IA générative : comprendre la frontière entre mémoire et création
Fil d'Ariane
Rencontre avec Giulio Biroli, physicien théoricien et professeur au département de physique de l’ENS- PSL
Les modèles d’IA générative sont capables de produire des images, des textes ou des sons d’un réalisme parfois saisissant. Mais apprennent-ils réellement à créer, ou se contentent-ils de reproduire ce qu’ils ont déjà vu ? Cette distinction entre mémorisation et généralisation constitue aujourd’hui l’une des grandes questions de la recherche en IA.
Dans un article récompensé par le prestigieux Best Paper Award à la conférence internationale NeurIPS 2025, Giulio Biroli, professeur au département de physique de l’École normale supérieure - PSL, et ses collaborateurs montrent que les modèles génératifs entrent d’abord dans une phase de généralisation – autrement dit de création – avant de pouvoir mémoriser les données qui les ont entraînés. À la croisée de la physique statistique et de l’IA, ces travaux éclairent d’un jour nouveau les capacités dites « créatives » de l’IA, mais aussi les enjeux éthiques et scientifiques soulevés.
Physicien théoricien, vos travaux portent sur une question clé en intelligence artificielle : la distinction entre mémorisation et généralisation. Pouvez-vous expliquer cette différence ?
Giulio Biroli : D'un côté, nous avons la mémorisation : l'IA se comporte comme un miroir. Si vous lui demandez de composer une mélodie, elle va simplement fouiller dans ses archives et vous ressortir, note pour note, une partition qu'elle a déjà vue. Elle ne comprend pas la musique, elle a simplement une excellente mémoire photographique. À l'opposé, il y a la généralisation, et c'est là que la magie opère. Généraliser, ce n'est pas répéter, c'est extraire la loi sous-jacente. L'IA ne retient pas chaque note, elle sait utiliser les règles de l'harmonie. Elle saisit la structure invisible qui fait qu'un paysage est beau ou qu'une chanson est triste. En résumé : La mémorisation est un perroquet qui répète une phrase apprise par cœur. La généralisation, c'est avoir compris le langage et l'utiliser pour créer une phrase qui n'a encore jamais existé.
Pourquoi cette question est-elle aujourd’hui si importante dans le développement des modèles génératifs ?
Giulio Biroli : Cette question est cruciale car elle est au cœur de l’IA générative qui, par définition, fonctionne quand elle génère des nouvelles données à la place de les reproduire. Mais au-delà de notre compréhension théorique de l’IA, l'enjeu est aussi éthique et juridique : si une IA mémorise au lieu de généraliser, elle risque de restituer des informations confidentielles ou de violer le droit d’auteur en copiant l’œuvre d’un artiste. Assurer la généralisation, c’est donc garantir que l'IA respecte la vie privée et la propriété intellectuelle.
« Les IA sont créatives parce qu’elles ne font pas ce qu’on leur apprend ! »
Dans votre article intitulé Why Diffusion Models Don’t Memorize: The Role of Implicit Dynamical Regularization in Training et récompensé par le prestigieux Best Paper Award à NeurIPS 2025, vous montrez que les modèles de diffusion restent longtemps dans un régime de généralisation avant de pouvoir mémoriser les données. Comment expliquer ce résultat inédit, et en quoi change-t-il notre compréhension de l’IA générative ?
Giulio Biroli : Il y a un paradoxe : nous entraînons mathématiquement ces IA pour qu'elles apprennent les données par cœur, mais elles réussissent précisément parce qu'elles « échouent » à le faire. Elles sont créatives parce qu’elles ne font pas ce qu’on leur apprend !
Notre étude révèle une hiérarchie dans l’apprentissage. Cela fonctionne un peu comme si vous deviez apprendre une longue pièce de théâtre. Au bout de quelques lectures, vous avez compris l'intrigue, les émotions et le style : vous pouvez raconter l'histoire avec vos propres mots. C’est la généralisation. Il faut des semaines de travail supplémentaire pour pouvoir réciter chaque virgule sans erreur, c’est-à-dire pour avoir tout mémorisé. Nous avons montré que pour l'IA, la compréhension des structures arrive avant la mémorisation. Tant que nous n'entraînons pas trop les modèles, ils restent dans cette phase où ils sont des créateurs et non des copieurs.
Plus précisément, ces résultats permettent-ils de mieux comprendre, ou de mieux encadrer, les capacités dites « créatives » de l’IA générative ?
Giulio Biroli : Nos recherches identifient ce qu’on pourrait appeler une « fenêtre de créativité ». Nous avons découvert que le temps d’entraînement agit comme un curseur : il faut entraîner les IA assez longtemps pour qu'elles apprennent à généraliser, mais pas trop, car elles ont aussi la capacité d’apprendre tout par cœur. Il leur faut juste – beaucoup – plus de temps. L'enseignement principal de notre étude est que plus vous avez de données, plus cette fenêtre de tir devient grande. Il s’agit d’un guide utile, surtout quand le nombre de données n’est pas gigantesque. Il faut donc faire attention à ne pas trop entrainer.
« Comprendre la dynamique de l’apprentissage [...] est une nécessité pour construire des remparts solides autour de notre vie privée et de la propriété intellectuelle. »
Quels enjeux soulèvent-ils, notamment en matière de fiabilité ou d’usage des données ?
Giulio Biroli : Jusqu'ici, nous avons étudié la mémorisation « brute », celle qui est facile à détecter car l'IA recopie l'original à l’identique. Mais le véritable défi se situe dans la zone grise : la mémorisation partielle. C’est une forme de plagiat subtil où l'IA ne recrée pas l'œuvre entière, mais en extrait des fragments d'identité ou des données personnelles sensibles de manière quasi invisible. Pour le droit d’auteur comme pour la sécurité, ces « fuites » de mémoire sont des failles que des personnes malintentionnées pourraient exploiter. Comprendre la dynamique de l'apprentissage n'est donc pas qu'un défi théorique, c'est une nécessité pour construire des remparts solides autour de notre vie privée et de la propriété intellectuelle.
Qu’apporte votre approche, qui mobilise notamment la physique statistique, à l’étude de ces modèles d’IA ? En quoi ce regard de physicien permet-il d’éclairer différemment ces questions ?
Giulio Biroli : Il y a deux aspects : d’abord, je suis la démarche classique du physicien, c’est-à-dire isoler le modèle le plus simple possible pour apporter un éclairage théorique nouveau sur des problèmes ouverts. Ce modèle est ensuite validé, affiné et parfois découvert par des expériences numériques sur les systèmes d’IA. Ensuite, j’utilise les outils mathématiques issus de la physique statistique développés lors de ces dernières décennies. Car de nombreux défis en IA sont analogues, en termes de concepts et de méthodes, à des problèmes de physique statistique, notamment les systèmes hors équilibre.
Le 25 septembre prochain, l’ENS-PSL organise une Nuit des Sciences consacrée aux données. En quoi ce type d’événement vous semble-t-il important aujourd’hui pour rapprocher la recherche en IA du grand public ? Et quel regard souhaitez-vous y partager ?
Giulio Biroli : L'intelligence artificielle suscite aujourd'hui à la fois fascination et inquiétude. Nous vivons sans doute l'une des révolutions techniques les plus rapides de l'histoire, et il est important pour les chercheurs de sortir des laboratoires pour partager la compréhension de ces outils. La vulgarisation est essentielle pour que le public ne subisse pas cette technologie, mais en comprenne les enjeux réels.
De mon côté, j'aborderai ces concepts de mémorisation et de généralisation. Je souhaiterais aussi échanger avec un acteur de théâtre en mettant en parallèle le processus créatif humain et l'apprentissage machine. En discutant de la manière dont un comédien s'approprie un texte pour le faire vivre plutôt que de simplement le réciter par cœur.
Les avancées récentes en intelligence artificielle suscitent à la fois beaucoup d’espoirs et de préoccupations. Comment situez-vous vos travaux dans ce paysage plus large ? En quoi une meilleure compréhension des mécanismes d’apprentissage peut-elle éclairer les débats actuels autour de l’IA ?
Giulio Biroli : Je situe mes travaux dans une démarche de compréhension fondamentale, avec la modestie nécessaire face à des systèmes d’une telle complexité. Élucider la frontière entre mémorisation et généralisation est crucial pour définir les limites objectives de l’IA. Cela peut permettre d’identifier les « pièges » de ces modèles, comme les atteintes fortuites à la vie privée ou au droit d’auteur. Plus généralement, comprendre les mécanismes de l'apprentissage nous permet de mieux anticiper les comportements défaillants au lieu de simplement les constater.
Plus largement, quels sont selon vous les grands défis scientifiques qui restent à relever pour mieux comprendre et maîtriser les modèles d’IA dans les années à venir ?
Giulio Biroli : Anticiper l’évolution de l’IA est difficile tant le progrès est rapide. Un défi scientifique majeur réside dans l'efficience : en particulier l’optimisation des processus d’apprentissage pour réduire drastiquement la dépendance aux données massives et la consommation énergétique. À mon avis, la prochaine frontière sera celle de systèmes robotiques complexes pilotés par des modèles d’IA, qui exigeront de coupler l'intelligence artificielle à la physique du monde réel.
| À propos de Giulio Biroli Après une formation initiale en ingénierie nucléaire au Politecnico de Milan, en Italie, Giulio Biroli effectue un programme d’échange avec l’École polytechnique à Palaiseau. Il continue sa formation avec un DEA de physique théorique à l’ENS-PSL et effectue une thèse sous la direction de Rémi Monasson, au Laboratoire de physique théorique de l'ENS (aujourd’hui regroupé au sein du Laboratoire de physique de l’ENS). Giulio Biroli effectue ensuite postdoctorat à l'Université de Rutgers aux États-Unis pendant 2 ans, avant d’obtenir un poste permanent au centre de physique théorique du CEA. Actuellement professeur au département de physique de l’ENS-PSL, il reçoit la médaille d’argent du CNRS en 2024. |