« J’essaye de comprendre les principes mathématiques derrière l’IA, car comprendre est essentiel pour maîtriser »
Rencontre avec Stéphane Mallat, professeur de mathématiques appliquées et d’informatique à l’ENS-PSL
DOSSIER INTELLIGENCE ARTIFICIELLE - À l’occasion du Sommet pour l'Action sur l'intelligence artificielle (IA) qui se tiendra en France les 10 et 11 février 2025 - et dont l’ENS accueillera le mardi 11 les « side events » dédiés à l’IA et la société - l’établissement donne la parole à ses expertes et experts en IA. Stéphane Mallat, mathématicien, est spécialisé dans l’apprentissage profond et les réseaux de neurones. Ces derniers – des algorithmes – fonctionnent de manière similaire au cerveau humain - et apprennent à partir de grandes quantités de données. Un enjeu clé dans le domaine de l’IA, aux nombreuses applications : reconnaissance d’images, diagnostics médicaux, chimie quantique…
Stéphane Mallat considère l’impact de l’IA de plus en plus important dans les sciences, et estime que l'IA générative en est une des avances les plus spectaculaires, avec notamment les grands modèles de langage. Pour le chercheur, il est essentiel de comprendre le fonctionnement de l’IA pour l’utiliser au mieux, notamment dans des domaines comme celui de l’éducation. Rencontre.

Vous êtes aujourd’hui spécialiste d’une des techniques phares de l’intelligence artificielle, les réseaux de neurones et l’apprentissage profond. Pouvez-vous nous en dire plus sur vos recherches ?
Stéphane Mallat : En IA, les réseaux de neurones sont actuellement utilisés pour résoudre des problèmes extrêmement variés : reconnaître des images, comprendre le langage, composer de la musique, calculer des solutions en physique – par exemple en météo ou en chimie quantique, calculer la configuration de protéines, poser des diagnostics médicaux, etc. Nous comprenons le fonctionnement des algorithmes, mais nous ne savons pas pourquoi ceux-ci parviennent à trouver de bonnes solutions. C’est une surprise, car ces problèmes mettent en jeu un très grand nombre de variables. Par exemple, une image peut comporter plus d’un million de pixels, et l’analyse de ces données nous confronte à une explosion combinatoire, appelée la « malédiction de la dimension ». Elle se produit lorsque le nombre de solutions ou d'états possibles augmente exponentiellement à mesure que la taille ou la complexité du problème augmente.
Un enjeu mathématique essentiel est de déterminer les structures qui permettent aux algorithmes de contourner cette complexité. Ce qui est étonnant, c’est que des problèmes très différents, allant de la physique au langage, se résolvent avec des algorithmes similaires : ils partagent des structures mathématiques communes et donc génériques. Un aspect particulièrement important réside dans l’organisation hiérarchique, que l’on retrouve dans tous ces problèmes. En physique, elle apparaît à travers des échelles multiples, qui vont des particules, aux atomes, aux molécules, aux planètes jusqu’au cosmos. Pour comprendre cette organisation, on fait notamment appel à l’analyse harmonique et à la théorie des ondelettes, sur lesquelles je travaille, en lien avec des modèles probabilistes et des techniques d’optimisation.
Vos recherches mêlent à la fois mathématiques, sciences de l’ingénieur, informatique et plus récemment, intelligence artificielle. Comment l’IA les a-t-elle fait évoluer ?
Stéphane Mallat : Quand j’ai commencé ma thèse en 1986, les questions liées à la compréhension de l’intelligence artificielle se concentraient surtout sur des systèmes experts basés sur la logique, qui étaient peu performants. Cela ne m’intéressait pas beaucoup. Le renouveau de l’IA, avec les réseaux de neurones, a ouvert un champ considérable de questions mathématiques sur les phénomènes de grande dimension, qui mobilisent un nombre considérable de variables. Les domaines mathématiques concernés se sont alors élargis, ce qui est devenu passionnant.
Par ailleurs, les applications et les algorithmes progressent beaucoup plus vite que leur compréhension mathématique, d’où la nécessité d’un aller-retour permanent entre mathématiques et applications. Pour ma part, je travaille autant sur la reconnaissance d’images que sur la synthèse sonore ou l’analyse de phénomènes physiques comme la turbulence, ainsi que la chimie quantique. Ce passage d’un champ d’application à l’autre permet de mieux cerner les propriétés génériques des réseaux de neurones, et de dégager la nature de leurs organisations hiérarchiques et leur essence mathématique.
« Avec l’IA, des synergies inédites entre les disciplines ont vu le jour, créant de nouveaux terrains fertiles pour la recherche. »
Pensez-vous que l’IA change la manière dont les chercheurs et chercheuses de différentes disciplines travaillent entre eux ?
Stéphane Mallat : L’IA a introduit énormément de travaux interdisciplinaires. L’intelligence artificielle permet d’analyser et d’exploiter des données. Or, toutes les sciences – sauf peut-être les maths pures – ont une composante d’analyse de données, de la sociologie à l’économie, en passant évidemment par la physique, la chimie, etc. À partir des mêmes algorithmes d’IA pour l’analyse de données, des synergies inédites entre les disciplines ont vu le jour, créant de nouveaux terrains fertiles pour la recherche.
En 2017, lors d’une interview, vous parliez d’un véritable « bond » de l’intelligence artificielle, et notamment d’un jour où il pourrait y avoir « de la physique sans physicien, ou de la chimie sans chimiste ». Une manière de dire que des connaissances peuvent émerger de l’IA sans qu’on ne comprenne véritablement comment. Quelques années après, que pensez-vous de cette projection ?
Stéphane Mallat : L’IA a un impact de plus en plus important dans les sciences, en particulier en chimie pour la découverte de nouvelles molécules et de nouveaux matériaux, et dans la plupart des domaines de la physique, pour calculer des solutions ou de nouvelles configurations de systèmes.
Ce qu’elle ne permet pas encore, c’est de découvrir les principes fondamentaux qui régissent ces disciplines. Nous n’en sommes clairement pas là. Toutefois, il serait hasardeux de prédire que l’IA restera incapable de réaliser certaines tâches que seuls les humains savent faire à ce jour ; la question est plutôt de savoir combien de temps cela prendra. Pour l’instant, l’avancée de l’IA est bien plus rapide que ce que l’on prévoyait.
Quelles sont selon vous les avancées récentes et les enjeux les plus importants aujourd’hui en IA et tout particulièrement pour vos travaux ?
Stéphane Mallat : Les avancées récentes les plus spectaculaires concernent l’IA générative, avec notamment les grands modèles de langage. Je pense que nous allons au-devant d’une nouvelle phase, marquée par le développement de systèmes robotiques autonomes, capables de collecter une quantité considérable de données au fil de leurs interactions avec le monde. Les sciences sociales seront également de plus en plus impactées, car elles étudient des phénomènes complexes sur lesquels nous avons de plus en plus de données. Derrière ces applications se cachent cependant des architectures similaires de réseaux de neurones profonds ; c’est surtout la taille des réseaux et les modalités d’application qui évoluent, plus que les principes fondamentaux. Mes travaux restent donc centrés sur l’analyse des structures mathématiques qui simplifient la complexité de ces problèmes et permettent de comprendre comment les réseaux parviennent à trouver des solutions. Pour l’IA générative, nous l’appliquons à la synthèse d’images, de sons et aux champs physiques en dynamique des fluides.
« L’école transmet les savoirs fondamentaux, il faut que les enseignants comprennent l’IA et apprennent à l’utiliser avec leurs élèves comme un atout et non pas un obstacle. »
En 2023, Geoffrey Hinton, considéré comme le parrain de l’IA et prix Nobel de physique 2024, mettait en garde contre ses potentielles dérives. Selon vous, y a-t-il des usages de l’IA sur lesquels être vigilants, en général et dans votre domaine de recherche ?
Stéphane Mallat : Les problématiques sociétales que posent l’IA sont multiples : celles autour du travail, de l’armement, de l’information et de l’éducation… ces dernières me concernent particulièrement. En 2022, j’ai créé MathAData, un programme d’enseignement des mathématiques et de l’IA, destiné aux collégiens et lycéens, basé sur des challenges de données réelles. C’est au secondaire que l’IA est susceptible de créer les déstabilisations les plus importantes. Avec les IA génératives comme ChatGPT, qui permettent de traduire un texte ou de résoudre un problème de maths instantanément, les élèves risquent de ne plus voir l’intérêt d’apprendre des langues ou des mathématiques. Le positionnement des enseignants est quant à lui remis en cause, n’étant plus les uniques détenteurs des savoirs.
L’école transmet les savoirs fondamentaux, il faut que les enseignants comprennent l’IA et apprennent à l’utiliser avec leurs élèves comme un atout et non pas un obstacle. À l’université, les savoirs fondamentaux sont acquis et les étudiants peuvent eux-mêmes apprendre à utiliser l’IA avec un esprit critique, pour en tirer le meilleur.
Pour rebondir plus généralement sur le point de vue de Hinton, il y a beaucoup d’autres angoisses sur l’IA, qui ne sont pas liées à la recherche académique mais à des problématiques commerciales. Mon positionnement est celui de comprendre les principes derrière l’IA, car comprendre est essentiel pour maîtriser. Le citoyen ne doit pas considérer l’IA comme étant en quelque sorte de la « pure magie ». Avec l’Éducation nationale via MathAData, nous essayons de faire comprendre des concepts mathématiques en considérant non pas l’IA comme une boîte noire, mais comme un exemple qui leur permet d’apprendre à utiliser les mathématiques dans cet aller-retour entre abstraction et problématiques concrètes.
Selon vous, l’open source est-il essentiel au développement de l’IA ?
Stéphane Mallat : L’open source est fondamental pour la recherche et très pratiqué. Aujourd’hui, la production d’un travail scientifique n’est souvent pas réduite à un article, mais englobe également un programme open source. En IA, il y a une multitude de détails qui ne figurent pas dans les articles et que nous avons besoin de récupérer via les softwares, c'est-à-dire les logiciels. Un résultat scientifique se propage beaucoup plus rapidement s’il y a un software qui permet de le reproduire. L’open source fait donc partie de l’essence de la recherche académique et tous les scientifiques l’encouragent.
C’est une vieille question qui n’est pas liée à l’IA en particulier, mais qui se pose très différemment dès lors que l’on est dans un contexte commercial. Les stratégies des diverses sociétés sont alors guidées par leur propre business model. On voit actuellement de fortes évolutions des politiques de sociétés comme Google qui restreignent davantage les publications et l’open source.
En tant que spécialiste en intelligence artificielle, quelle est la place de l’ENS-PSL en France et à l'international en tant que centre de recherche et de formation en IA ? Qu’est-ce qui en fait sa singularité ?
Stéphane Mallat : L’IA est un domaine qui repose essentiellement sur les mathématiques et l’informatique, en lien avec les sciences cognitives, et dont les applications s’étendent aujourd’hui à toutes les sciences, y compris aux sciences humaines. C’est donc un champ de recherche idéal pour l’ENS-PSL, qui possède des départements à la pointe dans tous ces domaines. De nombreux chercheurs ont ainsi apporté des contributions fondamentales en IA. La particularité de l'École normale réside probablement dans l'analyse théorique plus poussée de ses phénomènes et applications.
L’IA est un domaine qui reste encore très expérimental d’un point de vue applicatif. Il est donc aujourd’hui essentiel de comprendre les principes sous-jacents mathématiques et théoriques qui permettent ces applications, notamment dans d’autres domaines, comme l’économie et plus largement les sciences sociales. Ce sont ces liens qui se font à l’ENS-PSL. Cette interface entre la théorie et des applications très multiples est l’une des forces de l’établissement et l’un de ses positionnements les plus spécifiques.
Son Centre de sciences des données, créé il y a cinq ans, a favorisé des collaborations interdisciplinaires très riches entre tous les départements, et nous accueillons chaque année d’excellents chercheurs internationaux. Des cours d’IA sont désormais proposés dans les différents départements, en lien avec l’informatique. De nouveaux masters et un bachelor sont également en cours d’élaboration au sein de la Paris School of AI de PSL.
« Comprendre cette structuration est actuellement un enjeu très important de recherche, peut-être parce qu’il s’agit aussi de comprendre la structuration de la connaissance, et du monde. »
Pour terminer, quels seraient vos conseils à celles et ceux souhaitant orienter leur carrière dans la recherche en IA ?
Stéphane Mallat : L’IA est aujourd’hui un secteur de la recherche hyper concurrentiel et l’un des plus prometteurs. C’est sans doute à l’interface entre les mathématiques, la théorie et les applications que s’ouvrent le plus d’opportunités pour la recherche académique, c’est-à-dire lorsque l’on commence à se poser la question « pourquoi cela fonctionne et comment ? »
. On voit bien qu’il y a une ressemblance avec les calculs effectués par les réseaux de neurones et les calculs réalisés par notre cerveau. En effet, ces calculs s’adaptent à la structure des problèmes qu’ils résolvent, par exemple pour le langage, la perception d’images ou de sons.
Comprendre cette structuration est actuellement un enjeu très important de recherche, peut-être parce qu’il s’agit aussi de comprendre la structuration de la connaissance, et du monde que l’on perçoit et analyse. Dans la recherche académique théorique, nous avons déjà d’excellents scientifiques et étudiants, mais il y a de très grands besoins, car l’IA est un domaine de recherche en pleine expansion, qui va à une vitesse folle. Il faut donc apprendre à courir très vite pour jouer dans cette cour.
À propos de Stéphane Mallat
Après des études à l’École Polytechnique, Stéphane Mallat poursuit par un doctorat à l’Université de Pennsylvanie. Il est ensuite professeur à l’Université de New York (NYU) au Courant Institute, puis à l’École Polytechnique, avant de créer et diriger une start-up de traitement d’images, Let it Wave. En 2012, il devient professeur à l’École normale supérieure - PSL. Puis, en 2014, il est élu à l'Académie des sciences sur un siège interdisciplinaire, à l'interface entre mathématiques et sciences mécaniques et informatiques. En 2017, il est nommé professeur au Collège de France et titulaire de la chaire Sciences des données.
« Au départ, j’ai entamé mon doctorat pour découvrir les États-Unis et, très vite, j’ai été « piqué » par le virus de la recherche, qui m’a passionné. Je me suis intéressé au traitement de l’information, puis je suis revenu aux mathématiques en partant des applications, ce qui est différent de l’approche purement fondamentale où le problème mathématique est à la fois la source et la finalité. Cela m’a permis d’acquérir une compréhension beaucoup plus profonde et intuitive des mathématiques. L’informatique est par ailleurs un moyen fantastique d’expérimentation : voir une image comme le résultat d’un théorème donne un accès sensuel aux mathématiques. C’est cet aller-retour permanent entre les problèmes concrets et leur abstraction mathématique qui me passionne le plus. »