Liat Peterfreund lauréate des Bourses France L’Oréal-UNESCO Pour les Femmes et la Science

La jeune chercheuse en informatique récompensée

Liat Peterfreund a rejoint le département d’informatique de l’ENS-PSL au sein de l'équipe Valda (ENS, Université PSL, CNRS, Fondation Sciences Mathématiques de Paris, Inria) il y a tout juste un an, peu après l’obtention de son doctorat au Technion, l’Institut de technologie d'Israël. La jeune scientifique étudie le traitement de données informatiques : comment les extraire, comment les classer et surtout, comment les faire parler.
Liat Peterfreund © Fondation L’Oréal
© Fondation L’Oréal

Les bases de données de graphes : de la détection de fraude à la représentation de molécules

Les travaux de Liat se concentrent sur les bases de données de graphes (graph databases), dont l’utilisation est devenue de plus en plus populaire au fil des ans et de la démocratisation du web et des services en ligne (banques, réseaux sociaux, sites marchands…). Ces bases de données permettent créer des modèles de relations, afin, par exemple, de détecter des fraudes financières ou de faciliter les recommandations en ligne.

Un domaine de recherche passionnant qui concerne des champs d’application et des secteurs d’activités extrêmement variés : les bases de données de graphes sont aussi bien utilisées par des géants du web comme Amazon ou Facebook qu’en biologie, pour représenter certains types de molécules comme les protéines.

Fondamentalement, ce type de base de données sert à stocker des informations dans un format graphique, dans lequel les nœuds incarnent les entités et les arêtes illustrent les relations entre ces entités.

Graphe réseaux sociaux

Voici ci-dessus un exemple de graphe très simplifié schématisant un réseau social. Au vu d’une personne (dite « nœud », représentée ici par A) et de ses relations (périphéries), il est ainsi possible de déterminer qui sont les « amis des amis » (dont la nature de la relation est représenté par les arrêtes/flèches) de cette personne précise. Ici, E est l’ami de A, mais aussi l’ami de D, qui est également l’ami de A.

 

Établir un langage commun pour une meilleur circulation et compréhension de l’information

Obtenir ces graphes est en réalité loin d’être simple. Pour structurer et analyser les données, en d’autres termes pour les rendre exploitables, il faut entre autre repérer les « motifs », c’est à-dire trouver les récurrences entre les données, les extraire et surtout les interroger en leur posant de bonnes questions, de la bonne manière. Tout cela dans un langage informatique bien précis, évidemment.

Ce langage qui permet d’interroger les bases de données n’est pas unique. Tous les acteurs qui placent les graphes au cœur de leurs activités économiques ont recours à des variantes. « Si tous ces langages possèdent la même racine, un peu comme l’espagnol, l’italien et le français, qui sont des langues latines » n’hésite pas à comparer Liat, « les langages utilisés restent très différents des uns des autres, il est difficile de les faire se parler, ce qui pose un véritable problème quant à la fluidité de l’information et la croisée des données ».

C’est sur cette question complexe que Liat et son équipe travaillent actuellement au département d’informatique de l’École. Le projet auquel elle contribue est à la recherche d’un nouveau standard de langage de requête (graph query language) afin que tous les acteurs puissent interroger leurs bases de données à partir d’un ensemble standardisé de questions. « Cela permettra une meilleure compréhension des programmes, de leur complexité, de leur signification et de leur exactitude. » explique la chercheuse.

Tandis que certains de ses collègues se concentrent sur la partie de la « grammaire informatique » (c’est-à-dire vérifier qu’il y ait bien tous les éléments de langage nécessaires s’enchainant dans le bon ordre, l’équivalent d’un sujet-verbe-complément), Liat s’occupe du champ sémantique, en s’interrogeant sur le sens approprié des mots utilisés.

 

De l’importance de trouver du sens dans la recherche

Ce processus de définition est développé en même temps que la conception du langage lui-même, par un système d’allers-retours rigoureux. « Cela signifie que nous aurons également un impact sur la conception du langage lui-même. Ce projet pourrait influer plusieurs secteurs économiques dans les années à venir et ouvrir de nombreuses questions de recherche, ce qui sera passionnant pour la communauté universitaire. » estime Liat avec enthousiasme.

Ce sont ces tous derniers travaux qui valent à la jeune scientifique de faire partie cette année des lauréates des Bourses France L’Oréal-UNESCO Pour les Femmes et la Science. « Grâce à ce prix, je vais pouvoir établir de nouvelles collaborations et maintenir celles existantes en allant à la rencontre de chercheurs étrangers mais aussi en participant à des conférences internationales. » détaille-t-elle, reconnaissante. Tout aussi essentiel, Liat va aussi pouvoir se procurer un meilleur équipement informatique, comme des services cloud adaptés et du matériel plus performant, qui lui permettront de vérifier les résultats théoriques de ses recherches, en mettant en œuvre des algorithmes et en exécutant des expériences. « De manière générale, j’espère que mon travail a et aura un impact positif sur la société » déclare la jeune femme, qui a d’abord imaginé devenir psychologue pour aider les gens à aller mieux.

Et si la vocation de Liat a évolué, elle est heureuse de son métier de chercheuse, qui « lui permet d’apprendre tous les jours et de relever des défis mathématiques ». Elle est aussi très attachée au processus de transmission scientifique : « j’aime le temps de la formalisation de la pensée, le moment où une idée prend forme couchée sur le papier, j’aime aussi les communiquer aux autres, surtout si ce que je fais a du sens, ce que j’espère ! » dit-elle en souriant.

 

Toutes nos félicitations vont aussi à Ada Altieri, post-doctorante au Laboratoire de physique de l'ENS et également lauréate du prix Jeunes talents France 2020. Un entretien est à lire ici.