Mieux comprendre l’histoire de l’évolution grâce à de nouvelles méthodes bioinformatiques de pointe

Rencontre avec Hugues Roest Crollius, directeur de recherche CNRS à l’Institut de biologie de l’ENS-PSL

Créé le
10 octobre 2023
Aujourd’hui, la génomique comparative, qui permet notamment de comprendre l’histoire de l’évolution des espèces, nécessite des outils informatiques ultra puissants et sur mesure, mais aussi des stratégies innovantes pour traiter et comprendre les milliards de données génétiques récoltées.
Des travaux de pointe, à la croisée de la biologie et de l’informatique, que mène Hugues Roest Crollius et son équipe, directeur de recherche CNRS à l’Institut de biologie de l’ENS-PSL (IBENS) et spécialisé en génomique évolutive.
Dans cet entretien, le biologiste nous éclaire sur ses recherches, mais aussi sur les nouvelles méthodes et technologies bioinformatiques qui lui ont récemment permis de résoudre une question-clé dans l’histoire évolutive des poissons. Il revient notamment sur la plateforme du Centre de Biologie Computationnelle de l'IBENS, dont il est également le responsable scientifique.
Hugues Roest Crollius, directeur de recherche CNRS à l’Institut de biologie de l’ENS-PSL (IBENS) et responsable scientifique de la plateforme du Centre de Biologie Computationnelle
Hugues Roest Crollius, directeur de recherche CNRS à l’Institut de biologie de l’ENS-PSL (IBENS) et responsable scientifique de la plateforme du Centre de Biologie Computationnelle

« Tenter de comprendre comment les espèces sont reliées au cours de l’évolution, et comment leur génome a évolué, est un enjeu majeur pour la biologie des décennies à venir. »

Vous êtes biologiste spécialisé en génomique évolutive. En quoi consistent vos recherches actuelles et comment s’inscrivent-elles dans les enjeux contemporains de votre discipline ?

Hugues Roest Crollius : Le génome d’un individu, c’est-à-dire l’ADN contenu dans ses cellules, est hérité d’une longue lignée évolutive qui remonte jusqu’à l’origine du vivant il y a plus de 3,7 milliards d’années. C’est cette histoire, à l’échelle de l’évolution des génomes d’animaux vertébrés en particulier, que nous essayons de reconstruire. Pour cela, nous tentons de reconstruire informatiquement les génomes d’espèces ancestrales, dont l’ADN n’est plus disponible pour être séquencé, qui existaient il y a des millions d’années, afin de documenter ces états intermédiaires de l’histoire évolutive des espèces.

Aujourd’hui, de nombreux programmes de recherche nationaux et internationaux visent à séquencer les génomes de dizaines de milliers d’espèces. Tenter de comprendre comment celles-ci sont reliées au cours de l’évolution, et comment leur génome a évolué, est un enjeu majeur pour la biologie des décennies à venir.  

Directeur de recherche CNRS, vous êtes également le responsable scientifique de la plateforme bioinformatique du Centre de Biologie Computationnelle de l'Institut de Biologie de l’ENS (IBENS). En quoi consiste cette entité et qu’a-t-elle d’exceptionnel ?

Hugues Roest Crollius : Il s’agit avant tout d’une plateforme de calcul scientifique dédiée à la biologie, ouverte en priorité aux laboratoires qui ont initialement contribué à la monter : l’Institut de Biologie de l’ENS-PSL (IBENS), le Centre Interdisciplinaire de Recherche en Biologie (CIRB) du Collège de France et une unité CNRS de l’ESPCI-PSL.

Suivant l’idée d’Auguste Genovesio qui en a été le premier directeur, cette plateforme est mutualisée, c’est-à-dire que les équipes de recherche qui y installent des ordinateurs achetés sur leurs propres fonds disposent d’heures de calcul gratuites, tandis que les autres payent une contribution annuelle relative à l’utilisation qu’ils en ont. De ce fait, nous disposons aujourd’hui d’un « cluster de calcul » à haute performance, de plus de 4000 nœuds et 18 téraoctets de mémoire. Une ingénieure bioinformaticienne forme les utilisateurs lorsqu’ils sont débutants, les aide à lancer leurs calculs, effectue une partie de la maintenance des machines et surveille que tout se passe bien. Une cellule de direction se réunit mensuellement pour établir la stratégie, arbitrer les dépenses, et réfléchir au futur. Car, les plateformes de calcul de ce type sont vouées à se concentrer de plus en plus en « centres de calculs » régionaux, et il faut anticiper ces changements.

Qui peut accéder aux ressources de cette plateforme ?

Hugues Roest Crollius : Les calculs que l’on effectue en biologie sont assez différents de ceux réalisés en physique ou en mathématiques. Nous travaillons beaucoup avec des logiciels développés par la communauté internationale et partagés librement, dont plus de 200 sont installés sur le cluster. La plateforme est ouverte à tous les biologistes des 3 instituts fondateurs, mais nous l’ouvrons aussi aux autres laboratoires de l’ENS-PSL pour lesquels cela a du sens, comme ceux du département d’études cognitives.

Vous avez notamment utilisé cette plateforme pour mener des travaux sur la diversification précoce des poissons téléostéens. Il y a quelques mois, ceux-ci ont fait l’objet d’une publication dans la prestigieuse revue scientifique Science (1). En quoi ces recherches constituent-elles une avancée majeure pour la communauté phylogénomique et l’histoire évolutive des poissons ?

Hugues Roest Crollius : Les téléostéens regroupent 99,8 % des espèces de poissons, soit 30 000 espèces différentes identifiées, qui représentent la moitié de toutes les espèces de vertébrés. Ces poissons sont regroupés en trois grandes familles : le groupe qui inclut les anguilles, le groupe qui comprend les poissons dits à « langue osseuse », dont l’arapaima d’Amérique du Sud, et enfin le grand groupe des clupéocéphales, qui comprend toutes les autres espèces.  
Depuis plus de 50 ans, des débats entre paléontologues et biologistes de l’évolution font rage pour savoir dans quel ordre ces trois groupes sont apparus. Il s’agit là d’une des énigmes les plus anciennes en évolution, que la phylogénie moléculaire n'a pas réussi à résoudre jusqu'à présent. Dans cet article, nous présentons une réponse à cette question, solidement étayée par des preuves évolutives multiples et indépendantes. Tous nos résultats convergent vers un scénario évolutif inattendu qui résout la topologie des premières branches de l'arbre de vie des poissons.

Pour ces travaux, vous avez utilisé des méthodes bioinformatiques développées dans votre groupe de recherche. Qu’ont-elles de nouveau et comment permettent-elles une analyse plus concluante ?

Hugues Roest Crollius : Cette percée a été rendue possible par deux avancées majeures. Tout d'abord, nos collègues de l’INRAE à Rennes et à Toulouse ont séquencé les génomes de sept poissons du groupe des anguilles, peu connus jusqu’à présent. Deuxièmement, au laboratoire, nous avons mis en œuvre pour la première fois des méthodes qui utilisent la structure du génome, comme l’ordre des gènes sur les chromosomes, l'organisation des chromosomes… et non la séquence des gènes, comme caractère évolutif. L'idée que les structures génomiques puissent être utilisées pour répondre à des questions difficiles sur l'évolution a suscité beaucoup d'enthousiasme, et a depuis été adoptée par d’autres études sur des questions similaires.

 « Je suis convaincu que cette dynamique entre chercheurs de différentes générations est l’une des clés pour aborder des problèmes difficiles en science. »

Parmi les cosignataires de cette publication scientifique figurent deux jeunes chercheuses, formées auprès de vous à l’ENS : Elise Parey, première auteure et Camille Berthelot. Quels sont les bénéfices d’une telle dynamique scientifique intergénérationnelle ?

Hugues Roest Crollius : Élise Parey a réalisé sa thèse dans mon équipe de recherche, en co-direction avec Camille Berthelot, qui avait déjà, elle aussi, passé sa thèse au laboratoire il y a quelques années et qui l’avait ensuite rejoint en tant que chercheuse. Ce sont toutes deux des scientifiques extraordinaires. Ensemble et avec d’autres membres du laboratoire et collaborateurs, nous avons réalisé d’autres jolis travaux avant cet article dans Science. Je suis très fier de ce qu’elles ont accompli, et j’ai eu beaucoup de chance de les accueillir au sein de mon équipe de recherche.

Elles poursuivent maintenant leur carrière, Élise Parey comme post-doctorante à Londres et Camille Berthelot comme cheffe d’équipe à l’Institut Pasteur. Je suis sûr qu'elles vont faire parler d’elles dans un futur proche. Je suis convaincu que cette dynamique entre chercheurs de différentes générations est l’une des clés pour aborder des problèmes difficiles en science.

En tant que directeur de recherche CNRS, qu’est-ce que vous apporte de travailler à l’École normale supérieure ?

Hugues Roest Crollius : L’Institut de Biologie de l’ENS (IBENS) où je travaille est intimement lié au département de Biologie de l’ENS où se réalisent les enseignements en licence et master. C’est cette symbiose que je trouve vraiment cruciale. À travers les enseignements que les chercheurs peuvent dispenser, nous sommes amenés à constamment tester et mettre à jour nos propres connaissances. Nous avons la possibilité de transmettre un savoir à des étudiants et étudiantes très motivés et parfois, nous avons la chance de leur transmettre la passion de nos sujets d’étude et de les accueillir dans nos laboratoires. L’IBENS est également un lieu très convivial, riche de nombreuses disciplines en biologie, très bien équipé, où il fait bon chercher !

Quels conseils pourriez-vous donner à toute jeune personne souhaitant se lancer dans vos domaines ?

Hugues Roest Crollius : D’abord d’avoir une curiosité naturelle pour les phénomènes biologiques, et un intérêt pour l’évolution comme levier pour répondre aux questions qui se posent. Ensuite, au vu de la masse et de la complexité considérable des données que l’on manipule, il faut acquérir un savoir-faire, ou disposer d’une appétence pour les outils informatiques, et un peu en statistique. Mais si je reviens à mon propre parcours, il faut déjà bien choisir ses stages de master, en faire plusieurs si l’on peut, tester différents sujets, car être passionné pour une question, une thématique, est un moteur inépuisable mais indispensable pour animer la vie d’un chercheur.

 

Bibliographie
(1)    Genome structures resolve the early diversification of teleost fishes, Parey E., Louis A., Montfort J. et al. (2023), Science, 9 février 2023 - Vol 379, Issue 6632, pp. 572-575
DOI: 10.1126/science.abq4257