Quand l’informatique se mêle de poésie

Rencontre avec Thierry Poibeau, directeur adjoint du laboratoire LATTICE, spécialiste du traitement automatique des langues

Comment formaliser l’implicite ? Peut-on générer de la poésie à partir d’un simple programme informatique ?
A l’intersection entre informatique et langues, rencontre avec Thierry Poibeau, directeur de recherche au CNRS et directeur adjoint du laboratoire LATTICE (Langues, Textes, Traitements informatiques et Cognition).
Thierry Poibeau
Thierry Poibeau - Illustration Fiammmetta Ghedini / www.oupoco.org

La poésie, un terrain de jeu fascinant

Attaché au fonctionnement de la langue et à la façon de la formaliser, Thierry Poibeau s’intéresse de près à la poésie qui « donne une grande liberté, loin de tâches stéréotypées couramment utilisées pour évaluer les systèmes automatiques ».  « La poésie vit très bien sans l’informatique et se suffit à elle-même » et Thierry Poibeau sait combien elle « fascine les informaticiens car elle oblige à composer avec des contraintes (les rimes, la longueur des vers, etc.) et elle implique de jouer avec le sens des mots, avec l’implicite et le non-dit. »

En 2018, au sein du LATTICE (ENS-PSL), en collaboration avec Mylène Maignant, Frédérique Mélanie-Becquet et Clément Plancq, Thierry Poibeau crée le projet OuPoCo, une « occasion de s’interroger sur la place de l’informatique dans les processus créatifs » et « un moyen ludique de redécouvrir la poésie du 19e siècle. » Son but ? Produire des sonnets en recombinant des vers issus de sonnets du 19e siècle, un hommage contemporain en somme à l’OuLiPo (l’Ouvroir de Littérature Potentielle) où Raymond Queneau proposait en 1961, l’œuvre Cent mille milliards de poèmes, composée de dix sonnets dont chaque vers peut être combiné librement grâce à un jeu d’onglets.
Le projet de recherche OuPoCo entend étudier, sous différents aspects, la génération automatique de poésie et interroger les différences entre poésie générée automatiquement et poésie produite par des humains. Les chercheurs s’intéressent autant aux écarts de contenus, aux contraintes qu’aux jeux avec les formes. La poésie générative portée par OuPoCo consiste à générer du texte à partir d’une base de données, en s’appuyant sur un programme ou un algorithme. C’est une tâche particulièrement complexe pour un système informatique qui doit modéliser de manière correcte la syntaxe comme la cohérence sémantique et discursive.  Le système doit en plus intégrer diverses contraintes liées à des genres poétiques particuliers (telles que la forme et la rime). Enfin, « [il] doit faire preuve d'une certaine créativité littéraire, ce qui rend le poème intéressant et digne d'être lu.»

Mais peut-on dire qu’un poème généré automatiquement a du sens ? « Les systèmes récents, produisent des textes d’une qualité souvent bluffante, mais dont on contrôle très mal le contenu » reconnait Thierry Poibeau qui rappelle volontiers l’intérêt d’approches plus anciennes où l’on se focalise sur certains phénomènes linguistiques et qui produisent des textes plus mécaniques. Comparant les deux approches, il précise : « Ces systèmes sont moins naturels que ceux fondés sur l’observation de milliards d’exemples. Un des enjeux, pour le traitement des langues en général, est d’aller vers des systèmes mêlant ces deux approches. »

OUPOCO
Site de l'outil OUPOCO - Générateur de poèmes

La poésie et l’IA

L’informatique peut se révéler puissante, notamment en combinant association, aléatoire et hasard, mais peut-elle avoir sa place dans une création poétique ? Que penser d’une intelligence artificielle capable de créer des poèmes ?  Même si le chercheur estime qu’on est très loin de maîtriser les aspects esthétiques d’une poésie sur le plan informatique, « les développements récents en Intelligence artificielle ont permis des avancées importantes ».

Thierry Poibeau souligne cependant encore les limites d’une intelligence artificielle qui produirait des textes aussi naturels que ceux produits par des humains :  « aujourd’hui nous avons accès à des corpus de plusieurs milliards de mots, qui sont enregistrés et analysés par des techniques d’intelligence artificielle. Grâce à cela, on dispose de systèmes comme GPT3 d’OpenAI capables de générer des textes presque aussi naturels que s’ils étaient produits par des humains. Mais, paradoxalement, on ne sait pas vraiment contrôler ce qu’ils produisent. C’est en ce sens que j’ai parlé de « perroquets super performants » dans l’article « L’IA qui prend la parole. » : on est encore très loin de savoir générer des textes organisés, structurés, avec un contenu précis »

L’analyse des langues par l’informatique

Spécialiste du traitement automatique des langues, domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, Thierry Poibeau s’intéresse particulièrement à la typologie des langues « rares », notamment le cas des langues finno-ougriennes : « avec un doctorant (KyungTae Lim) et des collègues de l’Université d’Helsinki (Niko Partanen et Mika Hämäläinen), on s’est intéressé à la mise au point de techniques d’analyse pour des langues peu dotées (c’est-à-dire pour lesquelles on dispose de peu de ressources), comme le komi, une langue finno-ougrienne de Russie, alors que les modèles actuels reposent tous sur des corpus de millions, voire de milliards de mots

Rappelant que la poésie est aussi différente que les langues le sont, les contraintes pour le chercheur sont chaque fois complexes (tenant à la structure du vers, à l’accentuation, éventuellement à la longueur des voyelles, aux allitérations…). « C’est cette complexité qui rend l’analyse et la génération automatique de poésie intéressante en soi, même si le résultat n’est pas toujours à la hauteur des attentes ! » Récemment, l’équipe de chercheurs a conçu un système capable de transcrire de vieilles poésies finnoises en finnois moderne. Mais de préciser que « les outils proposent en général une traduction très littérale. Dans certains cas (sur des textes techniques par exemple), cela peut s’avérer parfaitement adapté. Mais sur de la poésie ou certains types d’œuvres littéraires, ça ne l’est évidemment pas. »

A propos de Thierry Poibeau

Initialement formé aux études de Lettres classiques, Thierry Poibeau s’est progressivement tourné vers la linguistique puis vers le traitement automatique des langues. « Ces domaines sont en fait très liés : il s’agit avant tout de comprendre comment fonctionnent les langues, et l’informatique peut nous y aider, en obligeant à formaliser ce qui reste sinon implicite. »

Il est directeur adjoint du laboratoire LATTICE (Langues, Textes, Traitements informatiques et Cognition) et titulaire d’une chaire PrAIRIe (Paris Artificial Intelligence Research Institute) dédiée au traitement des langues naturelles et aux humanités  numériques

REPÈRES DES CRÉATIONS ARTISTIQUES

OuLiPo

OULIPO, ou Ouvroir de Littérature Potentielle, a été fondé en 1960 par Raymond Queneau et le mathématicien François Le Lionnais, a ouvert la voie d’autres créations littéraires en utilisant l’informatique.
Le principe : établir des contraintes formelles, puis de les traduire sous forme de textes. En 1961, Raymond Queneau publie Cent mille milliards de poèmes, un petit ouvrage de dix sonnets dont chaque strophe est découpée pour pouvoir se combiner aux autres. Le lecteur peut à volonté remplacer chaque vers par un des 9 autres qui lui correspondent. Le lecteur peut ainsi composer lui-même cent mille milliards de poèmes différents qui respectent toutes les règles du sonnet. Ce projet sera entièrement réalisé plus tard grâce à un programme ordinateur par Tibor Papp.

 

OuPoCo , l’ouvroir de poésie potentielle

Le projet Oupoco est largement inspiré de l’ouvrage de Raymond Queneau Cent mille milliards de poèmes. Dans le cadre d’Oupoco, les poèmes de Queneau ont été remplacés par des sonnets du 19e siècle, qui sont à la fois libres de droit et plus variés quant à leur forme et leur structure. Un module d’analyse (structure globale, type de rimes, etc.) a été mis en place et les informations ainsi obtenues servent de base au générateur produisant des sonnets respectant les règles propres à ce genre.
Au-delà de l’aspect ludique du projet, celui-ci pose des questions quant au statut de l’auteur, et quant à la cohérence et la pertinence des poèmes produits. Il suscite aussi la curiosité, et amène par exemple souvent le lecteur à revenir aux sonnets source pour vérifier quel est le sens original d'un vers donné.

 

La boîte à poésie

Dans le cadre du projet OUPOCO , une « boîte à poésie », machine autonome basse consommation productrice de poésie, a aussi été conçue par avec deux artistes plasticiens, Mathilde Roussel et Matthieu Raffard, de l’Atelier Raffard-Roussel . « Un dispositif ludique et portatif, qui permet de montrer le générateur de poèmes dans des lieux variés et l’occasion d’aller au-devant de publics variés, en particulier ceux qui ne lisent pas ou peu de poésie. »