CryptAnalytics, œuvrer au respect de la vie privée à l’approche de l’ère quantique

Un projet lauréat de la bourse ERC Proof of Concept 2021

Aujourd’hui, Le Cloud est un lieu de stockage et d’accès aux données en ligne utilisé par tous : particuliers, structures gouvernementales, organisations du secteur privé… Cette démocratisation soulève de nombreuses questions, liées au respect de la vie privée et de la protection de ces données auxquelles David Pointcheval travaille depuis plusieurs années. Responsable de l’équipe de cryptologie et du département d’informatique de l’ENS-PSL, médaille d'argent du CNRS 2021, lauréat de l’ERC Advanced Grant pour le projet CryptoCloud en 2013, le scientifique a ainsi étudié les mécanismes cryptographiques permettant d'effectuer des calculs sur des données confidentielles. Grâce à la bourse ERC Proof of Concept obtenue en janvier pour CryptAnalytics, il va poursuivre le travail autour d’une meilleure sécurisation des données du Cloud.
David Pointcheval
David Pointcheval

Les nouveaux enjeux de sécurité et confidentialité du Cloud

Accéder de n’importe où, n’importe quand à vos emails, photos de vacances, logiciels, fichiers clients, mots de passe… voilà la promesse du Cloud, dispositif de stockage de données en ligne aujourd’hui utilisé massivement par les professionnels comme par les particuliers.

Né en 1990, le Cloud s’est développé conjointement à Internet. Au fil des années, la démocratisation de l’accès au web a fait apparaître des hébergeurs, ces entreprises spécialisées proposant d’abriter un grand nombre de données que des structures ne souhaitaient pas ou plus héberger au sein de leurs locaux. Moyennant paiement, généralement sous forme d’abonnement fonction de durée, du volume de stockage ou d’autres critères, il est désormais possible de « déporter » logiciels, sites web, fichiers clients… Hier hébergées sur un disque dur, les données stockées dans le Cloud sont désormais accessibles de n’importe où et n’importe quand, tant que l’utilisateur bénéficie d’une connexion internet.

Si les avantages sont multiples (volume de stockage quasiment illimité, accessibilité, sauvegarde des données automatique et implicite) l’utilisation du Cloud pose aussi de nombreuses questions de sécurité de ces données dématérialisées et rend plus aigus les enjeux de protection.

David Pointcheval, directeur du département d’informatique de l’ENS-PSL et lauréat de la bourse ERC Proof of Concept 2021 avec CryptAnalytics, un projet cryptographique pour la sécurisation des données en ligne, est un expert de la question. Il confirme, « les nouveaux modes de communication et d'utilisation d'internet, avec l'externalisation des stockages, des calculs et des services, font émerger de nouvelles notions de sécurité ». Membre de CASCADE (Construction and Analysis of Systems for Confidentiality and Authenticity of Data and Entities), l'équipe de cryptographie du Laboratoire d'Informatique de l'École normale supérieure, commune au CNRS et à l'INRIA, il a suivi de près le développement conjoint d’Internet et du Cloud.

« Le formalisme et la rigueur des mathématiques ont toujours été importants, et j'ai aussi eu la chance de vivre le développement de l'informatique avec l'arrivée des ordinateurs personnels dans les années 80 », explique le chercheur. « Je me suis donc, très tôt, confronté à la programmation sur des machines peu dociles. Concilier les preuves mathématiques et l’automatisation des tâches m'a fortement motivé, et la cryptographie était le domaine idéal, notamment la cryptographie à clé publique (1) qui fait appel à plusieurs principes de mathématique et à l'informatique fondamentale. Elle répond de plus à des besoins concrets de sécurité. Elle a le grand intérêt de combiner la rigueur mathématique avec les aspects fondamentaux de l'informatique et la mise en œuvre rapide de solutions concrètes à de nombreux problèmes de sécurité ».

« Au fil d'une carrière, un chercheur oscille entre travaux plus théoriques et applications pratiques. Cette souplesse et cette flexibilité sont un privilège indéniable de la recherche académique. »

 

Utiliser les données sensibles sans révéler les informations individuelles

Créée en 1988 par le père de la cryptologie française Jacques Stern, le GRECC devenu ensuite l’équipe CASCADE cherche à combiner complexité et cryptographie : « nos travaux sont en effet fortement inspirés de la théorie de la complexité, afin d'apporter des preuves formelles de sécurité, précise David Pointcheval. Ces dernières consistent à présenter des « réductions » qui prouvent que casser le mécanisme cryptographique est plus difficile que résoudre un problème connu, comme la factorisation de grands entiers, par exemple ».

Cette méthodologie de « sécurité prouvée » est, depuis plusieurs décennies, la compétence internationalement reconnue de l’équipe. Elle se décline en plusieurs étapes : identifier les besoins en termes de sécurité, formaliser les modèles de sécurité, proposer un mécanisme cryptographique, puis enfin prouver ce système et montrer qu’il fonctionne (2). « Les preuves sont rarement « inconditionnelles » mais consistent en une réduction, au sens de la théorie de la complexité, de problèmes connus. L'étude de la réelle difficulté de ces problèmes sous-jacents fait partie intégrante de l'analyse globale de sécurité. On parle alors de « cryptanalyse ». »

Dans le cadre de CryptoCloud, projet de l’équipe de David Pointcheval terminé il y a tout juste 6 mois, les chercheurs ont travaillé sur des données confidentielles. « Il s'agissait de permettre l'utilisation de données sensibles, dans le cadre d’analyses ou d’agrégations, sans révéler les informations individuelles. » De telles données sont entreposées dans de multiples Clouds ou Data Lakes, mais leur mise en commun est rarement possible pour des raisons réglementaires (RGPD) ou économiques (concurrence). « Nous avons étudié des mécanismes de calculs distribués sécurisés, nécessitant de nombreuses interactions entre les différents participants, mais également des techniques beaucoup plus efficaces en termes de communications et d’interactions », indique le chercheur.

La contribution majeure de ce projet fut indéniablement le chiffrement fonctionnel, et notamment le chiffrement fonctionnel multi-clients, distribué et décentralisé. Il permet à des acteurs indépendants, qui ne se font pas confiance, de générer des clés fonctionnelles pour les destinataires des résultats et de publier des « chiffrés » sur des séries de données (temporelles, par exemple). Aucun de ces « chiffrés » ne révèlent d’information sur les données individuelles. Les clés fonctionnelles spécifient les agrégations accessibles par période de temps. Par exemple, la clé fonctionnelle peut limiter le calcul à la seule somme globale des données de tous les acteurs. La génération de ces clés fonctionnelles demeure sous le contrôle des propriétaires des données, afin qu'ils maîtrisent parfaitement les calculs qu'ils autoriseront et donc les fuites d'information qui peuvent en découler.

« Il est possible d'implanter cet outil grâce à plusieurs problèmes algorithmiques sous-jacents. L'objectif de CryptAnalytics est de le mettre en œuvre sur des cas d'usage, afin de déterminer le paramétrage le plus adapté pour une utilisation sur des volumes de données très importants. » Des recherches qui s’inscrivent dans le prolongement de CryptoCloud et que va pouvoir mener l’équipe de David Pointcheval grâce à l’obtention de la bourse ERC Proof of Concept 2021.

 

De la finance au vote électronique

Au fil des six dernières années, l’ERC Advanced Grant reçue en 2013 pour CryptoCloud a permis d’accompagner de nombreuses thèses de recherche (5 ont été directement financées et 5 autres ont aussi bénéficié du cadre de ce projet) et d’élaborer de nouveaux modèles de sécurité et des protocoles cryptographiques pour le Cloud. L'ERC CrypAnalytics permettra sur 18 mois de recruter un ingénieur développement et un ingénieur de recherche, pour étudier les cas d'usage concrets et leur mise en œuvre.

De nombreuses applications ont déjà été identifiées sur des séries de données temporelles, dans le domaine de la finance, du transport, ou de la sécurité. Par exemple, les compagnies d'assurance qui, si elles sont en forte concurrence, pourraient percevoir l’intérêt de mutualiser leurs données pour obtenir une cartographie globale des sinistres ou encore de leur répartition par périodes de temps. Elles pourraient même bénéficier d’analyses statistiques plus complexes, sans pour autant avoir à révéler trop d'information les concernant individuellement. « La même chose peut s’imaginer pour le secteur de la sécurité informatique, à partir d’une remontée globale des attaques subies. Bien évidemment, plus le panel d'acteurs impliqués est large et meilleure sera la confidentialité des données individuelles », souligne le scientifique.

Le vote cryptographique, qui répond au besoin de vote par Internet dans le cadre de la dématérialisation, est un autre des sujets largement étudiés par l’équipe de David Pointcheval : « de belles « primitives » ont d’ailleurs été conçues pour cet usage spécifique, telles que le chiffrement homomorphe, les réseaux de mélangeurs ou les signatures en blanc. Elles se sont ensuite révélées utiles dans de multiples autres cas d’usage. »

Le vote s’inscrit dans cette problématique du calcul sur des données confidentielles, puisqu’il s’agit de recevoir les expressions de vote de chaque votant, et d’en calculer les sommes, pour chaque choix possible, sans révéler d’information individuelle. « Ce sont des calculs très simples d’un point de vue cryptographique, mais de nombreux autres problèmes apparaissent : Comment être sûr que le bulletin a bien été émis par le bon votant, et sans pression extérieure ? Comment être sûr que le mécanisme de génération du bulletin respecte bien l’expression du vote ? Comment être sûr que le dépouillement est fait correctement ?  La CNIL exige aussi que ces garanties puissent être apportées à tout votant, car un vote nécessite la confiance de tous dans le système, experts et non-experts. Et même si tous les mécanismes pour remplacer le vote par correspondance par le vote cryptographique existent, il reste la question de la confiance dans un système qui doit répondre à des exigences contradictoires, celle de la transparence et celle de la confidentialité du vote. »

Nouveau défi, orthogonal à tous les enjeux de sécurité posés par le Cloud, l’arrivée de l’ordinateur quantique. Sa puissance de calcul pourrait remettre en question nombre de problèmes algorithmiques réputés aujourd’hui insolubles. Tous les problèmes classiques, issus de la théorie des nombres, tels que le problème de la factorisation, s’ils sont complexes pour l’ordinateur d’aujourd’hui, le seront-ils autant pour l’ordinateur quantique ? « Des algorithmes efficaces permettraient à un ordinateur quantique de casser de nombreuses familles de problèmes actuellement jugés hors de portée des ordinateurs classiques. Il est donc important d'évaluer la difficulté de tous les problèmes sous-jacents dans la perspective de l'ordinateur quantique. À nous d’en proposer de nouveaux, des problèmes « post-quantiques » en somme, qui pourraient lui résister et servir de base à de nouveaux mécanismes cryptographiques ». Un défi important pour toute la communauté cryptographique.

 

CryptAnalytics, un projet collaboratif

Pour mener à bien leurs travaux, David Pointcheval et son équipe sont régulièrement amenés à interagir avec de nombreux autres acteurs, du monde académique et du monde industriel. « Nous avons en effet des collaborations régulières avec nos collègues des autres établissements de recherche, en France et dans le monde entier. Nous avons également des interactions récurrentes avec des entreprises (petites et grandes), notamment dans le cadre de projets de recherches financés aux niveaux régional, national et européen. C’est essentiel pour ne pas perdre de vue les besoins de la vie réelle. » atteste le chercheur.

« L'équipe CASCADE est par essence collaborative puisqu’il s’agit d’une Équipe-Projet-Commune entre l'ENS, le CNRS et Inria. Être hébergé à l'ENS permet la proximité avec les élèves, qui ont très souvent un intérêt commun pour les mathématiques et l'informatique. Cette double compétence est un atout en cryptographie », explique le chercheur pour qui cette interdisciplinarité favorisée par l’École est une force dans la recherche. « Toutes nos tutelles sont aussi d’une grande aide dans le support à la recherche, et l’accompagnement dans toutes nos démarches. Elles permettent que les activités de recherche soient conduites avec sérénité et soient au final plus efficaces. » témoigne-t-il.

Pour CryptAnalytics, l’équipe de David Pointcheval est ainsi accompagnée par la start-up Cosmian, un acteur du secteur privé. « J’ai eu la chance de la rencontrer dès ses débuts et nos récents résultats se sont révélés adaptés pour certains problèmes qu'ils rencontraient », reconnait-il. Une collaboration plus formelle avec son équipe a depuis été établie. Dans le cadre de CryptAnalytics, il s’agira de collaborer sur l'identification de cas d'usages et sur le développement de prototypes pour estimer la faisabilité et le potentiel à plus grande échelle du dispositif de sécurité.

 

(1) Dans la cryptographie à clé publique, ou cryptographie asymétrique, les algorithmes sont publics, mais chaque individu possède un couple de clés : l'une secrète lui permettant d'effectuer les opérations que lui seul est censé être en mesure de faire (signature ou déchiffrement), tandis que sa clé publique est diffusée afin de permettre à ses interlocuteurs de mettre en œuvre les opérations réciproques (vérification de signature ou chiffrement de message). Les deux clés ont un rôle « asymétrique », d'où la terminologie. Source : futura-sciences.com
(2) Source : Sécurité et efficacité des schémas cryptographiques, thèse de Dương Hiệu Phan – 2005, Travaux effectués au Groupe de Recherche en Complexité et Cryptographie (GRECC) Laboratoire d’informatique de l’ENS-PSL

 

À propos de David Pointcheval

 

Ancien étudiant à l’ENS, David Pointcheval a intégré l’École par le concours mathématiques avant de se tourner rapidement vers l'informatique. Il effectue alors une thèse en cryptographie sur les preuves de connaissances, entre l'université de Caen et le laboratoire d'informatique de l'ENS (LIENS).
Après un séjour post-doctoral à l'Université de Californie à San Diego (UCSD) sur les mécanismes de chiffrement à clé publique, il est recruté au CNRS, affecté au sein du Groupe de Recherche en Cryptographie et Complexité (GRECC) du LIENS. Il prend la direction de cette équipe en 2005, qui devient l’équipe CASCADE en 2008, commune à l’Inria. Après avoir été directeur-adjoint du Département d'Informatique de l'ENS (DIENS), il en prend la direction en 2017. Le 11 mars 2021, il obtient la médaille d'argent du CNRS pour l'ensemble de ses travaux. Cette médaille distingue des chercheurs et des chercheuses pour l'originalité, la qualité et l'importance de leurs travaux, reconnus sur le plan national et international.