Équipe CSTB : Systèmes Complexes et Bioinformatique Translationnelle

Intelligence Artificielle de Confiance

De Équipe CSTB : Systèmes Complexes et Bioinformatique Translationnelle
Révision datée du 18 septembre 2022 à 13:35 par Jeanningirardon (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche


Responsable : Anne JEANNIN-GIRARDON

Participants permanents : Nathalie AL MAKDESSI, Rabih AMHAZ, Ali AYADI, Pierre COLLET, Aline DERUYVER, Anne JEANNIN-GIRARDON, Pierre PARREND, Jean-Sébastien SERENI

Membres associés : Cécilia ZANNI-MERK, Ulvyia ABDULKARIMOVA, Samer EL ZANT

ATER : Romain ORHAND, Anna OUSKOVA-LEONTEVA

Doctorants : Lalla Aicha KONÉ, Quentin CHRISTOFFEL, Nasser GHANNAD, Hiba KHODJI, Tam’si LEY, Julien MICHEL, Yohan SOLON


Objectifs et approches

Nos objectifs sont de concevoir et développer des systèmes d'intelligence artificielle plus explicables, plus éthiques et plus autonomes.

Nos approches couvrent différents champs de l'intelligence artificielle au sens large et incluent :

  • l'ingénierie des connaissances et les ontologies informatiques ;
  • les graphes, tant dans leurs aspects théoriques qu'applicatifs ;
  • le raisonnement artificiel et les approches neuro-symboliques ;
  • le calcul évolutionnaire (algorithmes évolutionnaires, programmation génétique) ;
  • l'intelligence collective et la théorie des systèmes complexes ;
  • l'épistémologie de l'intelligence artificielle.


Une des spécificités de notre équipe réside dans l’exploitation de méthodes bio-informatiques traditionnelles afin de générer des connaissances qui peuvent ensuite guider des approches d’intelligence artificielle. Cette combinaison originale repose sur la pluralité et la complémentarité des compétences internes à l’équipe. En outre, nous nous appuyons au sein de la thématique IA de confiance sur des concepts des sciences humaines et sociales pour mieux cerner les notions d'explicabilité, d'éthique et d'autonomie inhérentes aux intelligences artificielles. Nous travaillons à réfléchir à une forme d’apprentissage automatique capable d'élaborer des lois éthiques associées à un principe de localité plutôt que des lois scientifiques universelles.

Champs d'application et projets en cours

Bioinformatique

Nous nous intéressons au contrôle qualité de données biologiques, en particulier les séquences de gènes. Dans ce cadre, nous développons des approches originales pour la détection d'erreurs de prédiction de gènes dans des alignements multiples de séquences basées sur des modèles d'apprentissage profond. Du fait de l'opacité de ces algorithmes, nous nous intéressons également à la conception et au développement d'approches d'explicabilité post-hoc parcimonieuses et quantifiables.

IA et raisonnement

Nous nous intéressons à l’association (et au couplage) des modèles d’apprentissage profond (systèmes à base de réseaux de neurones) avec des technologies sémantiques (arbre de décision, systèmes à base de règles, bases de connaissances, ontologies, graphes de connaissances, etc.) pour concevoir et développer des systèmes d’IA neuro-symboliques explicables et éthiques.

La théorie des catégories permet de mieux comprendre les ontologies qui sont constitutives de l’IA. Les topoi de Grothendieck permettent de réfléchir à des ontologies locales, pour envisager de créer des IA n’ayant plus pour objectif de trouver des lois universelles écrites à l’aide d’opérateurs arithmétiques, mais des lois locales écrites à l’aide d’opérateurs logiques, qui permettraient alors de décrire une éthique, qu’il est nécessaire d’imaginer pour une bonne interaction entre IA et humains.

IA et graphes

Les modèles à graphes supportent les propriétés de traçabilité des données, transparence du modèle et de compréhensibilité de la sortie de ces modèles. L’interprétabilité par l’humain est également améliorée par rapport aux jeux de données multi-dimensionnels utilisés habituellement par l'apprentissage automatique. Les modèles explicables à graphes peuvent être utilisés pour l’extraction de caractéristiques de données complexes en vue de réaliser un apprentissage, pour la représentation de connaissance et comme modèle d’apprentissage profond par les Graph Neural Networks. Le domaine d’application principal est la supervision de réseaux et la cybersécurité.

Nous effectuons également de la recherche fondamentale en théorie des graphes, afin d'améliorer notre compréhension des propriétés générales de la structure des graphes (notamment en lien avec leurs diverses colorations), des valeurs extrémales d'invariants (théorie extrémale) et du comportement de polynômes associés (polynôme de Tutte). Nous étudions également les apports d'une telle approche afin d'identifier des règles et des propriétés dans les gènes.

Éducation

Dans le domaine de l’éducation, nous avons mis en ligne POEM v3 (Personalized Open Education for the Masses), le flagship éducation de l'UniTwin CS-DC. Cette version de POEM a été validé par l’université de Strasbourg pour l'évaluation de cours. Le but premier POEM est de mettre à disposition une plateforme sociale et intelligente pour un écosystème éducationnel massif et personnalisé, afin de faciliter l'acquisition de la connaissance par des cursus personnalisés impliquant l'apprenant. La version 3 permet de mettre en œuvre une éducation de masse 4P tout en valorisant de manière automatique un entrepôt de contenus éducatifs non structurés. Il est basé sur un système de MOOC dont il rajoute la plus-value algorithmes d’IA pour choisir et proposer de manière individuelle des leçons adaptées aux objectifs, au niveau et aux compétences de l'étudiant


Développement de ressources