Équipe CSTB - Systèmes Complexes, Bioinformatique Translationnelle

Projets

De Équipe CSTB - Systèmes Complexes, Bioinformatique Translationnelle
Aller à : navigation, rechercher

Informatique translationnelle

Développement d’une infrastructure informatique dédiée à l’analyse intégrée de données provenant des “omiques” (cf. www.omics-ethics.org/fr/definition-sciences-omiques) liées aux maladies génétiques humaines et à la santé. Cette infrastructure inclut des algorithmes et des méthodes originaux, tels que :

  • Algorithmes et workflows informatiques pour la bioinformatique structurale , dans le cadre d'un projet financé par l'Institut Francais de Bioinformatique (IFB), coordonné par P. Tufféry (RPBS, Paris) et D. Ritchie (Loria, Nancy).
  • Algorithmes pour la biologie structurale intégrative, dans le cadre de projets financés en cours d'exécution, notamment l'infrastructure européenne INSTRUCT 'Integrative Structural Biology' et le projet ANR Investissement pour l'Avenir : FRISBI, coordonné par B. Klaholtz, IGBMC, Strasbourg.
  • Méthodologies multi-échelles permettant de mieux comprendre les propriétés des protéines (structure, interactions, dynamique…) et de faciliter l’agrégation de données hétérogènes au niveau d'une protéine ou d'une famille de protéines. Projet ANR (BIPBIP) financé en cours d'exécution, en collaboration avec Annick Dejaegere, IGBMC, Strasbourg.
  • Analyses évolutives des séquences protéiques issues des données NGS, appliqués à la Santé en collaboration avec les thématiques la fouille de données et l'optimisation stochastique.
  • GREMSAP (GRid Evolutionary Multiple Sequence Alignment Platform), en collaboration avec la thématique SONIC, l’Institut des Systèmes Complexes Paris Île de France, l’Institut de Neurobiologie Albert Fressard.
  • Social Network Clinical Database for Intellectual Disabilities : Mise en place d’un réseau social de patients autour de maladies génétiques amenant des déficiences intellectuelles, en collaboration avec la thématique l'optimisation stochastique, l’équipe Médecine translationnelle et neurogénétique, IGBMC, dirigé par Jean-Louis Mandel, et l’Université Cheikh Anta Diop au Sénégal.
  • Infrastructure big data pour l’analyse translationnelle des mutations impliquées dans les maladies génétiques humaines. BIRD/SM2PH-central a pour but l’intégration de données hétérogènes (génomiques, phénotypiques, évolutives, réseaux cellulaires, …), avec les méthodes de fouilles de données (règles d’associations, programmation logique inductive, …), et inclut la conception d'un langage de requête sémantique (BIRD-QL) et le développement d’interfaces graphiques originales. Cette infrastructure est développé en collaboration avec Hoan Nguyen, IGBMC, Strasbourg.

Bioinformatique systémique

Développement de la recherche dans le domaine de l’analyse des systèmes biologiques, pour comprendre les relations génotype-phénotype, notamment concernant les maladies génétiques, et l’étude de systèmes biologiques complexes, par exemple dans les maladies rares (ciliopathies, rétinopathies, …) en étroite collaboration avec le Laboratoire de Génétique Humaine, dirigé par Hélène Dollfus. L’une des originalités de nos approches est d’extraire et d’exploiter le message évolutif (analyse de séquences, génomique comparative…) afin de mieux analyser les différents niveaux de complexité des systèmes biologiques. Cet axe comprend divers développements:

  • Analyse de complexes macromoléculaires (TFIID, TFIIH, ...) en collaboration avec le département de Biologie Structurale Intégrative, IGBMC.
  • Analyse d’organelles (cil primaire, exosome, endosome, ...) en collaboration avec l’équipe d’Hélène Dollfus et l’équipe Trafic membranaire et signalisation lipidique, GMGM afin de caractériser des fonctionnalités partagées/spécifiques à différents niveaux (nucléotide, gène, voie) et d’identifier des corrélations entre les scénarios évolutifs déduits de nos analyses et les changements identifiés dans les processus moléculaires.
  • Analyse des données génomiques de 1000 patients atteints de myopathies (projet Myocapture et projet FRM en cours d'éxécution, en collaboration avec le laboratoire de Jocelyn Laporte, IGBMC) pour identifier et caractériser de nouveaux gènes responsables de ces maladies.
  • Analyse des données génomiques des patients atteints de ciliopathies (Bardet-Biedl Syndrome et Alstrom Syndrome) pour identifier des gènes responsables des pathologies, et comprendre les liens génotypes/phénotypes, en collaboration avec Hélène Dollfus.
  • L’intégration de données « omiques » pour développer une nouvelle génération de virus de la vaccine oncolytique (VACV). Projet financé en cours d’exécution (OncoVaccine : ANR Recherches Partenariales et Innovation Biomédicale), en collaboration avec la société TRANSGENE, la plate-form HTCS dirigé par Laurent Brino, IGBMC et l'équipe d'Etienne Weiss, IREBS, Strasbourg.
  • ImAnno est un projet collaboratif entre le LBGI et des équipes de l’IGBMC (P. Dolle) et de l’Institut de la Vision (J. Sahel, T. Léveillard) afin de développer un outil ergonomique et intégratif d’annotation d’images biologiques (ISH, fond d’œil…). Une fois annotées, les images permettent d’accéder à l’ensemble des outils d’extraction de connaissances implémentés ou développés par le LBGI, et notamment aux réseaux d’interaction protéine-protéine, aux outils d’analyse automatique de l’évolution, aux données de transcriptomiques…
  • Modélisation multi-échelle en temps et en espace du cil comme voie de communication (transport intracellulaire, interaction physique cellule-cellule, système sensorielle de l’environnement) et son rôle dans le cycle cellulaire, le développement, ainsi que l’évolution des organismes eucaryotes, en collaboration avec le Campus Numérique des Systèmes Complexes).

Evolution Artificielle et Systèmes Complexes

ECOMAPS (Evolutionary Computation on Massively Parallel Systems)

Le projet ECOMAPS a pour but de revisiter les différents paradigmes évolutionnaires pour les adapter à la parallélisation massive, notamment sur cartes GPGPU (General Purpose Graphic Processing Units) et de les intégrer dans le langage EASEA (cliquer ici pour une rapide explication).

Il comprend trois volets :

Poursuite du développement du langage EASEA (EAsy Specification of Evolutionary Algorithms, (Collet et al., 2001) permettant à un algorithme évolutionnaire de s'exécuter sur cartes GPGPU General Purpose Graphic Processing Unit sans que le programmeur n'ait besoin de savoir programmer les cartes. Le développement de la plateforme de calcul évolutionnaire massivement parallèle EASEA est actuellement assuré par :

  • Ogier Maitre pour les algorithmes évolutionnaires et la programmation génétique, et
  • Frédéric Kruger pour CMA-ES (Covariance Matrix Adapatation Evolutionary Strategy, utilisée pour les problèmes continus), les algorithmes mémétiques(algorithmes hybridés avec une recherche locale pour une évolution Lamarckienne) et la parallélisation en îlots sur clusters de machines hybrides.

La plateforme EASEA intègre les derniers développements algorithmiques de l'équipe. Il est disponible sur Sourceforge.

- Adaptation de la Programmation Génétique Linéaire à l'exécution sur cartes GPGPU
La Programmation Génétique Linéaire, développée par Wolfgang Banzhaf (cf. Brameier & Banzhaf, 2007) semble particulièrement bien adaptée à l'architecture des processeurs GPU. Ogier Maitre et Wolfgang Banzhaf travaillent à modifier la Programmation Génétique Linéaire pour profiter des spécificités de ces cartes massivement parallèles. Le résultat sera intégré au langage EASEA (cf. ci-dessous).
- Implémentation d'un algorithme de chimie virtuelle sur GPGPU 
La chimie virtuelle est un paradigme qui peut servir non seulement à simuler des réactions chimiques, mais qui peut aussi être utilisé pour résoudre des problèmes scientifiques. Le sujet du post-doc de Lidia Yamamoto consiste à porter la chimie virtuelle sur cartes GPU.

ARA (Administrateur Réseaux Artificiel)

Post-doc de Deepak Sharma financé par OSEO pour la société Kelerio. La société Kelerio administre des réseaux pour des entreprises clientes. Le but du projet ARA est de créer un Administrateur Réseaux artificiel capable de détecter des pannes et d'y remédier avant qu'elles ne surviennent.

Une collaboration a lieu sur ce sujet avec Cécilia Zanni-Merck et Philippe Bouché du LGeCo (INSA de Strasbourg).

RENZEO (Recherche de Nouvelles Zéolites)

Stage de M2 ILC option Recherche faisant suite à un stage de M1 en collaboration avec Laurent Baumes de l'Instituto de Tecnologia Quimica de l'Université Polytechnique de Valencia (Espagne). Les zéolites sont des structures cristallines poreuses d'une grande importance dans l'industrie. Suivant le diamètre des pores de la molécule, une zéolite peut être utilisée comme adsorbant, pour filtrer ou retenir d'autres molécules, permettant ainsi de déshydrater du gaz ou comme catalyseur. Chaque nouvelle découverte de zéolite permet de nouvelles utilisations industrielles, d'où l'importance de la recherche dans ce domaine.

BETON (optimisation de structures béton)

Cédric den Drijver effectue un stage en apprentissage financé par l'INSA de Strasbourg dans le cadre d'une collaboration autour de la thèse de Céline Conrardy financée par Lafarge. Le but de cet apprentissage est d'optimiser des structures béton (poutrelles, par exemple) par Programmation Génétique sur GPGPU en les évaluants par éléments finis.