Équipe CSTB - Systèmes Complexes, Bioinformatique Translationnelle

Projets

De Équipe CSTB - Systèmes Complexes, Bioinformatique Translationnelle
Aller à la navigation Aller à la recherche

Informatique translationnelle

Développement d’une infrastructure informatique dédiée à l’analyse intégrée de données provenant des “omiques” (cf. www.omics-ethics.org/fr/definition-sciences-omiques) liées aux maladies génétiques humaines et à la santé. Cette infrastructure inclut des algorithmes et des méthodes originaux, tels que :

  • Algorithmes et workflows informatiques pour la bioinformatique structurale , dans le cadre d'un projet financé par l'Institut Francais de Bioinformatique (IFB), coordonné par P. Tufféry (RPBS, Paris) et D. Ritchie (Loria, Nancy).
  • Algorithmes pour la biologie structurale intégrative, dans le cadre de projets financés en cours d'exécution, notamment l'infrastructure européenne INSTRUCT 'Integrative Structural Biology' et le projet ANR Investissement pour l'Avenir : FRISBI, coordonné par B. Klaholtz, IGBMC, Strasbourg.
  • Méthodologies multi-échelles permettant de mieux comprendre les propriétés des protéines (structure, interactions, dynamique…) et de faciliter l’agrégation de données hétérogènes au niveau d'une protéine ou d'une famille de protéines. Projet ANR (BIPBIP) financé en cours d'exécution, en collaboration avec Annick Dejaegere, IGBMC, Strasbourg.
  • Analyses évolutives des séquences protéiques issues des données NGS, appliqués à la Santé en collaboration avec les thématiques la fouille de données et l'optimisation stochastique.
  • GREMSAP (GRid Evolutionary Multiple Sequence Alignment Platform), en collaboration avec la thématique SONIC, l’Institut des Systèmes Complexes Paris Île de France, l’Institut de Neurobiologie Albert Fressard.
  • Social Network Clinical Database for Intellectual Disabilities : Mise en place d’un réseau social de patients autour de maladies génétiques amenant des déficiences intellectuelles, en collaboration avec la thématique l'optimisation stochastique, l’équipe Médecine translationnelle et neurogénétique, IGBMC, dirigé par Jean-Louis Mandel, et l’Université Cheikh Anta Diop au Sénégal.
  • Infrastructure big data pour l’analyse translationnelle des mutations impliquées dans les maladies génétiques humaines. BIRD/SM2PH-central a pour but l’intégration de données hétérogènes (génomiques, phénotypiques, évolutives, réseaux cellulaires, …), avec les méthodes de fouilles de données (règles d’associations, programmation logique inductive, …), et inclut la conception d'un langage de requête sémantique (BIRD-QL) et le développement d’interfaces graphiques originales. Cette infrastructure est développé en collaboration avec Hoan Nguyen, IGBMC, Strasbourg.

Bioinformatique systémique

Développement de la recherche dans le domaine de l’analyse des systèmes biologiques, pour comprendre les relations génotype-phénotype, notamment concernant les maladies génétiques, et l’étude de systèmes biologiques complexes, par exemple dans les maladies rares (ciliopathies, rétinopathies, …) en étroite collaboration avec le Laboratoire de Génétique Humaine, dirigé par Hélène Dollfus. L’une des originalités de nos approches est d’extraire et d’exploiter le message évolutif (analyse de séquences, génomique comparative…) afin de mieux analyser les différents niveaux de complexité des systèmes biologiques. Cet axe comprend divers développements:

  • Analyse de complexes macromoléculaires (TFIID, TFIIH, ...) en collaboration avec le département de Biologie Structurale Intégrative, IGBMC.
  • Analyse d’organelles (cil primaire, exosome, endosome, ...) en collaboration avec l’équipe d’Hélène Dollfus et l’équipe Trafic membranaire et signalisation lipidique, GMGM afin de caractériser des fonctionnalités partagées/spécifiques à différents niveaux (nucléotide, gène, voie) et d’identifier des corrélations entre les scénarios évolutifs déduits de nos analyses et les changements identifiés dans les processus moléculaires.
  • Analyse des données génomiques de 1000 patients atteints de myopathies (projet Myocapture et projet FRM en cours d'éxécution, en collaboration avec le laboratoire de Jocelyn Laporte, IGBMC) pour identifier et caractériser de nouveaux gènes responsables de ces maladies.
  • Analyse des données génomiques des patients atteints de ciliopathies (Bardet-Biedl Syndrome et Alstrom Syndrome) pour identifier des gènes responsables des pathologies, et comprendre les liens génotypes/phénotypes, en collaboration avec Hélène Dollfus.
  • L’intégration de données « omiques » pour développer une nouvelle génération de virus de la vaccine oncolytique (VACV). Projet financé en cours d’exécution (OncoVaccine : ANR Recherches Partenariales et Innovation Biomédicale), en collaboration avec la société TRANSGENE, la plate-form HTCS dirigé par Laurent Brino, IGBMC et l'équipe d'Etienne Weiss, IREBS, Strasbourg.
  • ImAnno est un projet collaboratif entre le LBGI et des équipes de l’IGBMC (P. Dolle) et de l’Institut de la Vision (J. Sahel, T. Léveillard) afin de développer un outil ergonomique et intégratif d’annotation d’images biologiques (ISH, fond d’œil…). Une fois annotées, les images permettent d’accéder à l’ensemble des outils d’extraction de connaissances implémentés ou développés par le LBGI, et notamment aux réseaux d’interaction protéine-protéine, aux outils d’analyse automatique de l’évolution, aux données de transcriptomiques…
  • Modélisation multi-échelle en temps et en espace du cil comme voie de communication (transport intracellulaire, interaction physique cellule-cellule, système sensorielle de l’environnement) et son rôle dans le cycle cellulaire, le développement, ainsi que l’évolution des organismes eucaryotes, en collaboration avec le Campus Numérique des Systèmes Complexes).

Evolution Artificielle et Systèmes Complexes

ECOMAPS (Evolutionary Computation on Massively Parallel Systems)

Le projet ECOMAPS a pour but de revisiter les différents paradigmes évolutionnaires pour les adapter à la parallélisation massive, notamment sur cartes GPGPU (General Purpose Graphic Processing Units) et de les intégrer dans le langage EASEA (cliquer ici pour une rapide explication).

Il comprend trois volets :

Poursuite du développement du langage EASEA (EAsy Specification of Evolutionary Algorithms, (Collet et al., 2001) permettant à un algorithme évolutionnaire de s'exécuter sur cartes GPGPU General Purpose Graphic Processing Unit sans que le programmeur n'ait besoin de savoir programmer les cartes. Le développement de la plateforme de calcul évolutionnaire massivement parallèle EASEA est actuellement assuré par :

  • Ogier Maitre pour les algorithmes évolutionnaires et la programmation génétique, et
  • Frédéric Kruger pour CMA-ES (Covariance Matrix Adapatation Evolutionary Strategy, utilisée pour les problèmes continus), les algorithmes mémétiques(algorithmes hybridés avec une recherche locale pour une évolution Lamarckienne) et la parallélisation en îlots sur clusters de machines hybrides.

La plateforme EASEA intègre les derniers développements algorithmiques de l'équipe. Il est disponible sur Sourceforge.

- Adaptation de la Programmation Génétique Linéaire à l'exécution sur cartes GPGPU
La Programmation Génétique Linéaire, développée par Wolfgang Banzhaf (cf. Brameier & Banzhaf, 2007) semble particulièrement bien adaptée à l'architecture des processeurs GPU. Ogier Maitre et Wolfgang Banzhaf travaillent à modifier la Programmation Génétique Linéaire pour profiter des spécificités de ces cartes massivement parallèles. Le résultat sera intégré au langage EASEA (cf. ci-dessous).
- Implémentation d'un algorithme de chimie virtuelle sur GPGPU
La chimie virtuelle est un paradigme qui peut servir non seulement à simuler des réactions chimiques, mais qui peut aussi être utilisé pour résoudre des problèmes scientifiques. Le sujet du post-doc de Lidia Yamamoto consiste à porter la chimie virtuelle sur cartes GPU.

ARA (Administrateur Réseaux Artificiel)

Post-doc de Deepak Sharma financé par OSEO pour la société Kelerio. La société Kelerio administre des réseaux pour des entreprises clientes. Le but du projet ARA est de créer un Administrateur Réseaux artificiel capable de détecter des pannes et d'y remédier avant qu'elles ne surviennent.

Une collaboration a lieu sur ce sujet avec Cécilia Zanni-Merck et Philippe Bouché du LGeCo (INSA de Strasbourg).

RENZEO (Recherche de Nouvelles Zéolites)

Stage de M2 ILC option Recherche faisant suite à un stage de M1 en collaboration avec Laurent Baumes de l'Instituto de Tecnologia Quimica de l'Université Polytechnique de Valencia (Espagne). Les zéolites sont des structures cristallines poreuses d'une grande importance dans l'industrie. Suivant le diamètre des pores de la molécule, une zéolite peut être utilisée comme adsorbant, pour filtrer ou retenir d'autres molécules, permettant ainsi de déshydrater du gaz ou comme catalyseur. Chaque nouvelle découverte de zéolite permet de nouvelles utilisations industrielles, d'où l'importance de la recherche dans ce domaine.

BETON (optimisation de structures béton)

Cédric den Drijver effectue un stage en apprentissage financé par l'INSA de Strasbourg dans le cadre d'une collaboration autour de la thèse de Céline Conrardy financée par Lafarge. Le but de cet apprentissage est d'optimiser des structures béton (poutrelles, par exemple) par Programmation Génétique sur GPGPU en les évaluants par éléments finis.

Collaborations

Collaborations internationales

Nos principales collaborations avec des consortia et des équipes à l'internationale incluent :

  • Consortium international Quest for Orthologs (QFO) depuis 2011 : avec ETH Zurich, Swiss Institute of Bioinformatics, Centre for Genomic Regulation (Barcelona Institute of Science and Technology), European Molecular Biology Laboratory (EMBL, Heildelberg), European Bioinformatics Institute, Institute of Molecular Life Science/University of Zurich, University of California, Lawrence Berkeley National Laboratory, University of Southern California, Science for Life Laboratory/ Stockholm University, University of Lausanne, University College of London, Center for Plant Systems Biology/Ghent University, Barcelona Supercomputing Center, The University of Tokyo, University of Oxford, University of Barcelona, University of Montpellier, Goethe University Frankfurt, Tokyo Institute of Technology, Institució Catalana de Recerca i Estudis Avançats, National Institutes of Natural Sciences (Okazaki).
  • LOEWE Centre for translational biodiversity genomics (Francfort) depuis 2019, avec notamment l'obtention d’un financement ANR PRCI (ANR/DFG) en 2021.
  • Swiss Institute of Bioinformatics/University of Lausanne depuis 2020
  • Consortium européen ERGA (European Reference Genome Atlas) depuis 2021 : avec The Rockfeller University, Senckenberg Biodiversity and Climate Research Centre, University of Cambridge, Centre for Ecology, Evolution and Environmental Change (Portugal), Universita degli Studi di Milano, University of Göttingen, University of Florence, Uppsala University, University of Liege, University of Oslo, University of Cologne, Barcelona Institute of Science and Technology, University of Porto, Queen Mary University of London, University of Lausanne
  • Université de Mannheim depuis 2013, sur le codage mathématique des gènes
  • Consortium européen Elixir, services et ressources bioinformatiques, projet H2020, 22 pays membres et plus de 220 organismes de recherche
  • Université de Nouakchott Al Aasria, Mauritanie, Mise en oeuvre d’un super-calculateur PARSEC dans la Grille de Calcul de l’Université, collaboration en cours via une doctorante
  • Co-création en 2016 et co-direction opérationnelle de l’Université Franco-Azerbaidjanaise (UFAZ) - avec l’Université du Pétrole ASOIU.

Collaborations nationales

Au niveau national, nous maintenons des collaborations étroites avec :

  • Station Biologique de Roscoff/ Sorbonne Universités
  • Institut Français de Bioinformatique, réseau de 21 plateformes bioinformatiques
  • Université de Lille, statistiques pour la phylogénie
  • Université de Montpellier, analyse génomique comparative
  • CEDRIC, Conservatoire National des Arts et Métiers, algorithmes pour la détection d’attaques complexes
  • Laboratoire MSAP (Miniaturisation pour la Synthèse, l'Analyse et la Protéomique (MSAP) UAR 3290), Université de Lille

Collaborations locales

Au niveau régional, nos principales collaborations incluent :

  • Laboratoire de Génétique Médicale/Institut de Génétique Médicale d'Alsace, INSERM U1112
  • IBMC. Equipe Régulations post-transcriptionnelles et nutrition
  • IBMC. Equipe Marie Sissler, analyse de variants génétiques
  • IGBMC. Equipe Jocelyn Laporte, analyse de variants génétiques, co-porteurs de projets
  • IGBMC. Equipe Amélie Piton, analyse de variants génétiques, co-porteurs de projets
  • IGBMC. Equipe Jean-Louis Mandel. Protection des données génétiques
  • UMR CNRS 7021 : Natacha Entz-Werlé, analyses transcriptomiques de gliomes
  • INSERM 1109 : Olivier Huck, analyses, analyse transcriptomiques de macrophages infectés
  • Université de Strasbourg : Dominique Guénot. Equipe « Progression Tumorale et Microenvironnement, Approches Translationnelles et Epidémiologie », analyses bioinformatiques de cancers du colon

Collaborations internes

Nous travaillons également avec d'autres équipes d'ICube, y compris :

  • SDC, co-encadrement de doctorants et stagiaires
  • IMAGes, serveur web pour services statistiques, co-porteur de projet API
  • CSIP, migration de services au Data Center
  • Réseaux, Interconnexion de plates-formes de recherche sur la détection d’anomalies dans l’Internet des Objets


Archive des collaborations