Équipe CSTB : Systèmes Complexes et Bioinformatique Translationnelle

LBGI Bioinformatique et Génomique Intégratives

De Équipe CSTB : Systèmes Complexes et Bioinformatique Translationnelle
Révision datée du 7 août 2015 à 10:18 par Admin (discussion | contributions) (1 version)
Aller à la navigation Aller à la recherche
Thématique : LBGI Bioinformatique et Génomique Intégratives
lbgi.fr

LBGI Bioinformatique et Génomique Intégratives, porté par Olivier Poch et Julie Thompson, se focalise essentiellement sur un champ de recherche en plein essor dans le domaine de la santé : la bioinformatique translationnelle. Notre objectif majeur est de développer une infrastructure informatique robuste capable de gérer des big data afin d’en extraire des connaissances pertinentes dans une approche « du lit du patient au laboratoire ». Dans ce cadre, nous nous intéressons particulièrement à l’étude des maladies génétiques rares et à la compréhension des mécanismes physiopathologiques impliqués dans ces maladies, mécanismes qui ont souvent un intérêt potentiel pour la compréhension des processus biologiques altérés dans des maladies plus communes, telles que l’obésité, les diabètes ou les cancers, ....

La bioinformatique translationnelle

La biologie moderne est caractérisée par le progrès rapide des biotechnologies et par la production de nombreux ensembles de données à l'échelle du génome, réunis sous le vocable « omiques ». Ainsi, les sciences biomédicales ont maintenant un accès potentiel à une énorme quantité de données qui croît de façon exponentielle et qui couvre des types de données très hétérogènes reliées aux patients (d’origine phénotypique, environnementale ou comportementale), aux « omiques » (environnement génomique, expressions de gènes, activités enzymatiques, productions et modifications du produit génique, etc.) et aux processus, protocoles ou analyses utilisées pour produire ces informations. Ces ensembles de données biologiques et techniques sont accessibles sous des formats divers, ce qui signifie que la fusion et l'exploitation de ces ensembles de données hétérogènes sont extrêmement difficiles. De plus, la situation est compliquée par le fait que les ensembles de données contiennent généralement du bruit expérimental ou biologique, des informations redondantes ou manquantes et beaucoup d’artefacts ou de biais techniques. Pour faire face à ce paysage de données complexes, la bioinformatique translationnelle doit exploiter des expertises diverses de haut niveau, allant de la gestion du big data et la découverte de connaissances, à la modélisation dynamique de systèmes complexes, et ce, afin de fournir des solutions efficaces pour des études biomédicales à grande échelle, utilisables par les scientifiques, les cliniciens et les patients. L’objectif majeur du LBGI est de concevoir et développer de tels systèmes d'informations automatisés.

Sujets de recherche

Le LBGI se consacre au développement d’approches in silico robustes, automatisées et intégrées (approches analytiques, statistiques, intégration et fouille de données, extraction et représentation des connaissances...) pour étudier l'évolution et le comportement des systèmes biologiques complexes (« hyperstructures », réseaux, etc.) chez l'homme et divers modèles animaux. Profitant de nos approches informatiques intégrées et dans le cadre de collaborations de longue date au niveau international, national et local, le LBGI participe à l'analyse de systèmes complexes impliqués dans diverses maladies humaines, notamment l'étude des déficiences fonctionnelles liées aux maladies rétiniennes ou du cerveau, l'identification de variations génétiques liées aux ciliopathies et la caractérisation du contexte génomique et transcriptomique dans divers cancers.

Opérations

Les travaux du LBGI s’organisent autour de deux grands axes complémentaires :

  • « L’informatique translationnelle » (Julie Thompson), pour développer une infrastructure informatique dédiée à l'analyse intégrée des « big data » résultant des études à haut-débit des maladies génétiques humaines. Il s'agit notamment de la conception et développement de systèmes de gestion de données originales (stockage, contrôle de la qualité, intégration de données hétérogènes) et des outils d'analyse dédiés à la fouille de données et l'extraction de connaissances biomédicales. Un aspect important est le développement d'interfaces utilisateurs intuitives pour faciliter l'accès par les biologistes et les cliniciens.
  • « La bioinformatique systémique » (Olivier Poch/Odile Lecompte) pour développer la recherche dans le domaine émergent de l'analyse des systèmes biologiques complexes, afin de comprendre les relations génotype-phénotype et de répondre aux questions concernant les maladies humaines. Il s'agit d'études intégrées de données évolutives, * « omiques » et de patients, notamment celles concernant les ciliopathies, et l'élaboration d'une approche systémique des relations entre les mutations et les réseaux biologiques dans les maladies.

Projets

Informatique translationnelle

Développement d’une infrastructure informatique dédiée à l’analyse intégrée de données provenant des “omiques” (cf. www.omics-ethics.org/fr/definition-sciences-omiques) liées aux maladies génétiques humaines et à la santé. Cette infrastructure inclut des algorithmes et des méthodes originaux, tels que :

  • Algorithmes et workflows informatiques pour la bioinformatique structurale , dans le cadre d'un projet financé par l'Institut Francais de Bioinformatique (IFB), coordonné par P. Tufféry (RPBS, Paris) et D. Ritchie (Loria, Nancy).
  • Algorithmes pour la biologie structurale intégrative, dans le cadre de projets financés en cours d'exécution, notamment l'infrastructure européenne INSTRUCT 'Integrative Structural Biology' et le projet ANR Investissement pour l'Avenir : FRISBI, coordonné par B. Klaholtz, IGBMC, Strasbourg.
  • Méthodologies multi-échelles permettant de mieux comprendre les propriétés des protéines (structure, interactions, dynamique…) et de faciliter l’agrégation de données hétérogènes au niveau d'une protéine ou d'une famille de protéines. Projet ANR (BIPBIP) financé en cours d'exécution, en collaboration avec Annick Dejaegere, IGBMC, Strasbourg.
  • Analyses évolutives des séquences protéiques issues des données NGS, appliqués à la Santé en collaboration avec les thématiques la fouille de données et l'optimisation stochastique.
  • GREMSAP (GRid Evolutionary Multiple Sequence Alignment Platform), en collaboration avec la thématique SONIC, l’Institut des Systèmes Complexes Paris Île de France, l’Institut de Neurobiologie Albert Fressard.
  • Social Network Clinical Database for Intellectual Disabilities : Mise en place d’un réseau social de patients autour de maladies génétiques amenant des déficiences intellectuelles, en collaboration avec la thématique l'optimisation stochastique, l’équipe Médecine translationnelle et neurogénétique, IGBMC, dirigé par Jean-Louis Mandel, et l’Université Cheikh Anta Diop au Sénégal.
  • Infrastructure big data pour l’analyse translationnelle des mutations impliquées dans les maladies génétiques humaines. BIRD/SM2PH-central a pour but l’intégration de données hétérogènes (génomiques, phénotypiques, évolutives, réseaux cellulaires, …), avec les méthodes de fouilles de données (règles d’associations, programmation logique inductive, …), et inclut la conception d'un langage de requête sémantique (BIRD-QL) et le développement d’interfaces graphiques originales. Cette infrastructure est développé en collaboration avec Hoan Nguyen, IGBMC, Strasbourg.

Bioinformatique systémique

Développement de la recherche dans le domaine de l’analyse des systèmes biologiques, pour comprendre les relations génotype-phénotype, notamment concernant les maladies génétiques, et l’étude de systèmes biologiques complexes, par exemple dans les maladies rares (ciliopathies, rétinopathies, …) en étroite collaboration avec le Laboratoire de Génétique Humaine, dirigé par Hélène Dollfus. L’une des originalités de nos approches est d’extraire et d’exploiter le message évolutif (analyse de séquences, génomique comparative…) afin de mieux analyser les différents niveaux de complexité des systèmes biologiques. Cet axe comprend divers développements:

  • Analyse de complexes macromoléculaires (TFIID, TFIIH, ...) en collaboration avec le département de Biologie Structurale Intégrative, IGBMC.
  • Analyse d’organelles (cil primaire, exosome, endosome, ...) en collaboration avec l’équipe d’Hélène Dollfus et l’équipe Trafic membranaire et signalisation lipidique, GMGM afin de caractériser des fonctionnalités partagées/spécifiques à différents niveaux (nucléotide, gène, voie) et d’identifier des corrélations entre les scénarios évolutifs déduits de nos analyses et les changements identifiés dans les processus moléculaires.
  • Analyse des données génomiques de 1000 patients atteints de myopathies (projet Myocapture et projet FRM en cours d'éxécution, en collaboration avec le laboratoire de Jocelyn Laporte, IGBMC) pour identifier et caractériser de nouveaux gènes responsables de ces maladies.
  • Analyse des données génomiques des patients atteints de ciliopathies (Bardet-Biedl Syndrome et Alstrom Syndrome) pour identifier des gènes responsables des pathologies, et comprendre les liens génotypes/phénotypes, en collaboration avec Hélène Dollfus.
  • L’intégration de données « omiques » pour développer une nouvelle génération de virus de la vaccine oncolytique (VACV). Projet financé en cours d’exécution (OncoVaccine : ANR Recherches Partenariales et Innovation Biomédicale), en collaboration avec la société TRANSGENE, la plate-form HTCS dirigé par Laurent Brino, IGBMC et l'équipe d'Etienne Weiss, IREBS, Strasbourg.
  • ImAnno est un projet collaboratif entre le LBGI et des équipes de l’IGBMC (P. Dolle) et de l’Institut de la Vision (J. Sahel, T. Léveillard) afin de développer un outil ergonomique et intégratif d’annotation d’images biologiques (ISH, fond d’œil…). Une fois annotées, les images permettent d’accéder à l’ensemble des outils d’extraction de connaissances implémentés ou développés par le LBGI, et notamment aux réseaux d’interaction protéine-protéine, aux outils d’analyse automatique de l’évolution, aux données de transcriptomiques…
  • Modélisation multi-échelle en temps et en espace du cil comme voie de communication (transport intracellulaire, interaction physique cellule-cellule, système sensorielle de l’environnement) et son rôle dans le cycle cellulaire, le développement, ainsi que l’évolution des organismes eucaryotes, en collaboration avec le Campus Numérique des Systèmes Complexes).

Collaborations

Nos projets, allant d’études moléculaires de bas niveau jusqu’aux applications cliniques, nécessitent d’une part, des collaborations étroites avec les informaticiens et bioinformaticiens théoriques (notamment au sein de l’équipe BFO), et d’autre part, des liens rapprochés avec la biologie expérimentale et médicale, notamment au sein des équipes de l'IGBMC et de la Faculté de Médecine de Strasbourg, pour développer ou améliorer les algorithmes dans un cadre de médecine translationnelle.

Développement de logiciels bioinformatiques :

  • Institut Francais de Bioinformatique
  • INSTRUCT European Consortium
  • FRISBI French Consortium
  • BIP:BIP (Bayesian inference paradigm: Biology in processors) Consortium
  • GJ. Barton; Univeristy of Dundee, Scotland
  • P. Collet, N. Lachiche, P. Gançarski; ICube, Strasbourg
  • A. Dejaegere; IGBMC, Strasbourg
  • MD. Devignes; LORIA, Nancy
  • P Sempé, X. Mary; IBM France
  • TJ. Gibson; EMBL, Heidelberg, Germany
  • DG. Higgins; University College Dublin, Ireland
  • P. Jollivet; Station Biologique de Roscoff
  • B. Klaholtz; IGBMC, Strasbourg
  • P. Koehl; UC Davis, USA
  • G. Labesse; CBS, Montpellier
  • C. Marino Buslje; Uni. Buenos Aires, Argentina
  • C. Mayer; Institut Pasteur, Paris
  • P. Pontarotti; Marseille
  • E. Pontelli; University of New Mexico, USA
  • AK. Royyuru; IBM Watson, USA
  • P. Schultz; IGBMC, Strasbourg
  • D. Moras; IGBMC, Strasbourg
  • A. Stoltzfus; NIST, USA
  • A. Van Dorsselaer; IPHC, Strasbourg

Développement de bases de données :

  • P. Bork; EMBL, Heidelberg, Germany
  • P. Dollé; IGBMC, Strasbourg
  • W. Krezel; IGBMC, Strasbourg
  • A. Pujol; Barcelona University, Spain

Ciliopathies :

  • H. Dollfus; LGM, Strasbourg
  • JL. Mandel; IGBMC, Strasbourg

Myopathies/AFM Décrypthon :

  • J. Laporte; IGBMC, Strasbourg
  • C. Marcelle; Melbourne University, Australia
  • T. Toursel; AFM, Paris

Maladies rétiniennes :

  • AMD Consortium (7 worldwide teams)
  • EVI-Genoret Consortium (42 European teams)
  • I. Audo; Université Pierre et Marie Curie, Paris
  • S. Bhattacharya; Inst. Ophthalmology, London, UK
  • J. Demongeot; U. Joseph Fourier, Grenoble
  • C. Grimm; Zurich, Switzerland
  • T. Léveillard; Institut de la Vision, Paris
  • J. Sahel; Institut de la Vision, Paris
  • C. Zeitz; Institut de la Vision, Paris
  • D. Zack; John Hopkins Hospital, Baltimore USA

Cancer de la prostate :

  • J. Abecassis, IGBMC, Strasbourg
  • M. Cecchini; University of Bern, Switzerland
  • J. Schalken; NCMLS, Nijmegen, Netherland
  • B. Wazylick; IGBMC, Strasbourg

Analyse de données de génomique fonctionnelle :

  • TF. Baumert; UdS, Strasbourg
  • B. Bihain; Genclis SAS, Nancy
  • A. Bloch-Zupan; IGBMC, Strasbourg
  • L. Brino; IGBMC, Strasbourg
  • P. Carbon; IBMC, Strasbourg
  • C. da Silva; Génoscope ; Evry
  • E. Friedrich; University of Luxembourg
  • J. Laporte; IGBMC, Strasbourg
  • A. Marchini; University of Heidelberg, Germany
  • R. Romand; IGBMC, Strasbourg
  • M. Roux; INIST, Nancy
  • M. Sissler; IBMC, Strasbourg
  • L. Tora; IGBMC, Strasbourg
  • L. Vallar; CRP-Santé, Luxembourg
  • V Laudet; ENS, Lyon

Publications

Une liste complète de nos publications est disponible ici.