CSTB team: Complex Systems and Translational Bioinformatics

SONIC (Stochastic Optimisation and Nature Inspired Computing)

From CSTB team: Complex Systems and Translational Bioinformatics
Jump to navigation Jump to search
Theme : SONIC (Stochastic Optimisation and Nature Inspired Computing)

File:Pierre web.jpg
Pierre Collet

The SONIC (Stochastic Optimisation and Nature Inspired Computing) theme, led by Pierre Collet, studies and uses techniques to tackle complex problems that are insoluble by exact methods. Nature-inspired methods are privileged for their robustness and their very good exploration of the search space. The team uses mainly:

  • evolutionary algorithms, including :
    • genetic algorithms (applied to discrete and combinatory problems),
    • evolutionary strategies (applied to continuous problems),
    • genetic programming (applied to learning and data mining problems),
    • multi-objective evolutionary optimisation (for all industrial problems that need to optimize several antagonistic criteria at the same time),
  • optimisation by ant colonies,
  • emerging approaches (BOIDS, optimisation by particle swarms).

The team is currently at the highest international level in the use of massively parallel graphics cards (GPGPU) for scientific computation by artificial evolution and for artificial intelligence, being the first to obtain accelerations of about three orders of magnitude compared to a modern CPU core on generic optimization problems with the EAsy Specification of Evolutionary Algorithms platform [1]. Typically, a calculation for one day on a computer with multiple GPU cards becomes equivalent to several years of computation on a modern PC-compatible computer, which makes it possible to tackle problems that cannot be addressed by other techniques.

The goal is ambitious: it consists of implementing a true artificial intelligence that is competitive with human intelligence on a PC type computer equipped with several graphic cards. There are two main types of projects: fundamental projects dealing with the adaptation of evolutionary algorithms to the characteristics of these new cards, and applied projects that test the developed algorithms on real problems, which are often very different from toy problems like benchmarks.

Research topics

Information systems are built of myriads of independent, interconnected devices, organized in loosely interdependent sub-systems (enterprise networks or site, public access networks, etc.). These information systems contain organization-critical data such as financial or commercial statements, personal devices, as well as critical industry systems known as SCADA (electrical grid, control systems for nuclear plants or aviation control, etc.). They are interconnected with various levels of control, and various constrains on confidentiality, integrity, availability.

Projects

ECOMAPS (Evolutionary Computation on Massively Parallel Systems)

The purpose of the ECOMAPS project is to revisit the different evolutionary paradigms in order to adapt them to massive parallelism, notably on General Purpose Graphic Processing Units (GPGPUs) and to integrate them into the EASEA language(click here for a rapid introduction).

It consists of 3 axes:

Continued development of the language EASEA (EAsy Specification of Evolutionary Algorithms, (Collet et al., 2001) allowing an evolutionary algorithm to be executed on GPGPU cards General Purpose Graphic Processing Unit without the programmer needing to know how to programme the cards. The development of the platform for massively parallel evolutionary calculations EASEA is currently done by :

  • Ogier Maitre for evolutionary algorithms and genetic programming, and
  • Frédéric Kruger for CMA-ES (Covariance Matrix Adapatation Evolutionary Strategy, used for continuous problems), thememetic algorithms(hybrid algorithms with a local search for Lamarkian evolution) and island parallelisation on clusters of hybrid machines.

The EASEA platform integrates the latest algorithmic developments of the team. It is available at Sourceforge.

- Adaptation of Linear Genetic Programming to execution on GPGPU cards
Linear Genetic Programming, developed by Wolfgang Banzhaf (cf. Brameier & Banzhaf, 2007) is especially well adapted to the GPU processor architecture. Ogier Maitre and Wolfgang Banzhaf are modifying Linear Genetic Programming to exploit the specificities of these massively parallel cards. The results will be integrated in the EASEA language (cf. below).
- Implementation of an algorithm for virtual chemistry on GPGPU
Virtual chemistry is a paradigm that canbe used not only to simulate chemical reactions, but also to resolve scientific problems. The topic of the post-doc of Lidia Yamamoto involves porting virtual chemistry to GPU cards.

ARA (Administrateur Réseaux Artificiel)

The post-doc of Deepak Sharma financed by OSEO for the company Kelerio. Kelerio manages networks for corporate customers. The purpose of the ARA project is to create an Artificial Network Administrator capable of detecting and correcting malfunctions before they occur.

A collaboration is ongoing on this subject with Cécilia Zanni-Merck and Philippe.bouche3 Philippe Bouché of LGeCo (INSA of Strasbourg)

RENZEO (Recherche de Nouvelles Zéolites)

Internship of M2 ILC Research option, following an M1 internship in collaboration with Laurent Baumes of the "Instituto de Tecnologia Quimica" of the Polytechnic University of Valencia (Spain). Zeolites are porous crystalline structures of great importance in industry. Depending on the pore diameter of the molecule, a zeolite may be used as an adsorbent, to filter or retain other molecules, thereby dehydrating gas or as a catalyst. Each new discovery of a zeolite allows new industrial uses, hence the importance of research in this field

BETON (Optimisation of concrete structures)

Cédric den Drijver is conducting an apprenticeship training course funded by INSA Strasbourg in the context of a collaboration related to the thesis of Céline Conrardy funded by Lafarge. The goal of this learning is to optimize concrete structures (beams, for example) by Genetic Programming on GPGPU by evaluating them by finite elements.

Ongoing thesis projects

- Genetic algorithms and genetic programmins on GPGPU cards
Thesis of Ogier Maitre, co-supervised by Pierre Collet and Nicolas Lachiche).

Work done:

  1. Parallélisation d'un algorithme évolutionnaire standard sur carte GPGPU : Ce travail a permis d'obtenir des accélérations proportionnelles à la puissance des cartes GPGPU par rapport à un processeur moderne de type Pentium (typiquement, x100 sur une carte NVidia GTX260 à 700 GFlops, cf. caractéristiques des cartes NVIDIA). La puissance des cartes GPGPU devient appliquable à tout problème d'optimisation abordable par évolution artificielle. Les résultats ont été inclus dans le langage EASEA, qui permet d'obtenir l'accélération par parallélisation automatique d'un algorithme évolutionnaire sans que l'utilisateur n'ait besoin de savoir programmer la carte (Ogier et al. 2009, 2009b).
  2. Parallélisation de l'évaluation d'arbres standards de Programmation Génétique sur carte GPGPU : des accélérations de l'ordre de x100 à x250 sont obtenues sur une demi-carte NVidia GTX295 sur de très grandes populations avec seulement 32 cas d'apprentissage. Cette avancée est majeure car elle permet d'appliquer la puissance des cartes GPGPU à des problèmes d'apprentissage automatique, ouvrant ainsi la voie à une intelligence artificielle compétitive avec l'intelligence humaine sur un PC standard équipé de cartes GPGPU (Koza 2003).

Ongoing and future work in the context of the thesis:

  1. Couplage de l'exécution parallèle d'arbres de PG avec un moteur évolutionnaire standard permettant de paralléliser un algorithme de Programmation Génétique standard sur GPGPU et son intégration dans EASEA (en cours).
  2. Développement d'un algorithme de Programmation Génétique adapté à l'architecture des GPGPU. Un bon candidat est la Linear Genetic Programming (Brameier et al. 2007).
  3. Adaptation du paradigme aux très grandes populations en s'inspirant probablement des travaux de (Poli et al. 2007) sur le sujet.


TER subject for M1 2009-2010 related to the thesis:

- Optimisation stochastique par méthodes évolutionnaires appliquée à la conduite d’engins autonomes (et notamment les drones)
Thèse de Stéphane Querry, dirigée par Pierre Collet et financée par la société POLYVIONICS. Ce projet comporte plusieurs volets :
  • Optimisation de trajectoires par évolution artificielle.
  • Optimisation des fonctions mathématiques de la représentation d'état non linéaire d'un engin par programmation génétique.
  • Optimisation des équations du filtrage de Kalman pour mieux intégrer le bruit spécifique associé à un engin particulier.

projects of 150h de M2 related to the thesis:

  • Portage de l'algorithme des Mouches sur carte embarquée en C (Julien Blaise) et en LISAAC (Farzad Sehat).

La soutenance consistera à faire tourner l'algorithme sur le Casque à Mouches ci-contre spécialement réalisé pour le projet :-)

- Modélisation et optimisation des pratiques collaboratives
Thèse d'Olivier Kuhn, dirigée par Pierre Collet et Parisa Ghodous, en cotutelle avec le LIRIS de l'Université de Lyon, sur financement CIFRE PROSTEP).

Travaux réalisés :

  • Conception d'une ontologie d'application pour la représentation et l'inférence de connaissances liées aux modèles CAD et aux templates.
  • Calcul de séquences de mise à jour de modèles pour la répercussion des modifications appliquées aux templates.

Travaux en cours :

  • Extension de la problématique aux environnements collaboratifs afin de résoudre rapidement les problèmes liées aux templates ainsi que leur mise à jour au sein des produits.

Liste des Publications

Liste

Animation Scientifique

  • 10 octobre 2014: workshop SONIC Industrie 4P, 10-10-2014 interne à l'équipe
  • 7 octobre 2014: workshop SONIC Systèmes médicaux complexes, 7-10-2014 interne à l'équipe
  • 7 juillet 2014: workshop SONIC interne à l'équipe
  • Du 7 au 11 juillet 2010, l'équipe présentera un tutoriel de 2h sur l'utilisation de cartes GPGPU pour l'évolution artificielle à la conférence mondiale sur l'évolution artificielle Gecco'10.
  • Le 26 mars 2010, l'équipe effectuera trois présentations aux 20è Journées Evolutionnaires à Paris VI.
  • Le 25 février, Ogier Maitre présentera les travaux de l'équipe à l'occasion de la première journée GPU de Strasbourg, organisée par le Centre d'Etudes du Calcul Parallèle et de la Visualisation.
  • Du 20 au 24 janvier 2009, l'équipe sera présente au 4è Symposium franco-Japonais Frontiers of Science organisé par le CNRS et la Japan Society for the Promotion of Science (qui a pour but de promouvoir les échanges entre 80 scientifiques français et japonais de haut niveau) par l'intermédiaire de Pierre Collet, qui présidera la session Evolution Artificielle et Vie Artificielle.
  • Du 26 au 28 novembre 2009, la thématique Evolution artificielle, Optimisation et Apprentissage de l'équipe FDBT a organisé la 9è Conférence Internationale sur l'Evolution Artificielle EA'09.
  • Du 8 au 11 juin 2009, l'équipe a été présente à la 4è école d'été sur l'Evolution Artificielle, avec :
    • Un tutoriel d'Introduction aux Algorithmes Evolutionnaires.
    • L'animation d'une après-midi de travaux pratiques sur la mise en oeuvre d'algorithmes génétiques sur cartes massivement parallèles GPGPU.
  • Le 31 mai 2009, Pierre Collet a présenté l'évolution artificielle sur cartes GPGPU en tant que conférencier invité à la 12è conférence polonaise sur l'Evolution Artificielle et l'Optimisation Globale.
  • Le 24 avril 2009, Pierre Collet a effectué un séminaire sur l'utilisation du langage EASEA pour implémenter des algorithmes évolutionnaires sur des cartes GPGPU en tant que conférencier invité de l'Université de Nottingham, dans l'équipe de Natalio Krasnogor.
  • Le 10 avril 2009, à l'occasion des 19è Journées sur l'Evolution Artificielle, l'équipe a effectué 3 présentations sur l'évolution artificielle.
  • Le 26 mars 2009, Pierre Collet a présenté l'utilisation des cartes GPGPU pour l'optimisation à l'occasion de la 3ème Journée de l'Optimisation à l'Université de Technologie de Belfort Montbéliard.
  • Du 16 au 19 juin 2008, l'équipe a été présente à la 3è école d'été sur l'Evolution Artificielle (fondée par Pierre Collet) avec un exposé sur l'Evolution artificielle Interactive et l'animation d'une table ronde sur les relations entre l'Evolution Artificielle et l'Industrie.
  • Le 14 mars 2008, à l'occasion des 18è journées sur l'Evolution Artificielle, Pierre Collet a fait un exposé sur le chaînon manquant entre l'industrie et la recherche en optimisation.
  • Pierre Collet a été Président de l'Association Evolution Artificielle de 2003 à 2008 et fait maintenant partie du "Comité des Sages" de l'association.
  • Du 29 au 31 octobre 2007, Pierre Collet a co-organisé la 8è Conférence Internationale sur l'Evolution Artificielle EA'08.

Principales Collaborations

Department of Computer Science, Memorial University of Newfoundland, St John, Canada
Venue du Pr Wolfgang Banzhaf dans l'équipe pendant 6 mois (d'avril 2010 à septembre 2010) pour y développer la chimie artificielle sur carte GPGPU.
Instituto de Tecnologia Quimica , Universidad Politecnica de Valencia (Espagne)
Collaboration sur la recherche de nouvelles zéolites, avec plusieurs articles de conférence et de journaux scientifiques soumis.
Indian Institute of Technology of Kharagpur (Inde)
avec la venue du doctorant Arijit Biswas pendant 8 mois (d'avril 2009 à décembre 2009) dans l'équipe dans le cadre d'une bourse franco-indienne Sandwitch. Un article de journal international a été soumis.
Laboratoire d'InfoRmatique en Image et Système d'informations, Université de Lyon
co-tutelle de la thèse d'Olvier Kuhn (cf. ci-dessus).
Société PROSTEP France et Allemagne
Thèse CIFRE d'Olivier Kuhn.
Société POLYVIONICS
Thèse de Stéphane Querry.
Equipe Image et Calcul Parallèle Scientifique (ICPS) du LSIIT, dirigée par Philippe Clauss
Un papier a été accepté à EuroPar'09 (Ogier et al. 2009b).
Projet INRIA ALEA, Centre de Recherche Bordeaux Sud Ouest et Service ORL de l'Hôpital Avicenne
plusieurs articles de journaux et chapitres de livre publiés.
Bristol Institute of Technology, University of the West of England
collaboration avec l'équipe d'Andy Adamatzky, et plusieurs articles publiés.

---

L'utilisation de méthodes évolutionnaires tisse des liens évidents avec la thématique Bioinformatique Théorique de l'équipe, notamment concernant l'étude d'opérateurs génétiques destinés à modifier le génotype des individus que l'on fait évoluer. Jusqu'à maintenant, l'évolution artificielle ne s'inspire de l'évolution naturelle que dans les grandes lignes. Le rapprochement avec la thématique Bioinformatique Théorique permet aux informaticiens d'accéder à des connaissances beaucoup plus précises sur les mécanismes génétiques biologiques, pour affiner les modèles qu'ils utilisent, et inversement, les biologistes peuvent apprendre de l'expérience in silico des chercheurs en évolution artificielle.

Les liens sont très forts aussi avec la thématique Fouille de données et classification, car les méthodes évolutionnaires permettent aussi de créer des classifieurs et extracteurs de connaissance (supervisés ou non) par programmation génétique, par exemple (cf. thèses de Sébastien Derivaux et Jonathan Weber).

Anciens membres

  • Julien Blaise, (étudiant de M1 effectuant un TER de 150h sur le portage de l'algorithme des mouches sur carte embarquée en C),
  • Farzad Sehat, (étudiant de M1 effectuant un TER de 150h sur le portage de l'algorithme des mouches sur carte embarquée en LISAAC),
  • Xavier Hennequin (étudiant de M1 effectuant un TER de 150h sur le portage du langage FIFTH sur carte GPGPU),
  • Sébastien Freimann (étudiant de M1 effectuant un TER de 150h sur le portage du langage PUSH sur carte GPGPU),
  • Cédric den Drijver (étudiant de M2, en apprentissage à l'INSA sur l'optimisation de poutrelles béton pour Lafarge dans le cadre d'une collaboration à l'occasion de la thèse de Céline Conrardy).
- Arijit Biswas 04/09 - 12/09
Optimisation du processus d'extraction de Manganèse de nodules polymétalliques extraits de fonds sous-marins : Dans le cadre de sa thèse de l'Indian Institute of Technology de Kharagpur (Inde) dirigée par les Professeurs Nirupam Chakraborti et Prodip Sen, Arijit Biswas a obtenu une bourse franco-indienne Sandwitch qui lui a permis de passer 8 mois en France dans l'équipe FDBT (entre avril 2009 et décembre 2009) dans le but d'apprendre à utiliser la Programmation Génétique (spécialité de l'équipe) et de l'appliquer à son sujet de thèse.

A l'issue de son séjour, les résultats précédemment obtenus (et publiés) par Arijit à l'aide de réseaux neuronaux ont été améliorés par Programmation Génétique. Un article de revue internationale est en préparation.