ML4RegGen

Résumé

Caractériser le code cis-régulateur de l’ADN, c’est-à-dire la grammaire génomique qui régule l’expression des gènes, est un domaine de recherche intense, avec de nombreuses applications en génétique et en cancérologie. Récemment, plusieurs approches d’apprentissage statistique et de deep learning ont montré qu’il était possible de prédire l’expression des gènes sur la base de la séquence ADN seule. Cependant, dans leur grande majorité, ces modèles sont peu interprétables et ne permettent pas de mettre en place un processus de rétro-ingénierie capable d’identifier les éléments génomiques (motifs et séquences) responsables de cette régulation. Notre groupe de recherche transdisciplinaire a pour objectif de proposer de nouveaux modèles d’apprentissage à la fois prédictifs et interprétables.

Plus spécifiquement, un de nos objectifs est l’étude des mécanismes de régulation liés aux séquences de faible complexité, présentes en grande quantité dans le génome. Les éléments de régulations identifiés par le modèle seront testés expérimentalement grâce à nos collaborations (consortium international FANTOM, ANR LOWCO), et leur impact potentiel en médecine génomique sera évalué (CHU Montpellier et PEPR Santé-Numérique).

Mots clés

Partenaires du projet

INSB

Charles-Henri LECELLIER

IGMM

(UMR5535) Montpellier

INS2I

Laurent BREHELIN

LIRMM

(UMR5506) Montpellier

INSMI

Sophie LEBRE

IMAG

(UMR5149) Montpellier

Projet ML4RegGen
Go to top of page