Chez tous les organismes vivants, l’activité des gènes est régulée dans l’espace et le temps. Les instructions responsables de cette régulation sont codées dans les génomes. Pourtant, réussir à prédire ces régulations par des méthodes computationnelles reste un défi majeur. Une régulation met en jeu une classe particulière de protéines appelées facteurs de transcription qui interprètent ces instructions en se liant à des séquences spécifiques d’ADN. La disponibilité de la séquence des génomes de très nombreuses espèces est une opportunité unique pour extraire des informations de régulation en se basant sur leur conservation dans l’évolution. Nous proposons d’élaborer une nouvelle méthode prédictive basée sur la conservation multi-facettes de ces sites de liaison. En se basant sur des publications récentes, nous avons sélectionné 3 types de conservation (conservation profonde, conservation grammaticale et conservation de co-occurrence). Après avoir construit un jeu de données d’apprentissage à partir de données génomiques, le modèle computationnel sera bâti et utilisé dans une collaboration entre une équipe de biologistes et bio-informaticiens. Des analyses expérimentales viendront tester in vivo certaines de ses prédictions.
MIM-REG Modélisation Intégrative Multi-critères pour la prédiction de REGulations transcriptionnelles
Résumé
Mots clés
- Analyse intégrativeApprentissage automatiqueBiologie computationnelleInteractomiqueRégulation des gènes
Partenaires du projet
INSB
François PARCY
(UMR5168) Grenoble, France
INS2I
Antoine FRENOY
TIMC-IMAG
(Techniques de l'Ingénierie Médicale et de la Complexité Informatique, Mathématiques et Applications) France