Problmes dapprentissage poss par la rgulation de lexpression des gnes - PowerPoint PPT Presentation

About This Presentation
Title:

Problmes dapprentissage poss par la rgulation de lexpression des gnes

Description:

Pb 2 : Extraction de la structure du r seau de r gulation. Pb 3 : A structure fix e, ... Ordre de grandeur actuel : milliers de g nes, dimension 100 ... – PowerPoint PPT presentation

Number of Views:59
Avg rating:3.0/5.0
Slides: 12
Provided by: Comp1065
Category:

less

Transcript and Presenter's Notes

Title: Problmes dapprentissage poss par la rgulation de lexpression des gnes


1
Problèmes dapprentissage posés par la régulation
de lexpression des gènes

Florence dAlché-Buc
2
Extraction des réseaux de régulation géniques
un objectif à long terme
Données dexpression des gènes issues des
biopuces
Apprentissage
Informations extraites de bases darticles
-

Informations sur les protéines fonctions
gène
Activation (ou inhibition) par le biais Dune
protéine
3
Décomposition en sous-problèmes
  • Pb 1 Classification non supervisée de données
    dexpression
  • Pb 2 Extraction de la structure du réseau de
    régulation
  • Pb 3 A structure fixée, modélisation de la
    dynamique du réseau et
  • identification de ses paramètres

4
Présentation du sous-problème 1
Classification non supervisée de données
dexpression
Objectif Regrouper les gènes de profils
expérimentaux similaires
5
Quelles données ?
Exemples (de Jong 2001) Initiation de la
sporulation chez Bacillus Subtilis
6
Origine des données les biopuces ou puces à ADN
- permettent dacquérir les différences
d'expression entre les gènes et ceci à l'échelle
d'un génome complet (ex génome de la levure
gt 6000 gènes) - technologie difficile à mettre
en place Plusieurs techniques fluorescence,
radioactivité . Données résultantes bruitées,
difficiles à normaliser
7
Biopuces
Source site ENS Auteur Philippe Marc
8
Biopuce image des intensités lumineuses
correspondant aux Taux dARN
Source site ENS Auteur Philippe Marc
9
Données observées
Type 1 une matrice n x m n lignes décrivant n
gènes, n colonnes Correspondant aux expériences
réalisées Type 2 une matrice n x m les
colonnes correspondent à une seule Expérience
mais pour laquelle on a pris différents
instants Expérimentaux Type 3 n x (m1 m2
mp) P expériences sur une même puce avec mi
instants expérimentaux Ensemble de profils
cinétiques
Profils cinétiques
10
Exemple de clustering obtenu avec une
classification hiérarchique (logiciel dEisen,
réf Eisen et al. 1998)
11
Clustering
Type 1 de nombreuses méthodes peuvent être
appliquées Déjà classification hiérarchique,
K-moyennes, cartes de Kohonen Type 2 inclure
dans les dissimilarités la notion de séquence,
mise En correspondance par time warping (utilisé
en reconnaisance de Caractères)
Ordre de grandeur actuel milliers de gènes,
dimension 100
Write a Comment
User Comments (0)
About PowerShow.com