Une nouvelle mthode dapprentissage : S'L'I'S'O' SelfLearning by Information ShareOut Application aux - PowerPoint PPT Presentation

1 / 38
About This Presentation
Title:

Une nouvelle mthode dapprentissage : S'L'I'S'O' SelfLearning by Information ShareOut Application aux

Description:

Application aux boucles - des prot ines. Equipe de Bioinformatique G nomique et ... Anneau orient de neurones. 1 neurone = 1 classe d'objets ... – PowerPoint PPT presentation

Number of Views:76
Avg rating:3.0/5.0
Slides: 39
Provided by: dsimbI
Category:

less

Transcript and Presenter's Notes

Title: Une nouvelle mthode dapprentissage : S'L'I'S'O' SelfLearning by Information ShareOut Application aux


1
Une nouvelle méthode dapprentissage
S.L.I.S.O. Self-Learning by Information
Share-Out Application aux boucles ß-ß des
protéines
Equipe de Bioinformatique Génomique et
Moléculaire (EBGM) INSERM U 726 / Université
Paris VII 75251 PARIS Cedex 05 - FRANCE
2
Plan
  • Brève présentation des fonctions et recherches du
    Pr. Serge Hazout
  • Les structures protéiques
  • Les alphabets structuraux
  • La Méthode de la Protéine Hybride
  • La méthode S.L.I.S.O.
  • Perspectives

3
1974 1975 1979 1984 1989 1994 2004
Diplôme de lÉcole Centrale de Paris DEA de
Statistique Mathématique / Assistant Doctorat de
3ème cycle Dr. de thèse A.J. Valleron Doctorat
dÉtat ès Sciences Maître de Conférences 1ère
classe Professeur des Universités 2ème
classe Professeur des Universités 1ère classe
4
  • Créateur du DEA dAnalyse de Génomes
    Modélisation Moléculaire (1995)
  • Créateur de la Licence - Maîtrise de Biologie -
    Informatique (2001)
  • Responsable du département de bio-statistiques
  • (1994)

5
Directeur de lEBGM 1987 - 2002 directeur
déquipe INSERM (3 unités) 2003 création de
lunité E-0346 / U726 Co-organisateur de
colloque "Rencontres Biologie Moléculaire
Informatique (RBMI) (Juin 1989 avril
1991) Membre du comité scientifique de
l'ACI IMPBio Membre du comité de pilotage
INSERM-STIC Membre du comité scientifique
dévaluation des plates-formes
bioinformatiques pour RIO Membre du comité
scientifique du colloque JOBIM 2002 Membre
du Conseil d'Administration de l'UFR de Biologie
Membre de la Commission des Spécialistes.
Expert pédagogique auprès de la Direction
Scientifique DS5 Membre de la Commission
Scientifique de Spécialité CSS 7 INSERM
6
  • La cytogénétique et l'analyse d'images
  • La généalogie du chromosome Y
  • L'étude de la diversité génétique des
    populations
  • humaines dans l'espace

1974 1988 1999
(i) Cartographie du génome humain (ii)
Analyse des génomes (iii) Bioinformatique
moléculaire
(i) Diversité génétique des populations
humaines dans lespace géographique (ii)
Bioinformatique génomique (iii)
Bioinformatique moléculaire
86 publications 9 thésards
7
Une recherche double développements
méthodologiques couplés à des applications
dintérêt biologique
8
Les structures secondaires
La vision des protéines succession des
structures secondaires
Hélice (1/3 des résidus) Feuillet (1/5 des
résidus) Boucle (1/2 des résidus)
9
Les structures secondaires
Limitations des structures secondaires
  • Impression erronée dune définition unique.
  • Difficulté de délimiter les extrémités des
    structures répétitives.
  • 50 des résidus sont oubliés.

de Brevern, Benros Hazout (2005) Progress in
Bioinformatics.in press.
10
Les structures secondaires
Une autre vision de la structure protéique
Au lieu de se focaliser sur quelques
états caractéristiques, essayer de tout décrire
au mieux.
de Brevern, Camproux, Hazout, Etchebest Tuffery
(2001), Recent Adv. In Prot. Eng., 319-331
11
Les alphabets structuraux
12
Les alphabets structuraux
Une autre vision de la structure protéique
représentation comme une
succession de lettres
GIMMXLPQXKUCNYWAAAAAAAVQPZCOZSKNMNNTPILTPWAAVWVWAA
DSPIMTLFFRLHAAAAAAAAAVWVWPIMMNMPQXLUIKPBAAAAAVWVQP
VCEBQKNMNTXPQGSHAAAAAVWAADGPIMTLLLPQPWAAAAAAAAAVZZ

13
Les alphabets structuraux
  • Approximation de la structure 3D locale des
    protéines
  • À laide des chaînes de Markov Cachées
  • Camproux, Tuffery, Chevrolat , Boisvieux
    Hazout (1999)
  • Prot Eng., 121063-1073
  • ? À laide dune adaptation des cartes
    topologiques de Kohonen
  • de Brevern, Etchebest Hazout (2000)
  • Proteins, 41, 271-287

14
Les alphabets structuraux
de Brevern, Etchebest Hazout (2000) Proteins,
41, 271-287
Camproux, Tuffery, Chevrolat , Boisvieux
Hazout (1999) Prot Eng., 121063-1073
15
Les alphabets structuraux
  • Prédiction à partir de la séquence
  • Par une approche Bayésienne
  • de Brevern, Etchebest Hazout (2000) Proteins,
    41, 271-287
  • de Brevern Benros, Gautier, Valadié, Hazout
    Etchebest (2004) In Silico Biology, 4, 34
  • Etchebest , Benros, Hazout de Brevern (2005)
    Proteins, 59, 810-827

Haut
16
Les alphabets structuraux
Autres applications
? Application aux boucles Camproux, Tuffery,
Buffat, Andre, Boisvieux Hazout (1999) Theor.
Chem. Acc. 101(1-3) 33-40 Camproux, de Brevern,
Hazout Tuffery P(2001) Theor. Chem. Acc.
106(1/2), 28-35 Fourrier, Benros de Brevern
(2004) BMC Bioinformatics, 5, 58.
17
Les alphabets structuraux
Autres applications
  • Reconstruction de structures 3D /
  • Recherche de similitudes structurales
  • Camproux, Gautier Tuffery (2004)
  • J Mol Biol 339, 591-605
  • Guyon, Camproux, Hochez Tuffery (2004)
  • Nucl. Acids Res. 32 W545-W548
  • http//bioserv.rpbs.jussieu.fr/cgi-bin/SA-Search

18
Les alphabets structuraux
Autres applications ? Modélisation de
structures 3D de Brevern, Wong,
Tournamille, Cartron, Colin, Le Van Kim
Etchebest C. (2005), BBA, sous presse
19
Séries de Blocs Protéiques
gt Protéine codée en Blocs Protéiques ZZfklmmmmmmmm
mmmmmmmmmmmmmmmmmnommmmmmmopacdfklmmmmnopafklmmmmm
mmmammmmnopaccddfbccddddfklmmmpghiabdcklmmmmmmmmkl
mmmmmmmmmmmpmklcfklmmnopafklmmmmmmmlmmmmmmm...
Nombre limité de transitions Nombre limité de
séries de BPs gt séries de 5 BPs
mmmnop
mmnopa
mnopac
opacd
20
Séries de Blocs Protéiques
- Analyse des séries de 5 Blocs Protéiques (un
Mot Structural) - Bonne approximation 3D 0.9 ?
(passage de 5 à 9 Ca). - Spécificité de la
relation séquence -structure - Recouvrement 72
Mots Structuraux gt 92 des résidus
de Brevern, Valadié, Hazout Etchebest (2002)
Protein Science, 11, 2871-2886
21
Séries de Blocs Protéiques
Deux aspects
22
Etude de longs fragments structuraux
Principaux objectifs 1 - Identification de
structures locales récurrentes. 2 -
Prédiction de la structure locale à partir de la
séquence. Deux méthodes
dapprentissage originales ? Méthode de la
Protéine Hybride ? Méthode S.L.I.S.O.
(Self-Learning by Information Share-Out)
Réseaux de neurones ? But classification
? Originalité
concept de partage de linformation Dun réseau
linéaire vers un réseau ramifié
23
Méthode de la Protéine Hybride
Méthode de classification originale ?
Anneau orienté de neurones 1 neurone
1 classe dobjets ? Chevauchement
Information en commun Application
Elaborer une bibliothèque de fragments prototypes
représentatifs des structures protéiques locales
? Longs fragments codés par des séries
de BPs ? Continuité des structures locales
le long des protéines
24
Banque de fragments protéiques
Description des structures protéiques par
lalphabet structural.
Banque de structures 3D (1041 structures)
Représentation 1D
16 Blocs Protéiques (BPs)
de Brevern, A.G., Etchebest, C., and Hazout, S.
2000. Bayesian probabilistic approach for
predicting backbone structures in terms of
protein blocks. Proteins 41 271-287
25
Banque de fragments protéiques
La représentation 1D est découpée en fragments
chevauchants. Exemple séries de 7 BPs
successifs, caractérisant des fragments de 11 Ca.
26
Classification des fragments protéiques
? Explication schématique de la Méthode de la
Protéine Hybride
de Brevern, A.G., and Hazout, S. 2001. Compacting
local protein folds with a Hybrid Protein Model.
Theor Chem Acc 106 36-47 de Brevern, A.G., and
Hazout, S. 2003. Hybrid Protein Model for
optimally defining 3D protein structure
fragments. Bioinformatics 19 345-353
27
Classification des fragments protéiques
  • ? Bibliothèque de N classes
  • représentée par un profil en BPs
  • ? Concept de mots flous
  • 1 classe 7 distributions en BPs
  • Distributions en commun entre
  • classes successives
  • ? Protéine probabiliste

Benros, C., de Brevern, A.G., and Hazout, S.
2003. Hybrid Protein Model (HPM) A method for
building a library of overlapping local
structural prototypes. Sensitivity study and
improvements of the training. IEEE Int Work NNSP
1 53-70
28
Principe de lapprentissage
? Processus itératif 1 neurone L 7
distributions en BPs ? Compétition entre
neurones Phase didentification - Tirage
aléatoire dun fragment - Calcul dun score -
Neurone vainqueur Phase denrichissement
local pour le neurone vainqueur ?
Diffusion de linformation par chevauchement
Cycles dapprentissage
29
Résultats Bibliothèque de fragments
? 120 prototypes moyens
? Répartition des fragments
? Faible variabilité géométrique Ca RMSD
moyen de 1,61 Å ( 0,77) (Aléatoire 4,5 Å
1,1)
Benros, C., de Brevern, A.G., Etchebest, C., and
Hazout, S. Assessing a novel approach for
predicting local 3D protein structures from
sequence. Soumis.
30
Relation séquence-structure et Prédiction
Fortes spécificités de séquence. Nouvelle
méthode de prédiction de la structure locale à
partir de la séquence.
? Proposer localement un nombre limité de
prototypes structuraux candidats. Exemple
protéine CheY de transduction du signal dE.coli
(3chy)
Benros, C., de Brevern, A.G., Etchebest, C., and
Hazout, S. Assessing a novel approach for
predicting local 3D protein structures from
sequence. Soumis.
31
Méthode S.L.I.S.O. (Self-Learning by Information
Share-Out)
  • Généralisation de la Méthode de la Protéine
    Hybride
  • ? Réseau de neurones orienté et ramifié
    multiplicité des chemins
  • Exemple dun réseau hexagonal

32
Analyse des boucles b - b
  • Objectif Mise en évidence de motifs
    structuraux caractéristiques codés en BPs.
  • Banque de boucles reliant deux brins b
  • ? Codage en BPs sous la forme ddd ddd
  • ? Banque de 3507 fragments
  • ? Longueur variable

33
S.L.I.S.O. Principe de lapprentissage
? Processus itératif - Tirage aléatoire dun
fragment à apprendre. - Phase didentification
recherche du chemin optimal dans le réseau par
calcul dun score.
- Phase denrichissement local neurones
vainqueurs connexions
ddd fb dcd
34
S.L.I.S.O. Principe de lapprentissage
? Processus itératif - Tirage aléatoire dun
fragment à apprendre. - Phase didentification
recherche du chemin optimal dans le réseau par
calcul dun score
ddd fkopa cdd
- Phase denrichissement local neurones
vainqueurs connexions
ddd fb dcd
35
S.L.I.S.O. Principe de lapprentissage
? S.L.I.S.O. repose sur lutilisation des parties
communes des objets. Création de
ramifications
36
S.L.I.S.O. Résultats préliminaires
? Neurones à forte capacité de reconnaissance ?
Connexions fortement visitées ? Spécificités
structurales en termes de BPs ? Réseau
résumant au mieux lensemble des
informations associées aux objets.
37
S.L.I.S.O. Résultats préliminaires
Exemple danalyse dun chemin - Succession de
8 neurones. - 507 fragments associés à ce
chemin. Faible variabilité structurale
8 BPs (boucle de 2 BPs) ddd fb dcd
Spécificités de séquence
38
Conclusion et Perspectives
  • Méthode de la Protéine Hybride réseau linéaire
    / prédiction locale
  • S.L.I.S.O. réseau ramifié
  • ? Représentation originale des objets en
    synthétisant leurs parties communes.
  • Perspectives de lapproche S.L.I.S.O.
  • - Application à dautres types de données
  • - Prédiction de la structure locale à partir de
    la séquence
  • Vers la prédiction de la structure globale par
    assemblage de fragments
Write a Comment
User Comments (0)
About PowerShow.com