Phylog - PowerPoint PPT Presentation

1 / 46
About This Presentation
Title:

Phylog

Description:

D couverte d'un repr sentant d'un troisi me phyla ? Adapt de ... Marqueurs artificiels. Double clustering hi rarchique des g nes et des topologies ... – PowerPoint PPT presentation

Number of Views:296
Avg rating:3.0/5.0
Slides: 47
Provided by: cel458
Category:

less

Transcript and Presenter's Notes

Title: Phylog


1
Phylogénie des Archaea
  • Céline Brochier
  • EA EGEE
  • (Évolution Génome Environnement)
  • Université de Provence Aix-Marseille I

2
Phylogénie des Archaea (ARNr 16S)
Euryarchaeota (9 ordres)
Methanopyrales
BACTERIA EUKARYA
Crenarchaeota (3 ordres)
0.05
Adapté de Schleper Nat Rev Microbio 2005
3
Phylogénie des Archaea(whole genome tree content)
Omelchenko et al. BMC Evolutionary Biology
2005 Slesarev et al. PNAS 2002
4
Problème des transferts horizontaux de gènes en
phylogénie
Phylogénie des espèces
A
B
C
D
E
F
5
Problématique
  • Est-il possible de reconstruire une phylogénie
    des procaryotes dans un contexte de HGT ?

6
Stratégie
Hypothèse Sil existe un ensemble de gènes qui
nont pas subi de transferts horizontaux, alors
la phylogénie quils infèrent reflète la part
verticale de lhérédité, cest-à-dire la
phylogénie des organismes
Les gènes qui ont subi la même histoire évolutive
doivent permettre dinférer (aux fluctuations
près) la même phylogénie
Test Des gènes congruents doivent soutenir ou
rejeter de la même façon les différentes
topologies possibles
7
Tester la congruence des marqueurs une approche
rapide
Topologies
0
4
13
42
0,2
1
R²0,9
2
0,1
4,7
9
37
0
R²0,05
3
4,1
7,8
0
0,3
3,3
Gènes
..
4
0,1
5,4
3,4
0,7
1,7
5
0,6
0,3
1,7
0
0,1
6
0,4
0,1
2,2
0,7
0,4
7
0,3
9,7
4,7
3,9
0,8
Analyse en Composante Principale (ACP) des
valeurs de déviation standard de chaque topologie
par rapport à la meilleure
2 gènes congruents seront proches sur
l ACP alors que 2 gènes incongruents seront
éloignés
8
Application aux Archaea
  • 53 protéines ribosomiques présentes chez au moins
    13 archaea
  • Analyses phylogénétiques individuelles
  • Reconstruction darbres non racinés (sans
    outgroup)
  • gt Augmenter le nombre de positions analysables
  • gt Diminuer le risque dartefact de
    reconstruction type ALB
  • Recherche de HGT
  • Analyse de la congruence entre marqueurs (ACP)
  • Élimination éventuelle des marqueurs atypiques
  • Concaténation des r-protéines

9
ACP r-protéines (Archaea)
P2
Axe 2 ( 11)
P1?
RTN?
44 r-protéines
Axe 1 ( 61)
P3
9 r-protéines
P1G 53 prot. (7175 pos) JTT loi G P3 9
prot. (926 pos) JTT P2 44 prot. (6249 pos)
JTT RTNG ARNr 16S et 23S (3933 pos) TN
loi G
Matte et al. MBE 2002
10
r-protéines détectées comme incongruentes a
posteriori
Matte et al. MBE 2002
11
Détection de lincongruence par les heat maps
Bapteste et al. BMC evolutionary biology 2005
Application aux protéines de la traduction
darchaea gt détection de marqueurs incongruents
rpl15e, rpl37ae
Double clustering hiérarchique des gènes et des
topologies Échelle p-value calculée pour un
gène donné et une topologie donnée variant de 0
(rejet) à 1 (acceptation)
Marqueurs artificiels
Marqueurs réels
12
Comparaison des fusions P1 et ARNr TNG
ARNr 16S 23S (3933 pos) ML TN G
53 r-protéines (7175 pos) ML JTT G
Pyrobaculum aerophilum
Aeropyrum pernix
82
Sulfolobus solfataricus
100
Pyrococcus furiosus
Pyrococcus horikoshii
100
100
68
Pyrococcus abyssi
100
Methanococcus jannaschii
30
52
100
100
Methanobacterium thermoautotrophicum
Archaeoglobus fulgidus
78
Methanosarcina barkeri
55
100
94
Haloarcula marismortui
100
87
100
100
Halobacterium sp
72
99
Thermoplasma acidophilum
10
10
100
100
Ferroplasma acidarmanus
Matte et al. MBE 2002
13
Comparaison des fusions P2 et P3
9 r-protéines (926 pos) ML JTT G
44 r-protéines (6249 pos) ML JTT G
Pyrobaculum aerophilum
Aeropyrum pernix
Sulfolobus solfataricus
100
100
Pyrococcus furiosus
Pyrococcus abyssi
100
100
71
Pyrococcus horikoshii
100
100
Methanococcus jannaschii
100
Methanobacterium thermoautotrophicum
Phylogénies congruentes sauf pour la position des
Thermoplasmatales HGT préférentiels à partir des
Sulfolobales ? Proximité écologique gt Proximité
phylogénétique
37
86
100
Halobacterium sp.
23
94
100
Haloarcula marismortui
51
100
100
100
Methanosarcina barkeri
Archaeoglobus fulgidus
98
Thermoplasma acidophilum
42
Ferroplasma acidarmanus
100
100
Matte et al. TIG 2002
14
Comparaison des protéomes des Thermoplasmatales
et Sulfolobales
Pyrobaculum aerophilum
Aeropyrum pernix
Sulfolobus solfataricus ? 2981 ORF
100
Pyrococcus furiosus ? 2125 ORF
Pyrococcus abyssi
100
Pyrococcus horikoshii
100
Methanococcus jannaschii
100
Methanobacterium thermoautotrophicum
Échanges de gènes importants entre
microorganismes vivants dans un même milieu gt
Adaptation secondaire des Thermoplasmatales au
milieu acide ?
86
Halobacterium sp.
100
Haloarcula marismortui
51
100
Methanosarcina barkeri
Archaeoglobus fulgidus
98
Thermoplasma acidophilum ? 1553 ORF
42
Picrophilus torridus ? 1535 ORF
100
Daprès Fütterer et al. PNAS 2004
15
Existe-t-il une phylogénie des Archaea ?
  • 53 r-protéines étudiées
  • 15 des r-protéines (9) sont détectées comme
    atypiques (HGT, biais de compositions, artefact)
  • Peu de biais préférentiel dans les HGT (P1 et P3
    proches)
  • gt Bruit aléatoire
  • 4 r-protéines supportent individuellement une
    émergence précoce des Thermoplasmatales HGT des
    Sulfolobales vers les Thermoplasmatales ?
  • attraction par les Crenarchaea
  • Phylogénie congruente avec celle basée sur lARNr
    16S
  • Biais
  • coévolution dans le ribosome des ARNr et des
    r-protéines
  • La congruence observée peut refléter
  • un fort biais dans le sens des HGT

Étude dautres systèmes indépendants de la
traduction
16
Analyse dautres systèmes la transcription
  • Transcription chez les Archaea
  • RNA polymerase
  • RNA polymerase
  • 12 sous-unités
  • Facteurs de transcription
  • NusA et NusG
  • Paralogues multiples TBP, TFB
  • Distribution taxonomique trop restreinte TFE,
    TFIIH, TIP49

17
Analyses individuelles
rpoH
A. pernix
P. aerophilum
S. solfataricus
37
S. tokodaii
97
A. fulgidus
M. thermoautotrophicum
P. abyssi
91
19
P. horikoshii
1 seul HGT probable entre Thermoplasmatales et
Methanopyrus kandleri
P. furiosus
100
11
H. sp.
H. marismortui
100
M. kandleri
15
25
F. acidarmanus
83
T. acidophilum
40
T. volcanium
95
19
M. jannaschii
47
M. maripaludis
65
M. barkeri
45
M.mazei
99
M. acetivorans
ARBRE NJ, matrice de distances JJTG
rpoM/TFIIS est manquante chez Methanopyrus
kandleri
Brochier et al. Genome Biology 2004
18
Traduction vs Transcription
53 r-protéines, 6373 aa ML JTT G
Protéines de la transcription 3275 aa, ML JTT G
P.aerophilum
A.pernix
S.tokodaii
84
100
100
S.solfataricus
100
P.furiosus
P.horikoshii
P.abyssi
100
M.kandleri
100
M.thermautotrophicus
85
M.jannashii
88
89
M.maripaludis
100
100
79
F.acidarmanus
T.acidophilum
98
100
62
100
T.volcanium
100
41
100
A.fulgidus
96
Halobacterium sp.
100
100
H.marismortui
100
100
100
M.barkeri
100
1 incongruence majeure !
2 incongruences mineures !
Brochier et al. Genome Biology 2004
19
Methanopyrus kandleri
de divergence observé dans les JDD traduction
et transcription
30 des sites de la fusion
Traduction (r-protéines)
Couples M kandleri - x
Divergence de M. kandleri observée transcription
gt traduction
Transcription (RNA pol sub.)
Brochier et al. Genome Biology 2004
20
Methanopyrus kandleri
Brochier et al. Genome Biology 2004
21
Le paradoxe de Methanopyrus kandleri
  • Émergence précoce
  • Lipides primitifs
  • Signatures de crenarchaeota ARNr 16S
  • Phylogénie ARNr 16S, RNA polymerases
  • Émergence tardive mais évolution rapide
  • Protéines ribosomiques
  • Contenu en gène du génome
  • Réarrangements génomiques
  • Split de gènes (réverse gyrase)
  • Fusion de gène (histones)
  • Gènes uniques/orphelins (DNA topoisomerase V type
    1B)
  • Perte de rpoM/TFIIS

Slesarev et al. PNAS 2002
22
Résoudre les incongruences ?
  • Methanopyrus kandleri
  • Artefact pour dans la phylogénie des protéines de
    la transcription
  • gt Ajout de séquences proches de M. kandleri gt
    Casser sa longue branche
  • Methanobacteriales/Methanococcales et
    Archaeoglobus
  • Manque de signal phylogénétique
  • gt Augmenter léchantillonnage taxonomique
  • HGT non détectés

23
Analyse de 25 génomes
Pyrobaculum aerophilum
Aeropyrum pernix


Sulfolobus tokodaii
100
100
Sulfolobus solfataricus


Nanoarcheum equitans
Thermococcus gammatolerans
Pyrococcus furiosus

Pyrococcus abyssi


Pyrococus horikoshii

100

Methanopyrus kandleri
100

Methanobacterium thermautotrophicus
55
95
Methanococcus maripaludis
68

Methanocaldococcus jannashii
100

Ferroplasma acidarmanus
Thermoplasma volcanium
31
82


Thermoplasma acidophilum


Archaeoglobus fulgidus
97
77
Haloferax volcanii
Haloarcula marismortui
85


96
Halobacterium sp.
86
45
Methanogenium frigidum
98
86
Methanobacteroides burtonii
100
79
Methanosarcina barkeri
0.1
0.1
100
100
Methanosarcina acetivorans


Methanosarcina mazei
transcription ML JTTG

r-protéines ML JTTG

1 incongruence majeure !
Les deux incongruences mineures ont disparu !
Brochier et al. BMC Evolutionary Biology 2005
24
Enzymes impliquées dans la méthanogénèse et dans
la synthèse des cofacteurs
25
Phylogénie des protéines impliquées dans la
méthanogénèse
Non méthanogènes
Methanopyrus kandleri
M. thermautotrophicus
Methanogènes Classe I
Methanocaldococcus jannaschii
Methanosarcinales
Methanogènes Classe II
Methanomicrobiales
Seuls 3 transferts de protéines impliquées dans
la méthanogénèse ou dans la synthèse des
coenzymes sont observés entre méthanogènes
Gènes non organisés en opéron
Acquisition unique de la méthanogénèse au cours
de lévolution des Euryarchaea plus probable que
celle dacquisitions multiples via HGT entre des
groupes distants (évolutivement et écologiquement)
26
Évolution de la méthanogénèse
Nanoarchaeota
Crenarchaeota
100
100
100
100
Thermococcales
100
Methanopyrales
Methanobacteriales
98
Methanococcales
49
100
Euryarchaeota
Thermoplasmatales
100
100
Archaeoglobales
99
Halobacteriales
100
82
Methanomicrobiales
100
100
Methanosarcinales
100
100
0.1
100
Methanogènes (Classe I)
Perte des gènes impliqués dans la methanogénèse
Methanogènes (Classe II)
Perte partielle des gènes impliqués dans la
methanogénèse
27
Une phylogénie des Archaea totalement résolue ?
Pyrobaculum aerophilum
  • Séparation des Crenarchaeota/Euryarchaeota
  • N. equitans Troisième phyla
  • Émergence précoce des Thermococcales
  • Méthanogénèse non ancestrale
  • Manque de signal pour la position relative des
    Methanopyrales Methanococcales
    Methanobacteriales
  • Grand cluster regroupant les Thermoplasmatales
    Archaeoglobus Halobacteria Methanomicrobia
  • gt Émergence tardive des Halophiles et
    Thermoplasmatales

Aeropyrum pernix

Sulfolobus tokodaii
100
Sulfolobus solfataricus

Nanoarcheum equitans
Thermococcus gammatolerans
Pyrococcus furiosus
100
Pyrococcus abyssi

Pyrococus horikoshii

Methanopyrus kandleri
Et pourtant
100
Methanobacterium thermautotrophicus
55
Methanococcus maripaludis
Methanocaldococcus jannashii
100

Ferroplasma acidarmanus
Thermoplasma volcanium
31

Thermoplasma acidophilum

Archaeoglobus fulgidus
97
Haloferax volcanii
Haloarcula marismortui
85

Halobacterium sp.
86
Methanogenium frigidum
98
Methanobacteroides burtonii
100
Methanosarcina barkeri
0.1
100
Methanosarcina acetivorans

Methanosarcina mazei

Brochier et al. BMC Evolutionary Biology 2005
r-protéines ML JTTG
28
Nanoarchaeota le troisième phyla
  • Isolée pour la première fois en 2002 (Stetter et
    al. 2002)
  • Plus petite cellule vivante connue (400nm)
  • ARNr 16S très divergent (non amplifiable avec des
    amorces classiques)
  • Association stricte à la surface de son hôte
    Ignicoccus (une Crenarchaeota)
  • Plus petit génome séquencé (480Kb)
  • Émergence précoce dans les phylogénies basées sur
    lARNr 16S et une concaténation de protéines
    ribosomiques
  • Assigné à un nouveau phylum Nanoarchaeota

Waters et al. PNAS 2003
29
Position de Nanoarchaeum equitans
Brochier et al. Genome Biology 2005
La majorité des protéines ribosomiques
soutiennent individuellement une émergence dans
les Euryarchaeota
Les protéines ribosomiques sont de petite
taille gt Quelle confiance peut-on avoir dans ce
placement ?
30
Position des Sulfolobales et Halobactériales
Malgré leur petite taille la position correcte de
ces deux groupes est majoritairement retrouvée
56
31
Marqueurs alternatifs
EF-1a (ML et MB, JTT G)
EF-2 (ML et MB, JTT G)
TOPOVI A (ML et MB, JTT G)
32
Position de N. equitans
Desulfurococcales
Nanoarchaeota
Sulfolobus solfataricus
Aeropyrum pernix
Nanoarchaeum equitans
Sulfolobales
Sulfolobus tokodaii
Thermococcales
2
3
100
1
4
100
100
Thermoproteales
Methanopyrales
Pyrobaculum aerophilum
100
Methanopyrus kandleri
100
60
100
Methanocaldococcus jannaschii
72
82
Archaeoglobales
Archaeoglobus fulgidus
96
100
75
Methanogenium frigidum
Methanococcus maripaludis
Methanomicrobiales
100
100
100
Methanococcales
Methanothermobacter thermautotrophicus
100
Methanococcoides burtonii
Methanobacteriales
100
Methanosarcina barkeri
100
100
Methanosarcina mazei
100
Methanosarcinales
100
Thermoplasma volcanium
Methanosarcina acetivorans
63
Thermoplasma acidophilum
Haloarcula marismortui
Ferroplasma acidarmanus
Halobacterium sp
1 - Pyrococcus furiosus 2 - Pyrococcus abyssi 3 -
Pyrococcus horikoshii 4 - Thermococcus
gammatolerans
Haloferax volcanii
0.1
Thermoplasmatales
Halobacteriales
r-protéines ML JTT G
Brochier et al. Genome Biology 2005
33
Position de N. equitans
  • Peut-être mal placée dans les études précédentes
  • gt Assignation à un troisième phylum peut-être
    prématurée
  • HGT de r-protéines à partir dIgnicoccus ?
  • Caractères typiques partagés avec les Euryotes ?
    caractères dérivés
  • DNA polymerase famille D
  • protéines de division cellulaire FTSZ MinD
  • Insertion dans EF-1a
  • Présence dhistones de type Eucaryote

34
Pyrobaculum aerophilum
Thermoproteales
Hyperthermus butylicus
Desulfurococcales
Aeropyrum pernix
Sulfolobus solfataricus
Sulfolobus tokodaii
Sulfolobales
Sulfolobus acidocaldarius
Nanoarchaeum equitans
Nanoarchaeota
Thermococcus kodakarensis
Thermococcus gammatolerans
Pyrococcus furiosus
Thermococcales
Pyrococcus horikoshii
Pyrococcus abyssi
Methanopyrus kandleri
Methanopyrales
M. thermautotrophicus
Methanobacteriales
Methanocaldococcus jannaschii
Methanococcales
Methanococcus maripaludis
Picrophilus torridus
Ferroplasma acidarmanus
Thermoplasmatales
Thermoplasma acidophilum
Thermoplasma volcanium
Archaeoglobus fulgidus
Archaeoglobales
Haloarcula marismortui
Halobacterium salinarum
Halobacteriales
Haloferax volcanii
Methanogenium frigidum
Methanomicrobiales
Methanococcoides burtonii
Methanosarcina barkeri
Methanosarcinales
Methanosarcina mazei
Methanosarcina acetivorans
35
Perspectives
  • Améliorer la méthodologie (détection de
    lincongruence)
  • Analyser de nouveaux systèmes (exosome, SRP,
    proteasome, réplication)
  • Intégrer les nouveaux génomes (Ignicoccus,
    Korarchaeota, Crenarchaea mésophiles
    Cenarchaeum symbiosum)

36
Phylogénie des Archaea (RNRr 16S)
Euryarchaeota (9 ordres)
Halobacteriales
Methanomicrobiales
Thermoplasmatales
Methanobacteriales
Methanosarcinales
Archaeoglobales
Methanoccocales
Thermococcales
Methanopyrales
BACTERIA EUKARYA
AAG group
Korarchaeota
Nanoarchaeota
Thermoproteales
Desulfurococcales
Sulfolobales
Crenarchaeota (3 ordres)
0.05
Adapté de Schleper Nat Rev Microbio 2005
37
Analyse des protéines de la traduction
Protéines de la traduction
Trop despèces non représentées (10)
Séquences paralogues (8) ARNt synthétases (20)
Séquences non paralogues (orthologues ou
xénologues ) (57)
Fusion P4
Fusion P1
Calcul des valeurs de vraisemblance pour un
échantillonnage représentatif de topologies
Analyse en Composante Principale des valeurs de
déviation standard de chaque topologie par
rapport à la meilleure
38
Résultats de lACP
P1 (9000 pos)
Ala
EF-G
Axe 1 (83)
ARNr (3500 pos)
Gènes a priori orthologues
Rps14
Gènes a priori non orthologues
Fusions
Axe 2 (7)
P4 (11000 pos)
39
Protéines traduction vs ARNr 16S 23S
?
?
Chlamydiales
Protéines
9000 positions
Mycoplasmas (Low GC Gram positives)
?
?
?
Spirochetes
Chlamydiales
Cyanobacteria
?
Green Sulfur
Spirochetes
D. radiodurans
Cytophagales
?
High GC Gram positives
Green Sulfur
?
Cytophagales
Low GC Gram positives
Thermotogales
Thermotogales
Aquificales
Aquificales
Mycoplasmas
Cyanobacteria
ARNr
3500 positions
Low GC Gram positives
D. radiodurans
High GC Gram positives
Valeurs de bootstrap inférieures à 90
40
Phylogénie du facteur délongation EF-G
Campylobacter
Campylobacter
Helicobacter
Helicobacter
Thiobacillus
Thiobacillus
Vibrio
Vibrio
Yersinia
Escherichia
Pasteurella
Haemophilus
Shewanella
Shewanella
Pseudomonas aeruginosa
Pseudomonas fluorescens
Pseudomonas aeruginosa
Pseudomonas
Xylella
Nitrosomonas
Nitrosomonas
Thiomonas
Burkholderia
Bordetella
Ralstonia
Bordetella
Bordetella
Burkholderia
Ralstonia
Neisseria
Neisseria
Fusion P1
EF-G
41
Phylogénie de lalanine ARNt synthétase
?-protéobactéries
Chlamydiales
?-protéobactéries
?-protéobactéries
Aquificales
Bactéries vertes sulfureuses
?-protéobactéries
Cytophagales
Deinococcales
Cyanobactéries
Spirochètes
Bactéries gram positives à haut taux de GC
Thermotogales
Bactéries gram positives à bas taux GC
42
(No Transcript)
43
Quantification des transferts horizontaux
  • Comparaison du contenu de génomes proches
  • 20 du génome de Salmonella est dorigine
    exogène récente
  • (Lan et Reeves 1996)
  • Très peu de transferts chez Chlamydia ou
    Rickettsia
  • (Kalman et al. 1999, Ogata et al. 2001)
  • Recherche de similitudes par BLAST
  • 24 des gènes de Thermotoga maritima et 16 des
    gènes dAquifex aeolicus seraient dorigine
    archébactérienne
  • (Aravind et al. 1998, Nelson et al. 1999)
  • Biais de composition
  • 18 du génome dEscherichia coli K-12 aurait été
    acquis par transfert depuis la divergence avec
    Salmonella.
  • (Lawrence et al. 1998)

Estimations très variables et contradictoires
(Ragan 2001).
44
Hypothèse de complexité
Fréquence des transferts
gt
Gènes du métabolisme
Gènes de linformation
Procaryotes
La probabilité de fixation dun gène transféré
décroît avec le nombre et la complexité des
interactions qua le produit de ce gène dans la
cellule (Jain et al. PNAS 1999)
Les gènes de linformation (réplication,
transcription, traduction) formeraient un
 noyau  de gènes peu transférés
Gènes du métabolisme, Gènes de linformation
Euryarcheota
Dans les 2 cas, lestimation des taux de
transferts est probablement biaisée par des
échantillonnages taxonomiques trop faibles (4 ou
6 taxons)
45
Phylogénie des protéines impliquées dans la
méthanogénèse
ML phylogenie de 7 protéines impliquées dans la
synthèse des coenzymes (aksD, aksE, aksF, cofD,
cofG, cofH, comD)
Non méthanogènes
Methanopyrus kandleri
M. thermautotrophicus
Methanogènes Classe I
100
Methanocaldococcus jannaschii
88
Methanosarcina acetivorans
Seuls 3 transferts de protéines impliquées dans
la méthanogénèse ou dans la synthèse des
coenzymes sont observés entre méthanogènes
Methanogènes Classe II
Methanosarcina mazeii
100
1
ML phylogenie de 9 protéines impliquées dans la
méthanogénèse (ftr, fwdA, mcrA, mer, mtd, mtrB,
mtrC, mtrD, mtrE)
Gènes non organisés en opéron
M. thermautotrophicus
Acquisition unique de la méthanogénèse au cours
de lévolution des Euryarchaea plus probable que
celle dacquisitions multiples via HGT entre des
groupes distants (évolutivement et écologiquement)
Methanopyrus kandleri
Methanocaldococcus jannaschii
70
Methanogens Class I
100
Methanogens Class II
100
Methanosarcina barkeri
10
Methanomicrobiales
65
Methanosarcina acetivorans
Methanosarcina mazeii
46
(No Transcript)
Write a Comment
User Comments (0)
About PowerShow.com