Bioinformatic PhD. course - PowerPoint PPT Presentation

1 / 32
About This Presentation
Title:

Bioinformatic PhD. course

Description:

Bioinformatic PhD. course. Bioinformatics. Xavier Messeguer Peypoch (http://www. ... Dot Matrix Pairwise alignment Multiple alignment ... – PowerPoint PPT presentation

Number of Views:165
Avg rating:3.0/5.0
Slides: 33
Provided by: lcl2
Category:

less

Transcript and Presenter's Notes

Title: Bioinformatic PhD. course


1
Bioinformatic PhD. course
Bioinformatics Xavier Messeguer Peypoch
(http//www.lsi.upc.es/alggen) LSI Dep. de
Llenguatges i Sistemes Informàtics BSC Barcelona
Supercomputing Center Universitat Politècnica de
Catalunya
2
Contents
1. Biological introduction
2. Comparison of short sequences ( up to
10.000bps)
Dot Matrix Pairwise alignment
Multiple alignment
3. Comparison of large sequences ( more that
10.000bps)
Data structures Suffix trees MUMs
4. String matching
Exact Extended Approximate
5. Sequence assembly
4. Projects PROMO, MREPATT,
3
Contents
1. Biological introduction
2. Comparison of short sequences ( up to
10.000bps)
Dot Matrix Pairwise alignment
Multiple alignment
3. Comparison of large sequences ( more that
10.000bps)
Data structures Suffix trees MUMs
4. String matching
Exact Extended Approximate
5. Sequence assembly
4. Projects PROMO, MREPATT,
4
Genoma
  • Els cromosomes són els volums duna enciclopèdia
    anomanada Genoma.

Les lletres, les paraules i les frases com són?
5
Dna STRUCTURE
1953 Watson and Crick discover the structure of
DNA
1953 Rosalind Franklin X difraction image of DNA
6
Cromosomes les lletres
Llavors un cromosoma serà ... A T A G G C T A C
G C A A A C C G G T C T A ...
7
Cromosomes les lletres
... G A C T ...
... C T G A ..
Llavors G A C T A G T C
Si busquem GACT dins la seqüència CACGACTATACGATA
TCGACTCATACGAGTCGTACGTA
Les paraules i les frases com són?
8
Cromosomes les frases i les paraules
9
Cromosomes activació duna instrucció
Transcripció
10
Transcription
11
Cromosomes activació duna instrucció
Transcripció
Maduració
Traducció
12
Cromosomes activació duna instrucció
Transcripció
Maduració
Traducció
Síntesi
13
Dogma central de la biologia molecular
14
Síntesi de les proteïnes
Dins la cel.lula mol/cel tipus mRNA
1500 600 tRNA 200000 gt3000 Proteïnes
106 2000
15
Cromosomes activació duna instrucció
Plegament
quines fases té?
16
Plegament de la proteïna
17
Proteins
18
Proteins
QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQES
KPVQMMCMNNSFNVATLPAEKMKILELPFASGDLSMLVLLPDEVSDLERI
EKTINFEKLTEWTNPNTMEKRRVKVYLPQMKIEEKYNLTSVLMALGMTDL
FIPSANLTGISSAESLKISQAVHGAFMELSEDGIEMAGSTGVIEDIKHSP
ESEQFRADHPFLFLIKHNPTNTIVYFGRYWSP
19
Activació duna instrucció (a linversa)
Transcripció
Maduració
Traducció
Plegament
20
Traducció
LRRLPGAATXXYRTFAAGTRRRXXXWA
Llavors la informació
està codificada com
LRRLPGAATXXYRTFAAGTRRRXXXWA
que és la traducció de
ACUCCAUUCUUUAACAGGGCCAUAUCGGCUAUAGGCCGAGUUAGGUACGA
UUAGCACGGAUACUAGCAUAUGCAUCGUAUAGCAUCGAUUAGAA
21
Maduració
LRRLPGAATXXYRTFAAGTRRRXXXWA
Traducció
UCUCCAUUCUUUAACAGGAUAUCGGCUAAGGCCGAGUUAGGUACGAUUAG
CACGGAUAUAGCAUAUGCAUCGUAUAGCAUCGAUUAGAAU
Maduració
Transcripció
22
Maduració
23
Transcripció
24
Cromosoma
Torrades amb mantega i melmelada
Els gens ocupen el 8 del genoma
25
Part dun cromosoma
TACGTATACTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGT
ACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGA
TGCGACGATGCGACGATCGTACGACTGCTACGATGCGACGATGCGACGAT
CGTACGACTGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGT
AGCTACGTACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACGA
CGATCGTAGCTACGTACGATCGCGATGCGACGATGCGACGATCGTACGAC
TGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGT
ACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTA
GCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCG
CGCACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTAC
GCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACG
TACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTA
CGACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGA
TCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCAC
ACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACG
TACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCG
ATATTAATGCAATCATGCCGATGCGACGATGCGACGATCGTACGACTGCT
AGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGTACGA
TCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTAGCTA
CGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCA
CGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCAT
GCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACG
ACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGAC
GATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATC
GTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGT
ACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGA
TGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACG
TATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATAT
TAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTATAC
GACGATCGTAGCTAGCTGCATGCTAGCGATGCTACGATCGATGCTATACG
ACGATCGTAGCTTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTCGATGCGACGATGCGACGA
TCGTACGACTGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCG
TAGCTACGTACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACG
ACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTAC
GGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACT
GCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATC
GATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTA
GCGATGCTACGACGATCGTACGGTACACCGCGCACGATCACACGATGCGA
CGATGCGACGATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGC
TACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ATCGATGCTATACGACGATCGTAGCTGCAGCATCGATGCTACGTACGACG
ATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGACGAT
CGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTA
CGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACG
ACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGC
GACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTAT
CCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATATTAA
TGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTATACGAC
GATCGTAGCTGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGC
AGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGC
ATGCTAGCGATGCTACGGTACGATCGTCGATCGTcagctcgatacgttac
gatctacgattacgatcatctatactatactatacgatatatctagatat
cgatcta.ACTCCATTCTTTAAACCGTACTACACACACTACTGATCGACG
ATTACGACGACGAAAGGGCCATATCGGCTAACTACATCATAGACAACATC
ACGGATCGTCTAAGGCCGAGTTAGGTACGATTAACGTACGACTACCTATC
GTATATACATCACGGATATAACCTATCTACTACGATTAACACGATCTATC
GTACGGCATATGCATCGTATAGCATCGATTAGAATACGTATACGTACGAT
CGTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGT
ACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACG
ATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTATCCTA
CGTACGATCGTGCAGCATCGATGCTACGTTGCATCGATGCTATACGACGA
TCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTA
CACCGCGCACGATCACACGATGCGACGATGCGTGCATCGATGCTATACGA
CGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACG
GTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACTG
CTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGTAC
GATCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTAGC
TACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGA
TCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATC
GTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACAC
GATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTA
CGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGAT
ATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGCGATGCG
ACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTGCATCGATGCT
ATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTTGCAT
CGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTAC
GTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGA
TCGTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGC
AGCTGCATGCTAGCGATGCTACGACGATCGTACGGTACACCGCGCACGAT
CACACGATGCGACGATGCGACGATCGTACGATGCTGCATCGATGCTATAC
GACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTA
CGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGAC
TGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCAT
CGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCT
AGCGATGCTACGATCGATGCTATACGACGATCGTAGCTATGCTATACGAC
GATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTGCAT
CGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTAC
GTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGACTGCTAGCTACGCATGCCTACTGCATCGATGCTATACGAC
GATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGG
TACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACTGC
TAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGA
TGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGC
GATGCTACGGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGT
ACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTAC
GTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTAC
GACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAG
CATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCAT
GCTAGCGATGCTACGCTGCTAGCTACGCATGCCTACGTACGTATCCTACG
TACGATCGTGCAGCATCGATGCTACGTACGATGCATGCTAGCGATGCTAC
GACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACG
ATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGAT
CGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACA
CGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGT
ACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGA
TATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTA
TACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATC
GTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTA
CGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGA
TGCGACGATCGTACGACTGCTAGCTACGCATGCCTACTGCATCGATGCTA
TACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATC
GTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTAC
GACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAG
CATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCAT
GCTAGCGATGCTGTCACGTAGCATGCTGACGTACGATCGATTCGATCGAT
CGTACGATCGTAGCTAGCTAGTCGTAGCGACGTAGGATTCACGTAGCGAT
GCGTAGCGTAGCATGCTGACGATGCATCGATCGATGCATCATGCTAGCGT
AGCTAGCTAGCATGACTGATCGATTAACGGTACGTATCCTACGTACGATC
GTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAG
CTGCATGCTAGCGATGCTACGTACGGTACACCGCGCACGATCACACGATG
CGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTA
TCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATATTA
ATGCAATCATGCAGCTGCATGCTAGCGATGCTACGCTGCTAGCTACGCAT
GCCTACGTACGTATCCTACGTACGATCGTGCAGCGATCGATATTAATGCA
ATCATGCAGCTGCATGCTAGCGATGCTACGTACGTACGTATCCTACGTAC
GATCGTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCAT
GCAGCTGCATGCTAGCGATGCTACGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTAC
GTACGATCGTATGCTAGCTAGCATGCATGCATGCATGCAT
26
On es troba?
TACGTATACTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGT
ACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGA
TGCGACGATGCGACGATCGTACGACTGCTACGATGCGACGATGCGACGAT
CGTACGACTGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGT
AGCTACGTACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACGA
CGATCGTAGCTACGTACGATCGCGATGCGACGATGCGACGATCGTACGAC
TGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGT
ACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTA
GCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCG
CGCACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTAC
GCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACG
TACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTA
CGACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGA
TCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCAC
ACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACG
TACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCG
ATATTAATGCAATCATGCCGATGCGACGATGCGACGATCGTACGACTGCT
AGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGTACGA
TCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTAGCTA
CGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCA
CGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCAT
GCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACG
ACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGAC
GATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATC
GTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGT
ACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGA
TGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACG
TATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATAT
TAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTATAC
GACGATCGTAGCTAGCTGCATGCTAGCGATGCTACGATCGATGCTATACG
ACGATCGTAGCTTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTCGATGCGACGATGCGACGA
TCGTACGACTGCTAGCTACGCATGCCTGCATCGATGCTATACGACGATCG
TAGCTACGTACGATCGTACGACGTACGTTACGTTGCATCGATGCTATACG
ACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTAC
GGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACT
GCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATC
GATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTA
GCGATGCTACGACGATCGTACGGTACACCGCGCACGATCACACGATGCGA
CGATGCGACGATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGC
TACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ATCGATGCTATACGACGATCGTAGCTGCAGCATCGATGCTACGTACGACG
ATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGACGAT
CGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTA
CGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACG
ACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGC
GACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTAT
CCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATATTAA
TGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTATACGAC
GATCGTAGCTGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGC
AGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGC
ATGCTAGCGATGCTACGGTACGATCGTCGATCGTCAGCTCGATACGTTAC
GATCTACGATTACGATCATCTATACTATACTATACGATATATCTAGATAT
CGATCTA.ACTCCATTCTTTAAACCGTACTACACACACTACTGATCGACG
ATTACGACGACGAAAGGGCCATATCGGCTAACTACATCATAGACAACATC
ACGGATCGTCTAAGGCCGAGTTAGGTACGATTAACGTACGACTACCTATC
GTATATACATCACGGATATAACCTATCTACTACGATTAACACGATCTATC
GTACGGCATATGCATCGTATAGCATCGATTAGAATACGTATACGTACGAT
CGTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGT
ACGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACG
ATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTATCCTA
CGTACGATCGTGCAGCATCGATGCTACGTTGCATCGATGCTATACGACGA
TCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTA
CACCGCGCACGATCACACGATGCGACGATGCGTGCATCGATGCTATACGA
CGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACG
GTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACTG
CTAGCTACGCATGCCTGCATCGATGCTATACGACGATCGTAGCTACGTAC
GATCGTACGACGTACGTTACGTTGCATCGATGCTATACGACGATCGTAGC
TACGTACGATCGTACGACGTACGTTACGTACGATCGTACGGTACACCGCG
CACGATCACACGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGA
TCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGATC
GTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACAC
GATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTA
CGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGAT
ATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGCGATGCG
ACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTGCATCGATGCT
ATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTTGCAT
CGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTAC
GTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGA
TCGTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGC
AGCTGCATGCTAGCGATGCTACGACGATCGTACGGTACACCGCGCACGAT
CACACGATGCGACGATGCGACGATCGTACGATGCTGCATCGATGCTATAC
GACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTA
CGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGAC
TGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCAT
CGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCT
AGCGATGCTACGATCGATGCTATACGACGATCGTAGCTATGCTATACGAC
GATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTGCAT
CGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTAC
GTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGAC
GATCGTACGACTGCTAGCTACGCATGCCTACTGCATCGATGCTATACGAC
GATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATCGTACGG
TACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTACGACTGC
TAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGA
TGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGC
GATGCTACGGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGT
ACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTAC
GTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTAC
GACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAG
CATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCAT
GCTAGCGATGCTACGCTGCTAGCTACGCATGCCTACGTACGTATCCTACG
TACGATCGTGCAGCATCGATGCTACGTACGATGCATGCTAGCGATGCTAC
GACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACG
ATCGTACGATGCTGCATCGATGCTATACGACGATCGTAGCTACGTACGAT
CGTACGACGTACGTTACGTACGATCGTACGGTACACCGCGCACGATCACA
CGATGCGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGT
ACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGA
TATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACGATCGATGCTA
TACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATC
GTGCATCGATGCTATACGACGATCGTAGCTACGTACGATCGTACGACGTA
CGTTACGTACGATCGTACGGTACACCGCGCACGATCACACGATGCGACGA
TGCGACGATCGTACGACTGCTAGCTACGCATGCCTACTGCATCGATGCTA
TACGACGATCGTAGCTACGTACGATCGTACGACGTACGTTACGTACGATC
GTACGGTACACCGCGCACGATCACACGATGCGACGATGCGACGATCGTAC
GACTGCTAGCTACGCATGCCTACGTACGTATCCTACGTACGATCGTGCAG
CATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAGCTGCAT
GCTAGCGATGCTGTCACGTAGCATGCTGACGTACGATCGATTCGATCGAT
CGTACGATCGTAGCTAGCTAGTCGTAGCGACGTAGGATTCACGTAGCGAT
GCGTAGCGTAGCATGCTGACGATGCATCGATCGATGCATCATGCTAGCGT
AGCTAGCTAGCATGACTGATCGATTAACGGTACGTATCCTACGTACGATC
GTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCATGCAG
CTGCATGCTAGCGATGCTACGTACGGTACACCGCGCACGATCACACGATG
CGACGATGCGACGATCGTACGACTGCTAGCTACGCATGCCTACGTACGTA
TCCTACGTACGATCGTGCAGCATCGATGCTACGTACGACGATCGATATTA
ATGCAATCATGCAGCTGCATGCTAGCGATGCTACGCTGCTAGCTACGCAT
GCCTACGTACGTATCCTACGTACGATCGTGCAGCGATCGATATTAATGCA
ATCATGCAGCTGCATGCTAGCGATGCTACGTACGTACGTATCCTACGTAC
GATCGTGCAGCATCGATGCTACGTACGACGATCGATATTAATGCAATCAT
GCAGCTGCATGCTAGCGATGCTACGACGATCGTACGACTGCTAGCTACGC
ATGCCTACGTACGTATCCTACGTACGATCGTGCAGCATCGATGCTACGTA
CGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTACG
ACGACGATCGATATTAATGCAATCATGCAGCTGCATGCTAGCGATGCTAC
GTACGATCGTATGCTAGCTAGCATGCATGCATGCATGCAT
27
Human genome
2001 Draft of the human genome
  • Cromosoma 1 246Mb
  • .
  • Cromosoma 22 47Mb
  • Cromosoma X 149Mb
  • Cromosoma Y 58Mb

28
Human chromosomes
29
Whats in the human genome?
parasitic repetitive elements
gene coding part (2)
gene non- coding part
microsatellites
DNA long repeats
30
Annotation
31
Comparison with another genomes
Organism Genome Size (Bases) Estimated Genes
Human (Homo sapiens) 3000 million 30,000
Laboratory mouse (M. musculus) 2600 million 30,000
Mustard weed (A. thaliana) 100 million 25,000
Roundworm (C. elegans) 97 million 19,000
Fruit fly (D. melanogaster) 137 million 13,000
Yeast (S. cerevisiae) 12.1 million 6,000
Bacterium (E. coli) 4.6 million 3,200
Human immunodeficiency virus (HIV) 9700 9
Genbank http//www.ncbi.nim.nih.gov
32
Homework
  1. TGDS Javier 14. ZFP161
  2. NR1H2 Dmitry 15. PROZ
  3. ATP5L2 Ana Iris
  4. MYCL3 David
  5. ETAA16 Patricia
  6. CRYBA2 Rogeli
  7. LOC389199 Atif
  8. NOS3 Aina
  9. FSCN3 Isaac
  10. C9orf122 Maria Merce
  11. MTTS1 Romina
  12. AMELY Guillem
  13. BiT1 Raul
Write a Comment
User Comments (0)
About PowerShow.com