Anotacin de Genomas con ESTs - PowerPoint PPT Presentation

1 / 39
About This Presentation
Title:

Anotacin de Genomas con ESTs

Description:

Conocer un poco m s sobre como se anotan genomas autom ticamente ... Por ejemplo: embri n, feto, adulto. Ontolog as eVOC http://www.sanbi.ac.za/evoc ... – PowerPoint PPT presentation

Number of Views:64
Avg rating:3.0/5.0
Slides: 40
Provided by: eduard84
Category:
Tags: anotacin | con | ests | feto | genomas

less

Transcript and Presenter's Notes

Title: Anotacin de Genomas con ESTs


1
Anotación de Genomas con ESTs
  • Eduardo Eyras
  • Bioinformática UPF Marzo 2006

2
  • Objetivos
  • Conocer un poco más sobre como se anotan genomas
    automáticamente
  • Y el uso de ESTs para anotar genomas

3
(No Transcript)
4
(No Transcript)
5
(No Transcript)
6
(No Transcript)
7
Objetivo
8
Localización en el genoma de genes
conocidos (known)
Proteínas conocidas
Secuencias de mRNAs
9
Alineamiento de proteínas/mRNAs al genoma en dos
pasos
1
BLAST proteína/mRNA query contra genoma
2
Realinea proteína/mRNA query contra región
genómica
Resultado estructura exónica
10
Alineando mRNAs al genoma
. . . GCCGCACCTGAAGAGGGAAAAGC . . .
mRNA query
404 CAGCCGCACCTGAAGAGG gtgtgtgt Target
Intron 2 gtgtgtgt GAAAAGC 428
792 bp
27250191 CAGCCGCACCTGAAGAGGgt........
.................agGAAAAGC 27251007
Secuencia genómica
Programas Exonerate, Blat, Sim4, Spidey
11
Alineando Proteínas al genoma
Proteína query
DCUP_HUMAN . . . RFPLDAAIIFSDILVVPQALGMEVTM . . .

DCUP_HUMAN 75 RFPLDAAIIFSDILVVPQ
ALGMEVTM RF
LDAAIIFSDILVVPQ ALGMEVTM
RFLLDAAIIFSDILVVPQ
ALGMEVTM HS307871 2141
ctccgggaattgacggccGTACCCA Intron 4 CAGgcgaggaa
gtttacctttcattttcalt0-----21
95 2433-0gtctgtatct
cctgttcctccccttacg agcgggcg
La traducción de la secuencia genómica
Secuencia genómica partida en codones
Programas GeneWise, Exonerate
12
Combinando proteinas y mRNAs
Proteína alineada al genoma
mRNA alineado en el mismo locus
Anotación de un tránscrito con CDS y UTR
13
Como encontrar más genes(novel)
Programas de predicción de genes e.g. Genscan,
Geneid, SGP2, Twinscan, etc
Predicción
Comparamos con bases de datos (Proteínas, mRNAs,
ESTs, etc)
Tránscrito 1
Tránscrito 2
Contruimos tráncritos a partir de predicciones
con evidencia
14
Anotación Funcional
Anotación (predicción a partir de proteína o mRNA)
Comparación con Bases de Datos con información
Funcional
15
A la caza de genes
  • Consorcio Público (HGP) Secuenciación del Genoma

Inciativa privada (Craig Venter) Secuenciación
de ESTs
16
ESTs (Expressed Sequence Tags)
Traducción Etiquetas de secuencias expresadas?
Son fragmentos de secuencia obtenidos a partir de
clones de cDNA Tiene una longitud de 300-600
bases Pueden contener parte del CDS y/o UTR
17
Obtención de cDNA
mRNA extraído de células de un determinado
tejido, estado de enfermedad y desarrollo.
18
ESTs
3
5
AAAAAA
Clone cDNA into a vector
TTTTTT
5
3
5 EST
Single-pass sequence reads
Multiple cDNA clones
3 EST
19
Genoma
Tránscrito primario
Splicing
Variantes de splicing
oligo-dT primer Transcriptasa Reversa
Clones de cDNA
Secuencias de ESTs (una única lectura)
5 3
5 3
20
Longitud de los ESTs
450 bp
Distribución de longitudes para ESTs de human
(dbEST)
21
Alineamiento de ESTs al genoma para anotar genes
EST
GT
AG
GT
AG
  • El alineamiento define exones e intrones

22
  • dbEST Más de 7 MILLONES de ESTs de humano

Alineamiento al genoma humano 3 Gigabases
23
Desarrollo de software specializado Programas
que mejoran en rapidez sin perder en calidad en
los alineamientos. Desarrollo de tecnología
especializada Computación en paralelo con más
de 2000 CPUs
24
Alineamiento de ESTs al genoma
Pueden contener colas polyA/polyT del cDNA
tenemos que cortarlas Pueden contener
contaminación del vector tenemos que
filtrarlos. Pueden contener intrones no
procesados (clones de tránscritos no maduros)
damos preferencia a ESTs que alineen con 1 ó más
intrones, con dinucleótidos consenso GTAG,
ATAC, GCAG Es secuenciación de baja calidad
(1 única pasada) Solo aceptamos matches casi
exactos al genoma (coverage gt 97, percent idgt
95)
25
Alineamiento de ESTs al genoma
EST
Stop
PolyA

AAAA
Pseudogene procesado
GT
AG
GT
AG
Mejor alineamiento en todo el genoma
Parálogo
26
Alineamiento de ESTs al genoma
EST quimérico
Trozo de gen A
Trozo de gen B
Thomson et al.. Fusion of the human gene for the
polyubiquitination coeffector UEV1 with Kua,
anewly identified gene.Genome Res. 2000
Nov10(11)1743-56 Parra et al. Tandem chimerism
as a means to increase protein complexity in the
human genome.Genome Res. 2006 Jan16(1)37-44
27
ESTs dan información sobre variantes de splicing
ESTs
Genoma
Cuales son los tránscritos representados por
este set de ESTs alienados al genoma? podemos
averiguar el conjunto de mRNAs en este locus del
genoma que supuestamente han dado lugar ha estos
ESTs?
28
Compatibilidades entre distintos ESTs
2 ESTs pueden tener estructura exónicas
redundantes
x
z
x z
z es redundante con x -gt es suficiente quedarnos
con x
29
Extensión de la estructura exónica
Consider 2 ESTs in a Genomic Cluster with more
ESTS
x
y
x y
y extiende x, podemos asumir que provienen del
mismo mRNA
30
Extensión de la estructura exónica
El resultado depende de la representación de
exones en los ESTs. Sin embargo, ESTs suelen
representar mayormente regiones 3y 5.
x
z
w
ESTs como z no son muy frecuentes, por lo que
tendremos fragmentación
31
Complejidad de las estructuras exónicas
x
z
w
x z
z w
En un grupo de ESTs pueden existir redundancias y
extensiones. Todas pueden ser importantes w es
compatible con z pero no con x, mantenemos z a
pesar de ser redundante con x, para obtener z w
32
Predicción de tránscritos a partir de ESTs
ESTs
Predicciones
Podemos obtener predicciones de mRNAs teniendo en
cuenta las compatibilidades entre ESTs.
Eyras et al. Genome Research 2004
33
(No Transcript)
34
ESTs proporcionan información sobre la expresión
de genes
Ontologías eVOC http//www.sanbi.ac.za/ev
oc/
El tejido, órgano o sistema anatómico en el que
se ha preparado la muestra. Por ejemplo
digestivo, pulmón, retina. El tipo de célula en
el que se ha preparado la muestra.Ejemplo
Linfocitos B, Fibroblasto. El estado patológico
del tejido en el que se preparó la muestra. Por
ejemplo normal, linfoma. El estadio en el
desarrollo del organismo en el cual se preparó la
muestra. Por ejemplo embrión, feto, adulto.
35
ESTs proporcionan información sobre la expresión
de genes
Ontologías eVOC http//www.sanbi.ac.za/ev
oc/
Sistema Anatómico
Estado de Desarrollo
Tipo de Célula
Patología

nervioso
cerebro
cerebelo

Librería 1
Librería 2

ESTs
ESTs
36
Como conectar el vocabulario de expressión con
los genes previamente anotados
ESTs
Genes
V Curwen et al. Genome Research (2004)
37
Vocabulario de expresión
38
  • CONCLUSIONES
  • La anotación de genomas requiere software
    especializado.
  • ESTs (muestreo parcial de mRNAs) son útiles para
    anotar genomas. En particular, para obtener
    información sobre splicing alternativo y sobre el
    contexto de la expresión.
  • La producción de ESTs es rápida y barata pero los
    datos necesitan bastante procesamiento.
  • Los ESTs solo dan información sobre los
    tránscritos expresados por la célula. Para
    estudia regiones reguladoras necesitamos el
    genoma.

39
  • FIN
Write a Comment
User Comments (0)
About PowerShow.com