DETECCI - PowerPoint PPT Presentation

1 / 28
About This Presentation
Title:

DETECCI

Description:

... Roseta: Identifica los pares observando que en otro ... M todo del Gen Vecino: Identifica los pares de prote nas que residen cerca en m ltiples genomas. ... – PowerPoint PPT presentation

Number of Views:56
Avg rating:3.0/5.0
Slides: 29
Provided by: may32
Category:
Tags: detecci | pares

less

Transcript and Presenter's Notes

Title: DETECCI


1
DETECCIÓN DE MÓDULOS FUNCIONALES PARALELOS
MEDIANTE EL ANÁLISIS COMPARATIVO DE SECUENCIAS DE
GENOMA
  • Nieves Ábalos Serrano
  • Mª Teresa Jiménez Ramírez
  • Miguel Ángel Moreo Fernández

2
Qué es la funcionalidad paralela?
  • Los módulos funcionales paralelos son conjuntos
    separados de proteínas en un organismo que
    catalizan una reacción bioquímica (la misma o
    similar) pero actúan en diferentes sustratos o
    usan diferentes cofactores.
  • Dan versatibilidad y complejidad a los organismos
  • Se originan mediante la duplicación genética
    durante la evolución.

3
Origen de la funcionalidad paralela
  • Existen organismos que tienen familias de
    secuencias de genes parecidas (paralogs). Se
    originaron a partir de la duplicación de genes y
    la posterior evolución de estos.
  • Se ha mostrado que el 50 de los genes
    procariotas y alrededor del 90 de los genes
    eucariotas han sido generados por duplicación
    genética.
  • Este hecho provoca que muchos genes codifiquen
    proteínas con algunas funciones parcialmente
    redundantes.

4
Método de detección módulos funcionalmente
paralelos.
  • Se ha desarrollado un método de cuatro pasos para
    descubrir módulos funcionales paralelos en todo
    el genoma, a partir de vínculos funcionales de
    proteínas.
  • De diez genomas se identificaron 37 sistemas
    celulares que consisten en módulos funcionales
    paralelos .

5
Métodos que infieren proteínas funcionalmente
vinculadas.
  • Varios métodos computacionales basados en el
    contexto genómico han sido desarrollados para
    inferir proteínas vinculadas funcionalmente.
  • Método del Perfil Filogenético Identifica los
    pares de proteínas que co-ocurren en varios
    genomas.

6
Métodos que infieren proteínas funcionalmente
vinculadas.
  • Método de la Piedra Roseta Identifica los pares
    observando que en otro genoma, las proteínas se
    encuentran fusionadas.

7
Métodos que infieren proteínas funcionalmente
vinculadas.
  • Método del Gen Vecino Identifica los pares de
    proteínas que residen cerca en múltiples genomas.

8
Métodos que infieren proteínas funcionalmente
vinculadas.
  • Método del Cluster de Genes Identifica pares de
    proteínas vinculadas basándose en distancias
    intergénicas cortas entre genes del genoma.

9
Métodos que infieren proteínas funcionalmente
vinculadas.
  • Ha sido mostrado que el rendimiento de estos
    métodos computacionales en la inferencia de
    interacciones de proteínas es cuantitativamente
    comparable al uso de datos experimentales a
    escala genómica.
  • El método de 4 pasos detecta módulos
    funcionalmente paralelos directamente a partir de
    secuencias de genoma. Este enfoque puede ser
    aplicado a organismos cuyas secuencias de genoma
    están disponibles.

10
Método de 4 pasos
  • PASO 1 Se aplican los métodos computacionales
    anteriores para detectar vínculos entre proteínas
    comparando con otros 82 genomas.
  • La salida de este paso es una descripción
    binaria del vínculo entre cada par de proteínas
    codificadas.
  • Si las dos proteínas están vinculadas con un
    nivel por encima del umbral escogido el vínculo
    es uno, en otro caso el vínculo es cero.

11
Método de 4 pasos
  • PASO 2 Construimos una matriz de vínculos
    funcionales para el genoma a estudiar y agrupamos
    las proteínas basándonos en la similaridad de sus
    patrones de vínculos funcionales usando un
    algoritmo de clustering jerárquico.

12
Método de 4 pasos.
  • PASO 2

Se construye una matriz simétrica de vínculos
funcionales. Está compuesta por 0s y 1s
(calculados en el paso 1) representando la
ausencia o presencia de vínculos funcionales
entre pares de proteínas.
13
Método de 4 pasos.
Agrupamos las proteínas basándonos en la
similaridad de sus patrones de vínculos
funcionales usando un algoritmo de clustering
jerárquico.
14
Método de 4 pasos.
  • PASO 2
  • Salida es una nueva matriz con las filas y
    columnas reordenadas donde las proteínas con las
    mismas funciones celulares o en los mismos
    pathways o complejos se meten en el mismo
    cluster.
  • La matriz reordenada puede ser visualizada en un
    mapa que llamamos mapa de cluster de vínculos
    funcionales del genoma.
  • El mapa está compuesto mayormente por pequeños
    clusters de proteínas altamente vinculadas.
    Típicamente los clusters se muestran en la
    diagonal del mapa arbitrariamente desde la
    esquina superior izquierda hasta la esquina
    inferior derecha de nuestro mapa debido a la
    simetría de los vínculos funcionales de la matriz.

15
Método de 4 pasos.
  • PASO 3

Buscamos visualmente clusters en la diagonal del
mapa de vínculos funcionales
16
Método de 4 pasos.
  • PASO 3
  • i) un patrón de cluster típico para pathways y
    complejos
  • ii) un patrón de cluster diagonal para tres
    módulos funcionales paralelos cada uno con dos
    componentes principales.
  • iii) Un patrón de cluster diagonal para dos
    módulos funcionales paralelos cada uno con tres
    componentes principales
  • Nótese que en (ii) y (iii) las proteínas en un
    subgrupo están vinculadas a proteínas en otro
    subgrupo(s), pero no con otras.

17
Método de 4 pasos.
PASO 4 Extracción manual de proteínas y sus
vínculos funcionales codificados en el patrón de
cluster de la diagonal del mapa
18
Método de 4 pasos.
PASO 4
Casar patrones de módulo y borrar vínculos entre
módulos funcionales paralelos que aparecen de las
relaciones paralogous usando relaciones de
localización de genes (genomas procariotas) o
relaciones de coevolución (genomas eucariotas)
19
Método de 4 pasos.
PASO 4 Finalmente, se añaden las proteínas que
están vinculadas a componentes del módulo pero no
están incluídas en la diagonal cluster.
(Proteínas 2 y 8 en los círculos sombreados)
produciendo una red de vínculos funcionales para
los módulos funcionales paralelos.
20
Descubrimiento
  • Un conjunto dado de módulos funcionales paralelos
    debe ser específico para un organismo dado ?
    Refleja el estilo de vida del organismo.
  • Por otro lado, algunos módulos funcionales
    paralelos son comunes en muchos organismos. ? Las
    funciones de estos módulos son esenciales para
    sobrevivir.

21
Estilo de vida de un organismo
  • Ejemplo En este análisis, podemos ver que
    R.Palustris
  • Tiene un estilo de vida metabólicamente versátil,
    es decir, que sobrevive en diversos entornos.
  • Transforma el nitrógeno de la atmósfera en NH3. ?
    Nitrogenasas y enzimas para el uso del nitrógeno.
  • Usa el CO2 y varios componentes aromáticos como
    sus fuentes de carbón. ? Enzimas de degradación
    de componentes aromáticos.

22
Módulos esenciales para sobrevivir
  • Ejemplo en el análisis de genomas eucariotas,
    observamos
  • la existencia de Heat Shock proteins (proteínas
    chaperonas).

23
Módulos funcionales paralelos
  • La identificación de estos módulos puede ayudar a
    interpretar la fisiología de un organismo a
    partir de sus secuencias de genoma
  • La existencia de módulos para una función dada
    ? el organismo es versátil en llevar a cabo
    la función. ? puede sobrevivir mejor en
    diversos entornos donde la función es necesitada.

24
Fisiología
  • Ejemplo La bacteria E.Coli K12
  • Posee 6 transportadores de péptidos (con distinto
    espectro y especificaciones de substrato), que
    son usados como fuente de carbón y nitrógeno.
  • Se necesitan para sobrevivir en distintos
    entornos donde los nutrientes disponibles son
    diferentes.

25
Otros métodos para descubrir la funcionalidad
paralela
  • El método de Kelley et al.
  • Usa datos de interacción de proteínas
    experimentales a gran escala.
  • Otro, más rudimentario y con limitaciones
  • Usa secuencias de genoma, combinando búsquedas de
    homólogos y relaciones de localización de genes.
  • Necesita conocer los componentes de un módulo
    funcional a priori.
  • Usa el tradicional alineamiento de secuencias.

26
Características del método de cuatro pasos (I)
  • Descubrimiento de módulos funcionales paralelos
    en todo el genoma.
  • Método de descubrimiento guiado, libre de la
    necesidad de centrarse en un objetivo
    predeterminado.
  • Usa secuencias de genoma.
  • Puede ser aplicado a todos los organismos
    completamente secuenciados y no está limitado por
    la disponibilidad de datos experimentales.

27
Características del método de cuatro pasos (II)
  • Identifica módulos funcionales paralelos
    codificados en los genomas pero que no se
    expresan bajo las condiciones experimentales.
  • Funciones redundantes que sólo se expresan en
    condiciones específicas.
  • Descubre redes de proteínas deducidas.
  • Simultáneamente, revelando las relaciones
    funcionales entre las proteínas dentro de los
    módulos.

28
Características del método de cuatro pasos (III)
  • Proporciona inferencia de mayor resolución de las
    funciones de las proteínas.
  • Basado en la pertenencia de las proteínas a
    subgrupos.
  • Mayor resolución de las que pueden proporcionar
    los métodos basados en homología.
  • Los vínculos funcionales en las proteínas en
    eucariotas son deducidos principalmente basándose
    en las homologías de las proteínas en bacterias.
Write a Comment
User Comments (0)
About PowerShow.com