MATRICES PAM Y BLOSUM - PowerPoint PPT Presentation

1 / 32
About This Presentation
Title:

MATRICES PAM Y BLOSUM

Description:

Matrices de sustituci n de amino cidos Las sustituciones de aa m s comunes se dan entre aquellos de estructura qu micamente parecidos. Sabiendo los tipos de ... – PowerPoint PPT presentation

Number of Views:410
Avg rating:3.0/5.0
Slides: 33
Provided by: MONI2228
Category:

less

Transcript and Presenter's Notes

Title: MATRICES PAM Y BLOSUM


1
MATRICES PAM Y BLOSUM
UNIVERSIDAD PERUANA CAYETANO HEREDIA Escuela de
Post-Grado Programa de Bioquímica y Biologia
Mólecular
  • El Supergrupo
  • Calla Choque, Jaeson.
  • Evangelista Falcón, W.
  • Olivera Cagna, Giovanna.
  • Quispealaya Poclin, Ronald.

2
Alineamiento de Secuencias
  • Es el proceso de comparar dos secuencias o más
    para buscar series individuales o patrones que
    esten en el mismo orden.
  • Se puede alinear de dos maneras las secuencias
  • Global, se alinea la secuencia entera usando la
    mayor cantidad de caracteres como sea posible.
  • Local, secuencias cercanas con gran cantidad de
    matches, son sub-alineamientos de un alineamiento
    de secuencias.

3
PUNTOS CLAVES PARA ALINEAR
  • Decidir si se realiza alineamiento global o
    local.
  • Con qué programa se realizará el alineamiento.
  • La regla para establecer el score.
  • Los valores para las penalidades de gap.
  • Una matriz de score representa una teoría de
    evolución en particular.

4
Matrices de sustitución de aminoácidos
  • Las sustituciones de aa más comunes se dan entre
    aquellos de estructura químicamente parecidos.
  • Sabiendo los tipos de cambios más y menos comunes
    en un número largo de proteínas se puede predecir
    alineamientos para cualquier secuencia de aa.
  • En 1978 Margaret Dayhoff analizó los cambios de
    pares de aminoácidos más probables que ocurren en
    las proteínas.

5
  • 183944 Trans MVHLTPVEKSAVTALWGKVNVDEVGGEALGRLLVVY
    PWTQRFFESFGDLSTPDAVMGNPK

  • 29436 Transl MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVY
    PWTQRFFESFGDLSTPDAVMGNPK
  • 10 20 30
    40 50 60
  • 70 80 90
    100 110 120
  • 183944 Trans VKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDK
    LHVDPENFRLLGNVLVCVLAHHFG

  • 29436 Transl VKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDK
    LHVDPENFRLLGNVLVCVLAHHFG
  • 70 80 90
    100 110 120
  • 130 140
  • 183944 Trans KEFTPPVQAAYQKVVAGVANALAHKYH
  • 29436 Transl KEFTPPVQAAYQKVVAGVANALAHKYH
  • 130 140

6
MATRIZ DE SUSTITUCION POR BLOQUES DE
AMINOACIDOSBLOSUM
7
BLOSUM
  • Henikoff Henikoff, 1992.
  • Los valores de la matriz están basados en la
    observación de sustituciones de aa en un set de
    2000 patrones de aa conservados llamados bloques.
    Estos bloques representan más o menos 500
    familias de proteínas relacionadas.
  • Tiene mucho más datos que PAM

8
BLOSUM
  • Las familias de proteínas estaban identificadas
    por Bairoch, consideradas en la mismas familias
    por la función que cumplen.En 1991 Henikoff
    Henikoff examinaron cada familia para la
    presencia de patrones de aa ungapped que están
    presentes en cada familia y se podrían usaron
    para identificar a los miembros de estas
    familias.

9
BLOSUM
  • Los bloques que caracterizan cada familia tienen
    muchas secuencias alineadas, donde los cambios de
    aa observados pueden ser contados en cada
    columna. Entonces los tipos de sustituciones
    tienen un score para todos los alineamientos la
    matriz BLOSUM indica la frecuencia de cada tipo
    de sustitución.

10
SET DE UN BLOQUE DE DATOS
B A B A A A A C A A C C A A B A A A C C A A B C
Existen 24 aminoácidos observados de los cuales
14 son A, 4 son B y 6 son C, se observan
en la siguiente proporción.
Aminoácidos Proporción de aa observados
A 14/24
B 4/24
C 6/24
11
Existen 60 de pares alineados en total de
aminoácidos.
Pares alineados Proporción observada
A con A 26/60
A con B 8/60
A con C 10/60
B con B 3/60
B con C 6/60
C con C 7/60
12
Par Alineado Prop. Obs. Prop. Esp. 2log²(obs/esp)
A con A 26/60 196/576 0.70
A con B 8/60 112/576 -1.09
A con C 10/60 168/576 -1.61
B con B 3/60 16/576 1.70
B con C 6/60 48/576 0.53
C con C 7/60 36/576 1.80
A B C A 1 -1 -2 B -1 2 1 C -2 1 2
13
SET DE DOS BLOQUES DE DATOS
En ambos bloques se trabajan juntas porque son
muy similares
B A B A B A B C A A C C
Aminoácidos Proporción de observados
A 13/34
B 5/17
C 11/34
C B B C B B A B C A A C
14
Pares Alineados Proporción de observados
A con A 2/13
A con B 3/13
A con C 5/26
B con B 1/13
B con C 3/13
C con C 3/26
15
El score de la probabilidad (Exy) que exista x
e y donde x e y son aminoácidos. Nxy es
el número de veces que se observa en la misma
columna del bloque alineado. Pxy
Nxy ? u?v Nuv
2 PxPy
Pxy si x ? y
Exy
PxPy
Pxy si x y
16
Entonces de acuerdo a la formula anterior
obtenemos
Par Alineado Prop. Obs. Prop. Esp. 2log2(obs/esp)
A con A 2/13 34/145 1.21
A con B 3/13 35/145 0.12
A con C 5/26 27/145 -0.09
B con B 1/13 41/145 3.75
B con C 3/13 32/145 -0.12
C con C 3/26 25/145 1.15
17
BLOSUM
  • Los patrones que tienen un 60 de similitud son
    agrupados en una matriz de sustitución denominada
    Blosum 60.
  • Los patrones que tienen un 85 de similitud son
    agrupados en una matriz de sustitución denominada
    Blosum 85.

18
BLOSUM62
19
MATRIZ DE SUSTITUCIÓN DE AMINOACIDOS DAYHOFF
  • PORCENTAJE DE MUTACIONES ACEPTADAS
  • PAM

20
PAM
  • Matriz que determina la probabilidad de cambio de
    un aminoácido a otro en secuencias de proteínas
    homólogas durante la evolución.
  • Las matrices dan los cambios esperados para un
    periodo de tiempo evolutivo, la similaridad de la
    secuencia decrece como los genes que codifican la
    misma proteína divergen con el incremento del
    tiempo evolutivo.

21
PAM
  • Para construir la matriz de Dayhoff (PAM) se
    sustituyo los aa de grupos de proteínas se
    estimaron 1572 cambios para 71 grupos de
    secuencias proteicas, logrando un 85 de
    similitud.
  • Existen mutaciones aceptables, donde los
    cambios son aceptados por selección natural,es
    decir no alteran la función proteica.

22
Assumptions en las matrices PAM
  • La probabilidad de que un aa X cambie hacia otro
    aa Y es la misma que Y cambie hacia X.
  • Los reemplazos dependen solo del aa en esa
    posicion y no de la vecindad.
  • En promedio todas las secuencias tienen la misma
    composición.

23
MUTACION RELATIVA
  • mj es la probabilidad que un aminoácido j cambie
    en un intervalo de tiempo dado. Los valores
    absolutos de mj dependen de en que similaridad la
    secuencias usada sea Aij, pero no los valores
    relativos.

Los valores de Ala (mAla) tiene una arbitrariedad
de 100 y los valores de todos los otros
aminoácidos dados de acuerdo a la escala (Atlas
de secuencia y estructura de proteínas )
24
PAM 1
  • ? Es una escala constante que toma el número
    total de mutaciones en 1.
  • Pj es la probabilidad en un rango de que ocurra
    el aminoácido j.

Mij probabilidad de que un aminoácido j no
cambie en PAM - 1
Mij (i1) Probabilidad de que el aminoácido j
cambie a i en un periodo evolutivo
25
Matriz de Score de la PAM-K
26
PAM Phylogenetic Tree
27
PAM-250
28
Errores en las matrices PAM
  • Muchas secuencias se desvian de la composición
    promedio.
  • Se encontraron reemplazos muy poco frecuentes que
    no se podian explicar por las probabilidades
    encontradas.
  • Cualquier error en la PAM1 es super-magnificado
    en la PAM250
  • Los procesos de Markov son una explicacion de la
    evolución que no obedece a la realidad. La
    probabilidad X ?Y es distinta a la probabilidad
    Y?X.

29
PAM vs BLOSUM
30
PAM / BLOSUM
  • PAM esta basado en modelo mutacional de
    evolución, asume que los cambios de aa ocurren
    como un proceso de Markov, cada cambio de aa en
    un sitio llega a ser independiente a los cambios
    previos de ese sitio. La matriz esté basada en la
    predicción del primer cambio que ocurre en la
    proteína del ancestro común durante la evolución
    de la familia de proteínas.
  • BLOSUM, consideran todos los cambios observados
    de los aa en un alineamiento local para la
    familia de proteínas. Estas proteínas muestran
    relaciones bioquímicas, y muestran un ancestro
    común.

31
PAM / BLOSUM
  • Las matrices PAM están basadas en scores de todas
    las posiciones de aa en secuencias relacionadas.
  • Esta diseñado para determinar el origen evolutivo
    de las proteínas.
  • Las matrices BLOSUM están basadas en
    sustituciones y posiciones conservadas en
    bloques, las que representan las regiones comunes
    semejantes en las secuencias relacionadas.
  • Está designado para encontrar los dominios
    conservados de las proteínas.

32
CONCLUSIONES
Write a Comment
User Comments (0)
About PowerShow.com