Title: Pruebas de significancia para datos cualitativos
1Pruebas de significancia para datos cualitativos
2- z, t y r son todos calculados de datos
cualitativos o cuantitativos? - Cuantitativos.
- ? es la letra griega chi que se usa para
representar las puebas de chi cuadrado que se
simboliza por ?2. - Estas pruebas dependen de f al igual que en las
pruebas de t. - Donde recordemos que f representa el número de
grados de libertad.
3Los datos cualitativos son usualmente contados en
grupos o categorías
- Un ejemplo son los grupos sanguíneos.
- La hipótesis de nulidad dice que cualquier
variación entre el número observado en el grupo
y lo que usted espera encontrar se debe a________ - La casualidad
4Si hay una diferencia significativa la variación
es más de lo esperado por casualidad y esto
sugiere que hay algún otro factor envuelto.
5- Al igual que con z y t si el valor calculado de
?2 es mayor que el valor significativo usted
acepta/rechaza la hipótesis de nulidad. - Si ?2 es mayor, p es menor la hipótesis de
nulidad es rechazada.
6Al igual que con z y t las tablas de X2 son
usadas directamente en las pruebas de 2 colas
7revisemos las tablas de chi cuadrado
8(No Transcript)
9- qué significan las columnas?
- Qué significan las filas?
- cuál es la diferencia con las tablas de t?
- qué significan los niveles 0.99 y 0.95?
10Criterios para aplicar X2
- Las muestras son tomadas al azar.
- Los datos son cualitativos
- Idealmente la frecuencia esperada más baja en
cualquier grupo no es menor de 5.
11Un genetista estaba interesado por saber si dos
plantas tenían el genotipo Aa. El las cruzó para
ver qué tan cerca de la razón teórica se
encontraban las progenies. Las razones teóricas
son ½ Aa ¼ AA ¼ aa Hubo 100 progenies y
estos fueron los resultados (muestra al azar)
genotipo Número observado (O) Número esperado (E) por la teoría
Aa AA aa 53 23 24 50 25 25
total 100 100
12- se aplican todos los criterios para usar X2?
- Establezca la hipótesis de nulidad y su
alternativa.
13 (número observado número
esperado)2 X2 S
número esperado
Lo vamos a representar de ahora en adelante por
( O E )2 S E
14resuelva
15- Substituyendo los números según el cuadro tenemos
que - X2 0.38
- Debemos buscar ahora f
16Uso de X2 para probar si lo observado se ajusta
a una teoría
- En este caso X2 se usa para ver si los resultados
obtenidos se ajustan a esta teoría genética en
particular. - En estos casos fk-1, donde k número de clases.
- Las clases en este caso son los genotipos, o sea,
3. - Por consiguiente f 2
17Los investigadores que usan X2 casi siempre están
interesados en dos colas. Es decir, están
interesados en las diferencias entre lo observado
y lo esperado, en cualquier dirección
- es éste o no el caso en nuestro problema?
- Si
- Recuerde que las tablas de X2 tal cual están,
registran ambas colas. - Entonces el X2 significativo con f2 es
- X2 5.991 al nivel 0.05 y 9.210 al nivel 0.01
18X2 calculado es 0.38 y es menor que el valor
significativo de X2. cuál es su conclusión?
Ud. Acepta la hipótesis de nulidad. La conclusión
es que la variación es insuficiente para
sospechar que hay otro factor envuelto y ésta es
debida solamente a la casualidad. Es decir, los
resultados se ajustan a la teoría genética
19En pruebas ordinarias de t donde µ no es
conocida, f N-1. en X2 cuando probamos si algo
se ajusta a la teoría, f k-1. N en las pruebas
de t es el número de resultados, mientras que en
X2 k representa el número de clases
20En las pruebas pareadas de t, también f N-1.
aquí, N es el número de diferencias
21veamos otro experimento
22El mismo genetista decide hacer otro experimento
para comprobar si la combinación de dos factores
de segregación genética se ajustan a la teoría
genética que establece que estos se combinan de
acuerdo a la razón 9 AB 3Ab 3aB 1ab
Sus resultados fueron los siguientes
cuáles son los números esperados?
fenotipo Número observado(O)
AB Ab aB ab 245 80 70 5
total 400
Número esperado(E)
225 75 75 25
400
podemos aplicar X2? por qué?
X2
cuál es X2 significativo?
f
una o dos colas?
conclusión?
23Uso de X2 para probar asociación en vez de
ajuste a una teoría
- Se afecta f (lo veremos más adelante)
- Los datos para probar asociación se arreglan en
una tabla de contingencia
24ejemplo
25En un estudio, para ayudar a decidir si una
inoculación en particular tiene alguna propiedad
protectiva, se obtuvieron los siguientes
resultados durante una epidemia
Establezca la hipótesis de nulidad y su
alternativa
Inoculados No inoculados Total de fila
Afectados No afectados 5 95 55 145 60 240
Total de columna 100 200 300
Asumimos la hipótesis de nulidad como cierta y
calculamos los resultados esperados usando los
totales de las filas y las columnas.
es esta una tabla de observados o esperados
26Podemos observar, usando los totales de columnas
que 100 de un total de 300, o sea 1/3 fueron
inoculados. Como hemos asumido como cierta la
hipótesis de nulidad, entonces se deriva que la
inoculación no está asociada con la incidencia de
la enfermedad. Esperamos entonces que 1/3 de
aquellos afectados fueron inoculados.
En el cuadro vemos también que se afectaron 60
personas. Por consiguiente podemos esperar que1/3
de ellos fueron inoculados(pues la vacuna no está
asociada con la incidencia de la enfermedad).
Así, tenemos que 20 fueron inoculados y tuvieron
la enfermedad.
Ya que se asume que la inoculación no tiene
ningún efecto y 1/3 han sido inoculados se puede
esperar también que 1/3 de los 240 no afectados
fueron inoculados. Es decir, 80 personas.
De manera similar, 2/3 del total no fueron
inoculados, de modo que se puede esperar que 2/3
de los 60 afectados, o sea 40, no fueron
inoculados
Finalmente, cuántos no inoculados, no afectados
podría esperar?
2/3 de 240, o sea 160
27Complete entonces su tabla de resultados esperados
28Abajo se observan las tablas de contingencia para
los resultados observados y los esperados
Observados (O)
Observe que el total de filas es igual al total
de columnas en las dos tablas
Inoculados No inoculados Total de fila
Afectados No afectados 5 95 55 145 60 240
Total de columna 100 200 300
Observe también que cada resultado esperado es
igual a Su total de fila x total de columna
gran total
Esperados (E)
Inoculados No inoculados Total de fila
Afectados No afectados 20 80 40 160 60 240
Total de columna 100 200 300
cuál sería el resultado esperado para el grupo
afectado inoculado?
60 x 100 300
20
29- Recuerde que estamos interesados en saber si la
inoculación protege contra la enfermedad. - Si esto es así, esperamos observar menos gente
inoculada afectada que lo esperado. esto es así? - De otra manera debíamos rechazar la teoría
inmediatamente - esta es una prueba de una o dos colas?
- Si
- Se esperaban 20 pero sólo 5 fueron observados en
este grupo. - Prueba de una sóla cola.
- Una vez resuelto todo lo anterior podemos
entonces utilizar la fórmula ya conocida y
calcular X2.
30- Cuando X2 fué usado para probar el ajuste a una
teoría, f k-1 - Ahora que usamos X2 para probar asociación usando
las tablas de contingencia, f (r-1) (c-1),
donde r es el número de filas y c el número de
columnas en el cuerpo de la tabla. - Por consiguiente, en nuestro problema f (2-1)
(2-1) 1 - O sea que hay 1 grado de libertad.
- Esto es porque si 1 resultado esperado es
calculado en una tabla de contingencia de dos
filas y dos columnas, ya que los totales de las
filas y las columnas son fijos, el resto de los
números en la tabla no se pueden escoger
libremente.
31- cuál es el valor de f en una tabla de
contingencia con 3 filas y 8 columnas? - (3-1)(8-1) 14
- En este caso el grado de libertad para escoger
resultados se amplía por haber un número mayor de
filas y de columnas.
32- Con toda la información que tenemos podemos ir a
la tabla y buscar el valor significativo de X2. - Los cuales son 2.706 para 0.05 y 5.412 para 0.01
- cuál es su conclusión?
- La hipótesis de nulidad es rechazada. Podemos ver
que menos gente que está inoculada contrae la
enfermedad. Ahora podemos decir también que el
grado de protección es estadísticamente
significativo (0.01 gt p)
33Para probar el nivel de ajuste a una teoría,
ésta por si misma es usada para calcular los
resultados esperados. Sin embargo, cuando usamos
X2 para probar una asociación, usamos los
resultados observados para calcular los
resultados esperados