Title: An
1Análisis de la Varianza
2Descripción breve del tema
- Introducción al diseño de experimentos
- El modelo
- Estimación de los parámetros
- Propiedades de los estimadores
- Descomposición de la variabilidad
- Estimación de la diferencia de medias
- Método de Fisher o LSD, contrastes múltiples
- Diagnosis
3Objetivos
- Reconocer la importancia del diseño y análisis
estadístico de experimentos - Presentar un procedimiento para comparar el
efecto de los distintos niveles de un factor - Construir y estimar un modelo para contrastar las
hipótesis de interés - Cuantificar el efecto de un factor en un
experimento
4Descripción breve del tema
- Introducción al diseño de experimentos
- El modelo
- Estimación de los parámetros
- Propiedades de los estimadores
- Descomposición de la variabilidad
- Estimación de la diferencia de medias
- Método de Fisher o LSD, contrastes múltiples
- Diagnosis
5Introducción al diseño de experimentos
- Un analista debe ser capaz de resolver problemas
reales aplicando el método científico. - Para la resolución de muchos de estos problemas
no existe una teoría sólida, para otros queremos
contrastarla - efecto de las técnicas venta en distintos
establecimientos - duración de materiales de construcción en
distintos ambientes - Notas de los estudiantes en distintas asignaturas
6Introducción al diseño de experimentos
- Un experimento es una prueba o serie de pruebas
en las que se modifican deliberadamente las
condiciones de un proceso o sistema con el
objetivo de observar el efecto de esas
modificaciones en el resultado. - En un experimento intervienen varios factores, el
objetivo es determinar la influencia de estos
factores en el resultado final de un proceso,
para explicar la relación causa-efecto.
7Introducción al diseño de experimentos
- Hay factores
- controlados su valor lo especifica el
investigador - no controlados debidos al entorno y al azar
- Debemos minimizar el efecto de los factores no
controlados.
8Introducción al diseño de experimentos
- Ejemplo Un analista está interesado en
determinar qué factores influyen en el número de
unidades vendidas de un cierto producto según el
tipo de establecimiento - controlados establecimiento, marca, posición
- no controlados clima, huelgas, eficacia
- Objetivo Determinar qué factores afectan las
ventas y en qué dirección - Consecuencias Determinar qué establecimientos
pueden generar mayores ventas
9Introducción al diseño de experimentosEjemplo
manufactura papel
- Un fabricante de bolsas de papel quiere mejorar
la resistencia a la tensión de las bolsas. - El analista de producción piensa que hay una
relación causa-efecto entre la cantidad de
celulosa utilizada en la fabricación del papel y
la resistencia. - Experimento en el que se fabrica papel con
distintos de celulosa y se mide la resistencia.
10Introducción al diseño de experimentosEjemplo
manufactura papel
Concentración de celulosa Observaciones Observaciones Observaciones Observaciones Observaciones Observaciones
Concentración de celulosa 1 2 3 4 5 6
5 7 8 15 11 9 10
10 12 17 13 18 19 15
15 14 18 19 17 16 18
20 19 25 22 23 18 20
11Introducción al diseño de experimentosEjemplo
manufactura papel
12Descripción breve del tema
- Introducción al diseño de experimentos
- El modelo
- Estimación de los parámetros
- Propiedades de los estimadores
- Descomposición de la variabilidad
- Estimación de la diferencia de medias
- Método de Fisher o LSD, contrastes múltiples
- Diagnosis
13El modelo (ANOVA)
- Tenemos n elementos que se diferencian en un
factor. - En cada elemento observamos una característica
que varía aleatoriamente de un elemento a otro. - Se desea establecer si hay o no relación entre el
valor medio de la característica estudiada y el
factor.
14El modelo (ANOVA)
- Tenemos
- una variable de interés y (resistencia de las
bolsas) - un factor que influye en los valores de y que
llamamos F ( de celulosa) - cierto número de niveles del factor F, que
denotamos por I (4 porcentajes distintos) - un número de observaciones para cada nivel del
factor, ni (6 observaciones para cada nivel) - El número total de observaciones es nn1n2nI
15El modelo (ANOVA)
- Si para i1,,I y j1,,ni
- yij es la j-ésima observación del i-ésimo grupo
- mi es la media del i-ésimo grupo
- uij es la perturbación que mide la variabilidad
debida al error experimental
16El modelo (ANOVA)
- La perturbación uij mide la desviación en la
observación j - del grupo i respecto de la media del grupo. Se
debe a - causas no asignables (factores no controlados).
Es una - variable aleatoria.
- El promedio de las perturbaciones es cero,
Euij0 - Misma variabilidad en todos los grupos,
Varuijs2 - Distribución perturbaciones es normal, uijN(0,
s2) - Perturbaciones independientes.
17El modelo (ANOVA)
- Alternativamente, podemos reformular el modelo
- y escribirlo como
- para i1,,I y j1,,ni . Donde
- m es la media de todas las observaciones
- ai es el efecto diferencial del i-ésimo grupo
- (ai m i-m)
18Descripción breve del tema
- Introducción al diseño de experimentos
- El modelo
- Estimación de los parámetros
- Propiedades de los estimadores
- Descomposición de la variabilidad
- Estimación de la diferencia de medias
- Método de Fisher o LSD, contrastes múltiples
- Diagnosis
19Estimación de los parámetros
- En el modelo
- Para i1,,I y j1,,ni con yijN(0, s2)
- Los parámetros desconocidos son
- El verdadero valor de la media de cada grupo
- m1, m2,, mI
- La varianza de la perturbación s2.
20Estimación de los parámetros
- Media de las
- observaciones en el
- i-ésimo grupo
21Estimación de los parámetros
- Como de costumbre, las perturbaciones las
- estimamos mediante los residuos (miden la
- variabilidad no explicada).
22Estimación de los parámetros
23Estimación de los parámetros
- La varianza muestral de los residuos es un
estimador de s2 - Desgraciadamente se trata de un estimador sesgado.
24Estimación de los parámetros
- Utilizamos la varianza residual como estimador de
s2 - El término que aparece en el cociente son los
grados de libertad. - Tenemos
25Descripción breve del tema
- Introducción al diseño de experimentos
- El modelo
- Estimación de los parámetros
- Propiedades de los estimadores
- Descomposición de la variabilidad
- Estimación de la diferencia de medias
- Método de Fisher o LSD, contrastes múltiples
- Diagnosis
26Props. de los estimadores (medias)
- Esperanza
- (centrado o insesgado)
- Varianza
27Props. de los estimadores (medias)
- Además, como es combinación lineal de
variables independientes y normales, sigue
distribución normal. - Como s es desconocido, tenemos el intervalo de
confianza
28Son todas las medias iguales?
29Descripción breve del tema
- Introducción al diseño de experimentos
- El modelo
- Estimación de los parámetros
- Propiedades de los estimadores
- Descomposición de la variabilidad
- Estimación de la diferencia de medias
- Método de Fisher o LSD, contrastes múltiples
- Diagnosis
30Descomposición de la variabilidad
- El Análisis de la Varianza compara la
variabilidad entre las medias de los grupos de
los distintos niveles del factor con la
variabilidad experimental. - A mayor diferencia entre las medias de los grupos
mayor variabilidad entre ellos
31Descomposición de la variabilidad
- Si las medias son muy diferentes, la variabilidad
entre las medias será mayor que la variabilidad
dentro de los grupos
32Descomposición de la variabilidad
33Descomposición de la variabilidad
- La Variabilidad Explicada (VE) mide la
variabilidad entre los distintos grupos. Si es
pequeña, es porque las medias son similares. - La Variabilidad No Explicada (VNE) o residual,
mide la variabilidad dentro de los grupos y es
debida al error experimental.
34Descomposición de la variabilidad
- En general
- Además, si m1mI
- En consecuencia, bajo H0
35Desc. variabilidad. Tabla ANOVA
Fuentes de variación Suma de cuadrados Grados de libertad Varianza Test F
Entre grupos VE I-1
Residual VNE n-I
Total n-1
36Descomposición de la variabilidad
- Contraste de la F
- Si H0 no es cierta, la varianza entre grupos será
mayor que la residual
Rechazo
Aceptación
Aceptación
37Descomposición de la variabilidadEjemplo
manufactura de papel
38Descomposición de la variabilidadEjemplo
manufactura de papel
Región de rechazo
39Descripción breve del tema
- Introducción al diseño de experimentos
- El modelo
- Estimación de los parámetros
- Propiedades de los estimadores
- Descomposición de la variabilidad
- Estimación de la diferencia de medias
- Método de Fisher o LSD, contrastes múltiples
- Diagnosis
40Estimación de la diferencia de medias
- Si llegamos a la conclusión de que, al menos, un
par de medias son distintas. Deseamos saber
cuáles son distintas y cuáles iguales. - Solución Comparar las medias 2 a 2
41Contrastes particulares
- Contraste para la igualdad de medias de dos
poblaciones normales con varianzas desconocidas
pero iguales - Hipótesis nula. H0 m1 m2
- Hipótesis alternativa. H1 m1 ¹ m2
- Rechazo H0 cuando
- Hipótesis alternativa. H1 m1 lt m2
- Rechazo H0 cuando
- Hipótesis alternativa. H1 m1 gt m2
- Rechazo H0 cuando
42Intervalos de Confianza particulares
- Intervalo de Confianza para la diferencia de
medias de dos poblaciones normales con varianzas
desconocidas pero iguales. - con un nivel de confianza 1-a ,
- donde P(X gt tn,a) a si Xtn
43Estimación de la diferencia de medias
- H0 m1 m2
- H1 m1 ¹ m2
- Si
- rechazamos H0.
- En la gráfica c tn1n2-2,a/2
densidad de una tn1n2-2
Acepto
44Diferencia de mediasEjemplo manufactura de papel
2.228
45Diferencia de mediasEjemplo manufactura de papel
46Estimación de la diferencia de mediasMétodo
Fisher o LSD
- Deseamos hacer varios contrastes del tipo
- y, según las hipótesis del modelo, la varianza es
la - misma en todos los niveles del factor.
Utilizamos, así, - todos los datos para estimarla
47Estimación de la diferencia de mediasMétodo
Fisher o LSD
- La distribución del estadístico es ahora
- Si hay muchos grupos (niveles del factor), el
nivel crítico cambia (porque n-I mucho mayor que
n1n2-2). Con el método de Fisher detectamos
diferencias más pequeñas. - Explicación varianza de una t.
48Diferencia de mediasEjemplo manufactura de papel
t(0.025,20) 2.086
49Diferencia de mediasEjemplo manufactura de papel
50Estimación de la diferencia de mediasContrastes
múltiples
- En un contraste de hipótesis, estamos siempre
inclinados a aceptar la hipótesis nula. La
rechazamos sólo si hay una evidencia muy fuerte
en su contra. - Pr(Rechazar H0H0 cierta) a
- Si utilizamos el método de Fisher para comparar
cada pareja de medias, realizamos I(I-1)/2
contrastes.
51Estimación de la diferencia de mediasContrastes
múltiples
- Al realizar m contrastes independientes cada uno
con nivel de significación a 0.05, la
probabilidad de rechazar alguna hipótesis nula
cierta es - Pr(Rechazar algún H0H0) 1- Pr(Aceptar todos
H0H0) 1- (1- 0.05)m 1-0.95m gt 0.05
52Estimación de la diferencia de mediasContrastes
múltiples. Método de Bonferroni
- Pr(Rechazar algún H0H0)SPr(Rechazar un
H0H0)ma - Fijado un nivel de significación global aT ,
garantizamos - dicho nivel de significación global si realizamos
cada - contraste con un nivel de significación aaT/m
- Los intervalos de confianza serán ahora más
anchos y se - solaparán con mayor facilidad.
53Contrastes múltiples. Método de
BonferroniEjemplo manufactura de papel
t(0.025,20) 2.086
t(0.00416, 20) 2.927
No hay diferencia en la Resistencia al utilizar
el 10 ó 15 de celulosa. Tampoco hay diferencia
al utilizar el 15 ó 20 de celulosa.
54Descripción breve del tema
- Introducción al diseño de experimentos
- El modelo
- Estimación de los parámetros
- Propiedades de los estimadores
- Descomposición de la variabilidad
- Estimación de la diferencia de medias
- Método de Fisher o LSD, contrastes múltiples
- Diagnosis
55Diagnosis
- Para comprobar las hipótesis del modelo,
calculamos los residuos (estimaciones de la
perturbación)
56Diagnosis
- Comprobar hipótesis de normalidad
- Gráficamente
- Histograma de residuos
- Gráfico probabilístico normal
- Métodos inferenciales
- Contraste de normalidad
57Diagnosis
- Comprobar hipótesis de varianza constante
- Gráficamente
- Gráfico de residuos frente a niveles del factor
- Gráfico de residuos frente a valores ajustados
- Métodos inferenciales
- Contraste de igualdad de varianzas (sensibles a
la normalidad)
58Diagnosis
- Comprobar hipótesis de independencia
- Gráficos de residuos frente a tiempo.
- Si los datos son independientes, en el gráfico no
- aparecerá ninguna tendencia.
- Si hay tendencias, es posible que el experimento
no haya - sido aleatorizado y las diferencias entre los
niveles sean - debidas al efecto del tiempo.
59DiagnosisEjemplo manufactura de papel
Niveles del factor