PPT – An PowerPoint presentation | free to download

About This Presentation

Title:

An

Description:

Title: Estad stica en la Ingenier a Author: Ignacio Cascos Last modified by: kaiser Created Date: 2/16/2006 6:07:35 PM Document presentation format – PowerPoint PPT presentation

Number of Views:41

Avg rating:3.0/5.0

Slides: 60

Provided by: Ignac48

Category:

more less

Transcript and Presenter's Notes

Title: An

1
Análisis de la Varianza

Tema 1

2
Descripción breve del tema

Introducción al diseño de experimentos
El modelo
Estimación de los parámetros
Propiedades de los estimadores
Descomposición de la variabilidad
Estimación de la diferencia de medias
Método de Fisher o LSD, contrastes múltiples
Diagnosis

3
Objetivos

Reconocer la importancia del diseño y análisis
estadístico de experimentos
Presentar un procedimiento para comparar el
efecto de los distintos niveles de un factor
Construir y estimar un modelo para contrastar las
hipótesis de interés
Cuantificar el efecto de un factor en un
experimento

4
Descripción breve del tema

Introducción al diseño de experimentos
El modelo
Estimación de los parámetros
Propiedades de los estimadores
Descomposición de la variabilidad
Estimación de la diferencia de medias
Método de Fisher o LSD, contrastes múltiples
Diagnosis

5
Introducción al diseño de experimentos

Un analista debe ser capaz de resolver problemas
reales aplicando el método científico.
Para la resolución de muchos de estos problemas
no existe una teoría sólida, para otros queremos
contrastarla
efecto de las técnicas venta en distintos
establecimientos
duración de materiales de construcción en
distintos ambientes
Notas de los estudiantes en distintas asignaturas

6
Introducción al diseño de experimentos

Un experimento es una prueba o serie de pruebas
en las que se modifican deliberadamente las
condiciones de un proceso o sistema con el
objetivo de observar el efecto de esas
modificaciones en el resultado.
En un experimento intervienen varios factores, el
objetivo es determinar la influencia de estos
factores en el resultado final de un proceso,
para explicar la relación causa-efecto.

7
Introducción al diseño de experimentos

Hay factores
controlados su valor lo especifica el
investigador
no controlados debidos al entorno y al azar
Debemos minimizar el efecto de los factores no
controlados.

8
Introducción al diseño de experimentos

Ejemplo Un analista está interesado en
determinar qué factores influyen en el número de
unidades vendidas de un cierto producto según el
tipo de establecimiento
controlados establecimiento, marca, posición
no controlados clima, huelgas, eficacia
Objetivo Determinar qué factores afectan las
ventas y en qué dirección
Consecuencias Determinar qué establecimientos
pueden generar mayores ventas

9
Introducción al diseño de experimentosEjemplo
manufactura papel

Un fabricante de bolsas de papel quiere mejorar
la resistencia a la tensión de las bolsas.
El analista de producción piensa que hay una
relación causa-efecto entre la cantidad de
celulosa utilizada en la fabricación del papel y
la resistencia.
Experimento en el que se fabrica papel con
distintos de celulosa y se mide la resistencia.

10
Introducción al diseño de experimentosEjemplo
manufactura papel
Concentración de celulosa Observaciones Observaciones Observaciones Observaciones Observaciones Observaciones
Concentración de celulosa 1 2 3 4 5 6
5 7 8 15 11 9 10
10 12 17 13 18 19 15
15 14 18 19 17 16 18
20 19 25 22 23 18 20
11
Introducción al diseño de experimentosEjemplo
manufactura papel
12
Descripción breve del tema

Introducción al diseño de experimentos
El modelo
Estimación de los parámetros
Propiedades de los estimadores
Descomposición de la variabilidad
Estimación de la diferencia de medias
Método de Fisher o LSD, contrastes múltiples
Diagnosis

13
El modelo (ANOVA)

Tenemos n elementos que se diferencian en un
factor.
En cada elemento observamos una característica
que varía aleatoriamente de un elemento a otro.
Se desea establecer si hay o no relación entre el
valor medio de la característica estudiada y el
factor.

14
El modelo (ANOVA)

Tenemos
una variable de interés y (resistencia de las
bolsas)
un factor que influye en los valores de y que
llamamos F ( de celulosa)
cierto número de niveles del factor F, que
denotamos por I (4 porcentajes distintos)
un número de observaciones para cada nivel del
factor, ni (6 observaciones para cada nivel)
El número total de observaciones es nn1n2nI

15
El modelo (ANOVA)

Si para i1,,I y j1,,ni
yij es la j-ésima observación del i-ésimo grupo
mi es la media del i-ésimo grupo
uij es la perturbación que mide la variabilidad
debida al error experimental

16
El modelo (ANOVA)

La perturbación uij mide la desviación en la
observación j
del grupo i respecto de la media del grupo. Se
debe a
causas no asignables (factores no controlados).
Es una
variable aleatoria.
El promedio de las perturbaciones es cero,
Euij0
Misma variabilidad en todos los grupos,
Varuijs2
Distribución perturbaciones es normal, uijN(0,
s2)
Perturbaciones independientes.

17
El modelo (ANOVA)

Alternativamente, podemos reformular el modelo
y escribirlo como
para i1,,I y j1,,ni . Donde
m es la media de todas las observaciones
ai es el efecto diferencial del i-ésimo grupo
(ai m i-m)

18
Descripción breve del tema

Introducción al diseño de experimentos
El modelo
Estimación de los parámetros
Propiedades de los estimadores
Descomposición de la variabilidad
Estimación de la diferencia de medias
Método de Fisher o LSD, contrastes múltiples
Diagnosis

19
Estimación de los parámetros

En el modelo
Para i1,,I y j1,,ni con yijN(0, s2)
Los parámetros desconocidos son
El verdadero valor de la media de cada grupo
m1, m2,, mI
La varianza de la perturbación s2.

20
Estimación de los parámetros

Media de las
observaciones en el
i-ésimo grupo

21
Estimación de los parámetros

Como de costumbre, las perturbaciones las
estimamos mediante los residuos (miden la
variabilidad no explicada).

22
Estimación de los parámetros
23
Estimación de los parámetros

La varianza muestral de los residuos es un
estimador de s2
Desgraciadamente se trata de un estimador sesgado.

24
Estimación de los parámetros

Utilizamos la varianza residual como estimador de
s2
El término que aparece en el cociente son los
grados de libertad.
Tenemos

25
Descripción breve del tema

Introducción al diseño de experimentos
El modelo
Estimación de los parámetros
Propiedades de los estimadores
Descomposición de la variabilidad
Estimación de la diferencia de medias
Método de Fisher o LSD, contrastes múltiples
Diagnosis

26
Props. de los estimadores (medias)

Esperanza
(centrado o insesgado)
Varianza

27
Props. de los estimadores (medias)

Además, como es combinación lineal de
variables independientes y normales, sigue
distribución normal.
Como s es desconocido, tenemos el intervalo de
confianza

28
Son todas las medias iguales?
29
Descripción breve del tema

Introducción al diseño de experimentos
El modelo
Estimación de los parámetros
Propiedades de los estimadores
Descomposición de la variabilidad
Estimación de la diferencia de medias
Método de Fisher o LSD, contrastes múltiples
Diagnosis

30
Descomposición de la variabilidad

El Análisis de la Varianza compara la
variabilidad entre las medias de los grupos de
los distintos niveles del factor con la
variabilidad experimental.
A mayor diferencia entre las medias de los grupos
mayor variabilidad entre ellos

31
Descomposición de la variabilidad

Si las medias son muy diferentes, la variabilidad
entre las medias será mayor que la variabilidad
dentro de los grupos

32
Descomposición de la variabilidad
33
Descomposición de la variabilidad

La Variabilidad Explicada (VE) mide la
variabilidad entre los distintos grupos. Si es
pequeña, es porque las medias son similares.
La Variabilidad No Explicada (VNE) o residual,
mide la variabilidad dentro de los grupos y es
debida al error experimental.

34
Descomposición de la variabilidad

En general
Además, si m1mI
En consecuencia, bajo H0

35
Desc. variabilidad. Tabla ANOVA

Fuentes de variación Suma de cuadrados Grados de libertad Varianza Test F
Entre grupos VE I-1
Residual VNE n-I
Total n-1
36
Descomposición de la variabilidad

Contraste de la F
Si H0 no es cierta, la varianza entre grupos será
mayor que la residual

Rechazo
Aceptación
Aceptación
37
Descomposición de la variabilidadEjemplo
manufactura de papel
38
Descomposición de la variabilidadEjemplo
manufactura de papel
Región de rechazo
39
Descripción breve del tema

Introducción al diseño de experimentos
El modelo
Estimación de los parámetros
Propiedades de los estimadores
Descomposición de la variabilidad
Estimación de la diferencia de medias
Método de Fisher o LSD, contrastes múltiples
Diagnosis

40
Estimación de la diferencia de medias

Si llegamos a la conclusión de que, al menos, un
par de medias son distintas. Deseamos saber
cuáles son distintas y cuáles iguales.
Solución Comparar las medias 2 a 2

41
Contrastes particulares

Contraste para la igualdad de medias de dos
poblaciones normales con varianzas desconocidas
pero iguales
Hipótesis nula. H0 m1 m2
Hipótesis alternativa. H1 m1 ¹ m2
Rechazo H0 cuando
Hipótesis alternativa. H1 m1 lt m2
Rechazo H0 cuando
Hipótesis alternativa. H1 m1 gt m2
Rechazo H0 cuando

42
Intervalos de Confianza particulares

Intervalo de Confianza para la diferencia de
medias de dos poblaciones normales con varianzas
desconocidas pero iguales.
con un nivel de confianza 1-a ,
donde P(X gt tn,a) a si Xtn

43
Estimación de la diferencia de medias

H0 m1 m2
H1 m1 ¹ m2
Si
rechazamos H0.
En la gráfica c tn1n2-2,a/2

densidad de una tn1n2-2
Acepto
44
Diferencia de mediasEjemplo manufactura de papel
2.228
45
Diferencia de mediasEjemplo manufactura de papel
46
Estimación de la diferencia de mediasMétodo
Fisher o LSD

Deseamos hacer varios contrastes del tipo
y, según las hipótesis del modelo, la varianza es
la
misma en todos los niveles del factor.
Utilizamos, así,
todos los datos para estimarla

47
Estimación de la diferencia de mediasMétodo
Fisher o LSD

La distribución del estadístico es ahora
Si hay muchos grupos (niveles del factor), el
nivel crítico cambia (porque n-I mucho mayor que
n1n2-2). Con el método de Fisher detectamos
diferencias más pequeñas.
Explicación varianza de una t.

48
Diferencia de mediasEjemplo manufactura de papel
t(0.025,20) 2.086
49
Diferencia de mediasEjemplo manufactura de papel
50
Estimación de la diferencia de mediasContrastes
múltiples

En un contraste de hipótesis, estamos siempre
inclinados a aceptar la hipótesis nula. La
rechazamos sólo si hay una evidencia muy fuerte
en su contra.
Pr(Rechazar H0H0 cierta) a
Si utilizamos el método de Fisher para comparar
cada pareja de medias, realizamos I(I-1)/2
contrastes.

51
Estimación de la diferencia de mediasContrastes
múltiples

Al realizar m contrastes independientes cada uno
con nivel de significación a 0.05, la
probabilidad de rechazar alguna hipótesis nula
cierta es
Pr(Rechazar algún H0H0) 1- Pr(Aceptar todos
H0H0) 1- (1- 0.05)m 1-0.95m gt 0.05

52
Estimación de la diferencia de mediasContrastes
múltiples. Método de Bonferroni

Pr(Rechazar algún H0H0)SPr(Rechazar un
H0H0)ma
Fijado un nivel de significación global aT ,
garantizamos
dicho nivel de significación global si realizamos
cada
contraste con un nivel de significación aaT/m
Los intervalos de confianza serán ahora más
anchos y se
solaparán con mayor facilidad.

53
Contrastes múltiples. Método de
BonferroniEjemplo manufactura de papel
t(0.025,20) 2.086
t(0.00416, 20) 2.927
No hay diferencia en la Resistencia al utilizar
el 10 ó 15 de celulosa. Tampoco hay diferencia
al utilizar el 15 ó 20 de celulosa.
54
Descripción breve del tema