An - PowerPoint PPT Presentation

1 / 59
About This Presentation
Title:

An

Description:

Title: Estad stica en la Ingenier a Author: Ignacio Cascos Last modified by: kaiser Created Date: 2/16/2006 6:07:35 PM Document presentation format – PowerPoint PPT presentation

Number of Views:41
Avg rating:3.0/5.0
Slides: 60
Provided by: Ignac48
Category:

less

Transcript and Presenter's Notes

Title: An


1
Análisis de la Varianza
  • Tema 1

2
Descripción breve del tema
  • Introducción al diseño de experimentos
  • El modelo
  • Estimación de los parámetros
  • Propiedades de los estimadores
  • Descomposición de la variabilidad
  • Estimación de la diferencia de medias
  • Método de Fisher o LSD, contrastes múltiples
  • Diagnosis

3
Objetivos
  • Reconocer la importancia del diseño y análisis
    estadístico de experimentos
  • Presentar un procedimiento para comparar el
    efecto de los distintos niveles de un factor
  • Construir y estimar un modelo para contrastar las
    hipótesis de interés
  • Cuantificar el efecto de un factor en un
    experimento

4
Descripción breve del tema
  • Introducción al diseño de experimentos
  • El modelo
  • Estimación de los parámetros
  • Propiedades de los estimadores
  • Descomposición de la variabilidad
  • Estimación de la diferencia de medias
  • Método de Fisher o LSD, contrastes múltiples
  • Diagnosis

5
Introducción al diseño de experimentos
  • Un analista debe ser capaz de resolver problemas
    reales aplicando el método científico.
  • Para la resolución de muchos de estos problemas
    no existe una teoría sólida, para otros queremos
    contrastarla
  • efecto de las técnicas venta en distintos
    establecimientos
  • duración de materiales de construcción en
    distintos ambientes
  • Notas de los estudiantes en distintas asignaturas

6
Introducción al diseño de experimentos
  • Un experimento es una prueba o serie de pruebas
    en las que se modifican deliberadamente las
    condiciones de un proceso o sistema con el
    objetivo de observar el efecto de esas
    modificaciones en el resultado.
  • En un experimento intervienen varios factores, el
    objetivo es determinar la influencia de estos
    factores en el resultado final de un proceso,
    para explicar la relación causa-efecto.

7
Introducción al diseño de experimentos
  • Hay factores
  • controlados su valor lo especifica el
    investigador
  • no controlados debidos al entorno y al azar
  • Debemos minimizar el efecto de los factores no
    controlados.

8
Introducción al diseño de experimentos
  • Ejemplo Un analista está interesado en
    determinar qué factores influyen en el número de
    unidades vendidas de un cierto producto según el
    tipo de establecimiento
  • controlados establecimiento, marca, posición
  • no controlados clima, huelgas, eficacia
  • Objetivo Determinar qué factores afectan las
    ventas y en qué dirección
  • Consecuencias Determinar qué establecimientos
    pueden generar mayores ventas

9
Introducción al diseño de experimentosEjemplo
manufactura papel
  • Un fabricante de bolsas de papel quiere mejorar
    la resistencia a la tensión de las bolsas.
  • El analista de producción piensa que hay una
    relación causa-efecto entre la cantidad de
    celulosa utilizada en la fabricación del papel y
    la resistencia.
  • Experimento en el que se fabrica papel con
    distintos de celulosa y se mide la resistencia.

10
Introducción al diseño de experimentosEjemplo
manufactura papel
Concentración de celulosa Observaciones Observaciones Observaciones Observaciones Observaciones Observaciones
Concentración de celulosa 1 2 3 4 5 6
5 7 8 15 11 9 10
10 12 17 13 18 19 15
15 14 18 19 17 16 18
20 19 25 22 23 18 20
11
Introducción al diseño de experimentosEjemplo
manufactura papel
12
Descripción breve del tema
  • Introducción al diseño de experimentos
  • El modelo
  • Estimación de los parámetros
  • Propiedades de los estimadores
  • Descomposición de la variabilidad
  • Estimación de la diferencia de medias
  • Método de Fisher o LSD, contrastes múltiples
  • Diagnosis

13
El modelo (ANOVA)
  • Tenemos n elementos que se diferencian en un
    factor.
  • En cada elemento observamos una característica
    que varía aleatoriamente de un elemento a otro.
  • Se desea establecer si hay o no relación entre el
    valor medio de la característica estudiada y el
    factor.

14
El modelo (ANOVA)
  • Tenemos
  • una variable de interés y (resistencia de las
    bolsas)
  • un factor que influye en los valores de y que
    llamamos F ( de celulosa)
  • cierto número de niveles del factor F, que
    denotamos por I (4 porcentajes distintos)
  • un número de observaciones para cada nivel del
    factor, ni (6 observaciones para cada nivel)
  • El número total de observaciones es nn1n2nI

15
El modelo (ANOVA)
  • Si para i1,,I y j1,,ni
  • yij es la j-ésima observación del i-ésimo grupo
  • mi es la media del i-ésimo grupo
  • uij es la perturbación que mide la variabilidad
    debida al error experimental

16
El modelo (ANOVA)
  • La perturbación uij mide la desviación en la
    observación j
  • del grupo i respecto de la media del grupo. Se
    debe a
  • causas no asignables (factores no controlados).
    Es una
  • variable aleatoria.
  • El promedio de las perturbaciones es cero,
    Euij0
  • Misma variabilidad en todos los grupos,
    Varuijs2
  • Distribución perturbaciones es normal, uijN(0,
    s2)
  • Perturbaciones independientes.

17
El modelo (ANOVA)
  • Alternativamente, podemos reformular el modelo
  • y escribirlo como
  • para i1,,I y j1,,ni . Donde
  • m es la media de todas las observaciones
  • ai es el efecto diferencial del i-ésimo grupo
  • (ai m i-m)

18
Descripción breve del tema
  • Introducción al diseño de experimentos
  • El modelo
  • Estimación de los parámetros
  • Propiedades de los estimadores
  • Descomposición de la variabilidad
  • Estimación de la diferencia de medias
  • Método de Fisher o LSD, contrastes múltiples
  • Diagnosis

19
Estimación de los parámetros
  • En el modelo
  • Para i1,,I y j1,,ni con yijN(0, s2)
  • Los parámetros desconocidos son
  • El verdadero valor de la media de cada grupo
  • m1, m2,, mI
  • La varianza de la perturbación s2.

20
Estimación de los parámetros
  • Media de las
  • observaciones en el
  • i-ésimo grupo

21
Estimación de los parámetros
  • Como de costumbre, las perturbaciones las
  • estimamos mediante los residuos (miden la
  • variabilidad no explicada).

22
Estimación de los parámetros
23
Estimación de los parámetros
  • La varianza muestral de los residuos es un
    estimador de s2
  • Desgraciadamente se trata de un estimador sesgado.

24
Estimación de los parámetros
  • Utilizamos la varianza residual como estimador de
    s2
  • El término que aparece en el cociente son los
    grados de libertad.
  • Tenemos

25
Descripción breve del tema
  • Introducción al diseño de experimentos
  • El modelo
  • Estimación de los parámetros
  • Propiedades de los estimadores
  • Descomposición de la variabilidad
  • Estimación de la diferencia de medias
  • Método de Fisher o LSD, contrastes múltiples
  • Diagnosis

26
Props. de los estimadores (medias)
  • Esperanza
  • (centrado o insesgado)
  • Varianza

27
Props. de los estimadores (medias)
  • Además, como es combinación lineal de
    variables independientes y normales, sigue
    distribución normal.
  • Como s es desconocido, tenemos el intervalo de
    confianza

28
Son todas las medias iguales?
29
Descripción breve del tema
  • Introducción al diseño de experimentos
  • El modelo
  • Estimación de los parámetros
  • Propiedades de los estimadores
  • Descomposición de la variabilidad
  • Estimación de la diferencia de medias
  • Método de Fisher o LSD, contrastes múltiples
  • Diagnosis

30
Descomposición de la variabilidad
  • El Análisis de la Varianza compara la
    variabilidad entre las medias de los grupos de
    los distintos niveles del factor con la
    variabilidad experimental.
  • A mayor diferencia entre las medias de los grupos
    mayor variabilidad entre ellos

31
Descomposición de la variabilidad
  • Si las medias son muy diferentes, la variabilidad
    entre las medias será mayor que la variabilidad
    dentro de los grupos

32
Descomposición de la variabilidad
33
Descomposición de la variabilidad
  • La Variabilidad Explicada (VE) mide la
    variabilidad entre los distintos grupos. Si es
    pequeña, es porque las medias son similares.
  • La Variabilidad No Explicada (VNE) o residual,
    mide la variabilidad dentro de los grupos y es
    debida al error experimental.

34
Descomposición de la variabilidad
  • En general
  • Además, si m1mI
  • En consecuencia, bajo H0

35
Desc. variabilidad. Tabla ANOVA

Fuentes de variación Suma de cuadrados Grados de libertad Varianza Test F
Entre grupos VE I-1
Residual VNE n-I
Total n-1
36
Descomposición de la variabilidad
  • Contraste de la F
  • Si H0 no es cierta, la varianza entre grupos será
    mayor que la residual

Rechazo
Aceptación
Aceptación
37
Descomposición de la variabilidadEjemplo
manufactura de papel
38
Descomposición de la variabilidadEjemplo
manufactura de papel
Región de rechazo
39
Descripción breve del tema
  • Introducción al diseño de experimentos
  • El modelo
  • Estimación de los parámetros
  • Propiedades de los estimadores
  • Descomposición de la variabilidad
  • Estimación de la diferencia de medias
  • Método de Fisher o LSD, contrastes múltiples
  • Diagnosis

40
Estimación de la diferencia de medias
  • Si llegamos a la conclusión de que, al menos, un
    par de medias son distintas. Deseamos saber
    cuáles son distintas y cuáles iguales.
  • Solución Comparar las medias 2 a 2

41
Contrastes particulares
  • Contraste para la igualdad de medias de dos
    poblaciones normales con varianzas desconocidas
    pero iguales
  • Hipótesis nula. H0 m1 m2
  • Hipótesis alternativa. H1 m1 ¹ m2
  • Rechazo H0 cuando
  • Hipótesis alternativa. H1 m1 lt m2
  • Rechazo H0 cuando
  • Hipótesis alternativa. H1 m1 gt m2
  • Rechazo H0 cuando

42
Intervalos de Confianza particulares
  • Intervalo de Confianza para la diferencia de
    medias de dos poblaciones normales con varianzas
    desconocidas pero iguales.
  • con un nivel de confianza 1-a ,
  • donde P(X gt tn,a) a si Xtn

43
Estimación de la diferencia de medias
  • H0 m1 m2
  • H1 m1 ¹ m2
  • Si
  • rechazamos H0.
  • En la gráfica c tn1n2-2,a/2

densidad de una tn1n2-2
Acepto
44
Diferencia de mediasEjemplo manufactura de papel
2.228
45
Diferencia de mediasEjemplo manufactura de papel
46
Estimación de la diferencia de mediasMétodo
Fisher o LSD
  • Deseamos hacer varios contrastes del tipo
  • y, según las hipótesis del modelo, la varianza es
    la
  • misma en todos los niveles del factor.
    Utilizamos, así,
  • todos los datos para estimarla

47
Estimación de la diferencia de mediasMétodo
Fisher o LSD
  • La distribución del estadístico es ahora
  • Si hay muchos grupos (niveles del factor), el
    nivel crítico cambia (porque n-I mucho mayor que
    n1n2-2). Con el método de Fisher detectamos
    diferencias más pequeñas.
  • Explicación varianza de una t.

48
Diferencia de mediasEjemplo manufactura de papel
t(0.025,20) 2.086
49
Diferencia de mediasEjemplo manufactura de papel
50
Estimación de la diferencia de mediasContrastes
múltiples
  • En un contraste de hipótesis, estamos siempre
    inclinados a aceptar la hipótesis nula. La
    rechazamos sólo si hay una evidencia muy fuerte
    en su contra.
  • Pr(Rechazar H0H0 cierta) a
  • Si utilizamos el método de Fisher para comparar
    cada pareja de medias, realizamos I(I-1)/2
    contrastes.

51
Estimación de la diferencia de mediasContrastes
múltiples
  • Al realizar m contrastes independientes cada uno
    con nivel de significación a 0.05, la
    probabilidad de rechazar alguna hipótesis nula
    cierta es
  • Pr(Rechazar algún H0H0) 1- Pr(Aceptar todos
    H0H0) 1- (1- 0.05)m 1-0.95m gt 0.05

52
Estimación de la diferencia de mediasContrastes
múltiples. Método de Bonferroni
  • Pr(Rechazar algún H0H0)SPr(Rechazar un
    H0H0)ma
  • Fijado un nivel de significación global aT ,
    garantizamos
  • dicho nivel de significación global si realizamos
    cada
  • contraste con un nivel de significación aaT/m
  • Los intervalos de confianza serán ahora más
    anchos y se
  • solaparán con mayor facilidad.

53
Contrastes múltiples. Método de
BonferroniEjemplo manufactura de papel
t(0.025,20) 2.086
t(0.00416, 20) 2.927
No hay diferencia en la Resistencia al utilizar
el 10 ó 15 de celulosa. Tampoco hay diferencia
al utilizar el 15 ó 20 de celulosa.
54
Descripción breve del tema
  • Introducción al diseño de experimentos
  • El modelo
  • Estimación de los parámetros
  • Propiedades de los estimadores
  • Descomposición de la variabilidad
  • Estimación de la diferencia de medias
  • Método de Fisher o LSD, contrastes múltiples
  • Diagnosis

55
Diagnosis
  • Para comprobar las hipótesis del modelo,
    calculamos los residuos (estimaciones de la
    perturbación)

56
Diagnosis
  • Comprobar hipótesis de normalidad
  • Gráficamente
  • Histograma de residuos
  • Gráfico probabilístico normal
  • Métodos inferenciales
  • Contraste de normalidad

57
Diagnosis
  • Comprobar hipótesis de varianza constante
  • Gráficamente
  • Gráfico de residuos frente a niveles del factor
  • Gráfico de residuos frente a valores ajustados
  • Métodos inferenciales
  • Contraste de igualdad de varianzas (sensibles a
    la normalidad)

58
Diagnosis
  • Comprobar hipótesis de independencia
  • Gráficos de residuos frente a tiempo.
  • Si los datos son independientes, en el gráfico no
  • aparecerá ninguna tendencia.
  • Si hay tendencias, es posible que el experimento
    no haya
  • sido aleatorizado y las diferencias entre los
    niveles sean
  • debidas al efecto del tiempo.

59
DiagnosisEjemplo manufactura de papel
Niveles del factor
Write a Comment
User Comments (0)
About PowerShow.com