Sin ttulo de diapositiva PowerPoint PPT Presentation

presentation player overlay
1 / 12
About This Presentation
Transcript and Presenter's Notes

Title: Sin ttulo de diapositiva


1
Análisis de Varianza con Un Criterio de
Clasificación
En clases anteriores se deseaba determinar si
existían diferencias entre las medias de dos
conjuntos de datos, en el ANÁLISIS DE VARIANZA se
considera como una generalización de esa
idea. Si se tiene un FACTOR se desea
determinar si es influyente. y11 y12
. . . yk1 y12 y22 . . .
yk2 y1n1 y1n2 . . .
yknk Se desea saber si hay diferencias entre
los grupos. El modelo para el análisis es yij
?i ?ij i 1,. . . ,k

j 1, . . . , ni. Se supone que los errores
tienen distribución normal con media cero,
varianza común ?2 y son independientes. ?
N(0,?2I)
2
Análisis de Varianza con Un Criterio de
Clasificación
Para determinar si existen diferencia entre los
grupos, puede probarse la hipótesis Ho ? 1
?2 . . . ?k vs. H1 algún ?i
distinto Esta prueba equivale a comparar los
modelos Modelo 1 yij ? ?ij
Modelo 2 yij ?i ?ij Los modelos
están anidados, y la comparación se realiza a
través de la tabla de análisis de varianza
correspondiente a la prueba de significancia del
modelo. Se rechaza Ho si F gt F k-1,N-k
3
Análisis de Varianza con Un Criterio de
Clasificación
Ejemplo Un ingeniero que desarrolla productos
está interesado en maximizar la resistencia a la
tensión de una nueva fibra sintética que se
empleará en la manufactura de tela para camisas
de hombre. La resistencia es influida por el
porcentaje de algodón presente en la fibra. El
ingeniero decide probar muestras a cinco niveles
de porcentaje de algodón 15,20,25,30,35. Los
resultados son los siguientes porcentaje (15,
15, 15, 15, 20, 20, 20, 20, 20, 20, 25, 25, 25,
25, 25, 30, 30, 30, 35, 35, 35, 35, 35, 35,
35) contenido (3, 3, 5, 2, 9, 12, 17,12, 18,
18, 14, 18, 18, 19, 19, 19, 25, 22, 19, 23, 7,
10, 11, 15, 11) Una herramienta para conocer
la resistencia para cada nivel de algodón el a
través del diagrama de caja. Para ello utilizamos
la instrucción StatgtANOVAgtOne- way . . . Como
variable respuesta se coloca el contenido o
resistencia y en el factor el porcentaje de
algodón utilizado. Adicional, se pide el gráfico
de caja para visualizar si existen diferencia por
cada nivel del factor. Los resultado son los
siguientes
4
Análisis de Varianza con Un Criterio de
Clasificación
Current worksheet Worksheet 1 One-way Analysis
of Variance Analysis of Variance for
contenid Source DF SS MS
F P porcenta 4 720,2 180,1
11,90 0,000 Error 20 302,7
15,1 Total 24 1023,0
Individual 95 CIs For Mean
Based on Pooled
StDev Level N Mean StDev
--------------------------------- 15
4 3,250 1,258 (--------) 20
6 14,333 3,830 (------)
25 5 17,600 2,074
(--------) 30 3 22,000
3,000 (---------) 35
7 13,714 5,619
(------)
--------------------------------- Pooled
StDev 3,890 0,0 8,0
16,0 24,0
5
Análisis de Varianza con Un Criterio de
Clasificación
  • A partir de los resultados de la tabla de
    Análisis de varianza, existen diferencias entre
    el nivel de algodón presente en la fibra y la
    resistencia.
  • Frecuentemente se emplea la siguiente
    reparametrización
  • yij ? ?i ?ij i 1,. . . ,k

  • j 1, . . . , ni.
  • Este modelo es equivalente al anterior (?i ?
    ?i ), tiene un parámetro adicional, y las
    ecuaciones normales correspondientes a esta
    reparametrización van a tener infinitas
    soluciones (los parámetros del modelo no son
    identificables).
  • Para resolver este problema, es necesario imponer
    una restricción sobre los ?i . Algunos de los
    más usados son
  • La suma de los ni ?i son iguales a cero. Los ?i
    representan las desviaciones de la media de cada
    grupo con respecto de la media general.
  • ?1 0 ?i i 2, . . . , k representan las
    desviaciones respecto al primer grupo.
  • Por defecto MINITAB utiliza la condición de que
    ?1 0 .

6
Análisis de Varianza con Un Criterio de
Clasificación
Los coeficientes del modelo, los genera MINITAB
al realizar el análisis de varianza
(Intercept) porcentaje20 porcentaje25
porcentaje30 porcentaje35 3.25000
11.08333 14.35000 18.75000
10.46429 Por defecto, MINITAB toma la
restricción ?1 0. Si se rechaza Ho ? 1 ?2
. . . ?k las hipótesis de interés son
Ho ? i ?j vs H1 ? i ? ?j Para
identificar cuáles promedios son diferentes
utilizamos la Mínima Diferencia Significativa.
Para ello se utiliza en la la instrucción para la
tabla ANOVA la herramienta comparaciones
7
Análisis de Varianza con Un Criterio de
Clasificación
Fisher's pairwise comparisons Family error
rate 0,264 Individual error rate
0,0500 Critical value 2,086 Intervals for
(column level mean) - (row level mean)
15 20 25 30
20 -16,322 -5,845 25
-19,794 -8,181 -8,906
1,647 30 -24,948 -13,405
-10,327 -12,552 -1,928
1,527 35 -15,551 -3,896
-0,866 2,686 -5,378
5,134 8,638 13,886
8
Análisis de Varianza con Un Criterio de
Clasificación
Al igual que cualquier modelo, es necesario
analizar los residuos para verificar que cumple
con las hipótesis. De nuevo utilizamos los
gráficos de residuos como en el caso de
regresión. Ya que el modelo es
desbalanceado, es decir, cada tratamiento difiere
del número de observaciones y la varianza no es
constante (forma de embudo) se realiza una
transformación de las observaciones para tratar
de resolver el posible problema de
heterocedasticidad.
9
Análisis de Varianza con Un Criterio de
Clasificación
Suposición e Normalidad Suposición de
Independencia de los residuos Si se conoce el
orden en que se recopilaron los datos se puede
utilizar para detectar alguna correlación entre
ellos. Si esto ocurre la suposición de
independencia ha sido violada.
10
Análisis de Varianza Estabilizar la Varianza
Cuando los residuos no presentan estabilidad en
la varianza puede ser debido a que son muy pocas
observaciones por nivel o que realmente las
varianzas no son constantes (Heterocedasticidad).
En presencia de inestabilidad de varianza
utilizamos la transformación Log(?) log?
?log(?) Deben existir réplicas para cada nivel,
de lo contrario no se podría determinar la
transformación por este método. Para ello
determinamos los promedios y desviaciones para
cada nivel, en nuestro caso tomamos la
información de la tabla ANOVA
Current worksheet Worksheet 1 One-way Analysis
of Variance Analysis of Variance for
contenid Source DF SS MS
F P porcenta 4 720,2 180,1
11,90 0,000 Error 20 302,7
15,1 Total 24 1023,0
Individual 95 CIs For Mean
Based on Pooled
StDev Level N Mean StDev
--------------------------------- 15
4 3,250 1,258 (--------) 20
6 14,333 3,830 (------)
25 5 17,600 2,074
(--------) 30 3 22,000
3,000 (---------) 35
7 13,714 5,619
(------)
--------------------------------- Pooled
StDev 3,890 0,0 8,0
16,0 24,0
11
Análisis de Varianza con Un Criterio de
Clasificación
Se estima una recta de regresión con estos
datos media desviacion log(des)
log(media) 3,25 1,25831 0,22977
1,17865 14,33 3,82971 1,34279 2,66236
17,60 2,07364 0,72931 2,86790 22,00
3,00000 1,09861 3,09104 13,71 5,61885
1,72613 2,61844 Realizamos la estimación
del modelo de regresión con el modelo
planteado Stat gtRegression gtRegression ... La
variable predictora es log de los promedios y la
respuesta log de las desviaciones, el resultado
es el siguiente Regression Analysis The
regression equation is log(des) - 0,200 0,494
log(media) Predictor Coef StDev T
P Constant -0,2005 0,8626 -0,23
0,831 log(medi 0,4935 0,3352 1,47
0,237 S 0,5050 R-Sq 42,0 R-Sq(adj)
22,6 El coeficiente del logaritmo de las
medias para cada nivel es ? 0.4935 ?
0.5 La transformación que le corresponde a las
observaciones es ? 1 - ? 1 - 0.5
0.5 Luego, la transformación para los datos es la
raíz cuadrada.
12
Análisis de Varianza con Un Criterio de
Clasificación
Calc gt Calculator . . .gt resultado
raiz(contenido) expresion sqrt(contenido) Una
vez aplicad ala transformación a la variable
Contenido, se estima nuevamente el modelo inicial
para analizar si el problema de los residuos se
modificó. La transformación no
modificó los residuos, esto indica que la
variabilidad en la varianza se debe al tamaño de
la muestra en cada nivel.
Write a Comment
User Comments (0)
About PowerShow.com