Supuestos de ANDEVA y contrastes Diseño Experimental Clase 4
Modelo yij = µ + α ij + ε ij µ = promedio global αi = promedio grupo εij = error o residuos
Supuestos • Los residuos εij se distribuyen normalmente • Los residuos εij tienen promedio 0 y varianza constante • Los residuos εij son independientes y no presenten autocorrelación de ningún tipo
Supuestos • ¿Qué tan robustos son métodos y supuestos? – Normalidad y varianza: Robustos – Independencia: Muy sensible
• ¿Cómo detectar problemas?
No conocemos εij
yij = µ + α i + ε ij
ε ij = yij − ( µ + α i ) rij = yij − ( µˆ + αˆ i ) rij = yij − yi⋅
Revisión Supuestos • Análisis gráfico – Independencia – Igualdad de varianza – Normalidad
• Estadístico – Normalidad
Normalidad de εij • Figuras cuantil-cuantil • Grafica – Cuantiles observados eje-x – Cuantiles esperados según ~N(0,1) – Línea que pasa por Q3 y Q1
Colas Livianas
Colas Pesadas
Colas Pesadas
0 -2 -4
Sample Quantiles
2
4
Normal Q-Q Plot
-3
-2
-1
0
1
Theoretical Quantiles
2
3
Distribución Asimétrica
Variable sin Considerar
Varianza constante • Se grafica los residuos vs. valores estimados – Residuos: rij – Estimados: ŷij
yˆ ij = µˆ + αˆ i
0 -5
Residuals
5
10
Residuals vs Fitted
6
8
10
12
14
Fitted values lm(sr ~ pop15 + pop75 + dpi + ddpi)
16
Residuos
0
yˆ ij = µˆ + αˆ i
Residuos estandarizados • Residuos usualmente estandarizados – Divide entre s – Reduce dispersión
• Raíz cuadrada – Reduce sesgo
Varianza Proporcional Residuos
0
yˆ ij = µˆ + αˆ i
Residuos
0
yˆ ij = µˆ + αˆ i
Independencia • Difícil de probar • Depende de Diseño Experimental • Figuras especiales 4. Residuos vs. nivel de factores 5. Residuos vs. orden de corrida
R E S I D U O S Orden
Sin Patrón
R E S I D U O S Orden
autocorrelación positiva
R E S I D U O S Orden
autocorrelación negativa alternan + y -
¿Cómo resolver problemas? • Problemas con modelo – Cambiar modelo – Incluir • Interacciones • Polinomios • Bloques
– Transformaciones
¿Cómo resolver problemas? • Varianzas desiguales – Transformaciones – Modelos independientes o nolineales – Rangos
¿Cómo resolver problemas? • Falta de Normalidad – Transformaciones – Análisis de Rangos – GLM
Transformaciones • ¿Cuáles son? – Matemáticas – Trigonométric a – Box-Cox
• ¿Cuál usar? – Prueba y Error – Box Cox es mejor
x′ = x x′ = 1 x x′ = 1 x x′ = log( x) x′ = arcsin( x )
Box-Cox • Transformaci ón de poder • Máxima Verosimilitud • Se relaciona a otras transformaci ones
Contrastes
Contrastes • Comparaciones ‘a priori’ • Basadas en Objetivos e Hipótesis del proyecto • Tienen más poder que ‘a posteriori’ – Basadas en SSt – No violan supuestos – No pierde control alfa
Contrastes • Se compara el efecto de cada nivel o tratamiento αi o sus promedios µi • Para contrastes se calculan promedios ponderados • La matriz de contrastes es el peso (ci) que se da a cada efecto αi o sus promedios µi
Nomenclatura yij yi . µˆ = y.. αˆ i = yi. − y..
µι = yi.
Contrastes g
ψ i = ∑ ci µi donde i
g
∑c
i
=0
i
ψ i = ∑ ciα i = c1µ1 + c2 µ 2 + + ca µα i
ψˆ i = ∑ wi µˆ i = ∑ wi yi⋅ i
i
Papas (Cochran) Control
Promedio
µ
Desviacion
αi
F3
S3
F6
S6
F12
S12
12
24
9
30
16
18
10
17
30
32
9
7
10
24
4
7
10
29
16
21
18
12
4
16
18
26
4
9
18
19
5
17
22.6
9.5
16.8
15.5
18.3
5.8
14.3
7.0
-6.2
1.1
-0.2
2.6
-9.9
-1.4
y1.-y..
TOTAL
15.7
Contrastes e Hipótesis • Supongamos que se quiere comparar el grupo control con los demás tratamientos
• Comparar “primavera” con “otoño”
H1 : µ1 =
µ 2 + µ3 + µ 4 + µ5 + µ 6 + µ 7 6
µ 2 + µ 4 + µ 6 µ3 + µ5 + µ 7 H2 : = 3 3
Hipótesis • Contrastes comparan promedios en un modelo lineal:
µ 2 + µ3 + µ 4 + µ5 + µ6 + µ7 H1 : µ1 − =0 6 µ 2 + µ 4 + µ6 µ3 + µ5 + µ 7 H2 : − =0 3 3
Comparación Lineal • Un contraste es una combinación lineal de los promedios grupales para evaluar una comparación específica 1 1 1 1 1 1 ψ 1 = 1µ1 − µ 2 − µ3 − µ 4 − µ5 − µ 6 − µ 7 6 6 6 6 6 6 1 1 1 1 1 1 ψ 2 = 0 µ1 + µ 2 − µ 3 + µ 4 − µ5 + µ 6 − µ 7 3 3 3 3 3 3
Coeficientes • Usualmente los contrastes se expresan como un vector de coeficientes:
1 1 1 1 1 1 c1 = 1, − , − , − , − , − , − 6 6 6 6 6 6 = ( 6, − 1, − 1, − 1, − 1, − 1, − 1) 1 1 1 1 1 1 c2 = 0, , − , , − , , − 3 3 3 3 3 3 = ( 0, 3, − 3, 3, − 3, 3, − 3)
Número contrastes • Hay número infinito de contrastes – Deben cumplir Σciµi = 0
• Algunos no son interpretables – c=(14, -8, -2, -3, -1)
• Otros son redundantes…
Contrastes Redundantes
ψ 1 = 0 µ1 + µ 2 + µ 3 − µ 4 − µ5 ψ 2 = 4 µ1 − µ 2 − µ3 − µ 4 − µ5 ψ 3 = 2 µ1 − 0µ 2 − 0 µ3 − µ 4 − µ5 ψ 3 = ψ 1 +ψ 2
Ortogonalidad • En cada modelo se pueden establecer g-1 contrastes no redundantes • Dos contrastes independientes se denominan ortogonales • Geométricamente son perpendiculares
ψ ⊥ψ ′
• Hay un número infinito de g-1 grupos de contrastes ortogonales
Ortogonalidad • Los contrastes son ortogonales si: – producto puntual de dos filas es 0
ci ci′ ψ ⊥ψ ′ ⇔ ∑ =0 ni ι
Suma de Cuadrados • Un grupo de contrastes ortogonales parte SSE • Cada SSψ tiene un (1) grado de libertad • Se puede SS E =calcular SSψ + SSψF + + SSψ 1
2
ψ2 SSψ = 2 g ci ∑i n i
g −1
Ejemplo
Contrastes polinómicos • Contrastes para ajustar polinomios • Requiere que niveles sean numéricos • Es casi lo mismo que una regresión • Polinomio depende de número de niveles – g=2 : lineal – g=3: lineal y cuadrático – g=4: lineal, cuadrático, cúbico
Contrastes polinomiales • Requieren mismo espacio entre niveles • Requieren igual n • Pueden usarse para otros casos, pero mejor usar regresion
k
Polinomio
1
2
3
3
Lineal
-1
0
1
1
-2
1
-3
-1
1
3
1
-1
-1
1
Cúbico
-1
3
-3
1
Lineal
-2
-1
0
1
2
2
-1
-2
-1
2
-1
2
0
-2
1
1
-4
6
-4
1
Cuadrático 4
Lineal Cuadrático
5
Cuadrático Cúbico Cuártico
4
5