1
PONTIFICIA UNIVERSIDAD CATOLICA DEL PERU FACULTAD DE LETRAS Y CIENCIAS HUMANAS ESPECIALIDAD DE PSICOLOGIA ESTADISTICA II Problema 1 a) El objetivo es identificar los grupos de menor puntuación, es decir se tiene la hipótesis que hay diferencias, mas no se sabe dónde se dan. Es un caso típico de ANOVA One Way con contrastes Post Hoc de Scheffe. •
Primero creamos una base SPSS con dos variables:
Variable Information Variable Régimen
Position 1
Clima
2
Label Régimen Laboral Clima
Measurement Level
Column Width
Alignment
Print Format
Write Format
Scale
8
Right
F8
F8
Scale
8
Right
F8
F8
Variables in the working file
Variable Values Value Régimen
•
Label 1 2 3 4
Ejecutivos Estables Contratados Service
Aplicamos la secuencia de comandos SPSS Analyze⇒ ⇒Compare Means⇒ ⇒One-Way Anova→ →Dependent list:Clima→ → Factor:Régimen → Post Hoc: check en Scheffe→ →Continue→ →Options→ →Check en Descriptive, Homogeneity of variantes test, Means plot→ →Continue→ →OK. Obtenemos los cuadros SPSS Descriptives Clima
N Ejecutivos Estables Contratados Service Total
6 8 13 13 40
Mean 14.83 14.50 12.00 11.77 12.85
Std. Deviation 1.169 1.195 1.581 2.166 2.107
Std. Error .477 .423 .439 .601 .333
95% Confidence Interval for Mean Lower Bound Upper Bound 13.61 16.06 13.50 15.50 11.04 12.96 10.46 13.08 12.18 13.52
Minimum 13 12 10 9 9
Maximum 16 16 15 15 16
Test of Homogeneity of Variances Clima Levene Statistic 2.163
df1
df2 3
36
Sig. .109
El test de Leven indica que sí se cumple el supuesto de varianzas homogéneas pues Sig. = 0.109 > 0.05 (Recordar que este supuesto es necesario para la validez plena del ANOVA)
2 ANOVA Clima
Between Groups Within Groups Total
Sum of Squares 69.959 103.141 173.100
df 3 36 39
Mean Square 23.320 2.865
F 8.139
Sig. .000
El contraste de H0: Las medias son todas cero vs H1: Al menos hay una media diferente del resto, se realiza con la prueba F. Aquí F = 8.139 y Sig. = 0.000 es menor que 0.05, de modo que rechazamos H0. Podemos concluir que sí hay diferencia en percepción del clima laboral según régimen de trabajo. Entonces sí tiene sentido identificar los grupos con menor grado de satisfacción o sea con puntuaciones más bajas. Esto lo hace la prueba de Scheffe: Multiple Comparisons Dependent Variable: Clima Scheffe
(I) Régimen Laboral Ejecutivos
Estables
Contratados
Service
(J) Régimen Laboral Estables Contratados Service Ejecutivos Contratados Service Ejecutivos Estables Service Ejecutivos Estables Contratados
Mean Difference (I-J) Std. Error .333 .914 2.833* .835 3.064* .835 -.333 .914 2.500* .761 2.731* .761 -2.833* .835 -2.500* .761 .231 .664 -3.064* .835 -2.731* .761 -.231 .664
Sig. .987 .018 .009 .987 .023 .011 .018 .023 .989 .009 .011 .989
95% Confidence Interval Lower Bound Upper Bound -2.35 3.01 .38 5.28 .61 5.51 -3.01 2.35 .27 4.73 .50 4.96 -5.28 -.38 -4.73 -.27 -1.72 2.18 -5.51 -.61 -4.96 -.50 -2.18 1.72
*. The mean difference is significant at the .05 level.
Según Scheffe: Ejecutivos No difiere de Estables (Sig. = 0.987 > 0.05) Ejecutivos Sí difiere de Contratados (Sig. = 0.018 < 0.05) Ejecutivos Sí difiere de Service (Sig. = 0.009 < 0.05) Estables Sí difiere de Contratados (Sig. = 0.023 < 0.05) Estables Sí difiere de Service (Sig. = 0.011 < 0.05) Contratados No difiere de Service (Sig. = 0.989 > 0.05) Examinando el cuadro de estadísticas descriptivas notamos que la percepción de clima es más baja en los trabajadores con modalidad de Service y Contratados.
3 Clima a,b
Scheffe
Régimen Laboral Service Contratados Estables Ejecutivos Sig.
N 13 13 8 6
Subset for alpha = .05 1 2 11.77 12.00 14.50 14.83 .994 .981
Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 8.978. b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed.
15
Mean of Clima
14
13
12
Ejecutivos
Estables
Contratados
Service
Régimen Laboral •
Tanto el Test de Scheffe como el gráfico muestran que donde habría que intervenir para mejorar la percepción de clima es con los trabajadores de Service y Contratados.
b) En este caso sólo hay una hipótesis previa y debemos aplicar Contrastes Ad Hoc. Analyze⇒Compare Means⇒One-Way Anova→Dependent list:Clima→ Factor:Régimen → Contrasts→ Coefficients:0→Add; 1→Add; -1→Add; 0→Add→Continue→Options→ Check en Descriptive, Homogeneity of variantes test, Means plot→Continue→OK. El output SPSS es similar al de a) pero sin el cuadro de Scheffe y con el cuadro de Contrastes
4 Contrast Coefficients
Contrast 1
Ejecutivos 0
Régimen Laboral Estables Contratados 1 -1
Service 0
Contrast Tests
Clima
Assume equal variances Does not assume equal variances
Contrast 1 1
Value of Contrast 2.50 2.50
Std. Error .761 .609
t 3.287 4.105
df 36 18.011
Sig. (2-tailed) .002 .001
Las hipótesis son H0: Media Estables = Media Contratados vs H1: Media Estables > Media Contratados y de acuerdo a la significación (asumiendo varianzas iguales porque Levene lo permite) es Sig. (1-tailed) = Sig.(2tailed)/2 = 0.002/2 = 0.001 < 0.05 que permite rechazar H0. Se concluye que es cierto que los trabajadores estables tienen mejor percepción de Clima que los contratados. Problema 2 a) La hipótesis general de trabajo es “habría diferencias en el nivel de actividad y que en dosis intermedias –o sea 0.5 - se encontraría mayor actividad que en dosis bajas (0 o 0.1) y en dosis altas (1 o 2)” Si denotamos con µ1 , µ 2 , µ 3, µ 4 y µ 5 el nivel promedio de actividad para dosis de 0, 0.1, 0.5, 1 y 2 microgramos de THC respectivamente, entonces la hipótesis de trabajo, genera dos hipótesis específicas previas que refraseadas en términos estadísticos son: HT1: ∃µ i ≠ µ j µ4 (“habría diferencias en el nivel de actividad”) HT2: µ1 < µ3 y µ2 < µ3 y µ3 > µ4 y µ3 > µ5 (“en dosis intermedias –o sea 0.5 - se encontraría mayor actividad que en dosis bajas (0 o 0.1) y en dosis altas (1 o 2)” HT1 se contrasta con la Prueba F del ANOVA ONE WAY HT2 se somete a prueba con 4 contrastes ad hoc unilaterales. Examinando los cuadros de output Descriptives Nivel de actividad
N Control 0.1 mg 0.5 mg 1.0 mg 2.0 mg Total
10 10 9 8 10 47
Mean 34.00 50.80 60.33 48.50 38.10 45.96
Std. Deviation 14.30 18.39 11.07 18.32 14.46 17.62
Std. Error 4.52 5.82 3.69 6.48 4.57 2.57
95% Confidence Interval for Mean Lower Upper Bound Bound 23.77 44.23 37.64 63.96 51.83 68.84 33.18 63.82 27.76 48.44 40.78 51.13
Minimum 8 28 38 32 17 8
Maximum 52 93 74 78 60 93
5 Test of Homogeneity of Variances Nivel de actividad Levene Statistic .834
df1
df2 4
Sig. .511
42
El cuadro de estadísticos descriptivos no sirve aún. En cuanto al Test de Levene su no significación corrobora que las varianzas poblacionales son iguales, así que el ANOVA ONE WAY es confiable. La hipótesis de trabajo HT1 genera H 0 : µ1 = µ 2 = µ 3 = µ 4 = µ 5 vs H 1 : ∃µ i ≠ µ j y H0 se contrasta con el estadístico F del ANOVA. La significación de H0 es Sig.=0.005 < 0.05 así que se rechaza H0 y concluimos que sí hay diferencias, HT1 se cumple. ANOVA Nivel de actividad
Between Groups Within Groups Total
Sum of Squares 4193.415 10094.500 14287.915
df 4 42 46
Mean Square 1048.354 240.345
F 4.362
Sig. .005
La hipótesis de trabajo HT2 se debe analizar con 4 contrastes ad hoc: El primero es H 0 : µ1 = µ3 vs H 1 : µ1 < µ3 que equivale a
H 0 : 1µ1 + 0 µ2 − 1µ3 + 0 µ4 + 0 µ5 = 0 vs H 1 : 1µ1 + 0 µ2 − 1µ3 + 0 µ4 + 0 µ5 < 0 El segundo es H 0 : µ2 = µ3 vs H 1 : µ2 < µ3 que equivale a
H 0 : 0 µ1 + 1µ2 − 1µ3 + 0 µ4 + 0 µ5 = 0 vs H 1 : 0 µ1 + 1µ2 − 1µ3 + 0 µ4 + 0 µ5 < 0 El tercero es H 0 : µ3 = µ4 vs H 1 : µ3 > µ4 que equivale a
H 0 : 0 µ1 + 0 µ2 + 1µ3 − 1µ4 + 0 µ5 = 0 vs H 1 : 0 µ1 + 0 µ2 + 1µ3 − 1µ4 + 0 µ5 > 0 Finalmente el cuarto contraste es H 0 : µ3 = µ5 vs H 1 : µ3 > µ5 que equivale a
H 0 : 0 µ1 + 0 µ2 + 1µ3 + 0 µ4 − 1µ5 = 0 vs H 1 : 0 µ1 + 0 µ2 + 1µ3 + 0 µ4 − 1µ5 > 0 El cuadro de abajo tiene la significación de los diversos contrastes pero a dos colas. Hay que dividir entre dos para tener la significación unilateral. Contrast Coefficients
Contrast 1 2 3 4
Control 1 0 0 0
Dosis de THC (microgramos) 0.1 mg 0.5 mg 1.0 mg 0 -1 0 1 -1 0 0 1 -1 0 1 0
2.0 mg 0 0 0 -1
6 Contrast Tests
Nivel de actividad
Assume equal variances
Does not assume equal variances
Contrast 1 2 3 4 1 2 3 4
Value of Contrast -26.33 -9.53 11.83 22.23 -26.33 -9.53 11.83 22.23
Std. Error 7.123 7.123 7.533 7.123 5.836 6.887 7.455 5.875
t -3.697 -1.338 1.571 3.121 -4.512 -1.384 1.587 3.785
df 42 42 42 42 16.664 14.974 11.242 16.613
Sig. (2-tailed) .001 .188 .124 .003 .000 .187 .140 .002
En el cuadro correspondiente a varianzas iguales, las significaciones a una cola son respectivamente: 0.0005, 0.094, 0.062 y 0.00015 de modo que sólo los contrastes 1 y 4 resultaron significativos (o sea se rechazó H0). Concluimos que el mayor nivel de actividad se da para la dosis de 0.5 en comparación con la dosis 0 y con dosis mayor de 2 mcg., pero no con las otras dosis. Así que HT2 como un todo no se cumple y el gráfico de abajo debe ser interpretado con cuidado. 70
Mean of Nivel de actividad
60
50
40
30 Control
0.1 mg
0.5 mg
1.0 mg
2.0 mg
Dosis de THC (microgramos)
Solución b) El output de SPSS es similar al anterior, salvo que aparece el cuadro de contrastes Post Hoc de Scheffe siguiente.
7 Multiple Comparisons Dependent Variable: Nivel de actividad Scheffe
(I) Dosis de THC (microgramos) Control
0.1 mg
0.5 mg
1.0 mg
2.0 mg
(J) Dosis de THC (microgramos) 0.1 mg 0.5 mg 1.0 mg 2.0 mg Control 0.5 mg 1.0 mg 2.0 mg Control 0.1 mg 1.0 mg 2.0 mg Control 0.1 mg 0.5 mg 2.0 mg Control 0.1 mg 0.5 mg 1.0 mg
Mean Difference (I-J) -16.80 -26.33* -14.50 -4.10 16.80 -9.53 2.30 12.70 26.33* 9.53 11.83 22.23 14.50 -2.30 -11.83 10.40 4.10 -12.70 -22.23 -10.40
Std. Error 6.93 7.12 7.35 6.93 6.93 7.12 7.35 6.93 7.12 7.12 7.53 7.12 7.35 7.35 7.53 7.35 6.93 6.93 7.12 7.35
Sig. .229 .017 .433 .986 .229 .773 .999 .508 .017 .773 .653 .062 .433 .999 .653 .736 .986 .508 .062 .736
95% Confidence Interval Lower Upper Bound Bound -39.13 5.53 -49.28 -3.39 -38.19 9.19 -26.43 18.23 -5.53 39.13 -32.48 13.41 -21.39 25.99 -9.63 35.03 3.39 49.28 -13.41 32.48 -12.43 36.10 -.71 45.18 -9.19 38.19 -25.99 21.39 -36.10 12.43 -13.29 34.09 -18.23 26.43 -35.03 9.63 -45.18 .71 -34.09 13.29
*. The mean difference is significant at the .05 level.
De acuerdo al cuadro sólo hay diferencia entre dosis 0 y dosis 0.5 Problema 3 a) Los dos cuadros iniciales de SPSS no ayudan por el momento. Vamos al cuadro con el t est de Levene: Between-Subjects Factors
Tipo de Producto
Ubicación en la tienda
1 2
1 2
Value Label Conocido Descono cido o reciente Ubicación usual Ubicación prominen te
N 20 20 20
20
8 Descriptive Statistics Dependent Variable: Número de unidades vendidas/día Tipo de Producto Conocido
Desconocido o reciente
Total
Ubicación en la tienda Ubicación usual Ubicación prominente Total Ubicación usual Ubicación prominente Total Ubicación usual Ubicación prominente Total
Mean 6.50 19.30 12.90 7.00 12.00 9.50 6.75 15.65 11.20
Std. Deviation 1.43 2.67 6.89 1.83 3.74 3.85 1.62 4.90 5.77
N 10 10 20 10 10 20 20 20 40
a Levene's Test of Equality of Error Variances
Dependent Variable: Número de unidades vendidas/día F 2.952
df1
df2 3
Sig. .045
36
Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+PROD+UBICA+PROD * UBICA
El test de Levene nos dice que no hay homogeneidad de varianzas (aunque a dos decimales exactos sí la habría). Debemos tomar con precauciones los resultados. En este caso, dado que la significación estuvo cerca del 0.05 continuamos con el análisis. En otra situación más extrema, habría que examinar los datos para ver si hay algún “valor extremo” que esté malogrando las varianzas, para eliminarlo de la muestra. Si no fuera ese el caso, tendríamos que usar pruebas no paramétricas o quizá hacer transformaciones en los datos, pero esto último es más especializado y requiere consulta a un estadístico. Tests of Between-Subjects Effects Dependent Variable: Número de unidades vendidas/día
Source Corrected Model Intercept PROD UBICA PROD * UBICA Error Total Corrected Total
Type III Sum of Squares 1059.800a 5017.600 115.600 792.100 152.100 238.600 6316.000 1298.400
df 3 1 1 1 1 36 40 39
Mean Square 353.267 5017.600 115.600 792.100 152.100 6.628
a. R Squared = .816 (Adjusted R Squared = .801)
F 53.301 757.056 17.442 119.512 22.949
Sig. .000 .000 .000 .000 .000
9 Estimated Marginal Means of Número de unidades vendidas/día 22 20 18
Estimated Marginal Means
16 14 12
Tipo de Producto
10 8
Conocido
6
Desconocido o recien
4
te
Ubicación usual
Ubicación prominente
Ubicación en la tienda Este es un caso de ANOVA TWO WAY donde queremos investigar el efecto de dos factores (Ubicación y Tipo de producto –conocido o nuevo-) en una variable respuesta (Ventas). Llamando Factor A al Tipo de producto y Factor B a Ubicación en los estantes, tenemos que la oración “se pensaba que la cantidad vendida de un producto dependía de su ubicación en los estantes del establecimiento y de si el producto era de antigua data en el mercado o si era desconocido o de reciente introducción” genera las hipótesis de trabajo: Hay efecto del factor B (Ubicación) (“se pensaba que la cantidad vendida de un producto dependía de su ubicación en los estantes del establecimiento”) y Hay efecto del factor A (Tipo de producto) (“y de si el producto era de antigua data en el mercado o si era desconocido o de reciente introducción”) No se menciona interacción como hipótesis. Pero de haberla tendremos que considerarla en las conclusiones, porque la interacción afecta las diferencias cuando estas existen. Estadísticamente y de acuerdo al modelo del ANOVA TWO WAY αβ)ij + ε Y = µ + αi + β j + (α Nuestras hipótesis nulas por contrastar son: H0:α αi = 0 ∀ i (No hay efecto de Tipo de producto) y H0:β β j = 0 ∀ j (No hay efecto de Ubicación) La primera hipótesis tiene un FA=17.442 con 1 y 36 grados de libertad. La significación es 0.000 < 0.05 así que rechazamos H0:αi = 0 ∀ i y concluimos que sí hay efecto de Tipo de producto. Examinando el cuadro de medias muestrales vemos que los productos conocidos tienen más ventas que los recientes (12.90 vs 9.50)
10
La segunda hipótesis tiene un FB=119.512 con 1 y 36 grados de libertad y con significación 0.000 < 0.05 de modo que también rechazamos H0:βj = 0 ∀ j y concluimos que sí hay efecto de Ubicación. Del cuadro de medias se tiene que los productos ubicados en lugar prominente tienen mejor venta que los ubicados en lugares usuales (15.65 vs 6.75) La existencia de interacción no es hipótesis, pero al contrastar su no existencia (H0:(αβ)ij = 0 ∀ ij) el FAB =22.949 resulta significativo y tenemos que rechazar H0:(αβ)ij = 0, es decir las diferencias en ventas entre Tipos de productos dependen de (cambian con) la ubicación. Este dato es importante y no debe ser omitido (aunque no haya sido puesto como hipótesis). Examinando el gráfico se ve que en ubicación usual, la venta es similar para ambos tipos de producto pero cuando se ponen en lugar prominente, aunque los dos productos aumentan sus ventas, la venta del producto conocido mayor. Es decir el lugar prominente genera diferencias entre los tipos de producto. b) Se quiere comparar la Combinación: Conocido/Ubicación prominente con la combinación Desconocido/Ubicación usual. Hay que aplicar un contraste t de Student para H0: µ12 = µ21 VS H1: µ12 > µ21. Se usa el CME en el denominador del estadístico t:
t=
(Y 12 − Y 21 ) = CME CME + n n
(19.3 − 7) = 10.68 que debe ser comparado con el valor de la tabla t-Student 6.628 6.628 + 10 10
con los grados de libertad del error o sea k = 36. De la Tabla t se tiene t0.95(36) ≅ t0.95(35) = 1.68957 : t = 10.68 > 1.68957 (pues el contraste es unilateral derecho) y por tanto se rechaza H0: µ12 = µ21 y se acepta H1: µ12 > µ21 Problema 4 Aplicando ANOVA One Way con contrastes Post Hoc de Scheffe obtenemos: Descriptives Número de unidades vendidas/día
N Conocido/Usual Conocido/prominente Desconocido/Usual Desconocido/Prominente Total
10 10 10 10 40
Mean 6.50 19.30 7.00 12.00 11.20
Std. Deviation 1.434 2.669 1.826 3.742 5.770
Std. Error .453 .844 .577 1.183 .912
95% Confidence Interval for Mean Lower Bound Upper Bound 5.47 7.53 17.39 21.21 5.69 8.31 9.32 14.68 9.35 13.05
ANOVA Número de unidades vendidas/día
Between Groups Within Groups Total
Sum of Squares 1059.800 238.600 1298.400
df 3 36 39
Mean Square 353.267 6.628
F 53.301
Sig. .000
Minimum 4 15 4 5 4
Maximum 9 22 10 19 22
11 Multiple Comparisons Dependent Variable: Número de unidades vendidas/día Scheffe
(I) Producto y Ubicación Conocido/Usual
Conocido/prominente
Desconocido/Usual
Desconocido/Prominente
(J) Producto y Ubicación Conocido/prominente Desconocido/Usual Desconocido/Prominente Conocido/Usual Desconocido/Usual Desconocido/Prominente Conocido/Usual Conocido/prominente Desconocido/Prominente Conocido/Usual Conocido/prominente Desconocido/Usual
Mean Difference (I-J) -12.80* -.50 -5.50* 12.80* 12.30* 7.30* .50 -12.30* -5.00* 5.50* -7.30* 5.00*
Std. Error 1.15 1.15 1.15 1.15 1.15 1.15 1.15 1.15 1.15 1.15 1.15 1.15
*. The mean difference is significant at the .05 level.
Número de unidades vendidas/día a
Scheffe
Producto y Ubicación Conocido/Usual Desconocido/Usual Desconocido/Prominente Conocido/prominente Sig.
N
1 10 10 10 10
Subset for alpha = .05 2 3 6.50 7.00 12.00 19.30 .979 1.000 1.000
Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 10.000.
Mean of Número de unidades vendidas/día
22 20 18 16 14 12 10 8 6 4
Conocido/Usual
Conocido/prominente Desconocido/Usual Desconocido/Prominen
Producto y Ubicación
Sig. .000 .979 .000 .000 .000 .000 .979 .000 .002 .000 .000 .002
95% Confidence Interval Lower Upper Bound Bound -16.18 -9.42 -3.88 2.88 -8.88 -2.12 9.42 16.18 8.92 15.68 3.92 10.68 -2.88 3.88 -15.68 -8.92 -8.38 -1.62 2.12 8.88 -10.68 -3.92 1.62 8.38
12
En cuanto al contraste Ad Hoc para comparar la Combinación Conocido/Ubicación prominente con la combinación Desconocido/Ubicación usual: H0: µ2 = µ3 vs H1: µ2 > µ3 Tenemos que comparar el tratamiento 2 con el 3. Realizando nuevamente el ANOVA pero ahora usando Contrastes, obtenemos las tablas adicionales: Contrast Coefficients
Contrast 1
Conocido /Usual 0
Producto y Ubicación Conocido /promine Desconoc nte ido/Usual 1 -1
Descono cido/Pro minente 0
Contrast Tests
Número de unidades vendidas/día
Assume equal variances Does not assume equal variances
Contrast 1 1
Value of Contrast 12.30 12.30
Std. Error 1.15 1.02
t 10.683 12.029
df 36 15.911
Sig. (2-tailed) .000 .000
La verdadera significación 0.000/2 = 0.000 y se rechaza H0. El contraste resulta significativo. Examinando las medias se ve que se cumple nuestra H1. Todos los resultados se mantienen. Problema 5 a) Factor A = Problema con a=2 niveles : A1=Problemas separados y A2=Problema integrado Factor B = Tema con b=3 niveles : B1=Regresión, B2=Anova y B3=Dos muestras El modelo lineal sería Y = µ + αi + β j + (α αβ)ij + ε donde: αi es el efecto de la modalidad i del Factor A (Problema) βj es el efecto de la modalidad j del Factor B (Tema) (α αβ)ij es el efecto de interacción (si existiera) entre Problema y Tema. b) HT1: “Habría diferencias según el Tipo de Problema” H1: Al menos un αi es distinto de 0. FA=12.054 que debemos comparar con F0.95(1,54)≈ F0.95(1,60)=4.0 y como FA es mayor rechazamos H0: αi=0 ∀i y aceptamos H1. Se cumple HT1 c) HT2: “Las diferencias entre los tipos de problema cambiarían significativamente según el Tema evaluado” se refiere a que el factor B interactúa con el factor A, luego tenemos H1: Al menos un αβ ij es distinto de 0. En este caso FAB=1.121 y su significación es Sig.=0.333>0.05 así que aceptamos H0: αβ ij=0 ∀ij. Concluimos que no se cumple HT2 d) HT3:“Era mejor evaluar el Anova con un solo problema integrado que con problemas separados” y esto genera la hipótesis estadística H1:µ12<µ22 (o H 1 : µ P . SeparadoAnova < µ P. IntegradoAnova ) que se contrasta contra H0:µ12=µ22 usando la t-Student modificada
t=
(Y 12 − Y 22 ) (13.10 − 17.70) = = −3.22 vs − t 0.95 (54) ≅ −t 0.95 (50) = −1.6759 . Como t resultó CME CME 10.226 10.226 + + n n 10 10
menor que -1.6759, rechazamos H0:µ12=µ22 y aceptamos H1:µ12<µ22 . La hipótesis HT sí se cumple. e) El gráfico muestra un posibilidad de interacción en la medida que las líneas poligonales no son paralelas; sin embargo de acuerdo a la significación, ya vimos que en verdad no hay interacción.
13
Problema 6 Este problema es parecido a los dos anteriores, así que sólo pondré sugerencias para las respuestas a) Tests of Between-Subjects Effects Dependent Variable: palabras Type III Sum Source of Squares df Mean Square Corrected Model 1945.490a 9 216.166 Intercept 13479.210 1 13479.210 edad 240.250 1 240.250 grupo 1514.940 4 378.735 edad * grupo 190.300 4 47.575 Error 722.300 90 8.026 Total 16147.000 100 Corrected Total 2667.790 99 a. R Squared = .729 (Adjusted R Squared = .702)
F 26.935 1679.536 29.936 47.191 5.928
Sig. .000 .000 .000 .000 .000
En el caso del factor A (Edad), la significación es Sig.=0.000 < 0.05 así que se rechaza H0:αi =0 ∀i; algo similar ocurre con el factor B (Grupo) y con la interacción de A y B. Como hay interacción, las diferencias entre los grupos de Edad cambian según el tipo de Tarea o método de memorización que hayan recibido. b)
Estimated Marginal Means of Número de palabras memorizadas Categoría de Edad
20
Joven Mayor
Estimated Marginal Means
17,5
15
12,5
10
7,5
Conteo
Rima
Adjetivo
Imagen
Intencional
Grupo (Nivel de procesamiento) La interacción es más fuerte cuando se trata del sistema de memorización “intencional”
14
Problema 7 Este problema fue resuelto en clase. Se trata de muestras correlacionadas y con datos ordinales (las calificaciones son subjetivas). Tenemos que contrastar H 0 : Me Inicio = Me Final vs H 1 : Me Inicio > Me Final usando la prueba No Paramétrica T de Wilcoxon. De SPSS obtenemos los cuadros: Descriptive Statistics Percentiles N
Mean
Std. Deviation
Minimum
Maximum
25th
50th (Median)
75th
Inicio
13
10.15
4.220
2
16
7.50
10.00
13.50
Final
13
7.77
4.265
2
15
3.50
8.00
11.00
Test Statisticsb
Ranks N Final - Inicio
Mean Rank
Sum of Ranks
Negative Ranks
7a
7.00
49.00
Positive Ranks
3b
2.00
6.00
Ties
3c
Total
13
a. Final < Inicio b. Final > Inicio c. Final = Inicio
Final - Inicio -2.196a
Z Asymp. Sig. (2-tailed)
.028
Exact Sig. (2-tailed)
.025
Exact Sig. (1-tailed)
.013
Point Probability
.001
a. Based on positive ranks. b. Wilcoxon Signed Ranks Test
La significación exacta a una cola es 0.013 que resulta menor que el nivel α = 0.05, así que podemos rechazar H 0 : Me Inicio = Me Final ; Falta verificar que se cumple nuestra H1; para ello acudimos a las estadísticas descriptivas donde encontramos, que en efecto, la mediana de Riesgo antes es 10 y mayor que la mediana de riesgo después que es 8, por lo que concluimos que sí hubo el éxito esperado con la intervención.
Problema 8 Otro problema resuelto en clase: Se trata de muestras independientes con datos cuantitativos pero sin distribución normal (dato del enunciado). Se espera que las pacientes bulímicas estén menos satisfechas con su cuerpo, así que debemos contrastar H 0 : Me Bu lim icas = Me No clínicas vs H 1 : Me Bu lim icas < Me No clínicas usando la prueba No Paramétrica U de Mann Whitnet. Los cuadros SPSS son:
La significación exacta a una cola es 0.001 <0.05, luego rechazamos H 0 : Me Bu lim icas = Me No clínicas . Falta ver que se cumpla nuestra hipótesis de trabajo
15
Para ver si se cumple H 1 : Me Bu lim icas < Me No clínicas podemos basarnos en el “puesto promedio” (Mean rank en SPSS) en satisfacción de las pacientes bulímicas: 10.29 que es menor que el correspondiente puesto promedio de un caso no clínico (Mean rank =19.40): se cumple nuestra H1 en la muestra, así que la aceptamos. Las estadísticas descriptivas, necesarias para comentar apropiadamente los resultados, se obtiene con el procedimiento Means:
Las medianas en Satisfacción cumplen: Me Bu lim icas = 11 < Me No clínicas = 14 , la hipótesis de trabajo se cumple. Problema 9 a) Se trata de tres muestras para comparar en una variable respuesta Y que no tiene distribución normal, así que tenemos que aplicar primero un ANOVA No Paramétrico (Test de Kruskal Wallis) y luego comparar por pares con la Prueba de Mann Whitney. Teóricamente debiera haber mayor reducción en el grupo 2 comparado con el grupo 3 y menor en el grupo 1 comparado con el grupo 3 también. La hipótesis de trabajo global es HTG: “Los programas de reducción logran bajar el peso de los participantes” y en este caso el contraste global es H0:Me1=Me2=Me3 vs H1: Al menos una mediana difiere del resto. De SPSS tenemos los cuadros:
Exact Sig. = 0.000 < 0.05 luego rechazamos H0:Me1=Me2=Me3. b)
16
El reporte obtenido con Means muestra que la condición 2 genera mayor pérdida de peso y condición 1 la segunda mayor pérdida, en cambio en el grupo control no hubo pérdida sino aumento en el peso. c) H0:Me2=Me3 vs es H1:Me2>Me3 La significación exacta es Exact Sig(1-tailed) = 0.01 < 0.05 ⇒ Rechazamos H0:Me2=Me3
De acuerdo a los “puestos promedio” en peso perdido el grupo de Dieta+Ejercicio está en el puesto 9.5, arriba del grupo control: Se cumple H1:Me2>Me3, algo que también se ve en el cuadro de estadísticas en b)
Comparando el grupo Sólo dieta con el grupo Control, contrastamos H0:Me1=Me3 vs es H1:Me1>Me3, se obtiene La significación exacta es Exact Sig(1-tailed) = 0.013 < 0.05 ⇒ Rechazamos H0:Me1=Me3
De acuerdo a los “puestos promedio” en peso perdido el grupo de Solo dieta está en el puesto 8.83, arriba del grupo control: Se cumple H1:Me1>Me3, como también se ve en el cuadro de estadísticas en b) Conclusión: Todas las hipótesis de trabajo se cumplen: Las dietas surte efecto significativo, siendo mejor la que combina dieta y ejercicio
17
Problema 10 Hay que aplicar primero un ANOVA No paramétrico de Kruskal Wallis (la prueba es “aún no normalizada”) y si éste resulta significativo (o sea si se rechaza H0) entonces se hace contrastes unilaterales de Mann Whitney (son grupos diferentes e independientes) entre Clase popular vs Clase acomodada, y luego entre Clase popular vs Clase media: Contraste de Kruskal Wallis para H0:Me1=Me2=Me3 vs H1: Al menos una mediana difiere del resto La significación asintótica* (para muestras grandes) es Asymp.Sig. 0.006< 0.05 ⇒ Rechazamos H0:Me1=Me2=Me3 *Mi PC se colgó por falta de memoria al hacer pruebas exactas!. Ojo con las pruebas exactas! De acuerdo a los “puestos promedio” sería en clase popular donde habría mayor predisposición.
Ustedes hagan los contrastes de Mann Whitney, mi PC quedó out. Problema 11 Aquí se trata de muestras correlacionadas y con datos ordinales (las calificaciones son subjetivas). Tenemos que contrastar H 0 : Me Antes = Me Después vs H 1 : Me Antes < Me Después usando la prueba No Paramétrica T de Wilcoxon. De SPSS obtenemos los cuadros:
La significación asintótica* a una cola es 0.002/2 = 0.001 < 0.05: Podemos rechazar H 0 : Me Antes = Me Después ; Verificando si se cumple H1: la mediana de Actitud antes es 33.5 y la mediana después es 41.0, por lo que concluimos que la intervención sí sensibilizó a los estudiantes. *mi PC se sigue colgando por falta de memoria…! 25 de Noviembre de 2009. ACG./SAMP.