Técnicas de análisis estadístico aplicadas a las ciencias de la actividad física y la salud Profesor: Manuel Pulido Martos Alumno: Juan Carlos Blanca Torres
1-4-2016 0
ÍNDICE PARTE 1 ........................................................................ página 2
PARTE 2 ........................................................................ página 17
PARTE 3 ........................................................................ página 25
1
Ejercicios para entregar por plataforma. PARTE 1 A continuación encontrarás una serie de ejercicios relacionados con las técnicas estadísticas explicadas en clase. En todos los casos debes indicar el tipo de análisis que llevas a cabo y justificar su empleo. Además, las respuestas deben estar basadas en los resultados de los análisis realizados. Cuando respondas, hazlo como si tu respuesta formase parte de un informe científico. Si necesitas incluir tablas o gráficos, apóyate en algún manual de estilo e indícalo (APA, Vancouver…)
Ingesta de nutrientes y fibra Se realiza un estudio para determinar el aporte calórico y de nutrientes al día en una muestra de 16 personas adultas. En el archivo nutrientes.sav encontrarás los datos recogidos: sexo de los participantes, consumo medio de calorías (kilocalorías) diario y consumo medio de proteínas (gramos) diario. Con la información de la tabla que aparece más adelante y que se corresponde con los consumos medios para población española durante diferentes años, trata de determinar lo siguiente:
2
Si la media del consumo calórico de la muestra de estudio es diferente de los valores poblacionales del año 2003. Estadísticas de muestra única
N Energía
Media 16
2746,0000
Desviación
Media de error
estándar
estándar
13,02306
3,25576
Prueba de muestra única Valor de prueba = 2767 95% de intervalo de confianza de la diferencia Diferencia de t Energía
-6,450
gl
Sig. (bilateral) 15
medias
,000
-21,00000
Inferior -27,9395
Superior -14,0605
La media del consumo calórico es inferior este año (media = 2746.0) que en el año 2003 (media = 2767.0). La diferencia entre los dos años fue de 21 kilocalorías (95% IC = -27.93-14.06). Una prueba t para muestras independientes indicó que las diferencias entre el consumo calórico de este año y del 2003 eran estadísticamente significativas (t = -6.450; gl = 15; p < .001).
3
Si la media del consumo de proteínas de la muestra de estudio es diferente de los valores poblacionales del año 2006. Estadísticas de muestra única
N Energía
Media 16
2746,0000
Desviación
Media de error
estándar
estándar
13,02306
3,25576
Prueba de muestra única Valor de prueba = 2761 95% de intervalo de confianza de la diferencia Diferencia de t Energía
-4,607
gl
medias
Sig. (bilateral) 15
,000
-15,00000
Inferior -21,9395
Superior -8,0605
La media del consumo de proteínas es superior este año (media = 94,03) que en el año 2006 (media =93,5). La diferencia entre los dos años fue de 0,53 g (95% IC = -,4532+1,5032). Una prueba t para muestras independientes indicó que las diferencias entre el consumo de proteínas de este año y del 2006 no eran estadísticamente significativas (t = -1,144; gl = 15; p>0,05).
4
Si las medias de los consumos calóricos y de proteínas de hombres y mujeres (por separado) de la muestra de estudio son diferentes de los valores poblacionales del año 2000. Estadísticas de muestra única Media de e rror estánda r
Desviación Sexo
N
Media
estándar
Hombre
Energía
8
2752,5000
4,47214
1,58114
Mujer
Energía
8
2739,5000
15,71169
5,55492
Prueba de muestra única Valor de prueba = 2730 95% de intervalo de confianza de la diferencia Diferencia de Sexo
t
gl
Sig. (bilateral)
medias
Inferior
Superior
Hombre
Energía
14,230
7
,000
22,50000
18,7612
26,2388
Mujer
Energía
1,710
7
,131
9,50000
-3,6353
22,6353
La media del consumo calórico en hombres es superior este año (media = 2752.0) que en el año 2000 (media = 2730.0). La diferencia entre los dos años fue de 22 kilocalorías (95% IC = 18.76+26.23). Una prueba t para muestras independientes indicó que las diferencias entre el consumo calórico en los hombres de este año y del 2000 eran estadísticamente significativas (t = -14.230; gl = 7; p < .001). La media del consumo calórico en mujeres es superior este año (media = 2739.0) que en el año 2000 (media = 2730.0). La diferencia entre los dos años fue de 9.5 kilocalorías (95% IC = -3.64+22.64). Una prueba t para muestras independientes indicó que las diferencias entre el consumo calórico en las mujeres de este año y del 2000 no eran estadísticamente significativas (t = 1.710; gl = 7; p > .05).
5
Clientes de gimnasio El dueño del gimnasio “Muscle” está convencido de que la situación económica de los últimos años le está ocasionando un grave perjuicio. Ha visto como su número de clientes ha disminuido considerablemente en los últimos 3 años. Preocupado por la situación y esperando que si hay una recuperación económica eso le llevará a un aumento de clientes, ha decidido contactar con otros gimnasios para conocer el número de bajas de clientes desde el año 2006. Concretamente les ha pedido que le envíen el número de bajas del período 2006-2011. Ha decidido comparar el número de bajas de lo que el considera la época de bonanza económica (2006-2008) con el número de bajas de la época de crisis (2009-2011). Con el archivo gimnasio.sav debes ayudar al dueño del gimnasio “Muscle” para tomar una decisión sobre si la situación económica realmente está afectando a la clientela de los gimnasios. Construye un gráfico que ayude a visualizar los resultados encontrados. Estadísticas de muestras emparejadas
Media Par 1
N
Desviación
Media de error
estándar
estándar
bajas_nocris
65,5000
18
23,05046
5,43304
bajas_cris
79,1667
18
8,67891
2,04564
Correlaciones de muestras emparejadas N Par 1
bajas_nocris & bajas_cris
Correlación 18
6
,141
Sig. ,576
Prueba de muestras emparejadas
Sig. (bilateral )
Diferencias emparejadas 95% de intervalo de confianza de la Desviació
Media de
n
error
estándar
estándar
13,666 23,45459
5,52830
Media Par bajas_nocris 1
bajas_cris
67
diferencia Inferior
Superior
25,33036
-2,00297
t
gl
2,472
17
,024
La media de bajas tramitadas en los gimnasios fue más alta durante el periodo de crisis (2009-2011). La diferencia entre los dos periodos fue de 13.67 (95% IC = 25.33 – 2.00). Una prueba t para muestras relacionadas indicó que las diferencias entre los dos periodos eran estadísticamente significativas (t = 2.47; gl = 17; p < .05).
7
El gráfico de cajas y bigotes anterior muestra que existe cierto grado de solapamiento (moderado) entre las dos barras de cada momento. Así pues, existen diferencias en las medias del número de bajas en los años de crisis y la de los años de no crisis.
Desarrollo de anorexia La anorexia nerviosa es un trastorno alimentario que lleva a que las personas pierdan más peso de lo que se considera saludable para su edad y estatura. Las personas con este trastorno pueden tener un miedo intenso a aumentar de peso, incluso cuando están con peso insuficiente. Es posible que hagan dietas o ejercicio en forma excesiva o que utilicen otros métodos para bajar de peso. No se conocen las causas exactas de la anorexia nerviosa. Entre los factores de riesgo que predisponen a padecer el trastorno, encontramos una preocupación excesiva con el peso y la figura, tener un trastorno de ansiedad en la niñez, tener problemas alimentarios durante la lactancia o la primera infancia, tener ciertas ideas culturales o sociales respecto de la salud y la belleza, tratar de ser perfeccionista o demasiado centrado en reglas… La anorexia generalmente comienza durante los años de adolescencia o a principios de la edad adulta y es más común en mujeres, aunque también se puede ver en hombres. El trastorno se observa principalmente en mujeres de raza blanca, de alto rendimiento académico y que tienen familia o personalidad orientada hacia el logro de metas. En un estudio en el que se pretendía analizar los factores de riesgo para la anorexia nerviosa se recogieron datos de una muestra de 80 mujeres jóvenes procedentes de diversos países. Se les pedía que completasen un cuestionario en el que se recogía información sobre los siguientes aspectos: diagnóstico de anorexia nerviosa (debían indicar si padecían anorexia o no), su origen (caucásico, asiático u otro), el tipo de escuela en el que se habían formado (pública o privada) y tipo de trabajo (a tiempo completo, a tiempo parcial o sin empleo).
8
En el archivo anorexia.sav se incluyen los datos de todas las variables. Debes determinar si existen diferencias en lo que se refiere al desarrollo de la anorexia teniendo en cuenta el origen de las participantes (caucásico vs. no caucásico) y el tipo de trabajo (con empleo vs. sin empleo).
Teniendo en cuenta el origen de las participantes (caucásico vs. no caucásico). Pruebas de chi-cuadrado Significación asintótica Valor
gl
(bilateral)
7,866a
2
,020
Razón de verosimilitud
8,078
2
,018
Asociación lineal por lineal
2,016
1
,156
Chi-cuadrado de Pearson
N de casos válidos
80
a. 2 casillas (33,3%) han esperado un recuento menor que 5. El recuento mínimo esperado es 2,85.
Al haber dos casillas con un recuento menor que 5 tenemos que utilizar la opción Exacta.
Resumen de procesamiento de casos Casos Válidos N origen * anorexia
Perdidos
Porcentaje 80
N
100,0%
Porcentaje 0
9
Total
0,0%
N
Porcentaje 80
100,0%
Tabla cruzada origen*anorexia anorexia sí origen
asiático
Recuento
caucásico
4
2
6
Recuento esperado
2,9
3,2
6,0
Recuento
22
36
58
27,6
30,5
58,0
Recuento
12
4
16
Recuento esperado
7,6
8,4
16,0
Recuento
38
42
80
38,0
42,0
80,0
Recuento esperado otro
Total
Total
no
Recuento esperado
Pruebas de chi-cuadrado Significación Valor
gl
Significación
exa cta
asintótica
exacta
(bilateral)
(bilateral)
7,866a
2
,020
,015
Razón de verosimilitud
8,078
2
,018
,037
Prueba exacta de Fisher
7,765
Chi-cuadrado de Pearson
Asociación lineal por lineal N de casos válidos
2,016b
Significación (unila teral)
Proba bilidad en el pun to
,017 1
,156
,191
,114
80
a. 2 casillas (33,3%) han esperado un recuento menor que 5. El recuento mínimo esperado es 2,85. b. El estadístico estandarizado es -1,420.
10
,065
La relación entre el hecho de padecer anorexia y el origen resultó estadísticamente significativa: χ2 (2, N = 80) = 7.87, p < .05.
11
Teniendo en cuenta el tipo de trabajo. Resumen de procesamiento de casos Casos Válidos N empleo * anorexia
Perdidos
Porcentaje 80
N
100,0%
Total
Porcentaje 0
N
0,0%
Porcentaje 80
100,0%
Tabla cruzada empleo*anorexia anorexia sí empleo
tiempo completo
Recuento Recuento esperado
sin empleo
Recuento Recuento esperado
tiempo parcial
Recuento Recuento esperado
Total
Recuento Recuento esperado
12
Total
no 14
17
31
14,7
16,3
31,0
13
12
25
11,9
13,1
25,0
11
13
24
11,4
12,6
24,0
38
42
80
38,0
42,0
80,0
Pruebas de chi-cuadrado Significación asintótica Valor
(bilateral)
gl
,298a
2
,862
Razón de verosimilitud
,298
2
,862
Asociación lineal por lineal
,008
1
,930
Chi-cuadrado de Pearson
N de casos válidos
80
a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mínimo esperado es 11,40.
La relación entre el hecho de padecer anorexia y el tipo de empleo no resultó estadísticamente significativa: χ2 (2, N = 80) = .298, p > .05.
13
Edad y actividad física Siendo conscientes de los beneficios para la salud de la realización de actividad física, se recogieron datos de una muestra de 20 personas adultas para comprobar la posible relación entre la edad y los niveles de realización de actividad física. Además de la edad, se aplicaba una medida de auto-informe que permitía conocer los niveles de realización de actividad en una escala de 0-100 (0 = ausencia de realización de AF; 100 = elevadísima frecuencia de realización de AF). También se les pedía que informasen sobre el número de horas diarias que empleaban en tareas que requerían de su tiempo y dedicación (actividad laboral, quehaceres domésticos…) El archivo con los resultados se denomina edad_af.sav. Tu tarea consiste en obtener el diagrama de dispersión de las variables edad y actividad física y hacer una breve descripción del gráfico. Igualmente, debes obtener un diagrama de dispersión con las variables actividad física y tiempo de ocupación y describir el resultado obtenido. Cuantifica la relación entre edad y actividad física e indicar si la relación es significativa. Para terminar, indica si esa relación se mantiene cuando se tiene en cuenta el tiempo de ocupación diaria de los participantes en el estudio. Tienes que justificar tu respuesta.
14
El diagrama de dispersión anterior muestra que en edades tempranas se realiza mayores niveles de actividad física que en edades más avanzadas.
El diagrama de dispersión anterior expresa que cuanto más tiempo libre tienen los participantes también realizan más actividad física. Mientras que cuanto más tiempo ocupacional tienen parecen realizar menos horas de actividad física.
15
Correlaciones edad edad
Correlación de Pearson
af -,766**
1
,000
Sig. (unilateral) N af
Correlación de Pearson
20
20
-,766**
1
,000
Sig. (unilateral)
20
N
20
**. La correlación es significativa en el nivel 0,01 (unilateral).
Existe una correlación negativa entre la edad y los niveles de actividad física (r = -.766, N = 20, p < .05). Es una correlación fuerte: 58.6% de la variación es explicada. Correlaciones Variables de control tiempo_ocu
edad
edad Correlación Significación (bilateral) gl
af
Correlación Significación (bilateral) gl
af
1,000
-,199
.
,415
0
17
-,199
1,000
,415
.
17
0
Cuando se controla el tiempo ocupacional la correlación entre la edad y el nivel de actividad física no es significativa (r = -.199, gl=17, p > .05). En el caso de no controlar esta variable el resultado sí sería significativo (r = -.766, N = 20, p < .05).
16
Ejercicios para entregar por plataforma. PARTE 2 A continuación encontrarás una serie de ejercicios relacionados con las técnicas estadísticas explicadas en clase. En todos los casos debes indicar el tipo de análisis que llevas a cabo y justificar su empleo. Además, las respuestas deben estar basadas en los resultados de los análisis realizados. Cuando respondas, hazlo como si tu respuesta formase parte de un informe científico. Si necesitas incluir tablas o gráficos, apóyate en algún manual de estilo e indícalo (APA, Vancouver…)
Emociones, conflicto trabajo-familia y actividad física durante el tiempo libre Por organizaciones saludables entendemos que son aquellas caracterizadas por invertir esfuerzos de colaboración, sistemáticos e intencionales para maximizar el bienestar de los empleados y la productividad, mediante la generación de puestos bien diseñados y significativos, de ambientes sociales de apoyo, y finalmente mediante las oportunidades equitativas y accesibles para el desarrollo de la carrera y del balance trabajo-vida privada. Aspectos como la promoción de conductas saludables, como la realización de actividad física, o los niveles de conflicto trabajo-familia son por tanto variables de interés en el seno de las organizaciones saludables. Teniendo en cuenta, además, que la vida laboral no deja de ser una vida emocional y que como sostienen muchos autores existe una influencia recíproca entre trabajo y emociones, sería interesante conocer el papel que juega una habilidad como la regulación de las emociones en la relación con variables dentro de las organizaciones saludables. Con esta intención, se recogieron datos en una muestra de 225 trabajadores de diferentes empresas, sobre su habilidad para la regulación emocional percibida (reparación emocional), sobre la influencia negativa de los aspectos laborales en el entorno familiar (conflicto trabajo-familia) y sobre los niveles de realización de actividad física (andar, moderada y vigorosa) durante el tiempo libre. Los datos recogidos se encuentran en el archivo ipaq.sav.
17
Lo que se te pide es que determines si, en el grupo de trabajadores estudiado, los niveles de actividad física total (andar + moderada + vigorosa), el conflicto trabajo-familia y la capacidad para reparar emociones, contribuyen a explicar la variación en los síntomas físicos relacionados con la salud mental. Deberás suponer que los niveles de actividad física total y el conflicto trabajo-familia ya explican un porcentaje de la varianza de los síntomas físicos. Informarás sobre los resultados encontrados, incluyendo el porcentaje de varianza adicional de los síntomas físicos que llega a explicar la reparación emocional, más allá de lo explicado por los niveles de AF total y el conflicto trabajo-familia. Informarás también sobre la posible multicolinealidad entre las variables predictoras del modelo. Estadísticos descriptivos Desviación Media sintomas
N
3,97
1,910
225
28,28
6,136
225
,76
,759
225
1116,16
2134,332
225
reparacion conftrabfam afvig
estándar
Correlaciones sintomas Correlación de Pearson
conftrabfam
afvig
sintomas
1,000
-,187
,297
-,278
reparacion
-,187
1,000
,003
,119
conftrabfam
,297
,003
1,000
-,180
-,278
,119
-,180
1,000
.
,002
,000
,000
reparacion
,002
.
,484
,038
conftrabfam
,000
,484
.
,003
afvig
,000
,038
,003
.
afvig Sig. (unilateral)
reparacion
sintomas
18
N
sintomas
225
225
225
225
reparacion
225
225
225
225
conftrabfam
225
225
225
225
afvig
225
225
225
225
Variables entradas/eliminadasa
Modelo 1
Variables
Variables
entradas
eliminadas
Método
afvig, reparacion,
. Entrar
conftrabfamb a. Variable dependiente: síntomas b. Todas las variables solicitadas introducidas.
Resumen del modelo
Modelo 1
R
R cuadrado
,408a
,166
R cuadrado
Error estándar
ajustado
de la estimación ,155
1,756
a. Predictores: (Constante), afvig, reparacion, conftrabfam
ANOVAa Suma de Modelo 1
cuadrados
Media gl
cuadrática
Regresión
135,697
3
45,232
Residuo
681,085
221
3,082
Total
816,782
224
a. Variable dependiente: síntomas
19
F 14,677
Sig. ,000b
b. Predictores: (Constante), afvig, reparacion, conftrabfam
Coeficientesa Coeficientes Coeficientes no
estandarizad
Estadísticas de
estandarizados
os
colinealidad
Error Modelo 1
B
estándar
(Constante)
5,116
,565
reparacion
-,051
,019
,652
,000
conftrabfa m afvig
Beta
T
Sig.
Tolerancia
VIF
9,050
,000
-,163
-2,628
,009
,985
1,015
,157
,259
4,148
,000
,967
1,034
,000
-,212
-3,368
,001
,953
1,049
a. Variable dependiente: síntomas
Al usar el método simultáneo, resultó un modelo significativo: F (3,221) = 14.677, p< .001. Dicho modelo explicó el 15.5% de la varianza (R2 corregida = .155). En la siguiente tabla se incluye la información sobre las variables predictoras introducidas en el modelo. Coeficientes de regresión estandarizados y no estandarizados para las variables introducidas en el modelo.
Tabla 1. Coeficientes de regresión estandarizados y no estandarizados para las variables introducidas en el modelo
Modelo
B
Reparación emocional
β
E.E. -,051
,019
-,163*
Conflicto trabajo-familia
,652
,157
,259**
Actividad física vigorosa
,000
,000
-,212*
*p < .01, **p < .0005
20
Diagnósticos de colinealidada Proporciones de varianza Índice de Autovalor
condición
Modelo
Dimensión
(Constante)
1
1
2,845
1,000
,00
,01
,04
,03
2
,808
1,876
,00
,00
,13
,71
3
,325
2,959
,02
,02
,82
,25
4
,022
11,281
,97
,97
,01
,00
reparacion
conftrabfam
afvig
a. Variable dependiente: síntomas
Parece existir una colinealidad entre los síntomas y la reparación, debido a que son las variables con proporciones de varianza por encima del 90%.
21
Recaída de lesiones por práctica de deporte En el archivo recaida.sav encontrarás los datos recogidos en un estudio que pretendía identificar algunas de las variables que predicen las recaídas de lesiones en una muestra de 221 adultos lesionados por diferentes prácticas deportivas. En el archivo, la variable “edad” registra la edad del lesionado en años y “prerecaidas” el número de lesiones previas. La variable “recaida” es una variable categórica que registra si el lesionado volvía a lesionarse después de recuperarse de su última lesión. El valor 1 indica recaída, mientras que el 0 indica que el lesionado no volvía a recaer. Además se aplicaba un cuestionario con dos escalas tipo Likert (0-12). La escala cuyos datos se recogen en la variable “praclesivas” se refiere a la puesta en práctica, por parte del deportista, de acciones que no son recomendadas cuando se práctica deporte por el riesgo de causar lesión. Un valor de 0 indicaba que el deportista nunca llevaba a cabo ese tipo de acciones y un valor de 12 indicaba que desarrollaba esas acciones de forma habitual. La escala identificada con la variable “atencpreven” se refiere a la atención que prestan los deportistas a la prevención de lesiones (importancia que dan a los chequeos médicos, formación sobre prevención, consulta de documentación…). Un valor de 0 indica una ausencia de atención y un valor de 12 implica una máxima atención. Indica si las variables “práctica de acciones lesivas” y “atención a la prevención de lesiones” explican la recaída de lesiones. Incluye las tablas que sean necesarias para entender los resultados. Se llevó a cabo un análisis de regresión logística con la recaída de lesiones como variable dependiente y la práctica de acciones lesivas y atención a la prevención de lesiones como variables predictoras. Se analizaron un total de 221 casos y el modelo completo predecía de forma significativa la recaída de lesiones (chicuadrado omnibus = 19,88, gl = 2, p < .05). El modelo explicaba entre un 8,6% y un 12.3% de la varianza de la recaída, con el 94.3% de los deportistas que no sufrían recaídas exitosamente predicho. De otro lado, solo el 14.1% de las predicciones para la condición de recaídas fueron acertadas. En general, el 71.0% de las predicciones fueron correctas. La Tabla praclesivas-atencpreven muestra los coeficientes, el estadístico de Wald, los grados de libertad asociados y los valores de probabilidad para cada una de las variables predictoras. Se pudo comprobar que solo las acciones relacionadas con las lesiones predecían de forma fiable las recaídas de lesiones. El valor de los coeficientes revela que cada unidad incrementada en las acciones
22
relacionadas con lesiones está asociada con un incremento de las probabilidades de recaída por un factor de 1.18 (95% IC 1.03-1.35). Resumen de procesamiento de casos Casos sin ponderara
N
Casos seleccionados
Incluido en el análisis
Porcentaje 221
100,0
0
,0
221
100,0
0
,0
221
100,0
Casos perdidos Total Casos no seleccionados Total
a. Si la ponderación está en vigor, consulte la tabla de clasificación para el número total de casos.
Pruebas ómnibus de coeficientes de modelo Chi-cuadrado Paso 1
gl
Sig.
Paso
19,877
2
,000
Bloque
19,877
2
,000
Modelo
19,877
2
,000
Resumen del modelo
Paso
Logaritmo de la
R cuadrado de
R cuadrado de
verosimilitud -2
Cox y Snell
Nagelkerke
1
246,113a
,086
,123
a. La estimación ha terminado en el número de iteración 4 porque las estimaciones de parámetro han cambiado en menos de ,001.
23
Tabla de clasificacióna Pronosticado recaída Porcentaje no
Observado Paso 1
recaída
no si
si
correcto
148
9
94,3
55
9
14,1 71,0
Porcentaje global a. El valor de corte es ,500
Variables en la ecuación 95% C.I. para EXP(B) Error B Paso 1a
praclesivas atencpreve n Constante
estándar
Wald
gl
Sig.
Exp(B)
Inferior
Superior
,159
,060
7,032
1
,008
1,173
1,042
1,319
,097
,065
2,244
1
,134
1,102
,970
1,252
-2,470
,427
33,523
1
,000
,085
a. Variables especificadas en el paso 1: praclesivas, atencpreven.
24
Ejercicios para entregar por plataforma. PARTE 3 A continuación encontrarás una serie de ejercicios relacionados con las técnicas estadísticas explicadas en clase. En todos los casos debes indicar el tipo de análisis que llevas a cabo y justificar su empleo. Además, las respuestas deben estar basadas en los resultados de los análisis realizados. Cuando respondas, hazlo como si tu respuesta formase parte de un informe científico. Si necesitas incluir tablas o gráficos, apóyate en algún manual de estilo e indícalo (APA, Vancouver…)
La estructura multidimensional del auto-concepto en adolescentes de 12-13 años, evaluado mediante el Self-Description Questionnaire II (Marsh, 1992) En un estudio realizado con 265 adolescentes de séptimo grado en EEUU, se aplicó un instrumento para evaluar el auto-concepto. La estructura teórica del auto-concepto arroja cuatro factores diferenciados: auto-concepto general (General SC), auto-concepto académico (Academic SC), auto-concepto para el inglés (English SC) y auto-concepto para las matemáticas (Math SC). Los datos recogidos se encuentran en el archivo self_concept.ess. Lo que se te pide es que analices con EQS la estructura factorial del autoconcepto en adolescentes. En primer lugar comprueba la hipótesis de normalidad multivariante y después comprueba el ajuste de un modelo con cuatro factores oblicuos (relacionados) (General SC, Academic SC, English SC y Math SC). Las variables observadas cargan sobre los factores con el siguiente patrón: General SC: SDQ2N01, SDQ2N13, SDQ2N25, SDQ2N37 Academic SC: SDQ2N04, SDQ2N16, SDQ2N28, SDQ2N40 English SC: SDQ2N10, SDQ2N22, SDQ2N34, SDQ2N46 Math SC: SDQ2N07, SDQ2N19, SDQ2N31, SDQ2N43
25
SDQ2N01
E25
SDQ2N13
E26
SDQ2N25
E27
SDQ2N37
E28
SDQ2N04
E29
SDQ2N16
E30
SDQ2N28
E31
SDQ2N40
E32
SDQ2N10
E33
SDQ2N22
E34
SDQ2N34
E35
SDQ2N46
E36
SDQ2N07
E37
General
Academico
Inglés
Mates
SDQ2N19
E38
SDQ2N31 SDQ2N43
E4309
El modelo no tiene ningún problema asociado a la identificación.
26
UNIVARIATE STATISTICS ---------------------
VARIABLE SDQ2N04
SDQ2N01
SDQ2N13
SDQ2N25
SDQ2N37
V25
V26
V27
MEAN 4.5208
4.4075
5.0038
5.0981
4.8264
SKEWNESS (G1) .6969
-.6669
-1.2792
-1.6174
-1.1139
-
KURTOSIS (G2) .3831
-.3399
.5618
2.2172
1.0580
-
STANDARD DEV. 1.4009
1.3484
1.3582
1.2270
1.1448
VARIABLE SDQ2N22
MEAN 5.3774
SDQ2N16
SDQ2N28
SDQ2N40
V30
V31
V32
4.6491
4.6906
4.9774
27
V28
V29
SDQ2N10 V33
4.6226
V34
SKEWNESS (G1) 1.9811
-.8857
-1.1636
-1.4999
-.8971
KURTOSIS (G2) 3.6907
.2561
.8334
1.5299
.4605
STANDARD DEV. 1.0911
1.2407
1.3323
1.3594
1.1518
VARIABLE SDQ2N31
SDQ2N34
SDQ2N46
SDQ2N07
SDQ2N19
V35
V36
V37
MEAN 4.7396
3.8906
5.2679
4.3208
4.5434
SKEWNESS (G1) 1.2169
-.2529
-1.9158
-.6471
-.9925
KURTOSIS (G2) .3823
-1.2894
2.7409
-.9754
-.3680
STANDARD DEV. 1.5704
1.7032
1.2968
1.7814
1.6942
VARIABLE
SDQ2N43 V40
MEAN
4.9774
SKEWNESS (G1)
-1.4930
KURTOSIS (G2)
1.2910
STANDARD DEV.
1.4006 28
-
V38
V39
-
MULTIVARIATE KURTOSIS ---------------------
MARDIA'S COEFFICIENT (G2,P) =
104.7880
NORMALIZED ESTIMATE =
35.5380
GOODNESS OF FIT SUMMARY FOR METHOD = ROBUST
ROBUST INDEPENDENCE MODEL CHI-SQUARE = OF FREEDOM
1158.861 ON
120 DEGREES
INDEPENDENCE AIC =
918.86114
INDEPENDENCE CAIC =
369.29356
MODEL AIC =
-75.37003
MODEL CAIC =
-524.18355
SATORRA-BENTLER SCALED CHI-SQUARE = OF FREEDOM
120.6300 ON
98 DEGREES
PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS
RESIDUAL-BASED TEST STATISTIC
.06018
=
PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS
YUAN-BENTLER RESIDUAL-BASED TEST STATISTIC
YUAN-BENTLER RESIDUAL-BASED F-STATISTIC DEGREES OF FREEDOM
=
=
PROBABILITY VALUE FOR THE F-STATISTIC IS
----------FIT
BENTLER-BONETT
NON-NORMED
FIT
INDEX INDEX
COMPARATIVE FIT INDEX (CFI)
= 29
= =
.03376
167 .00801
FIT INDICES
NORMED
125.101
1.530 98,
BENTLER-BONETT
.00000
=
PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS
236.969
.896 .973 .978
BOLLEN
(IFI) FIT INDEX
=
.979
MCDONALD (MFI) FIT INDEX
=
.958
ROOT MEAN-SQUARE ERROR OF APPROXIMATION (RMSEA) 90% CONFIDENCE INTERVAL OF RMSEA
(
.000,
=
.030 .046)
MEASUREMENT EQUATIONS WITH STANDARD ERRORS AND TEST STATISTICS STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @. (ROBUST STATISTICS IN PARENTHESES)
SDQ2N01 =V25 =
1.000 F1
+ 1.000 E25
SDQ2N13 =V26 =
1.084*F1
+ 1.000 E26
.154 7.027@ (
.168)
(
6.460@
SDQ2N25 =V27 =
.851*F1
+ 1.000 E27
.132 6.437@ (
.147)
(
5.789@
SDQ2N37 =V28 =
.935*F1
+ 1.000 E28
.131 7.117@
SDQ2N04 =V29 =
(
.152)
(
6.136@
1.000 F2
+ 1.000 E29
30
SDQ2N16 =V30 =
1.278*F2
+ 1.000 E30
.150 8.507@ (
.169)
(
7.564@
SDQ2N28 =V31 =
1.247*F2
+ 1.000 E31
.154 8.083@ (
.181)
(
6.885@
SDQ2N40 =V32 =
1.259*F2
+ 1.000 E32
.157 8.037@ (
.199)
(
6.313@
SDQ2N10 =V33 =
1.000 F3
+ 1.000 E33
SDQ2N22 =V34 =
.889*F3
+ 1.000 E34
.103 8.643@
SDQ2N34 =V35 =
(
.098)
(
9.067@
.670*F3
+ 1.000 E35
.148 4.528@
31
(
.162)
(
4.131@
SDQ2N46 =V36 =
.843*F3
+ 1.000 E36
.117 7.212@ (
.150)
(
5.626@
No se presenta ningún problema, ningún valor es negativo y todos son significativos.
VARIANCES OF INDEPENDENT VARIABLES ---------------------------------STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @.
V
F
---
--I F1
-
F1
.615*I
I
.138 I
I
4.452@I
I
(
.144)I
I
(
4.274@I
I
I
I F2
-
F2
.563*I
I
.127 I
I
4.446@I
I
(
.140)I
I
(
4.028@I
I
I
I F3 I
-
F3
.671*I .117 I
32
I
5.739@I
I
(
.123)I
I
(
5.457@I
I
I
I F4
-
F4
2.316*I
I
.274 I
I
8.443@I
I
(
.219)I
I
( 10.553@I
I
I
No se presenta ningún problema, ningún valor es negativo.
VARIANCES OF INDEPENDENT VARIABLES ---------------------------------STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @.
E
D
---
---
E25 -SDQ2N01
1.203*I
I
.126 I
I
9.524@I
I
(
.142)I
I
(
8.479@I
I
I
I
1.123*I
I
.125 I
I
9.003@I
I
(
.161)I
I
(
6.953@I
I
I
I
E26 -SDQ2N13
33
E27 -SDQ2N25
1.061*I
I
.107 I
I
9.882@I
I
(
.136)I
I
(
7.825@I
I
I
I
.773*I
I
.088 I
I
8.797@I
I
(
.108)I
I
(
7.142@I
I
I
I
1.399*I
I
.129 I
I
10.879@I
I
(
.144)I
I
(
9.709@I
I
I
I
.618*I
I
.069 I
I
9.005@I
I
(
.076)I
I
(
8.177@I
I
I
I
.900*I
I
.090 I
I
9.943@I
I
(
.142)I
I
(
6.355@I
I
I
I
.955*I
I
.095 I
I
10.009@I
I
E28 -SDQ2N37
E29 -SDQ2N04
E30 -SDQ2N16
E31 -SDQ2N28
E32 -SDQ2N40
34
(
.165)I
I
(
5.799@I
I
I
I
.656*I
I
.083 I
I
7.926@I
I
(
.108)I
I
(
6.061@I
I
I
I
.660*I
I
.076 I
I
8.718@I
I
(
.121)I
I
(
5.448@I
I
I
I
2.600*I
I
.234 I
I
11.108@I
I
.171)I
I
( 15.181@I
I
I
I
1.205*I
I
.119 I
I
10.164@I
I
(
.173)I
I
(
6.985@I
I
I
I
E33 -SDQ2N10
E34 -SDQ2N22
E35 -SDQ2N34
(
E36 -SDQ2N46
COVARIANCES AMONG INDEPENDENT VARIABLES --------------------------------------STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @.
V
F 35
---
--I F2
-
F2
.416*I
I F1
-
F1
.079 I
I
5.282@I
I
(
.084)I
I
(
4.959@I
I
I
I F3
-
F3
.356*I
I F1
-
F1
.072 I
I
4.937@I
I
(
.070)I
I
(
5.083@I
I
I
I F4
-
F4
.637*I
I F1
-
F1
.119 I
I
5.375@I
I
(
.131)I
I
(
4.869@I
I
I
I F3
-
F3
.466*I
I F2
-
F2
.079 I
I
5.911@I
I
(
.094)I
I
(
4.970@I
I
I
I F4
-
F4
.876*I
I F2
-
F2
.135 I
I
6.508@I
I
(
.141)I
I
(
6.213@I
I
I
I F4
-
F4
.332*I
I F3
-
F3
.101 I
36
I
3.302@I
I
(
.121)I
I
(
2.749@I
I
I
CORRELATIONS AMONG INDEPENDENT VARIABLES ---------------------------------------
V
F
---
--I F2
-
F2
.707*I
I F1
-
F1
I
I
I
I F3
-
F3
.555*I
I F1
-
F1
I
I
I
I F4
-
F4
.534*I
I F1
-
F1
I
I
I
I F3
-
F3
.758*I
I F2
-
F2
I
I
I
I F4
-
F4
.767*I
I F2
-
F2
I
I
I
I F4
-
F4
.266*I
I F3
-
F3
I
I
I
STANDARDIZED SOLUTION:
R-SQUARED
37
SDQ2N01 =V25 =
.581 F1
+ .814 E25
.338
SDQ2N13 =V26 =
.626*F1
+ .780 E26
.391
SDQ2N25 =V27 =
.544*F1
+ .839 E27
.296
SDQ2N37 =V28 =
.640*F1
+ .768 E28
.410
SDQ2N04 =V29 =
.536 F2
+ .844 E29
.287
SDQ2N16 =V30 =
.774*F2
+ .634 E30
.598
SDQ2N28 =V31 =
.702*F2
+ .712 E31
.493
SDQ2N40 =V32 =
.695*F2
+ .719 E32
.483
SDQ2N10 =V33 =
.711 F3
+ .703 E33
.506
SDQ2N22 =V34 =
.668*F3
+ .745 E34
.446
SDQ2N34 =V35 =
.322*F3
+ .947 E35
.104
SDQ2N46 =V36 =
.532*F3
+ .847 E36
.283
SDQ2N07 =V37 =
.854 F4
+ .520 E37
.730
SDQ2N19 =V38 =
.756*F4
+ .655 E38
.571
SDQ2N31 =V39 =
.923*F4
+ .385 E39
.851
SDQ2N43 =V40 =
.712*F4
+ .702 E40
.507
Aparecen las cargas factoriales (>.70). Nivel de significación extraído de las ecuaciones de medida. También aparecen los valores de R2 que muestran la fiabilidad individual de cada ítem (>.50).
38
Clima del aula y burnout En un estudio realizado con 716 profesores de distintos niveles educativos, se pretendía comprobar un modelo que explicase los efectos de una variable de tipo psicosocial (como el clima del aula) sobre dos dimensiones del burnout (cansancio emocional y realización personal). Concretamente, se planteaba que el clima del aula contribuiría de forma positiva a mejorar los niveles de realización personal, pero a través de su influencia sobre el cansancio emocional. El clima del aula favorable ayudaría a disminuir los niveles de cansancio emocional. Lo que se te pide es que analices con EQS el modelo teórico planteado y compruebes su ajuste a los datos. Los datos los encontrarás en el archivo burnout.ess. El modelo de medida que tendrás en cuenta para plantear las relaciones entre variables será el siguiente: Clima del aula: V7, V8, V9, V10 Cansancio emocional: V25, V26, V27 Realización personal: V30, V31, V32
39
D2
...
/G =8n ·G ... G ... c:J
E27
...
E8
...
E9
/G ,B ·G ... G ... 40
E26
E7
G ...
E25
El ü
E30
E31
E32
TOTAL NUMBER OF LINES PER SET IS:
26
(SUMMARY SECTION PLUS INFORMATION SECTION(S))
CODEBOOK FILE HAS BEEN WRITTEN ON FILE EQSOUT.CBK 30-Mar-16 TITLE:
PAGE :
6
EQS
Licensee:
Model built by EQS 6 for Windows
MAXIMUM LIKELIHOOD SOLUTION (NORMAL DISTRIBUTION THEORY)
PARAMETER ESTIMATES APPEAR IN ORDER, NO SPECIAL PROBLEMS WERE ENCOUNTERED DURING OPTIMIZATION.
UNIVARIATE STATISTICS ---------------------
VARIABLE
V7
V8
V9
V10
MEAN 3.8405
2.9669
2.7088
2.8863
3.0256
SKEWNESS (G1) .0570
-.3625
-.3965
-.1934
-.5057
KURTOSIS (G2) .6180
.2077
-.2753
.4423
-.2101
STANDARD DEV. 1.3110
.5303
.6363
.4932
.7125
VARIABLE
V26
V27
41
V30
V31
V25
-
V32
MEAN 5.8227
3.5354
3.1362
5.7729
5.8552
SKEWNESS (G1) .7659
.3811
.6495
-.8599
-.8903
KURTOSIS (G2) .1308
-.3170
-.1712
.6924
.4864
STANDARD DEV. .9559
1.2536
1.3205
.8983
.9451
-
MULTIVARIATE KURTOSIS ---------------------
MARDIA'S COEFFICIENT (G2,P) =
12.9699
NORMALIZED ESTIMATE =
11.2010
Los valores de kurtosis son normales ya que son todos inferiores a 1.96. En el encabezado multivariante Kurtosis observamos dos variantes del coeficiente Mardia. De mayor interés es la opción normalizada (<5).
GOODNESS OF FIT SUMMARY FOR METHOD = ROBUST
ROBUST INDEPENDENCE MODEL CHI-SQUARE = OF FREEDOM
2787.503 ON
45 DEGREES
INDEPENDENCE AIC =
2697.50332
INDEPENDENCE CAIC =
2446.68771
MODEL AIC =
135.14818
MODEL CAIC =
-48.78326
SATORRA-BENTLER SCALED CHI-SQUARE = OF FREEDOM
201.1482 ON
33 DEGREES
PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS
RESIDUAL-BASED TEST STATISTIC
.00000
=
42
177.239
PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS
YUAN-BENTLER RESIDUAL-BASED TEST STATISTIC
.00000
=
142.070
PROBABILITY VALUE FOR THE CHI-SQUARE STATISTIC IS
YUAN-BENTLER RESIDUAL-BASED F-STATISTIC DEGREES OF FREEDOM
=
=
.00000
5.130 33,
PROBABILITY VALUE FOR THE F-STATISTIC IS
683 .00000
FIT INDICES ----------BENTLER-BONETT
NORMED FIT INDEX =
.928
BENTLER-BONETT NON-NORMED FIT INDEX =
.916
COMPARATIVE FIT INDEX (CFI)
=
.939
BOLLEN
(IFI) FIT INDEX
=
.939
MCDONALD (MFI) FIT INDEX
=
.889
ROOT MEAN-SQUARE ERROR OF APPROXIMATION (RMSEA) 90% CONFIDENCE INTERVAL OF RMSEA
(
.073,
=
.084 .096)
MEASUREMENT EQUATIONS WITH STANDARD ERRORS AND TEST STATISTICS STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @. (ROBUST STATISTICS IN PARENTHESES)
V7 =V7 =
V8
1.000 F1
=V8
=
+ 1.000 E7
1.588*F1
+ 1.000 E8
.115 13.757@ (
.123)
( 12.932@
V9
=V9
=
.974*F1
+ 1.000 E9 43
.078 12.466@ (
.083)
( 11.706@
V10
=V10 =
1.367*F1
+ 1.000 E10
.112 12.232@ (
.119)
( 11.485@
V25
=V25 =
1.000 F2
+ 1.000 E25
V26
=V26 =
1.051*F2
+ 1.000 E26
.031 33.674@ (
.028)
( 37.472@
V27
=V27 =
.992*F2
+ 1.000 E27
.034 29.583@ (
.034)
( 29.577@
V30
=V30 =
1.000 F3
+ 1.000 E30
V31
=V31 =
1.142*F3
+ 1.000 E31 44
.063 18.156@ (
.062)
( 18.317@
V32
=V32 =
1.063*F3
+ 1.000 E32
.060 17.730@ (
.068) ( 15.535@
No se presenta ningún problema, ningún valor es negativo y todos son significativos.
VARIANCES OF INDEPENDENT VARIABLES ---------------------------------STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @.
V
F
---
--I F1
-
F1
.101*I
I
.013 I
I
7.816@I
I
(
.014)I
I
(
7.292@I
I
I
I F3
-
F3
.456*I
I
.043 I
I
10.598@I
I
(
I
( 10.298@I
I
I
45
.044)I
No se presenta ningún problema ya que ningún valor es negativo y todos son significativos.
VARIANCES OF INDEPENDENT VARIABLES ---------------------------------STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @.
E7
-
E
D
---
---
V7
.180*I D2
(
E8
-
-
.011 I
.082 I
15.915@I
13.725@I
.011)I
(
.079)I
I
I
.150*I
I
.015 I
I
9.975@I
I
.015)I
I
( 10.110@I
I
I
I
.147*I
I
.010 I
I
15.402@I
I
.011)I
I
( 13.990@I
I
I
I
.318*I
I
.020 I
I
V8
V9
V10
1.121*I
( 14.219@I
(
E10 -
F2
( 16.393@I
(
E9
-
46
15.732@I
I
.021)I
I
( 15.151@I
I
I
I
.442*I
I
.032 I
I
13.781@I
I
.036)I
I
( 12.431@I
I
I
I
.162*I
I
.026 I
I
6.344@I
I
(
.026)I
I
(
6.222@I
I
I
I
.488*I
I
.034 I
I
14.489@I
I
.039)I
I
( 12.527@I
I
I
I
.351*I
I
.027 I
I
13.111@I
I
(
.039)I
I
(
8.920@I
I
I
I
.299*I
I
.029 I
I
(
E25 -
V25
(
E26 -
E27 -
V26
V27
(
E30 -
E31 -
V30
V31
47
E32 -
10.129@I
I
(
.039)I
I
(
7.692@I
I
I
I
.398*I
I
.030 I
I
13.129@I
I
.036)I
I
( 10.915@I
I
I
I
V32
(
No se presenta ningún problema ya que ningún valor es negativo y todos son significativos.
COVARIANCES AMONG INDEPENDENT VARIABLES --------------------------------------STATISTICS SIGNIFICANT AT THE 5% LEVEL ARE MARKED WITH @.
V
F
---
--I F3
-
F3
.079*I
I F1
-
F1
.012 I
I
6.814@I
I
(
.013)I
I
(
6.334@I
I
I
CORRELATIONS AMONG INDEPENDENT VARIABLES 48
---------------------------------------
V
F
---
--I F3
-
F3
.370*I
I F1
-
F1
I
I
I
STANDARDIZED SOLUTION: SQUARED
R-
V7
=V7
=
.600 F1
+
.800 E7
.360
V8
=V8
=
.794*F1
+
.608 E8
.631
V9
=V9
=
.628*F1
+
.778 E9
.395
V10
=V10 =
.611*F1
+
.792 E10
.373
V25
=V25 =
.862 F2
+
.507 E25
.743
V26
=V26 =
.947*F2
+
.321 E26
.897
V27
=V27 =
.849*F2
+
.529 E27
.720
V30
=V30 =
.751 F3
+
.660 E30
.565
V31
=V31 =
.816*F3
+
.578 E31
.666
V32
=V32 =
.751*F3
+
.660 E32
.564
-.350*F1
+
.937 D2
.122
F2
=F2
=
Aparecen las cargas factoriales (>.70). Nivel de significación extraído de las ecuaciones de medida. También aparecen los valores de R2 que muestran la fiabilidad individual de cada ítem (>.50).
49