ESTADISTICA BIVARIADA ESTADISTICA INSTITUTO IACC 24-02-2019
Desarrollo
1) Se obtuvo la siguiente información acerca del número de años de estudio y la edad, de un grupo de trabajadores de una nueva empresa en el norte de Chile:
a) Complete la tabla bivariada (subtotales, totales).
Edad 20-25 25-30 30-35 TOTAL
Años de estudios 13 14 2 1 1 3 1 2 4 6
12 4 5 2 11
b) ¿Cuál es el promedio de edad de los que estudian 14 años?
Edad
Nf3
20-25 25-30 30-35 TOTAL
1 3 2 6
22,5*1 + 27.5*3 + 32.5*2 = 22.5 + 82.5 + 65 = 170 = 28 de edad 6
6
6
15 2 3 1 6
TOTAL 9 12 6 27
La edad promedio de los que estudian 14 años es de 28 años de edad. c) ¿Cuál es la cantidad de años de estudios promedio para quienes tienen a lo más 30 años?
Y 12 13 14 15 TOTAL
N1+N2 9 3 4 5 21
12*9 + 13*3 + 14*4 + 15*5 = 108 + 39 + 56 + 75 = 278 = 13 21
21
21
La cantidad de años de estudios promedio para los que tienen a lo más de 30 años de edad es de 13 años
d) ¿Qué grupo de trabajadores presenta la edad más homogénea: los que tienen 12 años de estudio o 15 años de estudio?
Marca de Clase
Edad
22,5 27,5 32,5
20-25 25-30 30-35 TOTAL
año estudio 12 4 5 2 11
Mc* Años estudios 90 137,5 65 292,5
= 3,579
Mc*años estudio 2.025,00 3.781,30 2.112,50 7.918,80
σ =
Marca de Clase
Edad
año estudio 15
Mc* Años estudios
Mc*años estudio
22,5 27,5 32,5
20-25 25-30 30-35 TOTAL
2 3 1 6
45 82,5 32,5 160
1.012,50 2.268,80 1.056,30 4.337,50
σ =
= 3,441
El grupo de trabajadores que presentan la edad más homogénea son los que tienen 15 años de estudio, ya que su coeficiente de variación es menor.
2) En esa misma empresa del norte, a los trabajadores se les realizó una prueba para poder determinar el orden jerárquico y así obtener un mejor sueldo, los datos son:
N°de Preguntas 20 - 25 25 - 30
1,0 - 3,0 5 23
30 - 35
19
Puntaje Obtenido 3,0 - 5,0 5,0 - 7,0 15 16 12 15 5
7
a) Calcule e interprete la covarianza.
N°de Preguntas 20 - 25 25 - 30
1,0 - 3,0 5 23
Puntaje Obtenido 3,0 - 5,0 15 12
30 - 35
19
5
N° de preguntas 20 - 25 25 - 30 30 - 35 Total
N° trabajadores 36 50 31 117
̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ 𝑃𝑟𝑒𝑔𝑢𝑛𝑡𝑎𝑠 =
5,0 - 7,0 16 15 7
Puntaje obtenido 1,0 - 3,0 3,0 - 5,0 5,0 - 7,0 Total
N° trabajadores 47 32 38 117
(22,5 ∗ 36) + (27,5 ∗ 50) + (32,5 ∗ 31) = 27,29 117
̅̅̅̅̅̅̅̅̅̅̅ = 𝑃𝑢𝑛𝑡𝑎𝑗𝑒
(2 ∗ 47) + (4 ∗ 32) + (6 ∗ 38) = 3,85 117
Promedio de la multiplicación de las variables
N° de preguntas 20 - 25 25 - 30 30 - 35 Total columna Mc (puntaje)
1,0 - 3,0 5/225 23/1265 19/1235 47 2
̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ 𝑃𝑟𝑒𝑔 ∗ 𝑃𝑢𝑛𝑡 =
3,0 - 5,0 15/1350 12/1320 5/650 32 4
Puntaje obtenido 5,0 - 7,0 Total fila 16/2160 36 15/2475 50 7/1365 31 38 N=117 6
Mc (preguntas) 22,5 27,5 32,5
225 + 1350 + 2160 + 1265 + 1320 + 2475 + 1235 + 650 + 1365 = 117 ̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ 𝑃𝑟𝑒𝑔 ∗ 𝑃𝑢𝑛𝑡 =
12045 = 102,95 117
𝑆𝑥𝑦 = 102,95 − (27,29 ∗ 3,85) = −2,12
En base al análisis, se puede concluir que la relación entre las variables es inversa, es decir; si el número de preguntas aumenta, el puntaje obtenido disminuye en -2,12 puntos b) Calcule e interprete el coeficiente de correlación.
̅= 𝑿
36 ∗ 22,5 + 50 ∗ 27,5 + 31 ∗ 32,5 3192,5 = = 27,29 117 117 ̅= 𝒀
2 ∗ 47 + 4 ∗ 32 + 6 ∗ 38 450 = = 3,85 117 117
2 ∗ 22,5 ∗ 5 + 4 ∗ 22,5 ∗ 15 + 6 ∗ 22,5 ∗ 16 + 2 ∗ 27,5 ∗ 23 + 4 ∗ 27,5 ∗ 12 +6 ∗ 27,5 ∗ 15 + 2 ∗ 32,5 ∗ 19 + 4 ∗ 32,5 ∗ 12 + 6 ∗ 32,5 ∗ 7 ̅̅̅̅ 𝑿𝒀 = 117 =
12955 = 110,73 117
̅∗ 𝒀 ̅ = 110,73 − (27,29 ∗ 3,85) = 5,66 𝑆𝑥𝑦 = ̅̅̅̅̅̅̅ 𝑿∗𝒀− 𝑿
Sx=1,94 Sy=-3,78 5,66
rxy = 1,94∗−3,78 = −0,77
La relación entre las variables es lineal con pendiente negativa, esto quiere decir que los trabajadores con mayor número de preguntas suelen obtener menos puntaje.
3) Continuando con la empresa del norte, el departamento de bienestar está realizando estudios médicos, por lo que consideró a 9 trabajadores, preguntándoles su estatura (cm) y peso (kg):
Altura
164
157
190
161
174
172
169
179
166
Peso
52
62
78
64
68
62
56
86
70
El jefe de RR.HH. plantea que a mayor altura, menor es el peso de los trabajadores, ¿usted está de acuerdo? Justifique su respuesta. n= 9 Promedio x= 170,2222222 Promedio y= 66,44444444 1 𝑺𝒙 = √ ∗ ((164 − 170,22)2 + (157 − 170,22)2 + (190 − 170,22)2 + (161 − 170,22)2 + (174 − 170,22)2 9−1 + (172 − 170,22)2 + (169 − 170,22)2 + (179 − 170,22)2 + (166 − 170,22)2 ) = 1,49
1 𝑺𝒙 = √ ∗ ((52 − 66,44)2 + (62 − 66,44)2 + (78 − 66,44)2 + (64 − 66,44)2 + (68 − 66,44)2 + (62 − 66,44)2 9−1 + (56 − 66,44)2 + (86 − 66,44)2 + (70 − 66,44)2 ) = 10,57
Aplicando Excel:
𝒓𝒙𝒚 = 𝟎, 𝟔𝟔𝟗𝟎𝟏𝟕𝟒𝟗𝟐
La relacion entre las variables es lineal con pendiente positiva, es decir; los trabajadores con mayor altura tienden a presentar mayor peso.
Bibliografía IACC (2018). Estadística bivariada. Estadística. Semana 5.