Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
MEDIDAS DE DISPERSION MEDIDAS DE REGRESION Y CORRELACION
KAROL BEDOYA CHAVEZ DIEGO ANDRES TORRES VICKY XIMENA GUTIERREZ NEIDY STEPHANY LONDOÑO JOHN ALEXANDER GARCIA COD: 204040
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES PSICOLOGIA 2017
1
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 TABLA DE CONTENIDO Introducción
4
Justificación
5
Objetivos
6
Cálculo e interpretación de las medidas variable discreta
7
Calculo e interpretación de las medidas variable continúa
20
Análisis de correlación lineal simple
33
Análisis y conclusiones a partir de los resultados
32
Conclusiones
36
Referencias
37
Laboratorio
38
2
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
3
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
INTRODUCCION La estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad, y es usada para la toma de decisiones. La finalidad del trabajo es que se logre comprender, analizar y profundizar los temas abordados de la segunda unidad del módulo de estadística descriptiva. Es un trabajo práctico que le permite al estudiante el desarrollo de estrategias y habilidades que favorecen su aprendizaje autónomo y contribuyen con su formación académica.
4
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 JUSTIFICACION
La estadística es una disciplina aplicada en todos los campos de la actividad humana. De ahí que se tenga como una asignatura indispensable en todas las áreas y carreras del conocimiento de nivel intermedio y profesional. Si existe una función que sea importante universalmente para aquellas personas que laboran dentro de una organización empresarial, está es la decisión. Debido al enorme aumento de disponibilidad de datos, a través de los computadores y de la gran complejidad, el proceso de decisión está sometido a presiones extraordinarias. En el futuro, los responsables de las decisiones tendrán que estar suficientemente familiarizados con las técnicas estadísticas existentes, para poder determinar cuándo se puede analizar una situación mediante la aplicación de la estadística. Se busca la conceptualización y reconocimiento a través de la teoría de los conceptos vistos en la unidad de estadística, para su posterior aplicación como una herramienta útil en el campo laboral, académico entre otros. El uso de estas herramientas estadísticas es aplicable en diferentes ramas del saber y sirven para poder dar solución y aclarar de manera más sencilla problemas que se evidencian a partir de la información; además de proporcionarnos los medios para analizar datos recopilados de manera ordenada, resumida, numérica, descriptica e ilustrativa.
5
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
OBJETIVOS
Aprender el manejo de las tablas y manejo de programas estadísticos para sacar porcentajes de acuerdo a lo estudiado. Relacionar agrupar y comprender datos de acuerdo a una población asignada. Analizar la información obtenida dependiendo el caso para poder obtener un resultado confiable utilizando tablas y gráficos. Reconocer las medidas y los términos generales para determinar el porcentaje relación según las variantes.
de acuerdo al modelo de
Identificar que variantes se pueden relacionar según sea el caso la variable dependiente como Y e la independiente como X para representarlas por ecuación matemática.
6
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
CALCULO E INTERPRETACION DE LAS MEDIDAS VARIABLES DISCRETAS Medidas Univariantes de dispersión Identificar las variables discretas dentro del problema de estudio y calcular las medidas Univariantes de dispersión más adecuada, a aquellas que consideren sean relevantes para el problema de estudio. Con la variable discreta elegida calcular: rango, varianza, desviación típica y coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio. Con la variable continúa elegida calcular: rango, varianza, desviación típica y coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio. Cálculo E Interpretación De Las Medidas Univariantes De Tendencia Central Y De Dispersión Para La Variable Discreta Dentro de las variables discretas se encuentra la edad, el estrato, el número de textos escolares, el número de materias aprobadas, materias con desempeño básico y materias con desempeño bajo. La variable elegida será la edad Para la muestra presentada en la encuesta posee cien (100) observaciones y al calcular los estadígrafos solicitados se encuentra que:
7
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 Rango Varianza de la muestra Desviación Típica Coeficiente de Variación
4 1.3735613 1.17199032 0.13065481
La edad promedio de los estudiantes es aproximadamente 9 años, el valor de la mediana es 9 años y la edad que más se repite entre los estudiantes es 9 años. Los datos de las edades se desvían de la media en aproximadamente 1 año. La edad mínima es 7 años y la edad máxima es 11 años.
Se podría decir que en la muestra se encuentran estudiantes entre los 7 y los 11 años de edad, que la mayoría de los estudiantes encuestados se encuentran entre los 8 y los 10 años.
8
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
Frecuencia
Histograma 30 25 20 15 10 5 0
Frecuencia 7
8
9
10
11
y mayor...
Clase
El histograma tiene una distribución normal y asimétrica, esto quiere decir que ambos lados no son iguales. Como se indicó anteriormente entre 8 y 10 años se concentra el mayor número de alumnos mientras en la edad de siete años se encuentra la menor frecuencia.
9
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
VARIABLE ESTRATO Media 2.28181818 Mediana 2 Moda 2 Desviación estándar 0.69244704 Varianza de la 0.4794829 muestra Rango 2 Mínimo 1 Máximo 3
El estrato promedio de los estudiantes es 2, el valor de la mediana es estrato 2 y el estrato que más se repite entre los estudiantes es el estrato 2. Los datos del estrato de los estudiantes se desvían de la media en aproximadamente 1 estrato. El estrato mínimo es 1 y el máximo es 3. En términos generales se podría decir que en el estudio realizado se encuentran tres (3) estratos socioeconómicos (1, 2 y 3)
10
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
Frecuencia
Histograma 50
Frecuencia
0 1
2
3
y mayor...
Clase
El histograma tiene una distribución normal y asimétrica, esto quiere decir que ambos lados no son iguales.
NÚMERO DE TEXTOS ESCOLARES QUE POSEE EN LA CASA Media 12.0090909 Error típico 0.6871264 Mediana 10 Moda 12 Desviación estándar 7.20664252 Varianza de la 51.9356964 muestra Rango 37 Mínimo 3 Máximo 40
11
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
El número de textos escolares que los estudiantes poseen en la casa en promedio es 12, el valor de la mediana del número de textos escolares que poseen en la casa los estudiantes es 10 y el número de textos escolares que posee en la casa la mayoría de los estudiantes es 12. Los datos del número de textos escolares que posee en la casa los estudiantes se desvían de la media en aproximadamente 7 textos escolares. El mínimo de textos escolar que poseen los estudiantes en sus casas es 3 y el máximo es 40. Existe una alta variabilidad en esta variable, la desviación típica es un poco mayor que la mitad de la media. Clase 3 8 12 17 22 27 32 36 41 y mayor...
Frecuencia
% acumulado
0 31 45 12 11 6 2 2 1 0
0.00% 28.18% 69.09% 80.00% 90.00% 95.45% 97.27% 99.09% 100.00% 100.00%
Clase 12 8 17 22 27 32 36 41 3 y mayor...
Frecuencia 45 31 12 11 6 2 2 1 0 0
% acumulado 40.91% 69.09% 80.00% 90.00% 95.45% 97.27% 99.09% 100.00% 100.00% 100.00%
12
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
El histograma tiene una forma asimétrica, con un pico descentrado dentro del recorrido de los datos, las colas descienden: bruscamente en un lado y suavemente en el otro. Los estudiantes tienden a tener pocos textos escolares en sus viviendas. Como se puede apreciar son muy poco los estudiantes que poseen un número mayor de 22 libros en sus casas
MATERIA APROBADAS Media 8.66363636 Error típico 0.1135354 Mediana 9 Moda 9 Desviación estándar 1.19076934 Varianza de la 1.41793161 muestra Rango 5
13
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 Mínimo Máximo
5 10
Las materias aprobadas promedio de los estudiantes es 9, el valor de la mediana es 9 materias aprobadas y la mayoría de los estudiantes tienen 9 materias aprobadas. Los datos de las materias aprobadas de los estudiantes se desvían de la media en aproximadamente 1 materia aprobada. El valor mínimo de materias aprobadas es 5 y el máximo 10. Clase
Frecuencia
5 6 7 8 9 10 y mayor...
1 5 12 26 34 32 0
% acumulado 0.91% 5.45% 16.36% 40.00% 70.91% 100.00% 100.00%
Clase
Frecuencia
9 10 8 7 6 5 y mayor...
34 32 26 12 5 1 0
% acumulado 30.91% 60.00% 83.64% 94.55% 99.09% 100.00% 100.00%
14
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
El histograma tiene una forma asimétrica, con un pico descentrado dentro del recorrido de los datos, las colas descienden: bruscamente en un lado y suavemente en el otro. Los estudiantes tienden a aprobar la mayoría de sus materias. NÚMERO DE MATERIAS CON DESEMPEÑO BAJO Media 1.33636364 Error típico 0.1135354 Mediana 1 Moda 1 Desviación estándar 1.19076934 Varianza de la 1.41793161 muestra Rango 5 Mínimo 0 Máximo 5
15
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 El número de materias con desempeño bajo que poseen los estudiantes en promedio es 1 materia, el valor de la mediana del número de materias con desempeño bajo que poseen los estudiantes es 1 y la mayoría de los estudiantes tienen solamente 1 materia con desempeño bajo. Los datos del número de materias con desempeño bajo se desvían de la media en aproximadamente 1 materia. El mínimo de materias con desempeño bajo que poseen los estudiantes es 0 materias y el máximo es 5. Clase
Frecuencia
0 1 2 3 4 5 y mayor...
32 34 26 12 5 1 0
% acumulado 29.09% 60.00% 83.64% 94.55% 99.09% 100.00% 100.00%
Clase
Frecuencia
1 0 2 3 4 5 y mayor...
34 32 26 12 5 1 0
% acumulado 30.91% 60.00% 83.64% 94.55% 99.09% 100.00% 100.00%
16
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
El histograma tiene una forma asimétrica, con un pico descentrado dentro del recorrido de los datos, las colas descienden: bruscamente en un lado y suavemente en el otro. Los estudiantes tienden a tener pocas materias con desempeño bajo.
NÚMERO DE MATERIAS CON DESEMPEÑO BÁSICO Media 3.12727273 Error típico 0.10967318 Mediana 3 Moda 3 Desviación 1.15026196 estándar Varianza de la 1.32310259 muestra Rango 6 Mínimo 1 Máximo 7
El número de materias con desempeño básico que poseen los estudiantes en promedio es 3 materias, el valor de la mediana del número de materias con desempeño básico que poseen los estudiantes es 3 y la mayoría de los estudiantes tienen solamente 3 materias con desempeño básico. Los datos del número de
17
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 materias con desempeño básico se desvían de la media en aproximadamente 1 materia. El mínimo de materias con desempeño básico que poseen los estudiantes es 1 materias y el máximo es 7. Clase
Frecuencia
1 2 3 4 5 6 7 y mayor...
3 33 39 22 9 3 1 0
% acumulado 2.73% 32.73% 68.18% 88.18% 96.36% 99.09% 100.00% 100.00%
Clase
Frecuencia
3 2 4 5 1 6 7 y mayor...
39 33 22 9 3 3 1 0
% acumulado 35.45% 65.45% 85.45% 93.64% 96.36% 99.09% 100.00% 100.00%
18
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
El histograma tiene una forma asimétrica, con un pico descentrado dentro del recorrido de los datos, las colas descienden: bruscamente en un lado y suavemente en el otro. Los estudiantes tienden a tener pocas materias con desempeño básico.
19
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
CÁLCULO E INTERPRETACIÓN DE LAS MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA LA VARIABLE CONTINÚA ESTATURA Media 1.32763636 Error típico 0.00689723 Mediana 1.325 Moda 1.26 Desviación estándar 0.07233875 Varianza de la 0.00523289 muestra Rango 0.3 Mínimo 1.2 Máximo 1.5 La estatura promedio de los estudiantes es 1.33m, el valor de la mediana es tener una estatura de 1.325m y la estatura que más se repite entre los estudiantes es 1.26m. Los datos de la estura de los estudiantes se desvían de la media en 0.072m. La estura mínima es 1.2m y la máxima es 1.5m.
20
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 Clase
Frecuencia
1.10 1.14 1.18 1.22 1.26 1.29 1.33 1.47 1.51 y mayor...
0 0 0 7 12 18 24 48 1 0
% acumulado 0.00% 0.00% 0.00% 6.36% 17.27% 33.64% 55.45% 99.09% 100.00% 100.00%
Clase
Frecuencia
1.47 1.33 1.29 1.26 1.22 1.51 1.10 1.14 1.18 y mayor...
48 24 18 12 7 1 0 0 0 0
% acumulado 43.64% 65.45% 81.82% 92.73% 99.09% 100.00% 100.00% 100.00% 100.00% 100.00%
21
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
El histograma tiene una forma asimétrica, con un pico descentrado dentro del recorrido de los datos, las colas descienden: bruscamente en un lado y suavemente en el otro (Fundibeq). Los estudiantes tienden a tener una estatura alta.
PESO Media Error típico Mediana Moda Desviación estándar Varianza de la muestra Rango Mínimo Máximo
31.3690909 0.5637873 30.6 35.2 5.91305111 34.9641735 28.1 19.9 48 22
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 El peso promedio de los estudiantes es 31.37kg, el valor de la mediana es tener un peso de 30.6kg y el peso que más se repite entre los estudiantes es 35.2kg. Los datos del peso de los estudiantes se desvían de la media en 5.91kg. El peso mínimo es 19.9kg y el máximo es 48m. Clase
Frecuencia
19.8 23.4 27.1 30.7 34.3 38.0 41.6 45.3 49.0 y mayor...
0 7 27 23 17 17 17 0 2 0
% acumulado 0.00% 6.36% 30.91% 51.82% 67.27% 82.73% 98.18% 98.18% 100.00% 100.00%
Clase
Frecuencia
27.1 30.7 34.3 38.0 41.6 23.4 49.0 19.8 45.3 y mayor...
27 23 17 17 17 7 2 0 0 0
% acumulado 24.55% 45.45% 60.91% 76.36% 91.82% 98.18% 100.00% 100.00% 100.00% 100.00%
23
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
El histograma tiene una forma asimétrica, con un pico descentrado dentro del recorrido de los datos, las colas descienden: bruscamente en un lado y suavemente en el otro (Fundibeq). Los estudiantes tienden a tener poco peso. DESEMPEÑO COMPORTAMIENTO Media 4.46181818 Error típico 0.05830497 Mediana 5 Moda 5 Desviación estándar 0.61150766 Varianza de la 0.37394162 muestra Rango 2 Mínimo 3 Máximo 5
24
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 El desempeño del comportamiento promedio de los estudiantes es 4.46, el valor de la mediana es tener un desempeño en el comportamiento de 5 y el desempeño del comportamiento que más se repite entre los estudiantes es 5. Los datos del desempeño del comportamiento de los estudiantes se desvían de la media en 0.61. El desempeño del comportamiento mínimo es 3 y el máximo es 5. Clase
Frecuencia
2.90 3.16 3.42 3.68 3.93 4.19 4.45 4.81 5.07 y mayor...
0 1 2 9 24 5 0 13 56 0
% acumulado 0.00% 0.91% 2.73% 10.91% 32.73% 37.27% 37.27% 49.09% 100.00% 100.00%
Clase
Frecuencia
5.07 3.93 4.81 3.68 4.19 3.42 3.16 2.90 4.45 y mayor...
56 24 13 9 5 2 1 0 0 0
% acumulado 50.91% 72.73% 84.55% 92.73% 97.27% 99.09% 100.00% 100.00% 100.00% 100.00%
25
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
Regresión y Correlación Lineal Simple A partir de la base de datos: Identificar dos variables cuantitativas de la situación estudiada que pueden estar relacionadas. Se tomará las variables “Materias Aprobadas” (MAp) y “Número de Textos Escolares que Posee en la Casa2” (NTEC) Estas variables podrían estar correlacionadas según el caso presentado en la base de datos Realizar un diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables.
26
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
11 10 9
MAP
8 7 6 5 4 0
5
10
15
20
25
30
35
40
45
NTEC
27
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 Al apreciar el diagrama de dispersión se observa que no se puede identificar una relación clara entre estas variables, motivo por el cual se utilizará otras variables para el ejercicio. Esta vez se definirá las variables peso y estatura para el análisis: 1.55 1.50
ESTATURA
1.45 1.40 1.35 1.30 1.25 1.20 1.15 15
20
25
30
35
40
45
50
PESO
28
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? De acuerdo a lo observado en el diagrama de dispersión los datos se podrían agrupar alrededor de una línea recta, la cual matemáticamente puede ser representada por la ecuación
Y mX b
Al realizar la estimación por el método de MCO se obtiene los siguientes resultados:
29
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 En términos generales se podría decir que es confiable, ya que el R cuadrado indica que la variable independiente (Estatura) explica en un 93.23% la variable dependiente (Peso) Y=78.13X-072.41 Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. En términos generales se podría decir que es confiable, ya que el R cuadrado indica que la variable independiente (Estatura) explica en un 93.23% la variable dependiente (Peso), si se realiza respecto al coeficiente de correlación es 0.9655, indica que las variables tiene una alta relación lineal positiva Relacionar la información obtenida con el problema La información obtenida entregaría una relación entre peso y edad
Media 8.66363636 Error típico 0.1135354 Mediana 9 Moda 9 Desviación estándar 1.19076934 Varianza de la 1.41793161 muestra Rango 5 Mínimo 5 Máximo 10 30
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
Con este documento los tutores y estudiantes de la UNAD van a querer implementar con mayor frecuencia el uso del wiki para la realización de los trabajos colaborativo o para la discusión de temas académicos pertinentes a los contenidos del curso respectivo.
31
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
ANALISIS DE CORRELACION LINEAL
Como primera medida se tomaron las variables de materias aprobadas y número de textos que poseen en casa, pero al realizar el diagrama de dispersión se pudo observar que no se puede identificar una relación clara entre las variables, por lo tanto se utilizaron otras variables.
En segunda opción se realizaron las variables de peso y estatura, donde se obtuvo como correlación 0.9655.
Se concluye que es confiable, puesto que matemáticamente es representada como Y=Mx+b, esto conlleva a ser una variable positiva que coincide con una recta lineal.
El resultado de la variable dependiente es de 93.23%
32
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 ANALISIS Y CONCLUSIONES A PARTIR DE LOS RESULTADOS
1. se presenta el primer caso ubicando las variables discretas mediante una base de datos ya diseñada con información que se toma como referente para dar inicio a la elaboración de la tabla donde la edad se toma como variable elegida done se encuentra que la edad promedio de los estudiantes es de 9 años teniendo en cuenta que los datos de las edades se desvían de la media en un año aproximadamente, concluyendo que la edad mínima es de 7 años y la máxima de 11 lo que quiere decir que en la encuesta se encuentran la mayoría de los estudiantes entre los 8 y los 11 años. 2. El estrato promedio de los estudiantes es 2 ubicando así el valor que más se repite en es el estrato 2 tomando en cuenta que el valor desviado en la media es de un estrato arrojando como resultado que los estratos de los estudiantes están entre 1 y 3 concluyendo que se encuentran 3 estratos en los que se desarrollan los estudiantes el 1 siendo el mínimo el 2 siendo el medio y el 3 siendo el máximo. Teniendo una distribución asimétrica lo que nos indica gran diferencia entre uno estrato y otro.
3. Numero de textos escolares que los estudiantes poseen en casa oscila entre un promedio de 12 el valor de la mediana, y 10 textos escolares que poseen en la casa los estudiantes teniendo en cuenta que la desviación de la media es de aproximadamente 7 libros, llegando así a la conclusión de que en las casas que menor número tienen e libros es 3 y la mayor cantidad es 40, la variabilidad es muy alta es más de la mitad de la media. A lo cual podemos afirmar que los estudiantes no manejan gran cantidad de libros en su casa.
33
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 4. Las materias aprobadas promedio de los estudiantes el valor de la mediana es 9 materias aprobadas teniendo en cuenta que la media se desvía aproximadamente en una materia en una forma asimétrica podemos decir que el mínimo de materias aprobadas está en un 5% y el valor máximo es de un 10% por lo cual podemos concluir que los estudiantes tienen la mayoría de sus materias aprobadas. 5. Materias con desempeño bajo, la mediana es 1 el valor con desempeño bajo de los estudiantes de 1 lo cual nos indica que la mayoría de los estudiantes aprobó todas sus materias y solamente en 1 tienen bajo desempeño teniendo en cuenta que el valor de la media se desvía aproximadamente en 1materia con bajo desempeño por lo cual podemos concluir que el mínimo d materias con bajo rendimiento es 0 y el máximo 5 de acuerdo al histograma en forma simétrica los estudiantes tienen un mínimo de materas con bajo rendimiento. 6. Numero de materias con desempeño básico, el valor de la mediana es de 3y la mayor parte de los estudiantes solo tienen 3 materias con un desempeño básico teniendo en cuenta que los datos se desvían de la media en 1 materia en promedio el número de materias que tienen con desempeño básico es de 1 concluyendo así que el valor más bajo es 1 y el más alto es 7 según histograma asimétrico, tienen pocas materias con desempeño básico. 7. Estatura promedio según estudio realizado arroja que el valor de la mediana es 1.325m mientras que la estatura promedio de los estudiantes es 1.33m y la estatura más común en esa población es de 1.26m siendo la mínima de 1.2m la máxima es de 1.5 m entonces podemos concluir según la forma asimétrica del histograma los estudiantes tienen una estatura promedio 1.47 y se puede deducir que son de estatura alta. 8. El peso promedio según estudio realizado la mediana está en un peso de 30.6km la mayoría de los estudiantes pesa 35.2km teniendo en cuenta que los datos se desvían de la media en 5.91 km siendo así podemos concluir que el peso promedio de los estudiantes es 31.37km y el peso mínimo es de 19.9km y el máximo es de 48 m.
34
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 9. Desempeño comportamiento el valor de la medina está en un desempeño de comportamiento de 5 teniendo en cuenta que se desvían de la media en 0.61siendo así podemos concluir que el promedio del comportamiento de los estudiantes es de 4.46 teniendo como mínimo un desempeño de 3 y máximo de 5. 10. Regresión y Correlación Lineal Simple en el primer ejercicio vemos como no se pudieron relacionar claramente las variables esto puede ser debido a que no tiene relación las materias aprobadas con el número de textos que cada estudiante posee en su casa, razón por la cual se toman otras variantes. 11. En este ejercicio se toma como dependiente el peso e independiente la estatura dando como resultado 93.23% la variable dependiente y la correlación es de 0,9655 ha lo cual las variables tienen alta correlación lineal y podemos deducir que es una variable confiable por cuanto es representada matemáticamente como Y=mX+b es una variable positiva que coincide con una recta lineal.
35
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 CONCLUSIONES
1. Conocimos muchos de los fundamentos que son necesarios para el estudio de la estadística. 2. Gracias al desarrollo de los ejercicios anteriores podemos decir que fortalecimos mucho de los conceptos y procedimientos presentes en la estadística descriptiva. 3. El desarrollo de los ejercicios nos permitió adentrarnos más en el ambiente de las estadísticas lo cual será de gran ayuda para nuestra formación como profesionales. 4. El trabajo en grupo nos permitió, también fortalecer nuestros conocimientos y conocer mucho más a nuestros compañeros de grupo. 5. Se puede concluir que se desarrolló con claridad todo el trabajo y se cumplieron cada uno de los lineamientos expuestos por la UNAD, entendiendo cada uno de los procesos para llevar a cabo cada uno de los procesos que determina una investigación.
36
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
REFERENCIAS BIBLIOGRAFICAS
Santa Escobar. Monica. Modulo.Estadistica.Descritiva,universidad Nacional Abierta y a distancia, Colombia(2005) Universidad Atacama¿Qué es la estadística? Recuperado de: http://www.mat.uda.cl/hgomez/apuntes/Esta/%c3%Adistica.Descriptiva.PDF.
37
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
LABORATORIOS
DIEGO TORRES
PUNTO 1 a) Realice el diagrama de dispersión y determine el tipo de asociación entre las variables X (sal) 1,6 2,3 3,3 4,2 4,6 5
Y (Tensión) 98 102 109 113 115 120
38
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
DIAGRAMA DE DISPERSION 140
Y (TENSION)
120 100 80
Series1
60
y = 6.1062x + 88.128 R² = 0.987
40
Linear (Series1) Linear (Series1)
20 0
0
1
2
3
4
5
6
X (SAL)
b) Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? Y= 6,1062x+88,128 R²= 0,987 En cuanto al resultado, se puede evidenciar que tiene un 98,7% de confiabilidad.
39
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 c) Determine el grado de relación de las dos variables. RTA. El valor de r coeficiente de correlación lineal confirma una relación Excelente entre las variables Sal – Tensión. d) Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la tensión arterial esperada? Y= ? Y= 6,1062x+88,128 5,6 = 6,1062x+88,128 5,6 – 88,128 = 6,1062x -82,528 = 6,1062 = 82,528/6,1062 TENSION ARTERIAL = 13,5 PUNTO 2 a. En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era importante ir anotando periódicamente el tiempo medio ( medido en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos representan dicha situación: X Y
12 45
23 30
35 27
42 25
53 23
65 21
70 20 40
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
DIAGRAMA DE DISPERSION 50 40 30
DIAGRAMA DE DISPERSION
Y 20
y = -0.3566x + 42.569 R² = 0.7963
10
Linear (DIAGRAMA DE DISPERSION)
0 0
20
40
60
80
X
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? Y= -0,3566x + 42,569 R²= 0,7963 En cuanto al resultado se evidencia un porcentaje medio de confiabilidad equivalente a 79,63%. c. Determine el grado de correlación de las dos variables.
41
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 El R 2 afirma además que el modelo explica el 79,63 % de la información y el valor de r coeficiente de correlación lineal confirma además una correlación Media entre las variables. d. ¿Qué tiempo deberá tardarse un empleado cuando lleven 90 días? Y= -0,3566x + 42,569 90 = -0,3566x + 42,569 90-42,569 = -0,3566x 47,431*0,3566 Tiempo en tardarse cuando lleve 90 días =16.91
PUNTO 3 Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas. A continuación se presentan los resultados:
42
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 ESTATURA (CM) 120 124 107 118 112 110 115 104 110 116
PESO (KG) 24 23 19 24 21 19 22 16 20 23
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables
43
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
DIAGRAMA DE DISPERSION 30
PESO (kg )
25 20
y = 0.386x - 22.751 R² = 0.8329
15
PESO (KG)
10
Linear (PESO (KG))
5 0 100
105
110
115
120
125
ESTATURA (cm)
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? Y= 0,386x – 22,751 R²= 0,8329 Según resultado obtenido tiene un 83.29% de confiabilidad, lo cual es excelente. c. Determine el grado de correlación de las dos variables. RTA. El valor de r coeficiente de correlación lineal equivalente a 0,8329 confirma una relación Excelente entre las variables ESTATURA- PESO. 44
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 d. ¿Cuál es el peso que debería tener un estudiante que mida 128 cm? Y= 0,386x – 22,751
JOHN ALEXANDER GARCIA
Actividad Individual 1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después. X(sal) Y(tensión) 1,6 98 2,3 102 3,3 109 4,2 113 4,6 115 5 120 a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables
45
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 30 25
tension
20 15 10 5 0 100
105
110
115
120
125
sal
La asociación entre las variables es lineal b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? X(sal) Y(tensión) x*y x^2 y^2 1,6 98 156,8 2,56 9604 2,3 102 234,6 5,29 10404 3,3 109 359,7 10,89 11881 4,2 113 474,6 17,64 12769 4,6 115 529 21,16 13225
46
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 5 21
120 657
600 2354,7
25 82,54
14400 72283
𝑎=
𝑦 = 𝑎𝑥 + 𝑏 𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦) 2
𝑛 ∑ 𝑥 2 − (∑ 𝑥) 6 ∗ 2354,7 − 21 ∗ 657 𝑎= 6 × 82,54 − 212 331,2 𝑎= = 6,1062 54,24 ∑𝑦 − 𝑎∑𝑥 𝑏= 𝑛 657 − 6,1062 ∗ 21 𝑏= 6 𝑏 = 88,5 El modelo matemático sería: 𝑦 = 6,1062𝑥 + 88,5
𝑟=
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦) √𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 × √𝑛 ∑ 𝑦 2 − (∑ 𝑦)2
47
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 𝑟=
6 × 2354,7 − 21 × 657
= 0,9935 √6 × 82,54 − 212 × √6 × 72283 − 6572 Se puede asegurar que la ecuación de la recta es confiable porque el coeficiente de regresión está cercano a 1 y tiene un grado alto de confiabilidad. c. Determine el grado de relación de las dos variables. El modelo explica el 99.35% de la información y el valor de r coeficiente de correlación lineal es excelente porque el 0.9935 está muy cercano al extremo 1 positivo que es la correlación perfecta positiva.
d. Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la tensión arterial esperada? Para encontrar la tensión arterial esperada al suministrar 5,6 de sal, en el modelo matemático encontrado se reemplaza x por 5,6 𝑦 = 6,1062𝑥 + 88,5 𝑦 = 6,1062(5,6) + 88,5 𝑦 = 122,69 La tensión esperada será de 122,69. 2. En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era importante ir anotando periódicamente el tiempo medio ( medido en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los
48
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos representan dicha situación: X
Y
12 45 23 30 35 27 42 25 53 23 65 21 70 20 a. Identifique la variable dependiente (y) y la variable independiente (x),realice el diagrama de dispersión y determine el tipo de asociación entre las variables
49
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
30
25
y
20 15 10 5 0 100
105
110
115
120
125
x
Hay un tipo de asociación lineal b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? X
Y 12 23 35 42 53
45 30 27 25 23
x*y 540 690 945 1050 1219
x^2 144 529 1225 1764 2809
y^2 2025 900 729 625 529
50
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 65 70 300
21 20 191
1365 1400 7209
4225 4900 15596
441 400 5649
𝑦 = 𝑎𝑥 + 𝑏 𝑎=
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦) 𝑛 ∑ 𝑥 2 − (∑ 𝑥)
2
7 ∗ 7209 − 300 ∗ 191 7 × 15596 − 3002 −6837 𝑎= = −0,36 19172 ∑𝑦 − 𝑎∑𝑥 𝑏= 𝑛 191 − (−0,36) ∗ 300 𝑏= 7 𝑏 = 42,72
𝑎=
El modelo matemático sería: 𝑦 = −0,36𝑥 + 42,72
51
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
𝑟=
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦) √𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 × √𝑛 ∑ 𝑦 2 − (∑ 𝑦)2
𝑟=
7 ∗ 7209 − 300 ∗ 191
√7 × 15596 − 3002 × √7 × 5649 − 1912 c. Determine el grado de correlación de las dos variables.
= −0,89
d. ¿Que tiempo deberá tardarse un empleado cuando lleven 90 días? Para encontrar el tiempo que deberá tardarse un empleado que lleva 90 días de debe reemplazar 90 en el modelo matemático 𝑦 = −0,36𝑥 + 42,72 𝑦 = −0,36(90) + 42,72 𝑦 = 75,12 El tiempo que se tardará un empleado que lleva 90 días es de 75,12minutos
52
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
3. Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas. A continuación se presentan los resultados:
X(estatura) 120 124 107 118 112 110 115 104 110 116
Y(peso) 24 23 19 24 21 19 22 16 20 23
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables
53
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 30 25
peso
20 15 10
5 0 100
105
110
115
120
125
estatura
Hay un tipo de relación lineal, siendo la variable dependiente el peso y la variable independiente la estatura b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? X(estatura) Y(peso) x*y x^2 y^2 120 24 2880 14400 576 124 23 2852 15376 529 107 19 2033 11449 361 118 24 2832 13924 576 112 21 2352 12544 441 110 19 2090 12100 361
54
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 115 104 110 116 1136
22 16 20 23 211
2530 1664 2200 2668 24101
13225 10816 12100 13456 129390
484 256 400 529 4513 𝑦 = 𝑎𝑥 + 𝑏 𝑎=
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦) 𝑛 ∑ 𝑥 2 − (∑ 𝑥)
2
10 ∗ 24101 − 1136 ∗ 211 10 × 129390 − 11362 1314 𝑎= = 0,39 3404 ∑𝑦 − 𝑎∑𝑥 𝑏= 𝑛 211 − 0.39 ∗ 1136 𝑏= 10 𝑏 = −23,2
𝑎=
El modelo matemático sería: 𝑦 = 0,39𝑥 − 23,2
55
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
𝑟=
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦) √𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 × √𝑛 ∑ 𝑦 2 − (∑ 𝑦)2
𝑟=
10 ∗ 24101 − 1136 ∗ 211
= 0,91 √10 × 129390 − 11362 × √10 × 4513 − 2112 Se puede asegurar que la ecuación de la recta es confiable porque el coeficiente de correlación está cercano a 1 y tiene un grado alto de confiabilidad c. Determine el grado de correlación de las dos variables. El R² afirma que el modelo explica el 82,8% de la información y el valor de r coeficiente de correlación lineal es excelente porque el 0.91 está muy cercano al extremo 1 positivo que es la correlación perfecta positiva. d. Cuál es el peso que debería tener un estudiante que mida 128 cm? 𝑦 = 0,39𝑥 − 23,2 𝑦 = 0,39(128) − 23,2 𝑦 = 26,72
56
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
NEIDY STEPHANY LONDOÑO
Ejercicios 1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después. X (Sal) Y (Tensión) 1,6 98 2,3 102 3,3 109 4,2 113 4,6 115 5,0 120 a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? c. Determine el grado de relación de las dos variables. d. Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la tensión arterial esperada? SOLUCION a. Diagrama de dispersión.
57
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 140
120
Tensión
100 80 60 40 20 0 0
1
2
3
4
5
6
Sal
La asociación entre las variables es lineal. b. Modelo Matemático. Paso 1. Realizamos la Tabla. 𝑥𝑖
𝑦𝑖 1,6 2,3 3,3 4,2 4,6
98 102 109 113 115
𝑥𝑖 𝑦𝑖 156,8 234,6 359,7 474,6 529,0
𝑥𝑖2 2,56 5,29 10,89 17,64 21,16
𝑦𝑖2 9.604 10.404 11.881 12.769 13.225 58
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 TOTAL
5,0 21,0
120 657
600,0 2.354,7
25,00 82,54
14.400 72.283
Paso 2. Hallamos las Medias Aritméticas. ∑𝑛𝑖=1(𝑥𝑖 ) 21,0 ∑𝑛𝑖=1(𝑦𝑖 ) 657 𝑥̅ = = = 3,5 ; 𝑦̅ = = = 109,5 𝑁 6 𝑁 6 Paso 3. Calculamos la Covarianza. ∑𝑛𝑖=1(𝑥𝑖 𝑦𝑖 ) 2.354,7 𝜎𝑥𝑦 = − 𝑥̅ 𝑦̅ = − 3,5 ∗ 109,5 = 9,2 𝑁 6 Paso 4. Calculamos la Varianza en X (consumo de sal). ∑𝑛𝑖=1(𝑥𝑖2 ) 82,54 𝜎𝑥2 = − (𝑥̅ )2 = − (3,5)2 = 1,51 𝑁 6 Paso 5. Calculamos los coeficientes de regresión. 𝜎𝑥𝑦 9,2 𝑏̂ = 2 = = 6,09 𝜎𝑥 1,51 𝑎̂ = 𝑦̅ − 𝑏̂𝑥̅ = 109,5 − 6,09 ∗ 3,5 = 88,18 Paso 6. Establecemos la recta de regresión 𝑦𝑖 = 𝑎̂ + 𝑏̂ ∗ 𝑥𝑖 , 𝑦𝑖 = 88,18 + 6,09 ∗ 𝑥𝑖
59
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 140
120
Tensión
100 80 60 40 20 0 0
1
2
3
4
5
6
Sal
Si es confiable. La recta intersecta el eje vertical, entre 80 y 100, aproximadamente. Y la pendiente positiva, concuerda con una recta creciente. c. Grado de relación de las dos variables. GRADO DE LA RELACIÓN Perfecta: r = 1 ; Excelente: 0.9 ≤ r < 1 ; Buena: 0.8 ≤ r < 0.9 Regular: 0.5 ≤ r < 0.8 ; Mala: r < 0.5 Paso 7. Calculamos la Variaciones Típicas.
60
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 ∑𝑛𝑖=1(𝑥𝑖2 ) 82,54 √ 𝜎𝑥 = − (𝑥̅ )2 = √ − (3,5)2 = 1,23 𝑁 6 ∑𝑛 (𝑦 2 ) 72.283 𝜎𝑦 = √ 𝑖=1 𝑖 − (𝑦̅)2 = √ − (109,5)2 = 7,54 𝑁 6 Paso 8. Aplicamos la fórmula del coeficiente de correlación lineal. 𝜎𝑥𝑦 9,2 r= = = 0,99 𝜎𝑥 𝜎𝑦 1,23 ∗ 7,54 Al ser el coeficiente de correlación positivo, la correlación es directa. Como el coeficiente de correlación está muy próximo a 1 (0,99), la correlación es muy fuerte. El grado de la relación es Excelente. d. Tensión arterial esperada, para una dosis de sal de 5,6. 𝑦𝑖 = 88,18 + 6,09 ∗ 𝑥𝑖 , 𝑦𝑖 = 88,18 + 6,09 ∗ 5,6 = 122,28
2. En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era importante ir anotando periódicamente el tiempo medio (medido en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos representan dicha situación: X 12 23 35 42 53 65 70 Y 45 30 27 25 23 21 20
61
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? c. Determine el grado de correlación de las dos variables. d. Que tiempo deberá tardarse un empleado cuando lleven 90 días? SOLUCION a. Variable dependiente (Y) y la Variable independiente (X). A mayor tiempo (días) de experiencia, menor será el tiempo medio (en minutos) utilizado para realizar una pieza. De tal forma que, la variable dependiente (Y) corresponde al tiempo medio (en minutos) que se utiliza para realizar una pieza. Y la variable independiente (X) corresponde al número de días desde que empezó dicho proceso de fabricación (experiencia). Diagrama de dispersión.
62
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
Tiempo para realizar una pieza
50 45 40 35
30 25 20 15 10 5 0 0
10
20
30
40
50
60
70
80
Número de días
La asociación entre las variables no es lineal (parece exponencial). b. Modelo Matemático. Paso 1. Realizamos la Tabla. 𝑥𝑖
𝑦𝑖 12 23 35 42 53
45 30 27 25 23
𝑥𝑖 𝑦𝑖 540 690 945 1.050 1.219
𝑥𝑖2 144 529 1.225 1.764 2.809
𝑦𝑖2 2.025 900 729 625 529 63
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
TOTAL
65 70 300
21 20 191
1.365 1.400 7.209
4.225 4.900 15.596
441 400 5.649
Paso 2. Hallamos las Medias Aritméticas. ∑𝑛𝑖=1(𝑥𝑖 ) 300 ∑𝑛𝑖=1(𝑦𝑖 ) 191 𝑥̅ = = = 42,86 ; 𝑦̅ = = = 27,28 𝑁 7 𝑁 7 Paso 3. Calculamos la Covarianza. ∑𝑛𝑖=1(𝑥𝑖 𝑦𝑖 ) 7.209 𝜎𝑥𝑦 = − 𝑥̅ 𝑦̅ = − 42,86 ∗ 27,28 = −139,36 𝑁 7 Paso 4. Calculamos la Varianza en X (número de días). ∑𝑛𝑖=1(𝑥𝑖2 ) 15.596 2 𝜎𝑥 = − (𝑥̅ )2 = − (42,86)2 = 391,02 𝑁 7 Paso 5. Calculamos los coeficientes de regresión. 𝜎𝑥𝑦 −139,36 𝑏̂ = 2 = = −0.36 𝜎𝑥 391,02 𝑎̂ = 𝑦̅ − 𝑏̂𝑥̅ = 27,28 − (−0.36)42,86 = 42,71 Paso 6. Establecemos la recta de regresión 𝑦𝑖 = 𝑎̂ + 𝑏̂ ∗ 𝑥𝑖 , 𝑦𝑖 = 42,71 − 0.36 ∗ 𝑥𝑖
64
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
Tiempo para realizar una pieza
50 45 40 35
30 25 20 15 10 5 0 0
10
20
30
40
50
60
70
80
Número de días
Si es confiable. La recta intersecta el eje vertical, entre 42 y 45, aproximadamente. Y la pendiente negativa, concuerda con una recta decreciente. c. Grado de relación de las dos variables. Paso 7. Calculamos la Variaciones Típicas. ∑𝑛 (𝑥 2 ) 15.596 𝜎𝑥 = √ 𝑖=1 𝑖 − (𝑥̅ )2 = √ − (42,86)2 = 19,77 𝑁 7
65
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 ∑𝑛𝑖=1(𝑦𝑖2 ) 5.649 √ 𝜎𝑦 = − (𝑦̅)2 = √ − (27,28)2 = 7,92 𝑁 7 Paso 8. Aplicamos la fórmula del coeficiente de correlación lineal. 𝜎𝑥𝑦 −139,36 r= = = −0,89 𝜎𝑥 𝜎𝑦 19,77 ∗ 7,92 Al ser el coeficiente de correlación negativo, la correlación es inversa. Como el coeficiente de correlación es próximo a 1 (0,89), la correlación es fuerte. El grado de la relación es Bueno. d. Tiempo que deberá tardar un empleado, cuando lleven 90 días. 𝑦𝑖 = 42,71 − 0.36 ∗ 𝑥𝑖 , 𝑦𝑖 = 42,71 − 0.36 ∗ 90 = 10,31 minutos
3. Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas. A continuación se presentan los resultados: Estatura (cm) 120 124 107 118 112 110 115 104 110 116 Peso (Kg) 24 23 19 24 21 19 22 16 20 23 a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? c. Determine el grado de correlación de las dos variables. d. Cuál es el peso que debería tener un estudiante que mida 128 cm? 66
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 SOLUCION a. Variable dependiente (Y) y la Variable independiente (X). Considero que a mayor estatura, mayor peso. Por lo tanto, la variable dependiente (Y) corresponde al Peso. Y la variable independiente (X) corresponde a la estatura. Organizando los datos: Estatura (cm) 104 107 110 110 112 115 116 118 120 124 Peso (Kg) 16 19 19 20 21 22 23 24 24 23 Diagrama de dispersión. 30 25
Peso (Kg)
20 15
10 5 0 100
105
110
115
120
125
Estatura (cm)
67
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 La asociación entre las variables es lineal. b. Modelo Matemático. Paso 1. Realizamos la Tabla. 𝑥𝑖 104 107 110 110 112 115 116 118 120 124 TOTAL 1.136
𝑦𝑖 16 19 19 20 21 22 23 24 24 23 211
𝑥𝑖 𝑦𝑖 1.664 2.033 2.090 2.200 2.352 2.530 2.668 2.832 2.880 2.852 24.101
𝑥𝑖2 10.816 11.449 12.100 12.100 12.544 13.225 13.456 13.924 14.400 15.376 129.390
𝑦𝑖2 256 361 361 400 441 484 529 576 576 529 4.513
Paso 2. Hallamos las Medias Aritméticas. ∑𝑛𝑖=1(𝑥𝑖 ) 1.136 ∑𝑛𝑖=1(𝑦𝑖 ) 211 𝑥̅ = = = 113,6 ; 𝑦̅ = = = 21,1 𝑁 10 𝑁 10 Paso 3. Calculamos la Covarianza. ∑𝑛𝑖=1(𝑥𝑖 𝑦𝑖 ) 24.101 𝜎𝑥𝑦 = − 𝑥̅ 𝑦̅ = − 113,6 ∗ 21,1 = 13,14 𝑁 10 68
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 Paso 4. Calculamos la Varianza en X (estatura). ∑𝑛𝑖=1(𝑥𝑖2 ) 129.390 2 𝜎𝑥 = − (𝑥̅ )2 = − (113,6)2 = 34,04 𝑁 10 Paso 5. Calculamos los coeficientes de regresión. 𝜎𝑥𝑦 13,14 𝑏̂ = 2 = = 0,39 𝜎𝑥 34,04 𝑎̂ = 𝑦̅ − 𝑏̂𝑥̅ = 21,1 − 0,39 ∗ 113,6 = −23,20 Paso 6. Establecemos la recta de regresión 𝑦𝑖 = 𝑎̂ + 𝑏̂ ∗ 𝑥𝑖 , 𝑦𝑖 = −23,20 + 0,39 ∗ 𝑥𝑖
69
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 30 25
Peso (Kg)
20 15
10 5 0 100
105
110
115
120
125
Estarura (cm)
No es confiable. La recta intersecta el eje vertical, entre 15 y 20, aproximadamente, lo cual contradice a -23,20. c. Grado de relación de las dos variables. Paso 7. Calculamos la Variaciones Típicas. ∑𝑛 (𝑥 2 ) 129.390 𝜎𝑥 = √ 𝑖=1 𝑖 − (𝑥̅ )2 = √ − (113,6)2 = 5,83 𝑁 10 ∑𝑛𝑖=1(𝑦𝑖2 ) 4.513 √ 𝜎𝑦 = − (𝑦̅)2 = √ − (21,1)2 = 2,47 𝑁 10
70
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 Paso 8. Aplicamos la fórmula del coeficiente de correlación lineal. 𝜎𝑥𝑦 13,14 r= = = 0.91 𝜎𝑥 𝜎𝑦 5,83 ∗ 2,47 Al ser el coeficiente de correlación positivo, la correlación es directa. Como el coeficiente de correlación está muy próximo a 1 (0,91), la correlación es muy fuerte. El grado de la relación es Excelente. d. Peso que debería tener un estudiante que mida 128 cm. 𝑦𝑖 = −23,20 + 0,39 ∗ 𝑥𝑖 , 𝑦𝑖 = −23,20 + 0,39 ∗ 128 = 26,72 Kilogramos.
71
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
VIKY XIMENA GUTIERREZ
SOLUCION 1 A) Realice el diagrama de dispersión y determine el tipo de asociación entre las variables RTA: X (sal) 1,6 2,3 3,3 4,2 4,6 5
Y (Tensión) 98 102 109 113 115 120
72
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
DIAGRAMA DE DISPERSION 140 y = 6.1062x + 88.128 R² = 0.987
120
Y (TENSION)
100 80
60 40 20 0 0
1
2
3
4
5
6
X (SAL)
} B) Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? RTA: Y 6,1062x + 88,128
R2 0,987
CONFIABLE? Respecto a lo que indica la gráfica, tiene un 98% de confiabilidad
73
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 C) Determine el grado de relación de las dos variables. RTA: El grado de relación de las 2 variables es excelente: 0,987 D) Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la tensión arterial esperada? RTA: X
SAL
Y
TENSION
Y
6,1062x + 88,128 5,6 5,6=6,1062x + 88,128
Y
5,6-88,128=6,1062x 82,5/6,1062x
TENSION ARTERIAL
13,5
SOLUCION 2 A) Identifique la variable dependiente (y) y la variable independiente (x),realice el diagrama de dispersión y determine el tipo de asociación entre las variables RTA:
74
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 X
Y 12 23 35 42 53 65 70
45 30 27 25 23 21 20
Y
DIAGRAMA DE DISPERSION 50 45 40 35 30 25 20 15 10 5 0
y = -0.3566x + 42.569 R² = 0.7963
0
10
20
30
40
50
60
70
80
X
75
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 B) Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? RTA: Y 0,3566x + 42,569
R2 0,7963
CONFIABLE? Tiene un bajo promedio, no es tan confiable
C) Determine el grado de correlación de las dos variables. RTA: el grado de correlación de las 2 variables es de: 0,7963 D) Que tiempo deberá tardarse un empleado cuando lleven 90 días? RTA: Y
-0,3566x + 42,569
Y
90 90-0,3566x+42,569 90-42,569*0,3566x
TIEMPO QUE DEBERA TARDARSE EL EMPLEADO
74 DIAS
76
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
SOLUCION 3 A) Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables RTA: PESO ESTATURA(CM) (KG) 120 124 107 118 112 110 115 104 110 116
24 23 19 24 21 19 22 16 20 23
77
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
DIAGRAMA DE DISPERSION 30
PESO (KG)
25 20 15
y = 0.386x - 22.751 R² = 0.8329
10 5 0 100
105
110
115
120
125
ESTATURA (CM)
B) Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable?
RTA: Y
0,386x – 22,751
78
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 R2 0,8329 R 0,9126 Respecto a lo que indica la gráfica con un 0,8329 de confiablidad, es excelente C) Determine el grado de correlación de las dos variables. RTA: El grado de correlación es de 0,8329 D) Cuál es el peso que debería tener un estudiante que mida 128 cm? RTA: Y Y PESO QUE DEBERIA TENER UN ESTUDIANTE
0,386x – 22,751 0,386x*128-22,751 26
79
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
KAROL BEDOYA CHAVEZ
EJERCICIO 1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después. X (sal) 1.6 2.3 3.3 4.2 4.6 5.0
Y (tensión) 98 102 109 113 115 120
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables:
ASOCIACION DE CONSUMO ENTRE SAL Y TENSION ARTERIAL 140 120
98
102
109
120 113 115
80
TENSION
100 80
60 40
TENSION
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
y = 6,1062x + 88,128R² = 0,987
La tensión arterial depende de la ingesta de sal esto la hace tener una relación directa ya que al aumentar el consumo de sal aumenta la tensión arterial.
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? El modelo lineal que predice el efecto de una variable sobre la otra es el siguiente: y= 6,1062x + 88,128
81
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 R² = 98 % Coeficiente de determinación R= 0,99 Coeficiente de Correlación El modelo es confiable ya que el coeficiente de determinación R2 está muy cercano a 1. c. Determine el grado de relación de las dos variables. R: Coeficiente de correlación 0,99 lo cual determina una correlación excelente entre las dos variables. d. Si a un paciente se le administra una dosis de (X) sal de 5,6. ¿Cuál es la tensión arterial esperada? y= 6,1062x + 88,128 X= 5,6 Y= 6,1062(5,6) +88,128 Y=122,32 La tensión arterial esperada a la ingesta de sal corresponde a la variable contenida en Y= a 122.32
82
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
EJERCICIO 2. En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha considerado que era importante ir anotando periódicamente el tiempo medio (medido en minutos) que se utiliza para realizar una pieza y el número de días desde que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de producción. Los siguientes datos representan dicha situación: X 12 23 35 42 53 65
Y 45 30 27 25 23 21
83
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 70
20
a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables
EJERCICIO 2 Series1 45
50
(Y) TIEMPO EN MINUTOS
Linear (Series1)
40 30
27
30
25
23
21
20
20
10 0 0
10
20
30
40
50
60
70
80
(X) DIAS DE PRODUCCION
y = -0,3566x + 42,569R² = 0,7963
La variable dependiente (y) son los minutos que se demoran en realizar la artesanía y la variable independiente (x) son el número de días que van pasando, entre más días pasan más rápido hacen el trabajo. El tipo de asociación es inversa: Si aumenta una magnitud la otra disminuye y viceversa, al aumentar el número de días los minutos de elaboración de la artesanía disminuye.
84
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? Y = -0,3566x + 42,569 R² = 0,796 Coeficiente de determinación R= 0.89 Coeficiente de correlación El modelo es medianamente confiable ya que el coeficiente de determinación R2 no está muy cercano a 1. c. Determine el grado de correlación de las dos variables. R= 0.89 Coeficiente de correlación¸ lo cual determina una correlación aceptable entre las dos variables. d. Que tiempo deberá tardarse un empleado cuando lleven 90 días? Y = -0,3566x + 42,569 X= 90 Y= -0,3566(90) + 42,569 Y=10,4 85
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
EJERCICIO 3 Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello selecciona 10 niños y realiza las mediciones respectivas. A continuación se presentan los resultados: ESTATURA (CM) PESO (KGS) 120 24 124 23 107 19 118 24 112 21 110 19 115 22 104 16 110 20 116 23
86
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 a. Identifique la variable dependiente (y) y la variable independiente (x), realice el diagrama de dispersión y determine el tipo de asociación entre las variables
EJERCICIO 3 30 25 19
PESO
20
20 19
21
22 23
24
24
23
16
15
y = 0,386x -22,751R² = 0,8329 10
5 0 100
105
110
115
120
125
ESTATURA
La variable dependiente (y) es el peso y la variable independiente (x) es la altura de los estudiantes, entre más altura mayor peso. El tipo de asociación es directa si aumenta una magnitud la otra aumenta- si disminuye una magnitud la otra también disminuye, si aumenta la altura también aumenta el peso en los estudiantes.
87
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040 b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? Y = 0,386x - 22,751 R² = 0,832 Coeficiente de determinación R= 0,91 Coeficiente de correlación El modelo es medianamente confiable ya que el coeficiente de determinación R2 no está muy cercano a 1. c. Determine el grado de correlación de las dos variables. R= 0,91 Coeficiente de correlación, lo cual determina una correlación excelente entre las dos variables. d. Cuál es el peso que debería tener un estudiante que mida 128 cm? Y = 0,386X - 22,751 X= 128 Y= 0,386(128) - 22,751 Y=26,657 UN ESTUDIANTE DEBERIA PESAR 26.657 KILOGRAMOS
88
Universidad Nacional Abierta y a Distancia – UNAD - Vicerrectoría Académica y de Investigación - VIACI Escuela: Escuela de Ciencias Sociales, Artes y Humanidades. Programa: Psicología Curso: Estadística Descriptiva Código: 204040
89