Paso 4-Descripción de la Información.
Presentado por: Mauricio Fernando Flórez polo Código: 1072262677
Tutor: Genaro Penagos
Grupo: 100105_321
Universidad Nacional Abierta y a Distancia (UNAD) CCAV Sahagún – Córdoba Estadística Descriptiva Noviembre de 2018
INTRODUCCIÓN. En el presente trabajo se presenta las soluciones de las actividades planteadas A partir de la base de datos suministrada calidad en el servicio de urgencias. La realización de este trabajo es dar a conocer y poner en práctica la regresión y correlación y medias de dispersión y estadísticas bivariantes sobre la unidad 2 de este curso, además de los comportamientos que se dan en el plano cartesiano tanto en las variables, como los grados y resultados que se manejan para los ejemplos que se plantean en el laboratorio propuesto, que es de vital importancia reconocer y manejar las fórmulas que se obtienen de la herramienta de Excel.
JUSTIFICACIÓN. Partiendo de una base de datos calidad en el servicio de urgencias se presenta las soluciones de las actividades planteadas aplicaremos el proceso de regresión lineal simple para determinar tanto la naturaleza como la fuerza de una relación entre dos variables y segundo lugar la regresión lineal múltiple con la cual describiremos la relación entre dos o más variables independientes y una variable dependiente utilizando la ecuación de regresión múltiple; estas ecuaciones de estimaciones nos permitirá realizar una interpretación de correlación de la investigación realizada. El trabajo de laboratorio constituye una de las mejores metodologías para la aplicación de modelos estadísticos a las variables de los hechos.
OBJETIVOS Objetivos Generales
Detallar y Relacionar variables de la problemática utilizando Medidas Bivariantes, determinar la relación entre dos o más variables inscritas en una situación específica a partir del análisis de regresión lineal simple.
Objetivos Específicos
1. Determinar la relación existente entre dos variables cuantitativas a través de las herramientas Infostat y Excel
2. Realizar diagramas de dispersión en los ejercicios de laboratorio y actividades colaborativas que permitan determinar el tipo de asociación entre las variables escogidas en cada ejercicio.
3. En los ejercicios propuestos de laboratorio y de regresión y correlación lineal simple crear modelos matemáticos que permita predecir el efecto de una variable sobre la otra para determinar su fiabilidad.
4. Determinar porcentajes que permitan una explicación de modelo y grado de relación de dos variables de los ejercicios de laboratorio y de regresión y correlación lineal simple.
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas. Edad Estatura EDAD 3 31 62 64 4 65 55 1 18 42 23 8 71 53 20 2 73 25 35 5 24 23 19 54 19 21 56 43 5 21
variable dependiente variable in dependiente ESTATURA (M) 0,65 1,74 1,58 1,59 1 1,65 1,7 0,73 1,62 1,53 1,65 1,18 1,69 1,58 1,53 0,85 1,64 1,75 1,6 1,03 1,55 1,58 1,78 1,66 1,7 1,79 1,72 1,68 1,03 1,63
y x
54 51 26 22 0 26 73 85 7 16 52 4 20 68 54 44 3 81 20 40 40 0 61 23 34 31 17 3 59 19 0 44 75 75 82 33 39 23 37 48 50
1,73 1,68 1,58 1,65 0,45 1,78 1,5 1,64 1,16 1,52 1,58 0,98 1,65 1,59 1,61 1,79 0,96 1,67 1,7 1,68 1,62 0,53 1,59 1,56 1,65 1,68 1,56 0,96 1,67 1,61 0,57 1,8 1,56 1,62 1,67 1,8 1,75 1,65 1,72 1,59 1,63
94 17 55 59 23 87 34 24 1 19 25 5 24 0 52 24 2 49 68 5 37 54 26 1 33 0 21 13 23 39 19 24 45 57 51 17 26 16 22 25 55
1,65 1,52 1,72 1,63 1,86 1,63 1,75 1,57 0,76 1,78 1,62 1,06 1,68 0,57 1,51 1,76 0,86 1,62 1,71 1,1 1,86 1,71 1,59 0,82 1,76 0,47 1,62 1,4 1,51 1,81 1,66 1,6 1,63 1,58 1,67 1,72 1,65 1,56 1,63 1,67 1,64
23 58 48 39 36 60 47 17
1,61 1,68 1,8 1,72 1,75 1,67 1,55 1,72
Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables.
Diagrama de dispersión 2.5
Estatura
2 1.5 1 y = 0.0084x + 1.2276 R² = 0.3417
0.5
0 0
20
40
60
80
100
Edad
El tipo de asociación entre las dos variables es directamente proporcional.
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? 𝑦 = 0,0084𝑥 + 1,2276 𝑅 2 = 0,3417
𝑅 2 = 34,17%, lo cual quiere decir que no es muy confiable
Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. 𝑅 2 = 0,8774 ∗ 100 = 87,74% porcentaje de explicación 𝑟 = √0,8774 𝑟 = 0,9366 grado de relación entre dos variables
la correlación entre las variables porcentaje de hidrocarburo y la pureza es excelente. Relacionar la información obtenida con el problema. Según la base los resultados obtenidos en el diagrama de dispersión de las dos variables seleccionada de la base de datos podemos determinar que la relación entre la edad y el peso de los pacientes es directamente proporcional
Anexo: Laboratorio Regresión y Correlación Lineal.
LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL.
CH-Pureza. El rendimiento del producto de un proceso químico está relacionado con la temperatura de operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que está presente en el condensador principal en un proceso de destilación, de acuerdo con los siguientes datos:
X (% de Hidrocarburos) 0,99 1,02 1,15 1,29 1,46 1,36 0,87 1,23 1,55 1,4 1,19 1,15 0,98 1,01 1,11 1,2 1,26 1,32 1,43 0,95
Y (Pureza) 90,01 89,05 91,43 93,74 96,73 94,45 87,59 91,77 99,42 93,65 93,54 92,52 90,56 89,54 89,85 90,39 93,25 93,41 94,98 87,33
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
RENDIMIENTO DEL PRODUCTO DE UN PROCESO QUIMICO 102
y = 14,947x + 74,283 R² = 0,8774
100 98
PUREZA
96 94 92 90 88 86 0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
% DE HIDROCARBURO
Posee tendencia positiva y relación directa entre el % de hidrocarburo y la pureza puesto que a medida que él % aumenta la pureza también aumenta es decir que la pureza si depende del % de hidrocarburo. La ecuación matemática es confiable en un 87,74%. b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? y = 14,947x + 74,283
R² = 0,8774
R²= coeficiente de determinación = 87,74% por lo tanto es confiable
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. R= coeficiente de correlación R= raíz cuadrada de 0,8774
R= 0,93% La correlación es excelente
d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?
y= pureza. x= hidrocarburo? y= 91,3 91,3= 14,947x+74,283 91,3-74,283=14,947x 17,02/14,947=x x= 1,13 Cuando el oxígeno es igual a 91,3 el porcentaje del hidrocarburo será 1,13%.
Tem-Vapor. El número de libras de vapor (y) consumidas mensualmente por una planta química, se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se registraron los siguientes valores de temperatura y consumo anual.
Mes
x Temperatura (°F)
y Consumo de vapor (Lb)
Ene. Feb. Mar. Abr. May. Jun. Jul. Ago. Sep. Oct. Nov. Dic.
21 24 32 47 50 59 68 74 62 50 41 30
185,79 214,47 288,03 424,84 455 539 621,55 675,06 562,03 452,93 369,95 273,
CONSUMO MENSUAL DE VAPOR POR UNA PLANTA QUIMICA CONSUMO DE VAPOR (LB)
800
y = 9.2087x - 6.3184 R² = 0.9999
700 600 500 400 300 200 100 0 0
10
20
30
40
50
60
70
80
TEMPERATURA °F
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
Tendencia positiva, existe una relación directa entre la temperatura y el consumo de vapor, por lo tanto el número de libras de vapor consumidas mensualmente por una planta química si se relaciona con la temperatura la cual está representada en °F, su correlación es excelente con un 0,99%, la R² = 99,99 lo que significa que posee un alto grado de confiabilidad.
b. Encuentre el modelo matemático que permite predecir el efecto de una otra. ¿Es confiable? y = 9,2087x - 6,3184
variable sobre la
R² = 0,9999
R²= coeficiente de determinación= 99,99 % lo cual es confiable. c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.
R= coeficiente de correlación
R= raíz cuadrada de 0,9999% R= 0,99% La correlación es excelente
d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 °F?
y= consumo de vapor? x= temperatura en °F x= 70 °F y= 9,2087(70) + 6,3184 y= 644,609 + 6,3184 y= 650,9. Cuando la temperatura es igual a 70 °F el consumo de vapor será 650,9%
%-Umbral. Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables aleatorias
x (porcentaje de sobrepeso)
y (umbral de reflejo de flexión nociceptiva)
89 90 75 30 51 75 62 45 90
2 3 4 4,5 5,5 7 9 13 15
20
14
a- Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
UMBRAL DE REFLEJO DE REFELXIÓN
O BE S I DAD Y RE S P UE S TA I NDI V I DUAL AL DO LO R 16
14
y = -0,0629x + 11,642 R² = 0,1115
12 10 8 6 4 2 0 0
20
40 60 % DE SOBREPESO
80
100
Tendencia negativa, existe una relación inversa entre % de sobrepeso y el umbral de reflejo de flexión a medida que aumenta el % de sobrepeso, disminuye el Umbral de reflejo de flexión, la correlación entre las dos variables es mínima con un 0,33%, también es posible afirmar que este modelo no es recomendable puesto que posee un grado de confiabilidad muy bajo por tener un R²= 11,15%. b- Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. Es confiable? y = -0,0629x + 11,642 R² = 0,1115 R²= coeficiente de determinación = 11,15 % por lo tanto no es confiable c-Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. 𝑅 𝟐 = 0,1115 ∗ 100 = 11,15% porcentaje de explicación
𝑟 = √0,1115
R= raíz cuadrada de 0,1115 R= 0,33% La correlación es mínima
d-¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de sobrepeso, de 40?
y= umbral de reflejo de flexión nociceptiva? x= porcentaje de sobrepeso X= 40 % Sobrepeso y= (-0,0629) (40)+ 11,642 y= -2,516 + 11,642 y= 9.126 Cuando el porcentaje de sobrepeso es de 40%, el umbral de reflejo de flexión nociceptiva es de 9,126.
REFERENCIAS BIBLIOGRÁFICAS
Estadística descriptiva. Campus virtual UNAD http://campus03.unad.edu.co/ecbti04/mod/forum/view.php?id=3900
Ortegón Pava, Milton Fernando. Análisis de las medidas univariantes https://www.youtube.com/watch?v=Ktk263q-W-4