CORRELACION Y REGRESION 1. El editor en jefe de un importante periódico metropolitano ha intentado convencer al dueño del periódico para que mejore las condiciones de trabajo en el taller de prensas. Está convencido de que, cuando trabajan las prensas, el grado de ruido crea niveles no saludables de tensión y ansiedad. Recientemente hizo que un psicólogo realizara una prueba durante la cual los prensistas se situaron en cuartos con niveles variables de ruido y luego se le hizo otra prueba para medir niveles de humor y ansiedad. La siguiente tabla muestra el índice de su grado de ansiedad o nerviosismo y el nivel de ruido al que se vieron expuestos. (1,0 es bajo y 10,0 es alto). Nivel de ruido Grado de ansiedad
4 39
3 38
1 16
2 18
6 41
7 45
2 25
3 38
a) Represente gráficamente SOLUCIÓN: 50 f(x) = 4.57x + 16.52 R² = 0.72
45
Grado de ansiedad
40 35 30 25 20 15 10 5 0
0
1
2
3
4 Nivel de ruido
b) ecuación. SOLUCIÓN: y = 4.5667x + 16.517 c) grado de ansiedad en 5. SOLUCIÓN: y = 4.5667*(5) + 16.517 = 39.35
5
6
7
8
d) Calcule e interprete el coeficiente de correlación SOLUCIÓN: r = 84.80% Interpretación: indica una relación lineal exacta positiva intensa (creciente) de 84.80% e) Calcule e interprete el coeficiente de determinación SOLUCIÓN: R = 71.91% Interpretación: la variación del grado de ansiedad quedará explicada en 71,91% por la ecuación de regresión que está en función del nivel de ruido. 2. El Gerente de una Clínica dispone de la siguiente información: Año Cirugías
2001 120
2002 143
2003 150
2004 170
2005 162
2006 158
a) Grafique y determine la ecuación de la tendencia lineal. SOLUCIÓN: 180 160 140
f(x) = 7.63x - 15133.34 R² = 0.65
Cirugías
120 100 80 60 40 20 0 2000
2001
2002
2003
2004
2005
2006
2007
Año
b) Proyecte las cirugías al corazón para el año 2007 SOLUCIÓN: y = 7.6286*(2007) – 15133 = 177.2 Interpretación: indica que para el año 2007 se proyectó 177 cirugías 3. Se ha medido la variación de creatinina en pacientes tratados con Captopril (droga antihipertensión) tras la suspensión del tratamiento con diálisis, resultando la siguiente tabla: Días tras la diálisis: X Creatinina (mg/dl): Y
1 5.
5 5. 7
10 15 20 25 4. 4. 4. 4 2 8 5 2
35 3. 8
a) Calcule el modelo de regresión lineal SOLUCIÓN: Está dado por: y = -0.0552x + 5.475 b) Interprete el coeficiente de regresión. SOLUCIÓN: b= -0.0552, indica que por cada dia de suspensión del tratamiento con diálisis que pase, la variación de creatinina disminuye en promedio en (-0.0552) unidades. c) Si un individuo presenta 8 días tras la suspensión del tratamiento con diálisis, que sucede con la creatinina (mg/dl). SOLUCIÓN: y = -0.0552*(8) + 5.475 = 5.03 Interpretación: indica que si un individuo presenta 8 días tras la suspensión del tratamiento con diálisis, la creatinina esta en 5.03 mg/dl.
PRUEBA DE INDEPENDENCIA 1. Quinientos empleados de una empresa que fabrica cierto producto, sospechoso de estar asociado con alteraciones respiratorias, se clasificaron en forma cruzada con base de grado de exposición al producto y si tenían o no los síntomas de tales alteraciones respiratorias. Los resultados se muestran en la siguiente tabla:
Síntomas presentes Si No Total
Alto 185 120 305
Nivel de Exposición Limitado Sin exposición conocida 33 17 73 72 106 89
Total 235 265 500
¿Proporcionan estos datos la evidencia suficiente para indicar que, en un nivel de significación de 0.05, existe una relación entre el grado de exposición y la presencia de los síntomas de las alteraciones respiratorias? SOLUCIÓN: Hipótesis Ho: No hay relacion entre variables H1: Si existe relacion entre variables Nivel de Significancia: 5% Estadístico: 2
X =∑ 2 c
( Oi−E i )
Ei ( 185−143.35 )2 ( 33−49.82 )2 ( 17−41.83 )2 ( 120−161.65 )2 (73−56.18 )2 ( 72−47.17 )2 2 X c= + + + + + 143.35 49.82 41.83 161.65 56.18 47.17 2 X c =61.356
DECISION: X2t= 5.991 Se rechaza la Hipótesis nula por estar en la zona de rechazo Se puede decir que hay evidencia estadística que las personas con alteraciones respiratorias se deprimen
2. A un grupo de 350 adultos que participaron en una encuesta de salud, se les preguntó si llevaban a no una dieta. Las respuestas (por sexos) son las siguientes
Masculino 14 159 173
A dieta Sin dieta Total
Sexo Femenino 25 152 177
Total 39 311 350
¿Sugieren estos datos que al estar a dieta depende del sexo? Sea = 0.05. SOLUCIÓN: Hipótesis Ho: No hay relacion entre variables H1: Existe relacion entre variables Nivel de Significancia: 5% Estadístico: 2
X =∑ 2 c
( Oi−E i )
Ei ( 14−19.28 )2 ( 25−19.72 )2 ( 159−153.72 )2 ( 152−157.28 )2 X 2c = + + + 19.28 19.72 153.72 157.28 2 X c =3.215 Decisión: X2f= 3.841 No se rechaza la hipótesis alternativa . PRUEBA DE HOMOGENEIDAD 1. En un estudio acerca de la contaminación atmosférica a realizado en dos comunidades, se seleccionó una muestra aleatoria de 200 familias de cada una de dichas comunidades. Se le preguntó a uno de los miembros de cada familia si algún miembro de la misma se sentía afectado por la contaminación atmosférica. Las respuestas son las siguientes:
Comunidad I II Total
¿ Algún miembro de la familia ha sido afectado por la contaminación? Si No Total 43 157 200 81 119 200 124 276 400
¿Pueden concluir los investigadores que las dos comunidades difieren con respecto a la variable de interés? Sea = 0.05 SOLUCIÓN: Hipótesis Ho: Existe homogeneidad H1: No existe homogeneidad Nivel de significancia: 5% Estadistico: 2
X =∑ 2 c
( Oi−E i )
Ei ( 43−62 )2 ( 157−138 )2 ( 81−62 )2 (119−138 )2 2 X c= + + + 62 138 62 138 2 X c =16.877 Decisión: X2f= 3.841 Se rechaza la Hipótesis nula. Hay evidencia estadística para concluir que las muestras no provienen de poblaciones homogeneidad según si algún miembro de la familia ha sido afectado por la contaminación. 2. A cada uno de los varones de una muestra de tamaño 250, extraída de una población que se sospechaba sufría de alguna enfermedad de las articulaciones se les preguntó cuál de tres síntomas lo molestaba mayormente. La misma pregunta se le hizo a una muestra de 300 mujeres que se sospechaba padecían la misma enfermedad. Los resultados fueron los siguientes: ------------------------------------------------------------------------------------Síntoma más molesto Hombres Mujeres -----------------------------------------------------------------------------------Rigidez matutina 111 102 Dolor por la noche 59 73 Hinchazón de las articulaciones 80 125 ------------------------------------------------------------------------------------TOTAL 250 300 -------------------------------------------------------------------------------------Proporcionan estos datos la suficiente evidencia para indicar que las dos poblaciones no son homogéneas con respecto a los síntomas principales? Sea = 0.05 ¿Cuál es el valor de p para esta prueba? SOLUCIÓN: Hipótesis Ho: Existe homogeneidad H1: No existe homogeneidad Nivel de significancia: 5% Estadistico:
2
X =∑ 2 c
( Oi−E i )
Ei ( 111−96.82 )2 ( 59−60 )2 ( 80−93.18 )2 ( 102−116.18 )2 ( 73−72 )2 (125−93.18 )2 X 2c = + + + + + 96.82 60 93.18 116.18 72 93.18 2 X c =7.258 Decisión: X2f= 3.841 Se rechaza hipótesis nula, no existe homogeneidad entre las variables Conclusión: existe diferencias.
SEMINARIO Nº 10 1. Se tiene interés en evaluar si el uso de anticonceptivos orales es un factor de riesgo del infarto miocárdico en mujeres casadas menores de 45 años de edad. Para tal efecto se realiza un estudio comparativo tipo caso control y se obtienen los siguientes resultados: Uso de anticonceptivos orales
Pacientes con infarto Sin infarto Miocárdico Miocárdico (Casos) (Controles) _________________________________________________________________ Si 23 34 Nunca 35 132 _________________________________________________________________ Total 58 166 Se pide calcular e interpretar el odds ratio (OR) SOLUCIÓN:
P( F / E) ODDS 1 P ( F ' / E ) FE∗F ' E ' = = ODDS 2 P ( F / E ' ) F ' E∗FE ' P ( F '/ E ' ) 23∗132 ¿= =2.551 35∗34 ¿=
Conclusión: El uso de anticonceptivos orales es un Factor de Riesgo del infarto miocárdio en mujeres casadas menores de 45 años de edad.
2. Evaluar si niveles altos de colesterol sérico (>250) se considera factor de riesgo de un infarto del miocárdio. Por consiguiente se realiza un estudio comparativo de cohortes y se obtiene los siguientes resultados: Niveles de colesterol
Desarrolla IM No desarrolló IM Total Sérico (mg%) _________________________________________________________ >250 10 125 135 250 21 449 470 _________________________________________________________
Se pide calcular e interpretar el riesgo relativo SOLUCIÓN:
a ( a+ b ) ¿−¿= ( c +dc ) ¿+ ¿ ¿ RR=¿
10 ( 135 ) RR= =1.658 21 ( 470 ) Conclusión: Niveles altos de colesterol sérico (>250) se considera Factor de Riesgo de un infarto del miocárdio.
3. Se desea evaluar si el consumo del tabaco es un factor de riesgo del cáncer de pulmón. Para tal efecto se registraron 550 fumadores de los 649 casos con cáncer de pulmón, comparados con los 300 no fumadores de los 640 controles a. Mostrar una tabla 2x2 con los datos obtenidos. SOLUCIÓN:
TABACO Si No Total b.
CANCER PULMÓN (Casos) (Controles) E E' 550 340 99 300 649 640
Calcular e interpretar el odds ratio asociado con el consumo de tabaco. SOLUCIÓN:
P( F / E) ODDS1 P ( F ' / E ) FE∗F ' E ' ¿= = = ODDS2 P ( F / E ' ) F ' E∗FE ' P ( F'/ E ' ) 550∗300 ¿= =4.902 99∗340 Conclusión: El consumo del tabaco es un Factor de Riesgo del cáncer de pulmón. 4. Se realizó un estudio caso- control para encontrar si la vasectomía es un factor de riesgo del cáncer de próstata. Los datos obtenidos se muestran en la tabla cruzada de abajo. VASECTOMIA Casos Controles TOTAL Si No TOTAL
70 105 175
80 178 258
154 279 433
Calcular el odss ratio. Interpretar los resultados SOLUCIÓN:
P( F / E) ¿=
ODDS 1 P ( F ' / E ) FE∗F ' E ' = = ODDS 2 P ( F / E ' ) F ' E∗FE ' ' P (F / E ')
¿=
70∗178 =1.483 105∗80
Conclusión: La vasectomía es un Factor de Riesgo del cáncer de próstata. 5. Una investigación del riesgo asociado con un agente quimioterápico (Cytarabine) fue realizado por Jolson y sus colaboradores (1992). Los pacientes recibieron una formulación de la droga (grupo expuesto) o la formulación original (grupo no expuesto). El resultado era si el paciente desarrolló toxicidad cerebelosa mientras se encontraba en terapia. Los resultados obtenidos fueron los siguientes: Enfermedad Total Si No ____________________________________ Exposición Si 11 14 25 No 3 31 34 ____________________________________ TOTAL 14 45 59 Calcular e interpretar el riesgo relativo SOLUCIÓN:
a ( a+ b ) ¿−¿= ( c +dc ) ¿+ ¿¿ RR=¿ 11 25 RR= =4.987 3 34
( ) ( )
Conclusión: El agente quimioterápico (Cytarabine) se considera Factor de Riesgo de toxicidad cerebelosa mientras el paciente se encuentra en terapia.