UNIVERSIDAD DE SAN MARTIN DE PORRES
Y
• •
• • •• • • •
X
• •• • • •• ••• • •• ••
Análisis de Regresión y Correlación Prof.: DR. LUIS ROBLE ALEMAN
Y
• • • • • • • • •
X
Lineal Positiva
Y
Lineal Negativa con Mayor dispersión
• • • • • •• •
•
•
•
X
BIOESTADISTICA 2004
Lineal Negativa
Y
• •• •• • • • • •• • • • • • • •• •• • • ••
X
Ninguna Relación
Diagramas de Dispersión Y
¾Es un gráfico que permite detectar la existencia de una relación entre dos variables. ¾Visualmente se puede buscar patrones que indiquen el tipo de relación que se da entre las variables.
• • •• • • • • • •• • • •
Correlación Simple El análisis de correlación es un grupo de técnicas estadísticas que nos permiten medir la intensidad de la relación que puede existir entre dos variables, su grado de relación y su sentido.
X
Curvilínea Positiva
Y
• • •• •• • • •• • • • • • X
Curvilínea Negativa
El objetivo es determinar qué tan intensa es la relación y utilizamos para ello el coeficiente de correlación.
1
Coeficiente de Correlación Simple Ejemplo 1 Mediciones de la presión sanguínea sistólica (mmHg) mediante dos métodos en 25 pacientes con hipertensión esencial.
Prueba de hipótesis parámetro D 1. Planteamiento: Ho : ρ = 0 Hi : ρ = 0 2. Nivel de significación 5% 3.Estadístico de prueba:
tc=
r
n–2 1–r2
Prueba de hipótesis acerca del parámetro D (rho) Saber si X e Y están correlacionados: Ho : ρ = 0 H1 : ρ = 0 Estadístico de prueba es:
tc=
r
n–2 1–r2
tc
Ejemplo 1
= 0.95
25 – 2
= 14.41
1 – (0.95) 2
t n-2
Æ
t23 =
3.788 y como tc=14.41 se tiene que
p< 2*(0.0005) = 0.001 Decisión: Como p <0.001, rechazamos la Ho Conclusión: Se puede afirmar que existe correlación lineal (positiva) entre las variables, presión sanguínea y respuesta al TRATAMIENTO.
2
Análisis de Regresión Objetivo
Línea de Regresión
Estimadores Mínimo-Cuadráticos
Estudio de la relación funcional entre dos variables. Establecer una relación cuantitativa entre dos o más variables relacionadas. Se trata de PREDECIR y/o EXPLICAR el valor de una variable (v. Dependiente), dado el valor de otra(s) variable(s) relacionada(s) (v. Independiente(s)). Las variables X e Y deben ser de naturaleza cuantitativa y de preferencia continua.
Regresión Lineal Simple •Para resolver el problema tenemos que AJUSTAR una línea entre los puntos observados, a fin de usarla para predecir el valor de Y (variable dependiente) a partir de un valor conocido de X (variable independiente). •Para cada valor de X hay una subpoblación de valores Y. •Cada subpoblación de los valores de Y tiene distribución normal.
Como todos los puntos no están exactamente sobre una línea recta, se cometen errores en el ajuste.
Ejemplo 2
Línea de Regresión Suposiciones de regresión y correlación a) Normalidad: los valores de Y estarán distribuidos normalmente a cada valor de X. b) Homoscedasticidad: la variación alrededor de la línea de regresión será constante para todos los valores de X. c) Independencia de error: el error (diferencia residual entre un valor observado y uno estimado de Y) sea independientemente de cada valor de X. d) Linealidad: la relación entre las variables es lineal.
Una compañía farmacéutica conduce un estudio piloto para evaluar la relación entre tres dosis en un nuevo agente hipnótico y tiempo de sueño. Los resultados de este estudio son presentados de la siguiente manera.
Tiempo de sueño en horas: Dosis (mg/Kg)
3
Diagrama de Dispersión
Estimación de la Recta de Regresión
Según el diagrama de dispersión, se espera una relación positiva o directa entre ambas variables. Modelo de regresión:
9
9
Por consiguiente el modelo de Regresión Estimado es:
y =a+bx
Cálculos Estadísticos
Que significa: Por cada mg/Kg de incremento de dosis (agente hipnótico) su respectivo tiempo de sueño promedio aumentará en 0,5 horas. Es importante interpretar los resultados obtenidos en función de las unidades en que se encuentran expresadas nuestras variables en estudio (y).
4