SEP
SNEST
DGEST
INSTITUTO TECNOLÓGICO DE TOLUCA
ESTADISTICA INFERENCIAL II Unidad I: Regresión Lineal Múltiple
Carrera: Ingeniería industrial a distancia
P R E S E N T A: Javier Ruiz Palafox Maestro: Ing. Claudia Georgina Santiesteban Alcántara
Toluca, Estado de México, a 08 de febrero de 2019
Javier Ruiz Introducción El Análisis de Regresión Lineal Múltiple nos permite establecer la relación que se produce entre una variable dependiente Y y un conjunto de variables independientes (X1, X2,... XK). El análisis de regresión lineal múltiple, a diferencia del simple, se aproxima más a situaciones de análisis real puesto que los fenómenos, hechos y procesos sociales, por definición, son complejos y, en consecuencia, deben ser explicados en la medida de lo posible por la serie de variables que, directa e indirectamente, participan en su concreción. 1.1 Regresión Lineal Múltiple 1.1.1 Prueba de hipótesis en la regresión lineal múltiple Las hipótesis sobre los parámetros del modelo son equivalentes a las realizadas para regresión lineal simple, pero ahora son más necesarias porque en regresión múltiple tenemos más parámetros en el modelo; sin embargo, por lo general es necesario evaluar su verdadera contribución a la explicación de la respuesta. La hipótesis global más importante sobre un modelo de regresión múltiple consiste en ver si la regresión es significativa. Esto se logra probando la siguiente hipótesis:
Aceptar Ho significa que ningún término o variable en el modelo tiene una contribución significativa al explicar la variable de respuesta Y. Mientras que rechazar Ho implica que por lo menos un término en el modelo contribuye de manera significativa a explicar Y. Ejemplo Se probará la significación de la regresión con estaturas y edades de la tabla 1.5
utilizando los datos de los pesos,
El valor de Fo calculado por formula nos da un valor de Fo=10.9402, por comodidad observamos el resumen arrojado por Excel. En tanto que el valor de F encontrado en tablas cuando tenemos un nivel de significancia de 0,05 y 2 grados de libertad en el numerador y 9 en el denominador el cual es igual a 4,26 2
Javier Ruiz 1.1.2 Intervalos de confianza y predicción en regresión múltiple
En los modelos de regresión múltiple con frecuencia es conveniente construir estimaciones de intervalos de confianza para los coeficientes de regresión . Por ejemplo, a partir de la tabla 1.6 es claro que un estimador por intervalos de cada coeficiente en lo individual está dado por:
También es posible obtener un intervalo de confianza con respecto a la respuesta media en un punto particular, digamos está dado por:
1.1.3 Uso de software estadístico Para capturar la tabla de datos para el análisis de regresión lineal múltiple, primeramente capturamos los datos en la hoja de cálculo, posteriormente activamos Datos seguido de Análisis de datos y seleccionamos Regresión y aceptar. 3
Javier Ruiz
En la ventana de captura se solicitará el rango de celdas donde se encuentran los datos para la variable dependiente Rango Y de entrada y para la (s) variable (s) regresora (s) Rango X de entrada (para los datos de X1 y X2, se sombrean ambos simultáneamente con el ratón, en este caso a partir de la columna 2)
Activamos la casilla de rótulos, por default está indicado en una hoja nueva, seleccionamos además cualquiera de las opciones de residuo, grafica de residuales y curva de regresión ajustada y aceptar y tendremos el resultado. 1.2 Regresión no lineal Si las dos variables X y Y se relacionan según un modelo de línea recta, se habla de regresión lineal simple
Cuando las variables X y Y se relacionan según una línea curva, se habla de regresión no lineal o curvilínea. Aquí se puede distinguir entre regresión parabólica, exponencial, potencial etc.
4
Javier Ruiz
Anexo Diagrama de dispersión: Un diagrama de dispersión o gráfica de dispersión o gráfico de dispersión es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos Coeficiente de regresión y correlación: Se llama coeficiente de regresión a la pendiente de la recta de regresión y el coeficiente de correlación de Pearson es una medida lineal entre dos variables aleatorias cuantitativas. Como se calcula un ANOVA: Las expresiones para el cálculo de los elementos que intervienen en el ANOVA son las siguientes
Conclusiones La regresión múltiple, analiza la relación de dos o más variables continuas, cuando analiza dos variables a esta se él conoce como variable bivariantes que pueden corresponder a variables cualitativas. La finalidad de una ecuación de regresión es la de estimar los valores de una variable con base en los valores conocidos de la otra. Del mismo modo, una ecuación de regresión explica los valores de una variable en términos de otra. Es decir, se puede intuir una relación de causa y efecto entre dos o más variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una.
Fuentes bibliográficas
Anónimo. (2019). Estadística inferencial II. 10/02/2019, de Internet Sitio web: https://rua.ua.es/dspace/bitstream/10045/8143/1/Regresion%20MUTIPLE.pdf Anónimo. (2019). Estadística inferencial II. 10/02/2019, de Internet Sitio web: https://www.academia.edu/8137314/Estad%C3%ADstica_Inferencial_II Anónimo. (2019). Estadística inferencial II. 10/02/2019, de Internet Sitio web: https://es.wikipedia.org/wiki/Diagrama_de_dispersi%C3%B3n
5
Javier Ruiz
Anónimo. (2019). Estadística inferencial II. 10/02/2019, de Internet Sitio web: https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson
6