Luis González, Cedula 14291607, UNIDAD DE APOYO Guiria - Sucre Variable dependiente X2: Ingreso familiar, aproximado, medido en miles de Bolívares.
Variables independientes X17: Gasto mensual, en miles de Bolívares, que destina la familia para transporte. X19: Sexo del cabeza de familia. (0) Masculino. (1) Femenino. X20: Edad, en años, del cabeza de familia. X22: Gasto mensual, en miles de Bolívares, que destina la familia en vivienda y servicios. X23: Gasto mensual, en miles de Bolívares, que destina la familia en alimentación Modelo X2 = b0 + b1X17 + b2X19 + b3X20 + b4X22 + b5X23 (a) El procedimiento ANOVA es una prueba de la significancia de la regresión, a fin de determinar si hay una relación lineal entre la variable dependiente X2 y cualquiera de las variables independientes X17, X19, X20, X22 Y X23 Es decir, según los resultados obtenidos en para el modelo Fijamos la hipótesis nula y alterna H0 : b17 = b19 = b20 = b22 = b23 = 0 Ha : bi ≠ 0 al menos para un i, con i = 17, 19, 20, 22 y 23. El rechazo de la hipótesis nula implica que al menos una de las variables independientes consideradas en el modelo contribuye al modelo en forma significativa. La región de rechazo viene dada por F > F α,5;115. Se tiene de la tabla de la distribución de Fisher que F 0,05;5;115 = 2,29. Ahora bien, como F = 176,191 > 2, 29, la hipótesis nula se rechaza. Se puede concluir al nivel del 5%, que existe una relación lineal entre X2 y por lo menos alguna de las variables independientes. (b) El planteamiento de hipótesis nula y alterna es: H0 : bi = 0 Ha : bi ≠ 0, Para i = 17, 19, 20, 22 y 23. Se rechaza la hipótesis nula si |t| > tα/2;115. Se tiene de la tabla que t 0,025;115 = 1,9 aproximativamente. Para un nivel de significancia 5% se rechaza la hipótesis nula para b22 y
b23. También podemos observar que los valores de los p-valor de b22 y b23 son iguales a 0 que confirma el rechazo de la hipótesis nula para las variables independientes X22 y X23, siendo estas 2 variables las que más inciden en el gasto del Ingreso familiar. (C) La regresión múltiple tiene 4 supuestos importantes que hay que seguir para hacer un análisis preciso y no sesgado: Normalidad, Homocedasticidad, Relación lineal y Multicolinealidad. En el grafico P-P Los puntos que siguen aproximadamente una línea recta indicando que los residuos están distribuidos normalmente. No apreciamos tendencia clara en este gráfico, los residuos no presentan estructura definida respecto de los valores predichos por el modelo por lo que no debemos rechazar la hipótesis de homocedasticidad. Se puede observar que no hay presencia de colinealidad ni multicolinealidad en las variables independientes el grafico de dispersión indican muy poca correlación entre ellas