Econometría
Trabajo Práctico Econometría Salarios y Nivel Educativo
Integrantes: ► Roberto Jara ► Jorge Sepulveda ► Jimmy Arias
CONTENIDO
1.
INTRODUCCION ..............................................................................................................................................................3
2.
DATOS ............................................................................................................................................................................4
3.
RESULTADOS EMPIRICOS ...............................................................................................................................................5
4.
CONCLUSION ..................................................................................................................................................................8
2
1. INTRODUCCION En el siguiente trabajo analizaremos como se ven afectados los salarios en relación al nivel educacional de las personas, considerando también otros coeficientes como la edad y el sexo. Los datos analizados corresponden a 65.000 hogares en EE.UU. tomados al azar, y específicamente a los periodos del año 1992 y 2012. Este set de datos fue entregado por la oficina de Estadísticas Laborales del Departamento de Trabajo, todos estos datos serán procesados a través del software Stata para obtener nuestro modelo de estudio. Se analizaran los distintos coeficientes antes mencionados para determinar cuánto explica el modelo estas variables. El método que usaremos para la estimación del salario dado el nivel educativo de las personas es el de mínimos cuadrados ordinarios MCO. Y= B0+B1X1+ B2X2+B3X3+…+BkXk+u. El Objetivo de MCO es determinar aproximadamente los valores reales de los coeficientes del modelo de regresión B0 y B1X1+ B2X2+B3X3... a partir de los datos de una muestra de las variables, El estimador MCO se basa en una fórmula que aplicada a los datos de la muestra proporciona estimaciones de los coeficientes del modelo de regresión. De acuerdo a las variables que tenemos disponibles, hemos definidos cuatro modelos para estudiar el comportamiento de los salarios: 1. 2. 3. 4. 5.
AHEi = β0+β1*BACHELORi+β2* FEMALEi +β3* AGEi +β4* YEARDUMi +u AHEi = β0+ β1*BACHELORi + β3* AGEi + β4* YEARDUMi +u AHEi = β0+ β2* FEMALEi +β3* AGEi +β4* YEARDUMi +u AHEi = β0+ β1*BACHELORi+β2* FEMALEi +β4* YEARDUMi +u AHEi = β0+β1*BACHELORi+β4* YEARDUMi +u De acuerdo a estos cuatro de modelos de regresión lineal se escogerá para el análisis el que tenga como resultado un mayor coeficiente de determinación, mientras mayor sea el R2, mejor será el ajuste del modelo a los datos. Además se interpretarán todos los coeficientes para entender el comportamiento de todas las variables y por último se realizará un test de hipótesis para comprobar la consistencia del modelo.
3
2. DATOS La información usada para definir y analizar nuestro modelo de Salarios y Nivel Educativo se obtuvieron del archivo CPS92_12 ccontiene los datos de los años 1992 y 2012 (de las encuestas de marzo de 1993 y 2013). Estos datos corresponden a trabajadores de tiempo completo, con más de 35 horas de trabajo por semana durante al menos 48 semanas en el año. Los datos se proporcionan para los trabajadores cuyo nivel de educación más alto es (1) Licenciado Escuela Secundaria, y (2) Licenciatura Nivel Superior. También se creó una nueva variable YEARDUM que tiene valor (1) si es año 1992 y valor (2) si es año 2012. Nuestro modelo explicativo está compuesto por: AHE ganancias promedio por hora YEAR Periodo correspondiente. BACHELOR Variable dummy, 1 si el trabajador tiene una licenciatura; 0 si el trabajador tiene un título de escuela secundaria FEMALE Variable dummy, 1 si es mujer; 0 si es hombre AGE Edad de la persona. YEARDUM Variable dummy creada para poder explicar el modelo en años diferentes o si es 1992 y 1 si es 2012
Cuadro 1: Estadísticas Descriptivas
Variables
Media
Mediana
Std.Dev.
year ahe bachelor female age
2001.89 15.66 0.46 0.43 29.68
1992.00 13.46 0.00 0.00 30.00
10.00 9.44 0.50 0.49 2.82
Min
Max
1992.00 2012.00 1.24 91.46 0.00 1.00 0.00 1.00 25.00 34.00
4
3. RESULTADOS EMPIRICOS Cuadro 2: Modelo General
En el cuadro anteriormente enseñado se puede ver una regresión lineal con todos las variables del modelo, sin embargo la variable “year” presenta un problema en sus datos, ya que tiene información del año 1992 y 2012 por lo tanto se tuvo que agregar una variable Dummy al modelo llamada “yeardum” la cual para el año 1992 es 0 y para el año 2012 es uno, esto nos ayuda a explicar la variación de los años dentro del modelo, lo cual se puede ver en la siguiente regresión Cuadro N°3
Se pude apreciar que la variable yeardum tiene un valor diferente que en la regresión del cuadro N°2, esta variable nos indica que una persona en el año 2012 con todas las demás variables constantes gana 7,2 dólares más en promedio por hora trabajada en Estados Unidos que en el año 1992 5
Si realizamos un test T con una hipótesis donde: Ho; yeardum=0, Hi; yeardum≠0 y con 5 grados de libertad. Podemos concluir que la variable es explicativa al modelo, ya que el valor del test es 57.1siendo mayor que 1.96, por lo tanto se rechaza la hipótesis nula yeardum=0 siendo la variable estadísticamente significativa.
Sin embargo para poder comparar todas las regresiones lineales que se hicieron se hizo un cuadro comparativo: Cuadro N°4 Variable
m1
bachelor
6.373109 .129 -2.8155866 .129 .43696161 .022 7.2977198 .128 -2.6454986 .677
.441876 .023 7.3445471 .13 -3.8785224 .686
-2.1623478 .138 .40481348 .024 8.2048414 .136 .51116647 .727
.32518048
.30367875
.21560448
female age yeardum _cons
r2
m2
m3
6.0829659 .13
m4
m5
6.3001617 .13 -2.8406928 .13
6.0065742 .132
7.28065 .129 10.375916 .115
7.3277059 .131 9.2795413 .105
.30813296
.28624388 legend: b/se
En el cuadro se pude ver que se realizaron 5 modelos diferentes, de los cuales el que tiene mayor r2 es el modelo número 1 que considera todas las variables del modelo. Luego de que se eligió el modelo más óptimo se hizo un test de Breusch-Pagan:
Cuadro N° 5
6
. hettest bachelor female age yeardum Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: bachelor female age yeardum chi2(4) Prob > chi2
= =
3552.96 0.0000
Para saber si las variables eran significativas al modelo se hizo un test de significancia global
Los resultados muestran que el modelo es estadísticamente significativo con un 95% de confianza. Como se pude ver en el cuadro numero 5, el test de Breusch – Pagan arrojo que la regresión lineal del modelo 1 tienen Heterocedasticidad, esto debido a que existe un sesgo en los estimadores de la varianza y los errores estándar, debido a esto se invalidan las pruebas de hipótesis y se realizó una regresión lineal aplicando errores estándar robustos, lo cual nos arrojó el siguiente modelo. Variable
m1
bachelor
6.373109 ,129 -2.8155866 ,129 .43696161 ,022 7.2977198 ,128 -2.6454986 ,677
.441876 ,023 7.3445471 ,13 -3.8785224 ,686
-2.1623478 ,138 .40481348 ,024 8.2048414 ,136 .51116647 ,727
.32518048
.30367875
.21560448
female age yeardum _cons
r2
m2
m3
6.0829659 ,13
m4
m5
m1R
6.3001617 ,13 -2.8406928 ,13
6.0065742 ,132
7.28065 ,129 10.375916 ,115
7.3277059 ,131 9.2795413 ,105
6.373109 ,13 -2.8155866 ,125 .43696161 ,023 7.2977198 ,125 -2.6454986 ,674
.30813296
.28624388
.32518048 legend: b/se
7
4. CONCLUSION Dado los modelos de regresión lineal y los diferentes test que se aplicaron, podemos concluir que las variables son significativas, siendo las más relevantes Bachelor y Yeardum, lo que significa que para obtener un mejor salario en dólares promedio, manteniendo todo lo demás constante, las personas tienen que obtener su licenciatura. Cuando esta variable no fue considerada en el modelo (m3) el r2 bajo considerablemente y la variable Yeardum aumento casi en un punto, lo que nos indica que a mayor cantidad de años de trabajo el sueldo va a aumentar igual, sin embargo si la persona cuenta con su licenciatura esta va a tener un aumento considerablemente mayor. Las demás variables son significativas al modelo sin embargo no tienen mayores variaciones, por lo que solo se evaluaron las dos anteriormente nombradas.
8