Tema 4
El Modelo de Regresión Lineal General Especificación Pilar González y Susan Orbe Dpto. Economía Aplicada III (Econometría y Estadística)
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
1 / 39
Objetivos de aprendizaje
• Realizar el análisis de la forma funcional en Gretl. • Identificar los principales elementos del modelo econométrico. • Conocer los supuestos básicos del modelo de regresión. • Interpretar los coeficientes desconocidos del modelo. • Gestionar las variables ficticias en Gretl.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
2 / 39
Contenido
1
Planteamiento del modelo.
2
Análisis gráfico y forma funcional. Supuesto de linealidad. Análisis gráfico y forma funcional en Gretl.
3
Variables explicativas cualitativas. Inclusión en el modelo econométrico. Gestión de las variables ficticias en Gretl.
4
Especificación del MRLG. Supuestos básicos del modelo. Interpretación de los coeficientes.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
3 / 39
Contenido
1
Planteamiento del modelo.
2
Análisis gráfico y forma funcional. Supuesto de linealidad. Análisis gráfico y forma funcional en Gretl.
3
Variables explicativas cualitativas. Inclusión en el modelo econométrico. Gestión de las variables ficticias en Gretl.
4
Especificación del MRLG. Supuestos básicos del modelo. Interpretación de los coeficientes.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
4 / 39
Planteamiento del modelo. Modelo econométrico. Variable dependiente
= Parte sistemática + Parte aleatoria Parte sistemática = f (variables explicativas) Parte aleatoria = Perturbación
Pilar González y Susan Orbe | OCW 2013
Y
= f (variables explicativas) + perturbación
Y
= f (X2 , X3 , . . . , Xk ) + u
Tema 4. MRLG: Especificación
5 / 39
Planteamiento del modelo.
Se ha de especificar: • Variables explicativas: cuantitativas y/o cualitativas. • Forma funcional f (.): lineal, cuadrática, logarítmica, ... • La perturbación es aleatoria, por lo que habrá que tener información sobre su distribución: media, varianza, ...
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
6 / 39
Contenido
1
Planteamiento del modelo.
2
Análisis gráfico y forma funcional. Supuesto de linealidad. Análisis gráfico y forma funcional en Gretl.
3
Variables explicativas cualitativas. Inclusión en el modelo econométrico. Gestión de las variables ficticias en Gretl.
4
Especificación del MRLG. Supuestos básicos del modelo. Interpretación de los coeficientes.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
7 / 39
Análisis gráfico y forma funcional. Ejemplo: función de consumo familiar. Modelo económico: C = f (R)
dC >0 dR
(propensión marginal a consumir)
Modelo econométrico: C = f (R) + u
La variable explicativa o regresor es la renta que es cuantitativa. ¿Y la forma funcional? ¿Qué tipo de relación existe entre el consumo y la renta? Instrumento: gráfico del consumo frente a la renta. Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
8 / 39
Análisis gráfico y forma funcional. 60
C o
50
o o oo o
40
o o o
30
o o o
20
o o
10
o oo oo o oo o
o o o
o
o o oo
o oo o
o o o
oo o
o o o
o
o
o
o o o
o o
o o
o
o
o
o
o
0 0
2
4
6
8
10
R
Forma funcional: lineal Ci = β1 + β2 Ri + ui
Pilar González y Susan Orbe | OCW 2013
i = 1, 2, ..., N
Tema 4. MRLG: Especificación
9 / 39
Análisis gráfico y forma funcional. 70
C 65
o o oo
60
o o o o o o o o o o oo o o o o o oo o o o o oo o o o o
55
50
45
40
o o oo o o o o o o oo o o oo o o oo o o o o oo o o o o oo o o o o o o o
35
30
oo o o
o
oo
o
25 0
2
4
6
8
10
R
Forma funcional: cuadrática Ci = β1 + β2 Ri + β3 Ri2 + ui Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
i = 1, 2, ..., N 10 / 39
Análisis gráfico y forma funcional. C 40
30
20
ooo
o
o
10
0
oo
o oo
o
o o
o
o
o o
o
o
o o
o
o
-10
o
o
oo ooo ooo oo o
o o oo oo o o o o o o o oo o o o oo ooo o oo o o o o o oo o o o oo o o o
o
o
-20
-30
-40 0
2
4
6
8
10
R
Forma funcional: logarítmica ln Ci = β1 + β2 ln Ri + ui Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
i = 1, 2, ..., N 11 / 39
Análisis gráfico y forma funcional. Lineal :
Ci
= β1 + β2 Ri + ui
Cuadrática :
Ci
= β1 + β2 Ri + β3 Ri2 + ui
Logarítmica :
ln Ci
Semilogarítmica :
ln Ci Ci
= β1 + β2 ln Ri + ui = β1 + β2 Ri + ui = β1 + β2 ln Ri + ui
¿Es válida cualquier forma funcional dentro del marco del modelo de regresión lineal general?
Supuesto. Linealidad El modelo de regresión lineal es lineal en los coeficientes.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
12 / 39
Análisis gráfico y forma funcional en Gretl.
EJEMPLO 4.1. Análisis gráfico y forma funcional. 1. Representar funciones en Gretl. Ejemplo 4.1.1. 2. Análisis gráfico de los datos y forma funcional. Ejemplo 4.1.2.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
13 / 39
Contenido
1
Planteamiento del modelo.
2
Análisis gráfico y forma funcional. Supuesto de linealidad. Análisis gráfico y forma funcional en Gretl.
3
Variables explicativas cualitativas. Inclusión en el modelo econométrico. Gestión de las variables ficticias en Gretl.
4
Especificación del MRLG. Supuestos básicos del modelo. Interpretación de los coeficientes.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
14 / 39
Variables explicativas cualitativas.
Algunos ejemplos: 1. Género, raza, nivel de estudios, puesto de trabajo, localización, zona de residencia... 2. Estacionalidad, cambios estructurales (crisis/no crisis, ...) 3. Variables cuantitativas recogidas por intervalo: renta, edad, ...
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
15 / 39
Variables explicativas cualitativas. Ejemplo: ventas de una cadena de perfumerías. Una cadena de perfumerías que tiene tiendas en Francia, España e Italia quiere analizar la evolución de sus ventas. Para ello cuenta con datos de las ventas de 350 de sus tiendas para el año 2011, así como la renta promedio del municipio donde se encuentra la tienda.
o o
o
o
o o o o o o o o o o o o o o o o
o o o o o o
Ventas
o
o
o o
Renta Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
16 / 39
Variables explicativas cualitativas. Si consideramos las 350 tiendas conjuntamente, el modelo sería: V = f (R)
⇒
Vi = β1 + β2 Ri + ui
o o
o
i = 1, 2, . . . , 350
o
o o o o o o o o o o o o o o o o
Ventas
o o o o o o
o
o
o o
Renta
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
17 / 39
Variables explicativas cualitativas. Consideremos el siguiente gráfico:
o o o
o o o o o o
o
o
o o o o o o
o
o o o
o o o o o
Ventas
o
o
o o
Renta Francia
Italia
España
⇒ existen diferencias entre las ventas de los diferentes países. V = f (Renta, P aís) Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
18 / 39
Variables explicativas cualitativas.
Ventas
o o
o o o o o o
aF
o
o
o o o o o o
o
o
o o o
o
o o o o
o
o
o o
a
a X = X0
Renta
Es preciso introducir el efecto país en el modelo de regresión de forma que el efecto sobre las ventas de un incremento unitario en la renta sea el mismo en los tres países, pero, para una misma renta, el nivel de ventas sea diferente en cada país. Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
19 / 39
Variables explicativas cualitativas.
Las variables cualitativas se introducen en el modelo a través de variables ficticias.
Variable ficticia. Una variable ficticia es una variable artificial binaria del tipo: (
1
si la característica está presente en la observación i
0
en otro caso
Di =
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
20 / 39
Variables explicativas cualitativas. En principio, se construyen tantas variables ficticias como categorías tenga la variable cualitativa.
Ejemplo. ⇒
Número de categorías: 3 1 0
i ∈ Italia en otro caso
1 0
i ∈ Francia en otro caso
1 0
i ∈ España en otro caso
Ii = Fi = Ei =
Pilar González y Susan Orbe | OCW 2013
3 Variables Ficticias
Tema 4. MRLG: Especificación
21 / 39
Variables explicativas cualitativas. Especificación: Se introducen tantas variables ficticias como categorías tiene la variable cualitativa menos 1, manteniendo el término constante. Vi = β1 + β2 Ii + β3 Fi + β4 Ri + ui
i = 1, 2, ..., 350
Vi | i Italia =
β1 + β2 + β4 Ri + ui
Vi | i Francia =
β1 + β3 + β4 Ri + ui
Vi | i España =
β1 + β4 Ri + ui
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
22 / 39
Variables explicativas cualitativas Representación gráfica.
Ventas
1 3 X
o o
o o o o o o
o
o
o o o o o o
o
o
1 2 X
o o o
o
o
o o o
o
o
o o
1 X
X = X0
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
Renta
23 / 39
Variables explicativas cualitativas ¿Por qué no introducimos todas las variables ficticias? Vi = β1 + β2 Ii + β3 Fi + β4 Ei + β5 Ri + ui
i = 1, 2, ..., 350
Vi | i Italia =
β1 + β2 + β5 Ri + ui
Vi | i Francia =
β1 + β3 + β5 Ri + ui
Vi | i España =
β1 + β4 + β5 Ri + ui
En este modelo con término independiente más las tres variables ficticias, los coeficientes β1 , β2 , β3 , β4 no están identificados porque Fi + Ii + Ei = 1, ∀i.
Supuesto. Ausencia de colinealidad perfecta No existen combinaciones lineales entre los regresores del modelo.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
24 / 39
Gestión de las variables ficticias en Gretl. EJEMPLO 4.2. Diseñar variables ficticias en Gretl. 1. Introducir la variable manualmente. Aplicación en el Ejemplo 4.2.1. 2. Generar la variable a partir de una variable discreta. Aplicación en el Ejemplo 4.2.2. 3. Definir la variable para un rango de observaciones. Aplicación en el Ejemplo 4.2.3. 4. Variables ficticias incluidas en Gretl. Aplicación en el Ejemplo 4.2.4. 5. La variable tendencia. Aplicación en el Ejemplo 4.2.5.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
25 / 39
Contenido
1
Planteamiento del modelo.
2
Análisis gráfico y forma funcional. Supuesto de linealidad. Análisis gráfico y forma funcional en Gretl.
3
Variables explicativas cualitativas. Inclusión en el modelo econométrico. Gestión de las variables ficticias en Gretl.
4
Especificación del MRLG. Supuestos básicos del modelo. Interpretación de los coeficientes.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
26 / 39
Especificación del MRLG.
Yi = β1 + β2 X2i + β3 X3i + . . . + βk Xki + ui
i = 1, 2, . . . , N
• Y : variable a explicar o endógena. • Xj j = 1, . . . , k: variables explicativas cuantitativas y/o variables ficticias. • βj j = 1, . . . , k: coeficientes a estimar. • u es la perturbación aleatoria (no observable). • N es el tamaño muestral.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
27 / 39
Especificación del MRLG. Parte sistemática:
β1 + β2 X2i + β3 X3i + . . . + βk Xki
• Recoge todos los factores relevantes y todos los factores que incluye son relevantes. • Refleja el comportamiento promedio de Y condicionado a X en la población: EX (Yi ) = β1 + β2 X2i + β3 X3i + . . . + βk Xki
⇒
EX (ui ) = 0
Parte aleatoria: u es una variable aleatoria no observable que quiere recoger: • Efectos no incluidos en la parte sistemática del modelo. • Comportamiento aleatorio de los agentes económicos. • Errores de medida.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
28 / 39
Especificación del MRLG. Supuestos básicos. Supuesto S1. El modelo de regresión lineal general (MRLG) poblacional se expresa como: Yi = β1 + β2 X2i + β3 X3i + . . . + βk Xki + ui
i = 1, .., N
donde: • Las variables explicativas son estocásticas. • β1 , β2 , . . . , βk son parámetros desconocidos constantes. • El modelo es lineal en los coeficientes. • El modelo está correctamente especificado, es decir, todos los factores relevantes están incluidos en el modelo y todos los factores incluidos en el modelo son relevantes.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
29 / 39
Especificación del MRLG. Supuestos básicos. S2. Ausencia de colinealidad. En la muestra, ningún regresor es constante ni puede haber combinaciones lineales exactas entre los regresores.
Sobre la perturbación aleatoria S3. Media condicionada cero. E(ui |X2 , X3 , . . . , Xk ) = 0 ∀i = 1, 2, . . . , N S4. Homocedasticidad. La varianza de la perturbación es constante. Var(ui |X2 , X3 , . . . , Xk ) = σ 2
∀i = 1, 2, . . . , N
S5. Ausencia de Autocorrelación: Cov(ui , uj |X2 , X3 , . . . , Xk ) = 0 ∀i 6= j. S6. Normalidad: Las pertubaciones uj son independientes de las variables explicativas y están idénticamente y normalmente distribuidas. ui ∼ N ID(0, σ 2 ) ∀i = 1, . . . , N Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
30 / 39
Interpretación de los coeficientes.
Dados los supuestos del MRLG, tenemos que:
EX (Yi )
=
EX (β1 + β2 X2i + . . . + βk Xki + ui )
=
β1 + β2 X2i + . . . + βk Xki + EX (ui ) | {z } =0
EX (Yi )
=
β1 + β2 X2i + . . . + βk Xki
EX (Yi ) es la Función de Regresión Poblacional (FRP).
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
31 / 39
Interpretación de los coeficientes. Modelo de regresión lineal simple. FRP: E(Yi |X) = β1 + β2 Xi
Yi = β1 + β2 Xi + ui donde:
β1 : ordenada de la recta de regresión poblacional. β2 : pendiente de la recta de regresión poblacional. 60
Y
FRP
E(Yi|X) = β1 + β2 Xi o
50
o o oo o o oo o oo o o o o o o o o o o o
40
30
o o o
20
o o
10
o oo oo o oo o
o o o
o
oo o
o
o o o
o
o
o
o o o
o o
o
β2 = Cambio en el valor esperado de Y cuando X aumenta en una unidad.
o
o
β1 = Valor esperado de Y cuando X vale cero 0 0
Pilar González y Susan Orbe | OCW 2013
2
4
6
Tema 4. MRLG: Especificación
8
10
X 32 / 39
Interpretación de los coeficientes Modelo de regresión lineal general. Supongamos que todos los regresores son variables explicativas cuantitativas. . βj , j = 2, 3, . . . , k: cambio (incremento o decremento) en el valor esperado de Y cuando Xj aumenta en una unidad, manteniendo el resto de las variables explicativas constantes: βj =
∆EX (Y ) ∆Xj = 1
Efecto marginal de Xj sobre Y.
. β1 = E[Yi |X2i = 0, . . . , Xki = 0] Es el valor esperado de Y cuando todas las variables explicativas toman el valor cero.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
33 / 39
Interpretación de los coeficientes. 1. Para distintas formas funcionales. Forma funcional
Efecto marginal
Lineal Yi = β1 + β2 Xi + ui
Elasticidad =
∆EX (Y )/Y ∆X/X
X Y
β2
β2
β2 + 2β3 X
(β2 + 2β3 X)
Cuadrática Yi = β1 + β2 Xi + β3 Xi2 + ui
X Y
log-log Y X
ln Yi = β1 + β2 ln Xi + ui
β2
log-lin ln Yi = β1 + β2 Xi + ui
β2 Y
β2 β2 X
lin-log Yi = β1 + β2 ln Xi + ui Pilar González y Susan Orbe | OCW 2013
β2
1 X
Tema 4. MRLG: Especificación
β2
1 Y 34 / 39
Interpretación de los coeficientes. 2. Variables explicativas cualitativas. Ejemplo de las tiendas de perfumería: Vi = β1 + β2 Ii + β3 Fi + β4 Ei + β5 Ri + ui
i = 1, 2, ..., 350
Función de regresión poblacional. E(Vi |Xi ) = EX (β1 + β2 Ii + β3 Fi + β4 Ri + ui ) = β1 + β2 Ii + β3 Fi + β4 Ii España: E(Vi |Ri , Ii = 0, Fi = 0) = β1 + β4 Ri . Italia:
E(Vi |Ri , Ii = 1, Fi = 0) = (β1 + β2 ) + β4 Ri
Francia: E(Vi |Ri , Ii = 0, Fi = 1) = (β1 + β3 ) + β4 Ri
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
35 / 39
Interpretación de los coeficientes. Representación gráfica.
Ventas
1 3 X
o o
o o o o o o
o
o
o o o o o o
o
o
1 2 X
o o o
o
o
o o o
o
o
o o
1 X
X = X0
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
Renta
36 / 39
Interpretación de los coeficientes.
Coeficiente de la variable renta. . β4 = Cambio en el valor esperado de las ventas cuando la renta aumenta en una unidad, manteniendo la variable país constante.
Término independiente. .
β1 = E(Vi |Ri = 0, Ii = 0, Fi = 0)
Valor esperado de las ventas en las tiendas españolas cuando el valor de la variable renta es cero.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
37 / 39
Interpretación de los coeficientes. Coeficientes asociados a las variables ficticias. . β2 , β3 no tienen una interpretación de pendiente porque las variables ficticias no son variables continuas, sino que son variables discretas. Para España: Para Italia: =⇒
E(Vi |Ri , Fi = 0, Ii = 0) = β1 + β4 Ri E(Vi |Ri , Ii = 1, Fi = 0) = (β1 + β2 ) + β4 Ri
β2 = E(Vi |Ri , Ii = 1, Fi = 0) − E(Vi |Ri , Ii = 0, Fi = 0)
β2 = Diferencia en el valor esperado de las ventas entre las tiendas italianas y las españolas, manteniendo la variable renta constante.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
38 / 39
Interpretación de los coeficientes
Para España: E(Vi |Ri , Fi = 0, Ii = 0) = β1 + β4 Ri Para Francia: E(Vi |Ri , Ii = 0, Fi = 1) = (β1 + β3 ) + β4 Ri
=⇒
β3 = E(Vi |Ri , Ii = 0, Fi = 1) − E(Si |Ri , Ii = 0, Fi = 0)
β3 = Diferencia en el valor esperado de las ventas entre las tiendas francesas y las españolas, manteniendo la variable renta constante.
Pilar González y Susan Orbe | OCW 2013
Tema 4. MRLG: Especificación
39 / 39