REGRESION CON SERIES TEMPORALES (Carlos Carcach) Cuando estudiamos el problema de autocorrelación y sus consecuencias dimos por sentado que las series de tiempo involucradas eran estacionarias. En el contexto del modelo de
ρ <1
e =ρ e +v
t −1 t , supusimos que autocorrelación AR(1), t , lo que aseguraba que la serie temporal bajo estudio era estacionaria. Sin embargo, muchas de las series usadas en macroeconomía, economía monetaria o finanzas son no estacionarias. Las consecuencias econométricas de no estacionaridad pueden ser severas, llevando a estimadores de mínimos cuadrados, estadísticos de prueba y predicciones que no son confiables.
Series de tiempo estacionarias y
Considere una variable económica, t , que se observa en el tiempo, tal como tasas de interés, las tasa de inflación, el PIB, ingreso disponible, etc. La variable es aleatoria, yt ya que no la podemos predecir de manera perfecta. El modelo económico que da lugar a esta serie es llamado un proceso estocástico o proceso aleatorio. Lo que nosotros
y
t , a la cual nos referimos como una observamos es una muestra de valores realizaciónparticular del proceso estocástico. Este es solo uno de los muchos patrones posibles que pueden ser tomados por el proceso estocástico.
Las propiedades del estimador de mínimos cuadrados en una regresión con datos de series temporales dependen del supuesto que las series envueltas son generadas por procesos estocásticos estacionarios. Un proceso estocástico estacionario posee las 3 propiedades siguientes: E ( yt ) = µ
(Media constante) (Varianza constante)
Var ( y t ) = σ
2
Cov( y t , y t + s ) = Cov( y t , y t − s ) = γ s
(Covarianza depende de s y no de t)
Detectar si una serie posee estas propiedades puede ser una tarea difícil, pero ver algunos gráficos puede ayudar. La serie generada artificialmente que es mostrada en la Figura 1 corresponde a una serie estacionaria. Note que la serie varía en forma aleatoria alrededor de un nivel constante (media) y con dispersión constante (varianza).
2 Figura 1: Proceso Estacionario
y ( t ) = 0.5 + 0.5 y ( t − 1) + N ( 0,1) S1
5 4 3 2 1 0 -1 -2 -3 -4 0
100
200
300
400
500
600
700
800
900
1000
1100
t
Ahora observe la serie mostrada en la Figura 2. Vea como esta serie se mueve despacio hacia arriba y hacia abajo pero sin un patrón definido. La serie no muestra tendencia clara alguna y representa lo que se conoce con el nombre de una caminata aleatoria sin desplazamiento. Figura 2: Proceso No Estacionario CAMINATA ALEATORIA SIN DESPLAZAMIENTO
y ( t ) = y ( t − 1) + 0.5 N ( 0,1)
Finalmente observe la serie de la Figura 3, la cual muestra una bien definida tendencia hacia incrementar valores de en el tiempo. yt
3 Figura 3: Proceso No Estacionario CAMINATA ALEATORIA CON DESPLAZAMIENTO
y ( t ) = 0.1 + y ( t − 1) + 0.5 N ( 0,1)
S3
100 80 60 40 20 0 -20 0
100
200
300
400
500
600
700
800
900
1000
1100
t
Las series en estas figuras fueron generadas a partir de un proceso AR(1) muy similar al que consideramos cuando discutíamos el problema de autocorrelación. El proceso AR(1) que hemos usado tiene la forma general siguiente: Proceso AR(1)
y ( t ) = α + ρ y ( t − 1) + vt
ρ <1
Este proceso es estacionario si , que es el caso de la serie mostrada en la Figura 1. Si y entonces el proceso AR(1) se traduce en una serie generada por una α =0 ρ =1 caminata aleatoria no estacionaria (Figura 2), en la cual, el valor de
durante un yt
período es igual al valor
en el período previo más un término de error, y t −1
Caminata Aleatoria Si
y
α ≠0
. vt
y ( t ) = y( t − 1) + vt .
la serie producida también es no estacionaria y es llamada una
ρ =1
caminata aleatoria con desplazamiento (Figura 3). Caminata Aleatoria con desplazamiento
y ( t ) = α + y ( t − 1) + vt .
4
Muchas series macroeconómicas y financieras son no estacionarias. Los gráficos mostrados en la Figura 4 corresponden a algunas de estas series. Cuáles de ellas parecen estacionarias? Es importante poder distinguir si una serie es o no es estacionaria ya que esto puede llevar a obtener estimadores e inferencias incorrectas.
5 Figura 4: Algunas Series de Tiempo Económicas
2. 0
110
1. 5
105
1. 0
100
0. 5
95
0. 0
90
- 0. 5
85
- 1. 0 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98
80
6000
5000
4000
3000
70 72 74 76 78 80 82 84 86 88 90 92 94 96 98
Inflación 6000
Indice Indicadores de P unta
2000 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98
Consumo
25 20
5000
15 4000 10 3000
5
2000 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98
Ingreso Disponible
0 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98
Tasa de Interés (mensual)
Regresiones Espurias Cuando se usan series no estacionarias se corre el riesgo de obtener regresiones que son significantes en apariencia. Se dice que tales regresiones son espurias. Como un ejemplo, considere el modelo de regresión de la serie no estacionaria mostrada en la Figura 2 sobre la serie generada por el proceso no estacionario (caminata y ( t ) = y ( t − 1) + N ( 0,1) aleatoria) (Figura 5). Figura 5: Proceso No Estacionario, CAMINATA ALEATORIA
y ( t ) = y ( t − 1) + N ( 0,1)
6 S4
20 15 10 5 0 -5 -10 -15 -20 -25 -30 0
100
200
300
400
500
600
700
800
900
1000
1100
t
Estas series fueron generadas independientemente y no hay ninguna relación entre ellas. Sin embargo, nosotros las podemos graficar como se muestra en Figura 6 y vemos que parece existir una relación inversa. Figura 6: Diagrama de Dispersión para los Datos Usados en la Regresión Espuria
70
y(t) = y(t-1) + 0.5 N(0,1)
60 50 40 30 20 -100
-80
-60
-40
y(t) = y(t-1) + N(0,1)
-20
7 Si estimamos la regresión obtenemos los resultados mostrados en la Tabla 1.
Estos
resultados indican que el modelo se ajusta a los datos bastante bien ( R = 0.75 ) y que el estimador de la pendiente es estadísticamente distinto de 0 ( ). Pero estos t = − 54.67 2
resultados carecen de sentido y son espurios. La significancia aparente de la relación es falsa y simplemente resulta del hecho que hemos relacionado unas serie que se mueve hacia abajo (Figura 2) con otra serie que aparentemente se mueve hacia arriba (Figura 5). Resultados de naturaleza más dramática aparecen cuando se usan modelos con variables no estacionarias con desplazamiento. Note que el valor del estadístico de Durban-Watson es pequeño. Granger y Newbold (C.W.J. Granger y P. Niewbold, “Spurious Regressions in Econometrics”, Journal of Econometrics, 2, 1974, p. 111 – 120) sugieren que cuando se modelan regresiones con series de tiempo, si el valor de es mayor que el del R2 estadístico Durbin-Watson, entonces uno debe sospechar la existencia de una relación espuria. Tabla 1: Resultados de Una Regresión Espuria Dependent Variable: RW1 (Figura 2) Method: Least Squares Sample: 1 1001 Included observations: 1001 Variable Coefficient Std. Error t-Statistic C 14.20404 0.542931 26.16175 RW2 -0.526263 0.009627 -54.66698 R-squared 0.749466 Mean dependent var Adjusted R-squared 0.749215 S.D. dependent var S.E. of regression 4.173168 Akaike info criterion Sum squared resid 17397.91 Schwarz criterion Log likelihood -2849.460 F-statistic Durbin-Watson stat 0.030498 Prob(F-statistic)
Prob. 0.0000 0.0000 42.99526 8.333262 5.697224 5.707031 2988.479 0.000000
Para resumir, cuando un modelo de regresión es basado en series de tiempo no estacionarias los resultados pueden indicar la existencia de una relación significante cuando en realidad no existe ninguna. En este caso, tanto el estimador MCO como el predictor de mínimos cuadrados no poseen sus propiedades usuales, y los estadísticos t no son confiables.
Pruebas de Estacionaridad Basadas en Raíces Unitarias La prueba de las raíces unitariasse usa para verificar si una serie es estacionaria. El modelo AR(1) para la serie de tiempo es yt
yt = ρ y t −1 + vt
(1)
8
Suponga que
es una variable aleatoria con media 0 y varianza,
, constante. Si
σ v2
vt
ρ = 1 entonces y t es la caminata aleatoria no estacionaria
y se dice que y t = y t −1 + vt
contiene una raíz unitaria. Podemos demostrar que
. Esta es una serie no Var( y t ) = tσ
2 v
estacionaria ya que su varianza cambia con el tiempo. Recordemos que el proceso AR(1)
ρ <1
es estacionario si . De modo que podemos contrastar la hipótesis de no estacionaridad probando la hipótesis nula contra la alternativa o ρ =1 ρ <1 simplemente
.
ρ <1
9
Esta prueba es puesta de una forma más conveniente sustrayendo ecuación (1).
y t −1 de ambos lados de la
y t − y t −1 = ( ρ − 1) y t −1 + vt
∆ y t = γ y t −1 + vt . Entonces
H 0 : ρ = 1 ↔ H 0 :γ = 0 .
H 1 : ρ < 1 ↔ H 1 :γ < 0
∆y t es llamada la primera diferencia de la serie y t . Si y t sigue una ∆ yt = yt − y t −1 = vt . caminata aleatoria entonces γ = 0 y La variable
La serie
es estacionaria si el error ∆y t
es puramente aleatorio. Series como
y t las
vt
cuales se convierten en estacionarias después de tomar primeras diferencias se dicen ser integradas de orden 1 y se designa como I(1). Series estacionarias son series integradas de orden 0 (I(0)). En general, si una serie debe ser diferenciada d veces para alcanzar estacionaridad se dice que es integrada de orden d o I(d).
La Prueba de Dickey-Fuller
Cuando las series en una regresión no son estacionarias, uso del estadístico t para contrastar hipótesis γ = 0 es inadecuado pues este no sigue la distribución t-Student. Si la hipótesis nula es cierta entonces . En estos casos, el estadístico t es conocido como el yt
estadístico τ (tau), el cual debe ser comparado con los valores de una distribución especial originalmente tabulada por Dickey y Fuller (D.A. Dickey y W.A. Fuller, “Distributions of the Estimators for Autorregressive Time Series with a Unit Root”, Journal of the American Statistical Association, 74, 1979, p. 427-431). Además de probar si una serie es una caminata aleatoria, Dickey y Fuller desarrollaron también valores críticos para la presencia de una caminata aleatoria con desplazamiento.
∆ y t = α 0 + γ y t −1 + vt
(2)
Esta serie exhibe una tendencia definida. Este es un caso extremadamente importante pues como podemos apreciar de la Figura 4, series macroeconómicas tienen una tendencia fuerte.
10
También es posible considerar una tendencia no estocástica. Para alcanzar esto, el modelo es modificado para incluir una tendencia temporal, o tiempo, t.
∆ y t = α 0 + α 1t + γ y t −1 + vt La Tabla 2 contiene valores críticos para el estadístico
τ
(3)
, los cuales son válidos para una
prueba de una cola en muestras grandes. Estos valores son mucho mayores que los valores críticos de la distribución t-Student (última fila en Tabla 2). Tabla 2: Valores Críticos para la Prueba Dickey-Fuller Modelo
∆y t = γ y t −1 + vt ∆y t = α 0 + γ y t −1 + vt
1%
5%
10%
-2.56
-1.94
-1.62
-3.43
-2.86
-2.57
∆y t = α 0 + α 1t + γ y t −1 + vt
-3.96 -3.41 -3.13 Valores críticos estándar -2.33 -1.65 -1.28 Fuente: R. Davidson y J.G. MacKinnon (1993), Estimation and Inference in Econometrics, New York, Oxford University Press, p. 708.
Para controlar la posibilidad que el término de error en una de las ecuaciones anteriores posea autocorrelación, se incluyen términos adicionales. m
∆y t = α 0 + γ y t −1 + ∑ ai ∆y t −i + vt i =1
(4)
Probando la hipótesis nula que γ = 0 dentro del contexto de este modelo es llamada la Prueba Dickey-Fuller Aumentada la cual usa los mismos valores críticos mostrados en la Tabla 2. Considere la serie sobre gasto real de consumo personal mostrada en la Figura 4. Esta variable tiene una tendencia muy fuerte y es razonable sospechar que ella no sea estacionaria. Estimando los modelos (2) y (3) con y sin términos adicionales para controlar por la posible autocorrelación da los resultados reportados en ecuaciones (5a) a (5c). (5a) ∆GCPt = − 1.5144+ 0.0030GCPt −1
( − 0.349) ( 2.557)
11 (5b) ∆GCPt = − 2.0239+ 0.052t + 0.0013GCPt −1
( 0.1068) ( 0.1917) ( 0.1377)
(5c) ∆GCPt = − 2.1110+ 0.00397GCPt −1 + 0.0013∆GCPt −1 − 0.0412∆GCPt − 2
( − 0.4951) ( 3.3068)
Note que en cada caso, el estimador de
( − 4.6594)
( − 0.7679)
es positivo lo mismo que los estadísticos
γ
τ
.
Esto nos lleva a NO RECHAZAR la hipótesis nula que gasto personal en consumo posee una raíz unitaria. La pregunta ahora se convierte en si es la primera diferencia, estacionaria?
∆ GPC t = GCPt − GCPt −1 ,
La Figura 7 muestra las primeras diferencias del consumo y parece ser el gráfico de un proceso estacionario. Figura 7: Primera Diferencia del Consumo El resultado de una prueba Dickey-Fuller para una caminata aleatoria (no hay tendencia) aplicada a la serie
∆GPC t , designada como
, es dado a continuación: ∆Dt
∆Dˆ t = − 0.9969 Dt −1 (−18.668) El valor grande y negativo del estadístico
τ
lleva a rechazar la hipótesis nula que
∆GPC t posee una raíz unitaria a favor de la alternativa de que es una serie estacionaria. Esto sugiere que
es integrada de orden 1 o I(1). GPC t
Cointegración La discusión anterior sugiere que debemos evitar el uso de series no estacionarias en modelos de regresión para evitar el problema de relaciones espurias. Existe una excepción
12
a esta regla general. Si
yt y
son variables no estacionarias I(1), entonces parece xt
razonable esperar que su diferencia o cualquier combinación lineal de ellas, tal como , también sea I(1). Sin embargo hay casos cuando
et = y t − β 1 − β 2 x t
et = y t − β 1 − β 2 x t es un proceso estacionario I(0). En este caso, se dice que
y yt
Cointegración implica que
y yt
que
son cointegradas. xt
comparten tendencias estocásticas similares, y ya xt
et = y t − β 1 − β 2 xt es estacionaria, estas series nunca divergen tanto una con respecto a
la otra. Las variables cointegradas
y
xt exhiben una relación de equilibrio en el
yt largo plazo definida por
y y t = β 1 + β 2 xt
es el error en el equilibrio, que et
representa desviaciones de corto plazo con respecto a la relación de largo plazo. Para probar la hipótesis de que
y yt
son cointegradas, nosotros probamos la xt
e = y t − βˆ1 − βˆ 2 xt estacionaridad de los residuales de mínimos cuadrados, ˆt , usando la prueba de Dickey-Fuller. Nosotros estimamos la regresión
∆ eˆt = α 0 + γ eˆt −1 + vt , donde
y estimamos el estadístico ∆eˆt = eˆt − eˆt −1
τ
(6)
para la pendiente. Como estamos
basando la prueba en valores estimados, los valores críticos son diferentes a los de la Tabla 2 y son mostrados en la Tabla 3. Tabla 3: Valores Críticos para la Prueba Cointegración Modelo
∆eˆt = α 0 + γ eˆt −1 + vt
1%
5%
10%
-3.90 -3.34 -3.04 Fuente: R. Davidson y J.G. MacKinnon (1993), Estimation and Inference in Econometrics, New York, Oxford University Press, p. 708.
13
Imagine que queremos probar si
y
xt = YPDRt , esto es si gasto personal en
y t = GPC t consumo e ingreso personal disponible real son cointegradas (Figura 4). es no estacionaria. La regresión entre estas variables es: xt = YPDRt
La serie
GPC t = − 390.785 + 1.016YPDRt
( − 24.50) ( 252.97)
Estimación de (6) da ∆eˆt = 0.1883− 0.1203eˆt −1
( 0.1107) ( − 4.5642)
El estadístico
τ
para la pendiente es menor que el valor crítico -3.90 al 1% por lo que
rechazamos la hipótesis nula que los residuales son no estacionarios a favor de la alternativa de que son estacionarios. Esto nos lleva a concluir que las variables son cointegradas y que existe una relación de equilibrio de largo plazo entre ellas.