Ìndice de producción Industrial Yubar Daniel Marín Benjumea
27/3/2019
Introducción
El índice de Producción Industrial (IPI) es un indicador económico publicado por la Junta de la Reserva Federal de los Estados Unidos que mide la producción real de la producción en la minería y los servicios públicos. Esta serie inicia en marzo 3 de 1948.
40
60
80
z
100
120
140
Serie original
1980
1985
1990
1995 Time
2000
2005
2010
Anàlisis de la varianza
−10
−5
Dz
0
5
Encontramos la primera diferencia de la serie ya que esta permite observar de forma más sencilla si su varianza es constante o no.
1980
1985
1990
1995 Time
2000
2005
2010
Transformación Box-Cox
95%
1500 1450 1400
Log Likelihood
1550
1600
Se obtuvo como el valor de máxima verosimilitud 0.18 aproximadamente con un inetervalo de confianza entre -0.01 y 0.35 para la mayoría de los metodos de estimación.
−2
−1
0
1
2
Se toman como posibles valores tranformadores 0.18, 0 y 0.25 λ = 0.25
DTz2 1980
1985
1990
1995
2000
2005
2010
Time
0.10 0.05 0.00 −0.10 1980
1985
1990
1995 Time
1980
1985
1990
1995 Time
λ=0
DTz3
0.00 −0.05
0.00 −0.04
DTz1
0.02
0.05
0.04
λ = 0.16
2000
2005
2010
2000
2005
2010
Se elige como transformación adecuada para la varianza ln(z) que es equivalente a valor λ = 0 ya que induce a un buen comportamiento en la varianza de la serie. Serie tranformada
5.0
ln(z)
4.5
4.0
1980
1985
1990
1995 Time
2000
2005
2010
ACF y PACF de la serie transformada
ACF
0.0
0.4
0.8
ACF serie transformada
0.0
0.5
1.0
1.5
2.0
2.5
3.0
2.0
2.5
3.0
Lag
0.6 0.2 −0.2
Partial ACF
1.0
PACF serie transformada
0.0
0.5
1.0
1.5 Lag
Al Observar las gráficas de la ACF y la PACF muestral se puede concluir que como la ACF muestral decae muy lentamente en forma aritmética y la PACF no presenta corte después del rezago 1 , esto indica que posiblemente es necesario diferenciar la serie. Como en la PACF los rezagos aparecen en periodos de 12 meses posiblemente sea necesario aplicar una diferencia estacional a la serie.
Test Dickey-Fuller Aumentado
∆Zt = β0 + β1 t + γZt−1 +
p X
φi ∆Zt−1 + at
i=1
Valores del estadístico de test: -3.1138 8.6279 5.2291
τ3 φ2 φ3
1pct
5pct
10pct
-3.98 6.15 8.34
-3.42 4.71 6.30
-3.13 4.05 5.36
En este caso llegamos a que como τ3 < τ (α, n) para 1pct, 5pct y 10 pct no se tienen sufiente evidencia muestral para rechazar H0 por lo que se concluye que la serie transformada no es estacionaria.
Diferencia Regular A continuación la ACF y PACF para la primera diferencia regular de la serie transformada.
ACF
−0.2
0.2
0.6
Series DTz
0.0
0.5
1.0
1.5
2.0
2.5
3.0
2.0
2.5
3.0
Lag
0.2 −0.2
Partial ACF
0.6
Series DTz
0.0
0.5
1.0
1.5 Lag
Basándonos en la gráfica anterior podemos observar una evidente aparición de una componente estacional en múltiplos de 12. En la ACF se puede ver como la componente estacional decae lentamente tipo cola y la PACF presenta cortes en los rezagos 11,23 y 36 lo que da a entender la necesidad de aplicar una diferencia estacional. Al hablar de la componente regular podemos observar que, aunque en la ACF y la PACF existan cortes en algunos rezagos estos son poco significativos.
Test Dickey-Fuller Aumentado Valores del estadístico de test: -7.5806 19.2389 28.8255 Valores críticos para el test:
τ3 φ2 φ3
1pct
5pct
10pct
-3.98 6.15 8.34
-3.42 4.71 6.30
-3.13 4.05 5.36
En este caso llegamos a que como τ3 > τ (α, n) para 1pct, 5pct y 10 pct se tienen sufiente evidencia muestral para rechazar H0 por lo que se concluye que la primera diferencia regular de la serie transformada es estacionaria.
Diferencia estacional y regular A continuación la ACF y PACF para las primeras diferencias regular y estacional de la serie transformada.
0.0 0.2 −0.4
ACF
Series DETz
0.0
0.5
1.0
1.5
2.0
2.5
3.0
2.0
2.5
3.0
Lag
0.0 −0.4
Partial ACF
0.2
Series DETz
0.0
0.5
1.0
1.5 Lag
Al analizar el comportamiento de la componente estacional en la ACF y la PACF se puede observar un decaimiento de cola exponencial (PACF) y aunque se presentan cortes en otros rezagos estos tienen magnitudes poco significativas, la ACF presenta corte en el rezago 12; dado todo lo anterior utilizaremos un modelo MA (1). En la componente regular la PACF presentan cortes para los rezagos 1, 2 y la ACF presenta un comportamiento de cola que decae rápidamente el cual puede ser explicado con un AR (2).
Modelo 1 Φ(B)(1−B)(1−B 12 ) ln(Zt ) = Θ(B 12 )at , Φ(B) = 1−φ1 B −φ2 B 2 Θ(B 12 ) = 1 − θ1 B 12 ## ## ## ## ## ## ## ## ## ## ##
Series: z ARIMA(2,1,0)(0,1,1)[12] Box Cox transformation: lambda= 0 Coefficients: ar1 ar2 0.2313 0.1308 s.e. 0.0523 0.0523
sma1 -0.8309 0.0309
sigma^2 estimated as 0.0002332: log likelihood=986.69 AIC=-1965.38 AICc=-1965.26 BIC=-1949.84
Pronóstico y ajuste
40
60
80
100
120
140
160
Forecasts from ARIMA(2,1,0)(0,1,1)[12]
1980
1985
1990
1995
2000
2005
2010
Residuales Se concluye que no existe violación del supuesto de errores no correlacionados.
0.00 −0.10
ACF
0.10
Series re1
0.0
0.5
1.0
1.5
2.0
2.5
3.0
2.0
2.5
3.0
Lag
0.00 −0.10
Partial ACF
0.10
Series re1
0.0
0.5
1.0
1.5 Lag
0.00
0.05
Cuantiles Muestrales −0.10 −0.05
40
−3 60
−2 80
fitted(modelo1)
−1 100
Cuantiles Teóricos 0 120
1
140
2 1980
Normal Q−Q Plot
3 1985 1990 1995 Time
2000 2005 2010
0.05
−0.10 −0.05
0.00
0.05
residuals(modelo1)
0.00
residuals(modelo1) −0.10 −0.05
Cuando se evalúa el supuesto de varianza se puede observar que a excepción de algunos valores atípicos no existe violación. Cuando observamos la grafico qqplot se observa un violación del supuesto de normalidad debido a valores atípicos u otros factores no controlados.
Ljung-Box
Q = n(n + 2)
k X
(n − j)−1 ρˆ2j (ˆ a)
j=1
## ## Box-Ljung test ## ## data: re1 ## X-squared = 0.015221, df = 1, p-value = 0.9018 Como Vp > 0.05 no se rechaza H0 por lo que se concluye que ρ1 = ρ2 = ... = ρk = 0
Modelo 2
auto.arima(Tz, max.p=5, max.q=5, ic=c("aic")) ## ## ## ## ## ## ## ## ## ##
Series: Tz ARIMA(2,1,0)(1,0,0)[12] Coefficients: ar1 ar2 0.2141 0.1697 s.e. 0.0517 0.0514
sar1 0.8031 0.0301
sigma^2 estimated as 0.0003711: log likelihood=934.11 AIC=-1860.22 AICc=-1860.12 BIC=-1844.56
Φ(B)Φ(B 12 )(1 − B) ln(Zt ) = at ,
Φ(B) = 1 − φ1 B − φ2 B 2
Φ(B 12 ) = 1 − φ1 B 12 ## ## ## ## ## ## ## ## ## ## ##
Series: z ARIMA(2,1,0)(1,0,0)[12] Box Cox transformation: lambda= 0 Coefficients: ar1 ar2 0.2141 0.1697 s.e. 0.0517 0.0514
sar1 0.8031 0.0301
sigma^2 estimated as 0.0003711: log likelihood=934.11 AIC=-1860.22 AICc=-1860.12 BIC=-1844.56
Pronóstico y ajuste
40
60
80
100
120
140
160
Forecasts from ARIMA(2,1,0)(1,0,0)[12]
1980
1985
1990
1995
2000
2005
2010
Residuales Se concluye que no existe violación del supuesto de errores no correlacionados.
ACF
−0.3
−0.1
0.1
Series re2
0.0
0.5
1.0
1.5
2.0
2.5
3.0
2.0
2.5
3.0
Lag
0.0 0.1 −0.2
Partial ACF
Series re2
0.0
0.5
1.0
1.5 Lag
0.00
0.05
Cuantiles Muestrales −0.10 −0.05
40
−3 60
−2 80
fitted(modelo1)
−1 100
Cuantiles Teóricos 0 120
1
140
2 1980
Normal Q−Q Plot
3 1985 1990 1995 Time
2000 2005 2010
0.05
−0.10 −0.05
0.00
0.05
residuals(modelo1)
0.00
residuals(modelo1) −0.10 −0.05
Cuando se evalúa el supuesto de varianza se puede observar que a excepción de algunos valores típicos no existe violación. Cuando observamos la grafico qqplot se observa un violación del supuesto de normalidad debido a valores atípicos u otros factores no controlados.
Ljung-Box
Q = n(n + 2)
k X
(n − j)−1 ρˆ2j (ˆ a)
j=1
## ## Box-Ljung test ## ## data: re1 ## X-squared = 0.015221, df = 1, p-value = 0.9018 Como Vp > 0.05 no se rechaza H0 por lo que se concluye que ρ1 = ρ2 = ... = ρk = 0
Modelo 3
## ## ## ## ## ## ## ## ## ##
Series: DETz ARIMA(3,0,0)(2,0,1)[12] with zero mean Coefficients: ar1 ar2 0.2431 0.1458 s.e. 0.0527 0.0544
ar3 -0.0493 0.0531
sar1 -0.1832 0.0708
sar2 -0.240 0.063
sma1 -0.6940 0.0583
sigma^2 estimated as 0.0002249: log likelihood=993.91 AIC=-1973.83 AICc=-1973.51 BIC=-1946.65
Φ(B)Φ(B 12 )(1−B)(1−B 12 ) ln(Zt ) = Θ(B 12 )at , Φ(B 12 ) = 1−φ1 B −φ2 B 2 Θ(B 12 ) = 1 − φ1 B 12 , ## ## ## ## ## ## ## ## ## ## ##
Φ(B) = 1 − φ1 B − φ2 B 2 − φ3 B 3
Series: z ARIMA(3,1,0)(2,1,1)[12] Box Cox transformation: lambda= 0 Coefficients: ar1 ar2 0.2431 0.1458 s.e. 0.0527 0.0544
ar3 -0.0493 0.0531
sar1 -0.1833 0.0708
sar2 -0.2401 0.0630
sma1 -0.6939 0.0583
sigma^2 estimated as 0.0002254: log likelihood=993.93 AIC=-1973.85 AICc=-1973.53 BIC=-1946.67
Pronóstico y ajuste
40
60
80
100
120
140
160
Forecasts from ARIMA(3,1,0)(2,1,1)[12]
1980
1985
1990
1995
2000
2005
2010
Residuales Se concluye que no existe violación del supuesto de errores no correlacionados.
0.00 −0.10
ACF
0.10
Series re3
0.0
0.5
1.0
1.5
2.0
2.5
3.0
2.0
2.5
3.0
Lag
0.00 −0.10
Partial ACF
0.10
Series re3
0.0
0.5
1.0
1.5 Lag
−0.10
−0.05
0.00
0.05
Cuantiles Muestrales
40
−3 60
−2 80
fitted(modelo3)
−1 100
Cuantiles Teóricos 0 120
1
140
2 1980
Normal Q−Q Plot
3 1985 1990 1995 Time
2000 2005 2010
−0.10
−0.10
0.00
0.05
−0.05
0.00
0.05
residuals(modelo3)
−0.05
residuals(modelo3)
Cuando se evalúa el supuesto de varianza se puede observar que a excepción de algunos valores típicos no existe violación. Cuando observamos la grafico qqplot se observa un violación del supuesto de normalidad debido a valores atípicos u otros factores no controlados.
Ljung-Box
Q = n(n + 2)
k X
(n − j)−1 ρˆ2j (ˆ a)
j=1
## ## Box-Ljung test ## ## data: re3 ## X-squared = 0.0058579, df = 1, p-value = 0.939 Como Vp > 0.05 no se rechaza H0 por lo que se concluye que algún ρ1 = ρ2 = ... = ρk = 0
Valores Atípicos
4
4.5
5
Original and adjusted series
−0.04
0
0.02 0.04 0.06
Outlier effects
1980
1985
1990
1995
2000
2005
2010
ACF
0.0
0.4
0.8
Series Tz1
0
5
10
15
20
25
30
35
25
30
35
Lag
0.6 0.2 −0.2
Partial ACF
1.0
Series Tz1
0
5
10
15
20 Lag
Al observar las gráficas de la ACF y la PACF muestral se puede concluir que como la ACF muestral decae muy lentamente en forma aritmética y la PACF no presenta corte después del rezago 1 , esto indica que posiblemente es necesario diferenciar la serie. Como en la PACF los rezagos aparecen en periodos de 12 meses posiblemente sea necesario aplicar una diferencia estacional a la serie.
ACF y PACF de la serie diferenciada
0.2 −0.2
ACF
0.6
Series DTz1
0
5
10
15
20
25
30
35
25
30
35
Lag
0.2 −0.2
Partial ACF
0.6
Series DTz1
0
5
10
15
20 Lag
Para la serie diferenciada la ACF para la componente regular no presenta cortes significativos, la componente estacional presenta un decaimiento lento en forma de cola. La PACF en la componente regular no muestra cortes significativos para ningunos de los rezagos y la componente estacional presenta corte en el rezago 12. Lo anterior muestra la necesidad de una diferencia regular.
Serie con diferencia regular y estacional
0.0 −0.4 −0.2
ACF
0.2
Series DETz1
0
5
10
15
20
25
30
35
25
30
35
Lag
0.1 −0.1 −0.3
Partial ACF
Series DETz1
0
5
10
15
20 Lag
Modelo 4
auto.arima(Tz1) ## ## ## ## ## ## ## ## ## ##
Series: Tz1 ARIMA(2,1,2) Coefficients: ar1 ar2 0.9934 -0.9696 s.e. 0.0143 0.0133
ma1 -1.0936 0.0154
ma2 0.9716 0.0192
sigma^2 estimated as 0.000682: log likelihood=819.69 AIC=-1629.38 AICc=-1629.21 BIC=-1609.84
Φ(B)(1 − B) ln(Zt ) = Θ(B)at ,
Φ(B) = 1 − φ1 B − φ2 B 2
Θ(B) = 1 − θ1 B − θ2 B 2 ## ## ## ## ## ## ## ## ## ## ##
Series: z1 ARIMA(2,1,2) Box Cox transformation: lambda= 0 Coefficients: ar1 ar2 0.9934 -0.9696 s.e. 0.0143 0.0133
ma1 -1.0936 0.0154
ma2 0.9716 0.0192
sigma^2 estimated as 0.000682: log likelihood=819.69 AIC=-1629.38 AICc=-1629.21 BIC=-1609.84
Pronóstico y ajuste
40
60
80
100
120
140
160
Forecasts from ARIMA(2,1,2)
0
100
200
300
Residuales Se concluye que existe violación del supuesto de errores no correlacionados.
0.2 0.4 −0.2
ACF
Series re4
0
5
10
15
20
25
30
35
25
30
35
Lag
0.0 −0.4
Partial ACF
0.4
Series re4
0
5
10
15
20 Lag
−0.10
0.00
0.05
Cuantiles Muestrales −0.05
40
−3 60
−2 80
fitted(modelo4)
−1 100
Cuantiles Teóricos 0 120
1
140
2 0
Normal Q−Q Plot
3 100 Time
200 300
−0.10
−0.10
0.05
−0.05
0.00
0.05
residuals(modelo4)
0.00
residuals(modelo4) −0.05
Cuando se evalúa el supuesto de varianza se puede observar que a excepción de algunos valores típicos no existe violación. Cuando observamos la grafico qqplot se observa un violación del supuesto de normalidad debido a valores atípicos u otros factores no controlados.
Ljung-Box
Q = n(n + 2)
k X
(n − j)−1 ρˆ2j (ˆ a)
j=1
## ## Box-Ljung test ## ## data: re4 ## X-squared = 6.7566, df = 1, p-value = 0.00934 Como Vp < 0.05 se rechaza H0 por lo que se concluye que algún ρk 6= 0
Elección del modelo
modelo1 modelo2 modelo3 modelo4
modelo1 modelo2 modelo3 modelo4
AIC
AICc
BIC
-1965.376 -1860.225 -1973.851 -1629.377
-1965.263 -1860.115 -1973.532 -1629.211
-1949.843 -1844.560 -1946.668 -1609.837
ME
RMSE
MAE
MAPE
0.0019484 0.0286146 0.0037263 0.3253056
1.120138 1.436086 1.098309 2.313185
0.7889148 1.0627495 0.7807411 1.6671659
1.012995 1.374529 1.002980 1.971603
Se elige el modelo 1 como el mejor, ya que aunque el modelo 2 y el modelo 4 presentan mejores medidas de ajuste, estos presentan mayores violaciones de supuestos y además sus medidas de pronóstico son peores comparadas con la del modelo 1.