LA MODELACIÓN DEL PRECIO MENSUAL DE LA ELECTRICIDAD EN COLOMBIA: ELEMENTOS ECONOMÉTRICOS
Elkin Castaño V. Escuela de Estadística Universidad Nacional de Colombia Departamento de Economía Universidad de Antioquia
Contenido
• • • • • •
Introducción El modelo propuesto Método de Estimación Resultados Capacidad de pronóstico Conclusiones
Introducción
Cuando las variables de un modelo econométrico son series de tiempo se debe decidir si: Son series estacionarias Son series no estacionarias Tienen tendencia aleatoria? Raíces unitarias. Tienen solo tendencia determinística? Estacionarias en tendencia.
La naturaleza de las series de tiempo involucradas en el análisis conducen a modelos econométricos con propiedades distintas y por tanto es un tema de mucha importancia en el trabajo econométrico aplicado: Especificación, estimación e inferencia. Interpretación: Relaciones de largo plazo (Cointegración), relaciones de corto plazo, relaciones de equilibrio. Los pronósticos tienen propiedades muy diferentes.
Introducción
Con respecto a la estrategia de usar un modelo en diferencias o un modelo en niveles por defecto el empleo rutinario de pre-tests sobre la existencia de raíces unitarias y de relaciones de cointegración: Mejora la comprensión del fenómeno estudiado Mejora la precisión de los pronósticos
En esta charla se discutirá la construcción de un modelo para el precio mensual de la electricidad en Colombia, considerando la naturaleza de las series tiempo de las variables involucradas. El período de análisis considerado es enero de 2000 a noviembre de 2011
Introducción
Cuál es la naturaleza de la serie de tiempo del precio mensual de la electricidad en Colombia? Precio mensual real del la electricidad 200
Precio
150
100
50
2000
2002
2004
2006
2008
2010
Time
Castaño y Sierra (2012) muestran que la serie de tiempo de los precios mensuales de la electricidad es no estacionaria y parece no contener una raíz unitaria.
Introducción Su evolución parece ser estacionaria alrededor de varios cambios de nivel generados por eventos exógenos asociados a cambios climáticos y regulaciones del gobierno.
La serie del logaritmo del precio mensual y cambios de nivel usando OLS 5.50 5.25 5.00 4.75 4.50 4.25 4.00 3.75 3.50 00
01
02
03
04
05
LOGPRECIO
06
07
08
09
10
NIVELES
Usando este resultado, se propone un modelo econométrico para explicar el nivel del precio.
El modelo propuesto Las variables
Desde un punto de vista microeconómico, la formación del precio de la electricidad se explica en términos de la demanda, la oferta y el comportamiento estratégico de los agentes.
Algunos autores tales como Barlow (2002), Mari (2006) y Karakatsani (2008): El precio es parcialmente dependiente de una variable que representa el exceso o la escasez de la oferta energética.
Con base en esta teoría, y teniendo en cuenta que en Colombia la mayor parte de la generación de electricidad tiene origen hídrico, esa variable, en unidades de Mwh, definida un como: Oferta Energética hídrica=la demanda de electricidad - la oferta hídrica afluente.
La oferta hídrica afluente se obtiene convirtiendo el caudal de agua de los ríos del sistema eléctrico colombiano en unidades de metros cúbicos por segundo (m3/s) a energía eléctrica (Mwh), a través de los factores de conversión de las plantas.
El modelo propuesto Las variables
Como en Colombia el sistema de generación de electricidad es predominantemente hídrico, la capacidad de generación depende de las condiciones climáticas.
En condiciones de escasez de agua, la generación eléctrica usa fuentes alternativas más costosas combustibles para su generación (carbón, gas, combustibles líquidos, etc).
Esto implica que la generación no hídrica de electricidad afecta el precio. Se propone utilizar una variable que indique la cantidad de Mwh mes generados por el uso de combustibles.
Se espera que tanto la variable de oferta energética hídrica, como la generación no hídrica se relacionen de manera positiva con el precio.
El modelo propuesto Las variables
Barlow (2002) y Mari (2006) sugieren que la relación entre el precio y las variables explicativas no es necesariamente lineal y sugieren que podría ser exponencial:
En condiciones de escasez, es decir donde los valores de la demanda son mayores que los valores de los aportes hídricos, el precio presenta valores extremos.
En las condiciones de exceso de oferta, cuando la demanda es mucho menor que los aportes hídricos, el precio se forma por los valores competitivos de la oferta.
El modelo propuesto Análisis de las variables
Evolución del logaritmo del precio mensual de la electricidad (Log(Pt)), de la oferta energética hídrica (DAt) y de la generación no hídrica (GNHt). LOGPREC 5.5
5.0
4.5
4.0
3.5 2000
2002
2004
2006
2008
2010
DA
GNH
150
100
100
80
50
60
0
40
-50
20
-100 2000
2002
2004
2006
2008
2010
0 2000
2002
2004
2006
2008
2010
El modelo propuesto Análisis de las variables
La variable dependiente, Log(Pt) (serie estabilizada en varianza), es generada por un proceso no estacionario. Castaño y Sierra (2011) muestran que la no estacionaridad del proceso no es debida a la existencia de una raíz unitaria ni a una tendencia determinística, sino que se debe a la presencia de varios cambios de nivel, generados por eventos exógenos climáticos y de regulación por parte del gobierno, alrededor de los cuales la serie parece evolucionar en forma estacionaria.
En otras palabras, Log(Pt) parece no contener tendencia (aleatoria o determinística) , sino que pertenece a la clase de procesos estacionarios en niveles.
El modelo propuesto Análisis de las variables
La variable explicativa DAt es una serie estacional con período de estacionalidad 12, con un cambio estructural en la parte final de la serie. Eliminando el período de cambio estructural (desde enero de 2009) la serie no contiene raíces unitarias.
La segunda variable explicativa GNHt, es una serie de tiempo estacional, que también presenta un cambio estructural en la parte final. Usando la serie hasta el mes de enero del año 2009 se prueba que no existen raíces unitarias
El modelo propuesto
Dadas estas características sobre la variable dependiente y las variables explicativas No existe cointegración: no hay relaciones de largo plazo La especificación de la relación dinámica adecuada se conduce bajo el supuesto que las variables del modelo pertenecen a la clase de series estacionarias con componentes determinísticas. Es posible investigar si existe equilibrio.
Una clase de modelos dinámicos muy útil, es el modelo autorregresivo y de rezagos distribuídos ARDL(p, q1, q2):
yt D( t ) 1 yt 1
20 x2t 21 x2t 1
p yt p 10 x1t 11 x1t 1 2 q x2t q t 2
2
1q x1t q 1
1
El modelo propuesto
Donde
D( t ) es una función determinística del tiempo (constante, tendencia, variables de
cambio de nivel, etc) ,
t
es ruido blanco normal de media cero, los
y
son
constantes desconocidas.
La búsqueda de la especificación adecuada para la relación condujo a un modelo ARDL(1,0,1) con cambios de nivel para el logaritmo del precio real, y cuya forma funcional es log(Pt ) 0 1S 34t 2 S 81t 3 S109t 0 DAt 0GNH t 1GNH t 1
log(Pt 1 ) t
(1)
El modelo propuesto Donde: La componente determinística contiene: la variable S34t: es una variable de salto a partir de octubre de 2002 e indica la presencia del Fenómeno del Niño; la variable S81t: es otra variable de salto a partir de octubre de 2006 e indica un anuncio de la ocurrencia del fenómeno del Niño; la variable S109t: es otra variable de salto a partir de enero de 2009 e indica reacción previa a la resolución CREG 06/09. 0 , 1 , 2 , 3 , 0 , 0 , 1 y son parámetros desconocidos y t sigue un proceso de
ruido blanco.
Estimación Si las variables DAt y GNHt no están correlacionados con t , la estimación de los parámetros del modelo (1), usando mínimos cuadrados ordinarios (OLS), será consistente y la inferencia sobre los parámetros del modelo será válida. Si existe tal correlación, en general la inferencia podría hacerse estimando un modelo multivariado, el cual considera una ecuación para el precio, otra para DA y otra para GNH. Cuando no existe tal correlación se dice que las variables DA y GNH son exógenas débiles. Esto significa que la distribución marginal de dichas variables no contiene información relevante para la estimación de los parámetros de distribución condicional de log(P) dadas DA y GNH y por lo tanto las ecuaciones para DA y GNH pueden ser ignoradas en el análisis.
Estimación
Para verificar si la inferencia se puede realizar estimando solamente la ecuación para el precio, se probó la exogeneidad débil de DA y GNH empleando la prueba de Wu-Hausman, Wu (1973), Hausman (1978).
En general, la prueba está basada en el modelo y=X11+X22+u
donde X1 es una matriz de regresores de nxk1, los cuales se cree que están correlacionados con el error, y X2 es otra matriz de nxk2 de regresores, que no están correlacionados con el error.
La hipótesis nula es HO: plim
1 ' X 1u =0 n
Estimación
Para realizar la prueba es necesario seleccionar un conjunto de l variables instrumentales Z1 (lk1). Z1 debe ser tal que, en el límite, está correlacionada con X1 pero no lo está con el error u.
Dado Z=[Z1 X2], se regresa X1 sobre Z para obtener Xˆ 1 =Z(Z’Z)-1Z’X1=PzX1. La hipótesis nula se prueba analizando la significancia de en la regresión auxiliar de mínimos cuadradros y=X11+X22+ Xˆ 1 + u
Bajo Ho y normalidad en el término de error u, el estadístico de prueba es d W= ˆ ’[Var( ˆ )]-1 ˆ k21 , donde k1 es el número de parámetros en el vector
, y Var( ˆ ) es la matriz de covarianza del vector ˆ .
Estimación
En nuestro caso, Las variables en la matriz X1 son DA t
y
GNH t.
la matriz Z1 contiene las variables DAt -1, GNH t-2 Las variables en la matriz X2 son D34t, D81 t, D109 t, GNH t-1, Log(P t-1) Tabla 1. Prueba de exogeneidad débil de Wu-Hausman Test Statistic F-statistic Chi-square
Value 0.826140 1.652280
df (2, 109) 2
Probability 0.4405 0.4377
Los resultados no rechazan la hipótesis nula de exogeneidad débil, dada la información empleada. Esto implica que se puede estimar por OLS la ecuación univariada (1) y realizar inferencia válida sobre sus parámetros.
Estimación Pronósticos?
La posibilidad de realizar pronósticos usando esta ecuación, depende de otra propiedad: La exogeneidad fuerte de las variables DA y GNH.
Esta propiedad se basa en la existencia de exogeneidad débil y de que el precio no cause "en el sentido de Granger" (1969), a DA ni a GNH. La causalidad de Granger de y sobre x, está asociada a la idea de saber si los valores rezagados de y mejoran o no la explicación que se obtendría de x, solamente con valores rezagos de ella misma.
Estimación Pronósticos?
Para probar la no causalidad de Granger se empleó el modelo VAR, 1 1 1 DAt 1t A11 A12 A13 DAt 1 GNH A1 A1 A1 GNH t t 1 2t 21 22 23 1 1 1 LogPt 3t A31 LogPt 1 A A 32 33
A11k A12k A13k DAt k 1t k k k A21 A22 A23 GNH t k 2t Ak Ak Ak LogP t k 3t 31 32 33
donde las jt contienen el efecto de las variables exógenas de cambio de nivel definidas en el modelo (1), j=1,2,3.
Estimación Pronósticos? Por ejemplo, para probar que Log(Preciot) no causa a DAt, se debe probar que A13i 0 y A23i 0, i 1,2,..., k
o que A13i 0 y A12i 0, i 1,2,..., k .
La prueba utilizó k=13 debido a los posibles efectos de estacionalidad, restricciones de nulidad para los parámetros en k=4,5,6,7,8,9 10. Prueba de Causalidad de Granger Variable Dependiente: Excluida Chi-sq Df GNH t 29.32357 5 Log ( Pt ) 7.594137 5
DAt
Prob. 0.0000 0.1801
Variable Dependiente: GNHt Excluida Chi-sq Df Prob. DAt 31.92067 5 0.0000 Log ( Pt ) 4.805673 5 0.4401
con
Estimación Pronósticos?
Se concluye que Log(Preciot) no causa según Granger a DAt ni a GNHt. Esto implica que para pronosticar el precio podemos usar la estimación de la ecuación univariada (1), usando pronósticos generados por modelos de series de tiempo para las variables DAt y GNHt.
Resultados de la estimación por OLS Tabla 3. Estimación del modelo ADRL(1,0,1) para el Log(Precio) Variable Dependiente: LogP Estimación OLS Número de observaciones incluidas: 130 Variable Coefficient Std. Error t-Statistic C 1.796749 0.247197 7.268501 D34 0.167300 0.038971 4.292929 D81 0.140999 0.033719 4.181632 D109 0.106490 0.043095 2.471073 DA 0.001163 0.000277 4.191350 GNH 0.011153 0.002102 5.304891 GNH(-1) -0.007720 0.002047 -3.771826 LogP (-1) 0.509423 0.069934 7.284305 R-squared 0.912486 Mean dependent var Adjusted R-squared 0.907464 S.D. dependent var S.E. of regression 0.121640 Akaike info criterion Sum squared resid 1.805149 Schwarz criterion Log likelihood 93.53591 Hannan-Quinn criter. F-statistic 181.7226 Durbin-Watson stat Prob(F-statistic) 0.000000
Prob. 0.0000 0.0000 0.0001 0.0149 0.0001 0.0000 0.0003 0.0000 4.291244 0.399873 -1.315937 -1.139473 -1.244234 1.867160
Resultados de la estimación por OLS
La aplicación de distintos diagnósticos a la ecuación estimada, incluyendo pruebas de normalidad, estabilidad de los parámetros, no autocorrelación, no heterocedasticidad, no efectos Garch, no cambios estructurales, forma funcional y no observaciones atípicas,
indican un comportamiento
adecuado del modelo.
La tabla anterior muestra que el modelo es estable ya que | ˆ |=0.509<1, y que las variables explicativas incluidas parecen ser altamente significativas.
Dado que el modelo es estable, en el modelo (1) se puede analizar la dinámica de un cambio en cada un de las variables explicativas a través del tiempo sobre el precio mensual.
Resultados
Las respuestas dinámicas parciales (multiplicadores) del precio con respecto a DAt período a período están dadas por
Log(Precio )t j DAt
El multiplicador de impacto es
= 0 j ,
j=0, 1, 2, …
0 y su estimación es ˆ0 =0.001163. Este valor
indica que el incremento de un MWh en la oferta hídrica produce un aumento inmediato de 0.001163% en el precio real esperado de la electricidad, cuando GNH permanece constante.
Resultados
El multiplicador de largo plazo es
0 /(1 )
y su estimación es
ˆ0 /(1 ˆ ) =0.002371, que indica que en el largo plazo por un aumento de un Mwh
en DA, el precio esperado aumenta 0.002371%.
Resultados Gráfica 2. Respuestas dinámicas del precio con respecto a DA Respuestas por período
Respuestas acumuladas
0.0014
0.0025
0.0012
0.002
0.001 0.0008
0.0015
0.0006
0.001
0.0004 0.0005
0.0002 0
0 0
1
2
3
4
5
6
7
8
9
10
0
1
2
3
4
5
6
7
8
9
10
El gráfico anterior muestra que el aumento de un Mwh tiene un efecto dinámico cuya duración está alrededor de 10 meses, puesto que el efecto acumulado en el décimo mes es un poco más 99.9% del efecto total o de largo plazo.
Resultados Para la variable GNHt, las respuestas dinámicas parciales del precio con respecto a ella período a período están dadas por
Log(Precio )t j GNH t
= 0 j 1 j 1 ,
j=1, 2, …
El multiplicador de impacto es 0 y su estimación es ˆ0 =0.011153 que indica que el incremento de un Mwh en la generación no hídrica produce un aumento inmediato de 0.0112% en el precio real esperado de la electricidad, permaneciendo constante DA.
El multiplicador de largo plazo es ( 0 1) /(1 ) y su estimación es (ˆ0 ˆ1) /(1 ˆ ) =0.00699788.
Resultados
El ajuste se logra en 10 meses aproximadamente. La Gráfica 3 muestra la evolución de las respuestas dinámicas con respecto a GNH, por período y acumuladas.
Resultados
Gráfica 3. Respuestas dinámicas del precio con respecto a GNH Respuestas por período
Respuestas acumuladas
0.012
0.012
0.01
0.01
0.008
0.008
0.006
0.006
0.004
0.004
0.002 0 -0.002 -0.004
0.002 0
1
2
3
4
5
6
7
8
9
10
0 0
1
2
3
4
5
6
7
8
9
10
Análisis de la capacidad de pronóstico
Para analizar la capacidad del modelo para pronosticar el precio mensual, se siguió el siguiente procedimiento:
i)
Se estimó el modelo con información desde 2000.1 a 2009.11, dejando por fuera las últimas 12 observaciones.
ii)
Usando el modelo estimado anterior, se pronosticaron y se construyeron intervalos de predicción al 95% para las 12 últimas observaciones de la serie.
Como la variable dependiente se encuentra transformada con el logaritmo natural, se usaron pronósticos que minimizan los sesgos por retransformación (Guerrero, 1993).
Análisis de la capacidad de pronóstico Pronósticos e intervalos de predicción de mínimo sesgo para el modelo ARDL 300
250
200
150
100
50
0 00:01
02:01
04:01 Precio Límite_Inf
06:01
08:01 Pronóstico Límite_Sup
10:01
Análisis de la capacidad de pronóstico Pronósticos y de los límites de predicción al 95%. Límite Límite Período Precio Pronóstico Inferior Superior 2009M12 201.0895 191.4971 144.7118 253.4081 2010M01 154.1271 201.8602 145.4948 280.0619 2010M02 198.4266 193.3704 137.4411 272.0592 2010M03 191.2173 177.8756 126.8963 249.3354 2010M04 198.1553 160.5866 115.7402 222.8100 2010M05 151.3407 133.4752 96.73700 184.1655 2010M06 91.46602 97.25388 70.04878 135.0247 2010M07 83.36772 93.21022 68.41650 126.9890 2010M08 85.12715 103.7780 76.75601 140.3132 2010M09 112.5012 109.9441 81.63278 148.0743 2010M10 137.0349 119.4913 88.90112 160.6073 2010M11 92.57473 103.8871 76.98324 140.1932
Análisis de la capacidad de pronóstico Para realizar la evaluación de los pronósticos se presenta el Error Absoluto Medio (EAM) y la Raíz Cuadrada del error Cuadrático Medio (RECM) así como la descomposición del Error Cuadrático Medio en términos de sus componentes: El Sesgo en Media, Sesgo en Varianza, y la Proporción en Covarianza. En la
Tabla 5 se
presentan los resultados. La Tabla 5. Evaluación de los pronósticos del modelo ARDL EAM 16.4043
RECM 20.8669
Sesgo_media 0.001659
Sesgo_var 0.074708
Prop. Covar 0.923633
Los resultados anteriores muestran que errores de predicción tienen a ser bajos y que los sesgos tanto en media como en varianza son bajos, mientras que la proporción en covarianza está cerca de 1, comportamiento típico de unos buenos pronósticos.
Conclusiones 1. La no existencia de una raíz unitaria en las series, sugiere que no existen una relaciones de largo plazo entre el LogPrecio , DA y GNH: No hay cointegración.
2. La especificación de un simple modelo ARDL(1,0,1) en niveles de las series, produce un modelo que puede ser estimado por mínimos cuadrados ordinarios, que tiene una interpretación económica y un comportamiento estadístico adecuados.
3. El modelo propuesto proporciona pronósticos adecuados.
4. El modelo posee equilibrio
• MUCHAS GRACIAS!