COMPARACION DE DISEÑOS DE FORMATO DICOTOMICO CUANDO SE ASUMEN DISTINTAS DISTRIBUCIONES PARA LA DISPOSICION A PAGAR Y SE OPTIMIZA EL VECTOR DE PAGOS - APLICACION DEL METODO DE VALORACION CONTINGENTE EN LA LAGUNA AVENDAÑO, QUILLON1 Radoslav Dimitrov Barzev RESUMEN El propósito principal de este estudio es comparar los estimadores de las medidas de cambio en el bienestar obtenidas a partir de tres diseños de encuesta para el Formato Dicotómico del Método de Valoración Contingente (FD MVC), cuando se asumen distintas distribuciones estadísticas para la Disposición a Pagar (DAP): Simétrica Uniforme, Simétrica Logística y Asimétrica Lognormal; y se optimiza el vector de pagos para los últimos dos diseños. Este estudio se realizó a través de una aplicación empírica sobre la actividad turística de la Laguna Avendaño, valorando la Disposición a Pagar de los turistas para evitar una desmejora en la calidad del aire debido a la instalación de una planta de celulosa en la confluencia de los Ríos Itata y Ñuble, a unos 10 km. de distancia de la Laguna. La distribución de la DAP fue determinada a partir de los datos de una preencuesta con formato abierto (simétrica para este estudio), utilizando el Test Gráfico Q-Q Plot y el Test Box-Cox (Johnson, 1982). Mientras que, para determinar el diseño de encuesta con vector de pagos óptimo se utilizó el criterio de Error Cuadrático Medio ECM, (Joseph Cooper, 1993). Así, dada la distribución de la DAP y el tamaño de la muestra final, se optimizó el vector de pagos, calculando el número de rangos, la cantidad de pago por cada rango, y la distribución de submuestras por cada rango. Esto se logró utilizando el Modelo Iterativo “Distribución de los Rangos de Pagos con Areas Iguales de Selección” DWEABS, desarrollado por Cooper (1993). Para la estimación de las medidas de bienestar, a partir de los datos obtenidos de las tres encuestas, se utilizó el Método de Máxima Verosimilitud. Para los errores se asumió una distribución logística (Logit) y para las medidas de bienestar (Media, Mediana e Integral Positiva) se utilizó una adaptación de la forma funcional lineal de Hanemann (1984), agregándole la variable Ingreso debido a su significancia estadística en los tres diseños. Para la comparación de las medidas de bienestar se crearon intervalos de confianza para, primeramente determinar la significancia estadística de las medidas obtenidas, y posteriormente determinar si existe diferencia estadística entre ellas. Para ello se utilizó el método de simulación de Park, Loomis y Creel (1991).
El presente trabajo corresponde a una síntesis de la Tesis que el autor desarrolló para optar al Grado Académico de Magister en Economía de Recursos Naturales y del Medio Ambiente, en la Universidad de Concepción, Concepción 1988. 1
1
1.
INTRODUCCION
1.1
Fundamentación
El Método de Valoración Contingente (MVC) intenta averiguar, a tráves de la pregunta directa, la valoración que otorgan las personas a los cambios en el bienestar que les produce la modificación en las condiciones de oferta de un bien ambiental. Básicamente, se les pregunta a las personas lo que estarían dispuestos a pagar por un beneficio y/o lo que estarían dispuestos a recibir a modo de compensación por tolerar un costo. El proceso de “preguntar” puede hacerse a través de una encuesta directa, o bien mediante técnicas experimentales en condiciones de “laboratorio”. Lo que se busca son las valoraciones personales de los encuestados frente al crecimiento o la reducción de la cantidad de un bien dado, un contingente, en un mercado hipotético. Se considera que el mercado contingente no incluiría sólo el bien en sí mismo (mejor calidad del agua, mejor calidad del aire, etc.), sino también el contexto institucional en el que éste sería ofertado y la forma en que se financiará (Azqueta, 1994; Dixon, Scura, Carpenter y Sherman, 1996; Pearce y Turner, 1995). El Método de Valoración Contingente ha sido ampliamente utilizado en la valoración de bienes que no tienen mercado específico, siendo que en muchos casos será la única técnica de estimación del beneficio. Además es aplicable a la mayor parte de los contextos de la política ambiental. Existen distintos formatos de preguntas sobre la disposición a pagar del entrevistado, para esta metodología: formato abierto (el entrevistador simplemente espera la respuesta a la pregunta formulada); formato subasta (el entrevistador adelanta una cifra y pregunta al entrevistado si estaría dispuesto a pagar esa cifra o más); formato múltiple (se le presenta al entrevistado un cuadro con varias cifras, ordenadas de mayor a menor, y se le pide al entrevistado seleccionar una); formato dicotómico (donde el encuestado es preguntado Si o No está dispuesto a pagar una cantidad fija); y tambíen otras variantes de estos formatos mencionados. Entre los formatos anteriores, el formato dicotómico se ha perfilado como la metodología preferida. La encuesta del formato dicotómico está compuesta por varios elementos: número total de la muestra N, límite inferior y superior de la cantidad ofrecida (los pagos), niveles específicos (rangos) de la cantidad ofrecida y la distribución de la muestra total entre los rangos específicos. Sin embargo, en este formato tanto su diseño como su análisis son relativamente complejos. La mayoría de los problemas de este formato están relacionados con el diseño de la encuesta, por lo que en los últimos años han recibido considerable atención. Entre los autores que se han referido a este tema se encuentran: Duffield y Patterson, 1991; Cooper y Loomis, 1992; Kanninen y Kriström, 1993; y Cooper, 1993. Cada uno de sus trabajos explora por lo menos alguno de los componentes del diseño de la encuesta para formato dicotómico. Duffield y Patterson (1991), iniciaron el camino hacia un diseño óptimo de la encuesta. Utilizando los datos de una preencuesta - tomando como predeterminados la distribución de la disposición a pagar DAP, el número de la muestra total N y el número de rangos de pagos 2
“b”- desarrollaron un modelo que distribuye en forma óptima la muestra total N entre los rangos “b”. Pero ellos dejaron sin resolver el problema de optimización de los rangos en sí. En la forma tradicional, por ejemplo, se divide la muestra total N entre un número de rangos “b” predeterminado, sin explicar el por qué de este número de rangos “b”. De este aspecto se encargó Cooper (1993), al desarrollar un modelo que obtiene el vector de pagos óptimo junto con una distribución óptima de la muestra total entre los rangos de pagos optimizados. El método se basa en un procedimiento iterativo que selecciona el diseño de la encuesta que minimiza el error cuadrático medio de la medida de bienestar. Por lo anteriormente expuesto, en este trabajo se analiza la diferencia en aplicar un diseño óptimo (con vector de pagos optimizado) vrs. un diseño no óptimo (con vector de pagos tradicional). Al mismo tiempo, se asumen distintas distribuciones estadísticas para la DAP. En la mayoría de los estudios de Valoración Contingente se ha asumido que la DAP, obtenida a partir de una preencuesta con formato abierto, tiene distribución normal o logística - simétrica. Sin embargo, hay poca evidencia que demuestra que la DAP se distribuye simétricamente. Cooper, analizando varias bases de datos de preencuestas obtenidas con formato abierto, ha demostrado que la DAP de muchas de ellas tiene distribución lognormal - asimétrica. Por tanto, es importante determinar la distribución de la DAP utilizando algún test antes de optimizar el vector de pagos. En este trabajo se aplican el Test Gráfico Q-Q Plot y el Test Box-Cox. Entonces, para efectuar la comparación de diseños para el formato dicotómico, se diseñan tres encuestas con diferentes vectores de pagos y diferentes distribuciones para la DAP simétrica con vector de pagos no óptimo, simétrica con vector de pagos optimizado y asimétrica con vector de pagos optimizado. Para la estimación de las medidas de bienestar, a partir de los datos obtenidos de la encuesta final según cada diseño, se utiliza el Método de Máxima Verosimilitud, con distribución logística Logit para los errores y para las medidas de bienestar (media, mediana e integral positiva) se usa una adaptación de la forma funcional lineal de Hanemann (Hanemann 1984, 1989, 1994; Boyle, Welsh, y Bishop 1988). A pesar de que uno de los diseños de encuesta está optimizado bajo el supuesto de asimetría para la distribución de la DAP, se utiliza Logit para el procesamiento de los datos de las tres encuestas, teniendo así una base común de comparación para los tres modelos resultantes. Investigaciones con simulación Monte Carlo han demostrado que los diseños con distribución de la DAP asimétrica funcionan bastante bien con Logit y la forma funcional lineal (Cooper, 1993). Finalmente, para comparar los estimadores de las medidas de bienestar se crean intervalos de confianza para determinar la significancia de las medidas de bienestar obtenidas, a través del método de simulación de Park, Loomis y Creel (1991). Primero se determina si la medida de bienestar está dentro del intervalo de confianza simulado, para después traslapar los intervalos de confianza y observar si las medidas de bienestar de cada modelo son estadísticamente diferentes. 1.2
Problemática del Bien Ambiental a Tratar
La construcción de una planta de celulosa en las cercanías de la localidad de Nueva Aldea, en la confluencia de los ríos Itata y Ñuble, ha definido un área de impacto conformado por 3
las siete comunas más cercanas a la planta industrial futura y que limitan con las riberas del río Itata. Estas comunas son Chillán, Bulnes, Quillón, Ránquil, Portezuelo, Coelemu y Treguaco (Centro EULA, 1997). Este proyecto implicará múltiples impactos, muchos de los cuales serán negativos (ej.: deterioro calidad del agua del río Itata, deterioro de la calidad del aire por gases y malos olores, reducción productividad de cultivos, etc.), pero también tendrá impactos positivos (ej.: generación de empleo, creación de infraestructura, etc.). La comuna de Quillón tiene una superficie de 424 km2 , su población es de 14.645 personas de las cuales 4.718 habitan en el área urbana, es decir un 32,2%. El porcentaje restante de 67,8% se localiza en áreas rurales. Una de las principales actividades de la comuna de Quillón es el turismo (en la Laguna Avendaño y el río Itata), que se desarrolla especialmente en los meses de verano. Las otras actividades importantes de la comuna son el comercio minorista, la actividad vitivinícola y las plantaciones de frutales. Debido a que el turismo es una actividad estacional, en Quillón la población en verano aumenta 3 veces, por la llegada de turistas (aproximadamente 30.000 turistas) y decrece en invierno - según información estadísticas de la Municipalidad de Quillón. 2.
REVISION DE LITERATURA
2.1
El Metodo de Valoracion Contingente con Formato Dicotomico (MVC FD)
El método de valoración contingente intenta averiguar, a través de la pregunta directa, la valoración que otorgan las personas a los cambios en el bienestar que les produce la modificación en las condiciones de oferta de un bien ambiental no transado en el mercado. El hecho de que la valoración finalmente obtenida dependa de la opinión expresada por la persona, a partir de la información recibida, es lo que explica el nombre que se le da a este método. Bishop y Heberlein (1979) introdujeron una variante del método, llamada referéndum (formato dicotómico), que requiere de los entrevistados únicamente respuestas del tipo SI/NO, a diferencia de los métodos anteriores que exigían repreguntar varias veces hasta que el entrevistado cambiaba el signo de su respuesta. Esta variante tiene enormes ventajas en comparación con los procedimientos utilizados anteriormente, porque elimina el sesgo que induce el hacer las repreguntas, además tiene menor costo de aplicación. M. Hanemann (1984) y T. A. Cameron (1988) desarrollaron formulaciones teóricas del MVC FD que permiten estimar cambios en el bienestar de las personas. Hanemann formula el problema como la comparación entre dos funciones indirectas de utilidad; Cameron interpreta la respuesta como una comparación entre la cantidad de dinero sugerida en la encuesta y la diferencia entre los valores dados por la función de gasto evaluada con y sin posibilidad de acceso al bien público que se pretende valorar.2 McConnel (1990) demostró que las porciones determinísticas de los dos modelos sugeridos son duales entre sí. La diferencia entre los dos enfoques es el momento en que se agrega el término estocástico a Se entiende por función de gasto una función que mide la mínima cantidad de dinero necesario para que un individuo alcance un determinado nivel de utilidad en unas condiciones dadas. 2
4
las funciones. En este estudio se utiliza el enfoque de Hanemann para la estimación de las medidas de bienestar, estableciendo la diferencia en las funciones de utilidad indirecta ∆V, pero se hace una adaptación de la forma funcional lineal de Hanemann para ∆V agregándole la variable Ingreso debido a su significancia estadística en los tres modelos. 2.1.1 Estructura del Modelo de Hanemann Para Hanemann, el turista - como consumidor - tiene una función de utilidad de la siguiente forma: U = U(J,Q,Z,S)
(1)
donde, U= J=
Función de utilidad. Toma valor “1” en situación cuando se toma acción (para hacer una mejora o evitar una desmejora) y “0” en situación cuando no se toma ninguna acción. Q = Actividad complementaria con nivel de calidad ambiental (turística). Z = Bien Hicksiano ( todos los demás bienes que consume el individuo). S = Atributos observables del individuo, los cuales pueden afectar sus preferencias (características sociales). W=W(J,P,Y;S) es la función de utilidad indirecta determinística para el individuo, la que se utiliza para describir e analizar las medidas de cambio en el bienestar. 2.1.2 Medidas de Cambio en el Bienestar Variación Equivalente La calidad del aire, como bien ambiental, es uno de los factores que asegura una creciente actividad turística en la Laguna Avendaño. Y aunque no tenga precio de mercado hay que valorar económicamente este bien ambiental para determinar el cambio en el bienestar y expresarlo monetariamente. Para hacer esto, se puede utilizar la cantidad de dinero que pagaría el turista para evitar cambios desfavorables en la calidad del recurso. Las dos formas comúnmente utilizadas con esta metodología para determinar el cambio en el bienestar de un individuo son la Variación Compensada (VC) y la Variación Equivalente (VE). Cada forma tiene dos opciones, en dependencia de quien de las partes involucradas tiene el derecho sobre el uso del recurso (ej.: turista o planta de celulosa). En este trabajo se utiliza la Variación Equivalente. La VE es la cantidad de dinero que se le entregará al turista si el cambio no se dio, pero que lo hará pasar a un nuevo nivel de bienestar, como si el cambio se hubiera dado:
5
i)
Cantidad máxima que el individuo está dispuesto a pagar DAP por evitar un cambio desfavorable. (Turista no tiene el derecho).
ii) Cantidad mínima que el individuo está dispuesto a aceptar DAA por renunciar a un cambio favorable. (Turista tiene el derecho). El cálculo de la VE se hace a partir de la función de gasto del individuo. Se traduce en la diferencia en el gasto necesario para alcanzar el nuevo nivel de bienestar, evitando un cambio desfavorable en el bien ambiental, dado un nivel de precios P y el nivel de utilidad después de la instalación de la planta de celulosa U1, (U0 es el nivel de utilidad antes de la instalación de la planta de celulosa): 0
1
1
1
VE=E(P,Q ,U ) - E(P,Q ,U ) =
∫
Q1
Q
0
∂E ( P , Q, U 1 ) dQi ∂Qi
(2) donde, Q0 es la calidad de aire antes de instalar la planta de celulosa - no afectada por gases. Q1 es la calidad de aire después de la instalación de la planta de celulosa - afectada por gases. (Q1
(3)
donde εJ es un error estocástico debido a que la parte izquierda de la expresión es una aproximación de la verdadera función de utilidad. Siguiendo con el despeje: V(1,Y-C;S)+ε1 = V(0,Y;S)+ε0 ,
(4)
C = variación equivalente VE y es la verdadera DAP. ε1= error cuando se trata de evitar la desmejora. ε0= error en situación con desmejora. ε1 y ε0 son variables aleatorias e idénticamente distribuidas. Mientras tanto, en la encuesta no se pregunta por la variación equivalente del turista, sino que se trata de averiguar a través de su DAP. Ahora bien, si el encuestado acepta pagar $X,
6
para evitar la desmejora obtenemos la siguiente expresión: V(1,Y-X;S)+ε1 = V(0,Y;S)+ε0 , V(1,Y-C;S) - V(0,Y;S)>ε0-ε1 , ∆V= V(1,Y-C;S) - V(0,Y;S) y η=ε0-ε1 , ∆V>η. (5) Dado que la respuesta de la pregunta (SI/NO) es variable aleatoria para nosotros, la probabilidad de una respuesta positiva está dada por: Pr[Respuesta SI] = F[∆V],
(6) ∆V
donde F es la función de probabilidad acumulada de η: F ( ∆V ) = ∫ f (η ) , con f(η) la −∞
función de densidad de probabilidad de η, indica la probabilidad que η sea menor o igual a ∆ V. Por otro lado, volviendo a la expresión V(1,Y-C;S)+ε1 = V(0,Y;S)+ε0 , se puede expresar C en función del ingreso Y, utilizando la función de gasto E(V,J;S), que es dual de V. Con la identidad Y-C=E(P,1,V(1,Y-C;S);S) se obtiene: Y-C=E(P,1,V(0,Y;S)+ε0-ε1;S) , C=Y-E(P,1,V(0,Y;S)+η;S) , (7) ecuación que confirma la aleatoriedad de C. Entonces la respuesta del encuestado se modela así: Pr[Respuesta SI]=Pr[C>X] = 1- Gc(X), (8) donde Gc(X) es la función de probabilidad acumulada de C evaluada en X.3 Finalmente, se pueden obtener las tres medidas de bienestar. La Media C+.
Esta medida de bienestar es el valor esperado de C, denominado C+. Se calcula con el método de integración por partes, a partir de la función de probabilidad acumulada Hanemann, 1989; Ardila, 1993): ∞
0
0
−∞
C+= ∫ 1 − Gc( X ) dX − ∫ Gc ( X ) dX ,
(9)
La Mediana C* Una segunda medida de la variación equivalente es la mediana C*, que hace que la probabilidad de una respuesta afirmativa sea 0,5, definiéndose de manera implícita: Gc(X) da la probabilidad que C sea menor o igual que X, que es la probabilidad de obtener una respuesta negativa, y 1-Gc(X) la probabilidad que C sea mayor que X. 3
7
Pr[V(1,Y-C*;S)+ε1>V(0,Y;S)+ε0]=0,5 F[V(1,Y-C*;S)-V(0,Y;S)>ε0-ε1]=0,5 F[∆V]=0,5
(10)
donde F es la distribución de probabilidad acumulada de η=ε0-ε1. Dado que F(∆V)=1Gc(X), la última expresión implica que C* define el punto donde Gc toma el valor 0,5, entonces C* es la mediana de C. La Integral Positiva C’ Siendo que en este trabajo se espera que la disponibilidad a pagar sea positiva, lo que es económicamente correcto, no tiene sentido calcular el valor esperado de la disponibilidad a pagar incluyendo los valores negativos. En este caso Hanemann (1989), sugiere únicamente el primer término de la ecuación (13) para calcular el valor esperado. Este valor se denomina C’ y es la Integral Positiva. 2.1.3 Las Formas Funcionales V(.) puede adoptar distintas formas funcionales. ∆V depende de X según la forma funcional asumida para V. En este trabajo se utiliza de base la forma funcional de Hanemann (1984) VJ=αJ+βY+ei ; ∆V=α-βX+η, a la cual se le hace una adaptación incluyendo la variable ingres Y.
2.2
Diseño Optimo para el Vector de Pagos del Formato Dicotómico
2.2.1 Determinación del Vector de Pagos Existen varios métodos para determinar el vector de pagos “m”. En este trabajo se utiliza el enfoque tradicional (sin optimizar el vector de pagos), y el enfoque de Joseph Cooper (1993) quien - a diferencia de Duffield y Patterson (1991) que obtienen una distribución óptima de los “n” entre los rangos de pagos “b” - logra también el número óptimo de rangos “m*” y la cantidad óptima por cada rango de pago “b*”. 2.2.1.1
Enfoque Tradicional sobre la Determinación del Vector de Pagos
En este enfoque, dado el N, los límites inferior y superior de la DAP, y la distribución estadística de la DAP (en este caso simétrica), se procede a dividir N (número muestra total) entre “m” (número aleatoriamente seleccionado de rangos de pagos del vector - en este caso 10). Inmediatamente se obtienen 10 submuestras “n” por cada pago “b”. Esta forma ha sido ampliamente utilizada, pero no tiene un criterio formal que justifique el uso de este enfoque. 8
2.2.1.2
Fundamentos para la Optimización del Vector de Pagos
Como resultado de las respuestas del Formato Dicotómico del MVC, la única información obtenida del encuestado “t” donde t=1,...,N, es si la DAP está por abajo o por encima del valor de pago propuesto (bt). Pero, como no se conoce la verdadera DAP, la DAP t es una variable aleatoria. Hanemann (1989), observa que el valor esperado de esta variable, y de cualquier otra variable aleatoria, puede ser expresada en forma continua: E ( DAP ) =
∞
∞
0
−∞
0
−∞
∫ bf (b)db = ∫ [ 1 − F (b)] db − ∫ F (b)db
(11)
donde F(b) es la función de densidad acumulada que representa la probabilidad de obtener una respuesta “NO” en la pregunta dicotómica de la encuesta, y f(b) es la función de densidad de probabilidad. Siendo que la DAP es una variable aleatoria no negativa en la mayoría de los casos, para estar consistente con la teoría económica, podemos expresarla así: ∞
E ( DAP ) = ∫ [ 1 − F (b )] db
(12)
0
Entonces, para optimizar el vector de pago, hay que seleccionar un criterio. En este trabajo ∩ se selecciona el vector de pagos que minimiza el error cuadrático medio ECM de la DAP (el estimador de la verdadera media poblacional DAP), definido como, 2
2
∩ ∩ ∩ ∩ (13) ECM ( DAP ) = E DAP − E ( DAP ) + E ( DAP) − DAP El criterio de ECM se prefiere ante el criterio de varianza mínima (Duffield y Patterson, 1991), por su mayor generalidad. Mientras que el criterio de mínima varianza produce un ∩ valor para la DAP con menor intervalo de confianza, no hace nada para asegura que este valor sea libre de sesgos. El criterio de ECM encuentra un punto de balance entre el insesgamiento y la varianza mínima.
2.2.1.3
Enfoque de Duffield y Patterson (1991) sobre la Determinación del Vector de Pagos
Duffield y Patterson (1991), propusieron un modelo para determinar el tamaño óptimo de la submuestra “nm”, dado un conjunto aleatoriamente determinado de pagos “bm”, el número de rangos de pagos “m” y el tamaño total de la muestra N. Específicamente, ellos enfocaron el problema como minimización de la varianza del valor esperado de la DAP sujeto a
∑
m i
ni = N , donde “ni” es el número de individuos que enfrentan un rango de pago “bi”. Las
variables consideradas en el diseño son “bi”, “ni” y “m”, donde “m” es el número de diferentes rangos de pagos (m
un criterio simple de incrementos iguales aproximados en forma log-lineal entre los rangos de pagos y un “m” predeterminado. En conclusión, la información cuantitativa ha sido utilizada de una manera informal. 2.2.1.4
Enfoque de Joseph Cooper (1993) sobre la Determinación del Vector de Pagos
En este enfoque, al igual que en el enfoque de Duffield y Patterson (1991), el N está dado y los fondos del investigador son la variable principal para determinar N. Pero en la determinación de “bm” y “nm”, se hace énfasis sobre el criterio de Error Cuadrático Medio y no sobre el criterio de varianza mínima. Se espera que en el proceso de seleccionar “b m” se debe minimizar la posibilidad de que la distribución de estos rangos de pagos sea diferente a la verdadera distribución de la DAPt , donde t=1,...,N. Si los “bm” están muy bajos, en relación a la verdadera DAPt , habrá mayor porcentaje de respuestas positivas SI. Si están muy altas ocurre lo contrario. A pesar de que “n” y “b” (donde “n” y “b” son vectores de “m” x 1) deben ser endógenamente determinados, puede no ser posible determinarlos simultáneamente. De hecho se sigue un procedimiento iterativo de dos pasos, descrito en el siguiente punto. 2.2.1.5
El Modelo “Distribución de los Rangos de Pagos con Areas Iguales de Selección” (DWEABS), desarrollado por Cooper 1993
DWEABS es un modelo iterativo de dos pasos. En el paso 1 - dado el número de rangos de pagos “m”, el tamaño de la muestra N, y una distribución de probabilidad de la DAP seleccionada a priori - el modelo fija las cantidades ofrecidas en iguales incrementos de probabilidad (o sea, el área bajo la función de densidad de la probabilidad está dividida en áreas iguales). En el paso 2, para el conjunto de pagos seleccionados en el paso 1, dados N y la distribución de probabilidad, se hace distribución de “nm” entre los rangos de pagos minimizando la varianza. Los dos pasos se recalculan para m=1 hasta N para encontrar el Error Cuadrático Medio ECM minimizando m* y distribuyendo ([b1*, n1*],...,[bm*, nm*]). En el paso 1, el área bajo la función de densidad de probabilidad f(DAPθ), (preseleccionada a partir de los datos de la preencuesta), está dividida en áreas iguales, con los rangos de pagos correspondientes a los límites entre las áreas. Expresando esto formalmente, dados Pi , bi es un conjunto en F(bi)=Pi, o bi=F-1(Pi), para i=1,...,m. Por ejemplo, si m=1, el área bajo la curva de función de densidad está dividida entre dos áreas iguales, donde las separaciones ocurren en P1=0.5, con un b1=F-1(0.5) correspondiente. Entonces, el orden (Pi) de la distribución correspondiente al cuantil (bi) se define así: Pi=(1/(m+1))*i,
para i=1,...,m
(14)
La división de la distribución en áreas iguales para la selección de los valores de los rangos de pagos se aplica para todo valor de “m” y para toda distribución. DWEABS ubica la mitad de los “b” a cada lado de la mediana. Si uno escoge un punto de rangos de pagos, éste sería la media y la mediana , las cuales son idénticas para distribuciones simétricas. Suponiendo
10
que la distribución predeterminada es la verdadera, el encuestado va estar igualmente dispuesto a aceptar o a rechazar el rango de pagos, por lo tanto se estará maximizando la probabilidad de que las respuestas estén equitativamente balanceadas entre “unos” y “ceros”. Para un “m”, la mitad de los puntos de rangos estarán fijos en el lado del “1” de la mediana y la otra mitad a incrementos equidistantes de probabilidad. Para un “m” impar, m/2 es la mediana. Con DWEABS, el punto de truncación T reemplaza “∞“ en el límite superior de la función del valor esperado (Ecuación 12), y no está determinado a priori, contrario de lo que hacen Duffield y Patterson (1991), más bien es una función creciente de “m”. Mientras “m” incrementa, más rangos de pagos están incluidos en las colas de la distribución - los rangos se seleccionan en un proceso que se aleja del centro de la distribución a medida que “m” incrementa. En este proceso de selección, los incrementos entre los rangos incrementan a medida que la distancia de la mediana incrementa. Como el tamaño de “m” es finito, esta tendencia es una forma eficiente de distribuir las cantidades de los rangos; dichas cantidades están ubicadas cerca una de otra en la región de más alta densidad, y más apartadamente en la región de menor densidad. En el paso 2, una vez determinados los puntos de los rangos de pagos según paso 1, se deriva la distribución de “nm” minimizando el ECM. El criterio es escoger “nm” que minimiza ∩∩
∩∩
el ECM ( DAPΙ b1 ,... bm ,θ ) = sesgo 2 + var( DAP ) sujeto a la restricción del tamaño total de la muestra: ∩∩
2
∩∩
min ( DAP − DAP ) + var( DAP )
n1 ,..., nm
(15)
m
s. a . ∑ ni = N , donde ni ≥ 0
para i = 1,..., n
i =1
∩∩
donde la DAP estimada en el programa de diseño se denota como DAP para diferenciarla ∩ de DAP , la que se estima a través de una regresión aplicada a las respuestas obtenidas con ∩∩
la encuesta de Formato Dicotómico, diseñada minimizando el ECM de la DAP . Siendo que las cantidades discretas “bm” se manejan hasta en el paso 2, se debe hacer una aproximación lineal discreta de la media continua para las variables diferentes a cero (Ecuación 12) y la varianza de la DAP. Duffield y Patterson (1991), han desarrollado aproximaciones no paramétrica trapezoidal para estos estimadores. Basándose en una aproximación a una integral, partida en “m” secciones de ∆bi de longitud, su aproximación ∩∩
de la DAP truncada a ∩∩
∞
∫ [ 1 − F (b)] db es: 0 m
DAP = ∑ ∆bi pi
(16)
i =1
donde, ∆bi=(bi+1-bi-1)/2, para i=2,...,m-1, ∆b1=(b2-b1)/2 y ∆bm=(bm-bm-1)/2
11
y pi=niy / ni es el porcentaje de respuestas positivas a “bi”. Considerando el hecho de que niy es una variable aleatoria binomial con parámetros ni y πi, donde πi=1-F(bi), la varianza de niy es niπi(1-π), y así var(pi)=πi(1-πi)/ni . Con esta derivación Duffield y Patterson (1991) obtuvieron su ecuación de la varianza del estimador de la DAP en (20), m
∩∩
var( DAP ) = ∑ ( ∆bi ) 2 π i (1 − π i ) / ni ,
(17)
i =1
m
Duffield y Patterson minimizan ecuación (17) sujeta a la restricción
∑n
i
= N . Sin
i
embargo, el criterio de ECM es preferible. Para minimizar el ECM con respecto a “nm”, las fórmulas (16) y (17) se sustituyen por la media y la varianza en (15). En ecuación (16), siendo que niy es desconocido, 1-F(b) se substituye por pi en vez de niy / ni. Siendo también que el sesgo no es función de los “n”, la condición de primera orden de la ecuación (15) y la versión restringida de la ecuación (17) son las mismas para un conjunto de rangos dado. Así el enfoque de Duffield y Patterson encuentra el ECM y varianza, minimizando los “n” solo para un conjunto de rangos de pagos dado. Para cualquier N, éste será el ECM minimizando el diseño de la muestra solo por casualidad. En el DWEABS, el modelo es iterativo con m=1 hasta N usando (15) como la función objetivo para encontrar el óptimo ECM minimizando el diseño de la muestra (b1,...,bm ; n1,...,nm). A diferencia del enfoque de Duffield y Patterson, DWEABS examina el diseño de los rangos de pago para cada posible valor de “m”. Por las ecuaciones (16) y (17) y por las propiedades de los rangos de pagos de DWEABS, ∂ sesgo/∂m<0 y ∂var/∂m>0. Esto ocurre porque la exactitud de la aproximación trapezoidal de E(DAP) aumenta a medida que el número de incrementos “m” aumenta. Reescribiendo ecuación (17) como un Lagrangiano sujeto a la restricción del tamaño de la muestra, tomando las condiciones de primer orden, resolviéndolos para ni* se obtiene el resultado de Duffield y Patterson (1991): n = * i
N∆bi [ π i (1 − π i )] m
∑ ∆b [ π i
i =1
i
1/ 2
(1 − π i )]
1/ 2
,
i=1,...,m.
(18)
Este resultado es aplicable a cualquier encuesta del MVC FD, donde el costo por cada encuesta individual es independiente de la cantidad del rango de pago. 3.
METODOLOGIA
3.1
Diseño de la Encuesta
Para obtener respuestas realistas se debe presentar una situación creíble, aunque ésta sea
12
hipotética. La encuesta se debe diseñar de manera que se puedan identificar las principales variables que influyen en la decisión de los encuestados, evitando sesgos y facilitando los cálculos econométricos posteriores. 3.1.1 Elementos de la Encuesta Siendo que se trabaja con una situación hipotética y respuestas subjetivas, deben tomarse en cuenta ciertas normas y elementos que componen la encuesta para asegurar un buen diseño de la misma. Para asegurar lo anterior, la encuesta se elaboró de acuerdo a las pautas generales entregadas por Mitchell y Carson (1989, 1995), pero se hizo énfasis en los siguientes elementos de la encuesta (Duffield y Patterson, 1991, Cooper, 1993): * Tamaño de la Muestra “N” Según Joseph Cooper (1993), el número total de observaciones en la encuesta N, se fija según los recursos disponibles del investigador. Sin embargo, a medida que vaya incrementando N los valores estimados se van aproximando a los verdaderos valores poblacionales. Debido a que en este trabajo se estudió el comportamiento de tres distintos diseños de encuesta y contó con una cantidad limitada de recursos para la investigación, se utilizaron únicamente 100 observaciones por cada encuesta. * Rangos de Pagos “$bm” y el Vector de Pagos “m” En el Formato Dicotómico se fija un Vector de Cantidades Ofrecidas (Pagos) “m” compuesto por varios rangos de pagos “bm”. El número de rangos, la cantidad por rango y la submuestra de N por cada rango “nm” se determinaron a través de distintos métodos analizados en la sección 2.2.1. * Límites Inferior y Superior de los Pagos Con las cantidades mínima y máxima que los turistas están dispuestos a pagar DAP, obtenidas a través de preguntas abiertas en la preencuesta, se determinaron los límites inferior y superior del vector de pagos. * La Distribución Estadística de la DAP - de las submuestas “nm” La muestra total N está subdividida en “nm” submuestras que están distribuidas entre los distintos rangos de pagos. La distribución estadística de la DAP determina la distribución de los “n” entre los rangos. Puede ser simétrica (ej.: normal, logística) o asimétrica (ej.: lognormal, gamma). Existe poca evidencia para indicar de qué forma se distribuye la DAP, por tanto el supuesto de la distribución afecta el diseño de la encuesta y por ende los valores estimados de las medidas de bienestar. Siendo que el diseño de la encuesta depende de la combinación de los elementos descritos, es muy importante la forma de determinación de cada uno de ellos. En este trabajo se utilizan tres diseños, donde se manipulan dos elementos: el vector de pagos y; la distribución estadística de la DAP.
13
El diseño A) presenta vector de pagos determinado en forma tradicional (no optimizado) con distribución simétrica (uniforme) de la DAP; el diseño B) presenta vector de pagos optimizado según modelo DWEABS4 desarrollado por Cooper (1993), con una distribución simétrica (logística) de la DAP y; el diseño C) presenta vector de pagos optimizado con el modelo DWEABS25 pero bajo una distribución asimétrica (lognormal) de la DAP. 3.1.2 Proceso de Encuestación En este trabajo se optó por el método de entrevista personal, el cual es más directo y asegura la calidad de la aplicación de la encuesta: control del tiempo, información presentada al encuestado, mantener el orden de las preguntas y el uso de material visual. La encuesta se aplicó en el balneario, durante el mes de Febrero a turistas que no provenien del área afectado. Según estadísticas de la Municipalidad de Quillón, unos 30.000 turistas visitan la Comuna de Quillón y la Laguna por temporada (Enero, Febrero y Marzo). 3.1.2.1 El Mercado Hipotético y el Vehículo de Pago La base del método de valoración contingente, es estimar cambios en el bienestar de las personas cuando cambia la calidad de un bien ambiental. Siendo que este bien no es transable en ningún mercado específico, se debe crear un mercado hipotético lo suficientemente creíble como para obtener respuestas realistas por parte de los encuestados. Para este estuido se formuló un mercado hipotético de permisos de emisión de gases. Los permisos serían emitidos por CONAMA (Comisión Nacional del Medio Ambiente) a inicio de cada año durante la vida útil de la planta de celulosa y podrían ser comprados por cualquier persona jurídica o natural, municipalidad u otra institución interesada. Se planteó que las siete comunas afectadas crearían un fondo común para comprar una cantidad de permisos que permita mantener la emisión a un nivel en que no se afectarían las actividades relacionadas con la calidad del aire. Una comisión monitorearía este proceso. El vehículo de pago propuesto es un cargo adicional sobre el valor de la entrada al balneario. El pago por acceso actual es de $500. Este cobro adicional sería destinado al fondo mencionado. 3.1.2.2
Preencuesta con Formato Abierto
Antes de la encuesta final, se aplicó una preencuesta con formato abierto donde se le preguntó abiertamente al encuestado sobre la cantidad que está DAP para evitar la desmejora ambiental. Se realizaron un total de 60 preencuestas. Esto se hizo con el propósito de verificar el funcionamiento general de la encuesta, determinar los límites inferior y superior del vector de pagos y seleccionar la distribución de la DAP. 3.1.2.3
Encuesta Final con Formato Dicotómico
Modelo “Distribución de los Rangos de Pagos con Areas Iguales de Selección” (DWEABS) cuando la distribución de la DAP es simétrica. 5 Modelo “Distribución de los Rangos de Pagos con Areas Iguales de Selección” (DWEABS2) cuando la distribución de la DAP es asimétrica. 4
14
En la encuesta final se utilizaron las mismas preguntas que en la preencuesta, con la diferencia de que la DAP se obtiene mediante una pregunta dicotómica: “Teniendo en cuenta sus ingresos, gastos, número de visitas que realiza al año y otras posibilidades de recreación, ¿estaría Ud. dispuesto a pagar $______X_______ adicional al valor de la entrada, para mantener la calidad de aire de la Laguna Avendaño?” 3.1.3 Diseño Optimo del Vector de Pagos bajo Distintos Supuestos de Distribución para la DAP En este trabajo se asumen tres distintas distribuciones de la DAP para cada diseño: A) simétrica uniforme; B) simétrica logística y; C) asimétrica lognormal. Con las distribuciones B) y C) se aplican los modelos DWEABS y DWEABS2 para optimizar el vector de pagos. Los estimadores de los parámetros de la distribución de la DAP, necesarios para los modelos DWEABS y DWEABS2, fueron obtenidos de la preencuesta con formato abierto (FA). Debido a que la teoría económica no da ninguna orientación sobre la distribución estadística esperada, es difícil determinar la naturaleza de la distribución. A pesar de ello, en los estudios empíricos frecuentemente se asume que la distribución de la DAP es simétrica. En el diseño A) se asume una distribución simétrica uniforme y en el dseño B) una distribución simétrica logística para la DAP. Mientras tanto, para el diseño C) se selecciona la distribución asimétrica lognormal. Existen varias técnicas para determinar cual de estas distribuciones es apropiada. En este trabajo se utilizan el Test Gráfico Q-Q Plot y el Test Box-Cox (Johnson, 1982) para verificar la normalidad de los datos a partir de la preencuesta. Con el Test Q-Q Plot se grafican los cuantiles de la muestra versus una situación hipotética donde los cuantiles están distribuidos normalmente (los datos hipotéticos forman una línea recta). Si los puntos de los dos gráficos sobrepuestos están cerca, se puede asumir la normalidad de los datos. Al mismo tiempo, la distribución logística puede ser utilizada cuando los datos están aproximadamente normalmente distribuidos, porque son distribuciones parecidas. También, con el Test Gráfico Q-Q Plot, aplicado en los datos de la preencuesta, se puede verificar si los datos están distribuidos lognormalmente. Si los datos están distribuidos lognormalmente, entonces el logaritmo de los datos debe dar aproximadamente una línea recta. Con el test Box-Cox, aplicado a los datos de la DAP con formato abierto, se asume que existe un valor λ para el cual la variable aleatoria DAP es transformada de la siguiente forma: (DAPFAλt-1)/λ. Si la DAP está distribuida lognormalmente λ=0, y si la DAP está distribuida normalmente λ=1. Por tanto, se probó la hipótesis nula de que DAP está distribuida lognormalmente ante la hipótesis alternativa de que tiene distribución normal. Para formalizar lo anteriormente expuesto consideremos la formula (12), que es un modelo probabilístico para la distribución de frecuencias de una variable aleatoria continua
15
representado por una curva continua que corresponde a la llamada función de densidad acumulada: ∞
E ( DAP ) = ∫ [ 1 − F (b )] db
(12)
0
Esta densidad puede tomar una gran variedad de formas. Las que se analizan aquí son la distribución de probabilidad normal, la distribución de probabilidad logística y la distribución de probabilidad lognormal. La Distribución de Probabilidad Normal Es una distribución continua en forma de campana, que es la más utilizada en una gran variedad de aplicaciones estadísticas. (Fig. 1). Como la ecuación de la función de densidad se construye de manera que el área bajo la curva representa probabilidad, el área total es igual a 1.
Su forma funcional de densidad viene dada por:
f(b)
σ b µ Fig.1 Función de densidad de probabilidad normal.
(b − µ ) 2 exp − -∞ < b < ∞ (19) 2σ 2 σ 2π donde µ es su media y σ es su desviación estándar y σ2 es su varianza. Entonces b sigue una distribución normal con media µ y varianza σ2 de la siguiente forma b~N(µ,σ2). f (b ) =
1
Esta distribución puede adoptar también f(b) una forma uniforme, como en el caso del diseño A) de este trabajo, donde los cuantiles están igualmente distribuidos bajo la curva de función de densidad. (Fig. 2).
La Distribución Logística
1 m b Fig.2 Función de densidad de probabilidad uniforme. f(b)
Si f(bi) es logística, los estimadores de los parámetros necesarios para calcular F(bi) pueden ser expresados a través de la Logística 16
Lognormal
b µ Fig.3 Funciones de densidad de probabilidad logística y lognormal.
siguiente forma funcional logística:
F(bi)= [1+exp(-(α+βbi))]-1 , donde α+βbi , β < 0
(20)
Esta distribución simétrica es la que se utiliza en el diseño B) de este trabajo. (Fig. 3). La Distribución Lognormal Esta distribución de probabilidad es la que se utiliza para el diseño C) de este trabajo y es la que representa una distribución asimétrica. Una variable b se dice que tiene una distribución logarítmico normal si logeb sigue una distribución normal. Si se supone que y=log b es N(µ, σ2), entonces b=ey sigue una distribución logarítmico normal LN(µ,σ2). Su media y su varianza están dadas por, E (b ) = E ( e y ) = e µ + (1/ 2 )σ 2
2
y, 2
V (b ) = V ( e y ) = e 2 µ +σ ( e σ − 1)
(21)
La curva de frecuencia de la distribución logarítmico normal aparece también en la Fig. 3, donde se puede apreciar la diferencia en la forma de la curva de la función de densidad, entre una distribución simétrica y una distribución asimétrica. Hay que mencionar también que, como muchas otras variables en economía, éstas no pueden tener valores negativos. 3.1.4 Forma Funcionale Seleccionada para las Medidas de Bienestar La medida de bienestar se determina como la cantidad máxima que los turistas de la Laguna Avendaño estarían dispuestos a pagar por evitar un cambio desfavorable y se define como variación equivalente. En este trabajo inicialmente se considera la forma funcional lineal de Hanemann (1984) y sus respectivas medidas de bienestar. Y para esta forma funcional desaparece la variable Ingreso, ∆V=α-βX+η. Pero, para las tres muestras de este trabajo ésta variable resultó estadísticamente significativa, mientras que el resto de variables socioeconómicas no fueron significativas. Por esta razón, y para tener mejor análisis de las medidas de bienestar de los tres modelos, se decidió adaptar la forma funcional lineal de Hanemann agregándole la variable Ingreso, obteniendo así la siguiente expresión ∆V=α-β1X+β2Y+η. 3.1.5 Distribución LOGIT para el Término Estocástico η 17
Una vez obtenidos los datos de la encuesta con formato dicotómico, donde también se obtiene la información sobre las características socioeconómicas del encuestado (McConnel y Ducci, 1989), la probabilidad de una respuesta positiva estará dada por la función de probabilidad acumulada de η evaluada en ∆V, que se asume sigue la distribución logística Logit: Pr(P=1)
= F(V) = 1-Gc(X) 1 = 1− 1 + e − ∆V
(22)
3.1.6 Método de Máxima Verosimilitud El método que se usa para estimar el modelo Logit es el Método de Máxima Verosimilitud. Este método estima los parámetros del modelo maximizando la función de verosimilitud con respecto a los parámetros del modelo - encontrando los valores de los parámetros que maximizan la probabilidad de encontrar las respuestas obtenidas en la encuesta. Asumiendo que F sigue la función LOGIT, el logaritmo de la función de verosimilitud L sobre la totalidad de la muestra, o el logaritmo de la probabilidad de obtener la muestra que se obtuvo, en donde cada individuo tuvo la opción de escoger Pi= 0,1, está dada por: L = Log (∏ F ( ∆V )∏ (1 − F ( ∆V ))) Pi = 1
L = Log (∏ ( Pi = 1
L=
Pi = 0
1 e − ∆V ) ( ) ∏ 1 + e − ∆V Pi = 0 1 + e − ∆V
∑ Pi *Log (
todoPi
1 e − ∆V ) + ( 1 − Pi ) * Log ( ) ∑ 1 + e − ∆V 1 + e − ∆V todoPi
(23)
donde ∆V puede reemplazarse por cualquiera de las formas funcionales dadas en la Tabla 1 de la sección anterior. Todos los cálculos se efectuaron con el Programa Computacional LIMDEP 6,0 (Green, 1991). 3.1.7 Intervalos de Confianza Para determinar la significancia de los estimadores y hacer comparación entre ellos, se desarrollaron intervalos de confianza para las medidas de bienestar. El procedimiento consiste en estimar la distribución de probabilidad de las medidas de cambio de bienestar. Siendo que los estimadores de los cambios en el bienestar son variables aleatorias, dependen de los coeficientes de los modelos econométricos estimados. Por tanto tienen una distribución de probabilidad que depende de la distribución de los coeficientes del modelo
18
adoptado. La estimación del modelo Logit utilizando el método de Máxima Verosimilitud proporciona estimadores los cuales son asintóticamente normales y tienen propiedades asintóticamente deseables (Amemiya, 1981). Los estimadores de las medidas de bienestar son funciones no lineales de los parámetros estimados en el modelo econométrico, y por esta razón no es fácil derivar analíticamente expresiones para la varianza de estas medidas. Krinsky y Robb (1986) propusieron un método basado en simulación, al que Park, Loomis y Creel (1991) utilizaron para estimar límites de confianza de medidas de bienestar basadas en modelos de valoración contingente. El método consiste en generar una muestra de gran tamaño de los coeficientes del modelo de regresión, utilizando los estimadores de la matriz de varianza-covarianza generados al estimar el modelo vía máxima verosimilitud. Dadas las propiedades de estos estimadores, se supone entonces que los parámetros βi siguen una distribución normal multivariada con media y varianza conocidas. Para cada una de las realizaciones de los parámetros del modelo econométrico en la muestra generada se calcula la medida de bienestar correspondiente, obteniéndose de esta manera tantas como se desee. Se obtiene un intervalo de confianza (1α) al organizar el vector de valores calculados de las medidas en orden ascendiente y eliminar α/2 de los valores de cada cola del vector para que sea en forma no paramétrica. En este trabajo se utilizaron 1.000 iteraciones para construir los intervalos de confianza simulados de las medidas de bienestar, utilizando el programa LIMDEP 6,0 (Green, 1991), para hacer las iteraciones. Después, se observa si la medida de bienestar originalmente calculada está dentro del intervalo de confianza construido. Si esto ocurre, entonces su estimador es significativo. Después se comparan los intervalos de confianza de los distintos modelos para ver si se traslapan. Y si esto ocurre, entonces las distintas medidas de bienestar no son estadísticamente diferentes. La medida con menor intervalo de confianza tiene mayor significancia, debido a la menor varianza. 4.
ANALISIS DE RESULTADOS
4.1
Test Gráfico Q-Q Plot y Tes Box-Cox para Determinar la Distribución Estadística de la DAP a partir de la Preencuesta
Después de aplicar la preencuesta con formato abierto, con una muestra de 60 observaciones, se aplicó el Test Q-Q Plot para visualizar gráficamente la distribución de la DAP. Los cuantiles de la muestra actual están distribuidos cerca de los puntos de la situación hipotética (que presenta una distribucón normal). Por tanto, se determinó que la DAP tiene una distribución simétrica. Se asume una distribución logística. Con el Test Box-Cox se obtuvo un λ=0,92 con un χ2 =88,37 que rechaza la hipótesis nula (de que la DAP a partir de la preencuesta se distribuye lognormalmente), con un 90% de confianza. Con este test se confirmó que la DAP tiene una distribución simétrica.
19
4.2
Cálculo del Vector de Pagos para Cada Diseño, según la Distribución Asumida para la DAP
La preencuesta sirvió no solamente para determinar la distribución de la DAP sino también el Límite inferior = 50 y el Límite superior = 3.000. Con el tamaño de la muestra N dado, igual a 100 por cada diseño, se procedió a calcular el vector de pagos “m” y las submuestras “n” por cada rango de pago “b”, para cada uno de los tres diseños. En el diseño A), de distribución uniforme, no se utiliza el modelo DWEABS, el vector de pagos ”m” asume 10 rangos de pagos “b”, con 10 submuestras iguales “n”. En los diseños B) de distribución logística y C) de distribución lognormal, se usa el modelo DWEABS y DWEABS2 respectivamente para optimizar el vector de pagos, con sus respectivos rangos de pagos y tamaño de las submuestras. Tabla 3:
Elementos del Vector de Pagos según la Distribución de la DAP de cada Diseño: A) Uniforme, B) Logística y C) Lognormal.
Tamañ Diseño A Diseño B Diseño C o vector Rangos b Submuestr Rangos b Submuestr Rangos b Submuestr m an an an 1 50 10 45 7 160 1 2 377 10 312 15 212 2 3 705 10 489 12 256 2 4 1.033 10 635 11 297 2 5 1.361 10 768 11 337 2 6 1.688 10 902 11 378 3 7 2.016 10 1.047 12 420 3 8 2.344 10 1.225 15 464 3 9 2.672 10 1.492 7 510 3 10 3.000 10 560 4 11 615 4 12 676 4 13 743 5 14 821 5 15 913 6 16 1.023 7 17 1.162 9 18 1.349 11 19 1.628 16 20 2.155 8 Fuente: Elaboración propia en base a los datos obtenidos con los modelos DWEABS y DWEABS2. Tabla 4:
Media E(DAP) y Varianza Var(DAP) para los Datos de la Preencuesta.
20
Media E(DAP)
Datos de la Preencuesta 768,33
Var(DAP)
356.862
Fuente: Elaboración propia en base a los datos obtenidos con los modelos DWEABS y DWEABS2. Tabla 5:
Media E(DAP) y Varianza Var(DAP) para el Vector de Pagos Optimizado “m*” de cada Diseño - antes de aplicar la Encuesta Final.
Media E(DAP)
Diseño A 1.539,1
Diseño B 768,33
Diseño C 1.041,50
Var(DAP)
889.890
158.404
296.861
Fuente: Elaboración propia en base a los datos obtenidos con los modelos DWEABS y DWEABS2. En la Tabla 6, donde se observa que el diseño A) no utilizó ningún criterio para demostrar que su vector de pagos “m” es óptimo en los rangos de pagos “b” y las submuestras seleccionados “n”. Mientras tanto, los diseños B) y C) utilizan el criterio del Error Cuadrático Medio (aplicando los modelos DWEABS y DWEABS2) para determinar el vector de pagos óptimo “m*”. El vector con diseño B) tiene menor ECM que el vector con diseño C), por lo tanto se considera más eficiente. A la vez, ambos son más eficientes que el vector con diseño A). Tabla 6:
ECM
Criterio de optimización del Vector de Pagos de los diseños B) y C): Error Cuadrático Medio ECM. Diseño A* --- *
Diseño B 8.741,12
Diseño C 45.150,52
Rango de Pagos “b*” en que se optimiza el 10 * 9 20 vector de pagos Fuente: Elaboración Propia en base a los datos obtenidos con los modelos DWEABS y DWEABS2. *) El diseño A no utiliza ningún criterio para optimizar su vector de pagos.
4.3
Descripción de la Muestra
Tabla 7: Descripción de las Variables de las Tres Muestras.
21
Variable Rango de Pagos “b” - Respuestas SI - Media
Muestra A
Muestra B
Muestra C
44% 1.539,1
68% 768,3
59% 1.041,3
Ingreso familiar (promedio) Transporte en que viaja (privado) Días por año que visita la Laguna Importancia del Aire según el encuestado Conocimiento del Proyecto por el encuestado Edad promedia de encuestado Sexo masculino
446.000
448.000
498.000
85%
81%
82%
4,5
4,7
5,0
9,92
9,80
9,96
10%
13%
13%
43
45,5
41
55%
56%
66%
Miembros por 5 5,5 5,2 Familia Fuente: Elaboración Propia en base a los datos obtenidos de las tres encuestas. Como se puede observar las muestras son bastante homogéneas. Esto es así porque la única variable que varía entre los distintos diseños es la del Rango de Pagos, ya que ésta se determina según la optimización del vector de pagos. Por lo tanto, se nota la diferencia entre las respuestas positivas según cada diseño. 4.4
Estimación del Modelo LOGIT con una Forma Funcional Lineal
Como ya se había mencionado en el Capítulo 3, en este trabajo se utiliza una adaptación de la forma funcional lineal de Hanemann (1984) para ∆V para estimar las medidas de bienestar. La Media C+, la Mediana C*, y la Integral Positiva C’ son las medidas de bienestar utilizadas para hacer comparaciones entre los tres modelos con distinto diseño. Hay que notar, que la media es igual a la mediana (α/β) para esta forma funcional, por tanto se presentan como un único resultado. Entonces, siendo que la forma funcional lineal está dada por la expresión ∆V = α - βZ (donde Z es cualquier variable), el primer paso fue correr en el Programa LIMDEP 6.0 una regresión con el modelo LOGIT, y con todas las variables descritas en la Tabla 7. Se excluyó únicamente la variable Días por año que visita la laguna, porque ésta se determina endógenamente. Además, tampoco es estadísticamente significativa. Obteniendo así: Pr(Resp. SI)=α1 - β1b+β2Ingr+β3Trans+β5Aire+β6Proy+β7Edad+β8Sexo+β9Fam
22
Este procedimiento se aplicó para las tres muestras obtenidas A), B) y C). Después se analizaron los “t-student” estadísticos y las únicas variables significativas fueron el Rango de Pagos “b” y el Ingreso. Entonces, se corrió una segunda regresión, únicamente con estas dos variables, obteniendo así la siguiente expresión: Pr(Resp. SI) = α1 - β1b + β2Ingr Tabla 8:
Estimación de los Coeficientes del Modelo LOGIT Lineal para las Tres Muestras*
Variable Intersección α1
Modelo A -1,1619 (-1,307)
Modelo B 2,5381 (1,901)
Modelo C 1,1461 (1,107)
“b”
-0,1964 (-5,061)
-0,4758 (-4,682)
-0,3587 (-5,050)
Ingr
0,8591 (3,592)
0,5550 (2,199)
0,6414 (2,753)
Fuente: Elaboración Propia en base a los datos obtenidos a partir de las regresiones corridas. *) Entre paréntesis están los valores “t”. Como se observa, las variables significativas también son consistentes con la teoría económica. Primero, la variable “b” tiene signo negativo porque a mayor cantidad de pago propuesta, hay menor DAP por parte de los encuestados. Segundo, la decisión del individuo depende principalmente de su restricción presupuestaria, que se determina por el ingreso familiar. Por tanto a mayor ingreso mayor disposición a pagar. Esto y el hecho de que la única variable significativa a parte del Rango de Pagos resultó ser el Ingreso Familiar, justifica la adaptación de la forma funcional lineal de Hanemann, donde se introduce el Ingreso en la regresión. Para calcular las medidas de bienestar C, a partir de los coeficientes obtenidos en la Tabla 8, se procede de la siguiente forma: Para la Media C+ y la Mediana C* se utiliza la expresión α C = , mientras que para la Integral Positiva C’ se utiliza la expresión log(1+eα)/β β donde, α = α1 + β2Ingr y β = β1, obteniendo así las medidas de bienestar para cada uno de los modelos A), B) y C). Tabla 9:
Estimadores de las Medidas de Cambio en el Bienestar C+, C* y C’. **
Medidas de Bienestar C
Modelo A
Modelo B
23
Modelo C
Media C+ y Mediana C*
1.355 (675)
1.055,9 (154,7)
1.209,4 (245,6)
Integral Positiva C’
1.417 1.057,6 1.214,4 (619,61) (153,80) (242,15) Fuente Elaboración Propia en base a los datos obtenidos a partir de las regresiones corridas. **) Los valores entre paréntesis representan las desviaciones estándar. Al visualizar los resultados de las medidas de bienestar, se confirman las observaciones hechas anteriormente, donde el modelo B) sigue teniendo la menor media con menor varianza6, seguido por el modelo C) y por último por el modelo A). 4.5
Estimación de Intervalos de Confianza para las Medidas de Bienestar.
Con el procedimiento iterativo de Park, Loomis y Creel (1991), se obtienen los intervalos de confianza simulados. Tabla 10:
Intervalos de Confianza para las Media C+ y Mediana C*. **
Media C+ y Mediana C* de los Modelos A, B y C Intervalos de Confianza Simulados
Modelo A
Modelo B
Modelo C
1.335 (675,01)
1.055,9 (154,71)
1.209,4 (245,6)
[1.086,25 – 1.559,38]
[952,95– 1.185,35]
[1.081,88 – 1.345,71]
Tamaño del Intervalo de 473,13 232,40 263,83 Confianza Fuente: Elaboración Propia en base a los datos obtenidos de la simulación de Intervalos de Confianza. **) Entre paréntesis están los valores de las desviaciones estándar. Tabla 11: Intervalos de Confianza para la Integral Positiva C’. ** Modelo A
Modelo B
Modelo C
Integral Positiva C’ de Modelos A, B y C
1.417 (619,61)
1.057,6 (153,8)
1.214,4 (242,15)
Intervalos de Confianza Simulados
[1.049,32 – 1.694,93]
[846,42 – 1.264,78]
[967,56 – 1.449,28]
6
Var(C)=σ2, donde σ es la desviación estandar. 24
Tamaño del Intervalo de Confianza
645,61
425,31
481,72
Fuente: Elaboración Propia en base a los datos obtenidos de la simulación de Intervalos de Confianza **) Entre paréntesis están los valores de las desviaciones estándar. La Media C+, la Mediana C* y la Integral Positiva C’ de los tres modelos están dentro de los intervalos de confianza calculados, por lo tanto todas son significativas estadísticamente. Los intervalos de los tres modelos se traslapan, implicando que las medidas de bienestar no son estadísticamente diferentes entre sí. Sin embargo, el modelo B) tiene los menores intervalos de confianza, por lo que sus medidas de bienestar C+, C* y C’ son las más significativas estadísticamente. Las medidas de bienestar C+, C* y C’ del modelo B) siguen siendo las menores y con menor varianza seguidas por las medidas del modelo C) y después por las medidas del modelo A). CONCLUSIONES -
No existe una regla general sobre como se distribuye la DAP, puede ser simétrica o asimétricamente. Por esto, hay que utilizar técnicas como el Test Gráfico Q-Q Plot y el Test Box-Cox para verificar que la distribución de la DAP.
-
Se observa que el vector de pagos optimizado “m*” del diseño B) con distribución logística tiende a tener un menor número de rangos “b”=9, mientras que el “m*” del diseño C) con distribución lognormal tiende a tener un mayor número de “b”=20. En el diseño A) con distribución uniforme no se usa ningún criterio para determinar “m*” y los rangos “b”=10 se establecen arbitrariamente.
-
Bajo estas condiciones, los diseños con vector de pagos optimizado agrupan los datos en el centro, mientras que el diseño no optimizado deja muchas observaciones en las colas donde la probabilidad de respuesta positiva es menor. Esto hace que la varianza de los diseños optimizados sea más pequeña. El diseño B) es el que presenta la menor varianza y el menor ECM, por lo que tiene mejor diseño.
-
Lo más sorprendente es que el diseño A) aunque tiene la distribución de la DAP determinada para este trabajo, presenta mayor varianza que la del diseño C). Esto se debe a que éste último tiene el vector de pagos “m” optimizado. Por tanto, es más grave no optimizar el vector de pagos que cometer el error de asumir una distribución equivocada.
-
También se concluye, que el diseño A) no tiene un criterio formal para la determinación de sus elementos (b, n, m) y por tanto su diseño no es óptimo.
-
Al calcular las medidas de bienestar, se confirman las observaciones hechas 25
anteriormente: se nota que el modelo B) sigue teniendo la menor media y varianza, seguido por el modelo C) y por último por el modelo A). El modelo B) tiene el mejor diseño. -
Al simular los intervalos de confianza de las medidas de bienestar de cada modelo, se encontró que las medidas de bienestar de los tres modelos se encuentran dentro de su intervalos de confianza, concluyendo que todas ellas son estadísticamente significativas. Además, no hay diferencia significativa entre ellas debido a que los intervalos de confianza se traslapan. Sin embargo el modelo B) tiene el menor intervalo de confianza, por lo que tiene el mejor diseño.
Finalmente, se concluye que los estimadores de las medidas de cambio en el bienestar obtenidas a través del Método de Valoración Contingente son sensibles a los cambios que se pueden hacer en los elementos del Diseño del Formato Dicotómico. Por tanto, es necesario un Diseño Optimo para obtener un valor económico estimado cercano al valor económico verdadero de estos bienes ambientales que no son transables y cuya valoración depende únicamente de un mercado hipotético y la opinión subjetiva de sus integrantes. BIBLIOGRAFIA - Amemiya, T. (1981), Qualitive Response Models: A Survey, Journal of Economic Literature, Vol. XIX. 1483-1586. - Ardila, Sergio (1993), Guía Para la Utilización de Modelos Econométricos en Aplicacione del Método de Valoración Contingente. - Azqueta, Diego (1994), Valoración Económica de la Calidad Ambiental, McGraw-Hill. - Bishop, Richard C. and Herberlein, Thomas A. (1979), Measuring Values of Extra Market Goods: Are Indirect Measures Biased? American Journal of Agricultural Economics, 64: 926-930. - Boyle, Kevin., Welsh, Michel P. and Bishop, Richard C. (1988), Validation of Empirical Measures of Welfare Change: Comment, Land Economics, 64(1): 94-98. - Cameron, Trudy Ann (1988), A New Paradigm for Valuing Non-market Goods Using Referndum Data: Maximum Likelihood Estimation by Censored Logistic Regression, Journal of Environmental Economics and Management. - Centro Eula (1997), Estudio de Línea de Base Río Itata., Universidad de Concepción, (Realizada para Celulosa Arauco y Construcción S.A.). - Cooper, Joseph and Loomis, John (1992), Sensitivity of Willingness to Pay Estimates to Bid Design in Dichotomous Choice Contingent Valuation Models, Land Economics, 68(2): 211-24. - Cooper, Joseph C. (1993), Optimal Bid Selection for Dihotomous Choice Contingent 26
Valuation Surveys, JEEM, 24, 25-40. - Dixon, John A., Scura, Louise., Carpenter, Richard A. and Sherman, Paul B. (1996), Economic Analysis of Environmental Impacts, Earthscan Publications Ltd, London, Asian Development Bank and World Bank. - Duffield, John W. and Patterson, David A. (1991), Inference and Optimal Design for a Welfare Measure in Dichotomous Choice Contingent Valuation, Land Economics, 67(2):255-39. - Green, W. H. (1991), Limdep Manual and References Guide, Version 6.0, Econometric Software Inc. Australia. - Hanemann, Michael W. (1984), Welfare Evaluation in Contingent Valuation Experiments with Discrete Responses, American Journal of Agricultural Economics, 222-241. - Hanemann, Michael W. (1989), Welfare Evaluation in Contingent Valuation Experiments with Discrete Response Data: Reply, American Journal of Agricultural Economics, 10571061. - Hanemann, Michael W. (1994), Valuing the Environment Through Contingent Valuation, Journal of economic Perspective. - Johnson, R. (1982), Applied Multivariate Statistical Analisis, Prentice-Hall, Englewood Cliffs, NJ. - Kanninen, Barbara J. and Kriström, Bengt (1993), Sensitivity of Willingness to Pay Estimates to Bid Design in Dichotomous Choice Contingent Valuation Models: Comment, Beijer International Institute of Ecological Economics. - Krinski, Itzhak and Robb, Leslie A. (1986) On approximating the Statistical Properties of Elasticities, Rev. Econ. and Statist., 68: 715-719. - McConnell, Keneth E. and Ducci, Jorge (1989), Valuing Environmental Quality in Developing Countries: Two Case Studies, (Presentado en el Encuentro de la AEA, Atlanta, Georgia). - McConnell, Keneth E. (1990), Models for Referendum Data: The Structure of Discrete Choice Models for Contingent Valuation, Journal of Environmental Economics and Management. - Mitchell, Robert and Carson, Richard (1989), Using Surveys to Value Public Goods: The Contingent Valuation Method, Resources for the Future. - Mitchell, Robert and Carson, Richard T. (1995), Current Issues in the Design, Administration and Analysis of Contingent Valuation Survey, Manchester University Press. - Park, Timothy, Loomis, John and Creel, Michael (1991), Confidence Intervals for 27
EvaluatingBenefits Estimates from Dichotomous Choice Contingent Valuation Studies, Land Economics, 67(1): 64-73. - Pearce, David W. and Turner, Kerry R. (1995), Economía de los Recursos Naturales y del Medio Ambiente, Celeste Ediciones.
28