Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Clase 1 Econometr´ıa IN709 MAGCEA Carlos Noton
Martes 12 de Marzo Oto˜ no 2019
1/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Outline
1
Introducci´on Clase 1
2
Modelo de Comportamiento Causalidad Modelo Determin´ıstico
3
Random Model Properties of Unobservable Random Shocks Expectations
4
Conclusiones Clase 1
2/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Introducci´on ¿Qu´e es la econometr´ıa? ¿Para qu´e sirve la econometr´ıa? Econometrics is the application of mathematics, statistical methods, and, more recently, computer science, to economic data and described as the branch of economics that aims to give empirical content to economic relations. More precisely, econometrics is the quantitative analysis of actual economic phenomena based on the concurrent development of theory and observation, related by appropriate methods of inference. Econometrics adds empirical content to economic theory allowing theories to be tested and used for forecasting and policy evaluation. (Fuente Wikipedia)
3/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Ejemplos Macroeconom´ıa: ¿Qu´e relaci´ on existe entre la tasa de inter´es y crecimiento econ´ omico? Macroeconom´ıa: ¿Qu´e relaci´ on existe entre la tasa de desempleo y la tasa de inflaci´ on? Econom´ıa Laboral: ¿Qu´e relaci´ on existe entre puntaje SIMCE y salarios? Econom´ıa Laboral: ¿Qu´e relaci´ on existe entre educaci´on de los padres y puntaje SIMCE de los hijos? Microeconom´ıa: ¿Qu´e factores determinan la elecci´on de AFP? Microeconom´ıa: ¿Qu´e valores debiera tener el pasaje del Transantiago para evitar congesti´ on?
4/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
M´as Ejemplos Marketing: ¿Qu´e efectos en la demanda genera una promoci´on de 2x1 en un supermercado? Econom´ıa Ambiental: ¿Qu´e reducci´ on de contaminaci´on causaria un impuesto al combustible? Finanzas P´ ublicas: ¿Qu´e tasa de IVA asegura una recaudaci´on de X millones? Organizaci´on Industrial: ¿Qu´e tan competitivo es el mercado de las Isapres? Econom´ıa Pol´ıtica: ¿Qu´e relaci´ on existe entre tasa de desempleo y las votaciones presidenciales? Historia Econ´omica: ¿Qu´e relaci´ on hubo entre aranceles y exportaci´on de Salitre el siglo pasado? Econom´ıa de la Salud: ¿Qu´e porcentaje de fumadores dejar´a de fumar con una ley m´as estricta?
5/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Modelo
B´asicamente, todas la preguntas econom´etricas buscan estimar o testear un modelo. Es decir, se busca contrastar o sustentar relaciones te´oricas con los datos. Modelos antag´ onicos pueden competir en su bondad de ajuste con la realidad. Por lo tanto, el primer paso es tener un modelo de comportamiento para el agente econ´ omico o unidad de an´alisis (individuo, firma, sector productivo, pa´ıs, etc).
6/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Causalidad Modelo Determin´ıstico
Modelo B´asico Queremos explicar o predecir el comportamiento del agente i en alguna variable denominada Yi , que puede ser una decisi´on o una caracter´ıstica. Llamaremos a Yi la variable end´ ogena. Queremos que esta variable dependiente, Yi , sea el resultado causal de otras K variables agrupadas en el vector denominado Xi . Llamaremos a los componentes del vector Xi las variables ex´ogenas. Por lo tanto queremos explicar el escalar Yi con el vector de dimension K , Xi . Ergo, la relaci´on que buscamos es la funci´ on f tal que: Yi = f (Xi ), ∀i ¿Alg´ un ejemplo no econ´ omico? ¿Alg´ un ejemplo econ´omico?
7/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Causalidad Modelo Determin´ıstico
¿Pueden los datos indicarme la relaci´on? El mayor desaf´ıo de la econometr´ıa es encontrar a partir de los datos, la mejor funci´on f que ajuste las observaciones del mundo real. Supongamos que tenemos N observaciones de la vida real, es decir, nuestra muestra o base de datos son N combinaciones de {Yi , Xi }. Pensemos en nuestro ejemplo favorito. Notar que Yi es escalar y Xi = (Xi1 , Xi2 , Xi3 , .., XiK ) es un vector que contiene las K caracter´ısticas observables del individuo i. Obviedad: S´olo lo observable, puede estar en nuestra base de datos. Las N observaciones {Yi , Xi }N i=1 se denominan una muestra aleatoria (random sample).
8/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Causalidad Modelo Determin´ıstico
Causalidad Buscamos variables X ’s que sean causantes o determinantes de Y . Es decir, aquellas variables tales que una alteraci´ on de alg´ un componente de Xi necesariamente implique un cambio en Yi . A veces, solo nos importa una variable explicativa en particular, pero queremos limpiar el efecto de otras posibles variables explicativas. Correlaci´on es la presencia simult´anea de dos variables. Estad´ısticamente puede representarse a trav´es de las covarianzas (que pueden ser negativas o positivas). La simple correlaci´on no basta. Veamos ejemplos no econ´omicos obvios.
9/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Causalidad Modelo Determin´ıstico
Confusi´on de Correlaci´on con Causalidad. Ejemplo Obvio 1: Siempre veo simult´aneamente paraguas y lluvia. Correlaci´on perfecta. ¿Puedo hacer llover sacando paraguas a la calle? Esto es un problema de causalidad inversa. Obviamente, la lluvia causa la presencia de paraguas y no al rev´es. ¿Cierto? Ejemplo Obvio 2: Siempre veo simult´aneamente paraguas y calles inundadas. Correlaci´on perfecta. ¿Qui´en causa a qui´en? Este problema se genera cuando una tercera variable no considerada (la lluvia) puede causar ambas observaciones (calles inundadas y presencia de paraguas).
10/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Causalidad Modelo Determin´ıstico
Causalidad en Econom´ıa Entenderemos la econom´ıa como la disciplina que modela la toma de decisiones de distintos agentes (seres humanos, pa´ıses, empresas, etc.). La relaci´on de causalidad en econom´ıa es mucho m´as discutible. En este caso los ejemplos no tienen nada de obvio. Ejemplo NO Obvio 1: Familias m´as numerosas viven en barrios m´as pobres. Correlaci´on perfecta entre tama˜ no y nivel socioecon´omico. ¿Pobreza causa n´ umero de hijos? ¿Alguna teor´ıa en el p´ ublico? ublico? ¿N´ umero de hijos causa pobreza? ¿Alguna teor´ıa en el p´ ¿Hay alguna tercera variable que pueda causar ambas caracter´ısticas? ¿Hay consenso que no es obvio?
11/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Causalidad Modelo Determin´ıstico
Causalidad en Econom´ıa
Ejemplo NO Obvio 2: las mejores universidades producen los mejores profesionales. Correlaci´ on perfecta. ¿Qui´en causa a qui´en? ¿Que tercera variable podr´ıa explicar esta correlaci´on? Candidatos a 3a variable: Calidad de la Educaci´ on primaria; la educaci´on de los padres y un largo etc´etera.
12/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Causalidad Modelo Determin´ıstico
Causalidad en Ciencias Sociales
Otros Ejemplos No Obvios: Aqu´ı una lista de correlaciones. Discutamos la causalidad. Las empresas m´as grandes son m´as rentables. Tomar una copa de vino al almuerzo hace bien para la salud. Los pa´ıses con baja inflaci´ on tienen mejores sistemas pol´ıticos. Alumnos con computadores en su casa obtienen mejores puntajes SIMCE.
13/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Causalidad Modelo Determin´ıstico
Causalidad en Ciencias Sociales
Otros Ejemplos No Obvios: Aqu´ı una lista de correlaciones. Discutamos la causalidad. Trabajadores m´as educados obtienen mejores salarios. La democracia genera mayor crecimiento econ´omico. Aranceles de importaci´ on m´as altos generan Industrias poderosas. Altas tasas de sindicalizaci´ on causan mayores tasas de conflictos laborales.
14/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Causalidad Modelo Determin´ıstico
Discutiendo Causalidad: M´as Ejemplos No Obvios:
Mayor presencia policial aumenta el n´ umero de delitos denunciados. La presencia de candidatas mujeres aumente el n´ umero de votantes mujeres. Estar desempleado causa problemas de salud. Pa´ıses especializados en recursos naturales son pa´ıses subdesarrollados.
15/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Causalidad Modelo Determin´ıstico
Discutiendo Causalidad: M´as Ejemplos No Obvios:
Menores niveles de corrupci´ on favorece a la inversi´on en capital humano. Pa´ıses con mayores tasas impositivas tienen mayores d´eficits fiscales. Pa´ıses con mayores ingresos tienen mejores universidades. Personas que leen frecuentemente tienen menor propensi´on a contraer mal de Alzhaimer.
16/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Causalidad Modelo Determin´ıstico
Modelo Determin´ıstico
Supongamos X efectivamente causa Y. Hasta el momento basados en nuestra base de datos observables, tenemos el siguiente modelo:
Yi = f (Xi ), ∀i Esta relaci´on determin´ıstica es super exigente. No hay posibilidad de error. Xi es deterministico lo mismo que Yi . No hay componentes aleatorios. No hay componentes no observables.
17/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Causalidad Modelo Determin´ıstico
Modelo Determin´ıstico
En econom´ıa que modela comportamiento humano, esta relaci´on nunca es perfecta. Siempre hay determinantes no observados. Siempre hay errores o consideraciones puntuales que produjeron una respuesta Yi distinta a la esperada a pesar de tener el mismo Xi . ¿Como podemos reconciliar los datos con las teor´ıas? ¿Como entender la realidad si existen determinantes no observados?
18/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Properties of Unobservable Random Shocks Expectations
Random Model Let us include random shocks in the model. Now the dependent variable or outcome Yi is the result of two forces: 1 2
Some observable characteristics or features denoted by Xi ; Some random unobservable shocks denoted by εi .
Hence, Yi = f (Xi , εi ) For now, suppose Xi is deterministic. εi is random to be consistent with unpredictable and unobservable shocks. εi ensures a perfect fit! Yi is random variable because it is a function of εi , which is a random variable.
19/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Properties of Unobservable Random Shocks Expectations
Properties of unobservable components εi
What would be desirable and reasonable properties for the unobservable shocks? We want εi to be unpredictable random shocks. We want εi to be a non-systematic component. We will start with the more restrictive assumptions. Over time we will relax some and we will explore models under different settings.
20/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Properties of Unobservable Random Shocks Expectations
First Property of εi We want that all agents are facing the same random shocks. Hence, they should be independent. We want that εi is absolutely independent of εj . Along the same lines, they should be drawn from exactly the same distribution. The distribution function should be the same εi for all i. All together means that the random variable εi is independent and identically distributed. We denote this as εi ∼ i.i.d.. Notice that this assumption does not imply any particular distribution.
21/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Properties of Unobservable Random Shocks Expectations
Second Property of εi
What are the requirements for the first moment of the shocks? Suppose E (εi ) = α. If α 6= 0, then we can always re-write the model based on new shocks ui such that ui = εi − α, where E (ui ) = 0. Therefore, without loss of generality (WLOG) we assume E (εi ) = 0, ∀i. In expected value, the shocks have no impact on Yi . This seems a very obvious desirable property, right?
22/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Properties of Unobservable Random Shocks Expectations
Third Property of εi
What are the requirements for the second moment of the distribution? It is reasonable that the dispersion of the shocks is the same for all individuals. Thus, we want a constant variance across individuals. Formally, V (εi ) = σε2 , ∀i. This assumption is usually called homoscedasticity.
23/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Properties of Unobservable Random Shocks Expectations
Fourth Property of εi Since εi is a non-systematic component, a natural assumption is that there is no way I can figure out εi based on Xi . Hence, the values of Xi are uncorrelated with shocks εi . If Xi is random, then we need assumptions about the joint distribution of Xi and εi . There are various assumptions that might work. The strongest assumption is that Xi and εi are independent. We denote that as Xi ⊥εi . If Xi is deterministic, then there is no problem because deterministic variables are independent of any random variable.
24/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Properties of Unobservable Random Shocks Expectations
Initial Properties of unobservable components εi The basic properties of εi are: 1
εi ∼ i.i.d.
2
E (εi ) = 0, ∀i.
3
V (εi ) = σε2 , ∀i.
4
Xi ⊥εi , ∀i.
The first assumption can be relaxed regarding the independence dimension. The second assumption is not a very strong assumption as we showed previously. The third assumption can be tested and there are ways to deal with it. We will play with these assumptions in the forthcoming weeks. There are situations that require different assumptions.
25/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Properties of Unobservable Random Shocks Expectations
Initial Properties of unobservable components εi The basic properties of εi are: 1
εi ∼ i.i.d.
2
E (εi ) = 0, ∀i
3
V (εi ) = σε2 , ∀i
4
Xi ⊥εi , ∀i
The fourth assumption is very strong and will cause a lot of trouble. Most of the times in economics, observable components are correlated with the unobserved components. We will return to this so-called endogeneity issue. Notice that we have not imposed assumptions over the distribution function of εi .
26/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Properties of Unobservable Random Shocks Expectations
Computing Expected Value εi and Yi are random variables, so I can compute their expected value. We assume that E (εi ) = 0. If Xi is deterministic, then the unconditional expected value of the endogenous outcome will be E (Yi ) = E (f (Xi , εi )) = G (Xi ), where G is a function of deterministic Xi . If Xi is random, then the joint distribution of Xi and εi matters. However, I can compute the conditional expectation of Yi for a given value of Xi = xi . Thus, E (Yi |Xi = xi ) = E (f (Xi , εi )|Xi = xi ) = Ge(xi ). The expectation depends on the functional form f . We will start with the easiest and convenient case: Linear functions.
27/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
The Model so far... Dependent variable or outcome Yi is the result of two forces: 1
Some observable characteristics or features denoted by Xi ;
2
Some random unobservable shocks denoted by εi . Yi = f (Xi , εi ), ∀i
This is equivalent that some exogenous force (call it Nature or God) set Xi (randomly or not). Then, a different God played with a roulette and drew the values of εi . Given these two values, Yi is uniquely determined through function f.
28/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
The Model so far... Shocks εi accounts for everything but Xi ensuring a perfect fit. The basic properties of εi are: 1
εi ∼ i.i.d.
2
E (εi ) = 0, ∀i
3
V (εi ) = σε2 , ∀i
4
Xi ⊥εi , ∀i
To compute closed solutions to the expected values or expected values conditional on explanatory variables X , we want assumptions regarding the functional form f . The first attempt to estimate f is to choose a functional form that depends on a vector of parameters β.
29/30
Introducci´ on Clase 1 Modelo de Comportamiento Random Model Conclusiones Clase 1
Resumen
En esta clase hemos aprendido: Que es la econometr´ıa. Que es un modelo econom´etrico. Las complicaciones para asumir causalidad. La necesidad de tener componentes aleatorios no observables. Los supuestos iniciales respecto a las propiedades de los componentes aleatorios no observables.
30/30