114
Intervalos de confianza Hasta ahora los estimadores estudiados son puntuales, es decir, exhiben un solo valor como estimaci´on del par´ametro de inter´es. Pero en muchos casos esto no es suficiente. A veces se requiere de un rango de posibles valores para el par´ametro de inter´es, es decir, un intervalo real donde se cree estar´a el valor del par´ametro con una alta confianza. Sea θ un par´ametro de inter´es y θˆ un estimador puntual de θ por intervalo, es un intervalo real de la forma (l , u) (l < θ < u), donde l y μ ˆ dependen de θˆ y de la distribuci´on de θ. Cada muestra aleatoria proporcionar´a un valor diferente para θˆ y por lo tanto valores diferentes para l y μ. As´ı, los extremos del intervalo en cuesti´on se convierten en v.a, las cuales denotaremos L y U . El intervalo (L , U ) es llamado Intervalo Aleatorio. Usando θˆ y su distribuci´on es posible determinar L y U tales que P (L < θ < U ) = 1 − α, α ∈ (0 , 1) , α dado. Para una muestra particular se obtiene el intervalo (l , u) donde se espera est´e el verdadero valor de θ. El intervalo (l , u) ser´a llamado un Intervalo de Confianza al 100 (1 − α) % para θ . l y μ son llamados L´ımites de Confianza. Por notaci´on se escribe : I. C. al 100 (1 − α) % para θ. El intervalo (l , μ) se conoce como intervalo de confianza bilateral para θ. ”De todos los posibles intervalos de confianza al 100 (1 − α) % para θ se espera que el 100 (1 − α) % de ellos contenga el verdadero valor de θ”. Los intervalos (l , +∞) ´o (−∞ , μ) son llamados intervalos de confianza unilaterales para θ. Usando θˆ y su distribuci´on es posible determinar L tal que P (L < θ) = 1 − α, α ∈ (0 , 1) , α dado. Similarmente es posible determinar U tal que P (θ < U ) = 1 − α, α ∈ (0 , 1) , α dado. Para una muestra particular se obtienen los intervalos (l , +∞) y (−∞ , μ), intervalos de confianza unilaterales al 100 (1 − α) % para θ.
115 En un I. C. bilateral la longitud μ − l es una medida de la calidad de la informaci´on obtenida. El valor max{θ − l , μ − θ} se conoce como presici´on del estimador. Aqu´ı es necesario aclarar que entre mayor sea la longitud de un I.C. menor ser´a su precisi´on y viceversa, entre menor sea la longitud del intervalo, mayor ser´a su precisi´on. Lo ideal es tener I. C. angostos con una alta confianza. En los intervalos de confianza unilaterales, no se puede hablar de precisi´on.
Obtenci´ on de un I. C. Sea X 1 , · · · , X n una m.a. de una distribuci´on f (x) que depende de un par´ametro θ desconocido ( dicha distribuci´on es usualmente denotada f (x ; θ)). Sea θˆ un estimador puntual para θ. Como θˆ es funci´on de la m.a, se suele escribir θˆ = h(X 1 , · · · , X n ). Suponga adem´as que la distribuci´on de θˆ NO depende de otros par´ametros desconocidos, pero puede depender de θ. Entonces, para α ∈ (0 , 1) dado, se pueden encontrar constantes a y b tal que P (a < h (X 1 , · · · , X n ; θ) < b) = 1 − α . Esto es posible ya que la distribuci´on de θˆ es conocida y solo depende posiblemente de θ. Suponga que de la desigualdad anterior es posible despejar a θ, de esta manera se obtiene P (L (X 1 , · · · , X n ) < θ < U (X 1 , · · · , X n )) = 1 − α . Para una m.a. particular calculamos l (X 1 , · · · , X n ) y μ (X 1 , · · · , X n ). Sea l = l (X 1 , · · · , X n ) y μ = μ (X 1 , · · · , X n ). El intervalo (l , μ) es un intervalo de confianza al 100 (1 − α) % para θ. Para los intervalos de confianza unilaterales se procede igual, solo que las ecuaciones probabil´ısticas a resolver son de la forma: P (a < h (X 1 , · · · , X n ; θ)) = 1 − α
y
P (h (X 1 , · · · , X n ; θ) < b) = 1 − α .
las cuales al despejar θ se convierten en: P (L (X 1 , · · · , X n ) < θ) = 1−α y
P (θ < U (X 1 , · · · , X n )) = 1−α
116
Usando Bootstrap Sea θˆ un estimador puntual para θ. La distribuci´on de θˆ puede depender ¯ − μ aprox √ de θ. Por el T. L. C. sabemos que X ∼ n(0 , 1). Adem´as, si σ 2 es σ/ n ¯
aprox
− √μ desconocida X ∼ n(0 , 1). S/ n Ahora ¯ ¯ X − μ X − μ √ √ P < 1.96 ≈ 0.975 y P < −1.96 ≈ 0.025 . s/ n s/ n
1.96 √Sn y −1.96 √Sn son los percentiles aproximados de la distribuci´on ¯ − μ. de X As´ı,
P
S ¯ − μ < 1.96 √S −1.96 √ < X n n
≈ 0.95
Si θˆ es insesgado para θ, un estimador para θ puede obtenerse como ¯ De esta manera un I. C. aproximado al 95 % para θ se obtiene θˆ = θ. como: ˆ ˆ ˆ ˆ θ − percentil 97.5 de (θ − θ), θ − percentil 2.5 de (θ − θ) , ya que P Percentil 2.5 < θˆ − θ < Percentil 97.5 ≈ 0.95 . ¿C´ omo proceder? Suponga que X 1 , · · · , X n es una m.a de f (x ; θ), θ desconocido. De esta muestra obtenemos θˆ = θ 0 . Se generan m muestras de tama˜ no n de f (x ; θ 0 ). Con cada muestra se calcula θˆ1 , θˆ2 , · · · , θˆm y luego 1 ˆ θi . θˆ¯ = m i=0 m
117 ˆ¯ Calcule θˆ1 − θˆ¯ , θˆ2 − θˆ¯1 , · · · , θˆm − θ. Halle el percentil 2.5 y 97.5 de los m valores obtenidos en el paso anterior, los cuales se denotan P97.5 y P2.5 . El intervalo Bootstrap al 95 % para θ est´a dado por: ˆ ˆ θ − P97.5 , θ − P2.5 .
Intervalos de Confianza para la Media Sea X 1 , · · · , X n una muestra aleatoria de una poblaci´on normal n (μ , σ 2 ) con media μ desconocida y varianza σ 2 conocida. Halle L y U tales que P (L < μ < U ) = 1 − α , α dado
P (L < μ < U ) = P (−U < −μ < −L) ¯ −U <X ¯ −μ<X ¯ −L =P X ¯ ¯ −μ ¯ − L X −U X X √ < √ < √ = P σ/ n σ/ n σ/ n = P (z1 < Z < z2 ) = 1 − α
Fig. 22: Intervalo de Confianza para la media
Haciendo P (Z < z1 ) = P (Z > z2 ) = α/2 .