•Estimación de parámetros: parámetros: I) Estimación puntual y por intervalos. II) Propiedades de un estimador. estimador. III) Cálculo de intervalos de confianza de una media poblacional 1
I)Estimación: puntual y por intervalos
Como ya hemos visto, a partir de los estadísticos que hemos obtenido en la/s muestra/s queremos obtener una idea de los valores de los parámetros en la población. Se trata de emplear los estadísticos para estimar los parámetros. Veremos DOS tipos de estimadores: 1) Estimación puntual. Aquí obtendremos un punto, un valor, como estimación del parámetro. 2) Estimación por intervalos. Aquí obtendremos un intervalo dentro del cual estimamos (bajo cierta probabilidad) estará el parámetro. 2
Estimación puntual de parámetros Un estimador puntual es simplemente un estadístico (media aritmética, varianza, etc.) que se emplea para estimar parámetros (media poblacional, varianza poblacional, etc.).
Es decir, cuando obtenemos una media aritmética( ) a partir de una muestra, tal valor puede ser empleado como un estimador para el valor de la media poblacional ( ).
(Algunos autores comparan los estimadores con los lanzamientos en un blanco; el círculo central sería el valor real del parámetro.)
3
II)Propiedades deseables en los estimadores Veremos CUATRO propiedades:
1. Insesgado 2. Eficiente 3. Consistente 4. Suficiente
4
Propiedades de un estimador (1) 1. Insesgado. Diremos que X
es un estimador insesgado de
µ , pues la media de la distribución de muestreo de las medias muestrales tomadas de una misma población es igual a la media de esta población.
La media muestral es un estimador insesgado de la media poblacional. Pero la varianza muestral NO es un estimador insesgado de la varianza poblacional.
5
Propiedades de un estimador (2) 2. Eficiente. Si comparamos dos estadísticos de una muestra del mismo
tamaño (n) y tratamos de decir cuál es el estimador más eficiente,
seleccionaremos el estadístico que tenga el
error estándar más
pequeño de la distribución muestral.
6
Propiedades de un estimador (3) 3. Consistencia. Un estimador puntual es consistente si sus valores tienden a acercarse al parámetro de población conforme se incrementa el tamaño de la muestra. En otras palabras, un tamaño grande de muestra tiende a proporcionar el mejor estimador que un tamaño pequeño. A diferencia de la “ausencia de sesgo” que se define para valores finitos de n, la “consistencia” es una propiedad asintótica.
Nota: la varianza muestral es un estimador consistente de la varianza poblacional, dado que a medida que el tamaño muestral se incrementa, el sesgo disminuye y disminuye.
7
Propiedades de un estimador (4)
4. Suficiente. Diremos que un estimador
es suficiente si utiliza la
información contenida en la muestra, al punto que ningún otro estimador
podría extraer de esta última más información referente al parámetro.
8
III)Intervalos de confianza para los principales parámetros El caso de la media
En este caso, en lugar de indicar simplemente un único valor como estimación del parámetro, lo que haremos es ofrecer un intervalo de valores que sea asumible con cierta probabilidad por el parámetro que queremos estimar.
-Intervalo de confianza: Es el intervalo de las estimaciones (probables) sobre el parámetro. -Límites de los intervalos de confianza: Son los dos valores extremos del intervalo de confianza
9
Intervalos de confianza para los principales parámetros: El caso de la media Ahora bien, ¿cuán grande habrá de ser el intervalo de confianza?
Evidentemente, si decimos que el intervalo de confianza va de menos infinito a más infinito, seguro que acertamos...pero eso no es muy útil. Por su parte, el extremo es la estimación puntual, en la que lo usual es que no demos con el valor del parámetro... La idea es crear unos intervalos de confianza de manera que sepamos en qué porcentaje de casos el parámetro estará dentro del intervalo crítico. ¿Y cómo fijamos tal porcentaje de casos? Usualmente se asume un porcentaje del 95%. Al calcular un intervalo de confianza sobre la media al 95% ello quiere decir que el 95% de las veces que repitamos el proceso de muestreo (y calculemos la media muestral), la media poblacional estará dentro de tal intervalo.
10
Intervalos de confianza para los principales parámetros: El caso de la media
Pero, ¿cómo calculamos estos dos límites? Sabemos que la distribución subyacente es normal, lo cual nos ayuda enormemente. En una distribución normal tipificada, es muy fácil saber qué puntuación típica (z) deja a la izquierda el 2.5% de los datos (yendo a las tablas es -1.96) y cuál deja a la izquierda el 97.5% de los datos (o a la derecha el 2.5% de los datos: 1.96). Ahora habrá que pasar esos datos a puntuaciones directas....
11
Intervalos de confianza para los principales parámetros: El caso de la media
Pero, ¿cómo calculamos estos dos límites?
Vamos a ver DOS casos. Primero, veremos el caso de que sepamos la varianza poblacional. Segundo, veremos el caso de que NO sepamos la varianza poblacional 12
Intervalos de confianza para los principales parámetros: El caso de la media
Conocemosσ
2
Nuestra distribución es normal, pero con cierta media y cierta desviación típica, las cuales sabemos por el tema anterior: 1) La media de la distribución muestral de medias es la media poblacional µ 2) La varianza de la distribución muestral de medias es σ2/n
O lo que es lo mismo, la desviación típica de la dist.muestral de medias es σ 13
n
Intervalos de confianza para los principales parámetros: El caso de la media
Conocemosσ
2
Y para pasar de directas a típicas: Estimador de
14
µ es X
Recordar que
O lo que es análogo
Intervalos de confianza para los principales parámetros: El caso de la media
Conocemosσ
En Puntuaciones típicas
X + z0.025 ⋅
2
z 0’025
σ n
z 0’975
Aplicando la lógica de pasar de puntuaciones típicas a directas
X + z0.975 ⋅
σ
En definitiva 15
n
Intervalos de confianza para la media: CASO DE DESCONOCER LA VARIANZA POBLACIONAL
Para la media (cuando conocemos la varianza poblacional), tenemos la expresión
Pero si no conocemos la varianza poblacional, no podemos emplear
En su lugar hemos de emplear
16
Intervalos de confianza para los principales parámetros: El caso de la media ¿Qué quiere decir la expresión siguiente?
σ σ P X + z0.025 ⋅ < µ < X + z0.975 ⋅ = 0.95 n n Quiere decir que cada vez que extraigamos una muestra y hallemos la media, el parámetro desconocido µ estará entre los límites de dicho intervalo el 95% de las veces. (O el 99% si hubiéramos elegido un intervalo al 99%, etc.)
17
18
Intervalos de confianza para OTROS parámetros Intervalos de confianza para la proporción poblacional “p” ∧
∧
p−E < p < p+E ∧ ∧
pq n
E = zα / 2
El intervalo de confianza puede expresarse: ∧
p± E ∧
∧
( p− E, p+ E ) 19
Intervalos de confianza para OTROS parámetros Intervalos de confianza para la varianza
(n − 1) s
χ
2 D
2
<σ < 2
(n − 1) s
2
χ I2
20