DISTRIBUCIÓN DEL MUESTREO • OBJETIVOS: • Describir situaciones donde el muestreo es el método de estudio indicado. • Describir los métodos de obtención de muestras aleatorias. • Analizar la relación entre parámetros y estadísticos.
• CONTENIDO • • • • •
CENSO • DEFINICIÓN: – Implica el examen de todos los elementos de una población
• SE UTILIZA CUANDO SE: – Necesita un marco de muestreo – Población muy pequeña resultando en costos y tiempo similares al necesario para el muestreo. – Tamaño de la muestra “n” es grande con relación al tamaño de la población “N”, debido a mucha variabilidad – Necesita precisión completa. – Dispone de la información en una base de datos.
MUESTREO • DEFINICIÓN – Es la elección de un subconjunto de la población a efectos de obtener una estimación no sesgada de la variable que esta siendo estudiada – Técnicamente el muestreo produce una foto de un evento en un momento particular
• TIPOS DE MUESTREO – NO PROBABILISTICO donde la elección de la muestra queda en manos del investigador
– PROBABILISTICO se utiliza un método formal de elección. Cada miembro de la población tiene una probabilidad conocida diferente de 0 de integrar la muestra.
Poblaciones y muestras. Parámetros y Estadísticos Muestreo aleatorio Propiedades de la distribución en el muestreo. Teorema Central del Límite.
MUESTREO
• FINALIDAD:
– Hacer generalizaciones sobre una población sin necesidad de examinar cada uno de sus elementos.
• RAZONES PARA MUESTREAR – Naturaleza destructiva de ciertas pruebas.Ej. Evaluaciones sensoriales (Carne, vino), resistencia de la mecha de lana, germinación de semillas, lamparas, municiones, dispositivos de seguridad. – Imposibilidad física de revisar todos los integrantes de la población. Ej.: poblaciones infinitas: peces, aves, serpientes son poblaciones grandes están en movimiento constante, nacen y mueren. – Costo de estudiar a todos los integrantes de una población a menudo es prohibitivo. Las empresas de opinion pública comunmente entrevistan a 2.000 familias para sacar conclusiones sobre todo el país. – Precisión-uniformidad. Menor número de encuestadores, más entrenados, más coordinados. Ej Censo USA – Oportunidad de la información (actualización). Ej político, material perecible (frutilla), enfermedades agudas
• MARCO DE MUESTREO – Es el listado de nuestro universo de “N” unidades de donde será seleccionada la muestra
• UNIDAD DE MUESTREO – Debe ser definida. De cada población nosotros podemos seleccionar varias muestras.
• MUESTREO ALEATORIO – Cada una de las posibles muestras tienen una probabilidad conocida de ser seleccionada – Es un procedimiento que produce una muestra probabilistica donde cada elemento de la población tiene una probabilidad diferente de 0 de ser seleccionada.
1
NUMEROS ALEATORIOS
MUESTREO • POBLACIÓN OBJETIVO (Universo) – Es la población sobre la cual queremos aprender algo. Queremos hacer o aplicar generalizaciones. • POBLACIÓN MUESTREADA – Es la colección de todos los posibles elementos que pueden ser seleccionados en una muestra, – Es la que está en el marco de muestreo
• PARAMETRO – Medida numérica descriptiva de la población calculada con todos los elementos de la misma
• ESTADÍSTICO – Medida numérica descriptiva de una muestra calculada a través de las observaciones de la misma
PLANES DE MUESTREO • MUESTREO ALEATORIO SIMPLE. MAS. – La muestra es diseñada de manera que cada integrante de la población tenga la misma probabilidad de estar incluido.
• MUESTREO ALEATORIO ESTRATIFICADO. MAE. – La población se divide primero en subgrupos, denominados estratos, y se selecciona una muestra de cada estrato.
• MUESTREO POR CONGLOMERADOS. MC – Se divide a la población en conglomerados (unidades primarias) y se seleccionan estos para luego recabarse la información de las unidades secundarias.
• MUESTREO SISTEMÁTICO. MS. – Los integrantes de la población se ordenan por algún método. Se selecciona aleatoriamente un punto de inicio y después se elige cada k-esimo elemento de la población para la muestra. k=N/n
¿Cuan próximo está el estadístico al parámetro poblacional? • Depende de: – Estadístico Considerado – Tamaño de la Muestra – Variabilidad de la población sometida a muestreo
• TEORÍA DEL MUESTREO – Estudia la relación entre la población y las muestras extraidas de la misma.
• DISTRIBUCIÓN MUESTRAL – Es una distribución de probabilidad que indica hasta que punto un estadístico tiende a variar a causa del muestreo aleatorio. La distribución es generada por la repetición del muestreo un gran número de veces.
CREACIÓN DE UNA DISTRIBUCIÓN • De una población finita de tamaño N, se extraen de manera aleatoria todas las muestras posibles de tamaño “n”. • Se calcula el estadístico de interés para cada muestra. • Listar en una columna los distintos valores observados del estadístico y en otra columna las frecuencias correspondientes de cada valor observado.
2
Distribución en el muestreo de las medias 8 10 12 14
8 8 9 10 11
10 9 10 11 12
12 10 11 12 13
14 11 12 13 14
Población: 8; 10; 12; 814 + 10 + 12 + 14 µ=
xi
Distribución de medias muestrales
8 9 10 11 12 13 14
0,300
0,250
f
xi
8 9 10 11 12 13 14
1 2 3 4 3 2 1 16
fr 0,063 0,125 0,188 0,250 0,188 0,125 0,063 1,000
4
= 11
σ = 20 4 = 5 2
0,200
0,150
0,100
0,050
0,000 8
9
10
11
12
13
Estadístico media aritmética
14
f 1 2 3 4 3 2 1 16
xi × f xi 2 × f fr 0,063 8 64 µ x = 176 = 11 16 0,125 18 162 2 1976 − 176 16 = 2.5 0,188 30 300 σ 2 = x 16 0,250 44 484 0,188 36 432 µ x = µ 0,125 26 338 2 σ 2 σ = 0,063 14 196 x n 1,000 176 1976 σ = σ x i
i
i
i
i
Distribución en el Muestreo • Muestreo de una población con distribución normal: – La distribución de las medias será normal – La media de la distribución de las medias será igual a la media poblacional – La varianza de la distribución de las medias será igual a la varianza poblacional dividida por el tamaño de la muestra
• Cuando el tamaño de la muestra aumenta la distribución de los resultados muestrales tiende a una distribución normal
ESTIMADORES • DE PUNTO es una regla o formula que nos dice como usar los datos del muestreo para calcular un número que puede ser usado como estimador del parametro poblacional • DE INTERVALO son dos números calculados en función de la muestra entre los cuales se considera que se encuentra el parámetro poblacional. Indica la precisión o exactitud de una estimación
n
TEOREMA CENTRAL DEL LIMITE • Para muestras de tamaño grande la distribución de la media muestral será aproximadamente normal sin considerar la distribución de probabilidad de la población. • Si la población muestreada tiene distribución normal, la distribución de las medias muestrales también será normal para todos los tamaños de muestra.
PROPIEDADES DE LOS ESTIMADORES • INSESGADOS – Una estimación es insesgada si la media de la distribución de un estadístico es igual al parámetro. – La esperanza del estadístico es igual al parámetro poblacional
• EFICIENTES – Un estimador eficiente es el que ofrece menor varianza con una misma media. Ej.: la media y mediana tienen la misma media pero la primera tiene menor varianza
3
• INTERVALO DE CONFIANZA • 68,3% tomando 1 Desviación Típica hacia cada lado de la media • 95,5% tomando 2 Desviación Típica hacia cada lado de la media • 99,7% tomando 3 Desviación Típica hacia cada lado de la media
• COEFICIENTE DE CONFIANZA – Es la probabilidad de que el intervalo estimado incluya al parametro poblacional en muestreos • NIVEL DE CONFIANZA
– Es el coeficiente de confianza expresado en porcentaje
Se sabe que los pesos de novillos Hereford de 18 meses de edad tienen una distribución aproximadamente normal, con una varianza de 36 kg2. Se tomó una muestra de 9 novillos y se determinó que la media de esa muestra es de 180 kg. – a. ¿Determine los límites del intervalo de confianza de 0.99 (99%) que estiman la media poblacional? – b. ¿Calcule que tamaño debería tener la muestra para cometer un error menor de 2 kg. en la estimación con un nivel de confianza de 0.90 (90%)?
• Las enfermedades podales de los ovinos en una región afectan el 20% (0.20) de los animales. a. Se realiza una encuesta de evaluación con un tamaño de muestra, n=100. ¿Dentro de que límites se espera encontrar la proporción de animales afectados a un nivel de confianza de 0.95 (95%)? b. Se quiere determinar el tamaño de la muestra para que el error en la estimación no supere el 4% (0.04) a un nivel de confianza del 99% (0.99).
4