MUESTREO ESTADISTICO MUESTREO ESTADISTICO
1. DEFINICION: Procedimiento para seleccionar una o más muestras estadísticamente representativas de la población o poblaciones. 2. EJEMPLOS DE USO DEL MUESTREO: a. Encuestas. b. Diseño y análisis de experimentos. c. Control de calidad
Ing Wilfredo Mormontoy Laurel MSP
3. CRITERIOS DE ACEPTACION DE UN METODO DE MUESTREO a. Representatividad: Significa atribuir a cada unidad de muestreo (persona, vivienda, ...) una probabilidad, conocida y diferente de cero, de ser elegida. b. Precisión de las estimaciones: La precisión o confiabilidad de las estimaciones derivadas de la muestra debe ser suceptible de medir. Así: π = p ± precisión c. Viabilidad: El método de muestreo debe ser práctico. La teoría y la práctica deben estar juntas. d. Economia y eficiencia: Un buen método de muestreo (muestra) debe proporcionar la mayor cantidad de información a menor costo.
5. METODOS DE MUESTREO No probabilísticos (prácticos y económicos
•Intencional •Sin norma •Accidental (casos) •Voluntarios
METODOS Probabilísticos
•MAS •MS •ME •M de C
4. TERMINOS ESTADISTICOS (RECORDAR) a. b. c. d. e. f. g.
Unidad de análisis Población Unidad de muestreo Marco de muestreo Muestra Parámetro Estadígrafo o estadístico.
6. MUESTREO ALEATORIO SIMPLE (MAS) a. a. Definición: Consiste en la selección de n elementos a partir de N de la población de modo que cada una de las posibles muestras de tamaño n, tenga la misma probabilidad, 1 N Cn , de ser seleccionada (muestreo sin sustitución). Es decir, cada elemento de la población tiene la misma probabilidad de ser seleccionado.
1
b. b. Tamaño de muestra: (Estudios con una sola población)
a. Para estimar una media poblacional
z 2α 2 s e n= E2 nf =
2
Si se conoce N:
6
n N
Ejemplo: En cierta población de 1200 escolares se desea estimar el nivel promedio de Hb con 95% de confianza. Al realizar un estudio piloto se encontró: x= 12,3 s = 1,6. Si los investigadores estan dispuestos a asumir un E = ± 0,5 , calcular n. Solución: n= (1,96)2 (1,6)2 = 39,33 Datos: (0,5)2 Z α/2 = 1,96 N= 1200 Se = 1,6 E = ± 0,5
nf =
z 2α 2 p e q e E2
nf =
n n 1+ N
Interpretación: El número mínimo necesario de escolares para realizar el estudio es de 39, si se desea estimar el nivel promedio de Hb en la población con una precisión de ± 0,5.
39,33 = 38,05 1 + 39,33/1200
nf ≥ 39
b. Para estimar una proporción poblacional
n=
• Revisión bibliográfica • Estudio piloto • Se ≈ x max – x min ,si xi ≈ normal
• E = error absoluto de muestreo o precisión = (x - µ) = debe ser asumido por el investigador • N = tamaño de la población • nf = tamaño final (sólo si se conoce N)
n 1+
Donde: • Z α/2 = coeficiente de confianza = 1,96, para un nivel de confianza = 95% • Se = desviación estándar obtenida de:
Si se conoce N:
Donde: • pe = proporción “estimada” de sujetos con la caracteristica de interés. Se puede obtener de: • Revisión bibliográfica • Estudio piloto • pe = qe = 50% = 0,5
• qe = 1 - pe = proporción “estimada” de sujetos sin la caracteristica de interés. • E = error absoluto de muestreo o precisión = (p- π ), debe ser asumido por el investigador y es más o menos igual a 5% (0,05)
2
Ejemplo:
En una población grande se desea estimar la prevalencia de DM con 95% de confianza. De la literatura se sabe que p =10%, si se asume un error muestral de 5%, calcular n. Solución:
Datos: •Z α/2 = 1,96 •pe =0,1 •qe =0,9 •E = ± 0,05
n= (1,96)2 (0,1)(0,9) = 138,3 (0,05)2 n ≥ 139
- c. Procedimiento de selección • Siendo la población homogénea • Teniendo el marco muestral. • Para identificar el número de cada elemento poblacional que será parte de la muestra, puede utilizarse la tabla de números aleatorios, una calculadora científica o una computadora.
Interpretación: Si se desea estimar la prevalencia poblacional con 95% de confianza y con un E de 5%, se debe evaluar 139 sujetos.
Ejemplo: A partir de la población de 150 sujetos aparentemente normales. a. Seleccionar una MAS de tamaño 10 b. Calcular los estimadores media y desviación estándar
Solución: a. Se tiene: N =150 y n =10 De la tabla de números aleatorios, sabiendo que el tamaño de la población tiene 3 dígitos, se escogen 3 columnas cualesquiera de dicha tabla para seleccionar 10 números comprendidos entre 1 y 150 inclusive. Por esta vez utilizaremos las 3 primeras columnas de la tabla. Entonces los 10 números son:
7. MUESTREO SISTEMATICO (MS) A. A. DEFINICION: Consiste en la selección de n elementos a partir de una población de tamaño N de modo que de cada cierto número(I) de elementos, uno será parte de la muestra. Es decir:
n
102, 9, 43, 25, 142, 104, 59, 150, 92, 16. Las concentraciones correspondientes de azúcar a estos números de sujetos son: 91, 94, 93, 105, 96, 108, 108, 90, 104, 95 b. Utilizando estos valores de la variable se obtienen los estimadores: x = 98,40 s = 7,07 Estos resultados muestrales serán utilizados para estimar la media aritmética poblacional
B. TAMAÑO DE MUESTRA
Se utilizan las mismas fórmulas que para el MAS. C. PROCEDIMIENTO DE SELECCIÓN • Siendo la población homogénea. • Teniendo un marco muestral • Se siguen los siguientes pasos: • I = N /n intervalo de muestreo (de cada I elementos uno será parte de la muestra) • De la tabla de números aleatorios se elige el número aleatorio de inicio, k, que debe ser 1≤ k ≤ I.
3
Luego, se generan los números de la siguiente manera: N° k k+I k+2I . . .
Ejemplo: De la población de 150 sujetos aparentemente normales seleccionar una MS de tamaño 10 Solución: • I =150/ 10 = 15 ( de cada 15 elementos, uno será parte de la muestra) • 1≤ k ≤ 15 ( de la tabla se eligen 2 columnas así, de las 2 ultimas: k =2). • Luego: N° : 2, 17, 32, 47, 62, 77, 92, 107, 122, 137
8. MUESTREO ESTRATIFICADO (ME) • • •
Se utiliza cuando la población no es homogénea. Se debe disponer del marco muestral. La población se divide en L estratos y de cada uno se selecciona una muestra. Así por ejemplo si se quisiera estimar la PA promedio de una población de varones adultos , la población se deberá estratificar en grupos de edad y de cada uno se seleccionará una muestra, usando el MAS o el MS.
4