MUESTREO Y SUS APLICACIONES
Problema a investigar:
Comportamiento del colesterol en los docentes de la facultad de medicina de la universidad San Martín de Porres. Unidad de análisis: Un docente de la USMP. Población: Docentes de la facultad de medicina de USMP. Tamaño de población: N = 800.
Población y muestra Censo Población Muestra
Inferencia estadística
Muestreo Muestra Investigador
Resultados
¿ Cuál es el objeto de estudio ? ¿ Conocer la muestra o la población ?
La muestra debe ser: Representativa: Porque a cada elemento de la población le corresponde una probabilidad diferente de cero de ser seleccionada para integrar la muestra. Viable: De fácil aplicación Suficiente: Permite recolectar la mayor cantidad posible de información al menor costo Inferencia estadística: Permite elaborar conclusiones probabilísticas acerca de una población en base a una muestra de dicha población.
Ventajas de un estudio mediante muestra:
Economía: En recursos de personal y materiales. Tiempo: Que la información obtenida sea oportuna, cuando se le requiera Calidad de la información obtenida, la calidad de la información recogida en la muestra es mejor que la obtenida en el censo, por que en el censo se presenta dificultades para capacitar y supervisar a los recursos humanos. Es por este motivo, casi la totalidad de estudios se realizan mediante muestras.
a.
Unidad de análisis.-
También se le denomina el elemento de la población y es aquella unidad indivisible de la cuál se obtiene el dato estadístico. Ejemplo: puede ser una persona, historia clínica, vivienda, o un animal, etc. b. Población.Es el conjunto de personas, objetos o cosas con una característica o atributo especial cuantificable, en un periodo y lugar determinado. Ejemplo: Estudiantes del 1er año de la Facultad de Medicina de la Universidad San Martín de Porres, segundo semestre del 2005. La característica a estudiar es la estatura que permitirá obtener los datos.
Tipo de Población
Población homogénea
Población heterogénea
c. Marco de muestreo.-
Permite identificar a los elementos de la población que es objeto de estudio. Puede ser una lista de personas, una relación de viviendas, un archivo, un croquis de una determinada comunidad, etc. El marco debe estar completamente actualizado porque de el se seleccionará la muestra. d. Unidad de muestreo. Es la unidad seleccionada del marco de muestreo. La unidad de muestreo puede coincidir con la unidad de análisis, por ejemplo un niño menor de 5 años, o puede estar constituida por un conglomerado de unidades de análisis, por ejemplo: Población: Pacientes que se atienden en los consultorios de un hospital. - Unidad de análisis: Un paciente que se atiende en un cosultorio externo del hospital. - Unidad de muestreo: Un consultorio externo del hospital (Pero no interesa el consultorio externo si no los pacientes que se atienden en dicho consultorio)
Población objetivo Unidad de análisis
Inferencia estadística Marco muestral
1 2 3 . . . N (tamaño de población)
así un listado de la población y cada elemento es identificado por su código
Muestra
e. Probabilidad de selección.-
Es la probabilidad diferente de cero que tiene cada unidad de la población de ser incluida en la muestra. f. Parámetro.Es un valor que describe una característica o un atributo de la población. Algúnos parámetros de la población de niños menores de 5 años de edad que estamos interesados en estudiar en base del muestreo son: i).Media aritmética poblacional: -Peso Promedio -Hemoglobina promedio. -Estatura promedio. ii).Proporción poblacional: -Proporción de niños que están desnutridos. -Proporción de niños que están parasitados. -Proporción de niños que tuvieron solamente lactancia materna exclusiva
g. Estadístico.-
Es un valor que describe una característica o atributo de una muestra y está en función de los datos muestrales. Por ejemplo se tiene la media, razón o proporción muestral. h. Error muestral. Se refiere únicamente a la variabilidad o dispersión entre los resultados de un estadístico de muestras sucesivas del mismo tamaño o diferente. La medida apropiada para cuantificar este error es el error estándar.
Población de personas de 40 a 50 años de edad cuya FC tiene µ = 80 p/m y σ = 2 p/m
Seleccionamos 1º muestra con n = 100 x1 = 82 p/m y S1 = 1.5 Seleccionamos 2º muestra con n = 100 x2 = 79p/m y S2 = 3 p/m
Seleccionamos nº muestra con n = 100 xn = 80.5 p/m y Sn = 3 Así sucesivamente se pueden seleccionar otras muestras y a veces los valores de xi y Si coincidirán pero las mas de las veces tienen diferencias. Es decir se pueden observar diferencias entre los estadísticos de las diferentes muestras, y esa diferencia es consecuencia de los errores muestrales. Se puede cuantificar la variabilidad atribuida a los errores muestrales y su medida es el ERROR ESTÁNDAR. Con el error estándar recién se pueden hacer las inferencias estadísticas respectivas
.
Muestreo probabilístico El muestreo probabilístico se basa en que cada unidad de la población tiene una probabilidad distinta de cero de ser elegida para integrar la muestra. Esta premisa le da una carácter aleatorio a la elección de las unidades de la población para integrar la muestra. La probabilidad de selección de un elemento para integrar la muestra es de n/N Para diseñar una muestra probabilística se tendrá en cuenta las tres operaciones básicas: - Proceso de selección - Proceso de estimación - Tamaño de muestra
TIPOS DE MUESTREO PROBABILISTICO - Muestreo aleatorio simple. - Muestreo Sistemático. - Muestreo estratificado. - Muestreo por conglomerados.
Muestreo empírico o no probabilístico El muestreo no probabilístico se caracteriza por el hecho de que no es posible determinar la probabilidad de inclusión de cada unidad de la población en la muestra. Generalmente, para la selección de las unidades interviene el criterio subjetivo del investigador . Con este método no podemos elegir muestras representativas y no se pueden hacer las inferencias respectivas porque no podemos cuantificar el error muestral.
Población El muestreo empírico o no probabilistico no permite la inferencia estadística y solo se le puede usar como estudio preliminar, piloto o exploratorio
Investigador
Muestra
Muestreo aleatorio simple. Se aplica cuando la población es finita y homogénea. Una población es finita cuando las unidades pueden ser enumeradas y podemos identificar al último de ellos En un muestreo aleatorio simple a cada elemento de la población le corresponde la misma probabilidad de ser seleccionada para integrar la muestra y esto se denotará así: P = n (tamaño de muestra) N (tamaño de la población) Ejemplo 1 Procedimiento: Una población N = 150 y una muestra n= 10 P = 10 / 150 = 1 / 15 1. El procedimiento consiste en enumerar los elementos de la población 2. Se usa la tabla de números aleatorios (también se puede usar programas informáticos diseñados para tal fin). Si N = 150 en la tabla de números aleatorios se seleccionan 3 columnas por que tiene 3 dígitos, y se busca desde 001 a 150 La muestra tomada es sin reposición , es decir si un número se repite varias veces solo se tomará una sola vez). En este caso se encuentra : 028 126 072 102 148 150 035 031 046 091
Muestreo sistemático. Es usada cuando la población es finita y heterogénea Procedimiento: Arranque aleatorio que consiste en: 1. Enumerar los elementos de la población 2. Determinar una relación de muestreo denotado por K K= N n
(tamaño de la población) (tamaño de la muestra
Por ejemplo si N = 150 y n = 10
entonces K = 150 / 10 = 15
Una vez identificado K se considera o genera un intervalo de selección que esta comprendido entre 1 y K ( en el ejemplo entre 1 y 15) incluyendo 1 y K y se seleccionara en forma aleatoria, al número seleccionado se le considera el arranque aleatorio (r) Y la muestra estará integrada por r r+K r+2K r+3K r+4K ......r+(n-1)K Así si en el ejemplo se elige el arranque n° 8 se tendrá la siguiente muestra: 8 23 38 53 68 83 98 113 128 143
TAMAÑO DE MUESTRA Para determinar el tamaño de muestra se tiene en cuenta el tipo de población, es decir: a. Si la población es homogénea se requiere pocos elementos en la muestra y si la población es heterogénea se requiere un mayor número de elementos. Para establecer una fórmula del tamaño de muestra se requiere saber el tipo de parámetro que se desea estimar, es decir , si el interés es estimar una media aritmética se requiere una fórmula específica y si se quiere estimar una proporción se considera otra fórmula.
Fórmula de tamaño de muestra para estimar una media aritmética n =
Z² σ² N E²(N-1)+Z²σ²
Donde : N: Tamaño de la población que es objeto de estudio. Z : es una desviación normal cuyo valor corresponde al grado de confianza que se establece. Es decir: N.C. : 90% 95% 99% Z : 1.64 1.96 2.57 σ² : Varianza poblacional de la población que es objeto de estudio En la práctica, el valor de la varianza se desconoce. Para establecer el valor a la varianza, hay que tener en cuenta las siguientes recomendaciones: - Recurrir a estudios similares que se han realizado y obtener el valor de la varianza respectiva. - Realizar un estudio piloto para estimar σ² . E: Error absoluto o precisión de la estimación deseada de la media.
Ejemplo nterés: Conocer el colesterol promedio de los estudiantes de la Facultad de Medicina USMP. (Suponemos que son 1800 alumnos) El estudio queremos realizarlo mediante una muestra y necesitamos calcular el tamaño de muestra n, considerando: un grado de confianza del 95%, y los resultados de un estudio preliminar: _ x=210 y s=30; error relativo del 6% Solución _ _ Por definición de error relativo. Er = E/X * 100 . Por consiguiente, E= Er* X /100. Como grado de confianza 95%, nos indica que Z=1.96 E= 6*210/100 = 12.6; σ= 30. Reemplazando valores en la formula se tiene: n= (1.96)²(30)²(1800) (12.6)²(1799) + 1.96²(30²) Por tanto, n=22 (Para realizar el estudio se requiere como mínimo 22 estudiantes)
Determinación del tamaño de muestra para estimar una proporción n =
Z² P (1 – P) N E²(N-1) + Z²P(1-P)
N : Tamaño de la población Z : Desviación normal P : Proporción de unidades que poseen el atributo de interés en la población E : Error absoluto o precisión de la estimación de la proporción. Por lo general el valor que asume es de 0.05 En la práctica, el valor de la proporción P se desconoce. Para determinar dicho valor se recurre a las siguientes recomendaciones : - Recurrir a estudios similares que se hayan realizado y extraer el valor de P. - En caso de no haber antecedentes, se recurre a un estudio piloto para conocer P. En caso contrario se recurre a la máxima varianza cuando P=0.5
Ej e mpl o I nt er és: Conocer l a pr opor ci ón de est udi ant es que consu men ci garrill os en l a Facul t ad de Medi ci na de La USMP. Nú mer o de est udi ant es N=1800.
El est udi o se r eali zará medi ant e una muestr a. Cal cul amos el ta maño de muest r a, consi der ando: Gr ado de confi anza del 95 %, por consi gui ent e, Z=1. 96. De un est udi o pr eli mi nar se ha det er mi nado que l a pr opor ci ón de al umnos que consumen ci garrill os es de p=0. 30. El err or absol ut o que se t oma en cuent a es de E=0. 05 Ree mpl azando l a i nfor maci ón en f ór mul a, se ti ene: n=
( 1. 96)²( 0. 3)( 0. 7)( 1800) (0. 05)²( 1799) + ( 1. 96)²( 0. 3)( 0. 7)
= 274
Por l o menos se r equi er e par a ej ecut ar el est udi o por l o menos 274 est udi ant es
En caso de que se desconocer el tamaño de la población N, las fórmulas quedaran reducidas como:
-
Para estimar una media aritmética,
n =
Z² σ² E²
- Para estimar una proporción, n=
Z² P (1 – P) E²