UNIVERSIDAD DE SAN MARTIN DE PORRES
MUESTREO Y SUS APLICACIONES Prof.: DR. LUIS ROBLE ALEMAN
BIOESTADISTICA 2006
PROBLEMA A INVESTIGAR Comportamiento del colesterol en los docentes de la facultad de medicina de la universidad San Martín de Porres.
Unidad de análisis: Un docente de la facultad de medicina de la USMP. Población: Docentes de la facultad de medicina de USMP. Tamaño de población: N = 800. El estudio se realizará mediante una muestra. ¿Cómo se diseña una muestra?
P O B L A C IÓ N Y M U E S T R A C enso P o b lació n M u estra
In feren cia estad ística
M u estreo M u estra In v estig ad o r
R esu ltad o s
¿ C u á l e s e l o b je t o d e e s t u d io ? ¿ C o n o c e r la m u e s t r a o la p o b la c ió n ?
LA MUESTRA DEBE SER: Representativa:
Porque a cada elemento de la población le corresponde una probabilidad diferente de cero de ser seleccionada para integrar la muestra. Tener un tamaño mínimo adecuado Viable: De fácil aplicación Suficiente: Permite recolectar la mayor cantidad posible de información al menor costo Inferencia estadística: Permite elaborar conclusiones probabilísticas acerca de una población en base a una muestra de dicha población.
VENTAJAS DE UN ESTUDIO MEDIANTE MUESTRA: Economía: En
recursos de personal y materiales. Tiempo: Que la información obtenida sea oportuna, cuando se le requiera Calidad de la información obtenida, la calidad de la información recogida en la muestra es mejor que la obtenida en el censo, por que en el censo se presenta dificultades para capacitar y supervisar a los recursos humanos. Es por este motivo, casi la totalidad de estudios se realizan mediante muestras.
A. UNIDAD DE ANÁLISIS.-
También se le denomina el elemento de la población y es aquella unidad indivisible de la cuál se obtiene el dato estadístico. Ejemplo: puede ser una persona, historia clínica, vivienda, o un animal, etc. B. POBLACIÓN.Es el conjunto de personas, objetos o cosas con una característica o atributo especial cuantificable, en un periodo y lugar determinado. Ejemplo: Estudiantes del 1er año de la Facultad de Medicina de la Universidad San Martín de Porres, segundo semestre del 2005. La característica a estudiar es la estatura que permitirá obtener los datos.
Tipo de Población
Población homogénea
Población heterogénea
C. MARCO DE MUESTREO.Permite identificar a los elementos de la población que es objeto de estudio. Puede ser una lista de personas, una relación de viviendas, un archivo, un croquis de una determinada comunidad, etc. El marco debe estar completamente actualizado porque de el se seleccionará la muestra. D. UNIDAD DE MUESTREO. Es la unidad seleccionada del marco de muestreo. La unidad de muestreo puede coincidir con la unidad de análisis, por ejemplo un niño menor de 5 años, o puede estar constituida por un conglomerado de unidades de análisis, por ejemplo: Población: Pacientes que se atienden en los consultorios de un hospital. - Unidad de análisis: Un paciente que se atiende en un consultorio externo del hospital. - Unidad de muestreo: Un consultorio externo del hospital (Pero no interesa el consultorio externo si no los pacientes que se atienden en dicho consultorio)
P o b l a c i ó n o b je ti v o
U n i d a d d e a n á l is i s
I n f e r e n c i a e s t a d ís t ic a M arco m u e s tr a l
1 2 3 . . . N (ta m a ñ o d e p o bla c ió n)
a s í u n li s t a d o d e l a p o b l a c i ó n y c a d a e l e m e n t o e s i d e n ti fi c a d o p o r su c ó d ig o
M u e stra
E. PARÁMETRO.Es un valor que describe una característica o un atributo de la población. Algunos parámetros de la población de niños menores de 5 años de edad que estamos interesados en estudiar en base del muestreo son: I).Media aritmética poblacional: -Peso Promedio -Hemoglobina promedio. -Estatura promedio. II).Proporción poblacional: -Proporción de niños que están desnutridos. -Proporción de niños que están parasitados. -Proporción de niños que tuvieron solamente lactancia materna exclusiva
G. ESTADÍSTICO.-
Es un valor que describe una característica o atributo de una muestra y está en función de los datos muestrales. Por ejemplo se tiene la media, razón o proporción muestral. H.ERROR MUESTRAL. Se refiere únicamente a la variabilidad o dispersión entre los resultados de un estadístico de muestras sucesivas del mismo tamaño o diferente. La medida apropiada para cuantificar este error es el error estándar.
Seleccionamos 1º muestra con n = 100 x1 = 82 p/m y S1 = 1.5 Población de personas de 40 a 50 años de edad cuya FC tiene µ = 80 p/m y σ = 2 p/m
Seleccionamos 2º muestra con n = 100 x2 = 79p/m y S2 = 3 p/m
Seleccionamos nº muestra con n = 100 xK= 80.5 p/m y SK= 3 Así sucesivamente se pueden seleccionar otras muestras y a veces los valores de xi y Si coincidirán pero las mas de las veces tienen diferencias. Es decir se pueden observar diferencias entre los estadísticos de las diferentes muestras, y esa diferencia es consecuencia de los errores muestrales. Se puede cuantificar la variabilidad atribuida a los errores muestrales y su medida es el ERROR ESTÁNDAR. Con el error estándar recién se pueden hacer las inferencias estadísticas respectivas
.
MUESTREO PROBABILÍSTICO El muestreo probabilístico se basa en que cada unidad de la población tiene una probabilidad distinta de cero de ser elegida para integrar la muestra. Esta premisa le da una carácter aleatorio a la elección de las unidades de la población para integrar la muestra. La probabilidad de selección de un elemento para integrar la muestra es de n/N Para diseñar una muestra probabilística se tendrá en cuenta las tres operaciones básicas: - Proceso de selección - Proceso de estimación - Tamaño de muestra
T IP O S D E M U E S T R E O P R O B A B IL IS T IC O -
M M M M
u e s tre o u e s tre o u e s tre o u e s tre o
a le a t o r io s im p le . S is t e m á t ic o . e s t r a t if ic a d o . p o r c o n g lo m e r a d o s .
Muestreo empírico o no probabilístico El muestreo no probabilístico se caracteriza por el hecho de que no es posible determinar la probabilidad de inclusión de cada unidad de la población en la muestra. Generalmente, para la selección de las unidades interviene el criterio subjetivo del investigador. Con este método no podemos elegir muestras representativas y no se pueden hacer las inferencias respectivas porque no podemos cuantificar el error muestral.
Población El muestreo e mpírico o no probabilistico no permite la inferencia estadística y solo se le puede usar como estudio preliminar, piloto o e xplo ratorio
Investigador
Muestra
MUESTREO ALEATORIO SIMPLE. Se aplica cuando la población es finita y homogénea. Una población es finita cuando las unidades pueden ser enumeradas y podemos identificar al último de ellos En un muestreo aleatorio simple a cada elemento de la población le corresponde la misma probabilidad de ser seleccionada para integrar la muestra y esto se denotará así: P = n (tamaño de muestra) N (tamaño de la población) Ejemplo 1 Procedimiento: Una población N = 150 y una muestra n= 10 P = 10 / 150 = 1 / 15 1. El procedimiento consiste en enumerar los elementos de la población 2. Se usa la tabla de números aleatorios (también se puede usar programas informáticos diseñados para tal fin). Si N = 150 en la tabla de números aleatorios se seleccionan 3 columnas por que tiene 3 dígitos, y se busca desde 001 a 150 La muestra tomada es sin reposición , es decir si un número se repite varias veces solo se tomará una sola vez).
MUESTREO SISTEMÁTICO. Es usada cuando la población es finita y heterogénea Procedimiento: Arranque aleatorio que consiste en: 1. Enumerar los elementos de la población 2. Determinar una relación de muestreo denotado por K K= N n
(tamaño de la población) (tamaño de la muestra
Por ejemplo si N = 150 y n = 10
entonces K = 150 / 10 = 15
Una vez identificado K se considera o genera un intervalo de selección que esta comprendido entre 1 y K ( en el ejemplo entre 1 y 15) incluyendo 1 y K y se seleccionara en forma aleatoria, al número seleccionado se le considera el arranque aleatorio (r) Y la muestra estará integrada por r r+K r+2K r+3K r+4K ......r+(n-1)K Así si en el ejemplo se elige el arranque n° 8 se tendrá la siguiente muestra: 8 23 38 53 68 83 98 113 128 143
TAMAÑO DE MUESTRA Para determinar el tamaño de muestra se tiene en cuenta el tipo de población, es decir: a. Si la población es homogénea se requiere pocos elementos en la muestra y si la población es heterogénea se requiere un mayor número de elementos. Para establecer una fórmula del tamaño de muestra se requiere saber el tipo de parámetro que se desea estimar, es decir, si el interés es estimar una media aritmética se requiere una fórmula específica y si se quiere estimar una proporción se considera otra fórmula.
FÓRMULA DE TAMAÑO DE MUESTRA PARA ESTIMAR UNA MEDIA ARITMÉTICA n =
Z² σ² N E²(N-1)+Z²σ²
Donde : N: Tamaño de la población que es objeto de estudio. Z : es una desviación normal cuyo valor corresponde al grado de confianza que se establece. Es decir: N.C. : 90% 95% 99% Z : 1.64 1.96 2.57 σ² : Varianza poblacional de la población que es objeto de estudio En la práctica, el valor de la varianza se desconoce. Para establecer el valor a la varianza, hay que tener en cuenta las siguientes recomendaciones: - Recurrir a estudios similares que se han realizado y obtener el valor de la varianza respectiva. - Realizar un estudio piloto para estimar σ² . E: Error absoluto o precisión de la estimación deseada de la media.
Ejemplo Interés: Conocer el colesterol promedio de los estudiantes de la Facultad de Medicina USMP. (Suponemos que son 1800 alumnos) El estudio queremos realizarlo mediante una muestra y necesitamos calcular el tamaño de muestra n, considerando: un grado de confianza del 95%, y los resultados de un estudio preliminar: _ x=210 y s=30; error relativo del 6% Solución _ _ Por definición de error relativo. Er = E/X * 100 . Por consiguiente, E= Er* X /100. Como grado de confianza 95%, nos indica que Z=1.96 E= 6*210/100 = 12.6; σ= 30. Reemplazando valores en la formula se tiene: n= (1.96)²(30)²(1800) (12.6)²(1799) + 1.96²(30²) Por tanto, n=22 (Para realizar el estudio se requiere como mínimo 22 estudiantes)
Determinación del tamaño de muestra para estimar una proporción n =
Z² P (1 – P) N E²(N-1) + Z²P(1-P)
N : Tamaño de la población Z : Desviación normal P : Proporción de unidades que poseen el atributo de interés en la población E : Error absoluto o precisión de la estimación de la proporción. Por lo general el valor que asume es de 0.05 En la práctica, el valor de la proporción P se desconoce. Para determinar dicho valor se recurre a las siguientes recomendaciones : - Recurrir a estudios similares que se hayan realizado y extraer el valor de P. - En caso de no haber antecedentes, se recurre a un estudio piloto para conocer P. En caso contrario se recurre a la máxima varianza cuando P=0.5
Ejemplo Interés: Conocer la proporción de estudiantes que consumen alcohol en la Facultad de Medicina de La USMP. Número de estudiantes N=1800.
El estudio se realizará mediante una muestra. Calculamos el tamaño de muestra, considerando: Grado de confianza del 95%, por consiguiente, Z=1.96. De un estudio preliminar se ha determinado que la proporción de alumnos que consumen alcohol es de p=0.30. El error absoluto que se toma en cuenta es de E=0.05 Reemplazando la información en fórmula, se tiene: n=
(1.96)²(0.3)(0.7)(1800) (0.05)²(1799) + (1.96)²(0.3)(0.7)
= 274
Por lo menos se requiere para ejecutar el estudio por lo menos 274 estudiantes
En caso de que se desconoce el tamaño de la población N, las fórmulas quedaran reducidas como:
- Para estimar una media aritmética, n =
Z² σ ² E²
- Para estimar una proporción, n=
Z² P (1 – P) E²
“El hombre encuentra a Dios detrás de cada puerta que la Ciencia abre”