INFERENCIA ESTADISTICA Población
Objetivo
Inferencia estadística
Muestreo
Muestra
Investigador
INFERENCIA ESTADISTICA Definición Es
de Inferencia de Estadística:
un proceso por medio del cuál se elaboran conclusiones probabilísticas en relación a una población, valiéndose de la información proporcionada por una muestra de esa población.
Problemas a resolver
1. Conocer la proporció Facultad de Odontolog 2. Un investigador está dos medicamentos en l
Laestimaciónpor puntodeparámetros Loproporcionasus respectivos estadísticos quesecalculanen basea los datos de la muestra , es decir: Parámetros µ σ2 µ1 - µ2 P P1 - P2
Estadísticos _ n x = Σ xi i=1 n n _ s 2 = Σ (xi - x) 2 i=1 n - 1 _ _ x 1 - x2 p=a/n, donde a es el número de unidades que poseenel atributo de interés enla muestra p 1 - p2 .
Ejemplo 1 Estimación de
Se tiene interés en estim Facultad de Medicina de muestra aleatoria de 36 a _
Ejemplo 2
Estimacióndeunaproporción
P
Interés: Estimar laproporciónde niñosdesnutridos menoresde 5 añosde unadeterminadacomunidad. Seleccionamos una muestra de100 niños menores de5 años yse determina que 45están desnutridos. Se quiereest imar una proporciónde población P=A/N, donde, A: nº de niños menores de5 años desnutridos enla poblaciónyN: nº de niños menores de 5años en la población. El estimador es: p=a/n donde a es el número de niños desnutridos enla muestray nes el tamaño de muestra. Por consiguiente, p= 45/100=0.45. proporciónestimada de niños desnutridos menores de 5años en la comunidades de 0.45.
Estimación por intervalo Consiste en determinar dos valores numéricos L1 y L2 y que con un cierto grado de confianza se espera que el valor del parámetro esté comprendida entre dichos valores. Intervalo de confianza para la media µ En este caso los valores L1 y L2 serían: _ _ L1 = x - Z ES (x) _ _ L2 = x + Z ES (x) Donde:
Z : Es un coeficiente de confianza y cuyo valor depende del grado de confianza (G.C.) que se establece, es decir: G.C. : 90% 95% 99% Z : 1.64 1.96 2.57 _ _ ES(x) : es el error estándar de x y se define como: _ _ ES(x) = s/√n , donde s es la desviación estándar de la muestra Nota El coeficiente Z se utiliza cuando tamaño de muestra n > 30.
En relación al ejemplo 1, construiremos un intervalo de confianza del 95% para la estatura promedio ( µ ) de los estudiantes de medicina. Grado de confianza del 95% le corresponde un Z=1.96 _ __ Error estándar ES(x) = 20/√36 = 3.33 Por consiguiente: L1= 170 – 1.96*3.33 = 163.5 L2= 170 + 1.96*3.33 = 176.5 µ [163.5 , 176.5] La estatura promedio de los estudiantes de la Facultad de Medicina de la USMP está oscilando entre 163.5 y 176.5 cm con grado de confianza 95%
Ejemplo 2 Se desea estimar el tiempo promedio de estancia hospitalaria para cierto tipo de pacientes. Se toma una muestra de 25 historias clínicas y se calcula x =5,7 y s = 4,5 días. Estimar µ con 95% de confianza. Solución: En este caso no se conoce σ , luego el modelo de estimación, será: L.S
µ = x ± t n-1
s √n
L.I.
Donde t n-1 es el coeficiente de confiabilidad, cuyo valor se obtiene de la tabla de distribución “t” de Student con n-1 grados de libertad para el nivel de confianza deseado. Algunas características de la distribución “t” de Student son: La distribución tiene forma acampanada. Es simétrica respecto al punto t=0 Forma cola rápidamente a la derecha e izquierda; por lo tanto “t” es más variable que Z La “forma” de la distribución cambia conforme el valor de n. Es decir, para cada grado de libertad (n1) existe una curva simétrica. A medida que n aumenta, “t” se aproxima a la normal Z.
Luego de la tabla “t” se obtiene para un nivel de significación de 0,05 bilateral: t24 = 2,064
7,68 días µ = 5,7 ± 2,064 4,8 3,72 días √25 Interpretación: La probabilidad de que el tiempo promedio de estancia hospitalaria, en la población de pacientes, se encuentre entre 3,72 y 7,68, es de 0,95.
IntervalodeconfianzaparalaproporciónP ______ • L1=p - z √pq/n ____ • L2=p +z √pq/n • donde q=1 - p. ____ • √pq/n =ES(p), nos indicael estimador del error estándar de la proporción de la muestra p
Segúnla informaciónque se dispone, se construye unintervalo del 95%para P: = 1.96 • Para una confianza del 95%, Z • Reemplazando valores se tiene: ____________ • L1 = 0.45 - 1.96 * √ 0.45(0.55)/100 = 0.352 ____________ • L2 = 0.45+ 1.96 * √0.45(0.55)/100 = 0.548. • La proporciónde niños menores de 5 años desnutridos endicha comunidad está entre 0.352 y 0.548 conuna confianza del 95%. Nota Se utiliza el coeficiente de confianza
Z∝/2 si np y n(1 -p) >5.
Pruebadehipótesis Es una técnicaestadística que sesigue para decidir si rechazamos o no una hipótesis estadísticaen basea la información de una muestra
Hipótesisestadística
:
Es unaafirmaciónde lo que creemos sobre una población. Por lo general, está hipótesis serefierea los parámetros de la población acercade los cuales se quiere hacer laafirmación. (En la practica, se tieneidea de la distribuciónde la variable que seestáestudiando) Ejemplo1 Uninvestigador pretendeestudiar enformacomparativa laeficacia de dos tratamientos (o procedimientos experimentales) para determinar cuál es el mejor
.
Tipos de hipótesis estadística Hipótesis nula (Ho) también se le denomina hipótesis de la no diferencia y se establece para ser rechazada o desacreditada.. • Considerando el ejemplo establecido en la hipótesis estadística , las hipótesis nula que les corresponde es: Ho: µA - µB = 0
(Tratamiento A no difiere de B)
Hipótesis alterna (H1) son todas las demás suposiciones o alternativas al problema para contrastar Ho. • La hipótesis alterna H1 puede ser uni o bilateral. • Con respecto al ejemplo, se tiene: • H1: µA - µB > 0, (indica que tratamiento A es mejor que el tratamiento B. Ha unilateral a la derecha)
Nivel de significación: α EN LA REALIDAD
Decisión estadística
Ho verdadero
Ho Falso
Rechazar Ho
Error tipo I ( α)
Decisión correcta (1-ß)
No rechazar Ho
Decisión correcta (1-α)
Error tipo II (ß)
Cuando se toma una decisión estadística, podemos cometer el error tipo I o tipo II. α = P(error tipo I) = P( Rechazar Ho / Ho es verdadero) α puede ser manejada por el investigador, por consiguiente puede establecer su valor, es decir, α =0.001, 0.01 , 0.05 α nos indica el nivel de significación de la prueba, porque permite diferenciar la región de rechazo y no rechazo de la prueba. 1- α indica el grado de confianza de la prueba. ß= P(error tipo II) = P(No rechazar Ho / Ho falso) ß no se maneja directamente por el investigador. α y ß están relacionados y ambos disminuyen su valor si incrementamos el tamaño de muestra o si mejoremos el diseño del estudio. 1-ß= P(rechazar Ho/Ho es falso), también se denomina potencia de prueba. Valor mínimo que puede tomar es del 80%.
Mostraremos estas cuatro probabilidades utilizando la distribución de medias y una prueba unilateral. H1
H0
(1- β )
(1α )
µ
ββ 0
Zona de no rechazo de H0
α _α xc
µ
1
_ xi
Zona de rechazo de H0