PRUEBAS DE HIPOTESIS ¿Qué es una hipótesis Estadística? Una creencia sobre la población, principalmente sobre sus parámetros: Creo que el % Media de enfermos es superior al 10% Varianza Proporción Diferencia de medias entre dos poblaciones Diferencia de proporciones entre dos poblaciones Etc.
Identificación de hipótesis Hipótesis La
que contrastamos
Los
No
Hip.
nula Ho
datos pueden rechazarla
debería ser rechazada sin una buena razón.
Alternativa H1
Niega Los No
a H0
H 0 : p = 50% =, ≤, ≥ , , p ≠ 50 % H : 1
datos pueden mostrar evidencia a favor
debería ser aceptada sin una gran evidencia a favor.
Problema:
¿La osteoporosis está relacionada con el sexo? Solución: Traducir
a lenguaje estadístico:
Establecer
¿ su opuesto o complemento:
Seleccionar
la hipótesis nula
H 0 : p = 50%
p = 50%
p ≠ 50%
Problema:
¿El colesterol medio para la dieta mediterránea es 6 mmol/l? Solución: Traducir
a lenguaje estadístico:
Establecer
su opuesto:
Seleccionar
la hipótesis nula
H0 : µ = 6
µ =6 µ ≠6
Razonamiento básico Si supongo que H0 es cierta... ¿qué hace un RECHAZA Ho científico cuando su teoría no coincide con ... el resultado del experimento sería improbable. sus Sin embargo ocurrió. predicciones?
X = 20
µ = 40
... el resultado del experimento sería improbable. Sin embargo ocurrió.
Razonamiento básico Si supongo que H0 es cierta... • No hay evidencia contra H0 ¿Si una teoría hace predicciones con éxito, queda probado que es cierta?
•No se rechaza H0 •El experimento no es concluyente •El contraste no es significativo
µ = 40 X = 38
... el resultado del experimento es coherente.
Región crítica y nivel de significación Región crítica Valores ‘improbables’ si... Es conocida antes de realizar el experimento: resultados experimentales que rechazarían H0
Nivel de significación: α Número pequeño: 1% , 5% Fijado de antemano por el investigador Es la probabilidad de rechazar H0 cuando es verdadera α=5%
Reg. Crit. Reg. Crit. No rechazo H0
H 0 : 40
Contrastes o Pruebas: unilateral y bilateral La posición de la región crítica depende de la hipótesis alternativa Bilateral
Unilateral
H1: µ<40
H1: µ ≠ 40
Unilateral
H1: µ>40
Significación: p
No se rechaza H0: µ=40
α H0: µ=40
X = 43
Significación: p Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p>α
No se rechaza H0: µ=40
X = 43
P
α
P
α
Significación : p
Se rechaza H0: µ =40 Se acepta H1: µ >40
α X = 50
Significación : p El contraste es estadísticamente significativo cuando p<
α
Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.
α
P
Se rechaza H0: µ =40 Se acepta H1: µ >40
α
P
X = 50
Riesgos al tomar decisiones
jemplo 1: Se juzga a un individuo por la presunta comisión de un delito
H0: Hipótesis nula
Es inocente
Los datos pueden rechazarla La que se acepta si las pruebas no indican lo contrario Rechazarla por error tiene graves consecuencias
H1: Hipótesis alternativa
Es culpable
No debería ser aceptada sin una gran evidencia a favor. Rechazarla por error tiene consecuencias consideradas menos graves que la anterior
Tipos de error al tomar una decisión Realidad Inocente veredicto
Inocente
OK
Culpable Error Menos grave
Culpable Error Muy grave
OK
Tipos de error al contrastar hipótesis Realidad H0 cierta No Rechazo H0
No hay error
H0 Falsa
Error tipo II No rechazar falsa
Rechazo H0 Acepto H1
Error tipo I
Rechazar H 0 cuando es verdadera
No hay error
H0
cuando es
TIPOS DE PRUEBAS HIPOTESIS EXISTEN DOS TIPOS DE PRUEBAS DE HIPOTESIS, LAS CUALES DEPENDEN DEL OBJETIVO DEL ESTUDIO.
• UNILATERALES. (UNA COLA) •
BILATERALES. (DOS COLAS)
Rechazo ACEPTACIÓN ACEPTACIÓN
BILATERAL
Prueba unilateral por la derecha
HIPOTESIS RESPECTO DE LA MEDIA POBLACIONAL 1.- SUPUESTOS: Población Normal y Varianza conocida σ
2
µ
Estadística para la dócima o Prueba
ZC
( X −µ ) =
Tipos de Hipótesis:
H 0 : µ = µ0 Bilateral H1 : µ ≠ µ0 H 0 : µ ≤ µ0 Unilateral H1 : µ > µ0 H 0 : µ ≥ µ0 Unilateral H1 : µ < µ0
σ
0
n
2 P( Z ≤ Z C ) si Z C < 0 valor p = 2 P( Z ≥ Z C ) si Z C > 0 valor p = P ( Z ≥ Z C ) valor p = P ( Z ≤ Z C )
Ejemplo
Se sabe que la variable Nivel total de proteínas en un adulto sano es de 7.25 , y que se distribuye normalmente con desviación estándar 0.025. A un paciente que cree estar enfermo, se le aplican 8 análisis de sangre a lo largo de varios días, obteniendo los siguientes valores: 7.23 – 7.25 – 7.28 – 7.29 – 7.32 – 7.26 – 7.27 – 7.24 ¿Qué hipótesis plantearía? H 0 : µ = 7.25
H1 : µ ≠ 7.25 La estadística es una variable Z
Zc =
(X −µ ) σ
0
n
=
( 7.268 − 7.25) 0.025
8
= 2.036
v − p = 2 P ( Z > 2.036) = 2 ⋅ 0.0209 = 0.0418 Se rechaza la hipótesis nula, el paciente realmente está enfermo
µ
HIPOTESIS RESPECTO DE LA MEDIA POBLACIONAL 2.- SUPUESTOS:
Estadística para la dócima o Prueba
Población Normal y Varianza desconocida
tC Tipos de Hipótesis:
H 0 : µ = µ0 Bilateral H1 : µ ≠ µ0 H 0 : µ ≤ µ0 Unilateral H1 : µ > µ0 H 0 : µ ≥ µ0 Unilateral H1 : µ < µ0
( X −µ ) = 0
S
n
≈ t( n −1)
2 P(t( n −1) ≤ tC ) si tC < 0 valor p = 2 P (t( n −1) ≥ tC ) si tC > 0 valor p = P (t( n −1) ≥ tC )
valor p = P (t( n −1) ≤ tC )
Ejemplo
Se ha realizado un experimento para estudiar el efecto del ejercicio físico en la reducción del nivel de colesterol en pacientes ligeramente obesos, con riesgo de infarto de miocardio. Ochenta pacientes se someten a un régimen específico de ejercicios mientras mantienen una dieta normal. Transcurridas 4 semanas se anotará la variación del nivel de colesterol. Se piensa que el programa reducirá la media del nivel de colesterol en más de 25 puntos. Al final del estudio, los datos obtenidos son: x 27 y s 18 ¿Corroboran estos datos la teoría de la investigación? Se trata de una hipótesis respecto a la media poblacional, unilateral. La población se supone normal y la varianza poblacional desconocida Como la media muestral supera al valor propuesto para la media poblacional, las hipótesis son las siguientes:
H 0 : 25 H1 : 25
La estadística es una variable cuyo valor es tC
27 25 18
80
tC
0.994
X
0 s
n
: t n 1
y el v-p= P (t 0.994) 0.1616 79
Luego no hay evidencia en la muestra para rechazar la hipótesis nula, porque el valor p es muy grande.
HIPOTESIS RESPECTO DE LA VARIANZA SUPUESTO:
Estadística para la prueba
Población Normal Tipos de hipótesis
H 0 : 2 02
(n 1) S 2 2 : ( n 1) 02 2 C
2 2 Bilateral p 2 P ( ( n 1) C) 2 2 H1 : 0 H 0 : 2 02 2 2 Unilateral p P ( ( n 1) C) 2 2 H1 : 0 H 0 : 2 02 2 2 Unilateral p P ( ( n 1) C) 2 2 H1 : 0
Ejemplo El calcio se presenta en la sangre de los mamíferos en concentraciones de alrededor de 6 mg/100mL de sangre total. La desviación estándar normal de esta variable es 1 mg de calcio por cada 100 mL de sangre total. Una variabilidad mayor que ésta puede ocasionar graves trastornos en la coagulación de la sangre. Se realizaron una serie de 9 pruebas sobre un paciente, la que dio una media de 6.2 mg de calcio por 100mL de sangre total y una desviación estándar de 2 mg de calcio por 100mL de sangre total. ¿Hay alguna evidencia de que el nivel medio de calcio en este paciente sea más alto que el normal? ¿Hay alguna evidencia que la desviación estándar del nivel de calcio sea más alta que la normal? Se trata en primer lugar de probar una hipótesis unilateral para la media poblacional. (Supuesto: la población es normal, la varianza poblacional es conocida e igual a 1) La estadística es una N(0,1) H0 : 6 6.2 6 9 0.6 Z v p P( Z 0.6) 0.2743 C H1 : 6 1 No hay evidencia para rechazar la hipótesis nula. En segundo lugar, se trata de una hipótesis sobre la varianza, de tipo unilateral. H0 : 2 1
La estadística es una variable
H1 : 1 2
Cuyo valor es :
2 C
9 1 22 2
1
32
2 C
n 1 S 2
0
2
: 2n 1
v p P( 28 32) 0.0001
Hay evidencia altamente significativa en la muestra para rechazar la hipótesis nula y aceptar que la desviación estándar es más alta que la normal
HIPOTESIS RESPECTO DE LA PROPORCION DE EXITOS p EN LA POBLACION Supuestos:
Estadística para la prueba
Población Bernoulli. Tamaño grande de muestra
ZC
Tipos de hipótesis
H 0 : p p0 Bilateral H1 : p p0
p 2 P(Z ZC )
H 0 : p p0 Unilateral H1 : p p0
p P( Z ZC )
H 0 : p p0 H1 : p p0
Unilateral
p P( Z ZC )
pˆ p0 p0 q0 n
: N (0,1)
EJEMPLO En un estudio sobre el consumo de cigarrillos entre los adolescentes de una región del país, se sostiene que el porcentaje de mujeres fumadoras es mayor al 40% de las mujeres de esa población. Para probar la hipótesis, se tomó una muestra de 200 mujeres, donde 100 de ellas fumaban. Pruebe la hipótesis. Se trata de una hipótesis unilateral sobre el parámetro p.
El estimador puntual de p es : H 0 : p 0.4
H1 : p 0.4
ZC
pˆ
100 0.5 200
0.5 0.4 2.88 0.4 0.6 200
p P ( Z 2.88) 0.002
Se rechaza la hipótesis nula y se acepta que el % de fumadoras supera la 40%
PRUEBAS DE HIPÓTESIS PARA UNA POBLACIÓN
DOS POBLACIONES