Guía de Pruebas de Hipótesis 1.
Pruebas de Hipótesis
Los siguientes ejercicios han sido seleccionados de una serie de libros. Se pide resolver cada uno de los siguientes ejercicios. 1. En un estudio de la perniciosa manzanilla cimarrona gigante, una de las especies herbáceas más altas en Europa, Jan Pergl y asociados compararon la densidad de estas plantas en lugares controlados y no controlados de la región del Cáucaso en Rusia. En su zona nativa, la densidad promedio se encontró que era de cinco plantas por metro cuadrado. En la zona invadida en la Republica Checa, una muestra de n = 50 planta produjo una densidad promedio de 6,17 plantas por metro cuadrado con una desviación estándar de 2,9 plantas por metro cuadrado. a) ¿La zona invadida en la república checa tiene una densidad promedio de manzanilla cimarrona gigante que es diferente de m 6= 5 al nivel de significancia a α = 0,05? b) ¿Cuál es el valor p asociado con la prueba del inciso a)? ¿Puede usted rechazar H0 al nivel de significancia de 5% usando el valor p?
2. El artículo “Wear in Boundary Lubrication” (S. Hsu, R. Munro y M. Shen, en Journal of Engineering Tribology, 2002:427-441) analiza algunos experimentos que implican diferentes lubricantes. En un experimento, 45 bolas de acero, lubricadas con parafina purificada, estaban sujetas a una carga de 40 kg a 600 rpm durante 60 minutos. El promedio de desgaste, medido por la reducción en el diámetro, era de 673,2 mm, y la desviación estándar era de 14,9 mm. Suponga que la especificación para un lubricante es que la media del desgaste sea menor de 675 mm. Considere α = 0,05. Siendo las hipótesis: H0 : µ ≥ 675 H1 : µ ≤ 675. a) Calcule el estadístico de prueba. b) Encuentre el estadístico de contraste (valor crítico). c) Tome la decisión de no rechazar H0 o rechazar. d) Encuentre el P − valor.
1
3.
Recientemente muchas compañías han experimentado con las “telecomunicaciones”, al permitir que sus empleados trabajen en su casa en sus computadoras. Entre otros factores, se supone que la telecomunicación reduce las faltas por enfermedad. Se conoce que en años pasados los empleados de una compañía faltaron una media de 5,4 días por enfermedad. Este año la compañía introduce las telecomunicaciones. La dirección elige una muestra aleatoria simple de 80 empleados para estudiarlos en detalle, y, al final del año, estos promedian 4,5 días de faltas por enfermedad con desviación estándar de 2,7 días. Sea µ la media del número de días de faltas por enfermedad para todos los empleados de la compañía. Considere α = 0,01. Realice una prueba de hipótesis con el propósito de verificar si las faltas de este año han disminuido. a) Establezca las hipótesis. b) Calcule el estadístico de prueba. c) Encuentre el estadístico de contraste (valor crítico). d) Tome la decisión de no rechazar H0 o rechazar. e) Encuentre el P − valor.
4.
Una muestra aleatoria simple consta de 65 longitudes de alambre de piano que se probaron para la medir la elongación sujeta a una carga de 30 N. La elongación o alargamiento promedio para los 65 alambres fue de 1,102 mm, y la desviación estándar, de 0,020 mm. Sea µ la media del alargamiento para todas las unidades de alambre de piano. Realice una prueba de hipótesis donde verifique que la media es mayor o igual al valor especificado de 1,100. Considere α = 0,02: a) Establezca las hipótesis. b) Calcule el estadístico de prueba. c) Encuentre el estadístico de contraste (valor crítico). 2
d) Tome la decisión de no rechazar H0 o rechazar. e) Encuentre el P – valor
5.
Análisis realizados en muestras de agua potable para 100 casas, en cada una de dos diferentes secciones de una ciudad, dieron las siguientes medias y desviaciones estándar deniveles de plomo (en partes por millón): Sección 1
Sección 2
N 100 100 x¯ 34,1 36,0 S2 5,9 6,0 a) Calcule el estadístico de prueba y su valor p (nivel de significancia observado) para probar una diferencia en las dos medias poblacionales. Use el valor-p para evaluar la significancia estadística de los resultados al nivel de 5%. b) Use un intervalo de confianza de 95% para estimar la diferencia en los niveles medios de plomo para las dos secciones de la ciudad. c) Suponga que ingenieros ambientales del municipio se preocuparan solo si detectan una diferencia de más de 5 partes por millón en las dos secciones de la ciudad. Con base en su intervalo de confianza en el inciso b), ¿la significancia estadística del inciso a) es de importancia practica para los ingenieros del municipio? Explique.
6.
Un inspector midió el volumen de llenado de una muestra aleatoria simple de 100 latas de jugo cuya etiqueta afirmaba que contenían 12 oz. La muestra tenía una media de volumen de 11,98 oz y desviación estándar de 0,19 oz. Seaµ la media del volumen de llenado para todas las latas de jugo recientemente llenadas con esta máquina. Realice una prueba de hipótesis que garantice lo que afirma la etiqueta.
3
a) Establezca las hipótesis. b) Calcule el estadístico de prueba. c) Encuentre el estadístico de contraste (valor crítico). d) Tome la decisión de no rechazar H0 o rechazar. e) Encuentre el P – valor
7.
Cuando está operando adecuadamente, una planta química tiene una media de producción diaria de cuando menos 740 toneladas. La producción se mide en una muestra aleatoria simple de 60 días. La muestra tenía una media de 715 toneladas/día y desviación estándar de 24 toneladas/día. Sea µ la media de la producción diaria de la planta. Un ingeniero prueba que H0 :≥ 740 contra H1 : m < 740. a) Determine el p-valor. b) ¿Piensa que es factible que la planta esté operando adecuadamente o está convencido de que la planta no funciona en forma adecuada? Explique su razonamiento.
8.
En un proceso de fabricación de placas de silicio cubiertas con tungsteno la resistencia objetivo para una placa es de 85mΩ. En una muestra aleatoria simple de 50 placas, la media de la resistencia de la muestra era de 84,8demΩ, y la desviación est´andar,0,5mΩ. Sea m la media de la resistencia de las placas fabricadas mediante este proceso. Un ingeniero de control de calidad prueba que H0 : µ = 85 contra H1 : µ 6= 85. a) Determine el p-valor. 4
b) ¿Piensa que es factible que la media este en el objetivo, o está convencido de que la media no está en el objetivo? c) Explique su razonamiento.
9.
Para medir la calidad del aire, de cierta región industrial, se extrae una muestra de 36 observaciones, encontrándose un promedio de 5 ppm de cadmio (Cd) atmosférico. Asumir que la desviación estándar poblacional es de 0,3. a) Realice una prueba de hipótesis para validad que el promedio poblacional no supera los 4,85 ppm, con α = 0,01 b) Además, calcular el valor de la probabilidad p e interpretarlo.
10. Las mujeres a las que se diagnosticó cáncer de pecho en su etapa temprana, un tercio murieron finalmente de la enfermedad. Suponga que el departamento de salud pública de una comunidad instituyo un programa de selección para la detección temprana de ese cáncer y aumentar el porcentaje de sobrevivencia p de las diagnosticadas con la enfermedad. Una muestra aleatoria de 200 mujeres se seleccionó de entre las que eran seleccionadas periódicamente por el programa y a las que se les diagnostico la enfermedad. Con x representemos el número de las de la muestra que sobreviven a la enfermedad. a) Si se desea detectar si el programa de selección ha sido efectivo, exprese la hipótesis nula que deba probarse. b) Indique la hipótesis alternativa. 5
c) Si 164 mujeres de la muestra de 200 sobreviven a la enfermedad, ¿se puede concluir que el programa de selección de la comunidad fue efectivo? Pruebe usando a α = 0,02 y explique las conclusiones practicas a partir de su prueba. d) Encuentre el valor-p para la prueba e interprételo.
11. La Sociedad protectora de animales informa que hay alrededor de 65 millones de perros en Estados Unidos y que aproximadamente 40% de todas las familias en Estados Unidos tienen al menos un perro. En una muestra aleatoria de 300 familias, 114 dijeron que tenían al menos un perro. ¿Estos datos dan suficiente evidencia para indicar que la proporción de familias con al menos un perro es diferente de la publicada por la Humane Society? Pruebe usando a α = 0,05.
12. Sea µ el nivel de radiación al que un trabajador se expone durante el transcurso de un año. La agencia de protección ambiental ha establecido el nivel máximo de seguridad de la exposición en 5 rem por año. Si se realiza una prueba de hipótesis para determinar si un puesto de trabajo es seguro.
13. La adición de MMT, un compuesto que contiene manganeso (Mn), a la gasolina como enriquecedor de octano ha causado preocupación por la exposición de personas al Mn, porque las elevadas ingestas han estado 6
ligadas a graves efectos en la salud. En un estudio de concentraciones en el aire ambiente de Mn fino, Wallace y Slonecker (Journal of the Air and Waste Management Association) presentaron la siguiente información resumida de las cantidades de Mn fi no (en nanogramos por metro cúbico) en casi todos los parques nacionales y en la mayor parte de zonas urbanas en California. Parques nacionales California n 36 26 x¯ 0,94 2,80 S2 1,2 2,8 a) ¿Hay suficiente evidencia para indicar que las concentraciones medias difieren para los dos tipos de lugares al nivel de significancia a α = 0,01? Use la prueba z de muestra grande. b) ¿Cuál es el valor p de esta prueba?
14. Se recomienda la instalación de un dispositivo de disminución de radón en cualquier casa donde la media de la concentración de radón es de 4.0 picocuries por litro (pCi/l) o mayor, porque se ha pensado que a la larga esa exposición representa una dosis suficientemente grande que puede aumentar el riesgo de cáncer. Se hicieron 75 mediciones en una casa específica. La media de las concentraciones era de 3.72 pCi/l y la desviación estándar de 1.93 pCi/l. a) El inspector de casas que realizo la prueba informó que debido a que la media de las mediciones es menor de 4.0 es innecesaria la disminución de radón. Explique por que este razonamiento es incorrecto. b) Debido a motivos de salud, se recomienda la disminución de radón siempre que sea factible que la concentración media de radón pueda ser de 4.0 pCi/l o mayor. Establezca las hipótesis nula y alternativa adecuadas para determinar si la disminución de radón es adecuada. c) Calcule el P-valor. ¿Usted recomendaría la disminución de radón? Explique.
7
15. Es deseable comprobar la calibración de una balanza pesando un peso patrón de 10 g 100 veces. Sea m la media poblacional de lecturas en la balanza, por lo que esta y ultima estará calibrada si µ = 10. Se hace una prueba de hipótesis H0 : µ = 10 contra H1 : µ 6= 10. Considere tres conclusiones posibles: (i) la balanza está calibrada. (ii) la balanza no está calibrada. (iii) la balanza podría estar calibrada. a) ¿Cuál de las tres conclusiones es mejor si H0 es rechazada? b) ¿cuál de las tres conclusiones es mejor si H0 no es rechazada? c) ¿Es posible realizar una prueba de hipótesis en una forma que sea posible demostrar concluyentemente que la balanza está calibrada? Explique.
16. Si la producción diaria de la máquina de una fábrica tiene más de 10% de artículos defectuosos, es necesario repararla. Una muestra aleatoria de 100 piezas de la producción del día contiene 15 piezas defectuosas y el supervisor decide que la maquina debe ser reparada. ¿La evidencia muestral apoya su decisión? Use una prueba con un nivel de significancia de 0,01.
17. Se realizo un estudio psicológico para compararlos tiempos de reacción de hombres y mujeres a un estímulo. En el experimento se emplearon muestras aleatorias independientes de 50 hombres y 50 mujeres. Los resultados se muestran en la siguiente tabla:
8
Hombres
Mujeres
n 50 50 x¯ (s) 3,6 3,8 S2 0,18 0,14 ¿Los datos presentan evidencia para sugerir una diferencia entre los tiempos medios de reacción verdaderos para hombres y mujeres? Use α = 0,05.
18. En los últimos años, muchos estudios de investigación han demostrado que los beneficios que se buscan con terapia hormonal de reemplazo (HRT) no existen y de hecho esa terapia de cambio hormonal aumenta el riesgo de varias enfermedades graves. Un experimento de cuatro años donde intervinieron 4532 mujeres, publicado en The Press Enterprise, se realizo en 39 centros médicos. La mitad de las mujeres tomaron placebos y la otra mitad tom´o Prempro, una terapia hormonal de reemplazo que se receta con frecuencia. Hubo 40 casos de demencia en el grupo hormonal y 21 en el de placebos. ¿Hay suficiente evidencia para indicar que el riesgo de demencia es más alto para pacientes que usan Prempro? Pruebe al nivel de significancia del 1%.
9
19. El voltaje de salida para un circuito eléctrico es de 130,0. Una muestra de 40 lecturas independientes del voltaje para este circuito dio una media muestral de 128,6 y desviación estándar de 2,1. Pruebe la hipótesis de que el promedio de voltaje de salida es 130 contra la alternativa de que es menor a 130. Use una prueba con nivel 0,05.
20. El factor pH es una medida de la acidez o alcalinidad del agua. Una lectura de 7,0 es neutral; valores de más de 7,0 indican alcalinidad y, debajo de 7,0 implican acidez. Loren Hill dice que la mejor probabilidad de pescar robalo es cuando el pH del agua está entre 7,5 y 7,9. Supongamos que usted sospecha que la lluvia acida está bajando el pH de su lugar de pesca favorita y desea determinar si el pH es menor a 7,5. a) Indique la hipótesis alternativa y nula que escogería para una prueba estadística. b) ¿La hipótesis alternativa del inciso a) implica una prueba de una o de dos colas? Explique. c) Suponga que unas muestras aleatorias de 30 especímenes de agua dieron lecturas de pH con x = 7,3 y s = 0,2. Con solo ver los datos, ¿piensa usted que la diferencia x−7,5 = −0,02 es suficientemente grande para indicar que el pH medio de las muestras de agua es menor a 7.5? (No realice la prueba.) d) Ahora realice una prueba estadística de las hipótesis del inciso a) e indique sus conclusiones. Pruebe usando α = 0,05. Compare su decisión basada estadísticamente con su decisión intuitiva del inciso c).
10
21. Se realizo un experimento para probar el efecto de un nuevo medicamento en una infección viral. La infección fue inducida en 100 ratones y estos se dividieron al azar en dos grupos de 50. El primer grupo, el grupo de control, no recibió tratamiento para la infección; el segundo grupo recibió el medicamento. Después de un periodo de 30 días, las proporciones de sobrevivientes, pˆ1 y ˆp2, en los dos grupos se encontraron de 0,36 y 0,60, respectivamente. a) ¿Hay evidencia suficiente para indicar que el medicamento es efectivo para tratar la infección viral? Use α = 0,05. b) Use un intervalo de confianza de 95% para estimar la diferencia real en los porcentajes de curación para los grupos tratados contra los de control.
22. El índice Rockwell de dureza para acero se determina al presionar una punta de diamante en el acero y medir la profundidad de la penetración. Para 50 especímenes de una aleación de acero, el ´índice Rockwell de dureza promedio 62 con desviación estándar de 8. El fabricante dice que esta aleación tiene un índice de dureza promedio de al menos 64. ¿Hay suficiente evidencia para refutar lo dicho por el fabricante con un nivel de significancia de 1%?
11
23. Mediciones de resistencia al corte, obtenidas de pruebas de compresión no confió nada para dos tipos de suelos, proporcionaron los resultados que se muestran en la siguiente tabla (medidas en toneladas por pie cuadrado). ¿Parecen diferir los suelos con respecto al promedio de resistencia al corte con un nivel de significancia de 1%? Tipo de suelo I N x¯ S2
30 1,65 0,26
Tipo de suelo II 35 1,43 0,22
24. Se han encontrado bifeniles policlorados (PCB) en cantidades peligrosamente altas en algunas aves de caza halladas en pantanos de la costa sudeste de Estados Unidos. La Administración de Alimentos y Drogas (FDA) considera que una concentración de los PCB de más de 5 partes por millón (ppm) en estas aves de caza es peligrosa para consumo humano. Una muestra de 38 aves de caza produjo un promedio de 7.2 ppm con una desviación estándar de 6.2 ppm. ¿Hay suficiente evidencia para indicar que las ppm medias de los PCB en la población de aves de caza excede del límite recomendado de la FDA de 5 ppm? Use a α = 0,01.
12
25. Los desechos industriales y residuales descargados en nuestros ríos y arroyos absorben oxígeno y, por tanto, reducen la cantidad de oxígeno disuelto disponible para peces y otras formas de fauna acuática. Una agencia estatal requiere un mínimo de 5 partes por millón (ppm) de oxígeno disuelto para que el contenido de oxígeno sea suficiente para sostener vida acuática. Seis especímenes de agua tomados de un río en un lugar específico durante la estación de aguas bajas (julio) dio lecturas de 4.9, 5.1, 4.9, 5.0, 5.0 y 4.7 de oxígeno disuelto. ¿Los datos dan suficiente evidencia para indicar que el contenido de oxıgeno disuelto es menor a 5 ppm? Pruebe usando a α = 0,05.
26. Considerando el ejercicio anterior, en el que medimos el contenido de oxígeno disuelto en agua de río para determinar si un arroyo tenía suficiente oxígeno para soportar vida acuática. Un inspector de control de contaminación sospechaba que la comunidad de un río estaba vertiendo cantidades de aguas negras poco tratadas al río. Para comprobar su teoría, saco cinco especímenes de agua de río escogidos al azar en un lugar aguas arriba del pueblo, y otros cinco de aguas abajo. Las lecturas de oxígeno disuelto (en partes por millón) son como sigue: Aguas arriba 4.8 5.2 5.0 4.9 5.1 Aguas abajo 5.0 4.7 4.9 4.8 4.9 a) ¿Los datos dan suficiente evidencia para indicar que el contenido medio de oxígeno aguas abajo del pueblo es menor que el contenido medio de oxígeno aguas arriba? Pruebe usando α = 0,01. b) Supongamos que usted prefiere la estimación como metodo de inferencia. Estime la diferencia en los contenidos medios de oxígeno disuelto para lugares aguas arriba y abajo del pueblo. Use un intervalo de confianza de 95%.
13
27. La temperatura de la tierra (que afecta la germinación de semillas, el crecimiento de cosechas en mal clima y muchos aspectos de producción agrícola) se puede medir usando ya sea sensores al nivel del suelo o aparatos sensibles a rayos infrarrojos instalados en aviones o satélites espaciales. Los sensores instalados en tierra son tediosos y requieren numerosas replicas para obtener una estimación precisa de la temperatura del suelo. Por otro lado, los sensores de ondas infrarrojas instalados en aviones o satélites parecen introducir un sesgo en las lecturas de temperatura. Para determinar el sesgo, se obtuvieron lecturas en cinco lugares diferentes usando sensores tanto en tierra como en aviones. Las lecturas (en grados Celsius) son como sigue: Lugar Tierra Aire 1 46,9 47,3 2 45,4 48,1 3 36,3 37,9 4 31,0 32,7 5 24,7 26,2 a) ¿Los datos presentan suficiente evidencia para indicar un sesgo en las lecturas de temperatura basadas en aviones? Explique.
28. En un estudio de la infestación dela langostaThenus orientalis por dos tipos de lapas, Octolasmis tridens y O. lowei, se midieron las longitudes del caparazón (en milímetros) de 10 langostas seleccionadas al azar pescadas en los mares cerca de Singapur: 78 66 65 63 60 60 58 56 52 50 Realice una prueba de hipótesis en el que la media poblacional es menor de 75 milímetros.
14
29. Jan Lindhe realizo un estudio sobre el efecto de un enjuague oral antiplaca sobre la acumulación de placa en dientes. Catorce personas cuyos dientes estaban muy limpios y pulidos se asignaron al azar a dos grupos de siete personas cada uno. Ambos grupos fueron asignados para usar enjuagues orales (no cepillado) durante un periodo de dos semanas. El grupo 1 utilizo un enjuague que contenía un agente antiplaca. El grupo 2, el grupo de control, recibió un enjuague similar excepto que, sin saberlo las personas, el enjuague no contenía agente antiplaca. Un índice x de placa, medida de acumulación de placa, fue registrado a las 4, 7 y 14 días. La media y desviación estándar para las mediciones de placa de 14 días se muestran en la tabla para los dos grupos.
Tamaño muestral Media Desviación estándar
Grupo de
Grupo
control
antiplaca
7 1,26 0,32
7 0,78 0,32
a) Exprese la hipótesis nula y alternativa que deberían usarse para probar la efectividad del enjuague oral antiplaca. b) ¿Los datos dan suficiente evidencia para indicar que el enjuague oral antiplaca es eficaz? Pruebe usando α = 0,05. c) Encuentre el valor-p aproximado para la prueba.
15
30. Se supone que una máquina que llena cajas de cereal está calibrada, por lo que la media del peso de llenado es de 12 oz. Sea m la media verdadera del peso de llenado. Suponga que en una prueba de hipótesis: H0 : µ = 12 contra H1 : µ 6= 12 si el P − valor = 0,30. a) ¿Se debe rechazar H0 con base en esta prueba? Explique. b) ¿Puede concluir que la máquina está calibrada para proporcionar una media del peso de llenado de 12 oz? Explique.
16