ESTIMACIÓN DE UNA MEDIA POBLACIONAL CON σ CONOCIDA Y DESCONOCIDA
Propósito • Realizar estimación de una media poblacional con varianza poblacional conocida. • Realizar el cálculo de una muestra para estimar una media poblacional.
Construir un intervalo de confianza que se utilice para estimar una media poblacional dado σ.
𝑥ҧ − 𝐸 < 𝜇 < 𝑥ҧ + 𝐸 𝜎 𝐸 = 𝑍𝛼 /2. 𝑛 μ = Media poblacional σ = Desviación estándar de la población 𝑥ҧ = Media muestral n = Número de valores muestrales E = Margen de error z α/2 = puntuación z que separa un área de α/2 en la cola derecha de la distribución normal estándar
1. La muestra es aleatoria simple. 2. El valor de la desviación estándar poblacional σ es conocido. 3. Cualquiera o ambas de estas condiciones se satisfacen: la población se distribuye normalmente o n > 30.
Han muerto personas en accidentes de embarcaciones y aviones debido al uso de una estimación obsoleta del peso medio de los hombres el cual ha variado de manera considerable, por lo que es necesario actualizar la estimación de esa media con la finalidad de que los medios de transporte no se sobrecarguen peligrosamente. Si utilizamos los pesos de hombres de una muestra aleatoria ഥ = 172,55 libras. Investigaciones realizadas simple: n = 40 y 𝒙 por otras fuentes sugieren que la población de los pesos de hombres tienen una desviación estándar dada por σ = 26 libras.
a. Calcule la mejor estimación puntual del peso medio de la población de todos los hombres. b. Construya un intervalo de confianza del 95% para el peso medio de todos los hombres. c. ¿Qué sugieren los resultados acerca del peso medio de 166,3 libras que se utilizaba en 1960 para determinar la capacidad que ofrece seguridad a los pasajeros de las embarcaciones?
VERIFICACIÓN DE REQUISITOS 1. La muestra es aleatoria simple. 2. σ = 26 libras. 3. Con n > 30
a. La media muestral de 172,55 libras es la mejor estimación puntual del peso medio para la población de todos los hombres. b. El nivel de confianza del 0,95 implica que = 0,05, entonces zα/2 = 1,96 𝐸 = 𝑍𝛼 /2.
𝜎 𝑛
𝐸 = 1,96.
26 40
= 8,057
Con 𝑥ҧ = 172,55 y E = 8,057 se construirá el intervalo de confianza: 𝑥ҧ − 𝐸 < 𝜇 < 𝑥ҧ + 𝐸 172,55 − 8,057 < 𝜇 < 172,55 + 8,057 𝟏𝟔𝟒, 𝟒𝟗 < 𝝁 < 𝟏𝟖𝟎, 𝟔𝟏
ഥ Redondeo similar a la 𝒙
c. Con base en el intervalo de confianza, es posible que el peso medio de 166,3 libras que se usaba en 1960 sea el peso medio de los hombres en la actualidad. Sin embargo, la mejor estimación puntual de 172,55 libras sugiere que el peso medio de los hombres ahora es mucho mayor que 166,3 libras.
Determinar qué tan grande debe ser una muestra para poder estimar la media poblacional μ.
𝑍𝛼/2 . σ 𝑛= 𝐸
2
Suponga que queremos estimar la puntuación media del CI de la población de estudiantes de estadística.
¿Cuántos estudiantes de estadística deben seleccionarse al azar para aplicarles pruebas de CI, si queremos tener una confianza del 95% de que la media muestral estará dentro de 3 puntos de CI de la media poblacional? Asimismo, σ = 15.
N.C. = 95% = 0,05 zα/2 = 1,96 E =3 σ = 15
𝑍𝛼 /2σ 𝑛= 𝐸
2
1,96 . 15 𝑛= 3
2
= 96,04 = 97 Redondeo hacia arriba
Entre los miles de estudiantes de estadística, necesitamos obtener una muestra aleatoria simple de al menos 97 de ellos.
Método para estimar una media poblacional cuando no se conoce la desviación estándar σ.
Cuando se desconoce σ, se utiliza la distribución t de Student (en vez de la distribución normal)
La media muestral 𝑥ҧ es la mejor estimación puntual de la media poblacional μ.
Como no conocemos el valor de la desviación estándar poblacional σ, la estimamos con el valor de la desviación estándar muestral s, pero esta introduce otra fuente de baja confiabilidad, especialmente con muestras pequeñas. Para poder mantener el nivel de confianza deseado, como 95%, compensamos esta falta de confianza adicional ampliando el intervalo de confianza. Utilizamos valores críticos t/2 (de una distribución t de Student) que son más grandes que los valores críticos de z/2 de la distribución normal. Primero debemos identificar el número de grados de libertad (gl) que es el número de valores muestrales que pueden variar después de haber impuesto ciertas restricciones a todos los valores de los datos.
Grados de libertad = n-1
Una muestra de tamaño n = 7 es una muestra aleatoria simple seleccionada de una población distribuida normalmente. Calcule el valor crítico t/2 correspondiente a un nivel de confianza del 95%. n =7 gl = n – 1 = 7-1 = 6 Nivel de confianza al 95% = 0,05
t = 2,447 /2
t
0,025
= 2,447
𝑥ҧ − 𝐸 < 𝜇 < 𝑥ҧ + 𝐸 𝑠 𝐸 = 𝑡𝛼/2 . 𝑛
(gl = n – 1) n > 30
μ = Media poblacional 𝑥ҧ = Media muestral Redondeo a una cifra más 𝑠 = Desviación estándar muestral de la media muestral n = Número de valores muestrales E = Margen de error t /2 = puntuación z que separa un área de /2 en la cola derecha de la distribución t.
1. La muestra es aleatoria simple.
2. La muestra proviene de una población con distribución normal o n > 30. 3. No existen valores atípicos y que el histograma tiene una forma que no es muy alejada de la de una distribución normal.
En una muestra de automóviles, se probaron las cantidades de emisiones de óxido de nitrógeno de cada uno (en gramos por milla)
0,06 0,11 0,16 0,15 0,14 0,08 0,15 0,12 0,16 0,08 0,10 0,12 0,11 0,09 0,11 0,12 0,15 0,09 Construya un intervalo de confianza del 98% para la cantidad media de emisiones de óxido de nitrógeno para todos los automóviles considerando que la muestra corresponde a una selección al azar de una población distribuida normalmente.
En una prueba de la eficacia del aceite de oliva para reducir la fricción de cojinetes, 49 cojinetes fueron lubricados con aceite de oliva. El coeficiente de rozamiento fue medido posterior a la lubricación resultando una media de 0,4 µs (coeficiente estático) y una desviación estándar de 21,0 µs. a. Construir un intervalo de confianza del 95% para el cambio medio neto después del tratamiento de lubricación. b. ¿Qué sugiere el intervalo de confianza acerca de la eficacia del aceite de oliva en pruebas de reducción de fricción para cojinetes?
Verificación de requisitos 1. La muestra es aleatoria simple. 2. La muestra proviene de una población con distribución normal o n > 30. (n=49) Nivel de confianza al 95% n = 49 gl = n – 1 = 48 = 0,05 (dos colas) 𝑥ҧ = Media muestral
t = 2,009 /2
(t
0,025
= 2,011)
Interpolando t
𝐸 = 𝑡𝛼 /2.
𝑠 𝑛
𝐸 = 2,011.
21,0
49
= 6,033
𝑥ҧ − 𝐸 < 𝜇 < 𝑥ҧ + 𝐸 0,4 − 6,033 < 𝜇 < 0,4 + 6,033 −5,633 µs < 𝜇 < 6,433µs Redondeo a una cifra más de la media
Con base en los resultados muestrales dados, tenemos una confianza del 95% de que los límites de -5,63 µs y 6,43 µs realmente contienen el valor de μ, la media del coeficiente estático para pruebas de fricción en cojinetes.
Como los límites del intervalo de confianza contienen el valor de 0, es muy posible que la media del coeficiente estático para pruebas de fricción sea igual a 0, lo que sugiere que el tratamiento con aceite no facilita los niveles de fricción en cojinetes.
Para determinar el tamaño de muestra que se necesita para estimar una media poblacional. Requiere determinar el tamaño de la muestra necesario para estimar una media poblacional, utilice el procedimiento que se describe en la estimación de la desviación estándar poblacional (σ) conocida.
La media muestral 𝑥ҧ es el valor intermedio de estos límites; el margen de error E es la mitad de la diferencia ഥ + E y el entre esos límites (ya que el límite superior es 𝒙 ഥ - E, y la distancia que los separa es 2E). límite inferior es 𝒙 Estimación puntal de μ: 𝐿í𝑚𝑖𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 + (𝐿í𝑚𝑖𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟) 𝑥ҧ = 2
Margen de error: 𝐸=
𝐿í𝑚𝑖𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − (𝐿í𝑚𝑖𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟) 2
Los pesos de la basura desechada proveniente de una muestra de 62 hogares. La siguiente pantalla de la calculadora TI-83/84 Plus es el resultado desplegado al considerar 62 cantidades de pesos totales (en libras) para construir un intervalo de confianza del 95% para el peso medio de la basura desechada por la población de todos los hogares. Utilice el intervalo de confianza de la pantalla para calcular los valores de la mejor estimación puntual 𝑥ҧ y del margen de error E.
Estimación puntal de μ: 𝑥ҧ =
𝐿í𝑚𝑖𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 + (𝐿í𝑚𝑖𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟) 2
30,607 + 24,28 𝑥ҧ = = 27,444 2
Margen de error: 𝐸=
𝐿í𝑚𝑖𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − (𝐿í𝑚𝑖𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟) 2
30,607 − 24,28 𝐸= = 3,164 𝑙𝑏 2
Se redondean a tres decimales, que es un espacio decimal adicional más de los dos lugares decimales utilizados
Métodos
Condiciones
Utilice la distribución normal (z).
σ conocida y población distribuida normalmente o σ conocida y n > 30
Utilice la distribución t.
σ desconocida y población distribuida normalmente o σ desconocida y n > 30
Utilice un método no La población no está distribuida normalmente y n ≤ paramétrico o bootstrap. 30. Criterios para decidir si la población está distribuida normalmente: La población no necesita ser exactamente normal, pero debe tener una apariencia un tanto simétrica, con una moda y sin valores atípicos. Tamaño de la muestra n > 30: Este es un lineamiento que se usa regularmente, pero tamaños de muestra de 15 a 30 son adecuados si la población parece tener una distribución normal y no existen valores atípicos.
Usted planea construir un intervalo de confianza para la media poblacional μ. Utilice los datos para determinar si el margen de error E debe calcularse utilizando un valor crítico de z/2 (de la distribución normal), un valor crítico de t/2 (de la distribución t) o ninguno de estos.
a.
n = 9, 𝑥ҧ = 75, s = 15 La población tiene una distribución normal.
b.
n = 5, 𝑥ҧ = 20, s = 2 y la población tiene una distribución muy sesgada.
c.
n = 12, 𝑥ҧ = 98,6, σ = 0,6 La población tiene una distribución normal.
d.
n = 75, 𝑥ҧ = 98,6, σ= 0,6 La población tiene una distribución sesgada.
e.
n = 75, 𝑥ҧ = 98,6, s = 0,6 La población tiene una distribución sesgada.
a. Puesto que la desviación estándar poblacional σ no se conoce y la población está distribuida normalmente, el margen de error se calcula usando t/2 b. Puesto que la muestra es pequeña (n ≤ 30) y la población no tiene una distribución normal, el margen de error E no se debe calcular usando un valor crítico de z/2 o t/2 por ello no se puede aplicar lo estudiado. c. Puesto que se conoce σ y la población tiene una distribución normal, el margen de error se calcula usando z/2. d. Como la muestra es grande (n > 30) y se conoce σ, el margen de error se calcula usando z/2. e. Como la muestra es grande (n > 30) y se desconoce σ, el margen de error se calcula usando t/2 .
¿ Qué aprendí ?
¿ Para qué aprendí ?
¿ Cómo aprendí ?
¿ Qué me falta aprender ?