Estadistica 2 Unidad 1

  • June 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Estadistica 2 Unidad 1 as PDF for free.

More details

  • Words: 3,616
  • Pages: 17
FÓRMULAS-FUNCIONES

PRUEBA DE HIPÓTESIS-FÓRMULAS Para probar la hipótesis se calcula el estadístico de prueba Z y se compara con los valores críticos de Z. A. PRIMERA SITUACIÓN. Solamente se cuenta con los valores X, μH, σ o s y n. 1. El valor Z para probar la hipótesis cuando σ es conocido: Z = (X- μH)⁄(σ/√n) En donde: X es la media muestral. μH es el valor de la media poblacional bajo la hipótesis nula. σ√n es el error estándar de la distribución muestral. 2. El valor Z utilizado para probar la hipótesis cuando σ es desconocida: Cuando σ es desconocida, se utiliza la desviación estándar muestral y Z se vuelve. Z = (X- μH)⁄(s/√n) En donde s es la desviación estándar muestral. B. SEGUNDA SITUACIÓN. Solamente se toman en cuenta los valores X, σ o s y n. C. TERCERA SITUACIÓN. Solamente se cuenta con la tabla muestral.

PRUEBA DE HIPOTESIS-FUNCIONES

A

Para probar la hipótesis, ya sea con σ conocido o con s, se utilizan las funciones NORMALIZACION, DISTR.NORM.ESTAND y DISTR.NORM.ESTAND.INV . 1. Ir a la Etiqueta Fórmulas  Grupo Biblioteca de funciones  Más funciones  Estadísticas  NORMALIZACIÓN.

1

2. Su sintaxis es =NORMALIZACION(x, media, desv_estándar), donde el argumento x es el valor que se desea normalizar (la media muestral), el argumento media es la media aritmética de la distribución (valor de la media poblacional bajo la hipótesis nula) y el argumento desv_estándar es la desviación estándar de la distribución (dividida entre la raíz cuadrada del tamaño de la muestra) 3. EJEMPLO. Un embotellador de refrescos de cola debe determinar si el peso promedio de sus envases es de 16 onzas (μ = 16 onzas). Debido a que se plantea la hipótesis de que μ = 16 onzas, la hipótesis nula y la alternativa son: H0: μ = 16 H1: μ ≠ 16 Si el embotellador selecciona una muestra de n = 50 envases, con una media de X = 16.375 onzas y una desviación estándar de s = 0.866 onzas, calcular el valor de Z. ✔ Solución: a. En el cuadro de diálogo Argumentos de función ingresar: * En la ventana x el valor de la media muestral: 16.375 * En la ventana media el valor de la hipótesis nula: 16 * En la ventana desv_estándar el valor de s dividido entre raíz cuadrada de n: .866/raíz(50) * Dar clic en Aceptar. * El resultado de la fórmula se muestra en la parte inferior del cuadro de diálogo: 2.9149

2

b. La regla empírica dice que el 95% de las X en la distribución de muestreo están a 1.96 errores estándar de la media poblacional y se calcula así: α = 1.00 – (0.05/2) = 0.975 Ir a la Etiqueta Fórmulas DISTR.NORM.ESTAND.INV.



Más

funciones



Estadísticas



En la ventana Probabilidad, ingresar el valor 0.975 o la referencia a la columna y celda que contiene el dato. El resultado es: 1.959963 por lo tanto 1.96 Estos valores de Z ± 1.96 son valores críticos que determinan las zonas de rechazo. Por lo tanto, el criterio de decisión es: Se acepta la hipótesis nula si – 1.96 ≤ Z ≤ 1.96. Se rechaza si Z < – 1.96 o Z > 1.96 c. Como Z = 2.91 > 1.96, se rechaza la hipótesis nula con un nivel de significancia de 5% d. El porcentaje correspondiente al valor Z se calcula mediante la función DIST.NORM.ESTAND cuya sintaxis es =DISTR.NORM.ESTAND(Z) donde el argumento Z es el valor cuya distribución se desea obtener (2.91). e. En el cuadro de diálogo Argumentos de función insertar la referencia a la celda donde se hizo el primer cálculo, en este ejemplo A1.

3

* Dar clic en Aceptar. * El resultado de la fórmula se muestra en la parte inferior del cuadro de diálogo: 0.9982 es decir, el 99.82% de probabilidad de que μ ≠ 16.

B

Para probar la hipótesis, tomando solamente en cuenta los valores X, σ o s y n, se utilizan las funciones NORMALIZACION y DISTR.NORM.ESTAND

1. Este procedimiento consiste en calcular la diferencia entre X y μH y luego proceder a resolver el problema. 2. Tomando el mismo ejemplo desarrollado en el apartado anterior tenemos: X – μH: 16.357 – 16 = 0.357 a. Para la función NORMALIZACIÓN, en el cuadro de diálogo Argumentos de función ingresar: * En la ventana x el valor de la media muestral: .375 * En la ventana media el valor de la hipótesis nula: 0 * En la ventana desv_estándar el valor de s dividido entre raíz cuadrada de n: .866/raíz(50) * Dar clic en Aceptar. * El resultado de la fórmula se muestra en la parte inferior del cuadro de diálogo: 2.9149 b. Para la función DISTR.NORM.ESTAND, repetir el paso (d) del apartado anterior. c. Para el nivel de significancia (DISTR.NORM.ESTAND.INV), repetir el paso b del apartado anterior. 4

C

Para probar la hipótesis, cuando solamente en cuenta con la tabla muestral, se recurre a Análisis de datos  Regresión y la función DISTR.T.INV. 1. EJEMPLO. Cierta línea aérea considera que existe una relación directa entre los gastos publicitarios y el número de pasajeros que eligen viajar por su compañía. Para determinar si existe dicha relación, y de ser así cuál podría ser exactamente, la empresa ha decidido llevar a cabo un estudio aplicando el método de los mínimos cuadrados. Se cuenta con una serie histórica mensual de gastos de publicidad y el número de pasajeros para n = 15 últimos meses. Los datos aparecen en la tabla siguiente. Los pasajeros están representados por la variable Y porque se supone que dependen de la publicidad y las cifras son en miles. ME S 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

PUBLICIDA D (X) 10 12 8 17 10 15 10 14 19 10 11 13 16 10 12

✔ Solución: 5

PASAJERO S (Y) 15 17 13 23 16 21 14 20 24 17 16 18 23 15 16

Obviamente, lo primero es ingresar los datos en una hoja de Excel en el rango A1:C16. a. Ir a la Etiqueta Datos  Grupo Análisis  Análisis de datos  Regresión  Aceptar, para abrir el cuadro de diálogo.

b. Ingresar los datos siguientes: * En la ventana Rango Y de entrada: C1:C16 * En la ventana Rango X de entrada: B1:B16 * Activar la casilla Rótulos. * Dejar activada la opción En una hoja nueva. *Dar clic en Aceptar.

6

 INTERPRETACION * La celda B4 (Coeficiente de correlación) muestra que existe una relación positiva entre el número de pasajeros y los gastos de publicidad en un 96.84% * La celda B5 (Coeficiente de determinación R^2) muestra que el 93.78% del cambio en el número de pasajeros se explica mediante el cambio en los gastos de publicidad. * La celda B7 (Error típico o Error estándar Se) determina el grado de confianza y muestra que el número de pasajeros estará entre el valor estimado ± Se. Se expresa en la unidad de medida del valor de Y, en este caso miles: 0.907 = 907 pasajeros. * La celda B17 (Intercepción) muestra el valor de a. 7

* La celda B18 (PUBLICIDAD (X)) muestra el valor de b. * La celda D18 (Estadístico t para PUBLICIDAD (X)) representa la prueba del parámetro poblacional. Por ejemplo: si α = 5%: t0.05,13 = 2.160 (tabla de distribución t: columna 0.975, fila 13), el criterio de decisión podría ser: Rechazar hipótesis nula si t > 2.160, para esto: H0: β1 = 0 H1: β1 ≠ 0 El valor α se calcula mediante la función DISTR.T.INV cuyos argumentos son: Probabilidad: en este caso 0.05 Grados de libertad: en este caso 13.

La interpretación es: * Como t (13.995) > α (2.160) se rechaza H0 lo que indica que existe una relación entre la publicidad y el número de pasajeros. * En caso de aceptar H0 estaríamos concluyendo que no existe relación entre la publicidad y el número de pasajeros.

EJERCICIOS 1. Como gerente de compras de una empresa, debe decidir si actualiza o no las computadoras de su departamento. Le han dicho que el costo promedio de las computadoras es de US $ 2100. Una muestra entre 64 minoristas revela un precio promedio de US $ 2251 con una desviación estándar de US $ 812. Con base en un nivel de significancia de 5% ¿cree que su información es correcta? a. Defina el juego de hipótesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. 8

d. Defina la regla de decisión. e. Explique qué significado tiene la distribución normal estándar en este ejercicio. f. ¿Qué acción recomienda? 2. Cuando regresaron de las minas a su casa, los siete enanos le dijeron a Blancanieves que extrajeron un promedio semanal de 12 toneladas de oro. No estando dispuesta a creer dicha afirmación sin prueba alguna, la señorita Nieves recopiló datos durante 49 semanas encontrando una media de 11.5 toneladas y una desviación estándar de 1.1 toneladas. Con un nivel de significancia de 10% ¿cree usted que los enanos están en lo correcto? a. Defina el juego de hipótesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. d. Defina la regla de decisión. e. Explique qué significado tiene la distribución normal estándar en este ejercicio. f. ¿Qué acción recomienda? 3. Debido al excesivo tiempo que se invierte en trasladarse hasta la fábrica, el departamento en donde usted trabaja está considerando modificar los horarios de labores. El jefe considera que los empleados invierten un promedio de 50 minutos para llegar al trabajo. Setenta empleados se toman en promedio 47.2 minutos con una desviación estándar de 18.9 minutos. Fije α en 1% y compruebe la hipótesis. a. Defina el juego de hipótesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. d. Defina la regla de decisión. e. Explique qué significado tiene la distribución normal estándar en este ejercicio. f. ¿Qué acción recomienda? 9

4. Un supermercado local gastó miles de pesos en la remodelación de su local. Aunque el cierre temporal alejó a los clientes, el gerente espera que éstos regresen y disfruten de las nuevas comodidades. Antes de remodelar, la facturación del supermercado era de $ 325,330 semanalmente. Ahora que se ha terminado la remodelación, el gerente tomó una muestra de 36 semanas para ver si de alguna manera el cierre temporal afectó el negocio. Se reportó una media de $ 341,660 y una desviación estándar de $ 129,550. A un nivel de significancia de 1% ¿qué puede decidir el gerente? a. Defina el juego de hipótesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. d. Defina la regla de decisión. e. Explique qué significado tiene la distribución normal estándar en este ejercicio. f. ¿Qué acción recomienda? 5. Una empresa de comida rápida tiene contemplado eliminar del menú la línea de pollo frito. El argumento es que los ingresos han descendido por debajo de la media de $ 4500 que se tenía en el pasado. ¿Será esta una decisión razonable si 144 observaciones revelan una media de $ 4477 y una desviación estándar de $ 1228? La gerencia está dispuesta a aceptar una probabilidad del 2% si se comete el Error tipo I. a. Defina el juego de hipótesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. d. Defina la regla de decisión. e. Explique qué significado tiene la distribución normal estándar en este ejercicio. f. ¿Qué acción recomienda? 6. Como supervisor de producción, su responsabilidad es garantizar que las bolsas con semillas de pasto que produce la empresa pesen en promedio 25 kilos. Preocupado por el hecho de que no se cumpla con esta especificación, usted selecciona 25 bolsas y encuentra una media de 23.8 kilos con una 10

desviación estándar de 6.6 kilos. ¿Deberá ordenar parar la línea de empaque y se hagan los ajustes en el proceso de llenado? Para minimizar un Error tipo I fije el valor de α en 1% a. Defina el juego de hipótesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. d. Defina la regla de decisión. e. Explique qué significado tiene la distribución normal estándar en este ejercicio. f. ¿Qué acción recomienda? 7. Usted acaba de ser contratado como asistente de gerencia para un fabricante de partes para computadora. En su primer día de trabajo, usted necesita supervisar el tiempo requerido para elaborar una parte determinada que se supone toma un tiempo promedio de 15 minutos. Su supervisor inmediato está preocupado porque la contratación de trabajadores no entrenados ha incrementado el tiempo de elaboración de una parte por encima de los 15 minutos fijados. Usted toma una muestra de 20 trabajadores y encuentra una media de 17.3 minutos y s = 1.9 minutos. A una valor α de 1% ¿qué le informará a su superior? a. Defina el juego de hipótesis b. Defina el nivel de significancia. c. Aplique cualquiera de los dos métodos (tomando en cuenta μH o tomando solamente en cuenta la diferencia entre las medias) para calcular el valor Z. d. Defina la regla de decisión. e. Explique qué significado tiene la distribución normal estándar en este ejercicio. f. ¿Qué acción recomienda? 8. Una empresa produce autopartes que se utilizan en los tractocamiones. El gerente de finanzas desea desarrollar un modelo de regresión que pueda utilizarse para predecir los costos. Seleccionó unidades producidas como una variable de predicción y recolectó los siguientes datos (en miles).

11

UNIDADE S 12.3 8.3 6.5 4.8 14.6 14.6 14.6 6.5

COSTO 6.2 5.3 4.1 4.4 5.2 4.8 5.9 4.2

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre los costos y las unidades producidas? ¿En qué porcentaje se explica el cambio en los costos mediante el cambio en las unidades producidas? b. Calcule el valor α para la prueba de parámetro poblacional al 5%. c. Si el criterio de decisión fuese: No rechazar H0 si t está entre ± α ¿qué decisión debe tomarse? d. ¿Qué puede decirnos el gerente acerca de la relación entre unidades producidas y su costo?

9. La siguiente tabla contiene información de una empresa dedicada a la venta de una conocida marca de cerveza. Su producto principal es el envase de cristal de 250 cc., al que corresponden estos datos: VENT AS miles 120 115 130 142 148 144 165 160 175 180

PUBLICID AD miles 8 9 10 14 12 16 20 22 26 24

12

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre las ventas y la publicidad? ¿En qué porcentaje se explica el cambio en las ventas mediante el cambio en los gastos de publicidad? b. Calcule el valor α para la prueba de parámetro poblacional al 5%. c. Si el criterio de decisión fuese: No rechazar H 0 si t está entre ± α ¿qué decisión debe tomarse? d. ¿Qué podemos inferir acerca de la relación entre los gastos de publicidad y las ventas? 10. Un hipermercado ha decidido ampliar el negocio. Decide estudiar de forma exhaustiva el número de cajas registradoras que va a instalar, para evitar grandes colas. Para ello, se obtuvieron los siguientes datos procedentes de otros establecimientos similares acerca del número de cajas registradoras y del tiempo medio de espera.

No CAJAS 10 12 14 12 18 20

T. ESPERA 59 51 42 32 26 22

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre el número de cajas y el tiempo medio de espera? ¿En qué porcentaje se explica el cambio en el número de cajas mediante el cambio en el tiempo de espera? b. Calcule el valor α para la prueba de parámetro poblacional al 5%. c. Si el criterio de decisión fuese: No rechazar H 0 si t está entre ± α ¿qué decisión debe tomarse? d. ¿Qué podemos inferir acerca de la relación entre el número de cajas y el tiempo medio de espera? 11. Una compañía de seguros considera que el número de vehículos que circulan por una determinada autopista a más de 120 km/hr, puede explicarse en función del número de accidentes que ocurren en ella. Durante 5 días obtuvieron los siguientes resultados: 13

ACCIDEN TES 5 7 2 1 9

VEHICUL OS 15 18 10 8 20

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre el número de vehículos y el número de accidentes? ¿En qué porcentaje se explica el cambio en el número de vehículos mediante el cambio en los accidentes? b. Calcule el valor α para la prueba de parámetro poblacional al 5%. c. Si el criterio de decisión fuese: No rechazar H 0 si t está entre ± α ¿qué decisión debe tomarse? d. ¿Qué podemos inferir acerca de la relación entre el número de vehículos y el número de accidentes? 12. Una empresa de manufacturas basa las predicciones de sus ventas anuales en los resultados oficiales de la demanda total en la industria. A continuación se dan los datos de demanda total y las ventas efectuadas por la empresa en los últimos 11 años.

DEMAN VENT DA AS 200 9 220 6 400 12 330 7 210 5 390 10 280 8 140 4 280 7 14

290 380

10 14

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre las ventas y la demanda? ¿En qué porcentaje se explica el cambio en las ventas mediante el cambio en la demanda? b. Calcule el valor α para la prueba de parámetro poblacional al 5%. c. Si el criterio de decisión fuese: No rechazar H 0 si t está entre ± α ¿qué decisión debe tomarse? d. ¿Qué podemos inferir acerca de la relación entre las ventas y la demanda? 13. La tabla registra el número de días que han transcurrido desde que se ha detectado un nuevo virus informático y el número de ordenadores infectados en un país.

DIAS 1 2 4 5 8 10 11 14 16 20

PC INFEC 255 1500 2105 5050 16300 45320 58570 375800 1525640 2577000

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre las PC infectadas y los días transcurridos? ¿En qué porcentaje se explica el cambio en las PC infectadas mediante el cambio en los días transcurridos? b. Calcule el valor α para la prueba de parámetro poblacional al 5%. c. Si el criterio de decisión fuese: No rechazar H 0 si t está entre ± α ¿qué decisión debe tomarse?

15

d. ¿Qué podemos inferir acerca de la relación entre las PC infectadas y los días transcurridos? 14. Se desea estudiar la posible relación entre los gastos en material informático de una empresa y sus ingresos globales. Para ello se recoge una muestra de datos anuales de gastos e ingresos de 7 empresas, los datos muestrales son los de la tabla adjunta. INGRESO S 20 50 100 200 300 400 500

GASTOS 25 15 25 57 75 91 121

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre los gastos y los ingresos ¿En qué porcentaje se explica el cambio en los gastos mediante el cambio en los ingresos? b. Calcule el valor α para la prueba de parámetro poblacional al 5%. c. Si el criterio de decisión fuese: No rechazar H 0 si t está entre ± α ¿qué decisión debe tomarse? d. ¿Qué podemos inferir acerca de la relación entre los gastos y los ingresos? 15. Un analista financiero está preparando un estudio acerca del comportamiento del consumidor. Recopiló los datos que aparecen en la tabla para determinar si existe una relación entre el ingreso del consumidor y los niveles de consumo.

INGRESO 24 12

CONSUM O 16 8

16

31 28 35 10 23 10 8 15 14 15

15 17 24 11 15 7 3 11 10 9

a. Calcule e interprete el modelo de regresión (el rango de salida debe ser en la misma hoja). ¿Cuál es el porcentaje de relación entre los ingresos y el consumo ¿En qué porcentaje se explica el cambio en el consumo mediante el cambio en los ingresos? b. Calcule el valor α para la prueba de parámetro poblacional al 5%. c. Si el criterio de decisión fuese: No rechazar H 0 si t está entre ± α ¿qué decisión debe tomarse? d. ¿Qué podemos inferir acerca de la relación entre el consumo y los ingresos?

17

Related Documents