333470730-estadistica-2escrito.docx

  • Uploaded by: Gabriel Medina
  • 0
  • 0
  • November 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View 333470730-estadistica-2escrito.docx as PDF for free.

More details

  • Words: 6,897
  • Pages: 42
FALCON NUÑEZ CLAUDIA SIKARU FRANCO ROBLES PAMELA PREN FRAGOSO NANCY ITZEL UGALDE MARINEZ NATALY VALDES ALEMAN ANDREA SOFIA VENTURA CORONADO MICHEL Prof. JORGE ARTURO RIVERO MARBAN LIC. EN MERCADOTECNIA 3er. CUATRIMESTRE ESTADISTICA II

OBJETIVOS

• Entender los conceptos de estimación puntual y estimación por intervalos. • Calcular las estimaciones para la media poblacional, tanto en el caso en que la desviación estándar poblacional sea conocida como en el caso de que sea desconocida. • Calcular las estimaciones (puntuales y por intervalos) para la probabilidad de éxito de una binomial. • Saber interpretar correctamente los resultados de las estimaciones por intervalos.

INTRODUCCION

En esta investigación, se pretende conocer y saber calcular las estimaciones puntuales y por intervalo para la media –ya sea conocida o no la desviación estándar poblacional-, así como las estimaciones para la probabilidad de éxito en una binomial. En el caso en que conozcamos todos los elementos de una población, es sencillo calcular todos los parámetros asociados; sin embargo, en la mayoría de casos no será así, y necesitaremos estimar algunos de ellos a partir de los parámetros de la muestra.

INDICE

3. ESTMACION PUNTUAL 3.1 Estimulación puntual y por intervalos 3.2 Propiedades de los estimadores puntuales 3.3 Estimación de intervalos de confianza para medias y diferencias de medias 3.4 Estimación de intervalos de confianza para proporciones y diferencias de proporciones 3.5 Estimación de intervalos de confianza para varianzas y diferencias de varianzas

4. PRUEBAS DE HIPOTESIS 4.1 Elementos de una prueba de hipótesis 4.2 Errores tipo I y tipo II 4.3 Pruebas de hipótesis sobre medias y diferencia de medias en muestras pequeñas y grandes 4.4 Pruebas de hipótesis sobre proporciones y diferencias de proporciones en muestras pequeñas y grandes 4.5 Pruebas de hipótesis sobre desviación estándar

ESTIMULACIÓN PUNTUAL Y POR INTERVALOS

Estimación puntual Una estimación puntual del valor de un parámetro poblacional desconocido (como puede ser la media µ , o la desviación estándar σ ), es un número que se utiliza para aproximar el verdadero valor de dicho parámetro poblacional. A fin de realizar tal estimación, tomaremos una muestra de la población y calcularemos el parámetro muestral asociado ( x para la media, s para la desviación estándar, etc.). El valor de este parámetro muestral será la estimación puntual del parámetro poblacional. Por ejemplo, supongamos que la compañía Sonytron desea estimar la edad media de los compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores y calculan la media de esta muestra, este valor será un estimador puntual de la media de la población. ¿Qué propiedades debe cumplir todo buen estimador? Insesgado: Un estimador es insesgado cuando la media de su distribución muestral asociada coincide con la media de la población. Esto ocurre, por ejemplo, con el estimador x , ya que µ x = µ y con estimador p´ ya que p µ p′ = • De varianza mínima: La variabilidad de un estimador viene determinada por el cuadrado de su desviación estándar. En el caso del estimador x , su desviación estándar es n x σ = σ , también llamada error estándar de µ . En el caso del error estándar de p´, n pp p ´*(1− ´) σ ′ = Observar que cuanto mayor sea el tamaño de la muestra n , menor será la variabilidad del estimador x y de p´, por tanto, mejor serán nuestras estimaciones.

Estimación por intervalo Dada una población X, que sigue una distribución cualquiera con media µ y desviación estándar σ. 1. Sabemos (por el TCL) que, para valores grandes de n , la media muestral x sigue una distribución aproximadamente normal con media µ x = µ y desviación estándar n x σ = σ . 2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribución normal, aproximadamente un 95% de los datos estaban situados a una distancia inferior a dos desviaciones estándar de la media. De lo anterior se deduce que: ( − 2 < < + 2 ) = 0,95 x x P µ σ x µ σ , 0,95 ( 2 ) ( 2 ) ( 2 ) ( 2 ) x x x x = P x < µ + σ − P x < µ − σ = P µ > x − σ − P µ > x + σ( − 2 < < + 2 ) = 0,95 x x Pxσµxσ Por tanto, ésta última fórmula nos da un intervalo de valores tal que la probabilidad de que la media de la población µ esté contenida en él es de 0,95. Este tipo de intervalos se llaman intervalos de confianza de un parámetro poblacional. El nivel de confianza (1 - α) del intervalo es la probabilidad de que éste contenga al parámetro poblacional. En el ejemplo anterior, el nivel de confianza era del 95% (α = 0,05).

PROPIEDADES DE LOS ESTIMADORES PUNTUALES Por lo tanto, el valor esperado, o media, de todos los posibles valores de un estadístico muestral insesgado es igual al parámetro poblacional que se estudia. Eficiencia: Se dice que el estimador puntual con menor error estándar tiene mas por eficiencia relativa que los otros. Cuando se muestrean poblaciones normales, el error estándar de la media muestral es menor que el error estándar de la mediana muestral. Por tanto, la media muestral es más eficiente que la mediana muestral. Consistencia: Un estimador puntual es consistente si el valer del estimador puntual tiende a estar más cerca del parámetro poblacional a medida que el tamaño de la muestra aumenta. En otras palabras, una muestra grande tiende a proporcionar mejor estimación puntual que una pequeña.

Estimación de intervalos de confianza para medias y diferencias de medias La estadística inferencial es el proceso de uso de los resultados derivados de las muestras para obtener conclusiones acerca de las características de una población. La estadística inferencial nos permite estimar características desconocidas como la media de la población o la proporción de la población. Existen dos tipos de estimaciones usadas para estimar los parámetros de la población: la estimación puntual y la estimación de intervalo. Una estimación puntual es el valor de un solo estadístico de muestra. Una estimación del intervalo de confianza es un rango de números, llamado intervalo, construido alrededor de la estimación puntual. El intervalo de confianza se construye de manera que la probabilidad del parámetro de la población se localice en algún lugar dentro del intervalo conocido. Suponga que quiere estimar la media de todos los alumnos en su universidad.

Sin embargo, la media de la muestra puede variar de una muestra a otra porque depende de los elementos seleccionados en la muestra. Tomando en cuenta la variabilidad de muestra a muestra, se aprenderá a desarrollar la estimación del intervalo para la media poblacional.

Estimación del intervalo de confianza para la media

Se emplea la siguiente fórmula:

Dónde: Z = valor crítico de la distribución normal estandarizada Se llama valor crítico al valor de Z necesario para construir un intervalo de confianza para la distribución. El 95% de confianza corresponde a un valor ( de 0,05. El valor crítico Z correspondiente al área acumulativa de 0,975 es 1,96 porque hay 0,025 en la cola superior de la distribución y el área acumulativa menor a Z = 1,96 es 0,975. Un nivel de confianza del 95% lleva a un valor Z de 1,96.

El valor de Z es aproximadamente 2,58 porque el área de la cola alta es 0,005 y el área acumulativa menor a Z = 2,58 es 0,995.

Ejemplo

Estimación de intervalo de confianza para la media

Antes de seguir continuando es necesario estudiar la distribución t de Student, por lo que a continuación se presenta una breve explicación de esta distribución. Al comenzar el siglo XX, un especialista en Estadística de la GuinnessBreweries en Irlanda llamado William S. Gosset deseaba hacer inferencias acerca de la media cuando la fuera desconocida. Como a los empleados de Guinness no se les permitía publicar el trabajo de investigación bajo sus propios nombres, Gosset adoptó el seudónimo de "Student". La distribución que desarrolló se conoce como la distribución t de Student.

Si la variable aleatoria X se distribuye normalmente, entonces el siguiente estadístico tiene una distribución t con n - 1 grados de libertad.

Esta expresión tiene la misma forma que el estadístico Z en la ecuación para la distribución muestral de la media con la excepción de que S se usa para estimar la desconocida. Entre las principales propiedades de la distribución t se tiene: En apariencia, la distribución t es muy similar a la distribución normal estandarizada. Ambas distribuciones tienen forma de campana. Sin embargo, la distribución t tiene mayor área en los extremos y menor en el centro, a diferencia de la distribución normal.

Los grados de libertad de esta distribución se calculan con la siguiente fórmula

Donde n = tamaño de la muestra Ejemplo: Imagínese una clase con 40 sillas vacías, cada uno elige un asiento de los que están vacíos. Naturalmente el primer alumno podrá elegir de entre 40 sillas, el segundo de entre 39, y así el número irá disminuyendo hasta que llegue el último alumno. En este punto no hay otra elección (grado de libertad) y

aquel último estudiante simplemente se sentará en la silla que queda. De este modo, los 40 alumnos tienen 39 o n-1 grados de libertad.

Estimación El objetivo principal de la estadística inferencial es la estima estimación, esto es que mediante el estudio de una muestra de una población se quiere generalizar las conclusiones hacia el total de dicha población. Como vimos en la sección anterior, los estadísticos pueden variar mucho dentro de sus distribuciones muestrales. Mientras menor sea el error estándar de un estadístico, más cercanos serán sus valores. El Error estandard podríamos expresarlo conceptualmente como el error que se puede cometer al intentar conocer a una población por medio de una muestra tomada de dicha población. Existen dos tipos de estimaciones para parámetros; puntuales puntuales y por intervalo: •

Una estimación puntual n puntual es un único valor estadístico y se usa para estimar un parámetro. El estadístico usado se denomina estimador.



Una estimación por intervalo n por intervalo es un rango, generalmente de ancho finito, que se espera que contenga el parámetro. Estimación por Intervalos n por Intervalos.

Un estimado puntual, por ser un sólo número, no proporciona por sí mismo información alguna sobre la precisión y confiabilidad de la estimación. Por ejemplo, imagine que se usa la media de una muestra para estimar (estimador puntual) la resistencia real a la ruptura de toallas de papel de cierta marca y suponga que = 9322.7.Debido a la variabilidad de la muestra, casi nunca se tendrá el caso de que= μ. El estimador puntual nada dice sobre lo cercano que esta de μ. Una alternativa para reportar el valor del parámetro que

se esté estimando es calcular un intervalo de valores factibles, es decir un límite de confianza o mite de confianza o intervalo de confianza intervalo de confianza (IC). X Un intervalo de confianza intervalo de confianza se calcula siempre seleccionando primero un nivel de confianza nivel de confianza, que es una medida del grado de confiabilidad en el intervalo. Entonces, en el ejemplo anterior, si queremos un nivel de confianza de 95% diríamos que es posible tener cualquier valor de mentre 9162.5 y 9482.9. Un nivel de confianza de 95% implica que 95% de las muestras daría lugar a un intervalo que incluye m o cualquier otro parámetro que se esté estimando, y sólo 5% de las muestras producirá un intervalo erróneo. Cuanto mayor sea el nivel de confianza podremos creer que el valor del parámetro que se estima está dentro del intervalo. Si, por ejemplo, queremos tener un nivel de confianza de 95% (locual es muy común), entonces usamos la distribución normal estándar y encontramos los valores que incluyen a 95% del área.

Intervalos de confianza para la media

Supongamos que la estatura de los niños de 2 años está distribuida normalmente con una media de 90 cm y una desviación estándar de 36 cm. ¿Cuál sería la distribución muestral de la media para una muestra de tamaño 9? Recordemos que la media de una distribución muestral de medias es igual a μ:

Y el error estándares:

Para nuestro ejemplo, la distribución muestral de la media tendría una media de 90 y una desviación estándar de 36/3 = 12. Recordemos que la desviación estándar de una distribución muestral es igual al error estándar.

La siguiente figura muestra esta distribución en donde el área:

Sombreada representa el 95% del total, encontrándose entre los valores de 66.48 y 113.52. Estos límites fueron calculados añadiendo y restando 1.96 desviaciones estándar del valor de la media de 90, lo que equivale al 95% del área bajo una curva normal estándar, es decir:

Lo que nos muestra la figura es que 95% de las medias se encontrarían a no más de 23.52 de la media de 90 (o sea a 1.96 desviaciones estándar). Ahora si consideramos la probabilidad de que la media de una muestraaleatoria se encuentre a cierta distancia de la media de la población,entonces podemos decir que como 95% de la distribución está a 23.5 de 90, la probabilidad de que la media de cualquier muestra esté a 23.52 de 90 es de 0.95. Lo anterior significa que si calculamos repetidamente la media de una muestral, y consideramos un intervalo que vaya de- 23.52 a + 23.52, este intervalo contendrá a la media de la población 95% de las veces. En general, podemos calcular el intervalo deconfianza con la siguiente fórmula:

Donde z es el valor de la curva estandar normal para la confianza que se requiere. En el caso de 95% de confianza:

De esta fórmula se puede observar que tanto el tamaño de la muestra como el valor de σ se deben conocer. Z se puede obtener de la tabla de la distribución normal a partir del nivel de confianza establecido. Como en muchas ocasiones se desconoce σ en esos casos lo correcto es utilizar otra distribución para muestras (la llamada “t”destudent que veremos en la siguiente sesión) si la población de donde provienen los datos es normal. En este caso se puede utilizar una estimación puntual de la desviación estándar de la población por medio de la desviación estándar de la muestra, es decir (σ ~ s). Ejemplos:

1. Se encuentra que la concentración promedio de zinc de una muestra de 36 cereales es de 2.6 gramos por miligramo. Encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc en el cereal. Suponga que la desviación estándar de la población es 0.3. Solución: La estimación puntual de μ es x = 2.6 (el valor de la media de la muestra). El valor de z para un nivel de confianza del 95% es 1.96, por lo tanto:

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo será más amplio:

2. Los vuelos de una empresa de aviación tienen una duración bimestral aproximadamente distribuida de forma normal con una desviación estándar de 40 horas. Si una muestra de 30 vuelos tiene una duración promedio de 780 horas, encuentre los intervalos de confianza de 96% para la media de la población de todos los vuelos de esta empresa.

Con un nivel de confianza del 96% se sabe que la duración media de losvuelos está entre 765 y 795 horas.

ESTIMACIÓN DE INTERVALOS DE CONFIANZA PARA PROPORCIONES Y DIFERENCIAS DE PROPORCIONES Un estimador puntual de la proporción P en un experimento binomial está dado por la estadística P=X/N, donde X representa el número de éxitos en N pruebas. Por tanto, la proporción de la muestra p=x/n se utilizará como estimador puntual del parámetro P. Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se puede establecer un intervalo de confianza para P alconsiderar la distribución muestral de proporciones.

Considerando el valor z para la distribución de proporciones

Si intentamos despejar el valor de P nos encontramos con que :

Pero ¿cómo podemos encontrar P si también está del lado derecho de la ecuación? Lo que haremos es aproximar la proporción de la población por la de la muestra, es decir sustituir P por la proporción de la muestra p siempre y cuando el tamaño de muestra no sea pequeño.

Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el procedimiento del intervalo de confianza que se establece aquí no es confiable ya que realmente se debería emplear la distribución binomial, por tanto, no se debe utilizar. Para estar seguros, se debe requerir que np y n(1-p) sea mayor o igual a 5. El error de estimación será la diferencia absoluta entre p y P, y podemos tener el nivel de confianza de que esta diferencia noexcederá el valor de

Ejemplos: 1. Un fabricante de reproductores de discos compactos utiliza unconjunto de pruebas amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas. Encuentre un intervalo de confianza de 90% para la proporción de los reproductores de discos compactos de la población que no pasarían todas las pruebas.

Ejemplo 2. En un estudio de 300 accidentes de automóvil en una ciudad específica, 60 tuvieron consecuencias fatales. Con base en estamuestra, construya un intervalo del 95% de confianza paraaproximar la proporción de todos los accidentes automovilísticos queen esa ciudad tienen consecuencias fatales.

Estimación de intervalos de confianza para varianzas y diferencias de varianzas

Si tenemos una muestra de tamaño n tomada de una población normal, podemos obtener un intervalo de confianza del nivel dado(90%, 95%, 99%, etc) para la varianza sabiendo que el valor de chicuadrada es para este caso:

El cual es una variable aleatoria que tiene una distribución Chi cuadrada con n -1 grados de libertad. Por lo tanto, podemos emplear esta definición para estimar un intervalo de confianza ya que lo que necesitamos es que

Donde x2 es el valor de Chi cuadrada para los grados de libertad y nivel de confianza (1 -α) especificado. Entonces podemos despejar la varianza σ2:

los valores de Chi cuadrada

Corresponden a lo que se muestra en la siguiente figura (notar que el valor mayor define el límite de la izquierda del intervalo y el menor elderecho, ya que están dividiendo)

Por lo que el intervalo de confianza para la varianza varianza estará dado por

Podemos encontrar el intervalo de confianza correspondiente para la desviación estándar n dar, σ, obteniendo las raíces cuadradas ces cuadradas de los límites de confianza para la varianza. Ejemplo. En 16 recorridos de prueba, el consumo de gasolina de un motor experimental tuvo una desviación estándar de 2.2. litros. Construir un intervalo de confianza del 99% para la varianza y para la desviación estándar esperadas de este motor.

Solución. Suponiendo que los datos pueden considerarse como una muestra aleatoria tomada de una población normal, usamos n = 16 y s=2.2. Ahora necesitamos los valores de Chi cuadrada para el caso específico.

Por lo que el intervalo de confianza para la varianza varianza estará dado por

Es decir: Y, por lo tanto, el intervalo de confianza para la desviación es n estándar nsería:

ELEMENTOS DE UNA PRUEBA DE HIPÓTESIS El promedio aritmético poblacional es un indicador muy importante, por lo tanto, frecuentemente se desea probar si dicho promedio ha permanecido igual, ha aumentado o hadisminuído. A través de la prueba de hipótesis se determina si la media poblacional es significativamente mayor o menor que algún valor supuesto. Hipótesis Se puede plantear uno de los siguientes tres tipos de hipótesis: - Prueba de hipótesis a dos colas H0 : = k H1 : k - Prueba de hipótesis a una cola superior H0 : = k ó H0 :

k

H1 : >k ó H1 : > k - Prueba de hipótesis a una cola inferior H0 : = k ó H0 :

k

H1 : < k ó H1 : < k En las distribuciones en el muestreo se vió que para el caso de la media, hay tres situaciones, por consiguiente la estadística de trabajo a utilizar depende de los supuestos de la población y del tamaño de la muestra.

Prueba de hipótesis para la media si la población de donde se obtiene la muestra tiene distribución normal con conocida. La estadística de trabajo a usar corresponde a la expresión (1.6):

(3.1) Donde: es el valor que se está suponiendo en la hipótesis nula (H 0). REGLA DE DECISION

- Si se ha planteado la hipótesis alternativa como: H1 : k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura 3.1

Figura 3.1 Regla de decisión para una prueba de hipótesis a dos colas. y pertenecen a una distribución normal estándar. Si el valor de la estadística de trabajo (Zx) está entre y no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Esdecir:

- Si se ha planteado la hipótesis alternativa como: H1 : > k, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribución, como se aprecia en la figura 3.2

Figura 3.2 Regla de decisión para una prueba de hipótesis a una cola superior. pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo (Zx) es menor que no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Esdecir,

Si se ha planteado la hipótesis alternativa como: H1 : < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribución, como se aprecia en la figura 3.3

Figura 3.3 Regla de decisión para una prueba de hipótesis a una cola inferior. Z pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo (Zx) es mayor que Z no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1. Esdecir,

EJEMPLO Un proceso manufacturero usado por una fábrica durante los últimos años da una producción media de 100 unidades por hora con una desviación estándar de 8 unidades. Se acaba de introducir en el mercado una nueva máquina para realizar ese tipo de producto. Aunque es muy cara comparada con la que está ahora en uso, si la media de producción de la nueva máquina es de más de 150 unidades por hora, su adopción daría bastantes beneficios. Para decidir si se debiera comprar la nueva máquina, a la gerencia de la fábrica se le permite hacer un ensayo durante 35 horas, hallándose un promedio de 160 unidades por hora. Con ésta información qué decisión se debe tomar si se asume un nivel de confianza del 99 por ciento. Solución . Según el enunciado, solo se compra la máquina si la producción es de mas de 150 unidades por hora, por lo tanto las hipótesis son: H0 : = 150

H1 : > 150 Para elegir la estadística de trabajo se tiene en cuenta que se conoce la varianza poblacional, por lo tanto se usa la expresión 3.1

por el planteamiento de la hipótesis alternativa se trabaja a una cola superior. En la distribución normal, con una confiabilidad del 99 por ciento el valor de Z es 2,33. como puede observarse en la figura 3.4, la estadística de trabajo está en la zona de rechazo de la hipótesis nula, por lo tanto, se acepta que la producción promedio por hora es superior a las 150 unidades y asumiendo un riesgo del 1 por ciento se puede comprar la nueva máquina.

Figura 3.4 Regla de desición para una prueba de hipótesis a una cola inferior.

Prueba de hipótesis para la media si se selecciona una muestra aleatoria de tamaño n 30 de una población con cualquier distribución.

La estadística de trabajo a usar es la expresión (1.7):

REGLA DE DECISION Es la misma que en el caso anterior y depende en todo caso

de la hipótesis alternativa. EJEMPLO La duración promedio de las llantas producidas por una fábrica de llantas, según experiencias registradas es de 46.050 kms. Se desea probar si el promedio poblacional ha cambiado; para tal efecto se toma una muestra aleatoria de 60 llantas y se obtiene una duración promedio de 45.050 kms. con una desviación estándar de 3.070 kms. Solución H 0 : = 46.050 H1 :

46.050

Teniendo en cuenta que el tamaño de la muestra es grande, como estadística de trabajo se utiliza la expresión 3.2

Por la hipótesis alternativa, la regla de decisión es a dos colas. La tabla a utilizar es la de la distribución normal. Asumiendo un nivel de confianza del 95 por ciento, los correspondientes valores de Z son -1,96 y 1,96. Como puede observarse en la figura 3.5, el valor de la estadística de trabajo está en la zona de rechazo de la hipótesis nula, por consiguiente, con una confiabilidad del 95 por ciento se acepta que la duración promedio de las llantas ha cambiado.

Figura 3.5 Regla de decisión para una prueba de hipótesis a

dos colas Prueba de hipótesis para la media si se selecciona una muestra aleatoria de tamaño n<30 . En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o corregida. • Si se utiliza la varianza sin corregir ( expresión (1.8):

) la estadística de trabajo es la

(3.3) • Si se utiliza la varianza corregida la estadística de trabajo es la expresión (1.9):

(3.4) EJEMPLO En su calidad de comprador comercial para un supermercado, se toma una muestra aleatoria de doce (12) sobres de café de una empacadora. Se encuentra que el peso promedio del contenido de café de cada sobre es 15,97 grs. con una desviación estándar de 0,15. La compañía empacadora afirma que el peso promedio mínimo del café es de 16 grs. por sobre. Puede aceptarse ésta afirmación si se asume un nivel de confianza del 90 por ciento? Solución Se desea probar si el peso mínimo es de 16 grs., es decir mayor o igual a 16 grs., así que las hiipótesis adecuadas son: H0 : 16 H1 : < 16 Teniendo en cuenta que el tamaño de la muestra es pequeño, como estadística de trabajo se utiliza la expresión 3.3 Teniendo en cuenta que el tamaño de la muestra es pequeño, como estadística de trabajo se utiliza la expresión 3.3

Como lo indica la hipótesis alternativa, se trabaja a una cola inferior en la tabla de la distribución t con 11 grados de libertad y una confiabilidad del 90 por ciento, el valor de Z es - 1,363 Como puede observarse (figura 3.6), la estadística de trabajo (-0,663) está ubicada en la zona de no rechazo de la hipótesis nula, por lo tanto, con un nivel de confianza del 90 por ciento no se rechaza que los empacadores de café tienen la razón, por lo tanto se concluye que el peso promedio de los sobres de café es mayor o igual a 16 grs.

Figura 3.6 Regla de decisión para una prueba de hipótesis a una cola inferior

PRUEBAS DE HIPÓTESIS SOBRE PROPORCIONES Y DIFERENCIAS DE PROPORCIONES EN MUESTRAS PEQUEÑAS Y GRANDES

Frecuentemente se desea estimar la proporción de elementos que tienen una característica determinada, en tal caso, las observaciones son de naturaleza cualitativa. Cuando se analiza información cualitativa y se está interesado en verificar un supuesto acerca de la proporción poblacional de elementos que tienen determinada característica, es útil trabajar con la prueba de hipótesis para la proporción. Hipótesis Como en el caso de la media, se puede plantear uno de los siguientes tres tipos de hipótesis: - Prueba de hipótesis a dos colas H0 : = k H1 :

k

- Prueba de hipótesis a una cola superior H0 : = k ó H0 :

k

H1 : > k ó H1 : > k - Prueba de hipótesis a una cola inferior H0 : = k ó H0 :

k

H1: < k ó H1 : < k Cuando se va a estimar una proporción el tamaño de la muestra (n) siempre debe ser mayor a 30, por lo tanto se tiene un solo caso. La estadística de trabajo a utilizar es la expresión (1.13):

(3.5)

REGLA DE DECISION Si se ha planteado la hipótesis alternativa como: H1: k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura 3.1 y pertenecen a una distribución normal estándar. Si el valor de la estadística de trabajo (Zp) está entre y no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si k, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribución, vease figura 3.2 pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo (Zp ) es menor que no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si Zp< no se rechaza H0 . - Si se ha planteado la hipótesis alternativa como: H1 : < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia ( ) en la parte inferior de la distribución, vease figura 3.3 Z pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo (Zp ) es mayor que Z no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si Zp> Z no se rechaza H0 . EJEMPLO Un fabricante afirma que por lo menos el 90 por ciento de las piezas de una maquinaria que suministra a una fábrica guardan las formas especificadas. Un exámen de 200 de esas piezas reveló que 160 de ellas no eran defectuosas. Pruebe si lo que afirma el fabricante es cierto. Solución H0 :

0,9

H1 : < 0,9 Para realizar una prueba de hipótesis para la proporción se utiliza la expresión 3.5

Asumiendo una confiabilidad del 95 por ciento, el valor correspondiente a Z en la distribución normal es -1,64 Como puede observarse en la figura 3.7, el valor de la estadística de trabajo se encuentra en la zona de rechazo de la hipótesis nula, por consiguiente, con una confiabilidad del 95 por ciento se concluye que la afirmación del fabricante no es cierta.

Figura 3.7 Regla de decisión para una prueba de hipótesis a una cola inferior

PRUEBAS DE HIPÓTESIS SOBRE DESVIACIÓN ESTÁNDAR Hipótesis: es una aseveración de una población elaborado con el propósito de poner aprueba, para verificar si la afirmación es razonable se usan datos. Ejemplo de hipótesis acerca de un parámetro de una población son: 

El sueldo promedio de un profesional asciende a $2,625.



El veinte por ciento de los consumidores utiliza aceite de oliva

En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera. Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable y debería no ser rechazada o si no es razonable debería ser rechazada P a s o 1 : E s t a b le c e r la h ip ó t e s is n u la y la a lt e r n a t iv a P a s o 2 : S e le c c io n a r e l n iv e l d e s ig n ific a c ió n P a s o 3 : I d e n t ific a r e l e s t a d í s t ic o d e p r u e b a P a s o 4 : F o r m u la r u n a r e g la d e d e c is ió n P a s o 5 : T o m a r u n a m u e s t r a , lle g a r a u n a d e c is ió n N o r e c h z a r la h ip ó t e s is n u la

R e c h a z a r la n u la y a c e p t a r la a lt e r n a t iv a

PROCEDIMIENTO SISTEMATICO 1. Plantear la hipótesis nula Ho y la hipótesis alternativa H1 Hipótesis nula H0: Una afirmación acerca del valor de un parámetro de la población. Hipótesis Alternativa H1: Una afirmación que es aceptada si la muestra provee la evidencia de que la hipótesis nula es falsa.

2. Seleccionar el nivel de significancia Nivel de significación: La probabilidad de rechazar la hipótesis nula cuando en realidad es verdadera.

TIPO DE ERRORES 

Error tipo I: Rechazar la nula cuando en realidad es verdadera



Error tipo II: Aceptar la hipótesis nula cuando en realidad es falsa.

CALCULO DEL VALOR ESTADISTICO DE LA PRUEBA Estadístico de prueba Es un valor, determinado a partir de la información de la muestra, usado para decidir si rechazar o no la hipótesis nula. TIPOS DE PRUEBA Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualda

Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o≤

VALORES Valor crítico El punto que divide la región entre el lugar en el que la hipótesis nula es rechazada y y la región donde la hipótesis nula es no rechazada. VALOR P •

Valor p: probabilidad de observar un valor de prueba más extremo que el valor observado, dado que la hipótesis nula es verdadera.



Si el valor p es más chico que el nivel de significación la hipótesis nula es rechazada.

Si el valor p es más grande que el nivel de significación la hipótesis nula no es rechazada PRUEBA DE HIPOTESIS PARA LA MEDIA DE UNA POBLACION DESVIACION ESTANDAR CONOCIDA O MUESTRAS GRANDES Cuando se plantean hipótesis para la media de la población y la desviación estándar poblacional es conocida o el tamaño de la muestra es grande, el estadístico de prueba está dado por:

x −μ z= ¯ ≈N ( 0,1) σ /√n el cual se distribuye como una Normal de media 0 y desvío estándar 1.

Prueba de hipotesis para la media de una poblacion desviacion estandar desconocida y de tamaño muestral pequeño. Cuando se plantean hipótesis para la media de la población y la desviación estándar poblacional es desconocida y el tamaño de la muestra es pequeño, el estadístico de prueba está dado por:

x −μ t= ¯ ≈t gl=n−1 S n−1 / √n el cual se distribuye como una t de Student con n-1 grados de libertad.

Prueba de hipotesis para la proporcion de una poblacion Cuando se plantean hipótesis para la proporción de la población, el estadístico de prueba está dado por:

p ¯ − p Ho z= ≈N ( 0,1 ) σ ¯p

donde

σ ¯p=



pHo∗q Ho n

el cual se distribuye como una Normal de media 0 y desvío estándar 1 CARACTERISTICAS DE t-Student 

Es continua, campánula, y simétrica como la distribución z.



Existe una familia de distribuciones t con media cero, pero con diferentes desviaciones estándar.



La distribución t es más aplanada y de colas más largas que la z.



Tiende a la z para tamaños grandes de muestra.

Forma de la distribucion normal estandarizada y la t-student

Prueba de hipotesis para dos medias desviacion estandar poblacional conocida o muestras grandes, muestras independientes Cuando se plantean hipótesis para la diferencia de medias de dos poblaciones y las desviaciones estándar poblacionales son conocidas o el tamaño de la muestra es grande, el estadístico de prueba está dado por:

z=

( ¯x 1− ¯ x 2 )−( μ 1−μ 2)



σ

2 1

n1

σ +

2

≈N ( 0,1)

2

n2

el cual se distribuye como una Normal de media 0 y desvío estándar 1. Prueba de hipotesis para dos medias desviaciones estandar poblacionales desconocidas pero iguales y muestras pequeñas, muestras independientes Cuando se plantean hipótesis para la diferencia de medias de dos poblaciones y las desviaciones estándar poblacionales son desconocidas y el tamaño de la muestra es pequeño, el estadístico de prueba está dado por:

t=

( ¯x 1− ¯x 2 )−(μ 1−μ )



S 2p (

1 1 + ) n1 n2

≈t gl=n +n −2 1

2

donde

S 2p =

(n1 −1)∗S 21 +(n2 −1)∗S 22 (n1 −1)+(n2 −1)

el cual se distribuye como una t de Student con n 1+n2-1 grados de libertad

Prueba de hipotesis para dos medias desviacion estandar Poblacional conocida o muestras grandes, muestras relacionadas o dependientes Cuando las muestras están relacionadas y se quiere probar si luego de aplicar un tratamiento las medias difieren (antes/después) y las desviaciones estándar poblacionales son desconocidas y el tamaño de la muestra es pequeño, el estadístico de prueba está dado por:

t=

¯ d − μd s ¯d

√n

≈t gl=n−1

n

donde

n

∑ d i ∑ ( x i − x 2) ¯ d=

i =1

n

=

i =1

n

n 2¯ d

S =

el cual se distribuye como una t de Student con n-1 grados de libertad.

∑ ( d i −¯d )2 i=1

n−1

Ejemplo El jefe de la Biblioteca Especializada de la Facultad de Ingeniería Eléctrica y Electrónica de la UNAC manifiesta que el número promedio de lectores por día es de 350. Para confirmar o no este supuesto se controla la cantidad de lectores que utilizaron la biblioteca durante 30 días. Se considera el nivel de significancia de 0.05 Solución: Se trata de un problema con una media poblacional: muestra grande y desviación estándar poblacional desconocida. Paso 01: Seleccionamos la hipótesis nula y la hipótesis alternativa Ho: μ═350 Ha: μ≠ 350 Paso 02: Nivel de confianza o significancia 95% α═0.05 Paso 03: Calculamos o determinamos el valor estadístico de prueba De los datos determinamos: que el estadístico de prueba es t, debido a que el numero de muestras es igual a 30, conocemos la media de la población, pero la desviación estándar de la población es desconocida. En este caso determinamos la desviación estándar de la muestra y la utilizamos en la formula reemplazando a la desviación estándar de la población.

Calculamos la desviación estándar muestral y la media de la muestra empleando Excel, lo cual se muestra en el cuadro que sigue.

DATOS

Paso 04: Formulación de la regla de decisión. La regla de decisión la formulamos teniendo en cuenta que esta es una prueba de dos colas, la mitad de 0.05, es decir 0.025, está en cada cola. el área en la que no se rechaza Ho está entre las dos colas, es por consiguiente 0.95. El valor crítico para 0.05 da un valor de Zc = 1.96. Por consiguiente la regla de decisión: es rechazar la hipótesis nula y aceptar la hipótesis alternativa, si el valor Z calculado no queda en la región comprendida entre -1.96 y +1.96. En caso contrario no se rechaza la hipótesis nula si Z queda entre -1.96 y +1.96. Paso 05: Toma de decisión. En este último paso comparamos el estadístico de prueba calculado mediante el Software Minitab que es igual a Z = 2.38 y lo comparamos con el valor critico de Zc = 1.96. Como el estadístico de prueba calculado cae a la derecha del valor critico de Z, se rechaza Ho. Por tanto no se confirma el supuesto del Jefe de la Biblioteca.

CONCLUSIONES

La primera fase de la estadística se trata de coleccionar, ordenar y presentar los datos o hechos numéricos. La segunda parte de la estadística se encarga de analizar, sintetizar (hacer inferencias y realizar interpretación) y finalmente publicar los datos que han sido presentados en forma de grafica y/o de manera tabular. Es precisamente en la sección del análisis estadístico en donde el investigador debe modificar los datos, es decir hacer estimaciones de los datos brutos. Para hacer estimaciones, uno debe estar bien familiarizado con los criterios estadísticos que se debe reunir y considerar en el proceso de la estimación, ya que las estimaciones sesgadas nos conducen a las inferencias y decisiones erróneas. Es precisamente con este punto en la mente que se avoco a realizar la presente investigación.

BIBLIOGRAFIA

http://www.uoc.edu/in3/emath/docs/Estimacion_IC.pdf http://tesisdeinvestig.blogspot.mx/2011/05/la-estimacion.html www.unlu.edu.ar/~estadistica/

More Documents from "Gabriel Medina"

Curso Excel 20070613 15h59m
October 2019 19
Doc1.docx
October 2019 14
Ejercicio 1 .docx
October 2019 19