Trabajo Final Probabilidad y Estadística 2018 Profesores: María Laura Patat y Julieta Buroni Alumnos: Núñez Tomás y Mione Katherine Fecha de Entrega: 05-07-2018 Título: “Análisis del Super”
Introducción: En el siguiente trabajo nos propondremos analizar todos los temas vistos en la cátedra. Partiendo de una base de datos extraída del inventario de productos de una reconocida cadena de supermercados. La misma cuenta con siete variables: Nombre de producto (variable cualitativa nominal ). Proveedor (variable cualitativa nominal) . Categoría (variable cualitativa nominal). Precio unitario (variable cuantitativa continua). Unidades en existencia (variable cuantitativa discreta). Unidades en pedido (variable cuantitativa discreta). Producto suspendido (variable cualitativa nominal). El tamaño de la población ( N ) es de 77 productos. Estadística descriptiva: Las siguientes medidas fueron calculadas a partir de la variable “precio por unidad”, debido a que resulta más útil para su posterior análisis. Máximo: 263,5 Mínimo: 2,5 Mediana (Me): 19,5 Media (𝑥̅ ) : 28,87 Modo (Mo) :18 Rango (r): 261 Varianza (𝑆 2 ): 1143,46 Desvío estándar (S): 33,82 Coeficiente de variabilidad: 1,17 Cuantiles: Cuartiles - Deciles - Percentiles o Q1= 13,25 o Q2= D5= P50 = 19,50 (mediana) o Q3= 33,25
Gráfico de barras 70 60 50 40 30 20
Unidades en existencias
10 0
En el gráfico se observa el promedio de las unidades en existencia de cada categoría, lo que demuestra que dicho supermercado posee una cantidad mayor de stock de pescados y mariscos con respecto a otras categorías. Esto podría deberse a que dicha muestra fue tomada durante un periodo donde la demanda de Pescados y Mariscos es mayor. Como consecuencia de esto el supermercado cuenta con un mayor stock.
Gráfico de Tortas "VERDADERO"
"FALSO"
90% 10%
En el presente grafico buscamos representar como se distribuye la variable categórica “Productos Suspendidos”. De nuestra población total de 77 productos contamos con un 90% (69) que no se encuentran suspendidos por lo tanto la empresa no ha discontinuado su stock en almacenes mientras que hay un 10% (8) que por distintas razones han dejado de ser requeridos. Distribución Binomial: Un empleado del deposito olvido etiquetar 5 cajas de acuerdo a su categoría antes de irse. El encargado necesita con urgencia saber su contenido para organizar la mañana del día siguiente pero no puede abrirlas. Se propone calcular la probabilidad de que sean frutas y verduras, sabiendo que durante la jornada se han embalado y etiquetado el 70% de las frutas y verduras en depósito. ¿Cuál es la probabilidad de que ninguna caja contenga frutas o verduras? P (x=0): 0,00243 ¿Cuál es la probabilidad de que al menos 3 de las cajas tengan frutas y verduras? P(x3) = P(x=3)+P(x=4)+P(x=5)= 0,308+0,360+0,168= 0,836
¿Cuál es la probabilidad de que todas las cajas posean en su interior frutas y verduras? P(x=5): 0,168 Distribución Hipergeométrica: El gerente esta preocupado porque se han recibido 5 denuncias sobre productos de repostería elaborada en el supermercado que se encontraba en malas condiciones. Lamentablemente el volumen de producción es demasiado grande para enviar a analizar en su totalidad, lo que por otro lado seria altamente costoso para la compañía. Debido a lo cual antes de tomar una decisión desea saber cual es la probabilidad de que en los 186 productos listos para salir a la venta se encuentren a lo sumo 3 en malas condiciones. Si se toma una muestra al azar del 19% (35). Si es mayor al 5% suspenderá la producción de forma inmediata P (x=3): 0,042
La probabilidad de hallar 3 productos de repostería en mal estado fue del 4,2%(menor al 5%) por lo cual el gerente deberá evaluar otro curso de acción en lugar de suspender la producción. Distribución Poisson: La media de dinero que ingresa al supermercado es de $5,5 por hora. Calculamos la probabilidad de que ingresen $4 en una hora: P (x=4): 0,15 Y la probabilidad de que ingresen $7 en dos horas: P (x=7): 0,064 Estimación: Puntual: Un estudio realizado sobre el rubro granos y cereales revelo que su media de unidades en pedido se ubica en las 15 uds. y su desviación estándar en los 10,95 uds. .Desconociendo los datos de la población total podemos estimar de forma puntual que por lo tanto la media de la población es 15 y el desvió es 10,95 ya que se trata de una distribución normal.
𝑥̅ = 𝜇 = 15 𝑆 = 𝛿 = 10,95 Intervalo de confianza: De un total de 77 productos que son vendidos en el supermercado se seleccionan 50 para una muestra. La media de la muestra es de 40 y su desviación estándar de 9. Construir un intervalo de confianza del 95% para la media de la población. Donde Z = 1,96 y ∝ = 0,05 𝑃 [(40 − 𝑍.
9
) ≤ 𝜇 ≤ (40 + 𝑍.
√40
Resultado: (37,21 ; 42,79)
9 √40
)] = 0,95
Test de hipotesis El encargado del depósito asegura que la media de productos lácteos es de 40 unidades en existencia con una desviación típica de 38,71. Pero el encargado de ventas desconfía y supone que es menor. Toma una muestra de 10 productos que le proporciona una media de 39,3. Con un nivel de significación del 5% realizamos un test de hipótesis. Como el tamaño de la muestra es menor a 30 usaremos la tabla de distribución tstudent, y calcular los siguientes valores:
𝐻0 : µ ≥ 40 𝐻1 : µ < 40 t-observado = - 0,057 t-crítico= -1,883
El valor t-observado cae fuera del área de rechazo, por lo tanto se acepta la hipótesis nula y la media de unidades en existencia de productos lácteos es mayor o igual a 40. Otra forma de aceptar o rechazar la hipótesis nula es tomando a t-observado como valor ”p”. En este caso, el área de p-value será desde - ∞ (menos infinito) hasta -0,057. Si el área p-value es mayor al área α, como en este caso, se acepta la hipótesis nula.