Universidad Mayor de San Andrés – Facultad de Ingeniería
Estadística Consideraciones Generales El término estadística se deriva del latín status, que significa estado o situación. Ciencia de las matemáticas encargada de analizar el comportamiento de una población ……… ……..mediante un estudio cuyo propósito es hacer inferencias (predicciones sobre un comportamiento de dicha población) a partir de un subconjunto de datos, llamado muestra, tomados de la mencionada población. La estadística descriptiva se encarga a su vez de reunir, organizar y analizar datos numéricos, así como ayudar a diseñar experimentos Utilidad: Útil en la investigación científica, particularmente donde existe incertidumbre experimental. Objeto: Toma de decisiones en presencia de incertidumbre. 26/03/2019
Jaime Ortega
1
Universidad Mayor de San Andrés – Facultad de Ingeniería
Estadística Consideraciones Generales
Población: conjunto finito o infinito de elementos que presentan características comunes, sobre los cuales se quiere efectuar un estudio determinado. Se define como la totalidad de los valores posibles (mediciones o conteos) de una característica específica que se desean estudiar en un momento determinado. Así, se puede hablar de la población de habitantes de un país, de la cantidad de pozos productores de petróleo en cierto campo, etc.
Muestra: subconjunto de la población, seleccionado de forma tal, que sea representativo de la población estudiada, obteniéndose con el objetivo de investigar alguna o algunas de las propiedades de la población de la cual se desprende. Las conclusiones que se obtengan de dicha muestra sólo podrán referirse a la población en referencia, por ejemplo la cantidad de pozos productores activos de petróleo en determinado campo.
26/03/2019
Jaime Ortega
2
Estadística 1 Consideraciones Generales Ejemplo: Se cuenta el número de partículas sólidas en suspensión (asfaltenos) de 1 mm. de diámetro que se encuentran en 24 muestras de un cierto petróleo. Los resultados son: 3 0 1
0 3 0
0 4 1
1 1 2
0 2 0
2 0 2
1 2 1
0 0 0
Observaciones: Observaciones están entre 0 y 4 El valor más frecuente es 0 No se puede predecir el siguiente valor Las variaciones no son sistemáticas. Son al azar. Comentario 26/03/2019
Métodos estadísticos no son un substituto de leyes físicas que gobiernan un problema Jaime Ortega
3
Estadística 1 Consideraciones Generales
Actividad: 2 voluntarios para recolectar información sobre las edades del curso
26/03/2019
Jaime Ortega
4
Estadística 1 Consideraciones Generales Al conjunto de métodos de resumir datos y calcular ciertos parámetros o estadígrafos, se le da el nombre genérico de Estadística Descriptiva. Datos son valores de medidas hechas sobre un o más fenómenos. Cada fenómeno medido es una variable la cual puede ser cualitativa o cuantitativa y ésta ultima puede ser discreta o continua. Una variable (dato) cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Una variable (dato) cualitativa es aquella que representa una característica de calidad del fenómeno medido. Ejemplo: candidatos en una elección, color, sabor, etc.
26/03/2019
Jaime Ortega
5
Estadística 1 Consideraciones Generales Una variable cuantitativa discreta
Es aquella que sólo puede tomar un número finito de valores entre dos valores cualesquiera de una característica. Ejemplo: número de personas contadas, número de partículas cósmicas por minuto, número de productos con fallas en una línea de producción etc. Una variable cuantitativa continua Es aquella que puede tomar un número infinito de valores entre dos valores cualesquiera de una característica. Ejemplo: los valores que se miden de longitud, presión, temperatura, tiempo, etc.
26/03/2019
Jaime Ortega
6
Estadística 1 Consideraciones Generales Clasificar las siguientes variables en cualitativas y cuantitativas discretas o continuas.
1. La nacionalidad de una persona.
Cualitativa
2. Número de litros de agua contenidos en un depósito.
Cuantitativa continua
3. El área de las distintas baldosas de un edificio.
Cuantitativa continua
4. Suma de puntos tenidos en el lanzamiento de un par de dados.
Cuantitativa discreta.
26/03/2019
Jaime Ortega
7
Estadística 1 Consideraciones Generales Cuando emplear métodos estadísticos ?
1.
No se entienden por completo las leyes físicas que gobiernan un problema
2.
Experimento no ha sido hecho antes.
3.
No se conoce el comportamiento de un instrumental y técnica.
4.
Existe presión económica y de tiempo.
5.
En presencia de resultados inesperados en un experimento o en una cierta producción.
26/03/2019
Jaime Ortega
8
Estadística 1 Consideraciones Generales Cuales son los pasos a seguir cuando se decide emplear métodos estadísticos ? 1. Estudiar la tecnología actual para tener información sobre posibles resultados experimentales 2. Definir el objetivo del programa de experimentos
3. Definir las variables que afectan los resultados 4. Diseñar un programa de experimentos en base a valores sucesivos de cada variable. 5. Llevar a cabo los experimentos tal que se obtengan datos precisos y exactos 6. Registrar todos los resultados ordenadamente. 7. Analizar los resultados para tomar decisiones y/o hacer predicciones (inferencia) 26/03/2019
Jaime Ortega
9
Estadística 2 Formas Simples de Resumir datos
Las formas más comunes de resumir datos son tablas y gráficos. En ambos casos, se muestra la frecuencia con la que un valor de una variable ha ocurrido en un experimento dado. En otras palabras, muestran la frecuencia de los resultados. Métodos Gráficos
Gráfica de Barras Se emplean para variables cualitativas y para cuantitativas discretas. Ejemplo: los resultados del experimento anterior se pueden registrar en una tabla y en una gráfico. La variable es : número de partículas sólidas en suspensión de 1 mm; los valores de la variable son 0, 1, 2, 3 y 4:
26/03/2019
Jaime Ortega
10
Estadística 2 Formas Simples de Resumir datos Gráfica de Barras
Tabla Número de partículas
Frecuencia
0
10
1
6
2
5
3
2
4
1
total
26/03/2019
24
Jaime Ortega
11
Estadística 2 Formas Simples de Resumir datos Histograma
Se emplean usualmente con variables cuantitativa continuas.
Ejemplo: Se mide con gran precisión la permeabilidad de un yacimiento petrolero en 100 muestras del mismo. Los resultado tabulados son: Permeabilidad (mili darcy) 20 - 22 22 - 24 24 - 26 26 - 28 28 - 30 total 26/03/2019
Número de muestras 6 15 40 30 9 100 Jaime Ortega
12
Estadística 2 Formas Simples de Resumir datos Histograma
26/03/2019
Se emplean usualmente con variables cuantitativa continuas.
Jaime Ortega
13
Estadística 2 Formas Simples de Resumir datos Cómo dibujar un Histograma
1. Agrupar las observaciones entre 5 y 20 intervalos de clase 2. Obtener un representante de clase que es el punto medio de la clase. 3. Determinar el número de observaciones en cada clase o intervalo. 4. Construir rectángulos con centros en el representante de clase. Ejercicio: construir el histograma de la distribución de edades de los alumnos de la clase
26/03/2019
Jaime Ortega
14
Estadística Formas Simples de Resumir datos Curva de Frecuencias
Si hay muchas observaciones, el histograma se puede reemplazar por una curva suave que pasa por las intersecciones de los valores de frecuencia con los representantes de clase.
26/03/2019
Jaime Ortega
15
Estadística Formas Simples de Resumir datos
Curva de Frecuencia Acumulada
Consiste en agrupar datos sumando las observaciones de una clase con las de la anterior. Ejemplo: de la tabla anterior se tiene:
Permeabilidad (mili Darcy)
20 - 22 22 - 24 24 - 26 26 - 28 28 - 30 26/03/2019
Número de muestras
6 15 40 30 9
Frecuencia Acumulada
6 21 61 91 100 Jaime Ortega
16
Estadística 2 Formas Simples de Resumir datos
26/03/2019
Curva de Frecuencia Acumulada
Jaime Ortega
17
Estadística II Formas Simples de Resumir datos Estadígrafos de Resumen de Datos Además de los métodos gráficos, es útil calcular algunos parámetros que resumen el conjunto de datos. Cualquier cantidad que es calculada a partir de datos estadísticos se llama estadígrafo. Los más simples son de dos tipos: medidas de locación o tendencia central y medidas de dispersión. Medidas de Posición Central Son la media, mediana y moda. Estas medidas asumen la representatividad del conjunto de datos. Cuando la distribución es simétrica, todas ellas se centralizan cerca al máximo de la curva.
26/03/2019
Jaime Ortega
18
Estadística Formas Simples de Resumir datos La Media Es el estadígrafo más importante de todos. Más adelante se verá que la media muestral estima el valor esperado de una distribución; de hecho, es un estimador de máxima verosimilitud. Se calcula mediante: _
n
y= i =1
yi n
Donde : yi son las observaciones y n es el número total de observaciones.
26/03/2019
Jaime Ortega
19
Estadística Formas Simples de Resumir Datos La Media Si los datos están tabulados en frecuencias la formula de cálculo es: N
_
y=
f i yi i 1 N
fi i 1
Donde N es el número de observaciones no repetidas, yi es el representante de clase y fi es la frecuencia con la que se repite la i-ésima observación. 26/03/2019
Jaime Ortega
20
Estadística Formas Simples de Resumir datos La Media Ponderada También conocida como promedio ponderado, es una media aritmética en donde cada uno de los valores se pondera de acuerdo con su importancia en el grupo en general. Esto es, que a cada valor yi se multiplica por el factor de ponderación correspondiente, wi , tras de lo cual los productos se suman para posteriormente dividirse entre la suma de las ponderaciones.
La fórmula de cálculo es:
n
_
y=
wi y i i 1 n
wi i 1
26/03/2019
Jaime Ortega
21
Estadística Formas Simples de Resumir datos La Media Ponderada Ejemplo: Se tiene cuatro de líneas de productos: A B, C, D y cada línea deja un margen de utilidad y tiene un cierto nivel de ventas, según se muestra en la tabla abajo. Cual es la media del margen de utilidades? Línea de Productos A B C D Total 26/03/2019
Margen de Utilidad en % (y) 4.2 5.5 7.4 10.1
Ventas (US$) (w) 30,000 20,000 5,000 3,000 58,000 Jaime Ortega
n
y w i 1
i
i
126,000 110,000 37,000 30,300 303,300 22
Estadística Formas Simples de Resumir datos La Media Aritmética
4.2 5.5 7.4 10.1 y (arit) = 6.8% 4 _
_
La Media Ponderada
303,300 y= 5,23% 58,000
Utilizar la media aritmética de 6.8 % es asumir –erróneamente- que todos los productos tienen el mismo volumen de ventas y que se puede esperar un margen de utilidad de 6.8% para todos. Ejercicio: calcular la media ponderada de los habitantes de La Paz, Oruro y Cochabamba.
26/03/2019
Jaime Ortega
23
Estadística Formas Simples de Resumir Datos
La Mediana Es el valor de clase que corresponde al 50% de las observaciones. Se la utiliza en ocasiones en lugar de la media, especialmente en casos de distribución asimétrica. La mediana es una medida de la acción de contar y por tanto no esta afectada por valores extremos. Si y1, y2, y3, ….yn son los datos de una muestra ordenada, entonces:
𝑀𝑒 = 𝑦
𝑀𝑒 = 26/03/2019
𝑛+1 2
con n par
𝑦𝑛 +𝑦𝑛
2 +1
2
2
con n impar
Jaime Ortega
24
Estadística Formas Simples de Resumir Datos
Medidas de Dispersión
Ejemplo: un estudio de gente afectada por una enfermedad reveló que la mayoría de las personas afectadas estaban por debajo de los dos años y por encima de los setenta; seria por tanto engañoso concluir simplemente que el "promedio de edad de la gente afectada es 36 años" sabiendo que los datos están dispersos sobre casi todo el rango de la vida humana. Es importante saber cuan dispersos están los datos pues: - Permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa. - Una amplia dispersión de valores con respecto al centro de distribución presenta riesgos generalmente inaceptables
26/03/2019
Jaime Ortega
25
Estadística Formas Simples de Resumir Datos
Medidas de Dispersión
Toda medida de posición central, para tener una adecuada interpretación, debe estar acompañada de una de dispersión. Las más comunes son: el rango, la desviación media absoluta, la varianza, la desviación estándar y el coeficiente de variación. El Rango
Diferencia entre el valor de la mayor y la menor observación. Útil para comparar la variabilidad de muestras de igual tamaño. Es muy sensitivo al número de observaciones y por tanto no es una característica descriptiva de una población.
26/03/2019
Jaime Ortega
26
Estadística Formas Simples de Resumir Datos
Medidas de Dispersión
La Desviación Media Absoluta (MAD) Es el promedio de las desviaciones absolutas respecto de la media. Es decir: n
yy
i =1
n
M .A.D =
26/03/2019
i
Jaime Ortega
27
Estadística Formas Simples de Resumir Datos
Medidas de Dispersión: La Varianza Muestral y la Desviación Estándar Ambas dan una medida de la dispersión de los datos alrededor de la media. Cuando los valores estén más alejados los unos de los otros, mayor será el valor de la Varianza y de la desviación estándar. 𝑛
La Varianza Muestral se calcula mediante:
𝑆2
= 𝑖=1
𝑦𝑖 − 𝑦 𝑛−1
2
𝑛
La desviación estándar es la raíz cuadrada de la Varianza:
𝑆= 𝑖=1
𝑦𝑖 − 𝑦 𝑛−1
2
La desviación estándar tiene las mismas unidades que las medidas originales y por esta razón se la prefiere como un estadígrafo de dispersión; sin embargo, para propósitos de análisis teórico y de cálculo, se trabaja generalmente con varianzas. 26/03/2019
Jaime Ortega
28
Estadística La Varianza Muestral y la Desviación Estándar
Aproximadamente 68% de los valores de la población cae dentro de ±1 desviación estándar a partir de la media.
Aproximadamente 95% de los valores estará dentro de ±2 desviaciones estándar a partir de la media
26/03/2019
Jaime Ortega
29
Estadística Formas Simples de Resumir Datos
Medidas de Dispersión
La Varianza Muestral y la Desviación Estándar 𝑛
𝑆2
= 𝑖=1
𝑦𝑖 − 𝑦 𝑛−1
2
𝑛
𝑆= 𝑖=1
𝑦𝑖 − 𝑦 𝑛−1
2
El uso de (n-1) en lugar de n en el denominador confunde a muchas personas. Es el número de grados de libertad de una suma de cuadrados, es igual al número de elementos independientes en dicha suma.
26/03/2019
Jaime Ortega
30
Estadística II Formas Simples de Resumir Datos
Medidas de Dispersión: La Varianza Muestral y la Desviación Estándar 𝑛
𝑆2 = 𝑖=1
𝑦𝑖 − 𝑦 𝑛−1
𝑛
2
𝑆= 𝑖=1
𝑦𝑖 − 𝑦 𝑛−1
2
En Estadística, la suma de los residuos es necesariamente 0 ya que existen variables con valores superiores e inferiores a la media. 𝑛
𝑛
𝑦𝑖 − 𝑦 = 𝑖=1 26/03/2019
𝑦𝑖 − 𝑛𝑦 = 𝑛𝑦 − 𝑛𝑦 = 0 𝑖=1 Jaime Ortega
31
Estadística Formas Simples de Resumir Datos
Medidas de Dispersión:
La Varianza Muestral y la Desviación Estándar
𝑛
𝑛
𝑦𝑖 − 𝑦 = 𝑖=1
𝑦𝑖 − 𝑛𝑦 = 𝑛𝑦 − 𝑛𝑦 = 0 𝑖=1
Ahora imaginemos que se tienen 3 valores de y que se pueden modificar arbitrariamente, pero con la condición de que la suma de los residuos sea 0. Se puede utilizar cualquier cantidad a dos de los tres valores de y, porque el otro va a estar dado por la fórmula, es decir que tienes dos grados de libertad
En aquellas raras ocasiones cuando se conoce la media poblacional, la formula de la varianza tendrá N en el denominador, donde N es el número de elementos de la población. 26/03/2019
Jaime Ortega
32
Estadística Formas Simples de Resumir Datos
Medidas de Dispersión
La Varianza Poblacional y la Desviación Estándar de la Población
𝑁
𝜎2
= 𝑖=1
𝑦𝑖 − 𝜇 𝑁
𝑁
2
𝜎= 𝑖=1
𝑦𝑖 − 𝜇 𝑁
2
Donde μ es la media poblacional y N el número de elementos de la población
26/03/2019
Jaime Ortega
33
Teoría de Probabilidades Concepto de Probabilidad Probabilidad es la posibilidad de ocurrencia de un cierto evento en un experimento dado. La teoría de probabilidades permite medir dicha posibilidad. Estadística y Probabilidad
La relación entre probabilidad y estadística puede verse mediante el siguiente ejemplo: Un lote de 10,000 válvulas de tubería se importan para la industria petroquímica. El fabricante especifica que el lote contiene una proporción p igual al 10 % o 0.1 de defectuosas. Si se toman muestras de 100 válvulas, se debe esperar que existan 10 defectuosas en cada muestra; sin embargo, al tomar varias muestras, algunas tendrán 8 defectuosas, otras tendrán 9, 10, 11, etc. La Teoría de Probabilidades nos permite calcular la posibilidad o probabilidad de obtener un número determinado de válvulas defectuosas en una muestra, obtenida bajo ciertas condiciones. En la realidad, la Estadística nos permite estimar el valor de p. 26/03/2019
Jaime Ortega
34
Teoría de Probabilidades Concepto de Probabilidad Estadística y Probabilidad Una situación real implica el conocer varios parámetros o variables (en el ejemplo anterior el parámetro es p). Si éstos no se conocen y tienen que ser estimados a partir de datos experimentales, se está en presencia de un problema estadístico. Una ves que dichos parámetros han sido estimados, ellos pueden ser utilizados para deducir el comportamiento de una población mediante la solución a un problema probabilístico
26/03/2019
Jaime Ortega
35
Teoría de Probabilidades Concepto de Probabilidad Estadística y Probabilidad En resumen: La Estadística Descriptiva acumula y analiza la masa de datos numéricos provenientes de los resultados de ciertas actividades o de la observación de fenómenos. La Probabilidad se encarga de evaluar la posibilidad de ocurrencia de los resultados de todas aquellas actividades en donde se tiene incertidumbre acerca de los resultados que se pueden esperar.
26/03/2019
Jaime Ortega
36
Teoría de Probabilidades Definiciones y Conceptos Experimento Aleatorio Se llama experimento o fenómeno aleatorio a aquél cuyos resultados no se pueden predecir de antemano en una experiencia concreta. Se llama experimento determinista o determinístico al que, realizado en las mismas condiciones, es posible predecir los resultados (Física del problema). Espacio Muestral: Es el conjunto de todos los posibles resultados de un experimento aleatorio. Punto Muestral: Es un posible resultado de un experimento (un evento) aleatorio.
26/03/2019
Jaime Ortega
37
Teoría de Probabilidades Definiciones y Conceptos Probabilidad de La Place Cuando se pueda asegurar que se cumple el postulado de indiferencia, es decir que todos los sucesos elementales o posibles resultados de un experimento son igualmente posibles y mutuamente excluyentes (no pueden ocurrir dos al mismo tiempo) entonces se define que la probalidad de ocurrencia de un evento cualquiera (a) se la puede estimar mediante:
número de casos favorables P(a ) número de casos posibles
26/03/2019
Jaime Ortega
38
Teoría de Probabilidades Definiciones y Conceptos Probabilidad de La Place Se observó que en 9 de cada 50 vehículos que pasan por una cierta esquina, los conductores no tienen cinturón de seguridad. Si un vigilante de tránsito se para en esa misma esquina en un día cualquiera ¿Cuál será la probabilidad que detenga un vehículo sin cinturón de seguridad?
P( a )
frecuencia observada de casos favorables 9 0.18 frecuencia observada de casos posibles 50
Tanto el enfoque clásico (teórico) como el enfoque empírico conducen a valores objetivos de probabilidad, en el sentido de que los valores de probabilidad indican en el largo plazo la tasa relativa de ocurrencia del evento. 26/03/2019
Jaime Ortega
39
Teoría de Probabilidades Definiciones y Conceptos Probabilidad Puntual o Probabilidad del Punto Muestral
Es la frecuencia de ocurrencia del evento en muchas repeticiones del experimento. Si se designa un evento con y, la probabilidad de su ocurrencia se expresa por P(y). Ejemplos: 1.- Se lanza una moneda regular (experimento), el Espacio Muestral es Cara y Cruz, es decir Ca y Cr. La probabilidad de ocurrencia de Cara es igual a la de Cruz y se denota por: P(Ca) = P(Cr) = 1/2.
26/03/2019
Jaime Ortega
40
Teoría de Probabilidades Definiciones y Conceptos Probabilidad del Punto Muestral 2.- Se lanzan dos dados. El Espacio Muestral consiste de 36 combinaciones que se muestran abajo. 1,1
1,2
1,3
1,4
1,5
1,6
2,1
2,2
2,3
2,4
2,5,
2,6
3,1
3,2
3,3
3,4
3,5
3,6
4,1
4,2
4,3
4,4
4,5
4,6
5,1 6,1
5,2 6,2
5,3 6,3
5,4 6,4
5,5 6,5
5,6 6,6
Cada uno de los 36 puntos muestrales tiene la misma probabilidad de ocurrencia. Por la simple inspección de la tabla anterior se tiene que:
P(suma de dos dados sea siete) = 6/36 = 1/6 P(suma de dos dados sea siete u once) = 6/36 + 2/36 = 2/9 26/03/2019
Jaime Ortega
Return 41
Teoría de Probabilidades Definiciones y Conceptos: Tipos de Eventos a) Eventos Mutuamente Excluyentes
Dos eventos E1 y E2 son mutuamente excluyentes si ambos no pueden ocurrir al mismo tiempo. En términos de probabilidad esto se expresa por: P(E1 ó E2) = P(E1) + P(E2) b) Eventos que no son Mutuamente Excluyentes Dos eventos E1 y E2 no son mutuamente excluyentes si ambos pueden ocurrir al mismo tiempo. En términos de probabilidad esto se expresa por: P(E1 ó E2) = P(E1) + P(E2) - P(E1 y E2) Donde P(E1 y E2) es la probabilidad que ambos eventos ocurran. 26/03/2019
Jaime Ortega
42
Teoría de Probabilidades Definiciones y Conceptos:
Tipos de Eventos
Ejemplo: Se lanzan dos dados, cual es la probabilidad que la suma sea 7 (E1 ) o al menos uno de los dados sea 3 (E2 )?
Examinando la tabla anterior se tiene: Posibles resultados de E1
(1,6), (2,5), (3,4), (4,3) (5,2), (6,1)
P(E1) = 6/36
Posibles resultados de E2
(1,3), (2,3), (3,3), (4,3), (5,3), (6,3), (3,1), (3,2), (3,4), (3,5), (3,6)
P(E2) =11/36
Posibles resultados de E1 y E2 Por lo tanto 26/03/2019
P(E1 y E2) = 2/36
(3,4), (4,3)
P(E1 ó E2) = P(E1) + P(E2) - P(E1 y E2) = 6/36 + 11/36 - 2/36 = 15/36 Jaime Ortega
43
Teoría de Probabilidades Definiciones y Conceptos: Tipos de Eventos Ejemplo: Se tienen cinco libros de distintas materias: Matemática, Biología, Química, Física y Lenguaje. Si se toma uno de ellos, ¿cuál es la probabilidad de que este sea de matemática o de física? Solución: Sean los eventos:
E1 =Tomar el libro de Matemáticas.
La probabilidad pedida es:
E2 =Tomar el libro de Física.
P(E1 ó E2) = P(E1) + P(E2) - P(E1 y E2) P(E1 ∪ E2) = P(E1) + P(E2) - P(E1 ∩ E2)
Como E1 y E2 son eventos mutuamente excluyentes: P(E1 ∩ E2) = 0 Por lo tanto nos queda: 26/03/2019
P(E1 ∪ E2) = P(E1) + P(E2) = 1/5 + 1/5 = 2/5 Jaime Ortega
44
Teoría de Probabilidades Definiciones y Conceptos : Probabilidad Condicional La probabilidad condicional de un evento E1, dado que un evento E2, sucedió se calcula mediante:
P(E1/E2) = P(E1 y E2)/P(E2)
o bien:
P(E1/E2) = P(E1 ∩ E2)/ P(E2) Ejemplo: Se lanzan dos dados, puesto que al menos un dado es 3, cual es la probabilidad que la suma sea 7? P(E2 )= P(al menos un dado es 3) = 11/36 P(E1 y E2 ) = P(la suma es 7 y un dado es 3) = 2/36
por tanto:
P(E1/E2) = P(E1 ∩ E2)/P(E2) = (2/36) / (11/36) = 2/11 26/03/2019
Jaime Ortega
45
Teoría de Probabilidades Definiciones y Conceptos : Probabilidad Condicional Ejemplo: en una oficina existen 100 computadoras. Unas son marca Canon(C ) y otras Dell (D). Además algunas son nuevas (N) y otras usadas (U); según la siguiente tabla: C
D
Total
N
40
30
70
Se escoge una computadora al azar y ésta es nueva. Cuál la probabilidad que sea Canon?
U
20
10
30
Usando la definición de probabilidad condicional:
Total
60
40
100
E2 = la computadora es nueva = 70/100 por tanto: 26/03/2019
E1 = la computadora es Canon = 60/100
P(E1/E2) = P(E1 ∩ E2)/P(E2) = (40/100) / (70/100) = 4/7 Jaime Ortega
46
Teoría de Probabilidades Definiciones y Conceptos : Eventos Dependientes e Independientes Se dice que dos eventos E1 y E2 son independientes si: P(E1/E2) = P(E1).
Se dice que dos eventos E1 y E2 son dependientes si: P(E1/E2) ≠ P(E1). Comentario: dos lanzamientos sucesivos de dos dados son sucesos independientes. La probabilidad que la suma sea 7: 6/36, es la misma en ambos lanzamientos ! Nota .- Existe una creencia popular llamada "ley del promedio". Según esto, si en el primer lanzamiento la suma fue 7, la probabilidad que la suma sea 7 en el segundo lanzamiento es menor. Esto implicaría que los dados tienen algún tipo de memoria ! Si dos sucesos E1 y E2 son independientes, entonces:
26/03/2019
Jaime Ortega
P(E1 ∩ E2) = P(E1) P(E2) 47
Teoría de Probabilidades Definiciones y Conceptos :
Permutaciones sin repetición
El número de maneras en las cuales se puede seleccionar r objetos de n distintos, tomando en cuenta el orden de selección y sin que estos objetos se repitan, se llama número de permutaciones de n objetos tomados de r, y se denota por: n
P
r
La formula de cálculo es: n
n! Pr n(n 1)......(n r 1) (n r )!
Ejemplo: la combinación de una cerradura es en realidad una permutación en la que el orden importa
26/03/2019
Jaime Ortega
48
Teoría de Probabilidades Definiciones y Conceptos :
Permutaciones sin repetición
Ejemplo: se establece un mecanismo de seguridad de una cerradura en 4 dígitos (clave). Cuantas claves se pueden establecer? Aplicando la formula de cálculo:
n
n! 10! 10 9 8 7 6! Pr n(n 1)......(n r 1) 5040 (n r )! (10 4)! 6!
Con 5 dígitos:
30240
Con 6 dígitos:
151200
26/03/2019
Jaime Ortega
49
Teoría de Probabilidades Definiciones y Conceptos :
Combinaciones
El número de maneras en las cuales se puede seleccionar r objetos de n distintos, sin tomar en cuenta el orden de selección. En términos matemáticos, se llama número de combinaciones de n objetos tomados de r, se denota por: n
C
r
La formula de cálculo es:
n
n n! C r r (n r )!r!
Ejemplo: Un inspector toma muestras de 5 artículos de un lote de 100.
Cuantas muestras distintas puede obtener? 26/03/2019
100
Jaime Ortega
100 100! C 5 5 (100 5)!5! 50
Teoría de Probabilidades Definiciones y Conceptos :
Combinaciones
Si el lote tiene un articulo defectuoso, cuantas muestras distintas que contenga el articulo defectuoso puede obtener ?.
Si es condición que uno de los artículos sea defectuoso, entonces se necesita encontrar el número de maneras muestras de cuatro artículos tomados de los restantes 99. Es decir:
99
26/03/2019
99 99! C4 4 (99 4)!4! Jaime Ortega
51
Teoría de Probabilidades Definiciones y Conceptos :
Combinaciones
Cual es la probabilidad de obtener una muestra que tenga el articulo defectuoso? La probabilidad de tomar una muestra que contenga el articulo defectuoso estará dada por el cociente entre las muestras que tienen el artículo defectuoso y todas las muestras que se puedan extraer. Número de casos posibles: 100𝐶5
Número de casos posibles: 99𝐶4
C4
99
p 26/03/2019
C5
100
0.05 Jaime Ortega
52
Teoría de Probabilidades Definiciones y Conceptos :
Combinaciones
Ejemplo: El número de partidos de futbol de una liga de 11 equipos.
11 11! 11 10 9! C 2 2 (11 2)!2! 9!2! 55
11
26/03/2019
Jaime Ortega
53
Teoría de Probabilidades Definiciones y Conceptos :
Variables Aleatorias
La definición formal menciona que una variable aleatoria o variable estocástica es una función que asigna un valor, usualmente numérico (número real), a un resultado del Espacio Muestral de un experimento aleatorio. En términos simples, una variable aleatoria es la forma de asignar un número particular, a un resultado experimental dado. Se utilizan letras mayúsculas X, Y, ... para designar variables aleatorias, y las respectivas minúsculas (x, y, ...) para designar valores concretos de las mismas. De manera similar a los "datos" o características en observación, mencionados en la Sección de Estadística Descriptiva, la variables aleatorias también pueden ser discretas o continuas.
26/03/2019
Jaime Ortega
54
Teoría de Probabilidades Definiciones y Conceptos : Variables Aleatorias Ejemplo 1: Experimento: medir la temperatura en escala Kelvin. Variable aleatoria: valores medidos de temperatura La variable aleatoria es continua pues tomará valores entre cero e infinito Si se denota a la variable con Y, entonces: Y= ( 0 ≤ T ≤ ∞) donde T es la temperatura.
26/03/2019
Jaime Ortega
55
Teoría de Probabilidades Definiciones y Conceptos : Variables Aleatorias Ejemplo 2: Experimento: se lanza una moneda dos veces Variable aleatoria: número de caras La variable es discreta pues tomará valores de 0,1 y 2. Es decir: Y=(0,1,2)
Otras variables son: la Media, la Varianza y la Desviación Estándar.
26/03/2019
Jaime Ortega
56
Teoría de Probabilidades Distribuciones de Probabilidad La distribución de probabilidad de una variable aleatoria, es una función que asigna a cada valor posible de dicha variable aleatoria, una probabilidad de ocurrencia del mencionado valor. Distribución de Probabilidades Discreta Se utilizan letras mayúsculas X, Y, ... para designar variables aleatorias, y las respectivas minúsculas (x, y, ...) para designar valores concretos de las mismas. Si una variable aleatoria discreta Y, puede tomar valores y1 , y2 , y3 , ... yn con probabilidades de ocurrencia p1 , p2 , p3 , ... pn , donde pi ≥ 0, para todo i, y la suma de las probabilidades es uno, entonces tal situación define una Distribución de Probabilidades Discreta. La probabilidad que Y tome un valor particular y, se denotará como P(Y = y) o simplemente como P(y). 26/03/2019
Jaime Ortega
57
Teoría de Probabilidades Distribuciones de Probabilidad
Distribución de Probabilidades Discreta
La figura ilustra una distribución hipotética de probabilidad discreta, donde la altura de la función p(y) es la que representa la probabilidad..
26/03/2019
Jaime Ortega
58
Teoría de Probabilidades Distribuciones de Probabilidad Distribución de Probabilidades Discreta Definición de función de distribución
En términos matemáticos, una función de distribución de probabilidades, en el caso de una variable aleatoria discreta, es la función de distribución acumulada:
𝐹 𝑌 = 𝑃 𝑌 ≤ 𝑦 ; ∀𝑦 ∈ 𝐸𝑠𝑝𝑎𝑐𝑖𝑜 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 Para dos números reales cualesquiera a y b con a < b tenemos entonces que
P (a < y ≤ b) = P (y ≤ b) - P (y ≤ a)
P (a < y ≤ b) = F(b) – F(a) 26/03/2019
Jaime Ortega
59
Teoría de Probabilidades Distribuciones de Probabilidad Distribución de Probabilidades Discreta Definición de función de distribución Si a, b, c con a < b < c, son valores consecutivos de una variable aleatoria discreta, tenemos entonces que:
P (y ≥ a ) = 1- P (y ≤ a-1 )
Donde a-1 es el número anterior a a
P (y ≥ b ) = 1- P (y ≤ a ) P (y ≥ c ) = 1- P (y ≤ b )
26/03/2019
Jaime Ortega
60
Teoría de Probabilidades Distribución de Probabilidades Discreta Ejemplo: Se lanzan dos dados regulares Variable Aleatoria: La suma de los números de los dos dados Valores de la variable: Y = (2,3,4,............11,12) Por inspección a la tabla anterior la Distribución de Probabilidades será: (trabajo de alumnos)
P(Y=2) = P(2) = 1/36
P(Y=3) = P(3) = 2/36
P(Y=4) = P(4) = 3/36
P(Y=5) = P(5) = 4/36
P(Y=6) = P(6) = 5/36
P(Y=7) = P(7) = 6/36
P(Y=8) = P(8) = 5/36
P(Y=9) = P(9) = 4/36
P(Y=10) = P(10) = 3/36
P(Y=11) = P(11) = 2/36
P(Y=12) = P(12) = 1/36
26/03/2019
Jaime Ortega
61
Teoría de Probabilidades Distribución de Probabilidades Discreta Ejemplo: Se desea realizar un estudio sobre el número de crías en una camada de algún mamífero. Se sabe que el número máximo de crías es 3. Variable Aleatoria:
Y = número de crías en una camada.
Y toma los valores: y = 0,1,2,3 Se sabe también ( por estudios de frecuencia) que las probabilidades son: P(Y=0) = 0.2 P(Y=1) = 0.3 P(Y=2) = 0.3 P(Y=3) = 0.2 26/03/2019
Jaime Ortega
62
Teoría de Probabilidades Distribución de Probabilidades Discreta Ejemplo: Se desea realizar un estudio sobre el número de crías en una camada de algún mamífero. Se sabe que el número máximo de crías es 3. La Función Acumulada de Distribución de Probabilidades o Función de Probabilidades se presenta como sigue:
P(Y=0) = 0.2 P(Y=1) = 0.3 P(Y=2) = 0.3 P(Y=3) = 0.2
26/03/2019
0.0 𝑦<0 0.2 0 ≤ 𝑦 < 1 𝐹 𝑌 = 0.5 1 ≤ 𝑦 < 2 0.8 2 ≤ 𝑦 < 3 1.0 𝑦≥3
Jaime Ortega
63
Teoría de Probabilidades Distribución de Probabilidades Discreta Ejemplo: Se desea realizar un estudio sobre el número de crías en una camada de algún mamífero. Se sabe que el número máximo de crías es 3. 0.0 𝑦<0 0.2 0 ≤ 𝑦 < 1 𝐹 𝑌 = 0.5 1 ≤ 𝑦 < 2 0.8 2 ≤ 𝑦 < 3 1.0 𝑦≥3
Cuál es la probabilidad que una camada tenga dos crías? P(Y=2) = F(2) – F(1) = 0.3
26/03/2019
Jaime Ortega
64
Teoría de Probabilidades Distribución Binomial
Se repite n veces un experimento el cual puede ser un éxito, con probabilidad p, o un fracaso con probabilidad (1-p). El número de éxitos será un número entero entre 0 y n. Considerar todas las maneras posibles de obtener r-éxitos y (n-r) fracasos, el total de combinaciones de éxitos y fracasos es: n
Cr
Por lo tanto, la probabilidad de tener r éxitos (Función de probabilidad de la Distribución Binomial ) está dada por:
P(Y r ) P(r ) n C r pr (1 p) nr n
Es condición indispensable que: 26/03/2019
P(r ) 1 r 0
Jaime Ortega
65
Teoría de Probabilidades Media y Varianza de la Distribución Binomial Media Si Y es una variable aleatoria discreta que toma valores y1 , y2 , y3 , ... yn con probabilidades de ocurrencia p1 , p2 , p3 , ... pn , con pi ≥ 0, para todo i, entonces el valor esperado (medio) de Y esta dado por: N
E (Y ) yi pi i 1
26/03/2019
Jaime Ortega
66
Teoría de Probabilidades Media y Varianza de la Distribución Binomial Varianza Si Y es una variable aleatoria discreta que toma valores y1 , y2 , y3 , ... yn con probabilidades de ocurrencia p1 , p2 , p3 , ... pn , con pi ≥ 0, para todo i, entonces la varianza de Y está dada por:
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑌 = 𝐸
26/03/2019
Jaime Ortega
𝑌 − 𝐸(𝑌)
2
67
Teoría de Probabilidades Media y Varianza de la Distribución Binomial Media Si Y es una variable aleatoria discreta que toma valores y1 , y2 , y3 , ... yn con probabilidades de ocurrencia p1 , p2 , p3 , ... pn , con pi ≥ 0, para todo i, entonces el valor esperado (medio) de Y esta dado por: N
E (Y ) yi pi i 1
Para una distribución Binomial se tiene: N
E (Y ) C r p (1 p) nr r np n
r
r 0
26/03/2019
Jaime Ortega
68
Teoría de Probabilidades Media y Varianza de la Distribución Binomial Media Es importante notar que si una población puede ser descrita por una distribución Binomial, entonces el valor esperado de la distribución es igual al valor teórico de la media poblacional, es decir:
E (Y ) np
26/03/2019
Jaime Ortega
69
Teoría de Probabilidades Media y Varianza de la Distribución Binomial Varianza Si Y es una variable aleatoria discreta que toma valores y1 , y2 , y3 , ... yn con probabilidades de ocurrencia p1 , p2 , p3 , ... pn , con pi ≥ 0, para todo i, entonces la varianza de Y está dada por:
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑌 = 𝐸
𝑌 − 𝐸(𝑌)
2
Para una distribución Binomial se tiene:
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑌 =
26/03/2019
𝑛 𝑟=0
𝑟 − 𝑛𝑝
2 nC
r
P r (1-p)n-r =np (1-p)
Jaime Ortega
70
Teoría de Probabilidades Media y Varianza de la Distribución Binomial Varianza Al igual que en el caso de la media, si una población puede ser descrita por una distribución de probabilidades, entonces el entonces la Varianza de la distribución es igual a la Varianza poblacional. Es decir: N
2 ) ( y pi i 2
i 1
26/03/2019
Jaime Ortega
71
Teoría de Probabilidades Ejemplos En un laboratorio de control de calidad de una empresa eléctrica, se inspecciona una muestra al azar de 10 alternadores instalados. Si se sabe que el 20% de los alternadores están defectuosos. Cuál es la probabilidad de que en la muestra: a) ninguno esté defectuoso
𝑃(𝑌 = 0) = 𝑃(0) = 𝑏(𝑦 = 0; 𝑛 = 10, 𝑝 = 0.2) 10! = ×0.20 ×(1 − 0.2)10−0 = 0.810 = 0.1074 (10 − 0)! 0!
26/03/2019
Jaime Ortega
72
Teoría de Probabilidades Ejemplos En un laboratorio de control de calidad de una empresa eléctrica, se inspecciona una muestra al azar de 10 alternadores instalados. Si se sabe que el 20% de los alternadores están defectuosos. Cuál es la probabilidad de que en la muestra: b) uno salga defectuoso
𝑃(𝑌 = 1) = 𝑃(1) = 𝑏(𝑦 = 1; 𝑛 = 10, 𝑝 = 0.2) 10! = ×0.21 ×(1 − 0.2)10−1 = 0.2684 (10 − 1)! 1!
26/03/2019
Jaime Ortega
73
Teoría de Probabilidades Ejemplos En un laboratorio de control de calidad de una empresa eléctrica, se inspecciona una muestra al azar de 10 alternadores instalados. Si se sabe que el 20% de los alternadores están defectuosos. Cuál es la probabilidad de que en la muestra: c) dos salgan defectuosos
𝑃(𝑌 = 2) = 𝑃(2) = 𝑏(𝑦 = 2; 𝑛 = 10, 𝑝 = 0.2) 10! = ×0.22 ×(1 − 0.2)10−2 = 0.3020 (10 − 2)! 2!
26/03/2019
Jaime Ortega
74
Teoría de Probabilidades Ejemplos En un laboratorio de control de calidad de una empresa eléctrica, se inspecciona una muestra al azar de 10 alternadores instalados. Si se sabe que el 20% de los alternadores están defectuosos. Cuál es la probabilidad de que en la muestra: a) al menos dos salgan defectuosos
𝑃 𝑌 ≥2 =1−𝑃 𝑌 ≤1 = 1 − 𝐵 𝑦 ≤ 1; 𝑛 = 10, 𝑝 = 0.2 = 1 − 0.1074 + 0.2684 = 0.6242 Note que:
26/03/2019
P(y≤ 1) = P(Y=0) + P(Y=1)= P(0) + P(1)
Jaime Ortega
75
Teoría de Probabilidades Ejemplos En un laboratorio de control de calidad de una empresa eléctrica, se inspecciona una muestra al azar de 10 alternadores instalados. Si se sabe que el 20% de los alternadores están defectuosos. Cuál es la probabilidad de que en la muestra: a) más de tres estén con defectos
𝑃(𝑌 ≥ 3) = 1 − 𝑃(𝑦 ≤ 2) = 1 − 𝐵(𝑦 ≤ 2; 𝑛 = 10, 𝑝 = 0.2) = 1 − (0.1074 + 0.2684 + 0.3020) = 0.3222 Note que:
26/03/2019
P(y≤ 2) = P(Y=0) + P(Y=1) + P(Y=2) = P(0) + P(1) + p(2)
Jaime Ortega
76
Teoría de Probabilidades Distribución Binomial Calcular probabilidades binomiales es tedioso incluso para valores relativamente pequeños de n. Cuando n se hace grande, se hace casi imposible sin ayuda de una calculadora o computadora. Existen tablas de probabilidades binomiales acumulativas 1, para valores de n que van de 2 a 4 y para valores seleccionados de p. 26/03/2019
Jaime Ortega
77
Teoría de Probabilidades
26/03/2019
Jaime Ortega
78
Teoría de Probabilidades EXCEL
26/03/2019
Jaime Ortega
79
Teoría de Probabilidades EXCEL P(Y=r) 0,35
0,3
0,25
0,2
0,15
0,1
0,05
0 0
26/03/2019
1
2
3
4
Jaime Ortega
5
6
7
80
Teoría de Probabilidades EXCEL
r 0 1 2 3 4 5 6 7 8 9 10
26/03/2019
F(Y) 0,1074 0,3758 0,6778 0,8791 0,9672 0,9936 0,9991 0,9999 1 1 1
Función de Disribución F(Y) 1
0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0
1
2
3
4
Jaime Ortega
5
6
7
8
9
10
81
Teoría de Probabilidades EXCEL (si n = 100) P(Y=r) 0,12
0,1
0,08
0,06
0,04
0,02
return 0 0
5
10
15
20
25
30
35
40
-0,02
26/03/2019
Jaime Ortega
82
Teoría de Probabilidades EXCEL (si n = 100) F(Y) 1 0,9 0,8
0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0
26/03/2019
5
10
15
20
25
Jaime Ortega
30
35
40
83
Teoría de Probabilidades Gráficas de la Distribución Binomial La figura muestra una distribución binomial con n = 10 pero con diferentes valores de r. Cuando p=0.5, la distribución es exactamente simétrica alrededor de la media: μ=np = 10×0.5.
26/03/2019
Jaime Ortega
84
Teoría de Probabilidades Gráficas de la Distribución Binomial Cuando p = 0.9, la distribución es la “imagen espejo” de la distribución para p =0.1 y está sesgada a la izquierda.
26/03/2019
Jaime Ortega
85
Teoría de Probabilidades La Distribución de Poisson La distribución de Poisson es una distribución de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia, la probabilidad de que ocurra un determinado número de eventos r, durante cierto período de tiempo. El parámetro r, es siempre un número entero. La distribución de probabilidad de Poisson esta dada por:
P(r ) e con r = 0,1,2 ... con 0 r! -
r
Donde:
λ es un número positivo que representa el número de veces que se espera que ocurra el fenómeno durante un intervalo dado. e es la base de los logaritmos naturales (e = 2,71828...) 26/03/2019
Jaime Ortega
86
Teoría de Probabilidades La Distribución de Poisson
Puede demostrarse que:
P(r ) 1 r 0
Estas probabilidades pueden calcularse utilizando la siguiente ecuación de recurrencia:
P(r 1)
26/03/2019
P(r ) (r 1)
Jaime Ortega
87
Teoría de Probabilidades La Distribución de Poisson La distribución de Poisson se utiliza principalmente para describir el número de accidentes que pueden ocurrir en un cierto intervalo de tiempo y como aproximación a la distribución Binomial cuando el parámetro p es pequeño. En la definición de la distribución se tomaron en cuenta las siguientes consideraciones: • Eventos ocurren al azar en un intervalo de tiempo, a una frecuencia promedio de eventos por unidad de tiempo.
• En un intervalo de tiempo de duración t , ocurren en promedio (λt ) eventos. • El número de accidentes en dos intervalos de tiempo diferentes es independiente el uno del otro. • Cada evento tiene dos posibles resultados mutuamente excluyentes 26/03/2019
Jaime Ortega
88
Teoría de Probabilidades La Distribución de Poisson Puede demostrarse que:
N
E ( y ) Varianza( y ) rP (r ) t r 0
La distribución de Poisson como aproximación a la distribución Binomial puede emplearse cuando n > 20 y = np < 5. La distribución de probabilidades se puede graficar para varios valores de λ, como se muestra a continuación.
26/03/2019
Jaime Ortega
89
Teoría de Probabilidades La Distribución de Poisson Ejemplo: En una cierta mina, el número de accidentes no fatales se distribuye con la distribución de Poisson. Por registro de accidentes a lo largo de años, se ha determinado que el número promedio de accidentes es de λ =6 accidentes por año. Cual es la probabilidad de tener un año con menos de dos accidentes ?
Sea Y = numero de accidentes por año.
La ecuación a emplearse es:
Lo que se pide es:
26/03/2019
P(r ) e e 6 r! r! r
6
r
P(Y < 2)
Jaime Ortega
90
Teoría de Probabilidades La Distribución de Poisson Ejemplo: En una cierta mina, el número de accidentes no fatales se distribuye con la distribución de Poisson. Por registro de accidentes a lo largo de años, se ha determinado que el número promedio de accidentes es de λ =6 accidentes por año. Cual es la probabilidad de tener un año con menos de dos accidentes ? En EXCEL:
26/03/2019
λ=
6
r 1 2 3 4 5 6
P(Y=r) 0,014873 0,044618 0,089235 0,133853 0,160623 0,160623
POISSON.DIST(D7;$E$4;FALSE) POISSON.DIST(D8;$E$4;FALSE) POISSON.DIST(D9;$E$4;FALSE) POISSON.DIST(D10;$E$4;FALSE) POISSON.DIST(D11;$E$4;FALSE) Jaime Ortega
91
Teoría de Probabilidades La Distribución de Poisson - Usos
El número de autos que pasan a través de un cierto punto en una ruta (suficientemente distantes de los semáforos) durante un periodo definido de tiempo.
El número de llamadas telefónicas en una central telefónica por minuto.
El número de servidores web accedidos por minuto.
La distribución de la riqueza humana.
Número de préstamos solicitados en un ente financiero
26/03/2019
Jaime Ortega
92
Teoría de Probabilidades La Distribución de Bernoulli La distribución de Bernoulli (o distribución dicotómica), es una distribución de probabilidad discreta, que toma valor 1 para la probabilidad de éxito, p, y valor 0 para la probabilidad de fracaso q, donde q=1-p.
𝑌~𝐵𝑒(𝑝) La función de probabilidad es:
𝑓 𝑦 = 𝑝𝑦 1 − 𝑝
26/03/2019
Jaime Ortega
1−𝑦
93
Teoría de Probabilidades La Distribución de Bernoulli Ejemplo: Se lanza una moneda. Se trata de un sólo experimento, con dos resultados posibles resultados : cara y cruz. Se define la variable aleatoria como: "número de cruces que salen en un lanzamiento". Se trata de un sólo experimento, con dos resultados posibles: el éxito (p) se considerará sacar cruz y vale 0.5. El fracaso (q) que salga cara, q=1 - p =1– 0.5 = 0.5. La variable aleatoria Y se la representa como: 𝑌~𝐵𝑒(0.5) La distribución de probabilidades será:
𝑃 𝑌 = 0 = 𝑃 0 = 0.50 0.51 = 0.5 𝑃 𝑌 = 1 = 𝑃 1 = 0.51 0.50 = 0.5
26/03/2019
Jaime Ortega
94
Teoría de Probabilidades La Distribución de Bernoulli Ejemplos:
La meta de ventas mensuales se logra o supera con una probalidad p, o no se logra con una probabilidad q . Un tratamiento médico puede ser efectivo con probabilidad p, o inefectivo con probabilidad q.
26/03/2019
Jaime Ortega
95
Teoría de Probabilidades Distribuciones Bi-variantes Discretas
Hasta ahora se han considerado distribuciones de probabilidades para una sola variable aleatoria discreta. Tales distribuciones pueden ser extendidas a situaciones en las cuales dos variables aleatorias, X e Y, pueden ser estudiadas simultáneamente. La Probabilidad Conjunta que X tome un valor particular x, y que Y tome un valor y , se denota por:
P(Y,X) = P(X=x, Y=y) La anterior función es tal que:
𝑃 𝑥, 𝑦 = 1 𝑥,𝑦 26/03/2019
Jaime Ortega
96
Teoría de Probabilidades
P ( X x ) P ( x, y )
Distribuciones Bi-variantes Discretas La probabilidad de obtener un valor particular de una variable aleatoria sin tener en cuenta el valor de la otra se llama probabilidad marginal y se calcula mediante:
y
P(Y y ) P( x, y ) x
Ejemplo analizado en la Sección de Probabilidad Condicional, sólo que con tres categorías: En una oficina existen 100 computadoras. Unas son marca Canon(C ) y otras Dell (D) y otras de marca Sony (S). Además algunas son nuevas (N) y otras usadas (U) y un grupo no están siendo empleadas (NE); según la siguiente tabla:
26/03/2019
Jaime Ortega
97
Teoría de Probabilidades Distribuciones Bi-variantes Discretas X
Y
26/03/2019
C
D
S
Total
N
15
28
15
58
U
10
8
10
28
NE
3
4
7
14
Total
28
40
32
100
Jaime Ortega
98
Teoría de Probabilidades Distribuciones Bi-variantes Discretas
En términos de probabilidades: X
Y
26/03/2019
C
D
S
Total
N
0.15
0.28
0.15
0.58
U
0.10
0.08
0.10
0.28
NE
0.03
0.04
0.07
0.14
Total
0.28
0.40
0.32
1
Jaime Ortega
99
Teoría de Probabilidades Distribuciones Bi-variantes Discretas X
C
D
S
Total
N
0.15
0.28
0.15
0.58
U
0.10
0.08
0.10
0.28
NE
0.03
0.04
0.07
0.14
Total
0.28
0.40
0.32
1
Y
26/03/2019
La Distribución Marginal de X, es decir la distribución de probabilidad que las computadoras sean de una u otra marca (C,D,S) es la suma a lo largo de Y.
Jaime Ortega
100
Teoría de Probabilidades Distribuciones Bi-variantes Discretas X
Y
C
D
S
Total
N
0.15
0.28
0.15
0.58
U
0.10
0.08
0.10
0.28
NE
0.03
0.04
0.07
0.14
La Distribución Marginal de Y, es decir la distribución de probabilidad que las computadoras sean Nuevas, Usadas o No Empleadas (N,U,NE) es la suma a lo largo de X. 𝑃 𝑌=𝑁 =
𝑃 𝑥, 𝑛 = 0.15 + 0.28 + 0.15 = 0.58 𝑥
𝑃 𝑌=𝑈 =
𝑃 𝑥, 𝑢 = 0.10 + 0.08 + 0.10 = 0.28 𝑥
Total
0.28
0.40
0.32
1
𝑃 𝑌 = 𝑁𝐸 =
𝑃 𝑥, 𝑛𝑒 = 0.03 + 0.04 + 0.07 = 0.14 𝑥
26/03/2019
Jaime Ortega
101
Teoría de Probabilidades DISTRIBUCIONES CONTINUAS Hasta ahora se consideraron distribuciones discretas donde la variable aleatoria puede tomar solamente un conjunto discreto de valores. En esta sección se considerarán distribuciones continuas donde la variable aleatoria puede tomar cualquier valor en algún intervalo especifico. Se vio la manera en la cual observaciones hechas sobre una variable continua pueden ser representadas en un histograma. En tanto se hagan más y más observaciones y el intervalo de clase se haga mas pequeño, el histograma puede aproximarse por una curva continua llamada curva de frecuencia 26/03/2019
Jaime Ortega
102
Teoría de Probabilidades Distribuciones Continuas En el gráfico, si la permeabilidad de las muestras analizadas se considera una variable aleatoria (Y) y la curva puede describirse en términos estándares tal que el área bajo la misma sea igual a la unidad, entonces el gráfico se llama curva de probabilidad. La altura de la curva de probabilidad en cualquier punto Y se denota por f(y) y a esta función se la llama función de densidad de probabilidades o f.d.p.
26/03/2019
Jaime Ortega
103
Teoría de Probabilidades DISTRIBUCIONES CONTINUAS La función de densidad de probabilidades debe satisfacer las siguientes condiciones: 𝑎
Recordar que para una variable aleatoria discreta se tiene:
𝑓 𝑦 ≥ 0 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑦 +∞
𝑏
𝑃 𝑦 =1
𝑓 𝑦 𝑑𝑦 = 1 𝑦
−∞
(c) Para cualquier a, b tal que a b b
se tiene que : P(a Y b) f ( y )dy
P (a < y ≤ b) = P (y ≤ b) - P (y ≤ a)
a
26/03/2019
Jaime Ortega
104
Teoría de Probabilidades Distribuciones Continuas Observaciones
Con respecto a las tres propiedades anotadas debe decirse lo siguiente: 1.- La función es siempre positiva. 2.- El área bajo la curva (suma de las probabilidades) es igual a uno
26/03/2019
Jaime Ortega
105
Teoría de Probabilidades Distribuciones Continuas Observaciones 3.- Cuando la variable aleatoria es continua, sólo se puede encontrar la probabilidad de observar un valor en un cierto rango lo que implica que el valor de f(y) NO ES LA PROBABILIDAD de observar Y. Esto último se debe al hecho que los valores posibles de Y no son contables, no se puede hablar del i-ésimo valor de Y y por lo tanto p(Yi) no tiene significado alguno.
26/03/2019
Jaime Ortega
106
Teoría de Probabilidades DISTRIBUCIONES CONTINUAS Observaciones Para el caso de estimar la probabilidad que y sea mayor o menor a un valor dado, b, se tiene:
26/03/2019
Jaime Ortega
107
Teoría de Probabilidades DISTRIBUCIONES CONTINUAS Función de Distribución Acumulada Otra forma de describir una distribución de probabilidades acumulada (f.d.a) definida como:
es mediante la función de distribución
yo
F (Y ) f ( y )dy
Esta función es el área bajo la curva de la función de densidad. Su gráfico consiste en una curva sigmoidea similar a la observada en la sección de Estadística descriptiva
26/03/2019
Jaime Ortega
108
Teoría de Probabilidades DISTRIBUCIONES CONTINUAS
F (Y )
Función de Distribución Acumulada
xo
f ( y)dy
26/03/2019
Jaime Ortega
109
Teoría de Probabilidades Distribuciones Continuas: Media y Varianza Valor Esperado (Media)
El valor esperado de una variable aleatoria continua esta dado por:
E (Y )
yf ( y)dy
Varianza
La Varianza de una variable aleatoria continua esta dada por:
Varianza (Y ) E[(Y ) 2 ] (Y ) 2 f ( y )dy donde E (Y )
26/03/2019
Jaime Ortega
110
Teoría de Probabilidades Distribución Normal La Distribución Normal, también llamada Distribución de Gauss o Distribución Gaussiana, es la distribución de probabilidad que con más frecuencia aparece en estadística y teoría de probabilidades. Esto se debe a dos razones fundamentalmente:
Su función de densidad es simétrica y con forma de campana, lo que favorece su aplicación como modelo a gran número de variables estadísticas.
Es el límite de otras distribuciones (Binomial, Poisson) y aparece relacionada con multitud de resultados ligados a la teoría de las probabilidades gracias a sus propiedades matemáticas: Caracteres morfológicos de individuos, efectos fisiológicos como el efecto de un fármaco, caracteres sociológicos como el consumo de cierto producto por un mismo grupo de individuos, caracteres psicológicos como el cociente intelectual, errores cometidos al medir ciertas magnitudes, valores estadísticos muestrales como la media 26/03/2019
Jaime Ortega
111
Teoría de Probabilidades Distribución Normal La función de densidad de la distribución normal es:
f ( y)
1 (2 )
2 ( y )
e
2 2
con y
donde μ y σ son parámetros tales que - ∞< μ < +∞ y σ > 0.
26/03/2019
Jaime Ortega
112
Teoría de Probabilidades Distribución Normal La gráfica de la Distribución Normal es:
26/03/2019
Jaime Ortega
113
Teoría de Probabilidades Distribución Normal La gráfica de la Distribución Acumulada de la Distribución Normal es:
26/03/2019
Jaime Ortega
114
Teoría de Probabilidades Distribución Normal
Puede demostrarse que:
E (Y )
y
Varianza (Y )
Lo anterior indica que los parámetros que caracterizan a la distribución normal, μ y σ2 , son la esperanza y Varianza de Y, respectivamente.
26/03/2019
Jaime Ortega
115
Teoría de Probabilidades Distribución Normal Estándar La integral de la función de densidad de probabilidades de la Distribución Normal, no puede evaluarse por métodos ordinarios; sin embargo, métodos de integración numérica han sido empleados para evaluar y tabular los resultado de dicha integral. Tal proceso se lleva a cabo haciendo la transformación:
z = (Y-μ)/σ De esta manera, la función acumulada estándar se denota por:
G( z)
z2
e
2
dz
En el caso de la función de distribución estándar puede probarse que μ= 0 y 𝜎 2 = 1
26/03/2019
Jaime Ortega
116
Teoría de Probabilidades Distribución Normal Estándar La gráfica de la Distribución Normal Estándar es:
26/03/2019
Jaime Ortega
117
Teoría de Probabilidades Propiedades Distribución Normal Estándar Es simétrica respecto de su media La moda y la mediana son ambas iguales a la media. Los puntos de inflexión de la curva se dan para z = μ ±σ En el intervalo [ μ − σ , μ + σ ] se encuentra comprendida aproximadamente, el 68,26% de la distribución
26/03/2019
Jaime Ortega
118
Teoría de Probabilidades Tablas de la Distribución Normal Estándar La Distribución Normal Estándar se encuentra integrada y sus valores presentan en una tabla como: Z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.0000
0.0040
0.0080
0.0120
0.0160
0.0199
0.0239
0.0279
0.0319
0.0359
0.1
0.0398
0.0438
0.0478
0.0517
0.0557
0.0596
0.0636
0.0675
0.0714
0.0753
0.2
0.0793
0.0832
0.0871
0.0910
0.0948
0.0987
0.1026
0.1064
0.1103
0.1141
0.3
0.1179
0.1217
0.1255
0.1293
0.1331
0.1368
0.1406
0.1443
0.1480
0.1517
0.4
0.1554
0.1591
0.1628
0.1664
0.1700
0.1736
0.1772
0.1808
0.1844
0.1879
0.5
0.1915
0.1950
0.1985
0.2019
0.2054
0.2088
0.2123
0.2157
0.2190
0.2224
0.6
0.2257
0.2291
0.2324
0.2357
0.2389
0.2422
0.2454
0.2486
0.2517
0.2549
0.7
0.2580
0.2611
0.2642
0.2673
0.2704
0.2734
0.2764
0.2794
0.2823
0.2852
3.0
0.4987
0.4987
0.4987
0.4988
0.4988
0.4989
0.4989
0.4989
0.4990
0.4990
26/03/2019
Jaime Ortega
119
Teoría de Probabilidades Tablas de la Distribución Normal Estándar Para saber el área debajo de la curva entre 0 y 0.45, se ubica la intersección de fila de 0.4 y la columna 0.05, que corresponde al valor 0.1736. Como la curva es simétrica, la tabla también es válida para 0.45y 0, que también tiene un área de 0.1736. Z
26/03/2019
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.0000
0.0040
0.0080
0.0120
0.0160
0.0199
0.0239
0.0279
0.0319
0.0359
0.1
0.0398
0.0438
0.0478
0.0517
0.0557
0.0596
0.0636
0.0675
0.0714
0.0753
0.2
0.0793
0.0832
0.0871
0.0910
0.0948
0.0987
0.1026
0.1064
0.1103
0.1141
0.3
0.1179
0.1217
0.1255
0.1293
0.1331
0.1368
0.1406
0.1443
0.1480
0.1517
0.4
0.1554
0.1591
0.1628
0.1664
0.1700
0.1736
0.1772
0.1808
0.1844
0.1879
Jaime Ortega
120
Teoría de Probabilidades Tablas de la Distribución Normal Estándar
Retorno
26/03/2019
Jaime Ortega
121
Teoría de Probabilidades Tablas de la Distribución Normal Estándar
26/03/2019
Jaime Ortega
122
Teoría de Probabilidades
En EXCEL
26/03/2019
Jaime Ortega
123
Teoría de Probabilidades
En EXCEL
26/03/2019
Jaime Ortega
124
Teoría de Probabilidades Ejemplo de Empleo de la Distribución Normal Estándar Las resistencias individuales a la tracción de tubos de acero para un gasoducto, se distribuye aproximadamente normal con media 24 MPa y desviación estándar 3. El consumidor requiere que al menos 95 % de las tubos tengan una resistencia mayor a 20 MPa. Cumplen dichas barras con las especificaciones del cliente? Si se define a Y como la resistencia de los tubos, entonces se pide verificar que :
P(Y > 20) ≥ 0.95
P(Y >20) = P[Z ≥ (20 - 24)/3 ] = P[Z ≥ -1.33]= 1-P [Z<-1.33] = 1-0,0918 =0.9082. Se concluye que sólo 91 % de las barras tiene una resistencia mayor a 20 y por tanto el lote no cumple con las especificaciones del cliente.
26/03/2019
Jaime Ortega
125
Teoría de Probabilidades Ejemplo de Empleo de la Distribución Normal Estándar en EXCEL P(Y > 20) ≥ 0.95
P(Y >20) = P[Z ≥ (20 - 24)/3 ] = P[Z ≥ -1.33]= 1-P [Z<-1.33] = 1-0,0918 =0.9082. Se observa que barras que tiene una resistencia mayor a 19 Mpa son el 95%
26/03/2019
Jaime Ortega
126
Teoría de Probabilidades Distribución Normal Estándar: Cálculo de Probalidad
Se sabe que los pesos individuales de tornillos de un cierto lote se distribuyen normalmente con media μ= 2.10 gramos y desviación estándar σ= 0.15 gramos. Qué proporción (probabilidad) de tornillos pesará más de 2.55 gramos? Lo que se pide es calcular :
P(Y > 2.55) = 1 - P(Y ≤2.55)
Haciendo la transformación:
Z = (Y - μ)/ σ se tiene:
P(Y > 2.55) = 1 - P ( Z ≤ (2.55 - 2.10)/0.15) ) = 1 - P( Z < 3)
Ver tabla
= 1 - G(3) = 1 - 0.9987 = 0.0013 .
26/03/2019
Conclusión: El 0.13 % de los tornillos pesan más de 2.55 gramos. Jaime Ortega
127
Teoría de Probabilidades Distribución Normal Estándar: Cálculo de Probalidad En una ciudad se estima que la temperatura máxima en el mes de junio sigue una distribución normal, con media 23° y desviación típica 5°. Calcular el número de días del mes en los que se espera alcanzar máximas entre 21° y 27°
21 − 23 23 − 27 𝑃 21 < 𝑌 ≤ 27 = 𝑃 <𝑍≤ = 5 5 = 𝑃 −0.4 < 𝑍 ≤ 0.8 = 𝑃 𝑍 ≤ 0.8 − (1 − 𝑃 𝑍 ≤ 0.4 ) =
= 0.7881 − 1 − 0.6554 = 0.4425 × 30 = 13
26/03/2019
Jaime Ortega
128
Teoría de Probabilidades Usos de la Distribución Normal
1. Muchas mediciones físicas están normalmente distribuidas. En general, tales mediciones son de dos tipos: aquellas en que las variaciones son causadas por errores de observación y las que se hacen sobre poblaciones que presentan variaciones naturales (longitud y peso de individuos biológicos). 2. En la aplicación del Teorema del Limite Central. Este teorema establece que si muestras de tamaño n se toman de una población que no necesariamente tiene una Distribución Normal, con media y desviación estándar, entonces las medias muestrales tenderán a tener una Distribución Normal en la medida que n se incremente. 3. Los montos de dinero en las solicitudes de préstamos hipotecarios 4. Ventas mensuales de commodities
26/03/2019
Jaime Ortega
129
Teoría de Probabilidades Distribución Exponencial
Gráfica de la Función de densidad de probabilidad
La función de densidad de la Distribución Exponencial es:
e f ( y) 0
y
y0 y0
donde el parámetro λ > 0
26/03/2019
Jaime Ortega
130
Teoría de Probabilidades Distribución Exponencial
Gráfica de la Función de Distribución de probabilidad
La función de Distribución de Probabilidades (distribución acumulada) es:
1 e F ( y) 0
26/03/2019
y
y0 y0
Jaime Ortega
131
Teoría de Probabilidades Distribución Exponencial La media y la Varianza están dadas por:
E (Y ) ye dy y
0
V (Y ) E Y
26/03/2019
2
1
2
1 1 y 1 y e dy 2 0
Jaime Ortega
132
Teoría de Probabilidades Distribución Exponencial Las aplicaciones más comunes de la Distribución Exponencial son la descripción de la distribución de tiempos de falla, soluciones al problema de la teoría de colas y como aproximación a la Distribución de Poisson. Ejemplo
Se sabe que la vida de un cierto componente electrónico tiene una distribución exponencial con una vida 1 media de 100 horas (100= ). Que proporción de dichos componentes fallará antes de 50 horas? 𝜆
La probabilidad que un componente falle antes de 50 horas se la calcula cuando Y ≤ 50 en la función de distribución acumulativa. Esto es:
P(Y 50) F (50) 1 e50/100 0.393 26/03/2019
Jaime Ortega
133
Teoría de Probabilidades Distribución Exponencial La probabilidad que un componente falle antes de 40, 60 y 70 horas, será:
P(Y 40) F (40) 1 e40/100 0.329
P(Y 50) F (50) 1 e50/100 0.393
P(Y 60) F (60) 1 e60/100 0.451 P(Y 70) F (70) 1 e70/100 0.503 P(Y 80) F (80) 1 e80/100 0.550
26/03/2019
Jaime Ortega
134
Teoría de Probabilidades Distribución Exponencial Probabilidad de Duración del Componente
Graficando:
26/03/2019
0,095163 0,181269 0,259182 0,32968 0,393469 0,451188 0,503415 0,550671 0,59343 0,632121 0,667129 0,698806
0,7
Probabilidad de duracion
10 20 30 40 50 60 70 80 90 100 110 120
0,8
0,6
0,5
0,4
0,3
0,2
0,1
0
0
20
40
60
80
100
120
140
Horas
Jaime Ortega
135
Teoría de Probabilidades Distribución Exponencial EXCEL:
26/03/2019
Jaime Ortega
136