DISTRIBUCIÓN BINOMIAL
1. INTRODUCCION: Es una distribución de probabilidad de variable discreta y Bernoulli es el autor de esta distribución. Ensayo de Bernoulli: Es cualquier ensayo de algún experimento que conduce sólo a uno de dos resultados mutuamente excluyentes, tales como: vivo o muerto; enfermo o saludable; + ó – De una sucesión de ensayos de Bernoulli se obtiene la distribución binomial. La formación de un proceso de Bernoulli se efectúa bajo las siguientes condiciones. A. Se tiene un número finito de ensayos B. Cada ensayo conduce a uno de dos resultados
C. La probabilidad de éxito, representada por p, permanece constante de ensayo a ensayo. La probabilidad de fracaso, 1-p, se denota por q. D. Los ensayos son independientes, es decir, el resultado de cualquier ensayo particular no es afectado por el resultado del otro ensayo. 8. CÁLCULO DE PROBABILIDADES CON LA DISTRIBUCIÓN BINOMIAL Al estudiar la distribución binomial se tiene interés en calcular la probabilidad de obtener x éxitos de un total de n ensayos de Bernoulli.
n! x n-x p(X = x) = pq x!(n - x)! Donde:
X = variable aleatoria x = 0,1,2,3,....n
Se demuestra que la distribución binomial es una distribución de probabilidad ya que: • P(x) ≥ 0 ∀ ∑ P(x) =1 La distribución binomial tiene dos parámetros: n yp La media de la distribución binomial es: µx = np La desviación estándar es: σ = √npq
Ejemplo: En cierta población la prevalencia de alergia es de 20%. Si se selecciona una muestra aleatoria de n=10. Calcular : • La probabilidad de que la muestra contenga exactamente un alérgico. Solución: Datos: Éxito= tener alérgia ∴ p = 0,2 y q = 0,8 n = 10 x=1 Luego: P(X=1)= 10! (0,2)1 (0,8)9 1!9! = 10 (0,2)(0,8)9 P(X=1) = 0,2684
a. La probabilidad de que la muestra incluya menos de dos alérgicos Solución: p = 0,2 q = 0,8 n = 10 P(X<2) = P(X=0) + P(X=1) = 10! (0,2)0 (0,8)10 + 0,2684 0!10! = 0,1074 + 0,2684 P(X<2) = 0,3758 c. La probabilidad de que la muestra incluya dos o más alérgicos. d. La probabilidad de que la muestra incluya entre uno y tres alérgicos inclusive.
DISTRIBUCION NORMAL
DISTRIBUCION NORMAL • • •
Es una distribución de probabilidad de variablecontinua. El matemático Gauss contribuyó notablemente en el estudio y difusión de esta distribución. La mayoría de las variables continuas tienen polígonos de frecuencias que permiten visualizar un aumento gradual hasta llegar a un máximo y luego un descenso igualmente gradual. Así:
Polígono de frecuencias
Curva normal
y Si n→ ∞ e i→ 0
Xi
x
µ
Xi
• Como toda figura geométrica en el plano, la curva normal posee una fórmula o ecuación denominada tambien Función de densidad de la variable aleatoria continua que es la siguiente: 2 1 x −μ
e 1 y= 2π σ
− 2 σ
(1) -∞ < x < ∞
Donde: y = altura de la curva en el punto x µ = media aritmética de la distribución σ = desviación estándar de la distribución
• • • •
Características más importantes de la distribución normal
Es simétrica respecto a la media, µ. La media, la mediana y la moda son iguales. El área total debajo de la curva y por encima del eje x es igual a una unidad cuadrada Si se levantan perpendiculares a una distancia de una desviación estándar a ambos lados de la media, se habrá delimitado aproximadamente el 68.26% del área total.
Si se extienden estas perpendiculares hasta dos desviaciones estándar, se define como 95.44% del área total y con 3 desviaciones estándar aproximadamente el 99.74%. Así:
0,6826
µ-σ µ
µ+σ
0,9544
Xi
µ-2σ
µ
µ+2σ Xi
5. La normal queda completamente determinada por los parámetros µ y σ
Distribución normal unitaria o normal estándar • Tiene una media de cero y desviación estándar de uno • Se obtiene a partir de la ecuación (1), haciendo µ=0, σ=1 y x - µ = z σ Donde z es una variable aleatoria con distribución normal. Luego:
Cálculo de área o probabilidad en la curva normal estándar Se utiliza la tabla de áreas. Ejemplo 1: Calcular el área entre z= -∞ y z=2 Solución: Se recomienda graficar la curva normal y sombrear el área solicitada para facilitar la resolución del problema. Así:
σ=1
0
2
zi
De la tabla de áreas se obtiene: P(z ≤ 2) = 0,9772 Interpretación: La probabilidad de que la variable z asuma valores entre -∞ y 2 inclusive, es 0,9772
Ejemplo 2: Si de la población de posibles valores de z, se elige uno al azar, ¿ cuál es la probabilidad de que se encuentre entre 0,84 y 2,45 inclusive? Solución: La pregunta permite calcular: P(0,84 ≤ z ≤ 2,45) = ? Veamos el gráfico siguiente:
σ=1
0 0,84 2,45
zi
De la tabla: área entre -∞ y z=2,45 →0,9929
área entre -∞ y z=0,84 →0,7995 ∴P(0,84 ≤ z ≤ 2,45) = 0,9929 - 0,7995= 0,1934 Interpretación: La probabilidad de que una z elegida al azar quede entre 0,84 y 2,45 es de 0,1934 ó el 19,34% de los valores de z están entre 0,84 y 2,45.
Ejemplo 3: Calcular P(z≥2,71). Solución: Graficando: De la tabla: área entre -∞ y z=2,71 → 0,9966
σ=1
0
2,71
zi
Luego: P(z≥2,71)=1,00,9966 =0,0034.
Interpretación: La probabilidad de que un valor de z sea mayor o igual a 2,71 es de 0,0034.
Cálculo de áreas en una curva normal cualquiera Ejemplo: Los niveles de colesterol total en la población general se distribuyen normalmente con µ=200 y σ= 20. Si de esta población se selecciona un sujeto al azar, ¿ cúal es la probabilidad de que: • tenga un valor entre 170 y 230? Solución:
Se solicita: P(170≤x≤230)=?. En el gráfico, el área que debemos calcular aparece sombreada: σ=20
170
200 230
Xi
Se transforman o estandarizan los valores de xi en términos de z. x1 −µ 230−200 z1 = = =1,50 σ 20 x2 −µ 170−200 z2 = = =−1,50 σ 20
σ=1
-1,50
0
1,50
zi
Luego: P(170≤x≤230)= P(-1,50≤z≤1,50)=?. De la tabla: P(-1,50≤z≤1,50)= 0,9332 - 0,0668 = 0,8664 Interpretación: La probabilidad de que un sujeto seleccionado al azar tenga un nivel de colesterol entre 170 y 230, es de 0,8664
b. Tenga un valor de 270 ó más. Solución: p(x≥270) =? σ=20 200
270
xi
σ=1 0
3,50
zi
Cálculo de z: Z= 270 – 200=3,50 20 Luego: P(x≥270)=P(z≥3,50) = 1 - 0,9998 = 0,0002.
Interpretación: La probabilidad de que un sujeto elegido al azar tenga un nivel de colesterol de 270 ó más, es de 0,0002
b.1 Calcular el valor de la mediana y moda • C. A partir de que valor del colesterol se localiza el 10% superior de la población? • D. Entre que valores de colesterol se localiza el 80% central de la población?