DISTRIBUCIÓN BINOMIAL JORGE MEDINA
b. La probabilidad de éxito, representada por p, permanece constante de ensayo a ensayo. La probabilidad de fracaso, 1-p, se denota por q. c. Los ensayos son independientes, es decir, el resultado de cualquier ensayo particular no es afectado por el resultado del otro ensayo. 2. CÁLCULO DE PROBABILIDADES CON LA DISTRIBUCIÓN BINOMIAL Al estudiar la distribución binomial se tiene interés en calcular la probabilidad de obtener x éxitos de un total de n ensayos de Bernoulli. Este cálculo se realiza con:
Ejemplo: En cierta población la prevalencia de alergia es de 20%. Si se selecciona una muestra aleatoria de n=10. Calcular : a. La probabilidad de que la muestra contenga exactamente un alérgico. Solución: Datos: Éxito= tener alérgia ∴ p = 0,2 y q = 0,8 n = 10 x=1 Luego: p(X=1)= 10! (0,2)1 (0,8)9 1!9! = 10 (0,2)(0,8)9
1. INTRODUCCION: Es una distribución de probabilidad de variables discretas. Bernoulli es el autor de esta distribución. Ensayo de Bernoulli: Es cualquier ensayo de algún experimento que conduce sólo a uno de dos resultados mutuamente excluyentes, tales como: vivo o muerto; enfermo o saludable; + ó – De una sucesión de ensayos de Bernoulli se obtiene la distribución binomial. La formación de un proceso de Bernoulli se efectúa bajo las siguientes condiciones. a. Cada ensayo conduce a uno de dos resultados mutuamente excluyentes. Uno de los resultados posibles se denomina (arbitrariamente) éxito y el otro fracaso.
p(X = x) = Donde:
n! p x qn- x x!(n - x)!
X = variable aleatoria x = 0,1,2,3,....n
Se demuestra que la distribución binomial es una distribución de probabilidad ya que: a. p(x) ≥ 0 b. ∑ p(x) =1 La distribución binomial tiene dos parámetros: n y p La media de la distribución binomial es: µx = np La desviación estándar es: σx = √npq
b. La probabilidad de que la muestra incluya menos de dos alérgicos Solución: p = 0,2 q = 0,8 n = 10 p(X<2) = p(X=0) + p(X=1) = 10! (0,2)0 (0,8)10 + 0,2684 0!10! = 0,1074 + 0,2684 p(X<2) = 0,3758
p(X=1) = 0,2684
1
DISTRIBUCION NORMAL • • •
DISTRIBUCION NORMAL
Polígono de frecuencias
• Como toda figura geométrica en el plano, la curva normal posee una fórmula o ecuación denominada tambien Función de densidad de la variable aleatoria continua que es la siguiente:
Curva normal
y=
y Si n→ ∞ e i→ 0
Xi
x
Es una distribución de probabilidad de variables continuas. El matemático Gauss contribuyó notablemente en el estudio y difusión de esta distribución. La mayoría de las variables continuas tienen polígonos de frecuencias que permiten visualizar un aumento gradual hasta llegar a un máximo y luego un descenso igualmente gradual. Así:
µ
Características más importantes de la distribución normal 1. Es simétrica respecto a la media, µ. 2. La media, la mediana y la moda son iguales. 3. El área total debajo de la curva y el eje x es igual a una unidad cuadrada 4. Si se levantan perpendiculares a una distancia de una desviación estándar a ambos lados de la media, se habrá delimitado aproximadamente el 68% del área total.
Xi
e 1 2π σ
−
1 x− µ 2 σ
2
(1) -∞ < x < ∞
Donde: y = altura de la curva en el punto x µ = media aritmética de la distribución σ = desviación estándar de la distribución
Si se extienden estas perpendiculares hasta dos desviaciones estándar, se define aproximadamente el 95% del área total y con 3 desviaciones estándar aproximadamente el 100%. Así:
0,68
µ-σ µ
0,95
µ+σ
Xi
µ-2σ
µ
µ+2σ
Xi
5. La normal queda completamente determinada por los parámetros µ y σ
2
Distribución normal unitaria o normal estándar • Tiene una media de cero y desviacion estandar de uno • Se obtiene a partir de la ecuación (1), haciendo µ=0, σ=1 y x - µ = z σ Donde z es una variable aleatoria con distribución normal. Luego:
σ=1
0
zi
2
De la tabla de áreas se obtiene: p(0 ≤ z ≤ 2) = 0,4772 Interpretación: La probabilidad de que la variable z asuma valores entre 0 y 2 inclusive, es 0,4772
0,84 2,45
Se utiliza la tabla de áreas. Ejemplo 1: Calcular el área entre z=0 y z=2 Solución: Se recomienda graficar la curva normal y sombrear el área solicitada para facilitar la resolución del problema. Así:
Ejemplo 2: Si de la población de posibles valores de z, se elige uno al azar, ¿ cuál es la probabilidad de que se encuentre entre 0,84 y 2,45 inclusive? Solución: La pregunta permite calcular: p(0,84 ≤ z ≤ 2,45) = ? Veamos el gráfico siguiente:
Ejemplo 3: Calcular p(z≥2,71). Solución: Graficando:
σ=1
0
Cálculo de área o probabilidad en la curva normal estándar
De la tabla: área entre 0 y z=2,71 → 0,4966
zi
De la tabla: área entre 0 y z=2,45 →0,4929 área entre 0 y z=0,84 →0,2995 ∴p(0,84 ≤ z ≤ 2,45) = 0,4929 - 0,2995= 0,1934 Interpretación: La probabilidad de que una z elegida al azar quede entre 0,84 y 2,45 es de 0,1934 ó el 19,34% de los valores de z están entre 0,84 y 2,45.
σ=1
0
2,71
zi
Luego: p(z≥2,71)=0,5 - 0,4966 =0,0034.
Interpretación: La probabilidad de que un valor de z sea mayor o igual a 2,71 es de 0,0034.
3
Cálculo de áreas en una curva normal cualquiera Ejemplo: Los niveles de colesterol total en la población general se distribuyen normalmente con µ=200 y σ= 20. Si de esta población se selecciona un sujeto al azar, ¿ cúal es la probabilidad de que: a. tenga un valor entre 170 y 230? Solución:
0
1,50
σ=20
170
200
Xi
230
Se transforman o estandarizan los valores de xi en términos de z. x − µ 230 − 200 =1,50 = z1 = 1 20 σ x − µ 170 − 200 = = −1,50 z2 = 2 σ 20
b. Tenga un valor de 270 ó más. Solución: p(x≥270) =?
σ=1
-1,50
Se solicita: p(170≤x≤230)=?. En el gráfico, el área que debemos calcular aparece sombreada:
σ=20
zi
Luego: p(170≤x≤230)= p(-1,50≤z≤1,50)=?. De la tabla: p(-1,50≤z≤1,50)= 0,4332 + 0,4332 = 0,8664 Interpretación: La probabilidad de que un sujeto seleccionado al azar tenga un nivel de colesterol entre 170 y 230, es de 0,8664
200
270
xi
σ=1 0
3,50
zi
Cálculo de z: Z= 270 – 200=3,50 20 Luego: p(x≥270)=p(z≥3,50) = 0,5 - 0,4998 = 0,0002.
Interpretación: La probabilidad de que un sujeto elegido al azar tenga un nivel de colesterol de 270 ó más, es de 0,0002
4