Probabilidad y Estad´ıstica Unidad 1 Luis Rodr´ıguez y Javier Rojas 16 de octubre de 2002
1
Espacio Muestral
Desde el punto de vista axiom´atico, las matem´aticas se ocupan de relaciones entre cosas indefinidas. Para hablar con presici´on de cualquier rama matem´atica, entre ellas la que nos ocupa, la probabilidad, es necesario especificar nuestros elementos no definidos. Partiremos de la idea de conjunto de todos los resultados posibles de un experimento, al cual llamaremos espacio muestral Ω. Ejemplo: Si lanzamos una moneda dos veces, el espacio muestral est´a dado por: Ω = {(c, c), (c, s), (s, c), (s, s)}. Para que el espacio muestral est´e bien definido, cada punto muestral (resultado posible del experimento) queda descrito por un s´olo punto del espacio. Los puntos muestrales se denotan por w. Definimos por evento a un agregado de puntos muestrales. Denotaremos los eventos por las letras may´ usculas A, B, C, . . . . Un evento A ocurre cuando alguno de los puntos muestrales ocurre. En el ejemplo anterior A = {el primer lanzamiento es cara} es un evento y queda expresado por los puntos muestrales A = {(c, c), (c, s)}.
2
Relaciones entre eventos
Definimos el evento A uni´ on B (A ∪ B) como aquel que ocurre si A ocurre, B ocurre o si ocurren ambos simultaneamente. El evento A intersecci´ on B (A ∩ B) es aquel que ocurre si A y B ocurren simultaneamente. Definimos el evento complementario (Ac ) como aquel que ocurre si A no ocurre. El evento imposible lo denotamos ∅. Definimos para nuestro ejemplo los eventos A, B y C como A = {el primer lanzamiento es cara} B = {el segundo lanzamiento es sello} C = {el primer lanzamiento es sello} 1
entonces, A ∪ B = {(c, c)} ∪ {(s, s), (c, s)} = {(c, s), (c, c), (s, s)} A ∩ B = {(c, s), (c, c)} ∩ {(s, s), (c, s)} = {(c, s)} A ∪ C = {(c, s), (c, c)} ∪ {(s, s), (s, c)} = {(c, s), (c, c), (s, s), (s, c)} = Ω A∩C =∅ Ac = C
3
Familias de eventos
Una familia de eventos F de Ω es cualquier agregado de eventos de Ω. Las familias de eventos F que consideramos deben satisfacer las condiciones: 1. Ω ∈ F, es decir, algo siempre ocurre. 2. Si A ∈ F entonces Ac ∈ F. 3. Si A1 , . . . , An , . . ., es una sucesi´on en F alguno de los Ak ocurre, esto es # " ∞ [ Ak ∈ F (∀k = 1, . . .) Ak ∈ F ⇒ k=1
Una familia que satisface las condiciones 1, 2 y 3 es una σ-´ algebra sobre Ω. LA familia de las partes de Ω (P(Ω) = {A : A ⊆ Ω}) es una σ-´algebra sobre Ω. Cuando Ω es discreto consideramos P(Ω) la σ-´algebra can´onica.
4
Asignaci´ on de probabilidades
Dado un espacio muestral Ω y una σ-´alegbra de eventos F decimos que una funci´on P : Ω → [0, 1] que satisface: 1. P(Ω) = 1. 2. Si An ∈ F y los eventos son mutuamente excluyentes , esto es, (∀n, n0 ∈ N)[An ∩ An0 = ∅], entonces Ã∞ ! ∞ [ X P An = P(An ) n=1
n=1
Un espacio de probabilidad es una terna (Ω, F, P). El problema de como asignar una probabilidad a cada evento P(A), es decir, como definir una tal P sobre una σ-´algebra de eventos debe ser resuelto con las condiciones concretas de cada 2
experimento aleatorio considerado. En el caso cuando Ω es discreto y finito una manera de asignar probabilidades sobre F = P(Ω) es definir: #A 1 P(A) = #Ω Demueste que la funci´on definida anteriormente es una probabilidad. Demuestre qe si Ω = {w1 . . . wn } y P({wi }) = p entonces p = 1/n. En la pr´actica la composici´on del espacio muestral se conoce muy pocas veces, por lo que los valores exactos de las probabilidades de los eventos son desconocidas. En estos casos recurrimos a la noci´on de frecuencia relativa. El procedimiento es el siguiente: si A ∈ F, repetimos la experiencia N veces y observamos la veces que A ocurre. Si en N repeticiones A ocurre KN veces, llamaremos frecuencia relativa a fN =
KN N
al definir P(A) = fN tenemos dos dificultades principales: 1. Tendr´ıamos que precisar las condiciones de repetici´on del experimento y que significa observar A en ese caso. 2. Nada asegura que KN sea siempre el mismo cada vez que se realizan las N observaciones, por lo tanto P(A) no es u ´nico. Sin embargo, m´as adelante estudiaremos un resultado que permite ver la relaci´on de la frecuencia relativa y la probabilidad.
5
Conteo
Si Ω es un conjunto finito el espacio de probabilidad can´onico es (Ω, F, P), en donde F = P(Ω) #A y P(A) = . #Ω Para asignar probabilidades sobre conjuntos finitos debemos manejar herramientas de conteo del n´ umero de elementos de conjuntos finitos.
Proposici´ on 1 Si A y B son conjuntos finitos entonces #A × B = #A · #B. Este resultado se puede generalizar. Por inducci´on se ve que si A1 · · · An son conjuntos finitos entonces n Y #(A1 × A2 × · · · × An ) = #Ai . i=1
1
#A=n´ umero de puntos de A.
3
Ejemplos: 1. Cartas: consideremos las cuatro pintas como un grupo y los 10 n´ umeros como otro. Se obtienen por lo tanto 4 × 10 = 40 combinaciones de cartas. 2. Clasificaciones diferentes: Sea Ω un grupo de personas clasificadas por: estado civil, sexo y profesi´on. Si tenemos 10 profesiones, entonces #Ω = 2 × 2 × 10 = 40.
5.1
Muestras de poblaci´ on
Una poblaci´ on de tama˜ no n es un conjunto P = {a1 , . . . , an } y una muestra M de tama˜ no m es cualquier extracci´on de elementos de P tal que #M = m. Distinguimos entre muestras ordenadas y muestras no ordendas. Una muestra ordenada es aquella donde el orden de extracci´on importa. Una no muestra ordenada es aquella donde el orden no importa. Muestras ordenadas con reemplazo: es aquella donde realizamos extracciones de la poblaci´on total (permitimos muestras con elementos repetidos). Muestras ordenadas sin reemplazo: es aquella donde realizamos extracciones en la poblaci´on de forma que los elementos extraidos no se regresan a la poblaci´on.
umero de maneras de elegir muestras con reemplazo de tama˜ no m de una Proposici´ on 2 El n´ poblaci´ on de tama˜ no n es nm . Proposici´ on 3 El n´ umero de maneras de elegir muestras sin reemplazo de tama˜ no m de una poblaci´ on de tama˜ no n es (n)m = n(n − 1) · · · (n − (m − 1)). Cuando m > n,(n)m = 0 y si n = m entonces (n)m = n! (¡Verif´ıquelo!). Si m es fijo, demostrar que
(n)m = 1, n→∞ nm esto dice que las muestras ordenadas con o sin reemplazo son asint´ oticamente equivalentes. lim
En el muestreo ordenado sin reemplazo, la probabilidad de que un elemento fijo quede incluido en la muestra es (n − 1)m m 1− = (1) (n)m n y si es con reemplazo
µ ¶ 1 m (n − 1)m =1− 1− 1− nm n
Demuestre las ecuaciones (1) y (2)
4
(2)
Muestras no ordenadas sin reemplazo: En una poblaci´on P = {a1 , . . . , an } se pueden elegir µ ¶ n n! Cn,m = = m (n − m)!m! muestras no ordenadas sin reemplazo de tama˜ no m, en efecto observamos que por cada muestra no ordenada sin reemplazo existen m! muestras ordenadas sin reemplazo, Cn,m m! = (n)m entonces Cn,m
¡n¢ = m .
Ejemplo: De 10 personas del departamento de matem´aticas se elige una comisi´on integrada por 3 personas existen µ ¶ 10 10! 10 · 9 · 8 · 7! = = = 10 · 3 · 4 = 120 7!3! 7!3! 3 comisiones posibles. Consideramos una poblaci´on donde se distinguen elementos de dos tipos α y β respectivamente. Si tenemos p elementos de tipo α y q elementos de tipo β entonces existen (p + q)! p!q! configuraciones distintas de la poblaci´on. M´as generalmente, si tenemos una poblaci´on de n elementos fraccionada en k subpoblaciones de las cuales la primera contenga p1 elementos, la segunda p2 elementos, etc. , entonces existen (p1 + · · · + pk )! p1 !p2 ! · · ·!pk ! configuraciones distintas de la poblaci´on. Muestras no ordenadas con reemplazo: Sea P = {a1 , . . . , an } una poblaci´on y queremos contar el n´ umero de muestras diferentes con reemplazo de tama˜ no m. Para conseguir nuestro proposito contaremos el n´ umero de configuraciones diferentes de colocar m bolas en n celdas si las bolas son indistinguibles. Ejercicio: justifique que el problema de contar muestras no ordenadas com reepmplazo y el problema del n´ umero de ocupaciones son equivalentes. Ejercicio: cuente el n´ umero de ocupaciones.
6
Probabilidad Condicional
Para ilustrar los proximos conceptos consideremos el siguiente ejemplo: Se tiene un lote de 100 art´ıculos el cu´al contiene 20 defectuosos y 80 no defectuosos. Se eligen 2 art´ıculos al azar: 5
a) Con reemplazo. b) Sin reemplazo. Definimos los eventos siguientes: A = { el primer art´ıculo es defectuoso} y B = { el segundo art´ıculo es defectuoso} si estamos en la situaci´on a)
¡20¢
1 1 ¢= , P(A) = ¡100 5 1 P(B) = 15 . Si elegimos sin reemplazo, los resultados no son inmediatos, sin embargo en la actual suposici´on todav´ıa es v´alido que: 1 P(A) = . 5 ¿Cu´al es el valor de P(B)? Para responder esta interrogante es evidente que debemos considerar que la configuraci´on del lote cambio cuando escogemos el segundo art´ıculo. Lo que si es claro es que si tenemos el conocimiento de la ocurrencia de A entonces conocemos la probabilidad de B condicionado a la ocurrencia de A (P(A|B)). En este caso, P(A|B) = 19/99. Cuando calculamos P(A|B), esencialmente estamos calculando P(B) respecto del espacio muestral reducido en A, en vez del espacio muestral Ω. Sea (Ω, F, P) un espacio de probabilidad y B ∈ F un evento con probabilidad estrictamente positiva, P(B) > 0. Se define la funci´on P(·|B) : F → R mediante la f´ormula
T P(A B) P(A|B) = P(B)
para todo A ∈ F. Ejercicio: Demuestre que la funci´on P(·|B) es una probabilidad. Propiedades T 1. Si A B = ∅ entonces P(A|B) = 0. 2. Si B ⊂ A entonces P(A|B) = 1. 3. P(Ac |B) = 1 − P(A|B), para todo A ∈ F.
6
4. Si A, C ∈ F entonces P(A \ C|B) = P(A|B) − P(A ∩ C|B). Demostremos 3: P(B) = P(A ∩ B) + P(Ac ∩ B) de donde 1=
P(A ∩ B) P(Ac ∩ B) + P(B) P(B)
y as´ı obtenemos el resultado.
6.1
Principio de expansi´ on
Sea (Ω, F, P) un espacio de probabilidades, A es un evento del espacio muestral y Bi con 1 ≤ i ≤ n, una sucesi´on finita de eventos disjuntos dos a dos. Si los Bi son una descomposici´on de Ω, Ω = ∪ni=1 Bi entonces, n n [ [ A=A∩Ω=A∩ Bi = (A ∩ Bi ) i=1
y P(A) =
n X
i=1
P(A ∩ Bi )
i=1
de donde se obtiene el principio de expansi´on P(A) =
n X
P(A|Bi )P(Bi ).
i=1
En el ejemplo del principio de secci´on calculemos la probabilidad de B, a partir del principio de expansi´on: P(B) = P(B|A)P(A) + P(B|Ac )P(Ac ) = (19/99)(1/5) + (20/100)(4/5)
6.2
Teorema de Bayes
Sea (Ω, F, P) un espacio de probabilidades, supongamos que conocemos las probabilidades P(A|Bi ), para 1 ≤ i ≤ n, entonces podemos calcular P(Bi |A), en efecto P(Bi |A) =
P(A|Bi )P(Bi ) P(Bi ∩ A) = P(A) P(A)
y por el principio de expansi´on P(A|Bi )P(Bi ) , P(Bi |A) = Pn k=1 P(A|Bk )P(Bk ) este resultado se conoce como teorema de Bayes.
7
6.3
Eventos independientes
Al introducir el concepto de probabilidad condicional, hemos visto que en ciertos casos, cuando la ocurrencia del evento B no aporta informaci´on respecto a la ocurrencia o no del suceso A, se tiene que P(A|B) = P(A), en este caso decimos que A es independiente de B. Ahora bien, P(A|B) =
P(A ∩ B) P(B)
si P(A|B) = P(A) podemos expresar esto como: P(A ∩ B) = P(A)P(B). Observemos que esta expresi´on vale, aun cuando P(A) = 0 o P(B) = 0. Usemosla como definici´on de independencia.
8