3. Variáveis aleatórias e distribuições discretas Numa experiência aleatória, independentemente de o seu espaço de resultados ser expresso numericamente, tem interesse em considerar-se funções reais, conhecidas por variáveis aleatórias. ¯ Exemplo 3.1: Numa urna com 5 peças defeituosas (D) e 4 perfeitas (D), retiram-se ao acaso 2 duas peças sem reposição. Seja X o número de peças defeituosas nas duas peças retiradas. ¯1 ∩ D ¯ 2 ) = 4 × 3 = 12 P (X = 0) = P (D 9 8 72 ¯ ¯ P (X = 1) = P (D1 ∩ D2 ) + P (D1 ∩ D2 ) = 20 P (X = 2) = P (D1 ∩ D2 ) = 72
40 72
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 19/208
Variáveis aleatórias. Função de distribuição. Definição 3.1: Uma variável aleatória (v.a.) é uma função que associa um número real a cada ponto do espaço de resultados de uma experiência aleatória. Rigorosamente, dado um espaço de probabilidade (Ω, A, P ), uma variável aleatória X é uma função com domínio Ω e contradomínio na recta real (X : Ω → IR) tal que o conjunto Ar ≡ {w ∈ Ω : X(ω) ≤ r} ∈ A, ∀ r ∈ IR. As variáveis aleatórias podem assumir um número finito ou infinito de valores possíveis. Definição 3.2: Dada uma variável aleatória X, a função de distribuição (cumulativa) de X é dada por FX (x) ≡ P (X ≤ x), ∀ x ∈ IR. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 20/208
Variáveis aleatórias discretas. Definição 3.3: Se o conjunto dos possíveis valores de uma variável aleatória for finito ou infinito enumerável, a v.a. é dita ser discreta.
Função (massa) de probabilidade. Definição 3.4: Dada uma variável aleatória discreta X com os possíveis valores x1 , x2 , . . ., a função fX (xi ) = P (X = xi ) denota a probabilidade de ocorrência de {xi }, conhecida por função (massa) de probabilidade (f.m.p.), satisfazendo as seguintes condições: 1. fX (xi ) > 0, ∀ i = 1, 2, . . .. P 2. i≥1 fX (xi ) = 1.
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 21/208
Exemplo 3.1a: Na extracção, sem reposição, de 2 peças da urna com 5 peças defeituosas e 4 perfeitas, qual a função massa de probabilidade de X (número de peças defeituosas nas 2 peças retiradas)? E a sua função de distribuição? 12 , 72 40 , fX (x) = 72 20 , 72 0,
FX (x) =
0, 12 , 72
52 , 72 1,
x = 0; x = 1; x = 2; c.c.
fX (x)
6
1 0
x < 0; 0 ≤ x < 1; 1 ≤ x < 2; x ≥ 2.
1
2
x
1
2 ···
x
FX (x) 6 1 0
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 22/208
¯ Exemplo 3.1b: Na urna com 5 peças defeituosas (D) e 4 perfeitas (D), retiram-se peças com reposição até à primeira peça defeituosa. Seja Z o número de peças perfeitas até encontrar a primeira peça defeituosa. Qual a função massa de probabilidade de Z? P (Z = 0) = P (D1 ) = 95 ¯ 1 ∩ D2 ) = 4 × 5 P (Z = 1) = P (D 9 9 ¯ ¯ P (Z = 2) = P (D1 ∩ D2 ∩ D3 ) = ( 49 )2 × .. .. . . P (Z = z) = ( 49 )z ×
5 9
5 9
= fZ (z), z = 0, 1, . . . ,
que é a função massa de probabilidade de Z, satisfazendo: • fZ (z) > 0, ∀ z = 0, 1, . . .. •
∞ X z=0
fZ (z) =
( 95 )
∞ X 1 = 1. ( 49 )z = ( 95 ) 1−(4/9) z=0
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 23/208
Propriedades da função de distribuição. Seja X uma v.a. discreta com função de probabilidade fX (x). A função de distribuição de X, FX (x), satisfaz as seguintes propriedades: P1 : Se x ≤ y, então FX (x) ≤ FX (y). Ou seja, FX é uma função não decrescente. P2 : Se xn ↓ x (n → ∞), então FX (xn ) ↓ FX (x). Ou seja, FX é uma função contínua à direita. P3 : Se xn ↓ −∞ (n → ∞), então FX (xn ) ↓ 0 com FX (−∞) = 0. P4 : Se xn ↑ ∞ (n → ∞), então FX (xn ) ↑ 1 com FX (∞) = 1. Note-se ainda que, se FX (x) é a função de distribuição de X (v.a. discreta com os possíveis valores x1 , x2 , . . .), a função massa de probabilidade é dada fX (xi ) = P (X = xi ) = FX (xi ) − FX (xi−1 ). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 24/208
Valor esperado e variância. Definição 3.5: Dada uma v.a. discreta X com f.m.p. fX (xi ), i = 1, 2, . . ., o valor esperado (ou valor médio ou esperança) de X é dado por X E(X) = xi fX (xi ). i≥1
Definição 3.6: Dada uma variável aleatória discreta X com função de probabilidade fX (xi ), i = 1, 2, . . ., a variância de X é dada por X V ar(X) = (xi − E(X))2 fX (xi ). i≥1
Outras medidas de dispersão: p
• Desvio padrão: DP (X) = +
V ar(X).
• Coeficiente de variação: CV (X) = DP (X)/|E(X)|. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 25/208
Moda e quantis. Definição 3.7: Dada uma v.a. discreta X com f.m.p. fX (xi ), i = 1, 2, . . ., a moda e a mediana de X são dadas, respectivamente, por i) mo (X) = xo : max fX (xi ) = fX (xo ). i≥1
ii) md (X) = xd : P (X ≤ xd ) ≥ 0.5 e P (X ≥ xd ) ≥ 0.5. Se xi ∈ IN , pode-se encontrar xo usando as relações fX (xo )/fX (xo −1) ≥ 1
e fX (xo )/fX (xo +1) ≥ 1.
Definição 3.8: Dado qualquer número p, 0 < p < 1, o p-ésimo quantil de uma variável aleatória X, denotado por qp , é dado por P (X ≤ qp ) ≥ p e P (X ≥ qp ) ≥ 1 − p. Note-se que a mediana é o quantil q0.5 . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 26/208
Exemplo 3.2: Num lançamento de um dado, um jogador aposta 5 euros nas seguintes condições: i) Se sair face 6, ele ganha 4 vezes o montante apostado; ii) Se sair face 4 ou 5, ele ganha 5 euros; iii) caso contrário, ele nada ganha. Qual o lucro (X) esperado do jogador? X −5 fX (x) 1/2 E(X) =
X
0 1/3
15 1/6
x fX (x) = 0 euro.
x
E o lucro modal e mediano? mo (X) = −5 euros. md (X) = {0, −5} euros. E a variância de X? X V ar(X) = x2 fX (x) = 50 euros2 . x
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 27/208
Algumas das suas propriedades. Teorema 3.1: Seja X uma variável aleatória discreta com f.m.p. fX (xi ), i = 1, 2, . . ., e g(X) uma função de X. O valor esperado de g(X) é X E(g(X)) = g(xi )fX (xi ). i≥1
Se g(X) = X k (k inteiro positivo), o valor esperado E(X k ) é conhecido por momento (ordinário) de ordem k de X. Se X uma variável aleatória com valor esperado E(X) e variância V ar(X), têm-se as seguintes propriedades: P1 : E(aX + b) = aE(X) + b, a 6= 0 e b constantes. P2 : V ar(aX + b) = a2 V ar(X), a 6= 0 constante. P3 : V ar(X) = E(X 2 ) − E(X)2 .
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 28/208
Funções de variáveis aleatórias. Seja X uma variável aleatória definida no espaço de resultados Ω associado à experiência aleatória E. Se y = g(x) é uma função real (mensurável) de x, com x = X(ω) para algum ω ∈ Ω, então Y = g(X) é também uma variável aleatória definida no mesmo espaço de probabilidade. Se X é uma variável aleatória discreta com f.m.p. fX (x) e contradomínio D = {x1 , x2 , . . .}, então Y = g(X) é também uma variável aleatória discreta com f.m.p. X fX (xi ), y ∈ D∗ fY (y) = P (Y = y) = P (X ∈ Ay ) = xi ∈Ay
onde Ay = {x ∈ D : g(x) = y} e D∗ = g(D) é o contradomínio de Y . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 29/208
Distribuição uniforme discreta. Definição 3.9: Diz-se que uma variável aleatória X tem distribuição uniforme discreta se todos os seus valores x1 , . . . , xk são igualmente prováveis, com f.m.p dada por ( 1/k, x = x1 , . . . , xk ; fX (x) = 0, c.c. O valor esperado e a variância de uma variável aleatória X com distribuição uniforme discreta {1, . . . , k} são, respectivamente, k
1X E(X) = xi k i=1
k
1X 2 e V ar(X) = x − k i=1 i
2 X k 1 xi . k i=1
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 30/208
Distribuição hipergeométrica. Definição 3.10: Considere uma população com N elementos dos quais M possuem uma certa característica (sucesso). Retira-se uma amostra, sem reposição, de dimensão n, anotando-se o número X de elementos com a característica na amostra. A distribuição de probabilidade da v.a. X é designada distribuição hipergeométrica, cuja f.m.p. é M N −M ( x )( n−x ) , max(0, n+M −N ) ≤ x ≤ min(n, M ); (Nn ) fX (x) = 0, c.c. O valor esperado e a variância de uma variável aleatória X com distribuição hipergeométrica (N, M, n) são, respectivamente, E(X) = n
M N
e V ar(X) = n
M N −M N −n . N N N −1
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 31/208
Exemplo 3.3: Seja X uma v.a. com distribuição uniforme discreta {1, . . . , 6}. Qual a variância de X? P E(X) = 61 6i=1 i = 3.5 P E(X 2 ) = 16 6i=1 i2 ≃ 15.167 V ar(X) = E(X 2 ) − E(X)2 ≃ 2.917 Exemplo 3.4: Numa turma de 10 estudantes dos quais 3 são mulheres, 2 estudantes foram sorteados para formar uma comissão. Qual a probabilidade de haver pelo menos uma mulher na comissão? Seja X o número de mulheres na comissão de 2 estudantes. X ∼ Hipergeométrica(N = 10, M = 3, n = 2). P (X ≥ 1) = 1 − P (X = 0) ≃ 0.533 NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 32/208
Distribuição binomial. Definição 3.11: Uma experiência aleatória com somente dois resultados possíveis, sucesso (ocorrência de um acontecimento de interesse) e fracasso (caso contrário) é conhecida por ensaio de Bernoulli, cuja v.a. subjacente é dada por ( 1, se ocorrência de sucesso; X= 0, se ocorrência de fracasso e a sua função massa de probabilidade é dada por ( px (1 − p)1−x , x = 0, 1; fX (x) = 0, c.c., onde p = P (X = 1) é a probabilidade de sucesso, 0 < p < 1. Consequentemente, E(X) = p e V ar(X) = p(1 − p). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 33/208
Definição 3.12: Considere uma experiência aleatória com n ensaios de Bernoulli independentes e todos com probabilidade de sucesso p. A v.a. correspondente ao número X de sucessos na experiência tem distribuição binomial com parâmetros n e p, com f.m.p. ( n x p (1 − p)n−x , x = 0, 1, . . . , n; x fX (x) = 0, c.c. • O valor esperado e a variância de X ∼ Binomial(n, p) são, re-
spectivamente, E(X) = n p
e V ar(X) = n p(1 − p).
• Se Xi ∼ Bernoulli(p), i = 1, . . . , n, são v.a. independentes, então
X=
Pn
i=1
Xi ∼ Binomial(n, p).
• Se X ∼ Binomial(n, p), então n−X ∼ Binomial(n, (1 − p)). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 34/208
0.3 0.1 0.0
2
4
6
8
10
0
2
4
6
8
x
Distribuição Binomial (n=10,p=0.5)
Distribuição Binomial (n=30,p=0.5)
10
0.3 0.2 0.1 0.0
0.0
0.1
0.2
f(x)
0.3
0.4
x
0.4
0
f(x)
0.2
f(x)
0.2 0.0
0.1
f(x)
0.3
0.4
Distribuição Binomial (n=10,p=0.8)
0.4
Distribuição Binomial (n=10,p=0.2)
0
2
4
6
8
10
0
5
x
10
15
20
25
30
x
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 35/208
Exemplo 3.5: Considere um teste de múltipla escolha com 10 questões, onde somente uma das 5 alíneas de cada questão está correcta. Qual a probabilidade de um aluno acertar pelo menos metade das questões fazendo o teste ao acaso? Seja X o número de questões correctas no teste do aluno. X ∼ Binomial(n = 10, p = 1/5). P (X ≥ 5) = 1 − FX (4) = 1 − 0.9219 = 0.0781 Qual a nota esperada desse aluno, se cada questão correcta vale 1? E a variância de X? E(X) = 2 valores V ar(X) = 1.6 valores2
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 36/208
Distribuição geométrica. Definição 3.13: Considere uma experiência aleatória envolvendo a realização de ensaios de Bernoulli independentes, com probabilidade de sucesso p, até à ocorrência do primeiro sucesso. A v.a. X número de ensaios realizados até à ocorrência do primeiro sucesso tem distribuição geométrica com parâmetro p, 0 < p < 1, com f.m.p. ( (1 − p)x−1 p, x = 1, 2, . . . ; fX (x) = 0, c.c., O valor esperado e a variância de X ∼ Geométrica(p) são, respectivamente, 1 1−p E(X) = . e V ar(X) = p p2 NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 37/208
Teorema 3.2: (Propriedade da falta de memória) Se uma v.a. X ∼ Geométrica(p), então P (X > i + j|X > j) = P (X > i), ∀ i, j = 1, 2, . . . . Exemplo 3.6: Seja X o número de lançamentos de um dado até ao surgimento da primeira face 6. Qual o número esperado de lançamentos do dado até sair face 6? Como X ∼ Geométrica(p = 16 ), E(X) = 6 lançamentos. Qual a probabilidade de haver mais de 7 lançamentos, sabendo que já houve mais de 3 lançamentos do dado? P (X > 7|X > 3) = P (X > 4) =
X 5 x−1 1 x≥5
6
6
≃ 0.4822
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 38/208
Distribuição de Poisson. Definição 3.14: Em algumas experiências aleatórias, anota-se por vezes o número X de ocorrências de um evento de interesse num dado intervalo de tempo, superfície, volume, etc. A v.a. X tem distribuição de Poisson de parâmetro λ quando a sua f.m.p. é dada por ( −λ x e λ , x = 0, 1, 2, . . . ; x! fX (x) = 0, c.c., onde λ é a taxa (esperada) de ocorrência do evento de interesse. • O valor esperado e a variância de X ∼ Poisson(λ) são iguais a
E(X) = V ar(X) = λ. • Neste cenário, X poderá representar, e.g., o número de chamadas
telefónicas recebidas durante 1 hora num dado escritório. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 39/208
Teorema 3.3: Seja X o número de ocorrências de um evento de interesse num dado período de tempo (região). Se X ∼ Poisson(λ), então t X X= Xi , i=1
Poisson( λt ),
i = 1, . . . , t (independentes e identicamente com Xi ∼ distribuídas), sendo Xi o número de ocorrências do evento em cada uma das t fracções do período de tempo (região).
Exemplo 3.7: Suponha que X é o número de passas de um bolo-rei oriundo de uma padaria que se sabe ter uma distribuição de Poisson com taxa média de 5 passas por bolo. Qual a probabilidade de encontrar pelo menos 1 passa em meio bolo-rei dessa padaria? Seja X ∗ o número de passas em meio bolo-rei produzido nessa padaria. X ∗ ∼ Poisson(λ∗ = 2.5). P (X ∗ ≥ 1) = 1 − P (X ∗ = 0) = 1 − e−2.5 ≃ 0.918. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 40/208