4. Variáveis aleatórias e distribuições contínuas Exemplo 4.1: Seja X o momento de paragem do ponteiro dos minutos que avança continuamente num relógio avariado. Qual a probabilidade do ponteiro dos minutos parar nos 15 primeiros segundos? P (X ≤ 15) =
#pontos[0, 15] comprimento[0, 15] 15 1 = = = . #pontos[0, 60] comprimento[0, 60] 60 4
Note-se que P (X = 15) = 0 pois há infinitos pontos em [0, 60].
Variáveis aleatórias contínuas. Definição 4.1: Se o conjunto dos possíveis valores de uma v.a. for infinito não enumerável, a v.a. diz-se contínua, em certas condições. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 41/207
Função densidade de probabilidade. Definição 4.2: Diz-se que X é uma v.a. contínua, se existir uma função fX , denominada função densidade de probabilidade (f.d.p.) de X, satisfazendo as seguintes condições: 1. fX (x) ≥ 0, ∀ x ∈ IR. R∞ 2. −∞ fX (x)dx = 1.
3. Para qualquer conjunto B ∈ IR, P (X ∈ B) =
R
B
fX (x)dx.
Se X é uma v.a. contínua com f.d.p. fX (x) e a e b constantes reais, • P (a ≤ X ≤ b) representa a área sob a função fX (x) entre a e b. • Se a = b em i), P (X = a) =
Ra a
fX (x)dx = 0.
• fX (a) pode ser interpretada como a massa de probabilidade, para ǫ
pequeno, por unidade de comprimento P (a − 2ǫ ≤ X ≤ a + 2ǫ ) = R a+ 2ǫ a− ǫ fX (x)dx ≈ ǫfX (a). 2
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 42/207
Definição 4.3: Dada uma v.a. contínua X com f.d.p. fX (x), a função de distribuição (cumulativa) de X é dada por Z x fX (u)du, ∀ x ∈ IR. FX (x) ≡ P (X ≤ x) = −∞
Se X é uma v.a. contínua com função de distribuição FX (x), • P (a < X ≤ b) = FX (b) − FX (a), sendo a e b constantes reais.
• A f.d.p. de uma v.a. contínua X pode ser obtida pela derivação da d F (x), dx
sua função de distribuição, i.e., fX (x) = diferenciabilidade desta.
nos pontos de
• As propriedades da função de distribuição (Capítulo 3):
P1 : P2 : P3 : P4 :
Se x ≤ y, FX (x) ≤ FX (y). Se xn → x (n → ∞), FX (xn ) → FX (x) (continuidade). Se xn → −∞ (n → ∞), FX (xn ) → 0 com FX (−∞) = 0. Se xn → ∞ (n → ∞), FX (xn ) → 1 com FX (∞) = 1. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 43/207
Exemplo 4.2: Seja X o tempo de vida de uma componente electrónica. Suponha que X é uma v.a. contínua com f.d.p. fX (x) = e−x , se x > 0, e fX (x) = 0, caso contrário. Qual a função de distribuição de X? (R x e−u du = 1 − e−x , x > 0; −∞ FX (x) = 0, x ≤ 0.
0.8 0.6
F(x)
f(x)
0.0
0.2
0.4 0.0
0.2
0.4
0.6
0.8
1.0
Função de Distribuição
1.0
Função Densidade de Probabilidade
0
2
4
6 x
8
10
0
2
4
6
8
10
x
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 44/207
Valor esperado e variância. Moda e quantis. Definição 4.4: Dada uma v.a. contínua X com f.d.p. fX (x), i) O valor esperado (ou valor médio ou esperança) de X é dado por Z ∞ x fX (x)dx. E(X) = −∞
ii) A variância de X é dada por Z ∞ (x − E(X))2 fX (x)dx. V ar(X) = −∞
iii) A moda de X é mo (X) = xo : max fX (x) = fX (xo ). x
iv) A mediana de X é md (X) = xd : P (X ≤ xd ) = 0.5. v) O p-ésimo quantil de X é qp : P (X ≤ qp ) = p.
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 45/207
Algumas das suas propriedades. Teorema 4.1: Seja X uma v.a. contínua com f.d.p. fX (x) e g(X) uma função de X. O valor esperado de g(X) é Z ∞ g(x)fX (x)dx. E(g(X)) = −∞
Note-se que o valor esperado E(X k ), k inteiro positivo, é o momento (ordinário) de ordem k de X. Algumas propriedades do valor esperado E(X) e variância V ar(X) (Capítulo 3): P1 : E(aX + b) = aE(X) + b, a 6= 0 e b constantes.
P2 : V ar(aX + b) = a2 V ar(X), a 6= 0 constante.
P3 : V ar(X) = E(X 2 ) − E(X)2 .
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 46/207
Exemplo 4.3: A percentagem de uma substância (100X) em um certo composto químico é tal que X é uma v.a. descrita pela função ( 20 x3 (1 − x), 0 ≤ x ≤ 1; fX (x) = 0, c.c. Será fX (x) uma f.d.p.? Sim. i) fX (x) ≥ 0, ∀ x ∈ IR. R1 4 ii) 0 20 x3 (1−x)dx = 20[ x4 −
x5 1 ]| 5 0
= 20( 14 − 51 ) = 1.
Qual a percentagem média da substância no composto? 5 Z 1 6 1 1 2 x 1 x = 20 − = − x 20 x3 (1 − x)dx = 20 E(X) = 5 6 0 5 6 3 0 Aproximadamente 66.67%.
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 47/207
Funções de variáveis aleatórias. Seja X uma variável aleatória contínua com f.d.p. fX (x), −∞ < x < ∞, e y = g(x) é uma função real de x diferenciável em todos os pontos do respectivo domínio e estritamente monótona, então Y = g(X) é também uma v.a. contínua com f.d.p. dx dx d d −1 −1 FY (y) = FX (g (y)) = fX (g (y)) , fY (y) = dy dx dy dy com g(−∞) < y < g(∞).
Exemplo 4.4: Se X é uma v.a. contínua com f.d.p. fX (x) = 1, se 0 < x < 1, e 0, caso contrário, qual a f.d.p. de Y = eX ? ( d 1/y, fY (y) = fX (log y) log y = dy 0,
1 < y < e; c.c.
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 48/207
Distribuição uniforme contínua. Definição 4.5: Diz-se que uma variável aleatória X tem distribuição uniforme contínua (ou rectangular) se, para qualquer ponto entre a e b (a < b), a sua f.d.p. é dada por ( 1 , a < x < b; b−a fX (x) = 0, c.c. O valor esperado e a variância de uma v.a. X com distribuição uniforme contínua (a, b) são, respectivamente, b+a E(X) = 2
(b − a)2 e V ar(X) = . 12
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 49/207
Exemplo 4.5: Sabe-se que o tempo X gasto por um aluno no trajecto de casa para a Escola pode ser qualquer valor entre 20 a 40 minutos (valores igualmente prováveis). Saindo de casa às 12:30 para assistir a aula das 13:00, qual a probabilidade de ele chegar atrasado? Seja p a probabilidade de o aluno chegar atrasado à Escola. Se a v.a. X ∼ Uniforme(20, 40), 40 Z 40 1 1 1 p = P (X > 30) = dx = x = . 20 30 2 30 20 Em 12 dias, qual o número esperado de dias em que ele chega atrasado?
Seja Y o número de dias em que o aluno chega atrasado à Escola. Supondo independência entre os tempos gastos nos 12 dias e a mesma probabilidade de atraso p, Y ∼ Binomial(n = 12, p = 0.5) e, por conseguinte, E(Y ) = n p = 12 × 0.5 = 6 dias. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 50/207
Distribuição normal. Definição 4.6: Diz-se que uma v.a. contínua X tem distribuição normal (ou gaussiana) com média µ e variância σ 2 , denotada por N (µ,σ 2 ), se a sua f.d.p. é dada por 1 1 exp − 2 (x − µ)2 , −∞ < x < ∞. fX (x) = √ 2σ 2πσ Propriedades da curva gaussiana fX (x): • Como a função é simétrica em relação a µ, a mediana de X é µ. • fX (x) atinge o ponto máximo em x = µ com valor 1/(
√
2 π σ) e
portanto a moda de X é µ.
• A curva gaussiana tem 2 pontos de inflexão em x = µ ± σ. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 51/207
1.0
Função Densidade de Probabilidade − Normal
0.6 0.4 0.2 0.0
f(x)
0.8
N(0,1) N(1,2) N(−1,0.5)
−4
−2
0
2
4
6
x
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 52/207
Teorema 4.2: Se uma v.a. X ∼ N (µ, σ 2 ), Y = aX + b ∼ N (aµ + b, a2 σ 2 ), com a e b constantes reais. Corolário 4.1: Se uma v.a. X ∼ N (µ, σ 2 ), então Z = (X − µ)/σ ∼ N (0, 1), conhecida por distribuição normal reduzida (ou padronizada), cujas probabilidades encontram-se em tabelas. Exemplo 4.6: Suponha que a altura X dos alunos de uma turma de PE tem distribuição normal com média µ = 160cm e desvio padrão σ = 20cm. Qual a probabilidade de um aluno seleccionado ao acaso ter altura ente 150 e 170 cm? X−µ 170−160 150−160 < σ < 20 P (150 < X < 170) = P 20 = P (−0.5 < Z < 0.5) = FZ (0.5) − FZ (−0.5) = 0.6915 − 0.3085 = 0.383.
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 53/207
Distribuição exponencial. Definição 4.7: Diz-se que uma v.a. contínua X tem distribuição exponencial, com parâmetro λ > 0, se a sua f.d.p. é dada por ( λe−λ x , x ≥ 0; fX (x) = 0, c.c. Esta distribuição é bastante utilizada para descrever tempos de vida de componentes ou animais em estudos de Análise de Fiabilidade e Sobrevivência. O valor esperado e a variância de uma v.a. X com distribuição exponencial (λ) são, respectivamente, E(X) =
1 λ
e V ar(X) =
1 . λ2
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 54/207
Exemplo 4.7: Suponha que o tempo X de falha de duas componentes electrónicas tem distribuição exponencial com média de 5 hs (componente C1 ) e de 10 hs (C2 ). Considere ainda que elas estão ligadas num sistema em paralelo e que o funcionamento de cada uma não depende do da outra. Qual a fiabilidade do sistema após 20 horas? A fiabilidade do sistema com as duas componentes em pararelo é a probabilidade de pelo menos uma componente funcionar, denotada por P (C1 ∪ C2 ) = P (C1 ) + P (C2 ) − P (C1 ∩ C2 ) = 0.0183 + 0.1353 − 0.0183 × 0.1353 = 0.1511, uma vez que elas são independentes e a fiabilidade de cada uma é R∞ 1 20 P (C1 ) = P (X1 > 20) = 20 15 e− 5 x1 dx1 = e− 5 = e−4 = 0.0183, R∞ 1 −1 x 20 e 10 2 dx2 = e− 10 = e−2 = 0.1353. P (C2 ) = P (X2 > 20) = 20 10 NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 55/207
Teorema 4.3: (Propriedade da falta de memória) Se uma v.a. X ∼ Exponencial(λ), então P (X > s + t|X > t) = P (X > s), ∀ s, t ≥ 0. Teorema 4.4: Seja Nt o número de ocorrências num intervalo de tempo de comprimento t, com Nt ∼ Poisson(λ t). Considere ainda que X1 é o tempo decorrido até à primeira ocorrência, enquanto Xi , i > 1, é o tempo decorrido entre as ocorrências i−1 e i. A sequência X1 , X2 , . . . é formada por v.a. independentes e identicamente distribuídas com Xi ∼ Exponencial(λ), i = 1, 2, . . ., onde λ é a taxa média de ocorrências por unidade de tempo. Nomeadamente, • P (X1 > t) = P (Nt = 0) = e−λ t ⇔ X1 ∼ Exponencial(λ).
∗ • P (X2 > t) = P (X2 > t|X1 = s) = P (N(s,s+t] = 0|X1 = s) = ∗
P (N(s,s+t] = 0) = P (Nt = 0) = e−λ t ⇔ X2 ∼ Exponencial(λ).
* pela suposição de independência e estacionaridade das ocorrências.
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 56/207