8. Testes de hipóteses Uma outra forma de inferir sobre características de uma população é testar hipóteses previamente formuladas sobre os seus parâmetros, tendo em conta uma amostra aleatória da população e o valor tolerável para a probabilidade de rejeição incorrecta dessas hipóteses. Exemplo 8.1: Uma empresa portuguesa compra usualmente parafusos americanos e japoneses devido às suas boas condições de resistência à tracção (X). Os americanos afirmam que a resistência à tracção dos seus parafusos tem média 145 kg e desvio padrão 12 kg, enquanto os japoneses dizem ter 155 kg de média e 20 kg de desvio padrão. Um lote de parafusos será inspeccionado, desconhecendo-se a sua proveniência (americana ou japonesa). Com base numa amostra aleatória de 25 parafusos, calcula-se a resistência média à tracção (¯ x) a fim de investigar a origem dos mesmos. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 142/207
Supondo distribuição normal para as duas populações, N (145, 144) (americana) e N (155, 400) (japonesa), pode-se considerar a seguinte regra de decisão: • Se x ¯ ≤ 150, diz-se que os parafusos são de origem americana;
0.030
caso contrário, são de procedência japonesa (Regra 1).
0.000
0.010
0.020
N(145,144) N(155,400)
50
100
150
200
250
X NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 143/207
Na decisão do Exemplo 8.1, pode-se cometer dois tipos de erro: Erro do tipo I: Afirmar que os parafusos não são americanos (japoneses) quando na realidade eles são americanos. Erro do tipo II: Afirmar que os parafusos são americanos quando na realidade eles são japoneses. As probabilidades destes dois tipos de erro (Exemplo 8.1) são: ¯ > 150 | parafusos americanos) α = P (Erro tipo I) = P (X ¯ > 150 | X ∼ N (145, 144)) = P (Z > 2.08) = P (X = 0.019 ¯ ≤ 150 | parafusos japoneses) β = P (Erro tipo II) = P (X ¯ ≤ 150 | X ∼ N (155, 400)) = P (Z ≤ −1.25) = P (X = 0.106 NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 144/207
Ao usar a regra de decisão do Exemplo 8.1 (Regra 1), a probabilidade do erro de tipo I é superior à do erro de tipo II (α = 0.019 < β = 0.106), “favorecendo” assim os parafusos americanos. • Para cada regra de decisão tem-se um valor limítrofe para x ¯ (de-
notado aqui por x¯c ) em vez de 150. Por conseguinte, os valores de α e β variam consoante o valor fixado de x¯c .
• Se x ¯c > 150, α diminui e β aumenta. Se x¯c < 150, α aumenta e β
diminui.
• Se x ¯c = 148.75, α = β = 0.059 (ponto de equilíbrio).
Em suma, dada uma regra de decisão (i.e., um valor para x¯c ), calcula-se as probabilidades de erros tipo I e II para avaliar o método de decisão. Outro procedimento possível é fixar a probabilidade de um tipo de erro e encontrar a correspondente regra de decisão. Por exemplo, α = 0.05 implica x¯c = 154.4 e β = 0.4404, favorecendo a decisão para os parafusos americanos. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 145/207
Noções básicas. Um teste de hipóteses paramétricas usualmente visa comparar diferentes valores para o parâmetro desconhecido θ de uma dada população X. Procedimento geral de um teste de hipóteses: 1. Hipóteses de interesse: • Hipótese nula H0 (e.g., θ = θ0 ). • Hipótese alternativa H1 (e.g., θ 6= θ0 → teste bilateral; θ < θ0 ou θ > θ0 → testes unilaterais). 2. Erros associados à regra de decisão, cujas correspondentes probabilidades são dadas por • α = P (Erro do tipo I) = P (Rejeitar H0 |H0 verdadeiro). • β = P (Erro do tipo II) = P (Aceitar H0 |H0 falso). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 146/207
3. Região crítica (RC): Região que não favorece a hipótese nula H0 na regra de decisão. Construída com base numa estatística T = T (X1 , . . . , Xn ) (denominada estatística do teste). • A RC é construída tal que P (T ∈ RC|H0 verdadeiro) = α, sendo α (nível de significância do teste) fixado previamente. Doravante, RC é denotado por RCα . 4. Decisão do teste de hipótese: • Se T ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. Caso contrário, não se rejeita H0 a 100α%. • Quanto menor for o nível de significância do teste, tanto maior será a precaução contra o risco de rejeição incorrecta de H0 . Os níveis de significância são usualmente 1%, 5% e 10%. A determinação de β exige a especificação de cada valor alternativo para o parâmetro em teste, dado que H1 é geralmente composta (e.g., β = P (T ∈ / RCα |θ 6= θ0 )). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 147/207
Testes de hipóteses para parâmetros de populações normais Seja X1 , . . . , Xn uma a.a. de uma população X ∼ N (µ, σ 2 ), com σ 2 ¯ ∼ N (µ, σ 2 /n). conhecido. Sabe-se que o estimador MV de µ é X Teste de hipóteses: 1. Hipóteses: • H 0 : µ = µ0 • H1 : µ 6= µ0 (ou H1 : µ > µ0 ou H1 : µ < µ0 ) 2. Estatística do teste:
Z0 =
¯ − µ0 H0 X √ ∼ N (0, 1), σ/ n
cujo valor observado é denotado por z0 . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 148/207
3. Região crítica: Fixado um valor para α, RCα = {z ∈ IR : (z < −b) ∪ (z > b)}, onde b = FN−1(0,1) (1− α2 ).
−b
0
b
Z
4. Conclusão: • Se z0 ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. • Caso contrário, não há evidência para rejeitar H0 ao nível α. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 149/207
Exemplo 8.2: Uma máquina foi regulada para encher pacotes de café de 500g. Seja X1 , . . . , X16 uma a.a. de X (quantidade de café por pacote), cuja média amostral é 492g. Considerando que X segue uma distribuição normal com variância 400g 2 , teste a regulação da máquina ao nível de 1% de significância. Teste de hipóteses: 1. Hipóteses: H0 : µ = 500 ≡ µ0 versus H1 : µ 6= 500 2. Estatística do teste: Z0 = 492−500 é z0 = √ = −1.6.
¯ H0 X−µ √0 ∼ σ/ n
N (0, 1), cujo valor observado
400/16
3. Região crítica: Fixado α = 0.01, FN−1(0,1) (0.995) = 2.58 e RC1% = (−∞, −2.58) ∪ (2.58, ∞).
4. Conclusão: Como z0 ∈ / RC1% , não se rejeita H0 ao nível de significância de 1%, i.e., não há evidência contra a regulação da máquina.
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 150/207
Seja X1 , . . . , Xn uma a.a. de uma população X ∼ N (µ, σ 2 ), com µ e σ 2 ¯ ∼ N (µ, σ 2 /n). desconhecidos. Sabe-se que o estimador MV de µ é X Teste de hipóteses: 1. Hipóteses: • H 0 : µ = µ0 • H1 : µ 6= µ0 (ou H1 : µ > µ0 ou H1 : µ < µ0 ) 2. Estatística do teste:
¯ − µ0 H0 X √ T0 = ∼ t(n−1) , S/ n Pn 1 ¯ 2 cujo valor observado é t0 , onde S 2 = n−1 i=1 (Xi − X) . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 151/207
3. Região crítica: Fixado um valor para α, RCα = {t ∈ IR : (t < −b) ∪ (t > b)}, onde b = Ft−1 (1− α2 ). (n−1)
−b
0
b
T
4. Conclusão: • Se t0 ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. • Caso contrário, não há evidência contra H0 ao nível α. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 152/207
Exemplo 8.2a: Seja X1 , . . . , X16 uma a.a. de X (quantidade de café por pacote), cuja média e variância amostral são 480g e 800g 2 , respectivamente. Considerando uma distribuição normal para X, teste se a máquina está a encher pacotes de café com pelo menos 500g, ao nível de 5% de significância. Teste de hipóteses: 1. Hipóteses: H0 : µ ≥ 500 ≡ µ0 versus H1 : µ < 500. 2. Estatística do teste: T0 = 480−500 = −2.83. t0 = √
¯ µ=µ0 X−µ √0 ∼ S/ n
t(15) , cujo valor observado é
800/16
3. Região crítica: Fixado α = 0.05, Ft−1 (0.95) = 1.753 e RC5% = (15) (−∞, −1.753). 4. Conclusão: Como t0 ∈ RC5% , rejeita-se H0 ao nível de significância de 5%, i.e., há evidência4contra a hipótese de enchimento de pacotes de café com pelo menos 500g.
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 153/207
Exemplo 8.2b: No teste de hipóteses H0 : µ ≥ 500 ≡ µ0 versus H1 : µ < 500, a decisão do teste varia com a escolha de α, i.e., α RCα 0.05 (−∞, −1.753) 0.01 (−∞, −2.602) 0.006 (−∞, −2.857)
decisão do teste rejeita-se H0 rejeita-se H0 não se rejeita H0
Assim, o menor valor do nível de significância α que conduz à rejeição de H0 é P = P (T < −2.83|H0 ) = 0.0063.
Valor-p do teste. Definição 8.1: O valor-p de um teste de hipóteses (P ) é a probabilidade sob H0 de a estatística do teste tomar valores tão ou mais desfavoráveis a H0 do que o seu valor observado. Deste modo, H0 será rejeitado a todo nível de significância α tal que P < α e aceite no caso contrário. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 154/207
Seja X1 , . . . , Xn uma a.a. de uma população X ∼ N (µ, σ 2 ), com µ e σ 2 desconhecidos. Sabe-se que Q = (n − 1)S 2 /σ 2 ∼ χ2(n−1) . Teste de hipóteses: 1. Hipóteses: • H0 : σ 2 = σ02 • H1 : σ 2 6= σ02 (ou H1 : σ 2 > σ02 ou H1 : σ 2 < σ02 ). 2. Estatística do teste:
(n − 1)S 2 H0 2 Q0 = ∼ χ(n−1) , σ02 Pn 1 ¯ 2 com valor observado q0 e S 2 = n−1 i=1 (Xi − X) . Se µ for conhecido, Q0 =
Pn
i=1 (Xi −µ) σ02
2
H0
∼ χ2(n) .
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 155/207
3. Região crítica: Fixado um valor para α, RCα = {q ∈ IR+ : (q < a) ∪ (q > b)}, onde a = Fχ−1 2
(n−1)
( α2 ) e b = Fχ−1 2
0
(n−1)
(1− α2 ).
a
Q
b
4. Conclusão: • Se q0 ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. Caso contrário, não há evidência contra H0 . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 156/207
Exemplo 8.3: Seja X1 , . . . , X10 uma a.a. de X (tensão de ruptura), P10 2 P x = 900 e cujos resultados são 10 i i=1 xi = 81108. Considerando i=1 uma distribuição normal para X, teste se V ar(X) = σ 2 = 10. Teste de hipóteses: 1. Hipóteses: H0 : σ 2 = 10 ≡ σ02 versus H1 : σ 2 6= 10. 2. Estatística do teste: Q0 = q0 =
9×12 10
= 10.8.
(n−1)S 2 H0 ∼ σ02
χ2(9) , cujo valor observado é
3. Valor-p: P = 2 min(P (Q0 ≥ 10.8|H0 ), P (Q0 < 10.8|H0 )) = −1 0.58. Note-se que Fχ−1 2 (0.71) = 10.8, Fχ2 (0.7) = 10.66 e (9)
Fχ−1 2 (0.8) (9)
(9)
= 12.24.
4. Conclusão: Rejeita-se H0 para α ≥ 0.58 e aceita-se H0 para α < 0.58. Ou seja, há forte evidência a favor da hipótese V ar(X) = 10. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 157/207
Duas populações normais Sejam X11 , . . . , X1n1 e X21 , . . . , X2n2 a.a. de duas populações independentes X1 ∼ N (µ1 , σ12 ) e X2 ∼ N (µ2 , σ22 ), respectivamente, com σ12 e σ22 conhecidos. Sabe-se que o estimador MV de µ1 − µ2 é ¯1 − X ¯ 2 ∼ N (µ1 − µ2 , σ12 /n1 + σ22 /n2 ). X Teste de hipóteses: 1. Hipóteses: • H 0 : µ1 = µ2 ⇔ µ1 − µ2 = 0 • H1 : µ1 6= µ2 (ou H1 : µ1 > µ2 ou H1 : µ1 < µ2 ) 2. Estatística do teste:
¯1 −X ¯2 X
H
0 ∼ N (0, 1), Z0 = p 2 σ1 /n1 + σ22 /n2
com valor observado z0 .
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 158/207
3. Região crítica: Fixado um valor para α, RCα = {z ∈ IR : (z < −b) ∪ (z > b)}, onde b = FN−1(0,1) (1− α2 ).
−b
0
b
Z
4. Conclusão: • Se z0 ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. Caso contrário, aceita-se H0 ao nível α.
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 159/207
Sejam X11 , . . . , X1n1 e X21 , . . . , X2n2 a.a. de duas populações independentes X1 ∼ N (µ1 , σ12 ) e X2 ∼ N (µ2 , σ22 ), respectivamente, com σ12 = σ22 = σ 2 (desconhecido). Teste de hipóteses: 1. Hipóteses: • H 0 : µ1 = µ2 ⇔ µ1 − µ2 = 0 • H1 : µ1 6= µ2 (ou H1 : µ1 > µ2 ou H1 : µ1 < µ2 ) 2. Estatística do teste: T0 = q
¯1 −X ¯2 X
H0
(n1−1)S12 +(n2−1)S22 1 ( n1 n1 +n2 −2
com valor observado t0 e Si2 =
1 ni −1
+
1 ) n2
Pni
∼ t(n1 +n2 −2) ,
j=1 (Xij
¯ i )2 , i = 1, 2. −X
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 160/207
3. Região crítica: Fixado um valor para α, RCα = {t ∈ IR : (t < −b) ∪ (t > b)}, onde b = Ft−1 (n +n 1
2 −2)
(1− α2 ).
−b
0
b
T
4. Conclusão: • Se t0 ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. Caso contrário, não há evidência contra H0 .
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 161/207
Exemplo 8.4: Para testar a resistência de dois tipos de viga de aço (A e B), observou-se a resistência de algumas dessas vigas de aço, obtendo os seguintes resultados de duas amostras: tipo A B
tamanho 15 10
média 70.5 84.3
variância 81.6 85.7
Supondo que as amostras (aleatórias) são provenientes de duas populações normais independentes X1 ∼ N (µ1 , σ 2 ) e X2 ∼ N (µ2 , σ 2 ), teste a igualdade das médias populacionais. Teste de hipóteses: 1. Hipóteses: • H 0 : µ1 = µ2 ⇔ µ1 − µ2 = 0 • H1 : µ1 6= µ2 . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 162/207
2. Estatística do teste: T0 = q
¯1 −X ¯2 X
(n1−1)S12 +(n2−1)S22 1 ( n1 n1 +n2 −2
H0
+
1 ) n2
∼ t(23) ,
70.5−84.3 (83.204)(1/15+1/10)
cujo valor observado é t0 = √
= −3.71.
3. Valor-p: P = P (|T0 | ≥ 3.71|H0 ) = 2(1−Ft(23) (3.71)) = 0.0012. 4. Conclusão: • Rejeita-se H0 para α ≥ 0.0012. • Aceita-se H0 para α < 0.0012. Há forte evidência contra a hipótese de igualdade entre as resistências médias dos dois tipos de viga de aço. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 163/207
Testes de hipóteses para parâmetros de populações não normais uniparamétricas. Exemplo 8.5: Seja X1 , . . . , Xn uma a.a. de uma população X ∼ a ¯∼ Bernoulli(p). Pelo T.L.C. (n grande), X N (p, p(1 − p)/n). Teste de hipóteses para uma proporção (em grandes amostras): 1. Hipóteses: • H0 : p = p 0 • H1 : p 6= p0 (ou H1 : p > p0 ou H1 : p < p0 ). 2. Estatística do teste:
Z0 = p
¯ − p0 X
H0
p0 (1 − p0 )/n
∼ a
N (0, 1),
cujo valor observado é z0 . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 164/207
3. Região crítica: Fixado um valor para α, RCα = {z ∈ IR : (z < a) ∪ (z > b)}, onde b = −a = FN−1(0,1) (1− α2 ).
−b
0
b
Z
4. Conclusão: • Se z0 ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. • Caso contrário, não há evidência contra H0 ao nível α. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 165/207
Exemplo 8.6: Uma estação de TV afirma que no mínimo 60% dos telespectadores devem assistir o seu programa especial de Natal. A fim de avaliar esta afirmação, 200 famílias foram inquiridas, com 104 respostas afirmativas, sendo X1 , . . . , X200 uma a.a. de X ∼ Bernoulli(p). Teste de hipóteses: 1. Hipóteses: H0 : p ≥ 0.6 ≡ p0 versus H1 : p < 0.6.
¯ 0 H0 X−p ∼ p0 (1−p0 )/n a
2. Estatística do teste: Pelo T.L.C., Z0 = √ cujo valor observado é z0 = √0.52−0.6
0.6 0.4/200
N (0, 1),
= −2.31.
3. Valor-p: P (Z0 ≤ −2.31|H0 ) = 0.0104.
4. Conclusão: • Rejeita-se H0 para α ≥ 0.0104. • Não se rejeita H0 para α < 0.0104. Ou seja, há alguma evidência contra a afirmação da estação de TV. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 166/207
Teste de ajustamento do qui-quadrado de Pearson. Até ao momento os procedimentos de inferência estatística tem incidido sobre problemas paramétricos. Entretanto, pode-se também formular hipóteses sobre a própria forma distribucional de uma dada população, e.g., usando um teste de ajustamento do qui-quadrado de Pearson. Construção da estatística do teste do qui-quadrado de Pearson: 1. Considere uma amostra aleatória de N elementos sobre os quais se observa uma característica X, sendo as respectivas observações organizadas numa partição da recta real, B1 , . . . , Bk . 2. Seja pi = P (Bi ) a probabilidade de obter uma observação na iP ésima parte da partição, i = 1, . . . , k, tal que ki=1 pi = 1, enquanto Oi denota o número de elementos da amostra que pertence P a Bi , i = 1, . . . , k, tal que ki=1 Oi = N . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 167/207
3. O vector aleatório O = (O1 , . . . , Ok ) tem f.m.p. dada por fO (o1 , . . . , ok ) =
N! Ok 1 O2 pO 1 p2 · · · pk , O1 ! . . . Ok !
conhecida por distribuição Multinomial (N, p = (p1 , . . . , pk )), podendo-se provar que Oi ∼ Binomial(N, pi ), i = 1, . . . , k.
4. Hipóteses: • H0 : X ∼ FX (·) ⇒ pi = p0i , ∀ i = 1, . . . , k. • H1 : X ≁ FX (·) ⇒ pi 6= p0i , para algum i = 1, . . . , k. 5. Estatística do teste: Q0 =
k X (Oi − Ei )2 i=1
Ei
H0
χ2(k−m−1) ,
∼ a
onde Ei = E(Oi |H0 ) = N p0i e m é o total de parâmetros estimados. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 168/207
Exemplo 8.7: Acredita-se que o número X de acidentes por semana numa dada estrada segue uma distribuição Poisson. Para testar esta crença observou-se o número de acidentes nessa estrada durante 30 semanas, cujos resultados encontram-se a seguir. Teste a suposição de distribuição Poisson para X ao nível de significância de 5%. 8 3
4 1
1 0
1 2
3 0
0 3
0 0 4 2
8 1
9 12
2 5
4 7 0 5
1 4
3 2
Teste de hipóteses: 1. Hipóteses: • H0 : X ∼ Poisson(λ) versus H1 : X ≁ Poisson(λ). 2. Estatística do teste: Q0 =
k X (Oi − Ei )2 i=1
Ei
H0
∼ a
χ2(k−m−1) ,
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 169/207
95 = 3.167 onde Ei = 30 p0i e a estimativa MV de λ é x¯ = 30 (m = 1) e portanto, sob H0 , considera-se X ∼ Poisson(λ = 3.167). Por simplicidade, escolheu-se a seguinte partição B1 , . . . , B5 .
i 1 2 3 4 5
Bi [0, 1] (1, 2] (2, 3] (3, 4] (4, ∞)
p0i = P (X ∈ Bi |H0 ) P (X = 0) + P (X = 1) = 0.1756 P (X = 2) = 0.2113 P (X = 3) = 0.2230 P (X = 4) = 0.1766 1 − P (X ≤ 4) = 0.2135
Ei 5.268 6.339 6.691 5.297 6.404
O valor observado da estatística do teste é 2
2
2
2
+ (4−6.339) + (4−6.691) + (4−5.297) + (7−6.404) q0 = (11−5.268) 5.268 6.339 6.691 5.297 6.404 = 6.237 + 0.863 + 1.082 + 0.318 + 0.055 = 8.56
2
NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 170/207
3. Região crítica: Fixado α = 0.05, RC5% = {q ∈ IR+ : (q > b)}, onde b = Fχ−1 2 (0.95) = 7.815. (3)
0
b
Q
4. Conclusão: • Como q0 = 8.56 ∈ RC5% , rejeita-se H0 ao nível de significância de 5%. Ou seja, não há evidência a favor da hipótese de X ∼ Poisson(λ). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 171/207
Notas: 1. O valor-p do teste de ajustamento no Exemplo 8.7 é P = (Q0 > 8.56|H0 ) = 0.0357, −1 com Fχ−1 2 (0.95) = 7.815 e Fχ2 (0.975) = 9.348. (3)
(3)
Consequentemente, rejeita-se H0 para α ≥ 0.0357 e aceita-se H0 para α < 0.0357. Ou seja, há alguma evidência contra H0 . 2. Os valores Ei na estatística do teste do qui-quadrado devem ser • Todos maiores ou iguais a 1. • Pelo menos 80% deles devem ser no mínimo 5. Caso contrário, deve-se fazer reagrupamento de classes. 3. Caso seja necessário estimar m parâmetros no cálculo dos Ei , deve-se retirar m graus de liberdade da distribuição à estatística do teste do qui-quadrado de Pearson (χ2(k−m−1) ). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 172/207
Teste de independência do qui-quadrado de Pearson em tabelas de contingência. Suponha que cada um dos N elementos de uma população pode ser classificado de acordo com duas características X e Y , com r e s categorias, respectivamente. Seja pij = P (X = i, Y = j) a probabilidade (conjunta) de um elemento da população pertencer a categoria (i, j) de (X, Y ), i = 1, . . . , r, j = 1, . . . , s. Consequentemente, as probabilidades (marginais) das duas características são dadas por P pi• = P (X = i) = sj=1 P (X = i, Y = j) P p•j = P (Y = j) = ri=1 P (X = i, Y = j). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 173/207
Para avaliar a independência das duas características pode-se construir um teste de hipótese com base na estatística do qui-quadrado de Pearson, efectuando as seguintes adaptações: • A partição Bi , i = 1, . . . , rs pode ser apresentada como a partição
Bij , i = 1, . . . , r, j = 1, . . . , s.
• pij = P (Bij ) é a probabilidade de obter uma observação na (i, j)-
ésima parte da partição, tal que
Pr
i=1
Ps
j=1
pij = 1.
• Oij denota o número de elementos da amostra que pertence a Bij ,
tal que
Pr
i=1
Ps
j=1
Oij = N .
• A estatística do teste é dada por
Q0 =
s r X X (Oij − Eij )2 i=1 j=1
Eij
H0
∼ a
χ2(r−1)(s−1) ,
onde Eij = E(Oij |H0 ) = N p0ij . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 174/207
• A hipótese de independência entre X e Y é
H0 : pij = pi • × p• j , ∀ i, j. • Sob H0 , os valores esperados da estatística são
Eij = N p0ij = N pi• × p•j . Como pi• e p•j não são especificadas sob H0 , essas são substiO tuídas pelas suas estimativas de MV: pˆi• = ONi• e pˆ•j = N•j ,i.e., Oi• × O•j , N P P onde Oi• = sj=1 Oij e O•j = ri=1 Oij . Eij =
• Note-se que o vector aleatório O = (O11 , . . . , Ors ) segue uma
distribuição Multinomial (N, p = (p11 , . . . , prs )) e que Oij ∼ Binomial(N, pij ), i = 1, . . . , r, j = 1, . . . , s. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 175/207
Exemplo 8.8: Um fabricante de automóveis suspeita que a venda dos seus três últimos modelos está relacionada com o género dos seus compradores. Com base na seguinte tabela de contingência envolvendo 500 compradores, teste a hipótese de independência entre os três modelos de automóveis e o género dos compradores. género masculino feminino total
modelo 1 160 40 200
modelo 2 140 60 200
modelo 3 40 60 100
total 340 160 500
Teste de hipóteses: 1. Hipóteses: • H0 : pij = pi • × p• j , ∀ i, j • H1 : pij 6= pi • × p• j , para algum i, j. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 176/207
2. Estatística do teste: Q0 =
P2
i=1
p0ij
(Oij −Eij )2 j=1 Eij
P3
H0
∼ a
χ2(2) ,
onde Eij = E(Oij |H0 ) = N = Oi• × O•j /N . Por exemplo, E11 = 200 × 340/500 = 136 e E23 = 100 × 160/500 = 32. O valor observado da estatística (qui-quadrado de Pearson) é (60 − 32)2 (160 − 136)2 + ··· + = 49.63. q0 = 136 32 3. Valor-p: P = P (Q0 > 49.63|H0 ) = 1.67 × 10−11 , com Fχ−1 2 (0.9995) = 15.2. (2)
4. Conclusão: • Rejeita-se H0 para α ≥ 1.67 × 10−11 e aceita-se H0 no caso contrário, i.e., há forte evidência a favor da dependência entre a venda dos modelos de automóveis e género dos compradores. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 177/207