Slidespe Gs Print8

  • December 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Slidespe Gs Print8 as PDF for free.

More details

  • Words: 4,538
  • Pages: 18
8. Testes de hipóteses Uma outra forma de inferir sobre características de uma população é testar hipóteses previamente formuladas sobre os seus parâmetros, tendo em conta uma amostra aleatória da população e o valor tolerável para a probabilidade de rejeição incorrecta dessas hipóteses. Exemplo 8.1: Uma empresa portuguesa compra usualmente parafusos americanos e japoneses devido às suas boas condições de resistência à tracção (X). Os americanos afirmam que a resistência à tracção dos seus parafusos tem média 145 kg e desvio padrão 12 kg, enquanto os japoneses dizem ter 155 kg de média e 20 kg de desvio padrão. Um lote de parafusos será inspeccionado, desconhecendo-se a sua proveniência (americana ou japonesa). Com base numa amostra aleatória de 25 parafusos, calcula-se a resistência média à tracção (¯ x) a fim de investigar a origem dos mesmos. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 142/207

Supondo distribuição normal para as duas populações, N (145, 144) (americana) e N (155, 400) (japonesa), pode-se considerar a seguinte regra de decisão: • Se x ¯ ≤ 150, diz-se que os parafusos são de origem americana;

0.030

caso contrário, são de procedência japonesa (Regra 1).

0.000

0.010

0.020

N(145,144) N(155,400)

50

100

150

200

250

X NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 143/207

Na decisão do Exemplo 8.1, pode-se cometer dois tipos de erro: Erro do tipo I: Afirmar que os parafusos não são americanos (japoneses) quando na realidade eles são americanos. Erro do tipo II: Afirmar que os parafusos são americanos quando na realidade eles são japoneses. As probabilidades destes dois tipos de erro (Exemplo 8.1) são: ¯ > 150 | parafusos americanos) α = P (Erro tipo I) = P (X ¯ > 150 | X ∼ N (145, 144)) = P (Z > 2.08) = P (X = 0.019 ¯ ≤ 150 | parafusos japoneses) β = P (Erro tipo II) = P (X ¯ ≤ 150 | X ∼ N (155, 400)) = P (Z ≤ −1.25) = P (X = 0.106 NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 144/207

Ao usar a regra de decisão do Exemplo 8.1 (Regra 1), a probabilidade do erro de tipo I é superior à do erro de tipo II (α = 0.019 < β = 0.106), “favorecendo” assim os parafusos americanos. • Para cada regra de decisão tem-se um valor limítrofe para x ¯ (de-

notado aqui por x¯c ) em vez de 150. Por conseguinte, os valores de α e β variam consoante o valor fixado de x¯c .

• Se x ¯c > 150, α diminui e β aumenta. Se x¯c < 150, α aumenta e β

diminui.

• Se x ¯c = 148.75, α = β = 0.059 (ponto de equilíbrio).

Em suma, dada uma regra de decisão (i.e., um valor para x¯c ), calcula-se as probabilidades de erros tipo I e II para avaliar o método de decisão. Outro procedimento possível é fixar a probabilidade de um tipo de erro e encontrar a correspondente regra de decisão. Por exemplo, α = 0.05 implica x¯c = 154.4 e β = 0.4404, favorecendo a decisão para os parafusos americanos. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 145/207

Noções básicas. Um teste de hipóteses paramétricas usualmente visa comparar diferentes valores para o parâmetro desconhecido θ de uma dada população X. Procedimento geral de um teste de hipóteses: 1. Hipóteses de interesse: • Hipótese nula H0 (e.g., θ = θ0 ). • Hipótese alternativa H1 (e.g., θ 6= θ0 → teste bilateral; θ < θ0 ou θ > θ0 → testes unilaterais). 2. Erros associados à regra de decisão, cujas correspondentes probabilidades são dadas por • α = P (Erro do tipo I) = P (Rejeitar H0 |H0 verdadeiro). • β = P (Erro do tipo II) = P (Aceitar H0 |H0 falso). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 146/207

3. Região crítica (RC): Região que não favorece a hipótese nula H0 na regra de decisão. Construída com base numa estatística T = T (X1 , . . . , Xn ) (denominada estatística do teste). • A RC é construída tal que P (T ∈ RC|H0 verdadeiro) = α, sendo α (nível de significância do teste) fixado previamente. Doravante, RC é denotado por RCα . 4. Decisão do teste de hipótese: • Se T ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. Caso contrário, não se rejeita H0 a 100α%. • Quanto menor for o nível de significância do teste, tanto maior será a precaução contra o risco de rejeição incorrecta de H0 . Os níveis de significância são usualmente 1%, 5% e 10%. A determinação de β exige a especificação de cada valor alternativo para o parâmetro em teste, dado que H1 é geralmente composta (e.g., β = P (T ∈ / RCα |θ 6= θ0 )). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 147/207

Testes de hipóteses para parâmetros de populações normais Seja X1 , . . . , Xn uma a.a. de uma população X ∼ N (µ, σ 2 ), com σ 2 ¯ ∼ N (µ, σ 2 /n). conhecido. Sabe-se que o estimador MV de µ é X Teste de hipóteses: 1. Hipóteses: • H 0 : µ = µ0 • H1 : µ 6= µ0 (ou H1 : µ > µ0 ou H1 : µ < µ0 ) 2. Estatística do teste:

Z0 =

¯ − µ0 H0 X √ ∼ N (0, 1), σ/ n

cujo valor observado é denotado por z0 . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 148/207

3. Região crítica: Fixado um valor para α, RCα = {z ∈ IR : (z < −b) ∪ (z > b)}, onde b = FN−1(0,1) (1− α2 ).

−b

0

b

Z

4. Conclusão: • Se z0 ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. • Caso contrário, não há evidência para rejeitar H0 ao nível α. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 149/207

Exemplo 8.2: Uma máquina foi regulada para encher pacotes de café de 500g. Seja X1 , . . . , X16 uma a.a. de X (quantidade de café por pacote), cuja média amostral é 492g. Considerando que X segue uma distribuição normal com variância 400g 2 , teste a regulação da máquina ao nível de 1% de significância. Teste de hipóteses: 1. Hipóteses: H0 : µ = 500 ≡ µ0 versus H1 : µ 6= 500 2. Estatística do teste: Z0 = 492−500 é z0 = √ = −1.6.

¯ H0 X−µ √0 ∼ σ/ n

N (0, 1), cujo valor observado

400/16

3. Região crítica: Fixado α = 0.01, FN−1(0,1) (0.995) = 2.58 e RC1% = (−∞, −2.58) ∪ (2.58, ∞).

4. Conclusão: Como z0 ∈ / RC1% , não se rejeita H0 ao nível de significância de 1%, i.e., não há evidência contra a regulação da máquina.

NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 150/207

Seja X1 , . . . , Xn uma a.a. de uma população X ∼ N (µ, σ 2 ), com µ e σ 2 ¯ ∼ N (µ, σ 2 /n). desconhecidos. Sabe-se que o estimador MV de µ é X Teste de hipóteses: 1. Hipóteses: • H 0 : µ = µ0 • H1 : µ 6= µ0 (ou H1 : µ > µ0 ou H1 : µ < µ0 ) 2. Estatística do teste:

¯ − µ0 H0 X √ T0 = ∼ t(n−1) , S/ n Pn 1 ¯ 2 cujo valor observado é t0 , onde S 2 = n−1 i=1 (Xi − X) . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 151/207

3. Região crítica: Fixado um valor para α, RCα = {t ∈ IR : (t < −b) ∪ (t > b)}, onde b = Ft−1 (1− α2 ). (n−1)

−b

0

b

T

4. Conclusão: • Se t0 ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. • Caso contrário, não há evidência contra H0 ao nível α. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 152/207

Exemplo 8.2a: Seja X1 , . . . , X16 uma a.a. de X (quantidade de café por pacote), cuja média e variância amostral são 480g e 800g 2 , respectivamente. Considerando uma distribuição normal para X, teste se a máquina está a encher pacotes de café com pelo menos 500g, ao nível de 5% de significância. Teste de hipóteses: 1. Hipóteses: H0 : µ ≥ 500 ≡ µ0 versus H1 : µ < 500. 2. Estatística do teste: T0 = 480−500 = −2.83. t0 = √

¯ µ=µ0 X−µ √0 ∼ S/ n

t(15) , cujo valor observado é

800/16

3. Região crítica: Fixado α = 0.05, Ft−1 (0.95) = 1.753 e RC5% = (15) (−∞, −1.753). 4. Conclusão: Como t0 ∈ RC5% , rejeita-se H0 ao nível de significância de 5%, i.e., há evidência4contra a hipótese de enchimento de pacotes de café com pelo menos 500g.

NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 153/207

Exemplo 8.2b: No teste de hipóteses H0 : µ ≥ 500 ≡ µ0 versus H1 : µ < 500, a decisão do teste varia com a escolha de α, i.e., α RCα 0.05 (−∞, −1.753) 0.01 (−∞, −2.602) 0.006 (−∞, −2.857)

decisão do teste rejeita-se H0 rejeita-se H0 não se rejeita H0

Assim, o menor valor do nível de significância α que conduz à rejeição de H0 é P = P (T < −2.83|H0 ) = 0.0063.

Valor-p do teste. Definição 8.1: O valor-p de um teste de hipóteses (P ) é a probabilidade sob H0 de a estatística do teste tomar valores tão ou mais desfavoráveis a H0 do que o seu valor observado. Deste modo, H0 será rejeitado a todo nível de significância α tal que P < α e aceite no caso contrário. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 154/207

Seja X1 , . . . , Xn uma a.a. de uma população X ∼ N (µ, σ 2 ), com µ e σ 2 desconhecidos. Sabe-se que Q = (n − 1)S 2 /σ 2 ∼ χ2(n−1) . Teste de hipóteses: 1. Hipóteses: • H0 : σ 2 = σ02 • H1 : σ 2 6= σ02 (ou H1 : σ 2 > σ02 ou H1 : σ 2 < σ02 ). 2. Estatística do teste:

(n − 1)S 2 H0 2 Q0 = ∼ χ(n−1) , σ02 Pn 1 ¯ 2 com valor observado q0 e S 2 = n−1 i=1 (Xi − X) . Se µ for conhecido, Q0 =

Pn

i=1 (Xi −µ) σ02

2

H0

∼ χ2(n) .

NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 155/207

3. Região crítica: Fixado um valor para α, RCα = {q ∈ IR+ : (q < a) ∪ (q > b)}, onde a = Fχ−1 2

(n−1)

( α2 ) e b = Fχ−1 2

0

(n−1)

(1− α2 ).

a

Q

b

4. Conclusão: • Se q0 ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. Caso contrário, não há evidência contra H0 . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 156/207

Exemplo 8.3: Seja X1 , . . . , X10 uma a.a. de X (tensão de ruptura), P10 2 P x = 900 e cujos resultados são 10 i i=1 xi = 81108. Considerando i=1 uma distribuição normal para X, teste se V ar(X) = σ 2 = 10. Teste de hipóteses: 1. Hipóteses: H0 : σ 2 = 10 ≡ σ02 versus H1 : σ 2 6= 10. 2. Estatística do teste: Q0 = q0 =

9×12 10

= 10.8.

(n−1)S 2 H0 ∼ σ02

χ2(9) , cujo valor observado é

3. Valor-p: P = 2 min(P (Q0 ≥ 10.8|H0 ), P (Q0 < 10.8|H0 )) = −1 0.58. Note-se que Fχ−1 2 (0.71) = 10.8, Fχ2 (0.7) = 10.66 e (9)

Fχ−1 2 (0.8) (9)

(9)

= 12.24.

4. Conclusão: Rejeita-se H0 para α ≥ 0.58 e aceita-se H0 para α < 0.58. Ou seja, há forte evidência a favor da hipótese V ar(X) = 10. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 157/207

Duas populações normais Sejam X11 , . . . , X1n1 e X21 , . . . , X2n2 a.a. de duas populações independentes X1 ∼ N (µ1 , σ12 ) e X2 ∼ N (µ2 , σ22 ), respectivamente, com σ12 e σ22 conhecidos. Sabe-se que o estimador MV de µ1 − µ2 é ¯1 − X ¯ 2 ∼ N (µ1 − µ2 , σ12 /n1 + σ22 /n2 ). X Teste de hipóteses: 1. Hipóteses: • H 0 : µ1 = µ2 ⇔ µ1 − µ2 = 0 • H1 : µ1 6= µ2 (ou H1 : µ1 > µ2 ou H1 : µ1 < µ2 ) 2. Estatística do teste:

¯1 −X ¯2 X

H

0 ∼ N (0, 1), Z0 = p 2 σ1 /n1 + σ22 /n2

com valor observado z0 .

NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 158/207

3. Região crítica: Fixado um valor para α, RCα = {z ∈ IR : (z < −b) ∪ (z > b)}, onde b = FN−1(0,1) (1− α2 ).

−b

0

b

Z

4. Conclusão: • Se z0 ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. Caso contrário, aceita-se H0 ao nível α.

NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 159/207

Sejam X11 , . . . , X1n1 e X21 , . . . , X2n2 a.a. de duas populações independentes X1 ∼ N (µ1 , σ12 ) e X2 ∼ N (µ2 , σ22 ), respectivamente, com σ12 = σ22 = σ 2 (desconhecido). Teste de hipóteses: 1. Hipóteses: • H 0 : µ1 = µ2 ⇔ µ1 − µ2 = 0 • H1 : µ1 6= µ2 (ou H1 : µ1 > µ2 ou H1 : µ1 < µ2 ) 2. Estatística do teste: T0 = q

¯1 −X ¯2 X

H0

(n1−1)S12 +(n2−1)S22 1 ( n1 n1 +n2 −2

com valor observado t0 e Si2 =

1 ni −1

+

1 ) n2

Pni

∼ t(n1 +n2 −2) ,

j=1 (Xij

¯ i )2 , i = 1, 2. −X

NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 160/207

3. Região crítica: Fixado um valor para α, RCα = {t ∈ IR : (t < −b) ∪ (t > b)}, onde b = Ft−1 (n +n 1

2 −2)

(1− α2 ).

−b

0

b

T

4. Conclusão: • Se t0 ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. Caso contrário, não há evidência contra H0 .

NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 161/207

Exemplo 8.4: Para testar a resistência de dois tipos de viga de aço (A e B), observou-se a resistência de algumas dessas vigas de aço, obtendo os seguintes resultados de duas amostras: tipo A B

tamanho 15 10

média 70.5 84.3

variância 81.6 85.7

Supondo que as amostras (aleatórias) são provenientes de duas populações normais independentes X1 ∼ N (µ1 , σ 2 ) e X2 ∼ N (µ2 , σ 2 ), teste a igualdade das médias populacionais. Teste de hipóteses: 1. Hipóteses: • H 0 : µ1 = µ2 ⇔ µ1 − µ2 = 0 • H1 : µ1 6= µ2 . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 162/207

2. Estatística do teste: T0 = q

¯1 −X ¯2 X

(n1−1)S12 +(n2−1)S22 1 ( n1 n1 +n2 −2

H0

+

1 ) n2

∼ t(23) ,

70.5−84.3 (83.204)(1/15+1/10)

cujo valor observado é t0 = √

= −3.71.

3. Valor-p: P = P (|T0 | ≥ 3.71|H0 ) = 2(1−Ft(23) (3.71)) = 0.0012. 4. Conclusão: • Rejeita-se H0 para α ≥ 0.0012. • Aceita-se H0 para α < 0.0012. Há forte evidência contra a hipótese de igualdade entre as resistências médias dos dois tipos de viga de aço. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 163/207

Testes de hipóteses para parâmetros de populações não normais uniparamétricas. Exemplo 8.5: Seja X1 , . . . , Xn uma a.a. de uma população X ∼ a ¯∼ Bernoulli(p). Pelo T.L.C. (n grande), X N (p, p(1 − p)/n). Teste de hipóteses para uma proporção (em grandes amostras): 1. Hipóteses: • H0 : p = p 0 • H1 : p 6= p0 (ou H1 : p > p0 ou H1 : p < p0 ). 2. Estatística do teste:

Z0 = p

¯ − p0 X

H0

p0 (1 − p0 )/n

∼ a

N (0, 1),

cujo valor observado é z0 . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 164/207

3. Região crítica: Fixado um valor para α, RCα = {z ∈ IR : (z < a) ∪ (z > b)}, onde b = −a = FN−1(0,1) (1− α2 ).

−b

0

b

Z

4. Conclusão: • Se z0 ∈ RCα , rejeita-se H0 ao nível de significância de 100α%. • Caso contrário, não há evidência contra H0 ao nível α. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 165/207

Exemplo 8.6: Uma estação de TV afirma que no mínimo 60% dos telespectadores devem assistir o seu programa especial de Natal. A fim de avaliar esta afirmação, 200 famílias foram inquiridas, com 104 respostas afirmativas, sendo X1 , . . . , X200 uma a.a. de X ∼ Bernoulli(p). Teste de hipóteses: 1. Hipóteses: H0 : p ≥ 0.6 ≡ p0 versus H1 : p < 0.6.

¯ 0 H0 X−p ∼ p0 (1−p0 )/n a

2. Estatística do teste: Pelo T.L.C., Z0 = √ cujo valor observado é z0 = √0.52−0.6

0.6 0.4/200

N (0, 1),

= −2.31.

3. Valor-p: P (Z0 ≤ −2.31|H0 ) = 0.0104.

4. Conclusão: • Rejeita-se H0 para α ≥ 0.0104. • Não se rejeita H0 para α < 0.0104. Ou seja, há alguma evidência contra a afirmação da estação de TV. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 166/207

Teste de ajustamento do qui-quadrado de Pearson. Até ao momento os procedimentos de inferência estatística tem incidido sobre problemas paramétricos. Entretanto, pode-se também formular hipóteses sobre a própria forma distribucional de uma dada população, e.g., usando um teste de ajustamento do qui-quadrado de Pearson. Construção da estatística do teste do qui-quadrado de Pearson: 1. Considere uma amostra aleatória de N elementos sobre os quais se observa uma característica X, sendo as respectivas observações organizadas numa partição da recta real, B1 , . . . , Bk . 2. Seja pi = P (Bi ) a probabilidade de obter uma observação na iP ésima parte da partição, i = 1, . . . , k, tal que ki=1 pi = 1, enquanto Oi denota o número de elementos da amostra que pertence P a Bi , i = 1, . . . , k, tal que ki=1 Oi = N . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 167/207

3. O vector aleatório O = (O1 , . . . , Ok ) tem f.m.p. dada por fO (o1 , . . . , ok ) =

N! Ok 1 O2 pO 1 p2 · · · pk , O1 ! . . . Ok !

conhecida por distribuição Multinomial (N, p = (p1 , . . . , pk )), podendo-se provar que Oi ∼ Binomial(N, pi ), i = 1, . . . , k.

4. Hipóteses: • H0 : X ∼ FX (·) ⇒ pi = p0i , ∀ i = 1, . . . , k. • H1 : X ≁ FX (·) ⇒ pi 6= p0i , para algum i = 1, . . . , k. 5. Estatística do teste: Q0 =

k X (Oi − Ei )2 i=1

Ei

H0

χ2(k−m−1) ,

∼ a

onde Ei = E(Oi |H0 ) = N p0i e m é o total de parâmetros estimados. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 168/207

Exemplo 8.7: Acredita-se que o número X de acidentes por semana numa dada estrada segue uma distribuição Poisson. Para testar esta crença observou-se o número de acidentes nessa estrada durante 30 semanas, cujos resultados encontram-se a seguir. Teste a suposição de distribuição Poisson para X ao nível de significância de 5%. 8 3

4 1

1 0

1 2

3 0

0 3

0 0 4 2

8 1

9 12

2 5

4 7 0 5

1 4

3 2

Teste de hipóteses: 1. Hipóteses: • H0 : X ∼ Poisson(λ) versus H1 : X ≁ Poisson(λ). 2. Estatística do teste: Q0 =

k X (Oi − Ei )2 i=1

Ei

H0

∼ a

χ2(k−m−1) ,

NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 169/207

95 = 3.167 onde Ei = 30 p0i e a estimativa MV de λ é x¯ = 30 (m = 1) e portanto, sob H0 , considera-se X ∼ Poisson(λ = 3.167). Por simplicidade, escolheu-se a seguinte partição B1 , . . . , B5 .

i 1 2 3 4 5

Bi [0, 1] (1, 2] (2, 3] (3, 4] (4, ∞)

p0i = P (X ∈ Bi |H0 ) P (X = 0) + P (X = 1) = 0.1756 P (X = 2) = 0.2113 P (X = 3) = 0.2230 P (X = 4) = 0.1766 1 − P (X ≤ 4) = 0.2135

Ei 5.268 6.339 6.691 5.297 6.404

O valor observado da estatística do teste é 2

2

2

2

+ (4−6.339) + (4−6.691) + (4−5.297) + (7−6.404) q0 = (11−5.268) 5.268 6.339 6.691 5.297 6.404 = 6.237 + 0.863 + 1.082 + 0.318 + 0.055 = 8.56

2

NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 170/207

3. Região crítica: Fixado α = 0.05, RC5% = {q ∈ IR+ : (q > b)}, onde b = Fχ−1 2 (0.95) = 7.815. (3)

0

b

Q

4. Conclusão: • Como q0 = 8.56 ∈ RC5% , rejeita-se H0 ao nível de significância de 5%. Ou seja, não há evidência a favor da hipótese de X ∼ Poisson(λ). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 171/207

Notas: 1. O valor-p do teste de ajustamento no Exemplo 8.7 é P = (Q0 > 8.56|H0 ) = 0.0357, −1 com Fχ−1 2 (0.95) = 7.815 e Fχ2 (0.975) = 9.348. (3)

(3)

Consequentemente, rejeita-se H0 para α ≥ 0.0357 e aceita-se H0 para α < 0.0357. Ou seja, há alguma evidência contra H0 . 2. Os valores Ei na estatística do teste do qui-quadrado devem ser • Todos maiores ou iguais a 1. • Pelo menos 80% deles devem ser no mínimo 5. Caso contrário, deve-se fazer reagrupamento de classes. 3. Caso seja necessário estimar m parâmetros no cálculo dos Ei , deve-se retirar m graus de liberdade da distribuição à estatística do teste do qui-quadrado de Pearson (χ2(k−m−1) ). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 172/207

Teste de independência do qui-quadrado de Pearson em tabelas de contingência. Suponha que cada um dos N elementos de uma população pode ser classificado de acordo com duas características X e Y , com r e s categorias, respectivamente. Seja pij = P (X = i, Y = j) a probabilidade (conjunta) de um elemento da população pertencer a categoria (i, j) de (X, Y ), i = 1, . . . , r, j = 1, . . . , s. Consequentemente, as probabilidades (marginais) das duas características são dadas por P pi• = P (X = i) = sj=1 P (X = i, Y = j) P p•j = P (Y = j) = ri=1 P (X = i, Y = j). NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 173/207

Para avaliar a independência das duas características pode-se construir um teste de hipótese com base na estatística do qui-quadrado de Pearson, efectuando as seguintes adaptações: • A partição Bi , i = 1, . . . , rs pode ser apresentada como a partição

Bij , i = 1, . . . , r, j = 1, . . . , s.

• pij = P (Bij ) é a probabilidade de obter uma observação na (i, j)-

ésima parte da partição, tal que

Pr

i=1

Ps

j=1

pij = 1.

• Oij denota o número de elementos da amostra que pertence a Bij ,

tal que

Pr

i=1

Ps

j=1

Oij = N .

• A estatística do teste é dada por

Q0 =

s r X X (Oij − Eij )2 i=1 j=1

Eij

H0

∼ a

χ2(r−1)(s−1) ,

onde Eij = E(Oij |H0 ) = N p0ij . NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 174/207

• A hipótese de independência entre X e Y é

H0 : pij = pi • × p• j , ∀ i, j. • Sob H0 , os valores esperados da estatística são

Eij = N p0ij = N pi• × p•j . Como pi• e p•j não são especificadas sob H0 , essas são substiO tuídas pelas suas estimativas de MV: pˆi• = ONi• e pˆ•j = N•j ,i.e., Oi• × O•j , N P P onde Oi• = sj=1 Oij e O•j = ri=1 Oij . Eij =

• Note-se que o vector aleatório O = (O11 , . . . , Ors ) segue uma

distribuição Multinomial (N, p = (p11 , . . . , prs )) e que Oij ∼ Binomial(N, pij ), i = 1, . . . , r, j = 1, . . . , s. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 175/207

Exemplo 8.8: Um fabricante de automóveis suspeita que a venda dos seus três últimos modelos está relacionada com o género dos seus compradores. Com base na seguinte tabela de contingência envolvendo 500 compradores, teste a hipótese de independência entre os três modelos de automóveis e o género dos compradores. género masculino feminino total

modelo 1 160 40 200

modelo 2 140 60 200

modelo 3 40 60 100

total 340 160 500

Teste de hipóteses: 1. Hipóteses: • H0 : pij = pi • × p• j , ∀ i, j • H1 : pij 6= pi • × p• j , para algum i, j. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 176/207

2. Estatística do teste: Q0 =

P2

i=1

p0ij

(Oij −Eij )2 j=1 Eij

P3

H0

∼ a

χ2(2) ,

onde Eij = E(Oij |H0 ) = N = Oi• × O•j /N . Por exemplo, E11 = 200 × 340/500 = 136 e E23 = 100 × 160/500 = 32. O valor observado da estatística (qui-quadrado de Pearson) é (60 − 32)2 (160 − 136)2 + ··· + = 49.63. q0 = 136 32 3. Valor-p: P = P (Q0 > 49.63|H0 ) = 1.67 × 10−11 , com Fχ−1 2 (0.9995) = 15.2. (2)

4. Conclusão: • Rejeita-se H0 para α ≥ 1.67 × 10−11 e aceita-se H0 no caso contrário, i.e., há forte evidência a favor da dependência entre a venda dos modelos de automóveis e género dos compradores. NOTAS DE PROBABILIDADES E ESTAT´ ISTICA - GS – 177/207

Related Documents

Slidespe Gs Print8
December 2019 2
Slidespe Gs Print9
December 2019 2
Slidespe Gs Print6
December 2019 3
Slidespe Gs Print1&2
December 2019 3
Slidespe Gs Print3
December 2019 4
Slidespe Gs Print4
December 2019 4