Tugas 2 Adk.docx

  • Uploaded by: Fadil M Aziz
  • 0
  • 0
  • June 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Tugas 2 Adk.docx as PDF for free.

More details

  • Words: 4,871
  • Pages: 16
1. An article in the New York Times (February 17, 1999) about the PSA blood test for detecting prostate cancer stated that, of men who had this disease, the test fails to detect prostate cancer in 1 in 4 (so called false-negative results), and of men who did not have it, as many as twothirds receive false-positive results.Let C(𝐶̅ ) denote the event of having (not having) prostate cancer and let + (−) denote a positive (negative) test result. a. Which is true: P (−|C) = 1/4 or P (C|−) = 1/4? P (𝐶̅ |+) = 2/3 or P (+|𝐶̅ ) = 2/3? Karena dalam uji diagnostic yang pertama, diperoleh hasil uji yang negative namun ternyata mereka memiliki penyakit, maka yang benar adalah: P (−|C) = 1/4, dan sisanya, diketahui para pria tidak memiliki penyakit, namun mereka memiliki uji diagnostic positif maka yang benar adalah :P (𝐶̅ |+) = 2/3 b. What is the sensitivity of this test? Sensitivitas merupakan probabilitas uji diagnostic positif saat subjek memiliki penyakit, sensitivitas memiliki rumusan : P(Y=1|X=1) yang berarti P(+|C) = 1(P(−|C)) = 1- ¼ = 3/4. c. Of men who take the PSA test, suppose P (C) = 0.01. Find the cell probabilities in the 2 × 2 table for the joint distribution that cross classifies Y = diagnosis (+, −) with X = true disease status (C, 𝐶̅ ). X\Y + − Jumlah 1- ¼(0.01) = ¼(0.01)= 0.0025 C 0.01 0.0075 ̅ 0.66 0.33 1-0.01 = 0.99 𝑪 0.6675 0.3325 1 Jumlah ̅ ))=1-P(C)=0,99. Karena P(C)=0,01,komplemennya adalah P(𝑪 Selanjutnya, menerapkan definisi probabilitas bersyarat pada P (- | C) dan menggunakan probabilitas yang diketahui dari bagian (a) yang kita miliki, P (- ∩ C) = P (- | C) · P (C) = 1 4 × 0,01 = 0,0025. Akibatnya, P (+ ∩ C) = 0,01 - 0,0025 = 0,0075. Menggunakan hukum komplemen terhadap probabilits bersyarat yang diketahui, maka ̅ )= 1 − P(+ | 𝑪 ̅ )= 1 – 2/3 = 1/3 . Dan, mengaplikasikan probabilitas bersyarat , P(−|𝑪 ̅ ) memberikan P(−∩𝑪 ̅ ) = P(− |𝑪 ̅ )·P(𝑪 ̅ ) = 1 3 × 0.99 = 0.33. Maka, P(+ terhadap P(− | 𝑪 ̅ ) = 0.99 − 0.33 = 0.66, dan P(+) = 0.0075 + 0.66 = 0.6675, dan P(−) = 0.0025 + ∩𝑪 0.33 = 0.3325. d. Using (c), find the marginal distribution for the diagnosis P(+) = 0.0075 + 0.66 = 0.6675 P(−) = 0.0025 + 0.33 = 0.3325. e. Using (c) and (d), find P (C|+), and interpret. P(C | +) = P (C∩+)/P (+) = 0.0075/0.6675 = 0.01124. Ini berarti probabilitas dari lelaki yang terdiagnosis positif dan sebenarnya memiliki kanker prostat adalah 0.01124.

2. For diagnostic testing, let X = true status (1 = disease, 2 = no disease) and Y = diagnosis (1 = positive, 2 = negative). Let πi = P (Y = 1|X = i), i = 1, 2. a. Explain why sensitivity = π1 and specificity = 1 − π2. Karena sensitivity = P(Y = 1|X = 1) = π1, dan specificity = P(Y = 2|X = 2) = 1−P(Y = 1|X = 2) = 1−π2. b. Let γ denote the probability that a subject has the disease. Given that the diagnosis is positive, use Bayes’s theorem to show that the probability a subject truly has the disease is π1γ /[π1γ + π2(1 − γ )] P(Y = 1|X = 1)P(X = 1)

P(X = 1|Y = 1) = P(Y = 1|X = 1)P(X = 1) + P(Y = 1|X = 2)P(X = 2) c. For mammograms for detecting breast cancer, suppose γ = 0.01, sensitivity = 0.86, and specificity = 0.88. Given a positive test result, find the probability that the woman truly has breast cancer. P(positive,disease)= π1γ /[π1γ + π2(1 − γ )]=0.86(0.01)/[0.86(0.01) + 0.12(0.99)] = 0.0675. d. To better understand the answer in (c), find the joint probabilities for the 2 × 2 cross classification of X and Y . Discuss their relative sizes in the two cells that refer to a positive test result. Untuk menghitung nilai dalam tabel: P(Y = 1 ∩ X = 1) = P(Y = 1 | X = 1) · P(X = 1) = 0.86 × 0.01 = 0.0086 P(Y = 2 ∩ X = 1) = 0.01 − 0.0086 = 0.0014 P(X = 2) = 1 − 0.01 = 0.99 P(Y = 1 ∩ X = 2) = P(Y = 1 | X = 2) · P(X = 2) = 0.12 × 0.99 = 0.1188 P(Y = 2 ∩ X = 2) = 0.99 − 0.1188 = 0.8712. Maka: X\Y + Total 0.0086 0.0014 0.01 Disease 0.1188 0.8712 0.99 No Disease Interpretasi: Hampir semua subjek, yaitu sebanyak 99% dari subjek tidak memiliki kanker payudara. Untuk wanita dengan penyakit kanker payudara, terdapat probabilitas 0.86 untuk mendeteksinya. Untuk wanita tanpa kanker, terdapat probabilitas 0.88 hasilnya negative. Namun karena total dari yang berpenyakit hanya 1%, dan yang tidak berpenyakit adalah 99%, maka proporsi kecil dari error untuk mayoritas besar dari wanita yang tidak memiliki penyakit kanker menutupi proporsi besar dari diagnosis yang benar untuk jumlah sedikit wanita yang memiliki kanker. 3. According to recent UN figures, the annual gun homicide rate is 62.4 per one million residents in the United States and 1.3 per one million residents in the UK. a. Compare the proportion of residents killed annually by guns using the (i) difference of proportions, (ii) relative risk.

(i) 0.0000624 − 0.0000013 = 0.000061 (ii) 62.4/1.3 = 48 Maka, perkiraan kemungkinan kematian terkait senjata di AS adalah 48 kali lipat dari Inggris. b. When both proportions are very close to 0, as here, which measure is more useful for describing the strength of association? Why? Resiko relative, karena angka perbedaan proporsi yang kecil seolah –olah memperlihatkan tidak ada pengaruh apapun. 4. (In book no.5) Consider the following two studies reported in the New York Times: a. A British study reported (December 3, 1998) that, of smokers who get lung cancer, “women were 1.7 times more vulnerable than men to get small-cell lung cancer.” Is 1.7 an odds ratio, or a relative risk? Deskripsi 1,7 kali lebih rentan mengacu pada Risiko Relatif. Meskipun, baik odds rasio dan risiko relatif membandingkan kemungkinan peristiwa antara dua kelompok, istilah rentan menyiratkan rasio probabilitas. "Risiko relatif mengukur peristiwa dengan cara yang dapat ditafsirkan dan konsisten dengan cara orang berpikir." b. A National Cancer Institute study about tamoxifen and breast cancer reported (April 7, 1998) that the women taking the drug were 45% less likely to experience invasive breast cancer compared with the women taking placebo. Find the relative risk for (i) those taking the drug compared to those taking placebo, (ii) those taking placebo compared to those taking the drug. (i) Kata "kemungkinan" mengacu pada probabilitas, jadi kalimat ini berbicara tentang Risiko Relatif. "45% lebih kecil kemungkinannya" maka Risiko Relatif dari kelompok obat terhadap kelompok plasebo adalah 1- 0,45 = 0,55. (ii) RR kelompok placebo terhadap kelompok obat = (0,55) ^ - 1 = 1,82. Para wanita yang menggunakan plasebo adalah 1,82 kali lebih mungkin untuk mengalami kanker dibandingkan dengan wanita yang menggunakan obat 5. (In book no 7) For adults who sailed on the Titanic on its fateful voyage, the odds ratio between gender (female, male) and survival (yes, no) was 11.4. (For data, see R. Dawson, J. Statist. Educ. 3, no. 3, 1995.) a. What is wrong with the interpretation, “The probability of survival for females was 11.4 times that for males”? Give the correct interpretation. Odds rasio adalah rasio peluang bertahan hidup bagi wanita. Jadi, odds bertahan hidup untuk wanita adalah 11,4 kaliodds bertahan hidup untuk pria. Namun, odds bukan probabilitas, jadi pernyataan yang sama tidak bisa dibuat tentang probabilitas untuk bertahan hidup. Pernyataan yang benar adalah "Odds untuk bertahan hidup bagi perempuan adalah 11,4 kali lipat untuk laki-laki." Odds rasio dan risiko relatif tidak akan hampir sama

dalam kasus ini, karena peristiwa yang dipermasalahkan (bertahan hidup) bukan peristiwa yang cukup langka. b. The odds of survival for females equaled 2.9. For each gender, find the proportion who survived.  Karena odds rasio-nya adalah   F  11.4 , dan  F  2.9 , maka M M 

F 2.9  0.25 . Proporsi wanita yang selamat adalah  F   0.74 . 11.4 1 F

Proporsi pria yang selamat adalah  M 

M  0.20 . 1 M

c. Find the value of R in the interpretation, “The probability of survival for females was R times that for males.” Agar interpretasi yang diberikan masuk akal, R di sini harus menjadi risiko relatif yang diberikan oleh πf/ πm = 0.7436/0.2028 = 3.6667 6. (In book no 9) An estimated odds ratio for adult females between the presence of squamous cell carcinoma (yes, no) and smoking behavior (smoker, nonsmoker) equals 11.7 when the smoker category consists of subjects whose smoking level s is 0 <s< 20 cigarettes per day; it is 26.1 for smokers with s ≥ 20 cigarettes per day (R. Brownson et al., Epidemiology, 3: 61–64, 1992). Show that the estimated odds ratio between carcinoma and smoking levels (s ≥ 20, 0 <s< 20) equals 26.1/11.7 = 2.2 Dalam tabel 2 × 2, estimasi rasio odds antara kehadiran karsinoma sel skuamosa (Y) dan tingkat merokok (X) 0 <s <20 batang per hari diberikan oleh oddss/oddsc=26.1. Begitu pula yang diperkirakan odds rasio antara kehadiran karsinoma sel skuamosa dan tingkat merokok s ≥ 20 batang per hari diberikan oleh oddsss/oddsc = 11.7. Maka perkiraan odds rasio antara karsinoma dan tingkat merokok (s ≥ 20, 0 <s <20) adalah oddsss/oddss = 26.1(oddsc)/11.7(oddsc) = 2.2. 7. (In book no 11) A 20-year study of British male physicians (R. Doll and R. Peto, British Med. J., 2: 1525– 1536, 1976) noted that the proportion who died from lung cancer was 0.00140 per year for cigarette smokers and 0.00010 per year for nonsmokers. The proportion who died from heart disease was 0.00669 for smokers and 0.00413 for nonsmokers. a. Describe the association of smoking with lung cancer and with heart disease, using the difference of proportions, the relative risk, and the odds ratio. Interpret. Kanker Paru-paru P(Mati=Kanker|Merokok=Ya) = 0.00140 P(Mati=Kanker|Merokok=Tidak) = 0.00010 Perbedaan proporsi P(M=K|Mer=Ya)-P(M=K|Mer=Tid)= 0.00130 Resiko relative:P(M=K|Mer=Ya)/P(M=K|Mer=Tid)=0.00140/0.00010 = 14

Odds ratio = OR=RR*[1- P(M=K|Mer=Tid)]/([1- P(M=K|Mer=Ya)] Maka Odds ratio = 14 * (1-0.000010)/(1-0.00140) = 14.02 Perbedaan pada hasilnya menunjukkan bahwa proporsi dari dokter pria orang Inggris yang merokok dan meninggal karena kanker paru-paru adalah 0.13% lebih daripada yang tidak merokok. Hasil resiko relative menunjukkan proporsi bahwa dokter pria Inggris yang merokok, mati karena kanker paru-paru 14x dari yang itdak merokok. Odds Rasio menunjukkan bahwa odds yang mati karena kanker paru-paru dan dulunya merokok adalah 14.02x dari odds yang tidak merokok. Penyakit Jantung P(M=PJ|Mer=Ya) = 0.00669 P(M=PJ|Mer=Tid) = 0.00413 Perbedaan proporsi P(M=PJ|Mer=Ya) – P(M=PJ|Mer=Tid) = 0.00256 Risiko relatif P(M=PJ|Mer=Ya) / P(M=PJ|Mer=Tid) = 0.00669/0.00413 = 1.62 Odds Rasio = OR=RR*[1- P(M=PJ|Mer=Tid)]/([1- P(M=PJ|Mer=Ya)] Odds Rasio = 1.62 * (1-0.00413)/(1-0.00669) = 1.62 Perbedaan pada hasilnya menunjukkan bahwa proporsi dari dokter pria orang Inggris yang merokok dan meninggal penyakit jantung adalah 0.26% lebih daripada yang tidak merokok. Hasil resiko relative menunjukkan proporsi bahwa dokter pria Inggris yang merokok, mati karena penyakit jantung 1.62x dari yang itdak merokok. Odds Rasio menunjukkan bahwa odds yang mati karena penyakit jantung dan dulunya merokok adalah 1.62x dari odds yang tidak merokok. b. Which response (lung cancer or heart disease) is more strongly related to cigarette smoking, in terms of the reduction in deaths that could occur with an absence of smoking? Besarnya risiko relatif dan odds rasio keduanya jauh lebih tinggi untuk respon kanker paru-paru terhadap perokok daripada antara penyakit jantung dan perokok. Disimpulkan bahwa menghilangkan rokok akan memiliki dampak yang jauh lebih besar pada pengurangan kematian akibat kanker paru-paru daripada pengurangan kematian akibat penyakit jantung. 8. (In book no. 12) A statistical analysis that combines information from several studies is called a meta analysis. A meta analysis compared aspirin with placebo on incidence of heart attack and of stroke, separately for men and for women (J. Am. Med. Assoc., 295: 306–313, 2006). For the Women’s Health Study, heart attacks were reported for 198 of 19,934 taking aspirin and for 193 of 19,942 taking placebo. a. Construct the 2 × 2 table that cross classifies the treatment (aspirin, placebo) with whether a heart attack was reported (yes, no). Perlakuan Penyakit Jantung Jumlah Ya Tidak 198 19.736 19.934 Aspirin

Placebo

193

19.749

19.942

b. Estimate the odds ratio. Interpret. 198/19736 Odds Rasio-nya adalah 𝜃̂= n11n12/n21n22 = = 1.0266. 193/19749

Karena Odds Rasio-nya lebih besar dari 1, perempuan yang diberi aspirin lebih mungkin terkena penyakit jantung daripada yang tidak mengambil aspirin. c. Find a 95% confidence interval for the population odds ratio for women. Interpret. (As of 2006, results suggested that for women, aspirin was helpful for reducing risk of stroke but not necessarily risk of heart attack.) Rumus Interval Kepercayaan adalah log 𝜃̂ ± Zα/2 . σ log 𝜃̂ dimana σ log 𝜃̂ = (1/n11 + 1/n12 + 1/n21 +1/n22)^1/2 Maka: log 𝜃̂= log 1.0266 = 0.0114 σ log 𝜃̂= (1/198 + 1/19736 + 1/193 +1/19749)^1/2 = 0.1017 Maka, log 𝜃̂ ± Zα/2 . σ log 𝜃̂ menjadi 0.0114 ± 1.96 × 0.1017 = (−0.18793, 0.21073), maka Interval Kepercayaan 95% adalah (e-0.18793,e0.21073) = (0.82867, 1.23458). Karena Intervalnya mengandung angka 1, maka tidak ada asosiasi. 9. (In book no 13) Refer to Table 2.1 about belief in an afterlife. Jenis Kelamin Percaya pada akhirat Total Ya Tidak 509 116 625 Perempuan 398 104 502 Lelaki 907 220 1127 Total a. Construct a 90% confidence interval for the difference of proportions, and interpret. Interval kepercayaan untuk perbedaan proporsi adalah : (p1-p2) ± Zα/2{(p1(1-p1))/n1 + (p2(1-p2))/n2}1/2 509

398

Karena p1 = 625= 0.8144 dan p2= 502= 0.7928, maka interval kepercayaan 90% adalah: (0.8144-0.7928) ± 1.645{(0.8144(1-0.8144))/625 + (0.7928(1-0.7928))/502}1/2 = 0.0216 ± 0.0392 Yang berarti = (−0.01764, 0.06084). Karena interval ini memiliki angka negative, disimpulkan bahwa π1 − π2 < 0, atau sama dengan, π1 < π2. Ini berarti lebih banyak pria yang percaya terhadap akhirat dibandingkan wanita. b. Construct a 90% confidence interval for the odds ratio, and interpret. Interval kepercayaan untuk odds rasio adalah log 𝜃̂ ± Zα/2 . σ log 𝜃̂ maka: 509/116 log 𝜃̂=log = 0.05941 398/104

σ log 𝜃̂= (1/509 + 1/116 + 1/398 +1/104)^1/2 = 0.15071

log 𝜃̂ ± Zα/2 . σ log 𝜃̂= 0.05941 ± 1.645 × 0.15071 = (−0.18851, 0.30733) Interval kepercayaan 90% adalah (e−0.18851, e0.30733) = (0.82819, 1.35979). Karena intervalnya mengandung angka 1, maka tidak terdapat asosiasi antara pria dan wanita terhadap kepercayaan untuk adanya akhirat. c. Conduct a test of statistical independence. Report the P-value and interpret. Hipotesis nol bahwa kedua respon independen adalah πij = πi. · π., untuk semua i dan j. Hipotesis alternatifnya adalah kedua respon saling dependen terhadap satu sama lain. Akan digunakan statistik chi-kuadrat Pearson untuk menguji hipotesis dengan rumusan: X2 =∑𝑖𝑗

(𝑛𝑖𝑗−µ ̂𝑖𝑗)2 ̂𝑖𝑗 µ

. Dengan µ̂ij =( ni. x n.j) /n

Maka: µ̂11 = µ̂12 = µ̂21 = µ̂22 =

625𝑥907

= 502.9947

1127 625𝑥220 1127 502𝑥907

= 122.0053

= 404.0053

1127 502𝑥220 1127

= 97.9947

Nilai chi-kuadrat Pearsonnya adalah: X2 =

(509−502.9947)2 (116−122.0053)2 (398−404.0053)2 (104−97.9947)2 502.9947

+

122.0053

+

404.0053

+

97.9947

=0.8246.

Derajat kebebasannya adalah (I − 1)(J − 1) = (2 − 1)(2 − 1) = 1. p-value-nya adalah 0.3638, yang berarti H0 ditolak maka kepercayaan terhadap akhirat dan jenis kelamin saling independen. 10. (In book no. 16) Table 2.12 comes from one of the first studies of the link between lung cancer and smoking, by Richard Doll and A. Bradford Hill. In 20 hospitals in London, UK, patients admitted with lung cancer in the previous year were queried about their smoking behavior. For each patient admitted, researchers studied the smoking behavior of a noncancer control patient at the same hospital of the same sex and within the same 5-year grouping on age. A smoker was defined

as a person who had smoked at least one cigarette a day for at least a year.

a. Identify the response variable and the explanatory variable. b. Identify the type of study this was. c. Can you use these data to compare smokers with nonsmokers in terms of the proportion who suffered lung cancer? Why or why not? d. Summarize the association, and explain how to interpret it. 11. (In book no. 18) Table 2.13 shows data from the 2002 General Social Survey cross classifying a person’s perceived happiness with their family income. The table displays the observed and expected cell counts and the standardized residuals for testing independence.

a. Show how to obtain the estimated expected cell count of 35.8 for the first cell. Nilai 35.8 diperoleh dari perkalian antara jumlah baris 1 dengan kolom 1 dibagi total sample. n n x11  1 1 n 290  168  1362  35.8 b. For testing independence, X2 = 73.4. Report the df value and the P-value, and interpret. Dari tabel kontingensi teresbut diperoleh df sama dengan (b-1)(k-1) yaitu (2)(2)=4, dengan p – value sebesar 4.2273 10 -15 , dengan p – value yang sangat kecil, maka terbukti bahwa terdapat asosiasu yang kuat antara tingkat pendapatan dan tingkat kebahagiaan. c. Interpret the standardized residuals in the corner cells having counts 21 and 83. Nilai standardized residuals dari sell pertama bernilai -2.973, karena nilainya lebih dari 2 dalam nilai mutlak maka mengindikasikan adanya dependensi pada sel tersebut. Pada sel dengan jumlah pengamatan 83 memiliki nilai standardized residual -5.907,

begitupun dengan sel ini yang nilai mutlaknya lebih dari 2 atau 3, maka pada sel ini terindikasi adanya dependensi. d. Interpret the standardized residuals in the corner cells having counts 110 and 94. Nilai standardized residuals dari sell dengan jumlah pengamatan sebanya 110 bernilai 3.144, karena nilainya lebih dari 2 atau 3 dalam nilai mutlak maka mengindikasikan adanya dependensi pada sel tersebut. Pada sel dengan jumlah pengamatan 94 memiliki nilai standardized residual 7.368, begitupun dengan sel ini yang nilai mutlaknya lebih dari 2 atau 3, maka pada sel ini terindikasi adanya dependensi. 12. (In book no. 19) Table 2.14 was taken from the 2002 General Social Survey.

a. Test the null hypothesis of independence between party identification and race. Interpret.  Hipotesis H 0 : Ras dan partai independen atau tidak berasosiasi

H1 : Ras dan partai dependen atau berasosiasi 

Statistik Uji

   2

i

2 

j

n

ij

 ˆ ij 

2

ˆ ij

871  982.21352  444  438.77232  873  767.01422  302  190.78652 

982.2135 438.7723 2 80  85.2277  43  148.98582  85.2277 148.9858  167.8456

767.0142

190.7865



Kriteria Uji 2 2 Tolak H 0 jika  hitung , terima sebaliknya.   tabel



Kesimpulan 2 Karena  hitung   02.05( 2)  5.991 , maka H 0 ditolak, yang berarti dengan alpha 5% dapat disimpulkan bahwa ras dan partai dependen atau saling berasosiasi.

b. Use standardized residuals to describe the evidence.

Dengan rumus

 nij   ij

 [  ij  1  p. j  1  pi. ]1 / 2

diperoleh nilai standardized residuals

sebesar Democrat White Black

Independen Republic t -11.85544 0.6922 11.7769 11.8523 0.0916 -11.7748

Nilai standardized residual dari white democrat, white republic, black democrat, dan black republic memiliki nilai mutlak standardized residual yang lebih besar dari 2 atau 3, sehingga dapat disimpulkan bahwa mengindikasikan bahwa adanya dependensi pada sel tersebut. c. Partition the chi-squared into two components, and use the components to describe the evidence. Nilai  2 untuk perbandingan antara ras dengan (democrat, Independent) sebesar 22.80043, dan nilai  2 untuk perbandingan antara ras dengan (democrat+independent, Republic) memiliki nilai 138.6438. Ditinjau dari ras (Black and White) dua kelompok pertama democrat dan independent tidak berbeda secara nyata, sedangkan apabila digabung ternyata beda secara nyata dari kelompok republic. 13. (In book no 22) Table 2.15 classifies a sample of psychiatric patients by their diagnosis and by whether their

treatment prescribed drugs. a. Conduct a test of independence, and interpret the P-value.  Hipotesis H 0 : diagnosa dan treatment independen atau tidak berasosiasi

H1 : diagnosa dan treatment dependen atau berasosiasi 

Statistik Uji

   2

i

2 

j

n

ij

 ˆ ij 

2

ˆ ij

105  74.51452  8  38.48552  12  9.23192  2  4.76812 

74.5145 38.4855 9.2319 4.7681 2 2 2 2  18  24.3986 19  12.6014 47  65.2826 52  33.7174      24.3986 12.6014 65.2826 33.7174 2 2  0  8.5725 13  4.4275   8.5725 4.4275  84.18847  Kriteria Uji 2 2 Tolak H 0 jika  hitung , terima sebaliknya.   tabel 

Kesimpulan 2 Karena  hitung   02.05(5)  11.070 , maka H 0 ditolak, yang berarti dengan alpha 5% dapat disimpulkan bahwa ras dan partai dependen atau saling berasosiasi.

b. Obtain standardized residuals, and interpret.  nij   ij Dengan rumus  diperoleh nilai standardized residuals [  ij  1  p. j  1  pi. ]1 / 2 sebesar

Diagnosis Drug No Drugs Schizophrenia 2.034021 -2.03402 Affective disorder 0.927434 -0.92743 Neurosis -0.88922 0.889222 Personality disorder -1.28221 1.282206 Special Symptoms -3.0813 3.081304 Dari hasil perhitungan diatas, dapat dilihat bahwa nilai standardized residual dari schizophrenia dan special symptoms terhadap perawatan memiliki nilai mutlak lebih dari 2, sehingga mengindikasikan bahwa adanya dependensi pada sel tersebut c. Partition chi-squared into three components to describe differences and similarities among the diagnoses, by comparing (i) the first two rows, (ii) the third and fourth rows, (iii) the last row to the first and second rows combined and the third and fourth rows combined. Nilai  2 untuk dua baris awal (Schizophrenia, Affective disorder) adalah sebesar 0.891705, nilai  2 (Neurosis, Personality disorder) untuk baris ketiga dan keempat

sebesar 0.0149, nilai

 2 untuk baris kelima dengan dua baris awal (Special

Symptomps, Schizophrenia + Affective disorder) sebesar 72.8997, dan nilai  2 baris kelima dengan baris ketiga tambah keempat (Special Symptomps, Neurosis + Personality disorder) sebesar 11.0221. ditinjau dari baris satu dengan dua, dan tiga dengan empat tidak terdapat perbedaan secara nyata, namun apabila baris satu digabung dengan baris dua lalu dibandingkan dengan baris lima, maka akan terdapat perbedaan yang signifikan. Begitupula dengan baris tiga bila digabung dengan baris empat lalu dibandingkan dengan baris lima maka akan terdapat perbedaan yang signifikan, dengan  02.05(1)  3.841 . 14. (In book no 23) Table 2.16, from a recent General Social Survey, cross-classifies the degree of fundamentalism of subjects’ religious beliefs by their highest degree of education. The table also shows standardized residuals. For these data, X2 = 69.2.Write a report of about 200 words, summarizing description and inference for these data.

15. (In book no 29) A study (B. Kristensen et al., J. Intern. Med., 232: 237–245, 1992) considered the effect of prednisolone on severe hypercalcaemia in women with metastatic breast cancer. Of 30 patients, 15 were randomly selected to receive prednisolone, and the other 15 formed a control group. Normalization in their level of serum-ionized calcium was achieved by seven of the 15 prednisolone-treated patients and by 0 of the 15 patients in the control group. Use Fisher’s exact test to find a P-value for testing whether results were significantly better for treatment than control. Interpret. Treated 7 8 15 Control 0 15 15 7 23 30 Dari tabel yang diperoleh pada soal di atas, kita bisa menguji dengan menggunakan exact fisher, dan diperoleh nilai p – valuenya sebesar

15  15       7 0 P X  7        0.0032 ,  30    7 Diperoleh nilai p – value sebesar 0.0032 yang berarti lebih kecil dari alpha 5%, dengan demikian terdapat asosiasi dari effect perdnisolone terhadap kena atau tidaknya kanker payudara. 16. (In book no 30) Table 2.17 contains results of a study comparing radiation therapy with surgery in treating cancer of the larynx. Use Fisher’s exact test to test H0: θ = 1 against Ha: θ > 1. Interpret results.

 Hipotesis H 0 :   1 (tidak terdapat asosiasi antara terapi radiasi dengan operasi dalam mengobati kanker laring) H1 :   1 (terdapat asosiasi antara terapi radiasi dengan operasi dalam mengobati kanker laring)  Statistik uji

 n1.   n2.       t   n.1  t   Pt   n    n.1   23  18       21 15 P X  21       0.2755  41    36  

Kriteria uji Tolak H 0 jika p – value lebih kecil dari alpha 5%.



Kesimpulan

Karena nilai p – value lebih besar dari alpha 5% maka H 0 diterima, yang berarti dengan alpha 5% tidak terdapat asosiasi antara antara terapi radiasi dengan operasi dalam mengobati kanker laring. 17. (In book no 33) In murder trials in 20 Florida counties during 1976 and 1977, the death penalty was given in 19 out of 151 cases in which a white killed a white, in 0 out of 9 cases in which a white killed a black, in 11 out of 63 cases in which a black killed a white, and in 6 out of 103 cases in which a black killed a black (M. Radelet, Am. Sociol. Rev., 46: 918–927, 1981). a. Exhibit the data as a three-way contingency table. X = Ras Tersangka (B/W) Y = Putusan Hukuman Mati (Y/N) Z = Ras Korban (B/W) Putusan Ras Hukuman Ras Korban Tersangka Yes No White White 19 132 Black 11 52 Black White 0 9 Black 6 97 b. Construct the partial tables needed to study the conditional association between defendant’s race and the death penalty verdict. Find and interpret the sample conditional odds ratios, adding 0.5 to each cell to reduce the impact of the 0 cell count. Tabel Parsial Z=White Putusan Ras Hukuman Ras Korban Tersangka Yes No White White 19 132 Black 11 52  19.5  52.5    0.6719 11.5  132.5 Ketika

korbannya

orang

berkulit

putih,

yang

menerima

hukuman

mati

1  1.4883 kali lebih sering kepada tersangka berkulit hitam daripada yang 0.6719

berkulit putih. Dengan kata lain pada saat korbannya orang berkulit putih hukuman mati 48,83% lebih sering dijatuhkan terhadap orang kulit hitam. Z=Black

Ras Korban Black 0.5  97.5  0.7895 6.5  9.5 Ketika korbannya orang

Ras Tersangka White Black

Putusan Hukuman Yes No 0 9 6 97



 

berkulit

putih,

yang

menerima

hukuman

mati

1  1.2666 kali lebih sering kepada tersangka berkulit hitam daripada yang 0.7895

berkulit putih. Dengan kata lain pada saat korbannya orang berkulit putih hukuman mati 26.66% lebih sering dijatuhkan terhadap orang kulit hitam. c. Compute and interpret the sample marginal odds ratio between defendant’s race and the death penalty verdict. Do these data exhibit Simpson’s paradox? Explain. Tabel Marginal Putusan Ras Hukuman Ras Korban Tersangka Yes No Black White 19 141 Black 17 149  19.5  149.5    1.1773 17.5  141.5 Dengan mengesampingkan ras korban persentasi hukuman mati lebih sering dijatuhkan terhadap orang kulit putih daripada orang berkulit hitam, apabila asosiasi marginal berbeda dengan asosiasi parsialnya, maka terjadi sympson’s paradox. 18. (In book no 36) Give a “real world” example of three variables X, Y , and Z, for which you expect X and Y to be marginally associated but conditionally independent, controlling for Z. 19. (In book no 38) For three-way contingency tables: a. When any pair of variables is conditionally independent, explain why there is homogeneous association. b. When there is not homogeneous association, explain why no pair of variables can be conditionally independent. 20. (In book no 39) True, or false? a. In 2 × 2 tables, statistical independence is equivalent to a population odds ratio value of θ = 1.0.

b. We found that a 95% confidence interval for the odds ratio relating having a heart attack (yes, no) to drug (placebo, aspirin) is (1.44, 2.33). If we had formed the table with aspirin in the first row (instead of placebo), then the 95% confidence interval would have been (1/2.33, 1/1.44) = (0.43, 0.69). c. Using a survey of college students, we study the association between opinion about whether it should be legal to (1) use marijuana, (2) drink alcohol if you are 18 years old. We may get a different value for the odds ratio if we treat opinion about marijuana use as the response variable than if we treat alcohol use as the response variable. d. Interchanging two rows or interchanging two columns in a contingency table has no effect on the value of the X2 or G2 chi-squared statistics. Thus, these tests treat both the rows and the columns of the contingency table as nominal scale, and if either or both variables are ordinal, the test ignores that information. e. Suppose that income (high, low) and gender are conditionally independent, given type of job (secretarial, construction, service, professional, etc.). Then, income and gender are also independent in the 2 × 2 marginal table (i.e., ignoring, rather than controlling, type of job).

Related Documents

Tugas 2
October 2019 43
Tugas 2
June 2020 23
Tugas 2
October 2019 35
Tugas 2
August 2019 50
Tugas 2
June 2020 17
Tugas 2
April 2020 23

More Documents from ""