Tugas Kokurikuler II Mata Kuliah : Analisis Regresi Linear Dosen Pengajar : : dr. Pandu Riono, MPH, PhD
Topik :
PREDICTION INTERVAL BANDS AND CONFIDENCE INTERVAL BANDS ________________________________________________________
Oleh :
Iswandi 0806470421
Program Pascasarjana Departemen Biostatistik dan Kependudukan Fakultas Kesehatan Masyarakat Universitas Indonesia DEPOK, 18 Maret 2009
Tugas MK Analisis Regresi Linear
Digunakan data latihan lowbwt.dta use "E:\My Documents\UI Material\Slide UI\Semester 2\Regresi_Linear\lowbwt.dta"
Langkah 1 : Membuat scatter BB lahir bayi (bwt) vs. BB ibu pada masa menstruasi terakhir (lwt)
1000
Birth Weight (grams) 2000 3000 4000
5000
scatter bwt lwt, symbol(Oh)
50
100 150 200 Weight of Mother at Last Menstrual Period (pounds)
250
Interpretasi : Diagram pencar di atas menunjukkan hubungan linear antara berat badan lahir bayi dan berat badan ibu pada masa haid terakhir. Terlihat bahwa seakan-akan titik-titik observasi menyebar secara acak cenderung ke kanan dengan demikian pola hubungannya linear positif, artinya bahwa semakin bertambah berat badan ibu (lwt) maka semakin bertambah pula berat badan lahir bayi (bwt). Akan tetapi karena sebaran data yang nampak tidak rapat tebarannya, maka menunjukkan hubungannya semakin lemah.
Langkah 2 : Melakukan regresi BB lahir bayi (bwt) vs. BB ibu pada masa menstruasi terakhir (lwt) . regress bwt lwt Source | SS df MS -------------+-----------------------------Model | 3448881.3 1 3448881.3 Residual | 96468171.3 187 515872.574 -------------+-----------------------------Total | 99917052.6 188 531473.684
Number of obs F( 1, 187) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
189 6.69 0.0105 0.0345 0.0294 718.24
-----------------------------------------------------------------------------bwt | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------lwt | 4.429264 1.713025 2.59 0.010 1.049927 7.8086 _cons | 2369.672 228.4306 10.37 0.000 1919.04 2820.304
[email protected]
1
Tugas MK Analisis Regresi Linear
Interpretasi : 1. Uji F hipotesis uji sbb : Ho : β1= 0 Ha : β1≠ 0
Artinya ingin diketahui apakah semua variabel predictor (dalam latihan ini hanya satu variabel yaitu lwt) bukan merupakan penjelas yang signifikan terhadap veriabel outcome (bwt). Dari uji F didapat nilai F hitung sebesar 6.69 dengan probabilitas 0.0105. Karena probabilitas lebih kecil dari 0.05, Ho ditolak. Maka model regresi dapat digunakan untuk memprediksi berat badan lahir bayi (bwt) atau dapat dikatakan bahwa BB ibu pada saat haid terakhir (lwt) berpengaruh terhadap berat badan lahir bayi (bwt) 2. Uji t hipotesis uji sbb : Ho : β1= 0 Ha : β1≠ 0
Artinya ingin diketahui apakah suatu variabel predictor (lwt) bukan merupakan penjelas yang signifikan terhadap veriabel outcome (bwt). Dari uji t didapat nilai t hitung sebesar 2.59 dengan probabilitas 0.010. Karena probabilitas lebih kecil dari 0.05, Ho ditolak maka disimpulkan bahwa BB ibu pada saat haid terakhir (lwt) berpengaruh terhadap berat badan lahir bayi (bwt). 3. Persamaan Matematis Model Regresi
bwt = 2369.672 + 4.43 lwt artinya bahwa : • Konstanta sebesar 2369.672 menyatakan bahwa jika variabel predictor (lwt) dianggap konstan, maka rerata berat badan bayi lahir (bwt) sebesar 2369.672 gram. • Koefisien regresi lwt sebesar 4.43 menyatakan bahwa setiap penambahan berat badan ibu setelah haid pertama (lwt) sebesar 1 pon akan meningkatkan berat badan bayi lahir (bwt) sebesar 4.43 gram. 4. Koefisien Determinasi Dari output diketahui besarnya R2 adalah 0.0345, hal ini berarti hanya 3.45% variasi bwt dapat dijelaskan oleh variasi dari variabel predictor lwt. Sedangkan 96.55% dijelaskan oleh sebab-sebab yang lain di luar model.
Langkah 3 : Membuat variabel yhat di data editor predict yhat, xb
variabel yhat adalah nilai berat badan bayi lahir setelah persamaan model regresi di atas dimasukkan. Contoh responden 1 dengan BB ibu pada saat haid terakhir 120 pon, maka :
[email protected]
2
Tugas MK Analisis Regresi Linear
Ŷ = α + βx Ŷ = 2369.672 + 4.43 (120) Ŷ = 2901.2 Dengan demikian dapat diestimasi berat badan bayi si ibu tersebut adalah 2901.2 gram. Demikian seterusnya…
Langkah 4 : Membuat scatter (diagram tebar) dengan garis regresi linear menggunakan yhat scatter bwt lwt || line yhat lwt /// , xtitle(Berat Ibu saat Mens Terakhir) /// ytitle(Berat Bayi Lahir (grams)) legend(off)
Selain itu grafik tebar juga dapat dibuat tanpa menggunakan yhat scatter bwt lwt || lfit bwt lwt /// , ytitle(Berat bayi lahir (gram)) /// xtitle(Berat Ibu saat Mens Terakhir (pounds)) legend(off)
1000
Berat Bayi Lahir (grams) 2000 3000 4000
5000
Outputnya sbb :
50
100
150 Berat Ibu saat Mens Terakhir
200
250
Interpretasi : Diagram pencar di atas memperjelas hubungan linear antara berat badan lahir bayi dan berat badan ibu pada masa haid terakhir. Terlihat bahwa garis regresi pola hubungannya linear positif, artinya bahwa semakin bertambah berat badan ibu (lwt) maka semakin bertambah pula berat badan lahir bayi (bwt).
[email protected]
3
Tugas MK Analisis Regresi Linear
Langkah 5 : Menambah "95% confidence interval bands" pada grafik regresi.
1000
Berat Bayi Lahir (gram) 2000 3000 4000
5000
twoway lfitci bwt lwt || scatter bwt lwt /// ,ytitle(Berat Bayi Lahir (gram)) /// xtitle(berat ibu saat mens terakhir) legend(off)
50
100
150 berat ibu saat mens terakhir
200
250
Interpretasi : Diagram di atas memperlihatkan garis regresi hubungan antara berat badan lahir bayi dan berat badan ibu pada masa haid terakhir. Selain itu nampak convidence Interval band yang berada di sekitar garis tersebut. Confidence band menunjukkan seberapa tepat kita mengetahui lokasi garis regresi yang sebenarnya (the best fit line). Berdasarkan arsiran tersebut maka dengan tingkat kepercayaan 95% kita yakin bahwa 95% probabilitas BB bayi yang ‘sebenarnya’ berada di dalam area tersebut atau dengan kata lain secara rerata(mean) BB bayi yang sebenarnya di tingkat populasi akan berada antara garis tersebut. Nampak bahwa bentuk area tersebut melengkung, menyesuaikan bentuk sesuai dengan kerapatan titik obseravsi hal ini mengindikasikan bahwa pada area sempit tersebut tingkat kepercayaan semakin tinggi.
Langkah 6 : Menambah "95% prediction interval bands" pada grafik. twoway lfitci bwt lwt, stdf ciplot(rline) color(gray) || lfitci bwt lwt, lpattern(solid) || scatter bwt lwt
/// /// ///
[email protected]
4
Tugas MK Analisis Regresi Linear
///
1000
Berat Bayi Lahir (gram) 2000 3000 4000
5000
, xtitle(Berat Ibu saat Mens Terakhir (pounds)) ytitle(Berat Bayi Lahir (gram)) legend(off)
50
100 150 200 Berat Ibu saat Mens Terakhir (pounds)
250
Interpretasi : Diagram di atas selain memperlihatkan convidence interval band juga memperlihatkan prediction interval bands yang areanya lebih luas. Prediction interval bands menunjukkan harapan terhadap letak data atau dengan kata lain tujuan prediksi. Sehingga kita dapat menduga/memprediksi dengan 95% keseluruhan titik data berada di dalam area prediksi tersebut.
Perbedaan antara confidence interval bands dan prediction interval bands Confidence band menunjukkan seberapa tepat kita mengetahui lokasi garis regresi yang sebenarnya (the best fit line). Sebagai contoh analisis di atas, kita dapat meyakini dengan kepercayaan 95% bahwa garis regresi hubungan antara BB bayi dan BB ibu haid terakhir berada di dalam area atau dengan kata lain kita yakin 95% probabilitas BB bayi yang ‘sebenarnya’ berada di dalam area tersebut. Prediction interval bands menunjukkan harapan atau prediksi terhadap letak data. Maka kita dapat menduga dengan 95% keseluruhan titik observasi berada di dalam area prediksi tersebut. Dengan titik observasi yang banyak, maka dapatlah diduga kelompok data yang posisinya berada di luar confidence band, walaupun demikian kita yakin dengan kepercayaan 95% posisinya masih berada di dalam area prediction band. Jadi Confidence Interval band lebih terfokus kepada letak garis regresinya, sedangkan prediction interval band lebih cenderung fokusnya letak keseluruhan data atau scatter datanya.
[email protected]
5
Tugas MK Analisis Regresi Linear
Langkah 7 : Membuat kurva regresi bandwidth of 0.99 /// /// /// ///
1000
Berat Bayi lahir (gram) 2000 3000 4000
5000
twoway lfit bwt lwt, color(gray) || scatter bwt lwt || lowess bwt lwt, bwidth(.99) lpattern(solid) , xtitle(Berat Ibu saat Mens Terakhir) ytitle(Berat Bayi Lahir (gram)) legend(off)
50
100 150 200 Berat Ibu saat Mens Terakhir (pounds) Fitted values lowess bwt lwt
250
Birth Weight (grams)
Interpretasi : Kurva fit dalam bentuk lain adalah lowess (lowest estimation), dimana bentuk kurvanya mendekati garis lurus akan tetapi lebih fleksibel tertarik oleh observasi nilai x nya. Dengan demikian garis tersebut juga memperkiran garis regresi akan tetapi tidak dalam bentuk linear pada kepercayaan 99%.
Langkah 8 : Membuat variabel residual predict residual, rstudent display _N display invttail(_N-3,.025) scatter residual lwt || lowess residual lwt, bwidth(.99) , yscale(range(-2.13 2.13)) xlabel() yline(-2.13 2.13, lcolor(gray) lpattern(dash)) yline(0, lcolor(gray)) legend(off)
/// /// ///
[email protected]
6
-4
-2
0
2
4
Tugas MK Analisis Regresi Linear
50
100 150 200 Weight of Mother at Last Menstrual Period (pounds)
250
Interpretasi : Residual adalah selisih antara yhat (y prediksi) dan y observasi dalam hal ini residual student. Dari grafik scatter plot terlihat bahwa titik-titik menyebar secara merata baik di atas maupun di bawah angka nol pada sumbu y. Atau dapat dikatakan random atau tidak mencerminkan suatu pola yang sistematis. Sehingga model regresi layak dipakai untuk memprediksi BB bayi berdasarkan masukan variabel independen BB ibu pada menstruasi terakhir.
[email protected]
7