University of Indonesia
Tugas Kokurikuler IV Mata Kuliah ‘Analisis Regresi Linear’ Dosen Pengajar : Pandu Riono, MD, MPH, PhD
Perbandingan Dua Garis Regresi Oleh :
Iswandi 0806470421
[email protected]
Program Pascasarjana Departemen Biostatistik dan Kependudukan Fakultas Kesehatan Masyarakat Universitas Indonesia
Depok, 17 April 2009 Public Health - University of Indonesia Kampus UI, Depok 16424 Indonesia http://www.fkm. ui. ac.id/
1
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
Iswandi NPM : 0806470421
Permasalahan : Lakukanlah perbandingan model dua garis-lurus regresi dengan menggunakan data studi Framingham ‘Fram.dta’. Masing-masing variabel yang akan dihubungkan adalah : 1. sbp (Y) dan bmi (X) pada tiap kategori sex (Z) 2. sbp (Y) dan scl (X) pada tiap kategori sex (Z) 3. sbp (Y) dan bmi (X) pada tiap kategori umur (Z) 4. sbp (Y) dan scl (X) pada tiap kategori umur (Z) keterangan untuk kategori sbb : sex : kode 1 = laki-laki kode 0 = Perempuan age : kode 1 = range antara umur termuda sampai dengan di bawah (<) nilai kuartil pertama (25%) umur pasien. kode 2 = nilai kuartil pertama sd di bawah (<) nilai kuartil ketiga (75%) umur pasien kode 3 = nilai kuartil ketiga sd umur tertua pasien.
17/04/2009
2
Iswandi NPM : 0806470421
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
Penyelesaian : Deskripsikan data Transformasi data
Mulai dgn Persamaan awal (Full Model) Y = β0 + β1X + β2Z + βXZ + E
Uji Coincidence
S
NS
Yes
Menggunakan var. terakhir
Uji unt kesamaan intersep
NS
Kesimpulan : Garis tidak parallel & intersep tidak sama
Kesimpulan : Garis parallel tetapi tidak coincidence
Kesimpulan : Coincedence
S
Uji Parallelism
S
NS
STOP
No
Kesimpulan : Garis tidak parallel & intersep tidak sama Kesimpulan : Garis tidak parallel & intersep sama
17/04/2009
3
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
Iswandi NPM : 0806470421
Langkah 1 : mendeskripsikan variabel . des Contains data from E:\My Documents\UI Material\Slide UI\Semester 2\Regresi_Linear\hw3\Fram.dta obs: 4,699 vars: 10 11 Jan 1999 19:56 size: 206,756 (98.0% of memory free) ------------------------------------------------------------------------------storage display value variable name type format label variable label ------------------------------------------------------------------------------sex float %9.0g sex Sex sbp float %9.0g Systolic Blood Pressure dbp float %9.0g Diastolic Blood Pressure scl float %9.0g Serum Cholesterol chdfate float %9.0g fate Coronary Heart Disease followup float %9.0g Follow-up in Days age float %9.0g Age in Years bmi float %9.0g Body Mass Index month float %9.0g Study Month of Baseline Exam id float %9.0g ------------------------------------------------------------------------------Sorted by: followup . sum Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------sex | 4699 1.56395 .4959463 1 2 sbp | 4699 132.7665 22.8011 80 270 dbp | 4699 82.5416 12.73732 40 148 scl | 4666 228.2925 44.54262 115 568 chdfate | 4699 .313471 .4639534 0 1 -------------+-------------------------------------------------------followup | 4699 8061.313 3595.311 18 11688 age | 4699 46.04107 8.504363 30 68 bmi | 4690 25.63171 4.094672 16.2 57.6 month | 4699 6.369227 3.683821 1 12 id | 4699 2350 1356.629 1 4699
Tabel deskripsi di atas menginformasikan bahwa terdapat 10 variabel, masing-masing variabel tersebut adalah : 1. 2. 3. 4. 5. 6. 7. 8.
sbp = Tekanan darah sistolik dalam mm Hg dbp = Tekanan darah diastolik dalam mm Hg, age = umur dalam tahun, scl = serum kolesterol dalam mg/100 ml, bmi = indeks mass tubuh (IMT)=berat /tinggi2 dalam kg/m2, sex = jenis kelamin dengan kode 1: bila laki-laki dan 2: bila perempuan, month = bulan pada tahun pelaksanaan studi /(baseline exam) occurred, id = variabel identifikasi pasien (dinomori 1 sd 4699).
17/04/2009
4
Iswandi NPM : 0806470421
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
Informasi tindak-lanjut (follow up) penyakit jantung koroner atau CHD (coronary heart disease) : 9. followup = Masa follow up terhadap subjek dalam hari 10. chdfate = 1: jika subjek terpapar CHD hingga akhir masa follow-up dan 0: bila tidak.
Langkah 2 : mentransformasi data Dilakukan perintah generate untuk komputasi/perhitungan matematis yang melibatkan variabel sbp, bmi, scl dan age. Log transformation dilakukan terhadap variabel sbp, bmi dan scl. . gen logsbp = log(sbp) . gen logbmi = log(bmi) (9 missing values generated) . gen logscl = log(scl) (33 missing values generated)
Variabel sex dilakukan recode . recode sex 2=0 (sex: 2650 changes made)
Untuk variabel age dilakukan perintah generate dan recode untuk kepentingan kategorisasi. . gen agegroup = age . sum age, detail Age in Years ------------------------------------------------------------Percentiles Smallest 1% 32 30 5% 34 31 10% 35 31 Obs 4699 25% 39 31 Sum of Wgt. 4699 50% 75% 90% 95% 99%
45 53 58 60 63
Largest 65 66 66 68
Mean Std. Dev.
46.04107 8.504363
Variance Skewness Kurtosis
72.3242 .2323983 1.949889
. recode agegroup min/38=1 39/52=2 53/max=3 (agegroup: 4699 changes made)
Selanjutnya juga dilakukan log transformation terhadap variabel yang diduga berinteraksi : . gen bmisex = logbmi*sex (9 missing values generated) . gen sclsex = logscl*sex (33 missing values generated) . gen bmiagegr = logbmi*agegroup (9 missing values generated)
17/04/2009
5
Iswandi NPM : 0806470421
Analisis Regresi Linear - Perbandingan Dua Garis Regresi . gen sclagegr = logscl*agegroup (33 missing values generated)
Langkah 3 : membuat model Persamaan Awal (Full Model) Persamaan Full model ditulis sbb :
Y = β0 + β1X + β2Z + βXZ + e 1. Full model 1 : sbp (Y) dan bmi (X) pada sex (Z) . reg
logsbp logbmi sex bmisex
Source | SS df MS -------------+-----------------------------Model | 14.661556 3 4.88718532 Residual | 107.376899 4686 .022914404 -------------+-----------------------------Total | 122.038455 4689 .026026542
Number of obs F( 3, 4686) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
4690 213.28 0.0000 0.1201 0.1196 .15138
-----------------------------------------------------------------------------logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------logbmi | .3985947 .0173722 22.94 0.000 .3645371 .4326523 sex | .3950265 .1004207 3.93 0.000 .1981546 .5918983 bmisex | -.1259487 .0309746 -4.07 0.000 -.1866735 -.0652238 _cons | 3.593017 .0560033 64.16 0.000 3.483224 3.70281 ------------------------------------------------------------------------------
Persamaan regresi hubungan antara indeks mass tubuh (bmi) dan jenis kelamin (sex) terhadap tekanan darah sistolic (sbp) sebagai berikut : logsbp = 3.593 + 0.398 (logbmi) + 0.395 (sex) - 0.125 (bmisex) 2. Full model 2 : sbp (Y) dan scl (X) pada sex (Z) . reg logsbp logscl sex sclsex Source | SS df MS -------------+-----------------------------Model | 7.42106651 3 2.47368884 Residual | 113.85876 4662 .024422728 -------------+-----------------------------Total | 121.279827 4665 .025997819
Number of obs F( 3, 4662) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
4666 101.29 0.0000 0.0612 0.0606 .15628
-----------------------------------------------------------------------------logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------logscl | .2539169 .0153908 16.50 0.000 .2237437 .28409 sex | .795477 .1326423 6.00 0.000 .5354354 1.055519 sclsex | -.1473443 .0244971 -6.01 0.000 -.1953703 -.0993183 _cons | 3.501642 .083392 41.99 0.000 3.338154 3.66513 ------------------------------------------------------------------------------
17/04/2009
6
Iswandi NPM : 0806470421
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
Persamaan regresi hubungan antara serum kolesterol (scl) dan jenis kelamin (sex) terhadap tekanan darah sistolic (sbp) sebagai berikut : logsbp = 3.501 + 0.253 (logscl) + 0.795 (sex) - 0.147 (sclsex) 3. Full model 3 : sbp (Y) dan bmi (X) pada kelompok umur (Z) . xi:reg logsbp logbmi i.agegroup i.agegroup _Iagegroup_1-3
bmiagegr (naturally coded; _Iagegroup_1 omitted)
Source | SS df MS -------------+-----------------------------Model | 26.0925732 4 6.52314331 Residual | 95.9458816 4685 .020479377 -------------+-----------------------------Total | 122.038455 4689 .026026542
Number of obs F( 4, 4685) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
4690 318.52 0.0000 0.2138 0.2131 .14311
-----------------------------------------------------------------------------logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------logbmi | .2835812 .0410088 6.92 0.000 .2031847 .3639777 _Iagegroup_2 | .0263027 .0609803 0.43 0.666 -.0932473 .1458528 _Iagegroup_3 | .0826225 .1229922 0.67 0.502 -.1585 .323745 bmiagegr | .0090356 .0190186 0.48 0.635 -.0282498 .0463209 _cons | 3.864512 .0766483 50.42 0.000 3.714245 4.014779 ------------------------------------------------------------------------------
Persamaan regresi hubungan antara indeks mass tubuh (bmi) dan kelompok umur (agegroup) terhadap tekanan darah sistolic (sbp) sebagai berikut : logsbp = 3.864 + 0.283 (logbmi) + 0.026 (agegroup2) + 0.082 (agegroup3) + 0.009 (bmiagegr) 4. Full model 4 : sbp (Y) dan scl (X) pada kelompok umur (Z) . xi:reg logsbp logscl i.agegroup i.agegroup _Iagegroup_1-3
sclagegr (naturally coded; _Iagegroup_1 omitted)
Source | SS df MS -------------+-----------------------------Model | 18.375235 4 4.59380875 Residual | 102.904592 4661 .022077793 -------------+-----------------------------Total | 121.279827 4665 .025997819
Number of obs F( 4, 4661) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
4666 208.07 0.0000 0.1515 0.1508 .14859
-----------------------------------------------------------------------------logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------logscl | .1869181 .0352553 5.30 0.000 .117801 .2560352 _Iagegroup_2 | .2255884 .0881367 2.56 0.011 .0527988 .3983779 _Iagegroup_3 | .4899277 .1785144 2.74 0.006 .1399551 .8399003 sclagegr | -.0320994 .0165083 -1.94 0.052 -.0644636 .0002647 _cons | 3.975151 .1092194 36.40 0.000 3.76103 4.189273 ------------------------------------------------------------------------------
Persamaan regresi hubungan antara serum kolesterol (scl) dan kelompok umur (agegroup) terhadap tekanan darah sistolic (sbp) sebagai berikut : logsbp = 3.975 + 0.186 (logscl) + 0.225 (agegroup2) + 0.489 (agegroup3) - 0.032 (sclagegr)
17/04/2009
7
Iswandi NPM : 0806470421
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
Langkah 4 : Melakukan uji coincidence Uji coincidence dilakukan untuk mengetahui apakah kedua garis regresi terletak berhimpit (slope dan intersepnya) atau dengan kata lain apakah kedua garis regresi tersebut identik. Dengan demikian, hipotesisnya adalah sbb : 1. sbp (Y) dan bmi (X) pada sex (Z) Ho : β1M = β1F = 0 atau kedua garis lurus regresi terletak berhimpit pada kelompok laki-laki maupun perempuan Ha : salah satu slope ≠ 0 atau Kedua garis lurus tidak terletak berhimpit. 2. sbp (Y) dan scl (X) pada sex (Z) Ho : β1M = β1F = 0 atau kedua garis lurus regresi terletak berhimpit pada kelompok laki-laki maupun perempuan Ha : salah satu slope ≠ 0 atau Kedua garis lurus tidak terletak berhimpit. 3. sbp (Y) dan bmi (X) pada kelompok umur (Z) Ho : β1AG1 = β1AG2 = β1AG3 = 0 atau kedua garis lurus regresi terletak berhimpit pada ketiga kelompok umur Ha : salah satu slope ≠ 0 atau Kedua garis lurus tidak terletak berhimpit. 4. sbp (Y) dan scl (X) pada kelompok umur (Z) Ho : β1AG1 = β1AG2 = β1AG3 = 0 atau kedua garis lurus regresi terletak berhimpit pada ketiga kelompok umur Ha : salah satu slope ≠ 0 atau Kedua garis lurus tidak terletak berhimpit. Untuk menguji hipotesis-hipotesis di atas dilakukan langkah-langkah sbb : 1. sbp (Y) dan bmi (X) pada sex (Z) . reg logsbp logbmi Source | SS df MS -------------+-----------------------------Model | 14.0924231 1 14.0924231 Residual | 107.946032 4688 .023026031 -------------+-----------------------------Total | 122.038455 4689 .026026542
Number of obs F( 1, 4688) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
4690 612.02 0.0000 0.1155 0.1153 .15174
-----------------------------------------------------------------------------logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------logbmi | .3551821 .0143571 24.74 0.000 .3270354 .3833289 _cons | 3.727192 .046451 80.24 0.000 3.636126 3.818258 ------------------------------------------------------------------------------
17/04/2009
8
Iswandi NPM : 0806470421
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
. reg
logsbp logbmi sex
Source | SS df MS -------------+-----------------------------Model | 14.2826922 2 7.14134611 Residual | 107.755763 4687 .022990348 -------------+-----------------------------Total | 122.038455 4689 .026026542
Number of obs F( 2, 4687) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
4690 310.62 0.0000 0.1170 0.1167 .15163
-----------------------------------------------------------------------------logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------logbmi | .358977 .0144065 24.92 0.000 .3307334 .3872205 sex | -.0128971 .0044831 -2.88 0.004 -.0216861 -.0041081 _cons | 3.720557 .0464723 80.06 0.000 3.62945 3.811665 -----------------------------------------------------------------------------. reg
logsbp logbmi
sex bmisex
Source | SS df MS -------------+-----------------------------Model | 14.661556 3 4.88718532 Residual | 107.376899 4686 .022914404 -------------+-----------------------------Total | 122.038455 4689 .026026542
Number of obs F( 3, 4686) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
4690 213.28 0.0000 0.1201 0.1196 .15138
-----------------------------------------------------------------------------logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------logbmi | .3985947 .0173722 22.94 0.000 .3645371 .4326523 sex | .3950265 .1004207 3.93 0.000 .1981546 .5918983 bmisex | -.1259487 .0309746 -4.07 0.000 -.1866735 -.0652238 _cons | 3.593017 .0560033 64.16 0.000 3.483224 3.70281 ------------------------------------------------------------------------------
Tiga model di atas, bila disederhanakan hasilnya sbb : Tabel 1 : Ringkasan model sbp (Y) dan bmi (X) pada sex (Z) Source
df
SS
MS
F
Regression (X) Residual
1 4688
14.0924231 107.946032
14.0924231 .023026031
612.02
Regression (X, Z) Residual
2 4687
14.2826922 107.755763
7.14134611 .022990348
310.62
Regression (X, Z, XZ) Residual
3 4686
14.661556 107.376899
4.88718532 .022914404
213.28
17/04/2009
9
Iswandi NPM : 0806470421
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
Rumus Coincidence : F (XZ, Z |X) =
=
Regression SS X,Z,XZ − Regression SS X /2 MS residual (X,Z,XZ ) (14.661556 −14.0924231 )/2 0.022914404
= 12.41867
. display invF(2,4686,0.95) 2.9976482 . display Ftail(2,4686,12.41867) 4.177e-06
Nilai F di atas dibandingkan dengan F tabel pada F2,4686,0.95 = 2.99, karena F hitung > F tabel maka dengan demikian Ho ditolak. Atau dengan menggunakan nilai P berdasarkan F hitung pada F2,4686 = 4.177e-06 Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan kedua garis lurus tidak berhimpit (not coincident). 2. sbp (Y) dan scl (X) pada sex (Z) Dengan cara yang sama seperti poin 1 di atas, maka diperoleh hasil sebagai berikut : Tabel 2 : Ringkasan model sbp (Y) dan scl (X) pada sex (Z) Source
df
Regression (X) Residual
1 4664
6.53358301 114.746244
6.53358301 .024602539
265.57
Regression (X, Z) Residual
2 4663
6.53751858 114.742308
3.26875929 .024606971
132.84
3 4662
7.42106651 113.85876
2.47368884 .024422728
101.29
Regression (X, Z, XZ) Residual Rumus Coincidence : F (XZ, Z |X) =
=
SS
Regression SS X,Z,XZ − Regression SS X /2 MS residual (X,Z,XZ ) (7.42106651 −6.53358301 )/2 0.024422728
. display invF(2,4663,0.95) 2.9976577 . display Ftail(2,4663,18.16921) 1.380e-08
= 18.16921
MS
F
17/04/2009
10
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
Iswandi NPM : 0806470421
Nilai F di atas dibandingkan dengan F tabel pada F2,4663,0.95 = 2.99, karena F hitung > F tabel maka dengan demikian Ho ditolak. Atau dengan menggunakan nilai P berdasarkan F hitung pada F2,4686 = 1.380e-08 Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan kedua garis lurus tidak berhimpit (not coincident). 3. sbp (Y) dan bmi (X) pada kelompok umur (Z) . reg logsbp logbmi Source | SS df MS -------------+-----------------------------Model | 14.0924231 1 14.0924231 Residual | 107.946032 4688 .023026031 -------------+-----------------------------Total | 122.038455 4689 .026026542
Number of obs F( 1, 4688) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
4690 612.02 0.0000 0.1155 0.1153 .15174
-----------------------------------------------------------------------------logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------logbmi | .3551821 .0143571 24.74 0.000 .3270354 .3833289 _cons | 3.727192 .046451 80.24 0.000 3.636126 3.818258 -----------------------------------------------------------------------------. xi:reg logsbp logbmi i.agegroup i.agegroup _Iagegroup_1-3 (naturally coded; _Iagegroup_1 omitted) Source | SS df MS -------------+-----------------------------Model | 26.0879508 3 8.69598359 Residual | 95.9505041 4686 .020475993 -------------+-----------------------------Total | 122.038455 4689 .026026542
Number of obs F( 3, 4686) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
4690 424.69 0.0000 0.2138 0.2133 .14309
-----------------------------------------------------------------------------logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------logbmi | .3019411 .0137208 22.01 0.000 .275042 .3288402 _Iagegroup_2 | .0551687 .0051939 10.62 0.000 .0449862 .0653513 _Iagegroup_3 | .1409874 .0059218 23.81 0.000 .1293779 .1525969 _cons | 3.834713 .0440516 87.05 0.000 3.748351 3.921075 -----------------------------------------------------------------------------. xi:reg logsbp logbmi i.agegroup bmiagegr i.agegroup _Iagegroup_1-3 (naturally coded; _Iagegroup_1 omitted) Source | SS df MS -------------+-----------------------------Model | 26.0925732 4 6.52314331 Residual | 95.9458816 4685 .020479377 -------------+-----------------------------Total | 122.038455 4689 .026026542
Number of obs F( 4, 4685) Prob > F R-squared Adj R-squared Root MSE
= = = = = =
4690 318.52 0.0000 0.2138 0.2131 .14311
17/04/2009
11
Iswandi NPM : 0806470421
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
-----------------------------------------------------------------------------logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------logbmi | .2835812 .0410088 6.92 0.000 .2031847 .3639777 _Iagegroup_2 | .0263027 .0609803 0.43 0.666 -.0932473 .1458528 _Iagegroup_3 | .0826225 .1229922 0.67 0.502 -.1585 .323745 bmiagegr | .0090356 .0190186 0.48 0.635 -.0282498 .0463209 _cons | 3.864512 .0766483 50.42 0.000 3.714245 4.014779 ------------------------------------------------------------------------------
Tabel 3 : Ringkasan model sbp (Y) dan bmi (X) pada kelompok umur (Z) Source
df
Regression (X) Residual
1 4688
14.0924231 107.946032
14.0924231 .023026031
612.02
Regression (X, Z) Residual
3 4686
26.0879508 95.9505041
8.69598359 .020475993
424.69
4 4685
26.0925732 95.9458816
6.52314331 .020479377
318.52
Regression (X, Z, XZ) Residual Rumus Coincidence : F (XZ, Z |X) =
=
SS
MS
F
Regression SS X,Z,XZ − Regression SS X /2 MS residual (X,Z,XZ ) (26.0925732 −14.0924231 )/2 0.020479377
= 292.98133
. display invF(3,4685,0.95) 2.6068047 . display Ftail(3,4685,292.98133) 2.60e-174
Nilai F di atas dibandingkan dengan F tabel pada F3,4685,0.95 = 2.61, karena F hitung > F tabel maka dengan demikian Ho ditolak. Atau dengan menggunakan nilai P berdasarkan F hitung pada F3,4685 = 2.60e-174 Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan kedua garis lurus tidak berhimpit (not coincident). 4. sbp (Y) dan scl (X) pada kelompok umur (Z) Dengan cara yang sama seperti poin 3 di atas, maka diperoleh hasil sebagai berikut :
17/04/2009
12
Iswandi NPM : 0806470421
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
Tabel 4 : Ringkasan model sbp (Y) dan scl (X) pada kelompok umur (Z) Source
df
Regression (X) Residual
1 4664
6.53358301 114.746244
6.53358301 .024602539
265.57
Regression (X, Z) Residual
3 4662
18.2917625 102.988064
6.09725417 .022090962
276.01
4 4661
18.375235 102.904592
4.59380875 .022077793
208.07
Regression (X, Z, XZ) Residual Rumus Coincidence : F (XZ, Z |X) =
=
SS
MS
F
Regression SS X,Z,XZ − Regression SS X /2 MS residual (X,Z,XZ ) (18.375235 −6.53358301 )/2 0.022077793
= 268.18016
. display invF(3,4661,0.95) 2.6068144 . display Ftail(3,4661,268.18016) 1.44e-160
Nilai F di atas dibandingkan dengan F tabel pada F3,4661,0.95 = 2.61, karena F hitung > F tabel maka dengan demikian Ho ditolak. Atau dengan menggunakan nilai P berdasarkan F hitung pada F3,4661 = 1.44e-160 Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan kedua garis lurus tidak berhimpit (not coincident).
Langkah 5 : Melakukan uji parallelism Uji parallelism dilakukan untuk membuktikan kasus paralel ; yaitu apabila koefisien kemiringan keduanya sama, tetapi titik potongnya berbeda. Dengan demikian, hipotesisnya adalah sbb : 1. sbp (Y) dan bmi (X) pada sex (Z) Ho : β1M = β1F atau kedua garis lurus regresi memiliki koefisien kemiringan (slope) yang sama baik pada kelompok laki-laki maupun perempuan Ha : β1M ≠ β1F atau koefisien kemiringan (slope)-nya tidak sama.
17/04/2009
13
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
Iswandi NPM : 0806470421
2. sbp (Y) dan scl (X) pada sex (Z) Ho : β1M = β1F atau kedua garis lurus regresi memiliki koefisien kemiringan (slope) yang sama baik pada kelompok laki-laki maupun perempuan Ha : β1M ≠ β1F atau koefisien kemiringan (slope)-nya tidak sama 3. sbp (Y) dan bmi (X) pada kelompok umur (Z) Ho : β1AG1 = β1AG2 = β1AG3 atau terdapat dua garis lurus regresi yang memiliki koefisien kemiringan (slope) yang sama pada ketiga kelompok umur Ha : salah satu slope atau koefisien kemiringan (slope)-nya tidak sama. 4. sbp (Y) dan scl (X) pada kelompok umur (Z) Ho : β1AG1 = β1AG2 = β1AG3 atau terdapat dua garis lurus regresi yang memiliki koefisien kemiringan (slope) yang sama pada ketiga kelompok umur Ha : salah satu slope atau koefisien kemiringan (slope)-nya tidak sama. Untuk menguji hipotesis-hipotesis di atas, maka digunakan ringkasan tabel 1 - 4 di atas untuk masing-masing variabel yang akan dihubungkan. Rumus Parallelism : F (XZ | X, Z) =
Regression SS X,Z,XZ − Regression SS X,Z MS residual (X,Z,XZ )
1. sbp (Y) dan bmi (X) pada sex (Z)
F (XZ, Z |X) =
14.661556 −14.2826922 0.022914404
= 16.5338
. display invF(1,4686,0.95) 3.843444 . display Ftail(1,4686,16.5338) .00004857
Nilai F di atas dibandingkan dengan F tabel pada F1,4686,0.95 = 3.843, karena F hitung > F tabel maka dengan demikian Ho ditolak. Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4686 = .00004857 Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan kedua garis lurus tidak paralel atau koefisien kemiringannya tidak sama. 2. sbp (Y) dan scl (X) pada sex (Z)
17/04/2009
14
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
F (XZ, Z |X) =
7.42106651 −6.53751858 0.024422728
Iswandi NPM : 0806470421
= 36.1773
. display invF(1,4662,0.95) 3.8434543 . display Ftail(1,4662,36.1773) 1.939e-09
Nilai F di atas dibandingkan dengan F tabel pada F1,4662,0.95 = 3.843, karena F hitung > F tabel maka dengan demikian Ho ditolak. Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4662 = 1.939e-09 Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan kedua garis lurus tidak paralel atau koefisien kemiringannya tidak sama. 3. sbp (Y) dan bmi (X) pada kelompok umur (Z)
F (XZ, Z |X) =
26.0925732 −26.0879508 0.020479399
= 0.2257
. display invF(1,4685,0.95) 3.8434445 . display Ftail(1,4685,0.2257) .63475285
Nilai F di atas dibandingkan dengan F tabel pada F1,4685,0.95 = 3.843, karena F hitung < F tabel maka dengan demikian Ho gagal ditolak. Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4685 = 0.63475285 Karena nilai P (0.6347) lebih besar dari 0.05, maka Ho gagal ditolak. Sehingga dapat disimpulkan ada dua garis lurus pada ketiga kelompok umur tersebut yang paralel atau koefisien kemiringannya sama. 4. sbp (Y) dan scl (X) pada kelompok umur (Z)
F (XZ, Z |X) =
18.375235 −18.2917625 0.022077793
= 3.7808
. display invF(1,4661,0.95) 3.8434547 . display Ftail(1,4661,3.7808) .05190395
Nilai F di atas dibandingkan dengan F tabel pada F1,4661,0.95 = 3.843, karena F hitung < F tabel maka dengan demikian Ho gagal ditolak.
17/04/2009
15
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
Iswandi NPM : 0806470421
Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4661 = .05190395 Karena nilai P (0.05190395) lebih besar dari 0.05, maka Ho gagal ditolak. Sehingga dapat disimpulkan ada dua garis lurus pada ketiga kelompok umur yang
paralel atau koefisien
kemiringannya sama.
Langkah 6 : Melakukan uji kesamaan intersep Uji kesamaan intersep dilakukan untuk melihat apakah kedua garis regresi memiliki titik potong (intersep) yang sama, walaupun kemiringan (slope)- nya berbeda. Dengan demikian, hipotesisnya adalah sbb : 1. sbp (Y) dan bmi (X) pada sex (Z) Ho : β0M = β0F atau kedua garis lurus regresi memiliki titik potong (intersep) yang sama baik pada kelompok laki-laki maupun perempuan Ha : β0M ≠ β0F atau titik potong (intersep)-nya tidak sama. 2. sbp (Y) dan scl (X) pada sex (Z) Ho : β0M = β0F atau kedua garis lurus regresi memiliki titik potong (intersep) yang sama baik pada kelompok laki-laki maupun perempuan Ha : β0M ≠ β0F atau titik potong (intersep)-nya tidak sama. 3. sbp (Y) dan bmi (X) pada kelompok umur (Z) Ho : β0AG1 = β0AG2 = β0AG3 atau terdapat dua garis lurus regresi yang memiliki titik potong (intersep) yang sama pada ketiga kelompok umur Ha : β0AG1 = β0AG2 = β0AG3 atau titik potong (intersep)-nya tidak sama. 4. sbp (Y) dan scl (X) pada kelompok umur (Z) Ho : β0AG1 = β0AG2 = β0AG3 atau terdapat dua garis lurus regresi yang memiliki titik potong (intersep) yang sama pada ketiga kelompok umur Ha : β0AG1 = β0AG2 = β0AG3 atau titik potong (intersep)-nya tidak sama. Untuk menguji hipotesis-hipotesis di atas, maka digunakan ringkasan tabel 1 - 4 di atas untuk masing-masing variabel yang akan dihubungkan. Variabel yang terlibat dimasukkan secara berurut dalam uji ini, mengikuti formula berikut : F (Z | X)
=
Regression SS Z,X − Regression SS X MS residual (X,Z,XZ )
17/04/2009
16
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
Iswandi NPM : 0806470421
1. sbp (Y) dan bmi (X) pada sex (Z)
F (XZ, Z |X) =
14.2826922 −14.0924231 0.022914404
= 8.3035
. display invF(1,4686,0.95) 3.843444 . display Ftail(1,4686,8.3035) .00397485
Nilai F di atas dibandingkan dengan F tabel pada F1,4686,0.95 = 3.843, karena F hitung > F tabel maka dengan demikian Ho ditolak. Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4686 = .00397485 Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan titik potong (intersep) kedua garis lurus regresi tidak sama. 2. sbp (Y) dan scl (X) pada sex (Z) F (XZ, Z |X) =
6.53751858 −6.53358301 0.024422728
= 0.1611
. display invF(1,4662,0.95) 3.8434543 . display Ftail(1,4662,0.1611) .68816418
Nilai F di atas dibandingkan dengan F tabel pada F1,4662,0.95 = 3.843, karena F hitung < F tabel maka dengan demikian Ho gagal ditolak. Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4662 = .68816418 Karena nilai P (0.688) lebih besar dari 0.05, maka Ho gagal ditolak. Sehingga dapat disimpulkan ada kesamaan titik potong (intersep) kedua garis lurus regresi. 3. sbp (Y) dan bmi (X) pada kelompok umur (Z) F (XZ, Z |X) =
26.0879508 −14.0924231 0.020479377
= 585.7369
. display invF(1,4685,0.95) 3.8434445 . display Ftail(1,4685,585.7369) 4.97e-122
Nilai F di atas dibandingkan dengan F tabel pada F1,4685,0.95 = 3.843, karena F hitung > F tabel maka dengan demikian Ho ditolak.
17/04/2009
17
Iswandi NPM : 0806470421
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
17/04/2009
Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4685 = 4.97e-122 Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan titik potong (intersep) kedua garis lurus regresi tidak sama. 4. sbp (Y) dan scl (X) pada kelompok umur (Z) F (XZ, Z |X) =
18.2917625 −6.53358301 0.022077793
= 532.5795
. display invF(1,4661,0.95) 3.8434547 . display Ftail(1,4661,532.5795) 1.14e-111
Nilai F di atas dibandingkan dengan F tabel pada F1,4661,0.95 = 3.843, karena F hitung > F tabel maka dengan demikian Ho ditolak. Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4661 = 1.14e-111 Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan titik potong (intersep) kedua garis lurus regresi tidak sama.
Langkah 7 : Visualisasi grafik 1. sbp (Y) dan bmi (X) pada tiap kategori sex (Z) . twoway (lfit logsbp logbmi if sex==0, lcolor(green) lwidth(medthick)) (lfit logsbp logbmi if sex==1, lcolor(blue) lwidth(medthick))
2. sbp (Y) dan scl (X) pada tiap kategori sex (Z)
5 4.8
4.9
Fitted values
5 4.9
4.7
4.8 4.7
Fitted values
5.1
5.2
5.1
. twoway (lfit logsbp logscl if sex==0, lcolor(green) lwidth(medthick)) (lfit logsbp logscl if sex==1, lcolor(blue) lwidth(medthick))
2.5
3
3.5 logbmi
Fitted values
Fitted values
4
4.5
5
5.5 logscl Fitted values
6
6.5
Fitted values
Ket : garis biru = laki-laki, garis hijau = perempuan
Nampak dari grafik di atas garis tidak paralel, walaupun demikian perpotongan ada yang simetris.
18
Iswandi NPM : 0806470421
Analisis Regresi Linear - Perbandingan Dua Garis Regresi
17/04/2009
3. sbp (Y) dan bmi (X) pada tiap kategori umur (Z) . twoway (lfit logsbp logbmi if agegroup==1, lcolor(green) lwidth(medthick)) (lfit logsbp logbmi if agegroup==2, lcolor(blue) lwidth(medthick)) (lfit logsbp logbmi if agegroup==3, lcolor(red) lwidth(medthick))
4. sbp (Y) dan scl (X) pada tiap kategori umur (Z)
4.9 4.8
Fitted values
4.7
4.7
4.8
4.9
5
Fitted values
5.1
5
5.2
. twoway (lfit logsbp logscl if agegroup==1, lcolor(green) lwidth(medthick)) (lfit logsbp logscl if agegroup==2, lcolor(blue) lwidth(medthick)) (lfit logsbp logscl if agegroup==3, lcolor(red) lwidth(medthick)
2.5
3
3.5
4.5
4
5
5.5 logscl
logbmi Fitted values Fitted values
Fitted values Fitted values
Fitted values
6 Fitted values
Ket : garis hijau = age group 1 (30-38 thn), garis biru = age group 2 (39-52 thn), age group 3 = (53-68 thn)
Nampak dari grafik di atas adanya dua garis yang paralel, walaupun tidak coincidence.
Langkah 8 : Kesimpulan No
source
Coincidence Parallelism test test
Equal Intercept
Conclude
1
sbp (Y) dan bmi (X) pada tiap kategori sex (Z)
Signifikan
Signifikan
Signifikan
Garis tidak paralel juga intersepnya tidak sama
2
sbp (Y) dan scl (X) pada tiap kategori sex (Z)
Signifikan
Signifikan
Tidak signifikan
Garis tidak paralel dan intersepnya sama
3
sbp (Y) dan bmi (X) pada tiap kategori umur (Z)
Signifikan
Tidak signifikan
Signifikan
Garis Paralel tapi tidak coincidence
4
sbp (Y) dan scl (X) pada Signifikan
Tidak signifikan
Signifikan
Garis paralel tapi tidak coincidence
tiap kategori umur (Z)
6.5