Tugas Final Mata Kuliah : BiostatistikLanjut Dosen : Prof. Dr. dr. Muh. Tahir Abdullah, M.Sc. MSPH.
SOAL JAWAB ANALISIS REGRESI
Oleh: MUHAMMAD WAHIDIN NIM : K012181094 KELAS D
Program StudiIlmuKesehatanMasyarakat Program PascasarjanaUniversitasHasanuddin Makassar 2018
I.
SOAL HAL 152 NO. 7. Hajar (2000) mempelajarikemampuanmengelolakelas (Y) guru-guru matapelajaran di kota Makassar, penglolaankelasinidihipotesiskandipenagruhiolehluaskelasdalam m2 (X1), kelengkapankelas (X2), fasilitaskelaspembelajaran (X3), banyaknyasiswatiapkelas (X4, danwaktupengajar (X5). Kita mengetahuibahwaluaskelasmempunyaisklapengukuranrasio, sedangkanpeubahpeubahlainnyadiukurdenganskala interval. Model linear gandadigunakandalammenganalisis data dariseratusresponden, danhasilnyadapatdilihatsebagaiberikut :
Dependent Variabel : Y Source Model Error C Total
Variable NTERCEP X1 X2 X3 X4 X5
Analisis Of Variance DF Sum of Squares Mean Square F Value Prob> F 5 9195.64657 1839.12931 2.431 0.0406 94 71121.34343 756.61004 99 80316.99000 Root MSE 27.50655 R-Square 0.1145 Deep Mean 189.99000 Adj R-sq 0.0674 C.V 14.47789 Parameter Standard T for H0 : DF Estimate Error Parameter = Prob> I T I 0 1 73.914711 53.18519792 1.390 0.1679 1 0.371147 0.25953602 1.430 0.1560 1 -0.523902 0.77801861 -0.673 0.5024 1 0.671210 1.60568397 0.418 0.6769 1 1.625964 0.62300365 2.610 0.0105 1 0.294274 0.34866874 0.844 0.4008
a. Tentukantaksiran model regresinya ? b. Apakah model inisecara statistic dapatdigunakansebagaialatinferensi ?tunjukkanangka-angkadarihasil computer yang mendukungjawabananda ! c. Berapabesardayaramal model, danberapabesardayaramal X1 ,X2, X3, X4, dan X5 secarabersama-samaterhadapkemampuanmengelolakelas ? d. Jelaskankesignifikananmasing-masingpeubahbebassecarasendiri-sendiri !apakomentaranda ? e. Bagaimana model inidapatditingkatkandayaramalnya ?
Jawab: a. Model regresi: Y= β0 +β1 X1 +β2 X2 +β3 X3 +β4 X4 +β5 X5 +ε Taksiran parameter diperolehdarihasilkomputer, yaitu β0 = 73,93, β1 = 0,371, β2 = 0,524, β3 = 0,671, β4 = 1,626, β5 = 0,294, sehinggadiperolehtaksiran model regresi: Ŷ= 73,915 + 0,371 X1 - 0,524 X2 + 0,671 X3 + 1,626 X4 + 0,294 X5 +ε b. Pengujian model memberikannilaiFhitung = 2,431 dengannilai p = 0,0406 (p < 0,05) memberikaninformasitentangkesignifikanan
model.
Jadi,
model
inisignifikansehinggadapatdigunakanuntukmembuatinferensimeramalkankemampuanm engelolakelas (Y) untuksuatunilai X tertentu yang diberikan. c. Dayaramal model diberikanolehnilai R2 = 0,1145. Jadi, model mempunyaidayaramal 11,45% atausekitar 12% variasi Y dapatdijelaskanoleh model. Nilai R2terkoreksi = 0,0674. Angkainimenunjukkanbahwa X1, X2, X3, X4, dan X5secarabersamasamadapatmenjelaskansekitar 6,74% variasi Y yang berbedasekitar 5% daridayaramal model. Sementaraitu, sisanya (93,26%) dipengaruhiolehfaktor lain. Jadi, konstanta (β0) mempunyaikontribusisekitar 5% terhadap model dalamkaitannyadenganperamalan Y. d. Kesignifikananmasing-masingpeubahbebasdapatdilihatpadanilai t (T for HO: Parameter = 0) dengannilai p (Prob>│T│) sebagaiberikut: X1 t = 1,430; p = 0,1560 p > 0,05 X2 t = - 0,673; p = 0,5024 p > 0,05 X3 t = 0,418; p = 0,6769 p > 0,05 X4 t = 2,160; p = 0,0105 p < 0,05 X5 t = 0,844; p = 0,4008 p > 0,05 Jadi, darikelimapeubahtersebut, satu-satunyapeubah yang signifikanadalah X4 yang mempunyai
t
=
2,610
dengannilai
p
=
0,0105
sehinggadapatdisimpulkanbahwahanyavariabelbanyaknyasiswatiapkelas mempunyaipengaruhterhadapkemampuan maka
model
regresi
yang
guru
0,05 yang
matapelajarandalammengelolakelas,
diperolehadalah:
Ŷ= 73,915 + 1,626
X4 dapatdiinterpretasikanbahwajikabanyaknyasiswatiapkelas dinaikkansatusatuanskormakakemampuan
<
guru
(X4) mengelolakelas
(Y)
dapatditingkatkansebesar
1,626
satuanapabilapeubah-
peubahlainnyadipertahankantidakberubah.
Sementaraitu,
tidaksignifikannyabeberapapeubahbebasdapatdiakibatkanolehadanyainterkorelasi
di
antarapeubah-peubahtersebut. e. Untukmeningkatkandayaramal
model,
penambahanpeubahdapatdilakukanataumempertimbangkan model lain sepertikuadratik, eksponendansebagainya.
II.
SOAL HALAMAN 259 NO 17 Tabelberikutmemuat data dari 19 penderitaAsma yang mencantumkan volume kekuatanpernapasandalam liter persatuandetik (V) bersamaumurdalamtahun (U), tinggidalam cm (T) danberatbadandalam kg (B): a. Buatlah model dengan volume kekuatanpernapasan (V) sebagaipeubah yang diramalolehtinggi (T), berat (B) danumur (U). b. Ujilahpeubah-peubahbebasdanuji pula penggalan ! c. Berikutfaktorpengantarvariansi (FPV) untuksetiappeubahbebas d. Buatkanmatrikskorelasi yang memuatsemuapeubahbebasdanpeubahterikat ! e. Hitungnilaieigen, indekskondisi, danbilangankondisiuntukmatrikskorelasi (tidaktermasukpenggalan) ! f. Hitungnilaieigen, indekskondisi, danbilangankondisiuntukmatrikskorelasi (termasukpenggalan) ! g. Berikannilaisisaan student dannilaipengungkit (leverage) !Apakahada data yang tampakbermasalah ?Jelaskan ! h. Apakahadamasalahkekolineran ?Jelaskan ? Subjek
U
T
B
V
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
24 36 28 25 26 22 27 27 36 24 26 29 33 31 30
175 172 171 166 166 176 185 171 185 182 180 163 180 180 180
78,0 67,6 98,0 65,5 65,0 65,5 85,5 76,3 79,0 88,2 70,5 75,0 68,0 65,0 70,4
4,7 4,3 3,5 4,0 3,2 4,7 4,3 4,7 5,2 4,2 3,5 3,2 2,6 2,0 4,0
16 17 18 19
22 27 46 36
168 168 178 173
63,0 91,2 67,0 62,0
3,9 3,0 4,5 2,4
Jawaban : a. Model Persamaan dengan volume kekuatan pernapasan (V) sebagai peubah yang diramal oleh tinggi (T), berat (B) dan umur (U) : Model Summary
Model
R
R Square
,284a
1
Adjusted R
Std. Error of the
Square
Estimate
,081
-,103
,9197
a. Predictors: (Constant), umur, Berat Badan, Tinggi Badan
ANOVAa Model 1
Sum of Squares Regression
df
Mean Square
F
1,117
3
,372
Residual
12,688
15
,846
Total
13,805
18
Sig. ,728b
,440
a. Dependent Variable: Kekuatan Pernapasan b. Predictors: (Constant), umur, Berat Badan, Tinggi Badan
Coefficientsa Standardized Unstandardized Coefficients Model 1
B (Constant)
Std. Error -1,937
5,723
Berat Badan
,011
,022
Tinggi Badan
,030 -,013
umur
Coefficients Beta
t
Sig. -,338
,740
,134
,520
,611
,034
,230
,884
,391
,038
-,087
-,329
,746
a. Dependent Variable: Kekuatan Pernapasan
Berikut bentuk persamaanya Y=1,937 + 0,011 X1 + 0,030 X2 – 0,013 X3
b. Menguji peubah-peubah bebas dan uji pula penggalan Variabel Berat Badan : Variables Entered/Removeda Variables
Variables
Entered
Removed
Model
Berat Badanb
1
Method . Enter
a. Dependent Variable: Kekuatan Pernapasan b. All requested variables entered. Model Summary
Model
R ,181a
1
Adjusted R
Std. Error of the
Square
Estimate
R Square ,033
-,024
,8863
a. Predictors: (Constant), Berat Badan ANOVAa Model 1
Sum of Squares Regression
df
Mean Square
F
,451
1
,451
Residual
13,354
17
,786
Total
13,805
18
Sig. ,574
,459b
t
Sig.
a. Dependent Variable: Kekuatan Pernapasan b. Predictors: (Constant), Berat Badan Coefficientsa Standardized Unstandardized Coefficients Model 1
B (Constant) Berat Badan
Std. Error 2,670
1,485
,015
,020
Coefficients Beta
,181
1,799
,090
,758
,459
a. Dependent Variable: Kekuatan Pernapasan
Berdasarkan perhitungan program computer didapatkan nilai R2 = 0,033 artinya model memiliki daya ramal sebesar 3,3% . Variasi Y bisa dijelaskan oleh model. Nilai R2 terkorelasi = -0,024. Angka ini menunjukan bahwa variabel berat badan dapat dijelaskan 2,4%. variasi Y, yang berbeda sekitar 9% dari daya ramal model.
Variabel Tinggi badan Model Summary
Model
R ,226a
1
R Square
Adjusted R
Std. Error of the
Square
Estimate
,051
-,005
,8779
a. Predictors: (Constant), Tinggi Badan ANOVAa Model 1
Sum of Squares Regression
df
Mean Square
,703
1
,703
Residual
13,102
17
,771
Total
13,805
18
F
Sig. ,912
,353b
a. Dependent Variable: Kekuatan Pernapasan b. Predictors: (Constant), Tinggi Badan Coefficientsa Standardized Unstandardized Coefficients Model 1
B (Constant) Tinggi Badan
Coefficients
Std. Error -1,374
5,405
,030
,031
Beta
t
,226
Sig. -,254
,802
,955
,353
a. Dependent Variable: Kekuatan Pernapasan
Berdasarkan perhitungan program computer didapatkan nilai R2 = 0,051artinya model memiliki daya ramal sebesar 5,1% . Variasi Y bisa dijelaskan oleh model. Nilai R2 terkorelasi = -0,005. Angka ini menunjukan bahwa variabel berat badan dapat dijelaskan 0,5% variasi Y, yang berbeda sekitar 4,6% dari daya ramal model. Variabel Umur Model Summary
Model 1
R ,055a
R Square ,003
a. Predictors: (Constant), umur
Adjusted R
Std. Error of the
Square
Estimate
-,056
,8998
ANOVAa Model 1
Sum of Squares Regression
df
Mean Square
,042
1
,042
Residual
13,763
17
,810
Total
13,805
18
F
Sig. ,822b
,052
a. Dependent Variable: Kekuatan Pernapasan b. Predictors: (Constant), umur Coefficientsa Standardized Unstandardized Coefficients Model 1
B
Coefficients
Std. Error
(Constant)
4,019
1,050
umur
-,008
,035
Beta
t
-,055
Sig.
3,826
,001
-,228
,822
a. Dependent Variable: Kekuatan Pernapasan
Berdasarkan perhitungan program computer didapatkan nilai R2 = 0,003 artinya model memiliki daya ramal sebesar 0,3% . Variasi Y bisa dijelaskan oleh model. Nilai R2 terkorelasi = -0,056. Angka ini menunjukan bahwa variabel berat badan dapat dijelaskan 5,6% variasi Y, yang berbeda sekitar -0,356% dari daya ramal model. c. Faktor Pengantar Variansi (FPV) Untuk Setiap Peubah Bebas Model Summary
Model 1
R
R Square ,055a
Adjusted R Square ,003
-,056
Std. Error of the Estimate ,8998
a. Predictors: (Constant), umur
Berdasarkan tabel di atas diperoleh angka R2 (R Square) sebesar 0,003 atau (0,3%). Hal ini menunjukkan bahwa presentase sumbangan pengaruh variabel independen umur terhadap variabel dependen kekeuatan pernapasan sebesar 0,3%. Atau variasi variabel independen yang digunakan dalam model mampu menjelaskan sebesar 0,3% variasi variabel dependen.
Sedangkan sisanya sebesar 99,7% dipengaruhi atau dijelaskan oleh variabel lain yang tidak dimasukkan dalam model penelitian ini. Model Summary
Model
R
R Square ,226a
1
Adjusted R Square ,051
Std. Error of the Estimate
-,005
,8779
a. Predictors: (Constant), Tinggi Badan
Berdasarkan tabel di atas diperoleh angka R2 (R Square) sebesar 0,051 atau (5,1%). Hal ini menunjukkan bahwa presentase sumbangan pengaruh variabel independen tinggi badan terhadap variabel dependen
kekuatan pernapasan sebesar 5,1%. Atau variasi variabel
independen yang digunakan dalam model mampu menjelaskan sebesar 5,1%. variasi variabel dependen. Sedangkan sisanya sebesar 94,9% dipengaruhi atau dijelaskan oleh variabel lain yang tidak dimasukkan dalam model penelitian ini. Model Summary
Model 1
R
R Square ,181a
Adjusted R Square ,033
Std. Error of the Estimate
-,024
,8863
a. Predictors: (Constant), Berat Badan
Berdasarkan tabel di atas diperoleh angka R2 (R Square) sebesar 0,033 atau (3,3%). Hal ini menunjukkan bahwa presentase sumbangan pengaruh variabel independen Berat Badan terhadap variabel dependen
kekuatan pernapasan sebesar 3,3%. Atau variasi variabel
independen yang digunakan dalam model mampu menjelaskan sebesar 3,3%. variasi variabel dependen. Sedangkan sisanya sebesar 96,7% dipengaruhi atau dijelaskan oleh variabel lain yang tidak dimasukkan dalam model penelitian ini. d. Matriks Korelasi Yang Memuat Semua Peubah Bebas Dan Peubah Terikat
III.
SOAL HALAMAN 300 NO 7 Data berikutdari Bethel et. al. (1985).Semuasubjeklelakiberpenyakitasmadiukur forced expiratory volume in 1 second (FEV1), umur (X1dalamtahun), tinggi (X2 dalam cm), danberat (X3 dalam kg). Subjek
X1
X2
X3
FEV1
1
24
175
78,0
4,7
2
36
172
67,6
4,3
3
25
166
65,5
4,0
4
22
176
65,5
4,7
5
27
185
85,5
4,3
6
27
171
76,3
4,7
7
36
185
79,0
5,2
8
24
182
88,2
4,2
9
26
180
70,5
3,5
10
29
163
75,0
3,2
11
31
180
65,0
2,0
12
30
180
70,4
4,0
13
22
168
63,0
3,9
14
27
168
91,2
3,0
15
46
178
67,0
4,5
16
36
173
62,0
2,4
Gunakan FEV1 sebagai peubah terikat dan umur, berat, tinggisebagai peubah bebas. a. Gunakan prosedur semua regresi yang mungkin untuk menghasilkan sebuah model terbaik! b. Pertimbangkansebuah model denganmemusatkan (centering) umur, berat, tinggi, dankuadratnyamasing-masingsebagaipeubahbebas. Sarankansebuahstrategiseleksimajukelompokuntukmemilihsebuah
model
danimplementasikan! c. Gunakanprosedursemuaregresiuntuk model yang diperluasuntukmemilihsebuah model terbaik!
d. Bandingkanhasil-hasildari
(a),
(b),
dan
(c)!
Model
mana
yang
paling
wajar?Bagaimana data membatasikesimpulanAnda?
Jawaban : a. Prosedur semua regresi yang mungkin untuk menghasilkan sebuah model terbaik dengan menggunakan tabel rangkuman hasil prosedur semua regresi yang mungkin dengan menggunakan analisis spss berikut. Tabel rangkuman hasil prosedur Model 1 2 3 4 5 6 7
peubah
P Koefisien Nilai F parsial Kebaikan Model B0 B1 B2 B3 X1 X2 X3 R2 rrk X1 1 4.055 -0.005 -0.133 0.001 0,914276 X2 1 -1.980 0.034 0.997 0.066 0,884027 X3 1 2.408 0.021 0.820 0.046 0,893624 X1X2 2 -2.031 -0.012 0.036 -0.332 1.012 0.074 0,913522 X1X3 2 2.311 0.002 0.021 0.050 0.781 0.046 0,927269 X2X3 2 -2.283 0.029 0.016 0.812 0.606 0.092 0,904723 X1X2X3 3 -2.284 -0.007 0.030 0.014 -0.163 0.796 0.512 0.094 0,940622 Berdasarkan tabel di atas maka diperoleh bahwa kriteria pengaruh (dalam bentuk nilai – nilai R2p) dalam setiap himpunan yang meliputi satu, dua, dan tiga peubah yang diberikan sebagai berikut : 1. Himpunan satu peubah: tahun (X1) R21 = 0.001; 2. Himpunan dua peubah : tahun (X1) dan tinggi (X2) R22 = 0.074; 3. Himpunan tiga peubah : tahun (X1), tinggi (X2) dan berat (X3) R23 = 0.094; Dari tiga model (model 1, 4, dan 7 dalam tabel di atas), maka berdasarkan nilai R yang paling besar dari ketiga model, dipilih model 7 dengan nilai R yaitu 0.094. Jadi, pilihan persamaan regresi terbaik berdasarkan pada prosedur semua regresi yang mungkin dengan R2p sebagai kriteria diberikan oleh : Ŷ = 2.284 -0.007X1+0.030X2+0.014 Hasil ini diperoleh dari pengolahan komputer dengan program SPSS sebagai berikut hasil output :
Cp 2 2 2 3 3 3 4
Variables Entered/Removedb Variables Model
Variables Entered
1
X3, X2, X1a
Removed
Method . Enter
a. All requested variables entered. b. Dependent Variable: Y
Model Summary Selection Criteria
Model
R
1
.306a
R Square
Std. Error
Akaike
Amemiya
Mallows'
Schwarz
Adjusted R
of the
Information
Prediction
Prediction
Bayesian
Square
Estimate
Criterion
Criterion
Criterion
Criterion
.094
-.133
.94062
1.438
1.510
4.000
4.529
a. Predictors: (Constant), X3, X2, X1
ANOVAb Model 1
Sum of Squares Regression
df
Mean Square
1.100
3
.367
Residual
10.617
12
.885
Total
11.718
15
F
Sig. .415
.746a
a. Predictors: (Constant), X3, X2, X1 b. Dependent Variable: Y
Coefficientsa Standardized Unstandardized Coefficients Model 1
B (Constant)
Std. Error -2.284
6.316
X1
-.007
.040
X2
.030
X3
.014
a. Dependent Variable: Y
Coefficients Beta
t
Sig. -.362
.724
-.048
-.163
.873
.038
.233
.796
.442
.028
.151
.512
.618
b. Adapun sebuah strategi seleksi maju kelompok untuk memiliki sebuah model dan implementasikan pada model dengan memusatkan (centering) umur, berat, tinggi, dan kuadratnya masing – masing sebagai peubah bebas, yaitu terdapat beberapa langkah berikut. 1. Memilih peubah pertama yang dimasukkan dalam model, yaitu peubah yang mempunyai korelasi tertinggi dengan peubah terikat. Sehingga kita memperoleh koefisien – koefisien korelasi berdasarkan SPSS, yaitu: Correlations: x1; x2; x3; Y; x1^2; x2^2; x3^2 x1 0,199 0,459
x2
x3
-0,228 0,396
0,226 0,399
Y
-0,036 0,896
0,257 0,336
0,214 0,426
x1^2
0,993 0,000
0,194 0,471
-0,246 0,359
0,010 0,970
x2^2
0,198 0,463
1,000 0,000
0,234 0,384
0,258 0,335
0,192 0,476
x3^2
-0,232 0,387
0,217 0,419
0,999 0,000
0,188 0,487
-0,249 0,351
x2
x3
Y
x1^2
x2^2
0,224 0,404
Cell Contents: Pearson correlation P-Value
Berdasarkan tabel di atas sehingga diperoleh nilai koefisien korelasi: rYX1 = -0.023, rYX2 = 0.257, rYX3 =0.214, rX12Y=0.010, rX22Y=0.258, rX32Y=0.188 Maka diperoleh persamaan regresinya Y = 0,95 + 0,000097 X22 dimana statistik F pada model ini signifikan. Maka dilanjutkan pada langkah 2. Berdasarkan hasil analisis spss berikut. Regression Analysis: Y versus x2^2 The regression equation is Y = 0,95 + 0,000097 x2^2 Predictor Constant x2^2
Coef 0,946 0,00009659
S = 0,883877
SE Coef 2,977 0,00009666
R-Sq = 6,7%
T 0,32 1,00
P 0,755 0,335
R-Sq(adj) = 0,0%
Analysis of Variance Source Regression Residual Error Total
DF 1 14 15
SS 0,7802 10,9373 11,7175
MS 0,7802 0,7812
F 1,00
P 0,335
2. Dalam menghitung statistik F parsial yang bersangkutan dengan masing – masing peubah berdasarkan persamaan regresi yang memuat peubah yang bersangkutan dan peubah pertama yang dipilih. Maka diperoleh nilai F parsial sebagai berikut : F(X2│X1) = 1.012 F (X3│X1) = 0.781 3. Memusatkan perhatian pada peubah yang memiliki nilai statistik F parsial terbesar. Untuk data di atas, peubah tinggi mempunyai nilai F parsial terbesar yaitu 1.012 4. Maka selanjutnya pada akhir langkah didapatkan dengan menggunakan semua variabel bebas. Berikut hasil analisisnya melalui SPSS. Coefficientsa Unstandardized Coefficients Model 1
B (Constant) x2pangkat2
2
(Constant) x2pangkat2 x3
3
(Constant) x2pangkat2 x3 x3pangkat2
4
(Constant) x2pangkat2 x3
5
.946
2.977
9.659E-5
.000
.240
3.267
8.235E-5
.000
.016
.026
-32.006
16.550
4.858E-5
.000
Beta
t
Sig. .318
.755
.999
.335
.073
.943
.220
.809
.433
.163
.599
.560
-1.934
.077
.519
.613
.258
.130
.903
.449
9.400
2.012
.067
-.006
.003
-9.229
-1.980
.071
-138.514
180.677
-.767
.459
-.003
.006
-9.011
-.584
.571
.972
.476
10.119
2.043
.066
x3pangkat2
-.006
.003
-9.878
-2.009
.070
x2
1.192
2.013
9.119
.592
.566
-137.764
188.888
-.729
.483
-.003
.006
-8.927
-.553
.592
(Constant) x2pangkat2 x3
6
Std. Error
Standardized Coefficients
.976
.498
10.159
1.961
.078
x3pangkat2
-.006
.003
-9.939
-1.932
.082
x2
1.183
2.105
9.054
.562
.586
x1
-.010
.037
-.071
-.258
.801
-51.734
162.176
-.319
.757
.000
.005
-.134
.897
(Constant) x2pangkat2
-1.850
x3
1.085
x3pangkat2
.419
11.296
2.592
.029
-.007
.003
-11.034
-2.552
.031
x2
.258
1.804
1.971
.143
.890
x1
-.620
.266
-4.525
-2.327
.045
.009
.004
4.502
2.307
.046
x1pangkat2 a. Dependent Variable: y