Tugas Individu
BIOSTATISTIK LANJUT
( Prof. Dr. dr. H.M. Tahir Abdullah, M.Sc.,MSPH )
SOAL ANALISIS KORELASI DAN REGRESI
Oleh : NURHUMAIRAH K012181010 KELAS B
Program Studi Ilmu Kesehatan Masyarakat Program Pascasarjana Universitas Hasanuddin Makassar 2018
1. Hajr (2000) mempelajari kemampuan mengelola kelas (Y) guru-guru mata pelajaran di kota Makassar. Pengelolaan kelas ini dihipotesiskan dipengaruhi oleh luas kelas dalam m2 (π1), kelengkapan kelas (π2), fasilitas pembelajaran (π3), banyaknya siswa tiap kelas (π4), dan waktu mengajar (π5). Kita mengetahui bahwa luas kelas mempunyai skala pengukuran rasio, sedangkan peubah-peubah lainnya diukur dengan skala interval. Model linear ganda digunakan dalam menganalisis data dari serratus responden, dan hasilnya dapat dilihat sebagai berikut: Dependent variable Y Analysis of variance Sum of
Mean
Source
DF
Squares
Square
F Value
Prob>F
Model
5
9195.64657
1839.12931
2.431
0.0406
Error
94
71121.34343 756.61004
C total
99
80316.99000
Root MSE
27.50655
R-square
0.1145
Dep Mean
189.99000
Adj R-sq
0.0674
C.V.
14.47789
Variable
DF
Parameter
Standard
T for H0
Estimate
Error
Parameter
Prob
=0
ITI
NTERCEP
1
73.914711
53.18519792
1.390
0.1679
X1
1
0.371147
0.25953602
1.430
0.1560
>
X2
1
-0.523902
0.77801861
-0.673
0.5024
X3
1
0.671210
1.60568397
0.418
0.6769
X4
1
1.625964
0.62300365
2.610
0.0105
X5
1
0.294274
0.34866874
0.844
0.4008
a. Tentukan taksiran model regresinya! b. Apakah model ini secara statistis dapat digunakan sebagai alat inferensi ? tunjukkan angka-angka dari hasil computer yang mendukung jawaban anda ! c. Berapa besar daya ramal model, dan berapa besar daya ramal π1 , π2 , π3, π4 , π5 secara bersama-sama terhadap kemampuan mengelola kelas ? d. Jelaskan kesignifikanan masing-masing peubah bebas secara sendirisendiri! Apa komentar anda ? e. Bagaimana model ini dapat ditingkatkan daya ramalnya ? Jawaban: a. Taksiran model regresinya adalah Y=73.914711+0.371147π10.523902π2+0.671210π3+1.625964π4+0.294274π5 b. Nilai F = 2.431 dengan nilai p=0.0406 memberikan informasi tentang kesignifikanan model karena p < 0.05. Jadi model ini signifikan sehingga dapat digunakan untuk membuat inferensi, misalnya meramalkan nilai Y untuk suatu nilai X tertentu yang diberikan. c. Daya ramal model diberikan oleh nilai π
2 =0.1145. Jadi model mempunyai daya ramal 11,45% atau sekitar 11% variasi Y dapat dijelaskan oleh model. Nilai π
2 terkoreksi = 0.0674. Angka ini menunjukkan bahwa π1 , π2 , π3, π4 , π5 secara bersama-sama hanya mampu menjelaskan sekitar 6% variasi Y yang berbeda dari daya ramal model.
d. Dari hasil analisis, dapat diketahui bahwa satu-satunya peubah yang signifikan adalah banyaknya siswa tiap kelas (π4 ) yang mempunyai nilai p=0.0105 < 0.05 dengan nilai t=2.610. Dengan demikian koefisien regresi π4 yaitu π4 = 1.625 dapat diinterpretasikan jika jumlah siswa tiap kelas dinaikkan satu satuan, maka kemampuan mengelola kelas (Y) dapat ditingkatkan sebesar 1.625 satuan apabila peubah-peubah lainnya dipertahankan tidak berubah. Hasil analisis pada peubah bebas π1 , π2 , π3, π5 menunjukkan hasil yang tidak signifikan karena nilai p> 0.05 dengan nilai p masing-masing peubah bebas berturut-turut adalah 0.1560, 0.5024, 0.6769, 0.4008. e. Untuk meningkatkan daya ramal model, penambahan peubah dapat dilakukan untuk mempertimbangkan model lain seperti kuadratik, eksponen dan lain sebagainya.
2. Tabel berikut memuat data dari 19 penderita asma yang mencantumkan volume kekuatan pernapasan dalam liter per satu detik (V) bersama umur dalam tahun (U), tinggi dalam cm (T) dan berat badan dalam kg (B). a. Buatlah model dengan volume kekuatan pernapasan (V) sebagai peubah yang diramal oleh tinggi (T), berat (B), dan umur (U)! b. Ujilah peubah-peubah bebas dan uji pula penggalan! c. Berikan faktor pengangkat variansi (FPV) untuk setiap peubah bebas! d. Buatkan matriks korelasi yang memuat semua peubah bebas dan peubah terikat! e. Hitung nilai eigen, indeks kondisi dan bilangan kondisi untuk matriks korelasi (tidak termasuk penggalan)! f. Hitung nilai eigen, indeks kondisi dan bilangan kondisi untuk matriks hasil kali silang (termasuk penggalan)! g. Berikan nilai sisaan student dan nilai pengungkit (leverage)! Apakah ada data yang tampak bermasalah? Jelaskan! h. Apakah ada masalah kekolinearan ? jelaskan!
Subjek
U
T
B
V
1
24
175
78,0 4,7
2
36
172
67,6 4,3
3
28
171
98,0 3,5
4
25
166
65,5 4,0
5
26
166
65,0 3,2
6
22
176
65,5 4,7
7
27
185
85,5 4,3
8
27
171
76,3 4,7
9
36
185
79,0 5,2
10
24
182
88,2 4,2
11
26
180
70,5 3,5
12
29
163
75,0 3,2
13
33
180
68,0 2,6
14
31
180
65,0 2,0
15
30
180
70,4 4,0
16
22
168
63,0 3,9
17
27
168
91,2 3,0
18
46
178
67,0 4,5
19
36
173
62,0 2,4
Jawaban : a. Model Persamaan dengan volume kekuatan pernapasan (V) sebagai peubah yang diramal oleh tinggi (T), berat (B) dan umur (U) : Model Summary
Model
R
R Square
,284a
1
Adjusted R
Std. Error of the
Square
Estimate
,081
-,103
,9197
a. Predictors: (Constant), umur, Berat Badan, Tinggi Badan
ANOVAa Model 1
Sum of Squares Regression
df
Mean Square
F
1,117
3
,372
Residual
12,688
15
,846
Total
13,805
18
Sig. ,728b
,440
a. Dependent Variable: Kekuatan Pernapasan b. Predictors: (Constant), umur, Berat Badan, Tinggi Badan
Coefficientsa Standardized Unstandardized Coefficients Model 1
B (Constant)
Std. Error -1,937
5,723
Berat Badan
,011
,022
Tinggi Badan
,030 -,013
umur
Coefficients Beta
,740
,134
,520
,611
,034
,230
,884
,391
,038
-,087
-,329
,746
Berikut bentuk persamaanya Y=1,937 + 0,011 X1 + 0,030 X2 β 0,013 X3 b. Menguji peubah-peubah bebas dan uji pula penggalan Variabel Berat Badan : Variables Entered/Removeda
Model
Variables
Entered
Removed
Sig. -,338
a. Dependent Variable: Kekuatan Pernapasan
Variables
t
Method
Berat Badanb
1
. Enter
a. Dependent Variable: Kekuatan Pernapasan b. All requested variables entered. Model Summary
Model
R
Std. Error of the
Square
Estimate
R Square
,181a
1
Adjusted R
,033
-,024
,8863
a. Predictors: (Constant), Berat Badan ANOVAa Model 1
Sum of Squares Regression
df
Mean Square
F
,451
1
,451
Residual
13,354
17
,786
Total
13,805
18
Sig. ,574
,459b
a. Dependent Variable: Kekuatan Pernapasan b. Predictors: (Constant), Berat Badan Coefficientsa Standardized Unstandardized Coefficients Model 1
B (Constant) Berat Badan
Std. Error
Coefficients Beta
2,670
1,485
,015
,020
t
,181
Sig.
1,799
,090
,758
,459
a. Dependent Variable: Kekuatan Pernapasan
Berdasarkan perhitungan program computer didapatkan nilai R2 = 0,033 artinya model memiliki daya ramal sebesar 3,3% . Variasi Y bisa dijelaskan oleh model. Nilai R2 terkorelasi = -0,024. Angka ini menunjukan bahwa variabel berat badan dapat dijelaskan 2,4%. variasi Y, yang berbeda sekitar 9% dari daya ramal model. Variabel Tinggi badan Model Summary
Model 1
R ,226a
R Square ,051
a. Predictors: (Constant), Tinggi Badan
Adjusted R
Std. Error of the
Square
Estimate
-,005
,8779
ANOVAa Model 1
Sum of Squares Regression
df
Mean Square
,703
1
,703
Residual
13,102
17
,771
Total
13,805
18
F
Sig. ,912
,353b
a. Dependent Variable: Kekuatan Pernapasan b. Predictors: (Constant), Tinggi Badan Coefficientsa Standardized Unstandardized Coefficients Model 1
B (Constant) Tinggi Badan
Coefficients
Std. Error
Beta
-1,374
5,405
,030
,031
t
,226
Sig.
-,254
,802
,955
,353
a. Dependent Variable: Kekuatan Pernapasan
Berdasarkan perhitungan program computer didapatkan nilai R2 =0,051artinya model memiliki daya ramal sebesar 5,1% . Variasi Y bisa dijelaskan oleh model. Nilai R2 terkorelasi = -0,005. Angka ini menunjukan bahwa variabel berat badan dapat dijelaskan 0,5% variasi Y, yang berbeda sekitar 4,6% dari daya ramal model. Variabel Umur Model Summary
Model
R ,055a
1
R Square
Adjusted R
Std. Error of the
Square
Estimate
,003
-,056
,8998
a. Predictors: (Constant), umur
ANOVAa Model 1
Sum of Squares Regression
df
Mean Square
,042
1
,042
Residual
13,763
17
,810
Total
13,805
18
a. Dependent Variable: Kekuatan Pernapasan
F
Sig. ,052
,822b
b. Predictors: (Constant), umur Coefficientsa Standardized Unstandardized Coefficients Model 1
B
Std. Error
Coefficients Beta
(Constant)
4,019
1,050
umur
-,008
,035
t
-,055
Sig.
3,826
,001
-,228
,822
a. Dependent Variable: Kekuatan Pernapasan
Berdasarkan perhitungan program computer didapatkan nilai R2 = 0,003 artinya model memiliki daya ramal sebesar 0,3% . Variasi Y bisa dijelaskan oleh model. Nilai R2 terkorelasi = -0,056. Angka ini menunjukan bahwa variabel berat badan dapat dijelaskan 5,6% variasi Y, yang berbeda sekitar -0,356% dari daya ramal model. c. Faktor Pengantar Variansi (FPV) Untuk Setiap Peubah Bebas Model Summary
Model
R
R Square
,055a
1
Adjusted R Square
,003
Std. Error of the Estimate
-,056
,8998
a. Predictors: (Constant), umur
Berdasarkan tabel di atas diperoleh angka R2 (R Square) sebesar 0,003 atau (0,3%). Hal ini menunjukkan bahwa presentase sumbangan pengaruh variabel independen umur terhadap variabel dependen kekeuatan pernapasan sebesar 0,3%. Atau variasi variabel independen yang digunakan dalam model mampu menjelaskan sebesar 0,3% variasi variabel dependen. Sedangkan sisanya sebesar 99,7% dipengaruhi atau dijelaskan oleh variabel lain yang tidak dimasukkan dalam model penelitian ini Model Summary
Model
R
1
,226a
R Square
Adjusted R Square
,051
a. Predictors: (Constant), Tinggi Badan
-,005
Std. Error of the Estimate ,8779
Berdasarkan tabel di atas diperoleh angka R2 (R Square) sebesar 0,051 atau (5,1%). Hal ini menunjukkan bahwa presentase sumbangan pengaruh variabel independen tinggi badan terhadap variabel dependen kekuatan pernapasan sebesar 5,1%. Atau variasi variabel independen yang digunakan dalam model mampu menjelaskan sebesar 5,1%. variasi variabel dependen. Sedangkan sisanya sebesar 94,9% dipengaruhi atau dijelaskan oleh variabel lain yang tidak dimasukkan dalam model penelitian ini. Model Summary
Model
R
R Square
,181a
1
Adjusted R Square ,033
Std. Error of the Estimate
-,024
,8863
a. Predictors: (Constant), Berat Badan
Berdasarkan tabel di atas diperoleh angka R2 (R Square) sebesar 0,033 atau (3,3%). Hal ini menunjukkan bahwa presentase sumbangan pengaruh variabel independen Berat Badan terhadap variabel dependen kekuatan pernapasan sebesar 3,3%. Atau variasi variabel independen yang digunakan dalam model mampu menjelaskan sebesar 3,3%. variasi variabel dependen. Sedangkan sisanya sebesar 96,7% dipengaruhi atau dijelaskan oleh variabel lain yang tidak dimasukkan dalam model penelitian ini. d. Matriks Korelasi Yang Memuat Semua Peubah Bebas Dan Peubah Terikat
3. Data berikut dari Bethel et. Al (1985). Semua subjek lelaki berpenyakit asma diukur forced expiratory volume in 1 second (πΉπΈπ1 ), umur (π1 dalam tahun), tinggi (π2 dalam cm), dan berat (π3 dalam kg). Subjek
X1
X2
X3
FEV1
1
24
175
78,0
4,7
2
36
172
67,6
4,3
3
25
166
65,5
4,0
4
22
176
65,5
4,7
5
27
185
85,5
4,3
6
27
171
76,3
4,7
7
36
185
79,0
5,2
8
24
182
88,2
4,2
9
26
180
70,5
3,5
10
29
163
75,0
3,2
11
31
180
65,0
2,0
12
30
180
70,4
4,0
13
22
168
63,0
3,9
14
27
168
91,2
3,0
15
46
178
67,0
2,5
16
36
173
62,0
2,4
Gunakan FEV, sebagai peubah terikat dan umur, berat, tinggi sebagai peubah ebbas. a. Gunakan prosedur semua regresi yang mugkin untuk menghasilkan sebuah model terbaik ! b. Pertimbangkan sebuah model dengan memusatkan (centering) umur, berat, tinggi, dan kuadratnya masing-masing sebagai peubah bebas. Sarankan sebuah strategi seleksi maju kelompok untuk memilih sebuah model dan implementasikan!
c. Gunakan prosedur semua regresi yang mungkin untuk model yang diperluas untuk memilih sebuah model terbaik ! d. Bandingkan hasil-hasil dari (a), (b), dan (c) ! Model mana yang paling wajar ? bagaimana data membatasi kesimpulan anda ? Jawaban : a. Prosedur semua regresi yang mungkin untuk menghasilkan sebuah model terbaik dengan menggunakan tabel rangkuman hasil prosedur semua regresi yang mungkin dengan menggunakan analisis spss berikut. Tabel rangkuman hasil prosedur Model
peubah
1 2 3 4 5 6 7
X1 X2 X3 X1X2 X1X3 X2X3 X1X2X3
P Koefisien B0 B1 1 4.055 -0.005 1 -1.980 1 2.408 2 -2.031 -0.012 2 2.311 0.002 2 -2.283 3 -2.284 -0.007
B2
B3
0.034 0.021 0.036 0.029 0.030
0.021 0.016 0.014
Nilai F parsial X1 X2 X3 -0.133 0.997 0.820 -0.332 1.012 0.050 0.781 0.812 0.606 -0.163 0.796 0.512
Kebaikan Model R2 rrk 0.001 0,914276 0.066 0,884027 0.046 0,893624 0.074 0,913522 0.046 0,927269 0.092 0,904723 0.094 0,940622
Berdasarkan tabel di atas maka diperoleh bahwa kriteria pengaruh (dalam bentuk nilai β nilai R2p) dalam setiap himpunan yang meliputi satu, dua, dan tiga peubah yang diberikan sebagai berikut : 1. Himpunan satu peubah: tahun (X1) R21 = 0.001; 2. Himpunan dua peubah : tahun (X1) dan tinggi (X2) R22 = 0.074; 3. Himpunan tiga peubah : tahun (X1), tinggi (X2) dan berat (X3) R23 = 0.094; Dari tiga model (model 1, 4, dan 7 dalam tabel di atas), maka berdasarkan nilai R yang paling besar dari ketiga model, dipilih model 7 dengan nilai R yaitu 0.094. Jadi, pilihan persamaan regresi terbaik berdasarkan pada prosedur semua regresi yang mungkin dengan R2p sebagai kriteria diberikan oleh : ΕΆ = 2.284 -0.007X1+0.030X2+0.014
Cp 2 2 2 3 3 3 4
Hasil ini diperoleh dari pengolahan komputer dengan program SPSS sebagai berikut hasil output : Variables Entered/Removedb Variables Model
Variables Entered
1
X3, X2, X1a
Removed
Method . Enter
a. All requested variables entered. b. Dependent Variable: Y
Model Summary Selection Criteria
Model
R
1
.306a
Std. Error
Akaike
Amemiya
Mallows'
Schwarz
Adjusted R
of the
Information
Prediction
Prediction
Bayesian
Square
Estimate
Criterion
Criterion
Criterion
Criterion
R Square .094
-.133
.94062
1.438
1.510
4.000
4.529
a. Predictors: (Constant), X3, X2, X1
ANOVAb Model 1
Sum of Squares Regression
df
Mean Square
1.100
3
.367
Residual
10.617
12
.885
Total
11.718
15
F
Sig. .415
.746a
a. Predictors: (Constant), X3, X2, X1 b. Dependent Variable: Y
Coefficientsa Standardized Unstandardized Coefficients Model 1
B (Constant)
Std. Error -2.284
6.316
X1
-.007
.040
X2
.030
.038
Coefficients Beta
t
Sig. -.362
.724
-.048
-.163
.873
.233
.796
.442
X3
.014
.028
.151
.512
a. Dependent Variable: Y
b. Adapun sebuah strategi seleksi maju kelompok untuk memiliki sebuah model dan implementasikan pada model dengan memusatkan (centering) umur, berat, tinggi, dan kuadratnya masing β masing sebagai peubah bebas, yaitu terdapat beberapa langkah berikut. 1. Memilih peubah pertama yang dimasukkan dalam model, yaitu peubah yang mempunyai korelasi tertinggi dengan peubah terikat. Sehingga kita memperoleh koefisien β koefisien korelasi berdasarkan SPSS, yaitu: Correlations: x1; x2; x3; Y; x1^2; x2^2; x3^2 x1 0,199 0,459
x2
x3
-0,228 0,396
0,226 0,399
Y
-0,036 0,896
0,257 0,336
0,214 0,426
x1^2
0,993 0,000
0,194 0,471
-0,246 0,359
0,010 0,970
x2^2
0,198 0,463
1,000 0,000
0,234 0,384
0,258 0,335
0,192 0,476
x3^2
-0,232 0,387
0,217 0,419
0,999 0,000
0,188 0,487
-0,249 0,351
x2
x3
Y
x1^2
x2^2
0,224 0,404
Cell Contents: Pearson correlation P-Value
Berdasarkan tabel di atas sehingga diperoleh nilai koefisien korelasi: rYX1 = --0.023, rYX2 = 0.257, rYX3 =0.214, rX12Y=0.010, rX22Y=0.258, rX32Y=0.188 Maka diperoleh persamaan regresinya Y = 0,95 + 0,000097 X22 dimana statistik F pada model ini signifikan. Maka dilanjutkan pada langkah 2. Berdasarkan hasil analisis spss berikut.
.618
Regression Analysis: Y versus x2^2 The regression equation is Y = 0,95 + 0,000097 x2^2 Predictor Constant x2^2
Coef 0,946 0,00009659
S = 0,883877
SE Coef 2,977 0,00009666
R-Sq = 6,7%
T 0,32 1,00
P 0,755 0,335
R-Sq(adj) = 0,0%
Analysis of Variance Source Regression Residual Error Total
DF 1 14 15
SS 0,7802 10,9373 11,7175
MS 0,7802 0,7812
F 1,00
P 0,335
2. Dalam menghitung statistik F parsial yang bersangkutan dengan masing β masing peubah berdasarkan persamaan regresi yang memuat peubah yang bersangkutan dan peubah pertama yang dipilih. Maka diperoleh nilai F parsial sebagai berikut : F(X2βX1) = 1.012 F (X3βX1) = 0.781 3. Memusatkan perhatian pada peubah yang memiliki nilai statistik F parsial terbesar. Untuk data di atas, peubah tinggi mempunyai nilai F parsial terbesar yaitu 1.012 4. Maka
selanjutnya
pada
akhir
langkah
didapatkan
dengan
menggunakan semua variabel bebas. Berikut hasil analisisnya melalui SPSS. Coefficientsa Unstandardized Coefficients Model 1
B (Constant) x2pangkat2
2
(Constant) x2pangkat2 x3
3
(Constant) x2pangkat2 x3 x3pangkat2
Std. Error .946
2.977
9.659E-5
.000
.240
3.267
8.235E-5
.000
.016
.026
-32.006
16.550
4.858E-5
.000
.903
.449
-.006
.003
Standardized Coefficients Beta
t
Sig. .318
.755
.999
.335
.073
.943
.220
.809
.433
.163
.599
.560
-1.934
.077
.519
.613
9.400
2.012
.067
-9.229
-1.980
.071
.258
.130
4
(Constant) x2pangkat2 x3
5
180.677
-.003
.006
-9.011
-.767
.459
-.584
.571
.972
.476
10.119
2.043
.066
x3pangkat2
-.006
.003
-9.878
-2.009
.070
x2
1.192
2.013
9.119
.592
.566
-137.764
188.888
-.729
.483
-.003
.006
-8.927
-.553
.592
.976
.498
10.159
1.961
.078
x3pangkat2
-.006
.003
-9.939
-1.932
.082
x2
1.183
2.105
9.054
.562
.586
x1
-.010
.037
-.071
-.258
.801
-51.734
162.176
-.319
.757
.000
.005
-.134
.897
x3
1.085
.419
11.296
2.592
.029
x3pangkat2
-.007
.003
-11.034
-2.552
.031
x2
.258
1.804
1.971
.143
.890
x1
-.620
.266
-4.525
-2.327
.045
.009
.004
4.502
2.307
.046
(Constant) x2pangkat2 x3
6
-138.514
(Constant) x2pangkat2
x1pangkat2 a. Dependent Variable: y
-1.850