Analisis Regresi

  • October 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Analisis Regresi as PDF for free.

More details

  • Words: 3,688
  • Pages: 22
ANALISIS REGRESI Materi 1. Pendahuluan :Pengertian regresi: 1.1. Pengertian regresi, regresi linier sederhana dan regresi liner berganda serta bentuk-bentuk yang lain

1.2.Taksiran parameter regresi (Metode Least Square), pengujian parameter 1.3. Koefisien determinasi

1.4.Asumsi model 1.5. Langkah-langkah dalam pemodelan 1.6. Persoalan yang sering dihadapi dalam pemodelan regresi 2. Pengujian asumsi 3. Regresi Linier Sederhana 3.1. Cara pembuatan model regresi linier sederhana 3.2. Pengujian parameter regresi 3.3. Pengujian asumsi 4. Regresi Linier Berganda 4.1. Cara pembuatan model regresi linier sederhana 4.2. Pengujian parameter regresi 4.3. Pengujian asumsi 5. Pemilihan model terbaik 5.1. Best subset regression 5.2. Metode stepwise dan Backward

I.

PENDAHULUAN

PENGERTIAN REGRESI 1.1.Pengertian regresi, regresi linier sederhana dan regresi liner berganda serta bentuk-bentuk yang lain Digunakan untuk memodelkan hubungan antara variable respons (yang dipengaruhi) dan variable predictor (yang mempengaruhi) 1. REGRESI LINIER SEDERHANA

Y = β 0 + β1 X + ε

LINIER DALAM PARAMETER

2. REGRESI LINIER BERGANDA

Y = β 0 + β1 X 1 β1 + β 2 X 2 + β 3 X 3 + .........β k X k + ε

KETERANGAN: βi : parameter regresi ε : error Y : variabel respons X: variabel predictor 3. CONTOH REGRESI LINIER YANG LAIN:

Y = β 0 + β1 X 21 β1 + β 2 X 2 2 + β 3 X 2 3 + .........β k X 2 k + ε

Y = e β 0 + β1 X +ε (Dikatagorikan sebagai model regresi linier karena dapat dilinierkan melalui transformasi), Misalnya: Zi = Xi2 Y =

β 0 + β1Z1β1 + β 2 Z 2 + β 3 Z 3 + .........β k Z k + ε ln Y = β 0 + β1 X + ε

Y’ = ln Y

Y ' = β 0 + β1 X + ε

Tujuan utama: menemukan model yang paling sesuai βi???????

1.2.Taksiran parameter regresi (Metode Least Square), pengujian parameter Contoh data 1: Diduga ada hubungan linier antara variabel X dan variabel Y, dimana Y dapat dinyatakan sebagai fungsi dari X: Y = f(x) = β0 + β1 x + ε obs X Y

1 1.5 3

2 1.7 2.5

3 2 3.5

4 2.2 3

5 2.5 3.1

6 2.5 3.6

7 2.7 3.2

8 2.9 3.9

9 3 4

10 3.5 4

11 3.8 4.2

12 4.2 4.1

13 4.3 4.8

14 4.6 4.2

Y = f(x) = β0 + β1 x + ε Y

Berapa taksiran β0 dan β1

9 8 7 6 5

Y

4

b0 dan b1

3 2 1

CONTOH DATA

0 0

2

4

6

8

10

Untuk mendapatkan taksiran dari β0 dan β1, digunakan Metode maximum Likelihood Estimator (MLE) dimana metode ini secara prinsip adalah meminimumkan jumlah kuadrat kesalahan Σεi2 (εi= Y- (β0 + β1 xi). Pengujian parameter dilakukan untuk mengetahui apakah parameter tersebut secara significant berbeda dengan nol atau tidak , artinya apakah memang variabel prediktor X berpengaruh terhadap variabel respon Y dengan besaran β1. Hipotesis dalam pengujian ini adalah : H0: β1 = 0 H1: β1 ≠ 0 Jika H0 diterima artinya memang X tidak berpengaruh terhadap variabel respon Y secara linier.

1.3. Koefisien determinasi dan Asumsi Model Regresi Koefisien Determinasi Koefisien determinasi, disiimbolkan dengan R2 adalah sebuah besaran yang mengukur ketepatan garis regresi. Nilai R2 ini menunjukkan prosentase besarnya variabilitas dalam data yang dijelaskan oleh model regresi. Maksimum nilai R 2 adalah 100% dan mnimal 0. Jika nilai R2=100%, misalnya untuk regresi linier sederhana semua titik data akan menempel ke garis regresi, semakin kecil R2 maka data makin menyebar jauh dari garis. Oleh karena itu jika R2 kecil maka keeratan hubungan antara X dan Y lemah dan jika R2=0 menunjukkan bahwa X tidak memiliki hubungan dengan Y.

∑ (Y

i

(

2 − Y ) = ∑ Yˆi − Y

) + ∑ (Y − Yˆ ) 2

JUMLAH KUADRAT SEKITAR MEAN

JUMLAH KUADRAT KRN REGRESI JUMLAH KUADRAT TOTAL Y TERKOREKSI

i

2

i

JUMLAH KUADRAT SEKITAR REGRESI

Artinya diantara keragaman y disekitar nilai tengah (mean), sebagian keragaman itu

(

)2

berasal dari garis regresi dan sebagian lainnya, ∑ Yi − Yˆi menunjukkan bahwa amatan – amatan itu tidak seluruhnya terletak pada garis regresi. Untuk mengevaluasi baik tidaknya garis regresi sebagai peramal dapat dilihat dari berapa banyak variasi disekitar nilai mean terurai (dijelaskan) oleh variasi karena regresi dan variasi di sekitar regresi. Atau: R2 =

VARIASI KARENA REGRESI VARIASI DI SEKITAR MEAN(TOTAL)

Asumsi Model Regresi Asumsi model regresi dikaitkan dengan pengujian parameter model dimana pengujian dikatakan sahih jika asumsi model regresi dipenuhi. Asumsi tersebut menyangkut sifat dari distribusi residual (εi), yaitu: εi ~ IIDN (0, σ2) Artinya residual harus menyebar disekitar 0, memiliki varians konstan (identik) dan independen (tidak berkorelasi satu sama lain). Salah satu syarat untuk mencapai ini adalah pengamatan antar Yi tidak berkorelasi, misalnya tidak bersifat time series. Berkaitan dengan metode penaksiran (MLE), maka untuk regresi linier berganda dibutuhkan kondisi bahwa antar variabel X tidak saling berkorelasi (independent). 1.4.

Langkah-langkah dalam pemodelan Definisikan masalahnya pilih responnya Tentukan variabelvaribelnya

Kumpulkan data. Periksa mutu data tebaran. Coba modelnya

Apakah variabelvariabel itu penting dan tersedia

Konsultasikan pada pakar untuk mendapatkan kritik & komentar

Apakah parameter stabil dalam ruang sampelnya Apakah model sudah divalidasi ? Ti dak

S top

Ti dak

Apakah ada ketidakpastian model ?

Ya Ya

Buat distribusi variabel-variabel. Tentukan variabelvariabel baru yang dapat menjelaskan sisaan

Matriks korelasi regresi pertama

Tentukan tujuan 2 galat baku, R Taksir biayanya

Apakah tujuan dan biaya dapat diterima ? Ti dak S top

Ya

Peubah ditransformasi, bila perlu, dan tentukan persamaan regresinya

Apakah sasaran tercapai ? Tidak

Ya

Tidak

Apakah koefisienkoefisiennya wajar ? Apakah persamaannya masuk akal ? Apakah persamaan dapat digunakan ? Tidak

Pemeliharaan model

Ya

II.

PENGUJIAN ASUMSI

Asumsi residual:

 E(ε i ) = 0

, i= 1,2,3,…..n.

2  Varians ( ε i ) = σ  homoskedastisitas ( identik ).

 Tidak ada autokorelasi antar error; εi dan εj tidak berkorelasi, i ≠ j sehingga cov (εi, εj) = 0  Tidak ada kolinieritas ganda (multikolinieritas) antar variabel independen.



ε i ≈ N ( 0, σ 2 )

, artinya kesalahan error mengikuti distribusi normal dengan rata-rata nol dan varians σ2. Dalam bentuk gambar diilustrasikan sbb : (

N β0 + β1 X , σ 2

)

Y1 Y1

GRS YG SEBENARNYA

β0 ÷ β1 X

X1

X2

. ..........

Xn

X

2.1. Pengujian Asumsi Residual SECARA GRAFIK

1. Over All Plot

-5

0

5

Jika model benar  residual akan beristribusi normal dengan mean nol 2. Menyusun normal plot / half normal plot.

10



Jika jumlah data residual sangat banyak  over all plot dapat dibuat dengan cara membuat histogram

0

0

3. Plot εi melawan YˆI atau Xi Bentuk-bentuk yang mengkin terjadi: i



VARIASI TIDAK KONSTAN SEIRING DENGAN MEMBESARNYA Yi  WEIGHTED LEAST SQUARE.



ADA SUATU POLA TERTENTU, MIS : εi UNTUK Ŷi TERTENTU NEG, DIATAS NILAI Ŷi TSB CENDERUNG POS  MUNGKIN TERJADI KRN β0 DIHILANGKAN.

Yˆi

Yˆi

i

i

X 1i

MODEL TIDAK SESUAI  BUTUH PENYESUAIAN DENGAN MELAKUKAN TRANSFORMASI

X 2i

5. The Time Sequence Plot 10

× ×

5

0

× 5

× ×

-5

× × 10 × ×

15

20

TIME ORDER

Yˆi

×

X

j

Bentuk yang diinginkan i

RANDOM, MEMBENTUK CONFIDENCE BAND .

Yˆi

2.2. Melalui Pengujian 1. UJI KENORMALAN

e=

∑e n

i

=0

ei = the unit normal deviate from of the residual i S

ε ei = dapat digunakan untuk melihat apakah asumsi i ~ N (0 , 1) dipenuhi S σ 95 % dari distribusi N (0,1) berada pada limit (-1,96 , 1.96) ~ (-2,2) Jika (n–p) terlalu kecil, maka dapat digunakan pendekatan distribusi t n-p.

III. REGRESI LINIER SEDERHANA 3.1.

Cara pembuatan model regresi linier sederhana Postulate Model Y = f(x) = β0 + β1 x + ε Bermacam-macam bentuk model regresi linier

β0=0

β0 β1=0

β0 1. Taksiran β 0 , β 1  METODE LEAST SQUARE (meminimkan jumlah kuadrat error)  Model Taksiran :

bo dan b1 adalah taksiran dari β 0 , β 1

ˆ =b +b X Y o 1 Y

b0 = Y − b1 X

9 8 7

n

6 5

Y

4 3 2

b1 =

∑X Y

− nXY

∑X

− nX 2

i =1 n

i =1

1

i i 2 i

0 0

3.2.

2

4

6

8

10

Pengujian parameter Tujuan : Menguji pengaruh X terhadap Y  Gunakan Tabel Anova

Langkah-langkah menggunakan minitab : Contoh : Lihat data produksi (Lampiran 2)

Stat>Regressión>Regresión

Dialog Box items: Response: memilih kolom yang berisi variabel Y (respon) Predictors:memilih kolom yangberisi variabel X (prediktor)

Model Regresi yang terbentuk : The regression equation is PRODUKSI = ­ 7863 + 0.273 BAHAN BAKU Predictor       Coef       StDev          T        P Constant       ­7863        5828      ­1.35    0.192 BAHAN BA     0.27307     0.01376      19.84    0.000 S = 6143        R­Sq = 95.2%     R­Sq(adj) = 94.9% Analysis of Variance Source       DF          SS          MS         F        P Regression    1 14851467624 14851467624    393.55    0.000 Error        20   754744349    37737217 Total        21 15606211973 Unusual Observations Obs  BAHAN BA   PRODUKSI    Fit  StDev Fit   Residual    St Resid 17    513469   146650   132348       1909      14302       2.45R  R denotes an observation with a large standardized residual

3.3.

Pengujian Residual Sebelum dilakukan pengujian residual terlebih dahulu menyimpan residual dan nilai dugaan dalam kolom baru. Stat>Regression>Regression>Storage Dialog Box Items: Diagnostics Measures Residual : Pilih untuk menyimpan residual

Standard residual : Pilih untuk menyimpan residual yang sudah distandarisasi Deleted t residual: Pilih untuk menyimpan Residual Studendized Hi (leverages): Pilih untuk menyimpan leverages Cook’sdistances: Pilih untuk menyimpan cook’s distances DFITS : Pilih untuk menyimpan DFITS Karakteristik estimasi persamaan: Coeffficients : Pilih untuk menyimpan koefisien dari persamaan regresi Fits : Pilih untuk menyimpan nilai dugaan MSE : Pilih untuk menyimpan mean square error (Hal ini juga digambarkan dalam tabel analisis varians, dibawah MS) catatan bahwa akar kuadrat MSE sama dengan s yang juga diikutkan dalam output. X’X inverse: Pilih untuk menyimpan inverse dari X’X. Matrik ini bila dikalikan dengan MSE adalah matrik varians covarians dari koefisien. Jika anda melakukan weigthted regression (lihat options) kemudian pilihan ini disimpan dalam invers matriks X’WX. (lihat juga Stored Regressions Matrices) R matrix: Pilih untuk menyimpan matrik R dari QR atau Cholesky decomposition, lihat Stored Regressions Matrices

Stat>Regression>Regression>Residual Plot menampilkan plot residual untuk mengecek kesesuaian model.

Dialog Box Items: Residual for Plots: anda dapat menentukan tipe residual plot yang mau ditampilkan. Regular :Pilih plot biasa atau residual baris Standardized : Pilih plot untuk residual yang sudah distandarisasi Deleted : Pilih plot untuk rediual studendized yang dihapus Residual Plots Histogram of Residual: pilih untuk menampilkan residual dalam bentuk histogram Normal plot of residuals : pilih untuk menampilkan plot probabilitas normal untuk residual Residual versus fits: Pilih plot residual versus nilai dugaan (Y^) Residual versus order: Pilih plot residual versus urutqan data. Jumlah baris untuk setiap titik data ditunjukkan dengan sumbu X contohnya: 1, 2, 3,…,n Residual versus variabel: Pilih untuk plot residual versus variable yang dipilih, kemudian pilih kolom yang berisi variable ini. Minitab menmpilkan paragraph yang terpisah untuk setiap kolom yang anda enter didalam kotak dialog

Residual Model Diagnostics I Chart of Residuals

Normal Plot of Residuals

1

Residual

0

10000 0

X=0.000

-10000

-10000

-3.0SL=-13103

-2

-1

0

1

2

0

10

Normal Score

Observation Number

Histogram of Residuals

Residuals vs. Fits

8 7 6 5 4 3 2 1 0

20

10000

Residual

Frequency

Residual

3.0SL=13103

10000

0

-10000 -12000 -8000-4000 0 4000800012000 16000

Residual

60000

80000

100000 120000 140000

Fit

IV.

REGRESI LINIER BERGANDA

4.1. Struktur Data Contoh: Data tentang hasil produksi, bahan baku, tenaga kerja dan jenis mesin No 1 2 3 4 . . . 20 21 22

Y Produksi 74970 106430 83285 86810 . . . 131767 110120 88333

X1 X2 Bahan baku Tenaga kerja 308956 29 416141 35 325644 32 339427 29 . . . . . . 515209 39 472347 35 378199 29

X3 Mesin 11 12 12 11 . . . 12 12 11

Akan dibuat model regresi yang menghubungkan hasil produksi dengan bahan baku, tenaga kerja dan mesin. Y : Hasil produksi X1: Bahan baku X2: Tenaga kerja X3: Mesin 4.2. Cara Penaksiran Parameter Regresi dan Pengujian Model  Postulate Model :

Dalam bentuk Matriks Y = X β + ε Dimana:

Y=

Y1  Y   2 .    .  .    Yn 

X=

1 x11 ... xk 1    .  . . . . .    .  . . 1 x ... x  kn   1n

β=

β 0  β   1 .    .  .     β k 

ε 0  ε   1 .  ε =  .  .    ε k 

Taksiran parameter menggunakan metode Metode Least Square, diperoleh: Estimasi Parameter : b = ( X’ X) -1 X’Y Model estimasinya:

ˆ = Xb Y

Sebagai contoh model yang memuat 2 variabel prediktor dapat digambarkan sebagai berikut:

Model regresi yang menjelaskan hubungan antara kualitas dengan variable temperature dan tekanan. 2 2 yˆ = −5.127,9 + 31,10 x1 + 39,75 x 2 − −0,146 x1 x 2 − 0,133x1 − 1,14 x 2

Pengujian Model: Uji Serentak (Overall)  Hipotesa: Ho : β1 = β2 = … = βk = 0 H1 : minimal ada satu βi ≠ 0, dimana i = 1, 2, 3, …, k  Statistik Uji:

MS regr MS res

=

SS regr / k

SS res / n − (k + 1)

=

SS regr (b1 , b2 ,...bk | b0 ) s2

Fhitung =  Daerah Kritis: tolak Ho, jika Fhitung ≥ F k;n-(k+1);α

Tabel Anova Sumber

Derajat

Jumlah

Rata – rata

variasi

bebas

kuadrat

jumlah kuadrat

Regresi

k

b1 X1 Y − nY 2

(b1 X1 Y − nY 2 ) = MSregr k

n-(k+1)

Y1Y-b1X1Y

( Y1 Y − b 1 X1 Y ) = MSres ( n − k − 1)

n-1

Y 1Y − n Y 2

Residual Total terkoreksi

F hitung MSregr / MSres

Uji Indvidu Untuk menguji signifikansi dari pengaruh masing-masing variabel terhadap variabel y (respons)  Hipotesa : Ho : βi = 0 H1 : βi ≠ 0

, i = 1, 2, …, k , i = 1, 2, …, k

 Statistik Uji : bi thitung = sd (b ) i  Daerah Kritis : Tolak Ho, jika | thitung | > t 1-α/2,n-(k+1)

4.3. Pembuatan Model dengan Menggunakan Minitab Gunakan data produksi diatas 1. Klik Stat > Regression > Regression 2. Masukkan variabel Produksi (Y) ke kotak Response dan variabel Bahan Baku dan Tenaga Kerja (X1 dan X2) ke kotak Prediktors. Klik OK

Untuk mengontrol tampilan output pada window session Klik Stat>Regression>Regression>Results Dialog Box Items: Kontrol tampilan hasil Display nothing: Pilih untuk tidak menampilkan apa-apa Regression equation, table of coefficients, s, R-squared, and basic analysis of variance: Pilih untuk menampilkan beberapa output keluaran regresi In addition, sequential sums of square nand the unusual observation in the table of fits and residual: Pilih untuk menampilkan tambahan dari sebelumnya, sequential sum of squares (ditambahkan jumlahan kuadrat yang dijelaskan oleh setiap tambahan predictor) dan suatu tabel untuk nilai-nilai yang tidak umum In addition, the full table of fits and residuals: Pilih untuk menampilkan tambahan sebelumnya, suatu tabel nilai dugaan dan observasi redual

Output : The regression equation is PRODUKSI = ­ 19592 + 0.245 BAHAN BAKU + 715 TENAGA KERJA Predictor       Coef       StDev          T        P Constant      ­19592        9065      ­2.16    0.044 BAHAN BA     0.24461     0.02177      11.23    0.000 TENAGA K       715.1       434.9       1.64    0.117 S = 5897        R­Sq = 95.8%     R­Sq(adj) = 95.3% Analysis of Variance

Keterangan: Jika digunakan α=5%, maka tenaga kerja terlihat tidak signifikan dalam model. Mengapa???

Source       DF          SS          MS         F        P Regression    2 14945508709  7472754354    214.90    0.000 Error        19   660703264    34773856 Total        21 15606211973

Source       DF      Seq SS BAHAN BA      1 14851467624 TENAGA K      1    94041084 Unusual Observations Obs  BAHAN BA   PRODUKSI    Fit  StDev Fit   Residual    St Resid  17   513469     146650  133897     2061      12753       2.31R  R denotes an observation with a large standardized residual

Interpretasi:

 Dari ANOVA  Model regresi signifikan pada alpha 5%  Interpretasi model :  Bila bahan baku meningkat 1 (satuan), maka produksi akan meningkat 18,3%. Dengan syarat variabel lain konstan.  Bila tenaga kerja bertambah 1 orang, maka produksi akan meningkat sebesar 919. Dengan syarat variabel lain konstan.  Dan bila mesin bertambah 1 buah, maka produksi akan meningkat 5766 kali. PENGUJIAN RESIDUAL Residual Model Diagnostics Normal Plot of Residuals

I Chart of Residuals 20000

10000

3.0SL=14787

Residual

Residual

10000 0

0

X=-2.0E-11

-10000 -3.0SL=-14787

-10000

-20000 -2

-1

0

1

2

0

Normal Score

Histogram of Residuals

20

Residuals vs. Fits

5

10000

4

Residual

Frequency

10

Observation Number

3 2

Asumsi Residual dari model yang terbentuk terpenuhi, yaitu identik, independen, berdistribusi normal (IIDN)

0

1 0

-10000 -8000 -6000 -4000 -2000 0 2000 4 000 6000 8 000 10000

Residual

50000

100000

150000

Fit

Catatan:

Bila akan menambahkan variable baru: Prediction intervals for new observation : memasukkan nilai baru yang ingin diprediksi sebagai respon Confidence Level : Storage : pilih untuk menyimpan tambahan dari sebelumnya Fits : pilih untuk menyimpan fitted values untuk observasi yang baru SEs of fits : pilih untuk mengestimasi standard error dari nilai dugaannya Confidence limits : pilih untuk menampilkan batas keyakinan dengan batas atas dan batas bawah

Prediction limits : pilih untuk menampilkan nilai prediksi dengan batas atas dan batas bawah

V.

PEMILIHAN MODEL TERBAIK

Jika antar variabel prediktor saling berkorelasi satu sama lain, dikatakan terjadi kasus multicolinear. Hal ini kana mengakibatkan beberapa variabel prediktor tidak significant berada dalam model valaupun sesungguhnya variabel tersebut berhubungan sangat erat dengan variabel respon Y. Untuk mendapatkan model yang diinginkan terdapat dua pertimbangan dalam pembentukan model, diantaranya: • Agar persamaan regresi bermanfaat untuk tujuan prediksi, serigkali diinginkan model yang memuat sebanyak-banyaknya variabel X (prediktor) yang mempengaruhi variabel Y (respon) • Kareena pertimbangan biaya untuk mendapatkan informasi, maka digunakan sesedikit mungkin variabel X (prediktor) yang mempengaruhi variabel Y (respon) Untuk itu dibutuhkan metode untuk dapat mengakomodasikan dua kepentingan di atas dengan cara Selecting the best regression equation. Berikut ini adalah cara-cara yang sering digunakan dalam memilih model terbaik. 5.1. Best Subset Model Memilih semua subset (model) yang terbaik yang memenuhi kriteria diatas. Kriteria yang digunakan adalah: R2 terbesar MS residual terkecil Cp yang mendekati jumlah parameter Dengan menggunakan Minitab lakukan langkah berikut: Stat > Regression > Best Subsets Dalog box items Respons : Masukkan kolom yang memuat variabel respon Y Free predictors: masukkan yang memuat variabel –variabel prediktor X (maksimum 31 variabel) Predictors in all models: pilih kolom-kolom yang memuat variabel yang ingin dimasukkan dalam model. Kolom-kolom ini tidak boleh terdaftar dalam Free predictors. Jika anda menganalisis data dengan lebih dari 15 variabel prediktor, pertimbangkan termasuk variabel prediktor ini dalam rangka mengurangi jumlah free variables dan mempercepat proses perhitungan.

Best Subsets Regression Response is Y               R­Sq                    X X X X X  Vars   R­Sq   (adj)   C­p         S   1 2 3 4 5     1   92.3   92.0   25.4    27.314         X       1   88.5   88.1   50.3    33.288   X             2   95.4   95.0    6.9    21.580   X     X       2   92.6   92.1   25.1    27.188     X   X       3   96.4   96.0    2.0    19.378   X     X X     3   95.7   95.2    6.8    21.222   X X   X       4   96.4   95.8    4.0    19.758   X   X X X     4   96.4   95.8    4.0    19.762   X X   X X     5   96.4   95.6    6.0    20.165   X X X X X 

5.2. Stepwise and Eliminasi Backward Regression Stepwise Regression Model dibuat dengan memasukkan variabel prediktor satu persatu (secara bertahap) mulai dari variabel X yang memiliki korelasi tinggi Langkah-langkahnya: 1. Cari variabel X yang berkorelasi paling tinggi dengan Y, kemudian buat regresinya 2. Pemilihan variabel berikutnya adalah variabel yag memiliki korelasi parsial terbesar dengan Y dan buat model dengan memasukkan variabel tersebut. 3. Uji parameter yang telah ada di dalam model 4. Begitu seterusnya ulangi langkah 2-3 sampai diperoleh model terbaik Eliminasi Backward Membuat model dengan memasukkan semua variabel kemudian dikeluarkan satu persatu dengan melakukan pengujian terhadap parameter –parameternya dengan menggunakan partial F test. Nilai partial F-test (FL) terkecil dibandingkan dengan F0 table:

• •

Jika FL < F0, maka X yang bersangkutan dikeluarkan dari model dan dilanjutkan dengan pembuatan model baru tanpa variable tersebut Jika FL > F0, maka proses dihentikan dan persamaan terakhir tersebut yang digunakan/dipilih.

Dengan menggunakan Minitab lakukan langkah berikut: Stat > Regression > Stepwise>Methods Dalog box items Stepwise (forward and backward): pilih standard stepwise regression Predictor in initial model: masukkan variabelprediktor. Variabel ini akan dikeluarkan jika p-value lebih besar dari alpha to enter value (Jika ingin mempertahankan variabel tertentu dalam model abaikan nilai p-value dan enter variabel tersebut dalam Predictor to include in every model dalam box utama) Alpha to enter : tetapkan nilai α untuk memasukkan variable dalam model Alpha to remove: tetapkan nilai α untuk mengeluarkan variable dalam model Forward selection: pilih Forward selection Alpha to enter : tetapkan nilai α untuk memasukkan variable dalam model Backward elimination Alpha to remove: tetapkan nilai α untuk mengeluarkan variable dalam model Force: masukkan variabel prediktor yang tidak ingin dikeluarkan dari model. Contoh: Klik Stat > Regression > Stepwise Masukkan variabel X dan Y. Klik OK Gunakan data di Lampiran 2 Y = berat limbah blontong (kuintal) X1 = berat kapur tohor (kuintal) X2 = berat sulfur (kg) X3 = berat flokulan (kg) X4 = berat tebu (kuintal) X5 = berat fosfat (kg)

Variabel X1-X5 dipilih untuk dimasukkan dalam model

Stepwise Regression  F­to­Enter:      4.00    F­to­Remove:      4.00  Response is    Y     on  5 predictors, with N =   30     Step        1        2        3 Constant    74.68    74.56    74.72 X1          0.076    0.076    0.076 T­Value      4.80     4.95     5.25 X2         ­0.001                   T­Value     ­0.01                   X3            0.3      0.3          T­Value      0.10     0.10          X4         0.0209   0.0209   0.0209 T­Value      6.35     7.01     7.17 X5           ­4.7     ­4.7     ­4.7 T­Value     ­2.19    ­2.68    ­2.74 S            20.2     19.8     19.4 R­Sq        96.40    96.40    96.39

Jumlah variable yang signifikan dalam model hanya 3 variabel yaitu X1, X4 dan X5.Model yang terbentuk: Y=74,72 + 0,076 X1+0,0209 X4-4,7 X5 R2=96,39

Variabel X1-X5 ingin dimasukkan dalam model.

Stepwise Regression  F­to­Enter:      4.00    F­to­Remove:      4.00  Response is    Y     on  5 predictors, with N =   30     Step        1 Constant    74.68 X1          0.076 T­Value      4.80 X2         ­0.001 T­Value     ­0.01 X3            0.3 T­Value      0.10 X4         0.0209 T­Value      6.35 X5           ­4.7 T­Value     ­2.19 S            20.2

R­Sq        96.40

Related Documents