PERAMALAN BISNIS DENGAN METODE BOX-JENKINS (ARIMA)1 Oleh: Dwi Putra Darmawan2 Peramalan bisnis dengan metode Box-Jenkins, yang sering disebut dengan model ARIMA (Autoregressive Integrated Moving Average) dikembangkan oleh George Box & Gwilym Jenkins. Model ARIMA sebenarnya merupakan curve fitting, yakni sebuah metode untuk mencari pola yang paling cocok untuk data time series. Dengan demikian, model ARIMA ini menggunakan data masa lalu dan masa sekarang untuk membuat peramalan jangka pendek (short terms) secara akurat. Hal seperti ini dikatakan sebagai: “let the data speak by themselves”. Secara teoritis, metode Box-Jenkins ini merupakan metode yang sangat canggih untuk melakukan peramalan jangka pendek. Hasil peramalan akurat yang dihasilkan metode ini akan membantu manajer dalam membuat perencanaan strategis. Model ARIMA tidak mensyaratkan suatu pola data tertentu agar model dapat bekerja dengan baik. Artinya, model ini dapat dipakai untuk semua tipe pola data karena metode Box-Jenkins ini menggunakan asumsi bahwa data input adalah data stasioner (bukan data asli). Bila data tidak stasioner, perlu ditransformasi terlebih dahulu dengan metode pembedaan (differencing), yakni dengan cara mengurangkan data suatu periode tertentu dengan data periode sebelumnya. Pada umumnya, sebuah data bisnis akan menjadi stasioner setelah dilakukan proses pembedaan pertama (difference =1). Model ini akan bekerja lebih baik jika data time series yang digunakan bersifat dependen. Tatacara pemilihan metode peramalan kuantitatif yang tepat, termasuk model ARIMA disajikan pada Lampiran 1. Faktor-faktor yang dipertimbangkan dalam tabel itu adalah pola data (stasioner, trend, musim, dam siklus), horizon waktu (jangka pendek, menengah dan panjang), tipe model (time series dan causal), serta kebutuhan minimum data (jumlah variabel dan panjang musim) (Lampiran 1). Secara umum, model ini dirumuskan sebagai ARIMA (p,d,q). dalam hal ini, p = derajat autoregressive (AR), d = derajat difference, dan q = derajat moving average (MA). Model AR adalah model yang menggambarkan bahwa variabel dependen dipengaruhi oleh variabel dependen pada periode-periode sebelumnya (time lag dari variabel dependen sebagai variabel independen), sedangkan pada model MA, yang merupakan variabel independen adalah nilai residu (error) pada periode sebelumnya. Model AR dan model MA dapat dikombinasikan untuk menghasilkan model ARIMA. Bentuk umum model ARIMA adalah sebagai berikut: Yt = Ф0 + Ф1Yt-1 + Ф2Yt-2 + … + ФpYt-p - ω1εt-1 - ω2εt-2 -…- ω1εt-1 +ut. Model ARIMA dianggap memadai untuk model peramalan jika koefisien autocorrelations dari residu berbagai time lag tidak signifikan (sign.>5%). Langkah-langkah metode Box-Jenkins digambarkan seperti skema berikut. Data stasioner? 1
2
Paper disampaikan dan didiskusikan pada “Pelatihan Structural Equation Modeling (SEM dengan Program Amos), Workshop & Seminar Statistik Multivariat”, diselenggarakan oleh Universitas Muhammadiyah Malang (UMM), di Malang, Jawa Timur, tanggal 1-30 September 2005. Ketua Program Studi Agribisnis, Fakultas Pertanian, Universitas Udayana, Denpasar, Bali.
1
Identifikasi model sementara Estimasi parameter Uji diagnosis Tidak
Model memadai? Ya Model untuk peramalan
Langkah-langkah analisis metode Box-Jenkins (model ARIMA) dengan SPSS 13 sebagai berikut. 1. Buka file Arima.sav yang telah disiapkan sebelumnya dan lakukan transformasi data agar menjadi stasioner dengan cara berikut: pilih menu Graphs, Time series dan Autocorrelations, pada kotak dialog Transform, aktifkan Difference dan ketik angka 1, pada kotak dialog Display, aktifkan Autocorrelations dan Partial Autocorrelation. Kotak dialog Autocorrelations akan tampak sebagai berikut. Kemudian klik OK.
2. Perhatikan signifikansi pada statistik Box-Ljung, ACF (Autocorrelations Function) dan Partial ACF, jika sebagian besar nilai sign.>5% (menunjukkan tidak signifikan), maka data sudah stasioner, sehingga dapat digunakan sebagai input analisis model ARIMA. 3. Pada menu utama, pilih Analyze, Time Series, dan ARIMA, maka akan muncul kotak dialog ARIMA. Masukkan variabel client ke dalam kotak Dependent, lalu pada Model, aktifkan Include constant in model, dan isi kotak p, d, q masing-masing dengan angka 1, sehingga tampak seperti pada kotak dialog berikut.
2
4. Klik Save, untuk memunculkan kotak dialog ARIMA:Save. Aktifkan Add to file pada Create Variables agar variabel-variabel baru yang dihasilkan metodel ini (seperti variabel prediksi FIT_1 dan ERR_1) langsung ditambahkan pada file data. Aktifkan pula Predict through dan isi kotak Observation dengan 108 untuk memperoleh nilai prediksi selama 12 bulan (dari 96 data client). Confidence intervals yang digunakan adalah 95%. Klik Continue, OK. Parameter Estimate model ARIMA (1,1,1) ditampilkan pada Output1-SPSS Viewer (Lampiran 2).
5. Tahapan terakhir adalah uji kesesuaian model (model fit), dengan memilih Graphs pada menu utama, kemudian memilih Time Series dan Autocorrelations. Pada kotak dialog Autocorrelations, aktifkan Autocorrelations, tetapi non aktifkan Partial autocorrelations pada Display serta non aktifkan Difference pada Transform, lalu masukkan Error for client from ARIMA (ERR_1) ke dalam kotak Variables dan tekan OK. Model dikatakan sesuai jika statistik Box-Ljung menunjukkan tidak signifikan (sign.>5%) dan divisualisasinya ditunjukkan oleh ACF dari ERR_1.
3
4
Lampiran 1. Faktor-faktor yang Menjadi Pertimbangan dalam Memilih Metode Peramalan Kuantitatif Metode
Pola Data
Horizon Waktu
Tipe Model
Box-Jenkins Naif Rerata Sederhana Rerata Bergerak Pemulusan Eksponensial Pemulusan Eksponensial Linier Pemulusan Eksponensial Kuadratik Pemulusan Eksponensial Musiman Adaptive Filtering Regresi Sederhana Regresi Berganda Dekomposisi Klasik Model Trend Eksponensial S-Curve Fitting Gompertz Model Growth Curve Census II Leading Indicators Model Ekonometrika Regresi Berganda Time Series
ST,T,S,C ST,T,S ST ST ST T
S S S S S S
TS TS TS TS TS TS
T
S
TS
S
S
TS
S T C,S S,T T
S I I S I,L
TS C C TS TS
T T T S,T C C S,T
I,L I,L I,L S S S I,L
TS TS TS TS C C C
Kebutuhan Minimal Data Non Musiman Musiman 24 3*L 1 30 4-20 2 3 4 2*L 5*L 10 10*V 5*L 10 10 10 10 6*L 24 30 6*L
Sumber: Henke & Reitsch (1998)3 Keterangan: a. Pola data : ST=stasioner, T=Trend, S=musiman, C=siklus b. Horizon waktu: S=jangka pendek, I=jangka menengah, L=jangka panjang c. Tipe model: TS=time series, C=causal d. Kebutuhan minimal data: L=panjang musim, V=jumlah Variabel
3
Hanke, J.E. & A.G.Reitsch, Business Forecasting (7th Edition), Prentice Hall, New Jersey, 1998.
5
Lampiran 2. Hasil Olahan Model ARIMA dengan SPSS 13 Autocorrelations Series: client Box-Ljung Statistic Autocorrelat ion -.423
Std.Error(a) .101
Value 17.501
2
.037
.100
3
-.020
4
-.001
5
Lag 1
1
Sig.(b) .000
17.635
2
.000
.100
17.677
3
.001
.099
17.677
4
.001
.026
.099
17.744
5
.003
6
-.073
.098
18.289
6
.006
7
.028
.098
18.369
7
.010
8
.021
.097
18.417
8
.018
9
-.075
.097
19.027
9
.025
10
-.005
.096
19.030
10
.040
11
-.041
.095
19.210
11
.057
12
.176
.095
22.652
12
.031
13
-.122
.094
24.329
13
.028
14
.094
.094
25.330
14
.031
15
-.127
.093
27.202
15
.027
-.019
.093
27.242
16
.039
16
df
a The underlying process assumed is independence (white noise). b Based on the asymptotic chi-square approximation. Parameter Estimates
Non-Seasonal Lags
AR1
Estimates .276
Std Error .110
MA1
.996 .559
Constant
t 2.503
Approx Sig .014
.270
3.688
.000
.121
4.630
.000
Melard's algorithm was used for estimation. Correlation Matrix Non-Seasonal Lags Non-Seasonal Lags
AR1
AR1 1.000
MA1 .260
Constant 0(a)
MA1
.260
1.000
0(a)
0(a)
0(a)
1.000
Constant
Melard's algorithm was used for estimation. a The ARMA parameter estimate and the regression parameter estimate are asymptotically uncorrelated. Covariance Matrix Non-Seasonal Lags Non-Seasonal Lags Constant
AR1
AR1 .012
MA1 .008
Constant 0(a)
MA1
.008
.073
0(a)
0(a)
0(a)
.015
Melard's algorithm was used for estimation.
6
a The ARMA parameter estimate and the regression parameter estimate are asymptotically uncorrelated. Autocorrelations Series: Error for client from ARIMA, MOD_11 CON Box-Ljung Statistic Autocorrelat ion .045
Std.Error(a) .101
Value .202
2
.197
.100
3
.119
4
.092
5 6 7
Lag 1
df 1
Sig.(b) .653
4.036
2
.133
.100
5.458
3
.141
.099
6.318
4
.177
.071
.099
6.836
5
.233
-.011
.098
6.849
6
.335
.037
.098
6.996
7
.429
8
.021
.097
7.045
8
.532
9
-.052
.097
7.335
9
.602
10
-.002
.096
7.335
10
.693
11
.000
.095
7.335
11
.771
12
.135
.095
9.369
12
.671
13
-.072
.094
9.952
13
.698
14
.020
.094
9.999
14
.762
15
-.127
.093
11.868
15
.689
16
-.050
.093
12.161
16
.733
a The underlying process assumed is independence (white noise). b Based on the asymptotic chi-square approximation.
7