Ekonometrika Data Panel
Ekonometrika • Econometrics: gabungan Economics dan Metrics atau economic measurement (mengukur variabel-variabel ekonomi) (Gujarati, 2004) • Beberapa definisi tentang Econometrics: – The quantitative analysis of actual economic phenomena based on the concurrent development of theory and observation, related by appropriate methods of inference (Samuelson, et al., 1954) – The social science in which the tools of economic theory, mathematics, and statistical inference are applied to the analysis of economic phenomena (Goldberger, 1964) – Concern with the empirical determination of economic laws (Theil, 1971)
• Istilah ekonometrika diperkenalkan tahun 1926 oleh Ragner Frisch (pakar ekonomi dan statistik Norwegia) 2
Penggolongan Ekonometrika 1. Ekonometrika Teoritik Terkait pengembangan metode-metode yang cocok untuk mengukur hubungan-hubungan ekonomi yang ditetapkan dalam model ekonometrika. 2. Ekonometrika Terapan Membahas penggunaan atau penerapan metodemetode ekonomi yang telah dikembangkan dalam ekonometrika teoritik. 3
Ekonometrika merupakan gabungan dari.... Teori Ekonomi
Matematika Ekonomi
Statistika Ekonomi
Menjelaskan fenomena ekonomi secara kuantitatif
Menyatakan teori ekonomi dalam bentuk matematik (hubungan antar variabel)
Proses pengumpulan data, pengolahan, dan penyajian data (grafik dan tabel)
Contoh: Jika P↓ maka D↑ (T. mikro) hubungan (-) P dan D Berapa perubahan D (?)
1. 2.
Linear equation (slope, etc) Differential (elasticity, utility, etc)
1. 2.
Deskriptif (S-D curves, market equilibrium, elasticity, etc) Inferensi (t-test, F-test, R2)
Econometrics Gabungan ketiganya untuk analisis: - Koefisien hubungan antar variabel - Interpretasi hasil secara ekonomi
Tools/alat: SPSS, E-Views, SAS, STATA, R, etc. 4
Tujuan Ekonometrika 1. Verifikasi Membuktikan atau menguji validitas teori-teori ekonomi. 2. Estimasi (penaksiran) Menghitung nilai estimasi koefisien hubungan antar variabel ekonomi. 3. Forecasting (peramalan) Meramal suatu variabel ekonomi tertentu di masa yang akan datang. 5
Metode Ekonometrika 1. Economic theory 2. Mathematical model of theory 3. Econometric model of theory 4. Data 5. Estimation of econometric model 6. Hypothesis testing 7. Forecasting or prediction 8. Using the model for control or policy purposes 6
Tahapan Analisis Ekonometrika Identifikasi dan perumusan masalah Kerangka Pemikiran
Spesifikasi Model
Pengumpulan Data
Estimasi Parameter
Teori ekonomi dan konsep2 terkait Kajian studi-studi terdahulu Pemilihan variabel terkait Hipotesis (tanda dan besaran) Data Primer Data Sekunder
Cross-Section Time Series Panel
OLS, MLE, ILS, 2SLS, etc BLUE Krit. Ekonomi (besaran & tanda)
Evaluasi/Validasi Model Aplikasi Model untuk Rumusan Kebijakan
Krit. Statistik (signifikansi, koef det) Krit. Ekonometrika (asumsi ) 7
Metodologi Ekonometrika Berdasarkan Jenis Data DATA
Cross Section
Time Series
Univariate
Correlation Regression Multivariate analysis
PANEL
Multivariate
Regression
Correlation
AR, MA
Regression
Pooled
ARMA
Granger Causality
Fixed Effect
ARIMA
VAR
Random Effect
ARCH, GARCH
ECM, VECM
8
PANEL DATA • Data panel merupakan observasi dari unit-unit yang sama (cross-section) selama beberapa kurun waktu tertentu (time series). • Secara sederhana, data panel merupakan gabungan dari data cross section dan time series • Data umumnya diperoleh melalui survey yang berulang atau dengan mengikuti perkembangan sample selama beberapa kurun waktu. • Nama lain data panel: Pooled Data, Longitudinal Data, Event History Analysis, ataupun Cohort Analysis. (Gujarati, 2003) 9
PANEL DATA (2) Beberapa keuntungan penggunaan data panel (Baltagi dalam Gujarati, 2003): • Dapat mengontrol unobserved heterogeneity • Memberikan data yang lebih informatif, lebih bervariasi, mengurangi kolinearitas antarpeubah, memperbesar derajat kebebasan, dan lebih efisien. • Dapat mempelajari bentuk perubahan individu yang dinamis. • Dapat mendeteksi dan mengukur efek suatu peubah pada peubah lainnya dengan lebih baik • Dapat digunakan untuk mempelajari model perilaku (behavioral model) yang lebih kompleks 10
PANEL DATA (3) Beberapa keterbatasan dalam data panel (Gujarati,2003): • Masalah dalam desain survey panel, pengumpulan dan manajemen data (masalah yang umum dihadapi di antaranya: cakupan (coverage), kemampuan daya ingat responden (recall), frekuensi dan waktu wawancara. • Kesalahan pengamatan (measurement errors) yang umumnya terjadi karena kegagalan respon (ex: pertanyaan yg tdk jelas, ketidaktepatan informasi, etc). • Masalah attrition (jumlah responden yang berkurang pada survey lanjutan).
11
Model Umum Regresi Data Panel • Di mana: i = 1, 2, …, N, menunjukkan rumah tangga, individu, perusahaan, dsb (dimensi data silang) t = 1, 2, …, T, menunjukkan dimensi deret waktu α = koefisien intersep yang merupakan skalar β = koefisien slope dengan dimensi Kx1, dimana K adalah banyaknya peubah bebas Yit = peubah tak bebas unit individu ke-i dan unit waktu ke-t Xit = peubah bebas untuk unit individu ke-i dan unit waktu ke-t
Komponen Error 1. One way error components model Error term hanya memasukkan komponen error yang merupakan efek dari individu (µi) Komponen errornya 2. Two way error components model Komponen error terdiri dari efek dari individu (µi) dan efek dari waktu (λt) Komponen errornya = unobservable individual-specific effect = disturbance
Pendekatan dalam Regresi Data Panel •
Estimasi regresi data panel tergantung asumsi intersep, slope dan sisaan uit
•
Terdapat beberapa kemungkinan (Gujarati,2003) : Intersep dan slope adalah konstan menurut waktu dan individu sedangkan sisaan berbeda antar waktu dan individu Slope tetap tetapi intersep berbeda antar individu Slope tetap tetapi intersep berbeda antar individu antar waktu Semua koefisien (slope dan intersep) berbeda antar individu Semua koefisien berbeda antar individu dan antar waktu
•
Berdasarkan variasi-variasi asumsi tsb, terdapat tiga pendekatan perhitungan model regresi data panel yaitu: 1. Pooled OLS Method (PLS) 2. Fixed Effect Model (FEM) 3. Random Effect Model (REM)
Pendekatan dalam Regresi Data Panel Pooled Ordinary Least Square (PLS) • Menggunakan metode estimasi OLS biasa. • Setiap unit individu memiliki intersep dan slope yang sama (tidak ada perbedaan pada dimensi kerat waktu). • Regresi panel data yang dihasilkan berlaku untuk setiap individu. Fixed Effect Model (FEM) • Intersep dibedakan antar individu. • Dalam membedakan intersepnya dapat digunakan peubah dummy,. • Metode ini dikenal dgn model Least Square Dummy Variable (LSDV). Random Effect Model (REM) • Intersep tidak dianggap konstan, namun dianggap sebagai peubah random dengan suatu nilai rata-rata • Metode random dikenal dgn sebutan Error Components Model (ECM)
Common Effect Model (CEM) •• Merupakan pendekatan data panel yang paling sederhana • Model ini mengasumsikan perilaku individu sama dalam berbagai kurun waktu. • Mengasumsikan tidak adanya heterogenitas dan asumsi adanya dampak yang sama berlaku untuk semua individu Model persamaan CEM:
i = 1,2, ..., N dan t = 1, 2, ..., T
Common Effect Model (CEM) • Kelemahan common effects model (CEM) adalah tidak dapat menganalisis perbedaan antar individu dan antar waktu sehingga terdapat kemungkinan estimator yang dihasilkan bersifat bias.
Fixed Effect Model (FEM) •• FEM mengasumsikan bahwa perbedaan antar individu dapat diakomodir melalui perbedaan intersept-nya. (Gujarati, 2003) • Model persamaannya sebagai berikut: α + i = 1,2, ..., N (α + t = 1, 2, ..., T α+ • Berdasarkan asumsi struktur matriks varians-kovarians errornya, terdapat 3 metode estimasi yang dapat digunakan pada FEM, yaitu: OLS, GLS, dan FGLS/SUR.
AA adalah slope hasil estimasi dengan teknik pooled OLS
Fixed Effect Model (FEM) dengan LSDV •• Idenya adalah dengan merepresentasikan perbedaan intersep, yaitu dengan dummy variable. α + i = 1,2, ..., N (α + t = 1, 2, ..., T α+
=+
Fixed Effect Model (FEM) Hati-hati dalam menggunakan LSDV, karena: 1. Penggunaan variabel dummy yang terlalu banyak akan meningkatkan dof, sehingga observasi akan kurang cukup untuk menghasilkan analisis statistik yang bermakna. 2. Semakin banyak variabel yang terdapat di dalam model, resiko kemungkinan terjadi multikolinearitas juga semakin meningkat. 3. LSDV model tidak dapat mengidentifikasi dampak dari variabel time invariant.
Fixed Effect Model (FEM) •Hati-hati dalam menggunakan LSDV, karena: 4. Perlu berhati-hati dalam error term (). Hal tersebut karena menunjukkan observasi secara cross section dan menunjukkan observasi secara time series, sehingga asumsi klasik untuk perlu dimodifikasi. Berikut beberapa kemungkinannya: – Varians dari error bersifat homoskedastis untuk semua unit cross section, atau heteroskedastis – Setiap individu tidak terjadi autokorelasi dari waktu ke waktu, atau terjadi autokorelasi – Error term berkorelasi antar individu, atau tidak berkorelasi
Random Effect Model (REM) •• Perbedaan karakteristik antar individu merupakan komponen error sehingga perbedaan intercept untuk masing-masing individu merupakan variabel random/stokastik. Persamaan REM dapat ditulis sebagai berikut (Gujarati, 2003): α + i = 1,2, ..., n α +) t = 1, 2, ..., T α+ • Pada REM, metode OLS tidak bisa digunakan untuk mendapatkan estimator yang efisien karena adanya korelasi antara dan . • Sehingga, metode yang digunakan untuk mengestimasi parameter REM adalah GLS.
Random Effect Model (REM) •
Asumsi yang harus dipenuhi: • • • • untuk semua , , dan • untuk atau • untuk
Contoh
Contoh •
Model: Di mana Real value of the firm Real capital stock Real gross investment
Contoh Dependent Variable: Y? Method: Pooled Least Squares Date: 10/24/14 Time: 09:06 Sample: 1935 1954 Included observations: 20 Cross-sections included: 4 Total pool (balanced) observations: 80
Model CEM Variable
Coefficient
Std. Error
t-Statistic
Prob.
C X1? X2?
-63.30414 0.110096 0.303393
29.61420 0.013730 0.049296
-2.137628 8.018809 6.154553
0.0357 0.0000 0.0000
0.756528 0.750204 142.3682 1560690. -508.6596 119.6292 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
290.9154 284.8528 12.79149 12.88081 12.82730 0.218717
Contoh •
Model dengan LSDV:
untuk GM, untuk lainnya untuk US, untuk lainnya untuk WEST, untuk lainnya
Contoh Dependent Variable: Y? Method: Pooled Least Squares Date: 10/28/14 Time: 11:56 Sample: 1935 1954 Included observations: 20 Cross-sections included: 4 Total pool (balanced) observations: 80 Variable
Coefficient
Std. Error
t-Statistic
Prob.
C X1? X2? Fixed Effects (Cross) _GE--C _GM--C _US--C _WE--C
-73.84947 0.107948 0.346162
37.52291 0.017509 0.026664
-1.968117 6.165319 12.98212
0.0528 0.0000 0.0000
-171.9429 -10.37070 167.6899 14.62366 Effects Specification
Cross-section fixed (dummy variables) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.934563 0.930141 75.28890 419462.9 -456.1032 211.3706 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
290.9154 284.8528 11.55258 11.73123 11.62421 0.807158
Contoh
Pemilihan Model Terbaik Common Effect Model Uji BP-LM
Fixed Effect Model Random Effect Model
Uji Chow Uji Hausman
(Baltagi, 2005)
Uji Chow (CEM vs FEM) (seluruh intersep tidak memiliki efek individu ) dimana (sekurang-kurangnya terdapat satu intersep yang memiliki efek individu )
Jika maka asumsi intersept sama tidak berlaku, sehingga FEM lebih baik dari CEM.
(Greene, 2005)
Uji Hausman (REM vs FEM) (tidak terdapat korelasi antara efek individu dengan variabel independen ) (terdapat korelasi antara efek individu dengan variabel independen ) REM mengasumsikan tidak ada korelasi antara variabel independen dan efek individu [ FEM mengasumsikan ada korelasi antara variabel independen dan efek individu [ Jika
, maka dapat disimpulkan FEM lebih baik dari REM
(Baltagi, 2005)
Uji BP-LM (CEM vs REM) atau (varians residual bersifat homoskedastis ) atau (varians residual bersifat heteroskedastis)
residual CEM Jika LM > maka model estimasi yang tepat adalah REM.
(Greene, 2003)
Pemeriksaan Struktur Varians-Kovarians Residual • Data panel yang merupakan data gabungan dari dimensi ruang dan waktu akan memiliki struktur residual yang lebih kompleks dibanding data cross section atau time series saja. • Perlu dilakukan uji untuk mendeteksi pelanggaran asumsi klasik pada data panel, khususnya asumsi homoskedastis dan non-cross sectional correlation. • Untuk menguji kedua asumsi tersebut dapat dilihat dari struktur varians-kovarians residual yang dihasilkan.
Berdasarkan asumsi struktur matriks varians-kovarians errornya, ada 3 •metode estimasi (Greene, 2003): Ordinary Lest Square (OLS) Error diasumsikan berdistribusi normal, tidak ada autokorelasi, dan homoskedastis. Generalized Least Square (GLS) Error diasumsikan tidak ada autokorelasi dan heteroskedastis. Feasible Generalized Least Square (FGLS)/Seemingly Unrelated Correlation (SUR) Error FGLS tidak memerlukan uji asumsi.
Penentuan Struktur Varians-Kovarians Residual Homoskedastis Uji LM Heteroskedastis Uji Ada cross-sectional correlation
(Greene, 2003)
Uji LM • Digunakan untuk melihat keheteroskedastisitas pada struktur varians-kovarians pada residual yang dihasilkan. )
= estimasi varians error individu ke-i kondisi homoskedastis = sum square error FEM • Jika , maka tolak Ho, artinya varians antarindividu tidak sama lanjut uji
Uji •
Digunakan untuk melihat terjadi cross-section correlation atau tidak pada struktur varians-kovarians residual.
untuk (cov (ui, uj) = 0 atau tidak terdapat korelasi antar individu) untuk (cov (ui, uj) ≠ 0 atau terdapat korelasi antar individu ) = korelasi error individu ke-i dengan individu ke-j dan i j Hipotesis nol ditolak jika .
Metode Estimasi: CEM Struktur Matriks Varians-kovarians Residual Metode Estimasi VarianceCross-sectional Covariance correlation Homocedastis Tidak ada Ordinary Least Square (OLS) Generalized Least Square (GLS)/ Weighted Heterocedastis Tidak ada Least Square (WLS)/ Cross Sectional Weight Feasible Generalized Least Square (FGLS)/ Heterocedastis Ada Seemingly Unrelated Regression (SUR) atau Maximum Likelihood Estimator (MLE) Ada Serial Feasible Generalized Least Square (FGLS) Heterocedastis Correlation dengan proses Autoregressive (AR)
Metode Estimasi: FEM Struktur Matriks Varians-kovarians Residual Metode Estimasi Cross-sectional Variance-Covariance correlation Homocedastis Tidak ada Ordinary Least Square (OLS)/LSDV Heterocedastis Tidak ada Weighted Least Square (WLS) Seemingly Unrelated Regression Heterocedastis Ada (SUR)
Metode Estimasi: REM Metode OLS tidak bisa digunakan untuk mendapatkan estimator yang efisien bagi model random effects. Metode yang tepat untuk mengestimasi model random effects adalah Genaralized Least Squares (GLS).
Flowchart
Flowchart (2)
Kestasioneran Data (Konstannya rata-rata dan varians observasi)
Data dikatakan stasioner bila: • Rataan series kontan untuk setiap periode amatan • Varians series kontan untuk setiap periode amatan • Data bersifat flat • Tidak mengandung komponen trend • Tidak terdapat fluktuasi periodik Akibat dari tidak stasionernya observasi • Adanya spurious regression (regresi palsu)
Nachrowi (2006): Adanya otokorelasi mengakibatkan data menjadi tidak stasioner • Tidak stasionernya data berarti mempunyai sifat autokorelasi • Bila data dapat distasionerkan maka otokorelasi akan hilang dengan sendirinya • Karena metode transformasi data untuk membuat data menjadi stasioner sama dengan transformasi data untuk menghilangkan autokorelasi
Transformasi data: Tidak stasioner > stasioner Yaitu dengan pembedaan (difference) • First difference • Second difference (dilakukan bila data yang diperoleh setelah dilakukan pembedaan pertama masih menunjukkan trend)
Uji Stasioneritas 1. Grafik: plot nilai observasi dan waktu (t) 2. Uji Formal – ASUMSI CROSS-SECTIONAL INDEPENDENCE • • • • •
Uji Levin, Lin dan Chu (LLC) Uji Im, Pesaran dan Shin (IPS) Uji Breitung Uji Kombinasi p-value (Combining P-value test) Residual Based LM Test
– ASUMSI CROSS-SECTIONAL DEPENDENCE
50
Uji LLC • Levin, Lin dan Chu (LLC) : uji UNIT ROOT bagi masingmasing individu (cross-section) mempunyai keterbatasan dalam hipotesis alternatif. Hal ini disebabkan secara persisten terjadi deviasi yang cukup besar terhadap keseimbangannya, terutama terjadi pada ukuran sample yang kecil. • Oleh karena itu, disarankan suatu uji UNIT ROOT bagi DATA PANEL yang lebih powerful daripada hanya uji pada masingmasing cross-sectionnya.
Uji LLC •
Uji LLC dinyatakan dalam persamaan berikut: pi
Dyit = ri yi ,t -1 + iL Dyi ,t - L + zit + uit L =1
zit - fixed / random effect
•
Karena ordo lag tidak diketahui, maka perlu dilakukan tiga tahap prosedur uji LLC: 1. Lakukan uji Augmented Dickey-Fuller (ADF) masing-masing secara terpisah 2. Lakukan estimasi long-run standard deviation 1 melalui persamaan s) = 1 �Dy + 2�w � Dy Dy � � T -1 T 1 � 3. Hitung uji statistik untuk panel dengan mengestimasi pooled regresi persamaan: % % e% it = rn i ,t + e it 2 yi
T
t =2
2 it
k
L =1
T
) KL
t = 2+ L
it
i .t - L
� � �
Uji LLC • Adjusted t-statistic: %%sˆ -%2sˆ ( rˆ ) m * % t NTS N e mT t r* = r * sˆ mT %
• Kelemahan uji LLC: 1. Uji ini sangat tergantung pada asumsi interdependensi antar individu dan juga tidak dapat diaplikasikan jika terjadi korelasi antar cross-section. 2. Adanya asumsi yang sangat restriktif dimana dinyatakan bahwa semua cross-section bisa mengandung atau tidak mengandung UNIT ROOT
Levin-Lin-Chu Test
• Adopsi dari uji ADF • Hipotesis: H0 : setiap TS memiliki unit root (non stasioner) H1 : setiap TS stasioner • N dan T besar • Homogeneous panel data
Dyit = ryi ,t -1 +
pi
iL Dyi,t - L + zit + uit
L =1
zit - fixed / random effect
54
Uji IPS • Uji LLC sangatlah terbatas dimana dalam uji ini diperlukan r yang homogen sepanjang cross-section (i). • Oleh karena itu, IPS mempertimbangkan koefisien yang heterogen dan mengusulkan alternatif prosedur pengujian berdasarkan rata-rata uji UNIT ROOT masing-masing individu dengan mengggunakan uji ADF. • Hipotesis nol menyatakan bahwa masing-masing series dalam panel mengandung UNIT ROOT (untuk setiap i) dan hipotesis alternatifnya bahwa beberapa (tetapi tidak semua) series individu yang mempunyai UNIT ROOT
Uji IPS • t statistic uji IPS merupakan rata-rata t-statistik uji ADF masing-masing cross-section, yakni
1 t = N
N
�tr i =1
i
t r i adalah t-statistik individual
Im-Pesaran-Shin Test
• Lebih baik dari uji LLC • Hipotesis: H0 : ri = 0; i H1 : ri 0 • Menggunakan rata-rata unit root test statistik individu • Heterogenous panel data pi
Dyit = ri yi ,t -1 + iL Dyi ,t - L + zit + uit L =1
zit - fixed / random effect
57