BAB I
RUANG LINGKUP EKONOMETRIKA
Tujuan Pengajaran: Setelah mempelajari bab ini, anda diharapkan dapat: Mengerti definisi ekonometrika Mengerti keilmuan yang terkait dengan ekonometrika Membedakan jenis-jenis ekonometrika Memahami kegunaan ekonometrika Menjabarkan langkah-langkah penggunaan ekonometrika
1
BAB I RUANG LINGKUP EKONOMETRIKA Pengertian Ekonometrika Kalau dilihat dari segi namanya, ekonometrika berasal dari dari dua kata, yaitu “ekonomi” dan “metrika”. Kata “Ekonomi” di sini dapat dipersamakan dengan kegiatan ekonomi, yaitu kegiatan manusia untuk mencukupi kebutuhannya melalui usaha pengorbanan sumber daya yang seefisien dan seefektif mungkin untuk mendapatkan tujuan yang seoptimal mungkin. Kata “Metrika” mempunyai arti sebagai suatu kegiatan pengukuran. Karena dua kata ini bergabung menjadi satu, maka gabungan kedua kata tersebut menunjukkan arti bahwa yang dimaksud dengan ekonometrika adalah suatu pengukuran kegiatan-kegiatan ekonomi. Kegiatan ekonomi manusia tidak berjalan sesaat, tetapi berkelanjutan dari waktu ke waktu, dari peristiwa ke peristiwa, dari berbagai suasana, dari berbagai lintas sektor, lintas faktor. Untuk mengukur suatu kegiatan dalam keberagaman kondisi seperti itu, maka data merupakan sesuatu yang mutlak diperlukan. Melalui data, informasi itu dapat dianalisis, diinterpretasi, untuk mengungkap kejadian-kejadian di masa lampau, serta dapat digunakan untuk prediksi masa mendatang. Pengungkapan data atau analisis data dalam kegiatan ekonomi, dapat dilakukan dengan berbagai cara atau model, di antaranya melalui penggunaan grafik yang biasa disebut dengan metode grafis, atau melalui penghitungan secara matematis yang biasa disebut dengan metode matematis. Penggunaan metode ini tentu harus sesuai 2
dengan teori, khususnya teori ekonomi, karena ekonometrika bertujuan untuk mengukur kegiatan ekonomi. Kedua metode tersebut mempunyai kelebihan dan keunggulan masing-masing. Metode grafis sendiri dapat digolongkan ke dalam bentuk grafik berupa kurva, atau grafik dalam bentuk diagram. Metode grafis mempunyai keunggulan dalam kecepatan interpretasi informasi, karena grafik terrepresentasi dalam bentuk gambar yang mudah untuk dimaknai. Kelemahan metode grafis terletak pada kekurangakuratan interpretasi karena data umumnya ditampilkan dalam bentuk skala, yang bersifat garis besar, tentu kurang dapat menjelaskan secara rinci dan detil. Metode matematis mempunyai keunggulan dalam keakuratan interpretasi, karena melalui hitungan-hitungan secara rinci, sedang kelemahannya terletak pada tingkat kesulitan untuk menghitungnya, terlebih lagi jika variabel-variabel yang dihitung berjumlah sangat banyak. Guna mempermudah penghitungannya, maka dibuatlah berbagai rumus-rumus hitungan yang diambil dari berbagi data. Perbedaan di antara kedua metode tersebut, metode grafis dan matematis, terletak pada seberapa besar variabel dapat diungkap secara rinci. Perbedaan Metode Grafis dan Matematis Perihal Interpretasi Output Keakuratan
Grafis Relatif Lebih mudah diinterpretasi Berupa grafik, seperti kurva atau diagram Cenderung kurang akurat, karena berdasar data yang bersifat skala
3
Matematis Relatif lebih sulit diinterpretasi Hitungan matematis berupa rumus Dapat lebih akurat, karena dihitung secara rinci sesuai dengan keadaannya
Uraian di atas menjelaskan kepada kita bahwa dalam ekonometrika diperlukan tiga hal pokok yang mutlak ada, yaitu: teori ekonomi, data, dan model. Teori ekonomi meliputi teori ekonomi mikro, makro, manajemen, pemasaran, operasional, akuntansi, keuangan, dan lainlain. Guna memahami data, memerlukan disiplin ilmu tentang data, yaitu statistika. Model sendiri memerlukan disiplin ilmu matematika. Oleh karena itu, ekonometrika merupakan gabungan dari ilmu ekonomi, statistika, dan matematika, yang digunakan secara simultan untuk mengungkap dan mengukur kejadian-kejadian atau kegiatan-kegiatan ekonomi. Beberapa pakar mendefinisikan ekonometrika sebagai berikut: Ekonometrika dapat didefinisikan sebagai ilmu sosial yang menggunakan alat berupa teori ekonomi, matematika, dan statistika inferensi yang digunakan untuk menganalisis kejadian-kejadian ekonomi (Arthur S. Goldberger, 1964.p.1). 1 Ekonometrik adalah gabungan penggunaan matematik dan statistik untuk memecahkan persoalan ekonomi (J. Supranto, 1983. p.6). 2 Ekonometri adalah suatu ilmu yang mengkombinasikan teori ekonomi dengan statistik ekonomi, dengan tujuan menyelidiki dukungan empiris dari hukum skematik yang dibangun oleh teori ekonomi. Dengan memanfaatkan ilmu ekonomi, matematik, dan statistik, ekonometri membuat 1
Diterjemahkan dari buku KARYA Damodar Gujarati, Essential of Econometrics, second edition, Irwin McGraw Hill, 1999. 2 Supranto, J., Ekonometrik, Buku satu, Lembaga Penerbit FE UI, 1983.
4
hukum-hukum ekonomi teoritis tertentu menjadi nyata (Sugiyanto, Catur, 1994, p.3). 3 Pentingnya Ekonometri Suatu perusahaan ataupun unit-unit pengambil keputusan, terutama dalam kegiatan ekonomi, tentu memerlukan suatu tindakan evaluatif untuk memastikan keefektifan tindakannya atau bahkan mempunyai keinginan untuk melakukan prediksi guna menentukan langkah terbaik yang perlu diambil. Keinginan evaluasi ataupun prediksi seperti itu akan mudah diperoleh jika tindakan-tindakan sebelumnya itu diukur melalui teknikteknik pengukuran yang terstruktur dengan baik, baik melalui teori yang melandasi, metodologi yang digunakan, ataupun data pendukungnya. Suatu bentuk keilmuan yang mengakomodasi bentuk pengukuran kegiatan ekonomi itulah yang disebut sebagai ekonometri. Data dalam ekonometrika merupakan suatu kemutlakan, begitu pula penentuan jenis data, teknik analisanya, ataupun penyesuaian dengan tujuannya. Data yang diperlakukan sebagai pengungkap sejarah (historical data) akan menghasilkan evaluasi, dan untuk data yang diperlakukan pengungkap kecenderungan (trend data) akan menghasilkan prediksi. Hasil evaluasi ataupun prediksi yang mempunyai tingkat keakuratan tinggi saja yang akan mempunyai sumbangan terbesar bagi pengambilan keputusan. Di sinilah letak pentingnya ekonometrika. Sebagai contoh dalam mengungkap pentingnya ekonometrika, mari kita mencermati apa yang terjadi pada hukum permintaan dan penawaran. Hukum permintaan menjelaskan bahwa bila harga suatu barang cenderung 3
Sugiyanto, Catur, Ekonometrika Terapan, Edisi 1, BPFE Yogjakarta, 1994.
5
mengalami penurunan, maka jumlah permintaan terhadap barang tersebut akan mengalami peningkatan. Begitu pula dalam hukum penawaran, semakin sedikit barang yang ditawarkan, maka harga barang akan cenderung tinggi, tetapi ketika jumlah barang yang ditawarkan semakin banyak, maka harga barang akan semakin turun. Pernyataan-pernyataan seperti itu merupakan bentuk penyederhanaan yang hanya membahas keterkaitan antara dua variabel, yaitu variabel harga (P) dan variabel jumlah barang (Q) saja. Hukum permintaan menunjukkan bahwa hubungan antara variabel P dan Q berlawanan. Di sebut berlawanan karena jika P turun, maka Q yang diminta (D) akan bertambah, begitu pula sebaliknya. Oleh karena itu permintaan ditunjukkan oleh kurva atau garis yang cenderung menurun dari kiri atas ke kanan bawah (downward sloping). Lihat gambar 1.
P
P1
P2
D Q1
Q2 Gambar 1
6
Q
Kondisi seperti ini berbeda bila di hadapkan dengan hukum penawaran. Pada hukum penawaran hubungan antara variabel P dan Q adalah searah, artinya jika P meningkat, maka Q juga meningkat. Atau sebaliknya, jika P menurun, maka Q juga mengalami penurunan. Oleh karena itu penawaran ditunjukkan oleh garis atau kurva yang cenderung meningkat dari kiri bawah ke kanan atas (upward sloping). Lihat gambar 2.
P S P2
P1
Q1
Q2
Q
Gambar 2
Tidak hanya terhenti pada dua teori di atas saja, banyak teori-teori ekonomi lain yang hipotesisnya hanya bersifat kualitatif seperti hukum permintaan dan penawaran di atas. Pengungkapan yang sangat kualitatif seperti contoh tersebut, tidak dapat diketahui seberapa besar pengaruh antara variabel P terhadap Q, atau Q terhadap P. Karena tidak dapat menjelaskan secara angkaangka tentu saja bentuk kurva atau garis yang ditunjukkan juga tidak dapat menggambarkan kondisi dengan sangat
7
tepat. Kurva hanya dapat menggambarkan kecenderungan. Untuk menjawab persoalan itu, ekonometrika dengan menggunakan pendekatan kuantitatif dalam bentuk model pendekatan matematis yang berupa hitungan-hitungan metematika akan mampu untuk menunjukkan seberapa besar pengaruh suatu variabel tertenu terhadap variabel yang lain. Untuk menjawab tuntutan seperti itu, maka teori ekonomi yang sudah ada perlu dilengkapi dengan berbagai data yang diperlukan. Dalam hal ini perannya ditunjukkan oleh statistika. Fungsi dari statistika tidak hanya sekedar pengumpulan data saja, tetapi meluas hingga interpretasi terhadap pentingnya data tersebut, cara perolehan, jenis data, hingga sifat data. Peran statistik akan semakin berarti jika dianalisis dengan model matematis yang sesuai dengan teori-teori ekonomi yang dianalisis. Jenis Ekonometrika Ekonometrika dapat dibagi menjadi 2 (dua) macam, yaitu ekonometrika teoritis (theoretical econometrics) dan ekonometrika terapan (applied econometrics). Ekonometrik teoritis berkenaan dengan pengembangan metode yang tepat/cocok untuk mengukur hubungan ekonomi dengan menggunakan model ekonometrik. Ekonometrika terapan menggambarkan nilai praktis dari penelitian ekonomi, sehingga lingkupnya mencakup aplikasi teknik-teknik ekonometri yang telah lebih dulu dikembangkan dalam ekonometri teoritis pada berbagai bidang teori ekonomi, untuk digunakan sebagai alat pengujian ataupun pengujian teori maupun peramalan. Meskipun ekonometrika dapat didikotomikan ke dalam ekonometrika teoritis maupun terapan, namun tujuan-tujuan ekonometrika dapat dipersatukan sebagai 8
alat verifikasi, penaksiran, ataupun peramalan. Fungsi verifikasi ini bertujuan untuk mengetahui dengan pasti kekuatan suatu teori melalui pengujian secara empiris, karena teori yang mapan adalah teori yang dapat diuji dengan empiris. Ekonometrika berkaitan dengan analisa kuantitatif yang menghasilkan taksiran-taksiran numerik yang dapat digunakan untuk melakukan taksiran-taksiran dari hasil suatu kegiatan ekonomi. Fungsi seperti itu disebut sebagai fungsi penaksiran. Taksiran-taksiran numerik seperti dijelaskan di atas dapat pula digunakan untuk mengindera kejadian masa yang akan datang dengan pengukuran derajat probabilitas tertentu. Fungsi seperti ini lebih dikenal dengan forecasting (peramalan). Penggunaan ekonometrika Dalil-dalil ekonomi umumnya dijelaskan secara kualitatif dan dibatasi oleh asumsi-asumsi. Penggunaan asumsi dalam ilmu ekonomi merupakan refleksi dari kesadaran bahwa tidak mungkin untuk dapat mengungkap dengan pasti faktor-faktor apa saja yang saling terkait atau saling mempengaruhi faktor tertentu. Wajar saja, karena ilmu ekonomi merupakan rumpun ilmu sosial, dimana dalam kegiatan sosial antara variabel satu dan yang lainnya saling berinteraksi, berkaitan, dan saling mempengaruhi. Oleh karena itu penggunaan asumsi adalah untuk membantu penyederhanaan model. Asumsi yang paling sering digunakan adalah asumsi ceteris paribus (hal-hal yang tidak diungkapkan dianggap tetap). Asumsi ini digunakan mengingat sangat banyaknya variabel-variabel dalam ilmu sosial yang saling mempengaruhi, yang sangat sulit untuk dianalisis secara bersamaan. Pembatasan penggunaan variabel untuk menganalisis kegiatan ekonomi melalui penetapan ceteris paribus 9
tersebut, senyatanya adalah untuk mempermudah penafsiran-penafsiran serta pengukuran kegiatan ekonomi. Oleh karena itu dibuatlah pernyataan-pernyataan yang mewakili variabel yang diukur saja, dan mengasumsikan variabel lainnya bersifat tetap. Sebagai contoh, kalau kita hendak mencari jawaban tentang pertanyaan kenapa seseorang mengonsumsi suatu barang, maka kita dapat mengidentifikasi berbagai faktor yang mempengaruhi seperti: tingkat penghasilan, harga barang itu sendiri, harga barang lain, selera, kebutuhan, ekspektasi masa mendatang, tingkat pengeluaran, iklan, promosi, faktor barang pengganti, ketersediaan barang, kondisi politik, trend, gengsi, dan lain-lain, yang tentu itu tidak dapat dijelaskan secara pasti. Banyaknya faktor yang mempengaruhi tingkat konsumsi seseorang tersebut tentu tidak dapat diidentifikasi secara pasti, maka dalam ekonometrika disiasati dengan membentuk model, yang mengabstraksikan realita, dengan cara mengidentifikasi faktor-faktor besar saja (misalnya 1-5 faktor terpenting saja), selebihnya diwakili dengan asumsi ceteris paribus tersebut. Model matematis merupakan salah satu model untuk menggambarkan teori yang diterjemahkan dalam bentuk matematis. Umumnya model dikembangkan dalam bentuk persamaan, dimana sebelah kiri tanda persamaan mewakili variabel yang dipengaruhi, sedang variabel yang berada di sebelah kanan tanda persamaan mewakili variabel yang mempengaruhi. Variabel yang dipengaruhi disebut pula sebagai variabel terikat, variabel dependen (dependent variables). Variabel yang mempengaruhi disebut pula sebagai variabel bebas, variabel independen (independent variable), variabel penduga, juga variabel prediktor. Untuk memudahkan tahapan proses analisis, dan mendapatkan jawaban yang valid maka perlu menggunakan metodologi ekonometri yang memadai. 10
Metodologi Ekonometri Metodologi ekonometri merupakan serangkaian tahapan-tahapan yang harus dilalui dalam kaitan untuk melakukan analisis terhadap kejadian-kejadian ekonomi. Secara garis besar, tahapan metodologi ekonometri dapat diurutkan sebagai berikut: 1. merumuskan masalah 2. merumuskan hipotesa 3. menyusun model 4. mendapatkan data 5. menguji model 6. menganalisis hasil 7. mengimplementasikan hasil Merumuskan Masalah Merumuskan masalah adalah hal yang sangat penting, karena merupakan “pintu pembuka” untuk menentukan tahapan-tahapan selanjutnya. Merumuskan suatu masalah berarti mengungkap hal-hal apa yang ada di balik gejala atau informasi yang ada, dan sekaligus mengidentifikasi penyebab-penyebab utamanya. Oleh karena itu, di dalam merumuskan masalah tidak dapat dilepaskan dari pemahaman teori-teori yang melandasi atau kontekstual dengan penelitian, mengungkap mengapa penelitian itu dilakukan, dan sekaligus mampu membuat rencana untuk menentukan langkah untuk mendapatkan jawaban dari permasalahan yang ada. Rumusan masalah merupakan pedoman untuk membuat struktur isi penelitian. Wajar saja bila sebagian besar orang berpendapat bahwa perumusan masalah adalah tahapan yang paling sulit dan menentukan.
11
Perumusan masalah yang baik tentu disertai dengan latar belakang masalah, karena itu merupakan sumber informasi yang digunakan untuk memahami keterkaitan permasalahan yang dirumuskan. Umumnya perumusan masalah dalam suatu penelitian diungkapkan dalam bentuk kalimat pertanyaan yang membutuhkan jawaban. Karena membutuhkan jawaban, maka akan semakin baik jika apa yang mendasari permasalahan itu adalah hal-hal yang menarik minat peneliti. Sebagai ilustrasi dari perumusan masalah, beberapa contoh dikemukakan sebagai berikut: 1. Seperti dijelaskan di atas, bahwa evaluasi pegawai dalam rangka penempatan kerja di lingkungan Dinas Pendidikan Nasional Kabupaten Sukoharjo belum dilakukan secara memadai. Dengan tidak dilakukannya evaluasi yang memadai, maka tidak dapat diketahui informasi yang terkait dengan apa yang diharapkan pegawai, seberapa besar tingkat stres pegawai, maupun berapa besar potensi prestasi kerja yang tersimpan maupun yang telah dapat diwujudkan. Untuk itu dalam penelitian ini permasalahanpermasalahan seperti itu akan dirumuskan dalam bentuk pertanyaan sebagai berikut: apakah dalam penempatan kerja pegawai Depdiknas Kabupaten Sukoharjo selama ini telah sesuai dengan karakteristik individu masing-masing pegawai, atau karena terpaksa harus bertahan karena tuntutan yang lain? berapa besar tingkat stress yang dialami pegawai dilingkungan Depdiknas Kabupaten Sukoharjo, dan apa faktor yang yang paling signifikan mempengaruhinya? seberapa besar 12
tingkat prestasi kerja pegawai Depdiknas Kabupaten Sukoharjo selama ini? adakah stress kerja yang dialami pegawai mempengaruhi prestasi kerja, seberapa besar pengaruhnya? 2. Setelah Juni 1997 diketahui bahwa terdapat kesamaan arah antara inflasi, kurs, dan suku bunga. Ketika inflasi meningkat kurs USD terhadap IDR juga mengalami peningkatan, begitu pula suku bunga juga mengalami peningkatan. Tetapi ketika inflasi mengalami penurunan ternyata baik kurs dan suku bunga juga mengalami hal serupa. Berdasar pada hal tersebut, maka timbul pertanyaan “apakah kurs IDR terhadap USD dan suku bunga simpanan berjangka rupiah mempengaruhi tingkat inflasi di Indonesia ?”
Merumuskan Hipotesa Hipotesa merupakan jawaban sementara terhadap masalah penelitian, sehingga perlu diuji lebih lanjut melalui pembuktian berdasarkan data-data yang berkenaan dengan hubungan antara dua atau lebih variabel. Rumusan hipotesa yang baik seharusnya dapat menunjukkan adanya struktur yang sederhana tetapi jelas, sehingga memudahkan untuk mengetahui jenis variabel, sifat hubungan antar variabel, dan jenis data. Perumusan hipotesa biasanya berupa kalimat pernyataan yang merupakan jawaban sementara dari masalah yang akan diteliti. Berdasarkan contoh pada sub
13
merumuskan masalah di atas, maka dapat dicontohkan penarikan hipotesis seperti ini: 4 1. Pegawai di lingkungan Dinas Pendidikan Kabupaten Sukoharjo banyak yang mengalami stres kerja yang dapat berakibat pada menurunnya motivasi kerjanya. 2. Inflasi di Indonesia setelah tahun 1997 dipengaruhi oleh kurs nilai tukar IDR-USD dan bunga deposito. Hubungannya bersifat searah.
Menyusun Model Pada dasarnya setiap ilmu pengetahuan bertujuan untuk menganalisis kenyataan yang wujud di alam semesta dan di dalam kehidupan manusia. Namun, karena fakta-fakta mengenai kenyataan yang wujud dalam ilmu sosial ( dimana ilmu ekonomi termasuk salah satu cabangnya) berjumlah sangat banyak dan saling terkait satu sama lainnya, maka menggambarkan kenyataan yang sebenarnya berlaku dalam perekonomian adalah merupakan hal yang tidak mudah. Agar dapat menjelaskan realitas yang kompleks seperti itu, maka perlu dilakukan abstraksi melalui penyusunan suatu model. Oleh karena itu model merupakan abstraksi dari realitas. Dalam ilmu ekonomi, model ekonomi didefinisikan sebagai konstruksi teoritis atau kerangka analisis ekonomi yang menggabungkan konsep, definisi, anggapan, persamaan, kesamaan (identitas) dan ketidaksamaan dari
4
Penulisan hipotesis ini bersifat garis besar. Penulisan hipotesis dalam penelitian biasanya dituliskan sekaligus dua hipotesis yang berlawanan, yaitu hipotesis nol dan hipotesis alternative.
14
mana kesimpulan akan diturunkan. 5 Sebagaimana namanya, dalam ilmu ekonomi tentu yang digunakan adalah variabel-variabel ekonomi saja. Untuk variabel non ekonomi tidak perlu dipilih, atau dimasukkan saja ke dalam asumsi ceteris paribus. Variabel ekonomi dibedakan menjadi: 6 1. Variabel Endogin, yaitu variabel yang menjadi pusat perhatian si pembuat model, atau variabel yang ditentukan di dalam model dan ingin diamati variansinya. 2. Variabel Eksogin, yaitu variabel yang dianggap ditentukan di luar sistem (model) dan diharapkan mampu menjelaskan variasi variabel endogin. 3. variabel kelambanan, yaitu variabel dengan unsur lag, yang umumnya digunakan untuk data runtut waktu. Fungsi model dalam ekonometrika adalah sebagai tuntunan untuk mempermudah menguji ketepatan model penduga. Salah satu bentuk model adalah berupa persamaan fungsi secara matematis. Karena pada hakikatnya sebuah fungsi adalah sebuah persamaan matematis yang menggambarkan hubungan sebab akibat antara sebuah variabel dengan satu atau lebih variabel lain. Ketepatan model itu sendiri mempunyai dua tujuan yaitu: Pertama, untuk mengetahui apakah model penduga tersebut merupakan model yang tepat sebagai estimator. Kedua, untuk mengetahui daya ramal atau goodness of fit dari model penduga. Model persamaan ini disebut pula
5
Insukindro, Pembentukan Model dalam Penelitian Ekonomi, Jurnal Ekonomi dan Bisnis Indonesia, 7(1), 1-18. 6 Kuncoro, Mudrajad, Metode Kuantitatif, Teori dan Aplikasi Untuk Bisnis dan Ekonomi, UPP AMP YKPN, 2001, p.5.
15
sebagai metode regresi yang diharapkan dapat menjawab hipotesis yang telah ditentukan. Model ekonometrika setidaknya terdiri dari dua golongan variabel, yaitu variabel terikat (dependen) yang berada pada sebelah kiri tanda persamaan, dan variabel bebas (independen) yang berada di sebelah kanan tanda persamaan. Jumlah variabel bebas tidak harus satu, tetapi dapat berjumlah lebih dari satu variabel. Untuk model dengan satu variabel bebas disebut dengan regresi tunggal (single regression), sedang untuk model yang mempunyai lebih dari satu variabel bebas disebut regresi berganda (multiple regression).
Mendapatkan Data Mendapatkan data merupakan suatu langkah yang harus dilakukan oleh peneliti, agar dapat menjamin bahwa data yang dianalisis adalah benar-benar menggunakan data yang tepat. Hal ini penting untuk mendapatkan hasil analisis yang tidak bias atau menyesatkan. Para peneliti terdahulu telah mengingatkan agar jangan sampai dalam penelitian terdapat GIGO, garbage In garbage out. Tahapan yang dapat ditempuh untuk mendapatkan data pra analisis meliputi: penyuntingan data, pengembangan variabel, pengkodean data, cek kesalahan, pembentukan struktur data, tabulasi. Penyuntingan data, adalah upaya proses data untuk mendapatkan data yang memberikan kejelasan, dapat dibaca, konsisten, dan komplit. Pengembangan variabel, yaitu memperluas variansi data, misalnya mentransformasi menjadi data dalam 16
angka logaritma, melakukan indeksasi data, komposit, dan lain-lain. Pengkodean data, melakukan koding terhadap data yang akan digunakan dengan cara yang sesuai, seperti koding terhadap variabel dummy, data ordinal, data interval, dan lain-lain. Cek kesalahan, merupakan finalisasi pengujian data agar betul-betul mendapatkan data akhir yang valid. Strukturisasi data, membuat kesedian data agar dapat digunakan dengan baik di kemudian hari. Tabulasi data, biasanya tidak dimasukkan sebagai prosedur analitik dalam penelitian ilmiah karena tidak mengungkapkan hubungan dalam data. Kendati demikian, banyak riset bisnis yang ditujukan untuk penjelasan masalah dan atau menemukan hubungan. Tabulasi menyajikan hitungan hitungan frekuensi dari satu hal (analisis frekuensi) atau perkiraan numerik tentang distribusi sesuatu (analisis deskriptif). Tabulasi merupakan alat analisis bisnis. Tabulasi juga bermanfaat bagi peneliti sebagai alat menyusun kategori ketika mengubah variabel interval menjadi klasifikasi nominal. Dengan kata lain, tabulasi mendeskripsikan jumlah individu yang menjawab pertanyaan tertentu. Tabulasi dapat juga digunakan untuk menciptakan statistik deskriptif mengenai variabel-variabel yang digunakan atau tabulasi silang. 7
Menguji Model Untuk mengetahui sejauh mana tingkat kesahihan model terbaik yang dihasilkan, maka perlu dilakukan uji ketepatan fungsi regresi dalam menaksir nilai actual dapat 7
Ibid.
17
diukur dari goodness of fit-nya. Untuk melakukan uji goodness of fit pengukurannya dilakukan dengan menguji nilai statistik t, nilai statistik F, dan koefisien determinasinya (R2) pada hasil regresi yang telah memenuhi uji asumsi klasik. Uji nilai statistik t untuk mengetahui pengaruh secara individual variabel independen terhadap variabel dependen. Uji F untuk mengetahui secara bersama-sama semua variabel independen dalam mempengaruhi variabel dependen. Sedangkan koefisien determinasi untuk menentukan seberapa besar sumbangan variabel independen terhadap variabel dependen. Uji asumsi klasik juga perlu dilakukan terhadap model agar memperteguh validitas model, yang dapat dilakukan melalui pengujian normalitas, autokorelasi, multikolinearitas, juga heteroskedastisitas. Menganalisis Hasil Analisis ekonometrika dimulai dari interpretasi terhadap data dan keterkaitan antar variabel yang dijelaskan di dalam model. Tidak hanya analisis regresi, analisis korelasi juga perlu dilakukan untuk mendapatkan hasil pengukuran hingga benar-benar valid. Analisis regresi akan mendapatkan hasil pengaruh antara variabel independen terhadap variabel dependen. Sedang untuk analisis korelasi berguna untuk mengetahui hubungan antar variabel tanpa membedakan apakah itu variabel dependen ataukah independen. Tanda positif atau negatif pada masing-masing koefisien perlu untuk dicermati, karena mempunyai keterkaitan langsung terhadap kesesuaian dengan teori yang dirumuskan dalam model. Pengabaian terhadap kedua tanda tersebut, dapat menjadikan hasil regresi tidak sesuai dengan teori yang melatar belakangi. 18
Hal lain yang tidak kalah pentingnya adalah pengimplemantasian dari hasil pengukuran. Karena sebagus dan sebenar apapun hasil penelitian, apabila tidak ditindaklanjuti dalam bentuk implementasi, tidak akan berarti apa-apa. -000Tugas: 1. Buatlah rangkuman dari pembahasan di atas 2. Cobalah untuk menyimpulkan maksud dari uraian bab ini 3. Jawablah pertanyaan-pertanyaan di bawah ini: a. Apa yang dimaksud dengan ekonometrika b. Bidang keilmuan apa saja yang terkait secara langsung dengan ekonometrika c. Jelaskan pentingnya ekonometrika d. Uraikan tahapan-tahapan ekonometrika
19
BAB II MODEL REGRESI
Tujuan Pengajaran: Setelah mempelajari bab ini, anda diharapkan dapat: Mengerti definisi model Mengerti definisi regresi Menyebutkan model-model regresi Menjelaskan kegunaan model regresi Menuliskan alternatif notasi model Memahami perbedaan-perbedaan model Menggunakan model untuk menjabarkan teori
20
BAB II MODEL REGRESI
Keilmuan sosial mempunyai karakteristik berupa banyaknya variabel-variabel atau faktor-faktor yang saling mempengaruhi satu sama lain. Kondisi yang demikian ini menyebabkan kesulitan dalam menentukan secara pasti faktor apa saja yang menyebabkan faktor tertentu. Sebagai contoh, apabila kita ingin mengetahui faktor apa saja yang mempengaruhi permintaan suatu barang tertentu (sebut saja barang X), maka dengan mengidentifikasi kemungkinan faktor-faktor yang mempengaruhinya, kita akan mendapatkan banyak sekali faktor-faktor itu seperti: harga barang tersebut, harga barang lain, mutu barang, pendapatan, anggaran pengeluaran, prediksi harga masa yang akan datang, selera, trend yang berkembang, persepsi atas barang tersebut, kebutuhan, gengsi, return usaha yang mungkin diperoleh, tingkat bunga bank, stabilisasi keamanan, tempat penjualan barang tersebut, barang pengganti, dan tentu masih banyak lagi faktor-faktor lainnya yang sangat sulit untuk ditentukan secara mutlak, bahwa harga barang X tersebut hanya ditentukan oleh faktor-faktor yang telah dijelaskan. Dari beragam faktor-faktor yang disebutkan di atas, tentu mempunyai tingkat signifikansi yang berbeda. Beberapa faktor mungkin mempunyai tingkat signifikansi yang tinggi, sementara yang lain mungkin tingkat signifikansinya rendah, atau biasa disebut tidak signifikan. Dalam kepentingan untuk mengidentifikasi beberapa variabel saja, maka dibenarkan untuk mengabaikan variabel-variabel yang lain. Cara yang 21
dilakukan adalah membuat model, yang menjelaskan variabel-variabel yang hendak diteliti saja. Sedang untuk variabel-variabel lain yang terkait tetapi tidak hendak diteliti, dapat diabaikan. Hal ini dibenarkan dalam keilmuan sosial (ekonomi), karena terlalu banyak faktorfaktor yang saling terkait dan sangat sulit untuk diidentifikasi secara menyeluruh, sehingga perlu asumsi yang menganggap tidak adanya perubahan dari variabelvariabel yang disebut dengan ceteris paribus. Model dalam keilmuan ekonomi berfungsi sebagai panduan analisis melalui penyederhanaan dari realitas yang ada. Sehingga model sering diartikan refleksi dari realita atau simplikasi dari kenyataan. Hal ini akan semakin jelas kalau kita runut dari bentuk suatu model yang memang berbentuk sangat sederhana. Penulisan model dalam ekonometrika adalah merupakan pengembangan dari persamaan fungsi secara matematis, karena pada hakikatnya sebuah fungsi adalah sebuah persamaan yang menggambarkan hubungan sebab akibat antara sebuah variabel dengan satu atau lebih variabel lain. Penulisan model dalam bentuk persamaan fungsi tersebut dicontohkan dalam persamaan berikut ini: Persamaan Matematis Æ Y=a + bX ……….. (pers.1) Persamaan Ekonometrika Æ Y = b0 + b1X + e ……….. (pers.2) Munculnya e (error term) pada persamaan ekonometrika (pers.2) merupakan suatu penegasan bahwa sebenarnya banyak sekali variabel-variabel bebas yang mempengaruhi variabel terikat (Y). Karena dalam model tersebut hanya ingin melihat pengaruh satu variabel X saja, maka variabel-variabel yang lain dianggap bersifat tetap atau ceteris paribus, yang dilambangkan dengan e. 22
Bentuk Model Model persamaan fungsi seperti dicontohkan pada pers.2 bertujuan untuk mengetahui pengaruh variabel bebas terhadap variabel terikat. Oleh karena itu, persamaan tersebut disebut juga sebagai persamaan regresi. Model Regresi mempunyai bermacam-macam bentuk model yang dapat dibedakan berdasarkan sebaran data yang terlihat dalam scatterplott-nya. 8 Setidaknya terdapat tiga jenis model yaitu: Model Regresi Linier, Model Regresi Kuadratik, Model Regresi Kubik Model Regresi Linier Kata “linier” dalam model ini menunjukkan linearitas dalam variabel maupun lineraitas dalam data. Kata linier menggambarkan arti bahwa sebaran data dalam scatter plot menunjukkan sebaran data yang mendekati bentuk garis lurus. Data semacam ini dapat wujud apabila perubahan pada variabel Y sebanding dengan perubahan variabel X. Jika sebaran datanya berkecenderungan melengkung, maka cocoknya menggunakan dengan regresi kuadratik. Jika sebaran datanya kecenderungannya seperti bentuk U atau spiral regresinya menggunakan regresi kubik. Model linier sendiri dapat dibedakan sebagai single linier maupun multiple linier. Disebut single linier apabila variabel bebas hanya berjumlah satu dengan batasan pangkat satu. Sedang multiple linier apabila variabel bebas lebih dari satu variabel dengan batasan pangkat satu. Untuk lebih jelasnya akan dicontohkan bentuk 8
Scatter plot merupakan gambar sebaran data.
23
persamaan single linier (pers.3) dan persamaan multiple linier (pers.4) sebagai berikut: Y = b0 + b1X + e
……….. (pers.3)
Y = b0 + b1X1 + b2X2 + …… + bnXn + e ……….. (pers.4)
Misalkan dari pers.3 dianggap bahwa Y = Inflasi, dan X = bunga deposito (Budep) pada periode tertentu, dan jika datanya telah diketahui, maka data akan tergambar dalam bentuk titik-titik yang merupakan sebaran data dalam scatter plot. Dengan menggunakan data penelitian hubungan antara inflasi dan bunga deposito antara Januari 2001 hingga Oktober 2002, maka sebaran datanya tergambar sebagai berikut: Hubungan Suku Bunga terhadap Inflasi 16
15
14
13
12
11
INFLASI
10
9 8 13 .0
13 .5
14 .0
14 .5
BUDEP Gambar 3
24
15 .0
15 .5
16 .0
16 .5
Sebaran data tersebut di atas (gambar 3) menunjukkan hubungan yang positif, yaitu jika bunga deposito meningkat, maka inflasi juga meningkat. Begitu pula jika bunga deposito menurun, inflasi juga turun. Sedangkan contoh sebaran data yang digambarkan dalam scatter plot di bawah ini (gambar 4), menunjukkan bahwa hubungan antara variable Afenegat (Afeksi negative) dan Latribut (Atribut) mempunyai hubungan yang negative. Jika atributnya berkurang, maka afeksi negatifnya meningkat. Begitu pula sebaliknya. Dari scatter plot kedua gambar tersebut (baik gambar di atas maupun di bawah ini) menunjukkan bahwa sebaran datanya menyebar memanjang lurus, sehingga dapat diwakili dengan garis lurus. Oleh karena itu, kedua scater plot tersebut akan tepat digunakan regresi linier.
1.9
1.8
LATRIBUT
1.7
1.6 0
10
20
AFENEGAT
Gambar 4
25
30
40
Model Kuadratik
Salah satu ciri model kuadratik dapat diketahui dari adanya pangkat dua pada salah satu variabel bebasnya. Ciri yang lain dapat dilihat dari pengamatan terhadap scatter plott yang menunjukkan kecenderungan sebaran data membentuk lengkung, tidak seperti model linier yang cenderung lurus. Model kuadratik dituliskan dalam persamaan fungsi sebagai berikut: Y = b0 + b1X1 + b2X12 + e
……….. (pers.5)
Model Kubik Salah satu ciri model kubik dapat diketahui dari adanya pangkat tiga pada salah satu variabel bebasnya. Oleh karena itu sering disebut juga dengan fungsi berderajat tiga. Ciri yang lain dapat dilihat dari pengamatan terhadap scatter plott yang menunjukkan kecenderungan sebaran data yang berbentuk lengkung dengan arah yang berbeda. Setiap fungsi kubik setidaktidaknya mempunyai sebuah titik belok (inflexion point), yaitu titik peralihan bentuk kurva dari cekung menjadi cembung atau dari cembung menjadi cekung. 9 Model kuadratik dituliskan dalam persamaan fungsi sebagai berikut: Y = b0 + b1X1 + b1X12 + b1X13 + e (pers.6)
9
………..
Dumairy, Matematika Terapan Untuk Bisnis dan Ekonomi, BPFE, Yogjakarta, p.140
26
Notasi Model
Huruf Y memerankan fungsi sebagai variabel dependen atau variabel terikat. Y sering juga disebut sebagai variabel gayut, variabel yang dipengaruhi, atau variabel endogin. Dengan alasan keseragaman, penulisan huruf Y diletakkan disebelah kiri tanda persamaan. Sedang variabel independen yang secara umum disimbolkan dengan huruf X diletakkan disebelah kanan tanda persamaan. Huruf X menggambarkan variabel bebas atau variabel yang mempengaruhi. Oleh karena itu variabel ini mempunyai nama lain seperti variabel independen, variabel penduga, variabel estimator, atau juga variabel eksogen. Peletakannya di sebelah kanan tanda persamaan menunjukkan perannya sebagai variabel yang mempengaruhi. Huruf b0 sering juga dituliskan dengan huruf a, α, atau juga β0. Secara substansi penulisan itu mempunyai arti yang sama, yaitu menunjukkan konstanta atau intercept yang merupakan sifat bawaan dari variabel Y. Konstanta ini mempunyai angka yang bersifat tetap yang sekaligus menunjukkan titik potong garis regresi pada sumbu Y. Jika konstanta itu bertanda positif maka titik potongnya di sebelah atas titik origin (0), sedang bila bertanda negatif titik potongnya di sebelah bawah titik origin. Nilai konstanta ini merupakan nilai dari variabel Y ketika variabel X bernilai nol. Atau dengan bahasa yang mudah, nilai konstanta merupakan sifat bawaan dari Y. Huruf b1, b2, bn merupakan parameter yang menunjukkan slope atau kemiringan garis regresi. Parameter ini sering juga dituliskan dengan bentuk b, atau β1, β2, βn. Meskipun dituliskan dengan tanda yang 27
berbeda, secara substansi parameter ini menunjukkan beta atau koefisien korelasi yang sekaligus menunjukkan tingkat elastisitas dari variabel X tersebut. Nilai beta ini memungkinkan untuk bernilai positif maupun negatif. Tanda positif menunjukkan hubungan yang searah antara variabel X dengan variabel Y. Artinya jika X mengalami peningkatan maka Y juga mengalami peningkatan. Sebaliknya jika X mengalami penurunan maka Y pun akan menurun. Arah hubungan seperti itu tidak terjadi pada beta yang berangka negatif. Karena jika tandanya negatif arah hubungan X terhadap Y saling berlawanan. Jika X meningkat maka Y menurun, sebaliknya jika X menurun maka nilai statistik t meningkat. Demikian pula, karena nilai koefisien korelasi ini juga menunjukkan tingkat elastisitas, maka dari besarnya nilai koefisien korelasi (b) tersebut dapat ditentukan jenis elastisitasnya. Jika nilai b besarnya lebih dari satu (b>1) maka disebut elastis. Artinya, jika variabel X mengalami perubahan, maka variabel Y akan mengalami perubahan yang lebih besar dari perubahan yang ada pada variabel X tersebut. Jika nilai b besarnya sama dengan angka satu (b=1) disebut uniter elastis. Artinya, jika variabel X mengalami perubahan, maka variabel Y akan mengalami perubahan yang sama besar dengan perubahan yang ada pada variabel X tersebut. Jika nilai b besarnya lebih kecil dari angka satu (b<1) disebut inelastis. Artinya, jika variabel X mengalami perubahan, maka variabel Y akan mengalami perubahan yang lebih kecil dari perubahan yang ada pada variabel X tersebut. Huruf e merupakan kependekan dari error term atau kesalahan penggganggu. Simbol error ini tidak jarang dituliskan dalam huruf ε atau μ. Simbol ini merupakan karakteristik dari ekonometrika yang tidak dapat dilepaskan dari unsur-unsur stokhastik atau hal-hal yang mengandung probabilita, karena hasil yang 28
ditunjukkan oleh model ekonometrika hanya bersifat perkiraan, dalam arti tidak menunjukkan kebenaran yang mutlak. Oleh karena itu nama lain dari simbol ini tidak terlepas dari sifat dasar itu seperti: disturbance error atau stochastic disturbance. Kesalahan pengganggu ini sendiri mempunyai banyak sebab yang dapat menimbulkannya seperti: 1. tidak seluruh variabel bebas yang mempunyai potensi dalam mempengaruhi variabel terikat dapat disebutkan dalam model. 2. kesalahan asumsi dalam menentukan teori yang diwujudkan sebagai model. 3. ketidaklengkapan data yang dianalisis. 4. ketidaktepatan model yang digunakan. Misalnya, seharusnya digunakan model kuadratik tetapi justru yang digunakan adalah model linier, atau sebaliknya.
Spesifikasi Model dan Data Secara spesifik model dalam ekonometrika dapat dibedakan menjadi: model ekonomi (economic model) dan model statistic (statistical model). Model Ekonomi biasanya dituliskan dalam bentuk persamaan sebagai berikut: Y = b0 + b1X1 + b2 X2 Tanda b = parameter, menunjukkan ketergantungan variabel Y terhadap variabel X b0 = intercept, menjelaskan nilai variabel terikat ketika masing-masing variabel bebasnya bernilai 0 (nol).
29
Model ini menggambarkan rata-rata hubungan sistemik antara variabel Y, X1, X2. Dalam model ini nilai e tidak tertera, karena nilai e diasumsikan non random. Dalam realita, model ini tidak mampu menjelaskan variabelvariabel ekonomi secara pas (clear), oleh karena itu membutuhkan regresi. Model Statistik Model ekonomi seperti yang dijelaskan di atas, mencerminkan nilai harapan, maka dapat pula ditulis: E (Y) = b0 + b1X1 + b2 X2 Karena nilai harapan, maka tentu tidak akan secara pasti sesuai dengan realita. Oleh karena itu akan muncul nilai random error term (e). Nilai e sendiri merupakan selisih antara nilai kenyataan dan nilai harapan. Secara matematis dapat dituliskan sebagai berikut: e = Y – E(Y)
jadi, karena, maka
atau e = Y – Yˆ
Y = Yˆ + e Yˆ = E (Y) = b0 + b1X1 + b2 X2 Y = b0 + b1X1 + b2 X2 + e
tanda e pada persamaan di atas mencerminkan distribusi probabilitas. Atau dapat pula dianggap sebagai pengganti variabel-variabel berpengaruh lain selain variabel yang dijelaskan dalam model. Dalam teori ekonomi, e merupakan representasi dari asumsi ceteris paribus. Pengakuan adanya variabel lain yang berpengaruh, meskipun tidak disebutkan variabel apa, cukup ditulis dengan tanda e, maka model menjadi lebih realistik. Agar
30
terdapat gambaran yang jelas, maka nilai e harus diasumsikan. Asumsi-asumsinya adalah: 1. Nilai harapan e sama dengan 0 (nol). E(e) = 0, masing-masing random error mempunyai distribusi probabilitas = 0. Meskipun e bisa bernilai positif atau negatif, tetapi rata-rata e harus = 0. 2. Variance residual sama dengan standar deviasi Var (e) = σ 2 , artinya: masing-masing random error mempunyai distribusi probabilitas variance yang sama dengan standar deviasi ( σ 2 ). Asumsi ini menjelaskan bahwa residual bersifat homoskedastik. 3. Kovarian ei dan ej mempunyai nilai nol. Cov (ei, ej) = 0. Nilai nol dalam asumsi ini menjelaskan bahwa antara ei dan ej tidak ada korelasi serial atau tida berkorelasi (autocorrelation). 4. Nilai random error mempunyai distribusi probabilitas yang normal. Karena masing, masing observasi Y tergantung pada e, maka masing-masing Y juga memiliki varian yang random. Dengan demikian, statistik Y menjadi sebagai beriku: 1. Nilai harapan Y tergantung pada nilai masingmasing variabel penjelas dan parameterparameternya. Dengan menggunakan asumsi E(e) = 0, maka rata-rata perubahan nilai Y untuk setiap observasi ditentukan oleh fungsi regresi. E (Y) = b0 + b1X1 + b2 X2 2. Variance distribusi probabilitas Y tidak dapat berubah setiap observasi. Var (Y) = Var (e) = σ 2 3. Tidak ada kaitan langsung antara observasi satu dengan observasi lainnya. 31
Cov (Yi, Yj) = Cov (ei, ej) = 0 4. Nilai Y secara normal terdistribusi di sekitar ratarata. Asumsi-asumsi di atas difokuskan pada pembahasan variabel terikat. Perlu adanya asumsi tambahan terhadap variabel penjelas, yaitu: 1. Variabel independen tidak bersifat random, karena dengan jelas dapat diketahui dari data. 2. Variabel independen tidak merupakan fungsi linear dari yang lain. Asumsi ini penting agar tidak terjadi redundancy, yang menyebabkan multikolinearitas.
Kesimpulan: Dalam suatu model regresi terdapat dua jenis variabel, yaitu variabel terikat dan variabel bebas, yang dipisahkan oleh tanda persamaan. Variabel terikat sering disimbolkan dengan Y, biasa pula disebut sebagai variabel dependen, variabel tak bebas, variabel yang dijelaskan, variabel yang diestimasi, variabel yang dipengaruhi. Cirinya, berada pada sebelah kiri tanda persamaan (=). Variabel bebas sering disimbolkan dengan X, biasa pula disebut sebagai variabel independen, variabel yang mempengaruhi, variabel penjelas, variabel estimator, variabel penduga, variabel yang mempengaruhi, variabel prediktor. Cirinya terletak pada sebelah kanan tanda persamaan (=). Dalam suatu model juga terdapat parameterparameter yang disebut konstanta, juga koefisien korelasi. Konstanta sering disimbolkan dengan a, atau b0, atau β0. Koefisien korelasi disebut pula sebagai beta, B, b, menunjukkan slope, kemiringan, elastisitas.
32
-000-
Tugas: 1. Buatlah rangkuman dari pembahasan di atas! 2. Cobalah untuk menyimpulkan maksud dari uraian bab ini! 3. Jawablah pertanyaan-pertanyaan di bawah ini: a. Jelaskan apa yang dimaksud dengan model! b. Sebutkan apa saja jenis-jenis model ekonometrika! c. Jelaskan perbedaan antara jenis-jenis model ekonometrika! d. Coba uraikan asumsi-asumsi yang harus dipenuhi dalam regresi linier!
33
BAB III MODEL REGRESI DENGAN DUA VARIABEL
Tujuan Pengajaran: Setelah mempelajari bab ini, anda diharapkan dapat: Mengetahui kegunaan dan spesifikasi model Menjelaskan hubungan antar variabel Mengaitkan data yang relevan dengan teori Mengembangkan data Menghitung nilai parameter Mengetahui arti dan fungsi parameter Menentukan signifikan tidaknya variabel bebas Membaca hasil regresi Menyebutkan asumsi-asumsi.
34
BAB III MODEL REGRESI DENGAN DUA VARIABEL
Bentuk model Model regresi dengan dua variabel 10 umumnya dituliskan dengan simbol berbeda berdasarkan sumber data yang digunakan, meskipun tetap dituliskan dalam persamaan fungsi regresi. Fungsi regresi yang menggunakan data populasi (FRP) umumnya menuliskan simbol konstanta dan koefisien regresi dalam huruf besar, sebagai berikut: Y = A + BX + ε ……….. (pers.3.1) Fungsi regresi yang menggunakan data sampel (FRS) umumnya menuliskan simbol konstanta dan koefien regresi dengan huruf kecil, seperti contoh sebagai berikut: Y = a + bX + e ……….. (pers.3.2) Dimana: A atau a; merupakan konstanta atau intercept B atau b; merupakan koefisien regresi, yang juga menggambarkan tingkat elastisitas variabel independen Y; merupakan variabel dependen X; merupakan variabel independen
10
Yaitu satu variabel dependen dan satu variabel independen
35
Notasi a dan b merupakan perkiraan dari A dan B. Huruf a, b, disebut sebagai estimator atau statistik, sedangkan nilainya disebut sebagai estimate atau nilai perkiraan. 11 Meskipun penulisan simbol konstanta dan koefisien regresinya agak berbeda, namun penghitungannya menggunakan metode yang sama, yaitu dapat dilakukan dengan metode kuadrat terkecil biasa (ordinary least square) 12, atau dengan metode Maximum Likelihood. Metode Kuadrat Terkecil Biasa (Ordinary Least Square) (OLS) Penghitungan konstanta (a) dan koefisien regresi (b) dalam suatu fungsi regresi linier sederhana dengan metode OLS dapat dilakukan dengan rumus-rumus sebagai berikut: Rumus Pertama (I) Mencari nilai b: b=
n (∑ XY ) − (∑ X )(∑ Y ) n
(∑ X ) − (∑ X ) 2
2
mencari nilai a: a=
∑ Y − b. ∑ X n
Rumus kedua (II) 11
Supranto, J., Ekonometrik, Buku satu, LPFEUI, Jakarta, 1983 Ordinary Least Square (OLS) ditemukan oleh Carl Friedrich Gauss, seorang Matematikawan Jerman, pada tahun 1821.
12
36
Mencari nilai b: b=
∑ xy ∑x 2
mencari nilai a: a =Y − b X
Misalnya saja kita ingin meneliti pengaruh bunga deposito jangka waktu 1 bulan (sebagai variabel X = Budep) terhadap terjadinya inflasi di Indonesia (sebagai variabel Y=Inflasi) pada kurun waktu Januari 2001 hingga Oktober 2002, yang datanya tertera sebagai berikut:
37
Observasi Jan 01 Peb 01 Mar 01 Apr 01 Mei 01 Jun 01 Jul 01 Agu 01 Sep 01 Okt 01 Nop 01 Des 01 Jan 02 Peb 02 Mar 02 Apr 02 Mei 02 Jun 02 Jul 02 Agu 02 Sep 02 Okt 02 Jumlah
Y 8.28 9.14 10.62 10.51 10.82 12.11 13.04 12.23 13.01 12.47 12.91 12.55 14.42 15.13 14.08 13.3 12.93 11.48 10.05 10.6 10.48 10.33 260.49
38
X1 13.06 13.81 13.97 13.79 14.03 14.14 14.39 14.97 15.67 15.91 16.02 16.21 16.19 15.88 15.76 15.55 15.16 14.85 14.22 13.93 13.58 13.13 324.22
Bantuan dengan SPSS Cara memasukkan data tersebut di atas ke dalam SPSS, dapat dilakukan dengan tahapan sebagai berikut: 1. Pastikan bahwa lembar worksheet SPSS sudah siap digunakan. Caranya: tampilkan program SPSS di layar monitor. 2. Masukkan data ke masing-masing kolom. Pastikan bahwa yang aktif adalah Data View (lihat pojok kiri bawah), bukan variabel View!
39
3. Beri nama kolom tersebut sesuai nama variabelnya. Caranya: klik Variabel View (pojok kiri bawah), maka akan muncul kolom: Name, Type, Width, Decimals, label, values, missing, columns, align, measure. Masukkan nama variabel ke dalam kolom Name. Misal kita mau memberi nama variabel dengan Y, maka ketik Y. Jika hendak memberi nama tersebut dengan Inflasi, maka ketik inflasi. (Meskipun yang dimasukkan adalah huruf besar, tetapi dalam kolom akan muncul huruf kecil).
40
4. Data awal yang dimasukkan tadi dapat dikembangkan menjadi seperti hitungan dalam tabel di bawah (misal menjadi X12). Caranya: klik Transform, kemudian pilih Compute, maka layar SPSS akan berubah menjadi seperti dalam gambar sebagai berikut:
Pada kotak Target Variable (kanan atas) isilah dengan nama variabel baru (variabel pengembangan). Sesuai contoh, ketik X12, dimana X12 ini merupakan X1 yang dikuadratkan. Karena akan menghitung kuadrat, maka caranya: variabel yang ada di kolom Type&Label diblok (klik)
41
pindahkan ke dalam kolom Numeric Expression menggunakan langkah klik pada tanda segitiga penunjuk arah. Setelah itu pilih ** (pada tuts kalkulator) dan ketik angka 2 (karena hendak mengkuadratkan), dan kemudian ketik OK. Jika tahapan tersebut telah dilalui, worksheet data akan menampakkan variabel baru dengan data yang dihitung tadi. 5. Untuk membuat data perkalian, lakukan dengan cara memindahkan salah satu nama variabel yang hendak dikalikan (misalnya, Y) dari kotak Type&Label ke Numeric Expression, pilih tanda pengali (*) dan ikuti dengan memindahkan lagi variabel lainnya yang hendak dikalikan (misal X), setelah itu klik OK.
Berdasarkan data yang tertera di atas, maka nilai a dan b dapat dicari melalui penggunakan kedua rumus tersebut, baik itu rumus pertama ataupun kedua. Seandainya kita ingin menggunakan rumus pertama, maka langkah awal yang dapat dilakukan adalah mengadakan penghitunganpenghitungan atau pengembangan data untuk disesuaikan dengan komponen rumus, sehingga nantinya dapat secara langsung diaplikasikan ke dalam rumus. Pengembangan data yang dimaksudkan adalah menentukan nilai X12, nilai Y2, serta nilai XY. Hasil pengembangan data dapat dilihat pada tabel berikut:
42
Observasi Jan 01 Peb 01 Mar 01 Apr 01 Mei 01 Jun 01 Jul 01 Agu 01 Sep 01 Okt 01 Nop 01 Des 01 Jan 02 Peb 02 Mar 02 Apr 02 Mei 02 Jun 02 Jul 02 Agu 02 Sep 02 Okt 02 Jumlah
Y 8.28 9.14 10.62 10.51 10.82 12.11 13.04 12.23 13.01 12.47 12.91 12.55 14.42 15.13 14.08 13.3 12.93 11.48 10.05 10.6 10.48 10.33 260.49
X1 13.06 13.81 13.97 13.79 14.03 14.14 14.39 14.97 15.67 15.91 16.02 16.21 16.19 15.88 15.76 15.55 15.16 14.85 14.22 13.93 13.58 13.13 324.22
X12 170.5636 190.7161 195.1609 190.1641 196.8409 199.9396 207.0721 224.1009 245.5489 253.1281 256.6404 262.7641 262.1161 252.1744 248.3776 241.8025 229.8256 220.5225 202.2084 194.0449 184.4164 172.3969 4800.525
Y2 68.5584 83.5396 112.7844 110.4601 117.0724 146.6521 170.0416 149.5729 169.2601 155.5009 166.6681 157.5025 207.9364 228.9169 198.2464 176.89 167.1849 131.7904 101.0025 112.36 109.8304 106.7089 3148.48
XY 108.1368 126.2234 148.3614 144.9329 151.8046 171.2354 187.6456 183.0831 203.8667 198.3977 206.8182 203.4355 233.4598 240.2644 221.9008 206.815 196.0188 170.478 142.911 147.658 142.3184 135.6329 3871.398
Setelah mendapatkan hitungan-hitungan hasil pengembangan data, maka angka-angka tersebut dapat secara langsung dimasukkan ke dalam rumus I, sebagai berikut: Mencari nilai b: b=
n (∑ XY ) − (∑ X )(∑ Y ) n
(∑ X ) − (∑ X ) 2
2
43
b=
22 (3.871,398) − (324,22 )(260,49 ) 22 (4.800,525) − (324,22 )
2
85.170,76 − 84.456,0678 105.611,60 − 105.118,6084 714,6922 = 492,9916
=
b = 1,4497 dengan diketahuinya nilai b, maka nilai a juga dapat ditentukan, karena rumus pencarian a terkait dengan nilai b. Mencari nilai a: a=
∑ Y − b. ∑ X n
=
260,49 −1,4497 (324,22) 22
=
260,49 − 470,022 22
a = -9.5241
Seperti telah dijelaskan di atas, bahwa nilai a dan b dapat pula dicari dengan menggunakan rumus kedua. Demikian pula, agar dapat secara langsung menggunakan rumus II ini, perlu menghitung dulu komponen-komponen rumus.Langkah yang dapat dilakukan dicontohkan sebagai berikut:
44
Mencari nilai b, menggunakan rumus kedua: b=
∑ xy ∑x 2
Dari rumus di atas, kita perlu menemukan dulu nilai dari ∑ xy atau ∑ x 2 yang dapat dilakukan dengan rumusrumus sebagai berikut:
∑ x = ∑ X − (∑ X ) 2
2
2
∑ y = ∑ Y − (∑ Y ) 2
2
2
/n
/n
∑ xy = ∑ XY − (∑ X ∑ Y ) / n maka:
∑ x 2 = 4800.53 -
324.22 2 22
= 4800.53 – 4778.12 = 22.41 260.49 2 ∑ y = 3148.48 - 22 2
= 3148.48 – 3084.32 = 64.16
45
∑ xy
= 3871,40 -
(324.22 − 260.49) 22
= 3871.40 – 3838.91 = 32.49
Dengan diketahuinya, nilai-nilai tersebut, maka nilai b dapat ditentukan, yaitu: b=
32.49 = 1.4498 22.41
Dengan diketahuinya nilai b, maka nilai a juga dapat dicari dengan rumus sebagai berikut: a =Y − b X
= 11.8405 – (1.4498 x 14.7373) = 11.8405 – 21.3661 a= -9.5256
Hasil pencarian nilai a dan b dengan menggunakan rumus I dan II didapati angka yang cenderung sama. Pada penghitungan rumus I nilai a = –9,5241 dan b = 1,4497. Sedangkan hasil penghitungan dengan rumus II, nilai a = -9,5256 dan b = 1,4498. Tampak bahwa hingga dua angka di belakang koma tidak terdapat perbedaan, sedangkan tiga angka di belakang koma mulai ada perbedaan. Perbedaan ini sifatnya tidak tidak substansial, karena munculnya perbedaan itu sendiri akibat dari 46
pembulatan. Dengan demikian dapat disimpulkan bahwa, mencari a dan b dengan rumus I ataupun rumus II akan menghasilkan nilai yang sama. Bantuan dengan SPSS Nilai a dan b dapat dilakukan dengan melalui bantuan SPSS. Caranya: Klik Analize, pilih regression, pilih linear, masukkan variabel Y ke dalam kotak Dependent Variable (caranya pilih variabel Y dan pindahkan dengan klik pada segitiga hitam), pindahkan variabel X ke kotak Independent Variable, kemudian klik OK. SPSS akan menunjukkan hasilnya. Nilai a dan b akan tertera dalam output berjudul Coefficient.
47
Output
Model Summary
Model 1
R R Square .857a .734
a. Predictors: (Constant), X1
48
Adjusted R Square .721
Std. Error of the Estimate .9236
ANOVAb Sum of Model Squares 1 Regression 47.101 Residual 17.059 Total 64.160
df 1 20 21
Mean Square 47.101 .853
F 55.220
Sig. .000a
t -3.305 7.431
Sig. .004 .000
a. Predictors: (Constant), X1 b. Dependent Variable: Y
a Coefficients
Model 1 (Constant) X1
Standardi zed Coefficien Unstandardized ts Coefficients B Std. Error Beta -9.527 2.882 1.450 .195 .857
a. Dependent Variable: Y
Catatan: Hasil penghitungan manual dan SPSS tampaknya ada perbedaan dalam desimal. Itu disebabkan adanya penghitungan pembulatan.
Meskipun nilai a dan b dapat dicari dengan menggunakan rumus tersebut, namun nilai a dan b baru dapat dikatakan valid (tidak bias) 13 apabila telah memenuhi beberapa asumsi, yang terkenal dengan
13
Tidak bias artinya nilai a atau nilai b yang sebenarnya. Dikatakan demikian sebab, jika asumsi tidak terpenuhi, nilai a dan b besar kemungkinannya tidak merupakan nilai yang sebenarnya.
49
sebutan asumsi klasik. 14 Asumsi-asumsi yang harus dipenuhi dalam OLS ada 3 asumsi, yaitu: 1). Asumsi nilai harapan bersyarat (conditional expected value) dari ei, dengan syarat X sebesar Xi, mempunyai nilai nol. 2). Kovarian ei dan ej mempunyai nilai nol. Nilai nol dalam asumsi ini menjelaskan bahwa antara ei dan ej tidak ada korelasi serial atau tida berkorelasi (autocorrelation). 3). Varian ei dan ej sama dengan simpangan baku (standar deviasi). Asumsi 1,2,3, di atas diringkas sebagai berikut: Asumsi
Dinyatakan E
1
E (ei/Xi) = 0
2
Kov (ei , ej) = 0, Kov (Yi , Yj) = 0, i ≠ j i≠ j Var (ei/Xi) = σ 2 Var (Yi/Xi) = σ 2
3
dalam Dinyatakan dalam Y
E (Yi/Xi) = A + Bxi
Digunakan untuk membahas Multikolinearitas Autokorelasi Heteroskedas -tisitas
Penjelasan asumsi-asumsi ini secara rinci akan dibahas pada bab tersendiri tentang Multikolinearitas, Autokorelasi, dan Heteroskedastisitas. Prinsip-prinsip Metode OLS
14
Disebut klasik karena penemuannya pada jaman klasic (classic era), modelnya sering juga disebut sebagai model regresi klasik, baku, umum (classic, standard, general). Lihat Supranto (1983:73).
50
Perlu diketahui bahwa dalam metode OLS terdapat prinsip-prinsip antara lain: 1. Analisis dilakukan dengan regresi, yaitu analisis untuk menentukan hubungan pengaruh antara variabel bebas terhadap variabel terikat. Regresi sendiri akan menghitung nilai a, b, dan e (error), oleh karena itu dilakukan dengan cara matematis. 2. Hasil regresi akan menghasilkan garis regresi. Garis regresi ini merupakan representasi dari bentuk arah data yang diteliti. Garis regresi disimbolkan dengan Yˆ (baca: Y topi, atau Y cap), yang berfungsi sebagai Y perkiraan. Sedangkan data disimbolkan dengan Y saja. Perlu diingat, bahwa dalam setiap data tentu mempunyai lokus sebaran yang berbeda dengan yang lainnya, ada data yang tepat berada pada garis regresi, tetapi ada pula yang tidak berada pada garis regresi. Data yang tidak berada tepat pada garis regresi akan memunculkan nilai residual yang biasa disimbulkan dengan ei, atau sering pula disebut dengan istilah kesalahan pengganggu. Untuk data yang tepat berada pada garis maka nilai Y sama dengan Yˆ . Nilai a dalam garis regresi digunakan untuk menentukan letak titik potong garis pada sumbu Y. Jika nilai a > 0 maka letak titik potong garis regresi pada sumbu Y akan berada di atas origin (0), apabila nilai a < 0 maka titik potongnya akan berada di bawah origin (0). Nilai b atau disebut koefisien regresi berfungsi untuk menentukan tingkat kemiringan garis regresi. Semakin rendah
51
nilai b, maka derajat kemiringan garis regresi terhadap sumbu X semakin rendah pula. Sebaliknya, semakin tinggi nilai b, maka derajat kemiringan garis regresi terhadap sumbu X semakin tinggi. Gambaran uraian di atas dapat dilihat pada gambar berikut:
Y Yˆi = a + bX i
.
Y1
a
.
. . . . e . . o . b
0
e
. .
X1
X
Munculnya garis Yˆi = a + bX i seperti dalam gambar di atas, didapatkan dari memasukkan angka Xi ke dalam persamaan Yi = a + bXi +e. Dengan menggunakan hasil hitungan pada data di atas, maka garis Yˆi = a + bX i besarnya adalah: Yˆi = −9,525 + 1,449X i
Karena nilai a dalam garis regresi bertanda negatif (-) dengan angka 9,525, maka garis regresi akan memotong sumbu Y dibawah origin (0) pada angka – 9,525. Nilai parameter b variabel X yang besarnya 1,449 menunjukkan arti bahwa variabel X tersebut tergolong elastis, karena nilai b > 1. Artinya, setiap
52
perubahan nilai X akan diikuti perubahan yang lebih besar pada nilai Y. Tanda positif pada parameter b tersebut menunjukkan bahwa jika variabel X meningkat maka Y juga akan meningkat. Sebaliknya, jika X mengalami perubahan yang menurun, maka Y juga akan menurun, dengan perbandingan perubahan 1:1,449.
Ingat Elastisitas Jenis Elastisitas Elastik
Koefisien Elastisitas E>1
Elastik Unitary
E=1
Inelastik
E<1
Sifat Elastisitas Perubahan yang terjadi pada variabel bebas diikuti dengan perubahan yang lebih besar pada variabel terikat Perubahan yang terjadi pada variabel bebas diikuti dengan perubahan yang sama besar pada variabel terikat Perubahan yang terjadi pada variabel bebas diikuti dengan perubahan yang lebih kecil pada variabel terikat
Tanda (+) pada koefisien regresi menunjukkan hubungan yang searah. Artinya, jika variabel bebas meningkat, maka variabel terikat juga meningkat. Demikian pula sebaliknya. Tanda (-) pada koefisien regresi menunjukkan hubungan yang berlawanan. Artinya, jika variabel bebas meningkat, maka variabel terikat akan menurun. Demikian pula sebaliknya.
53
Menguji Signifikansi Parameter Penduga Seperti dijelaskan di muka, dalam persamaan fungsi regresi OLS variabelnya terbagi menjadi dua, yaitu: variabel yang disimbolkan dengan Y (yang terletak di sebelah kiri tanda persamaan) disebut dengan variabel terikat (dependent variable). Variabel yang disimbolkan dengan X (disebelah kanan tanda persamaan) disebut dengan variabel bebas (independent variable). Utamanya metode OLS ditujukan tidak hanya menghitung berapa besarnya a atau b saja, tetapi juga digunakan pula untuk menguji tingkat signifikansi dari variabel X dalam mempengaruhi Y. Pengujian signifikansi variabel X dalam mempengaruhi Y dapat dibedakan menjadi dua, yaitu: 1) pengaruh secara individual, dan 2) pengaruh secara bersama-sama. Pengujian signifikansi secara individual pertama kali dikembangkan oleh R.A. Fisher, dengan alat ujinya menggunakan pembandingan nilai statistik t dengan nilai t tabel. Apabila nilai statistik t lebih besar dibandingkan dengan nilai t tabel, maka variabel X dinyatakan signifikan mempengaruhi Y. Sebaliknya, jika nilai statistik t lebih kecil dibanding dengan nilai t tabel, maka variabel X dinyatakan tidak signifikan mempengaruhi Y. Metode dengan membandingkan antara nilai statistik (nilai hitung) dengan nilai tabel seperti itu digunakan pula pada pengujian signifikansi secara serentak atau secara bersama-sama. Hanya saja untuk pengujian secara bersama-sama menggunakan alat uji pembandingan nilai F. Hal Pengujian ini dikembangkan oleh Neyman dan Pearson. Hal mendasar yang membedakan antara penggunaan uji t dan uji F terletak pada jumlah variabel bebas yang diuji signifikansinya dalam mempengaruhi Y. Jika hanya menguji signifikansi satu variabel bebas saja, 54
maka yang digunakan adalah uji t. Oleh karena itu disebut sebagai uji signifikansi secara individual. Sedangkan pengujian signifikansi yang menggunakan lebih dari satu variabel bebas yang diuji secara bersama-sama dalam mempengaruhi Y, maka alat ujinya adalah menggunakan uji F. Sebagai perbandingan antara penggunaan uji t dan uji F dapat dilihat pada tabel berikut:
Tabel. 2. Pembandingan antara uji t dan uji F Hal yang dibandingkan Penemu Signifikan Tidak signifikan Pengujian Banyaknya variabel
Uji t R.A. Fisher t hitung > t tabel t hitung < t tabel Individual Satu
Uji F Neyman, Pearson F hitung > F tabel F hitung < F tabel Serentak Lebih dari satu
Uji t Untuk menguji hipotesis bahwa b secara statistik signifikan, perlu terlebih dulu menghitung standar error atau standar deviasi dari b. Berbagai software komputer telah banyak yang melakukan penghitungan secara otomatis, tergantung permintaan dari user. Namun perlu bagi kita untuk mengetahui formula dari standar error dari b, yang ternyata telah dirumuskan sebagai berikut:
∑ (Y − Yˆ ) (n − k )∑ (X − X ) 2
Sb =
t
t
2
t
Atau dapat ditulis pula dengan rumus sebagai berikut:
55
Sb =
∑e (n − k )∑ (X
2 t
− X)
2
t
Dimana: Yt dan Xt adalah data variabel dependen dan independen pada periode t Yˆt adalah nilai variabel dependen pada periode t yang didapat dari perkiraan garis regresi X merupakan nilai tengah (mean) dari variabel independen e atau Yt − Yˆt merupakan error term n adalah jumlah data observasi k adalah jumlah perkiraan koefisien regresi yang meliputi a dan b (n-k) disebut juga dengan degrees of freedom (df). Guna menghitung standar deviasi dari data yang tersedia berdasar rumus di atas, maka diperlukan menghitung nilai Yˆt terlebih dulu, untuk mempermudah penghitungan e atau Yt − Yˆt . Caranya adalah memasukkan nilai X ke dalam hasil regresi yang di hasilkan di atas. Dengan demikian tabel data akan menghasilkan kolom Yˆt sebagaimana tertera pada tabel di bawah ini.
56
Bantuan dengan SPSS • Uji t dapat dilihat dalam output hasil regresi dengan SPSS pada tabel Coefficient. • Uji F dapat dilihat dalam output hasil regresi dengan SPSS pada tabel ANOVA. • Kolom Sig. baik pada tabel Coefficient maupun ANOVA menunjukkan tingkat signifikansi pada derajat kesalahan (α) tertentu. Misal, kolom Sig. menunjukkan angka 0,04 itu berarti bahwa tingkat kesalahannya mencapai 4%. Angka sebesar itu dapat dikatakan signifikan jika derajat kesalahan (α) telah ditentukan sebesar 0,05. Tetapi jika α ditentukan 0,01 maka angka tersebut tidak signifikan.
Tabel pengembangan data untuk menghitung Standar Deviasi X1 13.06 13.81 13.97 13.79 14.03 14.14 14.39 14.97 15.67 15.91 16.02 16.21 16.19
Y 8.28 9.14 10.62 10.51 10.82 12.11 13.04 12.23 13.01 12.47 12.91 12.55 14.42
Yˆ 9.413 10.501 10.733 10.472 10.820 10.979 11.342 12.183 13.198 13.546 13.705 13.981 13.952
(Y − Yˆ ) (Y − Yˆ ) (X − X ) (X − X ) 2
-1.133 -1.361 -0.113 0.038 0.001 1.131 1.699 0.047 -0.188 -1.076 -0.795 -1.431 0.468
57
1.284 1.851 0.013 0.001 0.000 1.279 2.885 0.002 0.035 1.157 0.632 2.046 0.219
2
-1.68 -0.93 -0.77 -0.95 -0.71 -0.60 -0.35 0.23 0.93 1.17 1.28 1.47 1.45
2.82 0.86 0.59 0.90 0.50 0.36 0.12 0.05 0.86 1.37 1.64 2.16 2.10
15.88 15.76 15.55 15.16 14.85 14.22 13.93 13.58 13.13 324.22
15.13 14.08 13.3 12.93 11.48 10.05 10.6 10.48 10.33 260.49
13.502 13.328 13.024 12.458 12.009 11.095 10.675 10.167 9.515 260.591
1.628 0.752 0.277 0.472 -0.528 -1.045 -0.075 0.313 0.816 -0.101
2.650 0.566 0.076 0.223 0.279 1.092 0.006 0.098 0.665 17.060
1.14 1.02 0.81 0.42 0.11 -0.52 -0.81 -1.16 -1.61 -0.06
1.30 1.04 0.66 0.18 0.01 0.27 0.66 1.35 2.59 22.41
Dengan adanya pengembangan data menjadi seperti tertera pada tabel di atas, maka Sb dapat segera dicari, dimana hasilnya ditemukan sebesar: Sb =
=
17.06 20(22.41) 17.06 448.2
= 0.195 Selain dicari dengan rumus seperti di atas, Sb dapat pula dicari melalui jalan lain dengan rumus yang dapat dituliskan sebagai berikut: Sb =
s e2 ∑ xi2
Bila kita hendak menggunakan rumus ini, maka perlu terlebih dulu mencari nilai S e2 yang dapat dicari dengan membagi nilai total ei2 dengan n-2. Jadi S e2 dapat dicari dengan rumus sebagai berikut: 58
s e2 =
∑e
2 i
n−2
Agar rumus ini dapat langsung digunakan, tentu terlebih dulu harus mencari nilai total ei2 yang dapat dicari melalui rumus berikut ini: Rumus mencari nilai total ei2 : ∑ ei2 = ∑ yi2 − b 2 ∑ xi2 Dengan memasukkan nilai komponen rumus yang telah didapatkan melalui hitungan-hitungan terdahulu, maka nilai ei2 dapat diketahui, yaitu: ei2 = 64.16 – 2.1019 (22.41)
= 64.16 – 47.1040 = 17.056 Hitungan di atas telah memastikan bahwa nilai ei2 adalah sebesar 17,056. Dengan diketemukannya nilai ei2 ini maka nilai s e2 pun dapat diketahui melalui hitungan sebagai berikut: 2 e
s =
∑e
2 i
n−2
=
17.056 22 − 2
=
17.056 20
= 0.8528 59
Karena nilai se2 merupakan salah satu komponen untuk mencari nilai Sb, maka dengan ditemukannya nilai s e2 sebesar 0,8528 tentu saja nilai Sb pun dapat diketahui, yaitu: Sb =
=
s e2 ∑ xi2 0.8528 22.41
= 0.195 Hitungan dengan rumus ini ternyata menghasilkan nilai Sb yang sama besar dengan hitungan menggunakan rumus yang pertama, yaitu nilai Sb sebesar 0,195. Dengan diketahuinya nilai Sb, maka nilai statistik t (baca: t hitung) dapat ditentukan, karena rumus mencari t hitung adalah: t=
b sb
Jadi, nilai t hitung variabel X adalah sebesar: t =
1.4498 0.195
= 7.4348 Penghitungan nilai t dengan cara yang dilakukan di atas, menunjukkan bahwa nilai statistik t sebesar
60
7,4348. Angka tersebut umumnya disebut pula sebagai nilai t hitung. Besarnya angka t hitung ini yang menentukan signifikan tidaknya variabel X dalam mempengaruhi variabel Y. Cara menentukan signifikan tidaknya nilai t tersebut adalah melalui pembandingan antara nilai t hitung dengan nilai t tabel. Nilai t tabel sebenarnya telah ditentukan pada tabel t student yang telah ditetapkan oleh para penemunya. Karena untuk menentukan signifikan tidaknya nilai t hitung adalah melalui upaya membandingkan dengan nilai t tabel, maka dapat diketahui bahwa, jika nilai t hitung > t tabel, maka signifikan. Jika nilai t hitung < t tabel, maka tidak signifikan. Dengan menggunakan contoh data di atas, seandainya kita menggunakan derajat kesalahan yang ditolerir adalah 5 % (baca: α = 0,05), dan karena jumlah observasi adalah sebanyak 22 (baca: n=22), maka degree of freedom (df) sama dengan sebesar nk = 20, karena jumlah k adalah 2, yaitu 1 parameter a dan 1 parameter b, maka nilai t tabelnya adalah sebesar 1,725. (Lihat data t tabel di halaman lampiran). Nilai t tabel yang besarnya 2,086, sudah tentu angka tersebut lebih kecil dibanding dengan nilai t hitung yang besarnya 7,4348. Atas dasar itu dapat dipastikan bahwa variabel X (budep) signifikan mempengaruhi Y (inflasi). Gambaran pengujian nilai t dapat disimak melalui gambar di bawah ini:
61
Daerah diterima Daerah Ditolak
Daerah Ditolak
-t α/2; (n-k-1)
t α /2; (n-k-1)
-1,725
1,725
Gb.3.1. Daerah Uji t
Gambar di atas menunjukkan pengujian nilai t dua arah atau two sided atau two tail test. Kutub sebelah kiri bertanda negatif. Nilai t hitung bertanda negatif yang nilainya lebih kecil dari nilai –2.806 berada pada daerah ditolak. Kutub sebelah kanan yang bertanda positif berguna sebagai pembatas nilai t hitung yang lebih kecil dari 1,725 berarti berada di daerah tolak. Tanda -t α/2 atau t α/2 memberikan arti bahwa masing-masing kutub mempunyai daerah distribusi tolak sebesar 2,5%. Jumlah dari keduanya mencerminkan α = 5%. Jika pengujian nilai t menggunakan pengujian satu arah atau one tail test, maka daerah tolak hanya ada pada salah satu kutub saja. Bilai nilai t hitungnya negatif, maka daerah tolak berada pada sebelah kiri kurva, sedang bila nilai t hitungnya positif, maka daerah tolak berada pada sisi sebelah kanan. Probabilitas daerah tolak tidak lagi terbagi menjadi dua dengan porsi masing-masing 2,5%, tetapi telah penuh sebesar 5%.
62
Interpretasi Hasil regresi Setelah tahapan analisis regresi dilakukan sesuai dengan teori-teori yang relevan, langkah terpenting berikutnya adalah menginterpretasi hasil regresi. Interpretasi yang dimaksudkan disini adalah mengetahui informasi-informasi yang terkandung dalam hasil regresi melalui pengartian dari angka-angka parameternya. Dengan mengambil hitungan dari contoh kasus di atas, maka hasil analisis regresi atas pengaruh variabel suku bunga (Budep) (X) terhadap tingkat inflasi di Indonesia selama 22 bulan mulai dari Januari 2001 hingga Oktober 2002 (Inflasi) (Y) dapat ditulis dalam persamaan sebagai berikut: Inflasi = -9,5256 + 1,4498 Budep + e
thit =
(7,4348)
Persamaan di atas menginformasikan bahwa variabel Budep signifikan mempengaruhi variabel Inflasi. Terbukti dari nilai thit variabel Budep sebesar 7,4348 lebih besar dibanding nilai ttabel, pada α=5% dengan d.f. sebanyak 20, yang besarnya 1,725. Nilai b Budep yang besarnya 1,4498 menginformasikan bahwa setiap Budep meningkat 1%, maka Inflasi akan mengalami peningkatan sebesar 1,4498%. Sebaliknya, apabila Budep turun sebesar 1% maka Inflasi juga akan mengalami penurunan sebesar 1,4498%. Perlu diingat bahwa nilai b juga mencerminkan tingkat elastisitas variabel X. Karena nilai b (1,4498) lebih besar dari angka 1 (satu), maka dapat dipastikan bahwa variabel Budep sangat elastis 15. Artinya, besarnya tingkat perubahan yang terjadi pada Budep akan
15
Standar elastisitas dapat diketahui dari: jika E>1 = elastis, E=1 =uniter elastis, E<1 = inelastis.
63
mengakibatkan tingkat perubahan yang lebih besar pada variabel Y (Inflasi). Koefisien Determinasi (R2) Pembahasan hasil regresi di atas menunjukkan seberapa besar nilai a, b, dan t. Nilai a menjelaskan tentang seberapa besar faktor-faktor yang bersifat tetap mempengaruhi inflasi, sedangkan nilai b mencerminkan tingkat elastisitas variabel X. Nilai t sendiri mempertegas signifikan tidaknya variabel X dalam mempengaruhi Y. Dari beberapa nilai yang didapatkan tersebut, belum diperoleh keterangan tentang berapa besar pengaruh X (budep) terhadap Y (inflasi). Sebagai ilustrasi, seandainya Y (inflasi) diibaratkan dengan gelas, dan variabel X (Budep) sebagai air, maka hitungan-hitungan yang dilakukan di atas belum mampu memberikan informasi tentang seberapa banyak air yang ada dalam gelas tersebut. Untuk memperoleh keterangan banyaknya isi (air) yang ada dalam gelas, atau seberapa besar pengaruh X (Budep) terhadap Y (Inflasi), maka perlu dilakukan penghitungan koefisien determinasi, yang biasa disimbolkan dengan R2 (baca: R square). Koefisien determinasi (R2) pada intinya mengukur seberapa jauh kemampuan model dalam menerangkan variasi variabel terikat. Besarnya nilai koefisien determinasi adalah di antara nol dan satu (0
64
Dengan kalimat lain dapat dijelaskan bahwa koefisien determinasi (R2) adalah angka yang menunjukkan proporsi variabel dependen yang dijelaskan oleh variasi variabel independen. Juga, dapat digunakan sebagai ukuran ketepatan dalam menentukan prediktor. Artinya, R2 menunjukkan seberapa besar sumbangan X terhadap Y. Untuk menentukan koefisien determinasi (R2) pada regresi linier sederhana, dapat dihitung dengan rumus sebagai berikut: ⎡
R2 = ⎢
n ∑ XY − ∑ X ∑Y
[
2 2 2 2 ⎢ ⎣ n ∑ X − (∑ X ) ] [n ∑Y − (∑Y )
]
⎤ ⎥ ⎥ ⎦
Rumus ini jika digunakan untuk menghitung data yang telah tersedia di atas, maka akan menghasilkan nilai sebagai berikut: 2
R =
⎡ 22 (3.871,4) − 324,22(260,49) ⎢ ⎢ 22(4.800,53) − (324,22) 2 ] [22(3.148,48) − (260,49)2 ⎣
[
]
⎤ ⎥ ⎥ ⎦
⎤ ⎡ 714,73 ⎤ ⎥ = ⎢ ⎥ ⎣ 22,20 x 37,57 ⎦ ⎢⎣ [493,06] [1.411,52] ⎥⎦ ⎡
R2 = ⎢
714,73
⎡ 714,73 ⎤
R2 = ⎢ ⎥ = 0,857 ⎣ 834,05 ⎦ Angka koefisien determinasi (R2) yang besarnya 0,857 ini bila ditulis dalam bentuk prosentase sama dengan 85,7%. Angka tersebut menjelaskan bahwa determinasi atau sumbangan variabel Bunga deposito 65
(budep) terhadap inflasi adalah sebesar 87,5%. Artinya, sumbangan faktor-faktor lain (selain Budep) terhadap Inflasi hanya sebesar 14,3%. Dengan demikian dapat disimpulkan bahwa Budep merupakan prediktor yang baik untuk menaksir Inflasi. Bantuan dengan SPSS • R2 (baca: R square) atau koefisien determinasi dapat dilihat dalam output hasil regresi dengan SPSS pada tabel model summary. • Misalkan angka R2 menunjukkan angka 0.734 menunjukkan arti bahwa determinasi dari variabel bebas terhadap variabel terikat adalah sebesar 73,4%. • Ibarat air dalam gelas, variabel terikat (Y) adalah gelasnya dan air adalah variabel bebasnya (X). Terkait dengan angka 0,734 maka air dalam gelas adalah sebanyak 73,4% dari gelas tersebut.
Analisis regresi pada dasarnya adalah menjelaskan berapa besar pengaruh tingkat signifikansi variabel independen dalam mempengaruhi variabel dependen. Meskipun hasil regresi seperti tertera pada persamaan di atas telah dapat diinterpretasi, dan dapat menunjukkan inti tujuan analisis regresi, namun bukan berarti bahwa tahapan analisis telah selesai hingga di sini. Hasil regresi di atas masih perlu dipastikan apakah besarnya nilai thit ataupun angka-angka parameter telah valid ataukah masih bias. Jika nilai-nilai tersebut sudah dapat dipastikan valid atau tidak bias, memang analisis regresi dapat berhenti di
66
sini saja. Tetapi, jika nilai-nilai belum dapat dipastikan valid, maka perlu dilakukan langkah-langkah analisis lanjutan untuk menjadikan parameter-parameter tersebut menjadi valid. Validitas (ketidakbiasan) informasi dari nilai-nilai hasil regresi dapat diketahui dari terpenuhinya asumsi-asumsi klasik, yaitu jika data variabel telah terbebas dari masalah Autokorelasi, tidak ada indikasi adanya heteroskedastisitas, maupun tidak terjadi multikolinearitas atau saling berkolinear antar variabel. Bahasan Asumsi Klasik akan dibahas tersendiri. -000Tugas: 1. Buatlah rangkuman dari pembahasan di atas! 2. Cobalah untuk menyimpulkan maksud dari uraian bab ini! 3. Jawablah pertanyaan-pertanyaan di bawah ini: a. Coba jelaskan apa yang dimaksud dengan regresi linier sederhana! b. Coba tuliskan model regresi linier sederhana! c. Coba uraikan arti dari notasi atas model yang telah anda tuliskan! d. Jelaskan informasi apa yang dapat diungkap pada konstanta! e. Jelaskan informasi apa yang dapat diungkap pada koefisien regresi! f. Jelaskan kegunaan standar error Sb! g. Jelaskan kegunaan nilai t! h. Coba uraikan bagaimana menentukan nilai t yang signifikan! i. Jelaskan Apa yang dimaksud dengan koefisien determinasi!
67
BAB IV REGRESI LINIER BERGANDA
Tujuan Pengajaran: Setelah mempelajari bab ini, anda diharapkan dapat: Mengetahui kegunaan dan spesifikasi model Menjelaskan hubungan antar variabel Mengaitkan data yang relevan dengan teori Mengembangkan data Menghitung nilai parameter Mengetahui arti dan fungsi parameter Menentukan signifikan tidaknya variabel bebas Menentukan determinasi model Menjelaskan tahapan-tahapan regresi Membaca hasil regresi Menyebutkan asumsi-asumsi. Membedakan dengan regresi linier sederhana
68
BAB IV REGRESI LINIER BERGANDA Pengertian Regresi linier Berganda Pada bab sebelumnya telah dibahas tentang regresi linier dengan 2 (dua) variabel (yaitu variabel Y dan X) atau biasa disebut dengan single linier regression. Pada bab ini jumlah variabel yang digunakan akan ditambah menjadi lebih banyak, yaitu satu variabel Y dan jumlah variabel X nya lebih dari 1 (satu) variabel. Artinya, variabel X bisa berjumlah 2, 3, atau lebih. Jumlah X yang lebih dari satu tersebut terkenal dengan istilah Regresi Linier Berganda atau multiple linier regression. Bertambahnya jumlah variabel X hingga lebih dari satu sangat memungkinkan, karena dalam keilmuan sosial semua faktor-vaktor atau variabel-variabel saling berkaitan satu dengan lainnya. Sebagai misal, munculnya inflasi tentu tidak hanya dipengaruhi oleh bunga deposito (budep) saja seperti yang telah diterangkan di atas, tetapi sangat mungkin dipengaruhi oleh faktor lain seperti perubahan nilai tukar (kurs), jumlah uang beredar, kelangkaan barang, dan lain-lain. Sebagaimana dalam teori inflasi, inflasi dapat digolongkan sebagai inflasi karena tarikan permintaan dan inflasi desakan biaya. Inflasi tarikan permintaan terjadi apabila masyarakat banyak memegang uang. Tentu secara singkat dapat diartikan bahwa terdapat jumlah kelebihan jumlah uang beredar yang ada di masyarakat. Selain itu dapat pula disebabkan ekspektasi masyarakat akibat adanya perubahan nilai tukar uang. Seperti yang pernah terjadi di Indonesia dalam kurun waktu pertengahan Juni
69
1997 hingga 2003, gerakan lonjakan inflasi ternyata terjadi pula pada gerakan lonjakan nilai tukar rupiah (IDR) terhadap dollar Amerika Serikat (USD). Inflasi desakan biaya mempunyai sebab yang hampir serupa. Inflasi jenis ini terjadi akibat melonjaknya harga-harga faktor produksi. Kalau ditelusuri, melonjaknya hargaharga faktor produksi dapat disebabkan banyak hal seperti semakin langkanya jenis barang, tuntutan kenaikan gaji pekerja, semakin mahalnya ongkos transportasi, atau bisa juga disebabkan oleh adanya perubahan nilai tukar mata uang juga. Dari uraian singkat ini dapat disimpulkan bahwa pemicu terjadinya inflasi desakan biaya karena perubahan pada sisi supply, sedang inflasi tarikan permintaan disebabkan perubahan pada sisi demand. Berbagai alasan yang dijelaskan di atas, maka untuk semakin memperjelas perihal terjadinya inflasi, dapat dicoba menambah satu variabel penduga (X2) yaitu Kurs, yang menggambarkan nilai tukar IDR terhadap USD, pada kurun waktu yang sama dengan data sebelumnya yaitu antara Januari 2001 hingga Oktober 2002. Karena jumlah variabel X tidak lagi satu melainkan sudah dua, maka analisa yang akan digunakan adalah analisa regresi linier berganda. Dengan bertambahnya variabel Kurs sebagai variabel penduga, maka data yang dianalisis pun bertambah hingga menjadi sebagai berikut:
70
X1 (Budep) 13.06 13.81 13.97 13.79 14.03 14.14 14.39 14.97 15.67 15.91 16.02 16.21 16.19 15.88 15.76 15.55 15.16 14.85 14.22 13.93 13.58 13.13 324.22
Y (Inflasi) 8.28 9.14 10.62 10.51 10.82 12.11 13.04 12.23 13.01 12.47 12.91 12.55 14.42 15.13 14.08 13.3 12.93 11.48 10.05 10.6 10.48 10.33 260.49
X2 (Kurs) 9433.25 9633.78 10204.7 11074.75 11291.19 11294.3 10883.57 8956.59 9288.05 10097.91 10554.86 10269.42 10393.82 10237.42 9914.26 9485.82 9115.05 8688.65 8964.7 8928.41 8954.43 9151.73 216816.7
Perubahan model dari bentuk single ke dalam bentuk multiple mengalami beberapa perubahan, meliputi: 1) jumlah variabel penjelasnya bertambah, sehingga spesifikasi model dan data terjadi penambahan. 2) rumus penghitungan nilai b mengalami perubahan, 3) jumlah degree of freedom dalam menentukan nilai t juga berubah.
71
Model Regresi Linier Berganda Penulisan model regresi linier berganda merupakan pengembangan dari model regresi linier tunggal. Perbedaannya hanya terdapat pada jumlah variabel X saja. Dalam regresi linier tunggal hanya satu X, tetapi dalam regresi linier berganda variabel X lebih dari satu. Model regresi linier umumnya dituliskan sebagai berikut: Populasi: BnXn + e
Y = A + B1X1 + B2X2 + B3X3 + ………+
Atau BnXn + e
Y = B0 + B1X1 + B2X2 + B3X3 + ………+
Sampel : +e
Y = a + b1X1 + b 2X2 + b 3X3 + ………+ b nXn
Atau nXn + e
Y = b0 + b1X1 + b 2X2 + b 3X3 + ………+ b
Perlu diingat bahwa penulisan model sangat beragam. Hal ini dapat dimengerti karena penulisan model sendiri hanya bertujuan sebagai teknik anotasi untuk memudahkan interpretasi. Penulisan cara di atas adalah bentuk model yang sering dijumpai dalam beberapa literatur. Notasi model seperti itu tentu berbeda dengan notasi model Yale 16. Apabila kita ingin menganalisis pengaruh Budep dan Kurs terhadap Inflasi dengan mengacu model Yale, maka notasi model menjadi seperti berikut: Populasi:
Y = B1.23 + B12.3X2i + B13.2X3i + e
Sampel :
Y = b1.23 + b12.3X2i + b13.2X3i + e
16
G.U. Yale, On the Theory of Correlation for any Number of Variables, Treated by a new System of Notation, Preceeding of Royal Society, A, Vol.79, 1970.
72
Notasi model Yale ini mempunyai spesifikasi dalam menandai variabel terikat yang selalu dengan angka 1. Untuk variabel bebas notasinya dimulai dari angka 2, 3, 4, dan seterusnya. 17 Notasi b1.23 berarti nilai perkiraan Y kalau X2 dan X3 masing-masing sama dengan 0 (nol). Notasi b12.3 berarti besarnya pengaruh X2 terhadap Y jika X3 tetap. Notasi b13..2 berarti besarnya pengaruh X3 terhadap Y jika X2 tetap. Penulisan model dengan simbol Y untuk variabel dependen, dan X untuk variabel independen, saat ini mulai ada penyederhanaan lagi, yang intinya untuk semakin memudahkan interpretasi. Berdasar pada keinginan mempermudah dalam mengingat variabel yang akan dibahas, maka notasi model dapat pula ditulis sebagai berikut: Inflasi
=
b0 + b1Budep + b2 Kurs + ε
...............................
(Pers.f.2)
Penulisan dengan gaya seperti ini ternyata sekarang lebih disukai oleh penulis-penulis saat ini, karena memberikan kemudahan bagi para pembacanya untuk tidak mengingatingat arti dari simbol X yang dituliskan, tetapi cukup dengan melihat nama variabelnya. Dengan pertimbangan tersebut maka cara ini nanti juga akan banyak digunakan dalam pembahasan selanjutnya. Penghitungan Nilai Parameter Penggunaan metode OLS dalam regresi linier berganda dimaksudkan untuk mendapatkan aturan dalam 17
Penulisan model seperti ini ditemui pula dalam buku-buku karya Gujarati
73
mengestimasi parameter yang tidak diketahui. Prinsip yang terkandung dalam OLS sendiri adalah untuk meminimalisasi perbedaan jumlah kuadrat kesalahan (sum of square) antara nilai observasi Y dengan Yˆ . Secara matematis, fungsi minimalisasi sum of square ditunjukkan dalam rumus:
∑ e 2 (b0, b1,b2) =
n
∑ (Y − Yˆ )
2
n=1
n
=
∑ (Y − b
0
− b1 X 1 − b2 X 2 ) 2
n=1
Untuk mendapatkan estimasi least square b0, b1,b2 minimum, dapat dilakukan melalui cara turunan parsial (partially differentiate) dari formula di atas, sebagai berikut: ∂∑ e 2 ∂b0
∂∑ e 2 ∂b1
∂∑ e 2 ∂b2
= 2nb0 + 2b1 ∑ X 1 + 2b2 ∑ X 2 − 2∑ Y = 2b0 ∑ X 1 + 2b1 ∑ X 12 + 2b2 ∑ X 1 X 2 − 2∑ X 1Y = 2b0 ∑ X 2 + 2b1 ∑ X 1 X 2 + 2b2 ∑ X 22 − 2∑ X 2Y
Jadikan nilai-nilai turunan parsial di atas menjadi sama dengan 0 (nol), dengan cara membagi dengan angka 2, hingga menjadi: nb0 + ∑ X 1b1 + ∑ X 2 b2 =
∑X b +∑X 1 0
b + ∑ X 1 X 2 b2
2 1 1
∑Y =∑X Y 1
74
∑X
b + ∑ X 1 X 2 b1 + ∑ X 22 b2 = ∑ X 2Y
2 0
Untuk menyederhanakan rumus paling atas dilakukan pembagian dengan n, sehingga memperoleh rumus baru sebagai berikut: b0 + b1 X 1 + b2 X 2 = Y b0 = Y − b1 X 1 − b2 X 2
Kalau kita notasikan: y = Y −Y x1 = X 1 − X 1 x2 = X 2 − X 2
maka b1 dan b2 dapat dicari dengan rumus:
b1 = b2 =
(∑ x1 y )(∑ x 22 ) − (∑ x 2 y )(∑ x1 x 2 ) (∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2
(∑ x 2 y)(∑ x12 ) − (∑ x1 y)(∑ x1 x 2 ) (∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2
Telah dikemukaan di atas bahwa pencarian nilai b pada single linier berbeda dengan multiple linier. Perbedaan ini muncul karena jumlah variabel penjelasnya bertambah. Semakin banyaknya variabel X ini maka kemungkinan-kemungkinan yang menjelaskan model juga mengalami pertambahan. Dalam single linier kemungkinan perubahan variabel lain tidak terjadi, tetapi dalam multiple linier hal itu terjadi. Misalnya, Jika terjadi 75
perubahan pada X1, meskipun X2 konstan, akan mampu merubah nilai harapan dari Y. Begitu pula, perubahan pada X2, meskipun X1 konstan, akan mampu merubah nilai harapan dari Y. Perubahan yang terjadi pada X1 atau X2 tentu mengakibatkan perubahan nilai harapan Y atau E(Y/X1,X2) yang berbeda. Oleh karena itu pencarian nilai b mengalami perubahan. Guna mengetahui seberapa besar kontribusi X1 terhadap perubahan Y, tentu perlu untuk melakukan kontrol pengaruh dari X2. Begitu pula, untuk mengetahui kontribusi X2, maka perlu juga melakukan kontrol terhadap X1. Dari sini dapat timbul pertanyaan, bagaimana caranya mengontrolnya? Untuk menjawabnya, perlu ilustrasi secara konkrit agar mudah dipahami. Misalnya kita hendak mengontrol pengaruh linier X2 ketika melakukan pengukuran dampak dari perubahan X1 terhadap Y, maka dapat melakukan langkah-langkah sebagai berikut: Tahap pertama: lakukan regresi Y terhadap X2. Y = b0 + b2 X2 + e1 Dimana e1 merupakan residual, yang besarnya: e1 = Y – b0 – b2X2 = Y- Yˆ Tahap kedua: lakukan regresi X1 terhadap X2 X1 = b0 + b2 X2 + e2 Dimana e1 merupakan residual, yang besarnya:
76
e2 = X1 – b0 – b2X2 = X1- Xˆ Tahap ketiga: lakukan regresi e1 terhadap e2 e1 = a0 + a1e2 +e3 Besarnya a1 pada tahap ketiga inilah yang merupakan nilai pasti atau net effect dari perubahan satu unit X1 terhadap Y, atau menunjukkan kemiringan (slope) garis Y atas variabel X1. Logika dari teori tersebut yang mendasari rumus yang dapat digunakan untuk menentukan koefisien regresi parsial (partial regression coefficients) (baca: b1, b2). Dengan memanfaatkan data yang telah tersedia, kita dapat pula menentukan nilai b1 variabel Budep maupun b2 variabel Kurs. Pencarian koefisien regresi tersebut dapat dilakukan dengan menggunakan rumus-rumus yang telah ditentukan di atas. Guna mempermudah dalam memasukkan angka-angka ke dalam rumus, maka data yang ada perlu diekstensifkan sesuai dengan kebutuhan rumus tersebut. Hasil ekstensifikasi dari beberapa rumus yang dicari sebagai berikut:
∑x
2 1
=∑X − 2 1
∑ x22 = ∑ X 22 −
(∑ X 1 ) 2 n (∑ X 2 ) 2
∑ x y = (∑ X Y ) − 1
∑x
2
n
(∑ X 1 )(∑ Y )
1
y = (∑ X 2 Y ) −
n (∑ X 2 )(∑ Y ) n
77
∑x x
1 2
= (∑ X 1 X 2 ) −
(∑ X 1 )(∑ X 2 ) n
Dengan menggunakan rumus-rumus tersebut di atas, maka nilai total masing-masing komponen rumus yang dikembangkan adalah tertera sebagai berikut: X1 324.22
Y X2 260.49 216,816.70
∑x
∑x
2 1
2 2
22.40 14,318,503.69
∑x y ∑x 1
32.48
y
∑x x
7,274.46
2,227.72
2
Berdasarkan data-data yang tertera dalam tabel di atas, maka nilai b0, b1, dan b2 dapat ditentukan, melalui pencarian menggunakan rumus-rumus sebagai berikut: Rumus untuk mencari nilai b1 (pada model multiple regression) adalah: b1=
(∑ x1 y)(∑ x 22 ) − (∑ x 2 y)(∑ x1 x 2 ) (∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2
Rumus untuk mencari nilai b2 (pada model multiple regression) adalah: b2 =
(∑ x 2 y)(∑ x12 ) − (∑ x1 y)(∑ x1 x 2 ) (∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2
Rumus untuk mencari nilai b0 (pada model multiple regression) adalah: b0 = Y − b1 X 1 − b2 X 2
Dengan menggunakan rumus pencarian b1 di atas, maka diketahui bahwa nilai b1 adalah:
78
1 2
b1 =
(∑ x1 y)(∑ x 22 ) − (∑ x 2 y)(∑ x1 x 2 ) (∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2
=
(32.49)(14.318.503,70) − (7.274,64)(2.227,72) (22,41)(14.318.503,70) − (2.227,72) 2
=
465.208.185,21 − 16.205.861,02 320.877.667,92 − 4.962.736,40
=
449.002.324,19 315.914.931,52
b1 = 1,421 Dengan menggunakan rumus pencarian b2 di atas, maka diketahui bahwa nilai b2 adalah:
b2 =
(∑ x 2 y)(∑ x12 ) − (∑ x1 y)(∑ x1 x 2 ) (∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2
=
(7.274,64)(22.41) − (32.49)(2.227,72) (22.41)(14.318.503,70) − (2.227.72) 2
=
163.024,68 − 72.378,62 320.877.667,92 − 4.962.736,40
=
90.646,06 315.914.931,52
= 0,0002869 atau dapat ditulis dengan 2,869E-04 Dengan menggunakan rumus pencarian b0 di atas, maka diketahui bahwa nilai b0 adalah: b0 = Y − b1 X 1 − b2 X 2
79
= 11,84-1,421(14,73)-0,0002869(9.855,30) = 11,84-20,93,2,827 = -11,917 Nilai dari parameter b1 dan b2 merupakan nilai dari suatu sampel. Nilai b1 dan b2 tergantung pada jumlah sampel yang ditarik. Penambahan atau pengurangan akan mengakibatkan perubahan rentangan nilai b. Perubahan rentang nilai b1 dan b2 diukur dengan standar error. Semakin besar standar error mencerminkan nilai b sebagai penduga populasi semakin kurang representatif. Sebaliknya, semakin kecil standar error maka keakuratan daya penduga nilai b terhadap populasi semakin tinggi. Perbandingan antara nilai b dan standar error ini memunculkan nilai t, yang dapat dirumuskan sebagai berikut: t=
b Sb
dimana: b = nilai parameter Sb = standar error dari b. Jika b sama dengan 0 (b=0) atau Sb bernilai sangat besar, maka nilai t akan sama dengan atau mendekati 0 (nol). Untuk dapat melakukan uji t, perlu menghitung besarnya standar error masing-masing parameter ( baik b0, b1, b2), seperti diformulakan Gujarati (1995:198-199) sebagai berikut:
S b0
⎡ 1 X 12 ∑ x 22 + X 22 ∑ x12 − 2X 1 X 2 ∑ x1 x 2 ⎤ ∑ E 2 = ⎢ + ⎥ ⎢⎣ n ∑ x12 ∑ x22 − (∑ x1 x2 ) 2 ⎦⎥ n − 3 80
S b1 =
S b2 =
∑x
2 2
∑E
2
∑E
2
(∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2 n − 3
∑x
2 1
(∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2 n − 3
Rumus-rumus di atas, dapat kita masuki dengan angka-angka yang tertera pada tabel, hanya saja belum semuanya dapat terisi. Kita masih memerlukan lagi angka untuk mengisi rumus ∑ e 2 . Untuk dapat mengisi rumus tersebut, perlu terlebih dulu mencari nilai e. Nilai e adalah standar error yang terdapat dalam persamaan regresi. Perhatikan persamaan regresi: Y = b0 + b1X1 + b2 X2 + e atau Inflasi = b0 + b1Budep + b2 Kurs + e Secara matematis, dari persamaan regresi di atas nilai e dapat diperoleh, dengan cara mengubah posisi tanda persamaan hingga menjadi: e = Y- (b0 + b1X1 + b2 X2) Dengan memasukkan nilai b0, b1, b2, yang telah didapatkan, dan X1i, X2i, yang ada pada data, maka nilai total e dapat terlihat pada tabel berikut:
81
X1 Y X2 13.06 8.28 9433.25 13.81 9.14 9633.78 13.97 10.62 10204.70 13.79 10.51 11074.75 14.03 10.82 11291.19 14.14 12.11 11294.30 14.39 13.04 10883.57 14.97 12.23 8956.59 15.67 13.01 9288.05 15.91 12.47 10097.91 16.02 12.91 10554.86 16.21 12.55 10269.42 16.19 14.42 10393.82 15.88 15.13 10237.42 15.76 14.08 9914.26 15.55 13.3 9485.82 15.16 12.93 9115.05 14.85 11.48 8688.65 14.22 10.05 8964.70 13.93 10.6 8928.41 13.58 10.48 8954.43 13.13 10.33 9151.73 324.22 260.49216816.70
B0 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933
B1 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421 1.421
B2 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287 0.000287
e e^2 -1.05 1.11 -1.31 1.73 -0.23 0.05 -0.33 0.11 -0.42 0.18 0.71 0.50 1.40 1.97 0.32 0.10 0.01 0.00 -1.10 1.21 -0.95 0.90 -1.50 2.24 0.37 0.13 1.56 2.43 0.77 0.60 0.41 0.17 0.71 0.50 -0.18 0.03 -0.80 0.63 0.18 0.03 0.55 0.30 0.98 0.96 0.09 15.90
Dari tabel di atas dapat diketahui bahwa nilai total nilai e adalah sebesar 0.09, sedangkan total nilai e2 adalah sebesar 15,90. Berdasarkan angka yang didapatkan tersebut, maka standar error b0, b1, b2, dapat dicari menggunakan rumus yang ada hingga hasil penghitungannya tertera sebagai berikut:
82
Mencari Sb0. S b0
⎡ 1 X 12 ∑ x 22 + X 22 ∑ x12 − 2X 1 X 2 ∑ x1 x 2 ⎤ ∑ e 2 = ⎢ + ⎥ ⎢⎣ n ⎥⎦ n − 3 ∑ x12 ∑ x22 − (∑ x1 x2 ) 2
⎡1 (14,74) 2 (14.318 .503,69) + (9.855,3) 2 (22,40) − 2(14,74)(9.855,3)(2.227 ,72) ⎤ 15,90 + ⎥ ⎢ (22,40)(14.318 .503,69) − (2.227 ,72) 2 ⎦ 22 − 3 ⎣ 22
= ⎡ 1 3.110.946.932,32 + 2.175.643.413,22 − 647.228.946,04 ⎤ 15,90 ⎥ ⎢ + 320.734.482.66 − 4.962.736,40 ⎦ 19 ⎣ 22 ⎡ 1 4.639.361.399,50 ⎤ 15,90 ⎢ 22 + 315.771.746,26 ⎥ 19 ⎦ ⎣
=
= (0.045 + 14,69) (0,84) = 3,84 (0,84) = 3,226 Mencari Sb1.
S b1 =
⎡
∑x
∑e
2 2
2
(∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2 n − 3
⎤ 15,9
14.318.503,69
= ⎢ 2 ⎥ ⎣ (22,40)(14.318.503,69) − (2.227,72) ⎦ 19 =
14.318.503,69 (0,84) 315.771.746,26
83
= 0,045(0.84) = 0,213 x 0,84 = 0,179 Mencari Sb2:
Sb2 =
∑x
∑e
2 1
2
(∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2 n − 3
⎡
⎤ 15,9
22,40
= ⎢ 2 ⎥ ⎣ (22,40)(14.318.503,69) − (2.227,72) ⎦ 19
=
22,40 (0,84) 315.771.746,26
= 0,000000070(0.84) = 0,000266 x 0,84 = 0,000223 Setelah diketahui semua nilai standar error (Sb0, Sb1, Sb2) melalui penggunaan rumus-rumus di atas, maka nilai t untuk masing-masing parameter dapat diperoleh, karena nilai t merupakan hasil bagi antara b dengan Sb. Pencarian nilai t mempunyai kesamaan dengan model regresi linier sederhana, hanya saja pencarian Sb nya yang berbeda. Pencarian masing-masing nilai t dapat dirumuskan sebagai berikut: Mencari nilai statistik tb0:
84
tb0 =
b0 Sb 0
Mencari nilai statistik tb1: t b1 =
b1 S b1
Mencari nilai statistik tb2: tb2 =
b2 ; Sb 2
Dengan menggunakan rumus-rumus di atas, maka nilai tb0 adalah:
tb0 =
−11,917 = -3,694 3,226
dan nilai tb1 adalah: t b1 =
1,421 =7,938 0,179
sedangkan nilai tb2 adalah: tb2 =
0,0002869 = 1,284 0,0002234
dengan diketahuinya nilai t hitung masing-masing parameter, maka dapat digunakan untuk mengetahui signifikan tidaknya variabel penjelas dalam mempengaruhi variabel terikat. Untuk dapat mengetahui apakah signifikan atau tidak nilai t hitung tersebut, maka perlu membandingkan dengan nilai t tabel. Apabila nilai t hitung lebih besar dibandingkan dengan nilai t tabel, maka variabel penjelas tersebut signifikan. Sebaliknya, jika nilai 85
t hitung lebih kecil darit tabel, maka variabel penjelas tersebut tidak signifikan. Karena nilai tb1 adalah sebesar 7,938, yang berarti lebih besar dibanding nilai tabel pada α=5% dengan df 19 yang besarnya 2,093, maka dapat dipastikan bahwa variabel budep secara individual signifikan mempengaruhi inflasi. Sedangkan nilai tb2 yang besarnya 1,284 adalah lebih kecil dibandingkan dengan nilai t tabel pada α =5% dengan df 19 yang besarnya 2,093, maka dapat dipastikan bahwa variabel Kurs secara individual tidak signifikan mempengaruhi inflasi. Pengujian kedua nilai t dapat dijelaskan dalam bentuk gambar sebagai berikut:
Daerah diterima 7,938 Gb.3.2.
Daerah ditolak t α /2; (n-k-1) 2,093
(+)
Daerah Uji t Variabel Budep
Daerah diterima Daerah ditolak 1,284 t α /2; (n-k-1) 2,093 Gb.3.2.
Daerah Uji t Variabel Kurs
86
(+)
Bantuan dengan SPSS Tahapan-tahan yang dilalui untuk melakukan regresi linier berganda dengan penghitungan-penghitungan nilai a, b, Sb di atas, dapat dilakukan dengan bantuan SPSS dengan tahapan sebagai berikut: • Pastikan data SPSS sudah siap • Lakukan regresi, caranya: pilih Analyze, Reression, Linear
• Masukkan variabel Y ke kotak variabel dependen, dan variabel X1 dan X2 ke kotak variabel Independen, kemudian klik OK.
87
• Hasil regresi akan tampak dalam output regression yang menunjukkan tabel: model summary (memuat R2), ANOVA (memuat nilai F), Coefficient (memuat nilai t). Model Summary
Model 1
R R Square .867a .752
Adjusted R Square .726
Std. Error of the Estimate .9148
a. Predictors: (Constant), X2, X1
ANOVAb
Model 1
Regression Residual Total
Sum of Squares 48.261 15.899 64.160
df 2 19 21
a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y
88
Mean Square 24.130 .837
F 28.836
Sig. .000a
Coefficientsa
Model 1
(Constant) X1 X2
Unstandardized Coefficients B Std. Error -11.933 3.511 1.421 .195 2.869E-04 .000
Standardi zed Coefficien ts Beta .840 .136
t -3.399 7.298 1.177
Sig. .003 .000 .254
a. Dependent Variable: Y
Catatan: • Nilai a, b1, b2, antara hitungan manual dengan hitungan SPSS terdapat sedikit perbedaan angka di belakang koma. Ini disebabkan oleh pembulatan angka saat penghitungan. • Angka 2.869E-04 dibaca 0,0002869
89
Koefisien Determinasi (R2) Disamping menguji signifikansi dari masingmasing variabel, kita dapat pula menguji determinasi seluruh variabel penjelas yang ada dalam model regresi. Pengujian ini biasanya disimbolkan dengan koefisien regresi yang biasa disimbolkan dengan R2. Uraian tentang koefisien determinasi sedikit banyak telah disinggung pada single linier regression. Pada sub bahasan ini hanya menambah penjelasan-penjelasan agar menjadi lebih lengkap saja. Koefisien determinasi pada dasarnya digunakan untuk mengkur goodness of fit dari persamaan regresi, melalui hasil pengukuran dalam bentuk prosentase yang menjelaskan determinasi variabel penjelas (X) terhadap variabel yang dijelaskan (Y). Koefisien determinasi dapat dicari melalui hasil bagi dari total sum of square (TSS) atau total variasi Y terhadap explained sum of square (ESS) atau variasi yang dijelaskan Y. Dengan demikian kita dapat mendefinisikan lagi R2 dengan arti rasio antara variasi yang dijelaskan Y dengan total variasi Y. Rumus tersebut adalah sebagai berikut: R2 =
ESS TSS
Total variasi Y (TSS) dapat diukur menggunakan derajat deviasi dari masing-masing observasi nilai Y dari rata-ratanya. Hasil pengukuran ini kemudian dijumlahkan hingga mencakup seluruh observasi. Jelasnya: n
TSS =
∑ (Y t =1
t
− Y )2
90
Nilai explained sum of square (ESS) atau variasi yang dijelaskan Y didapat dengan menggunakan rumus sebagai berikut: n
ESS =
∑ (Yˆ − Y ) t −1
2
t
Jadi, rumus di atas dapat pula dituliskan menjadi sebagai berikut: R2 =
∑ (Yˆ − Y ) ∑ (Y − Y )
2 2
dimana: Yˆ (baca: Y cap) adalah nilai perkiraan Y atau estimasi
garis regresi. Y (baca: Y bar) adalah nilai Y rata-rata.
Y cap diperoleh dengan cara menghitung hasil regresi dengan memasukkan nilai parameter dan data variabel. Penghitungan nilai Y cap menjadi penting untuk dilakukan agar mempermudah kita dalam menggunakan rumus R2 yang telah ditentukan di atas. Sebagai contoh menghitung Y cap, berikut ini dihitung nilai Y cap pada observasi 1. Hasil regresi adalah: Y = -11,917 + 1,421 (X1) + 0,0002869(X2) Jika observasi nomor 1 (satu) kita hitung, dimana X1= 13,06 dan X2 = 9.433,25, maka nilai Yˆ1 = -11,917 + 1,421 (13,06) + 0,0002869(9.433,25) = 9,438
91
Hasil hitungan Y cap individual maupun total, beserta ekstensinya diperlukan untuk menyesuaikan dengan rumus mencari R2. Hasil perhitungan dan pengembangan data selengkapnya tertera dalam tabel sebagai berikut: X1 13.06 13.81 13.97 13.79 14.03 14.14 14.39 14.97 15.67 15.91 16.02 16.21 16.19 15.88 15.76 15.55 15.16 14.85 14.22 13.93 13.58 13.13 324.22
Y 8.28 9.14 10.62 10.51 10.82 12.11 13.04 12.23 13.01 12.47 12.91 12.55 14.42 15.13 14.08 13.3 12.93 11.48 10.05 10.6 10.48 10.33 260.49
X2 9433.25 9633.78 10204.70 11074.75 11291.19 11294.30 10883.57 8956.59 9288.05 10097.91 10554.86 10269.42 10393.82 10237.42 9914.26 9485.82 9115.05 8688.65 8964.70 8928.41 8954.43 9151.73 216816.70
B0 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933 -11.933
B1 B2 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287 1.421 0.000287
Yˆ 9.348 10.471 10.862 10.856 11.259 11.416 11.654 11.925 13.015 13.588 13.876 14.064 14.071 13.586 13.322 12.901 12.240 11.678 10.862 10.439 9.949 9.366 260.747
2 2 ˆ Yˆ − Y (Y − Y ) Y − Y (Y − Y )
-2.493 -1.370 -0.978 -0.985 -0.581 -0.424 -0.187 0.085 1.174 1.748 2.035 2.223 2.230 1.745 1.482 1.061 0.400 -0.163 -0.979 -1.401 -1.891 -2.474 0.256
6.214 1.876 0.957 0.969 0.338 0.180 0.035 0.007 1.379 3.054 4.142 4.943 4.975 3.045 2.196 1.125 0.160 0.027 0.958 1.964 3.577 6.121 48.243
-3.561 -2.701 -1.221 -1.331 -1.021 0.269 1.200 0.390 1.170 0.630 1.070 0.710 2.580 3.290 2.240 1.460 1.090 -0.361 -1.791 -1.241 -1.361 -1.511 -0.001
Dengan menggunakan angka-angka yang terdapat dalam tabel di atas, maka nilai R2 dapat ditentukan. Adapun rumus untuk mencari nilai R2 adalah sebagai berikut: R
2
∑ (Yˆ − Y ) = ∑ (Y − Y )
2 2
92
12.677 7.293 1.490 1.770 1.041 0.073 1.439 0.152 1.368 0.396 1.144 0.503 6.654 10.821 5.015 2.130 1.187 0.130 3.206 1.539 1.851 2.282 64.160
dengan demikian nilai R2 dari model yang ada adalah sebesar: R2 =
48,243 64,160
R2 = 0,751 Nilai R2 sebesar 0,751 tersebut menunjukkan arti bahwa determinasi variabel Budep (X1) dan Kurs (X2) dalam mempengaruhi inflasi (Y) adalah sebesar 75,1%. Nilai sebesar ini mengindikasikan bahwa model yang digunakan dalam menjelaskan variabel Y cukup baik, karena mencapai 75,1%. Sisanya sebesar 24,1% dijelaskan oleh variabel lain yang tidak dijelaskan dalam model. Uji F Seperti telah dikemukakan di atas, bahwa dalam regresi linier berganda variabel penjelasnya selalu berjumlah lebih dari satu. Untuk itu, maka pengujian tingkat signifikansi variabel tidak hanya dilakukan secara individual saja, seperti dilakukan dengan uji t, tetapi dapat pula dilakukan pengujian signifikansi semua variabel penjelas secara serentak atau bersama-sama. Pengujian secara serentak tersebut dilakukan dengan teknik analisis of variance (ANOVA) melalui pengujian nilai F hitung yang dibandingkan dengan nilai F tabel. Oleh karena itu disebut pula dengan uji F. Pada prinsipnya, teknik ANOVA digunakan untuk menguji distribusi atau variansi means dalam variabel penjelas apakah secara proporsional telah signifikan menjelaskan variasi dari variabel yang dijelaskan. Untuk memastikan jawabannya, maka perlu dihitung rasio antara 93
variansi means (variance between means) yang dibandingkan dengan variansi di dalam kelompok variabel (variance between group). Hasil pembandingan keduanya itu (rasio antara variance between means terhadap variance between group) menghasilkan nilai F hitung, yang kemudian dibandingkan dengan nilai F tabel. Jika nilai F hitung lebih besar dibanding nilai F tabel, maka secara serentak seluruh variabel penjelas yang ada dalam model signifikan mempengaruhi variabel terikat Y. Sebaliknya, jika nilai F hitung lebih kecil dibandingkan dengan nilai F tabel, maka tidak secara serentak seluruh variabel penjelas yang ada dalam model signifikan mempengaruhi variabel terikat Y. Atau secara ringkas dapat dituliskan sebagai berikut: F ≤ Fα ;( k −1);( n − k ) Æ berarti tidak signifikan Æ atau H0
diterima F > Fα ;( k −1);( n−k ) Æ berarti signifikan Æ atau H0 ditolak
H0 diterima atau ditolak, adalah merupakan suatu keputusan jawaban terhadap hipotesis yang terkait dengan uji F, yang biasanya dituliskan dalam kalimat sebagai berikut: H0 : b1 = b2 = 0 Variabel penjelas secara serentak tidak signifikan mempengaruhi variabel yang dijelaskan. H0 : b1 ≠ b2 ≠ 0 Variabel penjelas secara serentak signifikan mempengaruhi variabel yang dijelaskan. Karena uji F adalah membandingkan antara nilai F hitung dengan nilai F tabel, maka penting untuk mengetahui bagaimana mencari nilai F hitung ataupun nilai F tabel. 94
Nilai F hitung dapat dicari dengan menggunakan rumus sebagai berikut: F=
R 2 /(k − 1) (1 − R 2 ) /( n − k )
Sedangkan nilai F tabel telah ditentukan dalam tabel. Yang penting untuk diketahui adalah bagaimana cara membaca tabelnya. Seperti yang telah dituliskan pada pembandingan antara nilai F hitung dan nilai F tabel di atas, diketahui bahwa F tabel dituliskan Fα;k-1; (n-k). Arti dari tulisan tersebut adalah: • Simbol α menjelaskan tingkat signifikansi (level of significance) (apakah pada α =0,05 atau α =0,01 ataukah α =0,10, dan seterusnya). • Simbol (k-1) menunjukkan degrees of freedom for numerator. • Simbol (n-k) menunjukkan degrees of freedom for denominator. Guna melengkapi hasil analisis data yang dicontohkan di atas, kita dapat menghitung nilai F berdasarkan rumus. Nilai F dari model tersebut ternyata besarnya adalah: F=
R 2 /(k − 1) (1 − R 2 ) /( n − k )
=
(0,751) /(3 − 1) (1 − 0,751) /(22 − 3)
=
0.3755 = 28.66 0.0131
95
Dari hasil penghitungan di atas diketahui bahwa nilai F hitung adalah sebesar 28,66. Nilai ini lebih besar dibanding dengan nilai F tabel pada α = 0,05 dengan (k-1) = 2, dan (n-k) = (22-3) = 19 yang besarnya 3,52. Dengan demikian dapat disimpulkan bahwa variabel Budep dan Kurs secara serentak signifikan mempengaruhi inflasi. Dengan demikian, maka null hyphothesis ditolak. Daerah penolakan atau penerimaan hipotesis dapat dilihat pada gambar berikut ini:
Daerah diterima Daerah ditolak F(α; k-1; n-k)
F
F0,05;2;19; 3,52
Gb.3.2. Daerah Uji F
-000Tugas: 1. Buatlah rangkuman dari pembahasan di atas! 2. Cobalah untuk menyimpulkan maksud dari uraian bab ini! 3. Lakukanlah perintah-perintah di bawah ini: a. Coba jelaskan apa yang dimaksud dengan regresi linier berganda! b. Coba tuliskan model regresi linier berganda! c. Coba uraikan arti dari notasi atas model yang telah anda tuliskan! d. Jelaskan informasi apa yang dapat diungkap pada konstanta!
96
e. Jelaskan informasi apa yang dapat diungkap pada koefisien regresi! f. Coba sebutkan perbedaan-perbedaan antara model regresi linier sederhana dengan model regresi linier berganda! g. Jelaskan mengapa rumus untuk mencari nilai b pada model regresi linier erganda berbeda dengan model regresi linier sederhana! h. Coba jelaskan apakah pencarian nilai t juga mengalami perubahan! kenapa? i. Coba uraikan bagaimana menentukan nilai t yang signifikan! j. Jelaskan apa kegunaan nilai F! k. Bagaimana menentukan nilai F yang signifikan? l. Jelaskan apakah rumus dalam mencari koefisien determinasi pada model regresi linier berganda berbeda dengan regresi linier sederhana! kenapa? m. Jelaskan bagaimana variabel penjelas dapat dianggap sebagai prediktor terbaik dalam menjelaskan Y!
97
BAB V UJI ASUMSI KLASIK
Tujuan Pengajaran: Setelah mempelajari bab ini, anda diharapkan dapat: Mengerti apa yang dimaksud dengan uji asumsi klasik Mengerti item-item asumsi Menjelaskan maksud item-item asumsi Menyebutkan nama-nama asumsi yang harus dipenuhi Mengerti apa yang dimaksud dengan autokorelasi Mengerti apa yang dimaksud dengan Multikolinearitas Mengerti apa yang dimaksud dengan Heteroskedastisitas Mengerti apa yang dimaksud dengan Normalitas Menjelaskan timbulnya masalah-masalah dalam uji asumsi klasik Menjelaskan dampak dari autokorelasi, heteroskedastisitas, multikolinearitas, normalitas Menyebutkan alat deteksi dari masalah-masalah tersebut Menggunakan sebagian alat-alat deteksi Menjelaskan keterkaitan asumsi-asumsi Menjelaskan konsekuensi-konsekuensi dari Asumsi
98
BAB V UJI ASUMSI KLASIK Di muka telah disinggung, baik dalam regresi linier sederhana maupun dalam regresi linier berganda, bahwa dalam kedua regresi linier tersebut perlu memenuhi asumsi-asumsi seperti yang telah di uraikan dalam kedua bahasan tersebut. Munculnya kewajiban untuk memenuhi asumsi tersebut mengandung arti bahwa formula atau rumus regresi diturunkan dari suatu asumsi tertentu. Artinya, tidak semua data dapat diperlakukan dengan regresi. Jika data yang diregresi tidak memenuhi asumsiasumsi yang telah disebutkan, maka regresi yang diterapkan akan menghasilkan estimasi yang bias. Jika hasil regresi telah memenuhi asumsi-asumsi regresi maka nilai estimasi yang diperoleh akan bersifat BLUE, yang merupakan singkatan dari: Best, Linear, Unbiased, Estimator. Best dimaksudkan sebagai terbaik. Untuk memahami arti Best, perlu kembali kepada kesadaran kita bahwa analisis regresi linier digunakan untuk menggambarkan sebaran data dalam bentuk garis regresi. Dengan kata lain, garis regresi merupakan cara memahami pola hubungan antara dua seri data atau lebih. Hasil regresi dikatakan Best apabila garis regresi yang dihasilkan guna melakukan estimasi atau peramalan dari sebaran data, menghasilkan error yang terkecil. Perlu diketahui bahwa error itu sendiri adalah perbedaan antara nilai observasi dan nilai yang diramalkan oleh garis regresi. Jika garis regresi telah Best dan disertai pula oleh kondisi tidak bias (unbiased), maka estimator regresi akan efisien. Linear mewakili linear dalam model, maupun linear dalam parameter. Linear dalam model artinya model yang digunakan dalam analisis regresi telah sesuai dengan 99
kaidah model OLS dimana variabel-variabel penduganya hanya berpangkat satu. Sedangkan linear dalam parameter menjelaskan bahwa parameter yang dihasilkan merupakan fungsi linear dari sampel. Secara jelas bila diukur dengan nilai rata-rata. Unbiased atau tidak bias, Suatu estimator dikatakan unbiased jika nilai harapan dari estimator b sama dengan nilai yang benar dari b. Artinya, nilai rata-rata b = b. Bila rata-rata b tidak sama dengan b, maka selisihnya itu disebut dengan bias. Estimator yang efisien dapat ditemukan apabila ketiga kondisi di atas telah tercapai. Karena sifat estimator yang efisien merupakan hasil konklusi dari ketiga hal sebelumnya itu. Asumsi-asumsi seperti yang telah dituliskan dalam bahasan OLS di depan, adalah asumsi yang dikembangkan oleh Gauss dan Markov, yang kemudian teori tersebut terkenal dengan sebutan Gauss-Markov Theorem. Serupa dengan asumsi-asumsi tersebut, Gujarati (1995) merinci 10 asumsi yang menjadi syarat penerapan OLS, 18 yaitu: Asumsi 1: Linear regression Model. Model regresi merupakan hubungan linear dalam parameter. Y = a + bX +e Untuk model regresi Y = a + bX + cX2 + e Walaupun variabel X dikuadratkan, ini tetap merupakan regresi yang linear dalam parameter sehingga OLS masih dapat diterapkan. Asumsi 2: Nilai X adalah tetap dalam sampling yang diulang-ulang (X fixed in repeated sampling). 18
Dari sepuluh asumsi di atas tidak semuanya perlu diuji. Sebagian cukup hanya diasumsikan, sedangkan sebagian yang lain memerlukan test.
100
Tepatnya bahwa nilai X adalah nonstochastic (tidak random). Asumsi 3: Variabel pengganggu e memiliki rata-rata nol (zero mean of disturbance). Artinya, garis regresi pada nilai X tertentu berada tepat di tengah. Bisa saja terdapat error yang berada di atas garis regresi atau di bawah garis regresi, tetapi setelah keduanya dirata-rata harus bernilai nol. Asumsi 4: Homoskedastisitas, atau variabel pengganggu e memiliki variance yang sama sepanjang observasi dari berbagai nilai X. Ini berarti data Y pada setiap X memiliki rentangan yang sama. Jika rentangannya tidak sama, maka disebut heteroskedastisitas Asumsi 5: Tidak ada otokorelasi antara variabel e pada setiap nilai xi dan ji (No autocorrelation between the disturbance). Asumsi 6: Variabel X dan disturbance e tidak berkorelasi. Ini berarti kita dapat memisahkan pengaruh X atas Y dan pengaruh e atas Y. Jika X dan e berkorelasi maka pengaruh keduanya akan tumpang tindih (sulit dipisahkan pengaruh masing-masing atas Y). Asumsi ini pasti terpenuhi jika X adalah variabel non random atau non stochastic. Asumsi 7: Jumlah observasi atau besar sampel (n) harus lebih besar dari jumlah parameter yang diestimasi. Bahkan untuk memenuhi asumsi yang lain, sebaiknya jumlah n harus cukup besar. Jika jumlah parameter sama atau bahkan lebih besar dari jumlah observasi, maka persamaan regresi tidak akan bisa diestimasi.
101
Asumsi 8: Variabel X harus memiliki variabilitas. Jika nilai X selalu sama sepanjang observasi maka tidak bisa dilakukan regresi. Asumsi 9: Model regresi secara benar telah terspesifikasi. Artinya, tidak ada spesifikasi yang bias, karena semuanya telah terekomendasi atau sesuai dengan teori. Asumsi 10. Tidak ada multikolinearitas antara variabel penjelas. Jelasnya kolinear antara variabel penjelas tidak boleh sempurna atau tinggi. Penyimpangan masing-masing asumsi tidak mempunyai impak yang sama terhadap regresi. Sebagai contoh, adanya penyimpangan atau tidak terpenuhinya asumsi multikolinearitas (asumsi 10) tidak berarti mengganggu, sepanjang uji t sudah signifikan. Hal ini disebabkan oleh membesarnya standar error pada kasus multikolinearitas, sehingga nilai t, b, Sb, menjadi cenderung kecil. Jika nilai t masih signifikan, maka multikolinearitas tidak perlu diatasi. Akan tetapi, jika terjadi penyimpangan pada asumsi heteroskedastisitas atau pada autokorelasi, penyimpangan tersebut dapat menyebabkan bias pada Sb, sehingga t menjadi tidak menentu. Dengan demikian, meskipun nilai t sudah signifikan ataupun tidak signifikan, keduanya tidak dapat memberi informasi yang sesungguhnya. Untuk memenuhi asumsi-asumsi di atas, maka estimasi regresi hendaknya dilengkapi dengan uji-uji yang diperlukan, seperti uji normalitas, autokorelasi, heteroskedastisitas, atupun multikolinearitas. Secara teoretis model OLS akan menghasilkan estimasi nilai parameter model penduga yang sahih bila dipenuhi asumsi Tidak ada Autokorelasi, Tidak Ada Multikolinearitas, dan Tidak ada Heteroskedastisitas. 102
Apabila seluruh asumsi klasik tersebut telah terpenuhi maka akan menghasilkan hasil regresi yang best, linear, unbias, efficient of estimation (BLUE).
A. Uji Autokorelasi A.1. Pengertian autokorelasi Dalam asumsi klasik telah dijelaskan bahwa pada model OLS harus telah terbebas dari masalah autokorelasi atau serial korelasi. Autokorelasi adalah keadaan dimana variabel gangguan pada periode tertentu berkorelasi dengan variabel gangguan pada periode lain. Sifat autokorelasi muncul bila terdapat korelasi antara data yang diteliti, baik itu data jenis runtut waktu (time series) ataupun data kerat silang (cross section). Hanya saja masalah autokorelasi lebih sering muncul pada data time series, karena sifat data time series ini sendiri lekat dengan kontinyuitas dan adanya sifat ketergantungan antar data. Sementara pada data cross section hal itu kecil kemungkinan terjadi. Asumsi terbebasnya autokorelasi ditunjukkan oleh nilai e yang mempunyai rata-rata nol, dan variannya konstan. Asumsi variance yang tidak konstan menunjukkan adanya pengaruh perubahan nilai suatu observasi berdampak pada observasi lain. Sebagai ilustrasi, misalnya kita mengamati perubahan inflasi apakah dipengaruhi oleh suku bunga deposito ataukah tidak. Bisa saja perubahan bunga deposito pada waktu tertentu, juga dialami oleh perubahan tingkat inflasi pada waktu yang sama. Kalau saja terjadi autokorelasi dalam kasus semacam ini, maka menjadi tidak jelas apakah inflasi betul-betul dipengaruhi oleh perubahan bunga
103
deposito ataukah karena sifat dari kecenderungannya sendiri untuk berubah. Telah jelas bagi kita bahwa autokorelasi akan muncul apabila ada ketergantungan atau adanya kesalahan pengganggu yang secara otomatis mempengaruhi data berikutnya. Jika terdapat ketergantungan, dalam bahasa matematisnya dituliskan sebagai berikut: E(ui, uj) ≠ 0; i ≠j Sebaliknya, jika tidak terdapat ketergantungan atau tidak adanya kesalahan pengganggu yang secara otomatis mempengaruhi data berikutnya maka masalah autokorelasi tidak akan muncul. Hal seperti itu dalam bahasa matematisnya dituliskan sebagai berikut: E(ui, uj) = 0; i ≠j A.2. Sebab-sebab Autokorelasi Terdapat banyak faktor-faktor yang dapat menyebabkan timbulnya masalah autokorelasi, namun dalam pembahasan ini hanya mengungkapkan beberapa faktor saja antara lain: 1. Kesalahan dalam pembentukan model, artinya, model yang digunakan untuk menganalisis regresi tidak didukung oleh teori-teori yang relevan dan mendukung. 2. Tidak memasukkan variabel yang penting. Variabel penting yang dimaksudkan di sini adalah variabel yang diperkirakan signifikan mempengaruhi variabel Y. Sebagai misal kita ingin meneliti faktor apa saja yang mempengaruhi terjadinya inflasi. Secara teoritik, banyaknya Jumlah Uang Beredar (JUB) mempunyai kaitan kuat dengan terjadinya inflasi. Alur berfikirnya seperti ini, semakin banyak JUB maka daya beli 104
masyarakat akan meningkat tentu akan pula diikuti dengan permintaan yang meningkat pula, Jika jumlah penawaran tidak mampu bertambah, tentu harga akan meningkat, ini berarti inflasi akan terjadi. Nah, tidak dimasukkannya JUB sebagai prediktor, sangat besar mengandung kecenderungan terjadinya autokorelasi. 3. Manipulasi data. Misalnya dalam penelitian kita ingin menggunakan data bulanan, namun data tersebut tidak tersedia. Kemudian kita mencoba menggunakan triwulanan yang tersedia, untuk dijadikan data bulanan melalui cara interpolasi atau ekstrapolasi. Contohnya membagi tiga data triwulanan tadi (n/3). Apabila hal seperti ini dilakukan, maka sifat data dari bulan ke satu akan terbawa ke bulan kedua dan ketiga, dan ini besar kemungkinan untuk terjadi autokorelasi. 4. Menggunakan data yang tidak empiris. Jika data semacam ini digunakan, terkesan bahwa data tersebut tidak didukung oleh realita. Misalnya pengaruh periklanan terhadap penjualan. Kalau dalam penelitian menggunakan data biaya periklanan bulan ke n dan data penjualan bulan ke n, besar kemungkinan akan terjadi autokorelasi. Secara empirik, upaya periklanan bulan ke n tidak akan secara langsung berdampak pada bulan yang sama, tetapi besar kemungkinan akan berdampak pada bulan berikutnya, jaraknya bisa 1 bulan, 2 bulan, atau lebih. Seharusnya data penjualan yang digunakan adalah data penjualan bulan ke n+1 atau n+2 tergantung dampak empiris tadi. Penggunaan data pada bulan yang sama dengan mengabaikan empiris seperti ini disebut juga sebagai Cobweb Phenomenon.
105
A.3. Akibat Autokorelasi Uraian-uraian di atas mungkin saja mengajak kita untuk bertanya tentang apa dampak dari autokorelasi yang timbul. Pertanyaan seperti ini tentu saja merupakan sesuatu yang wajar, karena kita tentu mempunyai pilihan apakah mengabaikan adanya autokorelasi ataukah akan mengeliminasinya. Meskipun ada autokorelasi, nilai parameter estimator (b1, b2,…,bn) model regresi tetap linear dan tidak bias dalam memprediksi B (parameter sebenarnya). Akan tetapi nilai variance tidak minimum dan standard error (Sb1, Sb2) akan bias. Akibatnya adalah nilai t hitung akan menjadi bias pula, karena nilai t diperoleh dari hasil bagi Sb terhadap b (t = b/sb). Berhubung nilai Sb bias maka nilai t juga akan bias atau bersifat tidak pasti (misleading). A.4. Pengujian Autokorelasi Pengujian autokorelasi dimaksudkan untuk menguji ada tidaknya autokorelasi, yaitu masalah lain yang timbul bila kesalahan tidak sesuai dengan batasan yang disyaratkan oleh analisis regresi. Terdapat beberapa cara untuk mendeteksi ada tidaknya autokorelasi, antara lain melalui: 1. Uji Durbin-Watson (DW Test). Uji Durbin-Watson yang secara populer digunakan untuk mendeteksi adanya serial korelasi dikembangkan oleh ahli statistik (statisticians) Durbin dan Watson. Formula yang digunakan untuk mendeteksi terkenal pula dengan sebutan DurbinWatson d statistic, yang dituliskan sebagai berikut:
106
t =n
d=
∑ (uˆ t =2
t
− uˆ t −1 ) 2
t =n
∑ uˆ t =2
2 t
atau dapat pula ditulis dalam rumus sebagai berikut: d = 2(1 −
∑ e .e t
e
2 t
t −1
)
Dalam DW test ini terdapat beberapa asumsi penting yang harus dipatuhi, yaitu: • Terdapat intercept dalam model regresi. • Variabel penjelasnya tidak random (nonstochastics). • Tidak ada unsur lag dari variabel dependen di dalam model. • Tidak ada data yang hilang. • υ t = ρυ t −1 + ε t Langkah-langkah pengujian autokorelasi menggunakan uji Durbin Watson (DW test) dapat dimulai dari menentukan hipotesis. Rumusan hipotesisnya (H0) biasanya menyatakan bahwa dua ujungnya tidak ada serial autokorelasi baik positif maupun negatif. Misalnya: terdapat autokorelasi positif, atau, terdapat autokorelasi negatif. Bertolak dari hipotesis tersebut, maka perlu mengujinya karena hipotesis sendiri merupakan jawaban sementara yang masih perlu diuji. Terdapat beberapa standar keputusan yang perlu dipedomani ketika menggunakan DW test, yang semuanya menentukan lokasi dimana nilai DW berada. Jelasnya adalah sebagai berikut: 107
DW < dL positif dL< DW
DW >4-dU autokorelasi 4-dU < DW <4-dL (inconclusive) DW > 4-dL negatif
=
terdapat
atokorelasi
= tidak dapat disimpulkan =
tidak
terdapat
= tidak dapat disimpulkan = terdapat autokorelasi
Dimana DW = Nilai Durbin-Watson d statistik dU = Nilai batas atas (didapat dari tabel) = Nilai batas bawah (didapat dari dL tabel) Ketentuan-ketentuan daerah hipotesis pengujian DW dapat diwujudkan dalam bentuk gambar sebagai berikut:
Inconclusive
Tidak ada Autokorelasi
Inconclusive
Korelasi (+) 0
dL
Korelasi (-) dU
2
4-dU
4-dL
Gambar 3.3.: Daerah Uji Durbin Watson
108
4
Dalam pengujian autokorelasi terdapat kemungkinan munculnya autokorelasi positif maupun negatif. Karena adanya masalah korelasi dapat menimbulkan adanya bias pada hasil regresi. Bantuan dengan SPSS
Untuk mengetahui ada tidaknya autokorelasi dengan DW test, tahapannya dilakukan seperti pada tahapan regresi, hanya saja dilanjutkan dengan mengaktifkan kunci lainnya. Lengkapnya tahapan tersebut adalah sebagai berikut: • Pilih Analyze, Regression, Linear • Masukkan variabel Y ke kotak Variabel Dependen, dan variabel X1 dan X2 ke dalam kotak Variabel Independen • Klik pada kotak pilihan Statistik (bawah) • Aktikan Durbin-Watson pada kolom Residual • Klik Continue, kemudian klik OK.
109
Maka SPSS akan menampilkan hasil regresinya. Kolom DurbinWatson akan tampak dalam tabel Model Summary, kolom paling kanan. Model Summaryb
Model 1
R R Square .867a .752
Adjusted R Square .726
a. Predictors: (Constant), X2, X1 b. Dependent Variable: Y
Bantuan dengan SPSS
Catatan:
110
Std. Error of the Estimate .9148
Durbin-W atson .883
Dengan menggunakan derajat kesalahan (α)=5%, dengan sampel 22 observasi, dengan predictor sebanyak 2 maka batas atas (U) adalah sebesar 1,54 sedang batas bawah (L) adalah sebesar 1,15. Karena nilai DW hasil regresi adalah sebesar 0,883 yang berarti lebih kecil dari nilai batas bawah, maka koefisien autokorelasi lebih kecil dari nol. Dengan demikian dapat disimpulkan bahwa hasil regresi tersebut belum terbebas dari masalah autokorelasi positif. Dengan kata lain, Hipotesis nol yang menyatakan tidak terdapat masalah autokorelasi dapat ditolak, sedang hipotesis nol yang menyatakan terdapat masalah autokorelasi dapat diterima. Uraian di atas dapat pula dijelaskan dalam bentuk gambar sbb:
Korelasi (+) inkonklusif
0
tidak ada autokorelasi inkonklusif
dL
dU
1,15
1,54
2
4-dU 2,46
Korelasi (-)
4-dL 2,85
Gambar. Daerah Uji Durbin Watson
111
4
2. Menggunakan metode LaGrange Multiplier (LM). LM sendiri merupakan teknik regresi yang memasukkan variabel lag. Sehingga terdapat variabel tambahan yang dimasukkan dalam model. Variabel tambahan tersebut adalah data Lag dari variabel dependen. Dengan demikian model dalam LM menjadi sebagai berikut: Y = β0 + β1X1+ β2 X2 + β3 Yt-1+ β4 Yt-2 + ε Variabel Yt-1 merupakan variabel lag 1 dari Y. Variabel Yt-2 merupakan variabel lag 2 dari Y. Lag 1 dan Lag 2 variabel Y dimasukkan dalam model ini bertujuan untuk mengetahui pada lag berapa problem otokorelasi muncul. Lag sendiri merupakan rentang waktu. Lag 1 menunjukkan adanya kesenjangan waktu 1 periode, sedang lag 2 menunjukkan kesenjangan waktu 2 periode. Periodenya tergantung pada jenis data apakah data harian, bulanan, tahunan. Lag 1 data harian berarti ada kesenjangan satu hari, lag 2 kesenjangan 2 hari dan seterusnya. Sebagai kunci untuk mengetahui pada lag berapa autokorelasi muncul, dapat dilihat dari signifikan tidaknya variabel lag tersebut. Ukuran yang digunakan adalah nilai t masing-masing variabel lag yang dibandingkan dengan t tabel, seperti yang telah dibahas pada uji t sebelumnya. Misalnya variabel Yt-1 mempunyai nilai t signifikan, berarti terdapat masalah autokorelasi atau pengaruh
112
kesalahan pengganggu mulai satu periode sebelumnya. Jika ini terjadi, maka untuk perbaikan hasil regresi perlu dilakukan regresi ulang dengan merubah posisi data untuk disesuaikan dengan kurun waktu lag tersebut. Terdapat beberapa alat uji lain untuk mendeteksi autokorelasi seperti uji Breusch-Godfrey, Uji Run, Uji Statistik Q: Box-Pierce dan Ljung Box, dan lainlain, namun uji-uji tersebut tidak dibahas di sini, mengingat tulisan ini masih berlingkup atau bersifat pengantar.
B. Uji Normalitas Tujuan dilakukannya uji normalitas adalah untuk menguji apakah variabel penganggu (e) memiliki distribusi normal atau tidak. Pengujian normalitas data dapat dilakukan sebelum ataupun setelah tahapan analisis regresi. Hanya saja pengalaman menunjukkan bahwa pengujian normalitas yang dilakukan sebelum tahapan regresi lebih efisien dalam waktu. Sangat beralasan kiranya, karena jika asumsi normalitas data telah dipenuhi terlebih dulu, maka dampak yang mungkin akan ditimbulkan dari adanya ketidaknormalan data seperti bias pada nilai t hitung dan nilai F hitung dapat dihindari. Sebaliknya, bila dilakukan analisis regresi terlebih dulu, dimana nilai t dan F baru diketahui, yang kemudian baru dilakukan normalitas data, sedangkan ternyata hasilnya tidak normal maka analisis regresi harus diulang lagi. Pengujian normalitas ini berdampak pada nilai t dan F karena pengujian terhadap keduanya diturunkan dari asumsi bahwa data Y atau e berdistribusi normal. 113
Beberapa cara dapat dilakukan untuk melakukan uji normalitas, antara lain: 1) Menggunakan metode numerik yang membandingkan nilai statistik, yaitu antara nilai median dengan nilai mean. Data dikatakan normal (simetris) jika perbandingan antara mean dan median menghasilkan nilai yang kurang lebih sama. Atau apabila nilai mean jika dikurangi nilai median menghasilkan angka nol. Cara ini disebut ukuran tendensi sentral (Kuncoro, 2001: 41). 2) Menggunakan formula Jarque Bera (JB test), yang rumusnya tertera sebagai berikut: ⎡ S 2 ( K − 3) 2 ⎤ JB = n ⎢ + ⎥ 24 ⎦ ⎣ 6
dimana: S = Skewness (kemencengan) distribusi data K= Kurtosis (keruncingan) Skewness sendiri dapat dicari dari formula sebagai berikut:
[E( X − μ ) ] S= [E( X − μ ]
3 2
2 3
Kurtosis dapat dicari dengan formula sebagai berikut: K=
E( X − μ)4
[E ( X − μ ) ]
2 2
114
Bantuan dengan SPSS SPSS dapat digunakan untuk melihat nilai Mean, Median, Modus, Skewness, Kurtosis, dan lain-lain. Caranya dapat dilakukan dengan tahapan sebagai berikut: • Pilih Analyze, Descriptive Statistic, Frequencies • Pindahkan variabel yang mau dicari nilainya (sebelah kiri) ke kotak Variables (sebelah kanan) • Kilik Statistik (bawah) • Aktifkan pilihan yang ada dalam kotak Dispersion, Distribution, Central Tendency • Kemudian klik Continue, dan OK.
115
• Maka SPSS akan menampakkan output sebagai berikut: Statistics
N
Valid Missing
Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum Sum
Y
X1
22 0 11.8405 .3727 12.1700 8.28a 1.7479 3.0552 -.099 .491 -.494 .953 6.85 8.28 15.13 260.49
22 0 14.7373 .2202 14.6200 13.06a 1.0329 1.0670 .009 .491 -1.424 .953 3.15 13.06 16.21 324.22
X2 22 0 9855.3027 176.0515 9774.0200 8688.65a 825.7548 681871.1 .363 .491 -1.096 .953 2605.65 8688.65 11294.30 216816.66
a. Multiple modes exist. The smallest value is shown
3) Mengamati sebaran data, dengan melakukan hitungan-hitungan berapa prosentase data observasi dan berada di area mana. Untuk menentukan posisi normal dari sebaran data, langkah awal yang dilakukan adalah menghitung standar deviasi. Standar deviasi dapat dicari melalui rumus sebagai berikut: SD =
∑ (Dv − Dv) n
Standar deviasi ini digunakan untuk menentukan rentang deviasi dari posisi simetris data. Untuk mempermudah, kita dapat memberinya nama: SD1 yang berarti rentang pertama, di sebelah kiri dan sebelah kanan dari posisi tengah-tengah (simetris). SD2 yang berarti rentang kedua di sebelah kiri dan sebelah kanan posisi tengahtengah (simetris) 116
SD3 yang berarti rentang ketiga di sebelah kiri dan sebelah kanan posisi tengahtengah (simetris). Penentuan area ini penting, karena sebaran data yang dikatakan normal 19 apabila tersebar sebagai berikut: Sebanyak 68% dari observasi berada pada area SD1 Sebanyak 95% dari sisanya berada pada area SD2 Sebanyak 99,7% dari sisanya berada pada area SD3 Untuk memperjelas maksud dari uraian di atas, kita dapat melihatnya pada gambar berikut ini
-SD3
-SD2
-SD1
Dv
SD1
SD2
SD3
68% observasi 95% observasi sisa 99,7% observasi sisa
Dalam pengujian normalitas mempunyai dua kemungkinan, yaitu data berdistribusi normal atau tidak normal. Apabila data telah berdistribusi normal maka tidak ada masalah karena uji t dan uji F dapat dilakukan (Kuncoro, 2001: 110). Apabila data tidak normal, maka 19
Gujarati, Basic Econometrics, third edition, McGraw-Hill, Inc. 1995.
117
diperlukan upaya untuk mengatasi seperti: memotong data yang out liers, memperbesar sampel, atau melakukan transformasi data. Data yang tidak normal juga dapat dibedakan dari tingkat kemencengannya (skewness). Jika data cenderung menceng ke kiri disebut positif skewness, dan jika data cenderung menceng ke kanan disebut negatif skewness. Data dikatakan normal jika datanya simetris. Lihat gambar berikut:
Positif Skewness Negatif Skewness
Normal
Langkah transformasi data sebagai upaya untuk menormalkan sebaran data dapat dilakukan dengan merubah data dengan nilai absolut ke dalam bilangan logaritma 20. Dengan mentransformasi data ke bentuk logaritma akan memperkecil error sehingga kemungkinan timbulnya masalah heteroskedastisitas juga menjadi sangat kecil (Setiaji, 2004: 18). 20
Kuncoro, 2001, juga Setiaji, 2004, mengatakan hal yang sama. Bahwa transformasi dapat dilakukan dengan logaritma.
118
Sebagai penjelas dari uraian di atas, maka ada baiknya kalau kita ikuti contoh soal sebagai berikut: Misalnya kita memiliki jumlah observasi sebanyak 30 sampel, dari penghitungan berat badan orang dewasa yang rata-ratanya ditemukan 46 kg, dengan standar deviasi (SD) 5 kg. Untuk menentukan normal tidaknya data sampel tersebut, dapat diketahui dari sebaran datanya. Misalnya dari data tersebut diketahui bahwa 20 dari data observasi (68% X 30) 10 orang di antaranya mempunyai berat badan yang berkisar antara 41-46 kg., dan 10 orang lainnya dengan berat 46-51 kg. Dan 4 orang mempunyai berat badan antara 36-41 kg, serta 5 orang berat badannya berkisar antara 51-56, dan satu orang beratnya kurang dari 36 kg, maka data dapat dikatakan normal. Dengan demikian bila diwujudkan dalam bentuk diagram sebaran data akan tampak sebagai berikut:
36
41
46
51
56
C. Uji Heteroskedastisitas C.1. Pengertian Heteroskedastisitas Sebagaimana telah ditunjukkan dalam salah satu asumsi yang harus ditaati pada model regresi linier, 119
adalah residual harus homoskedastis, artinya, variance residual harus memiliki variabel yang konstan, atau dengan kata lain, rentangan e kurang lebih sama. Karena jika variancenya tidak sama, model akan menghadapi masalah heteroskedastisitas. Heteroskedastisitas muncul apabila kesalahan atau residual dari model yang diamati tidak memiliki varians yang konstan dari satu observasi ke observasi lainnya (Kuncoro, 2001: 112). Padahal rumus regresi diperoleh dengan asumsi bahwa variabel pengganggu (error) atau e, diasumsikan memiliki variabel yang konstan (rentangan e kurang lebih sama). Apabila terjadi varian e tidak konstan, maka kondisi tersebut dikatakan tidak homoskedastik atau mengalami heteroskedastisitas (Setiaji, 2004: 17). Masalah heteroskedastisitas lebih sering muncul dalam data cross section dari pada data time series (Kuncoro, 2001: 112; Setiaji, 2004: 17). Karena dalam data cross section menunjukkan obyek yang berbeda dan waktu yang berbeda pula. Antara obyek satu dengan yang lainnya tidak ada saling keterkaitan, begitu pula dalam hal waktu. Sedangkan data time series, antara observasi satu dengan yang lainnya saling mempunyai kaitan. Ada trend yang cenderung sama. Sehingga variance residualnya juga cenderung sama. Tidak seperti data cross section yang cenderung menghasilkan variance residual yang berbeda pula.
C.2. Konsekuensi Heteroskedastisitas Analisis regresi menganggap kesalahan (error) bersifat homoskedastis, yaitu asumsi bahwa residu atau deviasi dari garis yang paling tepat muncul serta random sesuai dengan besarnya variabel-variabel independen (Arsyad, 1994:198). Asumsi regresi linier yang berupa 120
variance residual yang sama, menunjukkan bahwa standar error (Sb) masing-masing observasi tidak mengalami perubahan, sehingga Sb nya tidak bias. Lain halnya, jika asumsi ini tidak terpenuhi, sehingga variance residualnya berubah-ubah sesuai perubahan observasi, maka akan mengakibatkan nilai Sb yang diperoleh dari hasil regresi akan menjadi bias. Selain itu, adanya kesalahan dalam model yang dapat mengakibatkan nilai b meskipun tetap linier dan tidak bias, tetapi nilai b bukan nilai yang terbaik. Munculnya masalah heteroskedastisitas yang mengakibatkan nilai Sb menjadi bias, akan berdampak pada nilai t dan nilai F yang menjadi tidak dapat ditentukan. Karena nilai t dihasilkan dari hasil bagi antara b dengan Sb. Jika nilai Sb mengecil, maka nilai t cenderung membesar. Hal ini akan berakibat bahwa nilai t mungkin mestinya tidak signifikan, tetapi karena Sb nya bias, maka t menjadi signifikan. Sebaliknya, jika Sb membesar, maka nilai t akan mengecil. Nilai t yang seharusnya signifikan, bisa jadi ditunjukkan menjadi tidak signifikan. Ketidakmenentuan dari Sb ini dapat menjadikan hasil riset yang mengacaukan.
C.3. Pendeteksian Heteroskedastisitas Untuk mendeteksi ada tidaknya heteroskedastisitas, dapat dilakukan dengan berbagai cara seperti uji grafik, uji Park, Uji Glejser, uji Spearman’s Rank Correlation, dan uji Whyte menggunakan Lagrange Multiplier (Setiaji, 2004: 18) 21. Pengujian heteroskedastisitas menggunakan uji grafik, dapat dilakukan dengan membandingkan sebaran 21
Ditunjukkan pula oleh Gozali, 2001.
121
antara nilai prediksi variabel terikat dengan residualnya, yang output pendeteksiannya akan tertera berupa sebaran data pada scatter plot. Dengan menggunakan alat bantu komputer teknik ini sering dipilih, karena alasan kemudahan dan kesederhanaan cara pengujian, juga tetap mempertimbangkan valid dan tidaknya hasil pengujian. Pengujian heteroskedastisitas menggunakan uji Arch, dilakukan dengan cara melakukan regresi atas residual, dengan model yang dapat dituliskan e 2 = a + bYˆ 2 + u . Dari hasil regresi tersebut dihitung nilai R2. Nilai R2 tadi dikalikan dengan jumlah sampel (R2 x N). Hasil perkalian ini kemudian dibandingkan dengan nilai chi-square (χ2) pada derajat kesalahan tertentu. Dengan df=1 (ingat, karena hanya memiliki satu variabel bebas). Jika R2 x N lebih besar dari chi-square (χ2) tabel, maka standar error mengalami heteroskedastisitas. Sebaliknya, jika R2 x N lebih kecil dari chi-square (χ2) tabel, maka standar error telah bebas dari masalah heteroskedastisitas, atau telah homoskedastis.
D. Uji Multikolinieritas D.1. Pengertian Multikolinearitas Multikolinieritas adalah suatu keadaan dimana terjadi korelasi linear yang ”perfect” atau eksak di antara variabel penjelas yang dimasukkan ke dalam model. Tingkat kekuatan hubungan antar variabel penjelas dapat ditrikotomikan lemah, tidak berkolinear, dan sempurna. Tingkat kolinear dikatakan lemah apabila masing-masing variabel penjelas hanya mempunyai sedikit sifat-sifat yang sama. Apabila antara variabel penjelas memiliki banyak sifat-sifat yang sama dan serupa sehingga hampir tidak dapat lagi dibedakan tingkat pengaruhnya terhadap 122
Y, maka tingkat kolinearnya dapat dikatakan serius, atau perfect, atau sempurna. Sedangkan Tidak berklinear jika antara variabel penjelas tidak mempunyai sama sekali kesamaan. Sebagai gambaran penjelas, dapat dilihat pada gambar berikut ini: Y
Y
X2
X2
X1
X1
Gb.Tidak berkolinear
Gb. Berkolinear lemah
Y
X1
X2
Gb. Berkolinear sempurna
D.2. Konsekuensi Multikolinearitas Pengujian multikolinearitas merupakan tahapan penting yang harus dilakukan dalam suatu penelitian, karena apabila belum terbebas dari masalah multikolinearitas akan menyebabkan nilai koefisien regresi (b) masing-masing variabel bebas dan nilai standar error-nya (Sb) cenderung bias, dalam arti tidak dapat ditentukan kepastian nilainya, sehingga akan
123
berpengaruh pula terhadap nilai t (Setiaji, 2004: 26). Logikanya adalah seperti ini, jika antara X1 dan X2 terjadi kolinearitas sempurna sehingga data menunjukkan bahwa X1=2X2, maka nilai b1 dan b2 akan tidak dapat ditentukan hasilnya, karena dari formula OLS sebagaimana dibahas terdahulu, b1 =
(∑ x1 y)(∑ x 22 ) − (∑ x 2 y)(∑ x1 x 2 ) (∑ x12 )(∑ x 22 ) − (∑ x1 x 2 ) 2
0 0
akan menghasilkan bilangan pembagian, b1 = , sehingga nilai b1 hasilnya tidak menentu. Hal itu akan berdampak pula pada standar error Sb akan menjadi sangat besar, yang tentu akan memperkecil nilai t. D.3. Pendeteksian Multikolinearitas Terdapat beragam cara untuk menguji multikolinearitas, di antaranya: menganalisis matrix korelasi dengan Pearson Correlation atau dengan Spearman’s Rho Correlation, melakukan regresi partial dengan teknik auxilary regression, atau dapat pula dilakukan dengan mengamati nilai variance inflation factor (VIF). Cara mendeteksi ada tidaknya multikolinieritas dengan menghitung nilai korelasi antar variabel dengan menggunakan Spearman’s Rho Correlation dapat dilakukan apabila data dengan skala ordinal (Kuncoro, 2001: 114). Sementara untuk data interval atau nominal dapat dilakukan dengan Pearson Correlation. Selain itu metode ini lebih mudah dan lebih sederhana tetapi tetap memenuhi syarat untuk dilakukan. Pengujian multikolinearitas menggunakan angka korelasi dimaksudkan untuk menentukan ada tidaknya multikolinearitas. Mengacu pendapat Pindyk dan
124
Rubinfeld 22, yang mengatakan bahwa apabila korelasi antara dua variabel bebas lebih tinggi dibanding korelasi salah satu atau kedua variabel bebas tersebut dengan variabel terikat. Juga pendapat Gujarati (1995:335) yang mengatakan bahwa bila korelasi antara dua variabel bebas melebihi 0,8 maka multikolinearitas menjadi masalah yang serius. Gujarati juga menambahkan bahwa, apabila korelasi antara variabel penjelas tidak lebih besar dibanding korelasi variabel terikat dengan masing-masing variabel penjelas, maka dapat dikatakan tidak terdapat masalah yang serius. Dengan demikian, dapat disimpulkan bahwa apabila angka korelasi lebih kecil dari 0,8 maka dapat dikatakan telah terbebas dari masalah multikolinearitas. Dalam kaitan adanya kolinear yang tinggi sehingga menimbulkan tidak terpenuhinya asumsi terbebas dari masalah multikolinearitas, dengan mempertimbangkan sifat data dari cross section, maka bila tujuan persamaan hanya sekedar untuk keperluan prediksi, hasil regresi dapat ditolerir, sepanjang nilai t signifikan.
Tugas: 1. Buatlah rangkuman dari pembahasan di atas! 2. Cobalah untuk menyimpulkan maksud dari uraian bab ini! 3. Jawablah pertanyaan-pertanyaan di bawah ini: a. Coba jelaskan apa yang dimaksud dengan asumsi klasik! b. Sebutkan apa saja asumsi-asumsi yang ditetapkan! c. Coba jelaskan mengapa tidak semua asumsi perlu lakukan pengujian! 22
Lihat Kuncoro, 2001:146
125
d. Jelaskan apa yang dimaksud dengan autokorelasi! e. Jelaskan kenapa autokorelasi timbul! f. Bagaimana cara mendeteksi masalah autokorelasi? g. Apa konsekuensi dari adanya masalah autokorelasi dalam model? h. Jelaskan apa yang dimaksud dengan heteroskedastisitas! i. Jelaskan kenapa heteroskedastisitas timbul! j. Bagaimana cara mendeteksi masalah heteroskedastisitas? k. Apa konsekuensi dari adanya masalah heteroskedastisitas dalam model? l. Jelaskan apa yang dimaksud dengan multikolinearitas! m. Jelaskan kenapa multikolinearitas timbul! n. Bagaimana cara mendeteksi masalah multikolinearitas? o. Apa konsekuensi dari adanya masalah multikolinearitas dalam model? p. Jelaskan apa yang dimaksud dengan normalitas! q. Jelaskan kenapa normalitas timbul! r. Bagaimana cara mendeteksi masalah normalitas? s. Apa konsekuensi dari adanya masalah normalitas dalam model? t. Bagaimana cara menangani jika data ternyata tidak normal?
126
DAFTAR PUSTAKA Djarwanto, Pangestu Subagyo, 2000, “Statistik Induktif”, Edisi 4, BPFE Yogjakarta. Ghozali, Imam, 2001, “Aplikasi Analisis Multivariate dengan Program SPSS”, BP Undip, Semarang Gujarati,Damodar N., 1988, “Basic Econometrics” Second Edition, McGraw-Hill Book Company. Gujarati,Damodar N., 1999, “Essentials of Econometrics”, Second Edition, Irwin McGraw Hill. Hill, Carter, William E. Griffiths, George G. Judge, 1997, “Undergraduate Econometrics”, John Wiley & Sons, Inc. Johnston, Jack, and John DiNardo, 1997, “Econometric Methods” Fourth Edition, The McGraw-Hill Companies, Inc. Kuncoro, Mudrajad, 2001, “Metode Kuantitatif Teori dan Aplikasi Untuk Bisnis dan Ekonomi”, UPP AMP YKPN, Yogjakarta Salvatore, Dominick, 1996, “Managerial Economics in a Global Economy”, International Edition, Third Edition, McGraw-Hill, inc. Santoso, Singgih, 2001, “Buku Latihan SPSS Statistik Parametrik”, Elex Media Komputindo, Jakarta. Setiaji, Bambang, 2004, “Module Ekonometrika Praktis”, Fakultas Ekonomi Universitas Muhammadiyah Surakarta. Supranto, J., 1983, “Ekonometrik”, Buku Satu, Lembaga Penerbit Fakultas Ekonomi Universitas Indonesia.
127
Regresi Logit
128
X1 13.06 13.81 13.97 13.79 14.03 14.14 14.39 14.97 15.67 15.91 16.02 16.21 16.19 15.88 15.76 15.55 15.16 14.85 14.22 13.93 13.58 13.13 324.22
Y 8.28 9.14 10.62 10.51 10.82 12.11 13.04 12.23 13.01 12.47 12.91 12.55 14.42 15.13 14.08 13.3 12.93 11.48 10.05 10.6 10.48 10.33 260.49
X1 13.06 13.81 13.97 13.79 14.03 14.14 14.39 14.97 15.67 15.91 16.02 16.21 16.19 15.88 15.76 15.55 15.16 14.85 14.22 13.93 13.58 13.13 324.22
129
X12 170.5636 190.7161 195.1609 190.1641 196.8409 199.9396 207.0721 224.1009 245.5489 253.1281 256.6404 262.7641 262.1161 252.1744 248.3776 241.8025 229.8256 220.5225 202.2084 194.0449 184.4164 172.3969 4800.525
Y2 68.5584 83.5396 112.7844 110.4601 117.0724 146.6521 170.0416 149.5729 169.2601 155.5009 166.6681 157.5025 207.9364 228.9169 198.2464 176.89 167.1849 131.7904 101.0025 112.36 109.8304 106.7089 3148.48
XY 108.1368 126.2234 148.3614 144.9329 151.8046 171.2354 187.6456 183.0831 203.8667 198.3977 206.8182 203.4355 233.4598 240.2644 221.9008 206.815 196.0188 170.478 142.911 147.658 142.3184 135.6329 3871.398
t=
1.4498 b = = 7.4348 sb 0.195
Penemuan nilai b di sini penting untuk menentukan nilai B. Nilai b sendiri merupakan perkiraan tungga dari parameter B, yaitu koefisien regresi sebenarnya (Y = A + BX + e). Perbedaan antara nilai b dan B disebabkan adanya fluktuasi sampling. Nilai B sendiri besarnya adalah sama dengan nilai rata-rata b, karena nilai rata-rata b adalah pemerkira tak bias. Ingat E(b) = B. Permasalahannya adalah nilai b yang dihasilkan dengan perhitungan di atas adalah nilai b individual, maka kita perlu menguji apakah B berada pada interval atau tidak. Untuk menguji tingkat kepercayaannya maka kita perlu mengukur interval kepercayaan (confidence interval) apakah B berada di antara batas atas dengan batas bawah interval atau tidak. Kalau berada pada interval tersebut, maka dipastikan bahwa B mempunyai tingkat kepercayaan yang baik (reliabel), jika tidak, maka B tidak reliabel. Pengukuran berdasarkan interval kepercayaan dapat dituliskan dalam bentuk persamaan sebagai berikut: P (b-d ≤ B ≤ b +d) = 1- α Persamaan ini dapat dibaca: probabilita interval antara (b-d) dan (b+d) akan memuat nilai B sebesar (1- α ). Atau digambarkan sebagai berikut:
(b-d) batas bawah dimana:
interval
(b+d) batas atas
(b-d) = batas keyakinan bawah atau nilai batas bawah (b+d) = batas keyakinan atas atau nilai batas atas (1- α ) = koefisien keyakinan (confidence coefficient) atau tingkat keyakinan (confidence level).
130
sendiri disebut sebagai tingkat signifikansi Simbol α (level of significance) yang diartikan juga sebagai besarnya kesalahan yang ditolerir di dalam membuat keputusan. Seandainya ditentukan bahwa tingkat keyakinannya sebesar 95%, maka kesalahan yang ditolerir adalah yang kurang dari 5% atau 0,05. Angka ini didapat dari rumus 1- α tersebut (1 - 95% = 5% atau 0,05). Dengan demikian, dengan menggunakan persamaan di atas kita dapat menginterpretasi bahwa kemungkinan nilai B berada pada interval adalah sebesar 95%. Penghitungan seperti tersebut digunakan untuk menentukan apakah nilai B menerima atau menolak hipotesis (H0).
Banyak sekali konsep-konsep ekonomi yang dirumuskan dalam model matematis, seperti pengukuran GNP, tingkat Inflasi, uang beredar, dan lain-lain. Penggunaan model matematis seperti itu dimaksudkan untuk mendefinisikan hubungan antara berbagai variabel-variabel ekonomi yang saling mempengaruhi. Karena dalam pengukuran ekonomi diwujudkan dalam bentuk angka-angka maka ekonometrika bersifat kuantitatif, Dengan demikian, untuk dapat melakukan pengukuran kegiatan ekonomi, maka diperlukan alat analisisnya yang berupa gabungan dari teori ekonomi, matematika, dan statistika.
131
Blogger: Pondok Pangelmon Pawenang - Buat Entri
[email protected] | Dasbor | Akunku | Bantuan | Keluar
Pondok Pangelmon Pawenang
●
●
Posting ●
●
Pengaturan
●
Tata Letak
●
Lihat Blog
●
Judul:
EKONOMETRIKA
Tautan:
ekonometrika
Buat
Edit Entri
Moderasi Komentar
Gunakan ini untuk membuat link judul Anda ke dalam
website. Info lengkap
Edit HTML
Pratinjau
Font
Opsi Entri
Tulis
Label untuk entri ini: contoh skuter, liburan, musim gugur
Sembunyikan semua
Semua Label: akuntansi biaya akuntansi manajemen Filsafat Ekonomi filsafat ilmu filsafat sosial Teori
Keadilan Jalan pintas: tekan Ctrl dengan: B = Tebal, I = Italic, P = Publikasikan, S = Simpan, D = Konsep lainnya
Terbitkan Entri
Simpan Sekarang
Kembali ke daftar entri
http://www.blogger.com/post-create.g?blogID=3799599743255279943 [11/27/2008 10:46:55 AM]
Konsep disimpan otomatis di 10:56