Modul 2 - Statistika Ekonomi II
TEORI REGRESI Arie Wibowo Khurniawan, S.Si, M.Ak
Materi Konsep Populasi dan Sampel dalam garis
Regresi Variabel Gangguan
ei
Koefisien Regresi Penaksir Distribusi probabilitas dan Hubungan antarvariabel menggunakan uji
Hipotesis Latihan
Sejarah Persamaan regresi merupakan persamaan matematis yang memungkinkan kita meramalkan nilai-nilai peubah gayut (Y) dari nilai peubah tak gayut (X). Istilah ini berasal dari telaah kebakaan yang dilakukan oleh Sir Francis Galton (1822-1911) yang membandingkan tinggi badan anak laki-laki dengan tinggi badan ayahnya. Galton menunjukkan bahwa tinggi anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur (regressed) mendekati nilai populasi. Dengan kata lain, anak lakilaki dari ayah yang badannya sangat tinggi, cenderung lebih pendak dari ayahnya. Sedangkan anak laki-laki dari ayah yang badannya sangat pendak cenderung lebih tinggi dari ayahnya. Sekarang istilah
Pengantar Regresi Dua variabel numerik ingin diketahui
hubungannya Dua variabel numerik salah satu variabel dianggap sebagai variabel yang mempengaruhi variabel lainnya Variabel yang mempengaruhi X, variabel bebas, variabel penjelas (Variabel tak gayut) Variabel yang dipengaruhi Y, variabel tak bebas, variabel respon (Variabel gayut)
Konsep Populasi dalam Regresi Asumsi 1 : Distribusi probabilitas
Y
Assumptions of the Simple Linear Regression Model
p(Yi/Xi) memiliki varian yang sama σ2 pada setiap Xi. Asumsi 2 : Nilai mean(rata-rata) yang diharapkan terletak pada sebuah garis lurus (regresi) populasi. E (Yi) = X
=
µ=α+β
E[Y]=α + β X
Identical normal distributions of errors, all centered on the regression line.
X
Misalnya : ingin melihat hubungan antara pengeluaran untuk iklan (ads expenditures, X) dengan penerimaan melalui Tahunpenjualan 1 2 (sales 3 4 revenue, 5 6 Y)7 8 9 10 X Y
10 9 11 12 11 12 13 13 14 15 44 40 42 46 48 52 54 58 56 60
65
sales revenue (millions of dollars)
60 55 50
ˆ e =Y-Y
e
45 40
Y
ˆ Y
35 8
10
12
14
ads expenditures (millions of dollars)
16
Y
Regression Plot
E[Y]=α+ βX Yi
{
}
Error: εi
β = Slope
} 1
α= Intercept
Xi
X
Model Regresi Populasi Dalam aplikasinya data populasi ini sangat sulit untuk didapatkan oleh karena diperlukan waktu yang lama dan biaya yang tinggi. Oleh karena itu biasanya para praktisi mengunakan sampel untuk menduga/menaksir/ mengestimasi
Konsep Sampel dalam Regresi Y
Model Regresi Sebenarnya
Regression Plot
Regresi yang diduga
Regresi Sebenarnya
Model Regresi yang diduga (Sampel)
X
Variabel Gangguan (ei) Y the observed data point
Yi
.
{
Error ei = Yi − Yi Yi
Nilai Yi yang diamati biasanya tidak tepat sama dengan nilai yang dihasilkan oleh persamaan regresi atau nilai harapan E(Yi)
Hal ini disebabkan adanya variabel error atau variabel gangguan (ei). X Variabel gangguan Xi biasanya disebabkan ei = Yi - E(Y i) = Yi - µ oleh = Yi:- α - βXi • Kesalahan Pengukuran (human error) • Kesalahan Stokastik (kesalahan yang disebabkan oleh sifat ketidakmungkinan sesuatu di duplikasi)
Menaksir Nilai
dan
Garis regresi yang sebenarnya pada dasarnya tidak dapat diketahui bentuknya, yang dapat diketahui hanyalah dengan pendekatan metode kuadrat terkecil (lease square) dari sampel yang kita miliki yaitu : x1,x2,x3,.. dan y1,y2,y3,... a tau
Kasus 1 : X = % kenaikan biaya promosi penjualan (sales promotion selama 1 tahun Y = % kenaikan hasil penjualan selama 1 tahun X 1 2 3 4 Y 35 5 7 8
10 Buatlah persamaan regresi liniear sederhana
Distribusi Probabilitas
dan
Untuk mengetahui seberapa jauh atau dekat jenis estimasi regresi sampel menyimpang dari garis regresi populasi Y =α +βX. perlu diketahui bagaimana terdistribusi di sekitar α dan bagaimana terdistribusi di sekitar β. Hal ini dapat dilihat dari variance atau simpangan dimana : baku sbb:
Kasus 2 : X = % kenaikan biaya promosi penjualan (sales promotion selama 1 tahun Y = % kenaikan hasil penjualan selama 1 tahun X 1 2 3 4 Y 35 5 7 8
10 Hitunglah Standar Deviasi singel (S)
Interval Kepercayaan Dalam prakteknya, pendugaan tunggal tidak dapat memberikan berapa jarak/selisih nilai harapan (sampel) terhadap nialai sebenaranya (populasi). Itulah sebabnya sering digunakan pendugaan interval (selang), yaitu suatu pendugaan berupa interval yang dibatasi oleh dua nilai, yang disebut nilai batas bawah dan nilai batas atas. Untuk membuat pendugaan interval, tentukan terlebih dahulu besarnya koefisien kepercayaan atau tingkat kepercayaan, yang diberi simbol 1-α. Besarnya nilai 1α misalnya 90% (α=10%), 95% (α=5%), 99% Luas kurva = (α=1%) 1 atau α/2 lainnya. atau angka 100% 1-α α/2 -tα/2
+tα/2
Interval Kepercayaan
dan
Adapun Interval kepercayaan α dan β adalah da n Ingat ! 1 !!
3
2
4
5
a tau
Kasus 3 : X = % kenaikan biaya promosi penjualan (sales promotion selama 1 tahun Y = % kenaikan hasil penjualan selama 1 tahun X 1 2 3 4 Y 35 5 7 8
10 Hitunglah Interval kepercayaan α dan β dengan derajat keyakinan 95%
Uji Hipotesis Uji ini bertujuan untuk membuktikan ada atau tidaknya hubungan linier yang berarti antara variabel X dan Y, dimana hubungan ini ditentukan 1 oleh parameter β. Pada umumnya hipotesis dirumuskan sbb: H0 : β = 0 (tidak terdapat hubungan berarti antara X dan Y) H1: β ≠ 0 (terdapat hubungan berarti antara X dan Y) Kriteria : 1. apabila ttabel < thitung, maka H0 diterima 2. apabila ttabel > thitung, maka H0 ditolak dan berarti terdapat
2
H0 : β = 0 (tidak terdapat hubungan berarti antara X dan Y) H1: β > 0 (terdapat hubungan positif antara X dan Y) Kriteria : 1. apabila ttabel < thitung, maka H0 ditolak 2. apabila ttabel > thitung, maka H0 diterima dimana:
Kasus 4 : X = % kenaikan biaya promosi penjualan (sales promotion selama 1 tahun Y = % kenaikan hasil penjualan selama 1 tahun X 1 2 3 4 Y 35 5 7 8
10 Ujilah apakah terdapat hubungan linier yang berarti antara X dan Y
ARIE WIBOWO K 0813 111 77 904 buitenzorg99@yaho o.com