RESUME STATISTIKA – Untuk Ekonomi dan Keuangan Modern Buku II SUHARYADI PURWANTO S.K Statistik Deskriptif – digunakan untuk menggambarkan atau mendeskripsikan data yang telah dikumpulkan menjadi sebuah informasi. Statistik Induktif – digunakan untuk mengetahui tentang karakteristik populasi berdasarkan karakteristik sampel serta menganalisis dan menginterpretasikan menjadi sebuah kesimpulan atau informasi yang berguna untuk pengambilan keputusan. Kajian utama Statistik Induktif : - Probabilitas suatu peristiwa; - Pengujian hipotesa; - Pendugaan parameter. Populasi dan Sampel Populasi adalah kumpulan dari semua kemungkinan orang-orang, benda-benda, dan ukuran lain yang menjadi objek perhatian atau kumpulan seluruh objek yang menjadi perhatian. Sampel adalah suatu bagian dari populasi tertentu yang menjadi perhatian. Sampel probabilitas Merupakan suatu sampel yang dipilih sedemikian rupa dari populasi sehingga masingmasing anggota populasi memiliki probabilitas atau peluang yang sama untuk dijadikan sampel. Sampel nonprobabilitas Merupakan suatu sampel yang dipilih sedemikian rupa dari populasi sehingga setiap anggota tidak memiliki probabilitas atau peluang yang sama untuk dijadikan sampel. Metode Penarikan Sampel Metode Penarikan Sampel
Sampel Probabilitas (Probability Sampling)
1.Penarikan sampel acak sederhana (simple random sampling) 2. Penarikan sampel acak terstruktur (stratified random sampling) 3. Penarikan sampel cluster (cluster sampling)
Sampel Nonprobabilitas (Nonprobability Sampling)
1.Penarikan sampel sistematis (systematic sampling) 2. Penarikan sampel kuota (kuota sampling) 3. Penarikan sampel purposive (purposive sampling)
1. Penarikan Sampel Acak Sederhana Adalah pengambilan sampel dari populasi secara acak tanpa memperhatikan strata yang ada dalam populasi dan setiap anggota populasi memiliki kesempatan yang sama untuk dijadikan sampel. Dua cara sampel acak sederhana: a. Sistem Kocokan; yaitu sistem sampel acak sederhana dengan cara sama dengan sistem arisan. b. Menggunakan tabel acak; yaitu pemilih sampel dengan menggunakan suatu tabel. Dalam penggunaannya ditentukan terlebih dahulu titik awal (starting point). 2. Penarikan sampel acak terstruktur Penarikan sampel acak terstruktur dilakukan dengan membagi anggota populasi dalam beberapa sub kelompok yang disebut strata, lalu suatu sampel dipilih dari masing-masing stratum. Penarikan sampel terstuktur pada beberapa kasus memiliki keunggulan karena dapat merefleksikan secara lebih akurat parameter populasi daripada metode acak sederhana. Hal demikian terjadi apabila apabila pada kasus suatu strata jumlahnya sangat kecil, maka akan tidak terambil sampel pada metode acak sederhana. Dengan metode terstruktur maka setiap strata mempunyai jumlah sampel minimal, sehingga semua struktur dapat terwakili sehingga hasilnya lebih akurat. 3. Penarikan sampel cluster Adalahn teknik memilih sampel dan kelompok unit-unit yang kecil (cluster) dari sebuah populasi yang relatif besar dan tersebar luas. Anggota dalam setiap cluster bersifat tidak homogen/berbeda. 4. Penarikan sampel dikatakan sistematis apabila setiap unsur atau anggota dalam populasi disusun dengan cara tertentu-Secara alfabetis, dari besar kecil atau sebaliknya-kemudian dipilih titik awal secara acak lalu setiap anggota ke K dari populasi dipilih sebagai sampel. 5. Penarikan sampel Kuota adalah pengambilan sampel dari populasi yang mempunyai ciri-ciri tertentu sampai jumlah atau kuota yang diinginkan. 6. Penarikan sampel Purposive adalah penarikan sampel dengan pertimbangan yang didasarkan pada kepentingan atau tujuan penelitian. Ada 2 cara penarikan sampel purposive, yaitu : - Convenience Sampling yaitu penarikan sampel berdasarkan keinginan peneliti sesuai dengan tujuan penelitian; - Judgment Sampling yaitu penarikan sampel berdasarkan penelitian terhadap karakteristik anggota sampel yang disesuaikan dengan tujuan penelitian. Metode ini biasanya dilakukan untuk penelitian yang bersifat kualitatif.
Kesalahan penarikan sampel adalah perbedaan antara nilai statistik sampel dengan nilai parameter dari populasi. Distribusi sampel Distribusi sampel dari rata-rata hitung sampel adalah suatu distribusi probabilitas yang terdiri dari seluruh kemungkinan rata-rata hitung sampel dari suatu ukuran sampel tertentu yang dipilih dari populasi, dan probabilitas terjadinya dihubungkan dengan setiap rata-rata hitung sampel. Nilai rata-rata dari populasi : ∑X µ= N Kombinasi : CNn =
N! n! (N - n)!
Distribusi sampel rata-rata dan proporsi mempunyai nilai hitung rata-rata : 1 1 Xp = N ∑ p X = N ∑X Cn Cn Standar deviasi populasi : 2 ∑ ( x - µ) σ= N Standar deviasi sampel : 2 1 s= x−x N ∑ cn Distribusi sampel rata-rata dan proporsi mempunya standar deviasi : 2 2 1 ∑ (p - µ p ) sx = ∑ x−x sp = c Nn CNn
(
)
(
)
Hubungan antara standar deviasi sampel x dan proporsi pada kondisi sampel terbatas : σ N−n P( 1 − P ) N−n sx = sp = × n N −1 n N −1 Hubungan antara standar deviasi sampel x dan proporsi pada kondisi sampel tidak terbatas : σ P( 1 − P ) sx = sp = n n
Distribusi sampel rata-rata dan proporsi merupakan distribusi normal, sehingga : ( p − P) x−µ Z= Z= sp s Distribusi sampel selisih rata-rata dan proporsi. Distribusi sampel selisih apabila terdapat dua atau lebih populasi yang diambil sebagai sampel. a. Distribusi sampel selisih rata-rata i. Nilai rata-rata x x1− x 2 = x1 − x 2 = µ1 − µ 2 ii. Nilai standar deviasi s2x1 s2x 2 s x1− x 2 = s2x1 + s2x 2 = + n1 n2 iii. Nilai Z x1 − x 2 − ( µ1 − µ 2 ) Z= s x1− x 2
(
)
b. Distribusi sampel selisih proporsi i. Nilai rata-rata Pp1−p 2 = Pp1 − Pp 2 = P1 − P2 ii. Nilai standar deviasi P1(1 − P1 ) P2 (1 − P2 ) sp1−p 2 = sp21 + sp22 = + n1 n2 iii. Nilai Z ( p − p2 ) − ( P1 − P2 ) Z= 1 sp1−p 2 Faktor koreksi adalah usaha untuk memperbaiki hasil dugaan parameter dan diterapkan jika ratio n/N lebih besar dari 0,05. Faktor koreksi terhadap standar deviasi dirumuskan sebagai berikut : σ N−n sx = n N −1 Sedangkan untuk standar deviasi proporsi adalah : p( 1 − p ) N − n sp = n N −1 Dalil batas tengah menyatakan bahwa apabila populasi bersifat normal, maka distribusi sampel rata-rata dan proporsi juga bersifat normal.
Teori pendugaan dibagi dua, yaitu: (a) Pendugaan titik yang menggunakan nilai tunggal untuk menduga nilai populasi, (b) Pendugaan interval yaitu suatu interval dimana nilai parameter populasi diharapkan berada. Pendugaan yang baik mempunyai sifat: (a) tidak bias, nilai statistik sama dengan nilai parameter; (b) efisien, mempunyai standar deviasi yang kecil; dan (c) konsisten yaitu semakin banyaknya sampel semakin mendekati nilai populasi. Faktor-faktor yang penting dalam menyusun interval keyakinan rata-rata hitung adalah: (a) jumlah pengamatan dalam sampel (n); (b) besarnya standar deviasi; dan (c) tingkat keyakinan (C), dimana α = 1 – C Rumus interval untuk nilai rata-rata : x − Zα 2 ⋅ s n < µ < x + Zα 2 ⋅ s
(
)
(
n
)
Faktor-faktor yang penting dalam menyusun interval proporsi adalah: (a) jumlah pengamatan dalam sampel; (b) nilai proporsi (p); dan (c) tingkat keyakinan. Rumus interval untuk nilai rata-rata : (p − Zα 2 ⋅ Sp < P < p + Zα 2 ⋅ Sp) Rumus interval untuk selisih rata-rata dan proporsi: untuk melihat perbedaan antara dua populasi. a. Rumus interval untuk selisih nilai rata-rata x1 − x 2 − Z α 2 ⋅ σ x1− x 2 < ( µ1 − µ 2 ) < x1 − x 2 + Z α 2 ⋅ σ x1− x 2
((
)
)
((
)
)
b. Rumus interval untuk selisih nilai proporsi ( ( p1 − p2 ) − Zα 2 ⋅ sp1−p2 ) < (P1 − P2 ) < ( ( p1 − p2 ) + Zα 2 ⋅ sp1−p2 ) Penentuan ukuran sampel yang tetap akan memberikan dugaan yang baik bagi parameter populasi. Beberapa faktor yang mempengaruhi penentuan ukuran sampel yaitu: (a) tingkat keyakinan yang diinginkan (nilai Z); (b) tingkat kesalahan sampel yang diperbolehkan (ε); dan (c) standar deviasi dari populasi. Rumus untuk menentukan jumlah sampel : a. Jumlah sampel untuk nilai rata-rata : 2 n = ( Zα 2 ⋅ σ) ε
[
]
b. Jumlah sampel untuk nilai proporsi dengan nilai P diketahui : 2 ( Z α 2 ) p( 1 − p ) n= +1 ε2 c. Jumlah sampel untuk nilai proporsi denngan nilai P tidak diketahui : 2 n = ( 0,25 ) ( Z α 2 ε )
Hipotesa adalah suatu penyamaran mengenai nilai suatu parameter populasi yang dimaksudkan untuk pengujian dan berguna untuk pengambilan keputusan. Pengujian hipotesa adalah prosedur yang didasarkan pada bukti sampel yang dipakai untuk menentukan apakah hipotesa merupakan suatu pernyataan yang wajar dan oleh karenanya tidak ditolak, atau hipotesa tersebut tidak wajar dan oleh karena itu harus ditolak. Langkah-langkah pengujian hipotesa : a. Merumuskan hipotesa nol (H0) dan hipotesa alternatif (H1). H0 adalah suatu pernyataan mengenai nilai parameter populasi. H1 adalah suatu pernyataan yang diterima jika data sampel memberikan cukup bukti bahwa hipotesa nol adalah salah. H0 mempunyai tanda persamaan =, ≤, ≥; sedangkan H1 ≠, <, >. b. Menentukan taraf nyata yaitu probabilitas menolak hipotesa nol yang benar, semakin kecil semakin baik. Besar taraf nyata bisa 0,1; 0,05; dan 0,01. c. Uji statistik dengan menggunakan uji Z untuk populasi besar, uji t untuk sampel kecil, dan lain-lain. d. Menentukan daerah keputusan yaitu nilai Z kritis dari taraf nyata. Daerah keputusan ini bisa berupa uji satu arah dan dua arah. e. Menentukan keputusan yaitu menentukan nilai uji statistik dengan daerah keputusan. Menguji hipotesa mengenai rata-rata hitung dan proporsi populasi : a. Rumus Z, jika standar deviasi populasi (σ) diketahui : x −µ Z= sx b. Apabila nilai σ tidak diketahui, maka dugaan terbaik adalah menggunakan standar deviasi sampel (s). c. Rumus Z untuk proporsi populasi p −P Z= P(1 − P ) n Menguji Hipotesa Selisih Dua Nilai Rata-rata dan Proporsi : a. Rumus uji Z untuk selisih rata-rata dua : x1 − x 2 ( µ1 − µ 2 ) Z= s x1− x 2 b. Standar error selisih rata-rata hitung dari selisih dua nilai rata-rata untuk standar deviasi populasi yang diketahui :
(
)
σ x1− x 2 = σ12 n1 + σ22 n2 c. Standar error selisih rata-rata hitung apabila standar deviasi populasi tidak diketahui, digunakan dugaan standar error sampel : s x1− x 2 = s12 n1 + s22 n2 d. Rumus uji Z untuk selisih proporsi :
Z=
( p1 − p2 )( P1 − P2 )
sp1−p 2 e. Standar error selisih proporsi dari selisih dua proporsi untuk standar deviasi populasi yang diketahui : sp1− p 2 = [P1(1 − P1 ) ] n1 + [P2 (1 − P2 ) ] n2 f. Standar error selisih proporsi apabila standar deviasi populasi tidak diketahui : sp1−p 2 = [P(1 − P ) ] ( n1 − 1) + [P(1 − P ) ] ( n2 − 1) g. Nilai P diperoleh dari : ( x + x2 ) P= 1 ( n1 + n2 ) Dimana x1 adalah jumlah sukses atau unsur dari sampel pertama yang sesua, x2 adalah jumlah sukses atau unsur dari sampel kedua. Kesalahan jenis I dan II : a. Kesalahan jenis I adalah menolak hipotesa nol, padahal hipotesa nol benar; b. Probabilitas kesalahan jenis I adalah sebesar taraf nyata, atau α; c. Kesalahan jenis II adalah menerima hipotesa nol, padahal hipotesa nol adalah salah; d. Kesalahan jenis II dilambangkan dengan β; e. Probabilitas kesalahan jenis II dihitung dengan : µ −µ Z = xp σ n Dimana μxp = batas pengendalian, μ adalah rata-rata hitung, σ adalah standar deviasi dan n adalah besar sampel. f. Kurva Operating Characteristic adalah kurva yang memperlihatkan probabilitas menerima hipotesa yang salah. g. Kurva Power adalah kurva yang menunjukkan mengenai probabilitas tidak melakukan kesalahan jenis II.
Distribusi t-student digunakan untuk sampel kecil yaitu sampel yang kurang dari 30 serta populasi terdistribusi secara normal. Ciri-ciri dari distribusi t-student adalah: (a) merupakan distribusi kontinu; (b) berbentuk genta; (c) distribusi t-student merupakan suatu keluarga, dimana setiap derajat bebas dengan taraf nyata tertentu mempunyai distribusi tertentu pula, serta semakin besar sampel maka akan mendekati kurva normal; dan, (d) bentuk kurva t-student lebih melebar dan mendatar dibandingkan dengan kurva normal. Rumus untuk uji hipotesa tentang rata-rata adalah sebagai berikut : x−µ t= s n Dimana x merupakan rata-rata sampel, μ rata-rata populasi, s deviasi standar populasi dan n adalah jumlah sampel.
(
)
Rumus untuk uji hipotesa selisih antara dua rata-rata hitung populasi adalah sebagai berikut : - Untuk gabungan standar deviasi ( n − 1) s12 + ( n2 − 1) s22 S2p = 1 ( n1 + n2 ) − 2 - dan uji t menjadi x1 − x 2 t= S2p 1 + 1 n1 n2
( )
-
( )
dimana n1, adalah jumlah sampel pertama, s12 standar deviasi sampel pertama, n2 jumlah sampel kedua, s 22 standar deviasi sampel kedua, x 1 rata-rata sampel pertama, dan x 2 rata-rata sampel kedua.
Rumus uji hipotesa untuk data berpasangan adalah sebagai berikut: - Uji t : d t= sd n - Standar deviasi :
∑d
2
sd =
( d) − ∑ n
2
n −1 di mana d nilai rata-rata dari perbedaan sampel berpasangan, sd adalah standar deviasi data berpasangan, d perbedaan setiap data berpasangan dan n adalah jumlah sampel.
Distribusi F digunakan untuk menguji dua atau lebih rata-rata secara simultan. Analisis varians (ANOVA) digunakan untuk membedakan tiga nilai tengah atau lebih. Asumsi ANOVA yang mendasar adalah (a) sampel diperoleh dari populasi yang normal; (b) setiap populasi mempunyai standar deviasi yang sama; serta (c) semua populasi bersifat bebas satu sama lainnya. Rumus uji F adalah sebagai berikut : SST k − 1 MSTR F= = SSE N − k MSE T2 ( x) SST = ∑ c − ∑ N nc T2 SSE = ∑ c nc
2
Di mana Tc adalah jumlah nilai X pada setiap kolom, X adalah nilai setiap pengamatan, N jumlah total pengamatan dan nc adalah jumlah pengamatanpada setiap kolom atau perlakuan.
Analisis Korelasi adalah suatu teknik statistika yang digunakan untuk mengukur keeratan hubungan atau korelasi antara dua variabel . a. Koefisien korelasi yang dilambangkan dengan huruf r, Koefisien korelasi (r) menunjukkan seberapa dekat dengan kombinasi titik antara variabel Y dan X pada garis lurus sebagai garis dugaannya. b. Rumus koefisien korelasi n( ∑ XY ) − ( ∑ X )( ∑ Y ) r= 2 2 n ∑ X2 − ( ∑ X ) n ∑ Y 2 − ( ∑ Y )
[(
][ (
)
)
]
c. Koefisien determinasi r2 adalah bagian dari keragaman total variabel tak bebas Y yang dapat diterangkan atau diperhitungkan oleh keragaman variabel bebas X. d. Uji terhadap r yaitu apakah korelasi di dalam populasi sama dengan nol. Rumus distribusi t untuk uji r adalah sebagai berikut : r t= r n−2 t= atau 1− r 2 2 1− r n−2 Analisis regresi dilakukan untuk memperoleh koefisien regresi dari persamaan Y= a+bX, nilai koefisien yang diperoleh digunakan untuk menduga nilai Y berdasarkan nilai X tertentu. a. Rumus untuk koefisien regresi b : n( XY ) − ( ∑ X )( ∑ Y ) b= ∑ 2 n ∑ X2 − ( ∑ X ) b. Rumus untuk koefisien regresi a : ( ∑ Y ) − b( ∑ X ) a= n n
(
)
Standar error atau kesalahan baku pendugaan adalah suatu ukuran terhadap pancaran atau persebaran nilai-nilai pengamatan (Y) terhadap garis regresinya (Ŷ). Rumus kesalahan baku pendugaan adalah : S x. y =
∑Y
2
− a∑ Y − b∑ XY n−2
Rumus kesalahan baku untuk koefisien regresi b : Sb = S x.y
∑ X − ( ∑ X) 2
2
n
Rumus kesalahan baku untuk koefisien regresi a : Sa =
(∑ X
2
)
⋅ S x.y n∑ X − ( ∑ X )
2
Pendugaan interval nilai tengah Y dimaksudkan untuk mengetahui nilai dugaan bagi Y untuk seluruh nilai X yang diketahui. Rumus interval untuk nilai tengah Y adalah sebagai berikut :
(
)
2
1 X−X Yˆ ± t ( S yx ) + n ∑ X 2 − ( ∑ X) 2 n Pendugaan interval untuk koefisien regresi A dan B dirumuskan sebagai berikut : - Interval untuk B adalah : (b − t α 2 ⋅ Sb ≤ B ≤ b + t α 2 ⋅ Sb) -
Interval untuk A adalah : (a − t α 2 ⋅ Sa ≤ A ≤ a + t α 2 ⋅ Sa)
Pengujian hipotesa adalah suatu prosedur untuk memeriksa apakah koefisien regresi (a dan b) yang dihasilkan dari sampel sesuai atau tidak dengan nilai parameter populasi sebenarnya (A dan B) atau yang dihipotesakan. - Nilai t-hitung untuk b adalah : t = ( b − B ) Sb - Nilai t-hitung untuk a adalah : t = ( a − A ) Sa Apabila nilai t-hitung besar dari t-tabel dengan taraf nyata dan derajat bebas (df)=n-1, maka koefisien a dan b pengaruhnya nyata atau signifikan secara statistik. Koefisien korelasi koefisien determinasi dan kesalahan baku pendugaan mempunyai hubungan yang dapat digambarkan dengan tabel Anova. Dari tabel Anova dapat diketahui koefisien determinasi, kesalahan baku pendugaan dan nilai uji F untuk koefisien regresi. Rumus koefisien determinasi : Keragaman Regresi SSR SSE r2 = = = 1− Keragaman Total SST SST Rumus kesalahan baku pendugaan : S yx = SSE ( n − 2) Rumus untuk uji F F = ( SSR 1) ( SSE ( n − 2) ) = MSR MSE
Regresi berganda digunakan untuk mengetahui arah dan besar pengaruh dari variabel bebas yang jumlahnya lebih dari satu terhadap variabel tidak bebasnya. Banyak peristiwa di dalam kehidupan sosial ekonomi yang menunjukkan bahwa suatu variabel tidak bebas dipengaruhi oleh banyak variabel bebas. Analisa regresi berganda didasarkan pada asumsi-asumsi sebagai berikut : a. Ada hubungan yang bersifat linier antara variabel tidak bebas dengan variabel bebasnya. b. Variabel tidak bebas bersifat kontinu atau berskala rasio atau nisbah. c. Keragaman atau residu untuk semua nilai Y bersifat konstan dan menyebar secara normal. d. Pengamatan yang bersifat berurutan terhadap variabel bebas tidak berkorelasi. Bentuk umum persamaan regresi berganda adalah sebagai berikut : Y = a + b1 X1 + b2 X2 + b3 X3 + ... + bk Xk Persamaan regresi untuk dua variabel bebas adalah sebagai berikut : Y = a + b1 X l + b 2 X 2 Untuk mencari koefisien regresi yaitu a, b1, dan b2 digunakan rumus sebagai berikut : ΣY = na + b1ΣX1 + Σb2ΣX2 ΣY1Y = aΣX1 + b1ΣX12 + b2ΣX1ΣX2 ΣX2Y = aΣX2 + b1ΣX1 ΣX2 + b2ΣX22 Sedangkan untuk menemukan koefisien regresi lebih dari 2 variabel bebas akan sangat rumit, oleh sebab itu menggunakan program komputer akan sangat mempermudah. Koefisien determinasi menunjukkan suatu proporsi dari varian yang dapat diterangkan oleh persamaan terhadap varian total. Besarnya koefisien determinasi dirumuskan sebagai berikut : 2 n( a ⋅ ∑ Y + b1 ⋅ ∑ YX1 + b2 ⋅ ∑ YX2 ) − ( ∑ Y ) 2 R = 2 n ⋅ ∑ Y2 − ( ∑ Y ) Koefisien korelasi parsial dalam regresi berganda digunakan untuk melihat besarnya hubungan antara dua variabel yang bebas dari variabel yang lainnya. Besarnya koefisien korelasi parsial dirumuskan sebagai berikut : rYX1 − rYX 2rX1X 2 rYX1. X 2 = 2 2 1 − rYX 2 1 − rX1X 2
(
rYX 2. X1 = rYX1. X2.Y =
)(
)
rYX 2 − rYX1rX1X 2
(1 − r )(1 − r ) 2 YX1
2 X1X 2
rX1X 2 − rYX 2rYX 2
(1 − r )(1 − r ) 2 YX1
2 YX 2
Supaya hasil regresi tidak bias dan efisien maka harus diketahui apakah terjadi pelanggaran terhadap asumsinya. Beberapa pelanggaran asumsi tersebut adalah: (a) multikolinier yaitu terdapatnya hubungan antara variabel tidak bebas; (b) Heteroscedasticity yaitu pelanggaran di mana nilai residu ternyata tidak bersifat konstan untuk semua data Y; dan, (c) Autokorelasi yaitu pelanggaran asumsi di mana terdapat korelasi antara data pengamatan
Regresi nonlinier atau kurvilinier, adalah suatu fungsi yang menghubungkan variabel tidak bebas Y dengan variabel bebas X yang sifatnya tidak konstan untuk setiap perubahan nilai X. Bentuk-bentuk fungsi nonlinier: a. Bentuk Double Log, Y = αXb. Fungsi double log dapat dibuat liniear menjadi Y = a + bX, di mana Y = Ln Y dan X = Ln X. Model double log biasanya sesuai untuk kondisi di mana perubahan X menghasilkan perubahan terhadap Y yang tidak konstan baik meningkat atau menurun. b. Bentuk Semi Log = Y = a + b Log X atau Log Y = a + b X, model ini cocok untuk kondisi di mana perubahan X mengakibatkan perubahan terhadap Y dengan persentase yang konstan. c. Bentuk Hiperbola Y = a + b (1/X). Bentuk fungsi hiperbola yaitu apabila X meningkat maka Y akan menurun secara nir-linier. Y akan menurun secara kontinu dengan meningkatnya X, kemudian mendekati nilai asimptotik. d. Bentuk Kuadratik Y = a + b X2. Fungsi kuadratik biasanya berbentuk siklus atau ada titik minimum dan titik maksimum Memilih bentuk fungsi yang cocok harus didasarkan pada kesesuaian dengan fenomena ekonomi, bentuk yang lebih sederhana dan mempunyai koefisien determinasi yang tinggi. Variabel kualitatif adalah variabel yang dimaksudkan untuk menggambarkan kualitas dan bukan kuantitas. Variabel kualitatif yang mempunyai skala 0 dan 1 disebut variabel dummy. Variabel dummy boleh mempunyai skala lebih dari dua dengan ketentuan jumlah variabel dummy = jumlah skala -1. Variabel lag yaitu variabel yang terjadi karena ada kesenjangan waktu antara respons variabel bebas dengan variabel tidak bebasnya. Variabel lag dapat terjadi karena masalah teknologi, kelembagaan dan psikologis. Supaya dapat diregresikan dengan baik, maka diusahakan variabel lag-nya tidak terlalu jauh, sehingga tidak kehilangan data pengamatan dan multikolinieritas tidak terjadi.
Statistika Nonparametrik adalah statistik yang tidak memerlukan pembuatan asumsi tentang bentuk distribusi atau bebas distribusi, sehingga statistik nonparametrik tidak memerlukan asumsi terhadap populasi yang akan diuji. Statistika nonparametrik digunakan apabila: (a) ukuran sampel sedemikian kecil sehingga distribusi sampel atau populasi tidak mendekati normal; (b) apabila hasil pengukuran menggunakan data ordinal atau data berperingkat; dan, (c) apabila hasil pengukuran menggunakan data nominal. Uji chi-kuadrat digunakan untuk menguji keselarasan (goodness of fit) apakah frekuensi yang diharapkan sesuai dengan frekuensi yang teramati. Beberapa langkah yang diperlukan dalam pengujian keselarasan adalah: (a) menentukan hipotesa, Ho menyatakan adanya kecocokan antara frekuensi harapan dan frekuensi teramati, H1 menyatakan tidak adanya kecocokan antara frekuensi harapan dan frekuensi teramati; (b) menentukan nilai chi-kuadrat kritis dengan mengetahui derajat bebasnya dan tarat nyata; (c) menghitung nilai chi-kuadrat dengan rumus, X2 = Σ(fo - fe)2/fe; (d) menentukan daerah keputusan untuk menerima Ho atau menolak Ho; dan, (e) memutuskan menerima Ho atau menolak Ho, apabila nilai X2 hitung > dari X2 tabel, maka Ho diterima dan begitupula sebaliknya. Uji chi-kuadrat juga dapat digunakan untuk menguji apakah suatu distribusi mengikuti kurva normal atau tidak. Beberapa langkah yang diperlukan dalam pengujian normalitas yaitu: (a) menentukan distribusi frekuensi, nilai tengah rata-rata dan standar deviasi untuk data berkelompok; (b) menentukan nilai Z untuk batas bawah dan atas kelas, dimana Z = (X - µ)/σ; (c) menentukan luas atau probabilitas untuk nilai Z batas bawah dan atas kelas; (d) menghitung nilai frekuensi harapan dengan mengalikan probabilitas harapan setiap kelas dengan jumlah sampel; dan, (e) melakukan pengujian keselarasan sebagaimana dikemukakan pada kesimpulan ketiga. Uji chi-kuadrat dapat digunakan untuk uji independensi yaitu menguji apakah suatu variabel berhubungan dengan variabel yang lainnya. Untuk keperluan ini disusun tabel kontingensi yaitu satu variabel dengan kategori sejumlah c, dan variabel lain dengan kategori sejumlah r. Beberapa langkah yang diperlukan dalam uji independensi adalah: (a) menentukan hipotesa yaitu Ho menyatakan tidak adanya hubungan dan H1 menyatakan adanya hubungan; (b) menentukan taraf nyata dengan derajat bebas = (c - 1)(r - 1) dan taraf nyata α; (c) menentukan frekuensi harapan, dimana fe = (jumlah baris x jumlah kolom)/jumlah total; (d) mencari nilai chi-kuadrat dengan rumus X2 = Σ(fo - fe)2/fe; dan, (e) menentukan daerah keputusan untuk menerima Ho atau menolak Ho, dan (f) memutuskan untuk menerima Ho atau menolak Ho. Ciri-ciri distribusi chi-kuadrat: (a) nilai chi-kuadrat selalu positif; (b) distribusi chikuadrat tidak tunggal sebagaimana distribusi F dan t, tetapi keluarga distribusi chikuadrat dengan derajat bebas yang berbeda; dan, (e) distribusi chi-kuadrat condong ke kiri dan semakin banyak derajat bebasnya semakin mendekati kurva normal.