Kamarul Imam
[email protected]
ANALISIS DISKRIMINAN
1. Introduksi. Analisis Regresi Logistik dan Analisis Diskriminan adalah teknik statistik yang sesuai untuk variabel dependen yang bersifat katagorial (nominal atau nonmetrik) dengan variabel independen bersifat metrik. Pada banyak kasus, variabel dependen terdiri dari dua kelompok atau klasifikasi, contoh : lakilaki dan perempuan, tinggi dan rendah; bahkan seringkali juga lebih dari dua kelompok, seperti : rendah, sedang dan tinggi. Analisis Diskriminan dapat diaplikasi kepada dua kelompok atau lebih. Jika hanya ada dua kelompok variabel dependen, maka analisis disebut sebagai Two Group Discriminant Analysis, sedang untuk tiga kelompok atau lebih, analisis disebut Multiple Discriminant Analysis (MDA). Analisis Regresi Logistik atau disebut sebagai Analisis Logit terbatas hanya pada dua kelompok variabel dependen, walaupun dengan formulasi alternatif analisis ini bisa diaplikasi kepada lebih dari dua kelompok variabel dependen. Analisis Diskriminan melibatkan penurunan sebuah variat, merupakan kombinasi linier terbaik dari dua variabel independen atau lebih yang akan mendiskriminasi antara kelompok kelompok yang secara apriori didefinisikan sejak awal. Diskriminasi dapat diperoleh melalui mengatur bobot variat untuk setiap variabel untuik memaksimumkan varians antar kelompok relatif terhadap varians di dalam kelompok. Kombinasi linier tersebut disebut sebagai fungsi diskiriminan, yang diderivasi dari sebuah persamaan dalam bentuk : Zjk = a + W1 X1k + W2 X2k + . . . . + Wn Xnk Di mana, Zjk = skor diskriminan dari fungsi diskriminanj untuk obyekk, a = intersep, Wi = bobot diskriminan untuk variabel independeni, Xik = variabel independeni untuk obyekk. Analisis Diskriminan adalah teknik statistik yang sesuai untuk menguji hipotesis yang menyatakan bahwa ratarata kelompok dari sekumpulan variabel independen untuk dua kelompok atau lebih, setara. Untuk menyatakan hal itu, Analisis Diskriminan mengkalikan nilai setiap variabel independen dengan bobotnya masingmasing dan menjumlahkannya bersamasama. Hasilnya adalah sebuah skor Z diskriminan tunggal yang bersifat komposit untuk setiap individual dalam analisis. Melalui peratarataan terhadap skor diskriminan untuk seluruh individual pada suatu kelompok tertentu, akan dihasilkan ratarata kelompok, atau disebut sebagai group centroids. Centroids ini mengindikasikan sebagian besar lokasi tipikal dari setiap individual yang ada pada kelompok tertentu, dan sebuah perbandingan terhadap centroids kelompok akan menunjukkan seberapa jauh kelompokkelompok itu terpisah. Uji signifikansi statistikal terhadap fungsi diskriminan adalah ukuran yang digeneralisasi dari jarak antara centroids kelompok. Ini ditentukan dari perbandingan distribusi skor diskriminan untuk kelompokkelompok. Jika overlaps distribusi yang dihasilkan itu kecil, maka fungsi diskriminan memisahkan kelompokkelompok itu dengan baik. Jika overlaps distribusi itu besar, maka fungsi diskriminan yang dihasilkan adalah fungsi yang tidak dapat berperan sebagai diskriminator dengan baik. Secara grafis, konsep hasil uji signifikansi statistik kepada fungsi diskriminan dapat digambarkan seperti pada gambar berikut :
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
1
Kamarul Imam
[email protected]
A
B
Z
A
B
Z
Gambar yang di atas menunjukkan bahwa fungsi diskriminan dapat mendiskriminasi kelompok A dan B dengan baik. Daerah berarsir adalah adalah daerah kesalahan klasifikasi, yaitu individual dari kelompok A diklasifikasi sebagai anggota kelompok B. Gambar yang di bawah menunjukkan bahwa fungsi diskriminan kurang dapat mendiskriminasi kelompok A dan B dengan baik. Analisis Diskriminan Multiple memiliki karakter yang unik di antara analisisanalisis hubungan, yaitu : jika ada lebih dari dua kelompok sebagai variabel dependen, analisis diskriminan akan menghitung lebih dari satu fungsi diskriminan (NG – 1), di mana NG adalah banyaknya kelompok. Setiap fungsi menghitung skor Z pada setiap kelompok yang diperbandingkan. Analisis Logit adalah bentuk khusus dari analisis regresi yang difromulasikan untuk memprediksi dan menjelaskan sebuah variabel dependen dengan sifat katagori (binary). Perbedaan antar Analisis Logit dengan Analisis Diskriminan adalah terutama pada asumsi yang mendasari. Asumsi pada Analisis Diskriminan : multivariat normal dan kesetaraan matriks varianskovarians antar kelompok, adalah asumsi yang sulit dipenuhi pada banyak situasi. Untuk variabel dependen yang terdiri atas dua kelompok katagorial, Analisis Logit lebih direkomendasi daripada Analisis Diskriminan.
2. Contoh Hipotetis Analisis Diskriminan. Analisis Diskriminan diaplikasi dengan tujuan pemahaman kepada anggota kelompok, apakah kelompokkelompok itu berupa individual (pelanggan dan bukan pelanggan), perusahaan (profitable dan unprofitable), produk (berhasil dan tidak berhasil); yang bisa dievaluasi melalui serangkaian variabel independen. Contoh1 : Analisis Diskriminan Dua Kelompok. HATCO bermaksud mengetahui apakah sebuah produk baru – food mixer, akan berhasil dipasarkan secara komersial. Untuk itu HATCO melakukan survey kepada calon pelanggannya. HATCO mengklasifikasi dua kelompok pelanggan, yaitu pelanggan yang akan membeli produk baru tersebut dan pelanggan yang tidak akan membeli. HATCO telah menentukan tiga variabel yang diperkirakan menjadi pertimbangan pelanggan dalam memutuskan membeli atau tidak, yaitu : daya tahan (durability), kualitas hasil (performance) D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
2
Kamarul Imam
[email protected]
dan tampilan (style). Kuesioner yang disebar kepada pelanggan berisi pertanyaan pertanyaan yang menyangkut kepada ketiga variabel ini, dengan skor jawaban 1 sampai dengan 10 (1 = sangat buruk, 10 = istimewa). Hasil survey kepada pelanggan dari dua kelompok adalah : Tabel 1. Skor Evaluasi Pelanggan Terhadap Produk Baru. Kelompok Berdasar Intensi Evaluasi Terhadap Produk Baru Pembelian X1 (durability) X2 (performance) X3 (style) Kelompok1 : Akan Membeli Pelanggan 1 8 9 6 Pelanggan 2 6 7 5 Pelanggan 3 10 6 3 Pelanggan 4 9 4 4 Pelanggan 5 4 8 2 Ratarata kelompok 7.4 6.8 4.0 Kelompok2 : Tidak Membeli Pelanggan 6 Pelanggan 7 Pelanggan 8 Pelanggan 9 Pelanggan 10 Ratarata kelompok Selisih Ratarata
5 3 4 2 2 3.2 4.2
4 7 5 4 2 4.4 2.4
7 2 5 3 2 3.8 0.2
Dengan sepuluh pelanggan yang diamati pada tiga variabel pertimbangan, dapat dibuat grafik untuk melihat apa yang dihasilkan Analisis Diskriminan. (Pelanggan yang akan membeli ditandai lingkaran, yang tidak membeli ditandai dengan kotak).
10
8
9
7
5
6
2
2
3
4
5
6
1
4
3
8
9
10
X1 1
7
9 6
10
7
4
8
3
2
5
1
4
5
6
7
8
9
10
8
9
10
X2 1
2
3
10 7
9
8
5
3
4
2
1
6
2
3
4
5
6
7
X3
1
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
3
Kamarul Imam
[email protected]
Pada grafik X1 (dengan selisih ratarata kelompok terbesar), tampak bahwa variabel ini hampir dapat mendiskriminasi dengan sempurna. Dengan titik diskriminasi (cutting point) = 5.5; tampak hanya satu pelanggan yang akan membeli terklasifikasi sebagai pelanggan yang tidak membeli, yaitu pelanggan no. 5. Kesalahan klasifikasi = 1/10 = 10%. Makin besar selisih ratarata kelompok, makin memperkecil daerah overlaps. Pada grafik X2, kesalahan klasifikasi terjadi pada pelanggan no. 4 dan no. 7. Pelanggan no. 5 terklasifikasi dengan benar, walaupun pada X1 pelanggan no. 5 ini terklasifikasi dengan tidak benar, dan sebagian besar pelanggan terklasifikasi dengan benar seperti pada variabel X1. Dapat disimpulkan bahwa X1 dan X2 secara bersamasama dapat digunakan sebagai kombinasi linier dalam fungsi diskriminan. Pada grafik X3, kesalahan klasifikasi makin tinggi. Maka dengan mengabaikan X3, fungsi diskriminan (kombinasi X1 dan X2) lebih mampu mendiskriminasi kedua kelompok. Perbandingan percentage correctly classified (cc) terhadap tiga alternatif fungsi diskriminan dapat dilihat pada tabel berikut : Tabel 2. Perbandingan CC Fungsi Diskriminan. Kelompok
Fungsi 1: Z = X1
Hasil Perhitungan Zscore Fungsi 2 : Fungsi 3 : Z = X1 + X2 Z = 4.53 + .476 X1 + .359 X2
Kelompok1 : Akan Membeli Pelanggan 1 Pelanggan 1 Pelanggan 1 Pelanggan 1 Pelanggan 1
8 6 10 9 4
17 13 16 13 12
2.51 0.84 2.38 1.19 0.25
Kelompok2 : Tidak Membeli Pelanggan 1 Pelanggan 1 Pelanggan 1 Pelanggan 1 Pelanggan 1 Cutting Score
5 3 4 2 2 5.5
9 10 9 6 4 11
0.71 0.59 0.83 2.14 2.86 0.0
CC pada masingmasing fungsi diskriminan dapat dihitung sebagai berikut : Prediksi Prediksi Kelompok Kelompok Kelompok Kelompok Kelompok 1 2 1 2 Aktual Aktual Aktual 1 4 1 1 5 0 1 2 0 5 2 0 5 2 CC fungsi 1 = 90%
CC fungsi 2 = 100%
Prediksi Kelompok 1
2
5 0
0 5
CC fungsi 3 = 100%
Keterangan : Fungsi 3 adalah fungsi eksplisit yang dihasilkan dari data input. Representasi geometrik dapat dijelaskan oleh gambar berikut :
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
4
Kamarul Imam
[email protected]
V1
A Zcutoff
B
A B
V2
Z
Gambar di atas menjelaskan dua kelompok yang berbeda, dengan V1 dan V2 sebagai ukuran setiap individual anggota masingmasing kelompok. Garis cutoff adalah garis yang membagi kedua kelompok berbeda. Daerah intersection merupakan daerah overlaps yang menyatakan kesalahan klasifikasi. Keofisien diskriminan dihitung dengan prinsip maksimasi varians antar kelompok dan minimasi varians di dalam kelompok. Jika varians antar kelompok relatif lebih besar dibanding varians di dalam kelompok, maka fungsi diskriminan dapat mengklasifikasi kelompok dengan lebih baik.
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
5
Kamarul Imam
[email protected]
Contoh2: Analisis Diskriminan Tiga Kelompok. HATCO melakukan survey terhadap kemungkinan perpindahan pelanggan dari para pesaing. HATCO mendefinisikan ada tiga kelompok pelanggan, yaitu : (1) melakukan perpindahan, (2) tidak memutuskan apaapa dan (3) tidak melakukan perpindahan. Penelitian kecil dialkukan HATCO dengan melibatkan 15 pelanggan sebagai responden, di mana masingmasing kelompok terdiri atas lima orang. Indikator penyebab perpindahan pelanggan yang dipertimbangkan adalah : harga kompetitif (X1) dan kualitas pelayanan (X2). Kuesioner yang disebar kepada pelanggan berisi pertanyaanpertanyaan yang menyangkut kepada kedua variabel ini, dengan skor jawaban 1 sampai dengan 10 (1 = sangat buruk, 10 = istimewa). Hasil survey kepada pelanggan dari tiga kelompok adalah : Tabel 3. Skor Evaluasi Pelanggan Kemungkinan Perpindahan Kepada Pesaing. Kelompok Berdasar Intensi Evaluasi Terhadap Suplier Sekarang Perpindahan X1 (price) X2 (service) Kelompok1 : Akan Pindah Pelanggan 1 2 2 Pelanggan 2 1 2 Pelanggan 3 3 2 Pelanggan 4 2 1 Pelanggan 5 2 3 Ratarata kelompok 2.0 2.0 Kelompok2 : Tidak Memutuskan Pelanggan 6 Pelanggan 7 Pelanggan 8 Pelanggan 9 Pelanggan 10 Ratarata kelompok
4 4 5 5 5 4.6
2 3 1 2 3 2.2
Kelompok3 : Tidak Pindah Pelanggan 11 Pelanggan 12 Pelanggan 13 Pelanggan 14 Pelanggan 15 Ratarata kelompok
2 3 4 5 5 3.8
6 6 6 6 7 6.2
Dengan tiga kelompok yang akan diklasifikasi, Analisis Diskriminan menghasilkan dua fungsi diskriminan, di mana setiap fungsi merepresentasikan pembedaan antar kelompok. Untuk variabel X1, selisih ratarata kelompok1 cukup besar terhadap ratarata kelompok2 atau kelompok3 (2.0 terhadap 4.6 atau 3.8). X1 bisa mendiskriminasi antara kelompok1 dengan kelompok2 atau dengan kelompok3; tetapi kurang efektif untuk diskriminasi antara kelompok2 dan kelompok3. Untuk variabel X2, selisih ratarata pada kelompok1 dan kelompok2 tidak cukup besar (2.0 dengan 2.2); tetapi pada kelompok3 selisih rataratanya cukup besar dengan kelompok1 dan kelompok2 (6.2 dengan 2.0 atau 2.2). Variabel X1 membedakan kelompok1 terhadap kelompok2 dan kelompok3 dan variabel X2 membedakan kelompok3 terhadap kelompok1 dan kelompok2. X1 dan X2 memiliki dimensi diskriminasi antar kelompok yang berbeda. Secara grafis dapat dijelaskan kemampuan diskriminasi masingmasing variabel kepada kelompok1, kelompok2 dan kelompok3. D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
6
Kamarul Imam
[email protected]
15 11
14
5
13
10
4
12
7
9
2
1
3
6
8
1
2
3
4
5
X1 6
7
8
9
10
9
14
6 3
10
13
8
2
7
12
4
1
5
11
15
X2
1 2 3 4 5 6 7 8 9 10 Dari grafik tersebut di atas, tampak bahwa tidak ada variabel yang benarbenar dapat mendiskriminasi ketiga kelompok itu. Namun jika bisa dibuat dua buah fungsi diskriminan sederhana, hasilnya akan menjadi lebih jelas. Seandainya kedua fungsi itu untuk masing masing variabel bebasnya diberi bobot 1 dan 0, hasilnya adalah : Fungsi 1 : Z = 1 X1 + 0 X2 Fungsi 2 : Z = 0 X1 + 1 X2 Dari kedua fungsi hipotetis itu selanjutnya dapat dihitung skor diskriminan untuk setiap anggota kelompok. Tabel 4. Skor Diskriminan Individual Pada Setiap Kelompok Dengan Fungsi 1. Pelanggan Z score Pelanggan Z score Pelanggan 1 2 6 4 11 2 1 7 4 12 3 3 8 5 13 4 2 9 5 14 5 2 10 5 15
Z score 2 3 4 5 5
Tabel 5. Skor Diskriminan Individual Pada Setiap Kelompok Dengan Fungsi 2. Pelanggan Z score Pelanggan Z score Pelanggan 1 2 6 2 11 2 2 7 3 12 3 2 8 1 13 4 1 9 2 14 5 3 10 3 15
Z score 6 6 6 6 7
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
7
Kamarul Imam
[email protected]
Secara grafis, klasifikasi kelompok berdasar skor diskriminan masingmasing individual dapat digambarkan sebagai berikut : Fungsi 2
15
7
11
6
12
13
14
5
4
3
5
2
1
3
7
10
6
9
2
1
4
8
Fungsi 1 1
2
3
4
5
6
Tampak dari grafik ini, bahwa skor diskriminan setiap individual untuk kelompok1 dan kelompok2 pada fungsi2 tidak pernah melampaui 4.5. Skor diskriminan kelompok1 tidak pernah melampaui 3.5 pada fungsi1. Skor diskriminan individual pada fungsi3 di atas 4.5 pada fungsi2. Pembobotan sederhana kepada variabelvariabel bebas pada fungsi1 dan fungsi2 seperti di atas telah cukup dapat mengklasifikasi ketiga kelompok dengan baik.
3. Kerangka Kerja Untuk Analisis Diskriminan. Langkahlangkah operasional dalam Analisis Diskriminan terdiri atas enam tahapan berurutan yaitu : Tahap1 Tahap2 Tahap3 Tahap4 Tahap5 Tahap6
: : : : : :
Problem Penelitian. Isu Desain Penelitian. Asumsi. Estimasi Fungsi Diskriminan dan Menghitung Akurasi Prediksi Fungsi. Interpretasi Fungsi Diskriminan. Validasi Hasil Diskriminan.
Flowchart keenam langkah dapat digambarkan sebagai berikut :
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
8
Kamarul Imam
[email protected]
Tahap 1 Problema Penelitian Pilih tujuan : 1. Evaluasi selisih kelompok dengan basis multivariat. 2. Klasifikasi pengamatan ke dalam kelompok. 3. Identifikasi dimensi diskriminan antar kelompok.
Tahap 2 Isu Desain Penelitian 1. Seleksi variabel independen. 2. Pertimbangkan banyaknya sampel. 3. Lakukan analisis dan tentukan sampel. Tahap 3 Asumsi 1. 2. 3. 4.
Normalitas variabel independen. Linieritas hubungan. Multikolinieritas di antara variabel independen. Matriks dispersi yang setara.
Tahap 4 Estimasi Fungsi Diskriminan 1. Estimasi simultan atau stepwise. 2. Signifikansi fungsi diskriminan. Pengukuran akurasi kemampuan prediksi fungsi dengan matriks klasifikasi 1. Hitung cutting score optimal. 2. Tentukan kriteria untuk menghasilkan hit ratio. 3. Signifikansi statistik dari akurasi prediksi.
Satu
Tahap 5 Interpretasi Fungsi Diskriminan Berapa banyak fungsi akan diinterpretasi ?
Evaluasi Fungsi Tunggal 1. Bobot diskriminan 2. Discriminant loadings 3. Nilai F parsial.
Dua atau lebih
Evaluasi Fungsi Terpisah 1. Bobot diskriminan. 2. Discriminant loadings. 3. Nilai F parsial. Evaluasi Fungsi Dikombinasi 1. Fungsi yang dirotasi. 2. Potency Index. 3. Grafik centroid kelompok. 4. Grafik loadings. Tahap 6 Validasi Hasil Diskriminan 1. Split sampel atau validasi silang. 2. Memberi profil selisih kelompok.
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
9
Kamarul Imam
[email protected]
a. Tahap1. Tujuan Analisis Diskriminan. Tujuan Analisis Diskriminan antara lain adalah :
menentukan apakah ratarata skor yang dihitung dari sekumpulan variabel dari dua kelompok yang terdefinisi atau lebih, signifikan berbeda secara statistik.
menentukan variabel manakah yang dominan dalam membedakan kedua kelompok atau lebih.
membangun prosedur untuk mengklasifikasi obyek (individual, perusahaan, produk dan lainnya) ke dalam suatu kelompok berdasar skor dari sekumpulan variabel independen.
mengatur jumlah dan komposisi dimensi diskriminasi antara kelompok yang terbentuk dari sekumpulan variabel independen.
b. Tahap 2. Desain Penelitian Untuk Analisis Diskriminan. b.1 Seleksi variabel dependen dan variabel independen. Untuk mengaplikasi Analisis Diskriminan, terlebih dahulu harus menentukan manakah variabel independen dan variabel dependen. Perlu diingat, bahwa variabel dependen bersifat katagorial, sedang variabel independen bersifat metriks. Peneliti terlebih dahulu harus memfokuskan diri kepada variabel dependen. Variabel dependen bisa terdiri atas dua kelompok atau lebih, di mana masingmasing kelompok bersifat mutually exclusive dan exhaustive., artinya setiap anggota kelompok hanya bisa dimasukkan ke dalam suatu kelompok tertentu. Analisis Diskriminan masih sesuai diaplikasikan pada variabel dependen yang bersifat ordinal bahkan interval1. Beberapa katagori kelompok bisa dikembangkan, biasanya dua, tiga atau empat kelompok. Tetapi lebih dari itu bisa dikembangkan jika diperlukan. Tetapi, dari kelompokkelompok yang dibangun bisa juga disederhanakan menjadi dua kelompok ekstrim, sehingga hanya dibutuhkan Analisis Diskriminan Dua Kelompok. Prosedur semacam ini disebut sebagai polar extreme approach, di mana hanya melibatkan dua kelompok ekstrim saja dan mengabaikan kelompok kelompok moderat lainnya. Variabel independen biasanya ditentukan melalui dua cara, yaitu : (1) dari penelitian sebelumnya atau dari teoriteori dasarnya, dan (2) dari intuisi dan pengetahuan si peneliti yang logik. b.2 Ukuran sampel. Analisis Diskriminan agak sensitif terhadap ratio banyaknya sampel dengan banyaknya variabel bebas. Banyak penelitian menyarankan 20 pengamatan untuk setiap variabel bebas. Tetapi sangat direkomendasikan bahwa jumlah sampel sebaiknya 5 kali dari banyaknya variabel bebas2. Perlu pula dipertimbangkan banyaknya sampel pada setiap kelompok yang diteliti. Pada kondisi minimum, jumlah pengamatan pada kelompok terkecil harus lebih banyak daripada banyaknya variabel bebas. Sebagai petunjuk praktis, setiap kelompok hendaknya terdiri atas 20 buah sampel. Namun, walaupun telah demikian masih perlu juga dipertimbangkan ukuran relatif dari kelompok, upayakan banyaknya sampel pada setiap kelompok tidak terlalu jauh.
1 2
Joseph F. Hair et al, Multivariate Data Analysis, 1988:257. Opcit, 258.
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
10
Kamarul Imam
[email protected]
b.3 Pemecahan sampel. Seringkali sampel dibagi menjadi dua subsampel, yaitu : (1) subsampel yang digunakan untuk mengestimasi fungsi diskriminan, atau disebut sebagai analysis sample yang dianalisis dan (2) subsampel yang digunakan untuk keperluan validasi atau disebut sebagai holdout sample. Metode untuk memvalidasi fungsi adalah pendekatan spiltsample atau crossvalidation. Ukuran kedua subsampel harus cukup untuk menghasilkan kesimpulan yang jelas. Tidak ada metode yang pasti untuk memisahkan sampel menjadi dua subsampel, namun ada pendekatan yang populer yaitu memisahkan menjadi dua bagian yang sama. Pemisahan sampel menjadi dua subsampel tetap didasari oleh prosedur
proportionately stratified sampling. Jika kelompokkelompok katagori untuk Analisis Diskriminan setara direpresentasi oleh total sampel, maka dipilih sejumlah sampel individual yang setara. Jika kelompokkelompok katagori tidak setara direpresentasi oleh total sampel, maka banyaknya subsampel untuk holdout sample harus ditentukan secara proporsional kepada total sampel. Contoh, jika total sampel terdiri dari 50 orang lakilaki dan 50 orang wanita, maka subsampel sebagai holdout sample (sampel cadangan) adalah 25 orang lakilaki dan 25 orang wanita. Jika total sampel terdiri dari 70 orang lakilaki dan 30 orang wanita, maka holdout sample = 35 orang lakilaki dan 15 orang wanita. Jika jumlah total sampel terlalu sedikit, maka pemisahan menjadi subsampel tidak perlu dilakukan. Validasi fungsi bisa dilakukan dengan sampel yang ada. c. Tahap 3. Asumsi pada Analisis Diskriminan. Beberapa asumsi yang diberlakukan pada Analisis Diskriminan adalah : c.1 Variabel independen harus multivariat normal, dengan penyebaran yang setara (homogenitas) walaupun tidak diketahui dan matriks atau struktur kovarian untuk kelompokkelompok didefinisikan oleh variabel dependen. Jika asumsi ini tidak terpenuhi, maka timbul persoalan dalam estimasi koefisien fungsi. Maka sebaiknya, kalau memungkinkan dialihkan saja persaoalannya sebagai Analisis Logit. c.2 Tidak teridentifikasi multikolinieritas dan singularitas di antara variabel bebas. c.3 Outliers. Jika ada data yang ekstrim, upayakan dieliminasi. Lakukan terlebih dahulu uji kepada setiap kelompok secara terpisah baik secara univariat maupun multivariat. c.4 Hubungan antara variabel bebas dengan variabel tak bebas bersifat linier. d. Tahap 4. Estimasi Fungsi Diskriminan dan Uji Kualitas Model. Untuk memperoleh fungsi diskriminan, peneliti harus menentukan metode estimasi fungsi, kemudian menentukan banyaknya fungsi yang dipertahankan. Untuk mengukur tingkat kualitas fungsi dapat dilakukan melalui beberapa prosedur, yaitu : (1) menghitung Zskor fungsi diskriminan yang dihitung untuk setiap sampel, (2) hitung ratarata Zskor pada setiap kelompok, (3) bandingkan ratarata Zskor kelompok untuk memperoleh sebuah nilai yang dapat mendiskriminasi kelompok. Selanjutnya, lakukan casewise diagnostics untuk mengidentifikasi akurasi klasifikasi setiap pengamatan dan dampak relatifnya terhadap estimasi model secara keseluruhan. d.1 Metode perhitungan. Ada dua metode perhitungan untuk estimasi koefisien fungsi diskriminan, yaitu : (1) estimasi simultan dan (2) estimasi stepwise. Metode estimasi simultan D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
11
Kamarul Imam
[email protected]
dilakukan dengan melibatkan seluruh variabel bebas bersamasama. Metode ini tepat jika peneliti lebih menginginkan pengaruh seluruh variabel bebas secara bersamasama karena alasan teoritis. Metode estimasi stepwise dilakukan dengan melibatkan variabel bebas satu per satu ke dalam model, di mulai dari variabel bebas yang paling dapat mendiskriminasi kelompok dengan baik, kemudian variabel bebas berikutnya yang bila dikombinasikan dengan variabel bebas awal dapat meningkatkan kemampuan diskriminasi model. Prosedur ini berlanjut sampai seluruh variabel bebas telah dipertimbangkan kombinasinya dengan kriteria perbaikan kemampuan diskriminasi model. Ada kemungkinan pada tahapan berikutnya, sebuah variabel bebas yang telah dimasukkan ke dalam model pada tahapan sebelumnya menjadi variabel yang harus didrop pada tahapan ini. Metode stepwise tepat digunakan apabila peneliti lebih menginginkan variabelvariabel bebas yang dapat mendiskriminasi kelompok secara signifikan maupun yang tidak signifikan. Namun perlu dicatat, bahwa metode stepwise menjadi kurang stabil dan kurang bisa generalisatif dengan penurunan ratio ukuran sampel terhadap banyaknya variabel bebas, khususnya jika ukuran sampel di bawah 20 pengamatan pada setiap variabel bebas. Contoh3 : Estimasi Koefisien Diskriminan. Tiga kelompok belajar murid yang menghadapi kesulitan, yaitu : (a) kelompok MEMORY, kelompok yang menghadapi kesulitan dalam penggunaan memory, (b) kelompok PERCEPTION, kelompok yang menghadapi kesulitan dalam persepsi visual dan (c) kelompok COMMUNICATION, kelompok yang menghadapi kesulitan dalam penggunaan bahasa. Empat variabel bebas yang dianggap dapat mempengaruhi kelompokkelompok ini adalah : (a) PERFORMANCE, skala IQ, (b) INFO, informasi, (c) VERBEXP, ekspresi verbal dan (d) AGE, umur. Data dengan ukuran sampel kecil adalah : Tabel 6. Data Hipotetis. Group MEMORY
PERCEPTION
COMMUNICATION
PERF 87 97 112 102 85 76 120 85 99
Predictors INFO VERBEXP 5 31 7 36 9 42 16 45 10 38 9 32 12 30 8 28 9 27
AGE 6.4 8.3 7.2 7.0 7.6 6.2 8.4 6.3 8.2
Estimasi koefisien fungsi diskriminan untuk masingmasing kelompok : Zj = a + W1 Xj1 + W2 Xj2 + . . . . + Wk Xjk Zj = skor klasifikasi untuk kelompokj (j = 1, 2, ..., n), Wi adalah koefisien fungsi diskriminan untuk variabel bebasi (i = 1, 2, …, k), Wi diestimasi dengan formula matriks : Wi = Swg1 Mj Di mana Mj adalah matriks kolom ratarata variabel bebas pada kelompokj. Sedang konstanta, a, diestimasi dengan formula matriks :
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
12
Kamarul Imam
[email protected]
a = (1/2) WiMj Untuk data tersebut di atas, matriks Swg untuk kelompok1 yang dihasilkan adalah setiap elemen matriks Swg dibagi dengan dferror (dferror = 6) :
214.33 36.67 58.06 8.33
Swg1 =
36.67 7.56 12.28 1.06
58.06 12.28 25.00 1.62
8.33 1.06 1.62 0.92
0.20195 1.62970 0.37073 0.60623
0.00956 0.37073 0.20071 0.01299
0.17990 0.60623 0.01299 2.05006
Matriks inversi dari Swg1 : 0.04362 0.20195 0.00956 0.17990
Swg11 =
Kalikan matriks Swg11 dengan matriks kolom ratarata variabel bebas pada kelompok1 untuk menghitung Wi fungsi diskriminan untuk kelompok1 : Wi =
= [ 1,92
0.04362 0.20195 0.00956 0.17990
17.56
0.20195 1.62970 0.37073 0.60623
5.55
0.00956 0.37073 0.20071 0.01299
0.17990 0.60623 0.01299 2.05006
x
98.67 7.00 36.33 7.30
0.99 ]
Konstanta dapat dihitung : a = (1/2) WiMj 98.67
= (1/2) [1.92
17.56
5.55
0.99]
7.00
= 137.83
36.33 7.30
Dengan cara yang sama akan dihasilkan koefisien fungsi diskriminan untuk masingmasing kelompok sebagai berikut : Tabel 7. Fungsi Diskriminan masingmasing Kelompok. Kelompok1 Kelompok2 PERF 1.92420 0.58704 INFO 17.56221 8.69921 VERBEXP 5.54585 4.11679 AGE 0.98723 5.01749 Konstanta 137.83 71.28563
Kelompok3 1.36552 10.58700 2.97278 2.91135 71.24188
Persamaan fundamental untuk menguji sekumpulan fungsi diskriminan, mirip dengan MANOVA. Varians pada kelompok prediktor dapat dipisahkan menjadi dua sumber, yaitu : varians dalam kelompok (within group atau Swg) dan antara kelompok (between group atau Sbg). Melalui prosedur MANOVA, akan dibentuk matriks crossproduct : Σ Σ (Xij – GM)2 = n Σ (Xj – GM)2 + Σ Σ (Xij – Xj)2 i j
j
i
j
Jumlah kuadrat selisih data terhadap ratarata total (GM) dipisahkan menjadi dua kelompok varians : Stotal = Sbg + Swg D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
13
Kamarul Imam
[email protected]
Matriks varians antar kelompok, Sbg : 314.89 71.56 180.00 14.49
Sbg =
71.56 32.89 8.00 2.22
180.00 8.00 168.00 10.40
14.49 2.22 10.40 0.74
348.33 73.67 150.00 9.73
50.00 6.37 9.73 5.49
Matriks varians dalam kelompok, Swg : 1286.00 220.00 348.33 50.00
Swg =
220.00 45.33 73.67 6.37
Determinan matriks ini adalah : Swg = 4.70034789 x 1013
Sbg + Swg = 448.63489 x 1013 Wilk’s Lambda (Λ) untuk matriks ini :
Swg Λ=
= 0.10477 Sbg + Swg
Hitung nilaiF untuk menguji kemampuan prediksi fungsi diskriminan dengan formula sebagai berikut :
1–y
df2
y
df1
Fdf1,df2 =
di mana, y = Λ1/s s=√
p2(dfeffect)2 4 p2 + (deffect)2 – 5
p = banyaknya variabel independen. dfeffect = adalah derajat bebas perlakuan yang diuji = (k – 1) df1 = p(dfeffect) dan p – dfeffect + 1
df2 = s (dferror) –
p(dfeffect) 2
2
2
di mana, dferror = adalah derajat bebas yang berkaitan dengan error = (N k)
Untuk contoh kasus di atas, nilainilai : p = banyaknya variabel independen = 4 dfeffect = banyaknya kelompok dikurangi 1 = 3 1 = 2 dferror = banyaknya seluruh pengamatan dikurangi banyaknya kelompok = 9 3 = 6.
Dari nilainilai parameter ini dapat dihitung s : (4)2 (2)2 4 s=√
=2 (4)2 + (2)2 – 5
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
14
Kamarul Imam
[email protected]
y = Λ1/s = (0.010477)1/2 = 0.102357 df1 = p(dfeffect) = (4)(2) = 8
4–2+1 df2 = 2 6
(4)(2) 2
=6
2
2
1 – 0.102357
6
0.102357
8
F8,6 =
= 6.58
Kriteria nilai F pada Tabel F dengan df 8, 6 dan α = 0.05 adalah sama dengan 4.15. Nilai Fhitung > Fkriteria, maka dapat disimpulkan bahwa ketiga kelompok belajar dapat dibedakan dari kombinasi keempat variabel bebasnya. Ini merupakan uji hipotesis secara keseluruhan mengenai hubungan kelompok dengan variabelvariabel bebas. Untuk menentukan tingkat korelasi antara fungsi dengan variabelvariabel bebas dapat dihitung dari loading factor. Jika X1, X2 dan X3 memiliki korelasi yang tinggi dengan fungsi, kecuali X4 dan X5 tidak; maka peneliti mencoba untuk memahami seberapa jauh masingmasing X1, X2 dan X3 memiliki arti penting dalam fungsi dan bagaimana saling berinteraksi. Secara matematik, loading factor dapat dihitung dengan formulasi : λ = Rw D di mana, λ = matriks loading factor, Rw = matriks korelasi antara variabel bebas, D = matriks koefisien fungsi diskriminan yang distandardisasi. Loading factor ini lebih menjelaskan dominasi variabel bebas terhadap kemampuan fungsi untuk mengklasifikasi kelompok yang diamati. d.2 Signifikansi statistik. Beberapa ukuran signifikansi statistik yang tersedia untuk Analisis Diskriminan adalah : (1) Wilk’s lambda, (2) Hotelling’s trace, (3) Mahalanobi’s D2, (4) Rao’s V, dan (5) Pillai’s criterion. Jika metode stepwise yang digunakan untuk mengestimasi fungsi, maka ukuran Mahalanobi’s D2 dan Rao’s V lebih tepat digunakan sebagai uji signifikansi fungsi. Keduanya mengukur jarak yang digeneralisasi. Prosedur pengukuran jarak Mahalanobi didasari pada kuadrat jarak Euclidean yang digeneralisasi dan menyesuaikan varians yang tidak setara. Keunggulan utama prosedur uji ini adalah : D2 diukur dalam ruang original variabel bebas. Kelemahan ukuran D2 untuk uji signifikansi fungsi adalah : ukuran ini menjadi kritis dengan variabel bebas yang bertambah banyak, karena ukuran itu tidak dihasilkan pada setiap pengurangan dimensi. Kehilangan dimensionalitas akan mengurangi informasi karena hal itu mengurangi variabilitas variabel independen. Secara umum, D2 lebih disarankan dipakai jika peneliti menginginkan pemanfaatan maksimal dari informasi yang ada. Untuk banyaknya kelompok lebih dari dua, maka peneliti harus menguji juga signifikansi setiap fungsi antar kelompok, tidak hanya uji signifikansi fungsi secara total. Program komputer menghasilkan seluruh informasi yang D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
15
Kamarul Imam
[email protected]
dibutuhkan untuk menentukan banyaknya fungsi yang dibutuhkan untuk menghasilkan signifikansi total, tanpa melibatkan fungsi yang tidak meningkatkan kemampuan mendiskriminasi secara total. Jika sebuah fungsi atau lebih diperkirakan tidak signifikan, model diskriminan akan diestimasi ulang dengan banyaknya fungsi yang akan diturunkan terbatas hanya kepada fungsi yang signifikan saja. d.3 Menguji kecocokan model secara keseluruhan. Sekali fungsi diskriminan telah teruji signifikansinya, maka perlu dilakukan uji kecocokan model secara keseluruhan. Uji ini terdiri atas tiga hal, yaitu : (1) menghitung Zskor untuk setiap pengamatan, (2) mengevaluasi selisih Zskor kelompok dan (3) mengevaluasi tingkat akurasi prediksi fungsi kepada setiap pengamatan individual. (1) Menghitung Zskor. Nilai Z dihitung dari fungsi diskriminan eksplisit yang dihasilkan dari fungsi implisit : Zjk = a + W1 X1k + W2 X2k + . . . + Wn Xnk Di mana, Zjk = Zskor diskriminan fungsij untuk pengamatank, a = intercept, Wi = koefisien diskriminan untuk variabel bebasi, Xik = variabel bebasi untuk pengamatank. Skor ini bersifat metrik, memberikan arti langsung untuk membandingkan pengamatanpengamatan pada setiap fungsi. Pengamatan dengan Zskor yang sama diasumsi lebih dianggap sebagai variabel yang membentuk fungsi daripada perbedaan skor semata. Fungsi eksplisit yang dihasilkan dalam dua bentuk, yaitu (a) standardized dan (b) unstandardized. Fungsi standardized lebih bermanfaat untuk menginterpretasikan hasil, sedang unstandarized digunakan untuk menghitung Zskor. Perlu dicatat, bahwa fungsi diskriminan berbeda dengan fungsi klasifikasi atau yang disebut sebagai Fisher’s linear discriminant function. Fungsi klasifikasi, satu untuk setiap kelompok, dapat digunakan untuk mengklasifikasi pengamatan. Pada metode klasifikasi ini, sebuah nilai pengamatan untuk variabel bebas disisipkan ke dalam fungsi klasifikasi dan sebuah skor klasifikasi untuk setiap kelompok dihitung untuk pengamatan yang bersangkutan. Pengamatan itu kemudian diklasifikasi ke dalam kelompok yang memiliki skor klasifikasi tertinggi. Fungsi diskriminan digunakan sebagai ratarata klasifikasi karena fungsi itu memberikan representasi yang sederhana dan konsisten pada setiap fungsi diskriminan, menyederhanakan proses interpretasi dan memberi penilaian terhadap kontribusi variabelvariabel bebas. (2) Evaluasi Perbedaan/Selisih Kelompok. Peneliti dapat mengartikan bahwa menguji kecocokan model secara keseluruhan adalah menentukan ukuran perbedaan antara anggota setiap kelompok melalui Zskor. Intisari ukuran perbedaan kelompok adalah perbandingan cetroids kelompok, yaitu ratarata Zskor untuk seluruh pengamatan anggota kelompok. Jarak antar centoids disebut sebagai jarak
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
16
Kamarul Imam
[email protected]
Mahalanobi, D2. Peneliti harus yakin bahwa fungsi diskriminan yang signifikan akan memberikan jarak centroids signifikan.
Centroids kelompok pada setiap fungsi diskriminan dapat diploting untuk bisa lebih memperlihatkan hasil ditinjau dari prespektif global. Plot biasanya disiapkan untuk fungsi diskriminan kesatu, kedua atau ketiga (dengan asumsi fungsifungsi tersebut signifikan dapat memprediksi kelompok secara valid). (3) Evaluasi Tingkat Akurasi Klasifikasi Fungsi. Dengan variabel dependen yang bersifat non metrik, maka penggunaan R2 tidak dapat dilakukan sebagai ukuran akurasi model. Untuk mengukur akurasi fungsi melalui ketepatan prediksi anggota kelompok ke dalam kelompok awalnya (correctly classification, atau CC). Untuk itu, beberapa hal perlu dilakukan, yaitu : kembangkan matriks klasifikasi, tentukan Zcutoff, dan standard atau kriteria klasifikasi. CC mirip dengan R2 pada Analisis Regresi, dan D2 (dengan uji χ2) sama dengan Fratio. Zcutoff sebagai skor Z yang dipakai sebagai batas pemisahan antar kelompok dihitung dengan formula : ZA + ZB ZCE = 2 ZCE = Zcutoff untuk kelompok dengan ukuran pengamatan yang sama, ZA = cetroids kelompok A, ZB = cetroids kelompok B. Untuk ukuran pengamatan yang tidak sama, Zcutoff dihitung dengan formula : NA ZB + NB ZA ZCU = NA + NB ZCU = Zcutoff untuk kelompok dengan ukuran pengamatan tidak sama, NA = ukuran pengamatan untuk kelompok A, NB = ukuran pengamatan untuk kelompok B. Ukuranukuran ini menjadi optimal dengan asumsi bahwa kelompok berdistribusi normal dan struktur dispersi kelompok diketahui. ZCE
Kelompok A
ZA
Kelompok B
ZB
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
17
Kamarul Imam
[email protected]
ZCU
Kelompok B Kelompok A
ZA
ZB
Kriteria klasifikasi adalah dengan membandingkan Zskor setiap pengamatan individual pada kelompok dengan Zcutoff. klasifikasikan pengamatan ke dalam kelompok A, jika Zskor < Zcutoff, klasifikasikan pengamatan ke dalam kelompok B, jika Zskor > Zcutoff. Contoh hasil prosedur klasifikasi dapat ditunjukkan dalam matriks berikut : Tabel 7. Matriks Klasifikasi Untuk Analisis Diskriminan Dua Kelompok. Prediksi Kelompok Anggota Kelompok Kelompok Aktual % CC Aktual 1 2 1 2 Prediksi Anggota Kelompok
22 5
3 20
25 25
88 80
27
23
50
84*
Keterangan : % CC = (jumlah klasifikasi benar/total pengamatan) x 100%. = (22 + 20)/50 x 100% = 84%. Selanjutnya lakukan uji signifikansi terhadap persentase CC dengan ujit :
untuk ukuran pengamatan dalam kelompok yang sama maupun tidak sama : p – 0.5 t= √{(0.5)(1.0 – 0.5)/N} di mana, N =ukuran sampel keseluruhan, p = proporsi klasifikasi benar.
Pertanyaan yang timbul kemudian adalah : berapa kriteria CC atau hit ratio (C) yang dianggap cukup memadai tingkat akurasi prediksi fungsi diskriminan ? 60%, 75% atau 90% ? Untuk menjawab pertanyaan ini, peneliti secara awal harus menentukan kemungkinan persentase yang akan diklasifikasi dengan benar, tanpa bantuan fungsi diskriminan. Jika ukuran sampel pada tiap kelompok sama banyak, penentuan kemungkinan kebenaran klasifikasi : C = 1/banyaknya kelompok. Untuk dua kelompok, C = 50%, untuk tiga kelompok, C = 33,33% dan seterusnya. Untuk ukuran sampel pada tiap kelompok tidak sama, penentuan C dapat dilakukan dengan pendekatan maximum chance criterion, yaitu mengacu kepada kelompok dengan ukuran sampel terbesar. Contoh, jika kelompok1 = 75 sampel dan kelompok2 = 25 sampel, maka C = 75%. D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
18
Kamarul Imam
[email protected]
Pendekatan lain untuk menentukan C adalah proportional chance criterion : CPRO = p2 + (1 – p)2 Di mana, p = proprosi sampel pada kelompok1, 1 – p = proporsi sampel pada kelompok2. Contoh, untuk sampel kelompok1 = 75 dan kelompok2 = 25, maka C = (75%)2 + (25%)2 = 62.50%. Pendekatan penentuan C dengan berbagai pendekatan menjadi berarti, jika peneliti menggunakan holdout sample (splitsample approach). Jika CC lebih kecil daripada C, walaupun signifikan, maka fungsi diskriminan eksplisit yang dihasilkan menjadi kurang dapat diinterpretasikan. Ada suatu konvensi para ahli yang menyatakan bahwa CC > 1.25 kali lebih besar daripada C. Ukuran statistik untuk mengukur kemampuan mendiskriminasi dari matriks klasifikasi adalah Press’s Q Statistic. Ukuran ini membandingkan jumlah sampel yang diklasifikasi secara benar dengan total sampel dan banyaknya kelompok. Formula untuk Press’s Q Statistic adalah : [ N – nK]2 Press’s Q = N( k 1) Di mana, N = ukuran total sampel, n = banyaknya sampel yang diklasifikasi dengan benar, K = banyaknya kelompok.
Press’s Q Statistic diuji signifikansinya dengan ujiχ2 pada α tertentu dengan degree of freedom = 1. Jika Press’s Q Statistic > χ2α,df, maka CC hasil perhitungan memang berbeda dengan C.
Casewise Diagnostic. Untuk memperoleh kecocokan model dalam memprediksi, bisa dilakukan dengan menghitung hasil prediksi selangkah demi selangkah. Langkah ini dimaksudkan untuk : (1) mengetahui pengamatan yang salah diklasifikasi, dan (2) untuk pengamatan yang tidak representatif pada sisa pengamatan dalam kelompok. Walaupun fungsi diskriminan menghasilkan matriks klasifikasi yang menjelaskan akurasi klasifikasi secara keseluruhan, tetapi tidak menghasilkan detil klasifikasi kepada pengamatan individual. Mencari kesalahan klasifikasi pada pengamatan individual perlu dilakukan untuk mengidentifikasi karakteristik apakah yang ada pada pengamatan individual tersebut yang tidak memberi kontribusi positif terhadap akurasi kemampuan klasifikasi fungsi yang dihasilkan. Analisis dapat dilakukan kepada pengamatan individual yang salah diklasifikasi maupun kepada variabelvariabel bebas yang tidak dimasukkan ke dalam model. e. Tahap 5 : Interpretasi Hasil. Setelah fungsi diskriminan eksplisit diperoleh dan akurasi klasifikasi terbukti tinggi secara statistik, maka selanjutnya peneliti dapat melakukan interpretasi hasil. Proses ini merupakan tahap bagaimana menjelaskan peringkat urgensi relatif masing masing variabel bebas dalam mendiskriminasi kelompok. Ada tiga pendekatan metode yang dapat digunakan, yaitu : (1) melalui perbandingan standardized
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
19
Kamarul Imam
[email protected]
coefficients diskriminan, (2) discriminant loadings (korelasi struktur) dan (3) partial Fvalue. (1) Standardized discriminant coefficients. Ini merupakan pendekatan tradisional untuk menginterpretasi hasil analisis. Jika tanda matematik koefisien diskriminan diabaikan, maka nilai koefisien merupakan kontribusi relatif masingmasing variabel bebas terhadap fungsi. Variabel independen dengan koefisien yang lebih besar dapat dijelaskan bahwa variabel tersebut lebih besar kontribusinya dalam mendiskriminasi kelompok. Tanda matematik hanya menjelaskan kontribusi positif atau negatif. (2) Discriminant loadings. Bertahuntahun yang lalu, discriminant loadings digunakan sebagai basis untuk menginterpretasi hasil, karena memperbandingkan standardized discriminant coefficients kadangkadang masih mengandung kelemahan yang disebabkan adanya multikolinieritas. Discriminant loadings merupakan korelasi linier struktural antara masingmasing variabel bebas dengan fungsi diskriminan. Discriminant loadings merefleksikan variansi tingkat sumbangan relatif variabel independen terhadap fungsi diskriminan dan bisa diinterpretasi seperti factor loadings dalam menilai sumbangan relatif masingmasing variabel independen terhadap fungsi diskriminan. Discriminant loadings dianggap lebih valid daripada standardized discriminant coefficients dalam mengartikan kemampuan mendiskriminasi masingmasing variabel independen karena sifat korelatifnya. Walupun demikian, peneliti tetap harus berhatihati dalam menggunakan pendekatan ini untuk menginterpretasi hasil. (3) Partial Fvalue. Seperti telah dinyatakan di atas, ada dua pendekatan teknik komputasi, yaitu : simultan dan stepwise. Jika peneliti menggunakan metode stepwise, maka tersedia informasi tambahan yang bisa diinterpretasikan tentang kemampuan mendiskriminasi setiap variabel independen, melalui nilai F parsial. Makin besar nilai F parsial, makin besar pula kemampuan mendsikriminasi variabel independen yang bersangkutan. Secara umum, perbandingan nilai F parsial ini sama dengan memperbandingkan standardized discriminant coefficients, namun perbandingan ini telah lebih terbatas kepada koefisienkoefisien diskriminan yang signifikan. Dalam menginterpretasi dua fungsi diskriminan atau lebih, seringkali ditemui persoalan, yaitu : (1) apakah peneliti dapat menyederhanakan koefisien diskriminan untuk memberikan profil kepada setiap fungsi ? (2) bagaimana peneliti dapat menjelaskan pengaruh silang variabel bebas pada fungsifungsi diskriminan yang dihasilkan ? Untuk menjawab persoalan itu, ada tiga teknik yang bisa digunakan, yaitu : (1) teknik rotasi fungsi, (2) teknik potency index dan (3) teknik grafis untuk koefisien diskriminan. (1) Teknik rotasi fungsi diskriminan. Rotasi fungsi ditujukan untuk melakukan distribusi ulang varians. Teknik rotasi yang lebih sering digunakan adalah VARIMAX atau disebut sebagai rotasi orthogonal (dengan sumbusumbu yang tetap 90o, saling tegak lurus) daripada rotasi oblique (sumbusumbu tidak harus saling tegak lurus), seperti VARTIMAX, EQUIMAX3. Dengan rotasi ini, maka nilai koefisien diskriminan yang tidak terlalu
3
SPSS memberikan rotasi OBLIMIN, SAS memberikan PROMAX dan ORTHOBLIQUE.
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
20
Kamarul Imam
[email protected]
berbeda dengan lainnya akan menjadi signifikan perbedaannya, sehingga interpretasinya bisa lebih tajam. (2) Teknik potency index.
Potency index merupakan ukuran relatif kemampuan mendiskriminasi untuk seluruh variabel independen pada seluruh fungsi diskriminan yang dihasilkan. Ukuran ini mengindikasikan dua hal, yaitu : (a) kontribusi setiap variabel independen (discriminant loadings) dan (b) eigenvalue relatif di antara fungsi fungsi. Walaupun potency index terhitung, namun ini sekedar rank kontribusi masingmasing variabel independen saja. Prosedur menghitung potency index adalah : Langkah1 : hitung nilai potensi fungsi diskriminan yang signifikan. Nilai potensi dapat dihitung dengan formula : PIij = (Discriminant Loadingij)2 x relative eigenvalue fungsij. Di mana, PIij = potency index variabel independeni pada fungsij.
Relative eigenvalue fungsij (REVj) dihitung dengan formula : Eigenvalue of discriminant functionj REVj =
Sum of eigenvalues across all significant functions Langkah2 : hitung potency index komposit seluruh fungsi signifikan. Sekali potency value (langkah1) telah terhitung untuk setiap fungsi, potency index komposit dapat dihitung sebagai jumlah potency value dari setiap fungsi diskriminan signifikan. Potency index merepresentasikan total efek pen diskriminasian dari variabel pada seluruh fungsi diskriminan signifikan. Walaupun ini merupakan ukuran relatif, namun nilai absolutnya tidak memberikan arti yang substantif. (3) Teknik grafis discriminant loadings. Untuk menggambarkan perbedaanperbedaan dalam kelompok variabel prediktor, peneliti dapat membuat plot discriminant loading. Pendekatan yang paling sederhana adalah memplotting loadings yang telah dirotasi aktual atau loadings yang tidak dirotasi dalam sebuah grafik. Tetapi disarankan, plotting loadings yang telah dirotasi. Teknik yang lebih akurat adalah teknik yang melibatkan stretching the vectors. Yang dimaksud vectors dalam hal ini adalah sebuah garis lurus yang ditarik dari titik origin dari sebuah grafik menuju ke titik koordinat loading variabel tertentu. Panjang setiap vektor mengindikasikan tingkat kepentingan relatif setiap variabel dalam mendiskriminasi dalam kelompok. Untuk memperbesar (stretching) vektor, dapat mengkalikan discriminant loading (disarankan setelah dirotasi) dengan nilaiF univariat yang berkaitan. Proses plotting selalu melibatkan seluruh variabel signifikan yang masuk dalam model. Bisa juga dilakukan plotting variabel lain yang memiliki nilaiF univairat signifikan walaupun tidak signifikan dalam model. Prosedur ini menunjukkan pentingnya variabel kolinier yang tidak masuk ke dalam model, seperti pada teknik stepwise. Melalui penggunaan prosedur ini dapat dicatat bahwa titik vektor menuju ke kelompok memiliki ratarata skor tertinggi pada prediktor yang terkait dan jauh dari kelompok yang memiliki ratarata skor terendah. Centroid kelompok bisa diperbesar dengan prosedur ini dengan mengkalikannya kepada D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
21
Kamarul Imam
[email protected]
nilaiF univariat yang berkaitan dengan setiap fungsi diskriminan yang dihasilkan. Jika loadings diperbesar, maka centroid kelompok juga harus diperbesar agar bisa memplotting dengan akurat pada grafik yang sama. Aproksimasi nilaiF untuk setiap fungsi diskriminan diperoleh dengan menggunakan formula berikut :
estimation sample size – no. of groups Fvaluefunctioni = eigenvaluefunctioni
No. of groups – 1 Sebagai contoh, sampel = 50 yang dibagi dalam tiga kelompok. Multiplier setiap eigenvalue adalah = (50 – 3)/(3 1) = 23.5.4 Sebuah alternatif untuk memperbesar vektor dan centroids adalah dengan membuat “territorial map” (fasilitas ini pada Program SPSS), yang memplot centroids dan batas untuk setiap kelompok. f.
Tahap6 : Validasi Hasil. Tahap terakhir adalah mevalidasi hasil untuk menjamin hasil diskriminan memiliki validasai internal maupun eksternal. Dengan adanya kecenderungan dari analisis diskriminan yang akan meningkatkan hit ratio jika dievaluasi hanya melalui analisis sampel saja, maka crossvalidation merupakan langkah yang cukup penting. Seringkali crossvalidation telah dilakukan dengan sampel orisinal, tetapi hal itu memungkinkan untuk menambah tambahan sampel sebagai sampel cadangan (hold out). Sebagai tambahan kepada crossvalidation, biasanya peneliti akan menggunakan sampel tambahan/cadangan yang tidak dilibatkan pada saat mengestimasi koefisien diskriminan untuk menyakinkan bahwa ratarata kelompok merupakan indikator yang valid dari konseptual model dalam memilih variabel variabel independennya.
4. Statistik Untuk Analisis Diskriminan. Statistik yang penting dan berkaitan dengan analisis diskriminan adalah : a.
Canonical Correlation. Canonical correlation merupakan ukuran tingkat hubungan antara skor diskriminan dengan kelompok. Ini mengukur hubungan antara fungsi diskriminan tunggal dengan sekelompok variabel dummy yang mendefinisikan keanggotaan kelompok.
b.
Centroid. Centroid adalah ratarata skor diskriminan dari suatu kelompok tertentu. Ada sejumlah nilai centroid sesuai dengan jumlah kelompok.
c.
Classification Matrix. Matriks ini sering disebut juga sebagai confusion atau prediction matrix. Matriks ini menunjukkan jumlah observasi yang diklasifikasi secara benar dan tidak benar. Klasifikasi observasi yang benar muncul pada diagonal matriks, karena kelompok yang diprediksi sama dengan kelompok aktual. Elemen matriks di luar diagonal menjelaskan klasifikasi observasi yang tidak benar. Jumlah elemen diagonal dibagi dengan banyaknya observasi disebut sebagai hit ratio.
4
Lihat Dillon dan Goldstein.
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
22
Kamarul Imam
[email protected]
d.
Discriminant Function Coefficients.
e.
Koefisien fungsi diskriminan (unstandardized) adalah multiplier dari masingmasing variabel di mana nilai variabel tersebut dalam ukuran satuan yang orisinal. Discriminant Score. Koefisien diskriminan yang unstandardized dikalikan dengan nilai masingmasing variabel. Hasilnya dijumlahkankan dengan konstanta untuk menghasilkan skor diskriminan.
f.
Eigenvalue. Untuk setiap fungsi diskriminan, eigenvalue merupakan ratio jumlah kuadrat antar kelompok dengan jumlah kudrat dalam kelompok. Eigenvalue yang besar menunjukkan fungsi superior.
g.
Fvalues and their significance. Ini dihitung dengan oneway ANOVA, dengan pengelompokan variabel yang berperan sebagai variabel independen katagorial. Selanjutnya, setiap prediktor diperankan sebagai variabel dependen yang bersifat metrik dalam tabel ANOVA.
h.
Group Means and Group Standard Deviations.
i.
Pooled withingroup Correlation Matrix.
Ukuranukuran ini dihitung untuk setiap prediktor pada setiap kelompok.
The pooled withingroup correlation matrix dihitung dengan meratarata matriks kovarians yang terpisah untuk seluruh kelompok. j.
Standardized Discriminant Function Coefficients. Koefisien fungsi diskriminan terstandard digunakan sebagai bilangan pengali variabel variabel yang telah distandardisasi sebagai variabel dengan nilai ratarata = 0 dan varians = 1.
k.
Structure Correlations. Juga disebut sebagai discriminant loadings, merupakan korelasi struktural menggambarkan korelasi sederhana antar variabel prediktor dan fungsi diskriminan.
l.
Total Correlation Matrix. Merupakan ukuran korelasi seluruh sampel tanpa memperhatikan dari kelompok mana ia berasal.
m. Wilk’s λ. Kadangkadang disebut juga sebagai Ustatistic. Wilk’s λ untuk setiap prediktor merupakan ratio withingroup sum of squares kepada total sum of squares. Nilainya berkisar antara 0 dan 1. Makin besar nilai λ (mendekati 1) mengindikasikan bahwa rata rata kelompokkelompok tampak dianggap tidak berbeda; sebaliknya makin kecil nilai λ (mendekati 0), mengindikasikan bahwa ratarata kelompok dianggap berbeda.
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
23
Kamarul Imam
[email protected]
5. Contoh Lain : Kunjungan Liburan. Sebuah penelitian yang bermaksud mengetahui perbedaan karakteristik rumah tangga yang mengunjungi daerah wisata tertentu dalam dua tahun terakhir dengan keluarga yang tidak mengunjungi daerah wisata tersebut dalam dua tahun terakhir. Data dikumpulkan dari 42 buah rumah tangga, di mana 30 buah rumah tangga sebagai sampel yang dianalisis, sedang sisanya, 12 buah rumah tangga sebagai sampel cadangan (hold out) untuk validasi model yang dihasilkan. Data dari 30 buah sampel keluarga yang dianalisis adalah : No.
Kunjungan Wisata
Pendapatan Keluarga/th
Sikap Terhadap Perjalanan
Pentingnya Bagi Keluarga
Jumlah Anggota Keluarga
Usia Kepala Keluarga
Jumlah Pengeluaran Wisata
1
1
50.2
5
8
3
43
2
2
1
70.3
6
7
4
61
3
3
1
62.9
7
5
6
52
3
4
1
48.5
7
5
5
36
1
5
1
52.7
6
6
4
55
3
6
1
75.0
8
7
5
68
3
7
1
46.2
5
3
3
62
2
8
1
57.0
2
4
6
51
2
9
1
64.1
7
5
4
57
3
10
1
68.1
7
6
5
45
3
11
1
73.4
6
7
5
44
3
12
1
71.9
5
8
4
64
3
13
1
56.2
1
8
6
54
2
14
1
49.3
4
2
3
56
3
15
1
62.0
5
6
2
58
3
16
2
32.1
5
4
3
58
1
17
2
36.2
4
3
2
55
1
18
2
43.2
2
5
2
57
2
19
2
50.4
5
2
4
37
2
20
2
44.1
6
6
3
42
2
21
2
38.3
6
6
2
45
1
22
2
55.0
1
2
2
57
2
23
2
46.1
3
5
3
51
1
24
2
35.0
6
4
5
64
1
25
2
37.3
2
7
4
54
1
26
2
41.8
5
1
3
56
2
27
2
57.0
8
3
2
36
2
28
2
33.4
6
8
2
50
1
29
2
37.5
3
2
3
48
1
30
2
41.3
3
3
2
42
1
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
24
Kamarul Imam
[email protected]
Keterangan : Kunjungan wisata = 1, untuk keluarga yang mengunjungi obyek wisata tertentu dalam dua tahun terakhir, = 2 untuk keluarga yang tidak mengunjungi obyek wisata dalam dua tahun terakhir. Pendapatan keluarga/tahun dalam ribuan dollar. Sikap terhadap perjalanan (skor 1 sampai 9, sangat tidak suka – sangat menyukai). Pentingnya bagi keluarga (skor 1 sampai 9, sangat tidak penting – sangat penting). Jumlah anggota keluarga (dalam satuan orang). Usia kepala keluarga (dalam satuan tahun). Jumlah pengeluaran untuk wisata (1 = rendah, 2 = moderat, dan 3 = tinggi). Hasil analisis dengan SPSS Version 12.00 adalah sebagai berikut :
Discriminant Analysis Case Processing Summary
Unweighted Cases Valid Missing or out-ofrange group codes
Excluded
30
Percent 100,0
0
,0
0
,0
0
,0
0
,0
30
100,0
N
At least one missing discriminating variable Both missing or out-of-range group codes and at least one missing discriminating variable Total Total
Group Statistics Visit 1
2
Total
Mean
Std. Deviation
Valid N (listwise)
Income
60,520
9,8307
Unweighted 15
Weighted 15
Attitude
5,400
1,9198
15
15
Importance
5,800
1,8205
15
15
Hsize
4,333
1,2344
15
15
Age
53,733
8,7706
15
15
Income
41,913
7,5511
15
15
Attitude
4,333
1,9518
15
15
Importance
4,067
2,0517
15
15
Hsize
2,800
,9411
15
15
Age
50,133
8,2710
15
15
Income
51,217
12,7952
30
30
Attitude
4,867
1,9780
30
30
Importance
4,933
2,0998
30
30
3,567
1,3309
30
30
51,933
8,5740
30
30
Hsize Age
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
25
Kamarul Imam
[email protected]
Keterangan : Kode Visit = 1 (keluarga yang melakukan perjalanan ke obyek wisata dalam dua tahun terakhir). Mean = ratarata income = 60,520 Std. Deviation = standard deviasi income = 9,8307, dst. Kode visit = 2 (keluarga yang tidak melakukan perjalanan ke obyek wisata dalam dua tahun terakhir). Mean = ratarata income = 41,913 Std. Deviation = standard deviasi income = 7,5511, dst. Total adalah ratarata dan standard deviasi keseluruhan data. Pooled Within-Groups Matrices Covariance
Income
Income 76,831
Attitude 3,350
Importance 1,555
Hsize ,855
Age -1,070
Attitude
3,350
3,748
,317
-,036
-3,252
Importance
1,555
,317
3,762
,150
,288
,855
-,036
,150
1,205
-,402
Hsize Age Correlation
-1,070
-3,252
,288
-,402
72,667
Income
1,000
,197
,091
,089
-,014
Attitude
,197
1,000
,084
-,017
-,197
Importance
,091
,084
1,000
,070
,017
Hsize
,089
-,017
,070
1,000
-,043
-,014
-,197
,017
-,043
1,000
Age a
a
The covariance matrix has 28 degrees of freedom.
Keterangan : Matriks korelasi dalam kelompok gabungan dihitung dengan meratarata matriks kovarians yang terpisah untuk seluruh kelompok. Analysis 1 Summary of Canonical Discriminant Functions Eigenvalues Function 1 a
Eigenvalue a 1,786
% of Variance 100,0
Canonical Correlation ,801
Cumulative % 100,0
First 1 canonical discriminant functions were used in the analysis.
Keterangan :
Canonical correlation = 0,801 atau 80,10% merupakan ukuran tingkat hubungan antara skor diskriminan dengan kelompok. Analog dengan R2 pada Analisis Regresi. Wilks' Lambda Test of Function(s) 1
Wilks' Lambda ,359
Chi-square 26,130
df
Sig. 5
,000
Keterangan : Wilk’s λ = 0,359 dan signifikan pada α = 0,000 dengan uji χ2 = 26,130. Menunjukkan bahwa perbedaan ratarata kelompok (centroid) keluarga1 dan keluarga2 berbeda secara signifikan. D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
26
Kamarul Imam
[email protected]
Standardized Canonical Discriminant Function Coefficients Function 1 Income
,743
Attitude
,096
Importance
,233
Hsize
,469
Age
,209
Keterangan : Fungsi diskriminan yang dihasilkan dalam bentuk standardized coefficient adalah : Zjk = 0,743 X1k + 0,096 X2k + 0,233 X3k + 0,469 X4k + 0,209 X5k Di mana, X1 = family income, X2 = attitude, X3 = vacation importance, X4 = household size, X5 = age of head of household. Structure Matrix Function 1 Income
,822
Hsize
,541
Importance
,346
Attitude
,213
Age
,164 Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function. Canonical Discriminant Function Coefficients Function 1 Income
,085
Attitude
,050
Importance
,120
Hsize
,427
Age
,025
(Constant)
-7,975 Unstandardized coefficients
Keterangan : Fungsi diskriminan yang dihasilkan dalam bentuk unstandardized coefficient adalah : Zjk = 7,975 + 0,085 X1k + 0,050 X2k + 0,120 X3k + 0,427 X4k + 0,025 X5k
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
27
Kamarul Imam
[email protected]
Group covariances of canonical discriminant functions
Visit 1
Function 1
1 1,291
2
1
-1,291
Unstandardized canonical discriminant functions Evaluated at group means. Classification Statistics Classification Processing Summary Processed
Excluded
30
Missing or out-ofrange group codes
0
At least one missing discriminating variable
0
Used in Output
30 Prior Probabilities for Groups
Visit
Cases Used in Analysis
Prior
1 2 Total
,500
Unweighted 15
Weighted 15,000
,500
15
15,000
1,000
30
30,000
Classification Function Coefficients Visit 1
2
Income
,678
,459
Attitude
1,509
1,381
Importance Hsize Age
,938
,628
3,322
2,218
,832
,768
(Constant)
-57,532 -36,936 Fisher's linear discriminant functions Tests of Equality of Group Means Wilks' Lambda
F
df1
df2
Sig.
Income
,453
33,796
1
28
,000
Attitude
,925
2,277
1
28
,143
Importance
,824
5,990
1
28
,021
Hsize
,657
14,636
1
28
,001
Age
,954
1,338
1
28
,257
Keterangan : Tiga variabel bebas merupakan variabel yang signifikan dalam mendiskriminasi, yaitu :
income (sig. = 0,000), importance (sig. = 0,021) dan hsize (sig. = 0,001).
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
28
Kamarul Imam
[email protected] a
Original
Classification Results Predicted Group Membership Visit 1 2 1 12
Count
2
3
15
15
15
20,0 80,0 100,0 ,0 90,0% of original grouped cases correctly classified.
100,0 100,0
%
a
Total
0
1 2
Keterangan : Persentase klasifikasi observasi ke dalam kelompok yang benar = 90,00%. Artinya observasi dari kelompok1 diprediski sebagai kelompok1, dan observasi dari kelompok2 diprediksi sebagai kelompok2 = (12 + 15)/30 = 0,9000 atau 90,00%. Validasi model dengan menggunakan sampel cadangan yang tidak dilibatkan dalam menghitung koefisien diskriminan (sebanyak 12 buah sampel holdout) dapat dilakukan dengan menggunakan fungsi disklriminan dalam bentuk unstandardized coefficients. Territorial map yang dihasilkan dalam validasi ini adalah : a. hitung Zscore setiap observasi dari sampel cadangan dengan fungsi unstandardized, hasilnya adalah : Visit aktual Zscore ZCE* Prediksi visit 1 0.211 0 2 1 2.625 0 1 1 0.913 0 1 1 0.639 0 2 1 2.537 0 1 1 0.9545 0 1 2 1.382 0 2 2 0.039 0 2 2 1.345 0 2 2 0.6 0 2 2 0.4265 0 2 2 1.882 0 2 *
ZCE dihitung sebagai : ZA + ZB ZCE =
b. bila Zscore c. bila Zscore
1,291 + (1,291) =
=0 2 2 > ZCE, maka observasi terebut diprediksi sebagai kelompok1, < ZCE, maka observasi terebut diprediksi sebagai kelompok2. a
Classification Results Predicted Group Membership Visit 1 2 1 4
2
6
2
0
6
6
1
66,67
33,33
100,0
100,0 ,0 83,33% of original grouped cases correctly classified.
100,0
Original
Count
%
2
a
Total
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
29
Kamarul Imam
[email protected]
Dari hasil validasi dengan sampel cadangan, tampak ada penurunan persentase klasifikasi observasi kepada kelompoknya dengan benar, dari 90,00% menjadi 83,33%. Ini bisa disebabkan karena ada dua variabel bebas yang tidak signifikan, yaitu : attitude dan age. Maka beralasan sekali untuk membuat model dengan tiga variabel signifikan saja. Jika kasus di atas dirubah topiknya, yaitu : apakah yang membedakan pengeluaran keluarga untuk wisata (family spent) Model implisitnya adalah : Zjk = a + W1 X1k + W2 X2k + . . . + W5 X5k Di mana, Zjk = family spent for vacation dengan tiga katagori : 1 = low, 2 = moderat dan 3 = high, X1 = family income, X2 = attitude, X3 = vacation importance, X4 = household size, dan X5 = age of head of household. Hasil SPSS untuk perubahan topik ini adalah :
Discriminant Analysis Case Processing Summary Unweighted Cases Valid Excluded
Percent
N
30 0 0
100,0 ,0 ,0
0
,0
0
,0
30
100,0
Missing or out-of-range group codes At least one missing discriminating variable Both missing or out-of-range group codes and at least one missing discriminating variable Total
Total Group Statistics Spent 1
Mean 38,570
5,2972
Unweighted 10
Weighted 10
Attitude
4,500
1,7159
10
10
Importance
4,700
1,8886
10
10
3,100
1,1972
10
10
Age
50,300
8,0973
10
10
Income
50,110
6,0023
10
10
Attitude
4,000
2,3570
10
10
Importance
4,200
2,4855
10
10
Hsize 3
Total
Valid N (listwise)
Income
Hsize 2
Std. Deviation
3,400
1,5055
10
10
Age
49,500
9,2526
10
10
Income
64,970
8,6143
10
10
Attitude
6,100
1,1972
10
10
Importance
5,900
1,6633
10
10
Hsize
4,200
1,1353
10
10
Age
56,000
7,6012
10
10
Income
51,217
12,7952
30
30
Attitude
4,867
1,9780
30
30
Importance
4,933
2,0998
30
30
Hsize
3,567
1,3309
30
30
51,933
8,5740
30
30
Age
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
30
Kamarul Imam
[email protected]
Tests of Equality of Group Means
Income
Wilks' Lambda ,262
F 37,997
Attitude
,788
Importance Hsize Age
df1 2
df2 27
Sig. ,000
3,634
2
27
,040
,881
1,830
2
27
,180
,874
1,944
2
27
,163
,882
1,804
2
27
,184
Keterangan : Pada α = 0,05; tampak hanya dua buah variabel saja yang signifikan dalam mendiskriminasi, yaitu income (sig. = 0,000) dan attitude (sig. = 0,040). Pooled Within-Groups Matrices Correlation
Income
Income 1,000
Attitude ,051
Attitude
,051
Importance
,307
Hsize Age
Importance ,307
Hsize ,380
Age -,209
1,000
,036
,005
-,340
,036
1,000
,221
-,013
,380
,005
,221
1,000
-,025
-,209
-,340
-,013
-,025
1,000
Analysis 1 Summary of Canonical Discriminant Functions Eigenvalues Function 1
Eigenvalue a 3,819
2 a
% of Variance 93,9
Canonical Correlation ,890
Cumulative % 93,9
a
6,1 100,0 ,247 First 2 canonical discriminant functions were used in the analysis.
,445
Keterangan : Hanya dua buah fungsi diskriminan signifikan yang diperoleh, yaitu fungsi1 dan fungsi2. Perbandingan eigenvalue, menunjukkan bahwa fungsi1 lebih superior dibanding fungsi2. Wilks' Lambda Test of Function(s) 1 through 2 2
Wilks' Lambda ,166 ,802
Chi-square
Df
Sig.
44,831
10
,000
5,517
4
,238
Keterangan : Fungsi1 memiliki Wilk’s λ = 0,166 dengan probabilitas sig. = 0,000 mengindikasikan bahwa centroid kelompok1 dan kelompok2 memang berbeda. Sedang fungsi2 memiliki Wilk’s λ = 0,802 dengan probabilitas sig. = 0,238, ini mengindikasikan bahwa centroid kelompok2 tidak berbeda dengan kelompok3. Dapat disimpulkan bahwa hanya ada dua kelompok saja yang benarbenar berbeda, yaitu kelompok keluarga dengan pengeluaran (spent) = 1 dan spent = 2.
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
31
Kamarul Imam
[email protected]
Standardized Canonical Discriminant Function Coefficients Function Income
1 1,047
2 -,421
Attitude
,340
,769
Importance
-,142
,534
Hsize
-,163
,129
,495
,524
Age Structure Matrix
Function Income
1 * ,856
2 -,278
*
Hsize
,193
Attitude
,219
,588
*
Importance
,149
,454
*
,077
*
Age
,166 ,341 Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function. * Largest absolute correlation between each variable and any discriminant function Canonical Discriminant Function Coefficients Function 1 Income Attitude
2 ,154
-,062
,187
,422
Importance
-,070
,261
Hsize
-,127
,100
,059
,063
-11,094 Unstandardized coefficients
-3,792
Age (Constant)
Functions at Group Centroids Function Spent 1
1 -2,041
2 ,418
2
-,405
-,659
3
2,446
,240
Unstandardized canonical discriminant functions evaluated at group means
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
32
Kamarul Imam
[email protected]
Classification Statistics Classification Processing Summary Processed
Excluded
30
Missing or out-ofrange group codes
0
At least one missing discriminating variable
0
Used in Output
30
Prior Probabilities for Groups Spent
Prior
Cases Used in Analysis Unweighted Weighted
1
,333
10
10
2
,333
10
10
,333
10
10
1,000
30
30
3 Total
Classification Function Coefficients Spent Income
1 1,099
2 1,418
3 1,802
Attitude
2,904
2,754
3,667
Importance
-,002
-,397
-,360
Hsize
-,173
-,488
-,759
Age
1,124
1,153
1,379
-56,821 -69,018 Fisher's linear discriminant functions
-106,773
(Constant)
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
33
Kamarul Imam
[email protected]
Territorial Map Canonical Discriminant Function 2 -6,0 -4,0 -2,0 ,0 2,0 4,0 6,0 ôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòò òòòòô 6,0 ô 13 ó ò
.
ô ó
ó
ó ó ó 4,0 ô
ô
13 13
ó ó
13 13
ó ó
13 ô 13
ô
ô
ô
ó ô
ó ó
13 13
ó ó
ó ó
13 13
ó ó
ó 2,0 ô
ô
13 ô13
ô
ó ó
12 12
ó ,0 ô
* ô
ô
ó ó
12 12 12 12
ó ó
ô
ó ó
12 12ô
ô
ó ó
*
ô
12 ô 12
ó ó
12 12 12 12 12 12
* ô
ô
ó ó
23 23ô
ô
ô
ó ô ó ó ó ó
23 23 ô
ó ô ó ó
23 23
12 12
ó -4,0ô
23 23
23 23
12 12
ó ó
ó ó
23 23
23 23
12 12
ó -2,0ô
ó -6,0ô
ô
1223 12 23
ó ó
ó ó
ô
ó ô
23 ô23
ô
23 23 23 23 23 23
ó ô ó ó ó ó ó ô
ôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòô -6,0 -4,0 -2,0 ,0 2,0 4,0 6,0 Canonical Discriminant Function 1
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
34
Kamarul Imam
[email protected]
Symbols used in territorial map Symbol Group Label ------ ----- -------------------1 2 3 *
1 2 3 Indicates a group centroid Classification Results
a
Predicted Group Membership Spent Original
Count
1
2
1
9
1
0
10
2
1
9
0
10
3 1
0 90,0
2 10,0
8 ,0
100,0
2
10,0
90,0
,0
100,0
,0 20,0 86,7% of original grouped cases correctly classified.
80,0
100,0
%
3
a
Total
3
10
Keterangan : Hasil validasi model kepada holdout sample menunjukkan tingkat ketepatan klasifikasinya menurun sebagai berikut : Classification Results
a
Predicted Group Membership Spent Original
Count
2
Total
3
3
1
0
4
2
0
3
1
4
3
1
0
3
4
1
75,0
25,0
,0
100,0
2
,0
75,0
25,0
100,0
25,0 75,0 75,0% of original grouped cases correctly classified.
,0
100,0
%
3
a
1
1
D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS DISKRIMINAN.doc
35