Analisis-diskiminan-teori

  • June 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Analisis-diskiminan-teori as PDF for free.

More details

  • Words: 1,838
  • Pages: 12
Analisis Diskiminan Setelah dilaksanakannya Analisis Gerombol, kemudian dilanjutkan dengan Analisis Diskriminan. Menurut Johnson dan Wichern (1992), tujuan dari Analisis Diskriminan adalah untuk menggambarkan ciri-ciri suatu pengamatan dari bermacam-macam populasi yang diketahui, baik secara grafis maupun aljabar dengan membentuk fungsi diskriminan. Dengan kata lain Analisis Diskriminan digunakan untuk mengklasifikasikan individu ke dalam salah satu dari dua kelompok atau lebih. Suatu fungsi diskriminan layak untuk dibentuk bila terdapat perbedaan nilai rataan di antara kelompok-kelompok yang ada. Oleh karena itu sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap perbedaan vektor nilai rataan dari kelompok-kelompok tersebut. Dalam pengujian vektor nilai rataan antar kelompok, asumsi yang harus dipenuhi adalah: 

Peubah-pubah yang diamati menyebar secara

normal

ganda

(multivariate normality) 

Semua kelompok populasi mempunyai matrik ragam-peragam

yang sama 3.2.4.1 Uji Kenormalan Peubah Ganda

Menurut Karson (1982: 80), untuk menguji kenormalan peubah ganda digunakan prosedur yang dikembangkan oleh Mardia dalam Susiyanto (2003) dengan cara menghitung dua macam ukuran statistik yaitu ukuran skewness (b1,p) dan kurtosis (b2,p), yaitu:

(b ) = (1 n )∑∑ ( X  n

2

1, p

n

u =1 u '=1

(b ) = (1 n) ∑ ( X n

2, p

u =1



u

u

′ − X ) S −1 ( X u ' − X ) 

′ − X ) S −1 ( X u − X )  

3

2

Hipotesa yang digunakan adalah: H0 : peubah ganda mengikuti sebaran normal H1 : peubah ganda tidak mengikuti sebaran normal Bila: 2 nb1,p /6 ≤ χp ( p +1)( p +2) / 6 , dan

[b2,p – p(p + 2)] /

8 p ( p +2) / n

≤ Zα (tabel normal), maka tidak ada

alasan untuk menolak H0, berarti peubah ganda mengikuti sebaran normal. Menurut Johnson dan Wichern (1992), untuk menguji kenormalan ganda adalah dengan mencari nilai jarak kuadrat untuk setiap pengamatan yaitu:

d 2j = ( X j − X )' S −1 ( X j − X ) ,

di mana Xj adalah pengamatan yang ke-j

dan S-1 adalah kebalikan (inverse) matriks ragam-peragam S

Kemudian

d 2j

diurutkan dari yang paling kecil ke yang paling besar,

selanjutnya dibuat plot

d 2j

2  j −1 2  dengan nilai Chi-Kuadrat χ p  n  dimana: j





= urutan = 1, 2, ..., n dan p = banyaknya peubah. Bila hasil plot dapat didekati dengan garis lurus, maka dapat disimpulkan bahwa peubah ganda menyebar normal. Menurut Nourosis dalam Susiyanto (2003), berdasar teori Wahl dan Kronmal (1977), dikatakan bahwa seringkali kenormalan ganda sulit diperoleh terutama bila sampel yang diambil relatif kecil. Bila hal ini terjadi, uji vektor nilai rataan tetap bisa dilakukan selama asumsi kedua (kesamaan ragam-peragam) dipenuhi.

3.2.4.2 Uji Kesamaan Matrik Ragam Peragam Untuk menguji kesamaan matrik ragam-peragam (Σ ) antar kelompok digunakan hipotesa: H0 : Σ 0 = Σ 1 = Σ 2 = ....Σ k = Σ . H1 : Sedikitnya ada dua kelompok yang berbeda. Statistik uji yang digunakan adalah statistik Box’s M, yaitu: -2lnλ = ( n − k ) ln W *

(n − k ) − ∑( n j − 1) ln S j k

j =1

k

λ *=

∏S j =1

( n j −1) / 2 j

W /( n − k )

( n −k ) / 2

dimana: k

= banyaknya kelompok.

W / (n-k)

= matrik ragam-peragam dalam kelompok gabungan.

Sj

= matrik ragam-peragam kelompok ke-j.

Bila hipotesa nol (H0) benar, maka (-2lnλ *) / b akan mengikuti sebaran F dengan derajat bebas v1 dan v2 pada taraf signifikansi α , dimana: v1 = (1/2)(k –1)p(p + 1) v2 = (v1+ 2) / (a2 – a12) b = v1 / (1 – a1 - v1/ v2) a1 =

2 p 3 + 3 p −1  k 1 1  − ∑  6(k −1)( p + 1)  j =1 ( n j −1) ( n − k ) 

a2 =

 ( p − 1)( p + 2)  k 1 1 − ∑ 2 2  6(k + 1) (n − k )   j =1 ( n j − 1)

p = jumlah peubah pembeda dalam fungsi diskriminan. Sehingga apabila (-2lnλ *) / b ≤ Fv1,v2,α maka tidak ada alasan untuk menolak H0 dan dapat disimpulkan bahwa antar kelompok mempunyai matrik ragam-peragam yang sama dan sebaliknya bila (-2lnλ *) / b >

Fv1,v2,α

maka H0 ditolak, yang berarti bahwa antar kelompok tidak

mempunyai matrik ragam–peragam yang sama.

3.2.4.3 Uji Vektor Nilai Rataan Pengujian terhadap vektor nilai rataan antar kelompok dilakukan dengan hipotesa: H0 : µ 0 = µ 1 = µ 2 = ...= µ

k

H1 : Sedikitnya ada dua kelompok yang berbeda Statistik uji yang digunakan dalam pengujian hipotesis tersebut adalah statistik V-Bartlett yang menyebar mengikuti sebaran Chi-kuadrat (χ 2) dengan derajat bebas p(k - 1), apabila H0 benar. Statistik V-Bartlett diperoleh melalui: V = −[( n −1) −( p + k ) 2] ln( ∆)

dimana: n = banyaknya pengamatan p = banyaknya peubah dalam fungsi diskriminan k = banyaknya kelompok ∆=

W W +B

=

Wilk’s lambda

dalam hal ini: W

= matrik jumlah kuadrat dan hasil kali data dalam kelompok =

k

ni

∑∑( X i =1 j =1

B

ij

− X i )( X ij − X i )'

= matrik jumlah kuadrat dan hasil kali data antar kelompok. k

=

∑n ( X i =1

i

i

− X )( X i − X )'

Xij

= pengamatan ke-j kelompok ke-i

Xi

= vektor rataan kelompok ke-i

ni

= jumlah pengamatan pada kelompok ke-i,

X

= vektor rataan total

2 Apabila V ≤ χp ( k −1), (1−α) maka, tidak ada alasan untuk menolak H0,

ini berarti bahwa terdapat perbedaan vektor nilai rataan antar kelompok. 2 Sebaliknya bila V > χp ( k −1), (1−α) maka H0 ditolak.

Bila dari hasil pengujian ada perbedaan vektor nilai rataan, maka fungsi diskriminan layak disusun untuk mengkaji hubungan antar kelompok serta berguna untuk mengelompokkan suatu obyek ke salah satu kelompok tersebut.

Penentuan peubah bebas dalam pembentukan fungsi diskriminan dengan prosedur stepwise Menurut Nourosis dalam Susiyanto (2003), apabila dalam suatu penelitian menggunakan banyak peubah maka untuk efisiensi dalam menentukan peubah mana yang berperan dalam pembentukan fungsi diskriminan dilakukan melalui analisis diskriminan bertatar (stepwise disciminant). Prosedur ini digunakan untuk menghilangkan informasi dari peubah bebas yang kurang berguna dalam membentuk fungsi diskriminan. Prosedur diskriminan bertatar dimulai dengan pemilihan peubah bebas yang paling berarti. Kriteria untuk melihat variabel yang paling berarti (peubah yang dapat diikutsertakan dalam pembentukan fungsi diskriminan), yaitu: 1. Peubah yang memiliki nilai F terbesar. 2. Peubah yang memiliki nilai Wilk’s Lambda terkecil.

Peubah yang sudah terpilih bisa dikeluarkan dari fungsi diskriminan jika informasi yang dikandung tentang perbedaan kelompok ada di beberapa kombinasi peubah-peubah terpilih lainnya.

Pembentukan Fungsi Diskriminan

Analisis Diskriminan merupakan teknik statistik yang menggunakan peubah tak bebas Y berupa peubah kategorik dan peubah bebasnya adalah interval atau rasio. Fungsi diskriminan merupakan fungsi atau kombinasi linier peubah-peubah asal yang akan menghasilkan cara terbaik dalam pemisahan kelompok-kelompok. Fungsi ini akan memberikan nilai-nilai yang sedekat mungkin dalam kelompok dan sejauh mungkin antar kelompok (Dillon dalam Solikhah, 2003) Banyaknya fungsi diskriminan yang terbentuk secara umum tergantung dari min(p,k-1), dengan p adalah banyaknya peubah pembeda dan k adalah banyaknya kelompok yang telah ditetapkan. Fungsi diskriminan ini diartikan sebagai keragaman peubah yang terpilih sebagai kekuatan pembeda. Apabila fungsi diskriminan yang terbentuk sebanyak lebih dari 1, maka dapat dikatakan bahwa fungsi diskriminan pertama akan menjadi kekuatan pembeda yang paling besar, demikian berturut-turut untuk fungsi berikutnya. Fungsi diskriminan yang terbentuk mempunyai bentuk umum berupa persamaan linier (Fisher’s Sample Linear Discriminant Function) yaitu: ˆ x + ˆ x + +  ˆ x + +  ˆ x y1 =  11 1 12 2 1j j 1p p y 2 = ˆ 21 x1 + ˆ 22 x 2 + + ˆ 2 j x j + + ˆ 2 p x p

y 3 = ˆ31 x1 + ˆ32 x 2 +  + ˆ3 j x j + + ˆ3 p x p

…………………………………………….

y i = ˆi1 x1 + ˆi 2 x 2 + + ˆij x j + + ˆip x p

…………………………………………… y q = ˆ q1 x1 + ˆ q 2 x 2 + + ˆ qj x j + + ˆ qp x p

dengan i=1,2,…,q (min p,k-1) j=1,2,…,p atau dapat ditulis sebagai ˆ' x y =

dimana: ˆ = 

koefisien vektor

y = skor diskriminan Nilai

ˆ 

dipilih sedemikian sehingga fungsi diskriminan berbeda

sebesar mungkin antara kelompok, atau sehingga rasio antara jumlah kuadrat antar kelompok dengan jumlah kuadrat dalam kelompok maksimum.

Penilaian Kekuatan Fungsi Diskriminan Untuk mengetahui kekuatan fungsi diskriminan dalam menilai tiaptiap observasi dan mengelompokkannya ke dalam kelompok yang didefinisikan dapat dilakukan dengan melihat:

1. Korelasi Kanonik (Canonical correlation) Canonical Correlation (R) merupakan ukuran hubungan antara kelompok yang terbentuk oleh y dengan fungsi diskriminan yang ada. Ketika R adalah nol, maka hal ini dapat diartikan bahwa tidak ada hubungan di antara kelompok-kelompok yang ada dengan fungsi yang terbentuk. Sebaliknya apabila R-nya besar (mendekati 1), maka menunjukkan adanya korelasi yang tinggi antara fungsi diskriminan dengan kelompok yang ada. R ini digunakan untuk menjelaskan seberapa besar masing-masing fungsi berguna dalam menentukan perbedaan kelompok. 2. Akar Ciri (Eigen Value) Nilai eigen value menunjukkan ada atau tidaknya multikolinearitas atau terjadinya korelasi antar peubah bebas di dalam fungsi diskriminan. Multikolinearitas akan terjadi bila eigen value mendekati 0 (nol). 3. Group Centroid Group centroid merupakan rata-rata nilai diskriminan dari tiap-tiap observasi di dalam masing-masing kelompok. Semakin besar perbedaan group centroid antar kelompok, maka fungsi diskriminan yang diperoleh semakin dapat membedakan kelompok yang ada.

Ketepatan Pengelompokan Tingkat akurasi pengelompokkan sangat menentukan baik atau tidaknya suatu pengelompokkan. Persentase ketepatan pengelompokan dapat dihitung dari matrik klasifikasi yang menunjukkan nilai sebenarnya (actual members) dan nilai prediksi (prediction members) dari setiap kelompok. Rumus persentase ketepatan pengelompokan oleh fungsi diskriminan (hit ratio) adalah: k

Hit ratio =

∑n i =1 k

ic

∑n i =1

× 100%

i

dimana : ni = jumlah observasi dari µ i yang tepat dikelompokkan pada µ

i

nij = jumlah observasi dari µ i yang salah dikelompokkan pada µ

ij

dengan i =1,2,…,k dan j =1,2,…,k Dalam prakteknya, hasil dari hit ratio ini sering dibandingkan dengan suatu standar persentase tertentu. Ada 2 (dua) standar persentase yang sering digunakan yaitu kriteria peluang proporsional (the proportional chance criterion) dan kriteria peluang maksimum (the maximum chance criterion).

Kriteria peluang proporsional digunakan jika ukuran masing-masing kelompok tidak sama dan peneliti ingin mengidentifikasi dengan tepat tiaptiap observasi dari 2 (dua) kelompok atau lebih. Rumus yang digunakan untuk kriteria peluang proporsional ini adalah: k

Cproporsional = ∑ pi

2

i =1

dimana: Cproporsional p

= kriteria peluang proporsional dari model peluang. = proporsi jumlah observasi dari kelompok.

Kriteria peluang maksimum ditentukan dengan menghitung persentase total observasi yang ditunjukkan oleh persentase terbesar dari dua kelompok atau lebih. Hair et. Al dalam Solikhah (2003) menyarankan bahwa persentase ketepatan pengklasifikasian yang diperoleh melalui analisis diskriminan paling tidak 25 persen lebih besar dari persentase yang diperoleh melalui model peluang.