Output
Descriptive Statistics N
Minimum
Maximum
Mean
Std. Deviation
Ekonomi
14
68
99
76,64
9,779
Sosiologi
14
61
95
74,64
10,278
Anthropologi
14
50
98
69,07
16,050
Geografi
14
52
90
69,43
13,910
TataNegara
14
60
90
74,86
10,589
Valid N
14
(listwise)
Case Processing Summarya Cases Valid N
Percent 14
100,0%
Missing N
Total
Percent 0
0,0%
N
Percent 14
100,0%
a. Squared Euclidean Distance used Tabel di atas menunjukkan bahwa semua data sejumlah 14 objek telah diproses tanpa ada data yang hilang.
Proximity Matrix Case
Squared Euclidean Distance 1:A
2:B
3:C
4:D
5:E
6:F
7:G
8:H
9:I
10:J
11:K
12:L
13:M
1:A
,000
19,037
5,920
17,136
2,605
1,581
11,917
13,025
1,840
15,848
17,136
12,489
13,808
2:B
19,037
,000
8,268
13,130
17,252
18,221
9,608
13,192
14,027
10,277
13,130
4,419
11,729
3:C
5,920
8,268
,000
10,352
7,580
6,083
12,033
7,958
5,773
17,847
10,352
2,015
8,326
4:D
17,136
13,130
10,352
,000
18,500
10,806
13,753
,345
9,785
22,293
,000
9,036
,331
5:E
2,605
17,252
7,580
18,500
,000
6,225
6,463
14,997
4,011
11,202
18,500
11,288
14,416
6:F
1,581
18,221
6,083
10,806
6,225
,000
12,832
7,548
,901
17,380
10,806
12,366
8,640
7:G
11,917
9,608
12,033
13,753
6,463
12,832
,000
12,907
7,059
2,487
13,753
11,365
10,266
8:H
13,025
13,192
7,958
,345
14,997
7,548
12,907
,000
7,103
21,331
,345
7,967
,306
9:I
1,840
14,027
5,773
9,785
4,011
,901
7,059
7,103
,000
10,674
9,785
10,553
7,179
10:J
15,848
10,277
17,847
22,293
11,202
17,380
2,487
21,331
10,674
,000
22,293
17,690
18,340
11:K
17,136
13,130
10,352
,000
18,500
10,806
13,753
,345
9,785
22,293
,000
9,036
,331
12:L
12,489
4,419
2,015
9,036
11,288
12,366
11,365
7,967
10,553
17,690
9,036
,000
7,631
13:M
13,808
11,729
8,326
,331
14,416
8,640
10,266
,306
7,179
18,340
,331
7,631
,000
14:N
10,364
6,012
1,950
8,808
8,314
10,861
9,604
7,451
8,967
16,683
8,808
,380
7,059
This is a dissimilarity matrix Tabel di atas menunjukkan matriks jarak antara variabel satu dengan variabel yang lain. Semakin kecil jarak euclidean, maka semakin mirip kedua variabel tersebut sehingga akan membentuk kelompok cluster.
Agglomeration Schedule Stage
Cluster Combined
Coefficients
Cluster 1 Cluster 2
Stage Cluster First
Next
Appears
Stage
Cluster 1
Cluster 2
1
4
11
,000
0
0
3
2
8
13
,306
0
0
3
3
4
8
,338
1
2
11
4
12
14
,380
0
0
7
5
6
9
,901
0
0
6
6
1
6
1,710
0
5
9
7
3
12
1,983
0
4
10
8
7
10
2,487
0
0
12
9
1
5
4,280
6
0
12
10
2
3
6,233
0
7
11
11
2
4
9,623
10
3
13
12
1
7
11,672
9
8
13
13
1
2
12,881
12
11
0
Tabel di atas merupakan hasil proses clustering dengan metode “Between Group Linkage”. Setelah
jarak
antara
variabel
diukur
dengan
jarak
euclidean,
maka
dilakukan
pengelompokkan yang dilakukan secara bertingkat. Stage 1: terbentuk 1 cluster yang beranggotakan Sampel no 4 dan 11 dengan jarak 0.000 (perhatikan pada kolom Coefficients). Karena proses aglomerasi dimulai dari 2 obyek yang terdekat, maka jarak tersebut adalah yang terdekat dari sekian kombinasi jarak 14 obyek yang ada. Selanjutnya lihat kolom terakhir (Next Stage), terlihat angka 3. Hal ini berarti clustering selanjutnya dilakukan dengan melihat stage 3. Demikian seterusnya dari stage 3 dilanjutkan ke stage 11, sampai ke stage terakhir. Aglomeratif Aglomeratif adalah bagian yang sangat penting pada saat kita coba interprestasi analisis cluster hirarki ini. Proses aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang melibatkan sekian banyak obyek dan terus bertambah. Proses aglomerasi pada akhirnya
akan menyatukan semua obyek menjadi satu cluster. Hanya saja dalam prosesnya dihasilkan beberapa cluster dengan masing-masing anggotanya, tergantung jumlah cluster yang dibentuk.
Cluster Membership Case
4 Clusters 3 Clusters 2 Clusters
1:A
1
1
1
2:B
2
2
2
3:C
2
2
2
4:D
3
2
2
5:E
1
1
1
6:F
1
1
1
7:G
4
3
1
8:H
3
2
2
9:I
1
1
1
10:J
4
3
1
11:K
3
2
2
12:L
2
2
2
13:M
3
2
2
14:N
2
2
2
Dari table di atas, jika anda menginginkan 2 cluster, maka yang menjadi anggota cluster 1 lihat pada kolom “2 clusters” dengan symbol 1, yaitu sample A, E, F, G, I, J.
Dendogram berguna untuk menunjukkan anggota cluster yang ada jika akan ditentukan berapa cluster yang seharusnya dibentuk. Sebagai contoh yang terlihat dalam dendogram, apabila akan dibentuk 2 cluster, maka cluster 1 beranggotakan sample D sampai dengan Sampel B (sesuai urutan dalam dendogram); dan cluster 2 beranggotakan sample G sampai dengan Sampel E. Demikian seterusnya dapat dengan mudah dilihat anggota tiap cluster sesuai jumlah cluster yang diinginkan. Pemilihan Anggota Cluster Kemudian anda lihat data set anda pada “data view”, di mana ada variabel baru dengan nama “Cluster Between Average Linkage”. Variabel tersebut memberikan tanda pada sampel, masuk menjadi anggota cluster mana.
Initial Cluster Centers Cluster 1
2
3
Zscore: Ekonomi
-,78155 2,28620
Zscore: Sosiologi
-,54904
,52124
,03475
,55629
,05785
-,68980
Zscore:
-,78155
Anthropologi Zscore: Geografi
1,47887
,54431 -1,18104
Zscore:
1,43002
-,93086 -1,02530
TataNegara Tabel diatas merupakan tampilan pertama proses clustering data sebelum dilakukan iterasi. Untuk mendeteksi berapa kali proses iterasi yang dilakukan dalam proses clustering dari 14 sampel yang diteliti, dapat dilihat dari tampilan output berikut ini : Iteration Historya Iteratio
Change in Cluster Centers
n
1
2
3
1
1,379
1,308
,381
2
,482
,438
,000
3
,000
,000
,000
a. Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is ,000. The current iteration is 3. The minimum distance between initial centers is 3,632.
Ternyata proses clustering yang dilakukan melalui 3 tahapan iterasi untuk mendapatkan cluster yang tepat. Dari tabel diatas disebutkan bahwa jarak minimum antar pusat cluster yang terjadi dari hasil iterasi adalah 3,632. Adapun hasil akhir dari proses clustering digambarkan sebagai berikut ini :
Final Cluster Centers Cluster 1
2
3
Zscore: Ekonomi
-,43387
,99775
-,70485
Zscore: Sosiologi
-,86039
,57962
,35097
,64352
-,00445
-,79883
Zscore: Anthropologi Zscore: Geografi Zscore:
,06984
,86062 -1,16307
1,01451
-,06206 -1,19056
TataNegara
Output Final Cluster Centers tersebut diatas masih terkait dengan proses standarisasi data sebelumnya, yang mengacu pada Z-score dengan ketentuan sebagai berikut : Nilai negatif ( - ) berarti data berada di bawah rata–rata total. Nilai positif ( + ) berarti data berada di atas rata–rata total.
ANOVA Cluster Mean
Error df
Mean
Square
F
Sig.
df
Square
Zscore: Ekonomi
3,953
2
,463
11
8,536
,006
Zscore: Sosiologi
2,937
2
,648
11
4,533
,037
Zscore:
2,312
2
,762
11
3,035
,089
Zscore: Geografi
4,569
2
,351
11
13,017
,001
Zscore:
5,418
2
,197
11
27,528
,000
Anthropologi
TataNegara The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.
Semakin besar nilai F dan (sig < 0,05), maka semakin besar perbedaan variabel pada cluster yang terbentuk. Dengan demikian hasil cluster yang diperoleh dalam kasus ini bahwa variabel Tata Negara yang paling menunjukan adanya perbedaan diantara mata kuliah pada ketiga cluster yang terbentuk, ditunjukan dengan nilai F = 27,528 dan sig = 0,000.
Number of Cases in each Cluster 1
5,000
Cluster 2
5,000
3
4,000
Valid Missing
14,000 ,000
Dari tabel diatas diperoleh bahwa cluster-1 beranggotakan 5 sampel mata kuliah, cluster-2 beranggotakan 5 sampel mata kuliah, sedangkan cluster-3 beranggotakan 4 sampel mata kuliah.