Analisis Cluster.docx

  • Uploaded by: Muhajir
  • 0
  • 0
  • April 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Analisis Cluster.docx as PDF for free.

More details

  • Words: 1,237
  • Pages: 15
Output

Descriptive Statistics N

Minimum

Maximum

Mean

Std. Deviation

Ekonomi

14

68

99

76,64

9,779

Sosiologi

14

61

95

74,64

10,278

Anthropologi

14

50

98

69,07

16,050

Geografi

14

52

90

69,43

13,910

TataNegara

14

60

90

74,86

10,589

Valid N

14

(listwise)

Case Processing Summarya Cases Valid N

Percent 14

100,0%

Missing N

Total

Percent 0

0,0%

N

Percent 14

100,0%

a. Squared Euclidean Distance used Tabel di atas menunjukkan bahwa semua data sejumlah 14 objek telah diproses tanpa ada data yang hilang.

Proximity Matrix Case

Squared Euclidean Distance 1:A

2:B

3:C

4:D

5:E

6:F

7:G

8:H

9:I

10:J

11:K

12:L

13:M

1:A

,000

19,037

5,920

17,136

2,605

1,581

11,917

13,025

1,840

15,848

17,136

12,489

13,808

2:B

19,037

,000

8,268

13,130

17,252

18,221

9,608

13,192

14,027

10,277

13,130

4,419

11,729

3:C

5,920

8,268

,000

10,352

7,580

6,083

12,033

7,958

5,773

17,847

10,352

2,015

8,326

4:D

17,136

13,130

10,352

,000

18,500

10,806

13,753

,345

9,785

22,293

,000

9,036

,331

5:E

2,605

17,252

7,580

18,500

,000

6,225

6,463

14,997

4,011

11,202

18,500

11,288

14,416

6:F

1,581

18,221

6,083

10,806

6,225

,000

12,832

7,548

,901

17,380

10,806

12,366

8,640

7:G

11,917

9,608

12,033

13,753

6,463

12,832

,000

12,907

7,059

2,487

13,753

11,365

10,266

8:H

13,025

13,192

7,958

,345

14,997

7,548

12,907

,000

7,103

21,331

,345

7,967

,306

9:I

1,840

14,027

5,773

9,785

4,011

,901

7,059

7,103

,000

10,674

9,785

10,553

7,179

10:J

15,848

10,277

17,847

22,293

11,202

17,380

2,487

21,331

10,674

,000

22,293

17,690

18,340

11:K

17,136

13,130

10,352

,000

18,500

10,806

13,753

,345

9,785

22,293

,000

9,036

,331

12:L

12,489

4,419

2,015

9,036

11,288

12,366

11,365

7,967

10,553

17,690

9,036

,000

7,631

13:M

13,808

11,729

8,326

,331

14,416

8,640

10,266

,306

7,179

18,340

,331

7,631

,000

14:N

10,364

6,012

1,950

8,808

8,314

10,861

9,604

7,451

8,967

16,683

8,808

,380

7,059

This is a dissimilarity matrix Tabel di atas menunjukkan matriks jarak antara variabel satu dengan variabel yang lain. Semakin kecil jarak euclidean, maka semakin mirip kedua variabel tersebut sehingga akan membentuk kelompok cluster.

Agglomeration Schedule Stage

Cluster Combined

Coefficients

Cluster 1 Cluster 2

Stage Cluster First

Next

Appears

Stage

Cluster 1

Cluster 2

1

4

11

,000

0

0

3

2

8

13

,306

0

0

3

3

4

8

,338

1

2

11

4

12

14

,380

0

0

7

5

6

9

,901

0

0

6

6

1

6

1,710

0

5

9

7

3

12

1,983

0

4

10

8

7

10

2,487

0

0

12

9

1

5

4,280

6

0

12

10

2

3

6,233

0

7

11

11

2

4

9,623

10

3

13

12

1

7

11,672

9

8

13

13

1

2

12,881

12

11

0

Tabel di atas merupakan hasil proses clustering dengan metode “Between Group Linkage”. Setelah

jarak

antara

variabel

diukur

dengan

jarak

euclidean,

maka

dilakukan

pengelompokkan yang dilakukan secara bertingkat. Stage 1: terbentuk 1 cluster yang beranggotakan Sampel no 4 dan 11 dengan jarak 0.000 (perhatikan pada kolom Coefficients). Karena proses aglomerasi dimulai dari 2 obyek yang terdekat, maka jarak tersebut adalah yang terdekat dari sekian kombinasi jarak 14 obyek yang ada. Selanjutnya lihat kolom terakhir (Next Stage), terlihat angka 3. Hal ini berarti clustering selanjutnya dilakukan dengan melihat stage 3. Demikian seterusnya dari stage 3 dilanjutkan ke stage 11, sampai ke stage terakhir. Aglomeratif Aglomeratif adalah bagian yang sangat penting pada saat kita coba interprestasi analisis cluster hirarki ini. Proses aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang melibatkan sekian banyak obyek dan terus bertambah. Proses aglomerasi pada akhirnya

akan menyatukan semua obyek menjadi satu cluster. Hanya saja dalam prosesnya dihasilkan beberapa cluster dengan masing-masing anggotanya, tergantung jumlah cluster yang dibentuk.

Cluster Membership Case

4 Clusters 3 Clusters 2 Clusters

1:A

1

1

1

2:B

2

2

2

3:C

2

2

2

4:D

3

2

2

5:E

1

1

1

6:F

1

1

1

7:G

4

3

1

8:H

3

2

2

9:I

1

1

1

10:J

4

3

1

11:K

3

2

2

12:L

2

2

2

13:M

3

2

2

14:N

2

2

2

Dari table di atas, jika anda menginginkan 2 cluster, maka yang menjadi anggota cluster 1 lihat pada kolom “2 clusters” dengan symbol 1, yaitu sample A, E, F, G, I, J.

Dendogram berguna untuk menunjukkan anggota cluster yang ada jika akan ditentukan berapa cluster yang seharusnya dibentuk. Sebagai contoh yang terlihat dalam dendogram, apabila akan dibentuk 2 cluster, maka cluster 1 beranggotakan sample D sampai dengan Sampel B (sesuai urutan dalam dendogram); dan cluster 2 beranggotakan sample G sampai dengan Sampel E. Demikian seterusnya dapat dengan mudah dilihat anggota tiap cluster sesuai jumlah cluster yang diinginkan. Pemilihan Anggota Cluster Kemudian anda lihat data set anda pada “data view”, di mana ada variabel baru dengan nama “Cluster Between Average Linkage”. Variabel tersebut memberikan tanda pada sampel, masuk menjadi anggota cluster mana.

Initial Cluster Centers Cluster 1

2

3

Zscore: Ekonomi

-,78155 2,28620

Zscore: Sosiologi

-,54904

,52124

,03475

,55629

,05785

-,68980

Zscore:

-,78155

Anthropologi Zscore: Geografi

1,47887

,54431 -1,18104

Zscore:

1,43002

-,93086 -1,02530

TataNegara Tabel diatas merupakan tampilan pertama proses clustering data sebelum dilakukan iterasi. Untuk mendeteksi berapa kali proses iterasi yang dilakukan dalam proses clustering dari 14 sampel yang diteliti, dapat dilihat dari tampilan output berikut ini : Iteration Historya Iteratio

Change in Cluster Centers

n

1

2

3

1

1,379

1,308

,381

2

,482

,438

,000

3

,000

,000

,000

a. Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is ,000. The current iteration is 3. The minimum distance between initial centers is 3,632.

Ternyata proses clustering yang dilakukan melalui 3 tahapan iterasi untuk mendapatkan cluster yang tepat. Dari tabel diatas disebutkan bahwa jarak minimum antar pusat cluster yang terjadi dari hasil iterasi adalah 3,632. Adapun hasil akhir dari proses clustering digambarkan sebagai berikut ini :

Final Cluster Centers Cluster 1

2

3

Zscore: Ekonomi

-,43387

,99775

-,70485

Zscore: Sosiologi

-,86039

,57962

,35097

,64352

-,00445

-,79883

Zscore: Anthropologi Zscore: Geografi Zscore:

,06984

,86062 -1,16307

1,01451

-,06206 -1,19056

TataNegara

Output Final Cluster Centers tersebut diatas masih terkait dengan proses standarisasi data sebelumnya, yang mengacu pada Z-score dengan ketentuan sebagai berikut : Nilai negatif ( - ) berarti data berada di bawah rata–rata total. Nilai positif ( + ) berarti data berada di atas rata–rata total.

ANOVA Cluster Mean

Error df

Mean

Square

F

Sig.

df

Square

Zscore: Ekonomi

3,953

2

,463

11

8,536

,006

Zscore: Sosiologi

2,937

2

,648

11

4,533

,037

Zscore:

2,312

2

,762

11

3,035

,089

Zscore: Geografi

4,569

2

,351

11

13,017

,001

Zscore:

5,418

2

,197

11

27,528

,000

Anthropologi

TataNegara The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.

Semakin besar nilai F dan (sig < 0,05), maka semakin besar perbedaan variabel pada cluster yang terbentuk. Dengan demikian hasil cluster yang diperoleh dalam kasus ini bahwa variabel Tata Negara yang paling menunjukan adanya perbedaan diantara mata kuliah pada ketiga cluster yang terbentuk, ditunjukan dengan nilai F = 27,528 dan sig = 0,000.

Number of Cases in each Cluster 1

5,000

Cluster 2

5,000

3

4,000

Valid Missing

14,000 ,000

Dari tabel diatas diperoleh bahwa cluster-1 beranggotakan 5 sampel mata kuliah, cluster-2 beranggotakan 5 sampel mata kuliah, sedangkan cluster-3 beranggotakan 4 sampel mata kuliah.

Related Documents

Analisis
June 2020 46
Analisis
June 2020 51
Analisis
October 2019 71
Analisis
September 2019 78
Analisis
November 2019 53
Analisis
November 2019 60

More Documents from ""