Interpretasi Cluster
-
Author
martha-devi -
Category
Documents
-
view
559 -
download
3
Embed Size (px)
Transcript of Interpretasi Cluster
Nama NIM
: Faradila Martha Devi : 107094003053
1. Pengelompokkan data dengan metode K-Means Cluster (3 Cluster)
a. Perusahaan yang masuk Cluster 1, 2, 3 Cluster 1 : Bumi resources, Aneka Tambang, Astra Internasional, Indofood Sukses Makmur Cluster 2 : Aqua Golden Mississipi Cluster 3 : Astra Agro Lestari, Sampoerna Agro, SMART, Adaro Energy, Resources Alam Indonesia, Elnusa, Holcim Indonesia, Indocement Tunggal, Astra Otoparts, Indomobil Sukses Internasional, Ades Waters Indonesia, Siantara Top, Ultra Jaya Milk, Bentoel Int, Gudang Garam, HM Sampoerna, Indofarma, Kalbe Farma, Merck, Mustika ratu b. Output dan Interpretasinya
DescriptivesDescriptive Statistics N assets Hi Low Close Freq Valid N (listwise) 25 25 25 25 25 25 Minimum 190 215 50 50 15 Maximum 77788 129500 100000 127000 1192213 Mean 12160,84 13274,40 6851,56 8624,00 130952,96 Std. Deviation 17903,472 27400,901 20653,768 25713,036 273001,617
Analisis : Tabel ini merupakan table Deskriptif Statistik, yang mendeskriptifkan data-data (minimum, maximum, mean-rataan, standar deviasi) dalam table
Quick ClusterInitial Cluster Centers Cluster 1 Zscore(assets) Zscore(Hi) Zscore(Low) Zscore(Close) Zscore(Freq) 3,66561 ,61953 -,01218 ,07490 ,49193
2 -,62473 4,24167 4,51000 4,60373 -,47962
3 -,65942 1,44979 1,38708 1,04523 -,47949
Output ini adalah tampilan pertama (initial) proses clustering data sebelum dilakukan iterasi. Tapi, output ini tidak dianalisis, karena yang akan dianalisis adalah hasil akhir cluster dari proses clustering sesudah iterasiIteration History(a) Change in Cluster Centers Iteration 1 2 3
12,029 ,685 ,000
2 ,000 ,000 ,000
3 2,619 ,137 ,000
a Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is , 000. The current iteration is 3. The minimum distance between initial centers is 4,821.
Output ini menyatakan telah terjadi 3 kali proses iterasi, hingga menghasilkan Hasil Akhir Cluster (Final Cluster Centers)Final Cluster Centers Cluster Zscore(assets) Zscore(Hi) Zscore(Low) Zscore(Close) Zscore(Freq) 1 1,61235 -,05677 -,22461 -,20433 1,74156 2 -,62473 4,24167 4,51000 4,60373 -,47962 3 -,29123 -,20073 -,18058 -,18932 -,32433
Output ini adalah akhir dari proses clustering, dengan analisis : Angka di atas terkait dengan proses standardisasi data sebelumnya, yang mengacu pada angka z, dengan ketentuan berikut : a. Angka negative berarti data di bawah rata-rata total b. Angka positif berarti data di atas rata-rata total Hal itu berarti, data-data di atas berada di atas rata-rata total Mis, angka 1,61235 pada variable Zassets menyatakan rata-rata assets responden pada cluster 1, yaitu :
X = + z. Dimana : X = Rata-rata sampel (dalam hal ini rata-rata variable pada cluster tertentu) = Rata-rata populasi z = Nilai standardisasi yang didapat pada SPSS = Standar deviasi Contoh Perhitungannya : a. Rata-Rata Assets cluster 1 = 12160,84 + (1,61 x 17903,47) = 40985,43 b. Rata-Rata Assets cluster 2 = 12160,84 + (-0,625 x 17903,47) = 971,17 c. Rata-Rata Assets cluster 3 = 12160,84 + (-0,29 x 17903,47) = 6968,84 Setelah terbentuk 3 cluster, langkah selanjutnya adalah melihat apakah variable-variabel yang terbentuk mempunyai perbedaan tiap cluster, melalui pengujian output ANOVAANOVA Cluster Zscore(assets) Zscore(Hi) Zscore(Low) Zscore(Close) Zscore(Freq) Mean Square 6,243 9,405 10,597 11,039 7,233 df 2 2 2 2 2 Error Mean Square ,523 ,236 ,128 ,087 ,433 df 22 22 22 22 22 F 11,927 39,872 83,086 126,373 16,690 Sig. ,000 ,000 ,000 ,000 ,000
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.
Analisis : Kolom cluster menunjukkan besaran between cluster mean, sedangkan kolom Error menunjukkan besaran within cluster mean, sehingga kolom F : F = Cluster Error Contoh : Angka F (pada ZHi) = 9,405/0,236 = 39,85 sebanding dengan 39,872 (perbedaan angka mungkin karena pembulatan) Pada prinsipnya, semakin besar angka F suatu variable dan angka signifikannya di bawah 0,05, maka semakin besar pula perbedaan variable tersebut pada ketiga cluster yang terbentuk. Sebagai contoh : Pada variable Close, angka F = 126,373 dengan angka sig. 0,000 yang berarti signifikansi adalah nyata, atau dengan kata lain, factor Close sangat memmbedakan karakteristik ketiga cluster Sekarang kita bandingkan, angka F variable ZAssets (11,927) lebih kecil dari angka F variable ZClose (126,373), hal itu berarti perbedaan assets jauh lebih kecil dari perbedaan Close antar responden pada ketiga cluster
Number of Cases in each Cluster Cluster 1 2 3 4,000 1,000 20,000 25,000 ,000
Valid Missing
Analisis : Dari table di atas didapat : 1. Responden yang masuk ke cluster 1 sebanyak 4 responden 2. Responden yang masuk ke cluster 2 sebanyak 1 responden 3. Responden yang masuk ke cluster 3 sebanyak 20 responden Tidak ada variable yang hilang (missing), karena semua responden (25 resonden) terpeta pada ketiga cluster.2. Pengelompokkan data dengan metode Hierarchical Cluster
Output dan Interpretasinya :
ProximitiesCase Processing Summary(a) Cases Valid Missing Total Per Per cen cen Per N t N t N cent 96, 4,0 100 24 1 25 0% % ,0% a Squared Euclidean Distance used
Output menyatakan bahwa 24 data yang ada telah diproses
Cluster
P r o x im ity M a tr ix S q u a r e d E u c l id e a n D is t a n c e 16: 17: 18: 19: 1 : S U M A 2 T: SE UR M A T E R A A 5 :S U M A T E R A 8 : D K I 9 : J A W 1 A : J A W 1A 1 : D I 1 2 : J A W A 0 K A L I M A KN A T L AI M A KN A T L AI M A KN A T L AI M A N T A N 2 1 : S U L N N N C ase U T A R A B A R A T3 : R I A 4 : J A M S E L A T 6A : B E N G 7 K: LU A L MU PJ UA N A RB TAA R AT TE N G Y AO H G Y A KT AI MR UT R 3 : B A 1L 4I : N T 1B 5 : N T T B A R A T T I M U R S E L A T A T NE N G A2 H : S U T U N G 2A2 H: S U L2 S3 :ES L U L 2T 4E : INR GI A N U BI N KG 1 A 0 LE T 1 : S U M A T E R A U T, 0A 0 R0 A 3 , 8 9 1 3 , 4 8 5 2 , 2 4 1 7 , 0 8 7 2 , 6 0 6 3 , 8 4 8 3 0 , 1 4 1 8 , 4 5 3 4 , 3 1 4 5 , 9 4 5 6 , 4 6 1 8 , 9 7 3 9 , 0 2 0 1 6 , 9 5 5 7 , 3 0 3 9 , 4 3 8 5 , 2 5 3 5 , 1 4 2 4 , 6 4 9 7 , 4 5 3 9 , 8 8 1 1 9 , 1 1 0 3 2 , 5 9 4 2 : S U M A T E R A B A ,R8 9 1T , 0 0 0 1 , 3 7 9 3 , 9 9 0 9 , 5 5 8 4 , 3 6 5 9 , 2 8 8 2 0 , 8 0 1 6 , 5 0 6 4 , 6 5 0 2 , 6 6 9 7 , 3 8 1 4 , 1 0 6 1 2 , 4 7 92 2 , 4 9 4 1 1 , 8 4 0 1 2 , 0 0 7 5 , 4 2 8 2 , 8 2 4 2 , 1 4 1 3 , 8 8 7 7 , 1 8 3 9 , 5 5 1 3 2 , 7 5 0 3 A 3 :R IA U 3 , 4 8 5 1 , 3 7 9 , 0 0 0 2 , 8 5 1 7 , 6 0 4 3 , 7 3 7 8 , 3 2 8 3 0 , 0 9 4 4 , 5 4 8 2 , 9 0 3 1 , 3 3 4 6 , 1 7 0 3 , 7 8 4 1 1 , 5 0 22 1 , 7 0 1 8 , 9 0 7 1 0 , 6 4 5 4 , 6 5 3 ,7 8 1 2 ,5 8 7 4 ,6 6 4 4 , 7 9 5 8 ,1 0 7 3 2 ,6 0 5 4 :J A M B I 2 ,2 4 1 3 ,9 9 0 2 ,8 5 1 ,0 0 0 7 , 8 3 0 1 , 1 4 2 1 , 7 1 4 2 7 , 5 7 06 ,3 8 5 2 , 1 3 1 3 , 0 3 7 3 , 0 5 4 4 , 5 9 1 4 , 5 7 1 1 2 , 6 7 5 5 , 1 2 8 1 1 , 0 3 4 3 , 2 6 3 2 , 6 0 0 6 , 7 3 8 5 ,8 1 2 6 , 6 3 9 1 4 ,1 3 7 3 7 ,7 1 6 5 : S U M A T E R A S E ,L0 A8 T A N9 , 5 5 8 7 , 6 0 4 7 , 8 3 0 7 7 ,0 0 0 5 , 0 6 1 1 3 , 0 4 72 7 , 6 5 1 6 , 3 9 0 1 0 , 6 7 1 1 0 , 3 7 41 3 , 2 7 21 5 , 2 3 81 1 , 9 4 11 8 , 6 7 8 4 , 4 6 1 2 , 1 6 1 7 , 5 5 2 1 0 , 0 1 8 7 , 3 3 0 5 , 4 6 8 4 , 1 6 7 1 4 , 0 4 2 1 7 , 1 7 6 6 : B E N G K U L U 2 ,6 0 6 4 ,3 6 5 3 , 7 3 7 1 , 1 4 2 5 , 0 6 1 , 0 0 0 3 , 1 8 0 2 3 , 8 7 03 ,4 4 4 5 , 1 4 5 5 , 0 3 4 6 , 8 1 1 7 , 5 6 0 6 , 7 2 8 8 , 7 4 3 2 , 9 0 2 9 , 8 4 2 4 , 4 7 1 4 , 3 6 0 5 , 2 3 9 4 ,1 0 1 5 , 8 5 5 1 2 ,4 1 5 2 8 ,7 3 7 7 :L A M P U N G 3 , 8 4 8 9 , 2 8 8 8 , 3 2 8 1 , 7 1 4 1 3 , 0 4 7 3 , 1 8 0 , 0 0 0 3 2 , 7 3 91 1 , 9 2 2 4 , 9 6 1 7 , 9 9 8 4 , 6 8 7 9 , 1 1 2 4 , 3 7 6 9 , 7 2 9 6 , 5 3 3 1 7 , 0 3 3 6 , 1 1 1 7 , 8 5 5 1 3 , 1 6 21 1 , 0 9 4 1 3 , 2 2 9 2 3 , 5 3 6 4 4 , 9 4 4 8 : D K I J A K A R T A 3 0 , 1 4 1 2 0 , 8 0 13 0 , 0 9 42 7 , 5 7 0 2 7 , 6 5 1 2 3 , 8 7 0 3 2 , 7 3 9 , 0 0 0 2 9 , 8 7 63 2 , 8 8 6 2 9 , 4 1 03 1 , 4 4 12 7 , 5 6 32 8 , 1 2 33 5 , 5 5 5 3 3 , 0 0 8 2 7 , 9 9 8 2 5 , 9 9 5 3 2 , 5 9 32 5 , 6 0 01 7 , 3 3 9 2 7 , 5 8 2 3 0 , 3 0 2 4 3 , 8 1 9 9 : J A W A B A R A T 8 , 4 5 3 6 , 5 0 6 4 , 5 4 8 6 , 3 8 5 6 , 3 9 0 3 , 4 4 4 1 1 , 9 2 22 9 , 8 7 6 , 0 0 0 1 0 , 8 4 0 7 , 1 5 5 1 5 , 1 3 51 1 , 1 4 21 6 , 8 0 81 3 , 1 6 7 5 , 7 1 8 1 3 , 9 0 0 1 0 , 1 5 3 5 , 2 4 3 4 , 4 9 9 5 , 4 1 1 5 , 4 9 2 6 , 1 8 1 2 4 , 1 6 6 1 0 : J A W A T E N G A4 H3 1 4 4 , 6 5 0 2 , 9 0 3 2 , 1 3 1 1 0 , 6 7 1 5 , 1 4 5 4 , 9 6 1 3 2 , 8 8 61 0 , 8 4 0 , 0 0 0 , 1 , 2 3 6 , 7 9 5 1 ,9 6 3 4 , 5 7 4 2 0 , 5 5 9 8 ,4 1 6 1 2 ,3 1 0 1 , 5 0 4 3 ,3 2 8 9 ,7 6 7 6 ,2 5 6 5 , 9 0 5 1 3 ,3 4 4 3 9 ,3 2 4 1 1 : D I Y O G Y A K A 5R , 9T 4A 5 2 , 6 6 9 1 , 3 3 4 3 , 0 3 7 1 0 , 3 7 4 5 , 0 3 4 7 , 9 9 8 2 9 , 4 1 0 7 , 1 5 5 1 , 2 3 6 ,0 0 0 3 ,1 6 9 ,8 0 0 8 , 0 0 8 2 1 , 1 2 7 9 ,1 0 3 1 3 ,3 6 4 2 , 4 5 9 1 ,7 9 5 6 ,9 6 7 4 ,0 3 3 3 , 9 0 9 6 ,9 7 9 3 5 ,6 1 0 1 2 : J A W A T I M U R 6 , 4 6 1 7 , 3 8 1 6 , 1 7 0 3 , 0 5 4 1 3 , 2 7 2 6 , 8 1 1 4 , 6 8 7 3 1 , 4 4 11 5 , 1 3 5 , 7 9 5 3 , 1 6 9 , 0 0 0 2 ,7 9 5 2 , 3 2 8 2 0 , 9 0 1 9 ,9 1 4 1 3 ,8 5 9 1 , 8 8 9 6 ,1 1 2 1 4 , 3 1 6 8 ,1 6 9 8 , 0 7 0 1 7 ,4 9 8 4 4 ,9 5 4 1 3 :B A L I 8 , 9 7 3 4 , 1 0 6 3 , 7 8 4 4 , 5 9 1 1 5 , 2 3 8 7 , 5 6 0 9 , 1 1 2 2 7 , 5 6 31 1 , 1 4 2 1 , 9 6 3 ,8 0 0 2 ,7 9 5 ,0 0 0 7 , 7 3 4 2 3 , 2 1 2 1 2 , 6 1 3 1 7 ,7 9 9 3 , 2 3 2 3 ,8 0 6 1 0 , 8 1 7 5 ,5 6 5 6 , 3 5 9 8 ,7 0 1 4 2 ,4 0 7 1 4 :N T B 9 , 0 2 0 1 2 , 4 7 91 1 , 5 0 2 4 , 5 7 1 1 1 , 9 4 1 6 , 7 2 8 4 , 3 7 6 2 8 , 1 2 31 6 , 8 0 8 4 , 5 7 4 8 , 0 0 8 2 , 3 2 8 7 , 7 3 4 , 0 0 0 1 4 , 6 0 0 6 , 9 7 7 1 3 , 0 8 5 3 , 0 8 0 1 1 , 5 1 11 9 , 2 9 4 9 , 0 0 0 9 , 1 3 0 2 1 , 7 1 2 4 1 , 6 1 4 1 5 :N T T 1 6 , 9 5 5 2 2 , 4 9 42 1 , 7 0 11 2 , 6 7 5 1 8 , 6 7 8 8 , 7 4 3 9 , 7 2 9 3 5 , 5 5 51 3 , 1 6 72 0 , 5 5 9 2 1 , 1 2 72 0 , 9 0 12 3 , 2 1 21 4 , 6 0 0 , 0 0 0 6 , 5 1 6 2 9 , 8 2 9 1 6 , 6 1 6 2 2 , 2 5 62 4 , 4 9 01 5 , 6 6 5 1 9 , 4 7 9 2 5 , 9 2 7 3 4 , 6 3 8 1 6 : K A L I M A N T A N 7 ,B3 A 3R A 1T 1 , 8 4 0 8 , 9 0 7 5 , 1 2 8 4 , 4 6 1 2 , 9 0 2 6 , 5 3 3 3 3 , 0 0 8 5 , 7 1 8 8 , 4 1 6 9 , 1 0 3 9 , 9 1 4 1 2 , 6 1 3 6 , 9 7 7 6 , 5 1 6 0 , 0 0 0 1 0 , 7 1 9 5 , 4 9 1 1 0 , 3 1 71 2 , 4 8 6 5 , 9 3 5 5 , 2 4 4 1 4 , 1 4 2 2 1 , 6 8 5 1 7 : K A L I M A N T A N 9 ,T4 I3M8 U R 2 , 0 0 71 0 , 6 4 51 1 , 0 3 4 2 , 1 6 1 9 , 8 4 2 1 7 , 0 3 32 7 , 9 9 81 3 , 9 0 01 2 , 3 1 0 1 3 , 3 6 41 3 , 8 5 91 7 , 7 9 91 3 , 0 8 52 9 , 8 2 9 1 0 , 7 1 9 , 0 0 0 1 9 , 6 8 3 1 3 , 0 2 51 0 , 4 9 9 9 , 4 3 8 7 , 4 5 2 2 0 , 8 8 4 2 4 , 8 2 2 1 8 :K A L I M A N T A N 5 , 2 5 3 5 , 4 2 8 4 , 6 5 3 3 , 2 6 3 7 , 5 5 2 4 , 4 7 1 6 , 1 1 1 2 5 , 9 9 51 0 , 1 5 3 1 , 5 0 4 2 , 4 5 9 1 , 8 8 9 3 , 2 3 2 3 , 0 8 0 1 6 , 6 1 6 5 , 4 9 1 9 , 6 8 3 ,0 0 0 6 ,4 0 8 1 0 , 6 3 4 2 ,9 0 9 3 , 5 7 4 1 1 ,5 2 3 2 8 ,6 5 9 SELATAN 1 9 : K A L I M A N T A N 5 ,T1 E4 2 G 2 , H 2 4 , 7 8 1 2 , 6 0 0 1 0 , 0 1 8 4 , 3 6 0 7 , 8 5 5 3 2 , 5 9 3 5 , 2 4 3 3 , 3 2 8 1 , 7 9 5 6 , 1 1 2 3 , 8 0 6 1 1 , 5 1 12 2 , 2 5 6 1 0 , 3 1 7 1 3 , 0 2 5 6 , 4 0 8 N A 8 ,0 0 0 4 ,3 3 2 7 ,2 4 0 6 , 2 7 7 9 ,3 8 2 4 1 ,1 9 9 2 0 :S U L U T 4 , 6 4 9 2 , 1 4 1 2 , 5 8 7 6 , 7 3 8 7 , 3 3 0 5 , 2 3 9 1 3 , 1 6 22 5 , 6 0 0 4 , 4 9 9 9 , 7 6 7 6 , 9 6 7 1 4 , 3 1 61 0 , 8 1 71 9 , 2 9 42 4 , 4 9 0 1 2 , 4 8 6 1 0 , 4 9 9 1 0 , 6 3 4 4 , 3 3 2 , 0 0 0 6 , 6 5 5 9 , 0 6 6 1 1 , 4 8 5 2 8 , 7 2 0 2 1 : S U L T E N G A H 7 , 4 5 3 3 , 8 8 7 4 , 6 6 4 5 , 8 1 2 5 , 4 6 8 4 , 1 0 1 1 1 , 0 9 41 7 , 3 3 9 5 , 4 1 1 6 , 2 5 6 4 , 0 3 3 8 , 1 6 9 5 , 5 6 5 9 , 0 0 0 1 5 , 6 6 5 5 , 9 3 5 9 , 4 3 8 2 , 9 0 9 7 , 2 4 0 6 , 6 5 5 , 0 0 0 2 , 2 7 7 5 , 6 0 3 1 8 , 9 3 6 2 2 :S U L S E L 9 , 8 8 1 7 , 1 8 3 4 , 7 9 5 6 , 6 3 9 4 , 1 6 7 5 , 8 5 5 1 3 , 2 2 92 7 , 5 8 2 5 , 4 9 2 5 , 9 0 5 3 , 9 0 9 8 , 0 7 0 6 , 3 5 9 9 , 1 3 0 1 9 , 4 7 9 5 , 2 4 4 7 , 4 5 2 3 , 5 7 4 6 , 2 7 7 9 , 0 6 6 2 , 2 7 7 , 0 0 0 4 , 7 2 6 2 1 , 5 4 7 2 3 :S U L T E N G 1 9 , 1 1 0 9 , 5 5 1 8 , 1 0 7 1 4 , 1 3 7 1 4 , 0 4 2 1 2 , 4 1 5 2 3 , 5 3 63 0 , 3 0 2 6 , 1 8 1 1 3 , 3 4 4 6 , 9 7 9 1 7 , 4 9 8 8 , 7 0 1 2 1 , 7 1 22 5 , 9 2 7 1 4 , 1 4 2 2 0 , 8 8 4 1 1 , 5 2 3 9 , 3 8 2 1 1 , 4 8 5 5 , 6 0 3 4 , 7 2 6 , 0 0 0 2 6 , 1 0 7 2 4 : I R I A N J A Y A 3 2 , 5 9 4 3 2 , 7 5 03 2 , 6 0 53 7 , 7 1 6 1 7 , 1 7 6 2 8 , 7 3 7 4 4 , 9 4 44 3 , 8 1 92 4 , 1 6 63 9 , 3 2 4 3 5 , 6 1 04 4 , 9 5 44 2 , 4 0 74 1 , 6 1 43 4 , 6 3 8 2 1 , 6 8 5 2 4 , 8 2 2 2 8 , 6 5 9 4 1 , 1 9 92 8 , 7 2 01 8 , 9 3 6 2 1 , 5 4 7 2 6 , 1 0 7 , 0 0 0 T h i s i s a d i s s i m i la r it y m a t r i x
Analisis : Tabel menyatakan matrix proximity, dengan angka yang tertera adalah jarak (distance) antara 2 buah variable Seperti diketahui, langkah pertama cluster, adalah melakukan pengukuran tterhadap kesamaan (similarity) antar variable, sesuai tujuan cluster untuk mengelompokkan variable yang sama (similar) Contoh : Jarak antara variable 1 (Sumatera Utara) dengan variable 2 (Sumatera Barat) adalah 3, 891 Jarak antara variable 1 (Sumatera Utara) dengan variable 3 (Riau) adalah 3, 485
Average Linkage (Between Groups)Agglomeration Schedule Cluster Combined Cluster 1 Cluster 2 3 19 10 12 11 13 4 6 10 18 2 3 5 17 21 22 1 4 10 11 1 7 2 20 10 14 21 23 2 9 1 16 1 10 2 21 1 2 1 5 1 15 1 8 1 24 Stage Cluster First Appears Cluster 1 Cluster 2 0 0 0 0 0 0 0 0 2 0 0 1 0 0 0 0 0 4 5 3 9 0 6 0 10 0 8 0 12 0 11 0 16 13 15 14 17 18 19 7 20 0 21 0 22 0
Stage 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
Coefficients ,781 ,795 ,800 1,142 1,697 2,102 2,161 2,277 2,423 2,476 2,914 3,020 5,145 5,164 5,199 5,467 6,204 7,025 8,221 10,714 18,349 28,552 32,379
Next Stage 6 5 10 9 10 12 20 14 11 13 16 15 17 18 18 17 19 19 20 21 22 23 0
Analisis : Tabel di atas adalah hasil proses clustering dengan metode Between Group Linkage Setelah jarak antar variable diukur dengan cara Euclidean, maka dilakukan pengelompokkan variable secara hierarki, yaitu pengelompokkan dilakukan secara bertingkat, satu demi satu, atau dari terbentuknya cluster yang banyak, hingga akhirnya terbentuk 1 cluster, dengan cara Agglomerasi Pada Stage 1 : terbentuk 1 cluster dengan anggotanya variable 3 (Riau) dan 19 (Kalimantan Tengah), dengan coeffisien 0,781, yang menyatakan jarak antar varibel 3 dan 19, dan ini adalah jarak yang terdekat dari sekian banyak kombinasi jarak dari 24 variabel yang ada. Pada kolom Next stage, tertulis angka 6, yang berarti langkah clustering selanjutnya dengan melihat stage 6 Pada Stage 6 : Variabel 3 membentuk cluster dengan variable 2 (Sumatera Barat). Dengan demikian, sekarang cluster terdiri dari 3 variabel, 2 (Sumaera barat), 3 (Riau) dan 19 (Kalimantan Tengah), dengan jarak rata-rata : - Jarak variable 3 dan 19 (Pada Proximity Matrix) = 0,781 - Jarak variable 2 dan 3 = 1,379 - Jadi, jarak rata-rata = (0,781+1,379)/2 = 1,08
Demikian seterusnya, Dendogram)
hingga
terbentuk
1
cluster
saja
(divisualisasikan
dalam
Cluster Membership Case 3 Clusters 1:SUMATERA UTARA 1 2:SUMATERA BARAT 1 3:RIAU 1 4:JAMBI 1 5:SUMATERA SELATAN 1 6:BENGKULU 1 7:LAMPUNG 1 8:DKI JAKARTA 2 9:JAWA BARAT 1 10:JAWA TENGAH 1 11:DI YOGYAKARTA 1 12:JAWA TIMUR 1 13:BALI 1 14:NTB 1 15:NTT 1 16:KALIMANTAN BARAT 1 17:KALIMANTAN TIMUR 1 18:KALIMANTAN 1 SELATAN 19:KALIMANTAN TENGAH 1 20:SULUT 1 21:SUL TENGAH 1 22:SULSEL 1 23:SULTENG 1 24:IRIAN JAYA 3 2 Clusters 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2
Jawaban : a. Jika terbentuk 1. Cluster 1 2. Cluster 2 b. Jika terbentuk 1. Cluster 1 2. Cluster 2 3. Cluster 3
2 cluster : 23 Provinsi di Irian Jaya : Irian Jaya 3 cluster : 22 Provinsi di luar DKI Jakarta dan Irian Jaya : DKI Jakarta : Irian Jaya
V e rt ic a l Ic ic le C ase
3:RIAU
14:NTB
13:BALI
15:NTT
22:SULSEL
20:SULUT
23:SULTENG
7:LAMPUNG
24:IRIAN JAYA
8:DKI JAKARTA
21:SUL TENGAH
9:JAWA BARAT
12:JAWA TIMUR
11:DI YOGYAKARTA
10:JAWA TENGAH
6:BENGKULU
4:JAMBI X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
17:KALIMANTAN TIMUR
5:SUMATERA SELATAN
19:KALIMANTAN TENGAH
N 1 2 3 4 5 6 7 8 9 1 1 1 1 1 1 1 1 1 1 2 2 2 2
u m b e r o f c lu s t e r s X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X 0 X X X X X X 1 X X X X X X 2 X X X X X X 3 X X X X X X 4 X X X X X X 5 X X X X X X 6 X X X X X X 7 X X X X X X 8 X X X X X 9 X X X X X 0 X X X X X 1 X X X X X 2 X X X X X 3 X X X X X
X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X
18:KALIMANTAN SELATAN
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X
16:KALIMANTAN BARAT
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X
1:SUMATERA UTARA X X X X X X X X X X X X X X X X X X X X X X X
2:SUMATERA BARAT
Jawaban c. Analisis Dendogram Proses Aggloomerasi dimulai pada skala 0, dengan ketentuan jika sebuah garis dekat dengan angka 0, maka variable-variabel yang terwakili dengan garis tersebut semakin mungkin membentuk cluster 1. 3 dan 19; 11 dan 13; 10, 12, dan 18; 4 dan 6; membentuk clusternya masingmasing, sehingga terbentuk 4 cluster pada proses pertama, dan yang lainnya berdiri sendiri 2. Cluster yang terbentuk : Cluster 3 dan 19 bergabung dengan var 2, 20 membentuk 1 cluster 21 dan 22 Cluster 11 & 13 bergabung dengan cluster 10, 12, & 18 Cluster 4 & 6 bergabung dengan var 1, 7
5 dan 17 3. Cluster yang terbentuk pada proses 3 : Cluster 3, 19, 20, 2 bergabung dengan var 9 Cluster 21,22 bergabung dengan var 23 Cluser 11, 13, 10, 12, 18 bergabung dengan var 14 Cluster 4, 6, 1, 7 bergabung dengan var 16 Begitu seterusnya hingga terbentuk 1 cluster, yang merupakan gabungan dari cluster sebelumnya dan variable 24 - Irian Jaya Soal no. 3Produksi Perikanan Laut Yang Dijual Di TPI (Tempat Penjualan Ikan) Menurut Provinsi, 2005-2009 (Ton)
Provinsi
2005
2006
2007
2008
2009
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Nanggroe Aceh Sumatera Utara Sumatera Barat Riau Lampung DKI Jakarta Jawa Barat Jawa Tengah DI. Yogyakarta Jawa Timur Banten Bali NTB NTT Kalimantan Barat Kalimantan Sel Kalimantan Timur Sulawesi Utara Sulawesi Tengah Sulawesi Selatan Sulawesi Tenggara
1 841 3 082 335 163 3 259 26 553 23 150 152 352 623 60 058 7 689 15 828 4 300 1 460 6 320 8 510 8 251 149 1 053 26 803 2 363
4 042 93 5 063 118 6 599 24 881 48 958 146 284 629 41 259 11 197 8 108 4 610 2 072 6 636 6 579 6 464 2 073 469 23 209 2 760
4 676 1 214 8 650 90 3 070 35 348 54 092 163 856 1 851 58 799 7 490 20 206 5 019 4 053 10 230 14 850 11 141 1 983 842 29 779 6 837
5 629 1 841 27 813 261 4 507 39 820 54 906 159 307 1 171 92 489 8 071 18 821 6 633 4 053 10 869 15 528 10 060 2 123 11 252 33 166 3 764
5 978 63 004 4 047 440 4 733 30 362 34 935 158 961 1 492 104 634 6 509 34 706 7 678 4 280 9 931 17 931 8 465 2 384 1 176 35 612 2 428
22
Gorontalo
1 604
3 828
9 413
5 082
4 186
Sumber : http://www.bps.go.id/tab_sub/view.php?tabel=1&daftar=1&id_subyek=56¬ab=3
Analisis : QCL_1 menunjukkan provinsi masuk ke cluster mana QCL_2 menunjukkan jaraknya Jadi, dari QCL_1, yang termasuk : Cluster 1 : 19 Provinsi selain Jawa Tengah, Jawa Barat, dan Jawa Timur Cluster 2 : Jawa Tengah Cluster 3 : Jawa Barat dan Jawa Timur
DescriptivesDescriptive Statistics N duaribu_lima duaribu_enam duaribu_tujuh 22 22 22 Minimum 149 93 90 Maximum 152352 146284 163856 Mean 16170,27 16178,68 20613,14 Std. Deviation 33501,246 31889,626 36007,144
duaribu_delapan duaribu_sembilan Valid N (listwise)
22 22 22
261 440
159307 158961
23507,55 24721,45
37427,815 39081,694
Analisis : Tabel ini merupakan table Deskriptif Statistik, yang mendeskriptifkan data-data (minimum, maximum, mean-rataan, standar deviasi) dalam table
Quick ClusterInitial Cluster Centers Cluster Zscore(duaribu_lima) Zscore(duaribu_enam) Zscore(duaribu_tujuh) Zscore(duaribu_delapan) Zscore(duaribu_sembilan) 1 -,47781 -,50363 -,56997 -,62110 -,62130 2 4,06497 4,07986 3,97818 3,62830 3,43484 3 1,31003 ,78647 1,06051 1,84305 2,04476
Output ini adalah tampilan pertama (initial) proses clustering data sebelum dilakukan iterasi. Tapi, output ini tidak dianalisis, karena yang akan dianalisis adalah hasil akhir cluster dari proses clustering sesudah iterasiIteration History(a) Change in Cluster Centers 2 3 ,568 ,000 1,170 ,000 ,000 ,000 a Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is , 000. The current iteration is 2. The minimum distance between initial centers is 4,550. Iteration 1 2 1
Output ini menyatakan telah terjadi 2 kali proses iterasi, hingga menghasilkan Hasil Akhir Cluster (Final Cluster Centers), di bawah ini :Final Cluster Centers Cluster Zscore(duaribu_lima) Zscore(duaribu_enam) Zscore(duaribu_tujuh) Zscore(duaribu_delapan) Zscore(duaribu_sembilan) 1 -,29386 -,31022 -,31413 -,33212 -,30215 2 4,06497 4,07986 3,97818 3,62830 3,43484 3 ,75919 ,90719 ,99515 1,34098 1,15305
Output ini adalah akhir dari proses clustering, dengan analisis : Angka di atas terkait dengan proses standardisasi data sebelumnya, yang mengacu pada angka z, dengan ketentuan berikut : a. Angka negative berarti data di bawah rata-rata total b. Angka positif berarti data di atas rata-rata total Hal itu berarti, data-data di atas berada di atas rata-rata total
Mis, angka 4,06497 pada variable Zduaribu_lima (2005) menyatakan rata-rata penjualan ikan pada tahun 2005 responden pada cluster 2, yaitu : X = + z. Dimana : X = Rata-rata sampel (dalam hal ini rata-rata variable pada cluster tertentu) = Rata-rata populasi z = Nilai standardisasi yang didapat pada SPSS = Standar deviasi Contoh Perhitungannya : a. Rata-Rata Assets cluster 1 = 16170,27 + (-0,29 x 33501,25) = 6454.91 b. Rata-Rata Assets cluster 2 = 16170,27 + (4,07 x 33501,25) = 152520,36 c. Rata-Rata Assets cluster 3 = 16170,27 + (0,76 x 33501,25) = 41631,22 Setelah terbentuk 3 cluster, langkah selanjutnya adalah melihat apakah variable-variabel yang terbentuk mempunyai perbedaan tiap cluster, melalui pengujian output ANOVAANOVA Cluster Zscore(duaribu_lima) Zscore(duaribu_enam) Zscore(duaribu_tujuh) Zscore(duaribu_delapan) Zscore(duaribu_sembilan) Mean Square 9,659 10,060 9,841 9,428 8,096 df 2 2 2 2 2 Error Mean Square ,089 ,046 ,069 ,113 ,253 Df 19 19 19 19 19 F 109,072 217,149 141,799 83,585 31,992 Sig. ,000 ,000 ,000 ,000 ,000
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.
Analisis : Kolom cluster menunjukkan besaran between cluster mean, sedangkan kolom Error menunjukkan besaran within cluster mean, sehingga kolom F : F = Cluster Error Contoh : Angka F (pada Zduaribu_enam) = 10,060/0,046 = 218,7 sebanding dengan 217,149 (perbedaan angka mungkin karena pembulatan) Pada prinsipnya, semakin besar angka F suatu variable dan angka signifikannya di bawah 0,05, maka semakin besar pula perbedaan variable tersebut pada ketiga cluster yang terbentuk. Sebagai contoh : Pada variable duaribu_enam, angka F = 217,149 dengan angka sig. 0,000 yang berarti signifikansi adalah nyata, atau dengan kata lain, factor Close sangat membedakan karakteristik ketiga cluster Sekarang kita bandingkan, angka F variable Zduaribu_sembilan (31,992) lebih kecil dari angka F variable Zduaribu_enam (217,149), hal itu berarti perbedaan pada tahun duaribu_sembilan jauh lebih kecil dari perbedaan pada tahun duaribu_enam antar responden pada ketiga cluster
Number of Cases in each Cluster Cluster 1 2 3 Valid Missing 19,000 1,000 2,000 22,000 ,000
Analisis : Dari table di atas didapat : 1. Responden yang masuk ke cluster 1 sebanyak 19 responden 2. Responden yang masuk ke cluster 2 sebanyak 1 responden 3. Responden yang masuk ke cluster 3 sebanyak 2 responden Tidak ada variable yang hilang (missing), karena semua