Analisis Cluster

25
ANALISIS GEROMBOL (Cluster Analysis) Novi Hidayat P

description

Analisis Cluster

Transcript of Analisis Cluster

Page 1: Analisis Cluster

ANALISIS GEROMBOL(Cluster Analysis)

Novi Hidayat P

Page 2: Analisis Cluster

CLUSTER ANALYSISCluster Analysis adalah suatu teknik  analisis multivariate metode interdependen, dengan tujuan meringkas data dengan penggerombolan obyek (responden) sehingga terbentuk beberapa kelompok, disebut cluster. Obyek di dalam suatu cluster lebih mirip dibandingkan antar cluster. Kemiripan ini sudah didasarkan pada sekumpulan variabel secara simultan.

KEGUNAAN identifikasi banyaknya cluster dari sekumpulan obyek identifikasi karakteristik setiap cluster prediksi jumlah anggota masing-masing subpopulasi berdasarkan perhitungan anggota setiap cluster yang diperoleh dari data sampel

BASIS KLASTERING DAN INPUT Pengelompokka dibuat berbasis pada kesamaan (similiarities) atau jaraknya (disimiliarities) Input yang diperlukan berupa ukuran kesamaan atau data dimana kesamaan dapat dihitung

Page 3: Analisis Cluster

CLUSTER ANALYSIS Analisis Cluster dalam beberapa bidang keilmuan

Dalam analisis Pemasaran, Cluster analysis dapat digunakan untuk (a) mengetahui segmentasi dan menentukan target pasar yang dituju; (b) mengetahui positioning produk dan menentukan pengembangan produk baru; (c) Memilih pasar yang akan dipilih untuk produk baru perusahaan.

Dalam analisis penelitian pendidikan, data untuk clustering dapat berupa data siswa, orang tua, jenis kelamin atau nilai ujian. Clustering merupakan metode penting untuk memahami dan utilitas dari cluster dalam penelitian pendidikan, msialnya untuk pengelompokkan siswa ataupun sekolah.

Page 4: Analisis Cluster

CLUSTER ANALYSISUkuran ketakmiripan

Ukuran jarak yang sering digunakan adalah jarak euclidean (d)  dengan mengukur proximity pada ruang dua dimensi sehingga jarak antara dua observasi menunjukkan kesamaan. Secara Umum Jarak euclid antara 2 amatan dengan p variabel dinyatakan sebagai

p

kkjki XXdij

1

2)(

Ukuran Mikowski dan Mahalanobismp

k

m

jkik XXdij/1

1

j

tj Sdij XXXX ii 1

Page 5: Analisis Cluster

CLUSTER ANALYSISUkuran kemiripan

Sifat-sfat ukuran ketakmiripan:

•d(uv)≥ 0

•d(uu)= 0

•d(uv)= d(vu)

•d(uv) akan meningkat nilainya dengan semakin tak miripnya gerombol u dan v

Nilai jarak tersebut akan disajikan dalam matriks jarak yang disebut dengan matriks proksimitas/proximity

(2) Asumsi Analisis Gerombol Data antar pengamatan (case) independen Sampel diambil secara random Antar variabel tidak saling bebas (berkorelasi) Data untuk seluruh variabel minimal memiliki skala interval (terutama bila ukuran kemiripan yang digunakan adalah jarak)

Page 6: Analisis Cluster

CLUSTER ANALYSISMetode analisis :

1) Hirarki (berjenjang) : - Terstruktur- Dapat ditelusuri penggerombolan suatu objek dengan objek lainnya- Stabil- Banyak kelompok belum diketahui- Output berupa dendogram- pemotongan : jarak lompatan terjauh

2) Tidak Berhirarki :- Tidak terstruktur- Banyak kelompok ditentukan terlebih dahulu (diketahui)- Menggunakan Iterasi- Kurang Stabil- Output : anggota kelompok dan centroid

Page 7: Analisis Cluster

CLUSTER ANALYSISMetode yang sering digunakan untuk pengelompokan obyek pada Hierarchical clustering adalah Metode penggumpalan (agglomeratif)

Setiap obyek dianggap sebagai suatu gerombol/cluster, kemudian dikelompokkan dengan obyek yang memeiliki jarak terdekatMetode pembagian (divisive)

Bekerja dengan membagi 2 berdasarkan jumlah objek, dipisahkan dengan dicari obyek yang mempunyai jarak terjauh

Page 8: Analisis Cluster

CLUSTER ANALYSISHirarki (berjenjang)

Metode yang sering digunakan untuk pengelompokan obyek pada Hierarchical clustering adalah metode penggumpalan (agglomeratif)

Terdapat 7 metode pengelompokkan Agglomerative yang sering dipergunakan untuk perhitungan jarak antar cluster dengan obyek atau dengan cluster lain di dalam penggerombolan berjenjang, yaitu single lingkage (pautan tunggal), complete linkage (pautan lengkap, avarage linkage (pautan rata-rata), centroid, median, minimum variance, ward

Page 9: Analisis Cluster

CLUSTER ANALYSISHirarki (berjenjang)

Untuk teknik pengelompokkan dengan metode Divisive ada 2

metode yang sering digunakan yaitu :

•A splinter- Average Distance Method

•Automatic Interaction Detection

Page 10: Analisis Cluster

CLUSTER ANALYSISHirarki (berjenjang)

Output : berupa dendogram

Z

K

Page 11: Analisis Cluster

CLUSTER ANALYSISHirarki (berjenjang)

Latihan:Diketahui data variabel pendidikan dan pendapatan untuk 6 amatan adalah sebagai berikut:Nilai Pendapatan: 5,6,15,16,25,30Nilai Pendidikan: 5,6,14,15,20,19

Dengan menggunakan metode Pautan tunggal

Page 12: Analisis Cluster

CLUSTER ANALYSISHasilPendapatan Pendidikan Kelompok

5 5 16 6 115 14 216 15 225 20 230 19 2

Page 13: Analisis Cluster

CLUSTER ANALYSISAPLIKASISuatu penelitian dilakukan dengan cara survey, bertujuan ingin mengetahui peta karakteristik anak jalanan. Bilamana mapping ini dapat dilakukan, diharapkan dapat dikembangkan model pembinaan yang efektif.

Variabel yang diamati adalah pendidikan, alasan dan keinginan selengkapnya dapat dilihat pada Materi Bahasan Analisis Faktor.

Analisis dilakukan dengan program SPSS

Page 14: Analisis Cluster

Data ini akan digunakan untuk membuat pemetaan karakteristik anak jalanan dengan analisis cluster.

Dat Pendididkan Alasan Menjadi Anak Jalanan dan Keinginan Anak Jalanan

Page 15: Analisis Cluster

CLUSTER ANALYSISHASIL ANALISIS

Koefisien agglomerasi menghasilkan lompatan (selisih) terbesar dari stage 98 ke 99, yaitu dari 8.814 ke 12.466. Dengan demikian dapAt diketahui bahwa dari 100 anak jalanan tersebut membentuk 2 cluster.

Page 16: Analisis Cluster

CLUSTER ANALYSISHASIL ANALISIS

Penempatan setiap obyek (case) ke dalam cluster dapat dilihat pada tabel di bawah ini.

Page 17: Analisis Cluster

CLUSTER ANALYSISHASIL ANALISIS

Anak jalanan yang berjumlah 100 orang membentuk dua cluster dan untuk melakukan identifikasi karakteristik setiap cluster dilakukan analisis diskriptif.

Karakteristik cluster 1 adalah pendidikan orang tua cukup tinggi akan tetapi pendidikan anak tidak terurus, mereka menjadi anak jalanan bukan karena keadaan (ekonomi) dan sebenarnya mereka tidak ingin menjadi anak jalanan. Tampaknya anak jalanan di dalam kelompok ini lebih disebabkan karena sangat kurangnya perhatian orang tua.

Page 18: Analisis Cluster

CLUSTER ANALYSISHASIL ANALISIS

Karakteristik cluster 2 adalah pendidikan orang tua rendah, untuk bisa bertahan hidup mereka harus menjadi anak jalanan sehingga ada keinginan yang tinggi untuk menjadi anak jalanan. Pada cluster ini, tampaknya mereka menjadi anak jalanan dilatarbelakangi kondisi ekonomi keluarga.

Pembinaan anak jalanan pada cluster 1 seharusnya berbeda dengan pada cluster 2. Dengan kata lain, dari hasil pemetaan (mapping) ini selanjutnya dapat dirancang model dan program pembinaan anak jalanan yang efektif.

Page 19: Analisis Cluster

CLUSTER ANALYSISTidak Hirarki (tidak berjenjang)

Pada analisis gerombol tidak berjenjang jumlah cluster harus ditetapkan terlebih dahulu sebelum kita melakukan analisis data. Dengan kata lain, non hierarchical clustering digunakan bilamana jumlah gerombol dapat ditentukan sebelum analisis dilakukan.

Penentuan jumlah cluster dapat didasarkan pada rurjukan teoritis, kondisional, common sense, dan atau tujuan penelitian.

Metode yang banyak digunakan adalah Metode K-rataan (K - mean Method).

Page 20: Analisis Cluster

CLUSTER ANALYSISAPLIKASISuatu penelitian dilakukan dengan tujuan untuk mengetahui karakteristik karyawan. Bilamana terdapat beberapa kelompok karaktersitik, maka pada setiap kelompok ingin diketahui faktor apa yang dominan berpengaruh terhadap kinerjanya (perform). Variabel yang diamati adalah loyalitas, motivasi, kepuasan dan kinerja.

Pengembangan model dan program pembinaan karyawan guna meningkatkan kinerjanya ditetapkan hanya 2 macam. Oleh karena itu, karyawan akan dikelompokkan menjadi 2, selanjutnya akan diidentifikasi karakteristik dari dari setiap kelompok. Informasi ini akan digunakan sebagai bahan pengembangan model dan program pembinaan karyawan.

Mengingat jumlah cluster (kelompok) sudah ditetapkan terlebih dahulu, maka analisis untuk penggerombolan yang paling tepat adalah analisis gerombol tidak berjenjang. Hasil analisis data, menggunakan SPSS, disajikan sebagai berikut.

Page 21: Analisis Cluster

CLUSTER ANALYSISHASIL ANALISIS

Kelompok (cluster) 1 beranggotakan 49 orang karyawan, dengan center (mean) untuk semua variabel positif. Dengan demikian, pada kelompok ini upaya pembinaan diarahkan untuk lebih meningkatkan kinerja.

Page 22: Analisis Cluster

CLUSTER ANALYSISHASIL ANALISIS

Kelompok 2 beranggotakan 46 orang karyawan, dengan center semuanya negatif. Sehingga pada kelompok ini diperlukan upaya pembinaan yang tujuannya adalah perbaikan berbagai aspek perilaku karyawan.

Kemudian pada kelompok 2 ini akan diidentifikasi faktor apa yang dominan berpengaruh terhadap kinerja (perform)

Page 23: Analisis Cluster

CLUSTER ANALYSISUKURAN EVALUASI KLUSTER

1. Root Mean Square Standart Deviation (RMSSTD)

Tidak ada kriteria khusus, untuk pengelompokkan yang baik niali tsb harus kecil

2. R-Square (RS)

RS bernilai antara 0 dan 1, semakin esar nilai RS seamkin baik pengelompokkan yang dilakukan

*Dengan nilai SS diperoleh dari tabel One-way ANOVA niali amatan yang sudah dikelompokkan*

variabelsemua df pooled variabelsemua SS pooled

RMSSTD

SStotal

SSbetweenRS

Page 24: Analisis Cluster

CLUSTER ANALYSIS

7377,083,2028,498

3,1763,341

RS

Page 25: Analisis Cluster

TERIMA KASIH