ANALISIS CLUSTER -...

Post on 13-Nov-2020

13 views 0 download

Transcript of ANALISIS CLUSTER -...

ANALISIS CLUSTER

Cluster adalah kelompok obyek yang memiliki kesamaan karakteristikContoh Cluster

• Kelas di Sekolah

• Jurusan di Sekolah

• Blok di Rumah Sakit

• Los di Pasar

Pengertian CLUSTERING

Proses pengelompokkan sejumlah obyek berdasarkan informasi yang diperoleh dari data yang menjelaskan hubungan antar obyek dengan prinsip untuk memaksimalkan kesamaan antar anggota satu cluster dan meminimumkan kesamaan antar cluster.

CLUSTER IDENTIK DENGAN PARTISIS

A

DB

A U B U C U D = S A ∩ B ∩ C ∩ D = ФD = Outlayer (pencilan)

Tujuan Clustering

Manfaat Clustering

Tujuan utama dari clustering adalah mengelompokkan

obyek-obyek berdasarkan

karakteristik yang dimiliki masing-masing obyek

(Candiasa, 2011:77).

Untuk mengidentifikasi

obyek-obyek (Recognition), untuk mendukung sistem

pendukung keputusan dan data

mining.

Macam-Macam Metode CLUSTERING

1) Berbasis Metode Statistika) Metode Hirarkib) Metode Non-Hirarki

2) Berbasis Logika Fuzzy

a)Metode Fuzzy C-Means

b)Metode Fuzzy Subtractive Clustering.

3)Berbasis Neural Network

4) Berbasis Optimasi Centroid atau Lebar Cluster

Metode Genetik Algoritma (GA).

Analisis Cluster Berbasis Metode StatistikAsumsi yang Harus Dipenuhi

Representatif

• Sampel yang diambil benar-benar bisa mewakili populasi yang ada.

Multikolinearitas• Kemungkinan adanya korelasi

antar objek.

Proses Analisis Cluster

Memilih Ukuran Jarak

Melakukan Proses Standarisasi Data Jika

Diperlukan

Memilih Prosedur Pengclusteran

Melakukan Interpretasi Terhadap

Cluster yang Terbentuk

Melakukan Validasi dan Profiling Cluster

a. Jarak Euclid• Jarak berupa akar jumlah kuadrat

perbedaan nilai untuk tiap variabel.

1. Memilih Ukuran Jarak

1. Memilih Ukuran Jarak

1. Memilih Ukuran Jarak

1. Memilih Ukuran Jarak

Jika data memangmenpunyaisatuan yang berbedasecarasignifikan, makaharusdilakukan proses standarisasidata denganmengubah data keskor standar, seperti skor-, skor-T, atau skor S.

T=50+10Z

•  

2. Melakukan Proses Standarisasi Data (Jika Diperlukan)

3. Memilih Prosedur Pengclusteran

4. Melakukan Interpretasi Terhadap Cluster yang Terbentuk

Melakukan interpretasi terhadap cluster yang telah

terbentuk, yang pada intinya memberi nama spesifik

untuk menggambarkan isi cluster tersebut.

5. Melakukan Validasi dan Profiling Cluster

Menjelaskan karakteristik setiap cluster berdasar

profil tertentu. Dari data profiling tersebut bisa

dilakukan analisis lanjutan seperti analisis

diskriminan.

Metode K-Means Clustering

Pengertian K-Means Clustering

K-Means merupakan salah satu metode clustering non-hirarki yang berusaha untuk mempartisi obyek yang ada ke dalam bentuk satu atau lebih cluster.

Metode ini mempartisi obyek berdasarkan karakteristiknya.

Obyek yang mempunyai karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan obyek yang mempunyai karakteristik yang berbeda dikelompokkan ke dalam cluster yang lain.

Tujuan Pengelompokkan

Meminimalkan variasi dalam satu cluster dan memaksimalkan variasi antar cluster.

Penerapan Algoritma K-Means Clustering

Langkah – Langkah K-Means Clustering

1Tentukan jumlah cluster (k) yang ingin dibentuk. 2

Tetapkan k pusat cluster awal secara random.

3Alokasikan semua

data/obyek ke dalam cluster terdekat

4Tentukan kembali titik pusat cluster yang baru berdasarkan rata-rata

5Lakukan kembali langkah 3 hingga titik pusat dari

setiap cluster tidak berubah

(1). Tentukan jumlah cluster (k) yang dibentuk.Dalam kasus ini data yang ada akan dikelompokkan menjadi tiga cluster:

Baik

Sedang

Kurang

(2) Tetapkan k pusat cluster awal secara random

(3). Alokasikan semua data/obyek ke dalam cluster terdekat

(4) Tentukan kembali titik pusat cluster yang baru berdasarkan rata-rata

(5). Lakukan kembali langkah 3 hingga titik pusat dari setiap cluster tidak berubah

ketiga pusat cluster dikelompokkan menjadi 3 dengan karakteristik sebagai berikut:

• Kelompok pertama (cluster ke-1) : berisi siswa-siswa yang memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis sekitar 69,7, dan rata-rata nilai ulangan harian sekitar 58,3. • Kelompok kedua (cluster ke-2) : berisi siswa-siswa yang

memiliki ratarata nilai tugas sekitar 66,6, rata-rata nilai kuis sekitar 68,5, dan rata-rata nilai ulangan harian sekitar 82,9. • Kelompok ketiga (cluster ke-3) : berisi siswa-siswa yang

memiliki ratarata nilai tugas sekitar 78,3, rata-rata nilai kuis sekitar 72,9, dan rata-rata nilai ulangan harian sekitar 82,4

Dari langkah – langkah tersebut dapat disimpulkan bahwa• Kelompok pertama (Cluster ke-1), terdiri dari 12 orang siswa, yakni siswa

dengan nomor urut 2, 13, 14, 19, 21, 30, 31, 32, 33, 36, 38 dan 39. Pada cluster ke-1 ini siswa tergolong memiliki kemampuan matematika rendah. Berdasarkan hal tersebut siswa pada cluster ini diberikan remedi. • Kelompok kedua (Cluster ke-2), terdiri dari 9 orang siswa, yakni siswa

dengan nomor urut 1, 6, 10, 15, 22, 26, 29, 34 dan 35. Pada cluster ke-2 ini siswa tergolong memiliki kemampuan matematika sedang. Berdasarkan hal tersebut siswa pada cluster ini diberikan remedi. • Kelompok ketiga (Cluster ke-3), terdiri dari 19 orang siswa, yakni siswa

dengan nomor urut 3, 4, 5, 7, 8, 9, 11, 12, 16, 17, 18, 20, 23, 24, 25, 27, 28, 37 dan 40. Pada cluster ke-3 ini siswa tergolong memiliki kemampuan matematika tinggi. Karena hal tersebut siswa pada cluster ini tidak diberikan remedi, tetapi siswa pada cluster ini diberikan pengayaan.