Tugas Data Mining

download Tugas Data Mining

of 2

Transcript of Tugas Data Mining

TUGAS MATA KULIAH DATA MINING

HOSNOL HIDAYAT (2008420113)

TEKNIK INFORMATIKA UNIVERSITAS DR. SOETOMO SURABAYA 2012

KLASTERISASI DATA KATEGORIKAL MENGGUNAKAN ALGORITMA K-MODES Data kategorikal adalah data yang menggambarkan objek yang hanya mempunyai atribut kategorikal. Objek, yang disebut dengan objek kategorikal, adalah versi penyederhanaan dari objek simbolis. Jadi data kategorikal bisa kita artikan sebagai data yang bukan numerik atau data yang tidak bisa dikenai proses matematis Klasterisasi adalah suatu metode yang mengelompokkan sejumlah besar data menjadi suatu bagian-bagian kecil data yang mempunyai kemiripan letak, sifat, ciri, atau filter lain yang telah ditentukan. Dalam mengelompokkan suatu data menjadi suatu bagian-bagian kecil diperlukan suatu centroid of a group of data sets atau sebuah titik yang akan dijadikan nilai parameter utama dari keseluruhan titik data yang terdapat pada kelompok. Tipe-tipe algoritma klasterisasi dapat dikelompokkan menjadi dua kategori besar yaitu : Hierarchical methods (misal : Minimal Spanning Tree Method) dan Nonhierarchical methods (misal : K-means Algorithm dan Kmodes Algorithm). Algoritma K-Modes melakukan 2 (dua) modifikasi utama terhadap algoritma KMeans, yaitu : cara pengukuran jarak (ketidakcocokan) dan cara menentukan titik pusat. Inti dari algoritma K-Modes adalah sebagai berikut : 1. Tentukan jumlah klaster yang akan dibentuk (k). 2. Bangkitkan initial centroids (titik pusat) secara acak dari data ya tersedia dimana banyaknya sesuai dengan jumlah klaster yang dibentuk (satu titik pusat untuk tiap klaster). 3. Hitung jarak masing-masing data terhadap semua titik pusat klaster. Tempatkan data yang memiliki jarak terdekat pada klaster dimana titik pusat tersebut berada. 4. Perbaiki posisi titik pusat pada masing-masing klaster. 5. Jika posisi titik pusat yang baru sama dengan posisi titik pusat yang lama, maka proses klasterisasi selesai. Jika tidak ulangi terus dari langkah ketiga dan keempat.

Sumber: http://jurnal.umk.ac.id/jurnal/2009/Sains%20Desember%202009/KLASTERISASI%20 DATA%20KATEGORIKAL.pdf