Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar...

68
STUDI TENTANG SEMINAR HASIL TESIS STUDI TENTANG METODE C-MEANS CLUSTER DAN FUZZY C-MEANS CLUSTER SERTA APLIKASINYA PADA KASUS PENGELOMPOKKAN DESA/KELURAHAN BERDASARKAN STATUS KETERTINGGALAN BERDASARKAN STATUS KETERTINGGALAN SUKIM OLEH : PEMBIMBING : Dr. MUHAMMAD MASHURI, M.T. Dr. IRHAMAH, S.Si., M.Si. PROGRAM MAGISTER JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM 1 Senin, 24 Januari 2011 PROGRAM MAGISTER JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

Transcript of Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar...

Page 1: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

STUDI TENTANG

SEMINAR HASIL TESIS

STUDI TENTANGMETODE C-MEANS CLUSTER DAN FUZZY C-MEANS CLUSTER

SERTA APLIKASINYA PADA KASUS PENGELOMPOKKAN DESA/KELURAHAN BERDASARKAN STATUS KETERTINGGALANBERDASARKAN STATUS KETERTINGGALAN

SUKIMOLEH :

PEMBIMBING :Dr. MUHAMMAD MASHURI, M.T.

Dr. IRHAMAH, S.Si., M.Si., ,

PROGRAM MAGISTER JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

1Senin, 24 Januari 2011

PROGRAM MAGISTER JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

Page 2: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Pendahuluan

Clustering

Hierarchical Non Hierarchical

Single linkage

Complete linkage

Mixture resolving Mode seekingSquare error Graph

theoretic

C-Means Expectation Maximazation

Jain dkk., 1999

Page 3: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

C-Means Clustering

Definisi: pembentukan partisi dilakukansedemikian rupa sehingga setiap objeksedemikian rupa sehingga setiap objekberada tepat pada satu partisi.Kelebihan: sederhana mudahKelebihan: sederhana, mudahdiimplementasikan, memilikikemampuan untuk mengelompokkankemampuan untuk mengelompokkandata yang besar, dan Running timenyalinear O(NCT)linear O(NCT)

Page 4: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

C-Means Clustering (2)

Kelemahan:suatu saat secara alamitidak dapat dilakukan untuktidak dapat dilakukan untukmenempatkan objek tepat pada satupartisi, karena objek terletak di antarapartisi, karena objek terletak di antaradua atau lebih partisi yang lain.

Page 5: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Fuzzy C-Means Clustering

Definisi: pembentukan partisi dilakukansedemikian rupa sehingga setiap objeksedemikian rupa sehingga setiap objekberada pada partisi yang dibentukdengan pembobotan fuzzy.dengan pembobotan fuzzy.Kelebihan: sederhana, mudah diim-plementasikan memiliki kemampuanplementasikan, memiliki kemampuanuntuk mengelompokkan data yang besar lebih kokoh terhadap data outlierbesar, lebih kokoh terhadap data outlier

Page 6: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Fuzzy C-Means Clustering (2)

Kekurangan: Running timenya O(NC2T)

Page 7: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

PerkembangangC-Means Clustering

Metode CM Cluster pertama olehMacQueen (1967), pengembangan dariMacQueen (1967), pengembangan dariSteinhaus (1956). Penelitian terdahulu menggunakan CMPenelitian terdahulu menggunakan CM MacQueen (1967), Kumar dkk.,(2010)

Page 8: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

PerkembanganFuzzy C-Means Clustering

Metode FCM Cluster pertama kali olehDunn (1973), kemudian Bezdek (1981)Dunn (1973), kemudian Bezdek (1981)Penelitian terdahulu menggunakan FCM Bezdek (1981) Gath dan Geva (1989)Bezdek (1981), Gath dan Geva (1989), Huang, dkk. (1997), Bezdek (1984), Miyamoto dan Agusta (1995)Miyamoto dan Agusta (1995), McLachlan dan Peel (2000), Halkididkk (2010)dkk., (2010).

Page 9: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Perlunya Pengelompokkanwilayah (desa)

bahan perencanaan, dan evaluasisasaran program pemerintahsasaran program pemerintahprogram pemberdayaan desa tertinggaldi Indonesiadi Indonesia. Instruksi Presiden mengeni desatertinggaltertinggalDilaksanakan 1994 – 1997.

Page 10: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Penelitian Desa TertinggalPenelitian Desa Tertinggal(Pengelompokkan wilayah)

BPS (2005) pengelompokkan desa,Pravitasari (2008)—>pengelompokkanPravitasari (2008)—>pengelompokkankecamatan, Sarpono (2009) pengelompokkan desaSarpono (2009) pengelompokkan desa

Page 11: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Penelitian dengan CM dan FCM (Pengelompokkan wilayah)

CM pengelompokkan desa denganpartisi tegas,partisi tegas,

FCM pengelompokkan desa dengan

C1 C2

FCM pengelompokkan desa denganpartisi halus

C1 C2C1

Page 12: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Tujuan Penelitian

Mengkaji optimasi fungsi objektifmetode CM dan FCM.metode CM dan FCM.Membangun algoritma metode FCM dengan indeks validitasdengan indeks validitas.Mengelompokkan desa menurut status ketertinggalan di Kota Metro danketertinggalan di Kota Metro danKabupaten Lampung Timurmenggunakan metode CM dan FCMmenggunakan metode CM dan FCM.

Page 13: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Metode C-Means

Tahapan data clustering menggunakanmetode C-Means secara umum :metode C Means secara umum :1. Menentukan jumlah cluster2 Mengalokasikan data ke dalam cluster2. Mengalokasikan data ke dalam cluster

secara random3 Menghitung centroid/rata-rata dari data3. Menghitung centroid/rata rata dari data

yang ada di masing-masing cluster

Page 14: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Metode C-Means

4. Mengalokasikan masing-masing data kecentroid/rata-rata terdekat

5. Kembali ke Step 3, apabila masih adadata yang berpindah cluster atau apabilaperubahan nilai centroid, ada yang di atasnilai threshold yang ditentukan atauapabila perubahan nilai pada objectiveapabila perubahan nilai pada objective function yang digunakan di atas nilaithreshold yang ditentukanthreshold yang ditentukan

Page 15: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Distance Space Untuk Menghitung JarakDistance Space Untuk Menghitung JarakAntara Data dan Centroid

Beberapa distance space yang telahdiimplementasikan dalam menghitungdiimplementasikan dalam menghitungjarak (distance) antaradata dan centroid

L1 (Manhattan/City Block) distance spaceL1 (Manhattan/City Block) distance spaceL2 (Euclidean) distance spaceLp (Minkowski) distance spaceLp (Minkowski) distance space

Page 16: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Distance Space Untuk Menghitung JarakDistance Space Untuk Menghitung JarakAntara Data dan Centroid

Jarak antara dua titik x1 dan x2 padaManhattan/City Block distance spaceManhattan/City Block distance space dihitung dengan menggunakan rumussebagai berikut

1X

sebagai berikut

Page 17: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Distance Space Untuk Menghitung JarakDistance Space Untuk Menghitung JarakAntara Data dan Centroid

L2 (Euclidean) distance space, jarak antara dua titik dihitung menggunakanantara dua titik dihitung menggunakan rumus sebagai berikut

Page 18: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Distance Space Untuk Menghitung JarakDistance Space Untuk Menghitung JarakAntara Data dan Centroid

Lp (Minkowski) distance space yang merupakan generalisasi dari beberapamerupakan generalisasi dari beberapa distance space yang ada seperti L1 (Manhattan/City Block) dan L2(Manhattan/City Block) dan L2 (Euclidean)Tetapi secara umum distance spaceTetapi secara umum distance space yang sering digunakan adalah Manhattan dan EuclideanManhattan dan Euclidean

Page 19: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Distance Space Untuk Menghitung JarakDistance Space Untuk Menghitung JarakAntara Data dan Centroid

Euclidean sering digunakan karena penghitungan jarak dalam distance p g g jspace ini merupakan jarak terpendek yang bisa didapatkan antara dua titik

di hit k d kyang diperhitungkan, sedangkan Manhattan sering digunakan karena kemampuannya dalam mendeteksikemampuannya dalam mendeteksi keadaan khusus seperti keberadaaan outliers dengan lebih baikoutliers dengan lebih baik

Page 20: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Pengalokasian Ulang Data

Secara mendasar, ada dua cara pengalokasian data kembali ke dalam masing-masing cluster pada saatproses iterasi clusteringproses iterasi clustering.pengalokasian dengan cara tegas (hard), dimanadata item secara tegas dinyatakan sebagai anggotacluster yang satu dan tidak menjadi anggota clustercluster yang satu dan tidak menjadi anggota cluster lainnya, dandengan cara fuzzy, dimana masing-masing data item dib ik il i k ki k bi b b kdiberikan nilai kemungkinan untuk bisa bergabung kesetiap cluster yang ada.

Page 21: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Pengalokasian Ulang Data

Kedua cara pengalokasian tersebutdiakomodasikan pada dua metodediakomodasikan pada dua metode(Hard) C-Means dan Fuzzy C-Means

Page 22: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

(Hard) C-Means

Pengalokasian kembali data ke dalammasing-masing cluster dalam metodemasing masing cluster dalam metode(Hard) C-Means didasarkan padaperbandingan jarak antara data denganperbandingan jarak antara data dengancentroid setiap cluster yang adaData dialokasikan ulang secara tegas keData dialokasikan ulang secara tegas kecluster yang mempunyai centroidterdekat dengan data tersebutterdekat dengan data tersebut

Page 23: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

(Hard) C-Means

Pengalokasian ini dapat dirumuskansebagai berikutsebagai berikut  ( ){ }1, min ,k i

ik

d D x vu

⎧ =⎪= ⎨0,

ikd yang lainnya

⎨⎪⎩

di mana keanggotaan data ke-k ke dalam cluster ke-i, nilai centroid (rata-rata) cluster ke-i,

Page 24: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

CONTOH :

ObservasiVariabel

X1 X2

O1 5 5O2 6 6O3 15 14O4 16 15O5 25 20O6 30 19

digunakan ukuran ketakmiripan Jarak Euclid Kuadrat

Page 25: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

ObservasiVariabel

X1 X2

O 5 5O1 5 5O2 6 6O3 15 14O 16 15

JARAK

O4 16 15O5 25 20O6 30 19

Page 26: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

PROXIMITY MATRIX

ObservasiObservasi

O O O O O OO1 O2 O3 O4 O5 O6

O1 0 2 181 221 625 821

O2 0 145 181 557 745

O3 0 2 136 250

O4 0 106 212

O5 0 265

O6 0

Page 27: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

TEKNIK PENGELOMPOKKAN SENTROIDG O O S O

Langkah 1:

ObservasiObservasi

O1 O2 O3 O4 O5 O6Kelompok Pengelompokan

Variabel

X1 X2

O1 0 2 181 221 625 821

O2 0 145 181 557 745

O 0 2 136 250

1 O1,O2 5.5 5.5

2 O3 15 14O3 0 2 136 250

O4 0 106 212

O5 0 26

3 O4 16 15

4 O5 25 20

O6 05 O6 30 19

Page 28: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Langkah 2:

ObservasiObservasi

O1,O2 O3 O4 O5 O6 Kelompok PengelompokanVariabel

O1, O2 0 162.00 200.50 590.50 782.50

O3 0 2 135.96 250.00

Kelompok PengelompokanX1 X2

1 O1,O2 5.5 5.5

2 O3,O4 15.5 14.5O4 0 106.00 212.00

O5 0 26.00

O 0

3, 4

3 O5 25 20

4 O6 30 19

O6 0

Page 29: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Ob i

Langkah 3:

ObservasiObservasi

O1,O2 O3,O4 O5 O6

O O 0 181 00 590 50 782 50

Kelompok PengelompokanVariabel

X1 X2

O1,O2 0 181.00 590.50 782.50

O3,O4 0 120.50 230.50

O 0 26 00

1 O1,O2 5.5 5.5

2 O3,O4 15.5 14.5O5 0 26.00

O6 03 O5,O6 27.5 19.5

Page 30: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Langkah 4:

ObservasiObservasi

O1,O2 O3,O4 O5,O6

O O 0 181 00 680 00

Kelompok PengelompokanVariabel

X XO1,O2 0 181.00 680.00

O3,O4 0 169.00

O5,O6 0

X1 X2

1 O1,O2 5.5 5.5

2 (O O ) (O O ) 21 5 175, 6 2 (O3,O4),(O5,O6) 21.5 17

Ob iObservasi

ObservasiO1,O2 O3,O4,O5,O6

O1,O2 0 388.25

O O O O 0O3,O4,O5,O6 0

Page 31: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Dendogram TEKNIK PENGELOMPOKKAN SENTROID

Page 32: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Fuzzy C-Meansmengalokasikan kembali data ke dalammasing-masing cluster dengan memanfaatkanteori Fuzzy.mengeneralisasikan metode pengalokasianyang bersifat tegas (hard) seperti yang digunakan pada metode Hard C-Means

Page 33: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Fuzzy C-Means

Dalam metode Fuzzy C-Means dipergunakan variabel membershipdipergunakan variabel membership function, uik, yang merujuk padaseberapa besar kemungkinan suatuseberapa besar kemungkinan suatudata bisa menjadi anggota ke dalamsuatu clustersuatu cluster

Page 34: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Fuzzy C-Means

Pada Fuzzy C-Means yang diusulkanoleh Bezdek, diperkenalkan juga suatuoleh Bezdek, diperkenalkan juga suatuvariabel m yang merupakan weighting exponent dari membership functionexponent dari membership function

Page 35: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Fuzzy C-Means

Variabel ini dapat mengubah besaranpengaruh dari membership function,pengaruh dari membership function, uik, dalam proses clustering menggunakan metode Fuzzy C-Means.menggunakan metode Fuzzy C Means. m mempunyai wilayah nilai m>1

Page 36: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Fuzzy C-Means

Sampai sekarang ini tidak adaketentuan yang jelas berapa besar nilaiketentuan yang jelas berapa besar nilaim yang optimal dalam melakukanproses optimasi suatu permasalahanproses optimasi suatu permasalahanclustering. Nilai m yang umumnya digunakanNilai m yang umumnya digunakanadalah 2 (Zimmermann dlm Naik, 2004)

Page 37: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Fuzzy C-Means

Membership function untuk suatu data ke suatu cluster tertentu dihitungke suatu cluster tertentu dihitung menggunakan rumus sebagai berikut

Page 38: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Fuzzy C-MeansMembership function, uik , mempunyaiwilayah nilai 0≤ uik ≤1. Data item yang mempunyai tingkatkemungkinan yang lebih tinggi ke suatukelompok akan mempunyai nilai membership function ke kelompok tersebut yang mendekati angka 1 dan ke kelompok yangmendekati angka 1 dan ke kelompok yang lain mendekati angka 0.

Page 39: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Objective FunctionObjective function yang digunakankhususnya untuk Hard C-Means danyFuzzy C-Means ditentukan berdasarkanpada pendekatan yang digunakand l (i) Di t S U t kdalam (i) Distance Space UntukMenghitung Jarak Antara Data danCentroid (ii) Metode PengalokasianCentroid, (ii) Metode PengalokasianUlang Data ke Dalam Masing-MasingClusterCluster

Page 40: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Objective Function

Untuk metode (Hard) C-Means, objective function yang digunakanobjective function yang digunakanadalah sebagai berikut

di mana N = banyaknya data C banyaknya Cluster u adalahdi mana N = banyaknya data, C banyaknya Cluster, uik adalahkeanggotaan data ke-k ke dalam Cluster ke-i, i=1, 2,…,C ; k=1,2,…,N; uik bernilai 0 atau 1; vi adalah nilai centroid Cluster ke-i, i=1, 2, …C, D(xk,vi) adalah jarak antara data ke-k dengan centroid Cluster ke-i.k i

Page 41: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Objective Function

uik mempunyai nilai 0 atau 1. Apabilasuatu data merupakan anggota suatusuatu data merupakan anggota suatukelompok maka nilai uik =1 dansebaliknya.sebaliknya.

Page 42: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Objective Function

Untuk metode Fuzzy C-Means, objective function yang digunakan adalah sebagaifunction yang digunakan adalah sebagaiberikut

Page 43: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Algoritma (Hard) C-Means1. Menentukan jumlah cluster2. Mengalokasikan data sesuai dengan jumlah cluster

yang ditentukanyang ditentukan3. Menghitung nilai centroid masing-masing cluster4. Mengalokasikan masing-masing data ke centroid

terdekatterdekat5. Kembali ke Step 3. apabila masih terdapat

perpindahan data dari satu cluster ke cluster yang lain, atau apabila perubahan pada nilai centroidmasih di atas nilai threshold yang ditentukan, atauapabila perubahan pada nilai objective function masih di atas nilai threshold yang ditentukan.

Page 44: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Algoritma (Hard) C-Means

Untuk menghitung centroid cluster ke-i, vi digunakan rumus sebagai berikut:vi digunakan rumus sebagai berikut:

Page 45: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Fuzzy C-Means1. Menentukan jumlah cluster2. Mengalokasikan data sesuai dengan jumlah cluster

yang ditentukanyang ditentukan3. Menghitung nilai centroid dari masing-masing cluster4. Menghitung nilai membership function masing-

masing data ke masing-masing clustermasing data ke masing masing cluster5. Kembali ke Step 3. apabila perubahan nilai

membership function masih di atas nilai threshold yang ditentukan, atau apabila perubahan pada nilaiyang ditentukan, atau apabila perubahan pada nilaicentroid masih di atas nilai threshold yang ditentukan, atau apabila perubahan pada nilaiobjective function masih di atas nilai threshold yang di kditentukan.

Page 46: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Fuzzy C-Means

Untuk menghitung centroid cluster ke-i, vi, digunakan rumus sebagai berikut:vi, digunakan rumus sebagai berikut:

Page 47: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Algoritma C-Means 

Page 48: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Running time C-Means

Banyak ClusterWaktu CM (detik)

Metro LampungTimurTimur

2 0.037420 0.0487453 0.029578 0.0348174 0 026115 0 0472184 0.026115 0.0472185 0.027023 0.0612266 0.040287 0.0746047 0.040635 0.0664798 0.028714 0.0746939 0.041965 0.077199

10 0.098525 0.089858

Page 49: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Algoritma FCM

Page 50: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Optimasi Fungsi Objektif FCM

Sedangkan mencari nilai optimum vidilakukan penurunan sebagai berikut:dilakukan penurunan sebagai berikut:

( , , ) 0i

J X U Vv

∂=

∂2( , ) 1

C N N Cm

ik k i k iku D x v uβ⎧ ⎫⎛ ⎞

∂ + −⎨ ⎬⎜ ⎟⎝ ⎠⎩ ⎭

∑∑ ∑ ∑

2 2

1 1 1

( ) 2 ( ) ( ) 0N N N

m m mik k ik k i ik i

k k ki

u x u x v u vv = = =

∂ ⎡ ⎤− + =⎢ ⎥∂ ⎣ ⎦

∑ ∑ ∑

N N1 1 1 1 0i k k i

iv= = = =⎝ ⎠⎩ ⎭ =

2

1 1 1 11

0

C N N Cm

ik k i k iki k k i

u x v uβ= = = =

⎧ ⎫⎛ ⎞∂ − + −⎨ ⎬⎜ ⎟

⎝ ⎠⎩ ⎭ =∂

∑∑ ∑ ∑

1 12 ( ) 2 ( ) 0m

k ik ik k

x u v= =

− + =∑ ∑

1

2 ( ) 0N

mik k i

ku x v

=

⎡ ⎤− − =⎢ ⎥

⎣ ⎦∑

iv∂2

1 0

Nmik k i

k

i

u x v

v=

∂ −=

( ) ( )N

Tm ⎡ ⎤∂∑

1 1( ) ( )

N Nm

k ik ik k

x u v= =

=∑ ∑

1

Nmik k

ki N

u xv ==

∑( ) ( )

1 0

Tmik k i k i

k

i

u x v x v

v=

⎡ ⎤∂ − −⎣ ⎦=

∑1

i Nmik

ku

=∑

Page 51: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Running time FCMBanyak Cluster Waktu CM (detik)

Banyak ClusterWaktu (detik)

Metro Lampung TimurMetro Lampung Timur2 0.406585 0.6363833 0.248894 1.0899454 0.258251 2.9734745 0.269117 4.5509756 0.339287 4.5554407 0.310426 4.2237848 0.474275 5.4170689 0.361569 4.888947

Page 52: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Running time CM dan FCM dataRunning time CM dan FCM data Kota Metro

Page 53: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Running time CM dan FCM dataRunning time CM dan FCM data Kabupaten Lampung Timur

Page 54: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Indeks Validitas Fukuyama-SugenoIndeks Validitas Fukuyama Sugenopada Kota Metro

Page 55: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Indeks Validitas Fukuyama Sugeno padaIndeks Validitas Fukuyama-Sugeno padadata Kabupaten Lampung Timur

Page 56: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Hasil Pengelompokkan FCM pada dataHasil Pengelompokkan FCM pada data Kota Metro

No Kelurahan Derajat Keanggotaan ke-C1 C2 C3 C4

1 Sumbersari 0.030342 0.098435 0.162529 0.7086942 Rejomulyo 0.044388 0.307428 0.312149 0.3360343 Margodadi 0.023281 0.068991 0.120378 0.7873504 Margorejo 0.014927 0.043333 0.096305 0.8454354 Margorejo 0.014927 0.043333 0.096305 0.8454355 Mulyojati 0.065846 0.207097 0.453679 0.2733776 Mulyosari 0.015600 0.050854 0.102252 0.8312947 Ganjaragung 0.054328 0.251111 0.451360 0.2432008 Ganjarasri 0.137546 0.444688 0.310112 0.1076549 Tejosari 0.021692 0.079007 0.130335 0.76896610 T j 0 091602 0 167103 0 431845 0 30945010 Tejoagung 0.091602 0.167103 0.431845 0.30945011 Iringmulyo 0.723234 0.123608 0.108344 0.04481412 Yosorejo 0.217123 0.216264 0.357390 0.20922313 Yosodadi 0.061680 0.205291 0.518944 0.21408514 Metro 0.457187 0.207346 0.192301 0.14316615 Imopuro 0.796094 0.088368 0.076019 0.03951916 Hadimulyo Barat 0.464535 0.201562 0.211906 0.12199717 Hadimulyo Timur 0.058972 0.686182 0.178417 0.07642918 Yosomulyo 0.100463 0.283412 0.428209 0.18791519 Banjarsari 0.117547 0.540397 0.209822 0.13223320 Purwosari 0.034420 0.104520 0.208126 0.65293421 Purwoasri 0 034446 0 104932 0 207188 0 65343421 Purwoasri 0.034446 0.104932 0.207188 0.65343422 Karangrejo 0.094952 0.425875 0.258955 0.220218

Page 57: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Hasil Pengelompokkan FCM pada dataHasil Pengelompokkan FCM pada data Kabupaten Lampung Timur

Hasil pengelompokkan menggunakan metode FCM pada kasus desa di Kabupaten Lampung Timurmenghasilkan banyaknya cluster 13.

Hal ini ditunjukkan dengan nilai minimum indeksvaliditas Fukuyama-Sugeno sebesar 196.94243.

Banyaknya desa anggota cluster pertama sampaidengan cluster ketiga belas berturut-turut 15, 97, 5, 3, 43, 14, 10, 19, 1, 12, 7, 7, dan 24

Page 58: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Perbandingan Hasil CM dengan FCMg gKota Metro

Banyak ClusterWaktu (detik)

CM FCM 0 45

0.5

CM

Running Time

CM FCM

2 0.037420 0.406585

3 0.029578 0.248894

4 0.026115 0.258251 0.3

0.35

0.4

0.45

etik

)

FCM

5 0.027023 0.269117

6 0.040287 0.339287

7 0.040635 0.310426

8 0 028714 0 474275 0.1

0.15

0.2

0.25

Wak

tu (d

e8 0.028714 0.474275

9 0.041965 0.361569

10 0.098525 0.321329 2 3 4 5 6 7 8 9 100

0.05

Banyaknya Cluster

Page 59: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Perbandingan Hasil CM dengan FCMg g

Kota Metro

Distribusi banyaknya anggota cluster pada C=4

Metode CM FCM

Cluster  Nc % Nc %

C1 3 13.64 4 18.18

C2 4 18.18 4 18.18C2 4 18.18 4 18.18

C3 1 4.55 6 27.27

C4 14 63 64 8 36 36C4 14 63.64 8 36.36

Page 60: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Perbandingan Hasil CM dengan FCMg g

Kabupaten Lampung Timur

Banyak ClusterWaktu (detik)CM FCM

6

CMFCM

Running Time

2 0.048745 0.6363833 0.034817 1.0899454 0.047218 2.973474

4

5

detik

)

FCM

5 0.061226 4.5509756 0.074604 4.5554407 0.066479 4.2237848 0 074693 5 417068 1

2

3

Wak

tu (d

8 0.074693 5.4170689 0.077199 4.88894710 0.089858 5.053932 2 3 4 5 6 7 8 9 10

0

1

Banyaknya Cluster

Page 61: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Perbandingan Hasil CM dengan FCMg g

Kabupaten Lampung TimurDistribusi banyaknya anggota cluster pada C=13Distribusi banyaknya anggota cluster pada C=13

Metode CM FCMCluster  Nc % Nc %

C1 1 0 39 15 5 84C1 1 0.39 15 5.84C2 17 6.61 97 37.74C3 13 5.06 5 1.95C4 23 8.95 3 1.17C5 14 5.45 43 16.73C6 21 8.17 14 5.45C7 10 3.89 10 3.89C8 23 8 95 19 7 39C8 23 8.95 19 7.39C9 1 0.39 1 0.39C10 67 26.07 12 4.67C11 8 3.11 7 2.72C12 58 22.57 7 2.72C13 1 0.39 24 9.34

Page 62: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Kesimpulan dan SaranpKesimpulan (1)

1. Metode FCM lebih kokoh mempertahankanbanyaknya cluster terhadap adanya data pencilanjika dibandingkan dengan metode CM.

2 B d k h il l h d t P d 20082. Berdasarkan hasil pengolahan data Podes 2008 sebagai pengujian metode FCM secara empirisdiperoleh nilai yang mendukung bahwa FCM lebihhalus dalam mempartisi cluster. Hal ini karena tiapa us da a e pa t s c uste a a e a t apobjek dilengkapi dengan derajat keanggotaan kepusat cluster yang terbentuk.

3. Running time algoritma FCM terhadap banyaknyacluster tidak linear seperti algoritma CMcluster tidak linear seperti algoritma CM.

Page 63: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Kesimpulan (2)

4. Hasil Pengelompokkan menggunakan metode FCMpada kasus kelurahan di Kota Metro menghasilkanjumlah cluster terbaik 4 (empat) cluster, yaitu :

a. Cluster pertama terdiri dari empat kelurahanyaitu Iringmulyo, Metro, Imopuro, danHadimulyo Barat yang memiliki kemiripanad u yo a at ya g e e pakarakteristik antara lain jumlah penduduk diatas 9.000 jiwa, fasilitas pendidikan di atas 9unit, dan fasilitas kesehatan di atas 13 unit.

b. Cluster kedua terdiri dari empat kelurahanyaitu Ganjarasri, Hadimulyo Timur, Banjarsari,dan Karangrejo.g j

Page 64: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Kesimpulan (3)

c. Cluster ketiga terdiri dari enam kelurahan yaituMulyojati, Ganjaragung, Tejoagung, Yosorejo,Yosodadi, dan Yosomulyo.

d. Sedangkan cluster keempat terdiri dari delapankelurahan yaitu Sumbersari, Rejomulyo,Margodadi, Margorejo, Mulyosari, Tejosari,a godad , a go ejo, u yosa , ejosa ,Purwosari, dan Purwoasri.

Page 65: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Kesimpulan (4)

5. Hasil pengelompokkan menggunakan metode FCM pada kasus desa di Kabupaten Lampung Timurmenghasilkan banyaknya cluster 13.

6. Hal ini ditunjukkan dengan nilai minimum indeksvaliditas Fukuyama-Sugeno sebesar 196.94243.

7. Banyaknya desa anggota cluster pertama sampaidengan cluster ketiga belas berturut-turut 15, 97, 5, 3, 43, 14, 10, 19, 1, 12, 7, 7, dan 24.

8. Cluster pertama tediri dari 15 desa yaitu desa KaryaMukti, Banjar Agung, Mumbang Jaya, Maringgai, Kebon Damar, Tebing, Braja Luhur, Labuhan Ratu, g, j ,Empat, Putra Aji Satu, Nyampir, Lehan, TrisnoMulyo, Cempaka Nuban, Rantau Fajar, dan TegalOmbo.

Page 66: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Kesimpulan (5)

9. Karakteristik desa-desa dalam cluster pertamaadalah: rata-rata jumlah penduduk 2.882 jiwa, rata-rata fasilitas pendidikan 5 unit, rata-rata f ilit k h t 5 it t t tfasilitas kesehatan 5 unit, rata-rata tenagakesehatan 5 orang.

10.Cluster kedua beranggotakan desa yang memiliki0 C uste edua be a ggota a desa ya g ekarakteristik antara lain jumlah penduduk rata-rata 2.264 jiwa, tidak memiliki pemukiman kumuh(jumlah rumah tangga yang tinggal di pemukimankumuh nihil) fasilitas pendidikan rata rata 4 unitkumuh nihil), fasilitas pendidikan rata-rata 4 unit sekolah, dan fasilitas kesehatan rata-rata 4 unit.

Page 67: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Saran

Dalam penelitian ini masih banyak permasalahan yang belum dikaji secara mendalam, oleh karena itu penulismemberikan saran sebagai berikut:

1. Melakukan analisis data dengan metodepengelompokkan lainnya, seperti dengan algoritmaTwo Step Cluster, Fuzzy C-Shelll, Fuzzy Substractive, o Step C uste , u y C S e , u y Subst act e,dan sebagainya.

2. Mengembangkan algoritma pengelompokkan danmembuat sub programnyamembuat sub programnya

Page 68: Seminar Hasil Tesisdigilib.its.ac.id/public/ITS-Undergraduate-15186... · 2011. 9. 12. · seminar hasil tesis metode c-means cluster dan fuzzy c-means cluster serta aplikasinya pada

Penutup

Terima KasihTerima Kasih