Implementasi Fuzzy C-Means untuk Clustering Data dalam...

22
i Implementasi Fuzzy C-Means untuk Clustering Data dalam Sistem Informasi Promosi (Studi Kasus : UKSW) Artikel Ilmiah Diajukan kepada Fakultas Teknologi Informasi untuk memperoleh Gelar Sarjana Komputer Peneliti : Monica Dias Pangestika (672007068) Drs. Prihanto Ngesti Basuki, M. Kom. Charitas Fibriani, S. Kom., M. Eng. Program Studi Teknik Informatika Fakultas Teknologi Informasi Universitas Kristen Satya Wacana Salatiga Juli 2013

Transcript of Implementasi Fuzzy C-Means untuk Clustering Data dalam...

Page 1: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

i

Implementasi Fuzzy C-Means untuk Clustering Data

dalam Sistem Informasi Promosi

(Studi Kasus : UKSW)

Artikel Ilmiah

Diajukan kepada

Fakultas Teknologi Informasi

untuk memperoleh Gelar Sarjana Komputer

Peneliti :

Monica Dias Pangestika (672007068)

Drs. Prihanto Ngesti Basuki, M. Kom.

Charitas Fibriani, S. Kom., M. Eng.

Program Studi Teknik Informatika

Fakultas Teknologi Informasi

Universitas Kristen Satya Wacana

Salatiga

Juli 2013

Page 2: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan
Page 3: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

ii

Page 4: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

iii

Page 5: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

iv

Page 6: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

v

Pernyataan

Yang bertandatangan di bawah ini,

Nama : Monica Dias Pangestika

NIM : 672007068

Program Studi : Teknik Informatika

Fakultas : Teknologi Informasi, Universitas Kristen

Satya Wacana

Menyatakan dengan sesungguhnya bahwa tugas akhir dengan judul :

Implementasi Fuzzy C-Means untuk Clustering Data dalam Sistem Informasi

Promosi (Studi Kasus : UKSW)

Yang dibimbing oleh :

1. Drs. Prihanto Ngesti Basuki, M.Kom.

2. Charitas Fibriani, S.Kom., M.Eng.

Adalah benar hasil karya saya.

Di dalam tugas akhir ini tidak terdapat keseluruhan atau sebagian tulisan atau

gagasan orang lain yang saya ambil dengan menyalin atau meniru dalam bentuk

rangkaian kalimat atau gambar serta simbol yang saya akui seolah-olah sebagai

karya saya tanpa memberikan pengakuan penulisan atau sumber aslinya.

Salatiga, 25 Juli 2013

Yang memberi pernyataan,

Monica Dias Pangestika

Page 7: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

1

Implementasi Fuzzy C-Means untuk Clustering Data

dalam Sistem Informasi Promosi

(Studi Kasus : UKSW)

1)Monica Dias Pangestika,

2) Prihanto Ngesti Basuki,

3)Charitas Fibriani

Program Studi Teknik Informatika

Fakultas Teknologi Informasi

Universitas Kristen Satya Wacana

Jl. Diponegoro 52-60 Salatiga

Email: 4)[email protected],

5)[email protected],

6)[email protected]

Abstract Promotion is a important factor in a university to attract prospective students interest

for continuing their education in that university. Equality of the same promotion in Satya Wacana

Christian University (UKSW) to all high scholl and to all study major, make promotion less

effective. Data clustering method are used to classification scholl and study major based on the

clusters. Fuzzy C–Means algorithm is the one of algorithm which can be used to clustering data,

this algorithm be used in this research to clustering data prospective students and study major.

The final result is a information that shows scholls and study majors which the promotion is less,

need to increase, or enough. Based the result of this research, value of the cluster about scholls

and study major which include to low cluster, it is recommended to do promotion in that scholl

and that study major.

Keywords: Fuzzy C-Means, clustering data, information

Abstrak Promosi merupakan faktor penting dalam suatu universitas untuk menarik minat calon

mahasiswa agar melanjutkan pendidikannya ke universitas itu. Pemerataan promosi pada

Universitas Kristen Satya Wacana (UKSW) yang sama ke semua sekolah menengah atas dan pada

semua program studi, membuat kurang efektifnya promosi. Metode Pengelompokan data yang

dilakukan untuk mengklasifikasikan sekolah dan program studi berdasarkan clusternya. Algoritma

Fuzzy C-Means merupakan salah satu algoritma yang digunakan dalam teknik pengelompokan

data, untuk itulah algoritma Fuzzy C-Means digunakan pada penelitian ini untuk mengelompokkan

data calon mahasiswa dan program studi. Hasil akhir berupa informasi yang menunjukan sekolah

dan program studi yang promosinya kurang, lebih ditingkatkan, atau cukup. Berdasarkan hasil

penelitian, nilai cluster sekolah dan program studi yang masuk ke cluster rendah,

direkomendasikan untuk dilakukan promosi di sekolah dan program studi tersebut.

Kata Kunci : Fuzzy C-Means, pengelompokan data,informasi

1 Mahasiswa Teknologi Informasi Universitas Satya Wacana

2 Pembimbing Pertama Teknologi Informasi Universitas Satya Wacana

3 Pembimbing Kedua Teknologi Informasi Universitas Satya Wacana

4 Alamat email mahasiswa

5 Alamat email Pembimbing Pertama

6 Alamat email Pembimbing Kedua

Page 8: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

2

1. Pendahuluan

Promosi adalah salah satu faktor penting bagi suatu universitas untuk

menarik minat calon mahasiswa agar tertarik untuk melanjutkan pendidikannya ke

universitas itu. Banyaknya lulusan sekolah menengah atas yang ingin melanjutkan

jenjang pendidikan ke jenjang yang lebih tinggi, maka promosi pada suatu

universitas perlu lebih diefektifkan.

Selama ini suatu universitas menerima mahasiswa dari berbagai sekolah

menengah atas dan berbagai jurusan yang diminati dengan jumlah berbeda setiap

tahunnya. Tergantung dari bagaimana bagian promosi suatu universitas

melakukan promosi, menunjukkan kualitas yang dimiliki suatu universitas, baik

dalam hal akademik, fasilitas, maupun program studi yang dimiliki.

Penerimaan mahasiswa dari suatu sekolah menengah atas yang berbeda -

beda setiap tahunnya, program studi yang diminati yang tidak sama setiap

tahunnya, serta pemerataan promosi pada Universitas Kristen Satya Wacana yang

sama ke semua sekolah menengah atas dan pada semua program studi, membuat

kurang efektifnya promosi, mendorong penulis untuk melakukan pengelompokan

data berdasarkan data 3 tahun terakhir pada Universitas Kristen Satya Wacana.

Data jumlah calon mahasiswa dari setiap sekolah menengah atas, dan data

program studi yang diminati setiap tahunnya akan dikelompokkan menjadi 3

cluster.

Pembentukan cluster atau kelompok data merupakan salah satu teknik

yang digunakan dalam mengekstrak pola kecenderungan suatu data. Analisis

cluster atau clustering merupakan proses membagi data dalam suatu himpunan ke

dalam beberapa kelompok yang kesamaan datanya dalam suatu kelompok lebih

besar daripada kesamaan data tersebut dengan data dalam kelompok lain [1].

Metode Fuzzy C-Means yang digunakan dipilih karena metode ini adalah

suatu teknik pengelompokan data dimana keberadaan tiap-tiap titik data dalam

suatu cluster ditentukan oleh derajat keanggotaan. Fuzzy C-Means adalah

algoritma pengelompokan yang terawasi, karena pada algoritma Fuzzy C-Means

jumlah cluster yang akan dibentuk perlu diketahui terlebih dahulu. Konsep dasar

algoritma Fuzzy C-Means adalah menentukan pusat kelompok yang akan

menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster

ini masih belum akurat. Tiap-tiap titik data memiliki derajat keanggotaan pada

tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan

tiap-tiap titik data secara berulang-ulang, maka didapat lokasi pusat cluster

optimal. Perulangan ini didasarkan pada minimasi fungsi obyektif yang

menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot

oleh derajat keanggotaan titik data tersebut [2].

Diharapkan dengan perancangan sistem informasi tersebut, nantinya sistem ini

dapat memberi informasi berdasarkan pengelompokan data penerimaan

mahasiswa dari setiap sekolah menengah atas dan program studi yang diminati

untuk dapat menentukan strategi promosi berikutnya dalam biro promosi yang

lebih berorientasi kepada target.

Page 9: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

3

2. Strategi Promosi di UKSW

Strategi Promosi merupakan teknik dan cara – cara yang dipakai suatu

perusahaan atau organisasi untuk melakukan promosi dengan tujuan untuk

mendapatkan efisiensi promosi yang baik, termasuk didalamnya kegiatan

pemasaran untuk menginformasikan, membujuk, serta menarik konsumen

mengenai produk atau jasa yang ditawarkan perusahaan [3].

Biro Promosi dan Hubungan Luar (BPHL) adalah unit yang bertugas untuk

mengelola dan mengembangkan sistem dan program promosi di UKSW. Dalam

kegiatannya, BPHL menjalin hubungan kemitraan yang baik dengan sekolah,

gereja, pemerintah, industri, dan alumni. Banyak kegiatan yang dilakukan biro

promosi dalam kegiatan promosinya, ada kegiatan visitasi ke sekolah – sekolah

yang lebih prospek, kegiatan presentasi yang merupakan penyampaian materi

mengenai UKSW, kegiatan EXPO, kegiatan Road Show, kegiatan consultation

desk. Serta penggunaan baliho yang dipasang seperti pada persimpangan jalan,

trafik yang ramai contohnya seperti pada Kota Salatiga, brosur, leaflet, Satya link

yaitu website yang berisi informasi serta kegiatan yang ada pada UKSW, dan

iklan ke advedtorial.

Proses Bisnis pada BPHL dituangkan pada Standart Operational Prosedure

(SOP) Pelaksanaan Promosi. Pada SOP tersebut dijelaskan tahap – tahap untuk

pelaksanaan promosi sampai kepada laporan pertanggungjawaban. Dengan tujuan

memperkenalkan program dan keunggulan yang ada pada masing – masing

program studi di Universitas Kristen Satya Wacana Salatiga kepada siswa

SMA/SMK/MA/sederajat untuk menarik minat siswa melanjutkan pendidikannya

ke UKSW. Ruang lingkup meliputi presentasi ke sekolah meliputi permohonan

izin presentasi, materi promosi, anggaran, penjelasan program dan keunggulan,

pembuatan laporan.

3. Kajian Pustaka

Penelitian terdahulu

Irma Irandha P. W, mahasiswa D4 dari Politeknik Elektronika Negeri

Surabaya, meneliti tentang Analisa Keluarga Miskin Dengan Menggunakan

Metode Fuzzy C-Means Clustering. Penelitian ini meneliti Kota Surabaya

tepatnya di Kecamatan Wonocolo yang terdapat Keluarga miskin. Penentuan

status Keluarga Miskin menggunakan metode tentang data keluarga miskin yang

meliputi jumlah ART (Anggota Rumah Tangga), jenis pekerjaan, indikator

Kesehatan, Pendidikan, Perumahan dan Lingkungan, Ekonomi serta Sosial

Budaya. Metode ini dilakukan untuk menghasilkan informasi tentang keluarga

miskin dengan katagori sangat miskin, miskin, dan mendekati miskin [4].

Bahar mahasiswa program Pasca Sarjana, Magister Teknik Informatika dari

Universitas Dian Nuswantoro tentang Penentuan Jurusan Sekolah Menengah Atas

dengan Algoritma Fuzzy C-Means. Parameter data yang digunakan dalam

eksperimen berupa rata-rata nilai mata pelajaran kelompok peminatan, yaitu:

jurusan IPA (mata pelajaran Biologi, Matematika, Fisika dan Kimia), jurusan IPS

(mata pelajaran Sosiologi, Geografi, Sejarah dan Ekonomi), jurusan Bahasa

(Bahasa Inggris dan Bahasa Indonesia). Penelitian ini menghasilkan 3 cluster yang

Page 10: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

4

merupakan peminatan IPS, Bahasa, dan IPA, dan tingkat akurasi yang lebih tinggi

(yaitu rata – rata 78,39 %) dibandingkan dengan metode penentuan jurusan secara

manual [5].

Pada penelitian ini metode Fuzzy C-Means akan digunakan dalam

pengolahan data promosi di UKSW. Data yang diperlukan dalam penelitian ini

akan diambil dari data jumlah masing – masing sekolah menengah atas calon

mahasiswa dan jumlah program studi yang diminati per tahunnya selama 3 tahun,

di mana data ini dimasukkan langsung oleh bagian promosi dan semua proses

perhitungan Fuzzy C-Means dilakukan oleh sistem. Sistem ini menyediakan

fungsi untuk load data berupa file excel. Hasil dari penelitian ini akan

dikelompokkan menjadi 3 cluster, yaitu rendah, sedang, dan tinggi dan keterangan

informasi bagi biro promosi. Sehingga nantinya dapat membantu pihak promosi

dalam menentukan tindakan promosi selanjutnya yang lebih berorientasi target.

Algoritma Clustering

Kategori pengelompokan algoritma clustering adalah sebagai berikut [6]:

Hierarchical clustering menentukan sendiri jumlah cluster yang dihasilkan.

Hasil dari metode ini adalah suatu struktur data berbentuk pohon yang disebut

dendogram dimana data dikelompokkan secara bertingkat dari yang paling

bawah dimana tiap instance data merupakan satu cluster sendiri, hingga

tingkat paling atas dimana keseluruhan data membentuk satu cluster besar

berisi cluster-cluster. Hierarchical clustering dibagi lagi menjadi 2 yaitu :

- Agglomerative clustering merupakan suatu teknik hierarki clustering

yang menghasilkan suatu rangkaian penurunan jumlah cluster pada setiap

tahapan. Clustering yang terdapat pada setiap tahapan diperoleh dari

tahapan sebelumnya dengan cara menggabungkan 2 cluster yang

mempunyai kemiripan.

- Divisive hierarchical clustering mengelompokkan data dari kelompok

yang terbesar hingga ke kelompok yang terkecil, yaitu masing-masing

instance dari kelompok data tersebut. Sebaliknya, agglomerative

hierarchical clustering mulai mengelompokkan data dari kelompok yang

terkecil hingga kelompok yang terbesar. Beberapa algoritma yang

menggunakan metode ini adalah: RObust Clustering Using LinKs

(ROCK), Chameleon, Cobweb, Shared Nearest Neighbor (SNN).

Partitional clustering yang mengelompokkan data ke dalam k cluster dimana

k adalah banyaknya cluster dari input user. Kategori ini biasanya memerlukan

pengetahuan yang cukup mendalam tentang data dan proses bisnis yang

memanfaatkannya untuk mendapatkan kisaran nilai input yang sesuai.

Beberapa algoritma yang masuk dalam kategori ini antara lain: K-Means,

Fuzzy C-Means, Clustering Large Aplications (CLARA), Expectation

Maximation (EM), Bond Energy Algorithm (BEA), algoritma Genetika,

Jaringan Saraf Tiruan.

Clustering Large Data, dibutuhkan untuk melakukan clustering pada data

yang volumenya sangat besar sehingga tidak cukup ditampung dalam memori

komputer pasca suatu waktu. Biasanya untuk mengatasi masalah besarnya

Page 11: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

5

volume data, dicari teknik-teknik untuk meminimalkan berapa kali algoritma

harus membaca seluruh data. Beberapa algoritma yang masuk dalam kategori

ini antara lain: Balanced Iteratif Reducing and clustering using hierarchies

(BIRCH), Density Based Spatial Clustering of Application With Noise

(DCSCAN), Clustering Categorical Data Using Summaries (CACTUS).

Fuzzy Clustering C-Means (FCM)

Pada proses pengklasteran (clustering) secara klasik (misalnya pada

algoritma Clustering K-Means), pembentukan partisi dilakukan sedemikian rupa

sehingga setiap obyek berada tepat pada satu partisi. Namun, adakalanya tidak

dapat menempatkan suatu obyek tepat pada suatu partisi, karena sebenarnya

obyek tersebut terletak di antara 2 atau lebih partisi yang lain. Pada logika fuzzy,

metode yang dapat digunakan untuk melakukan pengelompokan sejumlah data

dikenal dengan nama fuzzy clustering. Fuzzy Clustering lebih alami jika

dibandingkan dengan pengklasteran secara klasik. Suatu algoritma clustering

dikatakan sebagai fuzzy clustering jika algoritma tersebut menggunakan parameter

strategi adaptasi secara soft competitive. Sebagian besar algoritma fuzzy clustering

didasarkan atas optimasi fungsi obyektif atau modifikasi dari fungsi obyektif

tersebut.

Salah satu teknik fuzzy clustering adalah Fuzzy C-Means (FCM). FCM

adalah suatu teknik pengklasteran data yang keberadaan tiap-tiap data dalam suatu

cluster ditentukan oleh nilai/derajat keanggotaan tertentu. Teknik ini pertama kali

diperkenalkan oleh Jim Bezdek pada tahun 1981. Berbeda dengan teknik

pengklasteran secara klasik (dimana suatu obyek hanya akan menjadi anggota

suatu klaster tertentu), dalam FCM setiap data bisa menjadi anggota dari beberapa

cluster. Batas-batas cluster dalam FCM adalah lunak (soft). Konsep dasar FCM,

pertama kali adalah menentukan pusat cluster yang akan menandai lokasi rata-rata

untuk tiap- tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat.

Tiap-tiap data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara

memperbaiki pusat cluster dan nilai keanggotaan tiap-tiap data secara berulang,

maka akan terlihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat.

Perulangan ini didasarkan pada minimasi fungsi obyektif [7].

Algoritma Fuzzy C-Means (FCM) diberikan sebagai berikut [8]:

Menentukan data yang akan di cluster X, berupa matriks berukuran n x m

(n=jumlah sampel data, m = atribut setiap data). Xij = data sampel ke-i

(i=1,2,...,n), atribut ke-j (j=1,2,...,m).

Menentukan:

- Jumlah cluster = c ( )

- Pangkat = w (> 1)

- Maksimum interasi = MaxIter

- Error terkecil yang diharapkan =

- Fungsi objektif awal = Po = 0

- Interasi awal = t =1 dan

Membangkitkan bilangan random μik, i=1,2,3 ..., n; k=1,2,3 ...,c; sebagai elemen-

elemen matriks partisi awal U.

Page 12: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

6

Menghitung jumlah setiap kolom:

......................................................................................(2.1)

dengan j = 1,2,...,n

Menghitung pusat cluster ke-k: Vkj, dengan k=1,2,...c; dan j=1,2,...m

............................................................................(2.2)

Menghitung fungsi objektif pada interasi ke-t :

.....................................(2.3)

Menghitung perubahan matriks partisi :

..........................................................(2.4)

dengan: i=1,2,...n; dan k=1,2,...c.

Memeriksa kondisi berhenti :

Jika: (|Pt – Pt-1|< ξ) atau (t > MaxIter) maka berhenti

Jika tidak: t=t+1, mengulang langkah ke-4.

Perancangan Sistem

Gambar berikut ini merupakan diagram alir (flowchart) yang merupakan

diagram alir perangkat lunak untuk menentukan informasi promosi dengan

menggunakan metode Fuzzy C-Means.

Page 13: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

7

tidak

Ya

Gambar 1 Flowchart Metode Fuzzy C-Means pada sistem

Input MaxIterasi

dan Error

Proses dengan

Algoritma FCM

Fgs Objectf skrg – fgs

Obj sblumbya < error

Iterasi > maks iterasi

Hasil clustering

Optimal

Selesai

Load Data Excel

jumlah sekolah atau

program studi selama

3 tahun

Mulai

Page 14: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

8

tidak

Ya

Gambar 2 Flowchart Algoritma Fuzzy C-Means

Use Case Diagram

Dalam diagram use case, hak akses hanya user. Di sini user adalah

pegawai biro Promosi UKSW. Seorang user dapat langsung mengakses sistem

dan menjalankan proses mulai algoritma. Di sini user menjalankan 2 aktifitas,

yaitu dimana user dapat melakukan proses algoritma mencakup perubahan pada

max iterasi dan error, juga meload data, kemudian melihat hasil, dimana user

dapat melihat fungsi obyektif yang dihasilkan, melihat matriks partisi, melihat

pusat cluster, melihat hasil pengelompokan cluster, dan melihat grafik hasil

Mulai

Baca Matriks X ukuran m x n,

error terkecil, pangkat pembobot

(w),maksimum iterasi

Bangkitkan matriks partisi awal

secara random[0....1] dan

normalisasi matriks partisi awal

P(t) –P(t-1) < error /

Iterasi >= maks iterasi

Hasil clustering

Optimal

Selesai

Inisialisasi P(0)=0,

Iterasi awal=1

Menghitung Pusat

cluster Vkj

Perbaharui

Matriks Partisi

Fungsi Objective

P(t)

t= t+1

Page 15: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

9

pengolahan metode Fuzzy C-Means, serta melihat Informasi bagi Biro Promosi.

Lebih jelasnya dapat dilihat Gambar 3.

User

Melakukan Proses Algoritma

Load data

Melakukan Perubahan MaxIterasi dan Error

Melihat Hasil

Melihat Fungsi Objectif

Melihat Matriks Partisi

Melihat Pusat Cluster

Melihat HasilPengelompokan Cluster

Melihat GrafiK hasil FCM

<<include>>

<<include>>

<<include>>

<<include>>

<<include>>

<<include>>

<<include>>

Melihat Informasi bagi Biro Promosi

<<include>>

Gambar 3 Use Case Diagram User

Class Diagram

MainFrame

+FuzzyFix fix+DialogInput input

+keluar()+inputSettingDanData()+tampilkanHasil()

DialogInput

+initComponents()+loadDataActionPerformed()+prosesactionPerformed()

Data

+file+table+jumlahIterasi+jumlahtahun+error+nilaiIterasiBerhenti+nilaiErrorIterasiBerhenti

FuzzyFix

+model+model1+modelPartisi+modelPusatCluster+modelFungsiObj+informasiIterasi+JUMLAH_DATA+table+L1+L2+L3+LT+totalCluster1Pow+totalCluster2Pow+totalCluster3Pow+pusatCluster+jumlahFungsiObjective+jumlahFungsiObjectiveSebelumnya

+proses()+bacaExcel()+bangkitkanMatriks()+tentukanPusatCluster()+fungsiObjective()+perubahanMatriksPartisi()+tampilkanHasil()+tampilkanGrafik1()+tampilkanGrafik2()+tampilkanGrafik3()+tampilkanPromosi()

Baris data

+name+data+derajatKeanggotaanCluster1+derajatKeanggotaancluster2+derajatKeanggotaanCluster3+cluster1+cluster2+cluster3+cluster1pow+cluster2pow+cluster3pow

Gambar 4 Class Diagram Sistem

Class diagram sistem pada Gambar 4 dapat dijelaskan sebagai berikut.

Class MainFrame dan DialogInput merupakan User Interface berupa tampilan

Page 16: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

10

Menu Utama dan Input setting dan Data. Class MainFrame melakukan panggilan

terhadap Class FuzzyFix yang merupakan algoritma dan menggunakan

DialogInput karena dipanggil dari MainFrame. Class FuzzyFix memiliki 2 Class

yang diperlukan untuk proses yaitu Class Baris Data yang digunakan untuk

menyimpan data yang dihasilkan setelah proses algoritma dan Class Data yang

berisi variabel dari Class DialogInput.

Gambar 5 Hirarki Keputusan untuk mengelompokkan data sekolah

menengah atas dan program studi

Penentuan cluster Rendah adalah promosi kurang, cluster Sedang adalah promosi

lebih ditingkatkan, dan cluster Tinggi adalah promosi cukup. Pada sekolah

menengah atas / jurusan yang promosinya cukup, kegiatan visitasi dapat

digantikan dengan mengirim brosur, leaflet, dan juga sosialisasi ke satya link,

sehingga biaya dapat lebih diefektifkankan ke sekolah / program studi yang

promosinya kurang, sehingga pendekatan, pengenalan kelebihan program studi

dapat terlaksana dengan waktu kunjungan yang cukup untuk tahap menarik minat

siswa. Untuk sekolah menengah atas / jurusan yang promosinya lebih

ditingkatkan, kegiatan visitasi tetap dilakukan, tetapi dengan waktu kunjungan

yang tidak begitu lama tetapi tetap efektif untuk penyampaian materi promosi.

Tujuan

Atribut

Jumlah Cluster

mengelompokkan data

Jumlah sekolah menengah

atas Jumlah program studi

Rendah Sedang Tinggi

Page 17: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

11

4. Hasil dan Pembahasan

Gambar 6 Tampilan Awal

Gambar 6 merupakan tampilan antarmuka awal bagi user. Halaman Utama

berisi 3 button menu yaitu button Setting dan Data , button Tampilkan Hasil , dan

button Keluar untuk keluar dari aplikasi.

Gambar 7 Tampilan Antarmuka Setting & Data

Pada proses clustering seperti pada Gambar 7, aktifitas yang dapat

dilakukan oleh user menentukan maksimal iterasi dan ketelitian kesalahan. Dua

faktor tersebut dipenuhi untuk menentukan kriteria berhenti.

Page 18: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

12

Gambar 8 Tampilan antarmuka Tampilkan Hasil

Pada Gambar 8 yang merupakan tampilan antarmuka tampilkan hasil, user

dapat melihat fungsi objective yang dihasilkan, matriks partisi, pusat cluster, hasil

perhitungan Fuzzy C-Means, grafik, dan informasi promosi.

Gambar 9 Hasil Perhitungan Fuzzy dan Clustering

Page 19: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

13

Gambar 10 Informasi Biro Promosi

Tabel 1 Hasil Pengclusteran Data Sekolah Menangah Atas Kota Salatiga

Label

Data Nama Sekolah Rendah Sedang Tinggi Keterangan

1 SMA Kristen 1 Salatiga

* Promosi cukup

2 SMA Kristen 2 Salatiga

*

Promosi lebih ditingkatkan

3 SMA Kristen Satya Wacana Salatiga

* Promosi cukup

4 SMA Muhammadiyah Salatiga

*

Promosi lebih ditingkatkan

5 SMA PGRI 3 Salatiga

*

Promosi lebih ditingkatkan

6 SMA Theresiana

*

Promosi lebih ditingkatkan

7 SMA Negeri 1 Salatiga

* Promosi cukup

8 SMA Negeri 2 Salatiga

* Promosi cukup

9 SMA Negeri 3 Salatiga

* Promosi cukup

10 SMK PGRI 1 Salatiga

*

Promosi lebih ditingkatkan

11 SMK PGRI 2 Salatiga

*

Promosi lebih ditingkatkan

12 SMK Kristen 1 Salatiga

* Promosi cukup

13 SMK Kristen 2 Salatiga

*

Promosi lebih ditingkatkan

14 SMK Islam Sudirman Tingkir

*

Promosi lebih ditingkatkan

15 SMK Diponegoro

*

Promosi lebih ditingkatkan

16 SMK Negeri 1

*

Promosi lebih ditingkatkan

17 SMK Pelita

*

Promosi lebih ditingkatkan

18 SMK Negeri 2

*

Promosi lebih ditingkatkan

19 SMK T&I Kristen

*

Promosi lebih ditingkatkan

20 SMK Saraswati

*

Promosi lebih ditingkatkan

21 SMK Negeri 3 Salatiga

*

Promosi lebih ditingkatkan

22 SMA Lain - Lain * Promosi lebih ditingkatkan

Page 20: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

14

Tabel 1 adalah salah satu contoh hasil pengclusteran dengan data sampel

sekolah menengah atas Kota Salatiga selama 3 tahun terakhir. Ada 22 data

mewakili nama – nama sekolah menengah atas serta jumlah calon mahasiswa tiap

tahunnya. Disini ke – 22 data tersebut masuk ke dalam 2 cluster yaitu cluster

sedang dan cluster tinggi. Dapat dilihat data yang masuk ke cluster tinggi ada

SMA Kristen 1 Salatiga, SMA Kristen Satya Wacana, SMA Negeri 1 Salatiga,

SMA Negeri 2 Salatiga, SMA Negeri 3 Salatiga, SMK Kristen 1 Salatiga, yang

promosinya cukup. Sisanya masuk ke kelompok sedang dimana promosi lebih

ditingkatkan.

Tabel 4.2 Hasil Pengclusteran Data Jurusan

Label

Data PROGRAM STUDI Rendah Sedang Tinggi Keterangan

1 AGRIBISNIS *

Promosi kurang

2 AGROEKOTEKNOLOGI *

Promosi kurang

3 AKUTANSI

*

Promosi lebih ditingkatkan

4 ANALIS KIMIA INDUSTRI *

Promosi kurang

5 BIMBINGAN KONSELING *

Promosi kurang

6 BIOLOGI *

Promosi kurang

7 SECRETARY PROGRAM *

Promosi kurang

8 TOURISM PROGRAM *

Promosi kurang

9 D2 PENDIDIKAN GURU SD *

Promosi kurang

10 DESAIN KOMUNIKASI VISUAL *

Promosi kurang

11 DOKTOR ILMU MANAJEMEN *

Promosi kurang

12 DOKTOR SOSIOLOGI AGAMA *

Promosi kurang

13 DOKTOR STUDI PEMBANGUNAN *

Promosi kurang

14 FISIKA *

Promosi kurang

15 ILMU HUKUM *

Promosi kurang

16 KEPERAWATAN *

Promosi kurang

17 KIMIA *

Promosi kurang

18 KOMPUTER AKUNTANSI *

Promosi kurang

19 KOMUNIKASI *

Promosi kurang

20 MAGISTER BIOLOGI *

Promosi kurang

21 MAGISTER ILMU HUKUM *

Promosi kurang

22 MAGISTER MANAJEMEN *

Promosi kurang

23

MAGISTER MANAJEMEN

PENDIDIKAN *

Promosi kurang

24 MAGISTER SAINS PSIKOLOGI *

Promosi kurang

25 MAGISTER SISTEM INFORMASI *

Promosi kurang

26 MAGISTER SOSIOLOGI AGAMA *

Promosi kurang

27 MAGISTER STUDI PEMBANGUNAN *

Promosi kurang

28 MANAJEMEN

*

Promosi lebih ditingkatkan

29 MATEMATIKA *

Promosi kurang

Page 21: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

15

30 PENDIDIKAN BAHASA INGGRIS

*

Promosi lebih ditingkatkan

31 PENDIDIKAN GURU SD

*

Promosi lebih ditingkatkan

32 PENDIDIKAN MATEMATIKA

*

Promosi lebih ditingkatkan

33 PENDIDIKAN EKONOMI *

Promosi kurang

34 PENDIDIKAN FISIKA *

Promosi kurang

35 PENDIDIKAN SEJARAH *

Promosi kurang

36 PERSONNEL MANAGEMENT *

Promosi kurang

37 PPKN *

Promosi kurang

38 PSIKOLOGI

*

Promosi lebih ditingkatkan

39 PUBLIC RELATION *

Promosi kurang

40 S1 PENDIDIKAN GURU

* Promosi cukup

41 SENI MUSIK *

Promosi kurang

42 SISTEM INFORMASI *

Promosi kurang

43 SISTEM KOMPUTER *

Promosi kurang

44 SOSIOLOGI *

Promosi kurang

45 STUDI PEMBANGUNAN *

Promosi kurang

46 TEKNIK ELEKTRO *

Promosi kurang

47 TEKNIK INFORMATIKA

*

Promosi lebih ditingkatkan

48 TEOLOGI * Promosi kurang

Tabel 2 adalah salah satu contoh hasil pengclusteran dengan data sampel

program studi selama 3 tahun terakhir. Ada 48 data mewakili nama – nama

program studi serta jumlah peminat tiap tahunnya. Disini dilihat ke – 48 data

tersebut ada 7 data pada cluster sedang yaitu Akutansi, Manajemen, Pendidikan

Bahasa Inggris, Pendidikan Guru SD, Pendidikan Matematika, Psikologi, dan

Teknik Informatika, yang promosinya lebih ditingkatkan . S1 Pendidikan Guru

promosinya sudah cukup. Sisanya masuk ke cluster rendah dimana promosi

kurang.

5. Simpulan

Berdasarkan uji coba terhadap data kota Salatiga dan data program studi,

nilai cluster sekolah dan program studi yang promosinya kurang, lebih

direkomendasikan untuk dilakukan promosi di sekolah dan pada program studi

tersebut. Biro promosi dapat lebih melakukan pendekatan terhadap sekolah

menengah atas dan peningkatan pengenalan keunggulan program studi terhadap

sekolah dan program studi yang promosinya kurang atau lebih ditingkatkan.

Dengan begitu biaya dari sekolah dan program studi yang promosinya cukup

dapat diefektifkan kepada promosi yang kurang. Informasi dalam clustering data

ini dihitung dengan menggunakan algoritma Fuzzy C Means (FCM). Adapun

perhitungan dalam Fuzzy C Means (FCM) menggunakan jumlah calon

Page 22: Implementasi Fuzzy C-Means untuk Clustering Data dalam ...repository.uksw.edu/bitstream/123456789/6361/2/T1_672007068_Full... · yang lebih prospek, kegiatan presentasi yang merupakan

16

mahasiswa tiap sekolah dan jumlah peminat masing – masing program studi

selama 3 tahun sebagai atribut.

Diharapkan di kemudian hari, pengembangan yang dapat dilakukan pada

aplikasi clustering data ini adalah dengan menambah atribut sebagai dasar

perhitungan Fuzzy C Means (FCM), membuat cluster dan pembobot sebagai

inputan yang dinamis. Serta pengembangan aplikasi lebih diperbaiki dari sisi User

interface secara umum, sehingga pihak promosi lebih mudah membaca hasil

perhitungan.

6. Daftar Pustaka

[1] Kusrini, 2006, Algoritma Data Mining, Penerbit ANDI, Yogyakarta.

[2] Kusumadewi, Sri dan Hari Purnomo, 2004, Aplikasi Logika Fuzzy Untuk

Pendukung Keputusan, Yogyakarta: Graha Ilmu.

[3] Suharyadi, 2012, Analisis Strategi Universitas dengan Data Mining,

Salatiga : Fakultas Teknologi Informasi Universitas Kristen Satya Wacana.

[4] P. W Irandha, Irma, Analisa Keluarga Miskin Dengan Menggunakan

Metode Fuzzy C-Means Clustering, Politeknik Elektronika Negeri

Surabaya.

[5] Bahar, 2011, Penentuan Jurusan Sekolah Menengah Atas dengan

Algoritma Fuzzy C-Means, Program Pasca Sarjana, Magister Teknik

Informatika, Universitas Dian Nuswantoro, Semarang.

[6] Kantardzic, Mehmed (2003), Data Mining Concepts Models, Methods, and

Algorithms, New Jersey, IEEE.

[7] Kusumadewi, S., Hartati, S., 2006, Fuzzy Multi Atribute Decision Making,

Graha Ilmu, Yogyakarta.

[8] Kusumadewi, S., Purnomo, H., 2010, Aplikasi Fuzzy Untuk Pendukung

Keputusan, Graha Ilmu, Jakarta.