Implementasi Fuzzy C-Means untuk Clustering Data dalam...
Transcript of Implementasi Fuzzy C-Means untuk Clustering Data dalam...
i
Implementasi Fuzzy C-Means untuk Clustering Data
dalam Sistem Informasi Promosi
(Studi Kasus : UKSW)
Artikel Ilmiah
Diajukan kepada
Fakultas Teknologi Informasi
untuk memperoleh Gelar Sarjana Komputer
Peneliti :
Monica Dias Pangestika (672007068)
Drs. Prihanto Ngesti Basuki, M. Kom.
Charitas Fibriani, S. Kom., M. Eng.
Program Studi Teknik Informatika
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Salatiga
Juli 2013
ii
iii
iv
v
Pernyataan
Yang bertandatangan di bawah ini,
Nama : Monica Dias Pangestika
NIM : 672007068
Program Studi : Teknik Informatika
Fakultas : Teknologi Informasi, Universitas Kristen
Satya Wacana
Menyatakan dengan sesungguhnya bahwa tugas akhir dengan judul :
Implementasi Fuzzy C-Means untuk Clustering Data dalam Sistem Informasi
Promosi (Studi Kasus : UKSW)
Yang dibimbing oleh :
1. Drs. Prihanto Ngesti Basuki, M.Kom.
2. Charitas Fibriani, S.Kom., M.Eng.
Adalah benar hasil karya saya.
Di dalam tugas akhir ini tidak terdapat keseluruhan atau sebagian tulisan atau
gagasan orang lain yang saya ambil dengan menyalin atau meniru dalam bentuk
rangkaian kalimat atau gambar serta simbol yang saya akui seolah-olah sebagai
karya saya tanpa memberikan pengakuan penulisan atau sumber aslinya.
Salatiga, 25 Juli 2013
Yang memberi pernyataan,
Monica Dias Pangestika
1
Implementasi Fuzzy C-Means untuk Clustering Data
dalam Sistem Informasi Promosi
(Studi Kasus : UKSW)
1)Monica Dias Pangestika,
2) Prihanto Ngesti Basuki,
3)Charitas Fibriani
Program Studi Teknik Informatika
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Jl. Diponegoro 52-60 Salatiga
Email: 4)[email protected],
Abstract Promotion is a important factor in a university to attract prospective students interest
for continuing their education in that university. Equality of the same promotion in Satya Wacana
Christian University (UKSW) to all high scholl and to all study major, make promotion less
effective. Data clustering method are used to classification scholl and study major based on the
clusters. Fuzzy C–Means algorithm is the one of algorithm which can be used to clustering data,
this algorithm be used in this research to clustering data prospective students and study major.
The final result is a information that shows scholls and study majors which the promotion is less,
need to increase, or enough. Based the result of this research, value of the cluster about scholls
and study major which include to low cluster, it is recommended to do promotion in that scholl
and that study major.
Keywords: Fuzzy C-Means, clustering data, information
Abstrak Promosi merupakan faktor penting dalam suatu universitas untuk menarik minat calon
mahasiswa agar melanjutkan pendidikannya ke universitas itu. Pemerataan promosi pada
Universitas Kristen Satya Wacana (UKSW) yang sama ke semua sekolah menengah atas dan pada
semua program studi, membuat kurang efektifnya promosi. Metode Pengelompokan data yang
dilakukan untuk mengklasifikasikan sekolah dan program studi berdasarkan clusternya. Algoritma
Fuzzy C-Means merupakan salah satu algoritma yang digunakan dalam teknik pengelompokan
data, untuk itulah algoritma Fuzzy C-Means digunakan pada penelitian ini untuk mengelompokkan
data calon mahasiswa dan program studi. Hasil akhir berupa informasi yang menunjukan sekolah
dan program studi yang promosinya kurang, lebih ditingkatkan, atau cukup. Berdasarkan hasil
penelitian, nilai cluster sekolah dan program studi yang masuk ke cluster rendah,
direkomendasikan untuk dilakukan promosi di sekolah dan program studi tersebut.
Kata Kunci : Fuzzy C-Means, pengelompokan data,informasi
1 Mahasiswa Teknologi Informasi Universitas Satya Wacana
2 Pembimbing Pertama Teknologi Informasi Universitas Satya Wacana
3 Pembimbing Kedua Teknologi Informasi Universitas Satya Wacana
4 Alamat email mahasiswa
5 Alamat email Pembimbing Pertama
6 Alamat email Pembimbing Kedua
2
1. Pendahuluan
Promosi adalah salah satu faktor penting bagi suatu universitas untuk
menarik minat calon mahasiswa agar tertarik untuk melanjutkan pendidikannya ke
universitas itu. Banyaknya lulusan sekolah menengah atas yang ingin melanjutkan
jenjang pendidikan ke jenjang yang lebih tinggi, maka promosi pada suatu
universitas perlu lebih diefektifkan.
Selama ini suatu universitas menerima mahasiswa dari berbagai sekolah
menengah atas dan berbagai jurusan yang diminati dengan jumlah berbeda setiap
tahunnya. Tergantung dari bagaimana bagian promosi suatu universitas
melakukan promosi, menunjukkan kualitas yang dimiliki suatu universitas, baik
dalam hal akademik, fasilitas, maupun program studi yang dimiliki.
Penerimaan mahasiswa dari suatu sekolah menengah atas yang berbeda -
beda setiap tahunnya, program studi yang diminati yang tidak sama setiap
tahunnya, serta pemerataan promosi pada Universitas Kristen Satya Wacana yang
sama ke semua sekolah menengah atas dan pada semua program studi, membuat
kurang efektifnya promosi, mendorong penulis untuk melakukan pengelompokan
data berdasarkan data 3 tahun terakhir pada Universitas Kristen Satya Wacana.
Data jumlah calon mahasiswa dari setiap sekolah menengah atas, dan data
program studi yang diminati setiap tahunnya akan dikelompokkan menjadi 3
cluster.
Pembentukan cluster atau kelompok data merupakan salah satu teknik
yang digunakan dalam mengekstrak pola kecenderungan suatu data. Analisis
cluster atau clustering merupakan proses membagi data dalam suatu himpunan ke
dalam beberapa kelompok yang kesamaan datanya dalam suatu kelompok lebih
besar daripada kesamaan data tersebut dengan data dalam kelompok lain [1].
Metode Fuzzy C-Means yang digunakan dipilih karena metode ini adalah
suatu teknik pengelompokan data dimana keberadaan tiap-tiap titik data dalam
suatu cluster ditentukan oleh derajat keanggotaan. Fuzzy C-Means adalah
algoritma pengelompokan yang terawasi, karena pada algoritma Fuzzy C-Means
jumlah cluster yang akan dibentuk perlu diketahui terlebih dahulu. Konsep dasar
algoritma Fuzzy C-Means adalah menentukan pusat kelompok yang akan
menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster
ini masih belum akurat. Tiap-tiap titik data memiliki derajat keanggotaan pada
tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan
tiap-tiap titik data secara berulang-ulang, maka didapat lokasi pusat cluster
optimal. Perulangan ini didasarkan pada minimasi fungsi obyektif yang
menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot
oleh derajat keanggotaan titik data tersebut [2].
Diharapkan dengan perancangan sistem informasi tersebut, nantinya sistem ini
dapat memberi informasi berdasarkan pengelompokan data penerimaan
mahasiswa dari setiap sekolah menengah atas dan program studi yang diminati
untuk dapat menentukan strategi promosi berikutnya dalam biro promosi yang
lebih berorientasi kepada target.
3
2. Strategi Promosi di UKSW
Strategi Promosi merupakan teknik dan cara – cara yang dipakai suatu
perusahaan atau organisasi untuk melakukan promosi dengan tujuan untuk
mendapatkan efisiensi promosi yang baik, termasuk didalamnya kegiatan
pemasaran untuk menginformasikan, membujuk, serta menarik konsumen
mengenai produk atau jasa yang ditawarkan perusahaan [3].
Biro Promosi dan Hubungan Luar (BPHL) adalah unit yang bertugas untuk
mengelola dan mengembangkan sistem dan program promosi di UKSW. Dalam
kegiatannya, BPHL menjalin hubungan kemitraan yang baik dengan sekolah,
gereja, pemerintah, industri, dan alumni. Banyak kegiatan yang dilakukan biro
promosi dalam kegiatan promosinya, ada kegiatan visitasi ke sekolah – sekolah
yang lebih prospek, kegiatan presentasi yang merupakan penyampaian materi
mengenai UKSW, kegiatan EXPO, kegiatan Road Show, kegiatan consultation
desk. Serta penggunaan baliho yang dipasang seperti pada persimpangan jalan,
trafik yang ramai contohnya seperti pada Kota Salatiga, brosur, leaflet, Satya link
yaitu website yang berisi informasi serta kegiatan yang ada pada UKSW, dan
iklan ke advedtorial.
Proses Bisnis pada BPHL dituangkan pada Standart Operational Prosedure
(SOP) Pelaksanaan Promosi. Pada SOP tersebut dijelaskan tahap – tahap untuk
pelaksanaan promosi sampai kepada laporan pertanggungjawaban. Dengan tujuan
memperkenalkan program dan keunggulan yang ada pada masing – masing
program studi di Universitas Kristen Satya Wacana Salatiga kepada siswa
SMA/SMK/MA/sederajat untuk menarik minat siswa melanjutkan pendidikannya
ke UKSW. Ruang lingkup meliputi presentasi ke sekolah meliputi permohonan
izin presentasi, materi promosi, anggaran, penjelasan program dan keunggulan,
pembuatan laporan.
3. Kajian Pustaka
Penelitian terdahulu
Irma Irandha P. W, mahasiswa D4 dari Politeknik Elektronika Negeri
Surabaya, meneliti tentang Analisa Keluarga Miskin Dengan Menggunakan
Metode Fuzzy C-Means Clustering. Penelitian ini meneliti Kota Surabaya
tepatnya di Kecamatan Wonocolo yang terdapat Keluarga miskin. Penentuan
status Keluarga Miskin menggunakan metode tentang data keluarga miskin yang
meliputi jumlah ART (Anggota Rumah Tangga), jenis pekerjaan, indikator
Kesehatan, Pendidikan, Perumahan dan Lingkungan, Ekonomi serta Sosial
Budaya. Metode ini dilakukan untuk menghasilkan informasi tentang keluarga
miskin dengan katagori sangat miskin, miskin, dan mendekati miskin [4].
Bahar mahasiswa program Pasca Sarjana, Magister Teknik Informatika dari
Universitas Dian Nuswantoro tentang Penentuan Jurusan Sekolah Menengah Atas
dengan Algoritma Fuzzy C-Means. Parameter data yang digunakan dalam
eksperimen berupa rata-rata nilai mata pelajaran kelompok peminatan, yaitu:
jurusan IPA (mata pelajaran Biologi, Matematika, Fisika dan Kimia), jurusan IPS
(mata pelajaran Sosiologi, Geografi, Sejarah dan Ekonomi), jurusan Bahasa
(Bahasa Inggris dan Bahasa Indonesia). Penelitian ini menghasilkan 3 cluster yang
4
merupakan peminatan IPS, Bahasa, dan IPA, dan tingkat akurasi yang lebih tinggi
(yaitu rata – rata 78,39 %) dibandingkan dengan metode penentuan jurusan secara
manual [5].
Pada penelitian ini metode Fuzzy C-Means akan digunakan dalam
pengolahan data promosi di UKSW. Data yang diperlukan dalam penelitian ini
akan diambil dari data jumlah masing – masing sekolah menengah atas calon
mahasiswa dan jumlah program studi yang diminati per tahunnya selama 3 tahun,
di mana data ini dimasukkan langsung oleh bagian promosi dan semua proses
perhitungan Fuzzy C-Means dilakukan oleh sistem. Sistem ini menyediakan
fungsi untuk load data berupa file excel. Hasil dari penelitian ini akan
dikelompokkan menjadi 3 cluster, yaitu rendah, sedang, dan tinggi dan keterangan
informasi bagi biro promosi. Sehingga nantinya dapat membantu pihak promosi
dalam menentukan tindakan promosi selanjutnya yang lebih berorientasi target.
Algoritma Clustering
Kategori pengelompokan algoritma clustering adalah sebagai berikut [6]:
Hierarchical clustering menentukan sendiri jumlah cluster yang dihasilkan.
Hasil dari metode ini adalah suatu struktur data berbentuk pohon yang disebut
dendogram dimana data dikelompokkan secara bertingkat dari yang paling
bawah dimana tiap instance data merupakan satu cluster sendiri, hingga
tingkat paling atas dimana keseluruhan data membentuk satu cluster besar
berisi cluster-cluster. Hierarchical clustering dibagi lagi menjadi 2 yaitu :
- Agglomerative clustering merupakan suatu teknik hierarki clustering
yang menghasilkan suatu rangkaian penurunan jumlah cluster pada setiap
tahapan. Clustering yang terdapat pada setiap tahapan diperoleh dari
tahapan sebelumnya dengan cara menggabungkan 2 cluster yang
mempunyai kemiripan.
- Divisive hierarchical clustering mengelompokkan data dari kelompok
yang terbesar hingga ke kelompok yang terkecil, yaitu masing-masing
instance dari kelompok data tersebut. Sebaliknya, agglomerative
hierarchical clustering mulai mengelompokkan data dari kelompok yang
terkecil hingga kelompok yang terbesar. Beberapa algoritma yang
menggunakan metode ini adalah: RObust Clustering Using LinKs
(ROCK), Chameleon, Cobweb, Shared Nearest Neighbor (SNN).
Partitional clustering yang mengelompokkan data ke dalam k cluster dimana
k adalah banyaknya cluster dari input user. Kategori ini biasanya memerlukan
pengetahuan yang cukup mendalam tentang data dan proses bisnis yang
memanfaatkannya untuk mendapatkan kisaran nilai input yang sesuai.
Beberapa algoritma yang masuk dalam kategori ini antara lain: K-Means,
Fuzzy C-Means, Clustering Large Aplications (CLARA), Expectation
Maximation (EM), Bond Energy Algorithm (BEA), algoritma Genetika,
Jaringan Saraf Tiruan.
Clustering Large Data, dibutuhkan untuk melakukan clustering pada data
yang volumenya sangat besar sehingga tidak cukup ditampung dalam memori
komputer pasca suatu waktu. Biasanya untuk mengatasi masalah besarnya
5
volume data, dicari teknik-teknik untuk meminimalkan berapa kali algoritma
harus membaca seluruh data. Beberapa algoritma yang masuk dalam kategori
ini antara lain: Balanced Iteratif Reducing and clustering using hierarchies
(BIRCH), Density Based Spatial Clustering of Application With Noise
(DCSCAN), Clustering Categorical Data Using Summaries (CACTUS).
Fuzzy Clustering C-Means (FCM)
Pada proses pengklasteran (clustering) secara klasik (misalnya pada
algoritma Clustering K-Means), pembentukan partisi dilakukan sedemikian rupa
sehingga setiap obyek berada tepat pada satu partisi. Namun, adakalanya tidak
dapat menempatkan suatu obyek tepat pada suatu partisi, karena sebenarnya
obyek tersebut terletak di antara 2 atau lebih partisi yang lain. Pada logika fuzzy,
metode yang dapat digunakan untuk melakukan pengelompokan sejumlah data
dikenal dengan nama fuzzy clustering. Fuzzy Clustering lebih alami jika
dibandingkan dengan pengklasteran secara klasik. Suatu algoritma clustering
dikatakan sebagai fuzzy clustering jika algoritma tersebut menggunakan parameter
strategi adaptasi secara soft competitive. Sebagian besar algoritma fuzzy clustering
didasarkan atas optimasi fungsi obyektif atau modifikasi dari fungsi obyektif
tersebut.
Salah satu teknik fuzzy clustering adalah Fuzzy C-Means (FCM). FCM
adalah suatu teknik pengklasteran data yang keberadaan tiap-tiap data dalam suatu
cluster ditentukan oleh nilai/derajat keanggotaan tertentu. Teknik ini pertama kali
diperkenalkan oleh Jim Bezdek pada tahun 1981. Berbeda dengan teknik
pengklasteran secara klasik (dimana suatu obyek hanya akan menjadi anggota
suatu klaster tertentu), dalam FCM setiap data bisa menjadi anggota dari beberapa
cluster. Batas-batas cluster dalam FCM adalah lunak (soft). Konsep dasar FCM,
pertama kali adalah menentukan pusat cluster yang akan menandai lokasi rata-rata
untuk tiap- tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat.
Tiap-tiap data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara
memperbaiki pusat cluster dan nilai keanggotaan tiap-tiap data secara berulang,
maka akan terlihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat.
Perulangan ini didasarkan pada minimasi fungsi obyektif [7].
Algoritma Fuzzy C-Means (FCM) diberikan sebagai berikut [8]:
Menentukan data yang akan di cluster X, berupa matriks berukuran n x m
(n=jumlah sampel data, m = atribut setiap data). Xij = data sampel ke-i
(i=1,2,...,n), atribut ke-j (j=1,2,...,m).
Menentukan:
- Jumlah cluster = c ( )
- Pangkat = w (> 1)
- Maksimum interasi = MaxIter
- Error terkecil yang diharapkan =
- Fungsi objektif awal = Po = 0
- Interasi awal = t =1 dan
Membangkitkan bilangan random μik, i=1,2,3 ..., n; k=1,2,3 ...,c; sebagai elemen-
elemen matriks partisi awal U.
6
Menghitung jumlah setiap kolom:
......................................................................................(2.1)
dengan j = 1,2,...,n
Menghitung pusat cluster ke-k: Vkj, dengan k=1,2,...c; dan j=1,2,...m
............................................................................(2.2)
Menghitung fungsi objektif pada interasi ke-t :
.....................................(2.3)
Menghitung perubahan matriks partisi :
..........................................................(2.4)
dengan: i=1,2,...n; dan k=1,2,...c.
Memeriksa kondisi berhenti :
Jika: (|Pt – Pt-1|< ξ) atau (t > MaxIter) maka berhenti
Jika tidak: t=t+1, mengulang langkah ke-4.
Perancangan Sistem
Gambar berikut ini merupakan diagram alir (flowchart) yang merupakan
diagram alir perangkat lunak untuk menentukan informasi promosi dengan
menggunakan metode Fuzzy C-Means.
7
tidak
Ya
Gambar 1 Flowchart Metode Fuzzy C-Means pada sistem
Input MaxIterasi
dan Error
Proses dengan
Algoritma FCM
Fgs Objectf skrg – fgs
Obj sblumbya < error
Iterasi > maks iterasi
Hasil clustering
Optimal
Selesai
Load Data Excel
jumlah sekolah atau
program studi selama
3 tahun
Mulai
8
tidak
Ya
Gambar 2 Flowchart Algoritma Fuzzy C-Means
Use Case Diagram
Dalam diagram use case, hak akses hanya user. Di sini user adalah
pegawai biro Promosi UKSW. Seorang user dapat langsung mengakses sistem
dan menjalankan proses mulai algoritma. Di sini user menjalankan 2 aktifitas,
yaitu dimana user dapat melakukan proses algoritma mencakup perubahan pada
max iterasi dan error, juga meload data, kemudian melihat hasil, dimana user
dapat melihat fungsi obyektif yang dihasilkan, melihat matriks partisi, melihat
pusat cluster, melihat hasil pengelompokan cluster, dan melihat grafik hasil
Mulai
Baca Matriks X ukuran m x n,
error terkecil, pangkat pembobot
(w),maksimum iterasi
Bangkitkan matriks partisi awal
secara random[0....1] dan
normalisasi matriks partisi awal
P(t) –P(t-1) < error /
Iterasi >= maks iterasi
Hasil clustering
Optimal
Selesai
Inisialisasi P(0)=0,
Iterasi awal=1
Menghitung Pusat
cluster Vkj
Perbaharui
Matriks Partisi
Fungsi Objective
P(t)
t= t+1
9
pengolahan metode Fuzzy C-Means, serta melihat Informasi bagi Biro Promosi.
Lebih jelasnya dapat dilihat Gambar 3.
User
Melakukan Proses Algoritma
Load data
Melakukan Perubahan MaxIterasi dan Error
Melihat Hasil
Melihat Fungsi Objectif
Melihat Matriks Partisi
Melihat Pusat Cluster
Melihat HasilPengelompokan Cluster
Melihat GrafiK hasil FCM
<<include>>
<<include>>
<<include>>
<<include>>
<<include>>
<<include>>
<<include>>
Melihat Informasi bagi Biro Promosi
<<include>>
Gambar 3 Use Case Diagram User
Class Diagram
MainFrame
+FuzzyFix fix+DialogInput input
+keluar()+inputSettingDanData()+tampilkanHasil()
DialogInput
+initComponents()+loadDataActionPerformed()+prosesactionPerformed()
Data
+file+table+jumlahIterasi+jumlahtahun+error+nilaiIterasiBerhenti+nilaiErrorIterasiBerhenti
FuzzyFix
+model+model1+modelPartisi+modelPusatCluster+modelFungsiObj+informasiIterasi+JUMLAH_DATA+table+L1+L2+L3+LT+totalCluster1Pow+totalCluster2Pow+totalCluster3Pow+pusatCluster+jumlahFungsiObjective+jumlahFungsiObjectiveSebelumnya
+proses()+bacaExcel()+bangkitkanMatriks()+tentukanPusatCluster()+fungsiObjective()+perubahanMatriksPartisi()+tampilkanHasil()+tampilkanGrafik1()+tampilkanGrafik2()+tampilkanGrafik3()+tampilkanPromosi()
Baris data
+name+data+derajatKeanggotaanCluster1+derajatKeanggotaancluster2+derajatKeanggotaanCluster3+cluster1+cluster2+cluster3+cluster1pow+cluster2pow+cluster3pow
Gambar 4 Class Diagram Sistem
Class diagram sistem pada Gambar 4 dapat dijelaskan sebagai berikut.
Class MainFrame dan DialogInput merupakan User Interface berupa tampilan
10
Menu Utama dan Input setting dan Data. Class MainFrame melakukan panggilan
terhadap Class FuzzyFix yang merupakan algoritma dan menggunakan
DialogInput karena dipanggil dari MainFrame. Class FuzzyFix memiliki 2 Class
yang diperlukan untuk proses yaitu Class Baris Data yang digunakan untuk
menyimpan data yang dihasilkan setelah proses algoritma dan Class Data yang
berisi variabel dari Class DialogInput.
Gambar 5 Hirarki Keputusan untuk mengelompokkan data sekolah
menengah atas dan program studi
Penentuan cluster Rendah adalah promosi kurang, cluster Sedang adalah promosi
lebih ditingkatkan, dan cluster Tinggi adalah promosi cukup. Pada sekolah
menengah atas / jurusan yang promosinya cukup, kegiatan visitasi dapat
digantikan dengan mengirim brosur, leaflet, dan juga sosialisasi ke satya link,
sehingga biaya dapat lebih diefektifkankan ke sekolah / program studi yang
promosinya kurang, sehingga pendekatan, pengenalan kelebihan program studi
dapat terlaksana dengan waktu kunjungan yang cukup untuk tahap menarik minat
siswa. Untuk sekolah menengah atas / jurusan yang promosinya lebih
ditingkatkan, kegiatan visitasi tetap dilakukan, tetapi dengan waktu kunjungan
yang tidak begitu lama tetapi tetap efektif untuk penyampaian materi promosi.
Tujuan
Atribut
Jumlah Cluster
mengelompokkan data
Jumlah sekolah menengah
atas Jumlah program studi
Rendah Sedang Tinggi
11
4. Hasil dan Pembahasan
Gambar 6 Tampilan Awal
Gambar 6 merupakan tampilan antarmuka awal bagi user. Halaman Utama
berisi 3 button menu yaitu button Setting dan Data , button Tampilkan Hasil , dan
button Keluar untuk keluar dari aplikasi.
Gambar 7 Tampilan Antarmuka Setting & Data
Pada proses clustering seperti pada Gambar 7, aktifitas yang dapat
dilakukan oleh user menentukan maksimal iterasi dan ketelitian kesalahan. Dua
faktor tersebut dipenuhi untuk menentukan kriteria berhenti.
12
Gambar 8 Tampilan antarmuka Tampilkan Hasil
Pada Gambar 8 yang merupakan tampilan antarmuka tampilkan hasil, user
dapat melihat fungsi objective yang dihasilkan, matriks partisi, pusat cluster, hasil
perhitungan Fuzzy C-Means, grafik, dan informasi promosi.
Gambar 9 Hasil Perhitungan Fuzzy dan Clustering
13
Gambar 10 Informasi Biro Promosi
Tabel 1 Hasil Pengclusteran Data Sekolah Menangah Atas Kota Salatiga
Label
Data Nama Sekolah Rendah Sedang Tinggi Keterangan
1 SMA Kristen 1 Salatiga
* Promosi cukup
2 SMA Kristen 2 Salatiga
*
Promosi lebih ditingkatkan
3 SMA Kristen Satya Wacana Salatiga
* Promosi cukup
4 SMA Muhammadiyah Salatiga
*
Promosi lebih ditingkatkan
5 SMA PGRI 3 Salatiga
*
Promosi lebih ditingkatkan
6 SMA Theresiana
*
Promosi lebih ditingkatkan
7 SMA Negeri 1 Salatiga
* Promosi cukup
8 SMA Negeri 2 Salatiga
* Promosi cukup
9 SMA Negeri 3 Salatiga
* Promosi cukup
10 SMK PGRI 1 Salatiga
*
Promosi lebih ditingkatkan
11 SMK PGRI 2 Salatiga
*
Promosi lebih ditingkatkan
12 SMK Kristen 1 Salatiga
* Promosi cukup
13 SMK Kristen 2 Salatiga
*
Promosi lebih ditingkatkan
14 SMK Islam Sudirman Tingkir
*
Promosi lebih ditingkatkan
15 SMK Diponegoro
*
Promosi lebih ditingkatkan
16 SMK Negeri 1
*
Promosi lebih ditingkatkan
17 SMK Pelita
*
Promosi lebih ditingkatkan
18 SMK Negeri 2
*
Promosi lebih ditingkatkan
19 SMK T&I Kristen
*
Promosi lebih ditingkatkan
20 SMK Saraswati
*
Promosi lebih ditingkatkan
21 SMK Negeri 3 Salatiga
*
Promosi lebih ditingkatkan
22 SMA Lain - Lain * Promosi lebih ditingkatkan
14
Tabel 1 adalah salah satu contoh hasil pengclusteran dengan data sampel
sekolah menengah atas Kota Salatiga selama 3 tahun terakhir. Ada 22 data
mewakili nama – nama sekolah menengah atas serta jumlah calon mahasiswa tiap
tahunnya. Disini ke – 22 data tersebut masuk ke dalam 2 cluster yaitu cluster
sedang dan cluster tinggi. Dapat dilihat data yang masuk ke cluster tinggi ada
SMA Kristen 1 Salatiga, SMA Kristen Satya Wacana, SMA Negeri 1 Salatiga,
SMA Negeri 2 Salatiga, SMA Negeri 3 Salatiga, SMK Kristen 1 Salatiga, yang
promosinya cukup. Sisanya masuk ke kelompok sedang dimana promosi lebih
ditingkatkan.
Tabel 4.2 Hasil Pengclusteran Data Jurusan
Label
Data PROGRAM STUDI Rendah Sedang Tinggi Keterangan
1 AGRIBISNIS *
Promosi kurang
2 AGROEKOTEKNOLOGI *
Promosi kurang
3 AKUTANSI
*
Promosi lebih ditingkatkan
4 ANALIS KIMIA INDUSTRI *
Promosi kurang
5 BIMBINGAN KONSELING *
Promosi kurang
6 BIOLOGI *
Promosi kurang
7 SECRETARY PROGRAM *
Promosi kurang
8 TOURISM PROGRAM *
Promosi kurang
9 D2 PENDIDIKAN GURU SD *
Promosi kurang
10 DESAIN KOMUNIKASI VISUAL *
Promosi kurang
11 DOKTOR ILMU MANAJEMEN *
Promosi kurang
12 DOKTOR SOSIOLOGI AGAMA *
Promosi kurang
13 DOKTOR STUDI PEMBANGUNAN *
Promosi kurang
14 FISIKA *
Promosi kurang
15 ILMU HUKUM *
Promosi kurang
16 KEPERAWATAN *
Promosi kurang
17 KIMIA *
Promosi kurang
18 KOMPUTER AKUNTANSI *
Promosi kurang
19 KOMUNIKASI *
Promosi kurang
20 MAGISTER BIOLOGI *
Promosi kurang
21 MAGISTER ILMU HUKUM *
Promosi kurang
22 MAGISTER MANAJEMEN *
Promosi kurang
23
MAGISTER MANAJEMEN
PENDIDIKAN *
Promosi kurang
24 MAGISTER SAINS PSIKOLOGI *
Promosi kurang
25 MAGISTER SISTEM INFORMASI *
Promosi kurang
26 MAGISTER SOSIOLOGI AGAMA *
Promosi kurang
27 MAGISTER STUDI PEMBANGUNAN *
Promosi kurang
28 MANAJEMEN
*
Promosi lebih ditingkatkan
29 MATEMATIKA *
Promosi kurang
15
30 PENDIDIKAN BAHASA INGGRIS
*
Promosi lebih ditingkatkan
31 PENDIDIKAN GURU SD
*
Promosi lebih ditingkatkan
32 PENDIDIKAN MATEMATIKA
*
Promosi lebih ditingkatkan
33 PENDIDIKAN EKONOMI *
Promosi kurang
34 PENDIDIKAN FISIKA *
Promosi kurang
35 PENDIDIKAN SEJARAH *
Promosi kurang
36 PERSONNEL MANAGEMENT *
Promosi kurang
37 PPKN *
Promosi kurang
38 PSIKOLOGI
*
Promosi lebih ditingkatkan
39 PUBLIC RELATION *
Promosi kurang
40 S1 PENDIDIKAN GURU
* Promosi cukup
41 SENI MUSIK *
Promosi kurang
42 SISTEM INFORMASI *
Promosi kurang
43 SISTEM KOMPUTER *
Promosi kurang
44 SOSIOLOGI *
Promosi kurang
45 STUDI PEMBANGUNAN *
Promosi kurang
46 TEKNIK ELEKTRO *
Promosi kurang
47 TEKNIK INFORMATIKA
*
Promosi lebih ditingkatkan
48 TEOLOGI * Promosi kurang
Tabel 2 adalah salah satu contoh hasil pengclusteran dengan data sampel
program studi selama 3 tahun terakhir. Ada 48 data mewakili nama – nama
program studi serta jumlah peminat tiap tahunnya. Disini dilihat ke – 48 data
tersebut ada 7 data pada cluster sedang yaitu Akutansi, Manajemen, Pendidikan
Bahasa Inggris, Pendidikan Guru SD, Pendidikan Matematika, Psikologi, dan
Teknik Informatika, yang promosinya lebih ditingkatkan . S1 Pendidikan Guru
promosinya sudah cukup. Sisanya masuk ke cluster rendah dimana promosi
kurang.
5. Simpulan
Berdasarkan uji coba terhadap data kota Salatiga dan data program studi,
nilai cluster sekolah dan program studi yang promosinya kurang, lebih
direkomendasikan untuk dilakukan promosi di sekolah dan pada program studi
tersebut. Biro promosi dapat lebih melakukan pendekatan terhadap sekolah
menengah atas dan peningkatan pengenalan keunggulan program studi terhadap
sekolah dan program studi yang promosinya kurang atau lebih ditingkatkan.
Dengan begitu biaya dari sekolah dan program studi yang promosinya cukup
dapat diefektifkan kepada promosi yang kurang. Informasi dalam clustering data
ini dihitung dengan menggunakan algoritma Fuzzy C Means (FCM). Adapun
perhitungan dalam Fuzzy C Means (FCM) menggunakan jumlah calon
16
mahasiswa tiap sekolah dan jumlah peminat masing – masing program studi
selama 3 tahun sebagai atribut.
Diharapkan di kemudian hari, pengembangan yang dapat dilakukan pada
aplikasi clustering data ini adalah dengan menambah atribut sebagai dasar
perhitungan Fuzzy C Means (FCM), membuat cluster dan pembobot sebagai
inputan yang dinamis. Serta pengembangan aplikasi lebih diperbaiki dari sisi User
interface secara umum, sehingga pihak promosi lebih mudah membaca hasil
perhitungan.
6. Daftar Pustaka
[1] Kusrini, 2006, Algoritma Data Mining, Penerbit ANDI, Yogyakarta.
[2] Kusumadewi, Sri dan Hari Purnomo, 2004, Aplikasi Logika Fuzzy Untuk
Pendukung Keputusan, Yogyakarta: Graha Ilmu.
[3] Suharyadi, 2012, Analisis Strategi Universitas dengan Data Mining,
Salatiga : Fakultas Teknologi Informasi Universitas Kristen Satya Wacana.
[4] P. W Irandha, Irma, Analisa Keluarga Miskin Dengan Menggunakan
Metode Fuzzy C-Means Clustering, Politeknik Elektronika Negeri
Surabaya.
[5] Bahar, 2011, Penentuan Jurusan Sekolah Menengah Atas dengan
Algoritma Fuzzy C-Means, Program Pasca Sarjana, Magister Teknik
Informatika, Universitas Dian Nuswantoro, Semarang.
[6] Kantardzic, Mehmed (2003), Data Mining Concepts Models, Methods, and
Algorithms, New Jersey, IEEE.
[7] Kusumadewi, S., Hartati, S., 2006, Fuzzy Multi Atribute Decision Making,
Graha Ilmu, Yogyakarta.
[8] Kusumadewi, S., Purnomo, H., 2010, Aplikasi Fuzzy Untuk Pendukung
Keputusan, Graha Ilmu, Jakarta.