APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES...
Transcript of APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES...
APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES
MASUK DENGAN TINGKAT KELULUSAN MAHASISWA
(Studi Kasus: STMIK AMIKOM YOGYAKARTA)
JUDUL
NASKAH PUBLIKASI
diajukan oleh
Faundry Amrul Ma’ruf
09.11.2997
kepada SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER
AMIKOM YOGYAKARTA
2013
PENGESAHAN NASKAH
DATA MINING APPLICATION PROCESS IN RELATION TO SEE WITH STUDENTS GRADUATION RATE
(Case Study: STMIK AMIKOM Yogyakarta)
APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES MASUK DENGAN TINGKAT KELULUSAN MAHASISWA (Studi Kasus: STMIK AMIKOM YOGYAKARTA)
Faundry Amrul Ma’ruf
Kusrini Jurusan Teknik Informatika
STMIK AMIKOM YOGYAKARTA
ABSTRACT
With the existence of many data accumulated explosive data growth has created
conditions that have a lot of data but minimal information. Data mining is the discovery of new information by looking for certain patterns or rules of a number of large amounts of data to get a relationship that may provide a useful indication.
By utilizing data from AMIKOM students are expected to know the relationship between the entrance to the graduation rate of students through the use of data mining methods. Categories in the measure of graduation rates and IPK student study duration.
The algorithm used is algorithm a priori, so that once the data is in the process it will display information in the form of support and confidence values of each category graduation rates, and will also display some reports, the reports suggestions, generated tables and summary report . AMIKOM campus parties will be given the right advice and accurate in getting his students more potential entry and print quality graduates. Keywords: A Priori Algorithm, Data Mining, Relationship Processes in Student
1. Pendahuluan
Pemanfaatan data yang ada dalam sistem informasi untuk menunjang kegiatan
pengambilan keputusan tidak cukup hanya mengandalkan data operasional saja,
diperlukan suatu analisis data untuk menggali potensi-potensi informasi yang ada. Jadi,
proses pengubahan data menjadi informasi dan dari informasi yang ada akan diambil
polanya agar menjadi pengetahuan. Dalam mengambil keputusan, kebanyakan mereka
hanya memanfaatkan data yang sudah di miliki untuk menggali informasi yang berguna.
Hal ini mendorong munculnya cabang ilmu baru untuk mengatasi masalah penggalian
informasi atau pola yang penting atau menarik dari data dalam jumlah besar, yang
disebut dengan data mining. Penggunaan metode data mining diharapkan dapat
menemukan hubungan antara proses masuk dengan tingkat kelulusan yang sebelumnya
tersembunyi didalam gudang data sehingga menjadi informasi yang berharga dan
bermanfaat bagi kampus STMIK AMIKOM yogyakarta supaya dapat mengetahui
tingkat kelulusan mahasiswanya dan faktor yang mempengaruhi tingkat kelulusan.
Dengan adanya informasi tersebut akan dapat diketahui potensial masuk mahasiswanya
melalui tes tertulis atau wawancara dengan melihat nilai support dan confidence.
2. Landasan Teori
2.1 Data warehouse
Data warehouse adalah sebuah koleksi data yang mempunyai karakteristik
subject-oriented, integrated, nonvolatile, dan time variant, yang dapat mendukung
keputusan ditingkat manajemen suatu organisasi (Inmon, 2002).
Data warehouse adalah sebuah sistem yang mengambil dan menggabungkan
data secara periodik dari sistem sumber data ke penyimpanan data bentuk dimensional
atau normal (Rainardi, 2008).
Data warehouse adalah sebuah database analitis yang hanya dapat dibaca dan
digunakan sebagai dasar untuk sebuah sistem pendukung keputusan (Poe, 1998) .
Jadi, Data warehouse merupakan metode dalam perancangan database, yang
menunjang DSS(Decission Support System) dan EIS (Executive Information System).
Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan
database sangat berbeda. Dalam perancangan database tradisional menggunakan
normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik.
2.2 Karakteristik Data Warehouse
Seperti yang telah disebutkan diatas bahwa data warehouse mempunyai empat
karakteristik (Inmon, 2002), yaitu:
1. Subject oriented
2. Integrated
3. Time variant
4. Nonvolatile
2.3 Pengertian Data mining
Data mining juga disebut sebagai serangkaian proses untuk menggali nilai
tambah berupa pengetahuan yang selama ini tidak diketahui secara manual .
(Pramudiono, 2006).
Karakteristik data mining sebagai berikut:
1. Data mining berhubungan dengan penemuan sesuatu yang tersembunyi
dan pola data tertentu yang tidak diketahui sebelumnya.
2. Data mining merupakan suatu proses otomatis terhadap daya yang sudah
ada.
3. Data yang akan diproses berupa daya yang sangat besar. data yang besar
digunakan untuk membuat hasil lebih dipercaya.
4. Tujuan data mining adalah mendapatkan hubungan atau pola yang
mungkin memberikan indikasi yang bermanfaat.
Penemuan pola merupakan keluaran lain dari data mining. misalnya sebuah
perusahaan yang akan meningkatkan fasilitas kartu kredit dari pelanggan, maka
perusahaan akan mencari pola dari pelanggan-pelanggan yang ada untuk mengetahui
pelanggan yang potensial dan pelanggan yang tidak potensial (Kusrini,2009).
2.4 Tahap-Tahap Data Mining
Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa
tahap, tahap-tahap data mining yaitu:
1. Data selection
2. Data cleaning
3. Data Transformation
4. Data mining
5. Evaluation
2.5 Metode Data mining
Banyak metode-metode yang dapat digunakan dalam proses data mining
diantaranya yaitu decision tree, clustering dan association rules. tetapi disini penulis
hanya membahas association rules.
a. Association rules
Association rules (aturan asosiasi) atau affinity analysis (analisis afinitas)
berkenaan dengan studi tentang “apa bersama apa”. Sebagai contoh dapat berupa
berupa studi transaksi di supermarket, misal seorang konsumen membeli (roti, mentega)
=> (susu) dan mempunyai nilai support = 40%, confidence = 50%. Aturan tersebut berarti
“seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga
membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari transaksi selama ini
(Kusrini, 2009).”
Karena awalnya berasal dari studi tentang database transaksi pelanggan untuk
menentukan kebiasaan suatu produk dibeli bersama produk apa, maka aturan asosiasi
juga sering dinamakan market basket analysis.
Analisis asosiasi dikenal juga sebagai salah satu metode data mining yang
menjadi dasar dari berbagai metode data mining lainnya. Khususnya salah satu tahap
dari analisis asosiasi yang disebut analisis pola frekuensi tinggi (frequent pattern mining)
menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien adalah
analisis pola frekuensi tinggi.
3. ANALISIS DAN PERANCANGAN APLIKASI DATA MINING
3.1 Tinjauan Umum
3.2.1 Analisis lingkungan sistem
Dalam pembangunan aplikasi data mining ini menggunakan jenis arsitektur
dengan sumber data warehouse fungsional yaitu sebuah data warehouse yang
mengambil data dari sistem operasional terdekat. tiap data warehouse fungsional
melayani kelompok yang berbeda dan terpisah, area fungsional yang berbeda dan
terpisah, unit geografis yang berbeda dan terpisah atau kelompok pemasaran produk
yang berbeda dan terpisah. Karena data mining membutuhkan data dalam jumlah besar
untuk itu diperlukan suatu data warehouse yang dapat menampung dan menyatukan dari
keenam sumber data tersebut. Selain itu penggunaan data warehouse juga bertujuan
agar data transaksional dalam keenam database sumber tidak terganggu.
Gambar 3.2 Analisis lingkungan sistem
3.3 Analisis Kebutuhan Sistem
Kebutuhan fungsional merupakan kemampuan sistem untuk melakukan proses
dan dapat menampilkan informasi apa saja. kebutuhan fungsional pada Aplikasi Data
mining ini merujuk pada kebutuhan akan perancangan data mining, seperti yang tertera
berikut ini :
1. Dapat menggabungkan data yang akan diproses mining dari data kelulusan
dan data mahasiswa (diambil dari kekuatan)
2. Dapat membersihkan data-data yang tidak relevan serta atribut yang tidak
dipakai (diambil dari kekuatan)
3. Dapat merubah data menjadi data yang siap diproses (diambil dari ancaman)
4. Dapat memproses data untuk dimining meliputi (diambil dari kelemahan dan
peluang)
a. Hubungan antara proses masuk dengan tingkat kelulusan.
b. Hubungan antara asal sekolah dan proses masuk dengan tingkat
kelulusan.
c. Hubungan antara kota asal sekolah dengan tingkat kelulusan.
d. Hubungan jurusan dengan tingkat kelulusan
e. Hubungan dari semua atribut agar di dapat hasil yang lebih spesifik
5. Dapat menampilkan hasil proses mining dengan nilai support dan confidence
(diambil dari kekuatan)
6. Menggunakan database sql server yang telah di ubah menjadi microsoft
access sehingga lebih mudah dalam mengoperasikannya. (diambil dari
ancaman)
7. Aplikasi inimampumelakukanpembuatanlaporan berupa laporan tabel hasil
proses mining, laporan rangkuman, laporan saran.(diambil dari kelemahan)
Data Warehouse
Data
data_gelombang
Data mhs
Aplikasi Data Mining
Data
jurusan
Data agama
Data
daft_wisuda
Data
calonsiswa
3.2 Pemodelan Data
Dalam aplikasi ini dibangun data warehouse yang digunakan untuk menampung
data dari data mahasiswa dan data kelulusan mahasiswa. Tujuan utama pembangunan
data warehouse adalah agar database sumber tidak terganggu bila terjadi error, selain itu
data warehouse memudahkan dalam menyatukan data dari beberapa database sumber.
Proses ETL (Ekstrak Transform Load) dalam pembangunan data warehouse
merupakan proses yang penting karena menentukan pembangunan data warehouse
selanjutnya. Pada pembangunan data warehouse ini, terdapat enam source system yaitu
dari data mahasiswa, data agama, data jurusan, data data_gelombang, data calonsiswa
dan data daft_wisuda. Proses pemuatan data dari data source ke data warehouse
melalui proses ETL. Diagram Proses ETL dapat digambarkan seperti pada gambar 3.4
3.4 Gambar 3.4 Proses ETL
3.4.1 Pemodelan Fungsi
Pemodelan fungsi digambarkan dengan Flowchart , DCD (Data Context
Diagram), DFD (Data Flow Diagram) dan kamus data (Data Dictionary).
Data WarehouseProses ETL
Data
data_gelomb
ang
Data mhs
Data jurusan
Data agama
Data
daft_w isuda
Data
calonsisw a
1. Flowchart yang diusulkan
Gambar 3.6 Flowchart
Form Utama
Muat Data
Muat
Tabel Data
Gabungan
Bersihkan
Bersihkan Data
Tabel yang
sudah bersih
Prodi
Atribut
Threshold
Proses
Proses Mining
Tabel Hasil
Gabungan
Laporan
Rangkuman
Laporan Saran
Untuk Amikom
Data Gabungan
Data mhs
Data
calonsiswa
Data
data_gelom
bang
Data
daft_wisuda
Data jurusan
Data agama
Proses lagi?
Yes
No
mulai
selesai
2. Diagram konteks
DFD menggambarkan arus data dari suatu sistem informasi logika tanpa
mempertimbangkan lingkungan fisik dimana dara tersebut berada. Berikut
gambaran DFD dari sistem yang akan dibuat.
Gambar 3.7 Diagram Context
Aplikasi Data Mining
Untuk Mencari Hubungan
Proses Masuk dengan
Tingkat Kelulusan
Admin
Verifikasi Login Admin
Tampil Data Gabungan
Hasil Proses Data Mining
Laporan Mining Proses Masuk
Laporan Mining Asal Sekolah
Laporan Mining Kota Asal
Laporan Mining Program Studi
Laporan Rangkuman
Laporan Saran Untuk Amikom
Data Login
Akses Data Gabungan
Input Jurusan
Input Atribut
Input Threshold
Data
Gabungan d
engan A
sal s
ekola
h
Petu
gas
Data
Petu
gas
Pro
ses
Import D
ata
Data
data
_gelo
mbang
Data
agam
a
Data
mahasis
wa, g
elo
mbang, k
elu
lusan, ju
rusan,
wis
uda, a
gam
a, te
st m
asuk
Data
Ware
house
Cle
anin
g S
ele
ctio
n
inte
gra
tion T
ransfo
rmatio
n
Sis
tem
Akadem
ik
Am
ikom
Data
juru
san
Data
mhs
Hasil d
ata
ware
house
Min
ing
Pro
ses
Masuk
Min
ing A
sal
Sekola
h
Min
ing K
ota
Asal
Min
ing
Juru
san
Data
Gabungan B
ers
ih
Data
Gabungan d
engan p
roses m
asuk
Data
Gabungan d
engan k
ota
asal
Data
Gabungan d
engan Ju
rusan
Data
Gabungan
Lapora
n H
asil M
inin
g P
roses M
asuk
Lapora
n H
asil M
inin
g A
sal S
ekola
h
Lapora
n H
asil M
inin
g K
ota
Asal
Lapora
n H
asil M
inin
g P
rogra
m S
tudi
Data
daft_
Wis
uda
Data
calo
nsis
wa
Data
Login
Verifik
asi L
ogin
3. DFD Level 1
Gambar 3.8 DFD Level 1
4. IMPLEMENTASI PROGRAM DAN PEMBAHASAN
4.1 Implementasi
Dalam bab ini menjelaskan tentang implementasi dari perancangan data mining,
implementasi rancangan antar muka, uji coba sistem, implementasi pengujian, manual
program, serta manual instalasi. Selain itu juga terdapat pengujian Aplikasi Data mining
dengan pengujian black box testing.
4.2 Pembahasan
4.2.1 Pembahasan Tampilan
4.2.1.1 Tampilan halaman login
Gambar 4.15 Tampilan halaman login
4.2.1.2. Tampilan halaman utama
Gambar 4.16 Tampilan Halaman Utama
4.2.1.3. Tampilan data gabungan
Pada saat menu berkas di pilih dan memilih sub menu ambil data maka akan
tampil seperti gambar berikut:
Gambar 4.17 Tampilan data gabungan
4.2.1.4. Tampilan bersihkan data
Setelah data mahasiswa berhasil diambil dan ditampilkan di datagrid proses
selanjutnya yaitu membersihkan data yang tidak dibutuhkan dan memilih data yang akan
ditampilkan dan akan diproses mining, selanjutnya staf memilih sub menu bersihkan data
dan hasilnya bisa dilihat di gambar berikut ini:
Gambar 4.18Tampilan Bersihkan Data
4.2.1.5. Tampilan data yang akan di proses mining
Pada Gambar berikut menunjukan bahwa proses mining telah siap untuk
diproses .
Gambar 4.19 Tampilan data yang akan di proses mining
4.2.1.6. Tampilan tabel gabungan setelah proses mining
Gambar 4.20 Tampilan tabel gabungan setelah proses mining
4.2.1.7. Tampilan laporan rangkuman
Gambar 4.21 Tampilan laporan rangkuman
4.2.1.8. Tampilan laporan saran untuk amikom
Gambar 4.22 Tampilan laporan saran untuk amikom
4.2.1.9. Tampilan rekam jejak
Gambar 4.23 Tampilan rekam jejak
4.2.1.10. Tampilan keamanan
Gambar 4.24 Tampilan keamanan
4.2.1.11. Tampilan ubah nama pengguna dan kata sandi
Gambar 4.25 Tampilan ubah nama pengguna dan kata sandi
4.2.1.12 Tampilan Logout
Gambar 4.26 Tampilan Logout
5. PENUTUP
5. 1 Kesimpulan
Kesimpulan yang dapat di ambil dalam pengerjaan skripsi ini adalah
a. Membuat aplikasi yang dapat menampilkan informasi yang berguna dalam
mengambil keputusan dalam menganalisa hubungan proses masuk dengan
tingkat kelulusan dengan menggunakan metode data mining.
b. Cara mengambil keputusan setelah proses mining selesai yaitu dengan
melihat tingkat saran yang di anjurkan untuk AMIKOM yang dapat di jadikan
acuan dalam memaksimalkan iklan pada daerah tertentu apabila yang di
pilih berdasarkan asal sekolah ataupun kota asal.
c. Pada aplikasi data mining ini juga di beri pilihan untuk pihak kampus
AMIKOM apabila ingin mendapatkan hasil kualitas lulusan yang lebih bagus
dan dengan target yang akurat bisa menggunakan pilihan keseluruhan
atribut di gabung jadi satu pilihan.
d. Hasil dari proses data mining ini dapat digunakan sebagai pertimbangan
dalam mengambil keputusan lebih lanjut tentang faktor yang mempengaruhi
tingkat kelulusan khususnya faktor dalam data induk mahasiswa. dengan
adanya aplikasi ini maka akan di dapat
e. informasi tentang keberhasilan proses masuk mahasiswa itu berasal dari
mana, dan juga dapat mengetahui asal sekolah, nama sekolah, program
studi mahasiswa tersebut. dari atribut program studi dapat di ketahui
program studi yang mana yang di unggulkan dan di anggap berhasil dalam
mencetak kelulusan mahasiswa di STMIK AMIKOM yogyakarta.
5. 2 Saran
Untuk pengembangan Aplikasi Data mining lebih lanjut dari segi algoritma yang
digunakan yaitu dapat menggunakan algoritma lain, misal algoritma nearest neighbor,
algoritma C4.5 ataupun menggunakan fuzzy C means
Daftar Pustaka
Inmon, W.H.(2002). Building the Data Warehouse,edisi-3. Wiley Computer Publishing.
Kusrini, dan Emha Taufik Luthfi, 2009. Algoritma Data mining. CV. Andi OFFSET.
Yogyakarta.
Kusrini, 2007. Strategi perancangan dan pengelolaan basis data. CV. Andi OFFSET.
Yogyakarta.
Poe, Vidette(1998). Building Data Warehouse for Decision Support, edisi-2. Prentice Hall.
Pramudiono, I. 2007. Pengantar Data mining : Menambang Permata Pengetahuan di
Gunung Data,http://www.ilmukomputer.org/wp-content/uploads/2006/08/iko-
datamining.zip
Pramudiono, I., 2007. Algoritma Apriori, http://datamining.japati.net/cgi-
bin/indodm.cgi?bacaarsip&1172210143
Rainardi, Vincent, 2008, Building a Data Warehouse with Examples in SQL Server,
Springer, New York.