APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES...

18
APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES MASUK DENGAN TINGKAT KELULUSAN MAHASISWA (Studi Kasus: STMIK AMIKOM YOGYAKARTA) JUDUL NASKAH PUBLIKASI diajukan oleh Faundry Amrul Ma’ruf 09.11.2997 kepada SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER AMIKOM YOGYAKARTA 2013

Transcript of APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES...

Page 1: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES

MASUK DENGAN TINGKAT KELULUSAN MAHASISWA

(Studi Kasus: STMIK AMIKOM YOGYAKARTA)

JUDUL

NASKAH PUBLIKASI

diajukan oleh

Faundry Amrul Ma’ruf

09.11.2997

kepada SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN KOMPUTER

AMIKOM YOGYAKARTA

2013

Page 2: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

PENGESAHAN NASKAH

Page 3: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

DATA MINING APPLICATION PROCESS IN RELATION TO SEE WITH STUDENTS GRADUATION RATE

(Case Study: STMIK AMIKOM Yogyakarta)

APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES MASUK DENGAN TINGKAT KELULUSAN MAHASISWA (Studi Kasus: STMIK AMIKOM YOGYAKARTA)

Faundry Amrul Ma’ruf

Kusrini Jurusan Teknik Informatika

STMIK AMIKOM YOGYAKARTA

ABSTRACT

With the existence of many data accumulated explosive data growth has created

conditions that have a lot of data but minimal information. Data mining is the discovery of new information by looking for certain patterns or rules of a number of large amounts of data to get a relationship that may provide a useful indication.

By utilizing data from AMIKOM students are expected to know the relationship between the entrance to the graduation rate of students through the use of data mining methods. Categories in the measure of graduation rates and IPK student study duration.

The algorithm used is algorithm a priori, so that once the data is in the process it will display information in the form of support and confidence values of each category graduation rates, and will also display some reports, the reports suggestions, generated tables and summary report . AMIKOM campus parties will be given the right advice and accurate in getting his students more potential entry and print quality graduates. Keywords: A Priori Algorithm, Data Mining, Relationship Processes in Student

Page 4: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

1. Pendahuluan

Pemanfaatan data yang ada dalam sistem informasi untuk menunjang kegiatan

pengambilan keputusan tidak cukup hanya mengandalkan data operasional saja,

diperlukan suatu analisis data untuk menggali potensi-potensi informasi yang ada. Jadi,

proses pengubahan data menjadi informasi dan dari informasi yang ada akan diambil

polanya agar menjadi pengetahuan. Dalam mengambil keputusan, kebanyakan mereka

hanya memanfaatkan data yang sudah di miliki untuk menggali informasi yang berguna.

Hal ini mendorong munculnya cabang ilmu baru untuk mengatasi masalah penggalian

informasi atau pola yang penting atau menarik dari data dalam jumlah besar, yang

disebut dengan data mining. Penggunaan metode data mining diharapkan dapat

menemukan hubungan antara proses masuk dengan tingkat kelulusan yang sebelumnya

tersembunyi didalam gudang data sehingga menjadi informasi yang berharga dan

bermanfaat bagi kampus STMIK AMIKOM yogyakarta supaya dapat mengetahui

tingkat kelulusan mahasiswanya dan faktor yang mempengaruhi tingkat kelulusan.

Dengan adanya informasi tersebut akan dapat diketahui potensial masuk mahasiswanya

melalui tes tertulis atau wawancara dengan melihat nilai support dan confidence.

2. Landasan Teori

2.1 Data warehouse

Data warehouse adalah sebuah koleksi data yang mempunyai karakteristik

subject-oriented, integrated, nonvolatile, dan time variant, yang dapat mendukung

keputusan ditingkat manajemen suatu organisasi (Inmon, 2002).

Data warehouse adalah sebuah sistem yang mengambil dan menggabungkan

data secara periodik dari sistem sumber data ke penyimpanan data bentuk dimensional

atau normal (Rainardi, 2008).

Data warehouse adalah sebuah database analitis yang hanya dapat dibaca dan

digunakan sebagai dasar untuk sebuah sistem pendukung keputusan (Poe, 1998) .

Jadi, Data warehouse merupakan metode dalam perancangan database, yang

menunjang DSS(Decission Support System) dan EIS (Executive Information System).

Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan

database sangat berbeda. Dalam perancangan database tradisional menggunakan

normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara yang terbaik.

2.2 Karakteristik Data Warehouse

Seperti yang telah disebutkan diatas bahwa data warehouse mempunyai empat

karakteristik (Inmon, 2002), yaitu:

Page 5: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

1. Subject oriented

2. Integrated

3. Time variant

4. Nonvolatile

2.3 Pengertian Data mining

Data mining juga disebut sebagai serangkaian proses untuk menggali nilai

tambah berupa pengetahuan yang selama ini tidak diketahui secara manual .

(Pramudiono, 2006).

Karakteristik data mining sebagai berikut:

1. Data mining berhubungan dengan penemuan sesuatu yang tersembunyi

dan pola data tertentu yang tidak diketahui sebelumnya.

2. Data mining merupakan suatu proses otomatis terhadap daya yang sudah

ada.

3. Data yang akan diproses berupa daya yang sangat besar. data yang besar

digunakan untuk membuat hasil lebih dipercaya.

4. Tujuan data mining adalah mendapatkan hubungan atau pola yang

mungkin memberikan indikasi yang bermanfaat.

Penemuan pola merupakan keluaran lain dari data mining. misalnya sebuah

perusahaan yang akan meningkatkan fasilitas kartu kredit dari pelanggan, maka

perusahaan akan mencari pola dari pelanggan-pelanggan yang ada untuk mengetahui

pelanggan yang potensial dan pelanggan yang tidak potensial (Kusrini,2009).

2.4 Tahap-Tahap Data Mining

Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa

tahap, tahap-tahap data mining yaitu:

1. Data selection

2. Data cleaning

3. Data Transformation

4. Data mining

5. Evaluation

2.5 Metode Data mining

Banyak metode-metode yang dapat digunakan dalam proses data mining

diantaranya yaitu decision tree, clustering dan association rules. tetapi disini penulis

hanya membahas association rules.

Page 6: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

a. Association rules

Association rules (aturan asosiasi) atau affinity analysis (analisis afinitas)

berkenaan dengan studi tentang “apa bersama apa”. Sebagai contoh dapat berupa

berupa studi transaksi di supermarket, misal seorang konsumen membeli (roti, mentega)

=> (susu) dan mempunyai nilai support = 40%, confidence = 50%. Aturan tersebut berarti

“seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga

membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari transaksi selama ini

(Kusrini, 2009).”

Karena awalnya berasal dari studi tentang database transaksi pelanggan untuk

menentukan kebiasaan suatu produk dibeli bersama produk apa, maka aturan asosiasi

juga sering dinamakan market basket analysis.

Analisis asosiasi dikenal juga sebagai salah satu metode data mining yang

menjadi dasar dari berbagai metode data mining lainnya. Khususnya salah satu tahap

dari analisis asosiasi yang disebut analisis pola frekuensi tinggi (frequent pattern mining)

menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien adalah

analisis pola frekuensi tinggi.

3. ANALISIS DAN PERANCANGAN APLIKASI DATA MINING

3.1 Tinjauan Umum

3.2.1 Analisis lingkungan sistem

Dalam pembangunan aplikasi data mining ini menggunakan jenis arsitektur

dengan sumber data warehouse fungsional yaitu sebuah data warehouse yang

mengambil data dari sistem operasional terdekat. tiap data warehouse fungsional

melayani kelompok yang berbeda dan terpisah, area fungsional yang berbeda dan

terpisah, unit geografis yang berbeda dan terpisah atau kelompok pemasaran produk

yang berbeda dan terpisah. Karena data mining membutuhkan data dalam jumlah besar

untuk itu diperlukan suatu data warehouse yang dapat menampung dan menyatukan dari

keenam sumber data tersebut. Selain itu penggunaan data warehouse juga bertujuan

agar data transaksional dalam keenam database sumber tidak terganggu.

Page 7: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

Gambar 3.2 Analisis lingkungan sistem

3.3 Analisis Kebutuhan Sistem

Kebutuhan fungsional merupakan kemampuan sistem untuk melakukan proses

dan dapat menampilkan informasi apa saja. kebutuhan fungsional pada Aplikasi Data

mining ini merujuk pada kebutuhan akan perancangan data mining, seperti yang tertera

berikut ini :

1. Dapat menggabungkan data yang akan diproses mining dari data kelulusan

dan data mahasiswa (diambil dari kekuatan)

2. Dapat membersihkan data-data yang tidak relevan serta atribut yang tidak

dipakai (diambil dari kekuatan)

3. Dapat merubah data menjadi data yang siap diproses (diambil dari ancaman)

4. Dapat memproses data untuk dimining meliputi (diambil dari kelemahan dan

peluang)

a. Hubungan antara proses masuk dengan tingkat kelulusan.

b. Hubungan antara asal sekolah dan proses masuk dengan tingkat

kelulusan.

c. Hubungan antara kota asal sekolah dengan tingkat kelulusan.

d. Hubungan jurusan dengan tingkat kelulusan

e. Hubungan dari semua atribut agar di dapat hasil yang lebih spesifik

5. Dapat menampilkan hasil proses mining dengan nilai support dan confidence

(diambil dari kekuatan)

6. Menggunakan database sql server yang telah di ubah menjadi microsoft

access sehingga lebih mudah dalam mengoperasikannya. (diambil dari

ancaman)

7. Aplikasi inimampumelakukanpembuatanlaporan berupa laporan tabel hasil

proses mining, laporan rangkuman, laporan saran.(diambil dari kelemahan)

Data Warehouse

Data

data_gelombang

Data mhs

Aplikasi Data Mining

Data

jurusan

Data agama

Data

daft_wisuda

Data

calonsiswa

Page 8: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

3.2 Pemodelan Data

Dalam aplikasi ini dibangun data warehouse yang digunakan untuk menampung

data dari data mahasiswa dan data kelulusan mahasiswa. Tujuan utama pembangunan

data warehouse adalah agar database sumber tidak terganggu bila terjadi error, selain itu

data warehouse memudahkan dalam menyatukan data dari beberapa database sumber.

Proses ETL (Ekstrak Transform Load) dalam pembangunan data warehouse

merupakan proses yang penting karena menentukan pembangunan data warehouse

selanjutnya. Pada pembangunan data warehouse ini, terdapat enam source system yaitu

dari data mahasiswa, data agama, data jurusan, data data_gelombang, data calonsiswa

dan data daft_wisuda. Proses pemuatan data dari data source ke data warehouse

melalui proses ETL. Diagram Proses ETL dapat digambarkan seperti pada gambar 3.4

3.4 Gambar 3.4 Proses ETL

3.4.1 Pemodelan Fungsi

Pemodelan fungsi digambarkan dengan Flowchart , DCD (Data Context

Diagram), DFD (Data Flow Diagram) dan kamus data (Data Dictionary).

Data WarehouseProses ETL

Data

data_gelomb

ang

Data mhs

Data jurusan

Data agama

Data

daft_w isuda

Data

calonsisw a

Page 9: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

1. Flowchart yang diusulkan

Gambar 3.6 Flowchart

Form Utama

Muat Data

Muat

Tabel Data

Gabungan

Bersihkan

Bersihkan Data

Tabel yang

sudah bersih

Prodi

Atribut

Threshold

Proses

Proses Mining

Tabel Hasil

Gabungan

Laporan

Rangkuman

Laporan Saran

Untuk Amikom

Data Gabungan

Data mhs

Data

calonsiswa

Data

data_gelom

bang

Data

daft_wisuda

Data jurusan

Data agama

Proses lagi?

Yes

No

mulai

selesai

Page 10: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

2. Diagram konteks

DFD menggambarkan arus data dari suatu sistem informasi logika tanpa

mempertimbangkan lingkungan fisik dimana dara tersebut berada. Berikut

gambaran DFD dari sistem yang akan dibuat.

Gambar 3.7 Diagram Context

Aplikasi Data Mining

Untuk Mencari Hubungan

Proses Masuk dengan

Tingkat Kelulusan

Admin

Verifikasi Login Admin

Tampil Data Gabungan

Hasil Proses Data Mining

Laporan Mining Proses Masuk

Laporan Mining Asal Sekolah

Laporan Mining Kota Asal

Laporan Mining Program Studi

Laporan Rangkuman

Laporan Saran Untuk Amikom

Data Login

Akses Data Gabungan

Input Jurusan

Input Atribut

Input Threshold

Page 11: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

Data

Gabungan d

engan A

sal s

ekola

h

Petu

gas

Data

Petu

gas

Pro

ses

Import D

ata

Data

data

_gelo

mbang

Data

agam

a

Data

mahasis

wa, g

elo

mbang, k

elu

lusan, ju

rusan,

wis

uda, a

gam

a, te

st m

asuk

Data

Ware

house

Cle

anin

g S

ele

ctio

n

inte

gra

tion T

ransfo

rmatio

n

Sis

tem

Akadem

ik

Am

ikom

Data

juru

san

Data

mhs

Hasil d

ata

ware

house

Min

ing

Pro

ses

Masuk

Min

ing A

sal

Sekola

h

Min

ing K

ota

Asal

Min

ing

Juru

san

Data

Gabungan B

ers

ih

Data

Gabungan d

engan p

roses m

asuk

Data

Gabungan d

engan k

ota

asal

Data

Gabungan d

engan Ju

rusan

Data

Gabungan

Lapora

n H

asil M

inin

g P

roses M

asuk

Lapora

n H

asil M

inin

g A

sal S

ekola

h

Lapora

n H

asil M

inin

g K

ota

Asal

Lapora

n H

asil M

inin

g P

rogra

m S

tudi

Data

daft_

Wis

uda

Data

calo

nsis

wa

Data

Login

Verifik

asi L

ogin

3. DFD Level 1

Gambar 3.8 DFD Level 1

Page 12: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

4. IMPLEMENTASI PROGRAM DAN PEMBAHASAN

4.1 Implementasi

Dalam bab ini menjelaskan tentang implementasi dari perancangan data mining,

implementasi rancangan antar muka, uji coba sistem, implementasi pengujian, manual

program, serta manual instalasi. Selain itu juga terdapat pengujian Aplikasi Data mining

dengan pengujian black box testing.

4.2 Pembahasan

4.2.1 Pembahasan Tampilan

4.2.1.1 Tampilan halaman login

Gambar 4.15 Tampilan halaman login

4.2.1.2. Tampilan halaman utama

Gambar 4.16 Tampilan Halaman Utama

4.2.1.3. Tampilan data gabungan

Pada saat menu berkas di pilih dan memilih sub menu ambil data maka akan

tampil seperti gambar berikut:

Page 13: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

Gambar 4.17 Tampilan data gabungan

4.2.1.4. Tampilan bersihkan data

Setelah data mahasiswa berhasil diambil dan ditampilkan di datagrid proses

selanjutnya yaitu membersihkan data yang tidak dibutuhkan dan memilih data yang akan

ditampilkan dan akan diproses mining, selanjutnya staf memilih sub menu bersihkan data

dan hasilnya bisa dilihat di gambar berikut ini:

Gambar 4.18Tampilan Bersihkan Data

4.2.1.5. Tampilan data yang akan di proses mining

Pada Gambar berikut menunjukan bahwa proses mining telah siap untuk

diproses .

Page 14: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

Gambar 4.19 Tampilan data yang akan di proses mining

4.2.1.6. Tampilan tabel gabungan setelah proses mining

Gambar 4.20 Tampilan tabel gabungan setelah proses mining

4.2.1.7. Tampilan laporan rangkuman

Gambar 4.21 Tampilan laporan rangkuman

Page 15: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

4.2.1.8. Tampilan laporan saran untuk amikom

Gambar 4.22 Tampilan laporan saran untuk amikom

4.2.1.9. Tampilan rekam jejak

Gambar 4.23 Tampilan rekam jejak

4.2.1.10. Tampilan keamanan

Gambar 4.24 Tampilan keamanan

Page 16: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

4.2.1.11. Tampilan ubah nama pengguna dan kata sandi

Gambar 4.25 Tampilan ubah nama pengguna dan kata sandi

4.2.1.12 Tampilan Logout

Gambar 4.26 Tampilan Logout

5. PENUTUP

5. 1 Kesimpulan

Kesimpulan yang dapat di ambil dalam pengerjaan skripsi ini adalah

a. Membuat aplikasi yang dapat menampilkan informasi yang berguna dalam

mengambil keputusan dalam menganalisa hubungan proses masuk dengan

tingkat kelulusan dengan menggunakan metode data mining.

b. Cara mengambil keputusan setelah proses mining selesai yaitu dengan

melihat tingkat saran yang di anjurkan untuk AMIKOM yang dapat di jadikan

acuan dalam memaksimalkan iklan pada daerah tertentu apabila yang di

pilih berdasarkan asal sekolah ataupun kota asal.

Page 17: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

c. Pada aplikasi data mining ini juga di beri pilihan untuk pihak kampus

AMIKOM apabila ingin mendapatkan hasil kualitas lulusan yang lebih bagus

dan dengan target yang akurat bisa menggunakan pilihan keseluruhan

atribut di gabung jadi satu pilihan.

d. Hasil dari proses data mining ini dapat digunakan sebagai pertimbangan

dalam mengambil keputusan lebih lanjut tentang faktor yang mempengaruhi

tingkat kelulusan khususnya faktor dalam data induk mahasiswa. dengan

adanya aplikasi ini maka akan di dapat

e. informasi tentang keberhasilan proses masuk mahasiswa itu berasal dari

mana, dan juga dapat mengetahui asal sekolah, nama sekolah, program

studi mahasiswa tersebut. dari atribut program studi dapat di ketahui

program studi yang mana yang di unggulkan dan di anggap berhasil dalam

mencetak kelulusan mahasiswa di STMIK AMIKOM yogyakarta.

5. 2 Saran

Untuk pengembangan Aplikasi Data mining lebih lanjut dari segi algoritma yang

digunakan yaitu dapat menggunakan algoritma lain, misal algoritma nearest neighbor,

algoritma C4.5 ataupun menggunakan fuzzy C means

Page 18: APLIKASI DATA MINING UNTUK MENGETAHUI HUBUNGAN PROSES ...repository.amikom.ac.id/files/Publikasi_09.11.2997.pdf · Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

Daftar Pustaka

Inmon, W.H.(2002). Building the Data Warehouse,edisi-3. Wiley Computer Publishing.

Kusrini, dan Emha Taufik Luthfi, 2009. Algoritma Data mining. CV. Andi OFFSET.

Yogyakarta.

Kusrini, 2007. Strategi perancangan dan pengelolaan basis data. CV. Andi OFFSET.

Yogyakarta.

Poe, Vidette(1998). Building Data Warehouse for Decision Support, edisi-2. Prentice Hall.

Pramudiono, I. 2007. Pengantar Data mining : Menambang Permata Pengetahuan di

Gunung Data,http://www.ilmukomputer.org/wp-content/uploads/2006/08/iko-

datamining.zip

Pramudiono, I., 2007. Algoritma Apriori, http://datamining.japati.net/cgi-

bin/indodm.cgi?bacaarsip&1172210143

Rainardi, Vincent, 2008, Building a Data Warehouse with Examples in SQL Server,

Springer, New York.