PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5...
Transcript of PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5...
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
PENERAPAN DATA MINING MENGGUNAKAN ALGORITME
C4.5 DALAM PENENTUAN JURUSAN SISWA
SMA NEGERI 2 SURAKARTA
oleh
NADYA AL FITRIANI
M0111060
SKRIPSI
ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar
Sarjana Sains Matematika
PROGRAM STUDI MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
2016
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
PENERAPAN DATA MINING MENGGUNAKAN ALGORITME
C4.5 DALAM PENENTUAN JURUSAN SISWA
SMA NEGERI 2 SURAKARTA
oleh
NADYA AL FITRIANI
M0111060
SKRIPSI
ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar
Sarjana Sains Matematika
PROGRAM STUDI MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
2016
i
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
ii
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
ABSTRAK
Nadya Al Fitriani. 2016. PENERAPANDATA MININGMENGGUNAKANALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWASMA NEGERI 2 SURAKARTA. Fakultas Matematika dan Ilmu PengetahuanAlam. Universitas Sebelas Maret.
Data mining merupakan proses eksplorasi terhadap data yang berukuranbesar untuk menemukan pola dalam pengambilan keputusan. Salah satu teknikdalam pengambilan keputusan adalah klasifikasi. Klasifikasi adalah teknik dalamdata mining dengan menerapkan metode pohon keputusan untuk membentukdata dalam grup atau kelas. Algoritme yang digunakan dalam pohon keputusanadalah algoritme C4.5.
Pada dunia pendidikan, proses penentuan jurusan siswa adalah hal pen-ting yang perlu diputuskan dengan benar. Tujuan dalam penelitian ini untukmenentukan penjurusan siswa SMA menggunakan algoritme C4.5. Berdasarkanpembahasan dapat disimpulkan bahwa algoritme C4.5 dapat digunakan dalamklasifikasi penjurusan karena memiliki akurasi tinggi.
Dalam penelitian ini, penentuan jurusan diperoleh dengan menghitung jum-lah kasus IPA dan IPS tiap atribut, entropy, gain, split info dan gain ratio. Hasilpengujian terhadap nilai siswa SMA Negeri 2 Surakarta pada data testing yangdilakukan sebanyak lima kali secara random, diperoleh rata-rata persentase ke-akuratan sebesar 86,82% dengan recall 92,19% dan presisi 88,17%. Sedangkanhasil pengujian secara keseluruhan presentase keakuratan sebesar 89,78%.Kata kunci: data mining, klasifikasi, algoritme C4.5
iii
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
ABSTRACT
Nadya Al Fitriani. 2016. APLICATION OF C4.5 ALGORITHM USINGDATA MINING IN DETERMINING MAJORS OF STUDENTSHIGH SCHOOL 2 SURAKARTA. Faculty of Mathematics and Natural Sciences,Sebelas Maret University.
Data mining is the process of exploration of the large-sized data to determinepatterns in decision-making. One techniques in decision making is classification.Classification is a technique in data mining by applying decision tree method forforming into groups or classes. Algorithm C4.5 is used in the algorithm decisiontree.
In education areas, the process of determining the student major is theimportant thing to be decided correctly. The purpose of this research is to de-termine the placement of students SMA using algorithms C4.5. Based on thediscussion it can be concluded that the algorithm is C4.5 can be used in theclassification of majors because it has high accuracy.
In this study, the determination of the majors is obtained by counting thenumber of cases of each attribute science and social studies, entropy, gain, splitinfo, and gain ratio. The test results of students at SMA Negeri 2 Surakartaon testing data is performed five times randomly, which is obtained an averagepercentage of 86.82% accuracy with recall 92.19%, and precision 88.17% . Whilethe test results overall percentage accuracy of 89.78%.Keywords: data mining, classification, algorithm c4.5
iv
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
MOTTO
Jika engkau berat untuk menjalani ujian yang berat, ingatlah Allah tidak
membebani seseorang melainkan sesuai dengan kesanggupannya.
(QS. Al-Baqarah[2] : 286)
v
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
PERSEMBAHAN
Saya persembahkan karya ini untuk Kedua Orangtua Saya
vi
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
KATA PENGANTAR
Segala puji dan syukur penulis panjatkan kepada Allah SWT yang telah
melimpahkan rahmat dan hidayah-Nya sehingga penulis berhasil menyelesaikan
skripsi ini. Dalam penyusunan skripsi ini penulis telah mendapatkan bantuan
dari banyak pihak. Oleh karena itu penulis mengucapkan terima kasih kepada
1. Bapak Drs. Isnandar Slamet, M.Sc., Ph.D. sebagai Pembimbing I yang
telah memberikan bimbingan materi dan memberikan arahan dalam me-
nyelesaikan skripsi.
2. Prof. Drs. Tri Atmojo K, M.Sc., Ph.D. sebagai Pembimbing II yang telah
memberi bimbingan, motivasi dan arahan dalam penulisan skripsi.
3. Teman-teman yang telah memberikan saran dan semangat.
Penulis berharap semoga laporan ini bermanfaat.
Surakarta, Agustus 2016
Penulis
vii
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
DAFTAR ISI
HALAMAN JUDUL . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
ABSTRAK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
MOTTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
PERSEMBAHAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi
KATA PENGANTAR . . . . . . . . . . . . . . . . . . . . . . . . . . . vii
DAFTAR ISI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix
DAFTAR TABEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x
DAFTAR GAMBAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi
I PENDAHULUAN 1
1.1 Latar Belakang . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Perumusan Masalah . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Batasan Masalah . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Tujuan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.5 Manfaat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
II LANDASAN TEORI 4
2.1 Tinjauan Pustaka . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 Teori Penunjang . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2.1 Data Mining . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2.2 Klasifikasi . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2.3 Pohon Keputusan . . . . . . . . . . . . . . . . . . . . . . . 7
2.2.4 Algoritme C4.5 . . . . . . . . . . . . . . . . . . . . . . . . 8
viii
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
2.2.5 Pengujian . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.6 Software Tanagra . . . . . . . . . . . . . . . . . . . . . . . 11
2.3 Kerangka Pemikiran . . . . . . . . . . . . . . . . . . . . . . . . . 12
IIIMETODE PENELITIAN 14
IVPEMBAHASAN 16
4.1 Deskripsi Atribut Data . . . . . . . . . . . . . . . . . . . . . . . . 16
4.2 Analisis Algoritme C4.5 . . . . . . . . . . . . . . . . . . . . . . . 16
4.3 Interpretasi Pohon Klasifikasi . . . . . . . . . . . . . . . . . . . . 25
4.4 Pengujian dan Evaluasi . . . . . . . . . . . . . . . . . . . . . . . . 26
V PENUTUP 30
5.1 Kesimpulan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.2 Saran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
DAFTAR PUSTAKA 31
LAMPIRAN 32
Lampiran 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Lampiran 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
ix
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
DAFTAR TABEL
2.1 Confusion Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.1 Atribut Nilai Siswa . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.2 Perhitungan Node 1 . . . . . . . . . . . . . . . . . . . . . . . . . 17
4.3 Perhitungan Node 2 Biologi C . . . . . . . . . . . . . . . . . . . . 19
4.4 Perhitungan Node 3 Biologi C Kimia B . . . . . . . . . . . . . . . 21
4.5 Perhitungan Node 4.1 Biologi C Kimia B Ekonomi C . . . . . . . 22
4.6 Perhitungan Node 4.2 Biologi C Kimia B Ekonomi B . . . . . . . 24
4.7 Hasil Pengujian Data Training secara Keseluruhan . . . . . . . . 26
4.8 Hasil Testing 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.9 Hasil Testing 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.10 Hasil Testing 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.11 Hasil Testing 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.12 Hasil Testing 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.13 Hasil Evaluasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
x
perpustakaan.uns.ac.id digilib.uns.ac.id
commit to user
DAFTAR GAMBAR
2.1 Menu dalam Tanagra . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2 Diagram Alur Algoritme C4.5 . . . . . . . . . . . . . . . . . . . . 13
4.1 Pohon Keputusan Perhitungan Biologi C Kimia B . . . . . . . . . 25
xi