PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5...

12
perpustakaan.uns.ac.id digilib.uns.ac.id commit to user PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060 SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika PROGRAM STUDI MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2016

Transcript of PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5...

Page 1: PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME

C4.5 DALAM PENENTUAN JURUSAN SISWA

SMA NEGERI 2 SURAKARTA

oleh

NADYA AL FITRIANI

M0111060

SKRIPSI

ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar

Sarjana Sains Matematika

PROGRAM STUDI MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET

SURAKARTA

2016

Page 2: PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME

C4.5 DALAM PENENTUAN JURUSAN SISWA

SMA NEGERI 2 SURAKARTA

oleh

NADYA AL FITRIANI

M0111060

SKRIPSI

ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar

Sarjana Sains Matematika

PROGRAM STUDI MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET

SURAKARTA

2016

i

Page 3: PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

ii

Page 4: PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

ABSTRAK

Nadya Al Fitriani. 2016. PENERAPANDATA MININGMENGGUNAKANALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWASMA NEGERI 2 SURAKARTA. Fakultas Matematika dan Ilmu PengetahuanAlam. Universitas Sebelas Maret.

Data mining merupakan proses eksplorasi terhadap data yang berukuranbesar untuk menemukan pola dalam pengambilan keputusan. Salah satu teknikdalam pengambilan keputusan adalah klasifikasi. Klasifikasi adalah teknik dalamdata mining dengan menerapkan metode pohon keputusan untuk membentukdata dalam grup atau kelas. Algoritme yang digunakan dalam pohon keputusanadalah algoritme C4.5.

Pada dunia pendidikan, proses penentuan jurusan siswa adalah hal pen-ting yang perlu diputuskan dengan benar. Tujuan dalam penelitian ini untukmenentukan penjurusan siswa SMA menggunakan algoritme C4.5. Berdasarkanpembahasan dapat disimpulkan bahwa algoritme C4.5 dapat digunakan dalamklasifikasi penjurusan karena memiliki akurasi tinggi.

Dalam penelitian ini, penentuan jurusan diperoleh dengan menghitung jum-lah kasus IPA dan IPS tiap atribut, entropy, gain, split info dan gain ratio. Hasilpengujian terhadap nilai siswa SMA Negeri 2 Surakarta pada data testing yangdilakukan sebanyak lima kali secara random, diperoleh rata-rata persentase ke-akuratan sebesar 86,82% dengan recall 92,19% dan presisi 88,17%. Sedangkanhasil pengujian secara keseluruhan presentase keakuratan sebesar 89,78%.Kata kunci: data mining, klasifikasi, algoritme C4.5

iii

Page 5: PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

ABSTRACT

Nadya Al Fitriani. 2016. APLICATION OF C4.5 ALGORITHM USINGDATA MINING IN DETERMINING MAJORS OF STUDENTSHIGH SCHOOL 2 SURAKARTA. Faculty of Mathematics and Natural Sciences,Sebelas Maret University.

Data mining is the process of exploration of the large-sized data to determinepatterns in decision-making. One techniques in decision making is classification.Classification is a technique in data mining by applying decision tree method forforming into groups or classes. Algorithm C4.5 is used in the algorithm decisiontree.

In education areas, the process of determining the student major is theimportant thing to be decided correctly. The purpose of this research is to de-termine the placement of students SMA using algorithms C4.5. Based on thediscussion it can be concluded that the algorithm is C4.5 can be used in theclassification of majors because it has high accuracy.

In this study, the determination of the majors is obtained by counting thenumber of cases of each attribute science and social studies, entropy, gain, splitinfo, and gain ratio. The test results of students at SMA Negeri 2 Surakartaon testing data is performed five times randomly, which is obtained an averagepercentage of 86.82% accuracy with recall 92.19%, and precision 88.17% . Whilethe test results overall percentage accuracy of 89.78%.Keywords: data mining, classification, algorithm c4.5

iv

Page 6: PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

MOTTO

Jika engkau berat untuk menjalani ujian yang berat, ingatlah Allah tidak

membebani seseorang melainkan sesuai dengan kesanggupannya.

(QS. Al-Baqarah[2] : 286)

v

Page 7: PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

PERSEMBAHAN

Saya persembahkan karya ini untuk Kedua Orangtua Saya

vi

Page 8: PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

KATA PENGANTAR

Segala puji dan syukur penulis panjatkan kepada Allah SWT yang telah

melimpahkan rahmat dan hidayah-Nya sehingga penulis berhasil menyelesaikan

skripsi ini. Dalam penyusunan skripsi ini penulis telah mendapatkan bantuan

dari banyak pihak. Oleh karena itu penulis mengucapkan terima kasih kepada

1. Bapak Drs. Isnandar Slamet, M.Sc., Ph.D. sebagai Pembimbing I yang

telah memberikan bimbingan materi dan memberikan arahan dalam me-

nyelesaikan skripsi.

2. Prof. Drs. Tri Atmojo K, M.Sc., Ph.D. sebagai Pembimbing II yang telah

memberi bimbingan, motivasi dan arahan dalam penulisan skripsi.

3. Teman-teman yang telah memberikan saran dan semangat.

Penulis berharap semoga laporan ini bermanfaat.

Surakarta, Agustus 2016

Penulis

vii

Page 9: PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

DAFTAR ISI

HALAMAN JUDUL . . . . . . . . . . . . . . . . . . . . . . . . . . . . i

ABSTRAK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii

ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv

MOTTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v

PERSEMBAHAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi

KATA PENGANTAR . . . . . . . . . . . . . . . . . . . . . . . . . . . vii

DAFTAR ISI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix

DAFTAR TABEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x

DAFTAR GAMBAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi

I PENDAHULUAN 1

1.1 Latar Belakang . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Perumusan Masalah . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Batasan Masalah . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.4 Tujuan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.5 Manfaat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

II LANDASAN TEORI 4

2.1 Tinjauan Pustaka . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2.2 Teori Penunjang . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2.1 Data Mining . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2.2 Klasifikasi . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2.3 Pohon Keputusan . . . . . . . . . . . . . . . . . . . . . . . 7

2.2.4 Algoritme C4.5 . . . . . . . . . . . . . . . . . . . . . . . . 8

viii

Page 10: PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

2.2.5 Pengujian . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2.6 Software Tanagra . . . . . . . . . . . . . . . . . . . . . . . 11

2.3 Kerangka Pemikiran . . . . . . . . . . . . . . . . . . . . . . . . . 12

IIIMETODE PENELITIAN 14

IVPEMBAHASAN 16

4.1 Deskripsi Atribut Data . . . . . . . . . . . . . . . . . . . . . . . . 16

4.2 Analisis Algoritme C4.5 . . . . . . . . . . . . . . . . . . . . . . . 16

4.3 Interpretasi Pohon Klasifikasi . . . . . . . . . . . . . . . . . . . . 25

4.4 Pengujian dan Evaluasi . . . . . . . . . . . . . . . . . . . . . . . . 26

V PENUTUP 30

5.1 Kesimpulan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

5.2 Saran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

DAFTAR PUSTAKA 31

LAMPIRAN 32

Lampiran 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Lampiran 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

ix

Page 11: PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

DAFTAR TABEL

2.1 Confusion Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

4.1 Atribut Nilai Siswa . . . . . . . . . . . . . . . . . . . . . . . . . . 16

4.2 Perhitungan Node 1 . . . . . . . . . . . . . . . . . . . . . . . . . 17

4.3 Perhitungan Node 2 Biologi C . . . . . . . . . . . . . . . . . . . . 19

4.4 Perhitungan Node 3 Biologi C Kimia B . . . . . . . . . . . . . . . 21

4.5 Perhitungan Node 4.1 Biologi C Kimia B Ekonomi C . . . . . . . 22

4.6 Perhitungan Node 4.2 Biologi C Kimia B Ekonomi B . . . . . . . 24

4.7 Hasil Pengujian Data Training secara Keseluruhan . . . . . . . . 26

4.8 Hasil Testing 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

4.9 Hasil Testing 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

4.10 Hasil Testing 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

4.11 Hasil Testing 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

4.12 Hasil Testing 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4.13 Hasil Evaluasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

x

Page 12: PENERAPAN DATA MINING MENGGUNAKAN ALGORITME · PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060

perpustakaan.uns.ac.id digilib.uns.ac.id

commit to user

DAFTAR GAMBAR

2.1 Menu dalam Tanagra . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2 Diagram Alur Algoritme C4.5 . . . . . . . . . . . . . . . . . . . . 13

4.1 Pohon Keputusan Perhitungan Biologi C Kimia B . . . . . . . . . 25

xi