Post on 10-Jul-2020
i
KLASIFIKASI DATA PRODUKSI PADI PULAU JAWA
MENGGUNAKAN ALGORITME CLASSIFICATION VERSION 4.5 (C4.5)
oleh
DWI SETYOWATI
M0112026
SKRIPSI
ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar
Sarjana Sains Matematika
PROGRAM STUDI MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET SURAKARTA
2018
ii
iii
PERNYATAAN
Dengan ini saya menyatakan bahwa skripsi saya yang berjudul KLASIFIKASI
DATA PRODUKSI PADI PULAU JAWA MENGGUNAKAN ALGORITME
CLASSIFICATION VERSION 4.5 (C4.5) belum pernah diajukan untuk
memperoleh gelar kesarjanaan pada suatu perguruan tinggi, dan sepanjang
pengetahuan saya juga belum pernah ditulis atau dipublikasikan oleh orang lain,
kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar
pustaka.
Surakarta, Januari 2018
Dwi Setyowati
iv
ABSTRAK
Dwi Setyowati. 2018. KLASIFIKASI DATA PRODUKSI PADI PULAU
JAWA MENGGUNAKAN ALGORITME CLASSIFICATION VERSION 4.5
(C4.5). Fakultas Matematika dan Ilmu Pengetahuan Alam. Universitas Sebelas
Maret.
Padi merupakan tanaman pangan yang banyak diproduksi masyarakat
Indonesia. Jumlah penduduk Indonesia yang semakin meningkat mengakibatkan
semakin tinggi kebutuhan konsumsi pangan khususnya padi. Kebutuhan pangan
yang meningkat harus diimbangi dengan jumlah produksi yang meningkat pula.
Untuk menghindari jumlah impor beras yang berlebihan, perlu dilakukan
optimalisasi produksi padi di kota/kabupaten.
Penelitian ini bertujuan mengklasifikasi data produksi padi Pulau Jawa.
Metode yang digunakan adalah klasifikasi dengan Algoritme C4.5. Data yang
digunakan bersumber dari Badan Pusat Statistik.
Berdasarkan hasil penelitian, klasifikasi data produksi padi Pulau Jawa
menghasilkan pohon keputusan dengan 9 aturan klasifikasidan 4 klasifikasi status
kota/kabupaten. Tingkat keakuratan yang diperoleh dari pohon keputusan sebesar
83.19% sehingga pohon keputusan yang terbentuk cukup layak dalam
mengklasifikasi produksi padi Pulau Jawa.
Kata kunci: klasifikasi, produksi padi, algoritme C4.5
v
ABSTRACT
Dwi Setyowati. 2018. THE CLASSIFICATION OF RICE DATA
PRODUCTION OF JAVA ISLAND USING CLASSIFICATION VERSION 4.5
ALGORITHM (C4.5). Faculty of Mathematics and Nature Sciences. Sebelas
Maret University.
Rice is a food plantation which is mostly produced in Indonesia. The
number of population on Indonesia which continues to increase causes the higher
the consumption of food, especially rice. The needs of food which is increasing
should be balanced with the number of the production which increases to avoid
the number of imported rice. So it is important to know the city/regency in which
the production of rice need to be optimized.
The research is aim to classify the rice data production of Java Island to find
out the city/regency that are need to be optimized. The methods use is
C4.5Algorithm. The data used in form on secondary data which sourced from
Badan Pusat Statistik.
Based on the result of the research, the classification of rice data production
of Java Island resulted decision tree with 9 classification rules. The level of the
accuracy obtained from decision tree is 83.19%, so that the decision tree formed
quite worth in doing the classification of the rice data production of Java Island.
Keywords : classification, production of rice , C4.5 algorithm
vi
MOTO
“Maka sesungguhnya bersama kesulitan ada kemudahan. Sesungguhnya bersama
kesulitan ada kemudahan. Maka apabila engkau telah selesai (dari sesuatu
urusan), tetaplah bekerja keras (untuk urusan yang lain), dan hanya kepada
Tuhanmulah engkau berharap.”
Q.S. Al-Insyirah
94 : 5-8
vii
PERSEMBAHAN
Karya ini dipersembahkan untuk keluarga dan teman-teman atas motivasi,
doa, dan semangat yang diberikan.
viii
PRAKATA
Puji syukur kehadirat Tuhan Yang Maha Esa atas limpahan rahmatNya
sehingga penulis dapat menyelesaikan skripsi ini. Ucapan terimakasih penulis
sampaikan kepada
1. Dra. Yuliana Susanti, M.Si. sebagai Pembimbing I yang telah memberikan
bimbingan dalam hal penulisan skripsi, motivasi, pemilihan tema,
pedalaman materi, dan pengambilan data,
2. Supriyadi Wibowo, S.Si., M.Si. sebagai Pembimbing II yang telah
memberikan bimbingan, motivasi, dan penyusunan alur penulisan,
3. Bowo Winarno, S.Si., M.Kom. yang telah memberikan motivasi dan
bimbingan dalam pembuatan program, dan
4. seluruh pihak yang telah membantu dalam kelancaran skripsi ini.
Semoga skripsi ini dapat bermanfaat.
Surakarta, Januari 2018
Penulis
ix
DAFTAR ISI
HALAMAN JUDUL ....................................................................................... i
HALAMAN PENGESAHAN ........................................................................ ii
PERNYATAAN ........................................................................................... iii
ABSTRAK ..................................................................................................... iv
ABSTRACT ....................................................................................................... v
MOTO ........................................................................................................... vi
PERSEMBAHAN ......................................................................................... vii
PRAKATA ................................................................................................... viii
DAFTAR ISI .................................................................................................. ix
DAFTARTABEL ........................................................................................... xi
DAFTAR GAMBAR .................................................................................... xii
I PENDAHULUAN .......................................................................................... 1
1.1 Latar Belakang Masalah ............................................................................ 1
1.2 Perumusan Masalah .................................................................................. 3
1.3 Tujuan ....................................................................................................... 3
1.4 Manfaat ..................................................................................................... 3
II LANDASAN TEORI .................................................................................... 4
2.1 Tinjauan Pustaka ....................................................................................... 4
2.2 Teori Penunjang ........................................................................................ 6
2.2.1 Data Mining .................................................................................. 6
2.2.2 Klasifikasi ..................................................................................... 7
2.2.3 Pohon Keputusan .......................................................................... 7
2.2.4 Algoritme C4.5 .............................................................................. 9
x
2.2.5 Confusion Matrix ........................................................................ 11
2.3 Kerangka Pemikiran................................................................................ 13
III METODE PENELITIAN ............................................................................ 14
IV PEMBAHASAN ........................................................................................... 16
4.1 Deskripsi Atribut Data ............................................................................ 16
4.2 Analisis Algoritme C4.5 ......................................................................... 17
4.2.1 Menentukan Node Akar .............................................................. 18
4.2.2 Menentukan Node Cabang .......................................................... 19
4.3 Interpretasi Pohon Keputusan ................................................................. 26
4.4 Pengujian Akurasi Pohon Keputusan Algoritme C4.5 ........................... 28
4.5 Program dalam Delphi ............................................................................ 29
V PENUTUP ..................................................................................................... 32
5.1 Kesimpulan ............................................................................................. 32
5.2 Saran ....................................................................................................... 32
VI DAFTAR PUSTAKA 33
xi
DAFTAR TABEL
2.1 Model Confusion Matrix ......................................................................... 11
4.1 Kategori Variabel Target ........................................................................ 16
4.2 Kategori Variabel Input .......................................................................... 17
4.3 Hasil Perhitungan Iterasi Pertama ........................................................... 18
4.4 Hasil Perhitungan Iterasi Kedua ............................................................. 20
4.5 Hasil Perhitungan Iterasi Ketiga ............................................................. 21
4.6 Hasil Perhitungan Iterasi Keempat ......................................................... 23
4.7 Aturan Klasifikasi dengan Algoritme C4.5 ............................................ 26
4.8 Klasifikasi Status Kota/Kabupaten ......................................................... 27
4.9 Jumlah Klasifikasi Benar ........................................................................ 28
4.10 Confusion Matrix ................................................................................... 29
xii
DAFTAR GAMBAR
2.1 Struktur Pohon Keputusan ........................................................................ 8
2.2 Diagram Alur Algoritme C4.5 ................................................................. 15
4.1 Pohon Keputusan Hasil Perhitungan Iterasi Pertama .............................. 19
4.2 Pohon Keputusan Hasil Perhitungan Iterasi Kedua ................................ 21
4.3 Pohon Keputusan Hasil Perhitungan Iterasi Ketiga ................................ 22
4.4 Pohon Keputusan Hasil Perhitungan Iterasi Keempat ............................. 23
4.5 Pohon Keputusan Hasil Perhitungan Iterasi Kelima dan Keenam .......... 24
4.6 Pohon Keputusan Produksi Padi dengan Algoritme C4.5 ...................... 25
4.7 Klasifikasi Produksi Padi Tiap Kota/Kabupaten di Pulau Jawa ............. 27
4.8 Output Syntax Program Delphi ............................................................... 31