PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

102
PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI PENJUALAN BOTOL PADA CV. SERIBUKILO SKRIPSI Oleh: TRI BAGUS TUSARWENDA 311410769 PROGRAM STUDI TEKNIK INFORMATIKA SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA BEKASI 2018

Transcript of PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

Page 1: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

PENERAPAN DATA MINING DENGAN ALGORITMA

C4.5 DALAM PREDIKSI PENJUALAN BOTOL

PADA CV. SERIBUKILO

SKRIPSI

Oleh:

TRI BAGUS TUSARWENDA

311410769

PROGRAM STUDI TEKNIK INFORMATIKA

SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA

BEKASI

2018

Page 2: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

PENERAPAN DATA MINING DENGAN ALGORITMA

C4.5 DALAM PREDIKSI PENJUALAN BOTOL

PADA CV. SERIBUKILO

SKRIPSI

Diajukan Sebagai Salah Satu Syarat Untuk Menyelesaikan

Program Strata Satu (S1) pada Program Studi Teknik Informatika

Oleh:

TRI BAGUS TUSARWENDA

311410769

PROGTAM STUDI TEKNIK INFORMATIKA

SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA

BEKASI

2018

Page 3: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...
Page 4: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...
Page 5: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...
Page 6: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

iv

KATA PENGANTAR

Puji syukur penulis panjatkan ke hadiran Allah SWT. yang telah

melimpahkan segala rahmat dan hidayah-Nya, sehingga tersusunlah Skripsi yang

berjudul “PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM

PREDIKSI PENJUALAN BOTOL PADA CV.SERIBUKILO”.

Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam

rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer (S.Kom.)

pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi Pelita Bangsa.

Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan

terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah

selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan

terima kasih yang sebesar-besarnya kepada:

a. Bapak Dr. Ir. Suprianto, M.P selaku Ketua STT Pelita Bangsa

b. Bapak Aswan Supriyadi Sunge, S.Kom, M.Kom selaku Ketua Program Studi

Teknik Informatika STT Pelita Bangsa.

c. Bapak Aswan Supriyadi Sunge, S.Kom, M.Kom selaku Pembimbing Utama

yang telah banyak memberikan arahan dan bimbingan kepada penulis dalam

penyusunan Skripsi ini.

d. Ibu Nisa Nurhidayanti, S.Pd, M.T, selaku Pembimbing Kedua yang telah

banyak memberikan arahan dan bimbingan kepada penulis dalam penyusunan

Skripsi ini.

e. Seluruh Dosen STT Pelita Bangsa yang telah membekali penulis dengan

wawasan dan ilmu di bidang teknik informatika.

f. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya

kepada penulis selama perjalanan studi jenjang Strata 1.

g. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang

telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat

menyelesaikan studi jenjang Strata 1.

h. Ibu dan Ayah tercinta yang senantiasa mendo’akan dan memberikan semangat

dalam perjalanan studi Strata 1 maupun dalam kehidupan penulis.

Page 7: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

v

Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang terdapat

dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan manfaat bagi

khasanah pengetahuan Teknologi Informasi di lingkungan STT Pelita Bangsa

khususnya dan Indonesia pada umumnya.

Bekasi, November 2018

Penulis

Page 8: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

vi

DAFTAR ISI

PERSETUJUAN ...................................................................................................... i

PENGESAHAN ...................................................................................................... ii

PERNYATAAN KEASLIAN PENELITIAN ....................................................... iii

KATA PENGANTAR ........................................................................................... iv

DAFTAR ISI .......................................................................................................... vi

DAFTAR TABEL ................................................................................................... x

DAFTAR GAMBAR ............................................................................................ xii

ABSTRACT ......................................................................................................... xiii

ABSTAKSI .......................................................................................................... xiv

BAB I PENDAHULUAN ....................................................................................... 1

1.1 Latar Belakang Masalah ........................................................................... 1

1.2 Identifikasi Masalah ................................................................................. 3

1.3 Rumusan Masalah .................................................................................... 4

1.4 Batasan Masalah ....................................................................................... 4

1.5 Tujuan dan Manfaat .................................................................................. 4

1.5.1 Tujuan ............................................................................................... 4

1.5.2 Manfaat Penelitian ............................................................................ 5

1.6 Sistematika Penulisan ............................................................................... 5

BAB II TINJAUAN PUSTAKA ............................................................................. 7

Page 9: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

vii

2.1 Tinjauan Penelitian Terdahulu ................................................................. 7

2.2 Tinjauan Teori ........................................................................................ 12

2.2.1 Produk ............................................................................................. 12

2.2.2 Penjualan. ........................................................................................ 13

2.2.3 Laba..................................................................................................14

2.2.4 Machine Learning............................................................................15

2.2.5 Bagian Machine Learning...............................................................16

2.2.6 Data Mining......................................................................................17

2.2.7 Tahapan Data Mining.......................................................................19

2.2.8 Klasifikasi ..........................................................................................21

2.2.9 Prediksi ..............................................................................................23

2.2.10 Algoritma C4.5 ..................................................................................24

BAB III METODE PENELITIAN........................................................................ 28

3.1 Metode Penelitian ................................................................................... 28

3.2 Kerangka Berfikir ................................................................................... 29

3.3 Objek Penelitian.......................................................................................32

3.4 Bahan Penelitian ......................................................................................33

3.5 Alat Penelitian (RapidMiner)....................................................................34

3.6 Jenis Data .................................................................................................35

3.7 Teknik Analisa Data..................................................................................36

Page 10: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

viii

3.8 Tahapan Penelitian ...................................................................................37

3.8.1 Pengumpulan Data................................................................................39

3.8.2 Pengelolaan Awal Data.........................................................................49

3.8.3 Metode yang Diusulkan........................................................................52

BAB IV HASIL DAN PEMBAHASAN .............................................................. 54

4.1 Hasil ........................................................................................................ 54

4.1.1 Evaluasi dan Validasi Hasil Algoritma C4.5......................................54

4.1.2 Pemilihan Data....................................................................................67

4.1.3 Pemilihan Atribut Sebagai Label........................................................68

4.1.4 Cross Validation.................................................................................68

4.1.5 Main Proces Decision Tree..................................................................69

4.1.6 Main Proces Validation.......................................................................70

4.2 Pembahasan ............................................................................................ 71

4.2.1 Decision Tree......................................................................................71

4.2.2 Confusion Matrix ...............................................................................72

4.2.2.1 Accuracy (Data Training)..................................................72

4.2.2.2 Recal Data (Data Training)...............................................73

4.2.2.3 Accuracy (Data Testing).....................................................74

4.2.2.4 Recal Data (Data Testing).................................................75

4.2.3 ROC/AUC (Area Under Cover)........................................................75

Page 11: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

ix

4.2.3.1 ROC/AUC Data Training...................................................76

4.2.3.2 ROC/AUC Data Testing.....................................................77

BAB V KESIMPULAN ........................................................................................ 78

5.1 Kesimpulan ............................................................................................. 78

5.2 Saran ....................................................................................................... 78

DAFTAR PUSTAKA ........................................................................................... 80

Page 12: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

x

DAFTAR TABEL

Tabel 3.1 Data Jenis Botol .................................................................................... 40

Tabel 3.2 Data Jenis Botol (lanjutan) .................................................................... 41

Tabel 3.3 Data Jenis Botol (lanjutan).....................................................................42

Tabel 3.4 Data Jenis Botol (lanjutan).....................................................................43

Tabel 3.5 Data Jenis Botol (lanjutan).....................................................................44

Tabel 3.6 Data Jenis Botol (lanjutan).....................................................................45

Tabel 3.7 Data Jenis Botol (lanjutan).....................................................................46

Tabel 3.8 Atribut Data............................................................................................46

Tabel 3.9 Atribut Data (lanjutan)...........................................................................47

Tabel 3.10 Jurnal Penelitian Terdahulu..................................................................47

Tabel 3.11 Jurnal Penelitian Terdahulu (lanjutan).................................................48

Tabel 3.12 Jurnal Penelitian Terdahulu (lanjutan).................................................49

Tabel 3.13 Atribut Data Training...........................................................................49

Tabel 3.14 Atribut Data Training..........................................................................50

Tabel 4.1 Data Jenis Botol Keseluruhan................................................................54

Tabel 4.2 Data Jenis Botol Keseluruhan (lanjutan).................................................55

Tabel 4.3 Data Jenis Botol Keseluruhan (lanjutan).................................................56

Tabel 4.4 Data Jenis Botol Keseluruhan (lanjutan).................................................57

Tabel 4.5 Data Jenis Botol Keseluruhan (lanjutan).................................................58

Page 13: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

xi

Tabel 4.6 Data Jenis Botol Keseluruhan (lanjutan).................................................59

Tabel 4.7 Data Jenis Botol Keseluruhan (lanjutan).................................................60

Tabel 4.8 Data Jenis Botol Keseluruhan (lanjutan).................................................61

Tabel 4.9 Data Training (80% dari Data Keseluruhan)..........................................61

Tabel 4.10 Data Training Lanjutan (80% dari Data Keseluruhan).........................62

Tabel 4.11 Data Training Lanjutan (80% dari Data Keseluruhan).........................63

Tabel 4.12 Data Training Lanjutan (80% dari Data Keseluruhan).........................64

Tabel 4.13 Data Training Lanjutan (80% dari Data Keseluruhan).........................65

Tabel 4.14 Data Testing (20% dari Data Keseluruhan).........................................65

Tabel 4.15 Data Testing Lanjutan (20% dari Data Keseluruhan)...........................66

Page 14: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

xii

DAFTAR GAMBAR

Gambar 2.1 Tahapan Data Mining........................................................................ 19

Gambar 2.2 Rumus Gain Ration........ ....................................................................25

Gambar 2.3 Rumus Split Information............ ........................................................25

Gambar 2.4 Rumus Prepruning......... ....................................................................26

Gambar 3.1 Kerangka Berfikir .............................................................................. 30

Gambar 3.2 Logo Seribukilo ................................................................................. 33

Gambar 3.3 Tahapan Penelitian ............................................................................ 38

Gambar 3.4 Langkah Pengujian.............................................................................53

Gambar 4.1 Pemilihan Data....................................................................................67

Gambar 4.2 Pemilihan Atribut Sebagai Label........................................................68

Gambar 4.3 Cross Validation.................................................................................68

Gambar 4.4 Main Proces Decision Tree (Data Training) ....................................69

Gambar 4.5 Main Proces Validation.....................................................................70

Gambar 4.6 Decision Tree.....................................................................................71

Gambar 4.7 Acciracy Data Training......................................................................72

Gambar 4.8 Recall Data (Data Training)...............................................................73

Gambar 4.9 Accuracy (Data Training)...................................................................74

Gambar 4.10 Recall Data (Data Testing)...............................................................75

Gambar 4.11 ROC/AUC Data Training.................................................................76

Page 15: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

xiii

Gambar 4.12 ROC/AUC Data Testing...................................................................77

Page 16: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

xiv

ABSTRACT

Many people talk about business, business benefits and the many types of

businesses that are diverse, which certainly has one goal, which is to get financial

benefits or profits. With so many types of businesses and benefits that can be taken

from business, of course, we often feel like immediately jumping into the business

world to get more or more specific profits, namely income. One example of a

business is selling bottles. In selling, we certainly have a large collection of sales

data, so we must be able to process sales data to become new information. In this

case the C4.5 algorithm is a method that can help process or predict sales values

in the future. One software that can be used to help implement the C4.5 algorithm

and simultaneously process data so that the data can be useful and produce new

information, namely RapidMiner. This research was conducted in order to help

sellers to predict sales of merchandise, so that they can prepare or stock items that

are predicted to increase in sales. From this study it can be concluded that by using

the C4.5 algorithm, bottle sales can be predicted with a fairly high accuracy, the

results of measuring the accuracy of the data obtained from training data with

Confusion Matrix are 90.59% and the testing data reaches 88.00%. When viewed

with the ROC curve, training data has Excellent Classification accuracy of 0.998

and testing data with Excellent Classification accuracy of 1,000.

Keywords: Data Mining, Sales, Classification, C4.5 Algorithm, RapidMiner,

Prediction.

Page 17: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

xv

ABSTRAK

Banyak orang membicarakan tentang bisnis, keuntungan bisnis serta

banyaknya jenis bisnis yang beraneka ragam yang tentu memiliki satu tujuan yaitu

mendapatkan keuntungan secara finansial atau laba. Dengan begitu banyak jenis

bisnis dan manfaat yang bisa di ambil dari bisnis tentu seringkali kita merasa ingin

segera terjun ke dunia bisnis untuk mendapatkan keuntungan atau lebih spesifik

yaitu penghasilan. Salah satu contoh bisnis adalah berjualan botol. Didalam

berjualan pasti kita mempunyai sekumpulan data penjualan yang sangat banyak,

karena itu kita harus dapat mengolah data penjualan agar menjadi informasi baru.

Dalam kasus ini algoritma C4.5 merupakan sebuah metode yang bisa membantu

mengolah atau memprediksi nilai penjualan dimasa yang akan datang. Salah satu

software yang dapat digunakan untuk membantu menerapkan algoritma C4.5 dan

sekaligus mengolah data agar data tersebut dapat bermanfaat dan menghasilkan

sebuah informasi yang baru yaitu RapidMiner. Penelitian ini dilakukan dalam

rangka membantu para penjual untuk memprediksi penjualan barang dagangannya,

sehingga mereka dapat menyiapkan atau menyetok barang yang diprediksi akan

mengalami kenaikan dalam penjualanya. Dari penelitian ini dapat disimpulkan

bahwa dengan menggunakan algoritma C4.5 maka pejualan botol dapat diprediksi

dengan akurasi yang cukup tinggi, hasil pengukuran akurasi data yang diperoleh

dari data training dengan Confusion Matrix nilainya mencapai 90.59% dan data

testing tingkat akurasinya mencapai 88.00%. Jika dilihat dengan kurva ROC, data

training memiliki akurasi Excellent Classification sebesar 0.998 dan data testing

dengan akurasi Excellent Classification sebesar 1.000.

Kata kunci : Data Mining, Penjualan, Klasifikasi, Algoritma C4.5, RapidMiner,

Prediksi.

Page 18: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...
Page 19: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

1

BAB I

PENDAHULUAN

1.1 Latar Belakang Masalah

Banyak orang membicarakan tentang bisnis, keuntungan bisnis serta banyak nya

jenis bisnis yang beraneka ragam yang tentu memiliki satu tujuan yaitu mendapatkan

keuntungan secara finansial atau laba. Dengan begitu banyak jenis bisnis dan manfaat

yang bisa di ambil dari bisnis tentu seringkali kita merasa ingin segera terjun ke dunia

bisnis untuk mendapatkan keuntungan atau lebih spesifik yaitu penghasilan. Salah satu

contoh bisnis adalah berjualan atau berdagang.

Menjual suatu barang di era moderninsasi ini sudah sangatlah mudah, tidak seperti

dulu kita harus mempunyai suatu tempat atau toko untuk berjualan, di zaman sekarang

kita tidak harus memiliki tempat atau toko untuk berjualan, kita bisa berjualan secara

online, kita hanya memerlukan smartphone atau laptop dan koneksi internet serta barang

yang akan di jual. Setelah semua yang kita perlukan tersedia, kita hanya perlu

mengunjungi beberapa marketplace dan kita taruh barang jualan kita di marketplace

tersebut. Kita juga mendapatkan keuntungan yang sangat banyak misalnya kita tidak

perlu menyewa tempat, kita mendapatkan notifikasi saat barang jualan kita akan di belu

customer, kita mendapatkan rekap data transaksi penjualan yang cukup akurat, dan masih

banyak yang lainnya.

Dalam lingkungan bisnis yang global sekarang ini, setiap perusahaan dituntut

untuk mampu bersaing dalam meningkatkan kinerja dan mampu menghasilkan laporan

Page 20: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

2

yang sesuai, sehingga perusahaan dapat mengambil keputusan dari hasil kinerja dan

laporan tersebut. Di sisi lain perkembangan teknologi informasi mempengaruhi

pemrosesan data untuk menghasilkan informasi yang lebih cepat, akurat, aktual, dan

relevan untuk meningkatkan ketepatan atau akurasi dalam pengambilan keputusan.

Dizaman sekarang hampir semua toko online maupun offline menggunakan

sistem komputerisasi dalam penyimpanan data penjualan, sehingga banyak data transaksi

akan dihasilkan. Data transaksi yang ada dalam database penjualan barang menyimpan

jumlah record transaksi penjualan yang memiliki volume yang sangat besar sehingga

menyebabkan jumlah data terus menerus bertambah setiap hari. Dari penumpukkan data

yang tejadi dapat digali untuk menemukan pola-pola penjualan barang yang dapat

digunakan untuk menganalisa pasar dan meramalkan penjualan pada waktu yang akan

datang.

Prediksi jumlah penjualan merupakan faktor penting yang menentukan kelancaran

usaha suatu perusahaan. Prediksi ini sangat berguna untuk menentukan berapa banyak

barang yang akan dipesan pada bulan selanjutnya. Permasalahan yang umum dihadapi

oleh suatu perusahaan adalah bagaimana memprediksi atau meramalkan penjualan barang

di masa mendatang berdasarkan data penjualan sebelumnya. Prediksi tersebut sangat

berpengaruh untuk menentukan target penjualan yang harus dicapai. Perencanaan yang

efektif baik untuk jangka panjang maupun jangka pendek bergantung pada peramalan

permintaan untuk produk yang akan dijual. Untuk menghasilkan prediksi yang tepat tentu

saja dibutuhkan kecermatan dan ketelitian.

Page 21: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

3

CV.Seribukilo merupakan suatu tempat penjualan macam–macam jenis botol,

berbagai macam bentuk dan berbagai macam model yang dijualnya, dari yang berbahan

plastik sampai yang berbahan kaca. CV.Seribukilo pun menjual barang dagangannya di

berbagai macam marketplace seperti Tokopedia, Bukalapak dan Shopee. Dengan harga

jualnya yang cukup murah, CV.Seribukilo pun memperoleh penjualan yang sangat

banyak sehingga kehabisan stok barang. Pemilik CV.Seribukilo ini pun ingin mengetahui

seberapa banyak penjualan di bulan berikutnya sehingga penjual dapat menyiapkan

barang yang cukup untuk di jual dibulan berikutnya.

Salah satu wujud nyata dari upaya ini yaitu menghitung potensi penjualan

seakurat mungkin sehingga akan diketahui seberapa besar penjualan pada CV.Seribukilo.

Algoritma yang akan digunakan untuk memprediksi penjualan dalam kasus ini adalah

algoritma C4.5, Metode ini akan berusaha mendapatkan prediksi penjualan dan dapat

diketahui gambaran fluktuasi penjualan pada perusahaan tersebut. Dari latar belakang

diatas, maka penulis berkeinginan untuk menyusun tugas akhir dengan judul “Penerapan

Data Mining Dengan Algoritma C4.5 Dalam Prediksi Penjualan Botol Pada

CV.Seribukilo”.

1.2 Identifikasi Masalah

Berdasarkan latar belakang masalah yang telah diuraikan diatas, maka penulis

mengidentifikasi masalah penelitian sebagai berikut:

1. Belum adanya suatu metode dalam penentuan prediksi penjualan produk di

CV.Seribukilo.

Page 22: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

4

2. Belum adanya suatu akurasi yang tepat dalam melihat penentuan suatu prediksi

penjualan produk.

1.3 Batasan Masalah

Untuk membatasi cakupan dari pokok pembahasan dan permasalahan yang akan

dipecahkan, maka dibuat batasan masalah sebagai berikut:

1. Penentuan akurasi untuk memprediksi penjualan produk.

2. menguji suatu metode (dalam hal ini algoritma C4.5) dalam klasifikasi data

mining terutama dalam hal prediksi penjualan produk.

1.4 Rumusan Masalah

Dari identfikasi masalah dan batasan masalah maka disimpulkan rumusan

masalah yaitu “Bagaimana tingkat akurasi penggunaan metode C4.5 dalam memprediksi

penjualan botol pada CV.Seribukilo?.”

1.5 Tujuan dan Manfaat Penelitian

1.5.1 Tujuan

Tujuan yang ingin dicapai dalam penelitian ini adalah untuk mendapatkan tingkat

akurasi dalam memprediksi penjualan botol pada CV.Seribukilo dengan menggunakan

algoritma C4.5.

Page 23: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

5

1.5.2 Manfaat Penelitian

Dengan tercapainya tujuan penelitian di atas, maka diharapkan akan bermanfaat

bagi semua pihak, bagi CV.Seribukilo maupun bagi penulis. Manfaat dari penelitian ini

adalah:.

1. Bagi Penulis

a. Menambah wawasan dan pengetahuan penulis tentang algoritma C4.5 untuk

prediksi tingkat penjualan barang.

b. Menerapkan ilmu yang telah didapat selama kuliah.

2. Bagi Institusi

Sebagai bahan masukan bagi perguruan tinggi untuk memperbaiki praktik-praktik

pembelajaran agar staff pengajar menjadi lebih kreatif, efektif, dan efisien

sehingga kualitas pembelajaran dan hasil belajar siswa meningkat.

3. Bagi CV.Seribukilo

Dapat digunakan untuk mengetahui tingkat penjualan barang pada masa

mendatang

1.6 Sistematika Penulisan

Gambaran secara garis besar mengenail hal-hal yang akan di bahas dalam

penulisan penelitian ini terdiri dari lima bab yaitu:

BAB I PENDAHULUAN

Dalam bab ini penulis menguraikan mengenai latar belakang

masalah, identifikasi masalah, batasan masalah, rumusan maslah.

Page 24: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

6

maksud dan tujuan penelitian, manfaat penelitian, metode

pengumpulan data, serta sistematika penulisan.

BAB II TINJAUAN PUSTAKA

Dalam bab ini berisi tentang teori yang mendasari judul dan

tinjauan penelitian terdahulu yang berkaitan dengan judul

penelitian ini.

BAB III METODOLOGI PENELITIAN

Bab ini memaparkan tentang objek yang dijadikan penelitian dan

rancangan atau langkah-langkah atau metode yang diuraikan

secara detail dipergunakan untuk memecahkan masalah yang

diambil dalam penelitian tugas akhir.

BAB IV HASIL DAN PEMBAHASAN

Dalam bab ini berisi tentang hasil penelitian dan pembahasan dari

jawaban hasil penelitian terhadap rumusan masalah.

BAB V PENUTUP

Bab ini memberikan penjelasan mengenai kesimpulan dan saran

yang diberikan untuk dijadikan sebagai bahan perbaikan untuk

penelitian selanjutnya.

Page 25: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

7

BAB II

TINJAUAN PUSTAKA

2.1 Tinjauan Penelitian Terdahulu

1. Penerapan Data Mining Dalam Memprediksi Pembelian Cat (Fitriana Harahap,

2015), penelitian ini merupakan penerapan teknik klasifikasi data mining pada

pembelian cat yang efektif pada departement penjualan home smart, diharapkan

nantinya dapat menghasilkan suatu pengetahuan yang dapat digunakan dalam

pengambilan keputusan dalam melakukan pembelian cat yang efektif. Algoritma

C4.5 adalah algoritma klasifikasi data bertipe pohon keputusan. Pohon keputusan

Algoritma C4.5 dibangun dengan beberapa tahap yang meliputi pemilihan atribut

sebagai akar, membuat cabang untuk tiap-tiap nilai dan membagi kasus dalam

cabang. Tahapantahapan ini akan diulangi untuk setiap cabang sampai semua

kasus pada cabang memiliki kelas yang sama. Dari penyelesaian pohon keputusan

maka akan didapatkan beberapa rule. Dalam hal ini penulis mengklasifikasikan

pembelian cat berdasarkan penjualan pada departement penjualan home smart.

Penerapan Algoritma C4.5 ini dapat membantu departement penjuan home smart

dalam menentukan pembelian cat dari suplier.

2. Analisa Penerapan Algoritma C4.5 Untuk Mempredikasi Penjualan Motor Pada

PT. Capella Dinamik Nusantara Cabang Muka Kuning (Azwanti Nurul, 2018),

penelitian ini membahas tentang analisa diperlukan untuk melihat pola dari data

penjualan sehingga dapat menghasilkan prediksi penjualan motor yang nantinya

Page 26: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

8

akan berguna untuk pendistribusian motor dibeberapa wilayah. Dari data

konsumen yang begitu banyak, maka dilakukan data mining dengan

menggunakan algoritma C4.5. Hasil dari kegiatan mining ini diharapkan dapat

memberikan sebuah pohon keputusan untuk melihat pola prediksi perilaku

konsumen membeli motor.

3. Prediksi Kompetensi Karyawan Menggunakan Algoritma C4.5 Studi Kasus: PT.

Hankook Tire Indonesia (Aswan Supriyadi Sunge, 2018), penelitian ini

membahas tentang ketidak kompetensi merupakan hal yang merugikan dari segi

perusahaan maupun karyawan tersebut, apa lagi persaingan yang sangat ketat

pada era sekarang ini yang harus mencari orang-orang berkompenten, oleh karena

itu dibutuhkan teknik klasifikasi dan prediksi data mining dalam memecahkan

masalah tersebut. Klasifikasi yang digunakan dalam data mining adalah Decision

Tree dikarenakan merupakan teknik yang banyak digunakan dan menghasilkan

output yang dengan aturan yang ada, dengan hal tersebut dapat menyajikan data

ketidak kompetensi karyawan. Dalam penelitian ini menggunakan Algoritma

C4.5 untuk menghasilkan aturan klasifikasi ketidak kompentesi karyawan dan

hasil akurasinya di dapat.

4. Penerapan Data Mining Untuk Prediksi Penjualan Wallpaper Menggunakan

Algoritma C4.5 (Juna Eska, 2016) jurnal ini membahas tentang presiksi penjualan

wallpaper. Wallpaper dinding rumah atau kertas dinding merupakan hiasan

dinding dengan bermacam motif dan warna. Kertas dinding digunakan untuk

mengubah penampilan suatu ruang agar semakin cantik dan memiliki nilai

Page 27: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

9

tambah. Dinding rumah yang polos cenderung membuat penghuni rumah merasa

bosan karena tampilan dinding yang monoton. Untuk itu, memiliki inisiatif

mendesain dinding rumah dengan wallpaper menjadi satu ide cemerlang yang

harus dicoba. Mewarnai dinding rumah dengan wallpaper memang bisa

menambah kesan indah pada suatu ruangan, sehingga ruangan terlihat lebih

ekspresif. Bermacam motif, warna, dan corak wallpaper dapat dipilih. Oleh karena

itu penjual harus lebih cermat menyediakan wallpaper mana yang akan banyak

peminatnya, sehingga perlu perekomendasian jenis jenis wallpaper dengan

menggunakan metode klasifikasi dilakukan menggunakan data mining algoritma

C4.5.

5. Closed Item-Set Mining for Prediction of Indian Summer Monsoon Rainfall A

Data Mining Model with Land and Ocean Variables as Predictors

(H.Vathsala,2015) Penelitian ini membahas tentang menambang aturan asosiasi

dari 37 (1969-2005) tahun monsun musim panas India data curah hujan dan coba

penerapannya dalam membantu prediksi yang lebih baik dari curah hujan

monsoon musim panas India. Kami memilih 36 variabel sebagai prediktor yang

mungkin dari curah hujan monsoon musim panas India berdasarkan literatur

sebelumnya dan membandingkan prediksi menggunakan semua 36 variabel dan

prediksi oleh atribut yang dipilih dari aturan asosiasi turunan. Hasil menunjukkan

kinerja yang lebih baik dalam prediksi semua wilayah India, wilayah tengah Barat

dan curah hujan wilayah Semenanjung ketika seleksi atribut digunakan

dibandingkan dengan semua 36 variabel digunakan untuk prediksi.

Page 28: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

10

6. Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa (Liliana

Suastina,2013) Penelitian ini membahas tentang pemilihan jurusan yang tidak

sesuai dengan kemampuan, kepribadian, minat dan bakat dapat mempengaruhi

mahasiswa dalam mengikuti perkuliahan. Penggunaan pendekatan algoritma

klasifikasi data mining akan diterapkan untuk menentukan jurusan dalam bidang

studi yang akan diambil oleh mahasiswa, sehingga mahasiswa tidak salah dalam

memilih jurusan yang akan di tempuh selama belajar pada perguruan tinggi.

Algoritma C4.5 digunakan untuk menentukan jurusan yang akan diambil oleh

mahasiswa sesuai dengan latar belakang, minat dan kemampuannya sendiri.

Parameter pemilihan jurusan adalah Indeks Prestasi Kumulatif Semester 1 dan 2.

Hasil eksperimen dan evaluasi menunjukan bahwa Algoritma Decision Tree C4.5

akurat diterapkan untuk penentuan kesesuaian jurusan mahasiswa dengan tingkat

akurasi 93,31 % dan akurasi rekomendasi jurusan sebesar 82,64%.

7. Analisa dan Penerapan Metode C4.5 Untuk Prediksi Loyalitas Pelanggan (Teguh

Budi Santoso, 2013) penelitian ini membahas tentang berbagai cara dilakukan

oleh masing-masing provider untuk memenangkan persaingan, antara lain yakni

dengan mempertahankan loyalitas pelanggan. Penelitian ini bertujuan membentuk

model klasifikasi pohon keputusan untuk memprediksi loyalitas pelanggan dan

melihat variable yang paling berpengaruh. Obyek dalam penelitian ini adalah

pelanggan. Data yang digunakan adalah data primer dari penyebaran kuisioner

berupa pertanyaan. Pembentukan model prediksi menggunakan metode C4.5.

pada algoritma C4.5 dilakukan perhitungan entropy dan information gain dimana

Page 29: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

11

atribut loyalitas pelanggan sebagai atribut tujuan, sedangkan harga, pelayanan,

promosi, citra perusahaan, dan kepercayaan sebagai atribut sumber untuk

memperoleh node akar dan node lainnya. Berdasarkan hasil klasifikasi

menggunkan algoritma C4.5 menunjukkan bahwa diperoleh akurasi mencapai

97.5%, yang menunjukkan bahwa algoritma C4.5 cocok digunakan untuk

mengukur tinggkat loyalitas pelanggan data seluler.

8. Kajian Penerapan Metode klasifikasi Data Mining Algoritma C4.5 Untuk

Prediksi Kelayakan Kredit Pada Bank Mayapada jakarta (Nandang Iriadi, 2016)

Industri perbankan mengalami perkembangan yang cukup pesat, baik dari sisi

volume usaha, mobilisasi dana masyarakat maupun pemberian kredit. Data

mining mengenai pinjaman memiliki potensial besar untuk menjelajahi bagian

pola yang tersembunyi dalam suatu dataset dari domain pinjaman termasuk

pinjaman kredit. Algoritma C4.5 merupakan pengklasifikasian yang paling

sederhana, mudah diimplemntasikan. Namun, Algoritma C4.5 masih memiliki

kelemahan dalam menangani data dalam dimensi tinggi. Penelitian ini bertujuan

untuk menerapkan algoritma C4.5 dengan seleksi atribut sehingga dapat

mengurangi dimensi dari data, serta mengidentifikasi fitur dalam kumpulan data

dengan metode algoritma C4.5. Dari penelitian ini yang dilakukan model yang

terbentuk dengan algoritma C4.5 sendiri sudah memiliki akurasi yang baik yaitu

sebesar 83.67% dengan proses seleksi atribut oleh algoritma C4.5.

Page 30: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

12

2.2 Tinjauan Teori

2.2.1 Produk

Produk merupakan titik pusat dari kegiatan pemasaran karena produk merupakan

hasil dari suatu perusahaan yang dapat ditawarkan ke pasar untuk di konsumsi dan

merupakan alat dari suatu perusahaan untuk mencapai tujuan dari perusahaannya. Suatu

produk harus memiliki keunggulan dari produk-produk yang lain baik dari segi kualitas,

desain, bentuk, ukuran, kemasan, pelayanan, garansi, dan rasa agar dapat menarik minat

konsumen untuk mencoba dan membeli produk tersebut.

Pengertian produk menurut Kotler (2009) adalah segala sesuatu yang dapat

ditawarkan kepasar untuk mendapatkan perhatian, dibeli digunakan, atau dikonsumsi

yang dapat memuaskan keinginan atau kebutuhan.

Sedangkan pengertian produk ( product ) menurut Kotler & Armstrong

(2001:346) adalah segala sesuatu yang dapat ditawarkan kepasar untuk mendapatkan

perhatian, dibeli, digunakan, atau dikonsumsi yang dapat memuaskan keinginan atau

kebutuhan. Secara konseptual produk adalah pemahaman subyektif dari produsen atas

sesuatu yang bisa ditawarkan sebagai usaha untuk mencapai tujuan organisasi melalui

pemenuhan kebutuhan dan kegiatan konsumen, sesuai dengan kompetensi dan kapasitas

organisasi serta daya beli pasar. Selain itu produk dapat pula didefinisikan sebagai

persepsi konsumen yang dijabarkan oleh produsen melalui hasil produksinya. Produk

dipandang penting oleh konsumen dan dijadikan dasar pengambilan keputusan

pembelian.

Page 31: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

13

2.2.2 Penjualan

Ada beberapa pengertian penjualan menurut beberapa ahli, yaitu sebagai berikut:

1. Menurut Moekijat (2000:48), “penjualan adalah suatu kegiatan yang ditujukan

untuk mencari pembeli, mempengaruhi, dan memberi petunjuk agar pembelian

dapat menyesuaikan kebutuhannya dengan produksi yang ditawarkan serta

mengadakan perjanjian mengenai harga yang menguntungkan kedua belah pihak”

2. Menurut Rudianto (2009:104), penjualan merupakan sebuah aktivitas yang

mengakibatkan arus barang keluar perusahaan sehingga perusahaan memperoleh

penerimaan uang dari pelanggan. Penjualan untuk perusahaan jasa, adalah jasa

yang dijual perusahaan tersebut. Untuk perusahaan dagang, adalah barang yang

diperjualbelikan perusahaan tersebut. Sedangkan untuk perusahaan manufaktur,

penjualan adalah barang yang diproduksi dan dijual perusahaan tersebut.

3. Penjualan merupakan kegiatan yang dilakukan oleh penjual dalam menjual barang

atau jasa dengan harapan akan memperoleh laba dari adanya transaksi-transaksi

tersebut (Mulyadi,2014).

4. Menurut Swastha (2014:246), penjualan adalah suatu proses pertukaran barang

atau jasa antara penjual dan pembeli. Jadi dapat disimpulkan bahwa penjualan

adalah usaha yang dilakukan manusia untuk menyampaikan barang kebutuhan

yang telah dihasilkan kepada mereka yang membutuhkan yang telah ditentukan

atas tujuan bersama.

Page 32: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

14

2.2.3 Laba

Menurut Darsono (2008:177) Laba adalah prestasi seluruh karyawan dalam

suatu perusahaan yang dinyatakan dalam bentuk uang yaitu selisih antara pendapatan

dikurangi beban.

Laba adalah kenaikan modal (aktiva bersih) yang berasal dari transaksi sampingan

atau transaksi yang jarang terjadi dari suatu badan usaha, dan dari semua transaksi atau

kejadian lain yang mempunyai badan usaha selama satu periode, kecuali yang timbul dari

pendapatan (revenue) atau investasi pemilik (Baridwan, 1992: 55).

Pengertian laba secara umum adalah selisih dari pendapatan di atas biaya-

biayanya dalam jangka waktu (perioda) tertentu. Laba sering digunakan sebagai suatu

dasar untuk pengenaan pajak, kebijakan deviden, pedoman investasi serta pengambilan

keputusan dan unsur prediksi (Harnanto, 2003: 444).

Dalam teori ekonomi juga dikenal adanya istilah laba, akan tetapi pengertian laba

di dalam teori ekonomi berbeda dengan pengertian laba menurut akuntansi. Dalam teori

ekonomi, para ekonom mengartikan laba sebagai suatu kenaikan dalam kekayaan

perusahaan, sedangkan dalam akuntansi, laba adalah perbedaan pendapatan yang

direalisasi dari transaksi yang terjadi pada waktu dibandingkan dengan biaya-biaya yang

dikeluarkan pada periode tertentu. Laba atau rugi sering dimanfaatkan sebagai ukuran

untuk menilai prestasi perusahaan atau sebagai dasar ukuran penilaian yang lain, seperti

laba per lembar saham. Unsur-unsur yang menjadi bagian pembentuk laba adalah

pendapatan dan biaya. Dengan mengelompokkan unsur-unsur pendapatan dan biaya,

Page 33: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

15

akan dapat diperoleh hasil pengukuran laba yang berbeda antara lain: laba kotor, laba

operasional, laba sebelum pajak, dan laba bersih (Harahap, 1997).

2.2.4 Machine Learning

Machine learning adalah cabang dari kecerdasan buatan, merupakan disiplin ilmu

yang mencakup perancangan dan pengembangan algoritma yang memungkinkan

komputer untuk mengembangkan perilaku yang didasarkan kepada data empiris, seperti

dari sensor data pada basis data. Sistem pembelajaran dapat memanfaatkan contoh (data)

untuk menangkap ciri yang diperlukan dari probabilitas yang mendasarinya (yang tidak

diketahui). Data dapat dilihat sebagai contoh yang menggambarkan hubungan antara

variabel yang diamati. Fokus besar penelitian Machine learning adalah bagaimana

mengenali secara otomatis pola kompleks dan membuat keputusan cerdas berdasarkan

data. Kesukarannya terjadi karena himpunan semua perilaku yang mungkin, dari semua

masukan yang dimungkinkan, terlalu besar untuk diliput oleh himpunan contoh

pengamatan (data pelatihan). Karena itu Machine learning harus merampatkan

(generalisasi) perilaku dari contoh yang ada untuk menghasilkan keluaran yang berguna

dalam kasus-kasus baru (Purnamasari, 2015).

Sejak pertama kali komputer diciptakan manusia sudah memikirkan bagaimana

caranya agar komputer dapat belajar dari pengalaman. Hal tersebut terbukti pada tahun

1952, Arthur Samuel menciptakan sebuah program, game of checkers, pada sebuah

komputer IBM. Program tersebut dapat mempelajari gerakan untuk memenangkan

permainan checkers dan menyimpan gerakan tersebut kedalam memorinya.

Page 34: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

16

Istilah machine learning pada dasarnya adalah proses komputer untuk belajar dari data

(learn from data). Tanpa adanya data, komputer tidak akan bisa belajar apa-apa. Oleh

karena itu jika kita ingin belajar machine learning, pasti akan terus berinteraksi dengan

data. Semua pengetahuan machine learning pasti akan melibatkan data. Data bisa saja

sama, akan tetapi algoritma dan pendekatan nya berbeda-beda untuk mendapatkan hasil

yang optimal. (Purnamasari, 2015).

2.2.5 Bagian Machine Learning

Ada beberapa bagian pada machine learning, sistem pembelajaran mesin terdiri

dari tiga bagian utama, yaitu (Tom Mitcel,1997):

1. Model: sistem yang membentuk prediksi atau identifikasi.

2. Parameter: sinyal atau faktor yang digunakan oleh model untuk membentuk

keputusannya.

3. Pembelajaran: sistem yang menyesuaikan parameter dan model dalam prediksi

versus hasil aktual.

Machine learning merupakan salah satu cabang dari disiplin ilmu Kecerdasan

Buatan (Artificial Intellegence) yang membahas mengenai pembangunan sistem yang

berdasarkan pada data. Banyak hal yang dipelajari, akan tetapi pada dasarnya ada 4 hal

pokok yang dipelajari dalam machine learning (Tom Mitcel, 1997):

1. Supervised machine learning algorithms

Supervised machine learning adalah algoritma machine learning yang dapat

menerapkan informasi yang telah ada pada data dengan memberikan label

Page 35: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

17

tertentu, misalnya data yang telah diklasifikasikan sebelumnya (terarah).

Algoritma ini mampu memberikan target terhadap output yang dilakukan dengan

membandingkan pengalaman belajar di masa lalu.

2. Unsupervised machine learning algorithms

Unsupervised machine learning adalah algoritma machine learning yang

digunakan pada data yang tidak mempunyai informasi yang dapat diterapkan

secara langsung (tidak terarah). Algoritma ini diharapkan mampu menemukan

struktur tersembunyi pada data yang tidak berlabel.

3. Semi-supervised machine learning algorithms

Semi-supervised machine learning adalah algoritma yang digunakan untuk

melakukan pemebelajaran data berlabel dan tanpa label. Sistem yang

menggunakan metode ini dapat meningkatkan efesiensi output yang dihasilkan.

4. Reinforcement machine learning algorithms

Reinforcement machine learning adalah algoritma yang mempunyai kemampuan

untuk bertinteraksi dengan proses belajar yang dilakukan, algoritma ini akan

memberikan poin (reward) saat model yang diberikan semakin baik atau

mengurangi poin (error) saat model yang dihasilkan semakin buruk. Salah satu

penerapannya adalah pada mesin pencari.

2.2.6 Data Mining

Berikut ini beberapa definisi dari data mining:

Page 36: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

18

1. Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu

kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual

(Pramudiono, 2006).

2. Data mining adalah analisis otomatis dari data yang berjumlah besar atau

kompleks dengan tujuan untuk menemukan pola atau kecenderungan yang

penting yang biasanya tidak disadari keberadaannya (Pramudiono, 2006).

3. Data mining merupakan analisis dari peninjauan kumpulan data untuk

menemukan hubungan ynag tidak diduga dan meringkas data dengan cara yang

berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik

data (Larose, 2005).

4. Data mining merupakan bidang dari beberapa bidang keilmuan yang menyatukan

teknik dari pembelajaran mesin, pengenalan pola, statistik, basis data, dan

visualisasi untuk penanganan permasalahan pengambilan informasi dari basis data

yang besar (Larose, 2005).

Asal muasal data mining dari kata mining yang artinya tambang jika

dikembangkan menggali data yang telah lampau. Data mining merupakan proses terpadu

dari analisis data yang terdiri dari serangkaian kegiatan yang berjalan berdasarkan definisi

tujuan yang akan dianalisis, dengan analisis datanya sampai interpretasi dan evaluasi hasil

(Giudici & Figini, 2009).

Pengumpulan data mining bukan sekedar terkumpul data saja tetapi mencakup

analisis dan prediksi dari informasi yang ingin ditampilkan. Data yang dikumpulkan

disimpan dalam database kemudian diproses sehingga dapat dijadikan untuk pengambilan

Page 37: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

19

keputusan dalam melihat informasi yang akan digunakan. Data mining dan Knowledge

Discovery in Databases (KDD) sering kali digunakan secara bergantian dalam

menjelaskan proses penggalian informasi dalam basis data yang sangat besar akan tetapi

berkaitan satu sama yang lain, skema proses KDD (Han & Kamber, 2006).

2.2.7 Tahapan Data Mining

Tahap- tahap data mining adalah sebagai berikut (Fayyad, 1996):

Gambar 2.1 Tahap Data Mining

Sumber: Fayyad

1. Data Selection

a. Menciptakan himpunan data target , pemilihan himpunan data, atau

memfokuskan pada subset variabel atau sampel data, dimana penemuan

(discovery) akan dilakukan.

Page 38: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

20

b. Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan

sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil

seleksi yang akan digunakan untuk proses data mining, disimpan dalam

suatu berkas, terpisah dari basis data operasional.

2. Pre-processing/ Cleaning

a. Pemprosesan pendahuluan dan pembersihan data merupakan operasi dasar

seperti penghapusan noise dilakukan.

b. Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses

cleaning pada data yang menjadi fokus KDD.

c. Proses cleaning mencakup antara lain membuang duplikasi data,

memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data,

seperti kesalahan cetak (tipografi).

d. Dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah

ada dengan data atau informasi lain yang relevan dan diperlukan untuk

KDD, seperti data atau informasi eksternal.

3. Transformation

a. Pencarian fitur-fitur yang berguna untuk mempresentasikan data

bergantung kepada goal yang ingin dicapai.

b. Merupakan proses transformasi pada data yang telah dipilih, sehingga data

tersebut sesuai untuk proses data mining. Proses ini merupakan proses

kreatif dan sangat tergantung pada jenis atau pola informasi yang akan

dicari dalam basis data.

Page 39: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

21

4. Data mining

a. Pemilihan tugas data mining; pemilihan goal dari proses KDD misalnya

klasifikasi, regresi, clustering, dan lain-lain.

b. Pemilihan algoritma data mining untuk pencarian (searching).

c. Proses Data mining yaitu proses mencari pola atau informasi menarik

dalam data terpilih dengan menggunakan teknik atau metode tertentu.

Teknik, metode, atau algoritma dalam data mining sangat bervariasi.

Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan

dan proses KDD secara keseluruhan.

5. Interpretation/ Evaluation

a. Penerjemahan pola-pola yang dihasilkan dari data mining.

b. Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan

dalam bentuk yang mudah mimengerti oleh pihak yang berkepentingan.

c. Tahap ini merupakan bagian dari proses KDD yang mencakup

pemeriksaan apakah pola atau informasi yang ditemukan bertentangan

dengan fakta atau hipotesa yang ada sebelumnya.

2.2.8 Klasifikasi

Menurut Jiawei Han (2012:327) dalam ebook yang berjudul "Data Mining

Concepts and Techniques" Klasifikasi adalah suatu bentuk analisis data yang

mengekstrak model yang menggambarkan kelas data penting. Model seperti itu, yang

disebut penggolong, memprediksi label kelas kategoris (diskrit, tidak berurutan).

Page 40: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

22

Misalnya, kita bisa membangun klasifikasi untuk mengkategorikan aplikasi pinjaman

bank aman atau berisiko analisis semacam itu dapat membantu kami memahami data

dengan lebih baik besar. Banyak metode klasifikasi yang telah diajukan oleh peneliti

dalam pembelajaran mesin, pengenalan pola, dan statistik. Kebanyakan algoritma adalah

memori penduduk, biasanya dengan asumsi ukuran data yang kecil. Penelitian data

mining terbaru telah dibangun di atas pekerjaan semacam itu, berkembang klasifikasi

terukur dan teknik prediksi yang mampu menangani sejumlah besar data disk- resident.

Klasifikasi memiliki banyak aplikasi, termasuk deteksi kecurangan, target pemasaran,

prediksi kinerja, manufaktur, dan diagnosis medis.

Menurut Luthfi (2009) klasifikasi adalah proses pengelompokan benda

berdasarkan ciri-ciri persamaan dan perbedaan. Dalam klasifikasi, terdapat terget variabel

kategori. sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori

yaitu: pendapatan tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain

klasifikasi dalam bisnis dan penelitian adalah:

1. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang

atau bukan.

2. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu

kredit yang baik atau buruk.

3. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk kategori

penyakit apa.

Page 41: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

23

2.2.9 Prediksi

Adapun pengertian prediksi menurut para ahli dan menurut Kamus Besar Bahasa

Indonesia (KBBI) yaitu:

1. Prediksi adalah suatu proses memperkirakan secara sistematis tentang sesuatu

yang paling mungkin terjadi di masa depan berdasarkan informasi masa lalu dan

sekarang yang dimiliki, agar kesalahannya (selisih antara sesuatu yang terjadi

dengan hasil perkiraan) dapat diperkecil. Prediksi tidak harus memberikan

jawaban secara pasti kejadian yang akan terjadi, melainkan berusaha untuk

mencari jawaban sedekat mungkin yang akan terjadi (Herdianto, 2013 : 8).

2. Menurut Kamus Besar Bahasa Indonesia (KBBI) prediksi adalah hasil dari

kegiatan memprediksi atau meramal atau memperkirakan nilai pada masa yang

akan datang dengan menggunakan data masa lalu. Prediksi menunjukkan apa

yang akan terjadi pada suatu keadaan tertentu dan merupakan input bagi proses

perencanaan dan pengambilan keputusan.

3. Menurut Render (2001) Peramalan (forecasting) adalah seni dan ilmu

memprediksi peristiwa-peristiwa masa depan dengan pengambilan data historis

dan memproyeksikannya ke masa depan dengan menggunakan beebrapa bentuk

model matematis.

4. Pengertian ramalan penjualan menurut Nafarin (2000) adalah proses kegiatan

memperkirakan produk yang akan dijual pada waktu yang akan datang dalam

keadaan tertentu dan dibuah berdasasrkan data yang pernah terjadi dan atau tidak

mungkin akan terjadi.

Page 42: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

24

2.2.10 Algoritma C4.5

Algoritma C4.5 merupakan algortima yang digunakan untuk membentuk pohon

keputusan. Pohon keputusan merupakan metodeklasifikasi dan prediksi yang sangat kuat

dan terkenal. Metode pohon keputusa mengubah fakta yang sangat besar menjadi pohon

keputusanyang merepresentasikan aturan. Aturan dapat dengan mudah dipahami dengan

bahasa alami. Dan mereka juga dapat diekspresikan dalam bentukbahasa basis data

seperti Structured Query Language untuk mencari record pada kategori tertentu (Kusrini,

2009).

Algoritma C4.5 merupakan kelompok algoritma Decision Tree. Algoritma ini

mempunyai input berupa training samples dan samples. Training samples berupa data

contoh yang akan digunakan untuk membangun sebuah tree yang telah diuji

kebenarannya. Sedangkan samplesmerupakan field-field data yang nantinya akan

digunakan sebagai parameter dalam melakukan klasifikasi data (Sunjana, 2010)

Menurut (Quinlan, 1993) Algoritma C4.5 adalah salah satu metode untuk

membuat decision tree berdasarkan training data yang telah disediakan. Algoritma C 4.5

dibuat oleh Ross Quinlan yang merupakan pengembangan dari ID3 yang juga dibuat oleh

Quinlan. Beberapa pengembangan yang dilakukan pada C4.5 adalah sebagai antara lain

bisa mengatasi missing value, bisa mengatasi continue data, dan pruning. Pohon

keputusan banyak sekali perkembangan tetapi yang sering dipakai adalah ID3 dan C4.5.

Keduanya mempunyai prinsip yang sama dikarenakan Algoritma C4.5 merupakan

pengembangan dari ID3, tetapi mempunyai perbedaan utama yaitu :

Page 43: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

25

1. C4.5 dapat menangani atribut yang kontinyu dan diskrit dan juga dapat menangani

data training dengan nilai yang hilang atau data yang kosong.

2. Hasil yang didapat dari Algoritma C4.5 akan terpangkas setelah dibentuk

3. Pemilihan atribut yang dilakukan dengan menggunakan Gain Ratio.

Algoritma C4.5 merupakan perbaikan dari ID3 menggunakan Gain Ratio untuk

diperbaharui information gain maka dengan rumus :

Gambar 2.2 Rumus Gain Ratio

Sumber: Quinlan

Dimana:

S = Ruang/Data Sample yang dipergunakan untuk data training

A = Atribut

Gain(S,A) = information gain pada atribut A

SplitInfo(S,A) = split information pada atribut A

Dengan atribut yang nilai Gain Ration yang paling tertinggi dipilih sebagai atribut

test untuk simpul. Pendekatan ini menerapkan normalisasi pada information gain dengan

menggunakan apa yang disebut dengan split information, dengan rumus :

Gambar 2.3 Rumus Split Information

Sumber: Quinlan

Page 44: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

26

Dimana:

S = Ruang (data) sample yang digunakan untuk training.

A = Atribut.

Si = Jumlah sample untuk atribut i

Pada saat membangun pohon keputusan, mungkin adanya data yang noise

maupun kosong pada training data. Pemangkasan pohon dapat dilakukan untuk

mengenali dan menghilangkan cabang tersebut agar pohon lebih kecil dan lebih mudah

dipahami agar lebih baik dalam melakukan klasifikasi. Ada dua metode dalam melakukan

pemakasan pohon keputusan yaitu:

1. Dengan Prepruning yaitu menghentikan pembangunan lebih awal pada subtree

agar tidak sampai lebih jauh dalam pemangkas data training. Rumus Prepruning

:

Gambar 2.4 Rumus Prepruning

Sumber: Quinlan

Dimana :

r = nilai perbandingan error rate

n = total sample

z = Φ-1(c)

c= confidence level

Page 45: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

27

2. Dengan Postpruning yaitu menyederhanakan pohon dengan membuang beberapa

cabang subtree setelah selesai dibangun. Metode ini sebagai bagian standard

untuk Algoritma C4.5.

Page 46: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

28

BAB III

METODOLOGI PENELITIAN

3.1 Metode Penelitian

Metode penelitian dapat diartikan sebagai cara ilmiah untuk mendapatkan data

yang valid dengan tujuan dapat ditemukan, dikembangkan, dan dibuktikan, suatu

pengetahuan tertentu sehingga dapat digunakan untuk memahami, memecahkan, dan

mengantisispasi masalah (Sugiyono, 2014).

Dalam pengumpulan data terdapat sumber data yang dihimpun langsung oleh

peneliti disebut dengan sumber primer, sedangkan apabila melalui tangan kedua disebut

sumber sekunder (Riduwan, 2008).

Untuk mendapatkan informasi serta data yang lengkap dan akurat dalam penulisan

laporan tugas akhir, maka penulis melakukan penelitian dengan metode-metode sebagai

berikut :

1. Observasi

Pengamatan melibatkan semua indera (penglihatan, pendengaran, penciuman,

pembauan, dan perasa). Pencatatan hasil dapat dilakukan dengan bantuan alat

rekam elektronik.

2. Wawancara

Pengambilan data melalui wawancara atau secara lisan langsung dengan sumber

datanya, baik melalui tatap muka atau melalui telephone. Jawaban responden

direkam dan dirangkum sendiri oleh peneliti.

Page 47: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

29

3. Dokumen

Pengambilan data melalui dokumen tertulis maupun elektronik dari lembaga atau

institusi. Dokumen diperuntukan untuk mendukung kelengkapan data yang lain.

Data yang diperoleh adalah data pejualan botol milik CV.Seribukilo di daerah

bekasi. Setelah data dikumpulkan berjumlah 210 data kemudian dibagi 2 yaitu data

training sejumlah 168 data dan data testing sejumlah 42 data dengan perbandingan 80%

dan 20%. Hasil data training digunakan untuk memperoleh hasil klasifikasi penjualan

dalam bentuk pohon keputusan dan data testing digunakan tingkat akurasi dari hasil

klasifikasi tersebut.

3.2 Kerangka Berpikir

Dalam menyelesaikan penelitian ini dibutuhkan sebuah kerangka pemikiran

sebagai pedoman yang dilakukan secara konsisten. Permasalahan penelitian ini adalah

dibutuhkan sebuah prediksi penjualan botol. Sebelum memulai prediksi yang harus

dilakukan terlebih dahulu adalah pengolahan data training untuk mendapatan rule

decision tree Algoritma C4.5 yang menjadi acuan menghasilkan prediksi penjualan botol.

Pengujian metode ini dilakukan dengan cara cross validation, confusion matrix dan kurva

ROC. Untuk pengembangannya dan pengujian metode digunakan aplikasi RapidMiner.

Berikut ini kerangka pemikiran yang dilakukan. Berikut merupakan langkah – langkah

yang akan dilakukan pada penelitian ini:

Page 48: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

30

Gambar 3.1 Kerangka Berpikir

Sumber: Pengolahan Data

Tahap pertama yang dilakukan dalam melakukan penelitian ini adalah melakukan

studi literatur dengan cara mempelajari teori dan pengetahuan dasar mengenai semua

yang berkaitan dengan penelitian ini agar dapat memahami dasar-dasar teori dan konsep-

konsep yang mendukung penelitian.

Page 49: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

31

Tahap kedua yaitu identifikasi masalah, pada tahap ini proses yang dilakukan

adalah menggali permasalahan yang di temukan pada objek yang di teliti serta

mengidentifikasi kebutuhan yang di butuhkan oleh pengguna guna mencari alternatif

solusi yang terkait dengan permasalahan tersebut.

Tahap ketiga yaitu pengumpulan data, setelah tahap identifikasi masalah

dilakukan dan semua kebutuhan sudah di dapatkan maka tahap selanjutnya yang harus

dilakukan adalah mengumpulkan data. Data yang di butuhkan data penjualan botol yang

di dapatkan dari CV.Seribukilo.

Tahap keempat yaitu membuat data training dari data-data yang sudah di

kumpulkan, karena tidak semua data di butuhkan untuk pengujian model.

Tahap kelima yaitu membuat data mining yang digunakan untuk memilih teknik

dan algoritma yang sesuai untuk menemukan pola yang tersembunyi dari data penjualan

botol yang di dapatkan dari CV.Seribukilo dengan menggunakan algoritma C4.5

Tahap keenam adalah hasil prediksi, di tahap ini kita dapat melihat hasil prediksi

dari penerapan data mining dengan algoritma C4.5.

Tahap ketujuh yaitu evaluasi, pada tahap ini dilakukanya evaluasi untuk

mengetahui apakah teknik dan algoritma yang digunakan sudah sesuai untuk digunakan

dalam penelitian sehingga bisa menemukan pola penjualan botol yang bermanfaat untuk

meningkatkan penjulan botol tersebut.

Page 50: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

32

3.3 Objek Penelitian

CV.Seribukilo adalah sebuah toko yang menjual berbagai macam jenis – jenis

kemasan botol, ada yang berbentuk bulat dan kotak, dan banyak juga warna yang tersedia.

Selain menjual barangnya dengan cara offline, CV.Seribukilo pun menjual barang

jualannya di marketplace yang sudah terkenal di Indonesia seperti tokopedia, shopee, dan

bukalapak. CV.Seribukilo ini berada di alamat Jl. Raya Taman Narogong Indah A8 No.7

Pengasinan, Rawalumbu – Kota Bekasi 17115. Seiring berjalannya waktu dan penjualan

semakin bertambah CV.Seribukilo ini pun membuka cabang di daerah Cileungsi-Bogor.

Banyak jenis botol yang dijual di toko ini seperti botol kale, botol kapsul, botol spray,

botol cimori dan masih banyak sekali jenis – jenis botol yang dijual.

CV.Seribukilo ini pun menpunyai selogan yaitu “Seribu Murahnya, Seribu

Puasnya”. memang sesuai seperti selogannya, harga yang di tawarkan pada barang

jualannya memang murah dan terjangkau, namun tetap dengan kualitas barang yang

cukup bagus sehingga para pembeli sangat puas dan tidak kecewa.

Page 51: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

33

Gambar 3.2 Logo Seribukilo

Sumber: CV.Seribukilo

3.4 Bahan Penelitian

Dalam melakukan penelitian ini, berikut bahan penelitian yang digunakan:

1. Literatur

Yaitu jurnal, buku dan artikel yang berhubungan dengan Algoritma C4.5, decision

tree dan data mining yang relevan dengan penelitian dan semuanya digunakan

sebagai bahan referensi untuk memperdalam pemahaman teori-teori dan

penerapan data.

2. Data

Pada penelitian ini, data yang digunakan adalah data penjualan milik

CV.Seribukilo. Data penjualan tersebut akan diolah menggunakan beberapa

Page 52: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

34

metode data mining sehingga diperoleh satu metode yang paling akurat dan dapat

digunakan sebagai rules dalam memprediksi penjualan botol pada CV.Seribukilo.

3.5 Alat Penelitian (RapidMiner)

Adapun alat penelitian yang digunakan untuk menunjang penelitian ini adalah

RapidMiner, yaitu perangkat lunak yang bersifat terbuka (open source). RapidMiner

adalah sebuah solusi untuk melakukan analisis terhadap data mining, text mining dan

analisis prediksi. RapidMiner menggunakan berbagai teknik deskriptif dan prediksi

dalam memberikan wawasan kepada pengguna sehingga dapat membuat keputusan yang

paling baik. RapidMiner memiliki kurang lebih 500 operator data mining, termasuk

operator untuk input, output, data preprocessing dan visualisasi.

RapidMiner memiliki beberapa sifat sebagai berikut:

1. Ditulis dengan bahasa pemrograman Java sehingga dapat dijalankan di berbagai

sistem operasi.

2. Proses penemuan pengetahuan dimodelkan sebagai operator trees.

3. Representasi XML internal untuk memastikan format standar pertukaran data.

4. Bahasa scripting memungkinkan untuk eksperimen skala besar dan otomatisasi

eksperimen.

5. Konsep multi-layer untuk menjamin tampilan data yang efisien dan menjamin

penanganan data.

6. Memiliki GUI, command line mode, dan Java API yang dapat dipanggil dari

program lain.

Page 53: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

35

Tools yang digunakan dalam RapidMiner ini adalah:

1. Panel operator view

Panel operator view merupakan induk langkah kerja dari proses analisa.

2. Panel repository view

merupakan komponen utama dalam Design Perspective selain Operator View.

View ini dapat digunakan untuk mengelola dan menata proses Analisis menjadi

proyek dan pada saat yang sama juga dapat digunakan sebagai sumber data dan

yang berkaitan dengan meta data.

3. Process view

Process View menunjukkan langkah-langkah tertentu dalam proses analisis dan

sebagai penghubung langkah-langkah tersebut.

4. Parameter view

Digunakan untuk mengatur fungsionalitas dari beberapa operator yang

membutuhkannya agar dapat dijalankan sesuai dengan proses analisa.

3.6 Jenis Data

Pada penelitian ini digunakan data yang berasal dari data historis penjualan botol

pada CV.Seribukkilo dengan jumlah data sebanyak 210 data. Terdapat 10 atribut terdiri

dari id barang, nama barang, kategori, satuan, harga, ukuran , bentuk, kualitas bahan,

warna, dan minat (naik atau turun).

Pada penelitian ini akan dilakukan menggunakan dua jenis data yaitu data

kualitatif dan data kuantitatif.

Page 54: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

36

1. Data kualitatif

Data kualitaif merupakan data yang berbentuk kata-kata, data kualitatif dalam data

yang akan digunakan pada penelitian ini yaitu id barang, nama barang , kategori,

satuan, bentuk, kuaitas bahan, ukuran, warna, dan termasuk label yaitu naik atau

turun

2. Data kuantitatif

Data kuanitaif merupakan data yang berbentuk angka dan dapat dihitung nilainya

dengan statistik ataupun matematika secara pasti. Fungsi dari data kuantitatif

adalah mengetahui jumlah atau besaran objek yang akan diteliti. Data kuantitatif

merupakan data yang menunjukan probabilititas, dalam data yang digunakan

untuk penelitian yaitu harga.

3.7 Teknik Analisa Data

Data karyawan yang didapatkan dari proses pengumpulan data sebanyak 210 data

karyawan dan memiliki 10 atribut terdiri dari id barang, nama barang, kategori, satuan,

harga, ukuran , bentuk, kualitas bahan, warna, dan minat (naik atau turun). Setelah data

didapatkan untuk melakukan penelitian maka ada beberapa tahapan preparation data.

Preparation data merupakan tahapan untuk mendapatkan data yang berkualitas, maka

dapat dilakukan beberapa teknik sebagai berikut:

1. Data Cleaning

Data yang berkualitas sangat mempengaruhi kualitas keputusan yang akan

diperoleh. Data yang tidak berkualitas adalah data yang nilai atributnya hilang,

Page 55: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

37

error dan data yang tidak konsiten dalam pengisian atributnya. Untuk

mendapatkan data yang berkualitas dilakukan tahapan dalam Data Cleaning

sebagai berikut:

a. Menghilangkan data yang tidak lengkap atau data yang tidak mempengaruhi

hasil pada saat di testing.

b. Mengisi nilai- nilai yang hilang, data yang tidak lengkap (missing value).

2. Data Integration and Transformation

Teknik yang digunakan untuk menganalisis data kolerasi, atribut yang redundan

disebut integration, sedangkan transformation berguna untuk meningkatkan

akurasi dan efisiensi. Algoritma C4.5 memiliki kelebihan memproses data yang

bernilai nominal, ortodinal maupun continue. Sehingga nilai-nilai setiap atribut

yang terdapat pada dataset tidak perlu ditransformasikan.

3. Data Reduction

Data set dapat direduksi dengan mengurangi jumlah atribut dan record supaya

menjadi lebih sedikit tetapi tetap bersifat informatif. Memperoleh representasi

dalam bentuk volume data yang telah berkurang jumlahnya namun tetap

mendapatkan hasil analisis yang sama. Deskretasi data merupakan bagian dari

reduksi data bagian penting untuk data numerik.

3.8 Tahapan Penelitian

Tahap selanjutnya adalah menentukan metode apa yang cocok digunakan dalam

teknik klasifikasi, setelah melakukan pengamatan dan observasi peneliti menentukan

Page 56: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

38

Algoritma C.45. Dalam penelitian ini akan dilakukan beberapa langkah-langkah atau

tahapan penelitian.

Gambar 3.3 Tahapan Penelitian

Sumber : Pengolahan Data

1. Pengumpulan Data

Pada bagian ini dijelaskan tentang bagaimana dan darimana data dalam penelitian

ini didapatkan, meliputi data sekunder dan data primer. Data sekunder berisi

tentang sumber perolehan data untuk keperluan penelitian, sedangkan data primer

berisi tentang data yang dihasilkan dari penelitian.

Page 57: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

39

2. Pengolahan Awal Data

Pada bagian ini dijelaskan tentang tahap awal data mining. Pengolahan awal data

meliputi proses input data ke format yang dibutuhkan, pengelompokan dan

penentuan atribut data.

3. Metode yang Diusulkan

Pada bagian ini dijelaskan tentang metode yang diusulkan untuk digunakan pada

prediksi penjualan botol, Penjelasan meliputi pengaturan dan pemilihan nilai dari

paraneter-parameter dan arsitektur melalui uji coba.

4. Evaluasi dan Validasi hasil

pada bagian ini dijelaskan tentang evaluasi dan validasi hasil penerapan metode

pada penelitian yang dilakukan. Penjelasan mengenai hal ini akan dipaparkan

pada bab IV.

3.8.1 Pengumpulan Data

Selama penelitian di CV.Seribukilo penulis dapat mengupulkan beberapa data,

antara lain:

1. Data Primer

Data primer adalah data yang diperoleh atau dikumpulkan oleh peneliti secara

langsung dari sumber datanya. Data primer disebut juga sebagai data asli atau data

baru yang memiliki sifat up to date. Untuk mendapatkan data primer peneliti harus

mengumpulkannya secara langsung. Teknik yang dapat digunakan peneliti untuk

mengumpulkan data primer antara lain observasi, wawancara, diskusi terfokus

Page 58: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

40

(Focus Grup Discussion - FGD) dan penyebaran kuesioner. Data primer dalam

penelitian ini didapatkan dari data penjualan botol milik CV.Seribukilo.

Tabel 3.1 Data Jenis Botol

id b

ara

ng

na

ma

ba

ran

g

ka

tego

ri

satu

an

ha

rga

uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl001 botol agro 100ml perkakas pcs 2100 kecil kotak baik sedikit naik

btl002 botol agro 150ml perkakas pcs 2400 kecil kotak baik banyak naik

btl003 botol agro 200ml perkakas pcs 2700 kecil kotak baik sedikit naik

btl004 botol agro 50ml perkakas pcs 1900 kecil kotak baik banyak naik

btl005 botol aqua 1000ml perkakas pcs 1400 besar bulat terbaik banyak naik

btl006 botol aqua 330ml perkakas pcs 1000 besar bulat terbaik banyak naik

btl007 botol aqua 500ml perkakas pcs 1100 besar bulat terbaik banyak naik

btl008 botol aqua 600ml perkakas pcs 1100 besar bulat terbaik banyak naik

btl009 botol aqua 750ml perkakas pcs 1200 besar bulat terbaik banyak naik

btl010 botol bohlam 1000ml perkakas pcs 2900 besar bulat baik banyak naik

btl011 botol bohlam 500ml perkakas pcs 1900 besar bulat baik banyak naik

btl012 botol bohlam 750ml perkakas pcs 2400 besar bulat baik banyak naik

btl013 botol bowling 1000ml perkakas pcs 2500 besar bulat baik banyak naik

btl014 botol bowling 250ml perkakas pcs 1500 besar bulat baik banyak naik

btl015 botol bowling 500ml perkakas pcs 1900 besar bulat baik banyak naik

btl016 botol bowling 600ml perkakas pcs 2100 besar bulat baik banyak naik

btl017 botol bp kotak 100ml perkakas pcs 900 kecil kotak terbaik banyak turun

btl018 botol bp kotak 150ml perkakas pcs 1100 kecil kotak terbaik banyak turun

btl019 botol bp kotak 50ml perkakas pcs 650 kecil kotak terbaik banyak turun

btl020 botol bp kotak 80ml perkakas pcs 750 kecil kotak terbaik banyak turun

btl021 botol bumbu 250ml perkakas pcs 1700 besar bulat terbaik banyak naik

btl022 botol bumbu 320ml perkakas pcs 1850 besar bulat terbaik banyak naik

btl023 botol bumbu 500ml perkakas pcs 2100 besar bulat terbaik banyak naik

btl024 botol bumbu lada 120ml perkakas pcs 1900 kecil kotak terbaik sedikit naik

btl025 botol bumbu lada 150ml perkakas pcs 2150 kecil kotak terbaik sedikit naik

btl026 botol bumbu lada 180ml perkakas pcs 2400 kecil kotak terbaik sedikit naik

btl027 botol bumbu lada 210ml perkakas pcs 2650 kecil kotak terbaik sedikit naik

btl028 botol cantik 1000ml perkakas pcs 3400 besar bulat baik banyak naik

btl029 botol cantik 250ml perkakas pcs 1550 besar bulat baik banyak naik

btl030 botol cantik 350ml perkakas pcs 1650 besar bulat baik banyak naik

Page 59: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

41

Tabel 3.2 Data Jenis Botol (lanjutan) id

ba

ran

g

nama barang

ka

tego

ri

satu

an

ha

rga

uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl031 botol cantik 500ml perkakas pcs 2500 besar bulat baik banyak naik

btl032 botol cantik 750ml perkakas pcs 3000 besar bulat baik banyak naik

btl033 botol disctop 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik

btl034 botol disctop 20ml perkakas pcs 1600 kecil bulat terbaik sedikit naik

btl035 botol disctop 30ml perkakas pcs 1600 kecil bulat terbaik sedikit naik

btl036 botol disctop 60ml perkakas pcs 1700 kecil bulat terbaik sedikit naik

btl037 botol fliptop 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik

btl038 botol fliptop 20ml perkakas pcs 1600 kecil bulat terbaik sedikit naik

btl039 botol fliptop 30ml perkakas pcs 1600 kecil bulat terbaik sedikit naik

btl040 botol fliptop 60ml perkakas pcs 1700 kecil bulat terbaik sedikit naik

btl041 botol gummy 150ml perkakas pcs 1600 kecil kotak baik banyak naik

btl042 botol gummy 200ml perkakas pcs 1900 kecil kotak baik sedikit naik

btl043 botol hand soap 500ml perkakas pcs 4200 besar bulat baik sedikit naik

btl044 botol jelly kotak 100ml perkakas pcs 1600 kecil kotak baik banyak turun

btl045 botol jelly kotak 150ml perkakas pcs 1900 kecil kotak baik banyak turun

btl046 botol jelly kotak 200ml perkakas pcs 2400 kecil kotak baik banyak turun

btl047 botol kale 1000ml perkakas pcs 3400 besar bulat baik banyak naik

btl048 botol kale 250ml perkakas pcs 1550 besar bulat baik banyak naik

btl049 botol kale 350ml perkakas pcs 1700 besar bulat baik banyak naik

btl050 botol kale 500ml perkakas pcs 2400 besar bulat baik banyak naik

btl051 botol kale 600ml perkakas pcs 2500 besar bulat baik banyak naik

btl052 botol kale 750ml perkakas pcs 3000 besar bulat baik banyak naik

btl053 botol kale kotak 1000ml perkakas pcs 3200 besar kotak terbaik banyak turun

btl054 botol kale kotak 250ml perkakas pcs 1600 besar kotak terbaik banyak turun

btl055 botol kale kotak 330ml perkakas pcs 1900 besar kotak terbaik banyak turun

btl056 botol kale kotak 500ml perkakas pcs 2500 besar kotak baik banyak turun

btl057 botol kapsul 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik

btl058 botol kapsul 130ml perkakas pcs 2000 kecil kotak baik banyak turun

btl059 botol kapsul 130ml perkakas pcs 2100 kecil bulat terbaik sedikit naik

btl060 botol kapsul 210ml perkakas pcs 2450 kecil kotak baik banyak turun

btl061 botol kapsul 230ml perkakas pcs 2300 kecil bulat terbaik sedikit naik

btl062 botol kapsul kotak 100ml perkakas pcs 1900 kecil kotak terbaik sedikit naik

btl063 botol kapsul kotak 130ml perkakas pcs 2100 kecil kotak terbaik sedikit naik

Page 60: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

42

Tabel 3.3 Data Jenis Botol (lanjutan) id

ba

ran

g

nama barang

ka

tego

ri

satu

an

ha

rga

uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl064 botol kapsul kotak 230ml perkakas pcs 2300 kecil kotak terbaik sedikit naik

btl065 botol karismatik kotak 250ml perkakas pcs 600 besar kotak terbaik banyak turun

btl066 botol karismatik kotak 330ml perkakas pcs 700 besar kotak terbaik banyak turun

btl067 botol karismatik kotak 400ml perkakas pcs 800 besar kotak terbaik banyak turun

btl068 botol karismatik kotak 500ml perkakas pcs 950 besar kotak baik banyak turun

btl069 botol karismatik kotak 600ml perkakas pcs 1100 besar kotak terbaik banyak turun

btl070 botol karismatik kotak 750ml perkakas pcs 1250 besar kotak terbaik banyak turun

btl071 botol karisnatik kotak 1000ml perkakas pcs 1400 besar kotak terbaik banyak turun

btl072 botol kick square 1000ml perkakas pcs 3200 besar kotak baik banyak turun

btl073 botol kick square 250ml perkakas pcs 1600 besar kotak terbaik banyak turun

btl074 botol kick square 330ml perkakas pcs 1900 besar kotak terbaik banyak turun

btl075 botol kick square 500ml perkakas pcs 2500 besar kotak baik banyak turun

btl076 botol kiwi 1000ml perkakas pcs 3000 besar bulat terbaik banyak naik

btl077 botol kiwi 250ml perkakas pcs 1700 besar bulat terbaik banyak naik

btl078 botol kiwi 500ml perkakas pcs 2500 besar bulat terbaik banyak naik

btl079 botol kristine 330ml perkakas pcs 1000 besar bulat terbaik sedikit naik

btl080 botol kristine 500ml perkakas pcs 1200 besar bulat terbaik sedikit naik

btl081 botol kristine 600ml perkakas pcs 1300 besar bulat terbaik sedikit naik

btl082 botol labor 250ml perkakas pcs 1900 besar bulat baik sedikit naik

btl083 botol labor 350ml perkakas pcs 2200 besar bulat baik sedikit naik

btl084 botol labor 500ml perkakas pcs 3200 besar bulat baik sedikit naik

btl085 botol labor bening 1000ml perkakas pcs 3400 besar bulat baik sedikit naik

btl086 botol labor bening 250ml perkakas pcs 2300 besar bulat baik sedikit naik

btl087 botol labor bening 350ml perkakas pcs 2600 besar bulat baik sedikit naik

btl088 botol labor bening 500ml perkakas pcs 2900 besar bulat baik sedikit naik

btl089 botol lemon 100ml perkakas pcs 1600 kecil kotak baik banyak turun

btl090 botol lemon 150ml perkakas pcs 1900 kecil kotak baik banyak turun

btl091 botol lemon 200ml perkakas pcs 2500 kecil kotak baik banyak turun

btl092 botol liebe 100ml perkakas pcs 1500 kecil kotak terbaik sedikit naik

btl093 botol liebe 200ml perkakas pcs 1700 kecil kotak terbaik sedikit naik

btl094 botol madu 100ml perkakas pcs 3200 kecil kotak terbaik sedikit naik

btl095 botol madu 200ml perkakas pcs 3700 kecil kotak terbaik sedikit naik

btl096 botol mahmud 250ml perkakas pcs 850 besar bulat terbaik sedikit naik

Page 61: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

43

Tabel 3.4 Data Jenis Botol (lanjutan) id

ba

ran

g

nama barang

ka

tego

ri

satu

an

ha

rga

uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl097 botol mahmud 350ml perkakas pcs 1000 besar bulat terbaik sedikit naik

btl098 botol mahmud 450ml perkakas pcs 1200 besar bulat terbaik sedikit naik

btl099 botol mahmud 500ml perkakas pcs 1300 besar bulat terbaik sedikit naik

btl100 botol matcha kotak 100ml perkakas pcs 1600 kecil kotak baik banyak turun

btl101 botol matcha kotak 150ml perkakas pcs 1900 kecil kotak baik banyak turun

btl102 botol matcha kotak 200ml perkakas pcs 2400 kecil kotak baik banyak turun

btl103 botol mg kotak 100ml perkakas pcs 900 kecil kotak terbaik banyak turun

btl104 botol mg kotak 150ml perkakas pcs 1100 kecil kotak terbaik banyak turun

btl105 botol mg kotak 200ml perkakas pcs 1300 kecil kotak terbaik banyak turun

btl106 botol mg kotak 50ml perkakas pcs 650 kecil kotak terbaik banyak turun

btl107 botol mg kotak 80ml perkakas pcs 750 kecil kotak terbaik banyak turun

btl108 botol parfum kotak 100ml perkakas pcs 1500 kecil kotak baik banyak naik

btl109 botol parfum kotak 10ml perkakas pcs 900 kecil kotak baik banyak naik

btl110 botol parfum kotak 20ml perkakas pcs 1000 kecil kotak baik banyak naik

btl111 botol parfum kotak 30ml perkakas pcs 1100 kecil kotak baik banyak naik

btl112 botol parfum kotak 50ml perkakas pcs 1200 kecil kotak baik banyak naik

btl113 botol parfum kotak 60ml perkakas pcs 1300 kecil kotak baik banyak naik

btl114 botol parfum kotak 80ml perkakas pcs 1400 kecil kotak baik banyak naik

btl115 botol parfum rol 10ml perkakas pcs 900 kecil kotak baik banyak naik

btl116 botol parfum rol 30ml perkakas pcs 1000 kecil kotak baik banyak naik

btl117 botol persegi moca 130ml perkakas pcs 1700 kecil kotak baik sedikit naik

btl118 botol persegi moca 160ml perkakas pcs 2000 kecil kotak baik sedikit naik

btl119 botol persegi moca 200ml perkakas pcs 2500 kecil kotak baik banyak naik

btl120 botol pipet 10ml perkakas pcs 2400 kecil kotak terbaik sedikit naik

btl121 botol pipet 10ml segel perkakas pcs 2700 kecil kotak terbaik banyak turun

btl122 botol pipet 15ml perkakas pcs 2500 kecil kotak terbaik sedikit naik

btl123 botol pipet 15ml segel perkakas pcs 2900 kecil kotak terbaik banyak turun

btl124 botol pipet 20ml segel perkakas pcs 3000 kecil kotak terbaik banyak turun

btl125 botol pipet 30ml perkakas pcs 2700 kecil kotak terbaik sedikit naik

btl126 botol pipet 30ml segel perkakas pcs 3200 kecil kotak terbaik banyak turun

btl127 botol pipet 40ml perkakas pcs 2900 kecil kotak terbaik sedikit naik

btl128 botol pipet 40ml segel perkakas pcs 3400 kecil kotak terbaik banyak turun

btl129 botol pipet 50ml segel perkakas pcs 2100 kecil kotak terbaik banyak turun

Page 62: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

44

Tabel 3.5 Data Jenis Botol (lanjutan) id

ba

ran

g

nama barang

ka

tego

ri

satu

an

ha

rga

uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl130 botol pipet 5ml segel perkakas pcs 2500 kecil kotak terbaik banyak turun

btl131 botol pipet 5ml segel perkakas pcs 2500 kecil kotak terbaik banyak turun

btl132 botol prima 1000ml perkakas pcs 3500 besar bulat baik banyak naik

btl133 botol prima 250ml perkakas pcs 1600 besar bulat baik banyak naik

btl134 botol prima 350ml perkakas pcs 1700 besar bulat baik banyak naik

btl135 botol prima 500ml perkakas pcs 2500 besar bulat baik banyak naik

btl136 botol prima 600ml perkakas pcs 2600 besar bulat baik banyak naik

btl137 botol prima 750ml perkakas pcs 3000 besar bulat baik banyak naik

btl138 botol prima kotak 1000ml perkakas pcs 3200 besar kotak terbaik banyak turun

btl139 botol prima kotak 250ml perkakas pcs 1600 besar kotak terbaik banyak turun

btl140 botol prima kotak 500ml perkakas pcs 2500 besar kotak terbaik banyak turun

btl141 botol pro round 100ml perkakas pcs 1500 kecil kotak terbaik sedikit naik

btl142 botol pro round 150ml perkakas pcs 1700 kecil kotak terbaik sedikit naik

btl143 botol pro round 200ml perkakas pcs 1900 kecil kotak terbaik sedikit naik

btl144 botol ps kotak 100ml perkakas pcs 850 kecil kotak terbaik banyak naik

btl145 botol ps kotak 130ml perkakas pcs 950 kecil kotak terbaik banyak naik

btl146 botol ps kotak 150ml perkakas pcs 1100 kecil kotak terbaik banyak naik

btl147 botol ps kotak 200ml perkakas pcs 1300 kecil kotak terbaik banyak naik

btl148 botol ps kotak 80ml perkakas pcs 750 kecil kotak terbaik banyak naik

btl149 botol pump 250ml perkakas pcs 3200 besar bulat terbaik banyak naik

btl150 botol pump 320ml perkakas pcs 3500 besar bulat terbaik banyak naik

btl151 botol pump 500ml perkakas pcs 3900 besar bulat terbaik banyak naik

btl152 botol pump kotak 1000ml perkakas pcs 5000 besar kotak terbaik banyak turun

btl153 botol pump kotak 250ml perkakas pcs 3200 besar kotak terbaik banyak turun

btl154 botol pump kotak 330ml perkakas pcs 3700 besar kotak baik banyak turun

btl155 botol pump kotak 500ml perkakas pcs 4200 besar kotak terbaik banyak turun

btl156 botol pump kotak 750ml perkakas pcs 4600 besar kotak terbaik banyak turun

btl157 botol sabun 250ml perkakas pcs 950 besar bulat terbaik banyak naik

btl158 botol sabun 330ml perkakas pcs 1100 besar bulat terbaik banyak naik

btl159 botol sabun 450ml perkakas pcs 1200 besar bulat terbaik banyak naik

btl160 botol sabun 600ml perkakas pcs 1400 besar bulat terbaik banyak naik

btl161 botol sabun 700ml perkakas pcs 1500 besar bulat terbaik banyak naik

btl162 botol sase 1000ml perkakas pcs 2900 besar bulat terbaik banyak naik

Page 63: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

45

Tabel 3.6 Data Jenis Botol (lanjutan) id

ba

ran

g

nama barang

ka

tego

ri

satu

an

ha

rga

uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl163 botol sase 250ml perkakas pcs 1600 besar bulat terbaik banyak naik

btl164 botol sase 350ml perkakas pcs 1900 besar bulat terbaik banyak naik

btl165 botol sase 500ml perkakas pcs 2400 besar bulat terbaik banyak naik

btl166 botol sase kotak 1000ml perkakas pcs 3200 besar kotak baik banyak turun

btl167 botol sase kotak 250ml perkakas pcs 1600 besar kotak terbaik banyak turun

btl168 botol sase kotak 350ml perkakas pcs 1900 besar kotak baik banyak turun

btl169 botol sase kotak 500ml perkakas pcs 2500 besar kotak baik banyak turun

btl170 botol sase kotak 750ml perkakas pcs 2900 besar kotak terbaik banyak turun

btl171 botol sehat 1000ml perkakas pcs 1450 besar bulat terbaik banyak naik

btl172 botol sehat 330ml perkakas pcs 850 besar bulat terbaik banyak naik

btl173 botol sehat 500ml perkakas pcs 950 besar bulat terbaik banyak naik

btl174 botol sehat 600ml perkakas pcs 1200 besar bulat terbaik banyak naik

btl175 botol sehat 750ml perkakas pcs 1300 besar bulat terbaik banyak naik

btl176 botol slim kotak 100ml perkakas pcs 1600 kecil kotak baik banyak turun

btl177 botol slim kotak 150ml perkakas pcs 2000 kecil kotak baik banyak turun

btl178 botol slim kotak 200ml perkakas pcs 2500 kecil kotak baik banyak turun

btl179 botol spray 20ml perkakas pcs 1700 kecil bulat baik banyak naik

btl180 botol spray 250ml perkakas pcs 2500 besar bulat baik sedikit naik

btl181 botol spray 30ml perkakas pcs 1700 kecil bulat baik banyak naik

btl182 botol spray 350ml perkakas pcs 2900 besar bulat baik sedikit naik

btl183 botol spray 500ml perkakas pcs 3200 besar bulat baik sedikit naik

btl184 botol spray 60ml perkakas pcs 1800 kecil bulat baik banyak naik

btl185 botol spray kotak 100ml perkakas pcs 1200 kecil kotak baik sedikit turun

btl186 botol spray kotak 30ml perkakas pcs 850 kecil kotak baik sedikit turun

btl187 botol spray kotak 60ml perkakas pcs 1000 kecil kotak baik sedikit turun

btl188 botol spray trigger 250ml perkakas pcs 4200 besar bulat baik banyak naik

btl189 botol tablet 100ml perkakas pcs 1600 kecil kotak baik sedikit naik

btl190 botol tablet 130ml perkakas pcs 1800 kecil kotak baik banyak naik

btl191 botol tablet 150ml perkakas pcs 2000 kecil kotak baik sedikit naik

btl192 botol tablet 200ml perkakas pcs 2300 kecil kotak baik sedikit naik

btl193 botol takar kotak 100ml perkakas pcs 1650 kecil kotak baik banyak turun

btl194 botol takar kotak 150ml perkakas pcs 1900 kecil kotak baik banyak turun

btl195 botol takar kotak 200ml perkakas pcs 2200 kecil kotak baik banyak turun

Page 64: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

46

Tabel 3.7 Data Jenis Botol (lanjutan) id

ba

ran

g

nama barang

ka

tego

ri

satu

an

ha

rga

uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl196 botol tetes 10ml perkakas pcs 900 kecil bulat baik sedikit naik

btl197 botol tetes 15ml perkakas pcs 1000 kecil bulat baik sedikit naik

btl198 botol tetes 20ml perkakas pcs 1100 kecil bulat baik sedikit naik

btl199 botol tetes 30ml perkakas pcs 1200 kecil bulat baik sedikit naik

btl200 botol wafe kotak 100ml perkakas pcs 1000 kecil kotak baik sedikit turun

btl201 botol wafe kotak 150ml perkakas pcs 1200 kecil kotak baik sedikit turun

btl202 botol wafe kotak 200ml perkakas pcs 1400 kecil kotak baik sedikit turun

btl203 botol wafe kotak 230ml perkakas pcs 1450 kecil kotak baik sedikit turun

btl204 botol yardley kotak 1000ml perkakas pcs 1400 besar kotak terbaik banyak Turun

btl205 botol yardley kotak 250ml perkakas pcs 600 besar kotak baik banyak Turun

btl206 botol yardley kotak 330ml perkakas pcs 700 besar kotak terbaik banyak Turun

btl207 botol yardley kotak 400ml perkakas pcs 800 besar kotak terbaik banyak Turun

btl208 botol yardley kotak 500ml perkakas pcs 950 besar kotak terbaik banyak Turun

btl209 botol yardley kotak 600ml perkakas pcs 1100 besar kotak terbaik banyak Turun

btl210 botol yardley kotak 750ml perkakas pcs 1250 besar kotak terbaik banyak Turun

Adapun atribut yang diguakan dalam mengolah data penjualan botol yaitu:

Tabel 3.8 Atribut Data

No Atribut Keterangan

1 Id Barang Data primary key yang merupakan identitas suatu barang

2 Nama Barang Nama dari jenis Botol

3 Kategori Jenis Suatu Barang

4 Satuan Ukuran suatu besaran

5 Harga Nilai penjualan botol

6 Ukuran Besar atau kecilnya botol

Page 65: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

47

Tabel 3.9 Atribut Data (Lanjutan)

No Atribut Keterangan

7 Bentuk Wujud dari botol, dengan dua nilai yakni: Bulat dan Kotak

8 Kualitas Bahan Bahan yang digunakan, dengan dua nilai yakni: Baik dan

Terbaik

9 Warna Macam – macam warna dari setiap botol, dengan dua nilai

yakni: Banyak dan Sedikit

10 Minat Jumlah peminat dari penjualan botol, dengan dua nilai

yakni: Naik dan Turun

2. Data Sekunder

Data sekunder adalah data yang diperoleh atau dikumpulkan peneliti dari berbagai

sumber yang telah ada (peneliti sebagai tangan kedua). Data sekunder dapat

diperoleh dari berbagai sumber seperti Biro Pusat Statistik (BPS), buku, laporm,

jural, dan lain-lain.

Tabel 3.10 Jurnal Penelitian Terdahulu

No Judul Jurnal Nama Pembuat Jurnal Tahun

1 Penerapan data mining dalam

memprediksi pembelian cat

Fitriana Harahap 2015

Page 66: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

48

Tabel 3.11 Jurnal Penelitian Terdahulu (Lanjutan)

No Judul Jurnal Nama Pembuat Jurnal Tahun

2 Analisa penerapan algoritma C4.5 untuk

mempredikasi penjualan motor pada PT.

Capella Dinamik Nusantara cabang muka

kuning

Nurul Azwanti 2018

3 Prediksi Kompetensi Karyawan

Menggunakan Algoritma C4.5 Studi

Kasus: PT. Hankook Tire Indonesia

Aswan Supriyadi Sunge 2018

4 Penerapan Data Mining Untuk Prediksi

Penjualan Wallpaper menggunakan

Algoritma C4.5

Juna Eska 2016

5 Closed Item-Set Mining for Prediction of

Indian Summer Monsoon Rainfall A Data

Mining Model with Land and Ocean

Variables as Predictors

H. Vathsala 2015

6 Penerapan Algoritma C4.5 Untuk

Penentuan Jurusan Mahasiswa

Liliana Suastina 2013

Page 67: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

49

Tabel 3.12 Jurnal Penelitian Terdahulu (Lanjutan)

No Judul Jurnal Nama Pembuat Jurnal Tahun

7 Analisa dan Penerapan Metode C4.5

Untuk Prediksi Loyalitas Pelanggan

Teguh Budi Santoso 2013

8 Kajian Penerapan Metode klasifikasi

Data Mining Algoritma C4.5 Untuk

Prediksi Kelayakan Kredit Pada Bank

Mayapada jakarta

Nandang Iriadi 2016

3.8.2 Pengelolaan Awal Data

Pada data penjualan botol yang telah dikumpulkan selanjutnya dilakukan proses

cleaning data, yaitu dengan menghilangkan record-record yang nois atau tidak lengkap

dan record yang berulang, atribut yang tidak diperlukan juga bisa dihilangkan seperti

atribut Id Barang, Nama Barang, Kategori dan Satuan, hal ini dilakukan karena atribut

tersebut tidak berpengaruh terhadap pengolahan data pada proes selanjutnya. Berikut

adalah tabel atribut dan kategorinya.

Tabel 3.13 Atribut Data Training

No Atribut Nilai

1 Harga

>600

<5000

Page 68: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

50

Tabel 3.14 Atribut Data Training

No Atribut Nilai

2 Ukuran

Besar

Kecil

3 Bentuk

Bulat

Kotak

4 Kualitas Bahan

Baik

Terbaik

5 Warna

Sedikit

Banyak

6 Minat

Naik

Turun

Dan yang sudah disiapkan untuk klasifikasi dibagi menjadi dua data, untuk data

training (80%) dan untuk data testing (20%). Pembagian data training dan data testing

menggunkan teknik sampling random sistematik. Cara penggunaan teknik ini yaitu

dengan cara perandoman atau pengundian hanya dilakukan satu kali, yakni ketika

menentukan unsur pertama dari sampling yang akan diambil. Penentuan unsur sampling

selanjutnya ditempuh dengan cara memanfaatkan interval sampel. Interval sampel adalah

angka yang menunjukkan jarak antara nomor-nomor urut yang terdapat dalam kerangka

sampling yang akan dijadikan patokan dalam menentukan atau memilih unsur- unsur

Page 69: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

51

sampling kedua dan seterusnya hingga unsur ke-n. Interval sampel biasanya

dilambangkan dengan huruf “k”.

Interval sampel atau juga disebut sampling rasio diperoleh dengan cara membagi

ukuran populasi dengan ukuran sampel yang dikehendaki (N/m). Contoh perhitungan

untuk mengambil data testing adalah sebagai berikut:

Jumlah populasi (N) = 210

Jumlah sampel (n) = 42

Jumlah data testing = 20 % x 210 = 42

Interval Sampling (k) = N/n = 210/42 = 5

Unsur pertama yang diambil untuk data testing (s) = 1

Unsur kedua = s + k

Unsur ketiga = s + 2k

Unsur keempat = s + 3k, dan seterusnya hingga unsurke-n.

Dari hasil diatas diperoleh data testing sebanyak 42 data botol, maka sisanya

dijadikan data training sebanyak 168 data botol. Setelah semua data siap dan sudah sesuai

dengan tahapan pengolahan sebelumnya, tahap selanjutnya yang dapat dilakukan adalah:

1. Choosing the appropriate Data Mining task

Pada tahap ini yang harus dilakukan adalah memilih jenis data mining yang ingin

digunakan pada penelitian untuk prediksi penjualan botol CV.Seribukilo maka

dipilih jenis data mining yang akan digunakan adalah klasifikasi.

Page 70: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

52

2. Choosing the Data Mining Algorithm

Setelah pemilihan jenis data mining yang akan digunakan yaitu klasifikasi, maka

tahap selanjutnya menentukan algoritma klasifikasi yang akan digunakan. Pada

penelitian ini algoritma yang akan digunakan adalah C4.5.

3. Employing the Data Mining Algorithm

Ditahap ini dilakukan pengolahan data dengan algoritma yang telah dipilih untuk

mendapatkan algoritma terbaik dengan tingkat akurasi yang tinggi dalam

klasifikasi prediksi penjualan botol pada CV.Seribukilo.

4. Evaluation

Dalam tahap ini dilakukan evaluasi dan menafsirkan pola yang didapatkan dari

hasil algoritma yang dipakai untuk mengetahui aturan, kehandalan, dan lain-lain.

Evaluasi dilakukan dengan menerapkan pola yang didapat dari proses sebelumnya

terhadap data testing yang disediakan. Evaluasi dilakukan dengan confusion

matrix dan kurva ROC.

5. Using the discovered knowledge

Pada tahap ini menggunakan pengetahuan yang diperoleh dari proses data mining

untuk penerapan pada aplikasi atau lainnya.

3.8.3 Metode Yang Diusulkan

Dalam penelitian ini akan dilakukan analisa menggukanan metode algoritma

C4.5. Data dihitung dengan menggunakan algoritma sesuai dengan metodenya kemudian

Page 71: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

53

dicari hasil akurasinya. Dalam tahapan ini akan dilakukan beberapa langkah pengujian

data yaitu seperti berikut:

Gambar 3.4 Langkah Pengujian

Sumber: Pengolahan Data

Page 72: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

54

BAB IV

HASIL DAN PEMBAHASAN

4.1 Hasil

4.1.1 Evaluasi dan Validasi Hasil Algoritma C4.5

Langkah pembuatan pohon keputusan (Decision Tree). Pada langkah awal dari

proses evaluasi algoritma C4.5 ini adalah mempersiapkan data yang akan di proses,

dalam penelitian ini data yang akan diolah adalah penjualan botol milik CV.Seribukilo.

Tabel 4.1 Data Jenis Botol Keseluruhan

id

ba

ran

g

nama barang Ka

tego

ri

satu

an

Ha

rga

Uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl001 botol agro 100ml Perkakas pcs 2100 kecil kotak baik sedikit Naik

btl002 botol agro 150ml Perkakas pcs 2400 kecil kotak baik banyak Naik

btl003 botol agro 200ml Perkakas pcs 2700 kecil kotak baik sedikit Naik

btl004 botol agro 50ml Perkakas pcs 1900 kecil kotak baik banyak Naik

btl005 botol aqua 1000ml Perkakas pcs 1400 besar bulat terbaik banyak Naik

btl006 botol aqua 330ml Perkakas pcs 1000 besar bulat terbaik banyak Naik

btl007 botol aqua 500ml Perkakas pcs 1100 besar bulat terbaik banyak Naik

btl008 botol aqua 600ml Perkakas pcs 1100 besar bulat terbaik banyak Naik

btl009 botol aqua 750ml Perkakas pcs 1200 besar bulat terbaik banyak Naik

btl010 botol bohlam 1000ml Perkakas pcs 2900 besar bulat baik banyak Naik

btl011 botol bohlam 500ml Perkakas pcs 1900 besar bulat baik banyak Naik

btl012 botol bohlam 750ml Perkakas pcs 2400 besar bulat baik banyak Naik

btl013 botol bowling 1000ml Perkakas pcs 2500 besar bulat baik banyak Naik

btl014 botol bowling 250ml Perkakas pcs 1500 besar bulat baik banyak Naik

btl015 botol bowling 500ml Perkakas pcs 1900 besar bulat baik banyak Naik

btl016 botol bowling 600ml Perkakas pcs 2100 besar bulat baik banyak Naik

btl017 botol bp kotak 100ml Perkakas pcs 900 kecil kotak terbaik banyak Turun

btl018 botol bp kotak 150ml Perkakas pcs 1100 kecil kotak terbaik banyak Turun

btl019 botol bp kotak 50ml Perkakas pcs 650 kecil kotak terbaik banyak Turun

btl020 botol bp kotak 80ml Perkakas pcs 750 kecil kotak terbaik banyak Turun

Page 73: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

55

Tabel 4.2 Data Jenis Botol Keseluruhan (Lanjutan)

id

ba

ran

g

nama barang Ka

tego

ri

satu

an

Ha

rga

Uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl021 botol bumbu 250ml perkakas pcs 1700 besar bulat terbaik banyak Naik

btl022 botol bumbu 320ml perkakas pcs 1850 besar bulat terbaik banyak Naik

btl023 botol bumbu 500ml perkakas pcs 2100 besar bulat terbaik banyak Naik

btl024 botol bumbu lada 120ml perkakas pcs 1900 kecil kotak terbaik sedikit Naik

btl025 botol bumbu lada 150ml perkakas pcs 2150 kecil kotak terbaik sedikit Naik

btl026 botol bumbu lada 180ml perkakas pcs 2400 kecil kotak terbaik sedikit Naik

btl027 botol bumbu lada 210ml perkakas pcs 2650 kecil kotak terbaik sedikit Naik

btl028 botol cantik 1000ml perkakas pcs 3400 besar bulat baik banyak Naik

btl029 botol cantik 250ml perkakas pcs 1550 besar bulat baik banyak naik

btl030 botol cantik 350ml perkakas pcs 1650 besar bulat baik banyak naik

btl031 botol cantik 500ml perkakas pcs 2500 besar bulat baik banyak naik

btl032 botol cantik 750ml perkakas pcs 3000 besar bulat baik banyak naik

btl033 botol disctop 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik

btl034 botol disctop 20ml perkakas pcs 1600 kecil bulat terbaik sedikit naik

btl035 botol disctop 30ml perkakas pcs 1600 kecil bulat terbaik sedikit naik

btl036 botol disctop 60ml perkakas pcs 1700 kecil bulat terbaik sedikit naik

btl037 botol fliptop 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik

btl038 botol fliptop 20ml perkakas pcs 1600 kecil bulat terbaik sedikit naik

btl039 botol fliptop 30ml perkakas pcs 1600 kecil bulat terbaik sedikit naik

btl040 botol fliptop 60ml perkakas pcs 1700 kecil bulat terbaik sedikit naik

btl041 botol gummy 150ml perkakas pcs 1600 kecil kotak baik banyak naik

btl042 botol gummy 200ml perkakas pcs 1900 kecil kotak baik sedikit naik

btl043 botol hand soap 500ml perkakas pcs 4200 besar bulat baik sedikit naik

btl044 botol jelly kotak 100ml perkakas pcs 1600 kecil kotak baik banyak turun

btl045 botol jelly kotak 150ml perkakas pcs 1900 kecil kotak baik banyak turun

btl046 botol jelly kotak 200ml perkakas pcs 2400 kecil kotak baik banyak turun

btl047 botol kale 1000ml perkakas pcs 3400 besar bulat baik banyak naik

btl048 botol kale 250ml perkakas pcs 1550 besar bulat baik banyak naik

btl049 botol kale 350ml perkakas pcs 1700 besar bulat baik banyak naik

btl050 botol kale 500ml perkakas pcs 2400 besar bulat baik banyak naik

btl051 botol kale 600ml perkakas pcs 2500 besar bulat baik banyak naik

btl052 botol kale 750ml perkakas pcs 3000 besar bulat baik banyak naik

btl021 botol bumbu 250ml perkakas pcs 1700 besar bulat terbaik banyak Naik

btl022 botol bumbu 320ml perkakas pcs 1850 besar bulat terbaik banyak Naik

btl023 botol bumbu 500ml perkakas pcs 2100 besar bulat terbaik banyak Naik

Page 74: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

56

Tabel 4.3 Data Jenis Botol Keseluruhan (Lanjutan)

id

ba

ran

g

nama barang Ka

tego

ri

satu

an

Ha

rga

Uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl024 botol bumbu lada 120ml perkakas pcs 1900 kecil kotak terbaik sedikit Naik

btl025 botol bumbu lada 150ml perkakas pcs 2150 kecil kotak terbaik sedikit Naik

btl026 botol bumbu lada 180ml perkakas pcs 2400 kecil kotak terbaik sedikit Naik

btl027 botol bumbu lada 210ml perkakas pcs 2650 kecil kotak terbaik sedikit Naik

btl028 botol cantik 1000ml perkakas pcs 3400 besar bulat baik banyak Naik

btl029 botol cantik 250ml perkakas pcs 1550 besar bulat baik banyak naik

btl030 botol cantik 350ml perkakas pcs 1650 besar bulat baik banyak naik

btl031 botol cantik 500ml perkakas pcs 2500 besar bulat baik banyak naik

btl032 botol cantik 750ml perkakas pcs 3000 besar bulat baik banyak naik

btl033 botol disctop 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik

btl034 botol disctop 20ml perkakas pcs 1600 kecil bulat terbaik sedikit naik

btl035 botol disctop 30ml perkakas pcs 1600 kecil bulat terbaik sedikit naik

btl036 botol disctop 60ml perkakas pcs 1700 kecil bulat terbaik sedikit naik

btl037 botol fliptop 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik

btl038 botol fliptop 20ml perkakas pcs 1600 kecil bulat terbaik sedikit naik

btl039 botol fliptop 30ml perkakas pcs 1600 kecil bulat terbaik sedikit naik

btl040 botol fliptop 60ml perkakas pcs 1700 kecil bulat terbaik sedikit naik

btl041 botol gummy 150ml perkakas pcs 1600 kecil kotak baik banyak naik

btl042 botol gummy 200ml perkakas pcs 1900 kecil kotak baik sedikit naik

btl043 botol hand soap 500ml perkakas pcs 4200 besar bulat baik sedikit naik

btl044 botol jelly kotak 100ml perkakas pcs 1600 kecil kotak baik banyak turun

btl045 botol jelly kotak 150ml perkakas pcs 1900 kecil kotak baik banyak turun

btl046 botol jelly kotak 200ml perkakas pcs 2400 kecil kotak baik banyak turun

btl047 botol kale 1000ml perkakas pcs 3400 besar bulat baik banyak naik

btl048 botol kale 250ml perkakas pcs 1550 besar bulat baik banyak naik

btl049 botol kale 350ml perkakas pcs 1700 besar bulat baik banyak naik

btl050 botol kale 500ml perkakas pcs 2400 besar bulat baik banyak naik

btl051 botol kale 600ml perkakas pcs 2500 besar bulat baik banyak naik

btl052 botol kale 750ml perkakas pcs 3000 besar bulat baik banyak naik

btl053 botol kale kotak 1000ml perkakas pcs 3200 besar kotak terbaik banyak turun

btl054 botol kale kotak 250ml perkakas pcs 1600 besar kotak terbaik banyak turun

btl055 botol kale kotak 330ml perkakas pcs 1900 besar kotak terbaik banyak turun

btl056 botol kale kotak 500ml perkakas pcs 2500 besar kotak baik banyak turun

btl057 botol kapsul 100ml perkakas pcs 1900 kecil bulat terbaik sedikit naik

btl058 botol kapsul 130ml perkakas pcs 2000 kecil kotak baik banyak turun

Page 75: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

57

Tabel 4.4 Data Jenis Botol Keseluruhan (Lanjutan)

id

ba

ran

g

nama barang Ka

tego

ri

satu

an

Ha

rga

Uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl059 botol kapsul 130ml perkakas pcs 2100 kecil bulat terbaik sedikit naik

btl060 botol kapsul 210ml perkakas pcs 2450 kecil kotak baik banyak turun

btl061 botol kapsul 230ml perkakas pcs 2300 kecil bulat terbaik sedikit naik

btl062 botol kapsul kotak 100ml perkakas pcs 1900 kecil kotak terbaik sedikit naik

btl063 botol kapsul kotak 130ml perkakas pcs 2100 kecil kotak terbaik sedikit naik

btl064 botol kapsul kotak 230ml perkakas pcs 2300 kecil kotak terbaik sedikit naik

btl065 botol karismatik kotak 250ml perkakas pcs 600 besar kotak terbaik banyak turun

btl066 botol karismatik kotak 330ml perkakas pcs 700 besar kotak terbaik banyak turun

btl067 botol karismatik kotak 400ml perkakas pcs 800 besar kotak terbaik banyak turun

btl068 botol karismatik kotak 500ml perkakas pcs 950 besar kotak baik banyak turun

btl069 botol karismatik kotak 600ml perkakas pcs 1100 besar kotak terbaik banyak turun

btl070 botol karismatik kotak 750ml perkakas pcs 1250 besar kotak terbaik banyak turun

btl071 botol karisnatik kotak 1000ml perkakas pcs 1400 besar kotak terbaik banyak turun

btl072 botol kick square 1000ml perkakas pcs 3200 besar kotak baik banyak turun

btl073 botol kick square 250ml perkakas pcs 1600 besar kotak terbaik banyak turun

btl074 botol kick square 330ml perkakas pcs 1900 besar kotak terbaik banyak turun

btl075 botol kick square 500ml perkakas pcs 2500 besar kotak baik banyak turun

btl076 botol kiwi 1000ml perkakas pcs 3000 besar bulat terbaik banyak naik

btl077 botol kiwi 250ml perkakas pcs 1700 besar bulat terbaik banyak naik

btl078 botol kiwi 500ml perkakas pcs 2500 besar bulat terbaik banyak naik

btl079 botol kristine 330ml perkakas pcs 1000 besar bulat terbaik sedikit naik

btl080 botol kristine 500ml perkakas pcs 1200 besar bulat terbaik sedikit naik

btl081 botol kristine 600ml perkakas pcs 1300 besar bulat terbaik sedikit naik

btl082 botol labor 250ml perkakas pcs 1900 besar bulat baik sedikit naik

btl083 botol labor 350ml perkakas pcs 2200 besar bulat baik sedikit naik

btl084 botol labor 500ml perkakas pcs 3200 besar bulat baik sedikit naik

btl085 botol labor bening 1000ml perkakas pcs 3400 besar bulat baik sedikit naik

btl086 botol labor bening 250ml perkakas pcs 2300 besar bulat baik sedikit naik

btl087 botol labor bening 350ml perkakas pcs 2600 besar bulat baik sedikit naik

btl088 botol labor bening 500ml perkakas pcs 2900 besar bulat baik sedikit naik

btl089 botol lemon 100ml perkakas pcs 1600 kecil kotak baik banyak turun

btl090 botol lemon 150ml perkakas pcs 1900 kecil kotak baik banyak turun

btl091 botol lemon 200ml perkakas pcs 2500 kecil kotak baik banyak turun

btl092 botol liebe 100ml perkakas pcs 1500 kecil kotak terbaik sedikit naik

btl093 botol liebe 200ml perkakas pcs 1700 kecil kotak terbaik sedikit naik

Page 76: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

58

Tabel 4.5 Data Jenis Botol Keseluruhan (Lanjutan)

id

ba

ran

g

nama barang Ka

tego

ri

satu

an

Ha

rga

Uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl094 botol madu 100ml perkakas pcs 3200 kecil kotak terbaik sedikit naik

btl095 botol madu 200ml perkakas pcs 3700 kecil kotak terbaik sedikit naik

btl096 botol mahmud 250ml perkakas pcs 850 besar bulat terbaik sedikit naik

btl097 botol mahmud 350ml perkakas pcs 1000 besar bulat terbaik sedikit naik

btl098 botol mahmud 450ml perkakas pcs 1200 besar bulat terbaik sedikit naik

btl099 botol mahmud 500ml perkakas pcs 1300 besar bulat terbaik sedikit naik

btl100 botol matcha kotak 100ml perkakas pcs 1600 kecil kotak baik banyak turun

btl101 botol matcha kotak 150ml perkakas pcs 1900 kecil kotak baik banyak turun

btl102 botol matcha kotak 200ml perkakas pcs 2400 kecil kotak baik banyak turun

btl103 botol mg kotak 100ml perkakas pcs 900 kecil kotak terbaik banyak turun

btl104 botol mg kotak 150ml perkakas pcs 1100 kecil kotak terbaik banyak turun

btl105 botol mg kotak 200ml perkakas pcs 1300 kecil kotak terbaik banyak turun

btl106 botol mg kotak 50ml perkakas pcs 650 kecil kotak terbaik banyak turun

btl107 botol mg kotak 80ml perkakas pcs 750 kecil kotak terbaik banyak turun

btl108 botol parfum kotak 100ml perkakas pcs 1500 kecil kotak baik banyak naik

btl109 botol parfum kotak 10ml perkakas pcs 900 kecil kotak baik banyak naik

btl110 botol parfum kotak 20ml perkakas pcs 1000 kecil kotak baik banyak naik

btl111 botol parfum kotak 30ml perkakas pcs 1100 kecil kotak baik banyak naik

btl112 botol parfum kotak 50ml perkakas pcs 1200 kecil kotak baik banyak naik

btl113 botol parfum kotak 60ml perkakas pcs 1300 kecil kotak baik banyak naik

btl114 botol parfum kotak 80ml perkakas pcs 1400 kecil kotak baik banyak naik

btl115 botol parfum rol 10ml perkakas pcs 900 kecil kotak baik banyak naik

btl116 botol parfum rol 30ml perkakas pcs 1000 kecil kotak baik banyak naik

btl117 botol persegi moca 130ml perkakas pcs 1700 kecil kotak baik sedikit naik

btl118 botol persegi moca 160ml perkakas pcs 2000 kecil kotak baik sedikit naik

btl119 botol persegi moca 200ml perkakas pcs 2500 kecil kotak baik banyak naik

btl120 botol pipet 10ml perkakas pcs 2400 kecil kotak terbaik sedikit naik

btl121 botol pipet 10ml segel perkakas pcs 2700 kecil kotak terbaik banyak turun

btl122 botol pipet 15ml perkakas pcs 2500 kecil kotak terbaik sedikit naik

btl123 botol pipet 15ml segel perkakas pcs 2900 kecil kotak terbaik banyak turun

btl124 botol pipet 20ml segel perkakas pcs 3000 kecil kotak terbaik banyak turun

btl125 botol pipet 30ml perkakas pcs 2700 kecil kotak terbaik sedikit naik

btl126 botol pipet 30ml segel perkakas pcs 3200 kecil kotak terbaik banyak turun

btl127 botol pipet 40ml perkakas pcs 2900 kecil kotak terbaik sedikit naik

btl128 botol pipet 40ml segel perkakas pcs 3400 kecil kotak terbaik banyak turun

Page 77: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

59

Tabel 4.6 Data Jenis Botol Keseluruhan (Lanjutan)

id

ba

ran

g

nama barang Ka

tego

ri

satu

an

Ha

rga

Uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl129 botol pipet 50ml segel perkakas pcs 2100 kecil kotak terbaik banyak turun

btl130 botol pipet 5ml perkakas pcs 2300 kecil kotak terbaik sedikit naik

btl131 botol pipet 5ml segel perkakas pcs 2500 kecil kotak terbaik banyak turun

btl132 botol prima 1000ml perkakas pcs 3500 besar bulat baik banyak naik

btl133 botol prima 250ml perkakas pcs 1600 besar bulat baik banyak naik

btl134 botol prima 350ml perkakas pcs 1700 besar bulat baik banyak naik

btl135 botol prima 500ml perkakas pcs 2500 besar bulat baik banyak naik

btl136 botol prima 600ml perkakas pcs 2600 besar bulat baik banyak naik

btl137 botol prima 750ml perkakas pcs 3000 besar bulat baik banyak naik

btl138 botol prima kotak 1000ml perkakas pcs 3200 besar kotak terbaik banyak turun

btl139 botol prima kotak 250ml perkakas pcs 1600 besar kotak terbaik banyak turun

btl140 botol prima kotak 500ml perkakas pcs 2500 besar kotak terbaik banyak turun

btl141 botol pro round 100ml perkakas pcs 1500 kecil kotak terbaik sedikit naik

btl142 botol pro round 150ml perkakas pcs 1700 kecil kotak terbaik sedikit naik

btl143 botol pro round 200ml perkakas pcs 1900 kecil kotak terbaik sedikit naik

btl144 botol ps kotak 100ml perkakas pcs 850 kecil kotak terbaik banyak naik

btl145 botol ps kotak 130ml perkakas pcs 950 kecil kotak terbaik banyak naik

btl146 botol ps kotak 150ml perkakas pcs 1100 kecil kotak terbaik banyak naik

btl147 botol ps kotak 200ml perkakas pcs 1300 kecil kotak terbaik banyak naik

btl148 botol ps kotak 80ml perkakas pcs 750 kecil kotak terbaik banyak naik

btl149 botol pump 250ml perkakas pcs 3200 besar bulat terbaik banyak naik

btl150 botol pump 320ml perkakas pcs 3500 besar bulat terbaik banyak naik

btl151 botol pump 500ml perkakas pcs 3900 besar bulat terbaik banyak naik

btl152 botol pump kotak 1000ml perkakas pcs 5000 besar kotak terbaik banyak turun

btl153 botol pump kotak 250ml perkakas pcs 3200 besar kotak terbaik banyak turun

btl154 botol pump kotak 330ml perkakas pcs 3700 besar kotak baik banyak turun

btl155 botol pump kotak 500ml perkakas pcs 4200 besar kotak terbaik banyak turun

btl156 botol pump kotak 750ml perkakas pcs 4600 besar kotak terbaik banyak turun

btl157 botol sabun 250ml perkakas pcs 950 besar bulat terbaik banyak naik

btl158 botol sabun 330ml perkakas pcs 1100 besar bulat terbaik banyak naik

btl159 botol sabun 450ml perkakas pcs 1200 besar bulat terbaik banyak naik

btl160 botol sabun 600ml perkakas pcs 1400 besar bulat terbaik banyak naik

btl161 botol sabun 700ml perkakas pcs 1500 besar bulat terbaik banyak naik

btl162 botol sase 1000ml perkakas pcs 2900 besar bulat terbaik banyak naik

btl163 botol sase 250ml perkakas pcs 1600 besar bulat terbaik banyak naik

Page 78: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

60

Tabel 4.7 Data Jenis Botol Keseluruhan (Lanjutan)

id

ba

ran

g

nama barang Ka

tego

ri

satu

an

Ha

rga

Uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl164 botol sase 350ml perkakas pcs 1900 besar bulat terbaik banyak naik

btl165 botol sase 500ml perkakas pcs 2400 besar bulat terbaik banyak naik

btl166 botol sase kotak 1000ml perkakas pcs 3200 besar kotak baik banyak turun

btl167 botol sase kotak 250ml perkakas pcs 1600 besar kotak terbaik banyak turun

btl168 botol sase kotak 350ml perkakas pcs 1900 besar kotak baik banyak turun

btl169 botol sase kotak 500ml perkakas Pcs 2500 besar kotak baik banyak turun

btl170 botol sase kotak 750ml perkakas Pcs 2900 besar kotak terbaik banyak turun

btl171 botol sehat 1000ml perkakas Pcs 1450 besar bulat terbaik banyak naik

btl172 botol sehat 330ml perkakas Pcs 850 besar bulat terbaik banyak naik

btl173 botol sehat 500ml perkakas Pcs 950 besar bulat terbaik banyak naik

btl174 botol sehat 600ml perkakas Pcs 1200 besar bulat terbaik banyak naik

btl175 botol sehat 750ml perkakas Pcs 1300 besar bulat terbaik banyak naik

btl176 botol slim kotak 100ml perkakas Pcs 1600 kecil kotak baik banyak turun

btl177 botol slim kotak 150ml perkakas Pcs 2000 kecil kotak baik banyak turun

btl178 botol slim kotak 200ml perkakas Pcs 2500 kecil kotak baik banyak turun

btl179 botol spray 20ml perkakas Pcs 1700 kecil bulat baik banyak naik

btl180 botol spray 250ml perkakas Pcs 2500 besar bulat baik sedikit naik

btl181 botol spray 30ml perkakas Pcs 1700 kecil bulat baik banyak naik

btl182 botol spray 350ml perkakas Pcs 2900 besar bulat baik sedikit naik

btl183 botol spray 500ml perkakas Pcs 3200 besar bulat baik sedikit naik

btl184 botol spray 60ml perkakas Pcs 1800 kecil bulat baik banyak naik

btl185 botol spray kotak 100ml perkakas Pcs 1200 kecil kotak baik sedikit turun

btl186 botol spray kotak 30ml perkakas Pcs 850 kecil kotak baik sedikit turun

btl187 botol spray kotak 60ml perkakas Pcs 1000 kecil kotak baik sedikit turun

btl188 botol spray trigger 250ml perkakas Pcs 4200 besar bulat baik banyak naik

btl189 botol tablet 100ml perkakas Pcs 1600 kecil kotak baik sedikit naik

btl190 botol tablet 130ml perkakas Pcs 1800 kecil kotak baik banyak naik

btl191 botol tablet 150ml perkakas Pcs 2000 kecil kotak baik sedikit naik

btl192 botol tablet 200ml perkakas Pcs 2300 kecil kotak baik sedikit naik

btl193 botol takar kotak 100ml perkakas Pcs 1650 kecil kotak baik banyak turun

btl194 botol takar kotak 150ml perkakas Pcs 1900 kecil kotak baik banyak turun

btl195 botol takar kotak 200ml perkakas Pcs 2200 kecil kotak baik banyak turun

btl196 botol tetes 10ml perkakas Pcs 900 kecil bulat baik sedikit naik

btl197 botol tetes 15ml perkakas Pcs 1000 kecil bulat baik sedikit naik

btl198 botol tetes 20ml perkakas Pcs 1100 kecil bulat baik sedikit naik

Page 79: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

61

Tabel 4.8 Data Jenis Botol Keseluruhan (Lanjutan)

id

ba

ran

g

nama barang Ka

tego

ri

satu

an

Ha

rga

Uk

ura

n

ben

tuk

ku

ali

tas

ba

ha

n

wa

rna

min

at

btl199 botol tetes 30ml perkakas Pcs 1200 kecil bulat baik sedikit naik

btl200 botol wafe kotak 100ml perkakas Pcs 1000 kecil kotak baik sedikit turun

btl201 botol wafe kotak 150ml perkakas Pcs 1200 kecil kotak baik sedikit turun

btl202 botol wafe kotak 200ml perkakas Pcs 1400 kecil kotak baik sedikit turun

btl203 botol wafe kotak 230ml perkakas Pcs 1450 kecil kotak baik sedikit turun

btl204 botol yardley kotak 1000ml perkakas Pcs 1400 besar kotak terbaik banyak turun

btl205 botol yardley kotak 250ml perkakas Pcs 600 besar kotak baik banyak turun

btl206 botol yardley kotak 330ml perkakas Pcs 700 besar kotak terbaik banyak turun

btl207 botol yardley kotak 400ml perkakas Pcs 800 besar kotak terbaik banyak turun

btl208 botol yardley kotak 500ml perkakas Pcs 950 besar kotak terbaik banyak turun

btl209 botol yardley kotak 600ml perkakas Pcs 1100 besar kotak terbaik banyak turun

btl210 botol yardley kotak 750ml perkakas Pcs 1250 besar kotak terbaik banyak turun

Data diatas adalah data keseluruhan, untuk melakukan pengolahan data di

RapidMiner data yang digunakan adalah Data Training dari seluruh populasi, data di

ambil 80% dari data seluruh populasi untuk di jadikan Data Training yang akan dipakai

untuk membuat model atau rule, dan 20% sebagai Data Testing yang dipakai untuk

sample testing.

Tabel 4.9 Data Training (80% dari Data Keseluruhan)

harga ukuran Bentuk kualitas bahan warna minat

2700 kecil Kotak Baik sedikit naik

2400 kecil Kotak Baik banyak naik

2100 kecil Kotak Baik sedikit naik

1000 besar Bulat Terbaik banyak naik

1100 besar Bulat Terbaik banyak naik

1100 besar Bulat Terbaik banyak naik

1200 besar Bulat Terbaik banyak naik

2900 besar Bulat Baik banyak naik

Page 80: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

62

Tabel 4.10 Data Training (80% dari Data Keseluruhan)

harga ukuran Bentuk kualitas bahan warna minat

1900 besar Bulat Baik banyak naik

2400 besar Bulat Baik banyak Naik

2500 besar Bulat Baik banyak Naik

750 kecil Kotak Terbaik banyak Turun

1700 besar Bulat Terbaik banyak Naik

1850 besar Bulat Terbaik banyak Naik

2100 besar Bulat Terbaik banyak Naik

1900 kecil Kotak Terbaik sedikit Naik

2150 kecil Kotak Terbaik sedikit Naik

2400 kecil Kotak Terbaik sedikit Naik

2650 kecil Kotak Terbaik sedikit Naik

3400 besar Bulat Baik banyak Naik

1550 besar Bulat Baik banyak Naik

1650 besar Bulat Baik banyak Naik

2500 besar Bulat Baik banyak Naik

3000 besar Bulat Baik banyak Naik

1900 kecil Bulat Terbaik sedikit Naik

1600 kecil Bulat Terbaik sedikit Naik

1600 kecil Bulat Terbaik sedikit Naik

1700 kecil Bulat Terbaik sedikit Naik

1900 kecil Bulat Terbaik sedikit Naik

1600 kecil Bulat Terbaik sedikit Naik

1600 kecil Bulat Terbaik sedikit Naik

1700 kecil Bulat Terbaik sedikit Naik

1600 kecil Kotak Baik banyak Naik

1900 kecil Kotak Baik sedikit Naik

1900 kecil Kotak Baik banyak Turun

2400 kecil Kotak Baik banyak Turun

3400 besar Bulat Baik banyak Naik

1550 besar Bulat Baik banyak Naik

1700 besar Bulat Baik banyak Naik

2400 besar Bulat Baik banyak Naik

1600 besar Kotak Terbaik banyak Turun

1900 besar Kotak Terbaik banyak Turun

2500 besar Kotak Baik banyak Turun

1900 kecil Bulat Terbaik sedikit Naik

Page 81: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

63

Tabel 4.11 Data Training (80% dari Data Keseluruhan)

harga ukuran Bentuk kualitas bahan warna minat

2000 kecil Kotak Baik banyak Turun

2100 kecil Bulat Terbaik sedikit Naik

2450 kecil Kotak Baik banyak Turun

2300 kecil Bulat Terbaik sedikit Naik

1900 kecil Kotak Terbaik sedikit Naik

2100 kecil Kotak Terbaik sedikit Naik

2300 kecil Kotak Terbaik sedikit Naik

600 besar Kotak Terbaik banyak Turun

700 besar Kotak Terbaik banyak Turun

800 besar Kotak Terbaik banyak Turun

1700 besar Bulat Baik banyak naik

2500 besar Bulat Baik banyak naik

2600 besar Bulat Baik banyak naik

3000 besar Bulat Baik banyak naik

3200 besar Kotak Terbaik banyak turun

1600 besar Kotak Terbaik banyak turun

2500 besar Kotak Terbaik banyak turun

1500 kecil Kotak Terbaik sedikit naik

1700 kecil Kotak Terbaik sedikit naik

1900 kecil Kotak Terbaik sedikit naik

850 kecil Kotak Terbaik banyak naik

950 kecil Kotak Terbaik banyak naik

1100 kecil Kotak Terbaik banyak naik

1300 kecil Kotak Terbaik banyak naik

750 kecil Kotak Terbaik banyak naik

3200 besar Bulat Terbaik banyak naik

3500 besar Bulat Terbaik banyak naik

3900 besar Bulat Terbaik banyak naik

5000 besar Kotak Terbaik banyak turun

3200 besar Kotak Terbaik banyak turun

3700 besar Kotak Baik banyak turun

4200 besar Kotak Terbaik banyak turun

4600 besar Kotak Terbaik banyak turun

950 besar Bulat Terbaik banyak naik

1100 besar Bulat Terbaik banyak naik

1200 besar Bulat Terbaik banyak naik

Page 82: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

64

Tabel 4.12 Data Training (80% dari Data Keseluruhan)

harga ukuran Bentuk kualitas bahan warna minat

1400 besar Bulat Terbaik banyak naik

1500 besar Bulat Terbaik banyak naik

2900 besar Bulat Terbaik banyak naik

1600 besar Bulat Terbaik banyak naik

1900 besar Bulat Terbaik banyak naik

2400 besar Bulat Terbaik banyak naik

3200 besar Kotak Baik banyak turun

1600 besar Kotak Terbaik banyak turun

1900 besar Kotak Baik banyak turun

2500 besar Kotak Baik banyak turun

2900 besar Kotak Terbaik banyak turun

1450 besar Bulat Terbaik banyak naik

850 besar Bulat Terbaik banyak naik

950 besar Bulat Terbaik banyak naik

1200 besar Bulat Terbaik banyak naik

1300 besar Bulat Terbaik banyak naik

1600 kecil Kotak Baik banyak turun

2000 kecil Kotak Baik banyak turun

2500 kecil Kotak Baik banyak turun

1700 kecil Bulat Baik banyak naik

2500 besar Bulat Baik sedikit naik

1700 kecil Bulat Baik banyak naik

2900 besar Bulat Baik sedikit naik

3200 besar Bulat Baik sedikit naik

1800 kecil Bulat Baik banyak naik

1200 kecil Kotak Baik sedikit turun

850 kecil Kotak Baik sedikit turun

1000 kecil Kotak Baik sedikit turun

4200 besar Bulat Baik banyak naik

1600 kecil Kotak Baik sedikit naik

1800 kecil Kotak Baik banyak naik

2000 kecil Kotak Baik sedikit naik

2300 kecil Kotak Baik sedikit naik

1650 kecil Kotak Baik banyak turun

1900 kecil Kotak Baik banyak turun

2200 kecil Kotak Baik banyak turun

Page 83: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

65

Tabel 4.13 Data Training (80% dari Data Keseluruhan)

harga ukuran Bentuk kualitas bahan warna minat

900 kecil Bulat Baik sedikit naik

1000 kecil Bulat Baik sedikit naik

1100 kecil Bulat Baik sedikit naik

1200 kecil Bulat Baik sedikit naik

1000 kecil Kotak Baik sedikit turun

1200 kecil Kotak Baik sedikit turun

1400 kecil Kotak Baik sedikit turun

1450 kecil Kotak Baik sedikit turun

1400 besar Kotak Terbaik banyak turun

600 besar Kotak Baik banyak turun

700 Besar Kotak Terbaik banyak turun

800 Besar Kotak Terbaik banyak turun

950 Besar Kotak Terbaik banyak turun

1100 Besar Kotak Terbaik banyak turun

1250 Besar Kotak Terbaik banyak turun

Data diatas adalah data training, data training adalah 80% dari data keseluruhan,

total populasi data training berjumlah 168 data. Data training dipilih secara acak dan

menghapus atribut id barang, nama barang, kategori, dan satuan karena atribut tersebut

tidak berpengaruh saat pengolahan data di RapidMiner. Atribut yang dipakai hanya harga,

ukuran, bentuk, kualitas bahan, warna dan minat (naik dan turun).

Tabel 4.14 Data Testing (20% dari data keseluruhan)

Harga ukuran Bentuk kualitas bahan warna Minat

1500 besar Bulat Baik banyak Naik

1900 besar Bulat Baik banyak Naik

2100 besar Bulat Baik banyak Naik

900 kecil Kotak terbaik banyak Turun

1100 kecil Kotak terbaik banyak Turun

650 kecil Kotak terbaik banyak Turun

Page 84: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

66

Tabel 4.15 Data Testing (20% dari data keseluruhan)

Harga ukuran Bentuk kualitas bahan warna Minat

1900 kecil Kotak Baik banyak Naik

1400 besar Bulat terbaik banyak Naik

4200 besar Bulat Baik sedikit Naik

1600 kecil Kotak Baik banyak Turun

2500 besar Bulat Baik banyak Naik

3000 besar Bulat Baik banyak Naik

3200 besar Kotak terbaik banyak Turun

1600 besar Kotak terbaik banyak Turun

1900 besar Kotak terbaik banyak Turun

2500 besar Kotak Baik banyak Turun

3000 besar Bulat terbaik banyak Naik

1700 besar Bulat terbaik banyak Naik

2500 besar Bulat terbaik banyak Naik

1200 besar Bulat terbaik sedikit naik

1300 besar Bulat terbaik sedikit naik

1900 besar Bulat Baik sedikit naik

2200 besar Bulat Baik sedikit naik

1000 besar Bulat terbaik sedikit naik

1200 besar Bulat terbaik sedikit naik

1300 besar Bulat terbaik sedikit naik

1600 kecil Kotak Baik banyak turun

1900 kecil Kotak Baik banyak turun

1100 kecil Kotak terbaik banyak turun

1300 kecil Kotak terbaik banyak turun

650 kecil Kotak terbaik banyak turun

750 kecil Kotak terbaik banyak turun

1500 kecil Kotak baik banyak naik

900 kecil Kotak baik banyak naik

1000 kecil Kotak baik banyak naik

1100 kecil Kotak baik banyak Naik

2500 kecil Kotak terbaik sedikit Naik

2900 kecil Kotak terbaik banyak Turun

3000 kecil Kotak terbaik banyak Turun

2700 kecil Kotak terbaik sedikit Naik

3200 kecil Kotak terbaik banyak Turun

2900 kecil Kotak terbaik sedikit Naik

Page 85: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

67

Data diatas adalah data testing, data testing adalah 20% dari data keseluruhan,

total populasi data testing berjumlah 42 data. Data testing dipilih secara acak, dan

menghapus atribut id barang, nama barang, kategori, dan satuan karena atribut tersebut

tidak berpengaruh saat pengolahan data di RapidMiner. Atribut yang dipakai hanya harga,

ukuran, bentuk, kualitas bahan, warna dan minat (naik dan turun).

4.1.2 Pemilihan Data

Gambar 4.1 Pemilihan Data

Sumber: Pengolahan Data

Langkah awal dalam mengelola data adalah memasukkan data yang ingin diolah

kedalam RapidMiner. Data yang akan dimasukkan yaitu data training atau data testing.

Pastikan sheet data yang ingin kita masukkan benar.

Page 86: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

68

4.1.3 Pemilihan Atribut Sebagai Label

Gambar 4.2 Pemilihan Atribut Sebagai Label

Sumber: Pengolahan Data

Pada atribut minat pilih sebagai binominal dan label, sedangkan yang lain

disesuaikan setelah itu tekan finish.

4.1.4 Cross Validation

Gambar 4.3 Cross Validation

Sumber: Pengolahan Data

Page 87: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

69

Cari operator cross validation pada kolom pencarian operator, selanjutnya double

click pada cross validation.

4.1.5 Main Proces Decision Tree

Gambar 4.4 Main Proces Decision Tree (Data Training)

Sumber: Pengolahan Data

Dalam proses ini dimasukan operator Decision Tree, Apply Model dan

Performance pada Main Proces, lalu hubungkan kabel-kabel tersebut. lalu klik tanda

panah yang mengarah keatas. Pastikan kabel-kabel tersebut terhubung secara benar,

sehingga tidak terjadi error.

Page 88: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

70

4.1.6 Main Proces Validation

Gambar 4.5 Main Proces Validation

Sumber: Pengolahan Data

Setelah muncul Validation pada Main Proces geser Validation kekanan lalu

sambungkan kabel Input ke Read Excell satu kabel, Read Excell ke Validation satu kabel

dan Validation ke Res empat kabel. Lalu tekan Running atau Play (segitiga warna biru)

di atas.

Page 89: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

71

4.2 Pembahasan

4.2.1 Decision Tree

Gambar 4.6 Decision Tree

Sumber: Pengolahan Data

Dari gambar diatas bisa diambil keputusan pengaruh terbesar penjualan yaitu dari

faktor bentuk barang itu sendiri. jika bentuk bulat maka penjualan naik, jika bentuk kotak

ukuran besar maka penjualan turun, jika bentuk kotak ukuran kecil warna banyak dan

harga lebih dari Rp1500 maka penjualan turun, jika bentuk kotak ukuran kecil warna

banyak dan harga dibawah atau sama dengan Rp1500 maka penjualan naik, jika bentuk

kotak ukuran kecil warna sedikit harga lebih dari Rp1475 maka penjualan akan naik, dan

Page 90: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

72

jika bentuk kotak ukuran kecil warna sedikit harga dibawah atau sama dengan Rp1475

maka penjualan akan turun.

4.2.2 Confusion Matrix

4.2.2.1 Accuracy (Data Training)

Gambar 4.7 Accuracy Data Training

Sumber: Pengolahan Data

Hasil pengukuran akurasi data yang diperoleh dari data training nilainya

mencapai 90.59%. Dari tabel tersebut diketahui prediksi naik dengan true naik mencapai

107 barang dan true turun sebanyak 13 barang, dengan hasil pencapaian nilai presisi

sebesar 89.17%. Sedangkan untuk prediksi penjualan barang turun untuk true naik

mencapai 3 barang dan untuk true turun terdapat 45 barang dengan hasil pencapaian nilai

presisi sebesar 93.75%. Untuk recall data barang yang sangat tinggi terdapat pada class

recall tue naik mencapai 97.27% sedangkan untuk class recall true turun mencapai

77.59%.

Page 91: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

73

4.2.2.2 Recall Data (Data Training)

Gambar 4.8 Recall Data (Data Training)

Sumber: Pengolahan Data

Hasil pengukuran recall data yang diperoleh dari data training nilainya mencapai

78.33%. Dari tabel tersebut diketahui prediksi naik dengan true naik mencapai 107 barang

dan true turun sebanyak 13 barang, dengan hasil pencapaian nilai presisi sebesar 89.17%.

Sedangkan untuk prediksi penjualan barang turun untuk true naik mencapai 3 barang dan

untuk true turun terdapat 45 barang dengan hasil pencapaian nilai presisi sebesar 93.75%.

Untuk recall data barang yang sangat tinggi terdapat pada class recall tue naik mencapai

97.27% sedangkan untuk class recall true turun mencapai 77.59%.

Page 92: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

74

4.2.2.3 Accuracy (Data Testing)

Gambar 4.9 Accuracy (Data Training)

Sumber: Pengolahan Data

Hasil pengukuran akurasi data yang diperoleh dari data testing nilainya mencapai

88.00%. Dari tabel tersebut diketahui prediksi naik dengan true naik mencapai 23 barang

dan true turun sebanyak 3 barang, dengan hasil pencapaian nilai presisi sebesar 88.46%.

Sedangkan untuk prediksi penjualan barang turun untuk true naik mencapai 2 barang dan

untuk true turun terdapat 14 barang dengan hasil pencapaian nilai presisi sebesar 87.50%.

Untuk recall data barang yang sangat tinggi terdapat pada class recall tue naik mencapai

92.00% sedangkan untuk class recall true turun mencapai 82.35%.

Page 93: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

75

4.2.2.3 Recall Data (Data Testing)

Gambar 4.10 Recall Data (Data Testing)

Sumber: Pengolahan Data

Hasil pengukuran recall data yang diperoleh dari data training nilainya mencapai

86.67%. Dari tabel tersebut diketahui prediksi naik dengan true naik mencapai 23 barang

dan true turun sebanyak 3 barang, dengan hasil pencapaian nilai presisi sebesar 88.46%.

Sedangkan untuk prediksi penjualan barang turun untuk true naik mencapai 2 barang dan

untuk true turun terdapat 14 barang dengan hasil pencapaian nilai presisi sebesar 87.50%.

Untuk recall data barang yang sangat tinggi terdapat pada class recall tue naik mencapai

92.00% sedangkan untuk class recall true turun mencapai 82.35%.

4.2.3 ROC/AUC (Area Under Cover)

Performance keakurasian AUC (Gorunescu, 2010) dapat diklasifikasikan menjadi

lima kelompok yaitu:

a. 0.90 – 1.00 = Excellent Classification.

Page 94: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

76

b. 0.80 – 0.90 = Good Classification.

c. 0.70 – 0.80 = Fair Classification.

d. 0.60 – 0.70 = Poor Classification.

e. 0.50 – 0.60 = Failure.

4.2.3.1 ROC/AUC Data Training

Gambar 4.11 ROC/AUC Data Training

Sumber: Pengolahan Data

Hasil yang didapat dari pengolahan ROC metode Algoritma C4.5 sebesar 0.998

menggunakan data training dapat dilihat gambar diatas dengan tingkat akurasi Excellent

Classification.

Page 95: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

77

4.2.3.2 ROC/AUC Data Testing

Gambar 4.12 ROC/AUC Data Testing

Sumber: Pengolahan Data

Sedangkan dari pengolahan ROC menggunakan data testing sebesar 1.000 dapat

dilihat digambar diatas dengan tingkat akurasi Excellent Classification.

Page 96: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

78

BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Berdasarkan hasil eveluasi dan validasi hasil serta uji coba pada penelitian

data mining prediksi penjualan botol menggunakan algoritma C4.5, peneliti dapat

menyimpulkan bahwa dengan menggunakan algoritma C4.5 maka penjualan botol

dapat diprediksi dengan akurasi yang cukup tinggi, hasil pengukuran akurasi data

yang diperoleh dari data training dengan Confusion Matrix nilainya mencapai

90.59% dan data testing tingkat akurasinya mencapai 88.00%. Jika dilihat dengan

kurva ROC, data training memiliki akurasi Exellent Clasification sebesar 0.998 dan

data testing dengan akurasi Exellent Clasification sebesar 1.000.

5.2 Saran

Dari hasil pengujian yang telah dilakukan dan hasil kesimpulan, maka saran

yang dapat diberikan penulis untuk pengembangan pada penelitian selanjutnya

adalah:

1. Memaksimalkan atau menambah atribut yang lebih spesifik dan lebih

banyak dalam menentukan prediksi penjualan botol seperti ketebalan botol,

panjang botol dan lain sebagainya oleh pihak perusahaan agar prediksi

kompetensi semakin akurat.

Page 97: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

79

2. Perlu adanya penelitian lebih lanjut dengan melakukan pengujian dengan

metode lain maupun komparasi seperti Naive Bayes, Neural Network dan

lain sebagainya agar memperoleh perbandingan dengan tingkat akurasi

yang paling tinggi dalam membuat kualifikasi prediksi penjualan botol.

3. Dalam penelitian selanjutnya diharapkan penelitian ini dapat dikembangkan

dalam bentuk aplikasi.

Page 98: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

72

DAFTAR PUSTAKA

Harahap, Fitriana. 2015. Penerapan Data Mining Dalam Memprediksi Pembelian

Cat. Medan: STMIK Potensi Utama.

Santoso, Teguh Budi. 2013. Analisa Dan Penerapan Metode C4.5 Untuk Prediksi

Loyalitas Pelanggan. Jakarta: Universitas Satya Negara Indonesia.

Fajrin, Alfannisa Annurullah dan Algifanri Maulana. 2018. Penerapan Data

Mining Untuk Analisa Pola Pembelian Konsumen Dengan Algoritma FP

Growth Pada Data Transaksi Penjualan Spare Part Motor. Batam:

Universitas Putera Batam.

Azwanti, Nurul. 2018. Analisa Algoritma C4.5 Untuk Memprediksi Penjualan

Motor Pada PT.Capella Dinamik Nusantara Cabang Muka Kuning. Batam:

Universitas Putera Batam.

Vathsala, H dan Shashidhar G Koolagudi. 2015. Close Item-Set Mining For

Prediction Of India Summer Monsoon Rainfall A Data Mining Model With

Land and Ocean Variables As Predictors. India: National Institute Of

Technologi.

Eska, Juna. 2016. Penerapan Data Mining Untuk Prediksi Penjualan Wallpaper

Page 99: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

73

menggunakan Algoritma C4.5. Medan: STMIK Royal Kisaran.

Rani, Larissa Navia. 2015. Klasifikasi Nasaah Menggunakan Algoritma C4.5

Sebagai Dasar Pemberian Kredit. Padang: Universitas Putera Indonesia

YPTK.

Sunge, Aswan Supriyadi. 2018. Prediksi Kompetensi Karyawan Menggunakan

Algoritma C4.5 (Studi Kasus: PT. Hankook Tire Indonesia). Bekasi: STT

Pelita Bangsa.

Purnamasari, Detty, Jonathan Henharta, Yoga Perdana Sasmita, Fuji Ihsani dan I

Wayan Simri Wicaksana. 2013. Get Easy Using Weka. Makasar: Dapur

Buku.

Page 100: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...
Page 101: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...
Page 102: PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI ...

DAFTAR RIWAYAT HIDUP

DATA PRIBADI :

Nama : Tri Bagus Tusarwenda

Usia : 24 Tahun

Tempat/Tgl lahir : Indramayu, 23 Agustus 1994

Jenis Kelamin : Laki-Laki

Agama : Islam

Status Pernikahan : Belum Menikah

Alamat sekarang : Jl. Makrik Rt 001/004 No 15 Kel. Bojong rawalumbu

Kec. Rawalumbu Bekasi 17116

No. Telpon : 0896 3747 7100

E-mail : [email protected]

PENDIDIKAN FORMAL :

1. Tamatan SDN Pengasinan II Bekasi Tahun 2001-2007 LULUS

2. Tamatan SMP Widya Nusantara Bekasi Tahun 2007-2010 LULUS

3. Tamatan SMK Binakarya Mandiri Bekasi Tahun 2010-2013 LULUS

4. Sekolah Tinggi Teknologi Pelita Bangsa Tahun 2014- Sekarang

Hormat Saya,

(Tri Bagus Tusarwenda )