Achmad Fajri Nur Khakim_Universitas Negeri Semarang_PKMKC.PDF
FAJRI AGUSTOMI - Universitas Pelita Bangsa
Transcript of FAJRI AGUSTOMI - Universitas Pelita Bangsa
PREDIKSI KELAYAKAN KREDIT KENDARAAN
BERMOTOR RODA DUA DENGAN ALGORITMA
C4.5
SKRIPSI
Oleh:
FAJRI AGUSTOMI
311410092
TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
PREDIKSI KELAYAKAN KREDIT KENDARAAN
BERMOTOR RODA DUA DENGAN ALGORITMA
C4.5
SKRIPSI
Diajukan Sebagai Salah Satu Syarat Untuk Menyelesaikan
Program Strata Satu (S1) pada Program Studi Teknik Informatika
Oleh:
FAJRI AGUSTOMI
311410092
TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
PERSETlJJUAN
SKRIPSI
PREDIKSI KELA Y AKAN KREDIT KENDARAAN BERMOTOR RODA
DUA DENGAN ALGORTTMA C4.5
Yang disusun oleh
FAJRI AGUSTOMI
311410092
Telah disetujui oleh Dosen Pembimbing Skripsi
Pada tanggal J~.:~ .. !l! .. --: .. 1..0( g
Dosen Pembimbing 1
Muhammad Makmun Effendi, S.Kom,M.Kom
NIDN: 0430087804
Mengetahui
Dosen Pembimbing 2
Rosi ' in, M.Pd
NIDN: 0414067303
Kaprodi T ·k Informatika
NIDN: 0426018083
PE~GESAHAN
SKRIPSI
PREDIKSI KELAYAKAN KREDIT KENDARAAN BERMOTOR RODA
DUA DENGAN ALGORITMA C4.5
Nama Penguji
Yang disusun oleh
FAJRI AGUSTOMI
311410092
Telah dipertahankan di depan Dewan Penguji
Pada tanggal 20 Oktober 20 18
Susunan Dewan Penguji
Tanda Tangan
Nama dan gelar penguji 1 Drs. Muh!d~in D .. M.Kom NIDN: 0401056703
Nama dan gelar penguji 2
Meogetahui
v {}J('-_Of\11_ .
Andrianr,::s.;, M.T NIDN: 0403049102
Teknik Informatika
Ketua STT Pelita Bangsa
NIDN: 0401066605
.. II
..
PER!'JYATAAN KEASLIAN PENELITIAN
Saya yang bertanda tangan dibawah ini menyatakan bahwa, skripsi ini
merupakan karya saya sendiri (ASLJ), dan isi dalam skripsi ini tidak terdapat
karya yang pemah diajukan oleh orang lain untuk memperoleh gelar akademis di
suatu institusi pendidikan tinggi manapun, dan sepanjang pengetahuan saya juga
tidak terdapat karya atau pendapat yang pemah ditulis dan/atau diterbitkan oleh
orang lain, kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan
dalam daftar pustaka.
Segala sesuatu yang terkait dengan naskah dan karya yang telah dibuat
adalah menjadi tanggungjawab saya pribadi.
Bekasi, /':1..~..1.<? .. ~.~-?18
.... <:,;,,~zt OAFF3355599
~
00 ,._, _ BURUPIAH
F AJRI AGUSTOMI
311410092
Ill
iv
KATA PENGANTAR
Puji syukur penulis panjatkan kehadiran Allah SWT. yang telah
melimpahkan segala rahmat dan hidayah-Nya, sehingga tersusunlah Skripsi yang
berjudul “PREDIKSI KELAYAKAN KREDIT KENDARAAN BERMOTOR
RODA DUA DENGAN ALGORITMA C4.5”.
Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam
rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer
(S.Kom.) pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi
Pelita Bangsa.
Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah
selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan
terimakasih yang sebesar-besarnya kepada:
a. Bapak Dr. Ir. Supriyanto, M.P selaku Ketua STT Pelita Bangsa
b. Bapak Aswan Sunge, S.Kom, M.Kom selaku Ketua Program Studi Teknik
Informatika STT Pelita Bangsa.
c. Bapak Muhammad Makmun Effendi, S.Kom M.Kom selaku Pembimbing
Utama yang telah banyak memberikan arahan dan bimbingan kepada penulis
dalam penyusunan Skripsi ini.
d. Seluruh Dosen STT Pelita Bangsa yang telah membekali penulis dengan
wawasan dan ilmu di bidang teknik informatika.
e. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya
kepada penulis selama perjalanan studi jenjang Strata 1.
f. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang
telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat
menyelesaikan studi jenjang Strata 1.
g. Ibu dan Ayah tercinta yang senantiasa mendo’akan dan memberikan semangat
dalam perjalanan studi Strata 1 maupun dalam kehidupan penulis.
Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang
terdapat dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan
manfaat bagi khasanah pengetahuan Teknologi Informasi di lingkungan STT
Pelita Ban gsa khususnya dan Indonesia pada umumnya.
Bekasi, .!~.:~ .. ~~ .. ~.?.-.0 1 Q
FAJRI AGUSTOMI
v
vi
DAFTAR ISI
PERSETUJUAN .................................................................................................. i
PENGESAHAN .................................................................................................. ii
PERNYATAAN KEASLAN PENELITIAN ..................................................... iii
KATA PENGANTAR ....................................................................................... iv
DAFTAR ISI ...................................................................................................... vi
DAFTAR TABEL ............................................................................................... x
DAFTAR GAMBAR ......................................................................................... xi
ABSTRACT ..................................................................................................... xiii
ABSTAKSI ...................................................................................................... xiv
BAB I PENDAHULUAN ................................................................................... 1
1.1 Latar Belakang .............................................................................................. 1
1.2 Identifikasi Masalah ...................................................................................... 2
1.3 Rumusan Masalah ......................................................................................... 3
1.4 Batasan Masalah............................................................................................ 3
1.5 Tujuan dan Manfaat ...................................................................................... 3
1.5.1 Tujuan .................................................................................................. 3
1.5.2 Manfaat ................................................................................................ 4
1.6 Metode Penelitian.......................................................................................... 5
vii
1.7 Sistematika Penulisan ................................................................................... 6
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI ........................... 7
2.1 Penelitian Terkait .......................................................................................... 7
2.2 Landasan Teori .............................................................................................. 9
2.2.1 Kredit ....................................................................................................... 9
2.2.2 Unsur-Unsur Kredit ................................................................................ 10
2.2.3 Data Mining ........................................................................................... 11
2.2.3.1 Pengelompokan Data Mining ............................................................. 12
2.2.3.2 Tahapan Data Mining ......................................................................... 14
2.2.4 Decision Tree ........................................................................................... 16
2.2.5 Algoritma C4.5 ......................................................................................... 18
2.2.6 Information Gain ...................................................................................... 22
2.2.7 RapidMiner .............................................................................................. 23
2.2.7.1 Keunggulan RapidMiner .................................................................... 24
2.2.7.2 Kelemahan RapidMiner ..................................................................... 25
2.2.8 Kuesioner ................................................................................................. 25
2.3 Kerangka Pemikiran .................................................................................... 26
BAB III METODE PENELITIAN.................................................................... 27
3.1 Objek Penelitian .......................................................................................... 27
3.1.1 Sejarah Perusahaan................................................................................ 27
3.1.2 Visi dan Misi ......................................................................................... 27
3.1.3 Struktur Organisasi ............................................................................... 28
viii
3.2 Instrumen Penelitian.................................................................................... 29
3.2.1 Bahan .................................................................................................... 29
3.2.2 Peralatan ................................................................................................ 29
3.3 Metode Pengumpulan Data, Populasi dan Sampel Penelitian .................... 32
3.3.1 Metode Pengumpulan Data ................................................................... 32
3.3.2 Populasi ................................................................................................. 33
3.3.3 Sampel Penelitian .................................................................................. 34
3.4 Tahapan Penelitian ...................................................................................... 34
3.5 Teknik Analisa Data .................................................................................... 36
3.6 Metode Analisa Data ................................................................................... 38
3.7 Pengolahan Awal Data ................................................................................ 40
3.7.1 Splid Validation .................................................................................... 41
3.7.2 Cross Validation .................................................................................... 41
3.7.3 Apply Model ......................................................................................... 42
3.7.4 Performance .......................................................................................... 42
3.8 Pemodelan ................................................................................................... 43
BAB IV HASIL DAN PEMBAHASAN .......................................................... 44
4.1 Kriteria Pelanggan ...................................................................................... 44
4.2 Perhitungan Algoritma C4.5 ...................................................................... 45
4.2.1 Menghitung Probabilitas Kelas ............................................................. 45
4.2.2 Menghitung Probabilitas Masing-Masing Atribut ................................ 46
4.2.3 Menghitung Probabilitas Akhir Untuk Setiap Kelas ............................. 48
ix
4.3 Hasil ........................................................................................................... 49
4.3.1 Evaluasi dan Validasi Hasil Algoritma C4.5 ........................................ 49
4.4 Pembahasan ................................................................................................ 58
4.4.1 Tahapan Proses RapidMiner ................................................................. 58
BAB V PENUTUP ............................................................................................ 78
5.1 Kesimpulan ................................................................................................ 78
5.2 Saran ........................................................................................................... 79
DAFTAR PUSTAKA ....................................................................................... 80
DAFTAR RIWAYAT HIDUP .......................................................................... 81
LEMBAR KONSULTASI BIMBINGAN SKRIPSI ........................................ 82
LAMPIRAN ...................................................................................................... 84
x
DAFTAR TABEL
Tabel 2.1 Tabel Ringkasan Penelitian ................................................................. 8
Tabel 2.2 Algoritma membuat Keputusan ........................................................ 19
Tabel 3.1 Kuesioner .......................................................................................... 30
Tabel 3.2 Atribut Yang Di Gunakan ................................................................. 40
Tabel 4.1 Probalitas Kelas................................................................................. 46
Tabel 4.2 Atribut Karakter ................................................................................ 46
Tabel 4.3 Atribut Pendidikan ............................................................................ 47
Tabel 4.4 Atribut Pekerjaan .............................................................................. 47
Tabel 4.5 Atribut Tanggungan .......................................................................... 47
Tabel 4.6 Atribut Rumah................................................................................... 48
Tabel 4.7 Atribut Pendapatan ............................................................................ 48
Tabel 4.8 Data Keseluruhan .............................................................................. 49
Tabel 4.9 Data Keseluruhan (Lanjutan) ............................................................ 50
Tabel 4.10 Data Keseluruhan (Lanjutan) .......................................................... 51
Tabel 4.11 Data Keseluruhan (Lanjutan) .......................................................... 52
Tabel 4.12 Data Keseluruhan (Lanjutan) .......................................................... 53
Tabel 4.13 Data Keseluruhan (Lanjutan) .......................................................... 54
Tabel 4.14 Data Keseluruhan (Lanjutan) .......................................................... 55
Tabel 4.15 Data Testing .................................................................................... 56
Tabel 4.16 Data Testing (Lanjutan) .................................................................. 57
xi
DAFTAR GAMBAR
Gambar 2.1 Tahapan Data Mining .................................................................... 14
Gambar 2.2 Decisien Tree................................................................................. 17
Gambar 2.3 Kerangka Pemikiran ...................................................................... 26
Gambar 3.1 Struktur Organisasi NSC Finance ................................................. 28
Gambar 3.2 Bagan Kerangka Pemikiran ........................................................... 35
Gambar 3.3 Teknik Analisa Data ...................................................................... 37
Gambar 4.1 Tampilan RapidMiner Saat Loading Pembukaan ......................... 58
Gambar 4.2 Tampilan Menu Awal Sebelum Proses ......................................... 59
Gambar 4.3 Tampilan Utama Proses Baru ........................................................ 60
Gambar 4.4 Tampilan Main Proses Read Excel ............................................... 61
Gambar 4.5 Pemilihan Data Yang Akan Di Proses .......................................... 61
Gambar 4.6 Pemilihan Data Training ............................................................... 62
Gambar 4.7 Atribut Label ................................................................................. 62
Gambar 4.8 Tampilan Model Training ............................................................. 63
Gambar 4.9 Nilai Performance Accuracy ......................................................... 64
Gambar 4.10 Nilai Description Accuracy ......................................................... 64
Gambar 4.11 Nilai Performance AUC (Optimistic) ......................................... 66
Gambar 4.12 Nilai Description AUC (Optimistic) ........................................... 67
Gambar 4.13 Nilai Performance AUC .............................................................. 68
Gambar 4.14 Nilai Description AUC ................................................................ 69
Gambar 4.15 Nilai Performance Precision........................................................ 70
Gambar 4.16 Nilai Description Precision ......................................................... 71
Gambar 4.17 Nilai Performance Recall ............................................................ 72
Gambar 4.18 Nilai Description Recall .............................................................. 72
xii
Gambar 4.19 Decision Tree .............................................................................. 73
Gambar 4.20 Nilai Description Decision Tree .................................................. 74
Gambar 4.21 Grafik Hasil Keseluruhan ............................................................ 76
Gambar 4.22 Grafik Hasil Layak dan Tidak Layak .......................................... 77
xiii
ABSTRACT
Determining the feasibility of motorbike credit in a leasing company is
very important, given that if there is a decision-making error it will affect the
company's loss which in this case is NSC finance. Therefore, the authors predict
motor credit feasibility with the C4.5 Algorithm method to determine whether or
not a motorbike loan is feasible. The author uses the Rapidminner version 9.0
supporting application to test the accuracy of the system made. Tests are carried
out with as much as 200 training data and data testing as many as 40 randomly
selected data. The testing data will be analyzed using the Rapidminner version 9.0
supporting application. the results of testing the prediction accuracy of
determining motor credit feasibility with the C4.5 Algorithm method are quite
high, namely 85.83%.
Keyworad: Prediction, Algorithm C4.5, Creditworthiness
xiv
ABSTRAK
Penentuan kelayakan kredit motor pada sebuah perusahaan leasing adalah
hal yang sangat penting, mengingat jika terjadi kesalahan pengambilan keputusan
maka akan berdampak kerugian perusahaan yang pada kasus ini adalah NSC
finance. Oleh karena itu penulis memprediksi kelayakan kredit motor dengan
metode Algoritma C4.5 untuk menentukan layak tidaknya sebuah pengajuan
kredit motor. Penulis menggunakan aplikasi pendukung Rapidminner versi 9.0
untuk pengujian akurasi sistem yang dibuat. Pengujian dilakukan dengan Data
training sebanyak 200 data dan Data testing sebanyak 40 data yang dipilih secara
random. Data testing tersebut akan dianalisa menggunakan aplikasi pendukung
Rapidminner versi 9.0. hasil pengujian akurasi prediksi penentuan kelayakan
kredit motor dengan metode Algoritma C4.5 cukup tinggi yaitu 85.83%.
Kata kunci : Prediksi, Algoritma C4.5, Kelayakan Kredit
1
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah
Minat masyarakat pada kepemilikan kendaraan bermotor masih terbilang
tinggi dan cukup banyak yang menggunakan jasa kredit dalam pembeliannya.
Perusahaan Leasing adalah badan usaha diluar Bank dan Lembaga Keuangan
Bukan Bank yang khusus didirikan untuk melakukan kegiatan usaha. Penulis
membahas kegiatan usaha perusahaan Leasing di bidang pembiayaan konsumen,
yaitu pembiayaan kredit motor bagi konsumen yang tertera sesuai Peraturan
Presiden Republik Indonesia Nomor 9 Tahun 2009 tentang Lembaga Pembiayaan
Konsumen (Consumer Finance) adalah kegiatan pembiayaan untuk pengadaan
barang berdasarkan kebutuhan konsumen dengan pembayaran secara angsuran.
NSC Finance Cabang Bekasi adalah salah satu perusahaan yang bergerak
dalam bidang pembiayaan kredit motor dengan mengadopsi konsep adanya
piutang cicilan yang merupakan piutang yang timbul dari penjualan cicilan dan
hal ini dibuktikan dengan adanya surat perjanjian sewa beli. Dengan jelas
dinyatakan dalam kontrak perjanjian ini di mana pihak pembeli atau debitur
mengikatkan diri dengan perusahaan untuk melunasi hutangnya secara cicil.
Jangka waktu pelunasan biasanya selama 12 bulan, 24 bulan dan 36 bulan.
2
Dalam upaya membantu menganalisis pengambilan keputusan konsumen
layak kredit, diperlukan model sistem pendukung keputusan yang sudah
terkomputerisasi dan dapat memberikan kemudahan dalam menganalisis data
dalam jumlah besar. Salah satu metode algoritma untuk memprediksi kelayakan
kredit motor adalah menggunakan Algoritma C4.5.
Algoritma C4.5 merupakan Algoritma yang digunakan untuk membentuk
pohon keputusan atau Decision Tree. Kelebihan menggunakan Algoritma C4.5
atau Decision Tree ini adalah hasil pohon ke putusannya sederhana dan mudah
dimengerti. Proses learning dan klasifikasi pada algoritma Decision Tree
sederhana dan cepat. Secara umum model Algoritma klasifikasi Decision Tree
mempunyai tingkat akurasi yang tinggi.
Menimbang dari latar belakang masalah diatas maka penulis mengambil
penelitian skripsi dengan judul “PREDIKSI KELAYAKAN KREDIT
KENDARAAN BERMOTOR RODA DUA DENGAN ALGORITMA C4.5”.
1.2 Identifikasi Masalah
Melihat dari latar belakang masalah yang penulis kemukakan diatas, maka
dapat diidentifikasikan masalah sebagai berikut.
1. Tingginya pengajuan kredit tidak sebanding dengan jumlah karyawan
yang ada. Risiko kredit macet yang tinggi, karena penentuan kelayakan
kredit didasar dari penilaian karyawan semata.
2. Penilaian kelayakan kredit masih manual, dengan cara menganalisa data
pemohon tanpa mempertimbangkan data masa lalu.
3
1.3 Rumusan Masalah
Berdasarkan latar belakang dan identifikasi masalah, maka bagaimana
memprediksi kelayakan kredit kendaraan bermotor roda dua dengan Algoritma
C4.5 ?
1.4 Batasan Masalah
Dalam pembahasan ini hanya membatasi bagaimana memprediksi
kelayakan kredit kendaraan bermotor roda dua dengan Algoritma C4.5.
1.5 Tujuan dan Manfaat
1.5.1 Tujuan
Berdasarkan permasalahan yang diteliti, maka tujuan dari
penulisan skripsi ini adalah:
1. Memprediksi kelayakan kredit motor yang dapat membantu kinerja
manajemen dalam pengambilan keputusan terkait kelayakan kredit motor.
2. Menggunakan sebuah perhitungan yang tepat dan efektif untuk
menganalisa setiap data pengajuan kredit yang datang, sesuai dengan
kriteria yang sudah ditentukan pihak perusahaan juga mempertimbangkan
data masa lalu.
3. Membantu mencegah NSC finance cabang bekasi salah dalam menentukan
kelayakan kredit motor yang berujung pada kerugian keuangan.
4
1.5.2 Manfaat
Hasil dari penulisan ini diharapkan dapat memberikan manfaat
kepada semua pihak khususnya mahasiswa dan untuk menambah
pengetahuan serta wawasan.
1. Manfaat bagi perusahaan
a. Diharapkan dapat membantu mempermudah NSC finance cabang
Bekasi dalam menentukan kelayakan kredit motor.
b. Mencegah NSC finance cabang Bekasi salah dalam menentukan
kelayakan kredit motor yang berujung pada kerugian keuangan.
2. Manfaat bagi penulis
a. Diharapkan dapat memberikan manfaat dan menambah ilmu dalam
bidang teknik informatika khususnya prediksi menggunakan
Algoritma C4.5.
b. Mendapat wawasan dalam pengetahuan tentang prediksi kelayakan
kredit sepeda motor menggunakan Algoritma C4.5.
3. Manfaat bagi Prodi Teknik Informatika STT Pelita Bangsa
a. Mendorong terwujudnya budaya penelitian kajian keilmuan.
b. Meningkatkan konsep, dan teknologi baru dalam menunjukan
peningkatan kualitas pendidikan nasional.
c. Memberikan referensi untuk penelitian lebih lanjut dalam
penelitian sistem informasi.
5
1.6 Metode Penelitian
Dalam proses skripsi ini penulis menggunakan beberapa metode
pengumpulan data.
1. Observasi
penulis melakukan penelitian yang bertujuan untuk memperoleh data
secara langsung berupa dokumen pendukung serta tinjauan lapangan dari
NSC finance cabang Bekasi yang berhubungan dengan pemberian
pinjaman kredit motor.
2. Wawancara
penulis melakukan suatu metode yaitu tanya jawab dengan Bapak M. Aan
selaku Account Officer NSC Finance cabang Bekasi salah satu yang
memiliki wewenang untuk menentukan kelayakan kredit motor.
3. Studi Pustaka
Pada tahap ini dilakukan dengan mempelajari buku-buku referensi atau
sumber-sumber yang berkaitan dengan topik pembahasan skripsi baik dari
text book maupun internet.
4. Kuesioner
penulis menyusun sebuah daftar pertanyaan yang berhubungan dengan
kelayakan kredit motor dan akan diisi oleh bagian Account Officer dan
Marketing Credit di NSC Finance Bekasi.
6
1.7 Sistematika Penulisan
Sistematika penulisan dibuat untuk mempermudah dalam penyusunan
skripsi yang memuat uraian secara garis besar isi skripsi adalah :
BAB I PENDAHULUAN
Bab pendahuluan mendeskripsikan mengenai latar belakang masalah,
tujuan, manfaat, dan sistematika penulisan.
BAB II TINJAUAN PUSTAKA
Bab tinjauan pustaka ini berisikan tentang landasan teori yang digunakan
sebagai bahan dasar referensi dalam proses penelitian.
BAB III METODE PENILITIAN
Bab metode penelitian ini berisikan tentang penjelasan dari metode
penelitian yang digunakan sebagai solusi penyelesaian masalah yang diangkat
dalam penelitian ini.
BAB IV HASIL DAN PEMBAHASAN
Memaparkan dari hasil-hasil tahapan penelitian, mulai dari analisis, hasil
testing, dan implementasinya.
BAB V PENUTUP
Berisi kesimpulan dan saran dari seluruh penelitian yang telah dilakukan.
7
7
BAB II
TINJAUAN PUSTAKA DAN LANDASAN TEORI
2.1 Penelitian Terkait
Sebelum memulai penelitian ini, penulis terlebih dahulu melakukan studi
kepustakaan dari penelitian-penelitian dan sumber-sumber lain. Dari studi
kepustakaan itu penulis menemukan beberpa penelitian yang mendorong penulis
untuk mengangkat tema seperti diatas. Penelitian tersebut yaitu :
1. Sistem Pendukung Keputusan Kelayakan Kredit Motor Menggunakan
Metode Naive Bayes Pada NSC Finance Cikampek, yang ditulis oleh
Qonita Tanjung penelitian ini menggunakan Naive bayes. Dari pengujian
yang dilakukan dengan membandingkan hasil analisa sistem dengan
aplikasi pendukung Rapidminer didapat tingkat akurasi sebesar 99% dan
eror sebesar 1 %.
2. Komparasi penerapan Algoritma C4.5 KNN dan Neural Network dalam
proses kelayakan penerimaan kredit kendaraan bermotor, yang ditulis oleh
Puji Astuti. Pengujian yang telah dihitung tingkat akurasinya dengan
memasukan data uji yang berasal dari data training. Data dalam penelitian
ini 486 data maka digunakan metode cross validation untuk menguji
tingkat akurasi. Untuk nilai akurasi model untuk metode C4.5 sebesar
92.8%, metode K-NN sebesar 77.78%, dan metode neural network sebesar
91.1%.
8
Tabel 2.1 Tabel Ringkasan Penelitian
NO Nama
Peneliti
Tahun Judul Metode Hasil
1. Qonita
Tanjung
2017 Sistem
pendukung
keputusan
kelayakan
kredit motor
Menggunak
an Metode
Naive
Bayes Pada
NSC
Finance
Cikampek,
Menggu
nakan
metode
Naive
Bayes
Dari pengujian
yang dilakukan
dengan
membandingkan
hasil analisa
sistem dengan
aplikasi
pendukung
Rapidminer
didapat tingkat
akurasi sebesar
99% dan eror
sebesar 1 %.
2. Puji
Astuti
2016 Komparasi
penerapan
Algoritma
C4.5 KNN
dan Neural
Network
dalam
Menggu
nakan
Algoritm
a C4.5
KNN
dan
Neural
Data dalam
penelitian ini 486
data maka
digunakan metode
cross validation
untuk menguji
tingkat akurasi.
9
proses
kelayakan
penerimaan
kredit
kendaraan
bermotor
Network Untuk nilai
akurasi model
untuk metode
C4.5 sebesar
92.8%, metode K-
NN sebesar
77.78%, dan
metode Neural
Network sebesar
91.1%.
2.2 Landasan Teori
Dalam Landasan Teori Peneliti meninjau dari beberapa sumber buku dan
jurnal untuk menjelaskan berbagai hal yang berhubungan dengan topik yang
terkait :
2.2.1 Kredit
Istilah kredit berasal dari bahasa Yunani “Credere” yang berarti
kepercayaan, atau “Credo” yang berarti saya percaya, karena itu dasar dari kata
kredit adalah kepercayaan bahwa seseorang atau penerima kredit akan memenuhi
segala sesuatu yang telah diperjanjikan terlebih dahulu pada masa yang akan
datang.
10
Sedangkan pengertian kredit dalam arti ekonomi menurut supriyono
(2014:4) adalah, “suatu penundaan pembayaran, yaitu uang atau barang (prestasi)
yang diterima sekarang akan dikembalikan pada masa yang akan datang berikut
tambahan suatu kontra prestasi”.
Menurut undang-undang pokok pe rbankan No.14 tahun 1967, kr edit
didefinisikan sebagai berikut:
Penyediaan uang atau tagihan-tagihan yang dapat disamakan, dengan itu
berdasarkan persetujuan pinjam-meminjam antara bank dengan pihak lain.
Berdasarkan definisi kredit, maka pihak meminjam berkewajiban
melunasi hutangnya setelah jangka waktu tertentu dengan jumlah bunga
yang telah ditentukan.
Secara singkat kredit berarti suatu pemberian prestasi oleh suatu pihak ke
pihak lain dan prestasi itu akan dikembalikan lagi pada suatu masa tertentu yang
akan datang disertai dengan suatu kontra prestasi berupa bunga.
2.2.2 Unsur-Unsur Kredit
Pada dasarnya pemberian kredit didasarkan atas kepercayaan, yang berarti
bahwa pemberian kepercayaan oleh bank sebagai pemberi kredit, dimana prestasi
yang diberikan benar-benar sudah diyakini akan dapat dibayar kembali dengan
penerima kredit sesuai dengan syarat-syarat yang telah disetujui bersama.
Berdasarkan hal tersebut dapat ditarik kesimpulan bahwa unsur-unsur yang
terdapat pemberian kredit, menurut supriyono (2014:4) adalah:
11
1. Kepercayaan, yaitu keyakinan si pemberi kredit bahwa prestasi (uang)
yang diberikan akan benar-benar kembali dari si penerima kredit pada
suatu masa yang akan datang.
2. Waktu, yaitu jangka waktu antara saat pemberian prestasi dengan saat
pengembaliannya. Dalam unsur waktu ini terkandung pengertian tentang
nilai agio yaitu nilai uang sekarang lebih berharga daripada nilai uang
dimasa yang akan datang, sehingga dalam hal ini perlu adanya kontra
prestasi yang harus berupa uang.
3. Risiko, yaitu risiko yang dapat timbul pada saat pemberian kredit. Untuk
menghindari risiko, maka sebelum kredit diberikan harus dilakukan
penilaian secara cermat dan dilindungi oleh agunan atau jaminan kredit
sebagai benteng terakhir dalam pengaman kredit. Penilaian didasarkan atas
bonafiditas calon penerima kredit sehingga dapat di tentukan sampai
sejauh mana calon penerima kredit dapat dipercaya oleh bank.
4. Prestasi, dalam hubungannya dengan pemberian kredit yang dimaksud
prestasi adalah uang.
2.2.3 Data Mining
Data mining adalah proses mencari pola atau informasi menarik dalam
data terpilih dengan menggunakan teknik atau metode tertentu. Data mining
merupakan proses analisa data untuk menemukan suatu pola dari kumpulan data
tersebut (Shella, 2015).
12
2.2.3.1 Pengelompokan Data Mining
Menurut Larose dalam bukunya yang berjudul “Discovering Knowledge in
Data:An Introduction to Data Mining”, data mining dibagi menjadi beberapa
kelompok berdasarkan tugas/pekerjaan yang dapat dilakukan, yaitu (Kasus, Pt,
Gunadi, & Sensuse, 2013) :
1. Deskripsi
Terkadang peneliti dan analisis secara sederhana ingin mencoba
mencari cara untuk menggambarkan pola dan kecenderungan sering
memberikan kemungkinan penjelasan untuk suatu pola atau
kecendurungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target
estimasi lebih ke arah numerik dari pada kearah ketegori. Model dibangun
menggunakan baris data (record) lengkap yang menyediakan nilai dari
variabel target sebagai nilai prediksi. Selanjutnya, pada peninjauan
berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai
variabel prediksi.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali
bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang.
Beberapa metode dan teknik yang digunakan dalam klasifikasi dan
estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.
Contoh prediksi dalam bisnis dan penelitian adalah:
13
a. Prediksi harga beras dalam tiga bulan yang akan datang.
b. Prediksi presentase kenaikan kecelakaan lalu lintas tahun depan jika
batas bawah kecepatan dinaikan.
4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori. Sebagai
contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori,
yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah.
5. Pengklasteran (Clusterring)
Pengklasteran merupakan pengelompokan record, pengamatan,
atau memperhatikan dan membentuk kelas obyek-obyek yang memiliki
kemiripan. Klaster adalah kumpulan record yang memiliki kemiripan satu
dengan yang lainnya dan memiliki ketidak miripan record dalam klaster
yang lain. Berbeda dengan klasifikasi, pada pengklasteran tidak ada
variabel target. Pengklasteran tidak melakukan klasifikasi, mengestimasi,
atau memprediksi nilai dari variabel target, akan tetapi, algoritma
pengkleasteran mencoba untuk melakukan pembagian terhadap
keseluruhan data menjadi kelompok-kelompok yang memiliki kemiripan
(homogen), yang mana kemiripan record dalam satu kelompok akan
bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok
lain akan bernilai minimal.
14
6. Asosiasi
Tugas asosiasi dalam data mining adalah untuk menemukan atribut
yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut
analisis keranjang belanja.
Contoh asosiasi dalam penilitian adalah:
a. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler
yang diharapkan untuk memberikan respon positif terhadap penawaran
upgrade layanan yang diberikan.
b. Menentukan barang dalam supermarket yang dibeli secara bersamaan
dan barang yang tidak pernah dibeli bersamaan.
2.2.3.2 Tahapan Data Mining
Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi
beberapa tahap proses yang diilustrasikan pada gambar Gambar 2.1 t ahap-tahap
tersebut bersifat interaktif, pemakai terlibat langsung atau dengan perantaraan
knowledge base (Ridwan, Suyono, & Sarosa, 2013).
Gambar 2.1 Tahapan data mining
15
1. Data selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan
sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil
seleksi yang digunakan untuk proses data mining, disimpan dalam suatu
berkas, terpisah dalam basis data operasional.
2. Pre-processing/cleaning
Sebelum proses data mining dapat dilakukan, perlu dilakukan proses
cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup
antara lain membuang duplikasi data, memeriksa data yang inkosisten, dan
memperbaiki kesalahan pada data.
3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga
data tersebut sesuai untuk proses data mining. Proses coding dalam KDD
merupakan proses kreatif dan sangat tergantung pada jenis atau pola
informasi yang akan dicari dalam basis data.
4. Data mining
Data mining adalah proses mencari pola atau informasi menarik dalam
data terpilih dengan menggunakan teknik atau metode tertentu. Teknik,
metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan
metode atau algoritma yang tepat sangat bergantung pada tujuan dan
proses KDD secara keseluruhan.
16
5. Interpretation/evalution
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan
dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan.
Tahap ini merupakan tahap dari proses KDD yang disebut interpretation.
Tahap ini mencakup pemeriksaan apakah pola atau informasi yang
ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
2.2.4 Decision Tree
Decision Tree atau Pohon keputusan adalah model prediksi menggunakan
struktur pohon a tau struktur berhirarki. Selain karena pembangunannya relatif
cepat, hasil dari model yang dibangun juga mudah untuk dipahami, sehingga
Decision Tree ini merupakan metode klasifikasi yang paling popular digunakan.
Decision Tree adalah flow chart seperti struktur Tree dimana tiap internal
node menunjukan sebuah test pada sebuah atribut, tiap cabang menunjukkan dari
test dan leaf node menunjukkan class-class atau class distribution (“Prosiding
Seminar Aplikasi Sains & Teknologi (SNAST) 2014 Yogyakarta, 15 November
2014 ISSN: 1979-911X,”2014).
Dalam decision tree tidak menggunakan vektor jarak untuk
mengklasifikasikan obyek. Seringkali data observasi mempunyai atribut-atribut
yang bernilai nominal. Seperti yang diilustrasikan pada gambar 2.2, misalnya
obyeknya adalah sekumpulan buah-buahan yang bisa dibedakan dalam atribut
bentuk, warna, ukuran dan rasa. Bentuk, warna, ukuran dan rasa adalah besaran
nominal, yaitu bersifat kategoris dan tiap nilai tidak bisa dijumlahkan atau
17
dikurangkan. Dalam atribut warna ada beberapa nilai yang mungkin yaitu hijau,
kuning, merah. Dalam atribut ukuran ada nilai besar, sedang dan kecil. Dengan
nilai-nilai atribut ini, kemudian dibuat decision tree untuk menentukan suatu
obyek termasuk jenis buah apa jika nilai tiap-tiap atribut diberikan(Asriningtias et
al., 2014).
Gambar 2.2 Decision Tree
Pohon yang dibentuk tidak selalu berupa pohon biner. Jika semua fitur
dalam data set menggunakan 2 macam nilai kategorikal maka bentuk pohon yang
didapatkan berupa pohon biner. Jika dalam fitur berisi lebih dari 2 macam nilai
kategoriikal atau menggunakan tipe numerik maka bentuk pohon yang didapatkan
biasanya tidak berupa pohon biner.
Pada Decision Tree terdapat tiga jenis node, yaitu:
a. Root Node, merupakan Node paling atas , pa da node ini tidak ada
input dan bisa tidak mempunyai output lebih dari satu.
18
b. Internal Node, merupakan node percabangan, pada node ini hanya
terdapat satu input dan mempunyai output minimal 2.
c. Leaf Node atau terminal node, merupakan node terakhir, pada node ini
hanya terdapat satu input dan tidak mempunyai output.
Kelebihan yang dimiliki Decision Tree antara lain:
a. hasil analisa berupa pohon yang mudah dimengerti.
b. Mudah untuk dibangun serta, membutuhkan data percobaan yang lebih
sedikit dibandingkan algoritma klasifikasi lainnya.
c. Mampu mengolah data nominal dan continyu.
d. Menggunakan teknik statistik sehingga dapat divalidasikan.
e. Akurasi yang dihasilkan mampu menandingi teknik klasifikasi lainnya.
2.2.5 Algoritma C4.5
Algoritma C4.5 merupakan kelompok algoritma decision tree. Algoritma
ini mempunyai input berupa training samples dan samples. Training samples
berupa berupa data contoh yang akan digunakan untuk membangun sebuah tree
yang telah diuji kebenarannya. Sedangkan samples merupakan field-field data
yang nantinya akan digunakan sebagai parameter dalam melakukan klasifikasi
data (“Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014
Yogyakarta, 15 November 2014 ISSN:1979-911X,”2014)
19
Tabel 2.2 Algoritma Membuat Keputusan
Algorithm : Generete_decision_tree.
Narrative : Generate a decision tree from the given training data.
Input : The training samples, samples, represented by discrete-valued attribute, the
set of candidate attributes, attribute-list.
Output : A dicision tree.
Method
1) Craete a node N;
2) If samples are all of the same class, C then
3) Return N as a leaf node labeled with class C
4) If attribute-list is empty then
5) Return N as leaf node labeled with the most common class in
samples;//majority voting
6) Select test-attribute, the attribute among attribute-list with the highest gain
ratio;
7) Label node N with last attribute;
8) For each known value a, of test-attribute
9) Grow a branch from node N for the condition test-attribute =
10) Let be the set of samples in samples for wich test-attribure = // a partition
11) If is empty then
12) attach a leaf labeled with the most common class in sample;
20
13) Else attach the node returned by Generate_decision_tree ( , attribute-list-list-
attribute);
Pada tahap pembelajaran algoritma C4.5 memiliki 2 prinsip kerja yaitu:
1. Pembuatan pohon ke putusan. Tujuan dari algoritma penginduksi pohon
keputusan adalah mengkontruksi struktur data pohon yang dapat digunakan untuk
memprediksi kelas dari sebuah kasus atau record baru yang belum memiliki kelas.
C4.5 melakukan kontruksi pohon keputusan.
2. dengan metode divide and conquer. Pada awalnya hanya dibuat node akar
dengan menerapkan algoritma divide and conquer. Algoritma ini memilih
pemecahan kasus-kasus yang terbaik dengan menghitung dan membandingkan
gain ratio, kemudian node-node yang terbentuk di level berikutnya, algoritma
divide and conquer akan diterapkan lagi sampai terbentuk daun-daun.
3. Pembuatan aturan-aturan (rule set). Aturan-aturan yang terbentuk dari pohon
keputusan akan membantuk suatu kondisi dalam bentuk if-then. Aturan-atturan ini
didapat dengan cara menelusuri pohon ke putusan dari akar sampai daun. Setiap
node dan syarat percabangan akan membentuk suatu kondisi atau suatu if,
sedangkan untuk nilai-nilai yang terdapat pada daun akar membentuk suatu hasil
atau suatu then.
Algoritma C4.5 merupakan pengmbanagn dari algoritma ID3. Algoritma
C4.5 dan ID3 diciptakan oleh seorang peneliti dibidang kecerdasan buatan
bernama j. Rose quinlan pada akhir tahun 1970-an. Aloritma C4.5 membuat
21
pohon keputusan dari atas ke bawah, dimana atribut paling atas merupakan akar,
dan yang paling bawah dinamakan daun (informasi, 2013).
Secara umum, algoritma C4.5 untuk membangun sebuah pohon keputusan
adalah sebagai berikut:
1. hitung jumlah data, jumlah data berdasarkan anggota atribut hasil dengan
syarat tertentu. Untuk proses pertama syaratnya masih kosong.
2. Pilih atribut sebagai Node.
3. Buat cabang untuk tiap-tiap anggota dari Node.
4. Periksa apakah nilai entropy dari anggota Node ada yang bernilai nol. Jika
ada, tentukan daun yang terbentuk. Jika seluruh nilai entropy anggota
Node adalah nol, maka proses pun berhenti.
5. Jika ada anggota Node yang memiliki nilai entropy lebih besar dari nol,
ulangi lagi proses dari awal dengan Node sebagai syarat sampai semua
anggota dari Node bernilai nol.Node adalah atribut yang mempunyai nilai
gain tertinggi dari atribut-atribut yang ada. Untuk menghitung nilai gain
suatu atribut digunakan rumus seperti yang tertera dalam persamaan
berikut:
Gain (S,A) = Entropy (S) –(∑ 𝐴𝑖𝑆
𝑛𝑖=1 *Entropy(Ai))
22
2.2.6 Information Gain
Information gain adalah salah satu attribute selection measure yang
digunakan untuk memilih test attribute tiap node pada tree. Atribut dengan
informasi gain tertinggi dipilih sebagai test atribut dari suatu node. Dalam
prosesnya perhitungan gain bisa terjadi atau tidak suatu missing value.
Setelah mendapat nilai entropy untuk suatu kumpulan data, maka kita
dapat mengukur efektifitas suatu atribut dalam mengklasifikasikan data. Ukuran
efektifitas ini disebut informasi gain. Secara matematis, information gain dari
suatu atribut A, dituliskan sebagai berikut (Julianto, Yunitarini, & Sophan, 2014);
Gain(S,A) – Entropy(S) –
∑ ve Value(A) |𝑆𝑣|𝑆
Entropy(Sv)
Dimana :
A : atribut
V : suatu nilai yang mungkin untuk atribut A Values (A) : himpunan yang
mungkin untuk atribut A
|Sv| : jumlah sampel untuk nilai v
|S| : jumlah seluruh sampel data
Entropy(Sv): entropy untuk sampel-sampel yang memiliki nilai v.
23
2.2.7 RapidMiner
RapidMiner merupakan perangkat lunak yang bersifat terbuka (open
source). RapidMiner adalah sebuah solusi untuk melakukan analisis terhadap data
mining, text mining dan analisis prediksi. RapidMiner menggunakan berbagai
teknik deskriptif dan prediksi dalam memberikan wawasan kepada pengguna
sehingga dapat membuat keputusan yang paling baik. RapidMiner memiliki
kurang lebih 500 ope rator data mining, termasuk operator untuk input, output,
data preprocessing dan visualisasi. RapidMiner merupakan software yang berdiri
sendiri untuk analisis data dan sebagai mesin data mining yang dapat
diintegrasikan pada produknya sendiri. RapidMiner ditulis dengan menggunakan
bahasa java sehingga dapat bekerja di semua sistem operasi(Aprilla Dennis,
2013).
RapidMiner sebelumnya bernama YALE (Yet Another Learning Environment),
dimana versi awalnya mulai dikembangkan mulai 2001 ol eh RalfKlinkenberg,
Ingo Mierswa, dan simon Fischer di artificial Intellegent Unit dari University of
Dortmund. RapidMiner didistribusikan di bawah lisensi AGPL (GNU Affero
General Public License) versi 3. H ingga saat ini telah ribuan aplikasi yang
dikembangkan menggunakan RapidMiner di lebih dari 40 ne gara. RapidMiner
sebagai software open source untuk data mining tidak perlu diragukan lagi karena
software ini sudah terkemuka di dunia. RapidMiner menempati perangkat pertama
sebagai software data mining pada polling oleh KDnuggets, sebuah portal data-
mining pada 2010-2011.
24
RapidMiner menyediakan GUI (Graphic User Interface) untuk merancang sebuah
pipeline analitis. GUI ini akan menghasilkan file XML (Extensible Markup
Language) yang mendefinisikan proses analitis keinginan pengguna untuk
diterapkan ke data. File ini kemudian dibaca oleh RapidMiner untuk menjalankan
analis secara otomatis.
2.2.7.1 Keunggulan RapidMiner
Sudah tidak diragukan lagi RapidMiner memilik keunggulan tersendiri
RapidMiner adalah aplikasi data mining yang tidak perlu dipertanyakan lagi dan
berbasis sistem open source dunia yang termuka dan ternama. Tersedia sebagai
aplikasi yang berdiri sendiri untuk analisis data dan sebagai mesin data mining
untuk integrasi ke dalam produk sendiri. Ribuan Aplikasi RapidMiner di lebih
dari 40 negara memberikan pengguna mereka keunggulan yang kompetitif. Solusi
yang diusung antara lain :
- Integrasi data
- Analitis ETL
- Data Analisis, dan
Pelaporan dalam data suite tunggal. Powerfull tapi memiliki antarmuka pengguna
grafis yang intiutif untuk desain analisis proses. Repositori untuk proses, data dan
penanganan meta data Hanya solusi dengan transformasi meta data : lupakan trial
and error dan memeriksa hasil yang telah di inspeksi selama desain. Hanya solusi
yang mendukung on-the-fly kesalahan dan dapat melakukan perbaikan dengan
25
cepat Lengkap dan fleksibel : Ratusan loading data, transformasi data, pemodelan
data, dan metode visualisasi data.
2.2.7.2 Kelemahan RapidMiner
Secara khusus untuk memperluas RapidMiner dengan R membantu
kelemahan alamat RM dalam luasnya algoritma, karena membawa ekosistem R
seluruh ke RM (mirip dengan bagaimana cepat saya menerapkan banyak
perpustakaan Weka pada awal pengembangan RM). Selanjutnya, karena R
pengguna paket rilis masyarakat yang menerapkan teknik baru yang lebih cepat
daripada vendor perusahaan, ini membantu mengubah kelemahan potensial
menjadi kekuatan potensial Namun, paket R cenderung dan berbagai kualitas, dan
lebih rentan dalam dukungan perbaikan/bug. Hal ini sangat bergantung pada
pengelola paket dan prevalensi penggunaan dalam komunitas R. Jadi, ketika
RapidMiner memiliki peserta didik dengan implementasi asli, biasanya lebih baik
untuk menggunakannya daripada R setara.
2.2.8 Kuesioner
Menurut wasis (2015:8) “kuesioner adalah daftar pertanyaan yang telah
disusun untuk memperoleh data sesuai yang diinginkan peneliti”.
Pengumpulan data dengan kuesioner ini ada dua macam yaitu: kuesioner
terbuka dan kuesioner tertutup. Pada kuesioner terbuka, responden secara bebas
menjawab pertanyaan yang telah disediakan peniliti dengan ungkapan yang sesuai
dengan responden. Sedangkan kuesioner tertutup, jawaban sudah disediakan
sehingga responden hanya memilih sesuai dengan pendapatnya.
26
2.3 Kerangka Pemikiran
Dalam penelitian ini metode yang digunakan yaitu Algoritma C4.5 untuk
memecahkan masalah dilakukan pengujian terhadap kinerja metode tersebut.
Pengujian metode dilakukan cross validation, confusion matrix dan kurva ROC.
Untuk pengembangan dan pengujian metode yang dipakai dengan menggunakan
aplikasi RapidMiner, Berikut ini kerangka pemikiran yang dilakukan.
Gambar 2.3 Kerangka Pemikiran
Masalah
Belum diketahui metode yang akurat untuk memprediksi kelayakan kredit motor
Analisa metode Algoritma C4.5
Metode
Pengembangan
RapidMiner 9.0
Kelayakan kredit motor apakah layak atau tidak
Implementasi
pengukuran
Hasil
Cross Validation, Confusion Matrix dan Kurva
Akurasi Algoritma C4.5 akurat untuk memprediksi kelayakan kredit motor
27
BAB III
METODE PENELITIAN
3.1 Objek Penelitian
3.1.1 Sejarah Perusahaan
PT.NSC Finance atau disebut juga Nusa Surya Ciptadana adalah
perusahaan berskala nasional yang bergerak di bidang leasing dan retail resmi
sepeda motor honda yang merupakan bagian dari Nusantara Sakti Group.
Sejak tahun 2000 N SC Finance telah memulai bisnisnya dalam bidang
pembiayaan dana tunai, furniture, gadai emas dan leasing kredit sepeda motor
khusus Honda Dealer Nusantara Sakti/Nusantara Surya Sakti. Kini NSC Finance
tersebar diseluruh indonesia dan didukung lebih dari 12.000 t enaga profesional
berpengalaman.
3.1.2 Visi dan Misi
A. Visi
menjadi Group Dealer sepeda motor Honda terbesar dan menjadi
perusahaan pembiayaan terbaik, tersehat dan terpercaya di indonesia.
B. Misi
Misi memberikan pelayanan terbaik kepada konsumen dengan konsep 3T
yaitu Tercepat, Termudah, dan Terpercaya namun tetap mengindahkan aspek
kehati-hatian sehingga menjadi perusahaan yang sehat dan kuat.
28
Kantor pusat NSC Finance beralamat di Gedung The Victoria Lantai 5-6
jl. Tomang Raya Kav. 35-37, Jakarta Barat, DKI Jakarta. Sedangkan kantor
cabang untuk daerah Bekasi beralamat di Jl. Bintara Raya, Bekasi, Jawa Barat.
3.1.3 Struktur Organisasi
Organisasi merupakan pengelompokan serta pengaturan dari berbagai
macam aktivitas yang dianggap perlu untuk mencapai tujuan, sumber daya,
lingkungan internal dan eksternal yang dihadapi juga berbeda. Berikut Struktur
Organisasi Perusahaan seperti gambar 3.1.
Gambar 3.1 Struktur Organisasi NSC Finance
Fungsi dari masing-masing bagian adalah sebagai berikut :
1. Kepada Unit bertanggung jawab untuk mengatur jalannya sistem
operasional pada NSC Finance apakah sudah sesuai dengan SOP atau
belum.
Kepala Unit
Ibu Laela
Marketing Kredit (Merangkap)
Ibu Yeti
Account Officer
Bpk.M.Adit
Sales Marketing
Retno
29
2. Marketing Bertanggung jawab untuk menentukan siapa yang layak
menerima kredit motor pada NSC Finance.
3. Account Officer bertanggung jawab untuk mengolah data keuangan pada
unit NSC Finance serta bertanggung jawab pula menentukan siapa yang
layak menerima kredit motor bersama dengan Marketing kredit.
4. Sales Marketing bertanggung jawab menawarkan jasa dan penjualan motor
yang ada di NSC Finance.
3.2 Instrumen Penelitian
Penelitian ini dilakukan berdasarkan permasalahan yang telah diuraikan
pada bab sebelumnya. Adapun instrumen yang dibutuhkan dalam melakukan
penelitian ini yaitu :
3.2.1 Bahan
Bahan penelitian ini yang dibutuhkan yaitu berupa data kredit calon
konsumen pada NSC Finance cabang Bekasi, yang akan digunakan untuk
memprediksi kelayakan kredit.
3.2.2 Peralatan
Tujuan dari deskripsi peralatan adalah untuk mengetahui kebutuhan sistem
agar mempermudah dalam memprediksi, peralatan ini meliputi :
30
A. Kuesioner
kuesioner diadopsi dari jurnal dari teori yang dikemukakan oleh ahli.
Kemudian penilaian dan uji validasi dilakukan oleh penulis.
Uji coba instrumen dilakukan kepada bagian Account Officer dan
Marketing Credit di NSC Finance cabang Bekasi. Pengukuran yang digunakan
akan diterapkan dalam penentuan calon kredit motor untuk mengukur kelayakan
berdasar kriteria-kriteria yang didapat dari kuesioner.
Tabel 3.1 Kuesioner (2018)
No Pertanyaan Jawaban Responden
Ya Tidak
1. Nasabah harus mengisi surat permohonan kredit dan
membawa SELURUH persyaratan pengajuan kredit?
2. Nasabah harus mengisi surat permohonan kredit dan
membawa SEBAGIAN persyaratan pengajuan
kredit?
3. Nasabah yang sebelumnya sudah pernah mengajukan
kredit dengan pembayaran BURUK, bisa
mengajukan kredit lagi?
4. Nasabah yang sudah pernah mengajukan kredit dan
MASIH BERJALAN, dapat mengajukan kredit lagi?
31
5. Proses survei dilakukan untuk memastikan kebenaran
data nasabah berupa alamat, kondisi tempat tinggal,
jumlah tanggungan dan keadaan lingkungan?
6. Proses pengajuan kredit tidak akan dilanjutkan
(ditolak) jika ditemukan kejanggalan dan atau
pengisian data tidak benar?
7. Kelengkapan persyaratan berkas dan hasil survei
adalah dasar penentuan kelayakan nasabah?
8. Karakter nasabah (kebiasaan, sifat dan hobi)
berpengaruh dalam penilaian kelayakan?
9. Pendidikan tinggi memperbesar kemungkinan
kelayakan nasabah?
10. Pekerjaan tetap (PNS/BUMN/dll) memperbesar
kemungkinan kelayakan nasabah dibanding
karyawan kontrak?
11. Wiraswasta golongan penghasilan kecil menurunkan
kelayakan nasabah?
12. Jumlah tanggungan nasabah berpengaruh dalam
menilai kelayakan?
13. Status rumah (milik sendiri/ngontrak/dll)
berpengaruh dalam menilai kelayakan?
14. Status nasabah (lajang/menikah/cerai) berpengaruh
dalam menilai kelayakan?
32
15. Tujuan membeli motor berpengaruh dalam menilai
kelayakan?
16. Keputusan pengajuan kredit oleh nasabah, diterima
dan tidaknya berada ditangan kredit analis?
17. Kepala cabang memiliki kuasa untuk menolak dan
menerima pengajuan kredit nasabah?
18. Jika terjadi kredit macet, kinerja kredit analis
berpengaruh?
19. Adanya jaminan dari nasabah untuk mengurangi
risiko kerugian akibat kredit macet?
20. Besarnya nilai jaminan mempengaruhi kelayakan
nasabah menerima kredit?
Sumber: Kuesioner (2018)
3.3 Metode Pengumpulan Data, Populasi dan Sampel Penelitian
3.3.1 Metode Pengumpulan Data
Untuk mendapatkan data-data yang dapat menunjang penelitian ini,
peneliti menggunakan beberapa metode pengumpulan data sebagai berikut :
1. Observasi
Observasi dilakukan langsung ke NSC Finance Bekasi yang beralamat di
Jl. Bintara Raya, Bekasi, Jawa Barat.
33
2. Wawancara
Wawancara dilakukan dengan bagian Account Officer untuk menanyakan
masalah-masalah yang ada pada saat analisa data calon pengajuan kredit
motor.
3. Angket
Langkah selanjutnya peneliti menyebar kuesioner kepada responden yakni
karyawan yang menjabat sebagai Account Officer dan Marketing Credit
yang menentukan secara langsung apakah pemohon layak atau tidak
berdasar kriteria-kriteria yang sudah ditentukan dengan mengisi beberapa
pertanyaan yang diajukan penulis.
4. Studi Pustaka
Penulis melakukan studi kepustakaan melalui literatur-literatur atas
referensi-referinsi yang ada diperpustakaan, maupun dari internet dan e-
book.
3.3.2 Populasi
Menurut Sugiono (2014:118) “populasi adalah wilayah generalisasi yang
terjadi atas obyek/subjek yang mempunyai kualitas dan karakteristik tertentu yang
ditetapkan oleh peneliti untuk dipelajari dan kemudian ditarik kesimpulannya.”
Jadi populasi bukan hanya orang, tetapi juga obyek dan benda-benda alam
yang lain. Populasi juga bukan sekedar jumlah yang ada pada obyek/subyek yang
dipelajari, tetapi meliputi seluruh karakteristik/sifat yang dimiliki oleh subyek
34
atau obyek itu. Populasi dalam penelitian ini adalah bagian Account Officer dan
Marketing Credit pada NSC Finance cabang Bekasi.
3.3.3 Sampel Penelitian
Menurut Sugiono (2012:119) “sampel adalah bagian dari jumlah dan
karakteristik yang dimiliki oleh populasi tersebut”.
Apabila peneliti melakukan penelitian terhadap populasi yang besar,
sementara peneliti ingin meneliti tentang populasi tersebut dan peneliti memiliki
keterbatasan dana, tenaga dan waktu maka peneliti menggunakan teknik
pengambilan sampel, sehingga generalisasi kepada populasi yang diteliti. Penulis
mengambil sampel 2 ka ryawan yang menjabat sebagai bagian bagian Account
Officer dan Marketing Credit pada NSC Finance cabang Bekasi.
3.4 Tahapan Penelitian
Dalam suatu penelitian tidak terlepas dari kerangka pemikiran, tahapan
penelitian ini dilakukan untuk menentukan kelayakan pengajuan kredit sepeda
motor menggunakan metode Algoritma C4.5. Berikut adalah kerangka pemikiran
dalam bentuk gambar :
35
Gambar 3.2 Bagan Kerangka Pemikiran
Tahapan metodologi penelitian dijelaskan secara umum sebagai berikut :
1. Problem
Pada penelitian ini terdapat masalah pada mengukur atau menentukan
kelayakan pengajuan kredit pada NSC Finance cabang Bekasi sehingga
perlu dicari bagaimana memprediksi dalam kelayakan kelayakan
pemberian kredit motor agar tidak terjadi kesalahan pengambilan
keputusan.
Bagaimana memprediksi kelayakan kredit bermotor roda dua
PROBLEM
APPROAC
Data Mining Algoritma C4.5
Prediksi penentuan kelayakan kredit sepeda motor roda dua dengan aplikasi pendukung RapidMiner 9.0
DEVELOPMENT IMPLEMENTATION
NSC Finance cabang Bekasi
RESULT
Mengukur tingkat akurasi dan error dengan aplikasi pendukung RapidMiner 9.0
36
2. Approach
Metode yang digunakan untuk menganalisa dan mengukur atau
menentukan kelayakan pengaju kredit sepeda motor adalah Metode Data
mining Algoritma C4.5.
3. Development
Aplikasi yang digunakan untuk menganalisa dan memprediksi untuk
menentukan kelayakan pengaju kredit sepeda motor dengan aplikasi
pendukung yang digunakan Rapidminer 9.0.
4. Implementation
Kriteria untuk pengukuran kelayakan diambil langsung dari NSC Finance
cabang Bekasi melalui kuesioner.
5. Result
Menganalisa hasil pengolahan data dan mengukur tingkat akurasinya dari
penentuan kelayakan atau ketidak layakan pengajuan kredit motor dengan
membandingkan dengan aplikasi pendukung lain yang menghasilkan
presentase tingkat akurasi dan eror.
3.5 Teknik Analisa Data
pada penelitian ini, data yang digunakan adalah data NSC Finance cabang
Bekasi data tersebut akan diolah menggunakan metode algoritma C4.5 dapat
digunakan sebagai rules dalam menentukan kelayakan kredit motor. Dalam
penelitian ini akan dilakukan beberapa langkah atau penelitian seperti berikut :
37
Gambar 3.3 Teknik Analisa Data
(Eko Cahyo, 2017)
1. Pengumpulan Data
Pada bagian ini dijelaskan tentang bagaimana dan darimana data penelitian
ini didapat, meliputi Observasi, Wawancara, Angket, Studi Pustaka.
2. Pengolahan Awal Data
Pada bagian ini dijelaskan tentang tahap awal data mining. Pengolahan
data meliputi proses input data ke format yang dibutuhkan,
pengelompokan dan penentuan atribut data.
3. Metode yang Diusulkan
Pada bagian ini dijelaskan tentang metode yang diusulkan untuk
digunakan pada prediksi kenaikan jabatan. Penjelasan meliputi pengaturan
P e n g u m p u l a n D a t a
Pengolahan Data Awal
Metode Yang Diusulkan
Pengujian Data Dengan Beberapa Metode
Pengujian/Validasi Hasil
38
dan pemilihan nilai dari parameter-parameter dan arsitektur melalui uji
coba.
4. Eksperimen dan Pengujian Metode
Pada bagian ini dijelaskan tentang langkah-langkah eksperimen meliputi
cara pemilihan arsitektur yang tepat dari model atau metode yang
diusulkan sehingga dihasilkan hasil yang dapat membuktikan bahwa
metode yang digunakan adalah tepat.
5. Evaluasi dan Validasi Hasil
Pada bagian ini dijelaskan tentang evaluasi dan validasi hasil penerapan
metode pada penelitian yang dilakukan. Penjelasan mengenai hal ini akan
dipaparkan pada Bab IV.
3.6 Metode Analisis Data
Metode analisis data menggunakan Algoritma C4.5 untuk pengumpulan
data sebanyak 200 konsumen dan memiliki 7 atribut dalam mempengaruhi
keputusan kelayakan kredit motor yaitu karakter, pendidikan, pekerjaan,
tanggungan, rumah, pendapatan, dan status. Adapun hasil keputusan yang
didapatkan adalah layak atau tidaknya pengajuan kredit. Setelah data yang
didapatkan untuk melakukan penelitian maka ada beberapa tahapan preparation
data. Preparation data merupakan tahapan untuk mendapatkan data yang
berkualitas, maka akan dilakukan beberapa teknik sebagai berikut :
39
1. Data Cleaning
Data yang berkualitas sangat mempengaruhi kualitas keputusan yang akan
diperoleh. Data yang tidak berkualitas adalah data yang nilai atributnya
hilang, error dan data tidak konsisten dalam pengisian atributnya. Untuk
mendapatkan data yang berkualitas dilakukan tahapan dalam data cleaning
sebagai berikut :
a. Menghilangkan data yang tidak lengkap atau data yang tidak
mempengaruhi hasil pada data testing.
b. Mengisi nilai-nilai yang hilang dari data yang tidak lengkap (missing
value).
2. Data intergartion and ransformation
Teknik yang digunakan untuk menganalisis data kolerasi, atribut yang
redundan disebut integration, sedangkan transformation bergunakan
untuk meningkatkan akurasi. Algoritma C4.5 memiliki kelebihan
memproses data yang bernilai nominal, ortodinal maupun continue.
Sehingga nilai-nilai setiap atribut yang terdapat pada dataset tidak perlu
ditransformasikan.
3. Data reduction
Dataset yang direduksi dengan mengurangi jumlah atribut dan record
supaya menjadi lebih sedikit tetapi tetap bersifat informatif. Memperoleh
respresentasi dalam bentuk volume data yang telah berkurang jumlahnya
namun tetap mendapatkan hasil analisa yang sama. Deskretasi data
merupakan bagian dari reduksi data bagian penting untuk data numerik.
40
Berikut adalah atribut keseluruhan sebelum dilakukan reduction data yaitu
karakter, pendidikan, pekerjaan, tanggungan, rumah, pendapatan dan
status (layak atau tidak layak) sebagai label. Kemudian menghapus atribut
yang tidak digunakan.
3.7 Pengolahan Awal Data
Pada data konsumen yang telah dikumpulkan dilakukan cleaning data,
yaitu dengan menghilangkan record-record yang noice atau tidak lengkap dan
record yang berulang. Atribut yang juga tidak diperlukan juga bisa dihilangkan
seperti atribut Karakter, Pendidikan, Pekerjaan, Tanggungan, Rumah, Pendapatan,
dan Status. Hal ini dilakukan karena atribut tersebut tidak berpengaruh terhadap
pengolahan data pada proses selanjutnya. Berikut adalah tabel atribut dan
kategorinya.
Tabel 3.2 Atribut yang Digunakan
No ATRIBUT
1. Karakter
2. Pendidikan
3. Pekerjaan
4. Tanggungan
5. Rumah
6. Pendapatan
7. Status
41
3.7.1 Splid Validation
Splid Validation merupakan data yang sudah disiapkan untuk klasifikasi
dibagi menjadi dua untuk data tranning dan data testing. Pembagian data menjadi
data tranning (80%) dan data testing (20%) menggunakan teknik sampling
random sistematik (systematic random sampling). Cara menggunakan teknik
sampling random sistematik ini pengundian dilakukan satu kali, yaitu ketika
melakuan unsur pertama disampling yang akan diambil. Penentuan unsur
sampling selanjutnya ditempuh dengan cara memanfaatkan interval sanple.
Interval sample adalah angka yang mennunjukan jarak antara nomor-nomor urut
yang terdapat dalam rangka sampling yang akan dijadikan patokan dalam
menentukan atau memilih unsur-unsur sampling kedua dan seterusnya hingga
unsur ke-n. Interval sample biasanya dilambangkan dengan huruf k.
3.7.2 Cross Validation
Cross-validation (CV) adalah metode statistik yang dapat digunakan
untuk mengevaluasi kinerja model atau algoritma dimana data dipisahkan
menjadi dua subset yaitu data proses pembelajaran dan data validasi/evaluasi.
Model atau algoritma dilatih oleh subset pembelajaran dan divalidasi oleh subset
validasi. Selanjutnya pemilihan jenis CV dapat didasarkan pada ukuran dataset.
Biasanya CV-K-fold digunakan karena dapat mengurangi waktu komputasi
dengan tetap menjaga keakuratan estimasi.
42
3.7.3 Apply Model
Merupakan sebuah model pertama kali dilatih pada ExampleSet oleh
Operator lain, yang sering merupakan algoritma pembelajaran. Setelah itu, model
ini dapat diterapkan pada ExampleSet lain. Biasanya, tujuannya adalah untuk
mendapatkan prediksi pada data yang tidak terlihat atau untuk mengubah data
dengan menerapkan model preprocessing.
The ExampleSet di mana model diterapkan, harus kompatibel dengan Atribur
model. Ini berarti, bahwa ExampleSet memiliki nomor, urutan, jenis, dan peran
Atribut yang sama seperti ExampleSet yang digunakan untuk menghasilkan
model.
3.7.4 Performance
Performance dapat diartikan sebagai tingkat pencapaian hasil atau “The
degree of accomplishment “ (Rue and Byars, 1981:375). Sering pula disebut
tingkat pencapaian tujuan organisasi. Penilaian terhadap performance atau disebut
juga kinerja merupakan suatu kegiatan yang sangat penting Penilaian dimaksud
bisa dibuat sebagai masukan guna mengadakan perbaikan untuk peningkatan
kinerja organisasi pada waktu berikutnya. (Mac Donald and Lawton, 1977).
Apabila sebuah organisasi tidak menghasilkan keluaran berupa materi,
performance juga sebagai sebutan bagi pengukuran output atau hasil dari
organisasi. Penjelasan tersebut dibicarakan oleh Stodgil dalam hubungannya
dengan permasalahan output organisasi.
43
3.8 Pemodelan
Pada penelitian ini metode yang digunakan adalah Algoritma C4.5 dan
dengan menggunakan tools RapidMiner 9.0.
Ada beberapa tahap dalam membuat pohon keputusan dengan algoritma
C4.5, yaitu sebagai berikut:
1. Menyiapkan data training atau data testing. Data training dan data testing
biasanya diambil dari histori yang pernah terjadi dan sudah dikelompokan
ke dalam kelas-kelas tertentu.
2. Menentukan akar dari pohon. Akar akan diambil dari atribut yang terpilih,
dengan cara menghitung nilai gain dari masing-masing atribut, nilai gain
yang paling tinggi yang akan menjadi akar pertama. Sebelum menghitung
nilai gain dari atribut, hitung dulu nilai entropy, dengan rumus sebagai
berikut :
Entropy (S) = ∑ − pi 𝑛𝑖=1 * log2 pi
3. Kemudian hitung nilai gain, dengan rumus sebagai berikut :
Gain(S,A) = Entropy (S) - � |𝑆𝑖||S|
𝑛
𝑖=1 * Entropy (S)
4. Ulangi langkah ke-2 hingga semua record terpartisi.
5. Proses partisi pohon keputusan akan terhenti saat :
a. Semua record dalam simpul N mendapat kelas yang sama.
b. Tidak ada atribut di dalam record yang dipartisi lagi.
c. Tidak ada record di dalam cabang yang kosong.
44
BAB IV
HASIL DAN PEMBAHASAN
4.1 Kriteria Pelanggan
Dalam menentukan seseorang layak atau tidak menerima kredit sepeda
motor ada beberapa kriteria yang digunakan pihak NSC Finance. Tidak hanya
kriteria yang bersifat objektif, tetapi juga kriteria yang bersifat subjektif.
Berdasarkan wawancara dan pengisian kuesioner oleh pihak NSC Finance
khususnya bagian Account Officer dan Marketing Credit.
Kriteria yang digunakan dalam penilaian dalam memberikan kredit sepeda
motor.
1. Karakter :
(Sangat kurang; Kurang; Cukup; Baik; Sangat baik)
2. Pendidikan :
(SD/MI; SLTP/SMP; SLTA/SMA; Diploma 3; S1 Ke atas)
3. Pekerjaan :
(Lain-lain; Wiraswasta; Karyawan; Provesi; PNS/BUMN)
4. Tanggungan :
(> 6 Orang; 5 Orang; 3-4 orang; 1-2 orang; 0 orang)
5. Rumah :
(Kost/kontrak; KPR; Milik Instansi; Milik keluarga; Milik sendiri)
45
6. Pendapatan :
(<1 juta rupiah; 1-1,5 juta rupiah; 1,5-2,5 juta rupiah; 2,5-3,5 juta
rupiah; > 3,5 juta rupiah)
4.2 Perhitungan Algoritma C4.5
Dataset yang digunakan sebagai data training adalah sebanyak 200 data.
yang diambil dari data pengajuan kredit terdahulu yang sudah ditentukan
kelayakannya. Sedangkan untuk data testing yang akan ditentukan kelayakannya
berjumlah 40 data.
4.2.1 Menghitung Probabilitas Kelas
Tahap pertama perhitunngan pencarian kelayakan dengan metode
Algoritma C4.5 adalah dengan mencari probabilitas dari masing-masing kelas.
Untuk pengajuan kredit motor akan ditentukan 2 kelas yaitu kelas “Layak” dan
“Tidak Layak”.
Cara perhitungannya adalah dengan mencari beberapa jumlah data yang
layak dan tidak layak dari total keseluruhan data training, lalu membaginya
dengan total keseluruhan data. Hasil dari perhitungan tersebut dapat dilihat pada
tabel berikut :
46
Tabel 4.1 Probabilitas Kelas
Kelas
Layak Tidak Layak
Layak 98/200 Tidak Layak 102/200
4.2.2 Menghitung Probabilitas Masing-Masing Atribut
Cara mencari probabilitas suatu atribut adalah dengan membandingkan
atribut dari data testing dengan atribut dari data training, beberapa jumlah atribut
dengan kelas layak yang berada pada data training, kemudian bagi dengan
probabilitas kelas layak. Begitu juga dengan mencari probabilitas untuk kelas
tidak layak.
1. Atriibut Karakter
Tabel 4.2 Atribut Karakter
Karakter Sangat
Baik
Baik Cukup Kurang Sangat
Kurang
Layak 33/98 36/98 26/98 1/98 2/98
Tidak Layak 0/102 2/102 12/102 47/102 41/102
47
2. Atribut Pendidikan
Tabel 4.3 Atribut Pendidikan
Pendidikan S1 ke atas Diploma 3 SLTA/SMA SLTP/SMP SD/MI
Layak 19/98 14/98 20/98 20/98 25/98
Tidak Layak 25/102 14/102 23/102 19/102 21/102
3. Atribut Pekerjaan
Tabel 4.4 Atribut Pekerjaan
Pekerjaan PNS/BUMN Profesi Karyawan Wiraswasta Lin-Lain
Layak 14/98 25/98 19/98 21/98 19/98
Tidak Layak 20/102 17/102 30/102 12/102 23/102
4. Atribut Tanggungan
Tabel 4.5 Atribut Tanggungan
Tanggungan 0 orang 1-2 orang 3-4 orang 5 orang > 6 orang
Layak 29/98 25/98 15/98 20/98 9/98
Tidak Layak 18/102 4/102 31/102 21/102 14/102
48
5. Atribut Rumah
Tabel 4.6 Atribut Rumah
Rumah Milik
Sendiri
Milik
Keluarga
Milik
Instansi
KPR Kost/Kontrak
Layak 16/98 16/98 19/98 17/98 30/98
Tidak Layak 21/102 19/102 16/102 22/102 24/102
6. Atribut Pendapatan
Tabel 4.7 Atribut Pendapatan
Pendapatan > 3,5 juta 2,5–3,5
juta
1,5-2,5
juta
1-1,5 juta < 1 juta
Layak 24/98 18/98 19/98 21/98 16/98
Tidak Layak 21/102 24/102 13/102 14/102 30/102
4.2.3 Menghitung Probabilitas Akhir Untuk Setiap Kelas
Untuk menghitung probabilitas akhir pada setiap kelas, perlu
menggunakan data training dan mengubahnya menjadi nilai yang sudah
ditentukan pada proses sesuai dengan atribut masing-masing. Lalu dari masing-
masing atribut dan nilai probabilitas kelas, dilakukan.
Dari kedua hasil yang sudah ditentukan pada tiap kelas, bandingkan nilai
yang paling tinggi. Jika kelas layak bernilai paling tinggi, maka hasilnya layak.
Begitu pula sebaliknya.
49
4.3 Hasil
4.3.1 Evaluasi dan Validasi Hasil Algoritma C4.5
Langkah pembuatan pohon keputusan (Decision Tree). Pada langkah awal
dari proses evaluasi algoritma C4.5 ini adalah menyiapkan data yang akan
diproses terlebih dahulu, dan berikut data keseluruhan PT. NSC Finanace
Tabel 4.8 Data Keseluruhan
50
Tabel 4.9 Data Keseluruhan (Lanjutan)
51
Tabel 4.10 Data Keseluruhan (Lanjutan)
52
Tabel 4.11 Data Keseluruhan (Lanjutan)
53
Tabel 4.12 Data Keseluruhan (Lanjutan)
54
Tabel 4.13 Data Keseluruhan (Lanjutan)
55
Tabel 4.14 Data Keseluruhan (Lanjutan)
56
Tabel 4.15 Data Testing
57
Tabel 4.16 Data Testing (Lanjutan)
58
4.4 Pembahasan
4.4.1 Tahapan Proses RapidMiner
Berikut adalah tahapan dalam melakukan data mining di rapidminer 9.0,
pada langkah awal saat membuka aplikasi akan muncul icon seperti berikut :
Pertama buka aplikasi Rapidminer
Gambar 4.1 Tampilan RapidMiner saat loading pembukaan
Setelah menunggu loading selesai maka akan muncul tampilan menu
utama awal tekan star new process untuk melakukan proses selanjutnya.
59
Halaman utama Rapidminer
Gambar 4.2 Tampilan menu awal sebelum proses
Setelah muncul gambar diatas, tekan new proses untuk membuat
pengolahan data awal.
60
Tampilan proses Rapidminer
Gambar 4.3 Tampilan Utama Proses Baru
Setelah muncul menu proses klik Import, klik Data lalu klik Read Excel
hingga muncul kotak Read Excel pada main proses
61
Gambar 4.4 Tampilan Main Proses Read Excel
Setelah itu klik Import Configuration Wizard untuk mengambil data excel
yang tersimpan dalam computer.
Gambar 4.5 pemilihan data yang akan diproses
62
Pilih data training lalu tekan next
Gambar 4.6 Pemilihan Data Training
Pilih next selanjutnya tekan Finish.
Lalu pilih Edit List -> ganti kolom status menjadi binominal, dan label.
Gambar 4.7 Atribut Label
63
Selanjutnya klik Apply
Pilih Cross validasion -> Run -> Model Decision Tree -> Apply Model ->
Performance Binominal (Klik Performance Pilih/(Ceklis) : a ccuracy, AUC
(optimistic),AUC, precision, recall.
Gambar 4.8 Tampilan Model Training
64
Selanjutnya klik Run.
Gambar 4.9 Nilai Performance Accuracy
Gambar 4.10 Nilai Description Accuracy
65
Hasil dari pengukuran data Accuracy yang diperoleh dari data training
mencapai accuracy: 85.83% +/- 11.81% (micro average: 85.83%).
Dari data tersebut diketahui prediksi tidak layak dengan true tidak layak
mencapai 51 konsumen dan true layak sebanyak 11 kons umen, dengan
pencapaian class precision 82,26%. Sedangkan prediksi layak dengan true layak
52 konsumen dengan pencapaian class precition 89,66 %. Untuk class recall
dengan true tidak layak mencapai 89,47% sedangkan untuk class recall dengan
true layak 82,54%.
PerformanceVector:
accuracy: 85.83% +/- 11.81% (micro average: 85.83%)
ConfusionMatrix:
True Tidak Layak Layak
Pred. Tidak Layak 51 11
Pred. Layak 6 52
AUC (optimistic): 0.944 +/- 0.068 (micro average: 0.944) (positive class: Layak)
AUC: 0.880 +/- 0.132 (micro average: 0.880) (positive class: Layak)
precision: 91.81% +/- 12.87% (micro average: 89.66%) (positive class: Layak)
ConfusionMatrix:
True Tidak Layak Layak
Pred. Tidak Layak 51 11
Pred. Layak 6 52
66
recall: 82.86% +/- 17.46% (micro average: 82.54%) (positive class: Layak)
ConfusionMatrix:
True Tidak Layak Layak
Pred. Tidak Layak 51 11
Pred. Layak 6 52
Gambar 4.11 Nilai Performance AUC (optimistic)
67
Gambar 4.12 Nilai Description AUC (optimistic)
Hasil nilai dari AUC (optimistic) di ketahui dari AUC (Area Under
Curve) optimiatic dengan hasil sebesar AUC (optimistic): 0.944 +/- 0.068 (micro
average: 0.944) (positive class: Layak).
Untuk mengetahui performance vector yang diperoleh adalah sebagai
berikut :
PerformanceVector:
accuracy: 85.83% +/- 11.81% (micro average: 85.83%)
ConfusionMatrix:
True Tidak Layak Layak
Pred. Tidak Layak 51 11
Pred. Layak 6 52
68
AUC (optimistic): 0.944 +/- 0.068 (micro average: 0.944) (positive class: Layak)
AUC: 0.880 +/- 0.132 (micro average: 0.880) (positive class: Layak)
precision: 91.81% +/- 12.87% (micro average: 89.66%) (positive class: Layak)
ConfusionMatrix:
True Tidak Layak Layak
Pred. Tidak Layak 51 11
Pred. Layak 6 52
recall: 82.86% +/- 17.46% (micro average: 82.54%) (positive class: Layak)
ConfusionMatrix:
True Tidak Layak Layak
Pred. Tidak Layak 51 11
Pred. Layak 6 52
Gambar 4.13 Nilai Performance AUC
69
Gambar 4.14 Nilai Description AUC
Hasil nilai dari AUC di ketahui dari AUC (Area Under Curve) dengan
hasil sebesar AUC: 0.880 +/- 0.132 (micro average: 0.880) (positive class: Layak)
Untuk mengetahui performance vector yang diperoleh adalah sebagai
berikut :
PerformanceVector:
accuracy: 85.83% +/- 11.81% (micro average: 85.83%)
ConfusionMatrix:
True Tidak Layak Layak
Pred. Tidak Layak 51 11
Pred. Layak 6 52
AUC (optimistic): 0.944 +/- 0.068 (micro average: 0.944) (positive class: Layak)
AUC: 0.880 +/- 0.132 (micro average: 0.880) (positive class: Layak)
70
precision: 91.81% +/- 12.87% (micro average: 89.66%) (positive class: Layak)
ConfusionMatrix:
True Tidak Layak Layak
Pred. Tidak Layak 51 11
Pred. Layak 6 52
recall: 82.86% +/- 17.46% (micro average: 82.54%) (positive class: Layak)
ConfusionMatrix:
True Tidak Layak Layak
Pred. Tidak Layak 51 11
Pred. Layak 6 52
Gambar 4.15 Nilai Performance Precision
71
Gambar 4.16 Nilai Description Precision
Hasil dari pengukuran data Precision yang diperoleh dari data training
mencapai precision: 91.81% +/- 12.87% (micro average: 89.66%) (positive class:
Layak)
Dari data tersebut diketahui prediksi tidak layak dengan true tidak layak
mencapai 51 kons umen dan true layak sebanyak 11 kons umen, dengan
pencapaian class precision 82,26%. Sedangkan prediksi layak dengan true layak
52 konsumen dengan pencapaian class precition 89,66 %. Untuk class recall
dengan true tidak layak mencapai 89,47% sedangkan untuk class recall dengan
true layak 82,54%.
72
Gambar 4.17 Nilai Performance Recall
Gambar 4.18 Nilai Description Recall
73
Hasil dari pengukuran data Recall yang diperoleh dari data training
mencapai recall: 82.86% +/- 17.46% (micro average: 82.54%) (positive class:
Layak)
Dari data tersebut diketahui prediksi tidak layak dengan true tidak layak
mencapai 51 kons umen dan true layak sebanyak 11 kons umen, dengan
pencapaian class precision 82,26%. Sedangkan prediksi layak dengan true layak
52 konsumen dengan pencapaian class precition 89,66 %. Untuk class recall
dengan true tidak layak mencapai 89,47% sedangkan untuk class recall dengan
true layak 82,54%.
Gambar 4.19 Decision Tree
74
Gambar 4.20 Description Decision Tree
Berdasarkan hasil dari Decision Tree, Maka dapat disimpulkan sebagai
berikut :
Rule 1 = - Jika Karakter Cukup maka Layak
- Jika Karakter Kurang maka Tidak Layak
- Jika Karakter Kurang maka Tidak Layak
- Jika Karakter Sangat baik maka Layak
- Jika Karakter Sangat baik maka Layak
- Jika Karakter Sangat kurang maka Tidak Layak
Rule 2 = - Jika Karakter Cukup, Tanggungan 0 orang maka Layak
- Jika Karakter Cukup, Tanggungan 1-2 orang maka Layak
75
- Jika Karakter Cukup, Tanggungan 3-4 orang, dan No, >62.500 maka
Layak
- Jika Karakter Cukup, Tanggungan 3-4 orang, dan No, <62.500 maka
Tidak Layak
- Jika Karakter Cukup, Tanggungan 5 orang maka Tidak Layak
- Jika Karakter Cukup, Tanggungan lebih dari 6 orang maka Layak
Rule 3 = - Jika Karakter Baik, No, >20, dan No, >61.500, Pekerjaan Karyawan
maka Layak
- Jika Karakter Baik, No, >20, dan No, >61.500, Pekerjaan PNS/BUMN
maka Layak
- Jika Karakter Baik, No, >20, dan No, >61.500, Pekerjaan Profesi maka
Tidak Layak
- Jika Karakter Baik, No, >20, dan No, >61.500, Pekerjaan Wiraswasta
maka Layak
- Jika Karakter Baik, dan No, >20, No, <61.500, maka Layak
- Jika Karakter Baik, dan No, <20, maka Tidak Layak
76
Gambar 4.21 Grafik Hasil Keseluruhan
Berdasarkan grafik hasil keseluruhan diatas maka dapat disimpulkan sebagai berikut :
Hasil tertinggi = 2 60 dari karakter Sangat Kurang, Hasil terendah = 60 dari karakter Cukup.
77
Gambar 4.22 grafik hasil Layak dan Tidak Layak
Berdasarkan grafik hasil keseluruhan diatas maka dapat disimpulkan sebagai berikut :
Hasil yang Layak = 62.5 dan hasil yang tidak layak = 37.5
78
BAB V
PENUTUP
5.1 Kesimpulan
Berdasarkan hasil penelitian yang dilakukan mengenai penentuan
kelayakan pengajuan kredit motor dengan metode Algoritma C4.5 pada NSC
Finance, maka dapat diambil beberapa kesimpulan sebagai berikut :
1. Metode Algoritma C4.5 yang digunakan memberikan proses
penyeleksian yang cepat dan algoritma yang mudah dipahami dengan
tingkat akurasi tinggi.
2. Dengan memprediksi kelayakan pengajuan kredit sepeda motor,
perusahaan dapat dengan mudah dan cepat memasukkan data
pendaftar.
3. Dengan menggunakan aplikasi Rapidminer untuk memprediksi
kelayakan pengajuan kredit motor, perusahaan mendapatkan hasil
analisa metode Algoritma C4.5 dengan cepat, apakah pengaju kredit
layak atau tidak layak.
4. Dengan menggunakan metode Algoritma C4.5 untuk menentukan
kelayakan pengajuan kredit motor menggunakan 200 data training atau
dataset dan 40 data testing yang dipilih secara random.
5. Dari pengujian yang dilakukan dengan membandingkan hasil analisa
sistem dengan aplikasi pendukung Rapidminer didapat tingkat akurasi
sebesar 85.83%.
6. Prediksi penentuan kelayakan pengajuan kredit dengan metode
Algoritma C4.5 dapat digunakan untuk membantu perusahaan dalam
menentukan kelayakan pengaju kredit motor pada NSC Finance.
79
5.2 Saran
Berdasarkan penelitian yang telah ditentukan mengenai prediksi kelayakan
pengajuan kredit sepeda motor dengan metode Algoritma C4.5 pada NSC
Finance, maka terdapat beberapa saran yang perlu diperhatikan :
1. Penentuan data training dapat mempengaruhi hasil pengujian, karena pola
data training tersebut akan dijadikan sebagai rule untuk menentukan kelas
pada data testing. Sehingga besar atau kecilnya presentase tingkat akurasi
dipengaruhi juga oleh penentuan data training.
2. Prediksi metode Algoritma C4.5 tidak akan menghasilkan keluaran yang
akurat jika terdapat salah satu data yang kosong atau nol pada salah satu
kelas maupun keduanya.
3. Dalam penelitian ini hanya menggunakan 6 kriteria untuk penentuan
kelayakan pengajuan kredit motor. Untuk penelitian selanjutnya bisa
ditambahkan kriteria lagi.
4. Jenis pengelompokan data dalam penelitian ini bersifat kategorik untuk
hasil yang lebih optimal mungkin bisa ditambah dengan perhitungan data
numerik.
5. Data yang dipakai dalam penelitian ini sebanyak 200 Data, untuk
penelitian selanjutnya Data bisa ditambahkan lebih dari 200 Data.
80
DAFTAR PUSTAKA
AISI. 2017. Statistic Motorcycle Production Wholesales Domestic and Exports. Diambil dari: http://www.aisi.or.id/statistic (25 september 2017)
Aprilla Dennis. (2013). Belajar Data Mining dengan RapidMiner. Innovation and Knowledge Management in Bussines Globalization: Theory & Practice, Vols 1 and 2, 5(4), 1-5. https://doi.org/10.1007/s13398-014-0173-7.2
Dhika, H., & Destiawati, F. (2015). Application of Data Mining Algorithm To
Recipient of Motorcycle Installment. JurnalComTech, 6(4), 569-579.
Elyana, Instianti. 2017. Decision Support System Untuk Kelayakan Pemberian Kredit Motor Dengan Menggunakan Metode Simple Additive Weighting Pada Perusahaan Leasing. ISSN: 1978-1946. Bogor: Jurnal Pilar Nusa Mandiri.Vol.13,No.1Maret2017:8591.Diambildari:ejournal.nusamandiri.a c.id/ejurnal/index.php/pilar/article/viewFile/341/27 3.(2 Oktober 2017)
Han, J.,&Kamber, M..2014. Data Mining Comcept and Tehniques. San Fransisco. Morgan Kauffman.
Hariani, Iswi. 2013. Restrukturisasi dan Penghapusan Kredit Macet. Jakarta: PT Elexmedia Komputindo.
Hermawati, Fajar Astuti. 2013. Data Mining. Andi : Yogyakarta.
KEMENKEU. 1967. Pokok-pokok Perbankan No.14. Diambil dari:
http://www.jdih.kemenkeu.go.id/fullText/1967/14TAHUN1967UU.HTM. (2 Oktober 2017).
Kusrini, dan Luthfi, Emha Taufik. 2015. Algoritma Data Mining, Edisi I, Yogyakarta:Andi Publishing.
Lee, Fiin dan Juan Santana. 2014 .Data Mining: Meramalkan Bisnis Perusahaan.
Jakarta: Elex Media Komputindo.
Linof, Gorden S & Berry, Michael J. 2013. Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management. Indiana. Wiley Publishing.
Satchidananda, S S & Jay B.Simha. 2015. Comparing Decision Trees With Logistic Regression For Credit Risk Analysis (SAS APAUGC)
81
RIWAYAT HIDUP
Penulis dilahirkan di Kota Tegal, Pada
tanggal 22 agustus 1995, Sebagai anak ke
delapan dari sepuluh bersaudara dengan
ayah bernama syaroni dan ibu bernama
tariyah.
Penulis menyelesaikan pendidikan formal
pertama kali pendidikan dasar di sd negeri 01
kedungsukun adiwerna kabupaten tegal yang
diselesaikan pada tahun 2007, kemudian melanjutkan sekolah menengah pertama
diselesaikan di Mts Nu Sunan Kalijaga Adiwerna kab.Tegal pada tahun 2010.
Penulis kemudian melanjutkan ke jenjang Sekolah Menengah Kejuruan (SMK) di
SMK Nu 1 Adiwerna kab.tegal yang diselesaikan penulis pada tahun 2013.
Pada tahun 2014 penulis terdaftar sebagai mahasiswa jurusan teknik informatika
di universitas pelita bangsa cikarang-Bekasi, selain kuliah penulis juga sambil
bekerja di perusahaan yang berada di daerah cikarang-bekasi beberapa perusahaan
yang pernah penulis bekerja diantaranya : PT.Kyowa Indonesia, PT.Yutaka
Manufacturing Indonesia, PT.Enkei Indonesia, PT.Yamaha Music Manufacturing
Asia dan PT.Musashi Auto Parts Indonesia. Selama menjadi mahasiswa beberapa
kegiatan yang dilakukan penulis antara lain: Mengikuti Seminar-seminar yang
diadakan di kampus pelita bangsa, penulis melaksanakan Kuliah Kerja Praktek
(KKP) di perusahaan PT.Yamaha Music Manufacturing Asia.
~008@ SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA ~~~~
lfBAN GSA jl. Raya lnspeksi Kalimalang. Tegal Danas Cikarang Pusat, Kab. Bekasi Telp. 021-
Fax. 021-27318252, website: www.pellt.abangsa.ac , SMS Center: 0857 3282 8000
LEMBAR KENDALl BIMBINGAN SKRIPSI
NIM : }_1.!_~.1..9.? .. ~.~ ............. . FORM 1-A Nama . .. f..~.~~.~ ...... 0 .. ~Y.?.:!.OfV\ I Program Studi : Teknik Infonnatika
Pembimbmg T · M.~.H~~-~~~I./ .... M!.4.!~~ \ltJ i: f J-l"tvr} I J S • '\CoJVl . fYl. ICctvl -Pcmbimbing IT : .f?..t?..?..i.~_1:~~ ... ~.-.P.~ ........
Judul Skripsi
P~t=Oif.(SI ~t:.LA)"Af'.A"' ~{ZC:DIT ~F-NOA~AAN e>E~Me>Tof2.. P.o OA OVA DEN GAr-t ALGo~ tT Mit C.t; 5
Tanggal No
Bimbingan
6
Catatan
7 0 7 I LO rt w., I ~t.-J.,~'- rc.. [, r~ ~r1 r-~--~--+-----~-----------
8 : ~~ vo I r()J~ ~bM ~~t' ~ ~~'1\ ~(~ nu }~ 9 l!)) { w .. l C<,vv~t0 lCJl-h"' 9?w-i
{\-v l-0 f'>t !1-1 t\l
Paraf
...
{0(@000® lfB ANGSA
No
19
20
Tanggal Bimbingan
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA ~~~~
Jl. Raya lnspeksi Kahmalang. Tegal Danas Cikarang Pusat, Kab. Bekasi Telp. 021-Fax. 021-27318252, website: www.pelltabangsa,ac. , SMS Center: 0857 3282 8000
Catatan Paraf
Bekasi, ./ .. '1. .... -. .. 0 .. ':: .. ~ Pembimbing I@
...
( ......... ~~. ~6·:·'~(Jb~.:.r..~ .... ) NlDN: f?;./ .. : ...... J.~.~ .. S.
84
LAMPIRAN
Tabel 4.8 Data Keseluruhan
85
Tabel 4.9 Data Keseluruhan (Lanjutan)
86
Tabel 4.10 Data Keseluruhan (Lanjutan)
87
Tabel 4.11 Data Keseluruhan (Lanjutan)
88
Tabel 4.12 Data Keseluruhan (Lanjutan)
89
Tabel 4.13 Data Keseluruhan (Lanjutan)
90
Tabel 4.14 Data Keseluruhan (Lanjutan)
91
Tabel 4.15 Data Testing
92
Tabel 4.16 Data Testing (Lanjutan)