KLASIFIKASI DATA NASABAH BERPOTENSI TERKENA KREDIT...
Transcript of KLASIFIKASI DATA NASABAH BERPOTENSI TERKENA KREDIT...
KLASIFIKASI DATA NASABAH BERPOTENSI TERKENA
KREDIT MACET DENGAN MENGGUNAKAN METODE
NAÏVE BAYES
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Oleh :
Yohana Mustika Rinjani Putri
155314004
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2019
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
DATA CLASSIFICATION CUSTOMERS HAVE THE
POTENTIAL TO GET BAD CREDIT USING THE NAÏVE BAYES
METHOD
THESIS
Present as Patrial Fulfillment of the Reiquirements
to Obtain Sarjana Komputer Degree
in Informatics Engineering Study Program
Created by :
Yohana Mustika Rinjani Putri
Student ID : 155314004
INFORMATICS ENGINEERING STUDY PROGRAM
INFORMATICS ENGINEERING DEPARTMENT
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2019
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
i
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iii
HALAMAN PERSEMBAHAN
Karena masa depan sungguh ada, dan harapanmu tidak akan
hilang.
(Amsal 23:18)
Skripsi ini kupersembahkan untuk :
Tuhan Yesus Kristus, Bunda Maria
Keluargaku
Sahabat dan Teman – Temanku
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
ABSTRAK
Dalam dunia perbankan saat ini banyak sekali nasabah bank yang terkena
keterlambatan pembayaran tagihan atau dikenal dengan kredit macet. Kredit macet
adalah keadaan dimana nasabah sudah tidak sanggup membayar sebagian atau
seluruh kewajibannya kepada bank seperti yang telah diperjanjikan. Hal ini sering
terjadi pada nasabah bank pemegang kartu kredit. Dimana nasabah tersebut tidak
dapat melunasi tagihan yang harus dibayarkan kepada pihak bank. Pihak bank harus
melakukan analisa terhadap nasabah yang terkena kredit macet. Dari data nasabah
yang ada pada saat ini dapat diolah dengan menggunakan teknik penambangan data
dengan menggunakan metode Naïve Bayes. Metode Naïve Bayes menghitung nilai
probabilitas untuk setiap nilai dari atribut target pada setiap kasus (sampel target).
Selanjutnya Naïve Bayes akan mengelompokkan ke kelas yang memepunyai nilai
probabilitas tinggi. Keluaran dari sistem ini adalah sebuah klasifikasi nasabah yang
terkena kredit macet atau tidak macet. Peneliti melakukan pengujian dengan 15393
data menggunakan fold bernilai 3. Pengujian dilakukan sebanyak 23 kali dengan
menghasilkan akurasi tertinggi yakni 77.2819%.
Kata kunci : kredit macet, Metode Naïve Bayes
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vi
ABSTRACT
In the banking world today, many bank customers are exposed to late
payment of bills, known as bad credit. Bad credit is a condition where the customer is
unable to pay part or all of his obligations to the bank as promised. This often
happens to bank credit card holders. Where the customer cannot pay the bills to be
paid to the bank. The bank must analyze customers affected by bad credit.From
existing customer data, it can be processed using data mining techniques using the
Naïve Bayes method. The Naïve Bayes method calculates the probability value for
each value of the target attribute in each case (target sample). Next Naïve Bayes will
group into classes that have a high probability value.The output of this system is a
classification of customers affected by bad credit or not stuck. The researcher
conducted a test with 15393 data using a fold worth 3. Tests were carried out 23
times with the highest accuracy of 77.2819%.
Key word : bad credit, Naïve Bayes method
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
KATA PENGANTAR
Puji syukur dipanjatkan kepada Tuhan Yesus Kristus, Bunda Maria atas berkat dan
kasih-Nya yang melimpah sehingga penulis dapat menyelesaikan skripsi dengan
judul “Klasifikasi Data Nasabah Berpotensi Terkena Kredit Macet Dengan
Menggunakan Metode Naïve Bayes. Dalam kesempatan ini, penulis ingin
mengucapkan terimakasih yang sebesar – besarnya kepada semua pihak yang turut
memberikan semangat, dukungan dan bantuan sehingga selesainya skripsi ini.
1. Tuhan Yesus Kristus dan Bunda Maria atas kasih dan berkat-Nya yang
melimpah kepada penulis.
2. Bapak Agus Priyono, S.H dan Ibu Suratmi , yang telah memberikan cinta
kasih dan sayang yang begitu besar serta semangat dan dukungannya kepada
penulis selama proses perkuliahan dan proses penulisan skripsi ini.
3. Agustina Permata Rinjani Putri, yang telah memberikan semangat, dukungan
serta penghiburan.
4. Bapak Sudi Mungkasi , S.Si., M.Math.Sc,. Ph.D selaku Dekan Fakultas Sains
dan Teknologi Universitas Sanata Dharma Yogyakarta.
5. Ibu Dr.Anastasia RitaWidiarti selaku Ketua Program Studi Teknik
Informatika Universitas Sanata Dharma Yogyakarta.
6. Romo Dr. Cyprianus Kuntoro Adi , SJ ., M.A., M.Sc, selaku dosen
pembimbing tugas akhir yang telah memberikan bimbingan, pengajaran dan
bersedia memberi ilmunya dalam pengerjaan tugas akhir ini, serta dengan
sabar memberikan pelajaran dan masukan dalam pembuatan skripsi ini.
7. Bapak Robertus Adi Nugroho, M.Eng selaku dosen pembimbing akademik
yang dengan sabar memberikan bimbingan, nasehat serta wejangan selama
masa perkuliahan.
8. Pipi, mimi, yemima, Mbak wiji, Pakde Semi , Holly yang telah memberikan
semangat dukungan serta perhatiannya kepada penulis. Lucia Adventia
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ix
Kurniasari dan Priscila Narwastu Putri adik sepupu seperjuangan skripsi ,
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
x
DAFTAR ISI
HALAMAN PERSETUJUAN PEMBIMBING ......... Error! Bookmark not defined.
HALAMAN PENGESAHAN ........................................................................................ i
HALAMAN PERSEMBAHAN .................................................................................. iii
PERNYATAAN KEASLIAN KARYA ..................... Error! Bookmark not defined.
ABSTRAK .................................................................................................................... v
ABSTRACT ................................................................................................................. vi
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH
UNTUK KEPERLUAN KEPENTINGAN AKADEMIS .......... Error! Bookmark not
defined.
KATA PENGANTAR ............................................................................................... viii
DAFTAR ISI ................................................................................................................. x
DAFTAR GAMBAR ................................................................................................. xiii
DAFTAR TABEL ...................................................................................................... xiv
BAB I ............................................................................................................................ 1
PENDAHULUAN ........................................................................................................ 1
1.1 Latar Belakang ............................................................................................... 1
1.2 Rumusan Masalah. ......................................................................................... 4
1.3 Tujuan Penelitian ............................................................................................ 4
1.4 Manfaat Penelitian. ......................................................................................... 4
1.5 Batasan Masalah ............................................................................................. 4
1.6 Metodologi Penelitian .................................................................................... 5
1.7 Sistematika Pembahasan. ............................................................................... 6
BAB II ........................................................................................................................... 8
LANDASAN TEORI .................................................................................................... 8
2.1 Kartu Kredit .................................................................................................... 8
2.2 Kredit Macet ........................................................................................................ 9
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xi
2.3 Penambangan Data ......................................................................................... 9
2.3.1 Pengertian Penambangan Data ..................................................................... 9
2.3.2 Pengelompokan Penambangan Data ........................................................... 11
2.4 Info Gain ...................................................................................................... 12
2.5 Normalisasi Min Max ........................................................................................ 14
2.6 Klasifikasi ..................................................................................................... 14
2.7 Naïve Bayes ...................................................................................................... 15
2.7.1 Persamaan Metode Naïve Bayes ................................................................. 16
2.8 Cross Validation ........................................................................................... 18
2.9 Akurasi dengan Matrixs Confusion. .................................................................. 19
BAB III ....................................................................................................................... 21
METODOLOGI PENELITIAN .................................................................................. 21
3.1 Desain Alat Uji .................................................................................................. 21
3.2 Data ................................................................................................................... 23
3.3 Preprocessing ..................................................................................................... 29
3.4 Modelling Naïve Bayes...................................................................................... 32
3.5 Akurasi .............................................................................................................. 41
3.6 Desain User Interface. ...................................................................................... 42
BAB IV ....................................................................................................................... 41
HASIL DAN ANALISIS ............................................................................................ 41
4.1 Analisis Hasil .................................................................................................... 41
BAB V ......................................................................................................................... 50
PENUTUP ................................................................................................................... 50
5.1 Kesimpulan ........................................................................................................ 50
5.2 Saran .................................................................................................................. 51
DAFTAR PUSTAKA ................................................................................................. 52
LAMPIRAN ................................................................................................................ 54
Tabel Penjelasan hasil akurasi. ................................................................................ 54
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xii
Source code program. .............................................................................................. 64
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiii
DAFTAR GAMBAR
GAMBAR 2.1 3 Fold Validation …………………………………………… 19
GAMBAR 3.2 DIAGRAM BLOK………………………………………….. 21
GAMBAR 3.3 DIAGRAM FLOWCHART………………………………… 23 GAMBAR 3.4 HALAMAN UTAMA…………………………………….……… 39 GAMBAR 4.5 GRAFIK AKURASI RATA – RATA …………………………… 44 GAMBAR 4.6 TABEL CONFUSION MATRIX…………………..…………….. 45
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
DAFTAR TABEL
TABEL 2.1 CONTOH MATRIXS CONFUSION …………………………….. 19
TABEL 3.2 CONTOH DATA NASABAH……………………………………. 22
TABEL 3.3 PENJELASAN ATRIBUT………………………………………… 30
TABEL 3.4 HASIL PERANGKINGAN ATRIBUT DATA 31
TABEL 3.5 DATA NASABAH SESUDAH PREPROCESSING……………… 31
TABEL 3.6 DATA NASABAH SESUDAH PREPROCESSING
DIGUNAKAN DALAM PERCOBAAN
……………………………………………
33
TABEL 3.7 JUMLAH MEAN & STANDAR DEVIASI TOTAL
PEMAKAIAN……………………………………………………….
.
36
TABEL 3.8 JUMLAH MEAN & STANDAR DEVIASI TOTAL PEMAKAIAN
PER LIMIT………………………………………………………….
36
TABEL 3.9 JUMLAH MEAN & STANDAR DEVIASI TOTAL PEMAKAIAN
RETAIL……………………………………………………………
…
36
TABEL 3.10 JUMLAH MEAN & STANDAR DEVIASI RASIO
PEMBAYARAN……………………………………………………
37
TABEL 3.11 JUMLAH MEAN & STANDAR DEVIASI RASIO
PEMBAYARAN PER 3 BULAN………………………………..
37
TABEL 3.12 PROBABILITAS JUMLAH KARTU…………………………… 38
TABEL 3.13 PROBABILITAS SETIAP KELAS………………………………… 38
TABEL 3.14 CONTOH HASIL CONFUSION MATRIX……………………… 41
TABEL 4.15 HASIL PERANGKINGAN ATRIBUT DATA NASABAH……… 44
TABEL 4.16 HASIL PERCOBAAN…………………………………………… 45
TABEL PENJELASAN HASIL AKURASI…………………………………. 54
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Kartu kredit adalah alat pembayaran pengganti uang tunai, berbentuk
kartu yang memberikan fasilitas kredit kepada pemiliknya, dimana saat jatuh
tempo dapat dibayar dengan jumlah minimum dan sisanya dijadikan kredit.
Pertumbuhan bisnis kartu kredit sangat pesat yaitu banyaknya pasar swalayan
dan juga toko-toko kecil yang mulai menerima kartu kredit sebagai alternatif
alat pembayaran dibandingkan dengan uang tunai.
Karakteristik pengguna bisa ditemukan pada nasabah pengguna kartu
kredit yang memiliki pendapatan tergolong cukup tinggi, sebagian besar
nasabah berpendidikan S1, terdapat jenjang karir yang jelas sehingga nasabah
memiliki kesempatan untuk berprestasi. Dengan banyak keinginan dan
kebutuhan,pengguna merupakan konsumen yang aktif. Image merupakan hal
yang penting bagi pengguna. Mereka suka produk dan layanan yang sudah
mapan, prestise yang mencerminkan kesuksesan mereka. Kehidupan
pengguna yang sibuk, mereka sangat tertarik terhadap alat-alat yang bisa
membantu mereka menghemat waktu.
Kartu kredit pada dasarnya adalah sebagai sebuah alat identifikasi
untuk konsumen yang secara keuangan bertanggung jawab. Penggunaannya
memberikan kredit berputar (revolving credit) tanpa jaminan untuk pembelian
barang atau jasa dari para pedagang (merchant) (Rahmadiana, 2013).
Hal yang paling mendasar dalam setiap pemberian kredit perbankan
adalah bahwa setiap orang atau badan usaha yang mendapatkan fasilitas kredit
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2
dari bank berarti bahwa orang atau badan usaha yang bersangkutan telah
mendapatkan kepercayaan terhadap kemampuan nasabah untuk membayar
kredit tersebut.
Kredit macet adalah keadaan dimana nasabah sudah tidak sanggup
membayar sebagian atau seluruh kewajibannya kepada bank seperti yang telah
dijanjikan.Faktor – faktor kredit macet adalah hal – hal yang ikut
menyebabkan suatu keadaan dimana nasabah sudah tidak sanggup membayar
sebagian atau seluruh kewajibannya kepada bank seperti yang telah
diperjanjikan. Faktor dari kredit macet tersebut yakni waktu pembayaran yang
terlambat, tagihan yang semakin banyak, penggunaan overlimit (Mudrajad
Kuncoro dan Suhardjono, 2002).
Suatu kredit dikatakan bermasalah jika debitor wanprestasi atau
ingkar janji atau tidak menyelesaikan kewajibanya sesuai dengan perjanjian
baik jumlah maupun waktu, misalnya pembayaran atas perhitungan bunga
maupun utang pokok. Kredit bermasalah disebabkan oleh karena nasabah
kartu kredit tidak dapat untuk memenuhi kewajibannya. Dalam perbankan,
kredit bermasalah khususnya mengenai kredit macet lebih dikenal dengan
nama Non-Performing Loan yang selanjutnya akan disebut NPL.Penyaluran
kredit yang berhasil akan membawa keuntungan besar bagi bank. Oleh
karena itu , bank harus berhati – hati dalam menyalurkan kredit kepada
seorang calon nasabah atau nasabah bank itu sendiri. Bank harus menentukan
terlebih dahulu nasabah mana yang berpotensi di berikan kredit.
Dengan banyaknya data nasabah yang memiliki kartu kredit, akan
menyulitkan pihak bank dalam menentukan nasabah mana yang paling
berpotensi terkena kredit macet maupun tidak macet dalam proses
pembayarannya. Prediksi tersebut dapat diketahui dengan menggunakan data
– data nasabah yang diproses secara matematik sehingga menemukan suatu
pola. Proses tersebut dinamakan data mining.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
Menurut Pramudiono, data mining adalah analisis otomatis dari setiap
data yang berjumlah besar atau kompleks dengan tujuan untuk menemukan
pola kecenderungan yang penting yang biasanya tidak disadari
keberadaannya. Data mining memiliki berbagai macam teknik salah satunya
yakni klasifikasi. (Kusrini & Luthfi,2009)
Klasifikasi memiliki berbagai algoritma yang dapat diterapkan untuk
melakukan klasifikasi data nasabat yang berpotensi terkena pembayaran kredit
macet. Sejumlah penelitian telah dilakukan, seperti penelitian yang dilakukan
oleh Awaludin Rizky Wicaksono(2016), penelitian yang dibuat yakni
klasifikasi data mining untuk menentukan potensi kredit macet pada koperasi
simpan pinjam primkoveri waleri. Penelitian ini menggunakan algoritma
decision tree C.45, hasil dari penelitian dari permasalahan yang
dikembangkan dapat disimpulkan bahwa pengimplementasian metode
desicion tree terhadap data nasabah kredit Koperasi Primkoveri Waleri tahun
2014 memiliki tingkat akurasi yang baik dalam menyelesaikan solusi
klasifikasi data mining dengan algoritma C4.5 yaitu sebesar 86%.
Penelitian serupa juga dilakukan oleh Sri Kusumadewi (2013),
penelitian yang dibuat yakni klasifikasi status gizi menggunakan naïve bayes
classification, pada penelitian ini , peneliti menggunakan semua atribut pada
data. Hasil penelitian permasalahan yang dikembangkan dapat disimpulkan
bahwa klasifikasi status gizi menggunakan naïve bayes classification ,
didapatkan akurasi sebesar 0.932 atau 93.2%
Berdasarkan uraian diatas peneliti mencoba untuk memprediksi data
nasabah suatu bank yang diperoleh dari salah satu bank swasta di Yogyakarta
dengan menggunakan teknik klasifikasi dan menerapkan algoritma Naïve
Bayes. Sehingga berdasarkan dari latar belakang diatas maka penulis
mengangkat judul “Klasifikasi Data Nasabah Berpotensi Terkena Kredit
Macet Dalam Pembayaran Tagihan Kartu Kredit dengan Metode Naïve
Bayes”.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4
1.2 Rumusan Masalah.
1. Bagaimana membuat pendekatan Naïve Bayes mampu secara otomatis
melakukan klasifikasi data nasabah berpotensi terkena kredit macet ?
2. Seberapa tepat klasifikasi pendekatan data nasabah berpotensi terkena
kredit macet dan berapa nilai akurasi pada model tersebut ?
1.3 Tujuan Penelitian
Secara umum tujuan penelitian ini yaitu membuat model klasifikasi data
nasabah untuk membantu bank guna menentukan nasabah mana yang
berpotensi terkena kredit macet. Mengetahui uji akurasi pada model tersebut.
1.4 Manfaat Penelitian.
Mengetahui metode Naïve Bayes dapat diterapkan untuk
mengklasifikasikan data nasabah yang berpotensi terkena kredit macet
berdasarkan data penggunaan kartu kredit.
1.5 Batasan Masalah
Dalam penelitian yang dilakukan dalam tugas akhir ini memiliki
batasan – batasan masalah, sebagai berikut :
1. Data yang diolah hanya data yang berhubungan dengan data nasabah
pengguna kartu kredit.
2. Sumber data yang digunakan merupakan data nasabah dari suatu Bank
swasta yang ada di Indonesia.
3. Data yang digunakan adalah data excel.
4. Metode yang akan digunakan untuk mengklasifikasikan data nasabah
adalah metode Naïve Bayes.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5
1.6 Metodologi Penelitian
Dalam penyelesaian tugas akhir yang berjudul klasifikasi data nasabah
yang berpotensi terkena kredit macet dalam pembayaran tagihan kartu kredit
menggunakan metode Naïve Bayes, akan ditempuh langkah – langkah sebagai
berikut :
1. Studi Pustaka
a. Penelitian pustaka, yaitu dengan mempelajari hal – hal yang
berkaitan dengan Data Mining metode Naïve Bayes, dengan
mengumpulkan dan mempelajari informasi dari buku buku artikel
dan website internet.
b. Interview, yaitu dengan melakukan konsultasi atau tanya jawab
dengan orang – orang yang memiliki pengetahuan dan wawasan
yang berhubungan dengan topik tugas akhir ini.
2. Pengumpulan Data.
Metodologi yang kedua adalah pengumpulan data. Data yang
digunakan dalam penelitian ini merupakan data nasabah yang berasala
dari salah satu bank swasta yang berada di Indonesia.
3. Pembuatan Alat Uji
Metodologi yang ketiga adalah pembuatan alat uji dilakukan dengan
teknik penambangan data yang langkah – langkahnya seperti dibawah
ini :
a. Pembersihan data, menghilangkan noise, dan data yang tidak
konsisten.
b. Integrasi data, menggabungkan data dari berbagai sumber data
yang berbeda.
c. Seleksi data dan transformasi data, untuk menentukan kualitas dari
hasil data mining, sehingga data diubah menjadi bentuk yang
sesuai untuk di mining.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6
d. Penerapan teknik data mining, teknik yang digunakan adalah
teknik Naïve Bayes.
e. Evaluasi pola yang ditentukan, menampilkan hasil dari teksnik
data mining berupa pola yang khas maupun mengukur akurasi.
f. Presentasi pengetahuan, merupakan tahap terakhir dari proses data
mining yaitu memformulasikan keputusan atau aksi dari hasil
analisa yang didapat.
4. Pengujian dan Analisa Hasil
Metodologi yang keempat adalah pengujian dan analisis hasil.
Alat uji yang telah dibuat akan diuji menggunakan data nasabah dan
selanjutnya hasil dari pengujian akan dianalisis.
5. Pembuatan Dokumen
Metodologi yang terakhir adalah pembuatan dokumen
berdasarkan semua metodologi penelitian yang sudah dilakukan.
1.7 Sistematika Pembahasan.
BAB 1. Pendahuluan
Dalam bab ini menguraikan tentang latar belakang masalah, rumusan
masalah, batasan masalah, tujuan penelitian dan sistematika penulisan.
BAB 2. Landasan Teori
Bab 2 berisi tentang penjelasan teori – teori yang digunakan dalam
melakukan penelitian.
BAB 3. Metodologi Penelitian
Dalam bab ini menguraikan tentang gambaran umum penelitian serta
cara penerapan konsep dasar yang telah diuraikan untuk menganalisis
dan merancang tentang system sesuai tahap – tahap penyelesaian
masalah tersebut dengan menggunakan metode Naïve Bayes.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
BAB 4 Analisis dan Perancangan Sistem.
Dalam bab ini berisi tentang implementasu ke program komputer
berdasarkan hasil perancangan yang dibuat, analisis perangkat lunak
yang telah dibuat.
BAB 5 Implementasi dan Analisis
Dalam bab ini berisi tentang kesimpulan dan saran dari keseluruhan
penulisan tugas akhir.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
BAB II
LANDASAN TEORI
Pada bab ini akan dibahas mengenai teori – teori yang digunakan untuk mendukung
penulisan tugas akhit klasifikasi data nasabah berpotensi terkena kredit macet dengan
menggunakan metode Naïve Bayes
2.1 Kartu Kredit
Kartu kredit merupakan sebuah alat pembayaran berupa kartu yang
tertera nama dan tanda tangan pemilik serta dapat digunakan untuk membayar
barang yang dibeli dengan dana dipinjamkan oleh suatu lembaga ditempat –
tempat yang bersedia menerima pembayaran tanpa harus mengeluarkan uang
tunai. Dengan kata lain, kartu kredit diciptakan untuk memudahkan nasabah
dalam berbelanja. Kartu kredit pada dasarnya merupakan alat identifikasi
untuk konsumen yang bertanggunag jawab secara keuangan. Penggunaan dari
kartu kredit tersebut memberikan kredit berputar tanpa adanya jaminan untuk
pembelian barang atau jasa dari para pedagang. Kartu kredit memberikan
jaminan nasabahnya dalam bertransaksi dengan limit minimum dan
maksimum yang diberikan kepada nasabah. Hal ini dilakukan agar nasabah
dapat menggunakan kartu tersebut untuk bertransaksi memberi barang atau
sesuatu yang diinginkan. Nasabah yang memiliki kartu kredit, biasanya
memiliki batas minimum limit dan maksimum limit penggunaan berbeda –
beda. Hal ini dilakukan karena pihak bank memberi hak limit dalam
bertransaksi berdasarkan penghasilan yang diperoleh nasabah tersebut.
Semakin banyak kartu yang dimiliki nasabah tersebut semakin banyak juga
biaya yang dikeluarkan oleh nasabah dalam membayar tagihan kartu kredit
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
setiap bulannya. Disisi lain kartu kredit dapat memberikan bencana bagi
nasabahnya.
Banyak nasabah yang tidak dapat mengelola kartu kredit tersebut
dengan baik. Hal ini akan berdampak pada pembayaran tagihan yang
terlambat. Pembayaran tagihan yang terlambat ini jika tidak segera
diselesaikan akan terkena kredit macet (Wahyuni dan Pranoto ,2013)
2.2 Kredit Macet
Kredit macet adalah keadaan dimana nasabah sudah tidak sanggup
membayar sebagian atau seluruh kewajibannya kepada bank seperti yang telah
.Faktor – faktor kredit macet adalah hal – hal yang ikut menyebabkan suatu
keadaan dimana nasabah sudah tidak sanggup membayar sebagian atau
seluruh kewajibannya kepada bank seperti yang telah diperjanjikan. Faktor
dari kredit macet tersebut yakni waktu pembayaran yang terlambat, tagihan
yang semakin banyak, penggunaan overlimit. Hal ini dapat menyulitkan pihak
bank untuk menentukan nasabah mana yang terkena kredit macet dalam
pembayaran tagihan. Agar nasabah pemegang kartu kredit dikatakan tidak
terkena kredit macet , maka nasabah tersebut harus membayar tagihan tersebut
dengan pembayaran penuh termasuk juga bunga yang diberikan oleh pihak
bank(Mudrajad Kuncoro dan Suhardjono, 2002).
.
2.3 Penambangan Data
2.3.1 Pengertian Penambangan Data
Menurut Pramudiono, data mining adalah serangkaian proses untuk
menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama
ini tidak diketahui secara manual (Kursrini & Luthfi,2009).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
Data mining mengacu pada mining knowledge dari data dalam jumlah
besar (Han & Kamber, 2006). Secara umum data mining dikenal dengan proses
Knowledge Discovery from Data (KDD). Proses KDD sebagai berikut :
1. Pembersihan data (Data Cleaning).
Proses pembersihan data atau data cleaning dilakukan untuk menghilangkan
noise dan data yang konsisten.
2. Integrasi data (Data Integration).
Proses data integrasi adalah proses menggabungkan data dari sumber data
yang berbeda.
3. Seleksi data ( Data Selection).
Seleksi data atau data selection adalah proses memilih data atau atribut yang
relevan untuk atribut ini. Pada tahap ini dilakukan analisis korelasi atribut
data. Atribut – atribut data tersebut dicek apakah relevan untuk dilakukan
penambangan data.
4. Transformasi data (Data Transformation).
Transformasi atau data transformation proses menggabungkan data ke dalam
bank yang sesuai untuk ditambang.
5. Penambangan data (Data Mining).
Langkah ini adalah langkah paling penting yaitu melakukan pengaplikasian
metode yang tepat untuk pola data.
6. Evaluasi pola (Pattern Evaluation).
Pada langkah ini dilakukan identifikasi pola dalam bentuk pengetahuan
berdasarkan beberapa pengukuran yang penting.
7. Presentasi pengetahuan (Knowledge Presentation).
Pada langkah ini dilakukan proses penyajian pengetahuan dari hasil
penambangan data. hasil klasifikasi data nasabah akan ditampilkan ke dalam
bentuk yang mudah dipahami user/pengguna.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
2.3.2 Pengelompokan Penambangan Data
Penambangan data dibagi menjadi beberapa kelompok berdasarkan tugas
yang dapat dilakukan, yaitu (Kursrini & Luthfi,2009) :
1. Deskripsi
Tugas deskripsi pada penambangan data adalah menggambarkan pola dan
keenderungan sering memberikan kemungkinan penjelasan untuk suatu pola
atau kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, namun pada variable target,
estimasi lebih kearah numerik dari pada kearah kategori. Peninjauan estimasi
nilai dari variable target dibuat berdasarkan nilai prediksi. Sebagai contoh,
estimasi nilai indeks prestasi kumulatif mahasiswa program pascasarjana
dengan melihat nilai indeks prestasi mahasiswa tersebut pada saat mengikuti
program sarjana.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi. Namun dalam prediksi
niali dari hasil akan merujuk ke masa mendatang. Contoh prediksi dalam
bisnis dan penelitian adalah prediksi harga beras dalam 6 bulan yang akan
datang.
4. Klasifikasi
Klasifikasi adalah proses penemuan model atau fungsi yang menjelaskan atau
membedakan konsep atau kelas data, dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Dalam
klasifikasi, terdapat target variable kategori. Sebagai contoh, penggolongan
pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi,
pendapatan sedang, dan pendapatan rendah.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
5. Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan, atau
memprihatinkan dan membentuk kelas objek – objek yang memiliki
kemiripan. Contoh pengklusteran dalam dunia bisnis atau penelitian adalah
mendapatkan kelompok – kelompok konsumen untuk target pemasaran dari
suatu produk sebuah perusahaan yang tidak memiliki dana pemasaran yang
besar.
6. Asosiasi
Tugas asosiasi dalam penambangan data adalah menemukan atribut yang
muncul satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang
belanja. Contoh asosiasi dalam dunia bisnis atau penelitian adalah
menemukan barang dalam supermarket yang dibeli secara bersamaan dan
barang yang tidak pernah dibeli secara samaan.
2.4 Info Gain
Proses seleksi atribut pada penelitian ini dilakukan menggunakan Weka Tools
3.8.2. Dalam melakukan seleksi atribut, peneliti melakukan eksperimen
menggunakan metode information gain.
Untuk menghitung information gain menggunakan rumus di bawah ini (Han et
al.,2012) :
( ) pi log2(pi) ……. (2.1)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
Keterangan :
D : Jumlah seluruh sampel data
M : jumlah nilai pada atribut target (jumlah kelas klasifikasi).
I : Maksimal nilai pada atribut target.
Pi : Jumlah sampel untuk kelas i.
Info A (D) =
X Info (Di) ……(2.2)
Keterangan dari rumus otersebut adalah :
A : Atribut
v : Suatu nilai yang mungkin untuk atribut A.
J : Maksimal nilai yang mungkin untuk atribut A.
D : Jumlah seluruh sampel data.
|Dj|: Jumlah sampel untuk nilai j.
Di : jumlah sampel untuk kelas i.
Kemudian niali information gain yang digunakan untuk mengukur efektifitas suatu
atribut dalam pengklasifikasin data dapat dihitung dengan rumus di bawah ini :
Gain (A) = |Info(D) – InfoA(D)| ………..(2.3)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
Keterangan :
A : Atribut.
Info (D) : Entropi untuk kelas D.
InfoA(D) : Entropi untuk kelas D pada atribut A.
2.5 Normalisasi Min Max
Normalisasi data mencoba untuk memberikan semua atribut bobot yang sama.
Misalkan bahwa minA dan maxA adalah nilai minimum dan maksimum atribut,
A.Normalisasi Min-max memetakan nilai, vi, dari A ke v0 i dalam kisaran [minA
baru, maks baru] (Han et al.,2012) :
Vi= ( )
( ) ( ) (new_maxA – new_minA) + new-minA ……(2.4)
Keterangan :
X = Data yang akan di normalisasi.
Min(X) = Jumlah minimum data.
Max(X) = Jumlah maksimum data.
new_minA = range minimum data.
new_maxA = range maximum data.
2.6 Klasifikasi
Klasifikasi adalah proses pembelajaran suatu fungsi tujuan (target) f
memetakan tiap himpunan atribut x dari label kelas y yang didefinisikan sebelumnya.
Fungsi target tersebut juga dengan model klasifikasi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
Terdapat dua jenis model klasifikasi yaitu :
a. Pemodelan Desktiptif (descriptive modeling).
Model klasifikasi yang berfungsi sebagai alat penjelasan untuk membedak
objek – objek dalam kelas – kelas yang berbeda.
b. Pemodelan Prediktif ( predictive modeling).
Model klasifikasi yang digunakan untuk memprediksi label kelas record yang
tidak diketahui(Herawati,2013).
2.7 Naïve Bayes
Naive Bayes merupakan sebuah pengklasifikasian probabilistik
sederhana yang menghitung sekumpulan probabilitas dengan menjumlahkan
frekuensi dan kombinasi nilai dari dataset yang diberikan. Algoritma
mengunakan teorema Bayes dan mengasumsikan semua atribut independen
atau tidak saling ketergantungan yang diberikan oleh nilai pada variabel kelas
(Patil,2013). Definisi lain mengatakan Naive Bayes merupakan
pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan
oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa
depan berdasarkan pengalaman di masa sebelumnya (Bustami, 2013).
Naive Bayes didasarkan pada asumsi penyederhanaan bahwa nilai
atribut secara kondisional saling bebas jika diberikan nilai output. Dengan
kata lain, diberikan nilai output, probabilitas mengamati secara bersama
adalah produk dari probabilitas individu (Ridwan, 2013). Keuntungan
penggunaan Naive Bayes adalah bahwa metode ini hanya membutuhkan
jumlah data pelatihan (Training data) yang kecil untuk menentukan estimasi
paremeter yang diperlukan dalam proses pengklasifikasian. Naive Bayes
sering bekerja jauh lebih baik dalam kebanyakan situasi dunia nyata yang
kompleks dari pada yang diharapkan (Pattekari & Parveen, 2012).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
2.7.1 Persamaan Metode Naïve Bayes
Persamaan dari teorema Bayes adalah :
( ) ( ) ( )
( ) …………..(2.5)
Dimana :
X : Data dengan class yang belum diketahui.
H : Hipotesis data merupakan suatu class spesifik.
P(H|X) : Probabilitas hipotesis H berdasarkan kondisi X (posterior
probabilitas).
P(H) : Probabilitas hipotesis H (prior probabilitas).
P(X) : Probabilitas X.
Untuk menjelaskan metode Naive Bayes, perlu diketahui bahwa
proses klasifikasi memerlukan sejumlah petunjuk untuk menentukan kelas apa
yang cocok bagi sampel yang dianalisis tersebut. Karena itu, metode Naive
Bayes di atas disesuaikan sebagai berikut
( ) ( ) ( )
( ) ……(2.6)
Di mana Variabel C merepresentasikan kelas, sementara variabel F1 ...
Fn merepresentasikan karakteristik petunjuk yang dibutuhkan untuk
melakukan klasifikasi. Maka rumus tersebut menjelaskan bahwa peluang
masuknya sampel karakteristik tertentu dalam kelas C (Posterior) adalah
peluang munculnya kelas C (sebelum masuknya sampel tersebut, seringkali
disebut prior), dikali dengan peluang kemunculan karakteristik-karakteristik
sampel pada kelas C (disebut juga likelihood), dibagi dengan peluang
kemunculan karakteristik-karakteristik sampel secara global (disebut juga
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
evidence). Karena itu, rumus di atas dapat pula ditulis secara sederhana
sebagai berikut:
…… (2.7)
Nilai Evidence selalu tetap untuk setiap kelas pada satu sampel. Nilai
dari posterior tersebut nantinya akan dibandingkan dengan nilai-nilai posterior
kelas lainnya untuk menentukan ke kelas apa suatu sampel akan
diklasifikasikan. (nomor urut) Penjabaran lebih lanjut rumus Bayes tersebut
dilakukan dengan menjabarkan (C|F1,..,Fn) menggunakan aturan perkalian
sebagai berikut:
P(C|F1,…,Fn=P(C)P(F1,…,Fn|C)
= P(C)P(F1|C)P(F2,…,Fn|C,F1) ……(2.8)
= P(C)P(F1|C)P(F2|C,F1)P(F3,…,Fn|C,F1,F2,F3)
= (C)P(F1|C)P(F2|C,F1)P(F3|C,F1,F2)P(F4,…,Fn|C,F1,F2,F3)
= P(C)P(F1|C)P(F2|C,F1)P(F3|C,F1,F2)…P(Fn|C,F1,F2,F3,…,Fn-1)
Dapat dilihat bahwa hasil penjabaran tersebut menyebabkan semakin
banyak dan semakin kompleksnya faktor - faktor syarat yang mempengaruhi
nilai probabilitas, yang hampir mustahil untuk dianalisa satu persatu.
Akibatnya, perhitungan tersebut menjadi sulit untuk dilakukan. Di sinilah
digunakan asumsi independensi yang sangat tinggi (naif), bahwa masing-
masing petunjuk (F1,F2...Fn) saling bebas (independen) satu sama lain.
Dengan asumsi tersebut, maka berlaku suatu kesamaan sebagai
berikut:
( ) ( )
( ) ( ) ( )
( ) = P(Fi) ……(2.9)
Untuk i≠j , sehingga
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
P(Fi|C,Fj) = P(Fi|C) ….. (2.10)
Persamaan di atas merupakan model dari teorema Naive Bayes yang
selanjutnya akan digunakan dalam proses klasifikasi. Untuk klasifikasi
dengan data kontinyu digunakan rumus Densitas Gauss :
P (Xi = xi |Y = yj )=
√ ( )
( ) ……(2.11)
Dimana :
P : Peluang
Xi : Atribut ke i
xi : Nilai atribut ke i
Y : Kelas yang dicari
yi : Sub kelas Y yang dicari
µ : mean, menyatakan rata – rata dari seluruh atribut
σ :Deviasi standar, menyatakan varian dari seluruh atribut.
Likelihood
P(A1) x P(A2) x P(A3)….P(An) x Nilai Probabilitas kategori ….. (2.12)
2.8 Cross Validation
Pada pendekatan ini, setiap data digunakan dalam jumlah yang sama
untuk pelatihan dan tepat satu kali untuk pengujian. Bentuk umum pendekatan
ini disebut dengan k-fold cross – validation, yang memecah set data menjadi k
bagian set data dengan ukuran yang sama. Setiap kali berjalan, satu pecahan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
berperan sebagai data set data latih sedangkan pecahan lainnya menjadi set
data latih. Prosedur tersebut dilakukan sebanyak k kali sehingga setiap data
kesempatan menjadi data uji tepat satu kali dan menjadi data latih sebanyak k-
1 kali. Total error didapatkan dengan menjumlahkan semua error yang
didapatkan dari k kali proses (Prasetyo,2014).
Gambar 2.1 3Fold Validation
2.9 Akurasi dengan Matrixs Confusion.
Matrixs confusion merupakan tabel yang mencatat hasil kerja
klasifikasi. Contoh matrixs confusion sebagai berikut :
Tabel 2.1 Contoh Matrixs Confusion
fij Kelas hasil prediksi (j)
Kelas =1 Kelas = 0
Kelas asli(i) Kelas =1 f11 f10
Kelas = 0 f01 f00
Tabel 2.9 merupakan contoh confusion yang melakukan klasifikasi
masalah biner (dua kelas) untuk dua kelas, misalnya kelas 0 dan 1. Setiap sel
fy dalam matrix menyatakan jumlah record data dari kelas I yang hasil
prediksinya masuk ke kelas j. Misalnya, sel f11 adalah jumlah data dalam
kelas 1 yang secara benar dipetakan ke kelas 1, dan f10 adalah data dalam
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
kelas 1 yang dipetakan secara salah ke kelas 0. Berdasarkan isi matrixs
confusion , maka dapat diketahui jumlah data dari masing – masing kelas
yang diprediksi secara benar yaitu (f11 + f00) dan data yang diklasifikasi
secara salah yaitu (f10+f01). Kuantitas matrixs confusion dapat diringkas
menjadi dua nilai, yaitu akurasi dan laju error. Dengan mengetahui jumlah
data yang diklasifikasikan secara benar, maka dapat diketahui akurasi hasil
prediksi dan dengan mengetahui jumlah data yang diklasifikasikan secara
salah maka dapat diketahui laju error dari prediksi yang dilakukan. Dua
kuantitas ini digunakan sebagai matrix kinerja klasifikasi.
Untuk menghitung akurasi digunakan formula sebagai berikut :
Akurasi =
….(2.13)
c =
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
BAB III
METODOLOGI PENELITIAN
Pada bab ini akan dijelaskan analisa data dan analisa system yang akan dibuat untuk
klasifikasi data nasabah berpotensi terkena kredit macet dengan menggunakan
metode Naïve Bayes.
3.1 Desain Alat Uji
Gambar 3.2 Diagram Blok
Berdasarkan pada gambar 3.2 diatas dimana data yang akan di proses pada sistem..
Tahap presprocessing pada data tersebut yakni seleksi atribut, dimana seleksi atribut
ini memilih atribut mana saja yang akan digunakan. Dalam sistem kerja tersebut
dimana data tersebut akan di rangking atau di urutkan berdasarkan bobotnya yang
terpenting. Data tersebut dipilih menjadi beberapa atribut. Selanjutnya, data tersebut
melalui tahap normalisasi. Tahap ini dilakukan, dimana pada data set tersebut
terdapat range data yang cukup jauh dan susah untuk diproses. Data tersebut
dilakukan proses transformasi linear terhadap data asli. Pada proses ini menggunakan
metode min max. Nilai pada set tersebut diubah skalanya dengan batas nilai minimum
yang diberikan yakni 0 sementara untuk batas maximum yang diberikan yakni 1.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
Setelah data melewati process preprocessing, data akan masuk ke tahap bagian
pembentukan model. Dimana data akan dibagi terlebih dahulu menjadi 2 bagian
yakni antara data training dan data testing. Dalam pembentukan model, data akan dio-
lah untuk mengetahui nilai rata – rata (mean) dan standar deviasi. Dimana setiap data
pada atribut terlebih dahulu di hitung jumlah rata –rata dan standar deviasi.
Selanjutnya jika model telah terbentuk, maka akan dilakukan uji model, dimana pada
uji model ini akan ada data baru yang akan dimasukkan sebagai data test. Data
dimasukkan dan di cari nilai probabilitas setiap atribut dengan menggunakan hasil
modeling. Setelah mencari nilai probabilitas kemudian menghitung nilai likelihood
berdasarkan status kelas, yang mana nilai likehood tersebut akan di gunakan untuk
mencari nilai probabilitas hasil. Nilai probabilitas hasil di hitung untuk mengetahui
hasil yang akan diketahui oleh sistem apakah data tersebut terkena kredit macet atau
tidak macet.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
Gambar 3.3 Diagram Flowchart
3.2 Data
Data yang digunakan pada penelitian ini merupakan data dari salah satu bank
swasta yang berada di Indonesia. Data tersebut memiliki 23 atribut dan 1 label kelas
dengan jumlah data 15393 data. Data ini dikumpulkan dari beberapa riwayat transaksi
nasabah pada bank tersebut. Berikut merupakan contoh dari data nasabah salah satu
bank di Indonesia.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
Tabel 3.2 Contoh Data Nasabah
X Jumlah
Kartu
Outstanding
(Rp)
Limit
Kredit
(Rp)
Tagihan
(Rp)
Total
Pemakaian
Tunai
(Rp)
Total
Pemakaian
Retail
(Rp)
1
2 36158
7.00E+06 23437
0
94
4 4
3496732
2.10E+07
111231
0
2536660
10 3 5747546
6.00E+06
5754698
0.045075
0
6 3 7691430
7.00E+06
2334602
0
4494421
8 2 22533915
2.00E+07 9
0 0
7 2 5309091
5.00E+06
5309314
0 380000
2 2 268691
1.00E+07
254564
0
1012
3 3
6769149
2.80E+07
4159779
0
0
5 2
9402085
1.00E+07
6099283
0
2666558
9 2 55083
8.00E+06
23120
0 0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
X Sisa
Tagihan
Tidak
Dibayar
(Rp)
Kode
Caban
g
Rasio
Pembayar
an
(%)
Prese
ntasi
Overli
mit
Rasio
Pembaya
rna 3
Bulan
(%)
Rasio
Pembayar
an 6 bulan
(%)
Skor
Delikuen
si
1
2623 9 102.19 0 74.78 100 0
4 581334
1 100
0
25.01
22.64
0
10 5757744
1 42.09
0 8.98
12.09
0
6 5902767
7 9.17
0 68.4
100
0
8 22442690
1 0 12.75
7.49
12.2
0
7 5310555
5 10.51
19.54
18.29
13.26
0
2 0
1 0
0
0
0
0
3 581334
1 100
0
25.01
22.64
0
5 581334
1 100
0
25.01
22.64
0
9 0 9 0 10.51
17.27
28.07
0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
X Jumlah
Tahun
Sejak
Pembu
kaan
Kredit
Total
Pemaka
ian
(Rp)
Sisa
Tagih
an Per
Jumla
h
Kartu
(Rp)
Sisa
Tagiha
n Per
Limit
(Rp)
Total
Pemakai
an Per
Limit
(Rp)
Pemakaian
3 Bulan
Per Limit
(Rp)
Pemakaian 6
Bulan Per
Limit
(Rp)
1 15.42 94 13161
.5
0.0037
6
0.000013
4
0.0117 0.0178
14 19.75
2536660
145333.5
0.0277 0.120793333
0.056 0.0169
5 11.83
1300000
1919248
9.60E-01
0.216667
2.65E-01
1.06E-02
2 1
0
2655278
1.06E+00
0
6.75E-02
7.97E-02
19 0.92
0
0
1.12E+00
0
9.95E-02
1.12E-01
4 2.83
0
11221345
1.06E+00
0
2.37E-02
2.69E-01
24 0.75
1012
0
0.00E+00
0.000101
0.00E+00
0.00E+00
3 10.75
0
0
0 0
0.0405 4.77E-02
43 1.67
2666558
2466024
5.95E-01
0.266656
3.23E-01
1.31E-01
38 0.75
0
0 0
0
0.00E+00
0.00E+00
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
X Utilisasi 3 bulan Utilisasi 6 bulan Kelas
1 1.32E-02
0.0219 0
14 0.102 3.47E-01
0
5 7.28E-01
5.49E-01
1
2 1.04E+00
9.29E-01
1
19 1.12E-02
2.24E-02
1
4 9.88E-01
9.64E-01
1
24 0.00423 0.0003 0
3 2.49E-01
2.68E-01
0
43 7.08E-01
3.37E-01
0
38 1.12E-02
2.24E-02
1
Beberapa atribut dari data set tersebut merupakan hasil penggabungan dari
beberapa atribut seperti pemakaian 3 bulan per limit, atribut tersebut merupakan hasil
dari perhitungan rata – rata jumlah yang di bayar dengan jumlah tagihan. Berikut ini
merupakan penjelasan dari setiap atribut pada data set tersebut.
Tabel 3.3 Penjelasan Atribut
No Atribut Keterangan
1 Jumlah kartu Jumlah kartu aktif yang dimiliki
pelanggan.
2 Outstanding Total saldo pemakaian kartu
kredit.
3 Limit kredit Jumlah maksimum limit kartu
kredit yang dapat digunakan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
No Atribut Keterangan
4 Tagihan Jumlah tagihan pada bulan
terakhir.
5 Total pemakaian Total pemakaian kartu kredit(tunai
dan retail) pada bulan terakhir.
6 Total pemakaian tunai Total pemakaian transaksi tunai
pada bulan terakhir.
7 Total pemakaian retail Total pemakaian transsaksi retail
pada bulan terakhir.
8 Sisa tagihan tidak terbayar Jumlah tagihan yang tidak
terbayar pada bulan terakhir.
9 Kode cabang -
10 Rasio pembayaran Rasio perbandingan jumlah yang
dibayar dengan tagihan pada
bulan terakhir.
11 Presentasi overlimit Presentasi overlimit
12 Nomor pelanggan ID pelanggan
13 Ultilisasi 3 bulan Ultilisasi kartu kredit selama 3
bulan terakhir.
14 Pemakaian 3 bulan per limit Rata – rata pemakaian selama 3
bulan terakhir dibagi total limit.
15 Rasio pembayaran 3 bulan Rata-rata rasio pembayaran 3
bulan terakhir
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
No Atribut Keterangan
18 Skor pembayaran Nilai yang dihitung berdasarkan
jumlah minimum pembayaran
yang dilakukan pelanggan dalam
6 bulan terakhir.
19 Sisa tagihan per jumlah kartu Jumlah tagihan yang tidak
terbayar pada bulan terakhir
dibagi jumlah kartu aktif.
20 Sisa tagihan per limit Jumlah tagihan yang tidak
terbayar pada bulan terakhir
dibagi total limit.
21 Total pemakaian per limit Total pemakaian kartu kredit
(tunai dan retail) pada bulan
terakhir dibagi total limit
22 Jumlah tahun sejak pembukaan kredit Jumlah tahun sejak pembukaan
kartu kredit pertama kali.
23 Flag kredit macet
1/0
Flag yang menandakan apakah
kredit macet atau tidak.
1 = Kredit Macet
0 = Tidak Macet
3.3 Preprocessing
Pada tahap preprocessing akan dilakukan tahap pembersihan data, integrasi
data, seleksi data dan transformasi data. Seleksi atribut dilakukan pada sebelum
melakukan tahap normalisasi. Sebelumnya data tersebut diolah menggunakan metode
Info gaint dengan menggunakan Weka Tools 3.8.2 untuk mengetahui perangkingan
atau urutan bobot pada atribut data. Berikut adalah hasil perangkingan data yang
dilakukan menggunakan Weka Tools 3.8.2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
30
Tabel 3.4 Hasil Perangkingan Atribut Data Nasabah
Rangking
Attribut / fitur
1 RasioPembayaran
2 Total Pemakaian Retail
3 Total Pemakaian Per Limit
4 Total Pemakaian
5 Rasio Pembayaran Per 3 Bulan
6 Utilisasi per 3 bulan
7 Tagihan
8 Outstanding
9 Sisa tagihan per limit
10 Sisa tagihan tidak terbayar.
11 Sisa tagihan per jumlah kartu.
12 Utilisasi per 6 bulan.
13 Rasio pembayaran per 6 bulan.
14 Pemakain 3 bulan per limit.
15 Presentasi over limit.
16 Pemakaian 6 bulan per limit.
17 Jumlah tahun sejak pembukaan kredit
18 Jumlah kartu
19 Limit kredit
20 Total pemakaian tunai
21 Kode Cabang
22 Skordelikuensi
23 X
Setelah itu dimana pada tahap ini jumlah atribut yang akan diproses terlebih
dahulu di masukkan atau diinputkan. Selanjutnya dilakukan proses normalisasi,
dimana pada proses ini merupakan proses penskalaan nilai atribut dari data sehingga
bisa jatuh pada range tertentu. Dimana pada tahap ini dilakukan proses pemilihan
atribut dengan menggunakan 5 atribut yang dipilih setelah melalui tahap
perangkingan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
31
Pada data set ini terdapat range data yang cukup jauh dan susah untuk
diproses. Metode yang digunakan dalam normalisasi ini yakni metode Min-Max.
Metode Min-Max merupakan metode normalisasi dengan melakukan transformasi
linear.
Vi= ( )
( ) ( ) (new_maxA – new_minA) + new-minA ………….(3.14)
Berdasarkan persamaan diatas dapat dinormalisasi data dibawah ini :
Normalisasi data atribut jumlah kartu
Vi =
( ) 0.0000453074513300073
Normalisasi data atribut outstanding
Vi =
( ) 0.00401203610832497
Normalisasi data atribut limit
Vi =
(1 -0 ) + 0 = 0.0000054046310907977
Normalisasi data atribut tagihan
Vi =
(1 – 0 ) +0 = 0
Tabel 3.5 Data nasabah sesudah di preprocessing
X A1 A2 A3 A4 A5 Kelas
1 0.209366
0.052108
0.047524576
0.435699
0
0
14 0.208193
0.052108
0.047524291
0.007425
0.052737
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
32
X A1 A2 A3 A4 A5 Kelas
5 0.209295
0.060977
0.055612927
0.027324
0
0
2 0.208193
0.052111
0.047527361
0
0
0
19 0.208298
0.052108 0.047524291
0.061776
0.032684
1
4 0.209341
0.060545
0.0552189
0.564301
0
0
24 0.208193
0.052108 0.047524291
0
0 1
3 0.209341
0.052108
0.047524291
0.297
0
0
43 0.208676
0.052108 0.051467662
0.329076
0 1
Keterangan :
A1= Rasio pembayaran
A2 = Tabel pemakaian retail
A3 = Total pemakaian per limit
A4 = Total Pemakaian.
A5 =Rasio pembayaran per 6 bulan
3.4 Modelling Naïve Bayes.
Pada tahap ini dilakukan proses penambangan data dengan menggunakan
algoritma Naïve Bayes. Data yang sudah diolah pada tahap sebelumnya akan diolah
menggunakan perhitungan algoritma. Data yang diolah adalah data training dan
testing.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
33
Berikut ini merupakan data yang dilakukan untuk mengolah data nasabah dengan
menggunakan metode Naïve Bayes :
1. Data yang digunakan merupakan data training dan data testing. Data testing
adalah data yang dicari hasil akhirnya sedangkan data training adalah data
yang akan digunakan untuk menentukan hasil akhir atau lebih dari data
testing.
2. Data testing yang sudah siap akan dipisahkan dari labelnya.
3. Data testing yang tidak memiliki tabel akan melakukan perulangan untuk
dihitung nilai probabilitas dari setiap data dengan berdasarkan data training.
4. Jumlah feature yang digunakan yakni 5 feature yaitu rasio pembayaran, total
pemakaian, total pemakaian per limit, total pemakaian retail, rasio
pembayaran per 6 bulan.
5. Data akan dibagi menjadi data training dan data testing dengan menggunakan
6. menggunakan cross validation yaitu k-fold validation. Percobaan yang
dilakukan menggunakan 3 jenis k-fold. Data akan dibagi sesuai dengan
jumlah k, dengan jumlah data yang sama rata. Data yang sudah dibagi nanti
akan menjadi data testing dan data training. Setiap percobaan akan mengambil
1 data testing dan data yang lain akan digunakan sebagai data training.
Berikut ini adalah contoh perhitungan untuk mencari nilai probabilitas dari setiap
data, data testing yang akan dihitung dilambangkan dengan X.
Tabel 3.6 Data nasabah sesudah di preprocessing digunakan dalam percobaan.
X A1 A2 A3 A4 A5 Kelas
1 0.209366
0.052108
0.047524576
0.047525
0.433893
0
14 0.208193
0.052108
0.047524291
0.047524
0.43343
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
34
X A1 A2 A3 A4 A5 Kelas
5 0.209295
0.060977
0.055612927
0.055613
0.434063
0
2 0.208193
0.052111
0.047527361
0.047527
0.433332
0
19 0.208298
0.052108 0.047524291
0.047524
0.433388
1
4 0.209341
0.060545
0.0552189
0.055219
0.43352
0
24 0.208193
0.052108 0.047524291
0.047524
0.433388
1
3 0.209341
0.052108
0.047524291
0.047524
0.434082
0
43 0.208676
0.052108 0.051467662
0.051468
0.433895
1
38 0.208193
0.052108
0.120795
0.047524
0.433332
0
Keterangan :
A1= Rasio pembayaran
A2 = Tabel pemakaian
A3 = Total pemakaian per limit
A4 = Total Pemakaian.
A5 =Rasio pembayaran per 3 bulan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
35
Berdasarkan pada tabel memperlihatkan data training dengan atribut jumlah kartu,
outstanding, limit kredit, tagihan, total pemakaian, total pemakaian tunai , total
pemakaian tunai , total pemakaian retail , sisa tagihan tidak dibayar, kode cabang,
rasio pembayaran, presentasi overlimit, nomer pelanggan, ultilisasi 3 bulan,
pemakaian 3 bulan per limit , rasio pembayaran per 3 bulan, utilisasi 6 bulan, rasio
pembayaran 6 bulan, skor pembayaran, sisa tagihan per jumlah kartu, sisa tagihan per
limit, total pemakaian per limit, jumlah tahun sejak pembukaan kredit sedangkan
atribut kelas adalah nasabah yang berpotensi terkena kredit macet dan tidak macet.
Berikut ini adalah penyelesaian contoh kasus menggunakan algoritma Naïve Bayes.
Terdapat dua kelas dari klasifikasi yang terbentuk :
1 : Macet
0 : Tidak Macet
Langkah – Langkah perhitungan sebagai berikut :
a. Menghitung mean dan standar deviasi untuk setiap data atribut.
Menghitung Mean atau nilai rata – rata menggunakan rumus sebagai
berikut : Nilai rata – rata =
………… (3.15)
Sementara untuk menghitung nilai standar deviasi setiap atribut dengan
rumus :
S = √ ( )
……………(3.16)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
Berikut merupakan hasil dari nilai mean dan standar deviasi dari setiap atribut
sesuai dengan persamaan pada 3.16 :
Tabel 3.7Hasil Mean & Standar Deviasi Total Pemakaian
Total pemakaian Macet Tidak
Mean 0.04831 0.05068
Standar Deviasi 0.00197 0.00407
Tabel 3.8 Jumlah Mean & Standar Deviasi Total Pemakaian per limit
Total Pemakaian Tunai Macet Tidak
Mean 0.13114
0.13314
Standar Deviasi 0.02070
0.02105
Tabel 3.9 Jumlah Mean & Standar Deviasi Total Pemakaian Retail
Total Pemakaian
Retail
Macet Tidak
Mean 0.05210
0.05549
Standar Deviasi 0
0.00446
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
Tabel 3.10 Jumlah Mean & Standar Deviasi Rasio Pembayaran
Rasio pembayaran Macet Tidak
Mean 0.20834
0.20911
Standar Deviasi 0.0002
0.000512
Tabel 3.11 Jumlah Mean & Standar Deviasi Rasio Pembayaran Per 3 Bulan
Rasio pembayaran per
6 bulan
Macet Tidak
Mean 0.43349
0.43378
Standar Deviasi 0.00026
0.00033
b. Menghitung probabilitas kategori kelas untuk variabel jumlah kartu untuk setiap
kategori itu sendiri. Tabel berikut menunjukkan probabilitas variabel setiap jumlah
kartu pada kategori kelas. Sedangkan tabel selanjutnya yakni menunjukkan
probabilitas untuk setiap kategori pada kelas.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
Tabel 3.12 Probabilitas jumlah kartu
Tabel Probabilitas Jumlah Kartu
Jumlah Kartu Probabilitas Jumlah Kartu
Jumlah
Kartu
Macet Tidak
Macet
Macet Tidak Macet
2 3 3 3/4 3/6
3 1 2 1/4 2/6
4 0 1 0/4 1/6
Jumlah 4 6 1 1
Tabel 3.13 Probabilitas setiap kelas
Jumlah Kelas Probabilitas Kelas
Jumlah Macet Tidak
Macet
Macet Tidak Macet
4 6 4/10 6/10
c. Menghitung probabilitas setiap katagori kelas dengan acuan nilai mean dan standar
deviasi pada halaman 36 dan 37 untuk setiap atributnya, apabila di berikan data baru
sebagai berikut : Misalkan seorang nasabah yang memiliki jumlah kartu 3 , tagihan
0.002006018, total pemakaian 0.008852531, , total pemakaian retail 0.017051153,
total pemakaian per limit 0.036745324, total pemakaian 0.097085453, rasio
pembayaran per 3 bulan 0.433924 dan rasio pembayaran 0.2081920 . Dengan
rumus sebagai berikut :
P (Xi = xi |Y = yj )= =
√ ( )
( ) ……….(3.17)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
Untuk rasio pembayaran = 0.2081920. Berdasarkan Persamaan (3)
sebagai berikut :
P(rasio pembayaran = 0.20819203| Kelas = Macet )
=
√ ( ) )
( ) = 831.0985144
P(rasio pembayaran = 0.20819203|| Kelas = Tidak Macet )
=
√ ( ) ( )
( ) = 236.8627312
Untuk total pemakaian retail = 0.01705113. Berdasarkan
Persamaan (3) sebagai berikut :
P(total pemakaian retail =0.01705113|Kelas = Macet )
=
√ ( ) ( )
( ) = 0
P(total pemakaian retail= 0.01705113|Kelas = Tidak Macet )
=
√ ( ) ( )
( ) = 0.18307
Untuk total pemakaian per limit = 0.01705113. Berdasarkan
Persamaan (3) sebagai berikut :
P(Total pemakaian per limit = 0.0367| Kelas = Macet )
=
√ ( ) ( )
( ) = 0.000584
P(Total Pemakaian per Limit = 0.0367| Kelas = Tidak Macet Macet )
=
√ ( ) ( )
( ) = 0.000525
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
Untuk total pemakaian = 0.0970. Berdasarkan Persamaan (3)
sebagai berikut :
P(Total Pemakaian = 0.0970| Kelas = Macet )
=
√ ( ) ( )
( ) = 0.2082
P(Total Pemakaian =0.0970 | Kelas =Tidak Macet )
=
√ ( ) ( )
( ) = 0.93519
Untuk rasio pembayaran per 3 bulan = 0.4339. Berdasarkan
Persamaan (3) sebagai berikut :
P(Rasio pembayaran per 3 bulan = 0.4339| Kelas = Macet )
=
√ ( ) ( )
( ) = 603.376
P(Rasio Pembayaran per 3 bulan = 0.4339 | Kelas = Tidak Macet )
=
√ ( ) ( )
( ) = 1176.4
d. Menghitung nilai likelihood. Menghitung nilai likelihood ini menggunakan hasil
dari nilai perhitungan probabilitas. Nilai likelihood dibagi menjadi 2 yakni
likelihood macet dan likelihood tidak macet.
Likehood Macet
P(rasio pembayaran) x P(total pemakaian retail) x P(total pemakaian per limit) x
P(total pemakaian) x P(rasio pembayaran per 3 bulan)
= (831.098)*(0)*(0.000584)*(481.066)*(0.2082)*(0.25)*(0.4) = 0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
41
Likehood Tidak macet
P(rasio pembayaran) x P(total pemakaian retail) x P(total pemakaian per limit) x
P(total pemakaian) x P(rasio pembayaran per 3 bulan)
= (0.18307)*(0.00055)*(1035.632)*(0.9351)*(0.19307)*(0.333)*(0.6) = 0.26495
e. Mencari nilai probabilitas dengan melakukan normalisasi terhadap likehood tersebut
sehingga jumlah nilai yang diperoleh = 1.
Probabilitas Macet =
Probabilitas Tidak Macet =
Dari hasil tersebut, terlihat bahwa nilai probabilitas tertinggi ada pada kelas
tidak macet dimana hasil nilai dari kelas tersebut yakni 1 dapat disimpulkan nasabah
yang memiliki jumlah kartu 3 masuk pada kelas kredit tidak macet.
3.5 Akurasi
Setelah dilakukan proses pembentukan modeling, maka selanjutnya dilakukan
proses menghitung akurasi dengan menggunakan confusion matrix, yakni dengan
menjumlahkan data yang benar dan membaginya dengan semua data yang benar
maupun yang salah dan kemudian dikalikan dengan 100%.
Tabel 3.14 Contoh Hasil Confusion Matrix
Kelas Macet Tidak Macet
Macet A B
Tidak Macet C D
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
Berdasarkan Tabel 3.4 diatas, jumlah akurasi dari setiao percobaan dapat
dihitung menggunakan rumus akurasi sebagai berikut :
Jumlah data yang memprediksi secara benar yakni data yang terletak pada
garis diagonal yaitu data data A+D. jumlah prediksi yang dilakukan adalah jumlah
semua hasil perhitungan confusion matrix yakni A+B+C+D. Setelah itu akurasi dapat
dikalikan dengan 100%
3.6 Desain User Interface.
Untuk mempermudah dalam melakukan tahap klasifikasi pada penelitian ini
dibuart user interface. User interface dibuat untuk membantu dalam proses
preprocessing , proses klasifikasi dan proses hasil akurasi. Berikut ini merupakan
halaman utama dalam penelitian ini :
Gambar 3.4 Halaman Utama
Pada halaman user interface terdapat 3 macam proses, yang pertama yakni
process preprocessing. Process preprocessing yakni dimana user menginputkan file
data yang akan diolah. Terdapat text box jumlah ciri, sebelum melakukan
preprocessing user diharuskan menginput jumlah ciri yang akan digunaka. Jika user
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
43
telah menginputkan jumlah ciri yang diinputkan maka selanjutnya melakukan proses
preprocessing.
Bagian kedua yakni proses klasifikasi, jika data sudah di preprocessing akan
masuk ke tahap klasifikasi. Dimana pada bagian ini data akan di proses menggunakan
model yang telah dibuat dan akan menghasilkan akurasi dari sistem tersebut. Bagian
ketiga yakni uji data tunggal. Pada bagian ini user akan menginput data yang sudah
dinormalisasi sebelumnya untuk mengetahui apakah data tersebut masuk ke dalam
kelompok kredit macet atau tidak macet.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
44
BAB IV
HASIL DAN ANALISIS
Pada bab ini akan di bahas hal – hal yang berkaitan dengan hasil implementasi sistem
hasil yang didapatkan dari pengujian – pengujian yang dilakukan serta analisis dari
suatu dari hasil pengujian.
4.1 Analisis Hasil
Berdasarkan hasil pengujian yang dilakukan dengan menggunakan klasifikasi
Naïve Bayes telah dilakukan proses sebelumnya yakni seleksi atribut. Seleksi atribut
ini dilakukan dengan menggunakan Weka Tool 3.8.2 dengan menggunakan
menggunakan Info gain dengan hasil sebagai berikut .
Tabel 4.15 Hasil perangkingan atribut data nasabah
Rangking
Attribut / fitur
1 RasioPembayaran
2 Total Pemakaian Retail
3 Total Pemakaianperlimit
4 Total Pemakaian
5 RasioPembayaran Per 3 Bulan
6 Utilisasi per 3 bulan
7 Tagihan
8 Outstanding
9 Sisatagihan per limit
10 Sisatagihantidakterbayar.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
45
Rangking
Attribut / fitur
11 Sisatagihan per jumlahkartu.
12 Utilisasi per 6 bulan.
13 Rasiopembayaran per 6 bulan.
14 Pemakain 3 bulan per limit.
15 Presentasi over limit.
16 Pemakaian 6 bulan per limit.
17 Jumlahtahunsejakpembukaankredit
18 Jumlahkartu
19 Limit kredit
20 Total pemakaiantunai
21 Skordelikuensi
22 X
Berdasarkan tabel 4. 15 diatas dapat dilakukan pengujian sebanyak 23 kali
yang dilakukan dengan menggunakan klasifikasi Naïve Bayes dan dengan
menggunakan k-fold validation didapat hasil akurasi seperti tabel 4.15 berikut ini.
Tabel 4.16 Tabel Hasil Percobaan
Jumlah Atribut Akurasi
1 8.792%
2 32.034%
3 46.0534%
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
46
Jumlah Atribut Akurasi
4 57.2468%
5 77.2819%
6 76.4049%
7 71.8703%
8 58.2213%
9 58.0069%
10 45.9884%
11 29.7993
12 27.5970%
13 34.6911%
14 34.8730%
15 25.0309%
16 23.5237%
17 23.7121%
18 22.0425%
19 22.0620%
20 20.7627%
21 23.2638%
22 8.7962%
23 8.7962 %
Tabel 4.16 merupakan tabel hasil akurasi dari semua percobaan yang
dilakukan sebanyak dua puluh tiga kali. Dari dua puluh tiga pengujian dengan jumlah
feature yang digunakan berbeda dan dengan jumlah fold yang sama didapatkan hasil
klasifikasi dan hasil akurasi yang berbeda. Hasil akurasi 77.28 % dengan hanya
menggunakan 5 feature yakni Rasio Pembayaran, Total Pemakaian Retail, Total
Pemakaian Per Limit, Total Pemakaian, Rasio Pembayaran Per 3 Bulan sedangkan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
47
untuk akurasi paling rendah 8.79% yang menggunakan jumlah 1atribut yakni Rasio
pembayaran , 22 feature yakni Rasio Pembayaran, Total Pemakaian Retail, Total
Pemakaian Per Limit, Total Pemakaian, Rasio Pembayaran Per 3 Bulan, Utilisasi Per
3 Bulan, Tagihan, Outstanding, Sisa Tagihan Per Limit, Sisa Tagihan Tidak Terbayar,
Sisa Tagihan per Jumlah Kartu, Utilisasi Per 6 Bulan, Rasio Pembayaran Per 6 Bulan,
Pemakaian 3 Bulan Per Limit, Presentasi Overlimit, Pemakaian 6 Bulan Per Limit,
Jumlah Tahun Sejak Pembukaan Kredit, Jumlah Kartu, Limit Kredit, Total
Pemakaian Tunai, dan 23 feature yakni Rasio Pembayaran, Total Pemakaian Retail,
Total Pemakaian Per Limit, Total Pemakaian, Rasio Pembayaran Per 3 Bulan,
Utilisasi Per 3 Bulan, Tagihan, Outstanding, Sisa Tagihan Per Limit, Sisa Tagihan
Tidak Terbayar, Sisa Tagihan per Jumlah Kartu, Utilisasi Per 6 Bulan, Rasio
Pembayaran Per 6 Bulan, Pemakaian 3 Bulan Per Limit, Presentasi Overlimit,
Pemakaian 6 Bulan Per Limit, Jumlah Tahun Sejak Pembukaan Kredit, Jumlah Kartu,
Limit Kredit, Total Pemakaian Tunai,Skor delikuensi, X. Grafik hasil rata- rata
akurasi pengujian ditunjukkan melalui gambar 4.5 dibawah ini :
Gambar 4.5 Grafik Akurasi Rata – Rata
0
10
20
30
40
50
60
70
80
90
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
Aku
rasi
Jumlah Feature
Akurasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
48
Gambar 4.6 Tabel confusion matrix
Gambar 4.5 merupakan grafik akurasi rata – rata. Percobaan dilakukan dengan
menggunakan feature/atribut yang berbeda. Setiap atribut akan dilakukan percobaan
dengan 3 fold dirata – rata untuk mencari nilai maksimal dari percobaan berdasarkan
feature/atribut. Berdasarkan hasil rata – rata akurasi terbesar adalah 77.2819%
dengan melakukan 23 kali percobaan menggunakan 5 feature/atribut yakni rasio
pembayaran , total pemakaian retail, total pemakaian limit, total pemakaian, rasio
pembayaran per 6 bulan. Sedangkan untuk akurasi terkecil yakni 8.79. % dengan 1,
yakni rasio pembayaran , untuk 22 feature yakni Rasio Pembayaran, Total Pemakaian
Retail, Total Pemakaian Per Limit, Total Pemakaian, Rasio Pembayaran Per 3 Bulan,
Utilisasi Per 3 Bulan, Tagihan, Outstanding, Sisa Tagihan Per Limit, Sisa Tagihan
Tidak Terbayar, Sisa Tagihan per Jumlah Kartu, Utilisasi Per 6 Bulan, Rasio
Pembayaran Per 6 Bulan, Pemakaian 3 Bulan Per Limit, Presentasi Overlimit,
Pemakaian 6 Bulan Per Limit, Jumlah Tahun Sejak Pembukaan Kredit, Jumlah Kartu,
Limit Kredit, Total Pemakaian Tunai, sementara untuk 23 feature/atribut yakni Rasio
Pembayaran, Total Pemakaian Retail, Total Pemakaian Per Limit, Total Pemakaian,
Rasio Pembayaran Per 3 Bulan, Utilisasi Per 3 Bulan, Tagihan, Outstanding, Sisa
Tagihan Per Limit, Sisa Tagihan Tidak Terbayar, Sisa Tagihan per Jumlah Kartu,
Utilisasi Per 6 Bulan, Rasio Pembayaran Per 6 Bulan, Pemakaian 3 Bulan Per Limit,
Presentasi Overlimit, Pemakaian 6 Bulan Per Limit, Jumlah Tahun Sejak Pembukaan
Kredit, Jumlah Kartu, Limit Kredit, Total Pemakaian Tunai,Skor delikuensi, X. Hal
ini dikarenakan penggunaan jumlah atribut yang digunakan dan hasil perangkingan
atribut untuk proses klasifikasi sangat berpengaruh terhadap hasil klasifikasi dan
akurasi sistem. Dalam hal ini untuk mengetahui apakah seseorang itu dapat terkena
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
49
kredit macet tidak hanya dilihat dari rasio pembayaran tagihannya saja melainkan
harus melihat dari sisi pemakaian sehari – hari, dilihat dari pemakaian yang melebihi
limit atau tidak serta melihat rasio pembayaran per 6 bulan juga, hal ini dapat dilihat
dari hasil akurasi rata – rata dengan feature/atribut rasio pembayaran , total
pemakaian retail, total pemakaian limit, total pemakaian, rasio pembayaran per 6
bulan dengan menghasilkan 77.2819% merupakan akurasi tertinggi dalam penelitian
ini. 1..
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
50
BAB V
PENUTUP
5.1 Kesimpulan
Dari hasil penelitian ini, dengan menggunakan metode Naïve Bayes untuk
melakukan proses klasifikasi data nasabah berpotensi terkena kredit macet dalam
pembayaran tagihan kartu kredit, dapat diambil kesimpulan sebagai berikut :
1. Penggunaan jumlah atribut yang digunakan dan hasil perangkingan atribut
untuk proses klasifikasi sangat berpengaruh terhadap hasil klasifikasi dan
akurasi sistem. Pada percobaan ini dengan menggunakan 5 atribut dapat
menghasilkan hasil akurasi sistem yang optimal yakni 77.2819%.
2. Dari pengujian sebanyak 23 kali dihasilkan akurasi rata- rata terbaik sebesar
77.2819 % dengan hanya menggunakan 5 feature atau atribut data yakni rasio
pembayaran , total pemakaian retail, total pemakaian limit, total pemakaian,
rasio pembayaran per 6 bulan. Rata – rata akurasi terendah sebesar 8.792 %
dengan hanya menggunakan 1 feature data yakni rasio pembayaran ,, 22
feature data yakni Rasio Pembayaran, Total Pemakaian Retail, Total
Pemakaian Per Limit, Total Pemakaian, Rasio Pembayaran Per 3 Bulan,
Utilisasi Per 3 Bulan, Tagihan, Outstanding, Sisa Tagihan Per Limit, Sisa
Tagihan Tidak Terbayar, Sisa Tagihan per Jumlah Kartu, Utilisasi Per 6
Bulan, Rasio Pembayaran Per 6 Bulan, Pemakaian 3 Bulan Per Limit,
Presentasi Overlimit, Pemakaian 6 Bulan Per Limit, Jumlah Tahun Sejak
Pembukaan Kredit, Jumlah Kartu, Limit Kredit, Total Pemakaian Tunai dan
23 feature data yakni Rasio Pembayaran, Total Pemakaian Retail, Total
Pemakaian Per Limit, Total Pemakaian, Rasio Pembayaran Per 3 Bulan,
Utilisasi Per 3 Bulan, Tagihan, Outstanding, Sisa Tagihan Per Limit, Sisa
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
51
Tagihan Tidak Terbayar, Sisa Tagihan per Jumlah Kartu, Utilisasi Per 6
Bulan, Rasio Pembayaran Per 6 Bulan, Pemakaian 3 Bulan Per Limit,
Presentasi Overlimit, Pemakaian 6 Bulan Per Limit, Jumlah Tahun Sejak
Pembukaan Kredit, Jumlah Kartu, Limit Kredit, Total Pemakaian Tunai,Skor
delikuensi
5.2 Saran
Saran untuk penelitian akhir ini adalah :
1. Sistem ini dapat dikembangkan dengan menggunakan metode yang lain.
2. Pemilihan atribut pada sistem ini dapat dikembangkan dengan metode lain
3. Hasil klasifikasi dampat dikembangkan dalam bentuk penampilan grafik pada
user interface.
4. Program dapat menerima masukan file bertipe lain, tidak hanya tipe file xls.
5. Uji data tunggal dapat dikembangkan dengan masukkan file.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
52
DAFTAR PUSTAKA
Han, J., et al. (2012). Data Mining : Concepts and Techniques 3rd
Edition. San
Fransisco : Morgan Kaufmann Publishers
Kusrini dan Luthfi, E.T.(2009). Algoritma Data Mining. Yogyakarta: ANDI.
Ariasih dkk. 2011. Pengantar Data Mining. Program Studi Magister Teknik
Elektro, Universitas Udayana. Denpasar.
Buaton Relita. 2014. 15 Metode Menyelesaikan Data Mining, Sistem Pakar dan
Sistem Pendukung Keputusan. STMIK Kaputama. Sumatera Utara.
Prasetyo, E. (2014) Data Mining : Mengolah data Menjadi Informasi Menggunakan
Matlab. Yogyakarta : Andi
Herawati, F.A. (2013) Data Mining. Yogyakarta : Andi.
Khasanah Imroatul. 2013. Sistem Prosedur Pemberian Kredit Modal Kerja Dalam
Upaya Meminimalisir Tunggakan Kredit. Jurnal. Fakultas Ilmu Administrasi.
Universitas Brawijaya.
Septiawanti, Sinta. 2018. Penerapan Algoritma Case Based Reasoning Pada Prediksi
Nasabah Berpotensi Membuka Simpanan Deposito. Jurnal. Teknik Informatika.
Universitas Sanata Dharma.
Bustami., 2013, Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Data
Nasabah Asuransi, TECHSI : Jurnal Penelitian Teknik Informatika, Vol. 3, No.2, Hal.
127-146.
Pattekari, S. A., Parveen, A., 2012, Prediction System for Heart Disease Using Naive
Bayes, International Journal of Advanced Computer and Mathematical Sciences,
ISSN 2230-9624, Vol. 3, No 3, Hal 290-294.
Abdullah, Sigit 2013. Penerapan Algoritma Decision Tree C4.5 Untuk Diagnosa
Penyakit Stroke Dengan Klasifikasi Data Mining Pada Rumah Sakit Santa Maria
Pemalang. Semarang.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
53
Wahyuni & Pranoto. (2013). Pelayanan dan Orientasi Pelanggan Terhadap
Loyalitas dengan Kepuasan Sebagai Variabel Intervening pada Pengguna Kartu
Kredit BCA. E-Jurnal Manajemen dan Bisnis. Vol. 1 (1): 1-23.
Mudrajad Kuncoro & Suhardjono (2002). Manajemen Perbankan : Teori dan Aplikasi
. BPFE. Yogyakarta.
Kusumadewi, Sri.2003.Klasifikasi Status Gizi Menggunakan Naïve Bayes
Classification. Jurnal. Teknik Informatika. Universitas Islam Indonesia.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
54
LAMPIRAN
Tabel Penjelasan hasil akurasi.
No Jumlah Atribut Nama atribut yang
digunakan Hasil Akurasi
1 1 - Rasio Pembayaran. 8.792%
2 2 - Rasio Pembayaran.
- Total Pemakaian Retail.
32.034%
3 3 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
46.0534%
4 4 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
57.2468%
5 5 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan
77.2819%
6 6 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
76.4049%
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
55
7 7 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
71.8703%
8 8 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding
58.2213%
9 9 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
58.0069%
10 10 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
- Sisa tagihan tidak
45.9884%
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
56
terbayar.
11 11 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
- Sisa tagihan tidak
terbayar.
- Sisa tagihan per jumlah
kartu.
29.7993
12 12 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
- Sisa tagihan tidak
terbayar.
- Sisa tagihan per jumlah
kartu.
- Utilisasi per 6 bulan.
27.5970%
13 13 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
34.6911%
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
57
- Sisa tagihan per limit.
- Sisa tagihan tidak
terbayar.
- Sisa tagihan per jumlah
kartu.
- Utilisasi per 6 bulan.
- Rasio pembayaran per 6
bulan.
14 14 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
- Sisa tagihan tidak
terbayar.
- Sisa tagihan per jumlah
kartu.
- Utilisasi per 6 bulan.
- Rasio pembayaran per 6
bulan.
- Pemakaian 3 bulan per
limit.
34.8730%
15 15 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
- Sisa tagihan tidak
terbayar.
- Sisa tagihan per jumlah
25.0309%
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
58
kartu.
- Utilisasi per 6 bulan.
- Rasio pembayaran per 6
bulan.
- Pemakaian 3 bulan per
limit.
- Presentasi overlimit.
16 16 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
- Sisa tagihan tidak
terbayar.
- Sisa tagihan per jumlah
kartu.
- Utilisasi per 6 bulan.
- Rasio pembayaran per 6
bulan.
- Pemakaian 3 bulan per
limit.
- Presentasi overlimit.
- Pemakaian 6 bulan per
limit.
23.5237%
17 17 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
23.7121%
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
59
- Sisa tagihan tidak
terbayar.
- Sisa tagihan per jumlah
kartu.
- Utilisasi per 6 bulan.
- Rasio pembayaran per 6
bulan.
- Pemakaian 3 bulan per
limit.
- Presentasi overlimit.
- Pemakaian 6 bulan per
limit.
- Jumlah tahun sejak
pembukaan akhir.
18 18 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
- Sisa tagihan tidak
terbayar.
- Sisa tagihan per jumlah
kartu.
- Utilisasi per 6 bulan.
- Rasio pembayaran per 6
bulan.
- Pemakaian 3 bulan per
limit.
- Presentasi overlimit.
- Pemakaian 6 bulan per
limit.
- Jumlah tahun sejak
pembukaan akhir.
- Jumlah kartu.
22.0425%
19 19 - Rasio Pembayaran.
- Total Pemakaian Retail.
22.0620%
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
60
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
- Sisa tagihan tidak
terbayar.
- Sisa tagihan per jumlah
kartu.
- Utilisasi per 6 bulan.
- Rasio pembayaran per 6
bulan.
- Pemakaian 3 bulan per
limit.
- Presentasi overlimit.
- Pemakaian 6 bulan per
limit.
- Jumlah tahun sejak
pembukaan akhir.
- Jumlah kartu.
- Limit kredit.
20 20 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
- Sisa tagihan tidak
terbayar.
- Sisa tagihan per jumlah
kartu.
- Utilisasi per 6 bulan.
- Rasio pembayaran per 6
20.7627%
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
61
bulan.
- Pemakaian 3 bulan per
limit.
- Presentasi overlimit.
- Pemakaian 6 bulan per
limit.
- Jumlah tahun sejak
pembukaan akhir.
- Jumlah kartu.
- Limit kredit.
- Total pemakaian tunai.
21 21 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
- Sisa tagihan tidak
terbayar.
- Sisa tagihan per jumlah
kartu.
- Utilisasi per 6 bulan.
- Rasio pembayaran per 6
bulan.
- Pemakaian 3 bulan per
limit.
- Presentasi overlimit.
- Pemakaian 6 bulan per
limit.
- Jumlah tahun sejak
pembukaan akhir.
- Jumlah kartu.
- Limit kredit.
- Total pemakaian
tunai.
- Skordelikuensi.
23.2638%
22 22 - Rasio Pembayaran. 8.7962%
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
62
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
- Sisa tagihan tidak
terbayar.
- Sisa tagihan per jumlah
kartu.
- Utilisasi per 6 bulan.
- Rasio pembayaran per 6
bulan.
- Pemakaian 3 bulan per
limit.
- Presentasi overlimit.
- Pemakaian 6 bulan per
limit.
- Jumlah tahun sejak
pembukaan akhir.
- Jumlah kartu.
- Limit kredit.
- Total pemakaian
tunai.
- Skordelikuensi.
- Kode cabang
23 23 - Rasio Pembayaran.
- Total Pemakaian Retail.
- Total Pemakaian Per
Limit.
- Total Pemakaian.
- Rasio Pembayaran per 3
bulan.
- Utilisasi per 3 bulan.
- Tagihan.
- Outstanding.
- Sisa tagihan per limit.
- Sisa tagihan tidak
8.7962 %
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
63
terbayar.
- Sisa tagihan per jumlah
kartu.
- Utilisasi per 6 bulan.
- Rasio pembayaran per 6
bulan.
- Pemakaian 3 bulan per
limit.
- Presentasi overlimit.
- Pemakaian 6 bulan per
limit.
- Jumlah tahun sejak
pembukaan akhir.
- Jumlah kartu.
- Limit kredit.
- Total pemakaian
tunai.
- Skordelikuensi.
- Kode cabang.
- X.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
64
Source code program.
1. Potongan.m clear;clc; %hasil perangkingan info gain rating =
[10,7,19,16,12,22,5,3,18,8,17,23,13,20,11,21,15,4,2,6,14,9,1]; Data = xlsread('normalisasi2.xls'); %memilih atribut yang akan digunakan jumlahciri = 5; if jumlahciri > size(rating,2)-1 jumlahciri = size(rating,2); end
for i=1:jumlahciri if i==1 Datapakai = Data(:,rating(i)); else Datapakai = [Datapakai,Data(:,rating(i))]; end end %menyimpan model Datapakai = [Datapakai,Data(:,24)]; save 'DataBaru2.mat' 'Datapakai';
2. Normal.m %Baca data data=xlsread('transformasi.xls'); out=data(:,3); limit=data(:,4); tagihan=data(:,5); pemakai=data(:,6); pakaire=data(:,7); sisa=data(:,8); kode=data(:,9); over=data(:,10); rasio=data(:,11); jenis=data(:,12); lamat=data(:,13); geni=data(:,14); heni=data(:,15); totpakai=data(:,16); sisatag=data(:,17); gagi=data(:,18); gusi=data(:,19); hidup=data(:,20);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
65
ty=data(:,21); hg=data(:,22); jh=data(:,23); %proses normalisasi out=Min_Max(out); limit=Min_Max(limit); tagihan=Min_Max(tagihan); pemakai=Min_Max(pemakai); pakaire=Min_Max(pakaire); sisa=Min_Max(sisa); kode=Min_Max(kode); over=Min_Max(over); rasio=Min_Max(rasio); jenis=Min_Max(jenis); lamat=Min_Max(lamat); geni=Min_Max(geni); heni=Min_Max(heni); totpakai=Min_Max(totpakai); sisatag=Min_Max(sisatag); gagi=Min_Max(gagi); gusi=Min_Max(gusi); hidup=Min_Max(hidup); ty=Min_Max(ty); hg=Min_Max(hg); jh=Min_Max(jh); [m,n]=size(out); norm_data=zeros(m,3);
%memanggil kembali data yang tidak dinormalisasi for i=1:m norm_data(i,3)=out(i); norm_data(i,4)=limit(i); norm_data(i,5)=tagihan(i); norm_data(i,6)=pemakai(i); norm_data(i,7)=pakaire(i); norm_data(i,8)=sisa(i); norm_data(i,9)=kode(i); norm_data(i,10)=over(i); norm_data(i,11)=rasio(i); norm_data(i,12)=jenis(i); norm_data(i,13)=lamat(i); norm_data(i,14)=geni(i); norm_data(i,15)=heni(i); norm_data(i,16)=totpakai(i); norm_data(i,17)=sisatag(i); norm_data(i,18)=gagi(i); norm_data(i,19)=gusi(i); norm_data(i,20)=hidup(i); norm_data(i,21)=ty(i); norm_data(i,22)=hg(i); norm_data(i,23)=jh(i); end
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
66
norm_data(:,1) = data(:,1); norm_data(:,2) = data(:,2); norm_data(:,24) = data(:,24); xlswrite('normalisasi2.xls',norm_data,1);
3. NaiveC.m function output = naiveC(DataTr,LabelTr,DataTs) kelas = [1,0]; Yes = find(LabelTr(:) == 1); No = find(LabelTr(:) == 0);
%nilai prior prob_yes = length(Yes)/length(LabelTr); prob_no = length(No)/length(LabelTr); prob = [prob_yes, prob_no];
% nilai likehood for i=1:length(kelas(1,:)) mn(i,:) = mean(DataTr(LabelTr == kelas(1,i),:)); st_dev(i,:) = std(DataTr(LabelTr == kelas(1,i),:)); end
% nilai posterior for j=1:size(kelas,2) likelihood = normpdf(DataTs, mn(j,:), st_dev(j,:)); posterior(j) = prod(likelihood)*prob(j); end
if posterior(1) > posterior(2) output = 0; else output= 1; end end
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
67
4. YukCoba.m
Data = Datapakai; ukurandata= size(Data,2); X = Data(:,1:ukurandata-1); Y = Data(:,ukurandata); jumdata = size(X);
range = jumdata(1)/3;
kel1 = X(1:range,:); kel2 = X(range+1:range*2,:); kel3 = X(range*2+1:jumdata(1),:);
DataTr1 = [kel2;kel3]; DataTs1 = kel1;
DataTr2 = [kel1;kel3]; DataTs2 = kel2;
DataTr3 = [kel1;kel2]; DataTs3 = kel3;
Lkel1 = Y(1:range); Lkel2 = Y(range+1:range*2); Lkel3 = Y(range*2+1:jumdata(1));
LabelTr1 = [Lkel2;Lkel3]; LabelTs1= Lkel1;
LabelTr2 = [Lkel1;Lkel3]; LabelTs2 = Lkel2;
LabelTr3= [Lkel1;Lkel2]; LabelTs3 = Lkel3;
%Model = fitcnb(DataTr,LabelTr);
for i=1:size(DataTs1,1) hasil(i,1) = naiveC(DataTr1,LabelTr1,DataTs1(i,:)); end
cf1 = confusionmat(hasil,LabelTs1); output1 = (sum(diag(cf1))/sum(sum(cf1)))*100; set(handles.uitable9,'data',cf1); set(handles.text7,'String',['Akurasi : '
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
68
num2str(output1) '%']); for i=1:size(DataTs2,1) hasil(i,1) = naiveC(DataTr2,LabelTr2,DataTs2(i,:));
end
cf2 = confusionmat(hasil,LabelTs2); output2 = (sum(diag(cf2))/sum(sum(cf2)))*100; set(handles.text8,'String',['Akurasi : '
num2str(output2) '%']); set(handles.uitable8,'data',cf2); for i=1:size(DataTs3,1) hasil(i,1) = naiveC(DataTr3,LabelTr3,DataTs3(i,:)); end
cf3 = confusionmat(hasil,LabelTs3); output3 = (sum(diag(cf3))/sum(sum(cf3)))*100;
set(handles.uitable7,'data',cf3); set(handles.text9,'String',['Akurasi : ' num2str(output3)
'%']);
akurasi = (output1+output2+output3)/3;
5. Gui.m
function varargout = gui(varargin) % GUI MATLAB code for gui.fig % GUI, by itself, creates a new GUI or raises the existing % singleton*. % % H = GUI returns the handle to a new GUI or the handle to % the existing singleton*. % % GUI('CALLBACK',hObject,eventData,handles,...) calls the
local % function named CALLBACK in GUI.M with the given input
arguments. % % GUI('Property','Value',...) creates a new GUI or raises
the % existing singleton*. Starting from the left, property
value pairs are % applied to the GUI before gui_OpeningFcn gets called. An % unrecognized property name or invalid value makes property
application % stop. All inputs are passed to gui_OpeningFcn via
varargin. % % *See GUI Options on GUIDE's Tools menu. Choose "GUI
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
69
allows only one % instance to run (singleton)". % % See also: GUIDE, GUIDATA, GUIHANDLES
% Edit the above text to modify the response to help gui
% Last Modified by GUIDE v2.5 10-Jun-2019 16:41:09
% Begin initialization code - DO NOT EDIT gui_Singleton = 1; gui_State = struct('gui_Name', mfilename, ... 'gui_Singleton', gui_Singleton, ... 'gui_OpeningFcn', @gui_OpeningFcn, ... 'gui_OutputFcn', @gui_OutputFcn, ... 'gui_LayoutFcn', [] , ... 'gui_Callback', []); if nargin && ischar(varargin{1}) gui_State.gui_Callback = str2func(varargin{1}); end
if nargout [varargout{1:nargout}] = gui_mainfcn(gui_State, varargin{:}); else gui_mainfcn(gui_State, varargin{:}); end % End initialization code - DO NOT EDIT
% eventdata reserved - to be defined in a future version of
MATLAB % handles structure with handles and user data (see GUIDATA)
% Get default command line output from handles structure varargout{1} = handles.output;
% --- Executes on button press in togglebutton1. function togglebutton1_Callback(hObject, eventdata, handles) % hObject handle to togglebutton1 (see GCBO) % eventdata reserved - to be defined in a future version of
MATLAB % handles structure with handles and user data (see GUIDATA) % Hint: get(hObject,'Value') returns toggle state of
togglebutton1 [filename,filepath]=uigetfile([{'*.xls','XLS
Only'};{'*.xlsx','XLSX Only'}],'Select Data File'); global data; data=xlsread(strcat(filepath,filename)); set(handles.uitable4,'data',data);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
70
% --- Executes on button press in togglebutton2. function togglebutton2_Callback(hObject, eventdata, handles) % hObject handle to togglebutton2 (see GCBO) % eventdata reserved - to be defined in a future version of
MATLAB % handles structure with handles and user data (see GUIDATA) % Hint: get(hObject,'Value') returns toggle state of
togglebutton2 global Datapakai; Data = Datapakai; ukurandata= size(Data,2); X = Data(:,1:ukurandata-1); Y = Data(:,ukurandata); jumdata = size(X);
range = jumdata(1)/3;
kel1 = X(1:range,:); kel2 = X(range+1:range*2,:); kel3 = X(range*2+1:jumdata(1),:);
DataTr1 = [kel2;kel3]; DataTs1 = kel1;
DataTr2 = [kel1;kel3]; DataTs2 = kel2;
DataTr3 = [kel1;kel2]; DataTs3 = kel3;
Lkel1 = Y(1:range); Lkel2 = Y(range+1:range*2); Lkel3 = Y(range*2+1:jumdata(1));
LabelTr1 = [Lkel2;Lkel3]; LabelTs1= Lkel1;
LabelTr2 = [Lkel1;Lkel3]; LabelTs2 = Lkel2;
LabelTr3= [Lkel1;Lkel2]; LabelTs3 = Lkel3;
%Model = fitcnb(DataTr,LabelTr);
for i=1:size(DataTs1,1) hasil(i,1) = naiveC(DataTr1,LabelTr1,DataTs1(i,:)); end
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
71
cf1 = confusionmat(hasil,LabelTs1); output1 = (sum(diag(cf1))/sum(sum(cf1)))*100; set(handles.uitable9,'data',cf1); set(handles.text7,'String',['Akurasi : ' num2str(output1) '%']); for i=1:size(DataTs2,1) hasil(i,1) = naiveC(DataTr2,LabelTr2,DataTs2(i,:)); end
cf2 = confusionmat(hasil,LabelTs2); output2 = (sum(diag(cf2))/sum(sum(cf2)))*100; set(handles.text8,'String',['Akurasi : ' num2str(output2) '%']); set(handles.uitable8,'data',cf2); for i=1:size(DataTs3,1) hasil(i,1) = naiveC(DataTr3,LabelTr3,DataTs3(i,:)); end
cf3 = confusionmat(hasil,LabelTs3); output3 = (sum(diag(cf3))/sum(sum(cf3)))*100; set(handles.uitable7,'data',cf3); set(handles.text9,'String',['Akurasi : ' num2str(output3) '%']);
akurasi = (output1+output2+output3)/3;
set(handles.text39,'String',['Akurasi rata-rata : '
num2str(akurasi) '%']); % --- Executes on button press in togglebutton4. function togglebutton4_Callback(hObject, eventdata, handles) % hObject handle to togglebutton4 (see GCBO) % eventdata reserved - to be defined in a future version of
MATLAB % handles structure with handles and user data (see GUIDATA)
% Hint: get(hObject,'Value') returns toggle state of
togglebutton4
function edit1_Callback(hObject, eventdata, handles) % hObject handle to edit1 (see GCBO) % eventdata reserved - to be defined in a future version of
MATLAB % handles structure with handles and user data (see GUIDATA)
% Hints: get(hObject,'String') returns contents of edit1 as text % str2double(get(hObject,'String')) returns contents of
edit1 as a double
% --- Executes during object creation, after setting all
properties.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
72
function edit1_CreateFcn(hObject, eventdata, handles) % hObject handle to edit1 (see GCBO) % eventdata reserved - to be defined in a future version of
MATLAB % handles empty - handles not created until after all
CreateFcns called
% Hint: edit controls usually have a white background on Windows. % See ISPC and COMPUTER. if ispc && isequal(get(hObject,'BackgroundColor'),
get(0,'defaultUicontrolBackgroundColor')) set(hObject,'BackgroundColor','white'); end
% --- Executes on button press in pushbutton1. function pushbutton1_Callback(hObject, eventdata, handles) % hObject handle to pushbutton1 (see GCBO) % eventdata reserved - to be defined in a future version of
MATLAB % handles structure with handles and user data (see GUIDATA) global data; out=data(:,3); limit=data(:,4); tagihan=data(:,5); pemakai=data(:,6); pakaire=data(:,7); sisa=data(:,8); kode=data(:,9); over=data(:,10); rasio=data(:,11); jenis=data(:,12); lamat=data(:,13); geni=data(:,14); heni=data(:,15); totpakai=data(:,16); sisatag=data(:,17); gagi=data(:,18); gusi=data(:,19); hidup=data(:,20); ty=data(:,21); hg=data(:,22); jh=data(:,23); out=Min_Max(out); limit=Min_Max(limit); tagihan=Min_Max(tagihan); pemakai=Min_Max(pemakai); pakaire=Min_Max(pakaire); sisa=Min_Max(sisa); kode=Min_Max(kode); over=Min_Max(over);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
73
rasio=Min_Max(rasio); jenis=Min_Max(jenis); lamat=Min_Max(lamat); geni=Min_Max(geni); heni=Min_Max(heni); totpakai=Min_Max(totpakai); sisatag=Min_Max(sisatag); gagi=Min_Max(gagi); gusi=Min_Max(gusi); hidup=Min_Max(hidup); ty=Min_Max(ty); hg=Min_Max(hg); jh=Min_Max(jh); [m,n]=size(out); norm_data=zeros(m,3);
for i=1:m norm_data(i,3)=out(i); norm_data(i,4)=limit(i); norm_data(i,5)=tagihan(i); norm_data(i,6)=pemakai(i); norm_data(i,7)=pakaire(i); norm_data(i,8)=sisa(i); norm_data(i,9)=kode(i); norm_data(i,10)=over(i); norm_data(i,11)=rasio(i); norm_data(i,12)=jenis(i); norm_data(i,13)=lamat(i); norm_data(i,14)=geni(i); norm_data(i,15)=heni(i); norm_data(i,16)=totpakai(i); norm_data(i,17)=sisatag(i); norm_data(i,18)=gagi(i); norm_data(i,19)=gusi(i); norm_data(i,20)=hidup(i); norm_data(i,21)=ty(i); norm_data(i,22)=hg(i); norm_data(i,23)=jh(i); end norm_data(:,1) = data(:,1); norm_data(:,2) = data(:,2); norm_data(:,24) = data(:,24);
rating =
[10,7,19,16,12,22,5,3,18,8,17,23,13,20,11,21,15,4,2,6,14,9,1]; jumlahciri = str2num(get(handles.edit5,'String')); if jumlahciri > size(rating,2)-1 jumlahciri = size(rating,2); end global Datapakai; disp(jumlahciri);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
74
for i=1:jumlahciri if i==1 Datapakai = norm_data(:,rating(i)); else Datapakai = [Datapakai,norm_data(:,rating(i))]; end end Datapakai = [Datapakai,norm_data(:,24)]; % disp(size(Datapakai)) set(handles.uitable1,'data',Datapakai);
function edit7_Callback(hObject, eventdata, handles) % hObject handle to edit7 (see GCBO) % eventdata reserved - to be defined in a future version of
MATLAB % handles structure with handles and user data (see GUIDATA)
properties. function edit32_CreateFcn(hObject, eventdata, handles) % hObject handle to edit32 (see GCBO) % eventdata reserved - to be defined in a future version of
MATLAB % handles empty - handles not created until after all
CreateFcns called
% Hint: edit controls usually have a white background on Windows. % See ISPC and COMPUTER. if ispc && isequal(get(hObject,'BackgroundColor'),
get(0,'defaultUicontrolBackgroundColor')) set(hObject,'BackgroundColor','white'); end
% --- Executes on button press in pushbutton2. function pushbutton2_Callback(hObject, eventdata, handles) % hObject handle to pushbutton2 (see GCBO) % eventdata reserved - to be defined in a future version of
MATLAB % handles structure with handles and user data (see GUIDATA) input1 = str2num(get(handles.edit23,'String')); input2 = str2num(get(handles.edit13,'String')); input3 = str2num(get(handles.edit32,'String')); input4 = str2num(get(handles.edit28,'String')); input5 = str2num(get(handles.edit26,'String'));
inputan = [input1,input2,input3,input4,input5]; load DataTr3; load LabelTr3; hasil = naiveC(DataTr3,LabelTr3,inputan);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
75
if hasil==1 set(handles.text38,'String','Yes'); else set(handles.text38,'String','No'); end % disp(inputan);
function edit36_Callback(hObject, eventdata, handles)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI