analisa data potensi karyawan untuk menentukan bonus tahunan ...
-
Upload
khangminh22 -
Category
Documents
-
view
1 -
download
0
Transcript of analisa data potensi karyawan untuk menentukan bonus tahunan ...
1
ANALISA DATA POTENSI KARYAWAN UNTUK
MENENTUKAN BONUS TAHUNAN
DENGAN ALGORITMA C4.5
SKRIPSI
Disusun Oleh :
MUHAMMAD TONO SUHANDOKO
311410453
PROGRAM STUDI TEKNIK INFORMARIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
ii
PERSETUJUAN
SKRIPSI
ANALISA DATA POTENSI KARYAWAN UNTUK
MENENTUKAN BONUS TAHUNAN
DENGAN ALGORITMA C4.5
Yang disusun oleh :
MUHAMMAD TONO SUHANDOKO
311410453
Telah disetujui oleh dosen pembimbing skripsi
pada tanggal ________________
iii
PENGESAHAN
SKRIPSI
ANALISA DATA POTENSI KARYAWAN UNTUK
MENENTUKAN BONUS TAHUNAN
DENGAN ALGORITMA C4.5
Yang disusun oleh :
MUHAMMAD TONO SUHANDOKO
311410453
Telah dipertahankan di depan Dewan Penguji
pada tanggal ________________
Susunan Dewan Penguji
Penguji 1 Penguji 2
Drs.Muhtajuddin Danny.S,Kom.M,Kom Ikhsan Romli.S,Si.M,Sc
NIDN : 0401056703 NIDN : 0413058603
Mengetahui
Kaprodi Teknik Informatika Ketua STT Pelita Bangsa
Aswan S. Sunge. S.E, M.Kom Dr.Ir. Supriyanto, M.P
NIDN : 0426018003 NIDN : 0401066605
iv
SURAT PERNYATAAN KEASLIAN SKRIPSI
Yang bertanda tangan dibawah ini :
Nama : Muhammad Tono Suhandoko
NIM : 311410453
Perguruan Tinggi : STT Pelita Bangsa
Program Studi : Teknik Informatika
Alamat Kampus : Jl. Inspeksi Kalimalang β Tegal Danas
Cikarang Selatan,Bekasi-jawa Barat 17530
Alamat Rumah : Kp.Cibeber RT/RW 001/005 Desa Simpangan
Cikarang Utara Jawa Barat
Dengan ini menyatakan bahwa skripsi yang telah saya buat dengan judul
βANALISA DATA POTENSI KARYAWAN UNTUK MENENTUKAN BONUS
TAHUNAN DENGAN ALGORITMA C4.5β adalah asli (orisinil) atau tidak plagiat
(menjiplak) dan belum pernah diterbitkan/dipublikasikan dimanapun dan dalam
bentuk apapun. Demikianlah surat pernyataan ini saya buat dengan sebenar-
benarnya tanpa ada paksaan dari pihak manapun. Apabila dikemudian hari ternyata
saya memberikan keterangan palsu dana tau ada pihak lain yang mengklaim skripsi
yang telah saya buat adalah hasil karya milik seseorang atau badan tertentu,saya
bersedia diproses baik secara pidana maupun perdata dan kelulusan saya dari
Sekolah Tinggi Teknologi Pelita Bangsa dicabut/dibatalkan.
Bekasi, November 2018
Yang meyatakan,
(Muhammad Tono Suhandoko)
v
ABSTRAK
Penerapan algoritma C4.5, dapat digunakan dalam menganalisa pegawai yang layak
atau tidaknya untuk menerima bonus tahunan ini berdasarkan kriteria yang telah
ditetapkan yang akan menghasilkan suatu pohon keputusan, dari pohon keputusan
inilah, akan diambil pengetahuan-pengetahuan baru berupa rules atau aturan-aturan
yang akan dijadikan pola keputusan. Oleh karena itu untuk menentukan karyawan
yang layak menerima bonus tahunan.dengan perhitungan klasifikasi algoritma C4.5
ini sekiranya bisa mempermudah dalam menentukan keputusan yang tepat dan
dengan hasil perhitungan secara manual ataupun menggunakan rapidminer
persentasenya cukup besar dan akurat.dengan adanya perhitungan ini sehingga bisa
dikembangkan lagi dengan pembuatan aplikasi yang sederhahana sehingga bisa
membantu pekerjaan agar lebih singkat dan akurat.Dengan adanya perhitungan
penelitian ini sekiranya bisa mempermudah dalam pengenbangan aplikasi yang bisa
berguna untuk kedepanya, algoritma C4.5 adalah sebuah metode perhitungan yang
cukup akurat, dan dengan itu penggunaanya sangat kompleks.
Kata Kunci : Bonus Tahunan Pegawai, Algoritma C4.5
vi
ABSTRACT
The application of the C4.5 algorithm, can be used to analyze employees who are
eligible or not to receive this annual bonus based on predetermined criteria that
will produce a decision tree, from this decision tree, new knowledge will be taken
in the form of rules or rules that will be made a decision pattern. Therefore, to
determine employees who deserve annual bonuses, with the classification
calculation of the C4.5 algorithm, if it can facilitate in determining the right
decisions and with the results of manual calculations or using rapidminer the
percentage is quite large and accurate. again by making simple applications so that
it can help work to be shorter and more accurate.With the calculation of this
research if it can make it easier in the application development that can be useful
for the future, the C4.5 algorithm is a fairly accurate calculation method, and with
that the use is very complex.
Keywords: Employee Annual Bonus, C4.5 Algorithm
vii
KATA PENGANTAR
Puji dan syukur kehadirat Tuhan Yang Maha Kuasa atas segala rahmat dan
karunia-Nya kepada penulis, serta kepada semua pihak yang telah turut dalam
membantu penyelesaian penulisan untuk laporan skripsi ini. Penulis memberi judul
ANALISA DATA POTENSI KARYAWAN UNTUK MENENTUKAN BONUS
TAHUNAN DENGAN ALGORITMA C4.5 Maksud dari penulisan ini adalah untuk
memenuhi persyaratan untuk dan sebagai syarat ujian untuk gelar sarjana computer.
Penulis sadar bahwa penulisan laporan ini masih jauh dari kesempurnaan , baik
secara alamiah maupun secara tehnik, oleh karena itu penulis sangat mengharapkan
adanya kritikan dan saran yang bersifat membangun, sebagai bahan pertimbangan
bagi penulis di masa mendatang.
Selama penelitian dan dalam menyelesaikan laporan ini, penulis telah
banyak menerima bimbingan, pengarahan, petunjuk, dan saran, serta fasilitas yang
membantu hingga akhir dari penulisan laporan ini. Untuk itu penulis
menyampaikan ucapan terima kasih yang sebesar-besarnya kepada :
1. Bapak Dr. Ir. Supriyanto, M.P, selaku ketua STT Pelita Bangsa.
2. Bapak Aswan S. Sunge, S.E., M.Kom, selaku ketua program studi Teknik
Informatika STT Pelita Bangsa.
3. Bapak M Fatchan, S.Kom.,M.Kom, selaku Dosen Pembimbing 1
4. Ibu Putri Anggun Sari,S.Pt.,M.Si. selaku Dosen Pembimbing 2
5. Kepada seluruh Dosen, staf dan karyawan prodi Teknik Informatika Sekolah
Tinggi Teknologi Pelita Bangsa
viii
6. Kepada kedua orang tua saya yang tercinta, dan keluarga kecilku yang ayah
cintai.serta kakak dan adikku yang selalu mendoakan demi keberhasilan, dan
telah memberikan dukungan baik moril maupun material yang tidak terhitung
jumlahnya.
7. Untuk semua teman-teman di TI.14.E.3 yang telah membantu saya dalam
menyusun laporan skripsi ini serta kepada semua pihak yang telah memberikan
dukungannya yang tidak dapat disebutkan satu persatu sehingga penelitian ini
dapat diselesaikan.
8. Untuk semua teman-teman perantauan yang ada di Cikarang ini, yang
senantiasa selalu men-support dan mengingatkan saya agar cepat
menyelesaikan skripsi ini.
Akhirnya semoga Allah SWT memberikan balasan pahala kebaikkan atas
segala bantuan yang telah diberikan kepada penulis. Penulis berharap semoga
lapran ini bermanfaat bagi semua pihak yang membantu,meskipun dalam laporan
ini masih banyak kekurangan. Oleh karena itu, kritik dan saran yang membangun
tetap penulis harapkan.
Cikarang, November 2018
Penulis
(Muhammad Tono Suhandoko)
ix
DAFTAR ISI
Halaman Judul ...................................................................................................... i
Persetujuan ........................................................................................................... ii
Pengesahan .......................................................................................................... iii
Surat Pernyataan Keaslian Skripsi ................................................................... iv
Abstraksi ................................................................................................................ v
Abstract ................................................................................................................. vi
Kata Pengantar .................................................................................................. vii
Daftar isi .............................................................................................................. xii
Daftar Tabel ......................................................................................................... xv
Daftar Gambar .................................................................................................. xvi
BAB I PENDAHULUAN ............................................................................................. 1
1.1 Latar Belakang Masalah ................................................................................ 1
1.2 Identifikasi dan Pembatasan masalah ........................................................... 2
1.2.1 Identifikasi Masalah ........................................................................ 2
1.2.2 Pembatasan Masalah ...................................................................... 3
1.3 Rumusan Masalah ........................................................................................... 3
1.4 Tujuan Penelitian ............................................................................................ 3
1.5 Manfaat Penelitian .......................................................................................... 3
1.5.1Bagi Mahasiswa ............................................................................... 4
1.5.2 Bagi Program Study teknik Informatika .......................................... 4
1.5.3 Bagi Perusahaan .................................................................................... 4
1.6 Sistematika Penulisan ..................................................................................... 5
BAB II TINJAUAN PUSTAKA ........................................................................... 6
2.1 Definisi Judul .............................................................................................. 6
2.1.1 Pengertian Karyawan ...................................................................... 6
2.1.2 Pengertian Bonus ............................................................................ 7
x
2.1.3 Pengertian Data mining.................................................................. 8
2.1.4 Teknik Klasifikasil ....................................................................... 21
2.1.5 Pohon Keputusan ......................................................................... 22
2.1.6 algoritma C4.5 ............................................................................. 24
2.2 Pemograman Web...................................................................................... 26
2.2.1 Pengertian Web.............................................................................. 26
2.2.2 HyperText Markup Language (HTML) ........................................ 26
2.2.3 PHP (Hypertext Preprocesseor) .................................................... 27
2.2.4 CSS (Cascading Style Sheet) ........................................................ 27
2.3 Metode Dan Teknik Pengembangan Sistem ............................................. 28
2.3.1 Metode Pengembangan Sistem .................................................... 28
2.3.2 Teknik Pengembangan Sistem ..................................................... 30
2.4 Rapid Miner .............................................................................................. 35
BAB III METODE PENELITIAN .................................................................... 37
3.1 Tinjauan Organisasi/Objek Penelitian ....................................................... 37
3.1.1 Sejarah .......................................................................................... 37
3.1.2 Visi Misi ....................................................................................... 37
3.1.3 Struktur Organisasi ...................................................................... 38
3.2 Metode Penelitian...................................................................................... 38
3.3 Metode Pengumpulan Data ....................................................................... 40
3.4 Pengolahan Data Awal .............................................................................. 41
3.5 Metode Yang Diusulkan ........................................................................... 45
3.6 Kerangka Pemikiran .................................................................................. 45
3.7 Pengembangan Sistem .............................................................................. 47
3.5.1 Pemodelan Sistem ......................................................................... 47
3.5.2 Perencanaan (Planning) ................................................................ 51
3.5.3 Analisis (Analysis) ........................................................................ 51
3.5.4 Desain (Design) ............................................................................. 51
BAB IV HASIL DAN PEMBAHASAN ............................................................ 53
4.1 Hasil Penelitian ......................................................................................... 53
4.1.1 Jumlah Kasus data KeseluruhanData Training,data Testing......... 53
xi
4.2 Pembahasan ............................................................................................... 55
4.2.1 Pohon Keputusan Berdasarkan Entropy dan Gain ...................... 55
4.2.2 Perhitungan Menggunakan RapidMiner ....................................... 73
4.2.3 User Interface Prediksi ............................................................... 78
BAB V PENUTUP ............................................................................................... 80
5.1 Kesimpulan ............................................................................................... 80
5.2 Saran .......................................................................................................... 80
Daftar Pustaka ....................................................................................................... 81
Lampiran ............................................................................................................... 83
xii
DAFTAR TABEL
Tabel 3.1 Atribut data karyawan PT Indonusa ..................................................... 41
Tabel 3.2 Atribut Yang Tidak Digunakan............................................................. 42
Tabel 3.3. Atribut Yang Digunakan ...................................................................... 42
Tabel 3.4 Skenario Use Case Diagram ................................................................. 47
Tabel 4.1 Data Testing .......................................................................................... 53
Tabel 4.2 Jumlah Nilai Atribut Data Keseluruhan Tabel ...................................... 54
Tabel 4.3 Hasil Perhitungan Entropy Dan Gain Node 1 ...................................... 61
Tabel 4.4 Jumlah Kasus Data Raining Atribut Hasil Pekerjaan Nilai Cukup ... 62
Tabel 4.5 Hasil Perhitungan Entropy dan Gain Node Hasil Perkerjaan Cukup ... 66
Tabel 4.6 Hasil Perhitungan Entropy Dan Gain Node 1.1.2 ................................ 70
Tabel 4.7 Hasil Perhitungan Entropy Dn Gain Node 1.1.2.3 ............................... 72
xiii
DAFTAR GAMBAR
Gambar 2.1 Bidang Ilmu Data Mining. ...................................................................9
Gambar 2.2 Tahapan KDD ....................................................................................11
Gambar 2.3 Fase Fase Pada SDLC ........................................................................29
Gambar 2.4 Model Waterfall .................................................................................30
Gambar 2.5 Notasi Use Case Diagram ..................................................................31
Gambar 2.6 Contoh Use Case Diagram ................................................................32
Gambar 2.7 Notasi Sequence Diagram ..................................................................32
Gambar 2.8 Contoh Sequence Diagram ................................................................33
Gambar 2.9 Notasi Activity Diagram .....................................................................33
Gambar 2.10 Contoh Activity Diagram .................................................................34
Gambar 2.11 Notasi Class Diagram ......................................................................34
Gambar 2.12 Contoh Class Diagram .....................................................................35
Gambar 2.13 Halaman Utama RapiMiner .............................................................36
Gambar 3.1 Struktur Organisasi .............................................................................38
Gambar 3.2 Tahap Penelitian .................................................................................39
Gambar 3.3 Langkah Pengujian Metode ................................................................45
Gambar 3.4 Kerangka Pemikiran ...........................................................................47
Gambar 3.7 Use Case Diagram .............................................................................48
Gambar 3.8 Activity Diagram Login ......................................................................49
Gambar 3.9 Activity Diagram Prediksi ..................................................................49
Gambar.3.10 Activity Diagram Logout ..................................................................50
Gambar 3.11 Sequence Diagram Login .................................................................50
Gambar 3.12 Sequence Diagram Prediksi .............................................................51
Gambar 3.13 Sequence Diagram Logout ...............................................................51
Gambar 3.14 Class Diagram ..................................................................................52
xiv
Gambar 3.15 Tampilan Halaman Login ................................................................53
Gambar 3.16 Tampilan Menu Utama ....................................................................53
Gambar 4.1 Pohon Keputusan Node 1 ...................................................................63
Gambar 4.2 Pohon Keputusan Node 1.1 ................................................................67
Gambar 4.3 Pohon Keputusan Node 1.1.2 .............................................................71
Gambar 4.4 Pohon Keputusan 1.1.2.3 ...................................................................74
Gambar 4.5 Halaman Utama RapidMiner 9.0 .......................................................75
Gambar 4.6 Kotak Dialog Select The Cell To Import ...........................................76
Gambar 4.7 Kotak Dialog Format Your Columns .................................................76
Gambar 4.8 Design Process ...................................................................................77
Gambar 4.9 Tabel Hasil Performance Vektor ........................................................77
Gambar 4.10 Tree View .........................................................................................78
Gambar 4.11 User Interface Halaman login ..........................................................79
Gambar 4.12 User Interface Halaman Prediksi .....................................................80
Gambar 4.13 Pengujian Menu Login .....................................................................80
Gambar 4.14 Pengujian Halaman Prediksi ........................................................... 81
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Seiring dengan berkembangnya teknologi penyimpanan data
berkembang pula kemampuan seseorang dalam mengumpulkan dan
mengelolah data, data yang terkumpul dan berukuran besar tersebut
merupakan aset yang dapat dimanfaatkan untuk dianalisis yang hasilnya
berupa pengetahuan atau informasi berharga untuk masa mendatang, tidak
hanya dunia bisnis namun instasi seperti perusahaan juga mengalami
penumpukan data.
Berbagai pihak berupaya untuk menguasai dan mengembangkan teknologi
dengan cara melakukan kegiatan penelitian maupun pengembangan, informasi juga
sudh dilakukan agar dapat menunjang kemajuan teknologi, trmasuk perusahaan-
perusahaan terus melakukan peningkatan terhadap teknologi didalam perusahaan
agar tetap mengikuti perkembangan zaman.
Berkembangnya sebuah perusahaan harus diimbangi dengan kualitas
sumber daya manusia, sumber daya manusia yang berkualitas di tandai dengan
kemampuaan setiap individu untuk menyelesaikan pekerjaan yang menjadi tanggng
jawabnya masing-masing, perusahaan juga akan memberkan apresiasi terhadap
karyawan yang berprestasi, tekun dan rajin agar dapat mamacu kinerja karyawan
yang lainya.
2
Karyawan merupakan salah satu sumber daya yang sangat penting dan di
perhitungkan di dalam menentukan keberhasilan perusahaan maupun unit kerja
yang ada di dalam perusahaan, perusahaan yang memiliki karyawan yang
berkualitas memungkin dengan mudah mengelola perusahaanya sehingga tujuan
yang telah ditetapkan akan tercapai. Upaya yang dapat dilakukan oleh perusahaan
terhadap karyawannya yang memiliki kualiatas serta integritas yang tinggi terhadap
perusahaan adalah dengan memberikan bonus tahunan kepada karyawan.
Dalam memberikan bonus tahunan perusahaan akan melakukan penilain
terhadap karyawanya, dalam menilai karyawan bukan hal yang mudah bila jumlah
karyawan terlalu banyak, hal ini akan membuat tim penilai menjadi kesulitan dalam
mengolah data maupun mendapatkan hasil yang maksimal, apalagi kriteria penilain
yang banyak akan membuat semua data karyawan harus dilihat dengan teliti dan
hati-hati.
Berdasarkan hal tersebut diatas penulis mengambil penelitian dengan judul
βANALISA DATA POTENSI KARYAWAN UNTUK MENENTUKAN BONUS
TAHUNAN DENGAN ALGORITMA C4.5β
1.2 Identifikasi Masalah dan Pembatasan masalah
1.2.1 Identifikasi Masalah
Melihat dari latar belakang masalah yang penulis kemukakan diatas maka
dapat diidentifikasikan masalah sebagai berikut:
1. Kesulitan dalam melihat suatu kinerja karyawan yang banyak dalam suatu
divisi.
3
2. Karyawan yang dinilai merupakan karyawan dalam satu bagian, karena
setiap bagian berbeda kriteria penilainnya.
3. Data penilaian belum akurat karena masih ada penilain karyawan yang
tidak obyektif dan tidak sesuai dengan performanya di lapangan.
1.2.2 Pembatasan Masalah
Pembahasan penelitian ini diusahakan tidak menyimpang dari apa yang
telah dirumuskan, oleh karena itu hanya membahas tentang:
1. Perhitungan bonus tahunan karyawan
2. Memilih mana yang masuk dalam kriteria penerimaan bonus tahuanant
3. Pengembangan analisa ini akan dititik beratkan pada penerapan metode data
mining dengan Algoritma C4.5
1.3 Rumusan Masalah
Berdasarkan pada latar belakang dan identifikasi masalah yang sudah
dikemukakan diatas, rumusan masalah pada penelitian ini adalah.
1. Bagaimana menentukan kriteria karyawan yang layak menerima bonus
tahunan?
2. Bagaimana memanfaatkan data mining dengan menggunakan algoritma
C4.5 dalam menganalisa kelayakan penerimaan bonus tahunan?
3. Bagaimana mempermudah tim penilaian dalam pengolahan data karyawan
untuk menentukan bnus tahunan?
1.4 Tujuan Penelitian
Tujuan yang hendak dicapai dalam penelitian ini adalah.
1. Untuk menentukan kriteria karyawan yang layak menerima bonus tahunan.
4
2. Membangun aplikasi sistem pendukung untuk menentukan kelayakan bonus
tahunan karyawan dengan metode algoritma C4.5.
3. Untuk memanfaatkan data mining dalam menentukan bonus tahunan
karyawan.
4. Mempermudah mengetahui cara untuk tim dalam menentukan bonus
tahunan karyawan.
1.5 Manfaat Penelitian
1.5.1 Bagi Mahasiswa
Mahasiswa dapat mengaplikasikan ilmu dan keterampilan yang diperoleh
selama di perkuliahan, dan untuk memenuhi salah satu syarat kelulusan
strata satu (S1) program studi teknik informatika sekolah tinggi teknologi
(STT) pelita bangsa Bekasi.
1.5.2 Bagi Program Study Teknik Informatika
Penelitian ini dapat memberikan informasi bagi peneliti atau calon peneliti
lain untuk menerapkanya kedalam system yang lebih luas dan lebih
kompleks atau sebagai bahan acuan yang dapat di kembangkan bagi
kemungkinan pengembang konsep dan materi lebih lanjut serta dapat
melengkapi referensi pustaka akademik.
1.5.3 Bagi Perusahaan
Mempermudah pihak perusahaan dalam mengambil keputusan untuk
menentukan karyawan yang layak dan tidak layak dalam penerimaan bonus
tahunan secara obyektif berdasarkan data yang ada. serta mempermudah
dalam mengambil penilaian terhadap karyawan.
5
1.6 Sistematika Penulisan
Agar lebih memahami laporan skripsi ini, maka laporan skripsi ini di
kelompoka kedalam beberapa sub bab pembahasan dan menggunakan sistematika
penyampaian sebagai berikut:
BAB I PENDAHULUAN
Menjelaskan mengenai uraian secara umum mengenai latar belakang
masalah, identifikasi masalahdan batasan masalah, rumusan masalah, tujuan
dan manfaat yang ingin dicapai dari penelitian ini serta sistematika
penulisan.
BAB II TINJAUAN PUSTAKA
Menjelaskan tentang teori yang melandasi penelitian algoritma C4.5 untuk
menentukan bonus tahunan karyawan. studi kasus ini untuk memberikan
contoh dalam penelitian.
BAB III METODE PENELITIAN
Menjelaskan tentang metode penelitian dari pengumpulan data eksperimen
dengan menguji data yang ada dengan menggunakan algoritma C4.5 yang
memprediksi seberapa besar bonus tahunan yang di peroleh oleh setiap
karyawan.
BAB IV HASIL DAN PEMBAHASAN
Menjelaskan dan manampilkan hasil prediksi dengan menggunkan
algoritma C4.5.
BAB V PENUTUP
Membahasan tentang kesimpulan dan saran dari penelitian selanjutnya.
6
BAB II
TINJAUAN PUSTAKA
2.1 Definisi Judul
2.1.1 Pengertian Karyawan
Menurut Budiharjo (2015:37) dalam jurnal yang berjudul βsystem
pengambilan keputusan untuk menentukan status karyawan kontrak menjadi
karyawan tetap menggunakan metode multifactor evaluation process (MFEP)β,
karyawan adalah asset utama perusahaaan yang menjadi perencana dan pelaku aktif
dari aktivitas organisasi. Karyawan adalah seorang pekerja yang bekerja dibawah
perintah orang lain dan mendapat kompensasi serata jaminan.
Menurut Prawironegoro dan Purwanti (2016:55), βkaryawan atau tenaga
kerja dalam hal ini adalah manusia yang bekerja dengan mendapatkan upah, oleh
sebab itu lazim disebut buruhβ. Terdapat dua jenis tenaga kerja yaitu tenaga kerja
intelektual (manajer dan staf) dan tenaga kerja fisik (buruh). Manajer dan staf pada
umumnya menerima gaji bulanan dan berbagai fasilitas yang manusiawi,
sedangkan buruh pada umumnya menerima upah jam-jaman, harian, mingguan, dan
borongan. Buruh adalah pelaksana, yaintu penggerak alat kerja untuk mencapai
sasaran kerja. Oleh sebab itu Ia lazim disebut kaum produsen, karena Ia yang
langsung menghasilkan komoditi.
Karyawan merupakan aset yang berharga bagi sebuah perusahaan dalam
mencapai tujuannya fokus utama manajemen sumber daya manusia (SDM) adalah
memberikan kontribusi atas suksesnya perusahaan agar produktifitas perusahaan
7
berjalan lancar diperlukan tenaga kerja atau karyawan yang sesuai dengan prinsip
βthe right man in the right placeβ sejalan dengan itu maka langkah awal yang
menjadi kunci utama yaitu proses rekrutmen dan seleksi untuk merekrut tenaga
kerja sesuai dengan kebutuhanny proses seleksi merupakan serangkaian langkah
kegiatan yang digunakan untuk memutuskan kandidat (calon karyawan) yang dapat
di tempatkan secara tepat saat ini di mana persaingan untuk mendapatkan pekerjaan
semakin kuat perusahaan sering kali mengalami kesulitan dalam menentukan
kandidat (Putra Hertanto Muhammad, 2014)
2.1.2 Pengertian Bonus
Menurut Mulyapradana (2016) βBonus adalah pendapatan tambahan yang
berfungsi sebagai pendorong semangat agar karyawan semakin bergairah dalam
meningkatkan prestasi kerja dan loyalitas pada perusahaanβ. Adapun tujuan
program bonus yang diberikan perusahaan, sebagai berikut:
a. Bagi Perusahaan
Tujuan pemberian bonus dimaksudkan untuk meningkatkan produksi dengan
cara mendorong karyawan agar bekerja disiplin dan memiliki semangat yang
lebih tinggi. Diharapkan dengan pemberian bonus ini dapat mencapai tujuan
dalam menghasilkan kualitas produksi yang lebih baik, meningkatkan
efektivitas dan efisiensi dalam penggunaan faktor produksi, serta mencegah
terjadinya turn over karyawan yang tinggi.
b. Bagi Karyawan
Dengan pemberian bonus dari perusahaan, diharapkan karyawan memperoleh
banyak keuntungan. Keuntungan yang merupakan komponen non-upah ini,
8
misalnya mendapatkan gaji yang lebih besar di akhir tahun, mendapat
dorongan untuk mengembangkan dirinya, berusaha bekerja dengan sebaik-
baiknya, dan loyalitas terhadap perusahaan.
2.1.3 Pengertian Data mining
Menurut fayyed (2017:1) yang terdapat dalam buku βdata minig untuk
klasifikasi dan klasterisasi dataβ, Data mining adalah langkah analisa terhadap
proses penemuan pengetahuan di dalam basis data atau knowledge discovery in
databases yang di singkat KDD.
Menurut Clifton (2017:1) dalam buku βData mining untuk klasifikasi dan
klasterisasi dataβ data mining merupakan gabungan sejumlah disiplin ilmu
computer, yang didefinisikan sebagai proses penemuan pola baru dari kumpulan-
kumpulan data sangat besar, meliputi metode-metode yang merupakan irisan dari
artificial intelligence, machine learning, statistics dan databases system.
Kemajuan luar biasa yang terus berlanjutdalam bidang data minng didorong
beberapa factor antara lain,
1. Pertumbuhan yang cepat dalam kumpulan data.
2. Penyimpanan data dalam warehouse data, sehingga perusahaaan memiliki
akses ke dalam database yang andal
3. Adanya peningkatan akses data melalu navigasi web dan internet.
4. Tekanan kompetisi bisnis untuk meningkatkan penguasaan pasar dalam
globalisasi ekonomi.
5. Perkembangan teknologi perangkat lunak untuk data minng (ketersedian
teknologi).
9
6. Perkembangan yang hebat dalm kemampuan komputasidan
pengembangan kapasitas media penyimpanan.
Dari definisi-definisi yang telah disampaikan, hal yang terpenting terkait
dengan data minig adalah:
1. Data mining nerupakan suatu proses otomatis terhadap data yang sudah
ada.
2. Tujuan data mining adalah mendapatkan hubungan atau pola yang
mungkin memberikan indekasi yang bermanfaat.
3. Data yag akan diproses berupa data yang sangat besar.
Gambar 2.1 Bidang Ilmu Data Mining.
Data mining bukanlah suatu bidang yang sama sekali baru. Salah satu
kesulitan untuk mendefiniskan data mining adalah kenyataan bahwa data mining
mewaris banyak aspek dan teknik dari idang-bidang imu yang sudah mapan
10
terlebih dahulu gambar 2.1 menunjukan bahwa data mining memiliki akar yang
panjang dari bidang ilmu seperti kecerdasan buatan (artificial intellegion),
machine learning, statistic, database, dan juga information retrieval
(pramudiono,2009)
A. Proses Data mining
Data mining merupakan salah satu dari rangkaian knowledge Discovery in
Database (KDD) knowledge Discovery in Database. Berhubungan denagan teknik
integrasi dan penemuan ilmia, interpretasi dan visualisasi dari pola-pola sejumlah
data. Serangkain proses tersebut memiliki tahap sebagai berikut (Azwanti,2018);
1. pembersihan data (untuk membuang data yang tidak konsisten dan noise)
2. integrasi data (penggabungan data dari beberapa sumber)
3. tranformasi data (data diubah menjadi bentuk yang sesuai untuk di-mining)
4. Aplikasi teknik Data mining, proses ekstrasi pola dari data yang ada.
5. Evaluasi pola yang ditemukan (proses interpretasi pola menjadi
pengetahuan yang dapat digunakan untuk mendukung pengambilan
keputusan).
6. Presentasi pengetahuan (dengan teknik visualisasi).
Langkah terakhir KDD adalah mempresentasikan pengetahuan dalam
bentuk yang mudah dipahami pengguna.
11
Gambar 2.2 Tahapan KDD
Cross-industry standard process for data mining (CRISP-DM) yang
dikembangkan tahun 1996 oleh analisis daribeberapa industry seperti Daimler
Chrysler, SPSS dan NCR. CRISS DM menyediakan standar proses data mining
sebagai strategi pemecahan masalah secara umum dari bisnis atau unit penelitian.
Enam fase CRISS-DM (Vulandari, 2017);
1 Fase Pemahaman Bisnis (business understanding phase)
a. Penentuan tujuan proyek dan kebutuhan secara detail dalam lingkup
bisnis atau unit penelitian secara keseluruhan.
b. Menerjemakan tjuan dan batasan menjdi formula dalam data mining
c. Menyiapkan strategi awal untuk mencapai tujuan.
2 Fase Pemahaman Data (Data understanding phase)
a. Mengumpulkan data
b. Menggunakan analisis penyelidikan data untuk mengenali lebih lanjut
data dan pencarian pengetahuan awal.
c. Mengevaluasi kualitas data
12
3 Fase Pengolahan Data (Data Preparation Phase)
a. Siapkan dari data awal, kumpulkan data yang akan digunakan untuk
fase berikutnya.
b. Pilih kasus dan variable yang ingin di analisis dan yang sesuai dengan
analisis yang akan dilakukan.
c. Lakukan perubuhan pada beberapa variable jika di butuhkan.
d. Siapkan data awal sehingga siap untuk perangkat pemodelan.
4 Fase Pemodelan (Modeling Phase)
a. Pilih dan aplikasikan teknik pemodelan yang sesuai.
b. Kalibrasi aturn model untuk meng optimalkan hasil.
c. Perlu di perhatikan bahwa beberapa teknik mungkin untuk digunakan
pada permasalan data mining yang sama.
d. Jika di perlukan, proses dapat kembali ke fase pengolahan data untuk
menjadi data kedalam bentuk yang sesuai dengan spesifikasi kebutuhan
teknik data mining tertentu.
5 Fase Evaluasi (Evaluation Phase)
a. Mengevaluasi satu atau lebih model yang digunakan dalam fase
pemodelan untuk mendapatkan kualitas dan efektifikas sebelum
disebarkan untu digunakan.
b. Menetapkan apakah terdapat model yang memenuhi tujuan pada fase
awal.
c. Menentukan apakah terdapat permasalah penting dari bisnis atau
penelitian yang tidak tertangani dengan baik.
13
d. Mengambil keputusan berkaitan dengan penggunaan hasil dari data
mining
6 Fase Penyebaran (deployment Phase)
a. Menggnakan model yang dihasilkan. Terbentuknya model tidak
menandakan terselesainya proyek.
b. Contoh sederhana penyebaran: pembuatan laporan.
c. Contoh komplek penyebaran: penerapan proses data mining secara
paralel pada departemen lain.
B. Pengelompokan Data mining
Berdasarkan fungsionalitas, tugas-tugas data minig bisa di kelompokan ke
dalam enam kelompok berikut ini, (Fayyad, 2017:3) dalam buku βdata mining
untuk klasifikasi dan klasterisasi dataβ:
1. Deskripsi
Terkadang penelitian dan analis secara sederhana ingin mencoba
mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat
dalam data sebagai contoh, petugas pengumpulan suara mungkin tidak
dapat menemukan ketarangan atau fakta bahwa siapa yang tidak cukup
professional akan sedikit didukung dalam dalam pemilihan presiden.
Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan
penjelasan untuk suatu pola atau kecenderungan.
2. Estimasi
Estimasi hamper sama dengan klasifikasi, kecuali table target estimasi
lebih kearah numarik daripada ke arah kategori. Model dibangun
14
menggunakan record lengkap dengan menyediakan nilai dari variebel target
sebagai nilai prediksi. Selanjutnya, pada peninjaauan berikutnya estimasi
nilai dari variebel target dibuat berdasarkan nilai variebel prediksi. Sebaga
contoh, akan dilakukan estimasi tekanan darah sistonik pada pasien rumah
sakit berdasrka umur pasien, jenis kelamin, indeks berat badan, dan level
sodium darah. Hubungan tekanan darah sistolik dan nilai variebel prediksi
dalam proses pembelajaran akan meng hasilkan model estimasi. Model
estimasi yang dihasilkan dapat digunakan untuk kasus baru lainya.
Contoh lain yaitu estimasi nilai indeks prestasi komulatif mahasiswa
program pasca sarjana dengan melihat nilai indeks prestsi mahasiswa
tersebut pada set mengikuti program sarjana.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali dalam
prediksi nilai dari hasil akan ada dimasa mendatang.
Contoh prediksi dalam bisnis dan penelitian adalah:
Prediksi harga beras dalam tiga bulan mendatang.
Prediksi persentase kenaikan kecelakan lalu lintas tahun depan jika
batas bawah kecepatan dinaikan.
Beberapa metode dan teknik yang digunakan dalm klasifikasi dan
estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.
15
4. Klasifikasi
Dalam klasifikasi terdapat target variebel kategori. Sebagai contoh,
penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu:
pendapatan tinggi, pendapatan sedang, dan pendapatan rendah.
Contoh lain klasifikasi dalam bisnis dan penelitian adalah:
Menentukan apakah suatu transaksi kartu kredit merupakan
transaksi yang curang atau bukan.
Memperkirakan apakah suatu pengajuan hipotek oleh nasabah
merupakan suatu kredik yang baik atau buruk.
Mendiagnosis penyakit seorang pasien untuk mendapatkan
termasuk kategori penyakit apa.
5. Pengklusteran
Pengklusteran merupakan pengkelompokan record, pengamatan,
atau memperhatikan dan membentuk kelas objek-objek yang memilik
kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan satu
dengan yang lainya dan memiliki tidak kemiripan dengan record-record
dalam kluster lain.
Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya
variebel target dalam pengklusteran. Pengklusteran tidak mencoba untuk
melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari varibel
target. Akan tetapi, algoritma pengklusteran mencoba untuk melakukan
pembagian terhadap keseluruhan data nmenjadi kelompok-kelompok yang
memiliki kemiripan (homogeny), yang mana kemiripan record dalam satu
16
kelompok akan bernilai maksimal sedangkan kemiripan dengan record
dalam kelompok lain akan bernilai minimal.
Contoh pengklusteran dalam bisnis dan penelitian adalah:
Mendapatkan kelompok-kelomok konsumen untuk target
pemasaran dari suatu produk bagi perusahaan yang tidak memiliki
dana pemasaran yang besar.
Untuk tujuan audit akuntasi, yaitu melakukan pemisahan terhadap
perilaku finansial dalam baik dan mencurigakan.
Melakuakn pengklusteran terhadap ekspresi dari gen, untuk
mendapatkan kemiripan perilaku dari gen dalam jumlah besar.
6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang
mencul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis
keranjang belanja.
Contoh asosiasi dalam bisnis dan penelitian adalah:
Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler
yang diharapkan untuk memberikan respon positif terhadap
penawaran upgrade layanan yang diberikan
Menemukan barang dalam supermarket yang di beli secara
bersamaan dan barang yang tidak pernah dibeli secara bersamaan.
17
C. Teknik pembelajaran Data mining
Teknik yang digunakan dalam data mining erat kaitanya dengan βpenemuanβ
(discovery) danβ pembelajaranβ (learning) yang terbagi dalam tiga metode utama
pembelajaran (Retno,2017) yaitu:
a. Supervised learning
Supervised learning adalah teknik yang paling banyak digunakan. Teknik
sama dengan βprograming by exampleβ. Teknik ini melibatatkan fase
pelatihan history yang karekter-karekternya dipetakan ke hasil-hasil yang
telah di ketahui diolah dalam algoritma data mining. Proses ini melatih
algoritma untuk mengenali variebel-variebel dan nilai-nilai kunci yang
nantinya akan digunakan sebagai dalam membuat perkiraan-perkiraan
ketika diberikan data baru.
b. Unsupervised learning
Teknik pembelajaran ini tidak melibatkan fase pelatihan seperti yang
terdapat pada supervised learning teknik tergantung pada penggunaan
algoritma yang mendeteksi semua pola, seperti associations dan sequences,
yang muncul dari kriteria penting yang spesifik dalam data masukan.
Pendekatan ini mengaah pada pembuatan banyak atuan (rule) yang
mengkarakterisasikan penemuan associations clusters, dan segments.
aturan-aturan ini kemudian dianalisis untuk menemukan hal-hal yang
penting.
18
c. Reinforcement learning
Teknik pembelajaran ini jarang digunakan dibandingkan dengan dua teknik
lainya, namun memiliki penerapan-penerapan yang terus dioptimalkan dari
waktu ke waktu dan memiliki control yang adaptif. tekni ini sangat
menyerupai kehidupan nyata yaitu seperti βon job trainingβ, dimana
seorang pekerja diberikan sekumpulan tugas yang membutuhkan
keputusan-keputusan. Pada beberapa titik waktu kelak diberikan penilaian
atas performance pekerja tersebut kemudian pekerja di minta mengevaluasi
keputusan-keputusan yang telah dibuatnya sehubungan dengan hasil
performance pada pekerja tersebut. reinfocement learning sangat tepat di
gunakan untuk menyelesaikan masalah-masalah yang sulit yang
bergantung pada waktu.
D. Kategori Data mining
Data mining di bagi menjadi dua kategori utama Han dan Kember (2006)
yaitu:
1. Prediktif
Tujuan dari tugas prediktif adalah untuk memprediksi nilai dari atribut
tertentu berdasarkan pada nilai-nilai atribut lain, atribut yang di prediksi
umumnya dikenal sebai target atau variebel tak bebas, sedangkan
atribut-atribut yang di gunakan untuk membuat prediksi di kenal sebagai
explanatory atau variebel bebas.
19
2. Deskriptif
Tujuan dari tugas deskriptis adalah untuk menurunkan pola-pola
(korelasi, trend, cluster, teritori, dan nomaly) yang meringkas hubungan
yang pokok dalam data. Tugas data mining deskriptif sering merupakan
penyelidikan dan sering kali memerlukan tekni post processing untuk
validasi dan penjelasan hasil.
E. Tranformasi Data
Tranformasi data adalah merupakan skala data kedalam bentuk lain
sehingga data memiliki distribusi yang diharapkan menurut vulandari (2017,5).
Setiap data dilakukan operasi matematika yang sama pada data aslinya. Berarti kita
merubah semua data untuk menjaga perbedaan antar data relative data tetap. Jika
data kita data tidak berubah. Ada bebrapa jenis tranformasi data yang sering
digunakan, diantaranya memiliki lebih dari satu variebel agar hubungan antar
1) Tranformasi kuadrat, berarti kita mengoperasikan pangkat dua data
variebel.
2) Tranformasi kubik, berarti kita mengoperasikan pangkat tiga pada data
variebel asli.
3) Tranformasi akar, berarti kita mengoperasikan akar pada data variabel asli.
Berguna untuk memperbaiki data yang terdistribusi positive skewnessdan
unequal varience (data tidak memenuhi asumsi kehomogennan). Dapat
digunakan data persentase, jika nilainya kebanyakan kecil maka sebaikny
gunakan tranformasi akar.
20
4) Tranformasi invers/kebalikan, melakukan operasi balikan baik balikan
pangkat atau tidak.
5) Tranformsi logaritma, berarti kita mengoperasikan data asli kebentuk
logaritma. Digunakan untu data yang terdistribusi positif skewness dan
unequal variance. Ada beberapa hal yang perlu di perhatikan. Jika pada data
asli menunjukan nilai kurang dari 10 atau mendekati nol, maka gunakan
log(x+1); jika data banyak mendekati nol seperti decimal, maka sebaiknya
dikalikan 10 lalu dilogaritmakan atau log((10x).
6) Tranformasi arcsin, berarti kita mengoperasikan data asli kebentuk arcsin
(balikan sinus). Disebut juga tranformasi angular yang digunakan bila data
dinyatakan dalam bentuk presentase atau proporsi. Biasanya memiliki
sebaran Binomial. Ada beberapa hal yang perlu diperhatikan, apabila data
asli memiliki nilai antara 30%-70% maka tidak membutuhkan tranformasi;
bila memiliki nilai 0%-30%70%-100% maka lakukan tranformasi arcsin
dan bila banyak bernilai nol maka gunakan tranformasi arcsin akar (%+0,5).
7) Tranformasi invers skor, digunakan dalam data yang terdapat nilai negative
dan akan menggunakan tranformasi berikutnya. Berguna untuk
memperbaiki data yang terdistribusi positif skewness dan unequal variance.
Pada umumnya untuk menentukan jenis tranformasi mana yang paling tepat
digunakan adalah dengan memplot data kita dan melihat trend dari data tersebut
atau berdasarkan histogram dari data tersebut vulandari (2017,5).
21
2.1.4 Teknik Klasifikasi
Menurut Vulandari (2017) Clasifiksion adalah sebuah model dalam data
mining dimana, classifier dikontruksi untuk memprediksi categorical label, seperti
βamanβ atau βberesikoβ untuk data aplikasi peminjaman uang; βyaβ atau βtidakβ
untuk data marketing; atau βtreatment Aβ,βtreatment Bβ atau βtreatment Cβ untuk
data medis. Kategori tersebut dapt direpresentasikan dengan nilai yang sesuai
dengan kebutuhanya, dimana pengaturan dari nilai tersebut tidak memiliki arti
tertentu.
Classification dan association rule discovery merupakan tugas yang sama
dalam data mining, dengan pengecualian bahwa tjuan utama dari klasifikasi adalah
prediksi label kelas, sedangkan asosiasi aturan penemuan menggambarkan kolerasi
antara item dalam database transaksional Vulandari (2017).
Proses data klasifikasi memiliki dua tahapan, yang pertama adalah learning:
yaitu training data dianalisa dengan menggunakan sebuah algoritma klasifikasi.
Yang kedua adalah classification: yaitu pada tahap ini test data digunakan untuk
mengestimasikan ketepan dari clarification rules. Jika keakuratan dikondisikan dan
yang diperkirakan dapat diterima, rele tersebut dapat di aplikasikan pada klasifiki
lainya dari tuple data yang baru. Vladimir Nikulin (2008) lebih spesifikasi
mengatakan bahwa, classification hanya bisa diterapkan pada data training yang
sangat kuat dimana diasumsikan bahwa kelas βpositifβ sudah mewakili minirotis
tanpa kehilangan atribut umum.
22
2.1.5 Pohon keputusan
Pohon dalam analisis pemecahan masalah pengambilan keputusan adalah
pemetaan mengena alternative-alternatif pemecahan masalah yang dapat diambil
dari masalah tersebut. Pohon tersebut juga memperlihatkan factor-faktor
kemungkinan/probablitas ang akan mempengaruhi alternative-alternatif keputusan
tersebut, disertai dengan estimasi hasil akhir yang akan didapat bila kita mengambil
alternative keputusan tersebut Vulandari (2017,14).
Pohon kputusan adalah salah satu metode klasifikasi yang paling popular
karena mudah untuk diinterpretasi oleh manusia. Pohon keputusan adalah model
prediksi menggunakan struktur pohon atau struktur berhirarki. Konsep dari pohon
keputusan dan aturan-aturan keputusan. Manfaat utama dari peggunaan pohon
keputsan adalah kemampuan untuk mem-break down proses pengambil keputusan
yang kompleks menjadi lebih simple sehingga pengambilan keputusan akan lebih
menginterpretasikan solusi dari permasalahan pohon keputusan juga berguna untuk
mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon
variebel input dengan sebuah variebel target. Pohon keputusan memadukan antara
eksplorasi data dan pemodelan, sehingga sangat bagus sebagai langkah awal dalam
proses pemodelan bahkan dijadikan sebagai model akhir dari beberapa teknik lain.
Sering terjadi tawar menawar antara keakuratan model dengan transparansi model.
Dalam beberapa aplikasi, akurasi dari sebuah klasifikasi atau prediksi adalah satu-
satunya hal yang ditonjolkan, misalnya sebuah perusahaan direct mail membuat
sebuah model yang akurat untuk memprediksi anggota mana yang berpontensi
23
untuk merespon permintaan, tanpa memperhatikan bagaimana atau mengapa model
tersebut bekerja Vulandari (2017,16).
1. Kelebihan Pohon keputusan
Kelebihan dari metod pohon keputusan adalah:
Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat
global, dapat diubah menjadi simpel dan spesifik.
Eliminasi perhitungan perhitungan yang tidak diperlukan, karena ketika
menggunakan metode pohon keputusan maka sample diuji hanya
berdasarkan kriteria atau kelas tertentu.
Fleksibel untuk memilih fitur dari internel node yang berbeda fitur yang
terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain
dalam node yang sama kefleksibelan metode pohon keputusan
ininmeningkatkan kualitas keputusan yang dihasilkan jika dibandingkan
ketika menggunakan metode penghitungan suatu tahap yang lebih
konvesional.
Dalam analisis multi variat, dengan kriterian dan kelas yang jumlahnya
sangat banyak seorang penguji biasanya perlu untuk mengestimasikan
baik itu distribusi dimensi tinggi ataupun parameter tertentu
daridistribusi kelas tersebut. Metode keputusan dapat menghindari
munculnya permasalahan ini dengan menggunakan kriteria yang jumlah
lebih sedikit pada setiap node internal tanpa banyak mengurangi kualitas
keputusan yang di hasilkan.
24
2. Kekurangan Pohon Keputusan
Terjadi overlap ketika kelas-kelas dan kriteria yang digunakan
jumlahnya sangat banyak. Hal tersebut juga dapat menyebabkan
meningkatnya waktu pengambilan keputusan dan jumlah memori yang
diperukan.
Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah pohon
keputusan yang besar.
Kesulitan dalam mendesain pohon keputusan yang optimal.
Hasil kualitas keputusan yang didapat dari metode pohon keputsan
sangat tergantung pada bagaimana pohon tersebut didesain.
2.1.6 Algoritma C4.5
Menurut Sukma Putri Utari (2015:3) Algoritma C4.5 merupakan algoritma
yang digunakan untuk membentuk pohon keputusan. Sedang pohon keputusan
dapat diartikan suatu cara untuk memprediksi atau mengklarifikasi yang sangat kuat.
Pohon keputusan dapat membagi kumpulan data yang besar menjadi himpunan-
himpunan record yang lebih kecil dengan menerapkan serangkaian aturan
keputusan.
Secara umum algoritma C4.5untuk membangun pohon keputusan adalah
sebagai berikut:
1. Pilih atribut sebagai akar
2. Buat cabang untuk masing-masing nilai
3. Bagi kasus dalam cabang
25
4. Ulangi proses untuk masing-masing cabangsampai semua kasus pada
cabang memiliki kelas yang sama.
5. Untuk memilih atribut sebagai akar, di dasarkan pada nilai gain tertinggi
dari atribut-atribut yang ada.
Dengan
S = himpunan kasus,
A = atribut,
n = jmlah partisi atribut
Ai|Si| = jumlah kasus pada partisi ke-I dan
|S |= jumlah kasus dalam S
Sedangkan perhitungan nilai entropy dapat di lihat pada rumus dua berikut:
πΈππ‘ππππ¦(π ) = β βππ β πππ2ππ
π
π=1
Dimana :
S : Himpunan kasus
A : Atribut
N : Jumlah partisi S
Pi : Proporsi dari Si terhadap S
1
| |,
| |
n
i
SiGain S A Entropy S Entropy Si
S
26
2.2 Pemograman WEB
2.2.1 Pengertian WEB
βDefinisi kata web adalah Web sebenarnya penyederhanaan dari sebuah
istilah dalam dunia komputer yaitu WORLD WIDE WEB yang merupakan bagian
dari tekhnologi Internet. World wide Web atau disingkat dengan nama www,
merupakan sebuah sistem jaringan berbasis Client-Server yang mempergunakan
protokol HTTP (Hyperteks Transfer Protocol) dan TCP/IP (Transmisson Control
Protocol / Internet Protocol) sebagai medianya. Karena kedua sistem ini
mempunyai hubungan yang sangat erat, maka untuk saat ini sulit untuk
membedakan antara HTTP dengan WWWβ. (Hastanti, dkk 2015:1-2)
2.2.2 HyperText Markup Language (HTML)
Menurut Harison dan Syarif (2016:43) βHTML adalah sebuah bahasa
markup yang digunakan untuk membuat sebuah halaman web, menampilkan
berbagai informasi di dalam sebuah Penjelajah web Internet dan formating
hypertext sederhana yang ditulis kedalam berkas format ASCII agar dapat
menghasilkan tampilan wujudyang terintegerasi. Dengan kata lain, berkas yang
dibuat dalam perangkat lunakpengolah kata dan disimpan kedalam format ASCII
normal sehingga menjadi home page dengan perintah-perintah HTML. Bermula
dari sebuah bahasa yang sebelumnya banyak digunakan di dunia penerbitan dan
percetakan yang disebut dengan SGML (Standard Generalized Markup Language),
HTML adalah sebuah standar yang digunakan secara luas untuk menampilkan
halaman web. HTML saat ini merupakan standar Internet yang didefinisikan dan
27
dikendalikan penggunaannya oleh World Wide Web Consortium(W3C). HTML
dibuat oleh kolaborasi Caillau TIM dengan Berners-lee Robert tahun 1989β.
2.2.3 PHP (Hypertext Preprocesseor)
βPHP adalah sebuah bahasa pemograman yangberjalan dalam sebuah web-
server (serverside). PHPdiciptakan oleh programmer unix dan Perl yangbernama
Rasmus Lerdoft pada bulanAgustus-September1994. Script PHP adalah bahasa
program yang berjalanpada sebuahwebserver, atau sering disebut server-side, Oleh
karena itu PHP dapat melakukan apa saja yangbisadilakukan program CGI lain,
yaitu mengolah data dengantipe apapun, menciptakanhalaman web yang dinamis
serta menerima dan menciptakan cookies, dan bahkanPHP bisamelakukan lebih
dari ituβ. (Harison dan Syarif 2016:42).
2.2.4 CSS (Cascading Style Sheet)
Menurut Winarno dan Utomo (2010:106) dalam Prayitno dan Safitri
(2015:2) menerangkan bahwa βCSS merupakan bahasa pemrograman web yang
digunakan untuk mengatur style-style yang ada di tagtag HTMLβ.
Menurut Simarmata (2010:148) dalam Firmansyah dan Udi (2018:185)
Mendefinisi-kan bahwa βPHP (Hypertext Preprocessor) adalah PHP mengijinkan
pengembang untuk menempelkan kode didalam HTML dengan menggunakan
bahasa yang sama seperti perl dan UNIX shells.β
28
2.3 Metode Dan Teknik Pengembangan Sistem
2.3.1 Metode Pengembangan Sistem
A. System Development Life Cycle (SDLC)
βSoftware Development Life Cycle atau yang sering disebut System
Development Life Cycle adalah proses mengembangkan atau mengubah suatu
sistem perangkat lunak dengan menggunakan model-model dan metodologi yang
digunakan orang untuk mengembangkan sistem-sistem perangkat lunak
sebelumnyaβ. (Mulyani, 2016).
Menurut Sukamto dan Shalahuddin (2013:26) dalam Firmansyah dan Udi
(2018:185) mengemukakan bahwa βSDLC atau Software De-velopment Life Cycle
atau sering disebut juga System Development Life Cycle adalah proses mengem-
bangkan atau mengubah suatu sistem perangkat lu-nak dengan menggunakan
model-model dan metod-ologi yang digunakan orang untuk mengembangkan
sistem-sistem perangkat lunak sebelumnya, berdasarkan best practice atau cara-
cara yang sudah teruji baik.β
B. Fase β fase yang ada Pada SDLC
1. Perencanaan (Planning)
Tahap perencanaan adalah proses mendasar untuk memahami mengapa
sebuah sistem informasi harus dibangun dan menentukan bagaimana tim proyek
akan membangunnya.
2. Analisis (Analysis)
Tahap analisis menjawab pertanyaan siapa yang akan menggunakan sistem,
sistem apa yang akan dilakukan, dan dimana dan kapan akan digunakan.
29
3. Desain (Design)
Tahap perancangan memutuskan bagaimana sistem akan beroperasi, dalam
hal perangkat keras, perangkat lunak, dan infrastruktur jaringan; antarmuka
pengguna, formulir dan laporan, database, dan file yang akan dibutuhkan.
4. Pelaksanaan (Implementation)
Tahap akhir dalam SDLC adalah tahap implementasi, dimana sistem
dibangun atau dibeli, dalam kasus desain software yang dikemas (Dennis,dkk,2009).
Gambar 2.3 Fase Fase Pada SDLC
C. Pengembangan Sistem Dengan Waterfall
Model Waterfall merupakan salah satu model pengembangan perangkat
lunak yang ada di dalam model SDLC (Sequencial Development Life Cycle).
Model waterfall sering juga disebut model sekuensi linear atau alur hidup klasik.
Pengembangan sistem dikerjakan secara terurut mulai dari planning, analysis,
design, implementation dan system.
30
Gambar 2.4 Model Waterfall
Kelebihan menggunakan metode pengembangan air terjun (waterfall)
adalah metode ini memungkinkan untuk departementalisasi dan kontrol. Proses
pengembangan model fase one by one, sehingga meminimalis kesalahan yang
mungkin akan terjadi.
Kekurangan menggunakan metode pengembangan waterfall adalah metode
ini tidak memungkinkan untuk banyak revisi jika terjadi kesalahan dalam
prosesnya. Karena setelah aplikasi ini dalam tahap pengujian, sulit untuk kembali
lagi dan mengubah sesuatu yang tidak terdokumentasi dengan baik dalam tahap
konsep sebelumnya.
2.3.2 Teknik Pengembangan Sistem
A. UML (Unified Modelling Language)
Menurut Windu Gata, Grace (2013:4) dalam Hendini (2016:108), βUnified
Modeling Language (UML) adalah bahasa spesifikasi standar yang dipergunakan
untuk mendokumentasikan, menspesifikasikan dan membanngun perangkat lunak.
UML merupakan metodologi dalam mengembangkan sistem berorientasi objek dan
juga merupakan alat untuk mendukung pengembangan sistemβ.
31
Dengan menggunakan UML kita dapat membuat model untuk semua jenis
aplikasi piranti lunak, dimana aplikasi tersebut dapat berjalan pada piranti keras,
sistem operasi dan jaringan apapun, serta ditulis dalam bahasa pemrograman
apapun. Tetapi karena UML juga menggunakan class dan operation dalam konsep
dasarnya, maka ia lebih cocok untuk penulisan piranti lunak dalam bahasa-bahasa
berorientasi objek seperti C++, Java, C# atau VB.NET. Walaupun demikian, UML
tetap dapat digunakan untuk modeling aplikasi prosedural dalam VB atau C.
B. Behavioral Diagram
1. Use Case Diagram
Use case diagram merupakan pemodelan untuk kelakuakn (behavior) sistem
informasi yang akan dibuat. Use case digunakan untuk mengetahui fungsi apa saja
yang ada di dalam sistem informasi dan siapa saja yang berhak menggunakan
fungsi-fungsi tersebut. Gambar dibawah ini adalah gambar notasi dari use case
diagram :
Gambar 2.5 Notasi Use Case Diagram
32
Berikut ini adalah Contoh Use Case Diagram :
Gambar 2.6 Contoh Use Case Diagram
2. Sequence Diagram
Sequence Diagram menggambarkan kelakuan objek pada use case dengan
mendeskripsikan waktu hidup objek dan pesan yang dikirimkan dan diterima antar
objek. Simbol-simbol yang digunakan dalam Sequence Diagram yaitu:
Gambar 2.9 Notasi Sequence Diagram
33
Contoh Squence Diagram :
Gambar 2.10 Contoh Sequence Diagram
3. Activity Diagram
Activity Diagram menggambarkan workflow (aliran kerja) atau aktivitas
dari sebuah sistem atau proses bisnis. Simbol-simbol yang digunakan dalam activity
Diagram yaitu :
Gambar 2.11 Notasi Activity Diagram
34
Contoh Activity Diagram :
Gambar 2.12 Contoh Activity Diagram
4. Class Diagram
Merupakan hubungan antar kelas dan penjelasan detail tiap-tiap kelas di
dalam model desain dari suatu sistem, juga memperlihatkan aturan-aturan dan
tanggung jawab entitas yang menentukan perilaku sistem. Class Diagram juga
menunjukkan atribut-atribut dan operasi-operasi dari sebuah kelas dan constraint
yang berhubungan dengan objek yang dikoneksikan. Gambar dibawah ini adalah
gambar notasi dari class diagram
Gambar 2.13 Notasi Class Diagram
35
Berikut ini adalah contoh dari Class Diagram :
Gambar 2.13 Contoh Class Diagram
2.4 Rapid Miner
Rapid Miner merupakan perangkat lunak yang bersifat terbuka (open
source). Rapid Miner adalah sebuah solusi untuk melakukan analisis prediksi.
Rapid Miner menggunakan berbagai teknik deskriptif dan prediksi dalam
memberikan wawasan kepada pengguna sehingga dapat membuat keputusan yang
paling baik. Rapid Miner memiliki kurang lebih 500 operator data mining, termasuk
operator untuk input, output, data preprocessing dan visualisasi. Rapid Miner
merupakan software yang berdiri sendiri untuk analisis data dan sebagai mesin data
mining yang dapat diitegrasikan pada produknya sendiri. Rapid Miner ditulis
dengan menggunakan bahasa java sehingga dapat bekerja di semua sistem operasi.
Rapid Miner menyediakan GUI (Graphic User Iterface) untuk merancang
sebuah pipeline analitis. GUI ini akan menghasilkan file XML (Extensible Markup
Language) yang mendefenisikan proses analitis keinginan pengguna untuk
36
diterapkan ke data. File ini kemudian dibaca oleh Rapid Miner untuk menjalankan
analis secara otomatis.
Rapid Miner memiliki beberapa sifat sebagai berikut
1. Ditulis dengan bahasa pemrograman java sehingga dapat dijalankan
diberbagai sistem operasi.
2. Proses penemuan pengetahuan dimodelkan sebagai operator trees.
3. Representasi XML internal untuk memastikan format standar pertukaran
data.
4. Bahasa scripting memungkinkan untuk eksperimen skala besar dan
otomatisasi eksperimen.
5. Konsep multi-layer untuk menjamin tampilan data yang efisien dan
menjamin penanganan data.
6. Memiliki GUI, command line mode, dan java API yang dapat dipanggil dari
program lain. (Wicaksana, dkk, Belajar Data Mining Dengan Rapid Miner,
2009)
Gambar 2.13 Halaman Utama RapiMiner
37
BAB III
METODE PENELITIAN
3.1 Tinjauan Organisasi/Objek Penelitian
3.1.1 Sejarah
PT indonusa bergerak di bidang perternakan udang air asin yang terletak di
desa patrol inderamuyu jawa barat. Perusahaan ini berdiri sejak tahun 1990an dan
sudah memiliki karyawan kurang lebih 102 karyawan, hasil dari perternakan ini
sebagian besar di pasarkan di restoran, hotel dan rumah makan lainya yang ada di
kawasan jawa barat.perusahaan ini termasuk perusahan menengah ke bawah karena
masih di kelolah oleh masyarakat desa disekitarnya, dan untuk karyawan sendiri
masih sebagian besar karyawan harian, itupun dalam waktu pemanenan atau
pembibitan benur udang saja.
3.1.2 Visi Misi
1. Visi
Untuk menjadi perternakan yang dapat diandalkan dalam hal pemasokan
udang yang berkualitas di Indonesia dankhususnya di daerah jawa barat.
2. Misi
a. Menjadikan perusahaan yang bisa mensejahterakan karyawan.
b. Meningkatkan budi daya udang di Indonesia
c. Meningkatka gizi masyarakat jawa barat.
38
3.1.3 Struktur Organisasi
Gambar 3.1 Struktur Organisasi
3.2 Metode Penelitian
Pada penelitian ini, data yang diperoleh akan diolah menggunakan metode
Algoritma C4.5 dapat di gunakan sebagai rules dalam menganalisi potensi
menentukan bonus tahunan karyawan. Dalam penelitian ini akan dilakukan
beberapa langkah atau tahapan penelitian.
39
Gambar 3.2 Tahap Penelitian
1. Pengumpulan Data
Pada bagian ini dijelaskan tentang bagaimana dan dari mana data dalam
penelitian ini didapatkan, meliputi data sekunder dan data primer. Data
sekunder berisi tentang sumber perolehan data yang dhasilkan dari
penelitian.
2. Pengolahan Awal Data
Pada bagian ini dijelaskan tentang tahap awal data mining. Pengolahn awal
data meliputi proses input data ke format yang dibutuhkan, pengelompokan
dan penentuan atribut data.
3. Metode yang Diusulkan
Pada bagian ini menjelaskan metode yang diusulkan untuk menganalisi
bonus tahunan karyawan. Yang meliputi pemilihan nilai dari parameter-
prameter dan arsitektur melalui uji coba.
Pengumpulan Data
Pengolahan Data Awal
Metode Yang Diusulkan
pengujian Data dengan Beberapa Metode
Pengujian/Validasi Hasil
40
4. Eksperimen dan Pengujian Metode
Bagian ini dijelaskan tengtang langkah-langkah eksperiment meliputi cara
pemilihan arsitektur yang tepat dari modl atau metode yang diusulkan
sehingga didapatkan hasil ang dapat membuktikan bahwa metode yang
digunakan adalah tepat.
5. Evaluasi dan Validasi Data
Eavaluasi dan validai hasil akan di jelaskan dan dipaparkan pada bab IV.
3.3 Metode Pengumpulan Data
Adapun Untuk melaksanakan dan menunjang keberhasilan penelitian yang
akan dilakukan, penulis dalam mencari data primer atau informasi yang dibutuhkan
dengan menggunakan cara-cara sebagi berikut:
1. Interview
Yaitu prosedur pengumpulan data yang dilakukan dengan cara tanya jawab
atau interview secara lisan maupun tulisan dengan pihak yang terkait, dalam
hal ini yakni PT Indonusa
2. Observasi
Penulis melakukan pengamatan secara langsung atau tinjauan langsung ke
lapangan, serta melakukan pengamatan langsung terhadap objek permasalahan
yang diteliti untuk memperoleh informasi yang lebih real.
3. Daftar Pustaka
Penulis mengkaji, mengkutip, dan mempelajari berbagai jenis buku, jurnal, dan
artikel dari internet yang berhubungan dengan permasalahan yang diteliti,
41
dimana teori-teori yang dipergunakan dijadikan sebagai referensi dalam
penyusunan skripsi tersebut.
Tabel 3.1 Atribut Pada Data Karyawan PT.Indonusa
No Atribut Nilai
1 NIP Nomer Induk karyawan/Karyawan
2 Nama Nama Karyawan
3 Tempat.tanggal lahir Tempat Tanggal Lahir Karyawan
4 Status Pernikahan TK=Tidak kawin, K0=kawin, K1=Kawin
Anak Satu, K2=kawin Anak Dua dan
K3=Kawin anak Tiga
5 Jenis Kelamin L=Laki-laki, P=Perempuan
6 Masa Kerja Masa kerja karyawan
7 Kehadiran Absensi karyawan
8 Loyalitas Kepedulian karyawan terhadap perusahaan
9 Hasil Pekerjaan Hasil pekerjaan karyawan selama satu tahun
10 Keputusan Layak, Tidak layak
3.4 Pengelolahan Data Awal
42
pada data karyawan yang telah dikumpulkan dan dilakukan cleaning data
yaitu menghilangkan record-record yang noise atau tidak lengkap dan record yang
berulang. Atribut yang tidak diperlukan juga bisa dihilangkan seperti atribut
NIP,Nama, Tempat Tanggal lahir, status pernikahan, dan jenis kelamin. Hal ini
dilakukan karena atribut tersebut tidak berpengaruh terhadap pengolahan data pada
proses selanjutnya. Berikut adalah tabel atribut dan kategorinya.
Tabel 3.2 Atribut Yang Tidak Digunakan
No Atribut Nilai
1 NIP Nomer induk karyawan/karyawan
2 Nama Nama karyawan
3 Tempat Tnggal Lahir Tempat tanggal lahir karyawan
4 Status Pernikahan TK=Tidak kawin, K0=kawin, K1=Kawin Anak
Satu, K2=kawin Anak Dua dan K3=Kawin anak
Tiga
5 Jenis kelamin L=laki-laki, P=perempuan
Sedangkan untuk atribut seperti masa kerja, kehadiran, loyalitas, dan hasil
pekerjaan. Hal ini dilakukan karena atribut tersebut berpengaruh terhadap
pengolahan data pada proses selanjutnya. Berikut adalah tabel dan kategorinya:
Tabel 3.3 Atribut Yang Digunakan
43
No Atribut Nilai
1 Masa Kerja Masa kerja karyawan
2 Kehadiran Absensi karyawan
3 Loyalitas Kepedulian karyawan terhadap perusahaan
4 Hasil Pekerjaan Hasil pekerjaan karyawan selama satu tahun
5 Keputusan Layak, Tidak layak
Data yang sudah di siapkan untuk klasifikasi dibagi menjadi dua untuk data
training (80%) dan data testing (20%). Pembagian data menjadi data training dan
data testing menggunakan teknik sampling random sistimatik (siysteatyc random
sampling). Cara penggunaan teknik sampling random sistematik ini pengundian
hanya dilakukan satu kali, yakni ketika menentukan unsur pertama dari sampling
yang akan di ambil. Penentuan unsur sampling selanjutnya ditempuh dengan cara
memanfaatkan interval sampel. Interval sampel adalah angka yang menunjukan
jarak antara nomer βnomer urut yang terdapat pada kerangka sampling yang akan
dijadikan patokan dalam menentukan atau memilih unsur-unsur sampling kedua
dan seterusnya hingga unsur ke-n. interval sampling biasanya dilambangkan
dengan huruf k.
44
Interval sampel atau juga sampling rasio diperoleh dengan cara membagi
ukuran populasi dengan ukuran sampling yang dikehendaki (N/n) contoh
perhitungan untuk mengambil data testing adalah sebagai berikut:
Jumlah data testing = 20% x N= n
Jumlah populasi = N
Jumlah sampel = n
Interval sampling k = N/n
Unsur pertama yang diambil untuk data testing (s)=1
Unsur kedua = s+k (1+5=6)
Unsur ketiga = s+2k (1+2*5=11)
Unsur ke-nβ¦=s+nk
Jumlah data testing (n)= 20% x N
=20% x 102 = 20
Interval sampel (k)=N/n
=102/20=5
S =1
S2 = s+k=1+5 =6
S3 =s+2k =1+(2*5)=11
45
S4 =s+3k =1+(3*5)=16 dst.
Dari hasil di atas dihasilkan data testing sebanyak 20 data karyawan,maka sisanya
di jadikan data training.
1. Choosing the appropriate Data miningtask
2. Choosing the Data miningAlgorithm
3. Employing The Data miningAlgorithm
4. Evoluation
5. Using The discovered Knowledge
3.5 Metode Yang Diusulkan
Dalam penelitian ini akan dilakukan analisis mengunakan algoritma C4.5.
dalam ini akan dilakukan beberapa langkah pengujian data yaiutu seperti berikut:
Gambar 3.3 Langkah Pengujian Metode
Mendapat hasil akurasi Prediksi Penerima bonus tahunan
Hasil algoritma C4.5
Pengolahan data dengan menggunakan
algoritma C4.5
46
Karakteristik dari Algoritma C4.5 yaitu salah satu algoritma dalam metode
pohon keputusan yang merubah data mejadi pohon keputusan menggunakan rumus
perhitungan entropy.
3.6 Kerangka Pemikiran
Dalam menyelesaikan penelitian ini dibutuhkan sebuah kerangka pemikiran
sebagai pedoman yang dilakukan secara konsisten. Permasalahan penelitian ini
belum di ketahui metode yang tepat dalam akurasi penerima bonus tahunan. Untuk
metode ini digunakan Algoritma C4.5 untuk memecahkan masalah pengujian
terhadap metode tersebut. Pengujian metode ini dilakukan dengan cara croos
Validation, confusion matrix dan Kurva ROC. Untuk pengembanganya dan
pengujian metode digunakan aplikasi rapidminer. Berikut ini kerangka pemikiran
yang di lakukan.
48
A. Use Case Diagram
Gambar 3.7 Use Case Diagram
1. Skenario Use Case Diagram
Tabel 3.4 Skenario Use Case Diagram
Nama Use Case Deskripsi Aktor
Login User dapat masuk kedalam
sistem dengan menggunakan
username dan password
User
Memilih Menu
Melakukan
Prediksi
User dapat melihat semua pilihan
yang ada di menu prediksi
User
Logout User keluar dari system User
B. Activity Diagram
1. Activity Diagram Login
49
Gambar 3.8 Activity Diagram Login
User memasukan username dan password, jika benar maka aktor akan
diarahkan oleh sistem ke menu utama. Jika salah maka sistem akan menampilkan
pesan βUsername dan password yang anda masukan salahβ.
2. Activity Diagram Prediksi
Gambar 3.9 Activity Diagram Prediksi
3. Activity Diagram Logout
50
Gambar.3.10 Activity Diagram Logout
User dapat keluar dari aplikasi / sistem setelah memilih tombol logout pada
pojok kanan atas menu utama.
C. Sequence Diagram
Sequence diagram menggambarkan interaksi yang terjadi pada berdasarkan
skenario pada Use Case Diagram dan mendeskripsikan pesan yang dikirimkan dan
diterima antar objek. Berikut adalah gambaran sequence diagram.
1. Sequence Diagram Login
Gambar 3.11 Sequence Diagram Login
2. Sequence Diagram Prediksi
51
Gambar 3.12 Sequence Diagram Prediksi
3. Sequence Diagram Logout
Gambar 3.13 Sequence Diagram Logout
D. Class Diagram Prediksi
Hubungan antar kelas dan penjelasan detail tiap-tiap kelas di dalam model
desain dari suatu sistem, juga memperlihatkan aturan-aturan dan tanggung jawab
entitas yang menentukan perilaku sistem. Class Diagram juga menunjukkan
52
atribut-atribut dan operasi-operasi dari sebuah kelas dan constraint yang
berhubungan dengan objek yang dikoneksikan.
Gambar 3.14 Class Diagram
3.7.2 Perencanaan (Planning)
Berdasarkan latar belakang masalah yang telah diuraikan pada bab
sebelumnya ( bab I ), penulis membuat atau membangun sebuah sistem informasi
Potensi karyawan untuk menentukan bonus tahunan.
3.7.3 Analisis (Analysis)
Untuk dapat mengatasi permasalahan yang ada sistem harus mampu
melakukan hal-hal berikut :
1. Sistem harus dapat dioperasikan oleh user dengan mudah.
2. Sistem harus mampu memprediksi karyawan penerima bonus tahunan
3. Membutuhkan login sebagai pengaman untuk dapat masuk kedalam sistem.
4. Sistem harus dapat memberikan informasi dengan jelas.
3.7.4 Desain (Design)
Berikut adalah desain user interface dari sistem yang akan dibuat :
53
1. Tampilan Menu Login
Gambar 3.15 Tampilan Halaman Login
Untuk dapat masuk kedalam sistem user terlebih dahulu melakukan login
dengan memasukan username dan password.
2. Tampilan Menu Utama
Gambar 3.16 Tampilan Menu Utama
54
BAB IV
HASIL DAN PEMBAHASAN
4.1 Hasil Penelitian
4.1.1 Jumlah Kasus Data keseluruhan, Data Training dan Data Testing
Data keseluruhan yang digunakan pada penelitian ini sebanyak 20 kasus, lalu
digunakan untuk data training sebanyak
Tabel 4.1 Data Testing
No Masa
Kerja Kehadiran Loyalitas
Hasil
Pekerjaan Bonus Tahunan
1 MS Bagus Kurang Baik Layak
20 MS Bagus Baik Baik Layak
3 MS Bagus Cukup Baik Layak
4 TS Bagus Baik Kurang Tdk Layak
5 MS Bagus Baik Cukup Tdk Layak
6 TS Tidak Cukup Cukup Tdk Layak
7 MS Bagus Baik Kurang Tdk Layak
8 MS Tidak Baik Kurang Tdk Layak
9 TS Tidak Cukup Baik Tdk Layak
10 TS Tidak Baik Cukup Tdk Layak
11 MS Tidak Kurang Cukup Tdk Layak
12 MS Tidak Kurang Cukup Tdk Layak
13 MS Bagus Cukup Baik Layak
55
14 TS Bagus Cukup Baik Tdk Layak
15 MS Tidak Baik Baik Tdk Layak
16 TS Bagus Cukup Baik Layak
17 MS Tidak Baik Baik Tdk Layak
18 TS Bagus Baik Cukup Tdk Layak
19 TS Tidak Cukup Cukup Tdk Layak
20 MS Tidak Cukup Cukup Tdk Layak
Untuk masa kerja terbagi atas 2 (dua) transformasi data yaitu:
a. MS (Memenuhi Syarat) yaitu karyawan yang sudah bekerja lebih dari satu
tahun.
b. TS (Tidak Memenuhi Syarat) yaitu karyawan yang masa kerja kurang dari
satu tahun
Tabel 4.2 Jumlah Nilai Atribut Data Keseluruhan
JUMLAH
KASUS(S)
TIDAK
LAYAK(S1) LAYAK(S2)
TOTAL 20 14 6
MASA KERJA
MS 12 8 4
TS 8 7 1
KEHADIRAN
BAGUS 10 5 5
TIDAK 10 10 0
LOYALITAS
56
BAIK 9 8 1
CUKUP 8 5 3
KURANG 3 2 1
HASIL
PEKERJAAN
BAIK 9 4 5
CUKUP 8 8 0
KURANG 3 3 0
Dari tabel diatas terdapat 20 kasus dimana 14 kasus TIDAK LAYAK dan 6 kasus
LAYAK
4.2 Hasil
Dalam penelitian potensi karyawan untuk menentukan bonus tahunan
menggunakan algoritma C4.5. pohon keputusan dibuat berdasarkan hasil
perhitungan entropy dan gain setelah pohon keputusan terbentuk, langka
selanjutnya mencari rule berdasarkan cabang pohon keputusan. Berikut akan
dibahas langkah-langkah dalam eksperimen potensi karyawan untuk menentukan
bonus tahunan menggunakan algoritma C4.5
4.2.1 Pohon Keputusan Berdasarkan Entropy dan Gain
A. Node 1 (Root) Atribut Total
Pada node 1 terlebih dahulu yaitu menghitung jumlah kasus, jumlah kasus
untuk LAYAK dan jumlah kasus untuk TIDAK LAYAK, dan Entropy dari semua
kasus dan kasus yang dibagi berdasarkan atribut MASA KERJA, KEHADIRAN,
57
LOYALITAS, dan HASIL PEKERJAAN. Setelah itu lakukan perhitungan Gain
untuk setiap atribut.Lihat Tabel 4.2
Entropy Total Data Testing
πΈππ‘ππππ¦ (S) = β βππ β πππ2
π
π=1
ππ
πΈππ‘ππππ¦ (Total) = (βTidak layak
Totalxlog2(
Tidak layak
Total))
+ (βLayak
Totalxlog2(
Layak
Total))
Entropy (Total)=(-14
20xlog2(
14
20)) + (
6
20xlog2(
6
20))
Entropy (Total)=0.88129
Entropy Masa Kerja MS
πΈππ‘ππππ¦ (Masa kerja MS)
= β(β
π
π=1
Tidak layak
Masa kerja MSβ log2(
Tidak layak
Masa kerja MS))
+ (β layak MS
Masa kerja MSβ log2(
layak MS
Masa kerja MS))
Entropy (Masa Kerja MS)=(-8
12xlog2(
8
12)) + (
4
12xlog2(
5
12))
Entropy (Masa Kerja MS)= 0,918295834
Entropy Masa Kerja TS
πΈππ‘ππππ¦ (Masa kerja TS)
= β(β
n
i=1
Tidak layak
Masa kerja TSβ log2(
Tidak layak
Masa kerja TS))
+ (β layak
Masa kerja TSβ log2(
layak
Masa kerja TS))
58
Entropy (Masa Kerja TS)=(β7
8*πππ2(
7
8))+(β
1
8*πππ2(
1
8))
Entropy (Masa Kerja TS)= 0,543564443
Gain Masa Kerja
πΊπππ(Total, Masa Kerja)
= πΈππ‘ππππ¦ (Total) β β|Masa Kerja|
|Total|β πΈππ‘ππππ¦(Masa Kerja)
π
π=1
πΊπππ(Total, Masa Kerja) = 0,881290899 β((12
20β 0,918295834 )+(
8
20β
0,543564443))
πΊπππ(Total, Masa Kerja) =0,112887622
Entropy Kehadiran Bagus
πΈππ‘ππππ¦ (Kehadiran Bagus)
= β(β
π
π=1
Tidak layak
Kehadiran Bagusβ log2(
Tidak layak
Kehadiran Bagus))
+ (β layak
Kehadiran Bagusβ log2(
layak
JKehadiran Bagus))
Entropy (Kehadiran Bagus)=(β5
10*πππ2(
5
10))+(β
5
10*πππ2(
5
10))
Entropy (Kehadiran Bagus)=1
1
| |,
| |
n
i
SiGain S A Entropy S Entropy Si
S
59
Entropy Kehadiran Tidak
πΈππ‘ππππ¦ (Kehadiran Tidak)
= β(β
π
π=1
Tidak layak
Kehadiran Tidakβ log2(
Tidak layak
Kehadiran Tidak))
+ (β layak
Kehadiran Tidakβ log2(
layak
Kehadiran Tidak))
Entropy (Kehadiran Tidak)=(β10
10*πππ2(
10
10))+(β
0
10*πππ2(
0
10))
Entropy (Kehadiran Tidak)=0
Gain Total Kehadiran
πΊπππ(Total, Kehadiran)
= πΈππ‘ππππ¦ (Total) β β|Kehadiran|
|Total|β πΈππ‘ππππ¦(Kehadiran)
π
π=1
πΊπππ(Total, Kehadiran) =0,881290899β((10
20β1)+(
10
20β 0))
πΊπππ(Total, Kehadiran) = 0,38129089
Entropy Loyalitas Baik
πΈππ‘ππππ¦ (Loyalitas Baik)
= β(β
n
i=1
Tidak layak
Jumlah kasus Baikβ log2(
Tidak layak
Jumlah kasus Baik))
+ (β layak Baik
Loyalitas Baikβ log2(
layak Baik
Loyalitas Baik))
Entropy (Loyalitas Baik)=(β8
9*πππ2(
8
9))+(β
1
9*πππ2(
1
9))
Entropy (Loyalitas Baik)= 0,503258335
Entropy Loyalitas Cukup
60
πΈππ‘ππππ¦ (Loyalitas Cukup)
= β(β
n
i=1
Tidak layak
Loyalitas Cukupβ log2(
Tidak layak
Loyalitas Cukup))
+ (β layak
Loyalitas Cukupβ log2(
layak
Loyalitas Cukup))
Entropy (Loyalitas Cukup)=(β5
8*πππ2(
5
8))+(β
3
8*πππ2(
3
8))
Entropy (Loyalitas Cukup)= 0,954434003
Entropy Loyalitas Kurang
πΈππ‘ππππ¦ (Loyalitas Kurang)
= β(β
n
i=1
Tidak layak
Loyalitas Kurangβ log2(
Tidak layak
Loyalitas Kurang))
+ (β layak
Loyalitas Kurangβ log2(
layak
Loyalitas Kurang))
Entropy (Loyalitas Kurang)=(β2
3*πππ2(
2
3))+(β
1
3*πππ2(
1))
Entropy (Loyalitas Kurang)= 0,918295834
Gain Total Loyalitas
πΊπππ(Total, Loyalitas) = πΈππ‘ππππ¦ (Total) β β|Loyalitas|
|Total|β
n
i=1
πΈππ‘ππππ¦(Loyalitas)
πΊπππ(Total, Loyalitas) =0,881290899β((10
20β1)+(
10
20β 0))
πΊπππ(Total, Masa Kerja) = 0,135306672
Entropy Pekerjaan Baik
61
πΈππ‘ππππ¦ (Hasil Pekerjaan Baik)
= β(β
n
i=1
Tidak layak
Hasil Pekerjaan Baikβ log2(
Tidak layak
Hasil Pekerjaan Baik))
+ (β layak
Hasil Pekerjaan Baikβ log2(
layak
Hasil Pekerjaan Baik))
Entropy (Hasil Pekerjaan Baik)=(β4
9*πππ2(
4
9))+(β
5
9*πππ2(
5
9))
Entropy (Hasil Pekerjaan Baik)=0.9910751
Entropy Pekerjaan Cukup
πΈππ‘ππππ¦ (Hasil Pekerjaan Cukup)
= β(β
n
i=1
Tidak layak
Hasil Pekerjaan Cukupβ log2(
Tidak layak
Hasil Pekerjaan Cukup))
+ (β layak
Hasil Pekerjaan Cukupβ log2(
layak
Hasil Pekerjaan Cukup))
Entropy (Hasil Pekerjaan Cukup) =(β8
8*πππ2(
8
8))+(β
0
8*πππ2(
0
8))
Entropy (Hasil Pekerjaan Cukup)=0
Entropy Pekerjaan Kurang
πΈππ‘ππππ¦ (Hasil Pekerjaan Kurang)
= β(β
n
i=1
Tidak layak
Hasil Pekerjaan Kurang
β log2(Tidak layak
Hasil Pekerjaan Kurang)) + (β
layak
Hasil Pekerjaan Kurang
β log2( layak
Hasil Pekerjaan Kurang))
Entropy (Hasil Pekerjaan Kurang)=(β3
3*πππ2(
3
3))+(β
0
3*πππ2(
0
3))
62
Entropy (Hasil Pekerjaan Kurang)=0
Gain Total Hasil Pekerjaan
πΊπππ(Total, Hasil Pekerjaan )
= πΈππ‘ππππ¦ (Total)
β β|Hasil Pekerjaan |
|Total|β πΈππ‘ππππ¦(Hasil Pekerjaan
n
i=1
)
πΊπππ(Total, Hasil Pekerjaan) =0,881290899β((9
20β 0,9910760) +(
8
20β 0)+
( 3
20β 0)+
πΊπππ(Total, Hasil Pekerjaan) =0,435306672
Dari hasil perhitungan diatas maka dapat dibuatkan tabel seperti Berikut:
Tabel 4.3 Hasil Perhitungan Entropy Dan Gain Node 1
JUMLAH
KASUS(S
)
TIDAK
LAYAK(S1)LAYAK(S2) ENTROPY GAIN
TOTAL 20 14 6 0,881290899
MASA KERJA 0,112887622
MS 12 8 4 0,918295834
TS 8 7 1 0,543564443
KEHADIRAN 0,381290899
BAGUS 10 5 5 1
TIDAK 10 10 0 0
LOYALITAS 0,135306672
BAIK 9 8 1 0,503258335
CUKUP 8 5 3 0,954434003
KURANG 3 2 1 0,918295834
HASIL PEKERJAAN 0,435306672
BAIK 9 4 5 0,99107606
CUKUP 8 8 0 0
KURANG 3 3 0 0
63
Gambar 4.1 Pohon Keputusan Node 1
B. Node 1.1 (Root) Atribut Total
Pada node 1.1 diketahui jumlah semua kasus sebanyak 9 kasus dengan
keputusa TIDAK LAYAK sebnayak 4 kasus dan keputusan LAYAK sebanyak 5
kasus lihat tabel 4.4
Tabel 4.4 Jumlah Kasus Data Raining Atribut Hasil Pekerjaan Nilai Cukup
Entropy Total Hsil Pekerjaan Cukup
πΈππ‘ππππ¦ (Total) = (βTidak layak
Totalxlog2(
Tidak layak
Total))
+ (βLayak
Totalxlog2(
Layak
Total))
Entropy (Total)=(-4
9xlog2(
4
9)) + (
5
9xlog2(
5
9))
Entropy (Total)= 0,99107606
NODEJumlah
Kasus(S)
Tdk
Layak(s1) Layak(S2)
1.1 Hasil pekerjaan baik 9 4 5
Masa Kerja
MS 6 2 4
TS 3 2 1
Kehadiran
Bagus 6 1 5
Tidak 3 3 0
Loyalitas
1 Baik 3 2 1
Cukup 5 2 3
Kurang 1 0 1
64
Entropy Masa Kerja MS
πΈππ‘ππππ¦ (Masa Kerja MS)
= β(β
π
π=1
Tidak layak
Masa Kerja MSβ log2(
Tidak layak
Masa Kerja MS))
+ (β layak
Masa Kerja MSβ log2(
layak
Masa Kerja MS))
Entropy (Masa Kerja MS)=(β2
6*πππ2(
2
6))+(β
4
6*πππ2(
4
6))
Entropy (Masa Kerja MS)= 0,918295834
Entropy Masa Kerja TS
πΈππ‘ππππ¦ (Masa Kerja TS)
= β(β
π
π=1
Tidak layak
Masa Kerja TSβ log2(
Tidak layak
Masa Kerja TS))
+ (β layak
Masa Kerja TSβ log2(
layak
Masa Kerja TS))
Entropy (Masa Kerja TS)=(β2
3*πππ2(
2
3))+(β
1
3*πππ2(
1
3))
Entropy (Masa Kerja TS)= 0,918295834
Gain Total Masa Kerja
πΊπππ(πππ‘ππ, Masa Kerja )
= πΈππ‘ππππ¦ (Total)
β β|Hasil Masa Kerja |
|Total|β πΈππ‘ππππ¦(Masa Kerja )
n
i=1
πΊπππ(πππ‘ππ, Masa Kerja) =0,99107606β((6
9β0,918295)+(
3
9β0,9182958)
πΊπππ(πππ‘ππ, Masa Kerja) = 0,07278023
65
Entropy Kehadiran Bagus
πΈππ‘ππππ¦ (Kehadiran, Bagus)
= β(β
π
π=1
Tidak layak
Kehadiran, Bagusβ log2(
Tidak layak
Kehadiran, Bagus))
+ (β layak
Kehadiran, Bagusβ log2(
layak
Kehadiran, Bagus))
Entropy (Kehadiran, Bagus)=(β1
6*πππ2(
1
6))+(β
5
6*πππ2(
5
6))
Entropy (Kehadiran, Bagus)=0,650022422
Entropy Kehadiran Tidak
πΈππ‘ππππ¦ (Kehadiran, Tidak)
= β(β
π
π=1
Tidak layak
Kehadiran, Tidakβ log2(
Tidak layak
Kehadiran, Tidak))
+ (β layak
Kehadiran, Tidakβ log2(
layak
Kehadiran, Tidak))
Entropy (Kehadiran, Tidak)=(β3
3*πππ2(
3
3))+(β
0
3*πππ2(
0
3))
Entropy (Kehadiran, Tidak)=0
Gain Total Kehadiran
πΊπππ(πππ‘ππ, Kehadiran)
= πΈππ‘ππππ¦ (πππ‘ππ)
β β|Kehadiran |
|πππ‘ππ|β πΈππ‘ππππ¦(Kehadiran )
π
π=1
πΊπππ(πππ‘ππ, Kehadiran) =0,99107606β((6
9β 0,650022422)+(
3
9β 0)
πΊπππ(πππ‘ππ, Kehadiran) =0,55772778
66
Entropy Loyalitas Baik
πΈππ‘ππππ¦ (Loyalitas, Baik)
= β(β
π
π=1
Tidak layak
Loyalitas, Baikβ log2(
Tidak layak
Loyalitas, Baik))
+ (β layak
Loyalitas, Baikβ log2(
layak
Loyalitas, Baik))
Entropy (Loyalitas, Baik)=(β2
3*πππ2(
2
3))+(β
1
3*πππ2(
1
3))
Entropy (Loyalitas, Baik)= 0,918295834
Entropy Loyalitas Cukup
πΈππ‘ππππ¦ (loyalitas, Cukup)
= β(β
π
π=1
Tidak layak
loyalitas, Cukupβ log2(
Tidak layak
loyalitas, Cukup))
+ (β layak
loyalitas, Cukupβ log2(
layak
loyalitas, Cukup))
Entropy (loyalitas, Cukup)=(β2
5*πππ2(
2
5))+(β
3
5*πππ2(
3
5))
Entropy (loyalitas, Cukup)= 0,97095059
Entropy Loyalitas Kurang
πΈππ‘ππππ¦ (Loyalitas, Kurang)
= β(β
π
π=1
Tidak layak
Loyalitas, Kurangβ log2(
Tidak layak
Loyalitas, Kurang))
+ (β layak
Loyalitas, Kurangβ log2(
layak
Loyalitas, Kurang))
Entropy (Loyalitas, Kurang)=(β0
1*πππ2(
0
1))+(β
1
1*πππ2(
1
1))
Entropy( Loyalitas, Kurang)=0
67
Gain Total Loyalitas
πΊπππ(πππ‘ππ, Loyalitas)
= πΈππ‘ππππ¦ (πππ‘ππ) β β|Loyalitas |
|πππ‘ππ|β πΈππ‘ππππ¦(Loyalitas)
π
π=1
πΊπππ(πππ‘ππ, Loyalitas) = 0,99107606 β((3
9β 0,918295834)+(
5
9β 0,970950594 ) +
(1
9β 0))
πΊπππ(πππ‘ππ, Loyalitas) =0,14556045
Tabel 4.5 Hasil Perhitungan Entropy Dan Gain Node 1.1 Hasil Perkerjaan Baik
Gambar 4.2 Pohon Keputusan Node 1.1
NODEJUMLAH
KASUS (S)
TIDAK
LAYAK (S1)LAYAK(S2) ENTROPY GAIN
1.1 HASIL PEKERJAAN CUKUP 9 4 5 0,99107606
MASA KERJA 0,07278023
MS 6 2 4 0,918295834
TS 3 2 1 0,918295834
KEHADIRAN 0,55772778
BAGUS 6 1 5 0,650022422
TIDAK 3 3 0 0
LOYALITAS 0,14556045
BAIK 3 2 1 0,918295834
CUKUP 5 2 3 0,970950594
KURANG 1 0 1 0
68
C. Node 1.1.2 (Root) Atribut Total
Pada node 1.1 diketahui jumlah semua kasus sebanyak 6 kasus dengan
keputusa TIDAK LAYAK sebnayak 1 kasus dan keputusan LAYAK sebanyak 5
kasus lihat table 4.6
Tabel 4.6 Jumlah Kasus Data Raining Atribut Hasil Pekerjaan Nilai Cukup Dan
Kehadiran Nilai Bagus
Entropy Total Hsil Pekerjaan Cukup Dan Kehadiran Bagus
πΈππ‘ππππ¦ (Total) = (βTidak layak
Totalxlog2(
Tidak layak
Total))
+ (βLayak
Totalxlog2(
Layak
Total))
Entropy (Total)=(-1
6xlog2(
1
6)) + (
5
6xlog2(
5
6))
Entropy (Total)= 0,650022422
Entropy Masa Kerja MS
πΈππ‘ππππ¦ (Masa Kerja MS)
= β(β
π
π=1
Tidak layak
Masa Kerja MSβ log2(
Tidak layak
Masa Kerja MS))
+ (β layak
Masa Kerja MSβ log2(
layak
Masa Kerja MS))
NODEJUMLAH
KASUS (S)
TIDAK
LAYAK (S1)LAYAK(S2)
1.1.2HASI PKERJAAN CUKUP KEHADIRAN
BAGUS6 1 5
MASA KERJA
MS 4 0 4
TS 2 1 1
LOYALITAS
BAIK 1 0 1
CUKUP 4 1 3
KURANG 1 0 1
69
Entropy (Masa Kerja MS)=(β0
4*πππ2(
0
4))+(β
4
4*πππ2(
4
4))
Entropy (Masa Kerja MS)= 0
Entropy Masa Kerja TS
πΈππ‘ππππ¦ (Masa Kerja TS)
= β(β
π
π=1
Tidak layak
Masa Kerja TSβ log2(
Tidak layak
Masa Kerja TS))
+ (β layak
Masa Kerja TSβ log2(
layak
Masa Kerja TS))
Entropy (Masa Kerja TS)=(β1
2*πππ2(
1
2))+(β
1
2*πππ2(
1
2))
Entropy (Masa Kerja TS)=1
Gain Total Masa Kerja
πΊπππ(Total, Masa Kerja)
= πΈππ‘ππππ¦ (Total) β β|Masa Kerja|
|Total|β πΈππ‘ππππ¦(Masa Kerja)
n
i=1
πΊπππ(Total, Masa Kerja) =0,650022422β((4
6β 0)+(
2
6β 1))
πΊπππ(Total, Masa Kerja) = 0,31668909
Entropy Loyalitas Baik
πΈππ‘ππππ¦ (Loyalitas, Baik)
= β(β
π
π=1
Tidak layak
Loyalitas, Baikβ log2(
Tidak layak
Loyalitas, Baik))
+ (β layak
Loyalitas, Baikβ log2(
layak
Loyalitas, Baik))
Entropy (Loyalitas, Baik)=(β0
1*πππ2(
0
1))+(β
1
1*πππ2(
1
1))
70
Entropy (Loyalitas, Baik)= 0
Entropy Loyalitas Cukup
πΈππ‘ππππ¦ (loyalitas, Cukup)
= β(β
π
π=1
Tidak layak
loyalitas, Cukupβ log2(
Tidak layak
loyalitas, Cukup))
+ (β layak
loyalitas, Cukupβ log2(
layak
loyalitas, Cukup))
Entropy (loyalitas, Cukup)=(β1
4*πππ2(
1
4))+(β
3
4*πππ2(
3
4))
Entropy (loyalitas, Cukup)= 0,811278124
Entropy Loyalitas Kurang
πΈππ‘ππππ¦ (Loyalitas, Kurang)
= β(β
π
π=1
Tidak layak
Loyalitas, Kurangβ log2(
Tidak layak
Loyalitas, Kurang))
+ (β layak
Loyalitas, Kurangβ log2(
layak
Loyalitas, Kurang))
Entropy (Loyalitas, Kurang)=(β0
1*πππ2(
0
1))+(β
1
1*πππ2(
1
1))
Entropy( Loyalitas, Kurang)=0
Gain Total Loyalitas
πΊπππ(Total, Loyalitas)
= πΈππ‘ππππ¦ (Total) β β|Loyalitas |
|Total|β πΈππ‘ππππ¦(Loyalitas)
n
i=1
πΊπππ(Total, Loyalitas) =0,650022422β((1
6β0)+(
4
6β0,811278124) + (
1
6β 0))
πΊπππ(Total, Loyalitas) = 0,10917034
71
Tabel 4.7 Hasil Perhitungan Entropy Dan Gain Node 1.1.2
Gambar 4.3 Pohon Keputusan Node 1.1.2
D. Node 1.1.2.3 (Root) Atribut Total
Pada node 1.1.2.3 diketahui jumlah semua kasus sebanyak 2 kasus dengan
keputusa TIDAK LAYAK sebanayak 1 kasus dan keputusan LAYAK sebanyak 1
kasus lihat table 4.8
NODEJUMLAH
KASUS (S)
TIDAK
LAYAK (S1)LAYAK(S2) ENTROPY GAIN
1.1.2HASI PKERJAAN CUKUP KEHADIRAN
BAGUS6 1 5 0,650022422
MASA KERJA 0,31668909
MS 4 0 4 0
TS 2 1 1 1
LOYALITAS 0,10917034
BAIK 1 0 1 0
CUKUP 4 1 3 0,811278124
KURANG 1 0 1 0
72
Tabel 4. 8 Jumlah Kasus Data Raining Atribut Hasil Pekerjaan Nilai Cukup,
Kehadiran Nilai Bagus Dan Masa Kerja MS
Entropy Total Hasil Pekerjaan Nilai Cukup, Kehadiran Nilai Bagus Dan
Masa Kerja MS
πΈππ‘ππππ¦ (Total) = (βTidak layak
Totalxlog2(
Tidak layak
Total))
+ (βLayak
Totalxlog2(
Layak
Total))
Entropy (Total)=(-1
2xlog2(
1
2)) + (
1
1xlog2(
1
1))
Entropy (Total)= 1
Entropy Loyalitas Cukup
πΈππ‘ππππ¦ (loyalitas, Cukup)
= β(β
π
π=1
Tidak layak
loyalitas, Cukupβ log2(
Tidak layak
loyalitas, Cukup))
+ (β layak
loyalitas, Cukupβ log2(
layak
loyalitas, Cukup))
Entropy (loyalitas, Cukup)=(β1
1*πππ2(
1
1))+(β
1
1*πππ2(
1
1))
Entropy (loyalitas, Cukup)= 1
NODEJUMLAH
KASUS (S)
TIDAK
LAYAK (S1)LAYAK(S2)
1.1.2.3 HASIL PEKERJAAN CUKUP,
KEHADIRAN BAGUS, MASA KERJA MS 2 1 1
LOYALITAS
CUKUP 2 1 1
KURANG 0 0 0
73
Entropy Loyalitas Kurang
πΈππ‘ππππ¦ (Loyalitas, Kurang)
= β(β
π
π=1
Tidak layak
Loyalitas, Kurangβ log2(
Tidak layak
Loyalitas, Kurang))
+ (β layak
Loyalitas, Kurangβ log2(
layak
Loyalitas, Kurang))
Entropy (Loyalitas, Kurang)=(β0
0*πππ2(
0
0))+(β
0
0*πππ2(
0
0))
Entropy( Loyalitas, Kurang)=0
GainTotal Loyalitas
πΊπππ(Total, Loyalitas)
= πΈππ‘ππππ¦ (Total) β β|Loyalitas |
|Total|β πΈππ‘ππππ¦(Loyalitas)
n
i=1
πΊπππ(Total, Loyalitas) =0,650022422β((1
6β0)+(
4
6β0,811278124) + (
1
6β 0))
πΊπππ(Total, Loyalitas) = 0,10917034
Tabel 4.8 Hasil Perhitungan Entropy Dn Gain Node 1.1.2.3
NODEJUMLAH
KASUS (S)
TIDAK
LAYAK (S1)LAYAK(S2) ENTROPY GAIN
1.1.2.3 HASIL PEKERJAAN CUKUP,
KEHADIRAN BAGUS, MASA KERJA MS 2 1 1 1
LOYALITAS 1
CUKUP 2 1 1 1
KURANG 0 0 0 0
74
Gambar 4.4 Pohon Keputusan 1.1.2.3
4.2.2 Perhitungan Menggunakan RapidMiner
Pengujian terhadap analisa sangat penting dilakukan untuk menentukan dan
memastikan apakah hasil analisa tersebut telah sesuai dengan keputusan yang
diharapkan. Untuk menguji kebenaran dari hasil pengolahan data yang dilakukan
secara manual, maka dapat menggunakan salah satu software aplikasi RapidMiner
9.0, aplikasi ini memudahkan kita untuk menghitung berbagai model data mining.
Adapun langkah-langkah dalam mengolah data menggunakan Rapid Miner adalah
sebagai berikut :
75
1. Seluruh data training yang akan diproses oleh RapidMiner disimpan terlebih
dahulu di Microsoft Excel dengan format .xlsx. adapun data training yang
dimaksud penulis memberi nama data testing.xlsx, data tersebut nantinya akan
dihitung menggunakan software aplikasi Rapidminer 9.0.
2. Buka software aplikasi RapidMiner 9.0 dengan cara klik dua kali pada shortcut
atau cari melalui My Computer dan akan muncul tampilan sebagai berikut :
Gambar 4.5 Halaman Utama RapidMiner 9.0
3. Selanjutnya pilih blank lalu pilih menu add data lalu cari dimana data
testing.xlsx berada pilih dan klik open. Selanjutnya akan muncul kotak dialog
select the cell to import pilih dan klik next.
76
Gambar 4.6 Kotak Dialog Select The Cell To Import
4. Selanjutnya pada format your columns pada atribut terjual klik tanda panah
kebawah lalu pilih change role lalu pilih label klik ok, klik next lalu klik finish.
Gambar 4.7 Kotak Dialog Format Your Columns
77
5. Drag data testing.xlxs pada menu repository yang sudah kita masukan kedalan
rapidminer ke design process, drag ID3. Tambahkan juga apply model dan
performance untuk mengetahui tingkat akurasinya. Pilih dan klik run.
Gambar 4.8 Design Process
Hasil performance vektor yang didapat adalah :
Gambar 4.9 Tabel Hasil Performance Vektor
78
Adapun pohon keputusan yang didapat dari rapidminer adalah sebagai
berikut :
Gambar 4.10 Tree View
Berdasarkan hasil pohon keputusan yang diperoleh pada perhitungan
rapidminer rule yang dihasilkan sama persis dengan perhitungan manual.
Algoritma C4.5 dianggap sebagai algoritma yang sangat membantu dalam
melakukan klasifikasi data karena karakteristik data yang diklasifikasi dapat
diperoleh dengan jelas, baik dalam bentuk struktur pohon keputusan maupun aturan
if-then, sehingga memudahkan pengguna dalam melakukan penggalian informasi
terhadap data yang bersangkutan. Pada pemilihan atribut juga sangat
mempengaruhi dalam pengolahan Algoritma C4.5 karena keputusan sangat
bergantung pada atribut yang dipilih.
79
4.2.3 User Interface Prediksi
User interface bentuk tampilan grafis yang berhubungan langsung dengan
pengguna yang berfungsi untuk menghubungkan pengguna (user) dengan sistem
Prediksi, tujuan utama dari user interface ini adalah pengoperasian dan kontrol
yang efektif, dan memberikan umpan balik yang baik dari sistem yang membantu
user dalam membuat keputusan operasional. Adapun User interface dari Prediksi
adalah sebagai berikut :
A. User Interface Halaman Login
Gambar 4.11 User Interface Halaman login
80
B. User Interface Halaman Prediksi
Gambar 4.12 User Interface Halaman Prediksi
4.2.4 Black Box Testing
Pengujian perangkat lunak black box adalah pengujian yang dilakukan
hanya mengamati hasil eksekusi melalui data uji dan memeriksa fungsional dari
perangkat lunak tersebut. Adapun hasil dari pengujian prediksi produk terlaris
berbasis web dengan menggunakan black box testing adalah sebagai berikut :
1. Pengujian Menu Login
Gambar 4.13 Pengujian Menu Login
81
Tabel 4.10 Hasil Uji Menu Login
Input Hasil Yang Diharapkan Output
Hasil
Test
Isi username dan
password kemudian
klik login
Tampil Halaman Menu
Utama
Halaman Prediksi OK
2. Pengujian Prediksi
Gambar 4.14 Pengujian Halaman Prediksi
Tabel 4.10 Hasil Uji Halama Prediksi
Input Hasil Yang Diharapkan Output
Hasil
Test
Klik Prediksi Tampil Form Prediksi Form Prediksi OK
Isi Form Lalu klik
Prediksi
Tampil Hasil Prediksi Hasil Prediksi OK
82
BAB V
PENUTUP
5.1 Kesimpulan
Dari hasil penelitian tentang analisa data potensi karyawan untuk
menentukan bonus tahunan dengan algoritma C4.5 maka garis besar dari penelitian
ini adalah:
1. Hasil penelitan dengan menggunakan algoritma C4.5 dalam menentukan
potensi karyawan bonus tahunan cukup akurat.
2. Algoritma C4.5 sangat membantu dalam pembuatan aplikasi sistem
pendukung dalam menganalisa data potensi karyawan untuk menentukan
bonus tahunan.
3. .Perhitungan menggunakan algoritma C.45 sangat akurat dengan data yang
ada di lapangan.
5.2 Saran
Dari hasil penelitian yang telah dilakukan dan hasil kesimpulan, maka saran
yang dapat diberikan dalam penelitian ini adalah:
1. Aplikasi yang ada bisa lebih di kembangkan lagi sehingga lebih
mempermudah dalam penentuan bonus tahunan karyawan.
2. .Metode algoritma C4.5 kedepanya bisa menjadi acuan dalam penentuan
bonus tahuan karyawan secara maksimal.
3. Untuk penelitian selanjutnya diharapkan hasil akurasinya harus lebih baik.
83
DAFTAR PUSTAK
Azwanti. (2018). Analisa Algoritma C4.5 Untuk Memprediksi Penjualan Motor
Pada PT.Capella Dinamik Nusantara Cabang Muka Kuning. Jurnal Ilmiah
Ilmu Komputer, 33-38.
Barros, C. R., de Calvalho, A. C., & Freitas, A. A. (2015). Automatic Design of
Decision-Tree Induction Algorithms. New York: Springer International
Publishing Switzerland.
Firman, A., Wowor, H. F., & Najoan, X. (2016). Sistem Informasi Perpustakaan
Online Berbasis Web. E-journal Teknik Elektro dan Komputer, 29-36.
Firmansyah, Y., & Udi. (2018). Penerapan Metode SDLC Waterfall Dalam
Pembuatan Sistem Informasi Akademik Berbasis Web Studi Kasus Pondok
Pesantren Al-Habi Sholeh Kabupaten Kubu Raya, Kalimantan Barat. Jurnal
Teknologi & Manajemen Informatika, 184-191.
Gat. (2015). Perancangan Basis Data Perputakaan Sekolah dengan Menerapkan
Model Data Relasional. Citec Journal, 304-315.
Haryati, S., Sudarsono, A., & Suryana, E. (2015). Implementasi Data Mining Untuk
Memprediksi Masa Studi Maha Siswa Menggunakan Algoritma C4.5 (Studi
Kasus : Universitas Daehasen Bengkulu). Jurnal Media Infotama, 130-138.
Hendini, A. (2016). Pemodelan UML Sistem Monitoring Penjualan dan Stok
Barang (studi Kasus : Distro Zhezha Pontianak). Jurnal Khatulistiwa
Informatika, 107-116.
Hidayatsyah, M. R. (2013). Penerapan Metode Decision Tree Dalam Pemberian
Pinjaman Kepda Debitur Dengan Algoritma C4.5 (Studi Kasus : Bank
Perkreditan Rakyat Syariah Berkah Dana Fadilah). Tugas Akhir Fakultas
Sains Dan Teknologi Universitas Islam Negeri Sultan S.
kusrini. (2007). Algoritma data Mining. Yogyakarta: Andi.
Maulana, G. G. (2017). Pembelajaran Dasar Algoritma Dan Pemograman
Menggunakan El-Algoritma Berbasis Web. Jurnal Teknik Mesin (JTM), 69-
73.
Mulyapradana, R., & Hatta, M. (2016). Jadi Karyawan Kaya. Jakarta: Visimedia.
84
Nofriansyah, D. (2015). Konsep Data Mining VS Sistem Pendukung Keputusan.
Yogyakarta: Depublish.
Nugroho, K. (2016). Model Analisis Prediksi Menggunakan Metode Fuzzy Time
Series. INFOKAM, 46-50.
Prasetyo, B., Pattiasina, T. J., & Soetarmono, A. N. (2015). Perancangan dan
Pembuatan Sistem Informasi Gudang (Studi Kasus : PT. PLN (Persero)
Area Surabaya Barat). TEKNIKA, 12-16.
Ritayani. (2013). Pengantar Algoritma Dan Pemograman. Teknik Informatika
Fakultas Ilmu Komputer Universitas Almuslim.
Sukatmi. (2014). Implementasi White Box Dan Black BoxDalam penjamin Mutu
Sistem Informasi. Jurnal Cendikia, 42-47.
Sumadya, D. O., Ginardi, R. H., & Akbar, R. J. (2016). Perancangan dan
Implementasi Basis Data Aplikasi Web Fotokita. Jurnal Teknik ITS, A552-
A555.
Vulandari, R. (2017). Data Mining. Yogyakarta: GayaMedia.
Yuliansyah, H. (2014). Perancangan Replikasi Basis Data Mysql Dengan
Mekanisme Pengamana Menggunakan SSL Encryption. Jurnal Informatika,
826-836.