analisa data potensi karyawan untuk menentukan bonus tahunan ...

1

ANALISA DATA POTENSI KARYAWAN UNTUK

MENENTUKAN BONUS TAHUNAN

DENGAN ALGORITMA C4.5

SKRIPSI

Disusun Oleh :

MUHAMMAD TONO SUHANDOKO

311410453

PROGRAM STUDI TEKNIK INFORMARIKA

SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA

BEKASI

2018

ii

PERSETUJUAN

SKRIPSI




Yang disusun oleh :


311410453

Telah disetujui oleh dosen pembimbing skripsi

pada tanggal ________________

iii

PENGESAHAN

SKRIPSI




Yang disusun oleh :


311410453

Telah dipertahankan di depan Dewan Penguji

pada tanggal ________________

Susunan Dewan Penguji

Penguji 1 Penguji 2

Drs.Muhtajuddin Danny.S,Kom.M,Kom Ikhsan Romli.S,Si.M,Sc

NIDN : 0401056703 NIDN : 0413058603

Mengetahui

Kaprodi Teknik Informatika Ketua STT Pelita Bangsa

Aswan S. Sunge. S.E, M.Kom Dr.Ir. Supriyanto, M.P

NIDN : 0426018003 NIDN : 0401066605

iv

SURAT PERNYATAAN KEASLIAN SKRIPSI

Yang bertanda tangan dibawah ini :

Nama : Muhammad Tono Suhandoko

NIM : 311410453

Perguruan Tinggi : STT Pelita Bangsa

Program Studi : Teknik Informatika

Alamat Kampus : Jl. Inspeksi Kalimalang – Tegal Danas

Cikarang Selatan,Bekasi-jawa Barat 17530

Alamat Rumah : Kp.Cibeber RT/RW 001/005 Desa Simpangan

Cikarang Utara Jawa Barat

Dengan ini menyatakan bahwa skripsi yang telah saya buat dengan judul

“ANALISA DATA POTENSI KARYAWAN UNTUK MENENTUKAN BONUS

TAHUNAN DENGAN ALGORITMA C4.5” adalah asli (orisinil) atau tidak plagiat

(menjiplak) dan belum pernah diterbitkan/dipublikasikan dimanapun dan dalam

bentuk apapun. Demikianlah surat pernyataan ini saya buat dengan sebenar-

benarnya tanpa ada paksaan dari pihak manapun. Apabila dikemudian hari ternyata

saya memberikan keterangan palsu dana tau ada pihak lain yang mengklaim skripsi

yang telah saya buat adalah hasil karya milik seseorang atau badan tertentu,saya

bersedia diproses baik secara pidana maupun perdata dan kelulusan saya dari

Sekolah Tinggi Teknologi Pelita Bangsa dicabut/dibatalkan.

Bekasi, November 2018

Yang meyatakan,

(Muhammad Tono Suhandoko)

v

ABSTRAK

Penerapan algoritma C4.5, dapat digunakan dalam menganalisa pegawai yang layak

atau tidaknya untuk menerima bonus tahunan ini berdasarkan kriteria yang telah

ditetapkan yang akan menghasilkan suatu pohon keputusan, dari pohon keputusan

inilah, akan diambil pengetahuan-pengetahuan baru berupa rules atau aturan-aturan

yang akan dijadikan pola keputusan. Oleh karena itu untuk menentukan karyawan

yang layak menerima bonus tahunan.dengan perhitungan klasifikasi algoritma C4.5

ini sekiranya bisa mempermudah dalam menentukan keputusan yang tepat dan

dengan hasil perhitungan secara manual ataupun menggunakan rapidminer

persentasenya cukup besar dan akurat.dengan adanya perhitungan ini sehingga bisa

dikembangkan lagi dengan pembuatan aplikasi yang sederhahana sehingga bisa

membantu pekerjaan agar lebih singkat dan akurat.Dengan adanya perhitungan

penelitian ini sekiranya bisa mempermudah dalam pengenbangan aplikasi yang bisa

berguna untuk kedepanya, algoritma C4.5 adalah sebuah metode perhitungan yang

cukup akurat, dan dengan itu penggunaanya sangat kompleks.

Kata Kunci : Bonus Tahunan Pegawai, Algoritma C4.5

vi

ABSTRACT

The application of the C4.5 algorithm, can be used to analyze employees who are

eligible or not to receive this annual bonus based on predetermined criteria that

will produce a decision tree, from this decision tree, new knowledge will be taken

in the form of rules or rules that will be made a decision pattern. Therefore, to

determine employees who deserve annual bonuses, with the classification

calculation of the C4.5 algorithm, if it can facilitate in determining the right

decisions and with the results of manual calculations or using rapidminer the

percentage is quite large and accurate. again by making simple applications so that

it can help work to be shorter and more accurate.With the calculation of this

research if it can make it easier in the application development that can be useful

for the future, the C4.5 algorithm is a fairly accurate calculation method, and with

that the use is very complex.

Keywords: Employee Annual Bonus, C4.5 Algorithm

vii

KATA PENGANTAR

Puji dan syukur kehadirat Tuhan Yang Maha Kuasa atas segala rahmat dan

karunia-Nya kepada penulis, serta kepada semua pihak yang telah turut dalam

membantu penyelesaian penulisan untuk laporan skripsi ini. Penulis memberi judul

ANALISA DATA POTENSI KARYAWAN UNTUK MENENTUKAN BONUS

TAHUNAN DENGAN ALGORITMA C4.5 Maksud dari penulisan ini adalah untuk

memenuhi persyaratan untuk dan sebagai syarat ujian untuk gelar sarjana computer.

Penulis sadar bahwa penulisan laporan ini masih jauh dari kesempurnaan , baik

secara alamiah maupun secara tehnik, oleh karena itu penulis sangat mengharapkan

adanya kritikan dan saran yang bersifat membangun, sebagai bahan pertimbangan

bagi penulis di masa mendatang.

Selama penelitian dan dalam menyelesaikan laporan ini, penulis telah

banyak menerima bimbingan, pengarahan, petunjuk, dan saran, serta fasilitas yang

membantu hingga akhir dari penulisan laporan ini. Untuk itu penulis

menyampaikan ucapan terima kasih yang sebesar-besarnya kepada :

1. Bapak Dr. Ir. Supriyanto, M.P, selaku ketua STT Pelita Bangsa.

2. Bapak Aswan S. Sunge, S.E., M.Kom, selaku ketua program studi Teknik

Informatika STT Pelita Bangsa.

3. Bapak M Fatchan, S.Kom.,M.Kom, selaku Dosen Pembimbing 1

4. Ibu Putri Anggun Sari,S.Pt.,M.Si. selaku Dosen Pembimbing 2

5. Kepada seluruh Dosen, staf dan karyawan prodi Teknik Informatika Sekolah

Tinggi Teknologi Pelita Bangsa

viii

6. Kepada kedua orang tua saya yang tercinta, dan keluarga kecilku yang ayah

cintai.serta kakak dan adikku yang selalu mendoakan demi keberhasilan, dan

telah memberikan dukungan baik moril maupun material yang tidak terhitung

jumlahnya.

7. Untuk semua teman-teman di TI.14.E.3 yang telah membantu saya dalam

menyusun laporan skripsi ini serta kepada semua pihak yang telah memberikan

dukungannya yang tidak dapat disebutkan satu persatu sehingga penelitian ini

dapat diselesaikan.

8. Untuk semua teman-teman perantauan yang ada di Cikarang ini, yang

senantiasa selalu men-support dan mengingatkan saya agar cepat

menyelesaikan skripsi ini.

Akhirnya semoga Allah SWT memberikan balasan pahala kebaikkan atas

segala bantuan yang telah diberikan kepada penulis. Penulis berharap semoga

lapran ini bermanfaat bagi semua pihak yang membantu,meskipun dalam laporan

ini masih banyak kekurangan. Oleh karena itu, kritik dan saran yang membangun

tetap penulis harapkan.

Cikarang, November 2018

Penulis

(Muhammad Tono Suhandoko)

ix

DAFTAR ISI

Halaman Judul ...................................................................................................... i

Persetujuan ........................................................................................................... ii

Pengesahan .......................................................................................................... iii

Surat Pernyataan Keaslian Skripsi ................................................................... iv

Abstraksi ................................................................................................................ v

Abstract ................................................................................................................. vi

Kata Pengantar .................................................................................................. vii

Daftar isi .............................................................................................................. xii

Daftar Tabel ......................................................................................................... xv

Daftar Gambar .................................................................................................. xvi

BAB I PENDAHULUAN ............................................................................................. 1

1.1 Latar Belakang Masalah ................................................................................ 1

1.2 Identifikasi dan Pembatasan masalah ........................................................... 2

1.2.1 Identifikasi Masalah ........................................................................ 2

1.2.2 Pembatasan Masalah ...................................................................... 3

1.3 Rumusan Masalah ........................................................................................... 3

1.4 Tujuan Penelitian ............................................................................................ 3

1.5 Manfaat Penelitian .......................................................................................... 3

1.5.1Bagi Mahasiswa ............................................................................... 4

1.5.2 Bagi Program Study teknik Informatika .......................................... 4

1.5.3 Bagi Perusahaan .................................................................................... 4

1.6 Sistematika Penulisan ..................................................................................... 5

BAB II TINJAUAN PUSTAKA ........................................................................... 6

2.1 Definisi Judul .............................................................................................. 6

2.1.1 Pengertian Karyawan ...................................................................... 6

2.1.2 Pengertian Bonus ............................................................................ 7

x

2.1.3 Pengertian Data mining.................................................................. 8

2.1.4 Teknik Klasifikasil ....................................................................... 21

2.1.5 Pohon Keputusan ......................................................................... 22

2.1.6 algoritma C4.5 ............................................................................. 24

2.2 Pemograman Web...................................................................................... 26

2.2.1 Pengertian Web.............................................................................. 26

2.2.2 HyperText Markup Language (HTML) ........................................ 26

2.2.3 PHP (Hypertext Preprocesseor) .................................................... 27

2.2.4 CSS (Cascading Style Sheet) ........................................................ 27

2.3 Metode Dan Teknik Pengembangan Sistem ............................................. 28

2.3.1 Metode Pengembangan Sistem .................................................... 28

2.3.2 Teknik Pengembangan Sistem ..................................................... 30

2.4 Rapid Miner .............................................................................................. 35

BAB III METODE PENELITIAN .................................................................... 37

3.1 Tinjauan Organisasi/Objek Penelitian ....................................................... 37

3.1.1 Sejarah .......................................................................................... 37

3.1.2 Visi Misi ....................................................................................... 37

3.1.3 Struktur Organisasi ...................................................................... 38

3.2 Metode Penelitian...................................................................................... 38

3.3 Metode Pengumpulan Data ....................................................................... 40

3.4 Pengolahan Data Awal .............................................................................. 41

3.5 Metode Yang Diusulkan ........................................................................... 45

3.6 Kerangka Pemikiran .................................................................................. 45

3.7 Pengembangan Sistem .............................................................................. 47

3.5.1 Pemodelan Sistem ......................................................................... 47

3.5.2 Perencanaan (Planning) ................................................................ 51

3.5.3 Analisis (Analysis) ........................................................................ 51

3.5.4 Desain (Design) ............................................................................. 51

BAB IV HASIL DAN PEMBAHASAN ............................................................ 53

4.1 Hasil Penelitian ......................................................................................... 53

4.1.1 Jumlah Kasus data KeseluruhanData Training,data Testing......... 53

xi

4.2 Pembahasan ............................................................................................... 55

4.2.1 Pohon Keputusan Berdasarkan Entropy dan Gain ...................... 55

4.2.2 Perhitungan Menggunakan RapidMiner ....................................... 73

4.2.3 User Interface Prediksi ............................................................... 78

BAB V PENUTUP ............................................................................................... 80

5.1 Kesimpulan ............................................................................................... 80

5.2 Saran .......................................................................................................... 80

Daftar Pustaka ....................................................................................................... 81

Lampiran ............................................................................................................... 83

xii

DAFTAR TABEL

Tabel 3.1 Atribut data karyawan PT Indonusa ..................................................... 41

Tabel 3.2 Atribut Yang Tidak Digunakan............................................................. 42

Tabel 3.3. Atribut Yang Digunakan ...................................................................... 42

Tabel 3.4 Skenario Use Case Diagram ................................................................. 47

Tabel 4.1 Data Testing .......................................................................................... 53

Tabel 4.2 Jumlah Nilai Atribut Data Keseluruhan Tabel ...................................... 54

Tabel 4.3 Hasil Perhitungan Entropy Dan Gain Node 1 ...................................... 61

Tabel 4.4 Jumlah Kasus Data Raining Atribut Hasil Pekerjaan Nilai Cukup ... 62

Tabel 4.5 Hasil Perhitungan Entropy dan Gain Node Hasil Perkerjaan Cukup ... 66

Tabel 4.6 Hasil Perhitungan Entropy Dan Gain Node 1.1.2 ................................ 70

Tabel 4.7 Hasil Perhitungan Entropy Dn Gain Node 1.1.2.3 ............................... 72

xiii

DAFTAR GAMBAR

Gambar 2.1 Bidang Ilmu Data Mining. ...................................................................9

Gambar 2.2 Tahapan KDD ....................................................................................11

Gambar 2.3 Fase Fase Pada SDLC ........................................................................29

Gambar 2.4 Model Waterfall .................................................................................30

Gambar 2.5 Notasi Use Case Diagram ..................................................................31

Gambar 2.6 Contoh Use Case Diagram ................................................................32

Gambar 2.7 Notasi Sequence Diagram ..................................................................32

Gambar 2.8 Contoh Sequence Diagram ................................................................33

Gambar 2.9 Notasi Activity Diagram .....................................................................33

Gambar 2.10 Contoh Activity Diagram .................................................................34

Gambar 2.11 Notasi Class Diagram ......................................................................34

Gambar 2.12 Contoh Class Diagram .....................................................................35

Gambar 2.13 Halaman Utama RapiMiner .............................................................36

Gambar 3.1 Struktur Organisasi .............................................................................38

Gambar 3.2 Tahap Penelitian .................................................................................39

Gambar 3.3 Langkah Pengujian Metode ................................................................45

Gambar 3.4 Kerangka Pemikiran ...........................................................................47

Gambar 3.7 Use Case Diagram .............................................................................48

Gambar 3.8 Activity Diagram Login ......................................................................49

Gambar 3.9 Activity Diagram Prediksi ..................................................................49

Gambar.3.10 Activity Diagram Logout ..................................................................50

Gambar 3.11 Sequence Diagram Login .................................................................50

Gambar 3.12 Sequence Diagram Prediksi .............................................................51

Gambar 3.13 Sequence Diagram Logout ...............................................................51

Gambar 3.14 Class Diagram ..................................................................................52

xiv

Gambar 3.15 Tampilan Halaman Login ................................................................53

Gambar 3.16 Tampilan Menu Utama ....................................................................53

Gambar 4.1 Pohon Keputusan Node 1 ...................................................................63

Gambar 4.2 Pohon Keputusan Node 1.1 ................................................................67

Gambar 4.3 Pohon Keputusan Node 1.1.2 .............................................................71

Gambar 4.4 Pohon Keputusan 1.1.2.3 ...................................................................74

Gambar 4.5 Halaman Utama RapidMiner 9.0 .......................................................75

Gambar 4.6 Kotak Dialog Select The Cell To Import ...........................................76

Gambar 4.7 Kotak Dialog Format Your Columns .................................................76

Gambar 4.8 Design Process ...................................................................................77

Gambar 4.9 Tabel Hasil Performance Vektor ........................................................77

Gambar 4.10 Tree View .........................................................................................78

Gambar 4.11 User Interface Halaman login ..........................................................79

Gambar 4.12 User Interface Halaman Prediksi .....................................................80

Gambar 4.13 Pengujian Menu Login .....................................................................80

Gambar 4.14 Pengujian Halaman Prediksi ........................................................... 81

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Seiring dengan berkembangnya teknologi penyimpanan data

berkembang pula kemampuan seseorang dalam mengumpulkan dan

mengelolah data, data yang terkumpul dan berukuran besar tersebut

merupakan aset yang dapat dimanfaatkan untuk dianalisis yang hasilnya

berupa pengetahuan atau informasi berharga untuk masa mendatang, tidak

hanya dunia bisnis namun instasi seperti perusahaan juga mengalami

penumpukan data.

Berbagai pihak berupaya untuk menguasai dan mengembangkan teknologi

dengan cara melakukan kegiatan penelitian maupun pengembangan, informasi juga

sudh dilakukan agar dapat menunjang kemajuan teknologi, trmasuk perusahaan-

perusahaan terus melakukan peningkatan terhadap teknologi didalam perusahaan

agar tetap mengikuti perkembangan zaman.

Berkembangnya sebuah perusahaan harus diimbangi dengan kualitas

sumber daya manusia, sumber daya manusia yang berkualitas di tandai dengan

kemampuaan setiap individu untuk menyelesaikan pekerjaan yang menjadi tanggng

jawabnya masing-masing, perusahaan juga akan memberkan apresiasi terhadap

karyawan yang berprestasi, tekun dan rajin agar dapat mamacu kinerja karyawan

yang lainya.

2

Karyawan merupakan salah satu sumber daya yang sangat penting dan di

perhitungkan di dalam menentukan keberhasilan perusahaan maupun unit kerja

yang ada di dalam perusahaan, perusahaan yang memiliki karyawan yang

berkualitas memungkin dengan mudah mengelola perusahaanya sehingga tujuan

yang telah ditetapkan akan tercapai. Upaya yang dapat dilakukan oleh perusahaan

terhadap karyawannya yang memiliki kualiatas serta integritas yang tinggi terhadap

perusahaan adalah dengan memberikan bonus tahunan kepada karyawan.

Dalam memberikan bonus tahunan perusahaan akan melakukan penilain

terhadap karyawanya, dalam menilai karyawan bukan hal yang mudah bila jumlah

karyawan terlalu banyak, hal ini akan membuat tim penilai menjadi kesulitan dalam

mengolah data maupun mendapatkan hasil yang maksimal, apalagi kriteria penilain

yang banyak akan membuat semua data karyawan harus dilihat dengan teliti dan

hati-hati.

Berdasarkan hal tersebut diatas penulis mengambil penelitian dengan judul

“ANALISA DATA POTENSI KARYAWAN UNTUK MENENTUKAN BONUS

TAHUNAN DENGAN ALGORITMA C4.5”

1.2 Identifikasi Masalah dan Pembatasan masalah

1.2.1 Identifikasi Masalah

Melihat dari latar belakang masalah yang penulis kemukakan diatas maka

dapat diidentifikasikan masalah sebagai berikut:

1. Kesulitan dalam melihat suatu kinerja karyawan yang banyak dalam suatu

divisi.

3

2. Karyawan yang dinilai merupakan karyawan dalam satu bagian, karena

setiap bagian berbeda kriteria penilainnya.

3. Data penilaian belum akurat karena masih ada penilain karyawan yang

tidak obyektif dan tidak sesuai dengan performanya di lapangan.

1.2.2 Pembatasan Masalah

Pembahasan penelitian ini diusahakan tidak menyimpang dari apa yang

telah dirumuskan, oleh karena itu hanya membahas tentang:

1. Perhitungan bonus tahunan karyawan

2. Memilih mana yang masuk dalam kriteria penerimaan bonus tahuanant

3. Pengembangan analisa ini akan dititik beratkan pada penerapan metode data

mining dengan Algoritma C4.5

1.3 Rumusan Masalah

Berdasarkan pada latar belakang dan identifikasi masalah yang sudah

dikemukakan diatas, rumusan masalah pada penelitian ini adalah.

1. Bagaimana menentukan kriteria karyawan yang layak menerima bonus

tahunan?

2. Bagaimana memanfaatkan data mining dengan menggunakan algoritma

C4.5 dalam menganalisa kelayakan penerimaan bonus tahunan?

3. Bagaimana mempermudah tim penilaian dalam pengolahan data karyawan

untuk menentukan bnus tahunan?

1.4 Tujuan Penelitian

Tujuan yang hendak dicapai dalam penelitian ini adalah.

1. Untuk menentukan kriteria karyawan yang layak menerima bonus tahunan.

4

2. Membangun aplikasi sistem pendukung untuk menentukan kelayakan bonus

tahunan karyawan dengan metode algoritma C4.5.

3. Untuk memanfaatkan data mining dalam menentukan bonus tahunan

karyawan.

4. Mempermudah mengetahui cara untuk tim dalam menentukan bonus

tahunan karyawan.

1.5 Manfaat Penelitian

1.5.1 Bagi Mahasiswa

Mahasiswa dapat mengaplikasikan ilmu dan keterampilan yang diperoleh

selama di perkuliahan, dan untuk memenuhi salah satu syarat kelulusan

strata satu (S1) program studi teknik informatika sekolah tinggi teknologi

(STT) pelita bangsa Bekasi.

1.5.2 Bagi Program Study Teknik Informatika

Penelitian ini dapat memberikan informasi bagi peneliti atau calon peneliti

lain untuk menerapkanya kedalam system yang lebih luas dan lebih

kompleks atau sebagai bahan acuan yang dapat di kembangkan bagi

kemungkinan pengembang konsep dan materi lebih lanjut serta dapat

melengkapi referensi pustaka akademik.

1.5.3 Bagi Perusahaan

Mempermudah pihak perusahaan dalam mengambil keputusan untuk

menentukan karyawan yang layak dan tidak layak dalam penerimaan bonus

tahunan secara obyektif berdasarkan data yang ada. serta mempermudah

dalam mengambil penilaian terhadap karyawan.

5

1.6 Sistematika Penulisan

Agar lebih memahami laporan skripsi ini, maka laporan skripsi ini di

kelompoka kedalam beberapa sub bab pembahasan dan menggunakan sistematika

penyampaian sebagai berikut:

BAB I PENDAHULUAN

Menjelaskan mengenai uraian secara umum mengenai latar belakang

masalah, identifikasi masalahdan batasan masalah, rumusan masalah, tujuan

dan manfaat yang ingin dicapai dari penelitian ini serta sistematika

penulisan.

BAB II TINJAUAN PUSTAKA

Menjelaskan tentang teori yang melandasi penelitian algoritma C4.5 untuk

menentukan bonus tahunan karyawan. studi kasus ini untuk memberikan

contoh dalam penelitian.

BAB III METODE PENELITIAN

Menjelaskan tentang metode penelitian dari pengumpulan data eksperimen

dengan menguji data yang ada dengan menggunakan algoritma C4.5 yang

memprediksi seberapa besar bonus tahunan yang di peroleh oleh setiap

karyawan.

BAB IV HASIL DAN PEMBAHASAN

Menjelaskan dan manampilkan hasil prediksi dengan menggunkan

algoritma C4.5.

BAB V PENUTUP

Membahasan tentang kesimpulan dan saran dari penelitian selanjutnya.

6

BAB II

TINJAUAN PUSTAKA

2.1 Definisi Judul

2.1.1 Pengertian Karyawan

Menurut Budiharjo (2015:37) dalam jurnal yang berjudul “system

pengambilan keputusan untuk menentukan status karyawan kontrak menjadi

karyawan tetap menggunakan metode multifactor evaluation process (MFEP)”,

karyawan adalah asset utama perusahaaan yang menjadi perencana dan pelaku aktif

dari aktivitas organisasi. Karyawan adalah seorang pekerja yang bekerja dibawah

perintah orang lain dan mendapat kompensasi serata jaminan.

Menurut Prawironegoro dan Purwanti (2016:55), ‘karyawan atau tenaga

kerja dalam hal ini adalah manusia yang bekerja dengan mendapatkan upah, oleh

sebab itu lazim disebut buruh’. Terdapat dua jenis tenaga kerja yaitu tenaga kerja

intelektual (manajer dan staf) dan tenaga kerja fisik (buruh). Manajer dan staf pada

umumnya menerima gaji bulanan dan berbagai fasilitas yang manusiawi,

sedangkan buruh pada umumnya menerima upah jam-jaman, harian, mingguan, dan

borongan. Buruh adalah pelaksana, yaintu penggerak alat kerja untuk mencapai

sasaran kerja. Oleh sebab itu Ia lazim disebut kaum produsen, karena Ia yang

langsung menghasilkan komoditi.

Karyawan merupakan aset yang berharga bagi sebuah perusahaan dalam

mencapai tujuannya fokus utama manajemen sumber daya manusia (SDM) adalah

memberikan kontribusi atas suksesnya perusahaan agar produktifitas perusahaan

7

berjalan lancar diperlukan tenaga kerja atau karyawan yang sesuai dengan prinsip

“the right man in the right place” sejalan dengan itu maka langkah awal yang

menjadi kunci utama yaitu proses rekrutmen dan seleksi untuk merekrut tenaga

kerja sesuai dengan kebutuhanny proses seleksi merupakan serangkaian langkah

kegiatan yang digunakan untuk memutuskan kandidat (calon karyawan) yang dapat

di tempatkan secara tepat saat ini di mana persaingan untuk mendapatkan pekerjaan

semakin kuat perusahaan sering kali mengalami kesulitan dalam menentukan

kandidat (Putra Hertanto Muhammad, 2014)

2.1.2 Pengertian Bonus

Menurut Mulyapradana (2016) “Bonus adalah pendapatan tambahan yang

berfungsi sebagai pendorong semangat agar karyawan semakin bergairah dalam

meningkatkan prestasi kerja dan loyalitas pada perusahaan”. Adapun tujuan

program bonus yang diberikan perusahaan, sebagai berikut:

a. Bagi Perusahaan

Tujuan pemberian bonus dimaksudkan untuk meningkatkan produksi dengan

cara mendorong karyawan agar bekerja disiplin dan memiliki semangat yang

lebih tinggi. Diharapkan dengan pemberian bonus ini dapat mencapai tujuan

dalam menghasilkan kualitas produksi yang lebih baik, meningkatkan

efektivitas dan efisiensi dalam penggunaan faktor produksi, serta mencegah

terjadinya turn over karyawan yang tinggi.

b. Bagi Karyawan

Dengan pemberian bonus dari perusahaan, diharapkan karyawan memperoleh

banyak keuntungan. Keuntungan yang merupakan komponen non-upah ini,

8

misalnya mendapatkan gaji yang lebih besar di akhir tahun, mendapat

dorongan untuk mengembangkan dirinya, berusaha bekerja dengan sebaik-

baiknya, dan loyalitas terhadap perusahaan.

2.1.3 Pengertian Data mining

Menurut fayyed (2017:1) yang terdapat dalam buku “data minig untuk

klasifikasi dan klasterisasi data”, Data mining adalah langkah analisa terhadap

proses penemuan pengetahuan di dalam basis data atau knowledge discovery in

databases yang di singkat KDD.

Menurut Clifton (2017:1) dalam buku “Data mining untuk klasifikasi dan

klasterisasi data” data mining merupakan gabungan sejumlah disiplin ilmu

computer, yang didefinisikan sebagai proses penemuan pola baru dari kumpulan-

kumpulan data sangat besar, meliputi metode-metode yang merupakan irisan dari

artificial intelligence, machine learning, statistics dan databases system.

Kemajuan luar biasa yang terus berlanjutdalam bidang data minng didorong

beberapa factor antara lain,

1. Pertumbuhan yang cepat dalam kumpulan data.

2. Penyimpanan data dalam warehouse data, sehingga perusahaaan memiliki

akses ke dalam database yang andal

3. Adanya peningkatan akses data melalu navigasi web dan internet.

4. Tekanan kompetisi bisnis untuk meningkatkan penguasaan pasar dalam

globalisasi ekonomi.

5. Perkembangan teknologi perangkat lunak untuk data minng (ketersedian

teknologi).

9

6. Perkembangan yang hebat dalm kemampuan komputasidan

pengembangan kapasitas media penyimpanan.

Dari definisi-definisi yang telah disampaikan, hal yang terpenting terkait

dengan data minig adalah:

1. Data mining nerupakan suatu proses otomatis terhadap data yang sudah

ada.

2. Tujuan data mining adalah mendapatkan hubungan atau pola yang

mungkin memberikan indekasi yang bermanfaat.

3. Data yag akan diproses berupa data yang sangat besar.

Gambar 2.1 Bidang Ilmu Data Mining.

Data mining bukanlah suatu bidang yang sama sekali baru. Salah satu

kesulitan untuk mendefiniskan data mining adalah kenyataan bahwa data mining

mewaris banyak aspek dan teknik dari idang-bidang imu yang sudah mapan

10

terlebih dahulu gambar 2.1 menunjukan bahwa data mining memiliki akar yang

panjang dari bidang ilmu seperti kecerdasan buatan (artificial intellegion),

machine learning, statistic, database, dan juga information retrieval

(pramudiono,2009)

A. Proses Data mining

Data mining merupakan salah satu dari rangkaian knowledge Discovery in

Database (KDD) knowledge Discovery in Database. Berhubungan denagan teknik

integrasi dan penemuan ilmia, interpretasi dan visualisasi dari pola-pola sejumlah

data. Serangkain proses tersebut memiliki tahap sebagai berikut (Azwanti,2018);

1. pembersihan data (untuk membuang data yang tidak konsisten dan noise)

2. integrasi data (penggabungan data dari beberapa sumber)

3. tranformasi data (data diubah menjadi bentuk yang sesuai untuk di-mining)

4. Aplikasi teknik Data mining, proses ekstrasi pola dari data yang ada.

5. Evaluasi pola yang ditemukan (proses interpretasi pola menjadi

pengetahuan yang dapat digunakan untuk mendukung pengambilan

keputusan).

6. Presentasi pengetahuan (dengan teknik visualisasi).

Langkah terakhir KDD adalah mempresentasikan pengetahuan dalam

bentuk yang mudah dipahami pengguna.

11

Gambar 2.2 Tahapan KDD

Cross-industry standard process for data mining (CRISP-DM) yang

dikembangkan tahun 1996 oleh analisis daribeberapa industry seperti Daimler

Chrysler, SPSS dan NCR. CRISS DM menyediakan standar proses data mining

sebagai strategi pemecahan masalah secara umum dari bisnis atau unit penelitian.

Enam fase CRISS-DM (Vulandari, 2017);

1 Fase Pemahaman Bisnis (business understanding phase)

a. Penentuan tujuan proyek dan kebutuhan secara detail dalam lingkup

bisnis atau unit penelitian secara keseluruhan.

b. Menerjemakan tjuan dan batasan menjdi formula dalam data mining

c. Menyiapkan strategi awal untuk mencapai tujuan.

2 Fase Pemahaman Data (Data understanding phase)

a. Mengumpulkan data

b. Menggunakan analisis penyelidikan data untuk mengenali lebih lanjut

data dan pencarian pengetahuan awal.

c. Mengevaluasi kualitas data

12

3 Fase Pengolahan Data (Data Preparation Phase)

a. Siapkan dari data awal, kumpulkan data yang akan digunakan untuk

fase berikutnya.

b. Pilih kasus dan variable yang ingin di analisis dan yang sesuai dengan

analisis yang akan dilakukan.

c. Lakukan perubuhan pada beberapa variable jika di butuhkan.

d. Siapkan data awal sehingga siap untuk perangkat pemodelan.

4 Fase Pemodelan (Modeling Phase)

a. Pilih dan aplikasikan teknik pemodelan yang sesuai.

b. Kalibrasi aturn model untuk meng optimalkan hasil.

c. Perlu di perhatikan bahwa beberapa teknik mungkin untuk digunakan

pada permasalan data mining yang sama.

d. Jika di perlukan, proses dapat kembali ke fase pengolahan data untuk

menjadi data kedalam bentuk yang sesuai dengan spesifikasi kebutuhan

teknik data mining tertentu.

5 Fase Evaluasi (Evaluation Phase)

a. Mengevaluasi satu atau lebih model yang digunakan dalam fase

pemodelan untuk mendapatkan kualitas dan efektifikas sebelum

disebarkan untu digunakan.

b. Menetapkan apakah terdapat model yang memenuhi tujuan pada fase

awal.

c. Menentukan apakah terdapat permasalah penting dari bisnis atau

penelitian yang tidak tertangani dengan baik.

13

d. Mengambil keputusan berkaitan dengan penggunaan hasil dari data

mining

6 Fase Penyebaran (deployment Phase)

a. Menggnakan model yang dihasilkan. Terbentuknya model tidak

menandakan terselesainya proyek.

b. Contoh sederhana penyebaran: pembuatan laporan.

c. Contoh komplek penyebaran: penerapan proses data mining secara

paralel pada departemen lain.

B. Pengelompokan Data mining

Berdasarkan fungsionalitas, tugas-tugas data minig bisa di kelompokan ke

dalam enam kelompok berikut ini, (Fayyad, 2017:3) dalam buku “data mining

untuk klasifikasi dan klasterisasi data”:

1. Deskripsi

Terkadang penelitian dan analis secara sederhana ingin mencoba

mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat

dalam data sebagai contoh, petugas pengumpulan suara mungkin tidak

dapat menemukan ketarangan atau fakta bahwa siapa yang tidak cukup

professional akan sedikit didukung dalam dalam pemilihan presiden.

Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan

penjelasan untuk suatu pola atau kecenderungan.

2. Estimasi

Estimasi hamper sama dengan klasifikasi, kecuali table target estimasi

lebih kearah numarik daripada ke arah kategori. Model dibangun

14

menggunakan record lengkap dengan menyediakan nilai dari variebel target

sebagai nilai prediksi. Selanjutnya, pada peninjaauan berikutnya estimasi

nilai dari variebel target dibuat berdasarkan nilai variebel prediksi. Sebaga

contoh, akan dilakukan estimasi tekanan darah sistonik pada pasien rumah

sakit berdasrka umur pasien, jenis kelamin, indeks berat badan, dan level

sodium darah. Hubungan tekanan darah sistolik dan nilai variebel prediksi

dalam proses pembelajaran akan meng hasilkan model estimasi. Model

estimasi yang dihasilkan dapat digunakan untuk kasus baru lainya.

Contoh lain yaitu estimasi nilai indeks prestasi komulatif mahasiswa

program pasca sarjana dengan melihat nilai indeks prestsi mahasiswa

tersebut pada set mengikuti program sarjana.

3. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali dalam

prediksi nilai dari hasil akan ada dimasa mendatang.

Contoh prediksi dalam bisnis dan penelitian adalah:

Prediksi harga beras dalam tiga bulan mendatang.

Prediksi persentase kenaikan kecelakan lalu lintas tahun depan jika

batas bawah kecepatan dinaikan.

Beberapa metode dan teknik yang digunakan dalm klasifikasi dan

estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi.

15

4. Klasifikasi

Dalam klasifikasi terdapat target variebel kategori. Sebagai contoh,

penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu:

pendapatan tinggi, pendapatan sedang, dan pendapatan rendah.

Contoh lain klasifikasi dalam bisnis dan penelitian adalah:

Menentukan apakah suatu transaksi kartu kredit merupakan

transaksi yang curang atau bukan.

Memperkirakan apakah suatu pengajuan hipotek oleh nasabah

merupakan suatu kredik yang baik atau buruk.

Mendiagnosis penyakit seorang pasien untuk mendapatkan

termasuk kategori penyakit apa.

5. Pengklusteran

Pengklusteran merupakan pengkelompokan record, pengamatan,

atau memperhatikan dan membentuk kelas objek-objek yang memilik

kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan satu

dengan yang lainya dan memiliki tidak kemiripan dengan record-record

dalam kluster lain.

Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya

variebel target dalam pengklusteran. Pengklusteran tidak mencoba untuk

melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari varibel

target. Akan tetapi, algoritma pengklusteran mencoba untuk melakukan

pembagian terhadap keseluruhan data nmenjadi kelompok-kelompok yang

memiliki kemiripan (homogeny), yang mana kemiripan record dalam satu

16

kelompok akan bernilai maksimal sedangkan kemiripan dengan record

dalam kelompok lain akan bernilai minimal.

Contoh pengklusteran dalam bisnis dan penelitian adalah:

Mendapatkan kelompok-kelomok konsumen untuk target

pemasaran dari suatu produk bagi perusahaan yang tidak memiliki

dana pemasaran yang besar.

Untuk tujuan audit akuntasi, yaitu melakukan pemisahan terhadap

perilaku finansial dalam baik dan mencurigakan.

Melakuakn pengklusteran terhadap ekspresi dari gen, untuk

mendapatkan kemiripan perilaku dari gen dalam jumlah besar.

6. Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang

mencul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis

keranjang belanja.

Contoh asosiasi dalam bisnis dan penelitian adalah:

Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler

yang diharapkan untuk memberikan respon positif terhadap

penawaran upgrade layanan yang diberikan

Menemukan barang dalam supermarket yang di beli secara

bersamaan dan barang yang tidak pernah dibeli secara bersamaan.

17

C. Teknik pembelajaran Data mining

Teknik yang digunakan dalam data mining erat kaitanya dengan “penemuan”

(discovery) dan” pembelajaran” (learning) yang terbagi dalam tiga metode utama

pembelajaran (Retno,2017) yaitu:

a. Supervised learning

Supervised learning adalah teknik yang paling banyak digunakan. Teknik

sama dengan “programing by example”. Teknik ini melibatatkan fase

pelatihan history yang karekter-karekternya dipetakan ke hasil-hasil yang

telah di ketahui diolah dalam algoritma data mining. Proses ini melatih

algoritma untuk mengenali variebel-variebel dan nilai-nilai kunci yang

nantinya akan digunakan sebagai dalam membuat perkiraan-perkiraan

ketika diberikan data baru.

b. Unsupervised learning

Teknik pembelajaran ini tidak melibatkan fase pelatihan seperti yang

terdapat pada supervised learning teknik tergantung pada penggunaan

algoritma yang mendeteksi semua pola, seperti associations dan sequences,

yang muncul dari kriteria penting yang spesifik dalam data masukan.

Pendekatan ini mengaah pada pembuatan banyak atuan (rule) yang

mengkarakterisasikan penemuan associations clusters, dan segments.

aturan-aturan ini kemudian dianalisis untuk menemukan hal-hal yang

penting.

18

c. Reinforcement learning

Teknik pembelajaran ini jarang digunakan dibandingkan dengan dua teknik

lainya, namun memiliki penerapan-penerapan yang terus dioptimalkan dari

waktu ke waktu dan memiliki control yang adaptif. tekni ini sangat

menyerupai kehidupan nyata yaitu seperti “on job training”, dimana

seorang pekerja diberikan sekumpulan tugas yang membutuhkan

keputusan-keputusan. Pada beberapa titik waktu kelak diberikan penilaian

atas performance pekerja tersebut kemudian pekerja di minta mengevaluasi

keputusan-keputusan yang telah dibuatnya sehubungan dengan hasil

performance pada pekerja tersebut. reinfocement learning sangat tepat di

gunakan untuk menyelesaikan masalah-masalah yang sulit yang

bergantung pada waktu.

D. Kategori Data mining

Data mining di bagi menjadi dua kategori utama Han dan Kember (2006)

yaitu:

1. Prediktif

Tujuan dari tugas prediktif adalah untuk memprediksi nilai dari atribut

tertentu berdasarkan pada nilai-nilai atribut lain, atribut yang di prediksi

umumnya dikenal sebai target atau variebel tak bebas, sedangkan

atribut-atribut yang di gunakan untuk membuat prediksi di kenal sebagai

explanatory atau variebel bebas.

19

2. Deskriptif

Tujuan dari tugas deskriptis adalah untuk menurunkan pola-pola

(korelasi, trend, cluster, teritori, dan nomaly) yang meringkas hubungan

yang pokok dalam data. Tugas data mining deskriptif sering merupakan

penyelidikan dan sering kali memerlukan tekni post processing untuk

validasi dan penjelasan hasil.

E. Tranformasi Data

Tranformasi data adalah merupakan skala data kedalam bentuk lain

sehingga data memiliki distribusi yang diharapkan menurut vulandari (2017,5).

Setiap data dilakukan operasi matematika yang sama pada data aslinya. Berarti kita

merubah semua data untuk menjaga perbedaan antar data relative data tetap. Jika

data kita data tidak berubah. Ada bebrapa jenis tranformasi data yang sering

digunakan, diantaranya memiliki lebih dari satu variebel agar hubungan antar

1) Tranformasi kuadrat, berarti kita mengoperasikan pangkat dua data

variebel.

2) Tranformasi kubik, berarti kita mengoperasikan pangkat tiga pada data

variebel asli.

3) Tranformasi akar, berarti kita mengoperasikan akar pada data variabel asli.

Berguna untuk memperbaiki data yang terdistribusi positive skewnessdan

unequal varience (data tidak memenuhi asumsi kehomogennan). Dapat

digunakan data persentase, jika nilainya kebanyakan kecil maka sebaikny

gunakan tranformasi akar.

20

4) Tranformasi invers/kebalikan, melakukan operasi balikan baik balikan

pangkat atau tidak.

5) Tranformsi logaritma, berarti kita mengoperasikan data asli kebentuk

logaritma. Digunakan untu data yang terdistribusi positif skewness dan

unequal variance. Ada beberapa hal yang perlu di perhatikan. Jika pada data

asli menunjukan nilai kurang dari 10 atau mendekati nol, maka gunakan

log(x+1); jika data banyak mendekati nol seperti decimal, maka sebaiknya

dikalikan 10 lalu dilogaritmakan atau log((10x).

6) Tranformasi arcsin, berarti kita mengoperasikan data asli kebentuk arcsin

(balikan sinus). Disebut juga tranformasi angular yang digunakan bila data

dinyatakan dalam bentuk presentase atau proporsi. Biasanya memiliki

sebaran Binomial. Ada beberapa hal yang perlu diperhatikan, apabila data

asli memiliki nilai antara 30%-70% maka tidak membutuhkan tranformasi;

bila memiliki nilai 0%-30%70%-100% maka lakukan tranformasi arcsin

dan bila banyak bernilai nol maka gunakan tranformasi arcsin akar (%+0,5).

7) Tranformasi invers skor, digunakan dalam data yang terdapat nilai negative

dan akan menggunakan tranformasi berikutnya. Berguna untuk

memperbaiki data yang terdistribusi positif skewness dan unequal variance.

Pada umumnya untuk menentukan jenis tranformasi mana yang paling tepat

digunakan adalah dengan memplot data kita dan melihat trend dari data tersebut

atau berdasarkan histogram dari data tersebut vulandari (2017,5).

21

2.1.4 Teknik Klasifikasi

Menurut Vulandari (2017) Clasifiksion adalah sebuah model dalam data

mining dimana, classifier dikontruksi untuk memprediksi categorical label, seperti

“aman” atau “beresiko” untuk data aplikasi peminjaman uang; “ya” atau “tidak”

untuk data marketing; atau “treatment A”,”treatment B” atau “treatment C” untuk

data medis. Kategori tersebut dapt direpresentasikan dengan nilai yang sesuai

dengan kebutuhanya, dimana pengaturan dari nilai tersebut tidak memiliki arti

tertentu.

Classification dan association rule discovery merupakan tugas yang sama

dalam data mining, dengan pengecualian bahwa tjuan utama dari klasifikasi adalah

prediksi label kelas, sedangkan asosiasi aturan penemuan menggambarkan kolerasi

antara item dalam database transaksional Vulandari (2017).

Proses data klasifikasi memiliki dua tahapan, yang pertama adalah learning:

yaitu training data dianalisa dengan menggunakan sebuah algoritma klasifikasi.

Yang kedua adalah classification: yaitu pada tahap ini test data digunakan untuk

mengestimasikan ketepan dari clarification rules. Jika keakuratan dikondisikan dan

yang diperkirakan dapat diterima, rele tersebut dapat di aplikasikan pada klasifiki

lainya dari tuple data yang baru. Vladimir Nikulin (2008) lebih spesifikasi

mengatakan bahwa, classification hanya bisa diterapkan pada data training yang

sangat kuat dimana diasumsikan bahwa kelas “positif” sudah mewakili minirotis

tanpa kehilangan atribut umum.

22

2.1.5 Pohon keputusan

Pohon dalam analisis pemecahan masalah pengambilan keputusan adalah

pemetaan mengena alternative-alternatif pemecahan masalah yang dapat diambil

dari masalah tersebut. Pohon tersebut juga memperlihatkan factor-faktor

kemungkinan/probablitas ang akan mempengaruhi alternative-alternatif keputusan

tersebut, disertai dengan estimasi hasil akhir yang akan didapat bila kita mengambil

alternative keputusan tersebut Vulandari (2017,14).

Pohon kputusan adalah salah satu metode klasifikasi yang paling popular

karena mudah untuk diinterpretasi oleh manusia. Pohon keputusan adalah model

prediksi menggunakan struktur pohon atau struktur berhirarki. Konsep dari pohon

keputusan dan aturan-aturan keputusan. Manfaat utama dari peggunaan pohon

keputsan adalah kemampuan untuk mem-break down proses pengambil keputusan

yang kompleks menjadi lebih simple sehingga pengambilan keputusan akan lebih

menginterpretasikan solusi dari permasalahan pohon keputusan juga berguna untuk

mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon

variebel input dengan sebuah variebel target. Pohon keputusan memadukan antara

eksplorasi data dan pemodelan, sehingga sangat bagus sebagai langkah awal dalam

proses pemodelan bahkan dijadikan sebagai model akhir dari beberapa teknik lain.

Sering terjadi tawar menawar antara keakuratan model dengan transparansi model.

Dalam beberapa aplikasi, akurasi dari sebuah klasifikasi atau prediksi adalah satu-

satunya hal yang ditonjolkan, misalnya sebuah perusahaan direct mail membuat

sebuah model yang akurat untuk memprediksi anggota mana yang berpontensi

23

untuk merespon permintaan, tanpa memperhatikan bagaimana atau mengapa model

tersebut bekerja Vulandari (2017,16).

1. Kelebihan Pohon keputusan

Kelebihan dari metod pohon keputusan adalah:

Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat

global, dapat diubah menjadi simpel dan spesifik.

Eliminasi perhitungan perhitungan yang tidak diperlukan, karena ketika

menggunakan metode pohon keputusan maka sample diuji hanya

berdasarkan kriteria atau kelas tertentu.

Fleksibel untuk memilih fitur dari internel node yang berbeda fitur yang

terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain

dalam node yang sama kefleksibelan metode pohon keputusan

ininmeningkatkan kualitas keputusan yang dihasilkan jika dibandingkan

ketika menggunakan metode penghitungan suatu tahap yang lebih

konvesional.

Dalam analisis multi variat, dengan kriterian dan kelas yang jumlahnya

sangat banyak seorang penguji biasanya perlu untuk mengestimasikan

baik itu distribusi dimensi tinggi ataupun parameter tertentu

daridistribusi kelas tersebut. Metode keputusan dapat menghindari

munculnya permasalahan ini dengan menggunakan kriteria yang jumlah

lebih sedikit pada setiap node internal tanpa banyak mengurangi kualitas

keputusan yang di hasilkan.

24

2. Kekurangan Pohon Keputusan

Terjadi overlap ketika kelas-kelas dan kriteria yang digunakan

jumlahnya sangat banyak. Hal tersebut juga dapat menyebabkan

meningkatnya waktu pengambilan keputusan dan jumlah memori yang

diperukan.

Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah pohon

keputusan yang besar.

Kesulitan dalam mendesain pohon keputusan yang optimal.

Hasil kualitas keputusan yang didapat dari metode pohon keputsan

sangat tergantung pada bagaimana pohon tersebut didesain.

2.1.6 Algoritma C4.5

Menurut Sukma Putri Utari (2015:3) Algoritma C4.5 merupakan algoritma

yang digunakan untuk membentuk pohon keputusan. Sedang pohon keputusan

dapat diartikan suatu cara untuk memprediksi atau mengklarifikasi yang sangat kuat.

Pohon keputusan dapat membagi kumpulan data yang besar menjadi himpunan-

himpunan record yang lebih kecil dengan menerapkan serangkaian aturan

keputusan.

Secara umum algoritma C4.5untuk membangun pohon keputusan adalah

sebagai berikut:

1. Pilih atribut sebagai akar

2. Buat cabang untuk masing-masing nilai

3. Bagi kasus dalam cabang

25

4. Ulangi proses untuk masing-masing cabangsampai semua kasus pada

cabang memiliki kelas yang sama.

5. Untuk memilih atribut sebagai akar, di dasarkan pada nilai gain tertinggi

dari atribut-atribut yang ada.

Dengan

S = himpunan kasus,

A = atribut,

n = jmlah partisi atribut

Ai|Si| = jumlah kasus pada partisi ke-I dan

|S |= jumlah kasus dalam S

Sedangkan perhitungan nilai entropy dapat di lihat pada rumus dua berikut:

𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑠) = ∑ −𝑝𝑖 ∗ 𝑙𝑜𝑔2𝑝𝑖

𝑛

𝑖=1

Dimana :

S : Himpunan kasus

A : Atribut

N : Jumlah partisi S

Pi : Proporsi dari Si terhadap S

1

| |,

| |

n

i

SiGain S A Entropy S Entropy Si

S

26

2.2 Pemograman WEB

2.2.1 Pengertian WEB

“Definisi kata web adalah Web sebenarnya penyederhanaan dari sebuah

istilah dalam dunia komputer yaitu WORLD WIDE WEB yang merupakan bagian

dari tekhnologi Internet. World wide Web atau disingkat dengan nama www,

merupakan sebuah sistem jaringan berbasis Client-Server yang mempergunakan

protokol HTTP (Hyperteks Transfer Protocol) dan TCP/IP (Transmisson Control

Protocol / Internet Protocol) sebagai medianya. Karena kedua sistem ini

mempunyai hubungan yang sangat erat, maka untuk saat ini sulit untuk

membedakan antara HTTP dengan WWW”. (Hastanti, dkk 2015:1-2)

2.2.2 HyperText Markup Language (HTML)

Menurut Harison dan Syarif (2016:43) “HTML adalah sebuah bahasa

markup yang digunakan untuk membuat sebuah halaman web, menampilkan

berbagai informasi di dalam sebuah Penjelajah web Internet dan formating

hypertext sederhana yang ditulis kedalam berkas format ASCII agar dapat

menghasilkan tampilan wujudyang terintegerasi. Dengan kata lain, berkas yang

dibuat dalam perangkat lunakpengolah kata dan disimpan kedalam format ASCII

normal sehingga menjadi home page dengan perintah-perintah HTML. Bermula

dari sebuah bahasa yang sebelumnya banyak digunakan di dunia penerbitan dan

percetakan yang disebut dengan SGML (Standard Generalized Markup Language),

HTML adalah sebuah standar yang digunakan secara luas untuk menampilkan

halaman web. HTML saat ini merupakan standar Internet yang didefinisikan dan

27

dikendalikan penggunaannya oleh World Wide Web Consortium(W3C). HTML

dibuat oleh kolaborasi Caillau TIM dengan Berners-lee Robert tahun 1989”.

2.2.3 PHP (Hypertext Preprocesseor)

“PHP adalah sebuah bahasa pemograman yangberjalan dalam sebuah web-

server (serverside). PHPdiciptakan oleh programmer unix dan Perl yangbernama

Rasmus Lerdoft pada bulanAgustus-September1994. Script PHP adalah bahasa

program yang berjalanpada sebuahwebserver, atau sering disebut server-side, Oleh

karena itu PHP dapat melakukan apa saja yangbisadilakukan program CGI lain,

yaitu mengolah data dengantipe apapun, menciptakanhalaman web yang dinamis

serta menerima dan menciptakan cookies, dan bahkanPHP bisamelakukan lebih

dari itu”. (Harison dan Syarif 2016:42).

2.2.4 CSS (Cascading Style Sheet)

Menurut Winarno dan Utomo (2010:106) dalam Prayitno dan Safitri

(2015:2) menerangkan bahwa “CSS merupakan bahasa pemrograman web yang

digunakan untuk mengatur style-style yang ada di tagtag HTML”.

Menurut Simarmata (2010:148) dalam Firmansyah dan Udi (2018:185)

Mendefinisi-kan bahwa “PHP (Hypertext Preprocessor) adalah PHP mengijinkan

pengembang untuk menempelkan kode didalam HTML dengan menggunakan

bahasa yang sama seperti perl dan UNIX shells.”

28

2.3 Metode Dan Teknik Pengembangan Sistem

2.3.1 Metode Pengembangan Sistem

A. System Development Life Cycle (SDLC)

“Software Development Life Cycle atau yang sering disebut System

Development Life Cycle adalah proses mengembangkan atau mengubah suatu

sistem perangkat lunak dengan menggunakan model-model dan metodologi yang

digunakan orang untuk mengembangkan sistem-sistem perangkat lunak

sebelumnya”. (Mulyani, 2016).

Menurut Sukamto dan Shalahuddin (2013:26) dalam Firmansyah dan Udi

(2018:185) mengemukakan bahwa “SDLC atau Software De-velopment Life Cycle

atau sering disebut juga System Development Life Cycle adalah proses mengem-

bangkan atau mengubah suatu sistem perangkat lu-nak dengan menggunakan

model-model dan metod-ologi yang digunakan orang untuk mengembangkan

sistem-sistem perangkat lunak sebelumnya, berdasarkan best practice atau cara-

cara yang sudah teruji baik.”

B. Fase – fase yang ada Pada SDLC

1. Perencanaan (Planning)

Tahap perencanaan adalah proses mendasar untuk memahami mengapa

sebuah sistem informasi harus dibangun dan menentukan bagaimana tim proyek

akan membangunnya.

2. Analisis (Analysis)

Tahap analisis menjawab pertanyaan siapa yang akan menggunakan sistem,

sistem apa yang akan dilakukan, dan dimana dan kapan akan digunakan.

29

3. Desain (Design)

Tahap perancangan memutuskan bagaimana sistem akan beroperasi, dalam

hal perangkat keras, perangkat lunak, dan infrastruktur jaringan; antarmuka

pengguna, formulir dan laporan, database, dan file yang akan dibutuhkan.

4. Pelaksanaan (Implementation)

Tahap akhir dalam SDLC adalah tahap implementasi, dimana sistem

dibangun atau dibeli, dalam kasus desain software yang dikemas (Dennis,dkk,2009).

Gambar 2.3 Fase Fase Pada SDLC

C. Pengembangan Sistem Dengan Waterfall

Model Waterfall merupakan salah satu model pengembangan perangkat

lunak yang ada di dalam model SDLC (Sequencial Development Life Cycle).

Model waterfall sering juga disebut model sekuensi linear atau alur hidup klasik.

Pengembangan sistem dikerjakan secara terurut mulai dari planning, analysis,

design, implementation dan system.

30

Gambar 2.4 Model Waterfall

Kelebihan menggunakan metode pengembangan air terjun (waterfall)

adalah metode ini memungkinkan untuk departementalisasi dan kontrol. Proses

pengembangan model fase one by one, sehingga meminimalis kesalahan yang

mungkin akan terjadi.

Kekurangan menggunakan metode pengembangan waterfall adalah metode

ini tidak memungkinkan untuk banyak revisi jika terjadi kesalahan dalam

prosesnya. Karena setelah aplikasi ini dalam tahap pengujian, sulit untuk kembali

lagi dan mengubah sesuatu yang tidak terdokumentasi dengan baik dalam tahap

konsep sebelumnya.

2.3.2 Teknik Pengembangan Sistem

A. UML (Unified Modelling Language)

Menurut Windu Gata, Grace (2013:4) dalam Hendini (2016:108), “Unified

Modeling Language (UML) adalah bahasa spesifikasi standar yang dipergunakan

untuk mendokumentasikan, menspesifikasikan dan membanngun perangkat lunak.

UML merupakan metodologi dalam mengembangkan sistem berorientasi objek dan

juga merupakan alat untuk mendukung pengembangan sistem”.

31

Dengan menggunakan UML kita dapat membuat model untuk semua jenis

aplikasi piranti lunak, dimana aplikasi tersebut dapat berjalan pada piranti keras,

sistem operasi dan jaringan apapun, serta ditulis dalam bahasa pemrograman

apapun. Tetapi karena UML juga menggunakan class dan operation dalam konsep

dasarnya, maka ia lebih cocok untuk penulisan piranti lunak dalam bahasa-bahasa

berorientasi objek seperti C++, Java, C# atau VB.NET. Walaupun demikian, UML

tetap dapat digunakan untuk modeling aplikasi prosedural dalam VB atau C.

B. Behavioral Diagram

1. Use Case Diagram

Use case diagram merupakan pemodelan untuk kelakuakn (behavior) sistem

informasi yang akan dibuat. Use case digunakan untuk mengetahui fungsi apa saja

yang ada di dalam sistem informasi dan siapa saja yang berhak menggunakan

fungsi-fungsi tersebut. Gambar dibawah ini adalah gambar notasi dari use case

diagram :

Gambar 2.5 Notasi Use Case Diagram

32

Berikut ini adalah Contoh Use Case Diagram :

Gambar 2.6 Contoh Use Case Diagram

2. Sequence Diagram

Sequence Diagram menggambarkan kelakuan objek pada use case dengan

mendeskripsikan waktu hidup objek dan pesan yang dikirimkan dan diterima antar

objek. Simbol-simbol yang digunakan dalam Sequence Diagram yaitu:

Gambar 2.9 Notasi Sequence Diagram

33

Contoh Squence Diagram :

Gambar 2.10 Contoh Sequence Diagram

3. Activity Diagram

Activity Diagram menggambarkan workflow (aliran kerja) atau aktivitas

dari sebuah sistem atau proses bisnis. Simbol-simbol yang digunakan dalam activity

Diagram yaitu :

Gambar 2.11 Notasi Activity Diagram

34

Contoh Activity Diagram :

Gambar 2.12 Contoh Activity Diagram

4. Class Diagram

Merupakan hubungan antar kelas dan penjelasan detail tiap-tiap kelas di

dalam model desain dari suatu sistem, juga memperlihatkan aturan-aturan dan

tanggung jawab entitas yang menentukan perilaku sistem. Class Diagram juga

menunjukkan atribut-atribut dan operasi-operasi dari sebuah kelas dan constraint

yang berhubungan dengan objek yang dikoneksikan. Gambar dibawah ini adalah

gambar notasi dari class diagram

Gambar 2.13 Notasi Class Diagram

35

Berikut ini adalah contoh dari Class Diagram :

Gambar 2.13 Contoh Class Diagram

2.4 Rapid Miner

Rapid Miner merupakan perangkat lunak yang bersifat terbuka (open

source). Rapid Miner adalah sebuah solusi untuk melakukan analisis prediksi.

Rapid Miner menggunakan berbagai teknik deskriptif dan prediksi dalam

memberikan wawasan kepada pengguna sehingga dapat membuat keputusan yang

paling baik. Rapid Miner memiliki kurang lebih 500 operator data mining, termasuk

operator untuk input, output, data preprocessing dan visualisasi. Rapid Miner

merupakan software yang berdiri sendiri untuk analisis data dan sebagai mesin data

mining yang dapat diitegrasikan pada produknya sendiri. Rapid Miner ditulis

dengan menggunakan bahasa java sehingga dapat bekerja di semua sistem operasi.

Rapid Miner menyediakan GUI (Graphic User Iterface) untuk merancang

sebuah pipeline analitis. GUI ini akan menghasilkan file XML (Extensible Markup

Language) yang mendefenisikan proses analitis keinginan pengguna untuk

36

diterapkan ke data. File ini kemudian dibaca oleh Rapid Miner untuk menjalankan

analis secara otomatis.

Rapid Miner memiliki beberapa sifat sebagai berikut

1. Ditulis dengan bahasa pemrograman java sehingga dapat dijalankan

diberbagai sistem operasi.

2. Proses penemuan pengetahuan dimodelkan sebagai operator trees.

3. Representasi XML internal untuk memastikan format standar pertukaran

data.

4. Bahasa scripting memungkinkan untuk eksperimen skala besar dan

otomatisasi eksperimen.

5. Konsep multi-layer untuk menjamin tampilan data yang efisien dan

menjamin penanganan data.

6. Memiliki GUI, command line mode, dan java API yang dapat dipanggil dari

program lain. (Wicaksana, dkk, Belajar Data Mining Dengan Rapid Miner,

2009)

Gambar 2.13 Halaman Utama RapiMiner

37

BAB III

METODE PENELITIAN

3.1 Tinjauan Organisasi/Objek Penelitian

3.1.1 Sejarah

PT indonusa bergerak di bidang perternakan udang air asin yang terletak di

desa patrol inderamuyu jawa barat. Perusahaan ini berdiri sejak tahun 1990an dan

sudah memiliki karyawan kurang lebih 102 karyawan, hasil dari perternakan ini

sebagian besar di pasarkan di restoran, hotel dan rumah makan lainya yang ada di

kawasan jawa barat.perusahaan ini termasuk perusahan menengah ke bawah karena

masih di kelolah oleh masyarakat desa disekitarnya, dan untuk karyawan sendiri

masih sebagian besar karyawan harian, itupun dalam waktu pemanenan atau

pembibitan benur udang saja.

3.1.2 Visi Misi

1. Visi

Untuk menjadi perternakan yang dapat diandalkan dalam hal pemasokan

udang yang berkualitas di Indonesia dankhususnya di daerah jawa barat.

2. Misi

a. Menjadikan perusahaan yang bisa mensejahterakan karyawan.

b. Meningkatkan budi daya udang di Indonesia

c. Meningkatka gizi masyarakat jawa barat.

38

3.1.3 Struktur Organisasi

Gambar 3.1 Struktur Organisasi

3.2 Metode Penelitian

Pada penelitian ini, data yang diperoleh akan diolah menggunakan metode

Algoritma C4.5 dapat di gunakan sebagai rules dalam menganalisi potensi

menentukan bonus tahunan karyawan. Dalam penelitian ini akan dilakukan

beberapa langkah atau tahapan penelitian.

39

Gambar 3.2 Tahap Penelitian

1. Pengumpulan Data

Pada bagian ini dijelaskan tentang bagaimana dan dari mana data dalam

penelitian ini didapatkan, meliputi data sekunder dan data primer. Data

sekunder berisi tentang sumber perolehan data yang dhasilkan dari

penelitian.

2. Pengolahan Awal Data

Pada bagian ini dijelaskan tentang tahap awal data mining. Pengolahn awal

data meliputi proses input data ke format yang dibutuhkan, pengelompokan

dan penentuan atribut data.

3. Metode yang Diusulkan

Pada bagian ini menjelaskan metode yang diusulkan untuk menganalisi

bonus tahunan karyawan. Yang meliputi pemilihan nilai dari parameter-

prameter dan arsitektur melalui uji coba.

Pengumpulan Data

Pengolahan Data Awal

Metode Yang Diusulkan

pengujian Data dengan Beberapa Metode

Pengujian/Validasi Hasil

40

4. Eksperimen dan Pengujian Metode

Bagian ini dijelaskan tengtang langkah-langkah eksperiment meliputi cara

pemilihan arsitektur yang tepat dari modl atau metode yang diusulkan

sehingga didapatkan hasil ang dapat membuktikan bahwa metode yang

digunakan adalah tepat.

5. Evaluasi dan Validasi Data

Eavaluasi dan validai hasil akan di jelaskan dan dipaparkan pada bab IV.

3.3 Metode Pengumpulan Data

Adapun Untuk melaksanakan dan menunjang keberhasilan penelitian yang

akan dilakukan, penulis dalam mencari data primer atau informasi yang dibutuhkan

dengan menggunakan cara-cara sebagi berikut:

1. Interview

Yaitu prosedur pengumpulan data yang dilakukan dengan cara tanya jawab

atau interview secara lisan maupun tulisan dengan pihak yang terkait, dalam

hal ini yakni PT Indonusa

2. Observasi

Penulis melakukan pengamatan secara langsung atau tinjauan langsung ke

lapangan, serta melakukan pengamatan langsung terhadap objek permasalahan

yang diteliti untuk memperoleh informasi yang lebih real.

3. Daftar Pustaka

Penulis mengkaji, mengkutip, dan mempelajari berbagai jenis buku, jurnal, dan

artikel dari internet yang berhubungan dengan permasalahan yang diteliti,

41

dimana teori-teori yang dipergunakan dijadikan sebagai referensi dalam

penyusunan skripsi tersebut.

Tabel 3.1 Atribut Pada Data Karyawan PT.Indonusa

No Atribut Nilai

1 NIP Nomer Induk karyawan/Karyawan

2 Nama Nama Karyawan

3 Tempat.tanggal lahir Tempat Tanggal Lahir Karyawan

4 Status Pernikahan TK=Tidak kawin, K0=kawin, K1=Kawin

Anak Satu, K2=kawin Anak Dua dan

K3=Kawin anak Tiga

5 Jenis Kelamin L=Laki-laki, P=Perempuan

6 Masa Kerja Masa kerja karyawan

7 Kehadiran Absensi karyawan

8 Loyalitas Kepedulian karyawan terhadap perusahaan

9 Hasil Pekerjaan Hasil pekerjaan karyawan selama satu tahun

10 Keputusan Layak, Tidak layak

3.4 Pengelolahan Data Awal

42

pada data karyawan yang telah dikumpulkan dan dilakukan cleaning data

yaitu menghilangkan record-record yang noise atau tidak lengkap dan record yang

berulang. Atribut yang tidak diperlukan juga bisa dihilangkan seperti atribut

NIP,Nama, Tempat Tanggal lahir, status pernikahan, dan jenis kelamin. Hal ini

dilakukan karena atribut tersebut tidak berpengaruh terhadap pengolahan data pada

proses selanjutnya. Berikut adalah tabel atribut dan kategorinya.

Tabel 3.2 Atribut Yang Tidak Digunakan

No Atribut Nilai

1 NIP Nomer induk karyawan/karyawan

2 Nama Nama karyawan

3 Tempat Tnggal Lahir Tempat tanggal lahir karyawan

4 Status Pernikahan TK=Tidak kawin, K0=kawin, K1=Kawin Anak

Satu, K2=kawin Anak Dua dan K3=Kawin anak

Tiga

5 Jenis kelamin L=laki-laki, P=perempuan

Sedangkan untuk atribut seperti masa kerja, kehadiran, loyalitas, dan hasil

pekerjaan. Hal ini dilakukan karena atribut tersebut berpengaruh terhadap

pengolahan data pada proses selanjutnya. Berikut adalah tabel dan kategorinya:

Tabel 3.3 Atribut Yang Digunakan

43

No Atribut Nilai

1 Masa Kerja Masa kerja karyawan

2 Kehadiran Absensi karyawan

3 Loyalitas Kepedulian karyawan terhadap perusahaan

4 Hasil Pekerjaan Hasil pekerjaan karyawan selama satu tahun

5 Keputusan Layak, Tidak layak

Data yang sudah di siapkan untuk klasifikasi dibagi menjadi dua untuk data

training (80%) dan data testing (20%). Pembagian data menjadi data training dan

data testing menggunakan teknik sampling random sistimatik (siysteatyc random

sampling). Cara penggunaan teknik sampling random sistematik ini pengundian

hanya dilakukan satu kali, yakni ketika menentukan unsur pertama dari sampling

yang akan di ambil. Penentuan unsur sampling selanjutnya ditempuh dengan cara

memanfaatkan interval sampel. Interval sampel adalah angka yang menunjukan

jarak antara nomer –nomer urut yang terdapat pada kerangka sampling yang akan

dijadikan patokan dalam menentukan atau memilih unsur-unsur sampling kedua

dan seterusnya hingga unsur ke-n. interval sampling biasanya dilambangkan

dengan huruf k.

44

Interval sampel atau juga sampling rasio diperoleh dengan cara membagi

ukuran populasi dengan ukuran sampling yang dikehendaki (N/n) contoh

perhitungan untuk mengambil data testing adalah sebagai berikut:

Jumlah data testing = 20% x N= n

Jumlah populasi = N

Jumlah sampel = n

Interval sampling k = N/n

Unsur pertama yang diambil untuk data testing (s)=1

Unsur kedua = s+k (1+5=6)

Unsur ketiga = s+2k (1+2*5=11)

Unsur ke-n…=s+nk

Jumlah data testing (n)= 20% x N

=20% x 102 = 20

Interval sampel (k)=N/n

=102/20=5

S =1

S2 = s+k=1+5 =6

S3 =s+2k =1+(2*5)=11

45

S4 =s+3k =1+(3*5)=16 dst.

Dari hasil di atas dihasilkan data testing sebanyak 20 data karyawan,maka sisanya

di jadikan data training.

1. Choosing the appropriate Data miningtask

2. Choosing the Data miningAlgorithm

3. Employing The Data miningAlgorithm

4. Evoluation

5. Using The discovered Knowledge

3.5 Metode Yang Diusulkan

Dalam penelitian ini akan dilakukan analisis mengunakan algoritma C4.5.

dalam ini akan dilakukan beberapa langkah pengujian data yaiutu seperti berikut:

Gambar 3.3 Langkah Pengujian Metode

Mendapat hasil akurasi Prediksi Penerima bonus tahunan

Hasil algoritma C4.5

Pengolahan data dengan menggunakan

algoritma C4.5

46

Karakteristik dari Algoritma C4.5 yaitu salah satu algoritma dalam metode

pohon keputusan yang merubah data mejadi pohon keputusan menggunakan rumus

perhitungan entropy.

3.6 Kerangka Pemikiran

Dalam menyelesaikan penelitian ini dibutuhkan sebuah kerangka pemikiran

sebagai pedoman yang dilakukan secara konsisten. Permasalahan penelitian ini

belum di ketahui metode yang tepat dalam akurasi penerima bonus tahunan. Untuk

metode ini digunakan Algoritma C4.5 untuk memecahkan masalah pengujian

terhadap metode tersebut. Pengujian metode ini dilakukan dengan cara croos

Validation, confusion matrix dan Kurva ROC. Untuk pengembanganya dan

pengujian metode digunakan aplikasi rapidminer. Berikut ini kerangka pemikiran

yang di lakukan.

47

Gambar 3.4 Kerangka Pemikiran

3.7 Pengembangan Sistem

3.7.1 Pemodelan Sistem

48

A. Use Case Diagram

Gambar 3.7 Use Case Diagram

1. Skenario Use Case Diagram

Tabel 3.4 Skenario Use Case Diagram

Nama Use Case Deskripsi Aktor

Login User dapat masuk kedalam

sistem dengan menggunakan

username dan password

User

Memilih Menu

Melakukan

Prediksi

User dapat melihat semua pilihan

yang ada di menu prediksi

User

Logout User keluar dari system User

B. Activity Diagram

1. Activity Diagram Login

49

Gambar 3.8 Activity Diagram Login

User memasukan username dan password, jika benar maka aktor akan

diarahkan oleh sistem ke menu utama. Jika salah maka sistem akan menampilkan

pesan “Username dan password yang anda masukan salah”.

2. Activity Diagram Prediksi

Gambar 3.9 Activity Diagram Prediksi

3. Activity Diagram Logout

50

Gambar.3.10 Activity Diagram Logout

User dapat keluar dari aplikasi / sistem setelah memilih tombol logout pada

pojok kanan atas menu utama.

C. Sequence Diagram

Sequence diagram menggambarkan interaksi yang terjadi pada berdasarkan

skenario pada Use Case Diagram dan mendeskripsikan pesan yang dikirimkan dan

diterima antar objek. Berikut adalah gambaran sequence diagram.

1. Sequence Diagram Login

Gambar 3.11 Sequence Diagram Login

2. Sequence Diagram Prediksi

51

Gambar 3.12 Sequence Diagram Prediksi

3. Sequence Diagram Logout

Gambar 3.13 Sequence Diagram Logout

D. Class Diagram Prediksi

Hubungan antar kelas dan penjelasan detail tiap-tiap kelas di dalam model

desain dari suatu sistem, juga memperlihatkan aturan-aturan dan tanggung jawab

entitas yang menentukan perilaku sistem. Class Diagram juga menunjukkan

52

atribut-atribut dan operasi-operasi dari sebuah kelas dan constraint yang

berhubungan dengan objek yang dikoneksikan.

Gambar 3.14 Class Diagram

3.7.2 Perencanaan (Planning)

Berdasarkan latar belakang masalah yang telah diuraikan pada bab

sebelumnya ( bab I ), penulis membuat atau membangun sebuah sistem informasi

Potensi karyawan untuk menentukan bonus tahunan.

3.7.3 Analisis (Analysis)

Untuk dapat mengatasi permasalahan yang ada sistem harus mampu

melakukan hal-hal berikut :

1. Sistem harus dapat dioperasikan oleh user dengan mudah.

2. Sistem harus mampu memprediksi karyawan penerima bonus tahunan

3. Membutuhkan login sebagai pengaman untuk dapat masuk kedalam sistem.

4. Sistem harus dapat memberikan informasi dengan jelas.

3.7.4 Desain (Design)

Berikut adalah desain user interface dari sistem yang akan dibuat :

53

1. Tampilan Menu Login

Gambar 3.15 Tampilan Halaman Login

Untuk dapat masuk kedalam sistem user terlebih dahulu melakukan login

dengan memasukan username dan password.

2. Tampilan Menu Utama

Gambar 3.16 Tampilan Menu Utama

54

BAB IV

HASIL DAN PEMBAHASAN

4.1 Hasil Penelitian

4.1.1 Jumlah Kasus Data keseluruhan, Data Training dan Data Testing

Data keseluruhan yang digunakan pada penelitian ini sebanyak 20 kasus, lalu

digunakan untuk data training sebanyak

Tabel 4.1 Data Testing

No Masa

Kerja Kehadiran Loyalitas

Hasil

Pekerjaan Bonus Tahunan

1 MS Bagus Kurang Baik Layak

20 MS Bagus Baik Baik Layak

3 MS Bagus Cukup Baik Layak

4 TS Bagus Baik Kurang Tdk Layak

5 MS Bagus Baik Cukup Tdk Layak

6 TS Tidak Cukup Cukup Tdk Layak

7 MS Bagus Baik Kurang Tdk Layak

8 MS Tidak Baik Kurang Tdk Layak

9 TS Tidak Cukup Baik Tdk Layak

10 TS Tidak Baik Cukup Tdk Layak

11 MS Tidak Kurang Cukup Tdk Layak

12 MS Tidak Kurang Cukup Tdk Layak

13 MS Bagus Cukup Baik Layak

55

14 TS Bagus Cukup Baik Tdk Layak

15 MS Tidak Baik Baik Tdk Layak

16 TS Bagus Cukup Baik Layak

17 MS Tidak Baik Baik Tdk Layak

18 TS Bagus Baik Cukup Tdk Layak

19 TS Tidak Cukup Cukup Tdk Layak

20 MS Tidak Cukup Cukup Tdk Layak

Untuk masa kerja terbagi atas 2 (dua) transformasi data yaitu:

a. MS (Memenuhi Syarat) yaitu karyawan yang sudah bekerja lebih dari satu

tahun.

b. TS (Tidak Memenuhi Syarat) yaitu karyawan yang masa kerja kurang dari

satu tahun

Tabel 4.2 Jumlah Nilai Atribut Data Keseluruhan

JUMLAH

KASUS(S)

TIDAK

LAYAK(S1) LAYAK(S2)

TOTAL 20 14 6

MASA KERJA

MS 12 8 4

TS 8 7 1

KEHADIRAN

BAGUS 10 5 5

TIDAK 10 10 0

LOYALITAS

56

BAIK 9 8 1

CUKUP 8 5 3

KURANG 3 2 1

HASIL

PEKERJAAN

BAIK 9 4 5

CUKUP 8 8 0

KURANG 3 3 0

Dari tabel diatas terdapat 20 kasus dimana 14 kasus TIDAK LAYAK dan 6 kasus

LAYAK

4.2 Hasil

Dalam penelitian potensi karyawan untuk menentukan bonus tahunan

menggunakan algoritma C4.5. pohon keputusan dibuat berdasarkan hasil

perhitungan entropy dan gain setelah pohon keputusan terbentuk, langka

selanjutnya mencari rule berdasarkan cabang pohon keputusan. Berikut akan

dibahas langkah-langkah dalam eksperimen potensi karyawan untuk menentukan

bonus tahunan menggunakan algoritma C4.5

4.2.1 Pohon Keputusan Berdasarkan Entropy dan Gain

A. Node 1 (Root) Atribut Total

Pada node 1 terlebih dahulu yaitu menghitung jumlah kasus, jumlah kasus

untuk LAYAK dan jumlah kasus untuk TIDAK LAYAK, dan Entropy dari semua

kasus dan kasus yang dibagi berdasarkan atribut MASA KERJA, KEHADIRAN,

57

LOYALITAS, dan HASIL PEKERJAAN. Setelah itu lakukan perhitungan Gain

untuk setiap atribut.Lihat Tabel 4.2

Entropy Total Data Testing

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (S) = ∑ −𝑝𝑖 ∗ 𝑙𝑜𝑔2

𝑛

𝑖=1

𝑝𝑖

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Total) = (−Tidak layak

Totalxlog2(

Tidak layak

Total))

+ (−Layak

Totalxlog2(

Layak

Total))

Entropy (Total)=(-14

20xlog2(

14

20)) + (

6

20xlog2(

6

20))

Entropy (Total)=0.88129

Entropy Masa Kerja MS

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Masa kerja MS)

= ∑(−

𝑛

𝑖=1

Tidak layak

Masa kerja MS∗ log2(

Tidak layak

Masa kerja MS))

+ (− layak MS

Masa kerja MS∗ log2(

layak MS

Masa kerja MS))

Entropy (Masa Kerja MS)=(-8

12xlog2(

8

12)) + (

4

12xlog2(

5

12))

Entropy (Masa Kerja MS)= 0,918295834

Entropy Masa Kerja TS

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Masa kerja TS)

= ∑(−

n

i=1

Tidak layak

Masa kerja TS∗ log2(

Tidak layak

Masa kerja TS))

+ (− layak

Masa kerja TS∗ log2(

layak

Masa kerja TS))

58

Entropy (Masa Kerja TS)=(−7

8*𝑙𝑜𝑔2(

7

8))+(−

1

8*𝑙𝑜𝑔2(

1

8))

Entropy (Masa Kerja TS)= 0,543564443

Gain Masa Kerja

𝐺𝑎𝑖𝑛(Total, Masa Kerja)

= 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Total) − ∑|Masa Kerja|

|Total|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(Masa Kerja)

𝑛

𝑖=1

𝐺𝑎𝑖𝑛(Total, Masa Kerja) = 0,881290899 −((12

20∗ 0,918295834 )+(

8

20∗

0,543564443))

𝐺𝑎𝑖𝑛(Total, Masa Kerja) =0,112887622

Entropy Kehadiran Bagus

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Kehadiran Bagus)

= ∑(−

𝑛

𝑖=1

Tidak layak

Kehadiran Bagus∗ log2(

Tidak layak

Kehadiran Bagus))

+ (− layak

Kehadiran Bagus∗ log2(

layak

JKehadiran Bagus))

Entropy (Kehadiran Bagus)=(−5

10*𝑙𝑜𝑔2(

5

10))+(−

5

10*𝑙𝑜𝑔2(

5

10))

Entropy (Kehadiran Bagus)=1

1

| |,

| |

n

i

SiGain S A Entropy S Entropy Si

S

59

Entropy Kehadiran Tidak

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Kehadiran Tidak)

= ∑(−

𝑛

𝑖=1

Tidak layak

Kehadiran Tidak∗ log2(

Tidak layak

Kehadiran Tidak))

+ (− layak

Kehadiran Tidak∗ log2(

layak

Kehadiran Tidak))

Entropy (Kehadiran Tidak)=(−10

10*𝑙𝑜𝑔2(

10

10))+(−

0

10*𝑙𝑜𝑔2(

0

10))

Entropy (Kehadiran Tidak)=0

Gain Total Kehadiran

𝐺𝑎𝑖𝑛(Total, Kehadiran)

= 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Total) − ∑|Kehadiran|

|Total|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(Kehadiran)

𝑛

𝑖=1

𝐺𝑎𝑖𝑛(Total, Kehadiran) =0,881290899−((10

20∗1)+(

10

20∗ 0))

𝐺𝑎𝑖𝑛(Total, Kehadiran) = 0,38129089

Entropy Loyalitas Baik

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Loyalitas Baik)

= ∑(−

n

i=1

Tidak layak

Jumlah kasus Baik∗ log2(

Tidak layak

Jumlah kasus Baik))

+ (− layak Baik

Loyalitas Baik∗ log2(

layak Baik

Loyalitas Baik))

Entropy (Loyalitas Baik)=(−8

9*𝑙𝑜𝑔2(

8

9))+(−

1

9*𝑙𝑜𝑔2(

1

9))

Entropy (Loyalitas Baik)= 0,503258335

Entropy Loyalitas Cukup

60

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Loyalitas Cukup)

= ∑(−

n

i=1

Tidak layak

Loyalitas Cukup∗ log2(

Tidak layak

Loyalitas Cukup))

+ (− layak

Loyalitas Cukup∗ log2(

layak

Loyalitas Cukup))

Entropy (Loyalitas Cukup)=(−5

8*𝑙𝑜𝑔2(

5

8))+(−

3

8*𝑙𝑜𝑔2(

3

8))

Entropy (Loyalitas Cukup)= 0,954434003

Entropy Loyalitas Kurang

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Loyalitas Kurang)

= ∑(−

n

i=1

Tidak layak

Loyalitas Kurang∗ log2(

Tidak layak

Loyalitas Kurang))

+ (− layak

Loyalitas Kurang∗ log2(

layak

Loyalitas Kurang))

Entropy (Loyalitas Kurang)=(−2

3*𝑙𝑜𝑔2(

2

3))+(−

1

3*𝑙𝑜𝑔2(

1))

Entropy (Loyalitas Kurang)= 0,918295834

Gain Total Loyalitas

𝐺𝑎𝑖𝑛(Total, Loyalitas) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Total) − ∑|Loyalitas|

|Total|∗

n

i=1

𝐸𝑛𝑡𝑟𝑜𝑝𝑦(Loyalitas)

𝐺𝑎𝑖𝑛(Total, Loyalitas) =0,881290899−((10

20∗1)+(

10

20∗ 0))

𝐺𝑎𝑖𝑛(Total, Masa Kerja) = 0,135306672

Entropy Pekerjaan Baik

61

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Hasil Pekerjaan Baik)

= ∑(−

n

i=1

Tidak layak

Hasil Pekerjaan Baik∗ log2(

Tidak layak

Hasil Pekerjaan Baik))

+ (− layak

Hasil Pekerjaan Baik∗ log2(

layak

Hasil Pekerjaan Baik))

Entropy (Hasil Pekerjaan Baik)=(−4

9*𝑙𝑜𝑔2(

4

9))+(−

5

9*𝑙𝑜𝑔2(

5

9))

Entropy (Hasil Pekerjaan Baik)=0.9910751

Entropy Pekerjaan Cukup

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Hasil Pekerjaan Cukup)

= ∑(−

n

i=1

Tidak layak

Hasil Pekerjaan Cukup∗ log2(

Tidak layak

Hasil Pekerjaan Cukup))

+ (− layak

Hasil Pekerjaan Cukup∗ log2(

layak

Hasil Pekerjaan Cukup))

Entropy (Hasil Pekerjaan Cukup) =(−8

8*𝑙𝑜𝑔2(

8

8))+(−

0

8*𝑙𝑜𝑔2(

0

8))

Entropy (Hasil Pekerjaan Cukup)=0

Entropy Pekerjaan Kurang

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Hasil Pekerjaan Kurang)

= ∑(−

n

i=1

Tidak layak

Hasil Pekerjaan Kurang

∗ log2(Tidak layak

Hasil Pekerjaan Kurang)) + (−

layak

Hasil Pekerjaan Kurang

∗ log2( layak

Hasil Pekerjaan Kurang))

Entropy (Hasil Pekerjaan Kurang)=(−3

3*𝑙𝑜𝑔2(

3

3))+(−

0

3*𝑙𝑜𝑔2(

0

3))

62

Entropy (Hasil Pekerjaan Kurang)=0

Gain Total Hasil Pekerjaan

𝐺𝑎𝑖𝑛(Total, Hasil Pekerjaan )

= 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Total)

− ∑|Hasil Pekerjaan |

|Total|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(Hasil Pekerjaan

n

i=1

)

𝐺𝑎𝑖𝑛(Total, Hasil Pekerjaan) =0,881290899−((9

20∗ 0,9910760) +(

8

20∗ 0)+

( 3

20∗ 0)+

𝐺𝑎𝑖𝑛(Total, Hasil Pekerjaan) =0,435306672

Dari hasil perhitungan diatas maka dapat dibuatkan tabel seperti Berikut:

Tabel 4.3 Hasil Perhitungan Entropy Dan Gain Node 1

JUMLAH

KASUS(S

)

TIDAK

LAYAK(S1)LAYAK(S2) ENTROPY GAIN

TOTAL 20 14 6 0,881290899

MASA KERJA 0,112887622

MS 12 8 4 0,918295834

TS 8 7 1 0,543564443

KEHADIRAN 0,381290899

BAGUS 10 5 5 1

TIDAK 10 10 0 0

LOYALITAS 0,135306672

BAIK 9 8 1 0,503258335

CUKUP 8 5 3 0,954434003

KURANG 3 2 1 0,918295834

HASIL PEKERJAAN 0,435306672

BAIK 9 4 5 0,99107606

CUKUP 8 8 0 0

KURANG 3 3 0 0

63

Gambar 4.1 Pohon Keputusan Node 1

B. Node 1.1 (Root) Atribut Total

Pada node 1.1 diketahui jumlah semua kasus sebanyak 9 kasus dengan

keputusa TIDAK LAYAK sebnayak 4 kasus dan keputusan LAYAK sebanyak 5

kasus lihat tabel 4.4

Tabel 4.4 Jumlah Kasus Data Raining Atribut Hasil Pekerjaan Nilai Cukup

Entropy Total Hsil Pekerjaan Cukup


Totalxlog2(

Tidak layak

Total))

+ (−Layak

Totalxlog2(

Layak

Total))

Entropy (Total)=(-4

9xlog2(

4

9)) + (

5

9xlog2(

5

9))

Entropy (Total)= 0,99107606

NODEJumlah

Kasus(S)

Tdk

Layak(s1) Layak(S2)

1.1 Hasil pekerjaan baik 9 4 5

Masa Kerja

MS 6 2 4

TS 3 2 1

Kehadiran

Bagus 6 1 5

Tidak 3 3 0

Loyalitas

1 Baik 3 2 1

Cukup 5 2 3

Kurang 1 0 1

64


𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Masa Kerja MS)

= ∑(−

𝑛

𝑖=1

Tidak layak

Masa Kerja MS∗ log2(

Tidak layak

Masa Kerja MS))

+ (− layak


layak

Masa Kerja MS))

Entropy (Masa Kerja MS)=(−2

6*𝑙𝑜𝑔2(

2

6))+(−

4

6*𝑙𝑜𝑔2(

4

6))

Entropy (Masa Kerja MS)= 0,918295834


𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Masa Kerja TS)

= ∑(−

𝑛

𝑖=1

Tidak layak

Masa Kerja TS∗ log2(

Tidak layak

Masa Kerja TS))

+ (− layak


layak

Masa Kerja TS))


3*𝑙𝑜𝑔2(

2

3))+(−

1

3*𝑙𝑜𝑔2(

1

3))

Entropy (Masa Kerja TS)= 0,918295834

Gain Total Masa Kerja

𝐺𝑎𝑖𝑛(𝑇𝑜𝑡𝑎𝑙, Masa Kerja )

= 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Total)

− ∑|Hasil Masa Kerja |

|Total|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(Masa Kerja )

n

i=1

𝐺𝑎𝑖𝑛(𝑇𝑜𝑡𝑎𝑙, Masa Kerja) =0,99107606−((6

9∗0,918295)+(

3

9∗0,9182958)

𝐺𝑎𝑖𝑛(𝑇𝑜𝑡𝑎𝑙, Masa Kerja) = 0,07278023

65

Entropy Kehadiran Bagus

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Kehadiran, Bagus)

= ∑(−

𝑛

𝑖=1

Tidak layak

Kehadiran, Bagus∗ log2(

Tidak layak

Kehadiran, Bagus))

+ (− layak

Kehadiran, Bagus∗ log2(

layak

Kehadiran, Bagus))

Entropy (Kehadiran, Bagus)=(−1

6*𝑙𝑜𝑔2(

1

6))+(−

5

6*𝑙𝑜𝑔2(

5

6))

Entropy (Kehadiran, Bagus)=0,650022422

Entropy Kehadiran Tidak

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Kehadiran, Tidak)

= ∑(−

𝑛

𝑖=1

Tidak layak

Kehadiran, Tidak∗ log2(

Tidak layak

Kehadiran, Tidak))

+ (− layak

Kehadiran, Tidak∗ log2(

layak

Kehadiran, Tidak))

Entropy (Kehadiran, Tidak)=(−3

3*𝑙𝑜𝑔2(

3

3))+(−

0

3*𝑙𝑜𝑔2(

0

3))

Entropy (Kehadiran, Tidak)=0

Gain Total Kehadiran

𝐺𝑎𝑖𝑛(𝑇𝑜𝑡𝑎𝑙, Kehadiran)

= 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑇𝑜𝑡𝑎𝑙)

− ∑|Kehadiran |

|𝑇𝑜𝑡𝑎𝑙|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(Kehadiran )

𝑛

𝑖=1

𝐺𝑎𝑖𝑛(𝑇𝑜𝑡𝑎𝑙, Kehadiran) =0,99107606−((6

9∗ 0,650022422)+(

3

9∗ 0)

𝐺𝑎𝑖𝑛(𝑇𝑜𝑡𝑎𝑙, Kehadiran) =0,55772778

66


𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Loyalitas, Baik)

= ∑(−

𝑛

𝑖=1

Tidak layak

Loyalitas, Baik∗ log2(

Tidak layak

Loyalitas, Baik))

+ (− layak


layak

Loyalitas, Baik))

Entropy (Loyalitas, Baik)=(−2

3*𝑙𝑜𝑔2(

2

3))+(−

1

3*𝑙𝑜𝑔2(

1

3))

Entropy (Loyalitas, Baik)= 0,918295834


𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (loyalitas, Cukup)

= ∑(−

𝑛

𝑖=1

Tidak layak

loyalitas, Cukup∗ log2(

Tidak layak

loyalitas, Cukup))

+ (− layak


layak

loyalitas, Cukup))

Entropy (loyalitas, Cukup)=(−2

5*𝑙𝑜𝑔2(

2

5))+(−

3

5*𝑙𝑜𝑔2(

3

5))

Entropy (loyalitas, Cukup)= 0,97095059


𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Loyalitas, Kurang)

= ∑(−

𝑛

𝑖=1

Tidak layak

Loyalitas, Kurang∗ log2(

Tidak layak

Loyalitas, Kurang))

+ (− layak


layak

Loyalitas, Kurang))

Entropy (Loyalitas, Kurang)=(−0

1*𝑙𝑜𝑔2(

0

1))+(−

1

1*𝑙𝑜𝑔2(

1

1))

Entropy( Loyalitas, Kurang)=0

67


𝐺𝑎𝑖𝑛(𝑇𝑜𝑡𝑎𝑙, Loyalitas)

= 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑇𝑜𝑡𝑎𝑙) − ∑|Loyalitas |

|𝑇𝑜𝑡𝑎𝑙|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(Loyalitas)

𝑛

𝑖=1

𝐺𝑎𝑖𝑛(𝑇𝑜𝑡𝑎𝑙, Loyalitas) = 0,99107606 −((3

9∗ 0,918295834)+(

5

9∗ 0,970950594 ) +

(1

9∗ 0))

𝐺𝑎𝑖𝑛(𝑇𝑜𝑡𝑎𝑙, Loyalitas) =0,14556045

Tabel 4.5 Hasil Perhitungan Entropy Dan Gain Node 1.1 Hasil Perkerjaan Baik

Gambar 4.2 Pohon Keputusan Node 1.1

NODEJUMLAH

KASUS (S)

TIDAK

LAYAK (S1)LAYAK(S2) ENTROPY GAIN

1.1 HASIL PEKERJAAN CUKUP 9 4 5 0,99107606


MS 6 2 4 0,918295834

TS 3 2 1 0,918295834

KEHADIRAN 0,55772778

BAGUS 6 1 5 0,650022422

TIDAK 3 3 0 0


BAIK 3 2 1 0,918295834

CUKUP 5 2 3 0,970950594

KURANG 1 0 1 0

68

C. Node 1.1.2 (Root) Atribut Total

Pada node 1.1 diketahui jumlah semua kasus sebanyak 6 kasus dengan

keputusa TIDAK LAYAK sebnayak 1 kasus dan keputusan LAYAK sebanyak 5

kasus lihat table 4.6

Tabel 4.6 Jumlah Kasus Data Raining Atribut Hasil Pekerjaan Nilai Cukup Dan

Kehadiran Nilai Bagus

Entropy Total Hsil Pekerjaan Cukup Dan Kehadiran Bagus


Totalxlog2(

Tidak layak

Total))

+ (−Layak

Totalxlog2(

Layak

Total))

Entropy (Total)=(-1

6xlog2(

1

6)) + (

5

6xlog2(

5

6))

Entropy (Total)= 0,650022422


𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Masa Kerja MS)

= ∑(−

𝑛

𝑖=1

Tidak layak


Tidak layak

Masa Kerja MS))

+ (− layak


layak

Masa Kerja MS))

NODEJUMLAH

KASUS (S)

TIDAK

LAYAK (S1)LAYAK(S2)

1.1.2HASI PKERJAAN CUKUP KEHADIRAN

BAGUS6 1 5

MASA KERJA

MS 4 0 4

TS 2 1 1

LOYALITAS

BAIK 1 0 1

CUKUP 4 1 3

KURANG 1 0 1

69

Entropy (Masa Kerja MS)=(−0

4*𝑙𝑜𝑔2(

0

4))+(−

4

4*𝑙𝑜𝑔2(

4

4))

Entropy (Masa Kerja MS)= 0


𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Masa Kerja TS)

= ∑(−

𝑛

𝑖=1

Tidak layak


Tidak layak

Masa Kerja TS))

+ (− layak


layak

Masa Kerja TS))


2*𝑙𝑜𝑔2(

1

2))+(−

1

2*𝑙𝑜𝑔2(

1

2))

Entropy (Masa Kerja TS)=1

Gain Total Masa Kerja

𝐺𝑎𝑖𝑛(Total, Masa Kerja)

= 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Total) − ∑|Masa Kerja|

|Total|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(Masa Kerja)

n

i=1

𝐺𝑎𝑖𝑛(Total, Masa Kerja) =0,650022422−((4

6∗ 0)+(

2

6∗ 1))

𝐺𝑎𝑖𝑛(Total, Masa Kerja) = 0,31668909


𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Loyalitas, Baik)

= ∑(−

𝑛

𝑖=1

Tidak layak


Tidak layak

Loyalitas, Baik))

+ (− layak


layak

Loyalitas, Baik))

Entropy (Loyalitas, Baik)=(−0

1*𝑙𝑜𝑔2(

0

1))+(−

1

1*𝑙𝑜𝑔2(

1

1))

70

Entropy (Loyalitas, Baik)= 0



= ∑(−

𝑛

𝑖=1

Tidak layak


Tidak layak

loyalitas, Cukup))

+ (− layak


layak

loyalitas, Cukup))


4*𝑙𝑜𝑔2(

1

4))+(−

3

4*𝑙𝑜𝑔2(

3

4))

Entropy (loyalitas, Cukup)= 0,811278124



= ∑(−

𝑛

𝑖=1

Tidak layak


Tidak layak

Loyalitas, Kurang))

+ (− layak


layak

Loyalitas, Kurang))


1*𝑙𝑜𝑔2(

0

1))+(−

1

1*𝑙𝑜𝑔2(

1

1))



𝐺𝑎𝑖𝑛(Total, Loyalitas)

= 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Total) − ∑|Loyalitas |

|Total|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(Loyalitas)

n

i=1


6∗0)+(

4

6∗0,811278124) + (

1

6∗ 0))

𝐺𝑎𝑖𝑛(Total, Loyalitas) = 0,10917034

71

Tabel 4.7 Hasil Perhitungan Entropy Dan Gain Node 1.1.2

Gambar 4.3 Pohon Keputusan Node 1.1.2

D. Node 1.1.2.3 (Root) Atribut Total

Pada node 1.1.2.3 diketahui jumlah semua kasus sebanyak 2 kasus dengan

keputusa TIDAK LAYAK sebanayak 1 kasus dan keputusan LAYAK sebanyak 1

kasus lihat table 4.8

NODEJUMLAH

KASUS (S)

TIDAK


1.1.2HASI PKERJAAN CUKUP KEHADIRAN

BAGUS6 1 5 0,650022422


MS 4 0 4 0

TS 2 1 1 1


BAIK 1 0 1 0

CUKUP 4 1 3 0,811278124

KURANG 1 0 1 0

72

Tabel 4. 8 Jumlah Kasus Data Raining Atribut Hasil Pekerjaan Nilai Cukup,

Kehadiran Nilai Bagus Dan Masa Kerja MS

Entropy Total Hasil Pekerjaan Nilai Cukup, Kehadiran Nilai Bagus Dan

Masa Kerja MS


Totalxlog2(

Tidak layak

Total))

+ (−Layak

Totalxlog2(

Layak

Total))

Entropy (Total)=(-1

2xlog2(

1

2)) + (

1

1xlog2(

1

1))

Entropy (Total)= 1



= ∑(−

𝑛

𝑖=1

Tidak layak


Tidak layak

loyalitas, Cukup))

+ (− layak


layak

loyalitas, Cukup))


1*𝑙𝑜𝑔2(

1

1))+(−

1

1*𝑙𝑜𝑔2(

1

1))

Entropy (loyalitas, Cukup)= 1

NODEJUMLAH

KASUS (S)

TIDAK

LAYAK (S1)LAYAK(S2)

1.1.2.3 HASIL PEKERJAAN CUKUP,

KEHADIRAN BAGUS, MASA KERJA MS 2 1 1

LOYALITAS

CUKUP 2 1 1

KURANG 0 0 0

73



= ∑(−

𝑛

𝑖=1

Tidak layak


Tidak layak

Loyalitas, Kurang))

+ (− layak


layak

Loyalitas, Kurang))


0*𝑙𝑜𝑔2(

0

0))+(−

0

0*𝑙𝑜𝑔2(

0

0))


GainTotal Loyalitas

𝐺𝑎𝑖𝑛(Total, Loyalitas)

= 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (Total) − ∑|Loyalitas |

|Total|∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(Loyalitas)

n

i=1


6∗0)+(

4

6∗0,811278124) + (

1

6∗ 0))

𝐺𝑎𝑖𝑛(Total, Loyalitas) = 0,10917034

Tabel 4.8 Hasil Perhitungan Entropy Dn Gain Node 1.1.2.3

NODEJUMLAH

KASUS (S)

TIDAK


1.1.2.3 HASIL PEKERJAAN CUKUP,

KEHADIRAN BAGUS, MASA KERJA MS 2 1 1 1

LOYALITAS 1

CUKUP 2 1 1 1

KURANG 0 0 0 0

74

Gambar 4.4 Pohon Keputusan 1.1.2.3

4.2.2 Perhitungan Menggunakan RapidMiner

Pengujian terhadap analisa sangat penting dilakukan untuk menentukan dan

memastikan apakah hasil analisa tersebut telah sesuai dengan keputusan yang

diharapkan. Untuk menguji kebenaran dari hasil pengolahan data yang dilakukan

secara manual, maka dapat menggunakan salah satu software aplikasi RapidMiner

9.0, aplikasi ini memudahkan kita untuk menghitung berbagai model data mining.

Adapun langkah-langkah dalam mengolah data menggunakan Rapid Miner adalah

sebagai berikut :

75

1. Seluruh data training yang akan diproses oleh RapidMiner disimpan terlebih

dahulu di Microsoft Excel dengan format .xlsx. adapun data training yang

dimaksud penulis memberi nama data testing.xlsx, data tersebut nantinya akan

dihitung menggunakan software aplikasi Rapidminer 9.0.

2. Buka software aplikasi RapidMiner 9.0 dengan cara klik dua kali pada shortcut

atau cari melalui My Computer dan akan muncul tampilan sebagai berikut :

Gambar 4.5 Halaman Utama RapidMiner 9.0

3. Selanjutnya pilih blank lalu pilih menu add data lalu cari dimana data

testing.xlsx berada pilih dan klik open. Selanjutnya akan muncul kotak dialog

select the cell to import pilih dan klik next.

76

Gambar 4.6 Kotak Dialog Select The Cell To Import

4. Selanjutnya pada format your columns pada atribut terjual klik tanda panah

kebawah lalu pilih change role lalu pilih label klik ok, klik next lalu klik finish.

Gambar 4.7 Kotak Dialog Format Your Columns

77

5. Drag data testing.xlxs pada menu repository yang sudah kita masukan kedalan

rapidminer ke design process, drag ID3. Tambahkan juga apply model dan

performance untuk mengetahui tingkat akurasinya. Pilih dan klik run.

Gambar 4.8 Design Process

Hasil performance vektor yang didapat adalah :

Gambar 4.9 Tabel Hasil Performance Vektor

78

Adapun pohon keputusan yang didapat dari rapidminer adalah sebagai

berikut :

Gambar 4.10 Tree View

Berdasarkan hasil pohon keputusan yang diperoleh pada perhitungan

rapidminer rule yang dihasilkan sama persis dengan perhitungan manual.

Algoritma C4.5 dianggap sebagai algoritma yang sangat membantu dalam

melakukan klasifikasi data karena karakteristik data yang diklasifikasi dapat

diperoleh dengan jelas, baik dalam bentuk struktur pohon keputusan maupun aturan

if-then, sehingga memudahkan pengguna dalam melakukan penggalian informasi

terhadap data yang bersangkutan. Pada pemilihan atribut juga sangat

mempengaruhi dalam pengolahan Algoritma C4.5 karena keputusan sangat

bergantung pada atribut yang dipilih.

79

4.2.3 User Interface Prediksi

User interface bentuk tampilan grafis yang berhubungan langsung dengan

pengguna yang berfungsi untuk menghubungkan pengguna (user) dengan sistem

Prediksi, tujuan utama dari user interface ini adalah pengoperasian dan kontrol

yang efektif, dan memberikan umpan balik yang baik dari sistem yang membantu

user dalam membuat keputusan operasional. Adapun User interface dari Prediksi

adalah sebagai berikut :

A. User Interface Halaman Login

Gambar 4.11 User Interface Halaman login

80

B. User Interface Halaman Prediksi

Gambar 4.12 User Interface Halaman Prediksi

4.2.4 Black Box Testing

Pengujian perangkat lunak black box adalah pengujian yang dilakukan

hanya mengamati hasil eksekusi melalui data uji dan memeriksa fungsional dari

perangkat lunak tersebut. Adapun hasil dari pengujian prediksi produk terlaris

berbasis web dengan menggunakan black box testing adalah sebagai berikut :

1. Pengujian Menu Login

Gambar 4.13 Pengujian Menu Login

81

Tabel 4.10 Hasil Uji Menu Login

Input Hasil Yang Diharapkan Output

Hasil

Test

Isi username dan

password kemudian

klik login

Tampil Halaman Menu

Utama

Halaman Prediksi OK

2. Pengujian Prediksi

Gambar 4.14 Pengujian Halaman Prediksi

Tabel 4.10 Hasil Uji Halama Prediksi

Input Hasil Yang Diharapkan Output

Hasil

Test

Klik Prediksi Tampil Form Prediksi Form Prediksi OK

Isi Form Lalu klik

Prediksi

Tampil Hasil Prediksi Hasil Prediksi OK

82

BAB V

PENUTUP

5.1 Kesimpulan

Dari hasil penelitian tentang analisa data potensi karyawan untuk

menentukan bonus tahunan dengan algoritma C4.5 maka garis besar dari penelitian

ini adalah:

1. Hasil penelitan dengan menggunakan algoritma C4.5 dalam menentukan

potensi karyawan bonus tahunan cukup akurat.

2. Algoritma C4.5 sangat membantu dalam pembuatan aplikasi sistem

pendukung dalam menganalisa data potensi karyawan untuk menentukan

bonus tahunan.

3. .Perhitungan menggunakan algoritma C.45 sangat akurat dengan data yang

ada di lapangan.

5.2 Saran

Dari hasil penelitian yang telah dilakukan dan hasil kesimpulan, maka saran

yang dapat diberikan dalam penelitian ini adalah:

1. Aplikasi yang ada bisa lebih di kembangkan lagi sehingga lebih

mempermudah dalam penentuan bonus tahunan karyawan.

2. .Metode algoritma C4.5 kedepanya bisa menjadi acuan dalam penentuan

bonus tahuan karyawan secara maksimal.

3. Untuk penelitian selanjutnya diharapkan hasil akurasinya harus lebih baik.

83

DAFTAR PUSTAK

Azwanti. (2018). Analisa Algoritma C4.5 Untuk Memprediksi Penjualan Motor

Pada PT.Capella Dinamik Nusantara Cabang Muka Kuning. Jurnal Ilmiah

Ilmu Komputer, 33-38.

Barros, C. R., de Calvalho, A. C., & Freitas, A. A. (2015). Automatic Design of

Decision-Tree Induction Algorithms. New York: Springer International

Publishing Switzerland.

Firman, A., Wowor, H. F., & Najoan, X. (2016). Sistem Informasi Perpustakaan

Online Berbasis Web. E-journal Teknik Elektro dan Komputer, 29-36.

Firmansyah, Y., & Udi. (2018). Penerapan Metode SDLC Waterfall Dalam

Pembuatan Sistem Informasi Akademik Berbasis Web Studi Kasus Pondok

Pesantren Al-Habi Sholeh Kabupaten Kubu Raya, Kalimantan Barat. Jurnal

Teknologi & Manajemen Informatika, 184-191.

Gat. (2015). Perancangan Basis Data Perputakaan Sekolah dengan Menerapkan

Model Data Relasional. Citec Journal, 304-315.

Haryati, S., Sudarsono, A., & Suryana, E. (2015). Implementasi Data Mining Untuk

Memprediksi Masa Studi Maha Siswa Menggunakan Algoritma C4.5 (Studi

Kasus : Universitas Daehasen Bengkulu). Jurnal Media Infotama, 130-138.

Hendini, A. (2016). Pemodelan UML Sistem Monitoring Penjualan dan Stok

Barang (studi Kasus : Distro Zhezha Pontianak). Jurnal Khatulistiwa

Informatika, 107-116.

Hidayatsyah, M. R. (2013). Penerapan Metode Decision Tree Dalam Pemberian

Pinjaman Kepda Debitur Dengan Algoritma C4.5 (Studi Kasus : Bank

Perkreditan Rakyat Syariah Berkah Dana Fadilah). Tugas Akhir Fakultas

Sains Dan Teknologi Universitas Islam Negeri Sultan S.

kusrini. (2007). Algoritma data Mining. Yogyakarta: Andi.

Maulana, G. G. (2017). Pembelajaran Dasar Algoritma Dan Pemograman

Menggunakan El-Algoritma Berbasis Web. Jurnal Teknik Mesin (JTM), 69-

73.

Mulyapradana, R., & Hatta, M. (2016). Jadi Karyawan Kaya. Jakarta: Visimedia.

84

Nofriansyah, D. (2015). Konsep Data Mining VS Sistem Pendukung Keputusan.

Yogyakarta: Depublish.

Nugroho, K. (2016). Model Analisis Prediksi Menggunakan Metode Fuzzy Time

Series. INFOKAM, 46-50.

Prasetyo, B., Pattiasina, T. J., & Soetarmono, A. N. (2015). Perancangan dan

Pembuatan Sistem Informasi Gudang (Studi Kasus : PT. PLN (Persero)

Area Surabaya Barat). TEKNIKA, 12-16.

Ritayani. (2013). Pengantar Algoritma Dan Pemograman. Teknik Informatika

Fakultas Ilmu Komputer Universitas Almuslim.

Sukatmi. (2014). Implementasi White Box Dan Black BoxDalam penjamin Mutu

Sistem Informasi. Jurnal Cendikia, 42-47.

Sumadya, D. O., Ginardi, R. H., & Akbar, R. J. (2016). Perancangan dan

Implementasi Basis Data Aplikasi Web Fotokita. Jurnal Teknik ITS, A552-

A555.

Vulandari, R. (2017). Data Mining. Yogyakarta: GayaMedia.

Yuliansyah, H. (2014). Perancangan Replikasi Basis Data Mysql Dengan

Mekanisme Pengamana Menggunakan SSL Encryption. Jurnal Informatika,

826-836.

analisa data potensi karyawan untuk menentukan bonus tahunan ...

Documents

Transcript of analisa data potensi karyawan untuk menentukan bonus tahunan ...