16. BAB V.pdf

V-1

BAB V IMPLEMENTASI

(Evaluation Phase dan Deployment Phase)

5.1 Lingkungan Implementasi

Implementasi merupakan tahapan dimana hasil perancangan yang telah

dibangun mulai diterapkan pada kondisi yang menyerupai kondisi yang

sebenarnya. Lingkungan implementasi meliputi lingkungan perangkat lunak

(software) dan lingkungan perangkat keras (hardware).

5.1.1 Lingkungan Perangkat Keras (Hardware)

Spesifikasi minimal dari hardware yang diperlukan pada saat

implementasi diantaranya adalah :

a. Microprosesor : Intel Pentium 4

b. Harddisk : 4GB

c. Memori : RAM 128 MB

d. Monitor : 1024 x 768

5.1.2 Lingkungan Perangkat Lunak (Software)

Spesifikasi software yang digunakan untuk membangun sistem ini adalah :

a. Sistem Operasi : Windows

b. Program Aplikasi : MS Visual Basic 6.0

c. Perangkat Tambahan : PHPMyAdmin

5.2 Implementasi Komponen

Implementasi komponen merupakan daftar dari perancangan yang telah

diimplementasikan. Implementasi komponen algoritma C4.5 pada data pasien

liver adalah sebagai berikut :

V-2

Tabel 5.1 Implementasi Komponen

No Nama Form File Fisik File Executable

1 Menu Utama frmUtama.frm daming.exe

2 Latih Data frmLatihData.frm daming.exe

3 Pohon Keputusan frmPohon.frm daming.exe

4 Aturan frmAturan.frm daming.exe

5 Hasil Penghitungan Entropy

dan Gain

frmTampilHitung.frm daming.exe

6 Pengujian Data

(Data Masukan)

frmUjiDataInput.frm daming.exe

7 Pengujian Data

(Data Master)

frmUjiDataMaster.frm daming.exe

5.3 Struktur Menu

Struktur dari simulasi implementasi algoritma C4.5 pada data pasien liver

digambarkan pada Gambar 5.1.

MENU UTAMA

LATIH DATA POHONKEPUTUSANATURAN

TERBENTUK

PENGHITUNGAN ENTROPI DAN

GAIN

UJI DATA(INPUT DATA)

UJI DATA(MASTER DATA) KELUAR

PRA PROSES DATA

PROSES DATA

Gambar 5.1 Struktur Menu

V-3

5.4 Implementasi Tampilan

Tampilan antarmuka simulasi implementasi algoritma C4.5 pada data

pasien liver digambarkan pada Gambar 5.2 sampai dengan Gambar 5.8.

5.4.1 Tampilan Menu Utama

Pada tampilan Gambar 5.2, terdapat opsi-opsi untuk melakukan latih data,

menampilkan pohon keputusan, menampilkan daftar aturan, menampilkan

penghitungan entropy dan gain, melakukan pengujian dengan data masukan, serta

pengujian data master dan penghitungan akurasi. Melakukan latih data merupakan

proses wajib yang harus dilalui apabila ingin memasuki opsi yang lain.

Gambar 5.2 Tampilan Menu Utama

5.4.2 Tampilan Latih Data

Tampilan Gambar 5.3 akan muncul setelah pengguna memilih opsi latih

data. Pada latih data terdapat pengaturan data yang meminta pengguna untuk

mengisi persentase data untuk data latih dan data uji. Setelah mengatur data,

pengguna memilih akan melakukan praproses data menggunakan rumus GINI

atau berdasarkan referensi kesehatan yang menjadi acuan. Setelah melakukan

praproses, pengguna memilih tombol perintah proses data yang meliputi

penghitungan entropy dan gain serta pembentukan pohon keputusan.

V-4

Gambar 5.3 Tampilan Latih Data

5.4.3 Tampilan Pohon Keputusan

Tampilan Gambar 5.4 akan muncul secara otomatis setelah proses data

selesai dilakukan. Tampilan ini berfungsi untuk menampilkan hasil penghitungan

entropy dan gain secara visual berupa pohon keputusan.

V-5

Gambar 5.4 Tampilan Pohon Keputusan

5.4.4 Tampilan Daftar Aturan

Tampilan Gambar 5.5 akan muncul setelah pengguna memilih opsi untuk

menampilkan daftar aturan pada tampilan menu utama. Tampilan ini berfungsi

untuk menampilkan daftar aturan sesuai dengan silsilah pada pohon keputusan.

V-6

Gambar 5.5 Tampilan Daftar Aturan

5.4.5 Tampilan Hasil Penghitungan

Tampilan Gambar 5.6 akan muncul setelah pengguna memilih opsi untuk

menampilkan hasil penghitungan. Tampilan ini berfungsi untuk menampilkan

hasil penghitungan entropy dan gain dengan kondisi baris penentu tertentu.

Gambar 5.6 Tampilan Hasil Penghitungan

V-7

5.4.6 Tampilan Uji Data (Data Masukan)

Tampilan uji Gambar 5.7 akan muncul setelah pengguna memilih opsi uji

data dengan data masukan. Tampilan ini berfungsi untuk mengetahui hasil

keputusan pasien liver berdasarkan pohon keputusan yang telah terbentuk.

Gambar 5.7

Tampilan Uji Data dengan Data Masukan

5.4.7 Tampilan Uji Data (Data Master) dan Akurasi

Tampilan Gambar 5.8 akan muncul setelah pengguna memilih opsi uji

data master dan penghitungan akurasi. Tampilan ini berfungsi untuk menampilkan

perbandingan pengujian data berdasarkan pohon keputusan dengan data liver,

menampilkan jumlah data terklasifikasi dan tidak terklasifikasi serta menampilkan

persentase akurasi.

V-8

Gambar 5.8

Tampilan Uji Data dengan Data Master dan Akurasi

5.5 Implementasi Basis Data

Implementasi algoritma C4.5 menggunakan 1 (satu) basis data bernama

db_liver yang terdiri dari 15 (lima belas) buah tabel. Struktur tabel bisa dilihat

pada Gambar 5.9 sampai dengan Gambar 5.23.

1) Tabel data pasien liver (tb_liver) berisi record pasien liver

Gambar 5.9 Struktur Tabel Data Pasien Liver

V-9

2) Tabel atribut (tb_atribut) menyimpan atribut-atribut yang terdapat pada

data pasien liver beserta split atributnya.

Gambar 5.10 Struktur Tabel Atribut

3) Tabel perbandingan pengujian (tb_comparetesting) menyimpan hasil

pengujian data master pasien liver dengan hasil pengujian data

berdasarkan pohon keputusan

Gambar 5.11 Struktur Tabel Perbandingan Pengujian Data

4) Tabel entropi (tb_entopy) menyimpan hasil penghitungan entropi sampai

terbentuknya pohon keputusan

Gambar 5.12 Struktur Tabel Entropi

5) Tabel gain (tb_gain) berisi menyimpan hasil penghitungan gain sampai

terbentuknya pohon keputusan

V-10

Gambar 5.13 Struktur Tabel Gain

6) Tabel hasil pengujian (tb_hasiltesting) menyimpan hasil pengujian data

pasien liver berdasarkan pohon keputusan

Gambar 5.14 Struktur Tabel Hasil Pengujian Data

7) Tabel penghitungan (tb_hitung) menyimpan penghitungan jumlah kasus

berdasarkan baris penentu

Gambar 5.15 Struktur Tabel Penghitungan

8) Tabel klasifikasi atribut (tb_klas_atribut) menyimpan hasil klasifikasi

atribut

Gambar 5.16 Struktur Tabel Klasifikasi Atribut

V-11

9) Tabel praproses (tb_pra) menyimpan hasil praproses data pasien liver

Gambar 5.17 Struktur Tabel Praproses Data

10) Tabel pra-GINI (tb_pre_gini) menyimpan data pasien liver untuk

menentukan split atribut

Gambar 5.18 Struktur Tabel Pra Gini

11) Tabel aturan (tb_rules) menyimpan daftar aturan yang terbentuk dari

pohon keputusan

Gambar 5.19 Struktur Tabel Aturan

V-12

12) Tabel pengujian (tb_testing) menyimpan data uji

Gambar 5.20 Struktur Tabel Pengujian

13) Tabel simpul pohon keputusan (tb_tree_atribut) menyimpan simpul dan

atribut yang terlibat pada pohon keputusan

Gambar 5.21 Struktur Tabel Simpul Pohon Keputusan

14) Tabel simpul pohon detail (tb_trklasdetail) menyimpan klasifikasi atribut

yang terlibat pada pohon keputusan beserta hasil kelanjutannya sampai

menemukan hasil keputusan akhir.

Gambar 5.22 Struktur Tabel Simpul Pohon Detail

V-13

5.6 Pengujian Implementasi

Pada penelitian ini, akan digunakan 3 (tiga) skenario dalam proses

pengujian :

1) Skenario (1)

Pengujian implementasi dilakukan dengan urutan sebagai berikut :

a) Mengatur persentase data latih dan data uji

b) Melakukan praproses data dengan menggunakan rumus GINI

c) Proses data

d) Menghitung tingkat akurasi

2) Skenario (2)

Pengujian implementasi dilakukan dengan urutan sebagai berikut :

a) Mengatur persentase data latih dan data uji

b) Melakukan praproses data dengan mengklasifikasikan data pasien liver

berdasarkan referensi kesehatan

c) Proses data

d) Menghitung tingkat akurasi

Skenario (1) dan (2) dilakukan masing-masing sebanyak 10 (sepuluh) kali

dengan pengaturan persentase data latih dan data uji terbagi pada Tabel 5.2.

Tabel 5.2 Pengaturan Persentase Data Latih dan Data Uji Latih Data

Ke-

Persentase

Data Latih

Persentase Data

Uji

1 10 % 90 %

2 20 % 80 %

3 30 % 70 %

4 40 % 60 %

5 50 % 50 %

6 60 % 40 %

7 70 % 30 %

8 80 % 20 %

9 90 % 10 %

10 100 % 100 %

V-14

3) Skenario (3)

Membandingkan tingkat akurasi hasil pengujian skenario (1) dengan hasil

pengujian skenario (2).

5.6.1 Skenario (1)

Berdasarkan Tabel 5.3, diperoleh rata-rata persentase akurasi pengujian

data dengan praproses menggunakan rumus GINI adalah 39,00 %. Dengan akurasi

tertinggi yaitu 56,22% dan akurasi terendah yaitu 22,41%.

Tabel 5.3 Hasil Pengujian Data (Praproses Menggunakan Rumus GINI)

Latih

Data Ke-

Jumlah

Data Latih

Jumlah

Data Uji

Jumlah Data

Terklasifikasi (YES)

Jumlah Data

Terklasifikasi (NO)

Jumlah Data

Tidak

Terklasifikasi

1 58 525 222 151 152

2 117 466 271 78 117

3 175 408 217 70 121

4 233 350 159 27 164

5 292 291 133 20 138

6 350 233 71 12 150

7 408 175 50 8 117

8 466 117 49 7 61

9 525 58 13 4 41

10 583 583 173 21 389

Latih Data Ke-

Jumlah Hasil Sesuai

Jumlah Hasil Tidak Sesuai

Persentase Akurasi (%)

Persentase Kesalahan (%)

1 268 257 51.05 48.95

2 262 204 56.22 43.78

3 215 193 52.70 47.30

4 141 209 40.29 59.71

5 113 178 38.83 61.17

6 69 164 29.61 70.39

7 46 129 26.29 73.71

8 46 71 39.32 60.68

9 13 45 22.41 77.59

10 194 389 33.28 66.72

Rata-rata Persentase 39.00 61.00

V-15

5.6.2 Skenario (2)

Berdasarkan Tabel 5.4, diperoleh rata-rata persentase akurasi pengujian

data dengan praproses berdasarkan referensi kesehatan adalah 54,89 %. Dengan

akurasi tertinggi yaitu 67,75% dan akurasi terendah yaitu 45,92%.

Tabel 5.4

Hasil Pengujian Data (Praproses Berdasarkan Referensi Kesehatan)

Latih Data Ke-

Jumlah Data Latih

Jumlah Data Uji

Jumlah Data Terklasifikasi (YES)

Jumlah Data Terklasifikasi (NO)

Jumlah Data Tidak

Terklasifikasi

1 58 525 289 167 69

2 117 466 227 145 94

3 175 408 225 80 103

4 233 350 217 51 82

5 292 291 161 46 84

6 350 233 117 40 76

7 408 175 99 23 53

8 466 117 76 8 33

9 525 58 38 5 15

10 583 583 320 75 188

Latih Data Ke-

Jumlah Hasil Sesuai

Jumlah Hasil Tidak Sesuai

Persentase Akurasi (%)

Persentase Kesalahan (%)

1 284 241 54.10 45.90

2 232 234 49.79 50.21

3 208 200 50.98 49.02

4 193 157 55.14 44.86

5 146 145 50.17 49.83

6 107 126 45.92 54.08

7 90 85 51.43 48.57

8 68 49 58.12 41.88

9 38 20 65.52 34.48

10 395 188 67.75 32.25

Rata-rata Persentase 54.89 45.11

V-16

5.6.3 Skenario (3)

Berdasarkan Gambar 5.24, terlihat bahwa tingkat akurasi pengujian data

dengan praproses berdasarkan referensi kesehatan cenderung meningkat

sedangkan tingkat akurasi pengujian data dengan praproses menggunakan rumus

GINI cenderung menurun.

Gambar 5.23 Grafik Perbandingan Hasil Pengujian Data

54,10

49,79 50,98

55,14

50,17

45,92

51,43

58,12

65,52 67,75

51,05

56,22 52,70

40,29 38,83

29,61 26,29

39,32

22,41

33,28

-

10,00

20,00

30,00

40,00

50,00

60,00

70,00

80,00

10 20 30 40 50 60 70 80 90 100

Pers

enta

se A

kura

si (%

)

Persentase Data Latih (%)

Grafik Perbandingan Hasil Uji Data

Hasil Uji Data (Referensi Kesehatan)Hasil Uji Data (Gini)

V-17

5.7 Evaluation Phase

Tingkat keakuratan pengujian data dengan praproses menggunakan rumus

GINI cenderung menurun, hal ini kemungkinan terjadi karena dipengaruhi oleh

penghitungan GINI untuk split atribut bernilai kontinyu hanya menghasilkan 2

(dua) klasifikasi atribut yaitu lebih kecil dari sama dengan () dari split atribut, sedangkan data-data pada atribut bernilai kontinyu itu

beragam sehingga berpengaruh pada pengujian data dan tingkat akurasi. Adapun

kelebihan dari aplikasi ini adalah :

1. Pengguna bisa memilih cara melakukan praproses data, yaitu

menggunakan rumus GINI atau berdasarkan referensi kesehatan.

2. Aplikasi ini menyimpan hasil penghitungan entropy dan gain

5.8 Deployment Phase

Hasil akhir dari implementasi algoritma C4.5 pada data pasien liver ini

berupa pohon keputusan dan daftar aturan yang terbentuk. Berikut adalah contoh

hasil implementasi tersebut :

1) Nama : Deployment (1)

Jumlah Data Latih : 5% dari 583 data (29 data)

Jumlah Data Uji : 95% dari 583 data (554 data)

Praproses : Rumus GINI

Atribut dan Split :

Gambar 5.24

Atribut dan Split untuk Deployment (1)

V-18

Pohon Keputusan :

Gambar 5.25

Pohon Keputusan Simpul 1.1 untuk Deployment (1)

Gambar 5.26

Pohon Keputusan Simpul 1.2 untuk Deployment (1)

V-19

Daftar Aturan : 20 (dua puluh) aturan terbentuk

Gambar 5.27

Daftar Aturan Deployment (1)

2) Nama : Deployment (2)

Jumlah Data Latih : 5% dari 583 data (29 data)

Jumlah Data Uji : 95% dari 583 data (554 data)

Praproses : Berdasarkan Referensi Kesehatan

Atribut dan Split :

Gambar 5.28

Atribut dan Split untuk Deployment (2)

V-20

Pohon Keputusan :

Gambar 5.29

Pohon Keputusan Simpul 1.1 1.3 untuk Deployment (2)

Gambar 5.30

V-21

Pohon Keputusan Simpul 1.4 1.5 untuk Deployment (2)

Daftar Aturan : 40 (empat puluh) aturan terbentuk

Gambar 5.31 Daftar Aturan Deployment 2 (1)

Gambar 5.32 Daftar Aturan Deployment 2 (2)

16. BAB V.pdf

Documents

Transcript of 16. BAB V.pdf