16. BAB V.pdf
-
Upload
haries-rochmatullah -
Category
Documents
-
view
241 -
download
0
Transcript of 16. BAB V.pdf
-
V-1
BAB V IMPLEMENTASI
(Evaluation Phase dan Deployment Phase)
5.1 Lingkungan Implementasi
Implementasi merupakan tahapan dimana hasil perancangan yang telah
dibangun mulai diterapkan pada kondisi yang menyerupai kondisi yang
sebenarnya. Lingkungan implementasi meliputi lingkungan perangkat lunak
(software) dan lingkungan perangkat keras (hardware).
5.1.1 Lingkungan Perangkat Keras (Hardware)
Spesifikasi minimal dari hardware yang diperlukan pada saat
implementasi diantaranya adalah :
a. Microprosesor : Intel Pentium 4
b. Harddisk : 4GB
c. Memori : RAM 128 MB
d. Monitor : 1024 x 768
5.1.2 Lingkungan Perangkat Lunak (Software)
Spesifikasi software yang digunakan untuk membangun sistem ini adalah :
a. Sistem Operasi : Windows
b. Program Aplikasi : MS Visual Basic 6.0
c. Perangkat Tambahan : PHPMyAdmin
5.2 Implementasi Komponen
Implementasi komponen merupakan daftar dari perancangan yang telah
diimplementasikan. Implementasi komponen algoritma C4.5 pada data pasien
liver adalah sebagai berikut :
-
V-2
Tabel 5.1 Implementasi Komponen
No Nama Form File Fisik File Executable
1 Menu Utama frmUtama.frm daming.exe
2 Latih Data frmLatihData.frm daming.exe
3 Pohon Keputusan frmPohon.frm daming.exe
4 Aturan frmAturan.frm daming.exe
5 Hasil Penghitungan Entropy
dan Gain
frmTampilHitung.frm daming.exe
6 Pengujian Data
(Data Masukan)
frmUjiDataInput.frm daming.exe
7 Pengujian Data
(Data Master)
frmUjiDataMaster.frm daming.exe
5.3 Struktur Menu
Struktur dari simulasi implementasi algoritma C4.5 pada data pasien liver
digambarkan pada Gambar 5.1.
MENU UTAMA
LATIH DATA POHONKEPUTUSANATURAN
TERBENTUK
PENGHITUNGAN ENTROPI DAN
GAIN
UJI DATA(INPUT DATA)
UJI DATA(MASTER DATA) KELUAR
PRA PROSES DATA
PROSES DATA
Gambar 5.1 Struktur Menu
-
V-3
5.4 Implementasi Tampilan
Tampilan antarmuka simulasi implementasi algoritma C4.5 pada data
pasien liver digambarkan pada Gambar 5.2 sampai dengan Gambar 5.8.
5.4.1 Tampilan Menu Utama
Pada tampilan Gambar 5.2, terdapat opsi-opsi untuk melakukan latih data,
menampilkan pohon keputusan, menampilkan daftar aturan, menampilkan
penghitungan entropy dan gain, melakukan pengujian dengan data masukan, serta
pengujian data master dan penghitungan akurasi. Melakukan latih data merupakan
proses wajib yang harus dilalui apabila ingin memasuki opsi yang lain.
Gambar 5.2 Tampilan Menu Utama
5.4.2 Tampilan Latih Data
Tampilan Gambar 5.3 akan muncul setelah pengguna memilih opsi latih
data. Pada latih data terdapat pengaturan data yang meminta pengguna untuk
mengisi persentase data untuk data latih dan data uji. Setelah mengatur data,
pengguna memilih akan melakukan praproses data menggunakan rumus GINI
atau berdasarkan referensi kesehatan yang menjadi acuan. Setelah melakukan
praproses, pengguna memilih tombol perintah proses data yang meliputi
penghitungan entropy dan gain serta pembentukan pohon keputusan.
-
V-4
Gambar 5.3 Tampilan Latih Data
5.4.3 Tampilan Pohon Keputusan
Tampilan Gambar 5.4 akan muncul secara otomatis setelah proses data
selesai dilakukan. Tampilan ini berfungsi untuk menampilkan hasil penghitungan
entropy dan gain secara visual berupa pohon keputusan.
-
V-5
Gambar 5.4 Tampilan Pohon Keputusan
5.4.4 Tampilan Daftar Aturan
Tampilan Gambar 5.5 akan muncul setelah pengguna memilih opsi untuk
menampilkan daftar aturan pada tampilan menu utama. Tampilan ini berfungsi
untuk menampilkan daftar aturan sesuai dengan silsilah pada pohon keputusan.
-
V-6
Gambar 5.5 Tampilan Daftar Aturan
5.4.5 Tampilan Hasil Penghitungan
Tampilan Gambar 5.6 akan muncul setelah pengguna memilih opsi untuk
menampilkan hasil penghitungan. Tampilan ini berfungsi untuk menampilkan
hasil penghitungan entropy dan gain dengan kondisi baris penentu tertentu.
Gambar 5.6 Tampilan Hasil Penghitungan
-
V-7
5.4.6 Tampilan Uji Data (Data Masukan)
Tampilan uji Gambar 5.7 akan muncul setelah pengguna memilih opsi uji
data dengan data masukan. Tampilan ini berfungsi untuk mengetahui hasil
keputusan pasien liver berdasarkan pohon keputusan yang telah terbentuk.
Gambar 5.7
Tampilan Uji Data dengan Data Masukan
5.4.7 Tampilan Uji Data (Data Master) dan Akurasi
Tampilan Gambar 5.8 akan muncul setelah pengguna memilih opsi uji
data master dan penghitungan akurasi. Tampilan ini berfungsi untuk menampilkan
perbandingan pengujian data berdasarkan pohon keputusan dengan data liver,
menampilkan jumlah data terklasifikasi dan tidak terklasifikasi serta menampilkan
persentase akurasi.
-
V-8
Gambar 5.8
Tampilan Uji Data dengan Data Master dan Akurasi
5.5 Implementasi Basis Data
Implementasi algoritma C4.5 menggunakan 1 (satu) basis data bernama
db_liver yang terdiri dari 15 (lima belas) buah tabel. Struktur tabel bisa dilihat
pada Gambar 5.9 sampai dengan Gambar 5.23.
1) Tabel data pasien liver (tb_liver) berisi record pasien liver
Gambar 5.9 Struktur Tabel Data Pasien Liver
-
V-9
2) Tabel atribut (tb_atribut) menyimpan atribut-atribut yang terdapat pada
data pasien liver beserta split atributnya.
Gambar 5.10 Struktur Tabel Atribut
3) Tabel perbandingan pengujian (tb_comparetesting) menyimpan hasil
pengujian data master pasien liver dengan hasil pengujian data
berdasarkan pohon keputusan
Gambar 5.11 Struktur Tabel Perbandingan Pengujian Data
4) Tabel entropi (tb_entopy) menyimpan hasil penghitungan entropi sampai
terbentuknya pohon keputusan
Gambar 5.12 Struktur Tabel Entropi
5) Tabel gain (tb_gain) berisi menyimpan hasil penghitungan gain sampai
terbentuknya pohon keputusan
-
V-10
Gambar 5.13 Struktur Tabel Gain
6) Tabel hasil pengujian (tb_hasiltesting) menyimpan hasil pengujian data
pasien liver berdasarkan pohon keputusan
Gambar 5.14 Struktur Tabel Hasil Pengujian Data
7) Tabel penghitungan (tb_hitung) menyimpan penghitungan jumlah kasus
berdasarkan baris penentu
Gambar 5.15 Struktur Tabel Penghitungan
8) Tabel klasifikasi atribut (tb_klas_atribut) menyimpan hasil klasifikasi
atribut
Gambar 5.16 Struktur Tabel Klasifikasi Atribut
-
V-11
9) Tabel praproses (tb_pra) menyimpan hasil praproses data pasien liver
Gambar 5.17 Struktur Tabel Praproses Data
10) Tabel pra-GINI (tb_pre_gini) menyimpan data pasien liver untuk
menentukan split atribut
Gambar 5.18 Struktur Tabel Pra Gini
11) Tabel aturan (tb_rules) menyimpan daftar aturan yang terbentuk dari
pohon keputusan
Gambar 5.19 Struktur Tabel Aturan
-
V-12
12) Tabel pengujian (tb_testing) menyimpan data uji
Gambar 5.20 Struktur Tabel Pengujian
13) Tabel simpul pohon keputusan (tb_tree_atribut) menyimpan simpul dan
atribut yang terlibat pada pohon keputusan
Gambar 5.21 Struktur Tabel Simpul Pohon Keputusan
14) Tabel simpul pohon detail (tb_trklasdetail) menyimpan klasifikasi atribut
yang terlibat pada pohon keputusan beserta hasil kelanjutannya sampai
menemukan hasil keputusan akhir.
Gambar 5.22 Struktur Tabel Simpul Pohon Detail
-
V-13
5.6 Pengujian Implementasi
Pada penelitian ini, akan digunakan 3 (tiga) skenario dalam proses
pengujian :
1) Skenario (1)
Pengujian implementasi dilakukan dengan urutan sebagai berikut :
a) Mengatur persentase data latih dan data uji
b) Melakukan praproses data dengan menggunakan rumus GINI
c) Proses data
d) Menghitung tingkat akurasi
2) Skenario (2)
Pengujian implementasi dilakukan dengan urutan sebagai berikut :
a) Mengatur persentase data latih dan data uji
b) Melakukan praproses data dengan mengklasifikasikan data pasien liver
berdasarkan referensi kesehatan
c) Proses data
d) Menghitung tingkat akurasi
Skenario (1) dan (2) dilakukan masing-masing sebanyak 10 (sepuluh) kali
dengan pengaturan persentase data latih dan data uji terbagi pada Tabel 5.2.
Tabel 5.2 Pengaturan Persentase Data Latih dan Data Uji Latih Data
Ke-
Persentase
Data Latih
Persentase Data
Uji
1 10 % 90 %
2 20 % 80 %
3 30 % 70 %
4 40 % 60 %
5 50 % 50 %
6 60 % 40 %
7 70 % 30 %
8 80 % 20 %
9 90 % 10 %
10 100 % 100 %
-
V-14
3) Skenario (3)
Membandingkan tingkat akurasi hasil pengujian skenario (1) dengan hasil
pengujian skenario (2).
5.6.1 Skenario (1)
Berdasarkan Tabel 5.3, diperoleh rata-rata persentase akurasi pengujian
data dengan praproses menggunakan rumus GINI adalah 39,00 %. Dengan akurasi
tertinggi yaitu 56,22% dan akurasi terendah yaitu 22,41%.
Tabel 5.3 Hasil Pengujian Data (Praproses Menggunakan Rumus GINI)
Latih
Data Ke-
Jumlah
Data Latih
Jumlah
Data Uji
Jumlah Data
Terklasifikasi (YES)
Jumlah Data
Terklasifikasi (NO)
Jumlah Data
Tidak
Terklasifikasi
1 58 525 222 151 152
2 117 466 271 78 117
3 175 408 217 70 121
4 233 350 159 27 164
5 292 291 133 20 138
6 350 233 71 12 150
7 408 175 50 8 117
8 466 117 49 7 61
9 525 58 13 4 41
10 583 583 173 21 389
Latih Data Ke-
Jumlah Hasil Sesuai
Jumlah Hasil Tidak Sesuai
Persentase Akurasi (%)
Persentase Kesalahan (%)
1 268 257 51.05 48.95
2 262 204 56.22 43.78
3 215 193 52.70 47.30
4 141 209 40.29 59.71
5 113 178 38.83 61.17
6 69 164 29.61 70.39
7 46 129 26.29 73.71
8 46 71 39.32 60.68
9 13 45 22.41 77.59
10 194 389 33.28 66.72
Rata-rata Persentase 39.00 61.00
-
V-15
5.6.2 Skenario (2)
Berdasarkan Tabel 5.4, diperoleh rata-rata persentase akurasi pengujian
data dengan praproses berdasarkan referensi kesehatan adalah 54,89 %. Dengan
akurasi tertinggi yaitu 67,75% dan akurasi terendah yaitu 45,92%.
Tabel 5.4
Hasil Pengujian Data (Praproses Berdasarkan Referensi Kesehatan)
Latih Data Ke-
Jumlah Data Latih
Jumlah Data Uji
Jumlah Data Terklasifikasi (YES)
Jumlah Data Terklasifikasi (NO)
Jumlah Data Tidak
Terklasifikasi
1 58 525 289 167 69
2 117 466 227 145 94
3 175 408 225 80 103
4 233 350 217 51 82
5 292 291 161 46 84
6 350 233 117 40 76
7 408 175 99 23 53
8 466 117 76 8 33
9 525 58 38 5 15
10 583 583 320 75 188
Latih Data Ke-
Jumlah Hasil Sesuai
Jumlah Hasil Tidak Sesuai
Persentase Akurasi (%)
Persentase Kesalahan (%)
1 284 241 54.10 45.90
2 232 234 49.79 50.21
3 208 200 50.98 49.02
4 193 157 55.14 44.86
5 146 145 50.17 49.83
6 107 126 45.92 54.08
7 90 85 51.43 48.57
8 68 49 58.12 41.88
9 38 20 65.52 34.48
10 395 188 67.75 32.25
Rata-rata Persentase 54.89 45.11
-
V-16
5.6.3 Skenario (3)
Berdasarkan Gambar 5.24, terlihat bahwa tingkat akurasi pengujian data
dengan praproses berdasarkan referensi kesehatan cenderung meningkat
sedangkan tingkat akurasi pengujian data dengan praproses menggunakan rumus
GINI cenderung menurun.
Gambar 5.23 Grafik Perbandingan Hasil Pengujian Data
54,10
49,79 50,98
55,14
50,17
45,92
51,43
58,12
65,52 67,75
51,05
56,22 52,70
40,29 38,83
29,61 26,29
39,32
22,41
33,28
-
10,00
20,00
30,00
40,00
50,00
60,00
70,00
80,00
10 20 30 40 50 60 70 80 90 100
Pers
enta
se A
kura
si (%
)
Persentase Data Latih (%)
Grafik Perbandingan Hasil Uji Data
Hasil Uji Data (Referensi Kesehatan)Hasil Uji Data (Gini)
-
V-17
5.7 Evaluation Phase
Tingkat keakuratan pengujian data dengan praproses menggunakan rumus
GINI cenderung menurun, hal ini kemungkinan terjadi karena dipengaruhi oleh
penghitungan GINI untuk split atribut bernilai kontinyu hanya menghasilkan 2
(dua) klasifikasi atribut yaitu lebih kecil dari sama dengan () dari split atribut, sedangkan data-data pada atribut bernilai kontinyu itu
beragam sehingga berpengaruh pada pengujian data dan tingkat akurasi. Adapun
kelebihan dari aplikasi ini adalah :
1. Pengguna bisa memilih cara melakukan praproses data, yaitu
menggunakan rumus GINI atau berdasarkan referensi kesehatan.
2. Aplikasi ini menyimpan hasil penghitungan entropy dan gain
5.8 Deployment Phase
Hasil akhir dari implementasi algoritma C4.5 pada data pasien liver ini
berupa pohon keputusan dan daftar aturan yang terbentuk. Berikut adalah contoh
hasil implementasi tersebut :
1) Nama : Deployment (1)
Jumlah Data Latih : 5% dari 583 data (29 data)
Jumlah Data Uji : 95% dari 583 data (554 data)
Praproses : Rumus GINI
Atribut dan Split :
Gambar 5.24
Atribut dan Split untuk Deployment (1)
-
V-18
Pohon Keputusan :
Gambar 5.25
Pohon Keputusan Simpul 1.1 untuk Deployment (1)
Gambar 5.26
Pohon Keputusan Simpul 1.2 untuk Deployment (1)
-
V-19
Daftar Aturan : 20 (dua puluh) aturan terbentuk
Gambar 5.27
Daftar Aturan Deployment (1)
2) Nama : Deployment (2)
Jumlah Data Latih : 5% dari 583 data (29 data)
Jumlah Data Uji : 95% dari 583 data (554 data)
Praproses : Berdasarkan Referensi Kesehatan
Atribut dan Split :
Gambar 5.28
Atribut dan Split untuk Deployment (2)
-
V-20
Pohon Keputusan :
Gambar 5.29
Pohon Keputusan Simpul 1.1 1.3 untuk Deployment (2)
Gambar 5.30
-
V-21
Pohon Keputusan Simpul 1.4 1.5 untuk Deployment (2)
Daftar Aturan : 40 (empat puluh) aturan terbentuk
Gambar 5.31 Daftar Aturan Deployment 2 (1)
Gambar 5.32 Daftar Aturan Deployment 2 (2)