16. BAB V.pdf

21
 V-1 BAB V IMPLEMENTASI (  Evaluation Phase  dan Deployment Phase ) 5.1 Lingkungan Implementasi Implementasi merupakan tahapan dimana hasil perancangan yang telah dibangun mulai diterapkan pada kondisi yang menyerupai kondisi yang sebenarnya. Lingkungan implementasi meliputi lingkungan perangkat lunak (software) dan lingkungan perangkat keras (hardware). 5.1.1 Lingkungan Perangkat Keras (Hardware) Spesifikasi minimal dari hardware yang diperlukan pada saat implementasi diantaranya adalah : a. Microprosesor : Intel Pentium 4  b.  Harddisk : 4GB c. Memori : RAM 128 MB d. Monitor : 1024 x 768 5.1.2 Lingkungan Perangkat Lunak (Software) Spesifikasi software yang digunakan untuk membangun sistem ini adalah : a. Sistem Operasi : Windows  b. Program Aplikasi : MS Visual Basic 6.0 c. Perangkat Tambahan : PHPMyAdmin 5.2 Implementasi Komponen Implementasi komponen merupakan daftar dari perancangan yang telah diimplementasikan. Implementasi komponen algoritma C4.5 pada data pasien liver adalah sebagai berikut :

Transcript of 16. BAB V.pdf

  • V-1

    BAB V IMPLEMENTASI

    (Evaluation Phase dan Deployment Phase)

    5.1 Lingkungan Implementasi

    Implementasi merupakan tahapan dimana hasil perancangan yang telah

    dibangun mulai diterapkan pada kondisi yang menyerupai kondisi yang

    sebenarnya. Lingkungan implementasi meliputi lingkungan perangkat lunak

    (software) dan lingkungan perangkat keras (hardware).

    5.1.1 Lingkungan Perangkat Keras (Hardware)

    Spesifikasi minimal dari hardware yang diperlukan pada saat

    implementasi diantaranya adalah :

    a. Microprosesor : Intel Pentium 4

    b. Harddisk : 4GB

    c. Memori : RAM 128 MB

    d. Monitor : 1024 x 768

    5.1.2 Lingkungan Perangkat Lunak (Software)

    Spesifikasi software yang digunakan untuk membangun sistem ini adalah :

    a. Sistem Operasi : Windows

    b. Program Aplikasi : MS Visual Basic 6.0

    c. Perangkat Tambahan : PHPMyAdmin

    5.2 Implementasi Komponen

    Implementasi komponen merupakan daftar dari perancangan yang telah

    diimplementasikan. Implementasi komponen algoritma C4.5 pada data pasien

    liver adalah sebagai berikut :

  • V-2

    Tabel 5.1 Implementasi Komponen

    No Nama Form File Fisik File Executable

    1 Menu Utama frmUtama.frm daming.exe

    2 Latih Data frmLatihData.frm daming.exe

    3 Pohon Keputusan frmPohon.frm daming.exe

    4 Aturan frmAturan.frm daming.exe

    5 Hasil Penghitungan Entropy

    dan Gain

    frmTampilHitung.frm daming.exe

    6 Pengujian Data

    (Data Masukan)

    frmUjiDataInput.frm daming.exe

    7 Pengujian Data

    (Data Master)

    frmUjiDataMaster.frm daming.exe

    5.3 Struktur Menu

    Struktur dari simulasi implementasi algoritma C4.5 pada data pasien liver

    digambarkan pada Gambar 5.1.

    MENU UTAMA

    LATIH DATA POHONKEPUTUSANATURAN

    TERBENTUK

    PENGHITUNGAN ENTROPI DAN

    GAIN

    UJI DATA(INPUT DATA)

    UJI DATA(MASTER DATA) KELUAR

    PRA PROSES DATA

    PROSES DATA

    Gambar 5.1 Struktur Menu

  • V-3

    5.4 Implementasi Tampilan

    Tampilan antarmuka simulasi implementasi algoritma C4.5 pada data

    pasien liver digambarkan pada Gambar 5.2 sampai dengan Gambar 5.8.

    5.4.1 Tampilan Menu Utama

    Pada tampilan Gambar 5.2, terdapat opsi-opsi untuk melakukan latih data,

    menampilkan pohon keputusan, menampilkan daftar aturan, menampilkan

    penghitungan entropy dan gain, melakukan pengujian dengan data masukan, serta

    pengujian data master dan penghitungan akurasi. Melakukan latih data merupakan

    proses wajib yang harus dilalui apabila ingin memasuki opsi yang lain.

    Gambar 5.2 Tampilan Menu Utama

    5.4.2 Tampilan Latih Data

    Tampilan Gambar 5.3 akan muncul setelah pengguna memilih opsi latih

    data. Pada latih data terdapat pengaturan data yang meminta pengguna untuk

    mengisi persentase data untuk data latih dan data uji. Setelah mengatur data,

    pengguna memilih akan melakukan praproses data menggunakan rumus GINI

    atau berdasarkan referensi kesehatan yang menjadi acuan. Setelah melakukan

    praproses, pengguna memilih tombol perintah proses data yang meliputi

    penghitungan entropy dan gain serta pembentukan pohon keputusan.

  • V-4

    Gambar 5.3 Tampilan Latih Data

    5.4.3 Tampilan Pohon Keputusan

    Tampilan Gambar 5.4 akan muncul secara otomatis setelah proses data

    selesai dilakukan. Tampilan ini berfungsi untuk menampilkan hasil penghitungan

    entropy dan gain secara visual berupa pohon keputusan.

  • V-5

    Gambar 5.4 Tampilan Pohon Keputusan

    5.4.4 Tampilan Daftar Aturan

    Tampilan Gambar 5.5 akan muncul setelah pengguna memilih opsi untuk

    menampilkan daftar aturan pada tampilan menu utama. Tampilan ini berfungsi

    untuk menampilkan daftar aturan sesuai dengan silsilah pada pohon keputusan.

  • V-6

    Gambar 5.5 Tampilan Daftar Aturan

    5.4.5 Tampilan Hasil Penghitungan

    Tampilan Gambar 5.6 akan muncul setelah pengguna memilih opsi untuk

    menampilkan hasil penghitungan. Tampilan ini berfungsi untuk menampilkan

    hasil penghitungan entropy dan gain dengan kondisi baris penentu tertentu.

    Gambar 5.6 Tampilan Hasil Penghitungan

  • V-7

    5.4.6 Tampilan Uji Data (Data Masukan)

    Tampilan uji Gambar 5.7 akan muncul setelah pengguna memilih opsi uji

    data dengan data masukan. Tampilan ini berfungsi untuk mengetahui hasil

    keputusan pasien liver berdasarkan pohon keputusan yang telah terbentuk.

    Gambar 5.7

    Tampilan Uji Data dengan Data Masukan

    5.4.7 Tampilan Uji Data (Data Master) dan Akurasi

    Tampilan Gambar 5.8 akan muncul setelah pengguna memilih opsi uji

    data master dan penghitungan akurasi. Tampilan ini berfungsi untuk menampilkan

    perbandingan pengujian data berdasarkan pohon keputusan dengan data liver,

    menampilkan jumlah data terklasifikasi dan tidak terklasifikasi serta menampilkan

    persentase akurasi.

  • V-8

    Gambar 5.8

    Tampilan Uji Data dengan Data Master dan Akurasi

    5.5 Implementasi Basis Data

    Implementasi algoritma C4.5 menggunakan 1 (satu) basis data bernama

    db_liver yang terdiri dari 15 (lima belas) buah tabel. Struktur tabel bisa dilihat

    pada Gambar 5.9 sampai dengan Gambar 5.23.

    1) Tabel data pasien liver (tb_liver) berisi record pasien liver

    Gambar 5.9 Struktur Tabel Data Pasien Liver

  • V-9

    2) Tabel atribut (tb_atribut) menyimpan atribut-atribut yang terdapat pada

    data pasien liver beserta split atributnya.

    Gambar 5.10 Struktur Tabel Atribut

    3) Tabel perbandingan pengujian (tb_comparetesting) menyimpan hasil

    pengujian data master pasien liver dengan hasil pengujian data

    berdasarkan pohon keputusan

    Gambar 5.11 Struktur Tabel Perbandingan Pengujian Data

    4) Tabel entropi (tb_entopy) menyimpan hasil penghitungan entropi sampai

    terbentuknya pohon keputusan

    Gambar 5.12 Struktur Tabel Entropi

    5) Tabel gain (tb_gain) berisi menyimpan hasil penghitungan gain sampai

    terbentuknya pohon keputusan

  • V-10

    Gambar 5.13 Struktur Tabel Gain

    6) Tabel hasil pengujian (tb_hasiltesting) menyimpan hasil pengujian data

    pasien liver berdasarkan pohon keputusan

    Gambar 5.14 Struktur Tabel Hasil Pengujian Data

    7) Tabel penghitungan (tb_hitung) menyimpan penghitungan jumlah kasus

    berdasarkan baris penentu

    Gambar 5.15 Struktur Tabel Penghitungan

    8) Tabel klasifikasi atribut (tb_klas_atribut) menyimpan hasil klasifikasi

    atribut

    Gambar 5.16 Struktur Tabel Klasifikasi Atribut

  • V-11

    9) Tabel praproses (tb_pra) menyimpan hasil praproses data pasien liver

    Gambar 5.17 Struktur Tabel Praproses Data

    10) Tabel pra-GINI (tb_pre_gini) menyimpan data pasien liver untuk

    menentukan split atribut

    Gambar 5.18 Struktur Tabel Pra Gini

    11) Tabel aturan (tb_rules) menyimpan daftar aturan yang terbentuk dari

    pohon keputusan

    Gambar 5.19 Struktur Tabel Aturan

  • V-12

    12) Tabel pengujian (tb_testing) menyimpan data uji

    Gambar 5.20 Struktur Tabel Pengujian

    13) Tabel simpul pohon keputusan (tb_tree_atribut) menyimpan simpul dan

    atribut yang terlibat pada pohon keputusan

    Gambar 5.21 Struktur Tabel Simpul Pohon Keputusan

    14) Tabel simpul pohon detail (tb_trklasdetail) menyimpan klasifikasi atribut

    yang terlibat pada pohon keputusan beserta hasil kelanjutannya sampai

    menemukan hasil keputusan akhir.

    Gambar 5.22 Struktur Tabel Simpul Pohon Detail

  • V-13

    5.6 Pengujian Implementasi

    Pada penelitian ini, akan digunakan 3 (tiga) skenario dalam proses

    pengujian :

    1) Skenario (1)

    Pengujian implementasi dilakukan dengan urutan sebagai berikut :

    a) Mengatur persentase data latih dan data uji

    b) Melakukan praproses data dengan menggunakan rumus GINI

    c) Proses data

    d) Menghitung tingkat akurasi

    2) Skenario (2)

    Pengujian implementasi dilakukan dengan urutan sebagai berikut :

    a) Mengatur persentase data latih dan data uji

    b) Melakukan praproses data dengan mengklasifikasikan data pasien liver

    berdasarkan referensi kesehatan

    c) Proses data

    d) Menghitung tingkat akurasi

    Skenario (1) dan (2) dilakukan masing-masing sebanyak 10 (sepuluh) kali

    dengan pengaturan persentase data latih dan data uji terbagi pada Tabel 5.2.

    Tabel 5.2 Pengaturan Persentase Data Latih dan Data Uji Latih Data

    Ke-

    Persentase

    Data Latih

    Persentase Data

    Uji

    1 10 % 90 %

    2 20 % 80 %

    3 30 % 70 %

    4 40 % 60 %

    5 50 % 50 %

    6 60 % 40 %

    7 70 % 30 %

    8 80 % 20 %

    9 90 % 10 %

    10 100 % 100 %

  • V-14

    3) Skenario (3)

    Membandingkan tingkat akurasi hasil pengujian skenario (1) dengan hasil

    pengujian skenario (2).

    5.6.1 Skenario (1)

    Berdasarkan Tabel 5.3, diperoleh rata-rata persentase akurasi pengujian

    data dengan praproses menggunakan rumus GINI adalah 39,00 %. Dengan akurasi

    tertinggi yaitu 56,22% dan akurasi terendah yaitu 22,41%.

    Tabel 5.3 Hasil Pengujian Data (Praproses Menggunakan Rumus GINI)

    Latih

    Data Ke-

    Jumlah

    Data Latih

    Jumlah

    Data Uji

    Jumlah Data

    Terklasifikasi (YES)

    Jumlah Data

    Terklasifikasi (NO)

    Jumlah Data

    Tidak

    Terklasifikasi

    1 58 525 222 151 152

    2 117 466 271 78 117

    3 175 408 217 70 121

    4 233 350 159 27 164

    5 292 291 133 20 138

    6 350 233 71 12 150

    7 408 175 50 8 117

    8 466 117 49 7 61

    9 525 58 13 4 41

    10 583 583 173 21 389

    Latih Data Ke-

    Jumlah Hasil Sesuai

    Jumlah Hasil Tidak Sesuai

    Persentase Akurasi (%)

    Persentase Kesalahan (%)

    1 268 257 51.05 48.95

    2 262 204 56.22 43.78

    3 215 193 52.70 47.30

    4 141 209 40.29 59.71

    5 113 178 38.83 61.17

    6 69 164 29.61 70.39

    7 46 129 26.29 73.71

    8 46 71 39.32 60.68

    9 13 45 22.41 77.59

    10 194 389 33.28 66.72

    Rata-rata Persentase 39.00 61.00

  • V-15

    5.6.2 Skenario (2)

    Berdasarkan Tabel 5.4, diperoleh rata-rata persentase akurasi pengujian

    data dengan praproses berdasarkan referensi kesehatan adalah 54,89 %. Dengan

    akurasi tertinggi yaitu 67,75% dan akurasi terendah yaitu 45,92%.

    Tabel 5.4

    Hasil Pengujian Data (Praproses Berdasarkan Referensi Kesehatan)

    Latih Data Ke-

    Jumlah Data Latih

    Jumlah Data Uji

    Jumlah Data Terklasifikasi (YES)

    Jumlah Data Terklasifikasi (NO)

    Jumlah Data Tidak

    Terklasifikasi

    1 58 525 289 167 69

    2 117 466 227 145 94

    3 175 408 225 80 103

    4 233 350 217 51 82

    5 292 291 161 46 84

    6 350 233 117 40 76

    7 408 175 99 23 53

    8 466 117 76 8 33

    9 525 58 38 5 15

    10 583 583 320 75 188

    Latih Data Ke-

    Jumlah Hasil Sesuai

    Jumlah Hasil Tidak Sesuai

    Persentase Akurasi (%)

    Persentase Kesalahan (%)

    1 284 241 54.10 45.90

    2 232 234 49.79 50.21

    3 208 200 50.98 49.02

    4 193 157 55.14 44.86

    5 146 145 50.17 49.83

    6 107 126 45.92 54.08

    7 90 85 51.43 48.57

    8 68 49 58.12 41.88

    9 38 20 65.52 34.48

    10 395 188 67.75 32.25

    Rata-rata Persentase 54.89 45.11

  • V-16

    5.6.3 Skenario (3)

    Berdasarkan Gambar 5.24, terlihat bahwa tingkat akurasi pengujian data

    dengan praproses berdasarkan referensi kesehatan cenderung meningkat

    sedangkan tingkat akurasi pengujian data dengan praproses menggunakan rumus

    GINI cenderung menurun.

    Gambar 5.23 Grafik Perbandingan Hasil Pengujian Data

    54,10

    49,79 50,98

    55,14

    50,17

    45,92

    51,43

    58,12

    65,52 67,75

    51,05

    56,22 52,70

    40,29 38,83

    29,61 26,29

    39,32

    22,41

    33,28

    -

    10,00

    20,00

    30,00

    40,00

    50,00

    60,00

    70,00

    80,00

    10 20 30 40 50 60 70 80 90 100

    Pers

    enta

    se A

    kura

    si (%

    )

    Persentase Data Latih (%)

    Grafik Perbandingan Hasil Uji Data

    Hasil Uji Data (Referensi Kesehatan)Hasil Uji Data (Gini)

  • V-17

    5.7 Evaluation Phase

    Tingkat keakuratan pengujian data dengan praproses menggunakan rumus

    GINI cenderung menurun, hal ini kemungkinan terjadi karena dipengaruhi oleh

    penghitungan GINI untuk split atribut bernilai kontinyu hanya menghasilkan 2

    (dua) klasifikasi atribut yaitu lebih kecil dari sama dengan () dari split atribut, sedangkan data-data pada atribut bernilai kontinyu itu

    beragam sehingga berpengaruh pada pengujian data dan tingkat akurasi. Adapun

    kelebihan dari aplikasi ini adalah :

    1. Pengguna bisa memilih cara melakukan praproses data, yaitu

    menggunakan rumus GINI atau berdasarkan referensi kesehatan.

    2. Aplikasi ini menyimpan hasil penghitungan entropy dan gain

    5.8 Deployment Phase

    Hasil akhir dari implementasi algoritma C4.5 pada data pasien liver ini

    berupa pohon keputusan dan daftar aturan yang terbentuk. Berikut adalah contoh

    hasil implementasi tersebut :

    1) Nama : Deployment (1)

    Jumlah Data Latih : 5% dari 583 data (29 data)

    Jumlah Data Uji : 95% dari 583 data (554 data)

    Praproses : Rumus GINI

    Atribut dan Split :

    Gambar 5.24

    Atribut dan Split untuk Deployment (1)

  • V-18

    Pohon Keputusan :

    Gambar 5.25

    Pohon Keputusan Simpul 1.1 untuk Deployment (1)

    Gambar 5.26

    Pohon Keputusan Simpul 1.2 untuk Deployment (1)

  • V-19

    Daftar Aturan : 20 (dua puluh) aturan terbentuk

    Gambar 5.27

    Daftar Aturan Deployment (1)

    2) Nama : Deployment (2)

    Jumlah Data Latih : 5% dari 583 data (29 data)

    Jumlah Data Uji : 95% dari 583 data (554 data)

    Praproses : Berdasarkan Referensi Kesehatan

    Atribut dan Split :

    Gambar 5.28

    Atribut dan Split untuk Deployment (2)

  • V-20

    Pohon Keputusan :

    Gambar 5.29

    Pohon Keputusan Simpul 1.1 1.3 untuk Deployment (2)

    Gambar 5.30

  • V-21

    Pohon Keputusan Simpul 1.4 1.5 untuk Deployment (2)

    Daftar Aturan : 40 (empat puluh) aturan terbentuk

    Gambar 5.31 Daftar Aturan Deployment 2 (1)

    Gambar 5.32 Daftar Aturan Deployment 2 (2)