Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru...tuberkulosis paru dan apakah ada...

8
Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X Jurnal Kajian Ilmiah 111 Universitas Bhayangkara Jakarta Raya Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru Joko Sulis Setyo 1 , Adjat Sudradjat 2 1 STMIK Nusa Mandiri Jakarta, [email protected] 2 AMIK BSI Jakarta, [email protected] ABSTRAK Kesehatan merupakan hal yang sangat berharga bagi semua orang. Tuberkulosis paru menjadi penyakit menular yang umum dan dalam banyak kasus bersifat mematikan. Tuberkulosis paru menular melalui udara ketika berinteraksi dengan orang yang sudah terinfeksi saat ia batuk dan bersin, atau melalui butiran ludah mereka yang menyebar di udara. Tuberkulosis paru dapat menyerang siapa saja, baik tua atau muda, laki-laki atau perempuan. Banyak gejala yang bisa terjadi pada seseorang yang terjangkit tuberkulosis paru, dan untuk menganalisa gejala tersebut bukan hal yang mudah, perlu dilakukan tes dahak pada penderita. Selain itu, dibutuhkan juga sebuah metode yang dapat mempermudah saat melakukan analisa dan menggali informasi pasien dari data rekam medik yang tersedia. Metode C4.5 (Decision Tree) adalah algoritma pengklasifikasian popular yang sederhana dan mudah diterapkan. Hasil yang diperoleh dari decision tree lebih mudah untuk dibaca dan ditafsirkan, melalui fitur untuk mengakses data detail profil pasien yang tersedia dalam pohon keputusan. Dengan perhitungan metode C4.5 diharapkan dapat membantu lebih awal dan memberikan banyak manfaat bagi pihak puskesmas dalam menangani pasien yang terjangkit tuberkulosis paru. Kata Kunci: Tuberkulosis Paru, Metode C4.5, Catatan Medis Pasien, Pusat Kesehatan ABSTRACT – Health is a very valuable thing for everybody. Pulmonary tuberculosis is a common contagious disease and in many cases deadly. Pulmonary tuberculosis is transmitted through the air when interacting with an infected person at the time when they cough and sneeze, or through their spittle granules that spread in the air. Pulmonary tuberculosis can affect all people, whether young or old, male or female. Many symptoms can occur in someone who contracted pulmonary tuberculosis, and to analyze the symptoms is not an easy thing, it needs to do sputum tests in patients. In addition, it is also necessary a method that can facilitate when performing analysis and extract patient information from medical record data available. The C4.5 (Decision Tree) method is a simple and easy-to-apply classification algorithm. The results obtained from the decision tree are easier to read and interpret, through features to access the detailed patient profile data available in the decision tree. With the calculation of C4.5 method is expected to help early and provide many benefits for the puskesmas in dealing with patients affected by pulmonary tuberculosis. Key Words: Pulmonary Tuberculosis, C4.5 Method, Patient Medical Records, Health Centers Naskah diterima : 15 Agustus 2017, Naskah dipublikasikan : 15 September 2017 PENDAHULUAN Kesehatan merupakan nikmat yang paling berharga bagi diri manusia. Pada umumnya setiap orang menginginkan hidup sehat. Namun bukan hal yang mudah untuk menjaga kesehatan, ditambah lagi pola hidup yang kurang baik. Salah satu yang bisa dilihat adalah kebiasaan merokok, ditambah lagi pencemaran udara yang sangat tinggi dari polusi. Itu semua dapat menimbulkan berbagai penyakit paru-paru. Paru-paru adalah organ dari sistem pernapasan (respirasi) dan berhubungan dengan sistem peredaran darah. Pada organ paru terdapat beberapa jenis penyakit yang dapat dikelompokan menjadi dua yaitu

Transcript of Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru...tuberkulosis paru dan apakah ada...

Page 1: Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru...tuberkulosis paru dan apakah ada penyakit penyerta lainnya dari data pasien yang terjangkit tuberkulosis paru menggunakan

Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

Jurnal Kajian Ilmiah 111

Universitas Bhayangkara Jakarta Raya

Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru

Joko Sulis Setyo1, Adjat Sudradjat2 1STMIK Nusa Mandiri Jakarta, [email protected]

2AMIK BSI Jakarta, [email protected]

ABSTRAK – Kesehatan merupakan hal yang sangat berharga bagi semua orang.

Tuberkulosis paru menjadi penyakit menular yang umum dan dalam banyak kasus bersifat mematikan. Tuberkulosis paru menular melalui udara ketika berinteraksi dengan orang yang

sudah terinfeksi saat ia batuk dan bersin, atau melalui butiran ludah mereka yang menyebar di udara. Tuberkulosis paru dapat menyerang siapa saja, baik tua atau muda, laki-laki atau perempuan. Banyak gejala yang bisa terjadi pada seseorang yang terjangkit tuberkulosis paru,

dan untuk menganalisa gejala tersebut bukan hal yang mudah, perlu dilakukan tes dahak pada penderita. Selain itu, dibutuhkan juga sebuah metode yang dapat mempermudah saat

melakukan analisa dan menggali informasi pasien dari data rekam medik yang tersedia. Metode C4.5 (Decision Tree) adalah algoritma pengklasifikasian popular yang sederhana dan mudah diterapkan. Hasil yang diperoleh dari decision tree lebih mudah untuk dibaca dan

ditafsirkan, melalui fitur untuk mengakses data detail profil pasien yang tersedia dalam pohon keputusan. Dengan perhitungan metode C4.5 diharapkan dapat membantu lebih awal dan

memberikan banyak manfaat bagi pihak puskesmas dalam menangani pasien yang terjangkit tuberkulosis paru. Kata Kunci: Tuberkulosis Paru, Metode C4.5, Catatan Medis Pasien, Pusat Kesehatan

ABSTRACT – Health is a very valuable thing for everybody. Pulmonary tuberculosis is a

common contagious disease and in many cases deadly. Pulmonary tuberculosis is transmitted through the air when interacting with an infected person at the time when they cough and sneeze, or through their spittle granules that spread in the air. Pulmonary tuberculosis can

affect all people, whether young or old, male or female. Many symptoms can occur in someone who contracted pulmonary tuberculosis, and to analyze the symptoms is not an easy

thing, it needs to do sputum tests in patients. In addition, it is also necessary a method that can facilitate when performing analysis and extract patient information from medical record data available. The C4.5 (Decision Tree) method is a simple and easy-to-apply classification

algorithm. The results obtained from the decision tree are easier to read and interpret, through features to access the detailed patient profile data available in the decision tree. With

the calculation of C4.5 method is expected to help early and provide many benefits for the puskesmas in dealing with patients affected by pulmonary tuberculosis. Key Words: Pulmonary Tuberculosis, C4.5 Method, Patient Medical Records, Health Centers

Naskah diterima : 15 Agustus 2017, Naskah dipublikasikan : 15 September 2017

PENDAHULUAN

Kesehatan merupakan nikmat yang

paling berharga bagi diri manusia. Pada umumnya setiap orang menginginkan hidup sehat. Namun bukan hal yang mudah untuk

menjaga kesehatan, ditambah lagi pola hidup yang kurang baik. Salah satu yang

bisa dilihat adalah kebiasaan merokok,

ditambah lagi pencemaran udara yang sangat tinggi dari polusi. Itu semua dapat

menimbulkan berbagai penyakit paru-paru. Paru-paru adalah organ dari sistem pernapasan (respirasi) dan berhubungan

dengan sistem peredaran darah. Pada organ paru terdapat beberapa jenis penyakit yang

dapat dikelompokan menjadi dua yaitu

Page 2: Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru...tuberkulosis paru dan apakah ada penyakit penyerta lainnya dari data pasien yang terjangkit tuberkulosis paru menggunakan

Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

Jurnal Kajian Ilmiah 112

Universitas Bhayangkara Jakarta Raya

penyakit paru spesifik (Tuberkulosis Paru) dan penyakit paru nonspesifik seperti bronchitis, pneumonia bronchiectasis,

bronchial asthma, tumor paru, dan lain-lain. Di antara penyakit paru, penyakit yang

paling menular dan berbahaya adalah tuberkulosis paru. Tuberculosis (TBC) merupakan penyakit menular yang umum,

dan dalam banyak kasus bersifat mematikan. penyakit ini disebabkan oleh

berbagai strain mikrobakteria, umumnya mycrobacterium tuberculosis. Biasanya menyerang paru-paru, namun juga bisa

berdampak pada bagian tubuh lainnya. Tuberkulosis menyerang melalui udara

ketika orang yang terinfeksi TB aktif batuk, bersin, atau menyebarkan melalui butiran ludah mereka melalui udara. TBC dapat

menyerang siapa saja, baik tua maupun muda, laki-laki ataupun perempuan.

Pusat Kesehatan Masyarakat (Puskesmas) merupakan salah satu sarana pelayanan kesehatan masyarakat yang amat

penting di Indonesia. Puskesmas adalah pintu pertama pelayanan kesehatan di masyarakat. Jika ditinjau dari sistem

pelayanan kesehatan di Indonesia, maka peranan dan kedudukan puskesmas adalah

sebagai ujung tombak sistem pelayanan kesehatan di Indonesia.

Seluruh data rekam medik pasien

yang tersimpan di puskesmas dapat digunakan untuk penambangan data (data

mining), sehingga bisa mengekstrak pengetahuan atau menemukan pola dari suatu data yang ada.

LANDASAN TEORI Data Mining adalah proses untuk

menemukan hubungan, pola dan tren baru yang bermakna dengan menyaring data sangat besar, yang tersimpan dalam

penyimpanan, menggunakan teknik pengenalan pola seperti teknik statistik dan

matematika (Kusrini dan Luthfi, 2009). Jadi, data mining adalah sebagai serangkaian proses mendapatkan

pengetahuan atau pola dari kumpulan data.

Data Mining adalah perpaduan dari Statistik, Artificial Inteligent dan Database (Gorunescu, 2011). Data Mining kemudian

dikenal dengan nama Knowladge-discovery in Database. Knowladge-discovery in

Database (KDD) adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola

atau hubungan dalam set data berukuran besar. Keluaran dari data mining ini bisa

dipakai untuk memperbaiki pengambilan keputusan di masa depan berdasarkan informasi yang di peroleh dari data masa

lalu. Tergantung pada aplikasinya, data ini bisa berupa pasien, mahasiswa,

permohonan kredit, image atau signal atau pengukuran lain yang perlu diklasifikasikan atau dicari fungsi regesinya atau relasi antar

atribut. (Santosa, 2007). Pohon keputusan (Decision Tree)

adalah, sebuah struktur data yang terdiri dari simpul (node) dan rusuk (edge). Simpul pada sebuah pohon dibedakan

menjadi tiga, yaitu simpul akar (root node), simpul percabangan/internal (branch/internal node) dan simpul daun

(leaf node). Metode decision tree dengan

algoritma C4.5 dapat digunakan untuk mengumpulkan berbagai informasi dari data yang ada di Puskesmas. Decision Tree

adalah algoritma pengklasifikasian yang popular yang sederhana dan mudah

diterapkan, tidak membutuhkan pengetahuan domain atau parameter pengetahuan dan dapat menangani data

dengan dimensional tinggi. Hasil yang diperoleh dari decision tree lebih mudah

untuk membaca dan menafsirkan melalui fitur untuk mengakses data detail profil pasien yang tersedia dalam pohon

keputusan. Pada penelitian ini, diagnosis yang dikembangkan akan lebih mengarah

kepada perhitungan klasifikasi gejala apa saja yang mempengaruhi seseorang terkena tuberkulosis paru.

Page 3: Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru...tuberkulosis paru dan apakah ada penyakit penyerta lainnya dari data pasien yang terjangkit tuberkulosis paru menggunakan

Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

Jurnal Kajian Ilmiah 113

Universitas Bhayangkara Jakarta Raya

METODOLOGI PENELITIAN

Tahapan Penelitian

Penelitian yang dilakukan oleh

penulis melalui tahapan sebagai berikut: 1. Perumusan Masalah

Setiap penelitian didasarkan pada permasalahan yang dihadapi. Tahap perumusan masalah yaitu klasifikasi

hal- hal yang mempengaruhi seseorang terjangkit penyakit TB paru dan apakah

ada penyakit penyerta lainnya dengan batasan ruang lingkup yang akan diteliti.

2. Penentuan Tujuan Penelitian

Menentukan tujuan yang akan didapat dari perumusan masalah yang terjadi dari

penelitian ini. Tujuan penelitian adalah untuk klasifikasi faktor yang mempengaruhi seseorang terkena

tuberkulosis paru dan apakah ada penyakit penyerta lainnya dari data

pasien yang terjangkit tuberkulosis paru menggunakan algoritma C4.5, sehingga membantu mendapatkan informasi untuk

memprediksi kondisi pasien yang akan berobat.

3. Studi Pustaka

Langkah selanjutnya adalah memantapkan diri untuk meneliti

masalah tersebut dengan teori yang berhubungan. Peneliti mempelajari buku-buku, jurnal penelitian, dan e-book

teori tentang data mining yang akan digunakan sebagai kajian teori dalam

penelitian. 4. Pengumpulan Data Primer

Data yang dikumpulkan dari data pasien

poli paru tahun 2016 pada di Puskesmas Kecamatan Cengkareng.

5. Pengolahan Data Pengolahan data yang penulis lakukan menggunakan teknik Data Mining

Algoritma C4.5 atau lebih dikenal pohon keputusan (Decision Tree).

6. Deskripsi Hasil Penelitian Menganalisa hasil pengolahan data berdasarkan hasil penelitian dan teori

yang ada dengan menggunakan perhitungan metode data mining

algoritma C4.5 sehingga diperoleh hasil

penelitian dan mendeskripsikan kesimpulan dari hasil penelitian yang telah dilakukan.

Instrumen Penelitian

Instrumen penelitian adalah suatu alat

yang digunakan untuk mengukur fenomena alam maupun sosial yang diamati, fenomena tersebut disebut variabel

penelitian (Sugiyono, 2009). Jadi instrumen penelitian merupakan alat bantu dalam

mengumpulkan data yang diperlukan terkait dengan penelitian tersebut. Karena data tersebut adalah data kuantitatif yang

dihitung dengan statistik dan menghasilkan deretan angka, maka instrumen yang

digunakan adalah melakukan pencatatan, wawancara informal dan dokumentasi dengan terjun langsung ke lapangan guna

mengambil data primer yang dibutuhkan saat observasi. Informasi yang dihasilkan

dari berbagai instrumen tidak perlu dicari validitas reliabelnya, sebab data yang diproses bersumber dari lembaga

bersangkutan yang menjadi tempat penelitian. Data yang diambil yaitu data historis rekam medik pasien yang terjangkit

penyakit tuberkulosis paru pada Puskesmas Kecamatan Cengkareng, Jakarta Barat.

Metode Pengumpulan Data

Pengumpulan data pada penelitan ini dilakukan dengan cara sebagai berikut:

a. Penelitian Lapangan Penelitian lapangan adalah penelitian

yang dilakukan langsung pada objek yang diteliti. Dalam hal ini pengumpulan data diperoleh melalui:

b. Wawancara (Interview) Penulis melakukan wawancara secara

langsung oleh sumber informasi yaitu kepala bagian poli paru Ibu Dr. Fitriani pada Puskesmas Kecamatan

Cengkareng. c. Observasi

Pengunpulan data ini dilakukan dengan pengamatan dan pencatatan secara langsung pada objek penelitian untuk

mendapatkan data-data yang diperlukan dalam penelitian. Seperti pencatatan dan

Page 4: Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru...tuberkulosis paru dan apakah ada penyakit penyerta lainnya dari data pasien yang terjangkit tuberkulosis paru menggunakan

Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

Jurnal Kajian Ilmiah 114

Universitas Bhayangkara Jakarta Raya

pengamatan langsung pada saat wawancara.

d. Dokumentasi

Pengumpulan data ini dilakukan dengan cara pengambilan data-data dokumen

yang diperlukan untuk kebutuhan penelitian. Dengan mengambil Data rekam medik pasien tahun 2016 yang

terjangkit penyakit Tuberkulosis Paru, visi dan misi perusahaan.

Populasi

Populasi adalah wilayah generalisasi yang terdiri atas: obyek/subyek yang

mempunyai kualitas dan karakteristik tertentu yang ditetapkan oleh peneliti untuk

dipelajari dan kemudian ditarik kesimpulannya. Jadi populasi tidak hanya orang tetapi obyek dan benda-benda alam

yang lain. Populasi juga bukan sekedar jumlah yang ada pada obyek/subyek yang

dipelajari, tetapi meliputi seluruh karakteristik/sifat yang dimiliki oleh subyek atau obyek itu (Sugiyono, 2009).

Berdasarkan kesimpulan di atas, populasi dalam penelitian ini yaitu Data 247 data pasien poli paru Tahun 2016 pada

Puskesmas Kec. Cengkareng Jl. Kamal Raya No.02 RT.9/RW.7, Kelurahan

Cengkareng Barat, Kecamatan Cengkareng –Jakarta Barat 11730.

Sample Penelitian

Sample adalah bagian dari jumlah dan karakteristik yang dimiliki oleh populasi

besar dan peneliti tidak mungkin mempelajari semua yang ada pada populasi, kesimpulannya akan dapat diberlakukan

untuk populasi sample yang di ambil harus betul- betul mawakili (Sugiyono, 2009).

Analisis Data

Dalam penelitian ini penulis menggunakan analisis data kuantitatif, yaitu

suatu analisa data yang dipergunakan apabila kesimpulan-kesimpulan yang

diperoleh dapat dibuktikan dengan angka-angka dan juga dalam perhitungan dipergunakan rumus yang ada hubungannya

dengan analisis penelitian. Dalam hal ini

akan dipegunakan analisis Algoritma C4.5 (Decision Tree). Selanjutnya penulis melakukan pengamatan serta analisa

terhadap permasalahan di Puskesmas Kecamatan Cengkareng yang terjadi pada

Bagian Poli Paru dengan menggunakan metode pengolahan Data Algoritma C4.5 (Decision Tree).

Ada beberapa tahap dalam membuat pohon keputusan dengan algoritma C4.5

(Kusrini, 2007). Yaitu : 1. Menyiapkan data training. 2. Data training biasanya diambil dari data

histori yang pernah terjadi sebelumnya dan sudah dikelompokan ke

dalam kelas-kelas tertentu. 3. Menentukan akar dari pohon. Akar akan

mengambil dari atribut yang terpilih,

dengan cara menghitung niali gain dari masing – masing atribut, niali gain yang

paling tinggi yang akan menjadi akar pertama. Sebelum menghitung nilai gain dari atribut, hitung dahulu nilai entropy.

Untuk menghitung nilai entropy digunakan rumus:

Keterangan :

S = himpunan kasus n = jumlah partisi S pi = proposi Si terhadap S

4. Kemudian hitung nilai gain dengan

rumus :

Keterangan : S = himpunan kasus A = fitur

n = jumlah partisi atribut A |Si| = proposi Si terhadap S

|S| = jumlah kasus dalam S

5. Ulangi langkah ke-2 hingga semua

record terpartisi 6. Proses partisi pohon keputusan akan

berhanti saat:

Page 5: Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru...tuberkulosis paru dan apakah ada penyakit penyerta lainnya dari data pasien yang terjangkit tuberkulosis paru menggunakan

Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

Jurnal Kajian Ilmiah 115

Universitas Bhayangkara Jakarta Raya

a. Semua record dalam simpul N mendapat kelas yang sama.

b. Tidak ada atribut di dalam record

yang dipartisi lagi. c. Tidak ada record di dalam cabang

yang kosong. Setelah hasil perhitungan algoritma

C4.5 didapat dengan perhitungan manual,

maka akan lebih akurat dengan software Rapid Miner. Dengan cara menginput table

ke dalam Ms. Excel yang kemudian akan dimasukan ke software Rapid Miner file akan terbaca apabila format yang digunakan

xls.

PEMBAHASAN

Berdasarkan data rekam medik pasien yang berobat tahun 2016 di poli paru Puskesmas Kecamatan Cengkareng dapat

diperoleh data sebagai berikut:

Tabel 1. Data Rekam Medik Pasien Poli Paru

No

.

Jen

is k

ela

min

Um

ur

Ba

tuk

2-3

min

gg

u

Ker

ing

at

ma

lam

Ber

at

ba

da

n t

uru

n

Na

fsu

ma

ka

n b

erk

ura

ng

Riw

ay

t k

on

tak

TB

Ba

tuk

ber

da

ha

k

Ba

tuk

ber

da

rah

Ha

sil

BC

G m

un

cul

Cep

at

Ben

jola

n d

i le

her

Ha

sil

1 Prmpn 55-64 y t y y t y t t t -

2 Laki2 15-24 y y y y t y y t t +

3 Laki2 >65 y t y t t y t t t -

4 Laki2 25-34 y y y t t y t t t -

5 Laki2 15-24 y y y y y y y t t +

6 Laki2 35-44 y y y t t y t t t -

7 Prmpn 15-24 y y y t t y t t t -

8 Prmpn 15-24 y y y y t y y t t +

9 Prmpn 25-34 y y y y t y y t t +

10 Prmpn 15-24 y y y t t y t t t -

11 Laki2 25-34 y t y y t y t t t -

12 Laki2 55-64 y y y y t y t t t +

13 Laki2 35-44 y t y y t t t t t -

14 Laki2 45-54 y y y t t y t t t -

15 Laki2 45-54 y y y t t y t t t -

16 Prmpn 15-24 y y y t t y t t t -

17 Prmpn 15-24 y y y t t y t t t -

18 Laki2 25-34 y t y y y y y t t +

19 Prmpn >65 y t y y t y t t t -

20 Prmpn >65 y t y y t y t t t -

21 Laki2 45-54 y y y t t y t t t -

22 Laki2 35-44 y t y y t y t t t -

23 Laki2 35-44 y t y y t y t t t -

24 Prmpn 25-34 y y y y y y t t t +

25 Laki2 25-34 y y y y y y t t t +

26 Laki2 25-34 y y y y t y y t t +

27 Laki2 45-54 y y y y t y y t t +

28 Laki2 0-14 y t y y t y y y y +

29 Laki2 45-54 y t y y t t t t t -

Sumber: Puskesmas Cengkareng (2016)

Berdasarkan tabel tersebut dengan menggunakan metode C4.5 (Decision Tree) akan ditentukan seseorang positif atau

negatif terjangkit tuberkulosis paru dengan melihat Jenis kelamin, umur, batuk 2-

minggu, keringat malam, berat badan turun, nafsu makan berkurang, riwayat kontak TB, batuk berdahak, batuk berdarah, hasil

suntikan BCG muncul lebih cepat 1 minggu dan muncul benjolan di leher.

Tabel 2. Proses Klasifikasi Data

JUM

LAH

K

ASU

S

NEG

ATI

F

PO

SITI

F

ENTR

OP

Y

GA

IN

TOTAL

247 106 141 0,985467

jenis kelamin

0,014028

Laki2 146 71 75 0,999458

Prmpn 101 35 66 0,930935

Umur

0,122861

0-14 44 3 41 0,359101

15-24 47 22 25 0,997059

25-34 46 18 28 0,965636

35-44 48 25 23 0,998747

45-54 32 19 13 0,974489

55-64 23 13 10 0,987692

>65 7 6 1 0,591672

Batuk

2-3 minggu

0,000340

YA 244 105 139 0,985948

TIDAK 3 1 2 0,918295

Keringat malam

0,039899

YA 158 54 104 0,926504

TIDAK 89 52 37 0,979411

Berat badan

turun

0,000340

YA 244 105 139 0,985948

TIDAK 3 1 2 0,918295

Nafsu makan

0,283186

Berkurang YA 174 41 133 0,787700

TIDAK 73 65 8 0,498675

Riwayat

kontak TB

0,153185

YA 48 1 47 0,14609

Page 6: Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru...tuberkulosis paru dan apakah ada penyakit penyerta lainnya dari data pasien yang terjangkit tuberkulosis paru menggunakan

Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

Jurnal Kajian Ilmiah 116

Universitas Bhayangkara Jakarta Raya

TIDAK 199 105 94 0,99779

Batuk

berdahak

0,030374

YA 196 94 102 0,99879

TIDAK 51 12 39 0,78712

Batuk

berdarah

0,182145

YA 68 4 64 0,32275

TIDAK 179 102 77 0,98588

Hasil BCG

muncul cepat

0,128261

YA 42 1 41 0,16232

TIDAK 205 105 100 0,99957

Muncul

benjolan dileher

0,128261

YA 42 1 41 0,16232

TIDAK 205 105 100 0,999570

Sumber: Hasil olahan data

Untuk memilih atribut sebagai akar,

didasarkan pada nilai gain tertinggi dari atribut-atribut yang ada. Sebelum

menghitung nilai gain dari atribut, hitung dahulu nilai entropy yaitu:

Berdasarkan tabel rekam medik

diatas, maka dihitung nilai entropy terlebih dahulu

1. Menghitung Nilai Entropy Total

Entropy (Total) =

(-106/247*log2(106/247))+(-141/247* log2 (141/247))

Entropy (Total) = 0,985467

2. Menghitung nilai entropy Jenis

Kelamin

Entropy (jenis kelamin,laki-laki) =

(-71/146*log2(71/146))+(-75/146* log2 (75/146))

Entropy (jenis kelamin,laki-laki l) = 0,999458

Entropy (jenis kelamin,perempuan) = (-35/101*log2(35/101))+ (-66/101* log2 66/101))

Entropy (jenis kelamin,perempuan) = 0,930935

Gain (Total,jenis kelamin) = 0,985467196–((-146/247*

0,999458482)+(101/247*0,930935072))

Gain(Total, jenis kelamin)= 0,014028

3. Menghitung Entropy Umur:

Entropy(umur,0-14)=

(-3/44*log2(3/44))+(-41/44* log2(41/44))

Entropy(umur,0-14)= 0,359101

Entropy(umur,15-24)= (-22/47*log2(22/47))+(-25/47*

log2(25/47))

Entropy(umur,15-24)= 0,997059

Entropy(umur,25-34)= (-18/46*log2(18/46))+(-28/46*

log2(28/46))

Entropy(umur, 25-34)= 0,965636

Entropy(umur,35-44)=

(-25/48*log2(25/48))+(-23/48* log2(23/48))

Entropy(umur,35-44)= 0,998747

Entropy(umur,45-54)=

(-19/32*log2(19/32))+(-13/32* log2(13/32))

Entropy(umur,45-54)= 0,974489 Entropy(umur,55-64)=

(-13/23*log2(13/23))+(-10/23* log2(10/23))

Entropy(umur, 55-64)= 0,987692

Entropy(umur,>65)= (-6/7*log2(6/7))+(-1/7* log2(1/7))

Entropy(umur,>65)= 0,591672

Gain(Total,umur)=

0,985467196–((-44/247*0,359101626)+ (47/247*0,997059057)+ (46/247*0,965636133)+

(48/247*0,998747298)+

Page 7: Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru...tuberkulosis paru dan apakah ada penyakit penyerta lainnya dari data pasien yang terjangkit tuberkulosis paru menggunakan

Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

Jurnal Kajian Ilmiah 117

Universitas Bhayangkara Jakarta Raya

(32/247*0,974489403)+ (23/247*0,987692509)+ (7/247*0,591672779))

Gain(Total,umur) = 0,122861

4. Menghitung Entropy Batuk 2-3

Minggu

Entropy(batuk 2-3 minggu,YA)= (-105/244*log2(105/244))+

(-139/244*log2139/244))

Entropy(batuk 2-3 minggu,YA)=

0,985948

Entropy(batuk 2-3 minggu,TIDAK)= (-1/3*log2(1/3))+(- 2/3* log2(2/3))

Entropy(batuk 2-3 minggu,TIDAK)= 0,918295

Gain(Total, batuk 2-3 minggu) = 0,985467196–((-244/247*0,985948041)+

(3/247*0,918295834))

Gain(Total,umur) = 0,000340

5. Menghitung Entropy Keringat malam

Entropy(keringat malam,YA)= (-54/158*log2(154/58))+ (-104/158*log2(104/158))

Entropy(keringat malam,YA)= 0,926504

Entropy(keringat malam,TIDAK)= (-52/89*log2(52/89))+ (-37/89*log2(37/89))

Entropy(keringat malam,TIDAK)= 0,979411

Gain(Total,keringat malam) =

0,985467196–((-158/247*0,926504446)+ (89/247*0,979411635))

Gain(Total,umur) =0,039899

Dari perhitungan pada tabel IV.2 dihasilkan gain tertinggi pada nafsu makan Berkurang dengan nilai 0,283186. Dengan

demikian nasfu makan berkurang menjadi

node akar. Ada dua nilai atribut dari nasfu makan berkurang yaitu YA dan TIDAK keduanya masih perlu dilakukan

perhitungan lagi.

KESIMPULAN DAN SARAN

Dari uraian yang telah disampaikan

penulis, dapat diambil kesimpulan sebagai berikut: 1. Hasil perhitungan secara manual bahwa

yang menjadi node akar adalah atribut nafsu makan berkurang dan hasil akhir

kelas pada atribut jenis kelamin dan keringat malam.

2. Hasil perhitungan menggunakan

Aplikasi Rapid Miner, yang menjadi node akar adalah atribut nafsu makan

berkurang dan hasil akhir kelas pada atribut jenis kelamin,hasil suntikan BCG muncul, dan keringat malam.

3. Dari hasil perhitungan secara manual dan menggunakan aplikasi Rapid Miner didapat hasil yang hampir sama. Yaitu

atribut nafsu makan berkurang menjadi node akar seseorang terkena

Tuberkulusis Paru. Sedangkan hasil akhir kelas pada perhitungan manual didapat atribut jenis kelamin, keringat

malam dan perhitungan Rapid miner didapat atribut jenis kelamin, keringat

malam dan hasil suntikan BCG muncul cepat. Yang membedakan hanya atribut hasil suntikan BCG muncul pada

perhitungan Rapid miner. 4. Dari hasil penelitian yang penulis ambil

dari data pasien yang ada, Penulis menyimpulkan bahwa faktor seseorang batuk lebih 2-3 minggu, batuk

berdahak,dan batuk berdarah belum tentu terkena Tuberkulosis Paru. Bisa

saja terjangkit penyakit lain, seperti bronchitis, pneumonia brockiectasis, asma bronkiole dan penyakit pernafasan

lainnya.

Page 8: Penerapan Metode C4.5 Terhadap Penyakit Tuberkulosis Paru...tuberkulosis paru dan apakah ada penyakit penyerta lainnya dari data pasien yang terjangkit tuberkulosis paru menggunakan

Volume 17, No. 3, September 2017 ISSN 1410-9794, EISSN 2597-792X

Jurnal Kajian Ilmiah 118

Universitas Bhayangkara Jakarta Raya

Berdasarkan hasil penelitian penerapan algoritma C4.5 pada penyakit Tuberkulosis yang akan diajukan, maka

saran yang selayaknya dapat dan dipertimbangkan agar dalam implementasi

nanti dapat bermanfaat dimasa depan sebagai berikut:

1. Memperluas ruang lingkup dari penelitian, sehingga menghasilkan informasi yang lebih menyeluruh

terhadap kondisi pasien dan menjadi bahan pertimbangan dalam pengambilan

keputusan untuk menentukan strategi pihak puskesmas.

2. Perlunya pemeliharaan dan pengawasan

data pasien yang berguna sebagai bahan informasi menganalisa kondisi dimasa

yang akan datang. 3. Mengembangkan pengarsipan data yang

lebih terkomputerisasi yang berhubung

dengan data mining, seperti data warehouse.

DAFTAR PUSTAKA

Gorunescu, Florin. (2011). Data Mining-

Concepts, Models, and Techniques. Berlin: Springer.

Hermawati, Fajar Astuti. (2013). Data

Mining. Yogyakarta: Andi Offset.

Himawan, Hidayatulah, Oliver S.

Simanjuntak, Triawan, Agus. (2015). Diagnosa Tingkat Kesehatan Pasien Menggunakan Metode Decision Tree.

ISSN: 1979-2328. Yogyakarta: Jurnal Ilmiah UPN “Veteran” Vol I, No. 1

Yogyakarta 2015 : 178-181. Diambil dari: http://jurnal.upnyk.ac.id/index.php/se

mnasif/article/view/1380 (23 Oktober 2016)

Ihsan dan Wajhillah, Rusda. (2015).

Penerapan Algoritma C4.5 terhadap

Diagnosa Penyakit demam Tifoid Berbasis Mobile. ISSN: 2355-990.

Sukabumi: Jurnal Ilmiah Swabumi Vol III, No. 1 September 2015: 24-

30. Diambil dari: https://www.researchgate.net/publication/290438140 (22 Oktober 2016)

Iswanto, Mukhammad Hasim, Adhistya

Erna Permanasari, dan Hanung Adi Nugroho. (2015). Pemanfaatan Teknik Data Mining Untuk Diagnosis

Penyakit Tuberculosis (TBC). ISSN: 2302-3805. Yogyakarta: Jurnal Ilmiah

Semnasteknomedia Vol III, No.1 6-7 Februari 2015: 121-124. Diambil dari:

http://ojs.amikom.ac.id/index.php/semnasteknomedia/article/view/901 (16

Oktober 2016) Kusrini. (2007). Konsep dan Aplikasi

Sistem Pendukung Keputusan. Yogyakarta: Andi Offset.

Kusrini dan Luthfi, E.T. (2009). Algoritma

Data Mining. Yogyakarta: Andi

Offset. Santosa, Budi. (2007). Data Mining

Terapan dengan Matlab. Yogyakarta: Graha Ilmu.

Sugiyono. (2009). Metode Penelitian Bisnis

(Pendekatan Kuantitatif, Kualitatif,

dan R&D). Bandung: Alfabeta.

Widodo, Prabowo Pudjo, Rahmadya Trias Handayanto, dan Herlawati. (2013). Penerapan Data Mining Dengan

Matlab. Bandung: Rekayasa Sains.