PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH...

33
PREDIKSI FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2016

Transcript of PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH...

Page 1: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

PREDIKSI FORMULA JAMU UNTUK PENYEMBUHANPENYAKIT DIABETES DENGAN

TEKNIK GRAPH MINING

MUHAMMAD FAHMI AMIR

DEPARTEMEN ILMU KOMPUTERFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGORBOGOR

2016

Page 2: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

PERNYATAAN MENGENAI SKRIPSI DANSUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa skripsi berjudul Prediksi Jamu untukPenyembuhan Penyakit Diabetes dengan Teknik Graph Mining adalah benarkarya saya dengan arahan dari komisi pembimbing dan belum diajukan dalambentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yangberasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan daripenulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka dibagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada InstitutPertanian Bogor.

Bogor, September 2016

Muhammad Fahmi AmirNIM G64120005

Page 3: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

ABSTRAK

MUHAMMAD FAHMI AMIR. Prediksi Formula Jamu untuk PenyembuhanPenyakit Diabetes dengan Teknik Graph Mining. Dibimbing oleh WISNUANANTA KUSUMA.

Jamu merupakan obat yang terdiri atas akar-akaran, daun-daunan, dansebagainya. Setiap tanaman yang menyusun sebuah jamu memiliki beberapasenyawa aktif yang berhubungan langsung dengan protein target. Protein targetmerupakan protein-protein yang berasosiasi langsung dengan sebuah penyakit.Penelitian ini berfokus pada penyakit Diabetes Melitus. Hubungan antar tanaman,senyawa aktif, dan protein target dapat dibentuk dalam sebuah jejaringfarmakologi yang direpresentasikan dalam graf. Algoritme Fingerprint dankoefisien Tanimoto digunakan untuk menduga kemiripan antar senyawa aktif daritanaman dan senyawa aktif yang menarget protein-protein diabetes. Teknikpenelusuran graf dapat diterapkan untuk mencari tanaman apa saja yang dapatberhubungan dengan protein target tertentu. Tanaman mangga, buncis, dan tapakdara memiliki skor formula jamu tertinggi dengan komposisi 1 tanaman dan dapatmenarget 9 protein target Diabetes Melitus. Lebih lanjut, kombinasi 9 tanamanmenunjukkan skor maksimal formula jamu yang mungkin, dengan 14 proteintarget yang dapat ditarget dari 21 protein target signifikan (66.67%). Terdapat 16kandidat formula jamu dengan kombinasi 9 tanaman yang memiliki skormaksimal.Kata kunci: jamu, jejearing farmakologi, penelusuran graf, protein target, senyawaaktif.

ABSTRACT

MUHAMMAD FAHMI AMIR. Predicting Jamu Formula for diabetes melitus usingGraph Mining Technique. Supervised by WISNU ANANTA KUSUMA.

Jamu (Indonesian term for herbal medicine) is a type of medicine that consists ofroots, leaves, and other parts of plant. Each plant component of Jamu has several activecompounds that directly connected to the target protein. Target proteins are proteins thatare directly associated with a disease. This research focuses on diabetes mellitusdisease. The connection between plants, active compounds, and target proteins can beestablished within a network pharmacology represented in graph. The Fingerprintalgorithm and Tanimoto coefficient are used to estimate the similarity between activecompounds of plants and active compounds that have association with the targetproteins of diabetes. The graph traversing technique can be applied to find any plantthat has connection with the specific target protein. This research discovered thatmango (tree), stringbean, and rosi periwinkle have the highest score result of Jamuformula with the composition of 1 plant. Those plants target 9 diabetes mellitus targetproteins. In addition, the combination of 9 plants showed the maximum possible scoreof jamu formula, with 14 target proteins that could be achieved from 21 significanttarget proteins (66.67%). There are 16 jamu formula candidates with the combinationof 9 plants that have the maximum score result.Keywords: active compound, graph traversing , jamu, network pharmacology,significant protein.

Page 4: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

PREDIKSI FORMULA JAMU UNTUK PENYEMBUHANPENYAKIT DIABETES DENGAN

TEKNIK GRAPH MINING

MUHAMMAD FAHMI AMIR

Skripsisebagai salah satu syarat untuk memperoleh gelar

Sarjana Komputer pada

Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTERFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGORBOGOR

2016

Page 5: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

Penguji:

1. Vektor Dewanto, ST MEng

2. Husnul Khotimah, SKomp MKom

Page 6: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

Judul Skripsi : Prediksi Formula Jamu untuk Penyembuhan Penyakit Diabetes denganTeknik Graph Mining

Nama : Muhammad Fahmi AmirNIM : G64120005

Disetujui oleh

Dr Eng Wisnu Ananta Kusuma, ST MT Pembimbing I

Diketahui oleh

Dr Ir Agus Buono, MSi Mkom Ketua Departemen

Tanggal lulus:

Page 7: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

PRAKATAPuji dan syukur penulis curahkan kepada Allah SWT atas segala nikmat dan

karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalampenelitian yang dilaksanakan sejak bulan Februari 2016 sampai Mei 2016 ini ialahjamu, dengan judul Prediksi Formula Jamu untuk Penyembuhan Penyakit Diabetesdengan Teknik Graph Mining.

Terima kasih penulis ucapkan kepada Ayahanda Djafar Amir dan IbundaRahmuniar yang selalu memberikan semangat, doa, dan kasih sayang, sehinggapenulis dapat menyelesaikan penelitian ini. Ucapan terima kasih selanjutnyakepada Bapak Dr Eng Wisnu Ananta Kusuma, ST MT, selaku pembimbing dalampenelitian ini, yang telah memberikan ilmu, arahan, binaan, dan saran yang sangatberharga kepada penulis selama menyusun skripsi. Ucapan terima kasih juga,penulis sampaikan kepada Bapak Vektor Dewanto, ST MEng dan Bu HusnulKhotimah, SKomp MKom, selaku penguji pada penelitian ini. Terima kasih taklupa penulis sampaikan juga kepada teman-teman seperjuangan ilmu komputerIPB angkatan 49, yang selalu memberikan semangat dan dukungan.

Akhir kata, semoga penelitian ini dapat memberikan banyak manfaat.

Bogor, September 2016

Muhammad Fahmi Amir

Page 8: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

DAFTAR ISI

DAFTAR TABEL viDAFTAR GAMBAR viPENDAHULUAN 1

Latar Belakang 1Perumusan Masalah 2Tujuan Penelitian 2Manfaat Penelitian 2

METODE 3Data 3Tahapan penelitian 3Algoritme Fingerprint 4Algoritme Traversing 5Lingkungan Pengembangan 8

HASIL DAN PEMBAHASAN 9Pengumpulan Data 9Pra Proses Data 9Penelusuran Graf dari Protein Diabetes Melitus ke Tanaman 11Kombinasi k Tanaman 12

SIMPULAN DAN SARAN 22Simpulan 22Saran 22

DAFTAR PUSTAKA 22RIWAYAT HIDUP 24

Page 9: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

DAFTAR TABEL

1 Hasil pengumpulan data dari berbagai database 102 Hasil normalisasi bobot protein 113 Kandidat 10 formula jamu kombinasi 1 tanaman dengan skor tertinggi 134 Perbandingan protein target Punica granatum dengan Argemone mexicana 135 Kandidat 10 formula jamu kombinasi 2 tanaman dengan skor tertinggi 146 Perbandingan bobot edge Mangifera indica dan Citrus aurantium 157 Kandidat 10 formula jamu kombinasi 3 tanaman dengan skor tertinggi 168 Kandidat 10 formula jamu kombinasi 4 tanaman dengan skor tertinggi 179 Waktu eksekusi program untuk k kombinasi tanaman 18

10 Perbandingan waktu eksekusi, skor maksimal, dan protein target 1911 Kandidat jamu 1 hingga jamu 8 dengan skor maksimal 2012 Kandidat jamu 9 hingga jamu 16 dengan skor maksimal 2113 Daftar protein Diabetes Melitus yang ditarget oleh Phaseolus vulgaris 2114 Protein Diabetes Melitus yang ditarget Phaseolus vulgaris 22

DAFTAR GAMBAR

1 Alur pengumpulan data 32 Tahapan penelitian 43 Ilustrasi algoritme Fingerprint 44 Ilustrasi jejaring farmakologi 55 Grafik skor maksimal dengan mereduksi tanaman 19

Page 10: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

PENDAHULUAN

Latar Belakang

Menurut kamus besar bahasa Indonesia, jamu merupakan obat dari akar-akaran, daun-daunan, dan sebagainya. Secara tradisional, jamu disusun dariberbagai tanaman yang dianggap memiliki khasiat untuk menyembuhkan danhanya berdasarkan pengalaman empiris selama ribuan tahun yang dipercayasecara turun-temurun. Secara umum, masih sedikit penjelasan lebih lanjutmengenai khasiat sebuah formula jamu dengan tanaman yang terkandung didalamnya (Nurishmaya 2014).

Penelitian jamu oleh Afendi et al. (2010) mengungkapkan setidaknyasebuah formula jamu memiliki komposisi empat tanaman herbal. Satu tanamanutama yang berefek langsung ke penyakit dan tiga tanaman lainnya sebagaitanaman pendukung yang memiliki khasiat sebagai analgesik, antimikroba, danantiradang. Selanjutnya, Afendi et al. (2013) membuat sistem klasifikasi khasiatformula jamu menggunakan metode PLS-DA (Partial Least Squares DiscriminantAnalysis). Data jamu yang digunakan fokus pada 3138 formula jamu yang diambildari 465 tanaman, semuanya terklasifikasi ke dalam 9 khasiat. Pemodelanklasifikasi dengan PLS-DA memiliki akurasi 94.21%.

Pemodelan klasifikasi khasiat jamu dilanjutkan oleh Fitriawan (2013),dengan menggunakan metode SVM (Support Vector Machinie). Data penelitiantersebut menggunakan data yang sama dengan data penelitian Afendi (2013).Hasilnya, pemodelan dengan SVM memiliki tingkat akurasi 95.34%, sedikit lebihbesar dibandingkan dengan pemodelan menggunakan PLS-DA.

Sistem klasifikasi khasiat jamu yang dibangun pada penelitian sebelumnyadimanfaatkan untuk memprediksi komposisi tanaman sebagai formula jamuantidiabetes. Nurishmaya (2014) mengemukakan bahwa, aktivitas farmakologistanaman utama untuk antidiabetes adalah hipoglikemik. Menurut Afendi et al.(2013), aktivitas farmakologis hipoglikemik muncul secara konsisten pada 54tanaman penyusun jamu dengan khasiat GST (Gastrointestinal Disorders).Kombinasi dari tanaman-tanaman tersebut kemudian diprediksi khasiatnyamenggunakan sistem yang telah dibangun sebelumnya. Ditemukan bahwatanaman pare, sembung, jahe, dan brotowali secara konsisten diprediksi memilikikhasiat GST.

Salah satu cara dalam menjelaskan mekanisme kerja sebuah obat adalahdengan mengetahui komponen senyawa aktif obat dan interaksinya dengan proteintarget sebuah penyakit. Sebuah tanaman obat yang menyusun sebuah jamu,memiliki banyak komponen senyawa kimia yang bekerja pada satu atau lebihprotein target (multicomponent-network target) (Syahrir 2015).

Langkah awal dalam mencari obat untuk sebuah penyakit, yaitu menelitiprotein-protein yang berasosiasi dengan penyakit tersebut (Li J et al. 2009).Sebuah penyakit dapat disembuhkan bila terdapat suatu senyawa aktif yangberhubungan langsung dengan protein tersebut.

Hubungan antara tanaman, senyawa aktif yang terkandung dalam tanaman,dan protein yang ditarget oleh senyawa aktif, dapat dibentuk dalam sebuahjejaring farmakologi yang direpresentasikan dalam graf. Teknik penelusuran graf

Page 11: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

2

ataupun graph mining dapat diterapkan pada multicomponent-network target,untuk mencari komposisi tanaman apa saja yang dapat berhubungan pada proteintarget tertentu.

Penelitian ini difokuskan pada formulasi jamu antidiabetes. Hasil penelitianUsman (2015), mengenai protein-protein signifikan yang berasosiasi denganDiabetes Melitus, akan digunakan sebagai data protein yang akan ditarget olehsenyawa aktif yang terkandung dalam tanaman jamu.

Perumusan Masalah

Hubungan antara tanaman, senyawa aktif yang terkandung dalam tanaman,dan protein yang ditarget oleh senyawa aktif dapat dimodelkan dalam sebuahjejaring farmakologi yang direpresentasikan dalam graf. Sebuah tanaman dapatmengobati sebuah penyakit apabila terdapat senyawa aktif yang terkandung dalamtanaman tersebut yang menarget protein-protein yang merepresentasikan penyakityang dimaksud.

Berdasarkan latar belakang, perumusan permasalahan pada penelitian iniadalah:1. Bagaimana memprediksi formula jamu anti diabetes dengan teknik graph

mining pada jejaring interaksi bahan aktif dan protein target Diabetes Melitus.2. Bagaimana menjelaskan formula baru tersebut bekerja mengobati diabetes

dalam sudut pandang graph mining.

Tujuan Penelitian

Tujuan dari penelitian ini adalah:1. Memprediksi formula jamu yang dapat mengobati penyakit Diabetes Melitus

dengan teknik graph mining.2. Menjelaskan cara kerja formula baru tersebut, dalam sudut pandang graph

mining.

Manfaat Penelitian

Diharapkan, formula jamu diabetes ini menjadi obat herbal yang dapatmengobati penderita diabetes.

Ruang Lingkup Penelitian

Lingkup dari penelitian ini, yaitu:1. Menggunakan data yang sama pada penelitian Fitriawan (2013): 465 jenis

tanaman yang terdapat di dalam dataset.2. Data senyawa aktif yang digunakan terdapat pada pangkalan data PubChem.

Page 12: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

3

3. Data interaksi senyawa aktif dan protein target terdapat pada pangkalan dataPubChem BioAssay.

4. Menggunakan data hasil penelitian Usman (2015): 21 protein target signifikanyang berasosiasi dengan penyakit Diabetes Melitus.

METODE

Data

Data pada penelitian ini terbagi atas 3 jejaring farmakologi yaitu GA , GB ,dan GC . GA merupakan jejaring tanaman, senyawa aktif, dan protein target. GB

adalah perluasan dari GA dengan mencari 10 senyawa aktif yang memilikikemiripan 0.9 dari setiap senyawa pada GA. GC merupakan jejaring hubunganantara protein signifikan Diabetes Melitus dengan senyawa aktif.

Pengumpulan data dilakukan dengan teknik web crawling pada beberapapangkalan data dan melalui hasil penelitian terkait. Secara ringkas, alurpengumpulan data dapat dilihat pada Gambar 1.

Tahapan penelitian

Tahapan-tahapan yang dilakukan pada penelitian ini dapat dilihat padaGambar 2.

Gambar 1 Alur pengumpulan data

Page 13: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

4

Algoritme Fingerprint

Algoritme ini dapat mengukur kemiripan antar dua buah senyawa yangdihitung menggunakan koefisien Tanimoto. Semakin mirip dua buah senyawamaka koefisien Tanimoto akan mendekati 1, sebaliknya semakin tidak mirip duabuah senyawa maka koefisien Tanimoto akan mendekati nilai 0. Algoritme iniakan mengodekan sebuah senyawa menjadi bit-bit biner yang merepresentasikansebuah struktur molekul. Terdapat 4860 struktur molekul yang diakomodasi olehFingerprint. Ilustrasi Algoritme Fingerprint dapat dilihat pada Gambar 3.

Pada setiap senyawa, algoritme Fingerprint akan mengkodekan 1 padasebuah bit jika terdapat sebuah struktur molekul yang bersesuaian, dan 0 untuksebaliknya. Dalam mengukur tingkat kemiripan, digunakan koefisien Tanimoto

Gambar 2 Tahapan penelitian

Gambar 3 Ilustrasi algoritme Fingerprint

Page 14: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

5

sesuai persamaan (1). Pada penelitian ini, algoritme Fingerprint digunakan untukmenghitung skor kemiripan antara senyawa aktif pada GA dan GC.

koef = c / (a+b-c) (1)

a = jumlah bit 1 pada senyawa pertamab = jumlah bit 1 pada senyawa keduac = jumlah bit 1 pada kedua senyawa

Algoritme Traversing

a. Menghubungkan GA , GB , dan GC

Terdapat 3 jejaring utama dari data penelitian ini. Ketiga jejaring tersebutmerupakan jejaring farmakologi berupa:

(GA) jejaring tanaman,senyawa aktif, protein

target

(GB) perluasan GA (GC) jejaring proteintarget Diabetes Melitus

Gambar 4 Ilustrasi jejaring farmakologi

Vertex atau simpul pada jejaring tersebut merupakan salah satu darikomponen tanaman, senyawa aktif, protein, ataupun penyakit, sedangkan edgedinyatakan sebagai keterhubungan antar komponen.

Jejaring farmakologi tersebut akan disimpan dalam struktur dataadjacency list, yaitu struktur data yang menyimpan graf dalam bentuk daftarketetanggaan. Penggunaan struktur data ini lebih baik dibandingkan denganmenggunakan struktur data adjacency matrix. Adjacency list dapatmempercepat proses penelusuran karena, untuk mengenumerasi tetanggasebuah simpul, dapat dilakukan dalam O(k), dengan k merupakan banyaknyatetangga sebuah simpul. Adapun adjacency matrix, menyimpan graf dalambentuk matriks ketetanggaan, sehingga proses mengenumerasi tetangga sebuahsimpul dilakukan dalam O(V), dengan V adalah banyaknya simpul (Halim danHalim 2013).

Page 15: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

6

Berikut langkah-langkah dalam menghubungkan ketiga jejaring GA, GB,dan GC.

• GA - GB

Pada dasarnya, GA dan GB sudah terhubung, karena GB merupakanperluasan dari GA. Perluasan tersebut melalui kemiripan antar senyawapada GA dengan senyawa pada GB.

• GA - GC

GA dan GC terhubung melalui 2 jalur, yaitu melalui kemiripansenyawa atau kesamaan protein. Jalur kemiripan antar senyawa dibentukdengan cara menghitung terlebih dahulu kemiripan setiap senyawa aktifpada GC dengan senyawa aktif pada GA menggunakan algoritmeFingerprint dan koefisien Tanimoto. Untuk setiap senyawa aktif pada GC,catat semua senyawa aktif GA yang memiliki skor kemiripan tertinggi, lalubuat edge baru antar senyawa tersebut.

Jalur kesamaan protein dibentuk dengan cara melihat protein-proteinpada GC dan GA yang sama persis. Untuk setiap protein yang sama persis,akan dibuat edge baru antar keduanya.

• GB - GC

GB dan GC terhubung dengan kesamaan protein. Setiap protein di GB

yang sama persis dengan protein di GC, akan dibuat edge baru antarkeduanya.

b. Penelusuran graf dari protein Diabetes Melitus ke tanamanPenelusuran graf dari protein Diabetes Melitus ke tanaman bertujuan

untuk mengetahui protein Diabetes Melitus apa saja yang dapat ditarget olehsebuah tanaman. Agar proses ini efisien, maka dilakukan dahulu penelusuranprotein Diabetes Melitus hingga senyawa aktif pada GA. Setelah semua proteinDiabetes Melitus tercatat pada senyawa aktif GA, untuk setiap senyawa aktif,dilakukan penelusuran kembali ke tanaman yang mengandung senyawa aktiftersebut. Setiap komponen (tanaman, senyawa aktif, atau protein) yang tidakdapat ditelusur dari protein Diabetes Melitus, akan dihilangkan dari jejaring,agar terbentuk jejaring yang lebih sederhana sehingga proses pencarian lebihefisien.

Diasumsikan bahwa, banyaknya tanaman, senyawa aktif, dan proteintarget adalah V, dan banyaknya edge antar komponen adalah E. Saatpenelusuran, setiap vertex hanya dikunjungi sekali, dan untuk setiap vertexhanya sekali mengenumerasi tetangganya. Maka, kompleksitas memori yangdigunakan adalah O(V+E), sedangkan kompleksitas waktu penelusuran adalahO(V+E).

Berikut langkah-langkah dalam melakukan penelusuran graf dari proteinDiabetes Melitus ke tanaman.• Penelusuran dari GC menuju GB.

1) Mula-mula, senyawa aktif pada GC dihilangkan.2) Dilakukan penelusuran dari protein Diabetes Melitus menuju senyawa

aktif SMx (x merupakan bilangan bulat), sekaligus mencatat proteintarget apa saja yang menelusuri senyawa aktif SMx.

Page 16: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

7

3) Dilakukan penelusuran kembali menuju senyawa aktif Sx (x merupakanbilangan bulat), sekaligus catat protein target apa saja yang menelusurisenyawa aktif Sx dan bobot kemiripan antar senyawa, yaitu 0.9.

• Penelusuran dari GC menuju GA.1) Mula-mula, senyawa aktif pada GC dihilangkan.2) Dilakukan penelusuran dari protein Diabetes Melitus menuju senyawa

aktif Sx (x merupakan bilangan bulat), sekaligus mencatat protein targetapa saja yang menelusuri senyawa aktif Sx. Apabila terdapat proteintarget yang sudah tercatat menelusuri senyawa aktif Sx, maka bobotyang sudah dicatat sebelumnya di-update menjadi 1.

3) Dilakukan penelusuran sekali lagi dari protein Diabetes Melitus, namunsenyawa aktif pada GC tetap ada.

4) Untuk setiap senyawa aktif pada GA, catat protein Diabetes Melitusyang menelusurinya (apabila sebelumnya protein tersebut belumdicatat), dan update bobot edge apabila skor kemiripan senyawa GA danGC yang dilalui, lebih besar dari bobot edge sebelumnya.

5) Dilakukan penelusuran balik semua senyawa aktif pada GA menujutanaman. Untuk setiap tanaman, apabila bobot protein target lebih besardari bobot protein target sebelumnya (jika sudah tercatat), maka catatsemua protein target yang tersimpan pada senyawa aktif yangmenelusuri tanaman tersebut.

c. Kombinasi k tanaman sebagai kandidat formula jamuSebuah formula jamu terdiri atas beberapa kombinasi tanaman. Mulai

dari kombinasi 1 tanaman, 2 tanaman, hingga 4 tanaman. Setiap formula jamu,saling bebas dengan formula jamu yang lain, sehingga proses pemilihan ktanaman sebagai kandidat formula jamu, dapat dilakukan secara paralel padapemilihan tanaman pertama. Jenis paralelisasi yang dilakukan adalahmendekomposisi fungsi untuk mengerjkaan t operasi yang sama, dengan tmerupakan banyaknya thread yang akan dilakukan. Setiap kandidat formulajamu, dihitung skor formula tersebut dengan persamaan (2). Semakin tinggiskor sebuah formula, maka akan semakin baik formula tersebut dalammengobati penyakit Diabetes Melitus.

Skor formula = ∑ PiWi (2)

Pi = bobot protein ke-iWi = bobot edge dari protein ke-i

Jika terdapat T tanaman, dan akan dipilih k tanaman unik, maka akan adaC(T, k) kemungkinan kandidat formula jamu dengan k buah tanaman penyusun.C(n, r) merupakan fungsi yang mengembalikan nilai banyaknya kombinasi nobjek diambil r objek. Hal ini menunjukkan bahwa kompleksitas memori danwaktu dalam mencari kombinasi k tanaman penyusun formula jamu adalahO(Tk).

Page 17: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

8

Optimasi penggunaan memori dapat dilakukan dengan membatasi jumlahkandidat formula jamu. Misalkan, hanya diinginkan F buah formula jamudengan skor tertinggi, maka dapat digunakan struktur data priority queue untukmenyimpan kandidat formula jamu tersebut.

Priority queue merupakan struktur data berbentuk (binary) heap.(Binary) Heap sendiri, adalah complete binary tree. Struktur data ini memilikikarakteristik, untuk setiap subtree dengan root X, maka left child dan rightchild subtree tersebut lebih kecil (atau sama dengan) X. Kompleksitas insertdan pop data pada priority queue adalah O(log n), dengan n merupakanbanyaknya data yang sudah disimpan kedalam priority queue, sedangkanproses top memiliki kompleksitas O(1) (Halim dan Halim 2013).

Top merupakan proses mengambil data dengan nilai maksimal padapriority queue, sedangkan pop adalah proses mengeluarkan data dengan nilaimaksimal dari priority queue. Karakteristik ini dapat dimanfaatkan untukmenyimpan skor kandidat formula jamu. Agar data yang tersimpan padapriority queue merupakan kandidat jamu dengan skor tertinggi, maka skor akandisimpan dalam bentuk -skor. Sebab, jika priority queue sudah menampung Fkandidat formula jamu, maka proses pop akan mengeluarkan formula jamudengan skor terendah (negatif skor tertinggi).

Dengan teknik dan struktur data ini maka, kompleksitas memori yangdigunakan menjadi O(F), dengan F merupakan banyaknya kandidat denganskor tertinggi. Jika proses ini diparalelkan dengan t thread, maka dibutuhkan tpriority queue yang masing-masing menampung F kandidat jamu, kemudianke-t priority queue tersebut akan digabungkan pada sebuah prority queue.Kompleksitas memori menjadi O(tF).

Di sisi lain, kompleksitas waktu masih tetap O(Tk), karena tetap harusmenghasilkan semua kombinasi k tanaman sebagai kandidat formula jamu.Pengoptimalan dapat dilakukan dengan mereduksi T. Dikarenakan formulajamu yang akan dicari memiliki skor tertinggi, maka tanaman yang tidakmemiliki bobot edge maksimal untuk sebuah protein Diabetes Melitus, dapatdieliminasi. Kemudian, dicari tanaman yang tidak menjadi subset (lebih kecil)protein Diabetes Melitus dari tanaman lain, karena jika dipilih sebuah tanamanX yang protein Diabetes Melitus-nya merupakan subset dari tanaman lain Yyang protein Diabetes Melitus-nya lebih banyak, maka lebih optimal jikadipilih tanaman Y tersebut.

Lingkungan Pengembangan

Spesifikasi perangkat keras dan perangkat lunak yang digunakan untukpenelitian ini adalah sebagai berikut:

Perangkat keras yang digunakan berupa komputer personal denganspesifikasi:• Laptop HP elitebook 2740p• Processor Core-i5 540M 2.53 GHz• RAM 4 GB • SSD 128 GB Samsung

Page 18: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

9

Perangkat lunak yang digunakan yaitu: • Sistem operasi Linux Ubuntu 14.04• Sublime Text 2 sebagai text editor• Python 2.7.6• C++11

HASIL DAN PEMBAHASAN

Pengumpulan Data

Pada GA, terdapat beberapa tanaman yang ketika dicari pada databaseKnapSack, muncul tanaman serupa (genus dan spesies sama) namun memilikitambahan inisial penemu tanaman tersebut. Misal, ketika dicari Zingiberofficinale, maka akan keluar tanaman itu sendiri dan Zingiber officinale ROSC.Pada kasus seperti ini, maka semua tanaman yang memiliki genus dan spesiesyang sama dengan kata masukkan, akan dianggap sebagai tanaman baru danmasuk dalam hasil pencarian. Setiap senyawa yang didapat pada prosessebelumnya, memiliki sebuah C_ID dan CAS ID. CAS ID akan digunakan untukmencari sebuah CID yang bersesuaian dengan senyawa tersebut. Hal ini bergunauntuk melakukan konversi ke database pubchem.

Dari hasil pengumpulan data, dapat dilihat bahwa, maksimal hanya terdapat14 protein Diabetes Melitus yang dapat ditarget oleh setidaknya sebuah senyawaaktif. Hal ini berarti, kandidat terbaik formula jamu yang bisa didapatkan,merupakan formula jamu yang komposisi tanamannya dapat menarget ke-14protein Diabetes Melitus tersebut. Ringkasan hasil pengumpulan data dariberbagai database, dapat dilihat pada Tabel 1.

Pra Proses Data

Pra proses data dilakukan pada protein target Diabetes Melitus hasilpenelitian Usman (2015). Terdapat 21 protein yang masing-masing memiliki 2nilai centrality yaitu betweeness centrality, dan closeness centrality. Ketiga nilaitersebut dirata-ratakan kemudian dinormalisasi kedalam nilai [0,1]. Nilai inilahyang akan menjadi bobot sebuah protein. Tabel 2 menunjukkan hasil normalisasiuntuk setiap protein target Diabetes Melitus.

Gene merupakan atribut yang menunjukkan nama dari protein DiabetesMelitus. BC dan CC, masing-masing merupakan nilai betweeness centrality, dancloseness centrality, sedangkan AVG merupakan nilai rata-rata dari BC dan CC.Hasil normalisasi ditunjukkan pada kolom NORM.

Page 19: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

10

Tabel 1 Hasil pengumpulan data dari berbagai databaseJejaring Data Sumber Data Hasil

a

Tanaman KNApSAcK - terdapat 246 tanaman baru- total tanaman menjadi 711

Senyawa aktif KNApSAcK - terdapat 4926 senyawa dan7725 hubungan tanaman-senyawa.

- terdapat 581 tanaman yangmemiliki setidaknya satusenyawa

Senyawa aktif PubChem - dari 4926 senyawa, hanya ada2780 yang memiliki cid dantergolong senyawa aktif

- terdapat 541 tanaman yangmemiliki setidaknya satusenyawa aktif

Protein target PubChemBioAssay

- terdapat 2308 protein target,dan 131.798 hubungansenyawa-protein target

- terdapat 1063 senyawa yangmemiliki setidaknya satuprotein target

b

Senyawa aktif ChemmineTools - terdapat 9647 senyawa aktifhasil perluasan dari GA

Protein target PubChemBioAssay

- terdapat 2465 protein yangditarget oleh 9647 senyawaaktif hasil sebelumnya

c

Protein target Penelitian Usman2015

- terdapat 21 protein signifikanyang berasosiasi denganpenyakit Diabetes Melitus

- skor BC dan CC untuk setiapprotein

Protein target UniProt - konversi id MGI ke GI untuksetiap protein target

Senyawa aktif Pubchem BioAssay - terdapat 803 senyawa aktifyang menarget 14 proteinDiabetes Melitus

Page 20: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

11

Tabel 2 Hasil normalisasi bobot proteinGene BC CC AVG NORM

INS 0.3211 0.6250 0.4731 1.000

AKT1 0.2435 0.5128 0.3782 0.799

TCF7L2 0.2003 0.5714 0.3859 0.816

KCNJ11 0.1342 0.5000 0.3171 0.670

UBC 0.1097 0.4878 0.2987 0.632

PPARG 0.0952 0.5128 0.3040 0.643

GCGR 0.0780 0.4762 0.2771 0.586

INSR 0.0775 0.5000 0.2888 0.610

IAPP 0.0526 0.4348 0.2437 0.515

SOCS3 0.0518 0.4348 0.2433 0.514

EP300 0.0443 0.4167 0.2305 0.487

PPARA 0.0311 0.4082 0.2197 0.464

WFS1 0.0186 0.4444 0.2315 0.489

APOE 0.0163 0.3846 0.2004 0.424

FOXO1 0.0096 0.3704 0.1900 0.402

STAT3 0.0066 0.3509 0.1787 0.378

PTH 0.0044 0.3509 0.1776 0.375

CTLA4 0.0000 0.3448 0.1724 0.364

MTNR1B 0.0000 0.3922 0.1961 0.414

PRKACA 0.0000 0.3390 0.1695 0.358

SOD3 0.0000 0.3448 0.1724 0.364

Tabel 2 menunjukkan bahwa, jika sebuah kandidat formula jamu dapatmenarget semua protein Diabetes Melitus, maka skor formula tersebut adalah11.307. Dari hasil pengumpulan data, hanya ada 14 protein Diabetes Melitus yangbisa ditarget. Mengacu pada Tabel 2, maka kandidat terbaik formula jamu yangdapat dihasilkan dengan menarget 14 protein tersebut, memiliki skor maksimal6.616.

Penelusuran Graf dari Protein Diabetes Melitus ke Tanaman

Dari hasil penelususran graf, ada senyawa aktif dan tanaman yang tidakdapat menarget protein Diabetes Melitus. Komponen tersebut dieliminasi dari GA ,sehingga tersisa 1467 senyawa aktif dan 460 tanaman pada GA. Setiap senyawa

Page 21: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

12

aktif dan tanaman pada GA telah menyimpan informasi berupa protein DiabetesMelitus apa saja yang dapat ditelusuri, beserta bobot edge ketika menelusuriprotein tersebut.

Salah satu contoh hasil penelusuran dan informasi yang disimpan:'73399': ({'60391226': ['Akt1', 0.7993787198, 0.9]}, set(['60391226'])).Keterangan :a) 73399 merupakan cid sebuah senyawa aktifb) 60391226 merupakan gi dari protein Diabetes Melitus yang dapat ditelusur

dari senyawa aktif inic) Akt1 merupakan gene simbol dari protein Diabetes Melitusd) 0.7993787198 merupakan bobot protein-proteine) 0.9 merupakan bobot edge yang dilalui ketika menelusuri protein Diabetes

Melitusf) set([‘60391226’]) merupakan struktur data himpunan untuk mencegah terjadi

double counting.Jika simpul merupakan sebuah tanaman, maka informasi yang berubah

hanya cid senyawa aktif menjadi nama latin tanaman yang dimaksud. Contohnya,"Schisandra chinensis Baill.": ({'60391226': ['Akt1', 0.7993787198, 0.9]},set(['60391226'])). Perbedaan dengan hasil sebelumnya, yaitu, “Schisandrachinensis Baill.” merupakan nama latin dari sebuah tanaman.

Kombinasi k Tanaman

Dari hasil penelusuran sebelumnya, tersisa 460 tanaman yang setidaknyamemiki 1 protein signifikan Diabetes Melitus. Dari 460 tanaman tersebut, akandikombinasikan 1,2, hingga 4 tanaman untuk menjadi sebuah kandidat formulajamu. Semakin tinggi skor sebuah formula, mengindikasikan semakin banyakprotien target Diabetes Melitus yang dapat ditelusur dan juga bobot edge yangmenelusuri protein tersebut, semakin besar. Untuk setiap k kombinasi tanaman,akan diambil 10 kandidat formula jamu dengan skor tertinggi.

Jika k=1, tanaman Mangifera indica memperoleh skor tertinggi dengan total9 dari 21 (42.8%) protein Diabetes Melitus dapat ditelusur, atau jika dilihat dariskor formula, 4.39 dari maksimal skor 11.3 (38.8%). Gondi et al. (2014)mengungkapkan bahwa pada kulit mangga kaya akan zat polifenol, karotenoid,dan serat makanan. Ekstrak kulit mangga mengandung berbagai senyawa aktifyang mudah larut dan memiliki sifat antioksidan. Pengujian bubuk kulit manggapada tikus diabetes menunjukkan peningkatan enzim antioksidan danpengurangan peroksidasi lipid dalam plasma, ginjal, dan hati. Hal inimenunjukkan senyawa aktif pada kulit mangga dapat mengobati penyakitDiabetes Melitus pada tikus. Tanaman Phaseolus vulgaris memiliki skor keduatertinggi setelah Mangifera indica. Kandungan serat dan efek penghambatan alfa-amilase, membuat Phaseolus vulgaris atau lebih dikenal dengan buncis, dapatmenjadi komponen makanan dalam mencegah ataupun mengobati DiabetesMelitus tipe 2 (Helmstädter 2010). Ringkasan 10 kandidat formula jamukombinasi 1 tanaman dengan skor tertinggi dapat dilihat pada Tabel 3. Dapat

Page 22: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

13

dilihat pada Tabel 3, tanaman Punica granatum hanya dapat menarget 7 proteinDiabetes Melitus, namun skor formulanya lebih tinggi dibanding Argemonemexicana, Salvia miltiorrhiza, dan Daucus carota. Hal ini menunjukkan, bobotedge ataupun bobot protein yang ditarget oleh Punica granatum lebih besar dariketiga tanaman tersebut. Perbandingan protein target dan bobot edge antaraPunica granatum dan Argemone mexicana dapat dilihat pada Tabel 4.

Tabel 3 Kandidat 10 formula jamu kombinasi 1 tanaman dengan skortertinggi

Nama latinSkor

formula

Persentaseskor formula

(%)

Jumlahprotein

DiabetesMelitus yang

ditarget

Persentase proteinDiabetes Melitusyang ditarget (%)

Mangifera indica 4.39472 38.869 9 42.857

Phaseolus vulgaris 3.96826 35.097 9 42.857

Catharanthus roseus 3.84531 34.010 9 42.857

Syzygium cumini 3.60054 31.845 8 38.095

Punica granatum 3.59379 31.785 7 33.333

Argemone mexicana 3.54536 31.357 8 38.095

Salvia miltiorrhiza 3.52600 31.186 8 38.095

Daucus carota 3.51318 31.072 8 38.095

Glycyrrhiza uralensis 3.41163 30.174 7 33.333

Zea mays L. 3.31603 29.329 7 33.333

Tabel 4 Perbandingan protein target Punica granatum dengan Argemonemexicana

ProteinDiabetesMelitus

Bobot ProteinBobot edge

Argemone mexicana Punica granatum

Prkaca 0.358291 1.000 0.900

Gcgr 0.585706 0.538 0.000

Mtnr1b 0.414494 0.542 1.000

Ppara 0.464325 0.900 1.000

Pparg 0.642658 0.900 1.000

Stat3 0.377816 0.637 0.900

Akt1 0.799379 1.000 1.000

Insr 0.610440 1.000 1.000

Page 23: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

14

Jika diperhatikan perbandingan bobot edge, Punica granatum relatif selalulebih besar dibanding Argemone mexicana. Hal ini membuat skor formula Punicagranatum lebih tinggi dibanding Argemone mexicana, walaupun untuk proteinGcgr tidak dapat ditarget oleh Punica granatum.

Jika k=2, kombinasi tanaman Mangifera indica dan Citrus aurantiummemperoleh skor tertinggi, yaitu 5.26 (46.5%), dan terdapat 11 protein DiabetesMelitus (52.3%) yang dapat ditelusur. Ringkasan 10 kandidat formula jamukombinasi 2 tanaman dengan skor tertinggi dapat dilihat pada Tabel 5.

Tabel 5 Kandidat 10 formula jamu kombinasi 2 tanaman dengan skor tertinggi

Nama latinSkor

formula

Persentaseskor formula

(%)

Jumlahprotein

DiabetesMelitus

yangditarget

Persentaseprotein

DiabetesMelitus yangditarget (%)

Citrus aurantium, Mangifera indica

5.26512 46.567 11 52.381

Angelica sinensis, Mangifera indica

4.97017 43.959 10 47.619

Ginkgo biloba, Mangifera indica

4.94171 43.707 10 47.619

Anacardium occidentale,Mangifera indica

4.93665 43.662 10 47.619

Mangifera indica, Phaseolus vulgaris

4.92913 43.596 11 52.381

Artemisia annua, Mangifera indica

4.89207 43.268 10 47.619

Citrus sinensis, Mangifera indica

4.89207 43.268 10 47.619

Lonicera japonica, Mangifera indica

4.89207 43.268 10 47.619

Mangifera indica, Schizonepeta tenuifolia

4.89207 43.268 10 47.619

Argemone mexicana, Catharanthus roseus

4.88972 43.247 11 52.381

Mengacu pada hasil kombinasi 1 tanaman, Mangifera indica mendapat skortertingi dan dapat menarget 9 protein Diabetes Melitus. Dari Tabel 5, terlihattanaman Mangifera indica hampir selalu muncul pada setiap kandidat formulajamu. Namun, jumlah protein Diabetes Melitus yang dapat ditarget, hanya

Page 24: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

15

berkisar antara 10 atau 11 protein saja. Hal ini menunjukkan bahwa, tanamankedua yang berpasangan dengan Mangifera indica, hanya menambah sekitar 2protein baru yang tidak dapat ditarget sebelumnya, namun, bisa juga bobot edgedari tanaman yang kedua lebih tinggi dari bobot edge Mangifera indica. Misalkankandidat dengan skor tertinggi, yaitu Mangifera indica dan Citrus aurantium.Perbandingan bobot protein keduanya dapat dilihat pada Tabel 6.

Tabel 6 Perbandingan bobot edge Mangifera indica dan Citrus aurantium

ProteinDiabetesMelitus

Bobot ProteinBobot edge

Mangifera indica Citrus aurantium

Prkaca 0.358291 0.900 0.900

Gcgr 0.585706 0.900 0.000

Kcnj11 0.670335 0.475 0.000

Ppara 0.464325 1.000 1.000

Pparg 0.642658 0.900 1.000

Stat3 0.377816 0.900 0.000

Akt1 0.799379 1.000 1.000

Insr 0.610440 1.000 0.000

Ins2 1.000000 0.434 0.000

Mtnr1b 0.414494 0.000 0.900

Ep300 0.487221 0.000 0.889

Dari Tabel 6, kontribusi Citrus aurantium terdapat pada protein Kcnj11,yang mana, nilai bobot edge Citrus aurantium lebih besar dari Mangifera indica.Selain itu, ada 2 protein Diabetes Melitus tambahan yang tidak dapat ditargetMangifera indica, yaitu protein Mtnr1b dan Ep300.

Jika k=3, kombinasi tanaman Angelica sinensis, Citrus aurantium, danMangifera indica memiliki skor tertinggi, yaitu 5.7763 (51.1%), dan ada 12protein Diabetes Melitus (57.1%) yang dapat ditelusur. Ringkasan 10 kandidatformula jamu terbaik dapat dilihat pada Tabel 7.

Dari Tabel 7, terlihat ada beberapa formula jamu yang memiliki skor yangsama. Artinya, kombinasi tanaman tersebut menarget protein Diabetes Melitusyang sama dan memilki bobot edge yang sama juga. Secara umum, untukkombinasi 3 tanaman, skor formula jamu berkisar di 50% dari skor maksimal, dansemuanya menarget 12 protein Diabetes Melitus.

Jika k=4, kandidat formula jamu dengan skor tertinggi, yaitu Angelicasinensis, Citrus aurantium, Glycyrrhiza uralensis, dan Mangifera indica, denganskor 6.13 (54.2%), dan ada 13 protein Diabetes Melitus ( 61.9%) yang dapatditelusur. Sepuluh kandidat terbaik dapat dilihat pada Tabel 8.

Page 25: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

16

Tabel 7 Kandidat 10 formula jamu kombinasi 3 tanaman dengan skortertinggi

Nama latinSkor

formulaPersentase skor

formula (%)

Jumlahprotein

DiabetesMelitus

yangditarget

Persentaseprotein

DiabetesMelitus yangditarget (%)

Angelica sinensis, Citrus aurantium, Mangifera indica

5.7763 51.088 12 57.143

Citrus aurantium, Daucus carota, Mangifera indica

5.67875 50.226 12 57.143

Citrus aurantium, Mangifera indica, Phoenix dactylifera

5.66678 50.120 12 57.143

Citrus aurantium, Mangifera indica, Polygonum cuspidatum

5.66678 50.120 12 57.143

Citrus aurantium, Mangifera indica, Polygonum multiflorum

5.66678 50.120 12 57.143

Citrus aurantium, Mangifera indica, Vitis vinifera

5.66678 50.120 12 57.143

Acorus calamus, Citrus aurantium, Mangifera indica

5.65461 50.012 12 57.143

Canarium commune, Citrus aurantium, Mangifera indica

5.65461 50.012 12 57.143

Citrus aurantium, Mangifera indica, Myristica fragrans

5.65461 50.012 12 57.143

Citrus aurantium, Mangifera indica, Piper cubeba

5.62661 49.765 12 57.143

Page 26: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

17

Tabel 8 Kandidat 10 formula jamu kombinasi 4 tanaman dengan skor tertinggi

Nama latinSkor

formula

Persentase skor

formula(%)

Jumlahprotein

DiabetesMelitus

yangditarget

Persentaseprotein

DiabetesMelitus yangditarget (%)

Angelica sinensis, Citrus aurantium, Glycyrrhiza uralensis, Mangifera indica

6.13136 54.229 13 61.905

Citrus aurantium, Daucus carota, Glycyrrhiza uralensis, Mangifera indica

6.03381 53.366 13 61.905

Citrus aurantium, Glycyrrhiza uralensis, Mangifera indica, Phoenix dactylifera

6.02184 53.260 13 61.905

Citrus aurantium, Glycyrrhiza uralensis, Mangifera indica, Polygonum cuspidatum

6.02184 53.260 13 61.905

Citrus aurantium, Glycyrrhiza uralensis, Mangifera indica, Polygonum multiflorum

6.02184 53.260 13 61.905

Citrus aurantium, Glycyrrhiza uralensis, Mangifera indica, Vitis vinifera

6.02184 53.260 13 61.905

Acorus calamus, Citrus aurantium, Glycyrrhiza uralensis, Mangifera indica

6.00967 53.152 13 61.905

Canarium commune, Citrus aurantium, Glycyrrhiza uralensis, Mangifera indica

6.00967 53.152 13 61.905

Citrus aurantium, Glycyrrhiza uralensis, Mangifera indica, Myristica fragrans

6.00967 53.152 13 61.905

Citrus aurantium, Glycyrrhiza uralensis, Mangifera indica, Piper cubeba

5.98167 52.905 13 61.905

Mengacu pada hasil kombinasi 3 tanaman, skor tertinggi merupakankombinasi tanaman Angelica sinensis, Citrus aurantium, dan Mangifera indica,dengan jumlah protein Diabetes Melitus yang dapat ditaget adalah 12. Padakombinasi k=4, kombinasi tersebut muncul lagi sebagai kandidat jamu dengan

Page 27: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

18

skor tertinggi, namun ditambah tanaman Glycyrrhiza uralensis. Hal inimenunjukkan bahwa ada satu protein baru yang dapat ditarget Glycyrrhizauralensis tapi, tidak dapat ditarget oleh 3 tanaman lainnya. Glycyrrhiza uralensissendiri konsisten muncul disemua 10 kandidat jamu, artinya dari keempatkombinasi tanaman, hanya Glycyrrhiza uralensis yang menarget sebuah proteinDiabetes Melitus yang tidak ditarget oleh 3 tanaman lainnnya. Jika ditelusuri balikdari protein Diabetes Melitus ke informasi yang disimpan tiap tanaman, terlihatbahwa protein Tcf7l2, hanya ditarget oleh satu tanaman, yaitu Glycyrrhizauralensis.

Fakta menarik ketika k=4, yaitu hanya ada 13 protein Diabetes Melitus yangdapat ditarget oleh senyawa aktif yang terkandung pada setiap formula. Padahal,dari hasil pengumpulan data, maksimal ada 14 protein Diabetes Melitus yangdapat ditarget oleh senyawa aktif. Hal ini mengindikasikan, bahwa kombinasi 4tanaman saja, masih kurang cukup untuk menarget 14 protein tersebut.Dibutuhkan lebih dari 4 tanaman agar dapat menarget maksimal 14 proteinsignifikan Diabetes Melitus tersebut.

Melakukan kombinasi 5 tanaman tanpa melakukan reduksi pada jumlahtanaman, akan memakan banyak waktu. Ketika kombinasi 1 tanaman, hanyadibutuhkan 0.005 detik agar program selesai. Kombinasi 2 tanaman memakanwaktu 0.34 detik. Kombinasi 3 dan 4 masing-masing membutuhkan 253 detik dan33.214 detik. Secara komprehensif, perbandingan kenaikan waktu eksekusiprogram dapat dilihat pada Tabel 9.

Tabel 9 Waktu eksekusi program untuk k kombinasi tanaman

Kombinasi k Waktu ke-k (detik) Waktu ke-[k+1]/[k]

1 0.005 68.00

2 0.340 744.11

3 253.000 131.28

4 33214.000 -

Dapat dilihat dari Tabel 9, peningkatan waktu seiring dengan naikknya k,adalah ratusan kali lipat. Hal ini sesuai dengan kompleksitas waktu program yaituO(Tk). Jika dilanjutkan dengan k=5, diperkirakan waktu eksekusi program adalah3 juta detik atau 1 bulan.

Hasil reduksi tanaman yang setidaknya menarget 1 protein Diabetes Melitusdengan bobot maksimal, menyisakan 348 tanaman (dari 460 tanaman). Angka inimasih cukup besar, sehingga jika dieliminasi lagi tanaman yang protein DiabetesMelitus-nya menjadi subset tanaman lain, maka tersisa 15 tanaman saja.

Kombinasi tanaman dengan k>4 dapat diterapkan pada 15 tanaman tersisadengan waktu yang efisien. Kandidat jamu yang dihasilkan merupakan kandidatjamu dengan bobot edge protein Diabetes Melitus yang maksimal. Tabel 10memperlihatkan perbandingan waktu eksekusi program, skor maksimal, danjumlah protein yang ditarget dengan variasi nilai k untuk jumlah 460 tanaman(tanpa reduksi) dan 15 tanaman (dengan reduksi).

Page 28: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

19

Pada Tabel 10, kolom Tanpa Reduksi Tanaman, untuk nilai k = 5 sampai k =11, tidak memiliki nilai, karena waktu eksekusi program yang cukup memakanwaktu. Jika diperhatikan skor maskimal tanpa mereduksi tanaman dan mereduksitanaman, selisihnya makin mengecil seiring bertambahnya nilai k. Hal inimengindikasikan, teknik mereduksi tanaman semakin baik pada nilai k yangmakin besar. Percobaan variasi nilai k hanya dibatasi sampai k=11, dikarenakankecenderungan skor maksimal yang mengalami saturasi pada k= [9,11], sesuaiGambar 5.

Dari Gambar 5, diketahui ketika nilai k mulai dari 9, ada kandidat formulajamu yang memiliki skor maksimal 6.616 dan menarget 14 protein Diabetes

Tabel 10 Perbandingan waktu eksekusi, skor maksimal, dan protein target

kReduksi Tanaman Tanpa Reduksi Tanaman

Waktu (detik) Skor Maksimal Protein Target Waktu (detik) Skor Maksimal Protein Target1 0.008 2.931 5 0.005 4.395 92 0.011 3.918 7 0.341 5.265 113 0.020 4.453 8 253.202 5.776 124 0.037 4.931 9 33214.315 6.131 135 0.081 5.346 10 - - -6 0.180 5.747 11 - - -7 0.243 6.125 12 - - -8 0.285 6.480 13 - - -9 0.246 6.616 14 - - -

10 0.177 6.616 14 - - -11 0.099 6.616 14 - - -

1 2 3 4 5 6 7 8 9 10 110.000

1.000

2.000

3.000

4.000

5.000

6.000

7.000

k

Sko

r M

aksi

mal

Gambar 5 Grafik skor maksimal dengan mereduksi tanaman

Page 29: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

20

Melitus. Percobaan untuk nilai k=9 menghasilkan 16 kandidat formula jamu.Berikut ke-16 kandidat formula jamu tersebut dengan skor formula maksimal6.616 dapat dilihat pada Tabel 11 dan Tabel 12.

Tabel 11 Kandidat jamu 1 hingga jamu 8 dengan skor maksimal

Nama TanamanJamu

1Jamu

2Jamu

3Jamu

4Jamu

5Jamu

6Jamu

7Jamu

8

Catharanthus roseus 1 1 1 1 1 1 1 1

Plumbago zeylanica 0 0 0 0 0 0 0 0

Salvia miltiorrhiza 1 1 1 1 1 1 1 1

Glycyrrhiza uralensis 1 1 1 1 1 1 1 1

Mangifera indica 1 1 0 0 1 1 0 0

Areca catechu 1 1 1 1 1 1 1 1

Fritillaria cirrhosa 1 1 1 1 1 1 1 1

Anacardium occidentale

0 0 0 0 1 1 1 1

Polygonum multiflorum

1 0 1 0 1 0 1 0

Cordyceps sinensis 0 0 0 0 0 0 0 0

Cassia tora 0 0 1 1 0 0 1 1

Ginkgo biloba 1 1 1 1 0 0 0 0

Polygonum cuspidatum

0 1 0 1 0 1 0 1

Phyllanthus urinaria 0 0 0 0 0 0 0 0

Punica granatum 1 1 1 1 1 1 1 1

Cara kerja sebuah formula jamu dari sudut pandang graph mining dapatdijelaskan dengan melihat senyawa aktif yang terkandung pada tanaman yangmenyusun jamu, kemudian untuk setiap senyawa aktif, dilihat informasi proteinDiabetes Melitus yang dapat ditarget.

Contohnya formula jamu dengan 1 kombinasi tanaman, Phaseolus vulgarisatau yang lebih dikenal dengan buncis. Tanaman tersebut memiliki informasibeberapa senyawa aktif dengan cid. Setiap senyawa aktif, memiliki informasiprotein Diabetes Melitus yang ditarget. Secara ringkas dapat dilihat pada Tabel 13.

Dari Tabel 13, terlihat ada 9 protein unik yang dapat ditarget olehPhaseolus vulgaris dengan berbagai bobot edge. Jika digabungkan semua proteintersebut dengan memilih bobot edge yang maksimum, maka secara ringkas dapatdilihat pada Tabel 14.

Page 30: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

21

Tabel 12 Kandidat jamu 9 hingga jamu 16 dengan skor maksimal

Nama TanamanJamu

9Jamu

10Jamu

11Jamu

12Jamu

13Jamu

14Jamu

15Jamu

16

Catharanthus roseus 1 1 1 1 1 1 1 1

Plumbago zeylanica 1 1 1 1 1 1 1 1

Salvia miltiorrhiza 0 0 0 0 0 0 0 0

Glycyrrhiza uralensis 1 1 1 1 1 1 1 1

Mangifera indica 0 0 0 0 1 1 0 0

Areca catechu 1 1 1 1 1 1 1 1

Fritillaria cirrhosa 1 1 1 1 1 1 1 1

Anacardium occidentale

0 0 0 0 1 1 1 1

Polygonum multiflorum

1 0 1 0 1 0 1 0

Cordyceps sinensis 0 0 0 0 0 0 0 0

Cassia tora 0 0 1 1 0 0 1 1

Ginkgo biloba 1 1 1 1 0 0 0 0

Polygonum cuspidatum

0 1 0 1 0 1 0 1

Phyllanthus urinaria 0 0 0 0 0 0 0 0

Punica granatum 1 1 1 1 1 1 1 1

Tabel 13 Daftar protein Diabetes Melitus yang ditarget oleh Phaseolus vulgaris

CIDProtein Diabetes Melitus yang ditarget [gene, bobot protein, bobot edge]

5281789 ['Prkaca', '0.3583', '0.9000'], ['Akt1', '0.7994', '0.9000']

181994 ['Mtnr1b', '0.4145', '0.6027']

5280520 ['Ppara', '0.4643', '0.9000'], ['Akt1', '0.7994', '0.9000']

5280961['Ppara', '0.4643', '1.0000'], ['Pparg', '0.6427', '1.0000']['Akt1', '0.7994', '1.0000']

6440982 ['Stat3', '0.3778', '0.6016'], ['Akt1', '0.7994', '0.9000']

162412 ['Ep300', '0.4872', '0.4522'], ['Akt1', '0.7994', '0.9000']

32021 ['Kcnj11', '0.6703', '0.4756'], ['Insr', '0.6104', '0.3769']

Page 31: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

22

Tabel 14 Protein Diabetes Melitus yang ditarget Phaseolus vulgaris

Gene Bobot protein Bobot edge

Prkaca 0.358291 0.900000

Kcnj11 0.670335 0.475610

Mtnr1b 0.414494 0.602740

Ppara 0.464325 1.000000

Pparg 0.642658 1.000000

Stat3 0.377816 0.900000

Akt1 0.799379 1.000000

Insr 0.610440 1.000000

SIMPULAN DAN SARAN

Simpulan

Teknik graph mining dapat menghasilkan 16 kandidat formula jamu dengankomposisi masing-masing formula terdiri dari 9 tanaman. Kandidat formula jamutersebut menarget 14 protein signifikan Diabetes Melitus atau sekitar 66.67% daritotal 21 protein signifikan, dan memiliki skor 6.616 atau sekitar 58.51% dari skormaksimal. Setiap formula jamu dapat dijelaskan cara kerjanya dalam mengobatiDiabetes Melitus dengan menelusuri senyawa aktif yang terkandung padatanaman, dan informasi protein Diabetes Melitus yang ditarget oleh senyawa aktiftersebut.

Saran

Teknik graph mining kombinasi 9 tanaman, dengan memanfaatkanalgoritme Fingerprint hanya dapat mengakomodasi maksimal 14 proteinsignifikan Diabetes Melitus (66.67%). Diperlukan teknik link prediction antarasenyawa aktif yang terkandung dalam tanaman dengan 7 protein signifikanDiabetes Melitus yang belum bisa diakomodasi pada penelitian ini.

DAFTAR PUSTAKA

Afendi FM, Darusman LK, Hirai A, Amin MA, Takahashi H, Nakamura K,Kanaya S. 2010. System biology approach for elucidating the relationshipbetween Indonesia herbal plants and the efficacy of jamu. Di dalam: Fan W,Hsu W, Webb GI, Liu B, Zhang C, Gunopulos D, Wu X, editor. 2010 IEEE

Page 32: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

23

International Conference on Data Mining Workshops; 2010 Des 14; Sydney,Australia. Sydney (AU): Conference Publishing Services.

Afendi FM, K. Darusman L, Hirai Morita A, Altaf-Ul-Amin M, Takahashi H,Nakamura K, Tanaka K, Kanaya S. 2013. Efficacy prediction of jamuformulations by PLS modeling. CAD. 9(1):46-59.doi:10.2174/1573409911309010005.

Fitriawan A. 2013. Sistem klasifikasi khasiat formula jamu dengan metodesupport vector machine [skripsi]. Bogor (ID): Institut Pertanian Bogor.

Gondi M, Basha SA, Bhaskar JJ, Salimath PV, Rao UJSP. 2014. anti-diabeticeffect of dietary mango ( mangifera indica L.) peel in streptozotocin-induced diabetic rats . J. Sci. Food Agric.. 95(5):991-999.doi:10.1002/jsfa.6778.

Halim S, Halim H. 2013. Competitive Programming 3. Singapura (SG): Lulu.Helmstädter A. 2010. beans and diabetes: phaseolus vulgaris preparations as

antihyperglycemic agents . Journal of Medicinal Food. 13(2):251-254.doi:10.1089/jmf.2009.0002.

Li J, Zhu X, Chen JY. Building disease-specific drug-protein connectivity mapsfrom molecular interaction networks and pubMed abstracts. PLoS ComputBiol. 2009; 5(7):e1000450.

Nurishmaya MR. 2014. Pendekatan bioinformatika formulasi jamu baruberkhasiat antidiabetes dengan ikan zebra (Danio rerio) sebagai hewanmodel [skripsi]. Bogor (ID): Institut Pertanian Bogor.

Pusat Bahasa. 2008. Kamus Besar Bahasa Indonesia Online [Internet]. [diunduh2015 Desember 30]. Tersedia pada:http://badanbahasa.kemdikbud.go.id/kbbi/

Syahrir NH. 2015. Uji permutasi efek sinergis bahan aktif tanaman obatberbasiskan jejaring dengan protein target [tesis]. Bogor (ID): InstitutPertanian Bogor.

Usman Syafiuddin. 2015. Identification of significant proteins associated withdiabetes melitus by using network analysis of protein-protein interactions[tesis]. Bogor (ID): Institut Pertanian Bogor.

Page 33: PREDIKSI FORMULA JAMU UNTUK … FORMULA JAMU UNTUK PENYEMBUHAN PENYAKIT DIABETES DENGAN TEKNIK GRAPH MINING MUHAMMAD FAHMI AMIR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

24

RIWAYAT HIDUP

Penulis dilahirkan pada tanggal 15 Mei 1994 di Limboto, KabupatenGorontalo, Provinsi Gorontalo. Penulis adalah anak ketiga dari tiga bersaudara,anak dari pasangan Djafar Amir dan Raudha Halidu (alm).

Penulis menempuh pendidikan Sekolah Menengah Atas di MAN InsanCendekia Gorontalo pada tahun 2009 hingga 2012. Kemudian penulismelanjutkan studi S1 di Institut Pertanian Bogor melalui jalur Undangan SeleksiMasuk IPB dan diterima di Departemen Ilmu Komputer, Fakultas Matematika danIlmu Pengetahuan Alam.

Selama mengikuti perkuliahan, penulis menjadi asisten praktikumAlgoritme dan Pemrograman pada tahun ajaran 2015/2016, asisten praktikumPengembangan Sistem Berorientasi Objek pada tahun ajaran 2015/2016. Penulisjuga pernah aktif sebagai staf Departemen Tahfidz Lembaga Pengajaran Quran Al-Hurriyyah. Bulan Juni – Agustus 2015, penulis melaksanakan Praktik KerjaLapang di Taman Buah Mekarsari.

Penulis juga aktif di komunitas Competitive Programming. Tahun 2014,penulis menjadi finalis Gemastik 7 bidang pemrograman kompetitif. Tahun 2015,menjadi finalis ACM-ICPC Regional Jakarta dan ACM-ICPC RegionalSingapura. Tahun 2016, penulis bersama team AgriCoder mendapat peringkat 4nasional pada lomba ACM-ICPC Multiprovincial Ideafuse 2016 yang diadakan diMedan.