Download - PENDETEKSIAN PARASIT MALARIA DALAM SEL DARAH …

PENDETEKSIAN PARASIT MALARIA DALAM SEL DARAH

MANUSIA MENGGUNAKAN METODE CONVOLUTIONAL

NEURAL NETWORK

Skripsi

Oleh:

RAIS AMIN

NIM: 1113091000070

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

JAKARTA

2020 M/1441 H

i UIN Syarif Hidayatullah Jakarta

PENDETEKSIAN PARASIT MALARIA DALAM SEL DARAH

MANUSIA MENGGUNAKAN METODE CONVOLUTIONAL

NEURAL NETWORK

Skripsi

Sebagai Salah Satu Syarat untuk Memperoleh Gelar

Sarjana Komputer

Oleh :

RAIS AMIN

NIM : 1113091000070

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

JAKARTA

2020 M / 1441 H

ii UIN Syarif Hidayatullah Jakarta

PERNYATAAN ORISINALITAS

iii UIN Syarif Hidayatullah Jakarta

LEMBAR PERSETUJUAN

PENDETEKSIAN PARASIT MALARIA DALAM SEL DARAH MANUSIA

MENGGUNAKAN METODE CONVOLUTIONAL NEURAL NETWORK

Skripsi

Sebagai Salah Satu Syarat untuk Memperoleh Gelar

Sarjana Komputer (S.Kom)

Oleh :

Rais Amin - 1113091000070

Menyetujui,

Pembimbing I

Dr. Imam Marzuki Shofi, M.T

NIP. 197202052008011010

Pembimbing II

Drs. M. Tabah Rosyadi, M.A.

NIP. 196207141989031004

Mengetahui,

Ketua Prodi Teknik Informatika

Dr. Imam Marzuki Shofi, M.T

NIP. 197202052008011010

iv UIN Syarif Hidayatullah Jakarta

PENGESAHAN UJIAN

v UIN Syarif Hidayatullah Jakarta

PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI

Sebagai civitas akademik UIN Syarif Hidayatullah Jakarta, saya yang bertanda tangan

dibawah ini:

Nama : Rais Amin

NIM : 111309100070

Program Studi : Teknik Informatika

Fakultas : Sains dan Teknologi

Jenis Karya : Skripsi

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada

Universitas Islam Negeri Syarif Hidatullah Jakarta Hak Bebas Royalti Noneksklusif

(Non-exclusive Royalty Free Right) atas karya ilmiah saya yang berjudul:

PENDETEKSIAN PARASIT MALARIA DALAM SEL DARAH MANUSIA

MENGGUNAKAN METODE CONVOLUTIONAL NEURAL NETWORK

Beserta perangkat yang ada (jika diperlukan). Dengan hak Bebas Royalti Noneksklusif

ini Universitas Islam Negeri Syarif Hidayatullah Jakarta berhak menyimpan,

mengalihmedia/formatkan, merawat, dan mempubikasikan tugas akhir saya selama

tetap mencantumkan nama saya sebagai penulis/pencipta dan sebagai pemilik Hak

Cipta. Demikian pernyataan ini saya buat dengan sebenarnya.

Dibuat di: Jakarta

Pada Tangal: 10 Agustus 2020

Yang menyatakan

(Rais Amin)

vi UIN Syarif Hidayatullah Jakarta

KATA PENGANTAR

Assalamu’alaikum Wr. Wb.

Puji syukur senantiasa penulis panjatkan atas kehadirat Allah SWT yang telah

melimpahkan karunia, nikmat dan anugerah-Nya sehingga penulis dapat

menyelesaikan penelitian sampai akhir proses penulisan skripsi ini. Tak lupa shalawat

serta salam senantiasa dihaturkan kepada junjungan kita baginda Nabi Muhammad

SAW beserta keluarga dan para sahabatnya. Penyusunan skripsi ini adalah salah satu

syarat untuk memperoleh gelar Sarjana Komputer (S.Kom) pada program studi Teknik

Informatika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Syarif

Hidayatullah Jakarta.

Dalam proses penulisan skripsi ini, tidak terlepas dari bimbingan, bantuan,

dukungan, saran, dan motivasi yang penulis terima dari berbagai pihak. Oleh karena

itu, penulis ingin mengucapkan terima kasih banyak kepada :

1. Ibu Prof. Dr. Lily Surraya Eka Putri, M.Env.Stud., selaku Dekan Fakultas Sains

dan Teknologi.

2. Bapak Dr. Imam Marzuki Shofi, M.T, selaku ketua Program Studi Teknik

Informatika, serta Bapak selaku sekretaris Program Studi Teknik Informatika.

3. Bapak Dr. Imam Marzuki Shofi M.T, selaku Dosen Pembimbing I dan Bapak

Drs. M. Tabah Rosyadi, M.A., selaku Dosen Pembimbing II yang telah

memberikan bimbingan, motivasi, dan arahan kepada penulis sehingga skripsi

ini bisa selesai dengan baik.

4. Seluruh Dosen, Staf Karyawan Fakultas Sains dan Teknologi, khususnya

Program Studi Teknik Informatika yang telah memberikan bantuan dan

kerjasama dari awal perkuliahan.

6. Orang tua penulis, yaitu Ibu Yurnensi yang telah mencurahkan kasih sayang,

do’a, dan dukungan penuh kepada penulis dalam mengerjakan skripsi.

vii UIN Syarif Hidayatullah Jakarta

7. Teman-teman TI C 2013. Terima kasih atas perhatian dan dukungan serta

masukan yang membangun demi terselesaikannya skripsi ini. Semoga kita bisa

lebih baik lagi dan sukses di masa yang akan datang.

8. Seluruh teman-teman TI UIN angkatan 2013 yang tidak bisa disebutkan satu

persatu yang senantiasa mendukung dan memberikan semangat kepada penulis

dalam menyelesaikan skripsi ini. Semoga kita bisa sukses di masa mendatang.

9. Seluruh pihak yang tidak dapat disebutkan satu-persatu yang secara langsung

maupun tidak langsung membantu penulis dalam menyelesaikan skripsi ini.

Akhir kata, penulis berharap semoga skripsi ini bermanfaat serta

menambah wawasan dan pengetahuan bagi pembaca. Penulis menyadari bahwa

skripsi ini masih jauh dari sempurna, untuk itu kritik dan saran yang bersifat

membangun sangat diharapkan dengan mengirimkan melalui email

Jakarta, 10 Agustus 2020

Rais Amin

viii UIN Syarif Hidayatullah Jakarta

Nama : Rais Amin

Program Studi : Teknik Informatika

Judul : Pendeteksian Parasit Malaria Dalam Sel Darah Manusia

Menggunakan Metode Convolutional Neural Network

ABSTRAK

Malaria adalah penyakit dalam darah yang disebabkan oleh parasit Plasmodium

yang ditularkan oleh gigitan nyamuk Anopheles betina. Ahli mikroskopis biasanya

memeriksa sel darah untuk mendiagnosis penyakit malaria ini. Namun, akurasi mereka

tergantung pada kualitas alat dan keahlian dalam mengklasifikasikan dan menghitung

sel parasit dan yang tidak terinfeksi. Pemeriksaan semacam itu akan sangat sulit dalam

proses diagnosis skala besar dan menghasilkan kualitas yang buruk. Beberapa dataset

malaria telah dikembangkan, diantaranya adalah dataset yang dikembangkan oleh

LHNVBC yang berisikan 27.558 data gambar sel. Proses pengolahan data science

adalah salah satu proses yang dapat menggambarkan protokol analitik prediktif yang

umum untuk diinterogasikan pada dataset biomedis dan kesehatan yang besar dan

kompleks. Dalam penelitian ini dataset malaria akan di proses melalui pengolahan data

science dengan menggunakan model Convolutional Neural Network yang

menggunakan arsitektur ResNet dengan pembelajaran Deep Learning dimana sistem

akan melalui pelatihan dan kemudian dapat mengenali parasit malaria dalam sel darah

manusia. Hasil akurasi menjadi tolak ukur seberapa akurat pembelajaran yang diterima

untuk mengenali data gambar sel yang menjadi input pada sistem sebanyak 96,23 %

dan 97% setelah diuji coba pada data testing.

Kata Kunci : Malaria, Data Science, Deep Learning, Convolutional Neural Network

Daftar Pustaka : 45 (Tahun 2015 – 2020)

Jumlah Halaman : VI BAB + xiv Halaman + 80 Halaman + 27 Gambar + 5

Tabel

ix UIN Syarif Hidayatullah Jakarta

DAFTAR ISI

PERNYATAAN ORISINALITAS ............................................................................. ii

LEMBAR PERSETUJUAN ...................................................................................... iii

PENGESAHAN UJIAN ............................................................................................. iv

PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI ..................................... v

KATA PENGANTAR ................................................................................................ vi

ABSTRAK ................................................................................................................ viii

DAFTAR ISI ............................................................................................................... ix

DAFTAR GAMBAR ................................................................................................ xiii

DAFTAR TABEL .................................................................................................... xiv

BAB I PENDAHULUAN ............................................................................................ 1

1.1 Latar Belakang ............................................................................................... 1

1.2 Rumusan Masalah .......................................................................................... 6

1.3 Batasan Masalah ............................................................................................. 6

1.4 Tujuan Penelitian ............................................................................................ 6

1.5 Manfaat Penelitian .......................................................................................... 6

1.6 Sistematika Penulisan ..................................................................................... 7

BAB II LANDASAN TEORI ..................................................................................... 9

2.1 Malaria ............................................................................................................ 9

2.2 Data Science ................................................................................................. 11

2.3 Klasifikasi Gambar ....................................................................................... 11

2.4 Artificial Intellegence (AI) ........................................................................... 12

x UIN Syarif Hidayatullah Jakarta

2.5 Machine Learning ........................................................................................ 14

2.6 Deep Learning .............................................................................................. 15

2.7 Jaringan Syaraf Tiruan / Artificial Neural Network (ANN) .......................... 16

2.8 Convolutional Neural Network (CNN) ........................................................ 17

2.8.1 Arsitektur Jaringan CNN....................................................................... 19

2.8.2 Fungsi Aktivasi ..................................................................................... 22

2.8.3 Learning Rate ........................................................................................ 23

2.8.4 Data Augmentation/ Data Augmentasi ................................................. 24

2.9 Precision dan Recall ..................................................................................... 26

2.10 Epoch ........................................................................................................ 26

2.11 ResNet ....................................................................................................... 26

2.12 Python ....................................................................................................... 31

2.13 Keras ......................................................................................................... 32

2.14 Tensorflow ................................................................................................ 32

2.15 Open CV ................................................................................................... 33

2.16 OSEMN Framework ................................................................................. 33

2.17 Studi Literatur Sejenis .............................................................................. 35

BAB III METODOLOGI PENELITIAN ............................................................... 39

3.1 Metode Pengumpulan Data .......................................................................... 39

xi UIN Syarif Hidayatullah Jakarta

3.1.1 Studi pustaka ......................................................................................... 39

3.2 OSEMN Framework .................................................................................... 39

3.2.1 Obtain(Pengumpulan data) ................................................................... 39

3.2.2 Scrub(Data Preparation) ........................................................................ 40

3.2.3 Explore(Eksplorasi data) ....................................................................... 40

3.2.4 Modelling(Perancangan Model) ............................................................ 40

3.2.5 iNterpreting(Mengintrepretasikan hasil) ............................................... 40

3.3 Kerangka Berpikir ........................................................................................ 41

BAB IV IMPLEMENTASI ...................................................................................... 42

4.1 Obtain(Pengumpulan data) ........................................................................... 42

4.2 Scrub(Data Preparation) .............................................................................. 42

4.3 Explore(Eksplorasi data) .............................................................................. 45

4.4 Modelling(Perancangan Model) ................................................................... 46

4.5 iNterpreting(Mengintrepretasikan hasil) ...................................................... 50

BAB V HASIL DAN PEMBAHASAN .................................................................... 53

5.1 Pembagian training, test dan validation dataset ........................................... 53

5.2 Arsitektur Jaringan ....................................................................................... 54

5.2.1 Proses Convolution Layer ..................................................................... 65

5.2.2 Proses Pooling ....................................................................................... 66

xii UIN Syarif Hidayatullah Jakarta

5.2.3 Proses Fully Connected ......................................................................... 66

5.3 Akurasi ......................................................................................................... 66

5.4 Prediksi ......................................................................................................... 68

BAB VI PENUTUP ................................................................................................... 73

6.1 Kesimpulan ................................................................................................... 73

6.2 Saran ............................................................................................................. 73

DAFTAR PUSTAKA ................................................................................................ 75

xiii UIN Syarif Hidayatullah Jakarta

DAFTAR GAMBAR

Gambar 2.1 Diagram Kecerdasan Buatan ................................................................... 13

Gambar 2.2 Perbandingan Pemrograman Tradisional dengan Machine Learning ..... 14

Gambar 2.3 Contoh Jaringan Convolutional Neural Network (CNN) ........................ 19

Gambar 2.4 Ilustrasi Arsitektur CNN ......................................................................... 20

Gambar 2.5 Feature Map ............................................................................................ 21

Gambar 2.6 Plot learning rate terhadap loss .............................................................. 23

Gambar 2.7 Augmentasi dengan perputaran gambar maksimal 90 ° .......................... 24

Gambar 2.8 Blok Residual .......................................................................................... 27

Gambar 2.9 Contoh arsitektur keseluruhan dari ResNet ............................................. 28

Gambar 2.10 Ilustrasi operasi max pooling dan average pooling pada CNN ............. 30

Gambar 2.11 Hasil Penelitian Literatur 1 ................................................................... 35

Gambar 2.12 Hasil Penelitian Literatur 4 ................................................................... 36

Gambar 3.1 Kerangka Berpikir Penelitian .................................................................. 41

Gambar 4.1 tree susunan folder project ...................................................................... 43

Gambar 4.2 Konfigurasi pembagian dataset ............................................................... 43

Gambar 4.3 Source code pembagian dataset............................................................... 45

Gambar 4.4 Source Code Data augmentation ............................................................. 46

Gambar 4.5 Arsitektur model ResNet ......................................................................... 48

Gambar 4.6 Source code pelatihan model .................................................................. 49

Gambar 4.7 Source code pengujian akurasi prediksi .................................................. 50

Gambar 4.8 Source code untuk menampilkan visualisasi hasil prediksi gambar sel .. 51

Gambar 5.1 Dataset Malaria ....................................................................................... 53

Gambar 5.2 Model yang terbentuk dari hasil training ................................................ 64

Gambar 5.3 Uji Akurasi Model ................................................................................... 67

Gambar 5.4 Grafik model loss dan accuracy .............................................................. 68

Gambar 5.5 Hasil uji akurasi pada data testing ........................................................... 69

Gambar 5.6 Hasil prediksi sistem ............................................................................... 72

xiv UIN Syarif Hidayatullah Jakarta

DAFTAR TABEL

Tabel 2.1 Perbandingan ANN, CNN dan RNN .......................................................... 24

Tabel 2.2 Perbandingan Penelitian sejenis .................................................................. 36

Tabel 5.1 Sebaran data hasil pembagian dataset ......................................................... 54

Tabel 5.2 Perbandingan nilai Akurasi dengan literatur sejenis ................................... 71

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Penyakit Malaria masih merupakan masalah kesehatan masyarakat yang

menyebabkan kematian terutama pada kelompok resiko tinggi yaitu bayi, anak balita,

ibu hamil, selain itu malaria secara langsung menyebabkan anemia dan dapat

menurunkan produktivitas kerja.

Pada tahun 2018, diperkirakan 228 juta kasus malaria terjadi di seluruh dunia

dengan jumlah total kematian 405 ribu. Sebagian besar kasus malaria pada tahun 2018

berada di Wilayah Afrika (213 juta atau 93%), diikuti oleh Wilayah Asia Tenggara

dengan 3,4% dari kasus dan Wilayah Mediterania Timur dengan 2,1%.(WHO, 2019)

Penemuan kasus malaria dilakukan berdasarkan gejala klinis, melalui

pemeriksaan sediaan darah yang dilakukan dengan konfirmasi laboratorium

menggunakan mikroskop maupun Rapid Diagnostik Test (RDT).(WHO, 2019)

Tingkat akurasi pemeriksaan sediaan darah sangat tergantung kepada keahlian

manusia dan dapat dipengaruhi oleh variabilitas antar pengamat dan terbatasnya

sumber daya daerah dalam pemeriksaan skala besar pada wilayah dimana malaria

endemik. Teknik alternatif seperti Polymerase Chain Reaction (PCR) dan Rapid

Diagnostic Test (RDT) telah digunakan, namun analisis PCR terbatas dalam kinerjanya

dan RDT kurang efektif dalam hal biaya pada pemeriksaan skala besar di wilayah

dimana malaria endemik.(Rajaraman et al., 2018)

Beberapa dataset malaria telah dikembangkan guna membantu dalam hal

pemeriksaan dan diagnosis penyakit malaria. Penelitian ini meggunakan dataset

(Lhncbc.Nlm.Nih.Gov) yang berisikan repositori sel tersegmentasi dari aktivitas

penelitian Malaria Screener. Dataset ini dikembangkan oleh para peneliti di Lister Hill

2

UIN Syarif Hidayatullah Jakarta

National Center for Biomedical Communications (LHNVBC), yang tergabung dalam

bagian National Library of Medicine (NLM). Dataset ini diambil menggunakan

aplikasi seluler yang telah dikembangkan yang berjalan pada smartphone Android yang

terpasang pada mikroskop cahaya konvensional. Sel darah yang diwarnai cairan

Giemsa dari 150 pasien yang terinfeksi parasit dan sel darah dai 50 pasien sehat

dikumpulkan dan difoto di Rumah Sakit Chittagong Medical College, bangladesh.

Kamera yang terpasang pada smartphone memperoleh gambar slide untuk setiap

bidang pandang mikroskopis. Gambar-gambar tersebut dianotasikan secara manual

oleh pembaca slide yang ahli di Mahidol-Oxford Tropical Medicine Research Unit di

Bangkok, Thailand. Peneliti NLM menerapkan algoritma berbasis level-set untuk

mendeteksi dan mensegmentasi sel darah merah. Dataset ini dibuat untuk mengurangi

beban para mikroskopis di daerah yang sumber dayanya terbatas dan juga untuk

meningkatkan akurasi diagnostik malaria. Dataset berisi total 27.558 gambar sel

dengan jumlah data yang sama pada sel yang terkena parasit (Parasitized) dan sel yang

tidak terinfeksi (Uninfected). (Https://Lhncbc.Nlm.Nih.Gov/Publication/Pub9932, n.d.

diakses 18 juli 2020)

Jumlah, kompleksitas, dan kecepatan agregasi biomedis dan data layanan

kesehatan akan meningkat dengan cepat selama beberapa dekade berikutnya.

Kemungkinan akan berlipat ganda setiap 1-2 tahun. Ini didorong oleh langkah besar

dalam teknologi digital dan komunikasi, perangkat IoT, dan layanan Cloud, serta

kemajuan algoritmik, komputasi, dan perangkat keras yang cepat. Permintaan publik

yang semakin meningkat untuk deteksi waktu-nyata, interpretasi yang tepat, dan sistem

diagnosis yang dapat diandalkan manusia dalam hal kesehatan dan penyakit juga

mempercepat tren itu. Proses pengolahan data science adalah salah satu proses yang

dapat menggambarkan protokol analitik prediktif yang umum untuk diinterogasikan

pada dataset biomedis dan kesehatan yang besar dan kompleks. Prosesnya dimulai

dengan mengidentifikasi masalah, diikuti dengan menentukan sumber data dan meta-

data, pembersihan, penyelarasan komponent data, preprocessing data, inferensi ilmiah

3


berbasis model, dan diakhiri dengan prediksi, validasi dan penyebaran data, perangkat

lunak, protokol dan temuan penelitian (Dinov, 2018). Dari uraian tersebut, proses

pengolahan data science dapat menjadi jawaban untuk dapat membuat sistem diagnosis

otomatis dari dataset biomedis dan kesehatan, termasuk penyakit malaria.

Sistem diagnosis otomatis bertujuan untuk melakukan tugas pemeriksaan sediaan

darah ini tanpa campur tangan manusia dan untuk menyediakan alat yang obyektif,

dapat diandalkan, dan efisien untuk melakukannya. Sistem diagnosis otomatis dapat

dirancang dengan memahami keahlian diagnostik dan merepresentasikannya dengan

algoritma pemrosesan gambar, analisis, dan pengenalan pola khusus yang disesuaikan.

Meskipun ini bukan topik penelitian yang populer, sejumlah studi visi terlihat secara

langsung membahas diagnosis otomatis malaria. Meskipun sangat khusus, jika angka

kematian dianggap hasil, maka studi ini dapat dianggap penting seperti beberapa

aplikasi visi komputer populer lainnya. Studi ini memberikan tinjauan tentang studi

visi komputer diagnosis malaria dan bermaksud untuk mengisi celah pada tugas

pemeriksaan sediaan darah ini.

Sistem diagnosis otomatis ini dapat dirancang menggunakan proses penerapan

metode Machine Learning (ML), representasi fitur yang akurat merupakan inti dari

kesuksesan untuk mencapai hasil yang diinginkan. Mayoritas sistem diagnosis

otomatis berbasis analisis gambar menggunakan ML dengan representasi hand-

engineered features dalam pengambilan keputusan(Poostchi et al., 2018). Namun

proses ini menuntut keahlian khusus dalam menganalisis variabilitas ukuran, latar

belakang, sudut, dan Region Of Interest (ROI) pada gambar. Untuk mengatasi

tantangan dalam perancangan hand-engineered features yang menangkap variasi

dalam data dasar, digunakanlah model Deep Learning (DL) yang dikenal sebagai

hierarchical learning yang dapat digunakan dalam mencapai kesuksesan yang

signifikan(Lecun et al., 2015).

4


Model DL menggunakan lapisan unit kaskade non-linier untuk menemukan

reprentasi fitur hirarki pada data mentah. Fitur dengan tingkat yang lebih tinggi

diabstraksikan dari tingkat yang lebih rendah untuk membantu dalam proses

pembelaaran yang kompleks, fungsi pengambilan keputusan non-linier, yang

dihasilkan dalam ekstraksi dan klarifikasi end-to-end (Schmidhuber, 2015). Tidak

seperti algoritma berbasil kernel seperti Support Vector Machine (SVM) pada model

ML, model DL menunjukkan peningkatan kinerja dengan peningkatan ukuran data dan

sumber daya komputasi, dan membuatnya memiliki skala yang lebih tinggi. (Srivasta

et al., 2014)

Pada sebuah gambar, sumber informasi yang penting terletak pada korelasi lokal

spasial diantara piksel/voxel yang berdekatan. Covolutional Neural Networks (CNN)

yang merupakan sebuah kelas pada mode DL, dirancang untuk mengeksploitasi

iniformasi ini melalui mekanisme local receptive fields, shared weights dan pooling

(Hinton dkk, 2015). Dalam representasi dan pengembangan performa CNN beberapa

model seperti AlexNet, VGGNet, GoogleNet, Resnet dan DenseNet, model-model ini

telah mencapai peningkatan yang sangat signifikan dengan menggunakan lebih sedikit

parameter dan perhitungan. Kinerja CNN yang menanjikan disertai dengan

ketersidiaan jumlah data yang dianotasi yang sangat besar. Dengan kelangkaan data

anotasi pencitraan medis, digunakanlah metode Transfer Learning yang dimana model

pra-latih DL disesuaikan baik pada data yang mendasarinya atau digunakan sebagai

ekstraktor fitur untuk membantu dalam tugas-tugas pengenalan visual. Model-model

ini mentransfer pengetahuan mereka saat mempelaari fitur-fitur umum dari dataset

skala besar untuk tugas yang mendasarinya(Razavian et al., 2014). Dan diakui bahwa

CNN yang dilatih pada dataset skala besar dapat berfungsi sebagai ekstraktor fitur

untuk berbaai tugas computer vision dalam membantun peningkatan kinerja,

dibandingkan metode lain. (Bousetouane & Morris, 2015)

Saat ini, banyak penelitian yang telah menerapkan DL dan memperoleh hasil yan

menjanjikan dalam berbagai tugas analisis dan pemahaman gambar medis. Pada

5


Evaluations of deep convolutional neural networks for automatic identification of

malaria infected cells(Dong et al., 2017) dan Visualizing abnormalities in chest

radiographs through salient network activations in Deep Learning (Sivaramakrishnan

et al., 2017) membuktikan bahwa CNN memliki lebih sedikit parameter hasil, lebih

sedikit model kompleksitas dan waktu komputasi. Dan juga membuktikan bahwa CNN

memiliki akurasi yang tinggi dan juga dapat mengekstraksi banyak lapisan fiur input

data secara otomatis.

Pada penelitian (Sivaramakrishnan et al., 2017) dalam membandingkan

arsitektur CNN yaitu AlexNet, VGG-16, ResNet, Xception dan Densenet, penilitian ini

mengamati dari studi validasi silang bahwa ResNet mengungguli arsitektur CNN yang

lainnya dalam semua metrik kinerja untuk tugas mengklasifikasikan. Dan arsitektur

ResNet memperoleh tingkat akurasi sebesar 95,59 dan mengungguli arsitektur yan

lainnya.

Dalam penulisan ini, penulis akan menggunakan model DL berbasis pre-tained

CNN dengan arsitektur ResNet sebagai fitur ekstraktor dalam mengklasifikasi

parasitized dan uninfected cells untuk membantu dalam peningkatan sistem diagnosis

penyakit malaria.

6


1.2 Rumusan Masalah

Berdasarkan latar belakang tersebut, penulis merumuskan masalah

sebagai berikut :

“Bagaimana cara pengolahan Data Science dalam menghasilkan tingkat

akurasi yang baik pada pendeteksian parasit penyebab malaria menggunakan

metode Convolutional Neural Network?”

1.3 Batasan Masalah

Adapun batasan masalah pada penulisan ini adalah:

1. Pendeteksian dilakukan pada gambar sel darah manusia.

2. Analisis dan perancangan sistem aplikasi menggunakan bahasa

pemrograman python.

3. Dalam melakukan pengolahan data science, penulis menggunakan OSEMN

Framework.

4. Dalam melakukan pemodelan pada pengolahan data science, penulis

menggunakan metode Convolurional Neural Network dengan arsitektur

ResNet.

5. Dataset berdasarkan studi literatur (Lhncbc.Nlm.Nih.Gov).

1.4 Tujuan Penelitian

Proses pengolahan Data Science dalam menghasilkan tingkat akurasi yang baik

pada pendeteksi parasit malaria dalam sel darah manusia menggunakan metode

Convolotuional Neural Network.

1.5 Manfaat Penelitian

Manfaat dari penulisan ini antara lain:

Bagi pengguna

1. Dapat mengetahui bentuk dan kategori parasit penyebab malaria.

7


2. Memudahkan untuk mendapatkan informasi tentang parasit penyebab

malaria guna untuk memahami dan mendeteksi penyakit malaria.

Bagi penulis

1. Mendapatkan ilmu pengetahuan mengenai penyakit malaria.

2. Mendapatkan pemahaman tentang data science, image processing dan

metode Convolutional Neural Network.

1.6 Sistematika Penulisan

Untuk memudahkan dalam penulisan skripsi, penulis menyusunnya ke dalam

enam bab. Setiap bab-nya terdiri dari beberapa sub bab tersendiri. Bab tersebut secara

keseluruhan saling berkaitan satu sama lain, dimana diawali dengan bab pendahuluan

dan diakhiri bab penutup yang berisi kesimpulan dan saran. Secara singkat akan

diuraikan sebagai berikut:

BAB I PENDAHULUAN

Dalam bab ini akan dibahas mengenai latar belakang, batasan masalah,

tujuan, dan manfaat serta sistematika penulisan.

BAB II LANDASAN TEORI

Dalam bab ini akan dibahas mengenai berbagai teori yang mendasari

analisis permasalahan dan berhubungan dengan topik yang dibahas.

BAB III METODOLOGI PENELITIAN

Bab ini membahas mengenai metode penelitian yang akan digunakan

dalam pengolahan data science pada Pendeteksi Parasit Malaria

BAB IV IMPLEMENTASI

8


Pada bab ini membahas mengenai hasil dari analisis, perancangan,

implementasi dan pengujian sesuai dengan metode yang dilakukan pada

sistem yang dibuat serta hasil dari pengujian.

BAB V HASIL DAN PEMBAHASAN

Bab ini membahas mengenai hasil dan pembahasan tentang pengolahan

data science pada sistem pendeteksi parasit malaria menggunakan

metode Convolutional Neural Network.

BAB VI PENUTUP

Bab ini berisi tentang kesimpulan dari penelitian yang telah dilakukan

dan saran yang diusulkan untuk pengembangan lebih lanjut agar

tercapai hasil yang lebih baik.

9

BAB II

LANDASAN TEORI

2.1 Malaria

Malaria adalah suatu penyakit yang disebabkan oleh parasit yang termasuk dalam

anggota spesies dari genus Plasmodium. Plasmodium falciparum, Plasmodium vivax,

Plasmodium ovale dan Plasmodium malariae hampir disemua kasus terjadi pada

manusia. Malaria ditransmisikan dari manusia ke manusia oleh nyamuk Anopheles

betina kemudian berkembang dan bereplikasi didalam eritrosit inang vertebrata.

(Millar & Cox-Singh, 2015)

Malaria adalah penyakit menular yang disebabkan plasmodium, yaitu makhluk

hidup bersel satu yang termasuk ke dalam kelompok protozoa. Malaria ditularkan

melalui gigitan nyamuk Anopheles betina yang mengandung Plasmodium di dalamnya.

Plasmodium yang terbawa melalui gigitan nyamuk akan hidup dan berkembang biak

dalam sel darah merah manusia. Penyakit ini menyerang semua kelompok umur baik

laki-laki maupun perempuan. Orang yang terkena malaria akan memiliki gejala:

demam, menggigil, berkeringat, sakit kepala, mual atau muntah.

(PUSDATINKemenkesRI, 2016)

Sampai saat ini menurut (Center for Disease Control and Prevention, 2018)

dikenal 5 jenis spesies plasmodium penyebab malaria pada manusia, yaitu:

1. Plasmodium falciparum, adalah parasit malaria yang ditemukan di daerah

tropis dan subtropis di dunia. Diperkirakan setiap tahunnya ada 1 juta orang

yang terbunuh akibat parasit ini, terutama di Afrika. Plasmodium falciparum

adalah penyebab malaria tropika yang sering menyebabkan malaria yang berat,

karena memiliki kemampuan melipat ganda secara cepat dalam darah sehingga

dapat menyebabkan anemia. Selain itu Plasmodium falciparum dapat

menyumbat pembuluh darah kecil. Ketika ini terjadi di otak akanmenyebabkan

malaria serebral dengankomplikasiyang dapat berakibat fatal (kematian).

10


2. Plasmodium vivax, adalah parasit malaria penyebab malaria tertiana yang

kebanyakan ditemukan di Asia, Amerika Latin, dan beberapa bagian di Afrika.

Karena padatnya penduduk terutama di Asia menyebabkan Plasmodium vivax

merupakan parasit malaria yang paling umum ditemukan pada manusia.

Plasmodium vivax memiliki tahapan dormansi dalam hati (hypnozoites) yang

dapat aktif dan menyerang darah(relapse) dalam beberapa bulan atau tahun

setelah gigitan nyamuk yang terinfeksi.

3. Plasmodium malariae, adalah penyebab malaria quartana yang ditemukan di

seluruh dunia. Plasmodium malariae adalah satu-satunya spesies parasit

malaria pada manusia yang memiliki siklus quartan (siklus tiga hari),

sedangkan tiga spesies lainnya memiliki siklus tertiana (siklus dua hari). Infeksi

Plasmodium malariae mampu bertahan dalam waktu yang lama jika tidak

diobati. Dalam beberapa kasus, infeksi kronis dapat berlangsung seumur hidup.

Pada beberapa pasien kronis yang terinfeksi.

4. Plasmodium ovale dapat menyebabkan komplikasi yang serius seperti sindrom

nefrotik. Plasmodium ovale, adalah parasit malaria yang menyebabkan malaria

ovale tetapi jenis ini jarang dijumpai. Plasmodium ovale banyak ditemukandi

Afrika (terutama Afrika Barat) dan pulau-pulau di Pasifik Barat. Plasmodium

ovale secara biologis danmorfologis sangat mirip dengan Plasmodium vivax.

Plasmodium ovale dapat menginfeksi individu yang negatif untuk golongan

darah duffy (salah satu penggolongan darah selain ABO dan Rh) sedangkan

Plasmodium vivax tidak. Golongan darah duffy banyak ditemukan pada

penduduk Sub-Sahara Afrika. Hal ini menjelaskan prevalensi infeksi

Plasmodium ovale banyak terjadi di sebagian besar Afrika.

5. Plasmodium knowlesi merupakan parasit malaria baru yang bisa menginfeksi

manusia. Plasmodium knowlesi ditemukandi seluruh Asia Tenggara sebagai

pathogen alami dari kera ekor panjang dan babi. Baru-baru ini Plasmodium

knowlesi terbukti menjadi penyebab signifikan malaria zoonosis, terutama di

11


Malaysia. Plasmodium knowlesi memiliki siklus replikasi 24 jam dan begitu

cepat dapat berkembang menjadi infeksi yang parah.

2.2 Data Science

Data science adalah sebuah bidang baru yang muncul dan menjadi ilmu yang

sangat transdisipliner, yang menjembatani antara bidang teoritis, komputasi,

eksperimental, dan biososial. Data science juga berurusan dengan sejumlah besar data

yang kompleks, tidak selaras, dan dinamis yang berasal dari berbagai sumber. Data

Science bertujuan untuk mengembangkan algoritma, metode, alat, dan layanan yang

mampu mengolah dataset dan menghasilkan sistem penunjang keputusan semi-

otomatis. (Dinov, 2018)

Data Science adalah interdisipliner ilmu yang inheren dengan pendekatan sains.

Teknik eksperimental baru telah merevolusi biologi selama bertahun - tahun dari

sekuensing DNA dan mikroarray di masa lalu ke CRISPR dan cryo-EM baru-baru ini.

Data Science berbeda karena itu bukan merupakan teknik tunggal, melainkan kerangka

kerja untuk menyelesaikan seluruh jajaran masalah. Potensi Data Science untuk

menjawab pertanyaan dalam berbagai disiplin ilmu yang berbeda sangat

menggairahkan banyak peneliti. (Ezer & Whitaker, 2019)

2.3 Klasifikasi Gambar

Klasifikasi gambar atau citra adalah sebuah pekerjaan untuk memasukkan citra

dan menempatkan ke dalam suatu kategori. Ini merupakan salah satu dari permasalahan

yang ada pada Computer Vision yang dapat disederhanakan dan memiliki berbagai

macam aplikasinya. Salah satu aplikasi dalam klasifikasi citra adalah pengklasifikasian

nama tempat pada suatu citra.

Setiap citra yang di input pada training set data diberikan label atau penamaan.

Saat klasifikasi, label atau penamaan tersebut akan menjadi perbandingan dengan hasil

hipotesis yang diberikan oleh model pembelajaran dan akan menghasilkan nilai error.

Klasifikasi yang terawasi ini bisa sangat efektif dan akurat dalam mengklasifikasikan

12


citra tempat maupun objek lainnya. Banyak metode dan algoritma yang dapat

mendukung proses klasifikasi yang terawasi terutama dengan teknik Deep Learning

(Putri, 2018)

2.4 Artificial Intellegence (AI)

Kecerdasan Buatan atau Artificial Intelligence (AI) adalah teknik yang

digunakan untuk meniru kecerdasan yang dimiliki oleh makhluk hidup maupun benda

mati untuk menyelesaikan sebuah persoalan. Untuk melakukan hal ini, setidaknya ada

tiga metode yang dikembangkan.

• Fuzzy Logic(FL).

Teknik ini digunakan oleh mesin untuk mengadaptasi bagaimana makhluk hidup

menyesuaikan kondisi dengan memberikan keputusan yang tidak kaku 0 atau 1.

Sehingga dimunculkan sistem logika fuzzy yang tidak kaku. Penerapan logika fuzzy ini

salah satunya adalah untuk sistem pengereman kereta api di Jepang.

• Evolutionary Computing(EC).

Pendekatan ini menggunakan skema evolusi yang menggunakan jumlah individu

yang banyak dan memberikan sebuah ujian untuk menyeleksi individu terbaik untuk

membangkitkan generasi selanjutnya. Seleksi tersebut digunakan untuk mencari solusi

dari suatu permasalahan. Contoh dari pendekatan ini adalah Algoritma Genetika yang

menggunakan ide mutasi dan kawin silang, Particle Swarm Optimization (PSO) yang

meniru kumpulan binatang seperti burung dan ikan dalam mencari mangsa, Simulated

Annealing yang menirukan bagaimana logam ditempa, dan masih banyak lagi.

• Machine Learning (ML)

Machine Learning atau pembelajaran mesin merupakan teknik yang paling

populer karena banyak digunakan untuk menggantikan atau menirukan perilaku

manusia untuk menyelesaikan masalah. Sesuai namanya ML mencoba menirukan

13


bagaimana proses manusia atau makhluk cerdas belajar dan mengeneralisasi (Ahmad,

2017)

Skema utama dari AI bisa dilihat pada gambar berikut:

Sumber (Ahmad, 2017)

Berdasarkan diagram pada gambar 2.1. dapat dijelaskan bahwa AI dibagi

menjadi beberapa macam algortima seperti Machine Learning, Fuzzy Logic,

Evolutionary Computation, dan lain-lain. Fuzzy Logic adalah suatu cabang ilmu

Artificial Intellegence, yaitu suatu pengetahuan yang membuat komputer dapat meniru

kecerdasan manusia sehingga diharapkan komputer dapat melakukan hal- hal yang

apabila dikerjakan manusia memerlukan kecerdasan. Evolutionary Computation

adalah algoritma untuk optimisasi global yang terinspirasi oleh evolusi biologis, dan

subbidang kecerdasan buatan dan komputasi lunak mempelajari algoritma ini. Dalam

istilah teknis, mereka adalah keluarga pemecah masalah trial and error berbasis

populasi dengan karakter optimisasi metaheuristik atau stokastik.

Gambar 2.1 Diagram Kecerdasan Buatan

14


Didalam ANN terdapat Deep Learning yang mana mesin dilatih lebih mendalam.

Deep Learning adalah salah satu cabang Machine Learning (ML) yang menggunakan

Deep Neural Network untuk menyelesaikan permasalahan pada domain ML.

2.5 Machine Learning

Machine Learning adalah serangkaian teknik yang dapat membantu dalam

menangani dan memprediksi data yang sangat besar dengan cara merepresentasikan

data-data tersebut dengan algoritma pembelajaran. Machine Learning dapat membuat

komputer memprogram diri mereka sendiri. Jika pemrograman adalah pekerjaan untuk

membuat otomatis, maka Machine Learning mengotomatisasi proses otomatis. Berikut

gambaran umum Machine Learning dibandingkan dengan pemrograman secara

tradisional.

Gambar 2.2 Perbandingan Pemrograman Tradisional dengan Machine Learning

Dari gambar diatas dapat dilihat bahwa pemrograman secara tradisional data dan

programan dijalankan di komputer untuk menghasilkan output. Sedangkan pada

Machine Learning data dan output dijalankan di komputer untuk membuat sebuah

program.

Ada banyak algoritma Machine Learning yang dikembangkan setiap tahunnya.

Setiap algoritma pembelajaran mesin memiliki tiga komponen penting antara lain:

15


a. Representasi: bagaimana merepresentasikan pengetahuan.

Contohnya termasuk Decision tree, Neural Network, Support Vector

Machine dan lain-lain.

b. Evaluasi: cara mengevaluasi prediksi dan hipotesis. Contohnya

meliputi Mean Squared Error, Cost function dan lain-lain.

c. Optimasi: cara program dari model dihasilkan dan proses

pencarian parameter terbaik. Misalnya Convex Optimization dan

Gradient Descent.

Selain dari algoritma pembelajaran ada empat jenis cara pembelajaran pada

Machine Learning, yakni:

a. Supervised Learning: Data pembelajaran mencangkup keluaran

yang yang sudah ditentukan.

b. Unsupervised Learning: Data pembelajaran tidak mencangkup

keluaran yang ditentukan.

c. Semi-supervised Learning: Data pembelajaran mencangkup

beberapa keluaran yang ditentukan.

d. Reinforcement Learning: Pemberian hadiah dari setiap serangkaian

tindakanyang dilakukan.

2.6 Deep Learning

Deep Learning merupakan salah satu bidang dari Machine Learning yang

memanfaatkan jaringan syaraf tiruan untuk implementasi permasalahan dengan dataset

yang besar. Teknik Deep Learning memberikan arsitektur yang sangat kuat untuk

Supervised Learning. Dengan menambahkan lebih banyak lapisan maka model

pembelajaran tersebut bisa mewakili data citra berlabel dengan lebih baik.

16


Pada Machine Learning terdapat teknik untuk menggunakan ekstrak fitur dari

data pelatihan dan algoritma pembelajaran khusus mengklasifikasi citra maupun untuk

mengenali suara. Namun, metode ini masih memiliki beberapa kekurangan baik dalam

hal kecepatan dan akurasi. Aplikasi konsep jaringan syaraf tiruan yang dalam (banyak

lapisan) dapat ditangguhkan pada algoritma Machine Learning yang sudah ada

sehingga komputer sekarng bisa belajar dengan kecepatan, akurasi, dan skala yang

besar. Prinsip ini terus berkembangkan hingga Deep Learning semakin sering

digunakan pada komunitas riset dan industri untuk membantu memecahkan banyak

masalah data besar seperti Computer vision, Speech recognition, dan Natural

Language Processing.

Feature Engineering adalah salah satu fitur dari Deep Learning untuk

mengekstrak pola yang berguna dari data akan memudahkan model untuk

membedakan kelas. Feature Engineering juga merupakan teknik yang paling penting

untuk mencapai hasil yang baik pada tugas prekdiksi. Namun, sulit untuk dipelajari dan

dikuasai karena kumpulan data dan jenis data yang berbeda memerlukan pedekatan

teknik yang berbeda juga. Algoritma yang digunakan pada Feature Engineering dapat

menemukan pola umum yang penting untuk membedakan antara kelas.

Ekstraksi fitur otomatis merupakan keunggulan deep learning dibanding dengan

algoritma machine learning terdahulu . ekstrasi fitur mengutamakan pemberian label

pada dataset yang ada dalam proses jaringan.

Secara historis, pelatihan machine learning menghabiskan berbulan-bulan,

bertahun-tahun, bahkan puluhan tahun dalam pembuatan set fitur lengkap untuk

klasifikasi data secara manual. Deep learning merupakan algoritma paling akurat

sejauh ini (Patterson & Gibson, 2017)

2.7 Jaringan Syaraf Tiruan / Artificial Neural Network (ANN)

Jaringan Syaraf Tiruan / Artificial Neural Network (ANN) merupakan metode

yang biasanya digunakan dalam peramalan maupun pengenalan pola. Pada peramalan

17


jaringan syaraf tiruan biasa digunakan sebagai peramalan nilai tukar mata uang asing,

peramalan harga saham, peramalan cuaca dan lain sebagainya, sedangkan untuk

pengenalan pola biasanya jaringan syaraf tiruan digunakan untuk pengenalan pola

huruf, pola tanda tangan hingga pola suara serta wajah (Kartika et al., 2016)

Berdasarkan (Nurhikmat, 2018), ANN merupakan sistem adatif yang dapat

mengubah strukturnya untuk memecahkan suatu masalah berdasarkan informasi

internal maupun eksternal. Menurut Pham dalam jurnal Hermantoro (Pham, 1994)

mengatakan bahwa ANN bersifat fleksibel terhadap inputan data dan menghasilkan

output respon konsisten. ANN telah banyak digunakan dalam area yang luas. Menurut

Kumar & Haynes (Kumar, 2003) dalam jurnal Ulil Hamida (Hamida, 2014)

menjelaskan, penerapan ANN dapat mengidentifikasi beberapa aplikasi yaitu:

• Estimasi/prediksi (aproksimasi fungsi, peramalah)

• Pengenalan Pola (klasifikasi, diagnosis, dan analisis diskriminan)

• Klustering (pengelompokan tanpa adanya pengetahuan sebelumnya)

2.8 Convolutional Neural Network (CNN)

Convolutional Neural Network (CNN) adalah arsitektur deep learning yang

terkenal yang terinspirasi oleh mekanisme persepsi visual makhluk hidup di alam. Pada

tahun 1959, Hubel & Wiesel menemukan bahwa sel-sel pada hewan visual cortex

bertanggung jawab untuk mendeteksi cahaya pada bidang reseptif. Terinspirasi oleh

penemuan ini, Kunihiko Fukushima menguslkan teori neocognitron pada tahun 1980,

yang dainggap sebagai pendahulu CNN. Pada tahun 1990, LeCun dkk. menerbitkan

jurnal yang membentuk kerangka kerja modern dari CNN, dan kemudian

memperbaikinya lagi pada tahun 1998. Mereka mengembangkan jaringan saraf tiruan

multi-layer yang disebut LeNet-5 yang dapat mengklasifikasikan digit tulisan tangan.

Dimulai pada tahun 1990 sebuah studi paralel oleh Zhang dkk. menggunakan Shift-

Invariant Artificial Neural Network (SIANN) untuk mengenali karakter dari sebuah

18


gambar. Namun, karena kurangnya data training yang besar dan daya komputasi pada

waktu itu, jaringan mereka tidak dapat bekerja dengan baik pada masalah yang lebih

kompleks, mis., klasifikasi gambar dan video skala besar.

Sejak 2006, banyak metode telah dikembangkan untuk mengatasi kesulitan yang

dihadapi dalam pelatihan mendalam pada CNN. Paling menonjol pada tahun 2012,

Krizhevsky dkk. Mengusulkan arsitektur CNN klasik dan menunjukkan perbaikan

yang signifikan dari metode sebelumnya pada pengklasifikasian gambar. Keseluruhan

arsitektur dari metode mereka dikenal dengan sebutan AlexNet, mirip dengan LeNet-

5 tetapi dengan struktur yang lebih dalam. Dengan keberhasilan AlexNet, banyak karya

telah diusulkan untuk meningkatkan kinerja CNN. (J Gu et al, 2015)

CNN temasuk kedalam kategori metode neural network. CNN tidak hanya dapat

mempelajari representasi fitur gambar secara otomatis, tetapi CNN juga mengungguli

banyak teknik buatan konvensional lainnya. (Sang et al., 2017)

Model neural network memiliki representasi data hirarkis dan bergantung pada

perhitungan layer yang memiliki implementasi berurutan, output layer sebelumnya

akan menjadi input layer berikutnya. Setiap layer memberikan satu level representasi.

Dan, ada satu set bobot yang mengukur parameter layer. Dan juga, unit input terhubung

ke unit output melalui bobot di samping sekelompok bias. Bobot dalam CNN,

dibagikan secara lokal, yang berarti bahwa setiap lokasi input memiliki bobot yang

sama. Bentuk filter berdasarkan bobot yang dikaitkan dengan output yang sama.

(Romero et al, 2016)

19


Gambar 2.3 Contoh Jaringan Convolutional Neural Network (CNN)

Sumber: cs23ln.github.io

Pada gambar diatas menunjukkan setiap lapisan input yang dimasukkan memiliki

volume yang berbeda dan mewakili dengan kedalaman, tinggi dan lebar. Setiap besaran

yang didapatkan tergantung dari hasil filtrasi dari lapisan sebelumnya dan juga banyak

filter yang digunakan. Model jaringan seperti ini sudah terbukti sangat ampuh dalam

menangani permasalahan klasifikasi citra.

2.8.1 Arsitektur Jaringan CNN

Pada neural network, neuron dikumpulkan dalam lapisan-lapisan (layers)

yan disebut denan lapisan neuron (neuron layers). Neuron-neuron pada satu

lapisan dihubungkan dengan lapisan sebelumnya dan sesudahnya, kecuali pada

lapisan input dan output. Lapisan diantara lapisan biasa disebut dengan lapisan

tersembunyi atau hidden layer. Perambatan juga bisa dilakukan pada arah

sebaliknya tergantungg pada algoritma pembelajaran yang dipakai.

Faktor terpenting dalam menentukan sifat suatu neuron adalah pola bobot

(weights) dan fungsi aktivitas dari neuron tersebut. Pada setiap lapisan yang

sama, neuron-neuron memiliki fungsi aktivitas yang sama.

Arsitektur neural network biasa dibagi berdasarkan jumlah lapisannya

menjadi:

1. Jaringan dengan lapisan tunggal (Single layer network).

Jaringan dengan lapisan tunggal adalah sebuah jaringan dengan

semua input terhubung langsung pada output tanpa melewati lapisan

tersembunyi.

20


2. Jaringan dengan banyak lapisan (multi-layer networks)

Jaringan dengan lapis banyak memiliki satu atau lebih lapisan

tersembunyi di antara lapisan input dan output.

Convolutional Neural Network (CNN) merupakan multi-layer networks

yang terdiri dari alternating layer yang secara local terhubung pada

convolutional layer dimana setiap layer memiliki jumlah filter yang sama.

Downsampling layer dan fully connected layer berfungsi sebagai classifier.(Al-

Waisy et al., 2017)

Gambar 2.4 Ilustrasi Arsitektur CNN

Sumber: (Al-Waisy et al., 2017)

Arsitektur CNN memiliki tiga konsep yang membuatnya efektif: local

receptive fields, weights sharing, dan downsampling operations. Local

receptive fields berisikan setiap neuron yang menerima input berupa porsi kecil

dari layer sebelumnya dan juga memiliki ukuran yang sama dari convolution

filter. Local receptive fields digunakan pada convolutional dan downsampling

layer. Weight sharing diterapkan pada convolutional layer untuk mengontrol

kapasitas dan mengurangi kompleksitas model. Terakhir, nonlinear

downsampling yang digunakan pada downsampling layer berfungsi untuk

mengurangi ukuran spasial gambar serta mengurangi jumlah parameter bebas

dari model. Konsep-konsep ini membantu CNN menjadi kuat dan efektif dalam

tugas-tugas pengenalan gambar.(Al-Waisy et al., 2017)

Berikut adalah penjelasan beberapa layer yang terdapat pada CNN:

21


1. Convolutional layer

Bobot pada layer ini terbuat dari satu set learnable filters yang

diproduksi secara acak dan dipelajari melalui algoritma back-

propagation. Feature map adalah hasil dari setiap filter yang

terhubung melalui sebuah gambar. Feature map juga memiliki

jumlah yang sama dari filter yang diterapkan pada layer tersebut. (Al-

Waisy et al., 2017)

Gambar 2.5 Feature Map

Sumber oreilly.com

Seperti yang telah diilustrasikan pada Gambar 2.2, convolutional

layer yang pertama berisikan 6 filter yang menghasilkan 6 feature

map yang disusun bersama. Setiap feature map mewakili fitur spesifik

dari gambar, misalnya represented points atau represented vertical

edges seperti yang diilustrasikan pada Gambar 2.3. Operasi

convolution dirumuskan sebagai berikut.

𝑥𝑗𝑙 = 𝑓 (∑ 𝑥𝑗

𝑙−1 ∗ 𝑘𝑖𝑗𝑙 + 𝑏𝑗

𝑙𝑖∈𝑀𝑗

) (1)

l = layer pada CNN

j = specific convolution feature map

22


f = fungsi aktivasi

𝑀𝑗 = selection of input maps

𝑘𝑖𝑗 = filter

𝑏𝑗 = feature map bias

2. Pooling layer

Layer ini mengimplementasikan operasi downsampling untuk

mengurangi ukuran spasial dari convolutional layer. Pertama, ukuran

pooling mask dan jenis operasi pooling harus ditentukan dan setelah

itu dapatditerapkan pada pooling layer.

Operasi pooling diimplementasikan pada nilai-nilai piksel yang

ditangkap oleh pooling mask, lalu dikalikan dengan trainable

coefficient, setelah itu ditambahkan ke trainable bias. Operasi

pooling dirumuskan sebagai berikut.

𝑥𝑗𝑙 = 𝑓(𝐵𝑗

𝑙𝑝𝑜𝑜𝑙(𝑥𝑗𝑙−𝑖) + 𝑏𝑗

𝑙) (2)

3. Full Connected layers

Layer ini digunakan untuk mengekstrak feature pada layer

sebelumnya untuk selanjutnya dilakunnya tugas klasifikasi. Hasil dari

convolutional atau pooling layer terakhir akan diberikan ke fully

connected layers seperti dalam jaringan sraf asli.

2.8.2 Fungsi Aktivasi

Fungsi aktivasi adalah fungsi non linear yang memungkinkan sebuah

neural network untuk dapat mentransformasikan data input menjadi dimensi

yang lebih tinggi sehingga dapat dilakukan hyperlane sederhana yang

memungkinkannya dilakukan klasifikasi.(Eka Putra, 2016)

Setiap fungsi aktivasi mengambil sebuah nilai dan melakukan operasi

matematika. Pada arsitektur CNN, fungsi aktivasi terletak pada perhitungan

23


−

akhir output feature map atau sesudah proses operasi convolution atau pooling

untuk menghasilkan suatu pola fitur.(Zufar & Setiyono, 2016)

Beberapa macam fungsi aktivasi yang sering digunakan dalam penelitian

CNN antara lain fungsi sigmoid, tanh, Rectified Liniear Unit (ReLU), Leaky

ReLU (LReLU), SGD dan SoftMax.

2.8.3 Learning Rate

Learning rate adalah salah satu hyper parameter yang sangat

mempengaruhi performa suatu model CNN. Dalam melakukan pencarian

learning rate yang tepat, digunakan suatu metode yang bernama cyclical

learning rates (Smith, 2017), dalam metode ini, akan dilakukan beberapa

epochs training, dengan learning rate yang dimulai dari nilai yang kecil, dan

setiap iterasi akan diperbesar learning rate-nya, setiap iterasi akan dilihat loss

yang didapat, dan jika loss yang didapat meningkat cukup drastis maka proses

pencarian akan diberhentikan. Berdasarkan data loss yang didapat, maka dipilih

learning rate sesaat sebelum loss memiliki nilai terendah.

Gambar 2.6 Plot learning rate terhadap loss

Dapat dilihat pada Gambar 3 bahwa pada saat learning rate berada pada

titik 1e 02 titik ini memiliki nilai loss terkecil kedua, maka titik ini cocok untuk

dipilih untuk menjadi learning rate. (Smith, 2017)

24


2.8.4 Data Augmentation/ Data Augmentasi

Augmentasi data adalah suatu proses dalam pengolahan data gambar,

augmentasi merupakan proses mengubah atau memodifikasi gambar

sedemikian rupa sehingga komputer akan mendeteksi bahwa gambar yang

diubah adalah gambar yang berbeda, namun manusia masih dapat mengetahui

bahwa gambar yang diubah tersebut adalah gambar yang sama (Perez & Wang,

2017). Augmentasi dapat meningkatkan akurasi dari model CNN yang dilatih

karena dengan augmentasi model mendapatkan data-data tambahan yang dapat

berguna untuk membuat model yang dapat melakukan generalisasi dengan

lebih baik. Salah satu jenis augmentasi yang umum dilakukan adalah dengan

melakukan perputaran gambar dengan besar tertentu, contoh dari penggunaan

augmentasi ini dapat dilihat pada Gambar 2.7

Dalam pembelajaran Deep Learning terdapat beberapa metode yaitu Artificial

Neural Network (ANN), Recurrent Neural Network (RNN) dan Convolutional Neural

Network (CNN). Berikut perbedaan antara beberapa metode tersebut:

Tabel 2.1 Perbandingan ANN, CNN dan RNN

Perbedaan ANN CNN RNN

Tipe data Tabular Data, Text

data

Image Data Sequence Data

Gambar 2.7 Augmentasi dengan perputaran

gambar maksimal 90 °

25


Parameter Sharing No Yes Yes

Fixed Length input Yes Yes No

Recurrent

Connections

No No Yes

Vanishing dan

Exploding

Gradient

Yes Yes Yes

Spatial

Relationship

No Yes No

Performa ANN dianggap

kurang powerful

dibandingkan

CNN dan RNN.

CNN dianggap

lebih powerful

dibandingkan

ANN dan RNN.

RNN mencakup

lebih sedikit

kompabilitas fitur

dibandingkan

dengan CNN.

Pengaplikasian Facial Recognition

dan Computer

Vision

Facial

Recognition,

Image

Classification dan

Natural Language

Processing.

Text-to-Speech

Conversion.

Keuntungan Memiliki Fault

Tolerance,

kemampuan untuk

bekerja denan

pengetahuan yang

tidak lengkap.

Memiliki akurasi

yan tinggi dalam

pengenalan

gambar dan weight

sharing

Mampu mengingat

setiap informasi,

time series

prediction.

26


Kekurangan Bergantung kepada

perangkat keras

yang digunakan,

perilaku jaringan

tidak dapat

dijelaskan.

Membutuhkan data

pelatihan yang

besar.

Gradient vanishing

dan exploding

gradient.

2.9 Precision dan Recall

Precision adalah tingkat ketepatan antara informasi yang diminta oleh pengguna

dengan jawaban yang diberikan oleh sistem. Sedangkan recall adalah tingkat

keberhasilan sistem dalam menemukan kembali sebuah informasi. Gunanya fungsi ini

agar akurasi model tidak serta merta dipercaya namun cukup dapat

dipertanggungjawabkan kebenarannya karena melihat akurasi model dari sisi lain.

2.10 Epoch

Epoch adalah ketika seluruh dataset sudah melalui proses training pada Neural

Netwok sampai dikembalikan ke awal untuk sekali putaran, karena satu Epoch terlalu

besar untuk dimasukkan (feeding) kedalam komputer maka dari itu kita perlu

membaginya kedalam satuan kecil (batches). Didalam epoch inilah tiap bobot/ weight

ditambahkan.

2.11 ResNet

Residual neural network atau yang biasa disebut sebagai Resnet adalah salah satu

jenis arsitektur yang cukup populer, arsitektur ini dibuat oleh (He et al., 2015).

Arsitektur ini cukup revolusioner pada saat itu karena arsitektur ini menjadi state of the

art pada saat itu tidak hanya dalam klasifikasi, namun dalam semua kategori termasuk

object detection, dan semantic segmentation. Arsitektur CNN yang memiliki

kedalaman tinggi adalah salah satu hal penting dalam membangun model CNN yang

memiliki performa yang baik, namun model CNN yang memiliki kedalaman yang

27


tinggi juga memiliki masalah, yaitu vanishing gradient problem, yaitu suatu keadaan

dimana hasil gradien yang dipelajari oleh model, tidak dapat mencapai layer pertama

karena mengalami perkalian berkali-kali sehingga layer pertama tidak menerima

gradien apa-apa, atau secara singkatnya, hal ini menyebabkan suatu CNN tidak dapat

belajar dari error yang telah dikalkulasi. Resnet memiliki berbagai macam jenis

arsitektur, mulai dari 18, 34, 50, 101, sampai 152 layer (He et al., 2015). Pada penelitian

ini digunakan arsitektur Resnet34, yaitu arsitektur resnet yang memiliki 34 layer,

arsitektur ini dipilih karena arsitektur ini memiliki performa yang baik pada kompetisi

ILSVRC (He et al., 2015) dan karena keterbatasan hardware peneliti, maka arsitektur

yang dipilih hanya memiliki 34 layer. Dari dataset keseluruhan, akan digunakan data

training untuk melatih model CNN yang dibuat, dan data validasi untuk mengukur

performa model yang dibuat. Performa dari sistem yang dibangun akan diukur dengan

menggunakan metrik evaluasi akurasi, training loss, validation loss dan melihat matriks

kekeliruan. Metrik ini digunakan juga pada berbagai penelitian yang dilakukan dengan

CNN. (Krizhevsky et al., 2017)

Hal yang diusung oleh (He et al., 2015). pada saat itu adalah dengan

menggunakan sesuatu yang bernama residual block, blok ini adalah blok yang ada pada

tiap lapis arsitektur CNN Resnet dan menjadi fundamental dari arsitektur tersebut,

gambaran dari blok ini dapat dilihat pada Gambar 2.8

Gambar 2.8 Blok Residual

Sumber: (He et al., 2015)

28


Blok ini menambahkan suatu jalan pintas yang berfungsi sebagai fungsi identitas,

yang secara tidak langsung akan melewati proses training untuk satu layer atau lebih,

sehingga membuat sesuatu yang bernama residual block.

Gambar 2.9 Contoh arsitektur keseluruhan dari ResNet

Sumber: (He et al., 2015)

29


Penggunaan residual block dapat terlihat pada Gambar 2.9, dimana arsitektur

VGGnet berada pada paling kiri, arsitektur yang tanpa menggunakan residual block

terdapat pada bagian tengah, dan arsitektur yang menggunakan residual block terdapat

pada bagian paling kanan. Dapat dilihat bahwa dengan melewati beberapa layer,

arsitektur ini dapat mengatasi permasalah vanishing gradient problem karena gradien

dapat sampai kepada layer pertama tanpa harus melewati jumlah perkalian yang sama

dibandingkan dengan arsitektur yang sama tanpa menggunakan residual block.

S(i, j) = (I ∗K)(i, j) = ∑∑I(i + m, j + n)K(m, n) (3)

Pada baris pertama, hasil konvolusi akan membentuk filter sebanyak 64 buah,

operasi konvolusi dapat dilihat pada rumus (3) dimana setiap elemen yang pada matriks

I dan K mengalami perkalian matriks sehingga menghasilkan filter S. Pada tahap ini

model belum memasuki modul residual. Setelah tahap ini selesai, gambar akan

memasuki pooling layer, pooling layer adalah layer yang bertugas untuk mengurangi

resolusi dari suatu gambar yang telah diproses, pooling layer berfungsi untuk

mengurangi noise yang ada dalam gambar tersebut, terdapat dua jenis pooling yang

ada, yaitu max pooling dan average pooling, ilustrasi dari operasi ini dapat dilihat pada

Gambar 2.10, average pooling lebih umum digunakan pada berbagai macam arsitektur

CNN. (Krizhevsky et al., 2017)

30


Lalu tiga modul residual ditumpuk diatas masing-masing layer, dan setiap layer

akan mempelajari 128 filter untuk setiap proses konvolusi. Dimensi spasial dari gambar

akan berkurang, lalu akan ditumpuk kembali 4 buah modul residual, yang dimana

setiap modul akan mempelajari 256 filter. Tahap terakhir, kita akan mengurasi dimensi

spasialnya kembali dan masuk kepada tahap menumpuk 6 buah modul residual, dimana

setiap layer akan mempelajari 512 filter. Hasil dari setiap filter ini akan melewati

average pooling dan masuk ke dalam jaringan fully connected dengan fungsi aktivasi

softmax untuk diketahui hasil klasifikasi.

softmax(x)i = exp(xi)∑n j=1 exp(x j) (4)

Softmax adalah suatu fungsi yang biasanya digunakan untuk menghitung

probabilitas yang umum digunakan untuk melakukan klasifikasi multi kelas, nilai

softmax berada pada range 0 - 1 dan memiliki jumlah 1 jika seluruh elemennya

dijumlahkan (Goodfellow, 2016). Fungsi ini biasanya digunakan di ujung layer dari

fully connected layer yang digunakan pada CNN untuk menghasilkan nilai

probabilitas suatu objek terhadap kelas yang ada. Rumus softmax dapat dilihat pada

Gambar 2.10 Ilustrasi operasi max pooling

dan average pooling pada CNN

31


(4), dimana kita akan menghitung nilai eksponen dari xi terhadap jumlah dari seluruh

nilai eksponen yang ada.

Untuk suatu model dapat memperbaiki dari kesalahan yang dibuat pada saat

training, digunakan fungsi cross entropy loss (5), dimana fungsi ini akan menghitung

kelas aktual ti berbanding dengan si yang akan menghitung jumlah log negatif dari

hasil perkalian nilai prediksi dikali kelas asli lalu dibagi dengan jumlah kelas.

CE = − ∑tilog(si) (5)

2.12 Python

Python merupakan salah satu contoh bahasa tingkat tinggi. Contoh lain bahasa

tingkat tinggi adalah Pascal, C++, Pert, Java, dan sebagainya. Sedangkan bahasa

tingkat rendah merupakan bahasa mesin atau bahasa assembly. Secara sederhana,

sebuah komputer hanya dapat mengeksekusi program yang ditulis dalam bentuk bahasa

mesin. Oleh karena itu, jika suatu program ditulis dalam bentuk bahasa tingkat tinggi,

maka program tersebut harus diproses dulu sebelum bisa dijalankan dalam komputer.

Hal ini merupakan salah satu kekurangan bahasa tingkat tinggi yang memerlukan

waktu untuk memproses suatu program sebelum program tersebut dijalankan. Akan

tetapi, bahasa tingkat tinggi mempunyai banyak sekali keuntungan. Bahasa tingkat

tinggi mudah dipelajari, mudah ditulis, mudah dibaca, dan tentu saja mudah dicari

kesalahannya. Bahasa tingkat tinggi juga mudah diubah portabel untuk disesuaikan

dengan mesin yang menjalankannya. Hal ini berbeda dengan bahasa mesin yang hanya

32


dapat digunakan untuk mesin tersebut. Dengan berbagai kelebihan ini, maka banyak

aplikasi ditulis menggunakan bahasa tingkat tinggi. Proses mengubah dad bentuk

bahasa tingkat tinggi ke tingkat rendah datam bahasa pemrograman ada dua tipe, yakni

interpreter dan compiler. (Utami, 2004)

2.13 Keras

Keras merupakan framework yang dibuat untuk mempermudah pembelajaran

terhadap komputer. Keras juga merupakan sebuah perangkat lunak yang berjalan diatas

platform Python untuk mendukung proses komputasi cerdas diantaranya adalah

jaringan Konvolusi. Keras diciptakan oleh Franchois Chollet. (Ilmiah et al., 2018)

Keras adalah API neural network berlevel tinggi yang ditulis dengan bahasa

pemrograman Python. Keras dapat berjalan diatas Tensorflow, CNTK, atau Theano

sebagai backend. Keras dapat digunakan dalam penelitian deep learning yang

memerlukan pembuatan prototipe yang mudah dan cepat dan user friendly. Selain itu

Keras juga mendukung komputasi pada Convolutional Neural Network dan Reccurent

Neural Network ataupun kombinasi dari keduanya. Keras dapat berjalan dengan baik

pada CPU maupun GPU. Keras kompatibel dengan Python versi 2.7 sampai versi 3.8

(Keras.io.).

2.14 Tensorflow

TensorFlow adalah perpustaka perangkat lunak, yang dikembangkan oleh Tim

Google Brain dalam organisasi penelitian Mesin Cerdas Google, untuk tujuan

melakukan pembelajaran mesin dan penelitian jaringan syaraf dalam. TensorFlow

kemudian menggabungkan aljabar komputasi teknik pengoptimalan kompilasi,

mempermudah penghitungan banyak ekspresi matematis dimana masalahnya adalah

waktu yang dibutuhkan untuk melakukan perhitungan.

Fitur utamanya meliputi:

33


1. Mendefinisikan, mengoptimalkan, dan menghitung secara efisien ekspresi

matematis yang melibatkan array multi dimensi (tensors).

2. Pemrograman pendukung jaringan syaraf dalam dan teknik pembelajaran

mesin.

3. Penggunaan GPU yang transparan, mengotomatisasi manajemen dan

optimalisasi memori yang sama dan data yang digunakan. Tensorflow bisa menulis

kode yang sama dan menjalankannya baik di CPU atau GPU. Lebih khusus lagi,

TensorFlow akan mengetahui bagian perhitungan mana yang harus dipindahkan ke

GPU.

4. Skalabilitas komputasi yang tinggi di seluruh mesin dan kumpulan data yang

besar.

2.15 Open CV

OpenCV adalah sebuah library (perpustakaan) yang digunakan untuk mengolah

gambar dan video hingga kita mampu meng-ekstrak informasi didalamnya. OpenCV

dapat berjalan di berbagai bahasa pemograman, seperti C, C++, Java, Python, dan juga

support diberbagai platform seperti Windows, Linux, Mac OS, iOS dan Android. Salah

satu contoh sederhana dalam penggunaan OpenCV adalah bagaimana kita dengan

mudah bisa mendeteksi wajah dalam sebuah gambar.

2.16 OSEMN Framework

OSEMN Framework adalah model penelitan yang terstandarisasi dan diterima

secara luas dalam bidang data science. OSEMN dapat memecahkan masalah data

science dalam skala besar. (Byrne et al., 2017)

OSEMN memiliki langkah-langkah yang mudah dipahami dan konsisten secara

logis dari alur kerja pemrosesan data, diperkaya dengan instruksi tambahan, catatan

dan dokumen sampel, memastikan kinerja kegiatan dan pencapaian hasil yang sama

dari aktifitas dan pengguna yang berbeda. (Dineva & Atanasova, 2018)

34


Menurut (Kumari et al., 2020)terdapat 5 tahapan pada OSEMN yang juga sesuai

dengan namanya:

1. O(Obtain)/ Pengumpulan data

Mengumpulkan data dari sumber yang relevan. Pada tahap ini kita harus

mengetahui data apa saja yang diperlukan, darimana sumbernya, bagaimana

mengumpulkannya, dan bagaimana menyiapkan datanya agar memenuhi

hasil yang diinginkan.

2. S(Scrub)/ Data Preparation

Pada tahap ini, data yang sudah dikumpulkan akan di bersihkan dan di filter

menjadi format yang dapat dimengerti mesin. Biasanya tahap ini meliputi:

- Handling missing data

- Correcting invalid values

- Removing duplicates

- Structuring the data to be fed in algorithm

- Feature engineering

3. E(Explore)/ Ekplorasi data

Pada tahap ini, data akan di eksplorasi dan menentukan karateristik dari data

tersebut. Kemudian data akan di ekstrak atribut dan variabel ujinya yang

kemudian akan dimasukkan ke tahap pemodelan.

4. M(Model)/Tahap Pemodelan

Pada tahap ini, data yang sudah di ekstrak akan masuk ke tahap pemodelan.

Pemodelan dibuat untuk menghasilkan parameter dan fitur data yang akan

digunakan pada tahap prediksi sebagai output.

5. N(iNterpreting)/Menginterpretasikan hasil

Tahap ini adalah tahap mengintrepretasikan hasil prediksi dan memberikan

hasil sedemikian rupa berupa presentasi data.

35


2.17 Studi Literatur Sejenis

Studi literatur di ambil dari beberapa skripsi dan jurnal yang berhubungan dengan

penelitian. Setiap literatur akan dibahas satu persatu secara singkat tentang judul, tools

dan hasil dari setiap penelitian.

• Pada penelitian yang berjudul “Comparison of Convolutional Neural

Network Architectures for Classification of Tomato Plant Diseases”

tahun 2020, yang ditulis oleh Valeria Maeda-Gutierrez dkk bertujuan

untuk membandingkan arsitektur CNN dalam klasifikasi Plant Diseases.

Penelitian ini membandingkan dan menguji arsitektur AlexNet,

GoogleNet, Inception V3, dan ResNet. Dan menghasilkan tingkat akurasi

seperti gambar dibawah:

Gambar 2.11 Hasil Penelitian Literatur 1

Penelitian ini menyimpulkan bahwa penggunaan arsitektur ResNet

memiliki tingkat akurasi yang sangat bagus dalam klasifikasi Tomato

Plant Diseases.

• Pada penelitian yang berjudul “Klasifikasi Citra Multi-Kelas

Menggunakan Convolutional Neural Network” tahun 2019, yang ditulis

oleh Kamal Hasan Mahmud, Adiwijaya dan Said Alfaraby bertujuan

untuk mengetahui strategi pembelajaran CNN yang memiliki performa

terbaik dengan berbagai skenario dalam klasifikasi citra dengan 100

kelas. Penelitian ini menyimpulkan bahwa arsitektur ResNet memiliki

nilai akurasi terbaik dari yang lainnya dengan nilai akurasi 75,82%.

36


• Pada penelitian yang berjudul “Malaria Parasite Detection from

Peripheral Blood Smear Images Using Deep Belief Networks” tahun

2017, yang ditulis oleh Dhanya Bibin, Madhu S. Nair dan P. Punitha

bertujuan untuk mengidentifikasi parasit malaria dalam sel darah manusia

menggunakan Deep Belief Networks (DBN). Penelitian ini menggunakan

model DBN dengan arsitektur 484-600-600-600-2. Penelitian ini

menghasilkan nilai akurasi 96,35%.

• Pada penelitian yang berjudul “Analysing TB Severity Levels With An

Enhanced Deep Residual Learning – Depth-Resnet” tahun 2018, yang

ditulis oleh Xiaohong Gao, Carl James-Reynolds, Ed Currie bertujuan

untuk menganalisis TB Severity Levels menggunakan arsitektur ResNet.

Penelitian ini menggunakan dataset dengan 5 kategori. Data di pre-proses

menjadi 128x128 piksel. Penelitian ini menghasilkan nilai akurasi seperti

gambar dibawah:

Gambar 2.12 Hasil Penelitian Literatur 4

• Pada penelitian yang berjudul “Data Science in biomedicine” tahun 2019,

yang ditulis oleh Yovaninna Alarcon-Soto dkk bertujuan untuk

menunjukkan tugas Data Science dalam pengolahan data Biomedicine.

Pada penelitian ini menunjukkan bahwa Data Science dapat digunakan

dalam pengolahan data biologikal dan penelitian medis lainnya.

Tabel 2.2 Perbandingan Penelitian sejenis

No. Penulis Judul Data

Science

CNN Transfer

Learning

Malaria

37


1 (Maeda-

Gutiérrez

et al.,

2020)

Comparison of

Convolutional

Neural Network

Architectures for

Classification of

Tomato

Plant Diseases

2 (Kamal

Hasan et

al., 2019)

Klasifikasi Citra

Multi-Kelas

Menggunakan

Convolutional

Neural Network

3 (Bibin et

al., 2017)

Malaria Parasite

Detection from

Peripheral Blood

Smear Images

Using Deep Belief

Networks

4 (Gao et al.,

2018)

Analysing TB

Severity Levels

With An Enhanced

Deep Residual

Learning

– Depth-Resnet

5 (Alarcón-

Soto et al.,

2019)

Data Science in

biomedicine

38


6 (Rais

Amin,

2020)

Penerapan Metode

Convolutional

Neural Network

Pada Pendeteksi

Parasit Malaria

Dalam Sel Darah

Manusia

39

BAB III

METODOLOGI PENELITIAN

Pada proses perancangan sistem, dibuatlah kerangka kerja dalam bentuk skema.

Metodologi penelitian dijadikan panduan untuk menentukan tahap-tahap yang harus

dilakukan. Tahap-tahap tersebut meliputi:

3.1 Metode Pengumpulan Data

3.1.1 Studi pustaka

Salah satu metode pengumpulan data yang penulis lakukan pada pembuatan

sistem ini adalah studi pustaka. Studi pustaka dilakukan dengan cara membaca,

mengutip, mengolah informasi yang berkaitan dengan pembuatan sistem, serta

membuat catatan yang bersumber pada bahan-bahan pustaka yang mendukung dan

berkaitan dengan pembuatan sistem ini. Sumber-sumber yang penulis kumpulkan

dan pelajari berupa data dan informasi definisi yang terdapat pada beberapa jurnal

dan buku yang terkait dengan penelitian dan pembuatan sistem ini serta dari

beberapa situs online yang terpercaya. Sumber-sumber tersebut diperlukan penulis

untuk membantu penyelesaian pada bab pendahuluan, landasan teori dan metode

penelitian.

3.2 OSEMN Framework

Dalam penelitian ini, penulis menggunakan OSEMN Framework dalam

pegolahan Data Science. Berikut ini merupakan langkah-langkah pada OSEMN

Framework:

3.2.1 Obtain(Pengumpulan data)

Pada tahap ini, penulis melakukan pengumpulan data masukan yang dibutuhkan

untuk membuat model sistem ini. Data yang dikumpulkan berupa gambar parasitized

dan Uninfected berdasarkan kelas yang penulis batasi pada penelitian ini. Data tersebut

40


penulis kumpulkan dari sumber internet. Data berupa kumpulan gambar sel yang

terinfksi parasit malaria dan yang tidak terinfeksi.

3.2.2 Scrub(Data Preparation)

Setelah seluruh data gambar berhasil dikumpulkan, data gambar tersebut

nantinya akan dibagi menjadi data latih, data uji dan data validasi pada proses

pembuatan model untuk mencapai nilai akurasi yang diinginkan, setelah data dilatih

dan diuji, dan telah mendapatkan nilai akurasi yang sesuai kemudian dibuatkan model

dengan metode Convolutional Recurrent Neural.

3.2.3 Explore(Eksplorasi data)

Data yang sudah ada kemudian masuk ke tahap eksplorasi data. Data-data yang

ada akan diubah ukurannya menjadi lebih kecil dari dataset aslinya. Data yang telah

diubah ukurannya kemudian melalui proses segmentasi citra dimana data diproses

untuk menentukan deteksi tepi, yang bertujuan untuk mengenali objek dan fitur yang

ada dalam data.

3.2.4 Modelling(Perancangan Model)

Pada tahap ini penulis melakukan pembuatan model dari dataset yang ada untuk

mengenali gambar dan proses klasifikasi menggunakan algoritma atau metode

Convolutional Neural Network dengan menggunakan arsitektur ResNet agar sistem

dapat mendeteksi parasit malaria.

3.2.5 iNterpreting(Mengintrepretasikan hasil)

Pada tahap ini akan meninterpretasikan hasil pemodelan yang telah dilakukan

yaitu hasil akurasi pengujian model dan visualisasi hasil prediksi pendeteksi parasit

malaria.

41


3.3 Kerangka Berpikir

Mulai

Studi Pustaka

Perumusan masalah

Scrub Obtain Explore Modelling iNterpreting

- Menentukan

Konsep Penelitian

- Mengumpulkan

data

Split dataset &

menyamakan

semua ukuran

gambar

Membuat

model

sistem

pendeteksi

parasit

malaria

-Membuat

kategori data

-Ekstrak fitur

data dan

augmentasi

- Menampilkan hasil

uji validasi dan

akurasi

- Menampilkan hasil

prediksi sistem

OSEMN Framework

Kesimpulan

Selesai

Gambar 3.1 Kerangka Berpikir Penelitian

42

BAB IV

IMPLEMENTASI

Pada bab ini akan dilakukan implementasi dan pembahasan dalam perancangan

sistem secara bertahap sesuai dengan metode penelitian yang digunakan selama

perancangan pembuatan sistem, yaitu menggunakan OSEMN Framework.

4.1 Obtain(Pengumpulan data)

Pengumpulan data dan informasi yang penulis lakukan yaitu dengan

menggunakan studi pustaka dan mendapatkan hasil berupa dataset yang diambil dari

National Library of Medicine yang dikembangkan oleh Stefan Jaeger pada tahun 2018

ftp://lhcftp.nlm.nih.gov/Open-Access-Datasets/Malaria/cell_images.zip yang dapat

diakses bebas untuk kepentingan pengembangan aplikasi dan pembelajaran. Dataset

ini nantinya akan digunakan sebagai data input sistem prediksi parasit malaria.

Dataset terdiri dari 27.558 gambar sel yang terbagi kedalam dua kategori yaitu

parasitized dan uninfected. Setiap kategori terdiri dari 13.779 gambar sel.

4.2 Scrub(Data Preparation)

Setelah data berhasil dikumpulkan, kemudian data tersebut dilanjutkan ke tahap

data preparation.

ftp://lhcftp.nlm.nih.gov/Open-Access-Datasets/Malaria/cell_images.zip

43


Gambar 4.1 tree susunan folder project

Setelah kita membuat susunan folder project, selanjutnya kita akan membuat

konfigurasi untuk membaca path folder dataset dengan ratio data training 80%,

validation data 10% .

Gambar 4.2 Konfigurasi pembagian dataset

Pada penentuan rasio pembagian dataset ini, untuk rasio pembagian data training

dan data testing menggunakan metode Simple Hold-Out Validation (Chollet, 2018),

metode ini menjadi acuan standar dalam pembagian data training dan testing dengan

44


rasio 80:20 dan untuk rasio pembagian data training dan data validation berdasarkan

penelitian (Akromunnisa et al., 2019) yang membandingkan antara nilai split 6:4, 7:3,

8:2 dan 9:1. Dari penelitian tersebut disimpulkan bahwa rasio 9:1 menghasilkan nilai

akurasi yang lebih besar dari rasio yang lainnya.

Kemudian data dibagi menjadi 3 folder training, testing dan validation dan semua

gambar diberikan label sesuai dengan folder yang telah dibuat.

45


Gambar 4.3 Source code pembagian dataset

4.3 Explore(Eksplorasi data)

Pada tahap ini, semua data yang telah dikumpulkan dan dibagi menjadi folder

training, testing dan validation di samakan seluruh ukuran yaitu 64x64 piksel dan

kategori warnanya yaitu “rgb”(“red”,”green”,”blue”) kemudian diberikan label

kategori “categorial” yang dikarenakan setiap folder berisikan dua kelas kategori yaitu

“Parasitized” dan “Uninfected”. Kemudian untuk data pada folder training akan di

augmentasikan menggunakan modul Keras ImageDataGenerator. Data training di

augmentasi dengan mengubah skala gambar dengan skala 1/255, dan gambar di rotasi

46


dengan range=20, dan zoom range=0.05, width shift range=0.05, height shift

range=0.05, shear range=0.05 dan data gambar di flip secara horizontal. Kemudian

data pada folder validation akan di augmentasikan juga menggunakan modul Keras

ImageDataGenerator dengan mengubah skala gambar menjadi 1/255. Data pada

validation ini tidak dirotasi dan di flip dikarenakan nantinya akan digunakan sebagai

uji validasi model data training yang sudah diubah dengan data validation yang skala

gambarnya sama. Data pada folder testing tidak di augmentasikan dikarenakan

nantinya akan digunakan sebagai data uji tahap prediksi model terhadap data yang asli.

Berikut adalah source code pada tahap eksplorasi data ini:

Gambar 4.4 Source Code Data augmentation

4.4 Modelling(Perancangan Model)

Kemudian dilakukan pembuatan pemodelan arsitektur CNN, dimana penulis

disini menggunakan arsitektur ResNet.

47


48


Gambar 4.5 Arsitektur model ResNet

Setelah pembuatan arsitektur model resnet, maka selanjutnya adalah melatih

model yang nantinya akan digunakan pada tahap prediksi yang disimpan dalam

malaria_model.h5.

49


Gambar 4.6 Source code pelatihan model

Dalam proses ini model akan dilatih dengan mengoptimalkan multinomial

logistic regression menggunakan Stochastic Gradient Descent (SGD) (Lecun et al.,

2015) dan nilai momentum Nesterov (Botev et al., 2017). Model yang disesuaikan

dioptimalkan untuk hiper-parameter dengan metode pencarian grid search (Bergstra &

Bengio, 2012).

Pada proses pelatihan model ini akan digunakan arsitektur model ResNet yang

telah dibuat yang diberi nilai input_shape= 64x64 pixel, 3 channel gambar RGB

(“red”,”green”,”blue”), nilai kelas 2 dimana pada dataset memiliki 2 kelas,

kernel_size=(3 , 4 , 6) dan dengan nilai regression=0.0005. Penentuan nilai dari epoch

untuk pelatihan model adalah 50 yang dimana suatu perulangan dari proses pelatihan

pada satu kali sesi lewatan sebanyak 50 kali guna mendapatkan error terkecil dan

menghasilkan kinerja yang baik untuk model yang dibuat. Sedangkan untuk kategori

loss yang digunakan adalah 'binary_crossentropy', dan untuk optimizer menggunakan

'SGD' dengan nilai learning rate = 1e-1 dan nilai momentum= 0.9.

50


4.5 iNterpreting(Mengintrepretasikan hasil)

Tahap ini akan menginterpretasikan hasil dari pengujian dari model yang telah

dibuat. Hasil yang akan diinterpretasikan berupa uji akurasi prediksi model terhadap

data testing dan visualisasi sistem prediksi yang dibuat.

Berikut adalah source code yang dibuat untuk menguji akurasi:

Gambar 4.7 Source code pengujian akurasi prediksi

Pada pengujian akurasi prediksi ini model yang telah tersimpan dalam

malaria_model.h5 akan di evaluasi dengan cara pembuatan prediksi pada data yang

terdapat pada folder testing dan selanjutnya dapat menentukan label dengan

probabilitas yang terbesar untuk setiap gambar yang ada. Dan hasil prediksi model ini

akan disimpan ke dalam prediction_model.h5.

Hasil model prediksi yang tersimpan dalam prediction_model.h5 selanjutnya

akan digunakan dalam visualisasi hasil prediksi sistem terhadap gambar sel yang ada

pada data testing. Berikut adalah source code untuk menampilkan hasil visualisasi

prediksi gambar sel.

51


Gambar 4.8 Source code untuk menampilkan visualisasi hasil prediksi gambar sel

Pada proses menampilkan visualisasi hasil prediksi ini, data input berupa data

gambar dari folder testing yang berisikan 5.512 gambar yang tergolong kedalam 2 kelas

dengan masing-masing kelas terdapat 2.786 gambar Uninfected dan 2.726 gambar

Parasitized. Data input dibaca menggunakan modul OpenCV cv2.imread, data diubah

kedalam bentuk RGB dan di resize menjadi 64x64 piksel dengan tipe data “float”

dengan skala gambar 1/255. Kemudian data diubah kedalam bentuk array guna

memudahkan proses prediksi kedalam bentuk matriks. Data yang telah diubah tersebut

52


akan diberi label “Parasitized” jika nilai prediksi = 0 dan label “Uninfected” jika nilai

prediksi = 1.

53

BAB V

HASIL DAN PEMBAHASAN

5.1 Pembagian training, test dan validation dataset

Setelah dataset telah terkumpul dan telah melalui tahap preprocessing,

selanjutnya dataset dibagi menjadi 3 folder training, testing dan validation. Yang

nantinya akan digunakan dalam proses modeling, pengujian dan prediksi.

Gambar 5.1 Dataset Malaria

Pembagian dataset menggunakan split data dengan persentase 80% untuk data

training dan 20 % untuk data testing guna proses modeling dan pegujian sistem dan

selajuntnya data validation berupa 10% dari data training guna proses prediksi.

Semua data pada folder training, testing dan validation dilabelkan dengan dua

kategori yaitu “0” untuk parasitized dan “1” untuk uninfected.

Berikut adalah sebaran data yang terdapat pada folder training, validation dan

testing:

54


Tabel 5.1 Sebaran data hasil pembagian dataset

No. Nama folder Kategori Jumlah data

Parasitized Uninfected

1. cell_images(dataset) 13779 13779 27558

2. training 9955 9887 19842

3. validation 1098 1106 2204

4. testing 2786 2726 5512

5.2 Arsitektur Jaringan

Setelah melalui tahap palabelan dan pengambilan data training dari dataset,

selanjutnya dataset akan dilatih menggunakan algoritma Convolutional Neural

Network (CNN). Dalam algoritma Convolutional Neural Network (CNN)

pembentukan arsitektur jaringan dapat mempengaruhi hasil dari akurasi model.

Pada proses pemodelan sistem penulis menggunakan arsitektur ResNet dan

dimodifikasi sesuai kebutuhan sistem.

Penelitian ini menggunakan input gambar dengan ukuran 64x64x3, tujuannya

adalah untuk membandingkan nilai akurasi berdasarkan ukuran gambarnya. Arsitektur

jaringan pada penelitian ini dijelaskan seperti penjelasan dibawah ini :

1. Proses Konvolusi pertama digunakan kernel berukuran 3x3 dan jumlah

filter sebanyak 64 filter , proses konvolusi ini adalah proses kombinasi

antara dua buah matriks yang berbeda untuk menghasilkan suatu nilai

matriks yang baru. Setelah proses konvolusi, maka ditambahkan sebuah

aktivasi fungsi yaitu RELU (Retrified Linear Unit). Fungsi aktivasi ini

bertujuan untuk mengubah nilai negative menjadi nol (menghilangkan

nilai negative dalam sebuah matriks hasil konvolusi). Hasil konvolusi ini

memiliki ukuran 64 x 64.

55


2. Proses pooling pertama. Penelitian ini menggunakan maxpooling untuk

mendapatkan nilai matriks yang baru hasil dari proses pooling.

Berdasarkan hasil pooling menghasilkan matriks baru berukuran 32x32

dari input hasil konvolusi pertama yang berukuran 64x64. Proses ini

menggunakan kernel pooling 3x3. Cara kerja maxpooling adalah

mengambil nilai paling maksimum berdasarkan pergeseran kernelnya

sebnayak nilai stridenya yaitu 2.

3. Proses Kovolusi kedua yaitu meneruskan hasil dari proses pooling

pertama yakni dengan input matriks gambar sebesar 32x32 pada 3 jumlah

filter yaitu 32, 32 dan 128 filter dan dengan ukuran kernel 3x3. Proses

konvolsi kedua ini sama-sama menggunakan fungsi aktivasi RELU.

Proses ini menghasilkan gambar berukuran 32x32.

4. Proses Kovolusi ketiga yaitu meneruskan hasil dari proses konvolusi

kedua yakni dengan input matriks gambar sebesar 32x32 pada 3 jumlah


konvolsi ketiga ini sama-sama menggunakan fungsi aktivasi RELU.


5. Proses Kovolusi keempat yaitu meneruskan hasil dari proses konvolusi

ketiga yakni dengan input matriks gambar sebesar 16x16 pada 3 jumlah


konvolusi keempat ini sama-sama menggunakan fungsi aktivasi RELU.


6. Proses selanjutnya masuk ke proses pooling yang kedua, proses ini

hampir sama dengan proses pooling yang pertama, namun pada proses ini

menggunakan average pooling dengan ukuran kernel 8x8. Proses ini

menghasilkan nilai output akhir dari matriksnya yaitu gambar berukuran

1x1.

56


7. Selanjutnya Flatten dan fully connected. Pada tahap ini digunakan hanya

satu hidden layer pada jaringan MLP (Multi Layer Perceptron). Flatten

disini mengubah output pooling layer menjadi sebuah vector.

8. Proses terakhir adalah menggunakan aktivasi fungsi Softmax. Fungsi ini

secara spesifiknya biasa digunakan pada metode klasifikasi multinomial

logistic regression dan multiclass linear discriminant analisys.

Berdasarkan uraian penjelasan dari arsitektur jaringan diatas, arsitektur tersebut

digunakan untuk proses training. Sehingga dari proses training didapatkan model dari

arsitektur tersebut. Berikut model yang terbentuk :

57


58


59


60


61


62


63


64


Gambar 5.2 Model yang terbentuk dari hasil training

65


Gambar 5.2 merupakan model yang terbentuk dari hasil training. Total parameter

yang terbentuk dari model sebanyak 2.164.174 neuron, dan parameter yang akan di

training sebanyak 2.150.472 neuron.

5.2.1 Proses Convolution Layer

Selanjutnya akan dibahas proses konvolusi yang terjadi berdasarkan arsitektur

jaringan yang telah dibahas diatas.

Konvolusi merupakan proses menggambungkan dua deret angka pada suatu

gambar sehingga menghasilkan deret angka yang baru, dengan kata lain gambar

tersebut dimanipulasi dengan menggunakan external mask / subwindows untuk

menghasilkan citra yang baru, angka konvolusi pada citra tersebut berbentuk matriks

array. Pada pemodelan ini digunakan input gambar dengan ukuran pixel 64x64x3, yang

menjelaskan ukuran tinggi dan lebar pixel gambar sebesar 64 pixel dan gambar input

tersebut memiliki 3 channel yaitu red, green, dan blue atau yang biasa disebut dengan

RGB.

Setiap channel piksel memiliki nilai matriks yang berbeda-beda. Input akan di

konvolusi dengan nilai filter yang sudah ditentukan. Filter merupakan blok lain atau

kubus dengan tinggi dan lebar yang lebih kecil namun kedalaman yang sama yang

tersapu di atas gambar dasar atau gambar asli. Filter digunakan untuk menentukan pola

apa yang akan dideteksi yang selanjutnya dikonvolusi atau dikalikan dengan nilai pada

matriks input, nilai pada masingmasing kolom dan baris pada matriks sangat bergantung

pada jenis pola yang akan dideteksi. Jumlah filter pada konvo ini sebanyak 64 dengan

ukuran kernel (3x3), ini artinya gambar yang dihasilkan dari hasil konvolusi akan

sebanyak 64 fitur map.

Berdasarkan arsitektur jaringan diatas digunakan aktivasi ReLU (Rectified

Linear Unit) setelah proses konvolusi. Fungsi dari aktivasi ini adalah melakukan

“treshold” dari 0 hingga infinity. Nilai yang ada pada hasil konvolusi yang bernilai

negatif akan diubah dengan aktivasi ini menjadi nol dan yang lainnya sampai infinity.

66


5.2.2 Proses Pooling

Pooling atau penggabungkan merupakan proses dari CNN dimana matriks input

disederhanakan menjadi matriks yang baru. Pada penelitian ini digunakan metode max

pooling dan average pooling pada proses poolingnya dimana diambil nilai terbesar dari

matriks input dan menghasilkan matriks baru sebagai outputnya.

5.2.3 Proses Fully Connected

Proses terakhir adalah fully-connected. Hasil dari proses terakhir dari model yang

ada pada feature extraction layer masih berbentuk multidimensional array, sehingga

harus dilakukan “flatten” atau reshape feature map menjadi sebuah vector agar bisa

digunakan sebagai input dari fully-connected layer. Setelah itu diberi fungsi dense.

Dense adalah fungsi untuk menambahkan layer pada fully connected.

Pada arsitektur jaringan ResNet ini menggunakan dense sebanyak 512 unit. Unit

tersebut artinya jumlah node yang harus ada di hidden layer, nilainya antara jumlah

input node dan output node. Fungsi dari fully connected layer ini adalah untuk

melakukan transformasi pada dimensi data agar data dapat diklasifikasikan secara

linear.

Kemudian di inialisasi layer outputnya, yang berupa 2 node, karena dalam

klasifikasi ini terdapat 2 kelas.

5.3 Akurasi

Setelah melewati tahap pemodelan, kemudian model tersebut diuji nilai akurasi

dan lossnya dengan menggunakan SGD optimizer dengan nilai learning rate = 1e-1

dan nilai momentum = 0.9.

67


Gambar 5.3 Uji Akurasi Model

Dengan menggunakan iterasi epoch sebanyak 50 kali selanjutnya didapatkan

hasil akurasi validasi sebagai berikut:

Epoch 50/50 620/620 [==============================] - 32s 522ms/step - loss: 0.1298 - accuracy: 0.973

- val_loss: 0.1392 - val_accuracy: 0.9623

Berdasarkan data diatas menunjukan hasil akurasi model, dapat diketahui besar

loss 12% dengan akurasi yang tinggi sebesar 97,3%. Sedangkan untuk data validasi,

nilai loss yaitu sebesar 13% dan akurasi sebesar 96,23%. Yang berarti menunjukkan

akurasi model sebesar 96,23%. Dengan hasil tersebut dapat dibuktikan bahwa

pemodelan berhasil dan sistem dapat dengan sangat baik membedakan data gambar

yang Parasitized dan Uninfected.

Berikut ini akan dipaparkan gambar grafik akurasi dan loss dari model training

dan validasi:

68


Gambar 5.4 Grafik model loss dan accuracy

Dari gambar 5.4 didapatkan hasil bahwa nilai akurasi training dan validasi

cenderung stabil dari setiap iterasi epochnya. Sedangkan untuk nilai loss training dan

validasi cenderung menurun dari setiap epochnya, hal ini menunjukkan hasil positif

dimana pada akhir pelatihan pemodelan berhasil mendapatkan akurasi yang sangat

bagus degan nilai loss yang sedikit.

5.4 Prediksi

Setelah pemodelan telah selesai dan tahap finalisasi, kemudian model tersebut

dihubungkan pada program prediksi agar dapat dijalankan, digunakan, dan diuji

dengan data pada folder testing yang berisikan 5.512 data gambar yang terbagi kedalam

2 folder parasitized yang berisikan 2.726 data gambar dan uninfected yang berisikan

2.786 data gambar . Dalam tahap pengujian model terhadap data pada gambar yang

69


terdapat pada folder testing menghasilkan nilai akurasi yang sangat bagus yaitu 97%,

dimana hasil ini sangat bagus yang membuktikan bahwa sistem dapat megenali dan

membedakan gambar yang Parasitized dan Uininfected.

Gambar 5.5 Hasil uji akurasi pada data testing

Dari data pada Gambar 5.5 didapatkan hasil bahwa dalam pengenalan dalam

kelas Parasitized tingkat akurasi pegenalan adalah 97 % dari data gambar sebanyak

2.726, dan tingkat akurasi yang sama 97 % pada pengenalan kelas Uninfected. Dan

rata-rata hasil dari kedua kelas tersebut adalah 97%. Data ini membuktikan bahwa

dalam pengenalan kelas Parasitized data yang berhasil di prediksi dengan benar adalah

sebanyak 2.644 data gambar, dan yang gagal adalah 82 data gambar. Sedangkan pada

kelas Uninfected data yang berhasil diprediksi dengan benar adalah sebanyak 2.702

data gambar dan yang gagal adalah sebanyak 84 data gambar.

Dari hasil tingkat akurasi pada penelitian ini, dapat dibandingkan dengan

beberapa literatur sejenis yang penelitiannya akan dijabarkan satu persatu berikut ini:

• Pada penelitian yang berjudul “Malaria Parasite Detection From

Peripheral Blood Smear Images Using Deep Belief Networks” pada

tahun 2017 yang ditulis oleh Dhanya Bibin, Madhu S. Nair dan P.

Punitha. Penelitian ini bertujuan untuk mendeteksi parasit malaria dalam

sel darah manusia menggunakan Deep Belief Network (DBN). Pada

penelitian ini model DBN bertujuan untuk mengklasifikasikan 4.100

gambar sel darah manusia ke dalam kelas parasit dan non-parasit.

70


Arsitektur DBN pada penelitian ini menggunakan 484 nodes visible layer

dan memiliki 2 kelas output layer dengan 4 lapisan hidden layer yang

mengandung 600 nodes pada setiap layernya. Penelitian ini menghasilkan

nilai akurasi sebesar 96,3% dalam dalam proses deteksi sel darah yang

mengandung parasit malaria dan yang tidak.

• Pada penelitian yang berjudul “Machine learning approach for

automated screening of malaria parasite using light microscopic

images” pada tahun 2013 yang ditulis oleh Dev Kumar Das, Madhumala

Ghosh, Malika Pal, Asok K. Maiti dan Chandan Chakraborty. Tujuan dari

penelitian ini adalah untuk membahas pengembangan karakterisasi dan

klasifikasi parasit malaria berbantuan komputer dengan menggunakan

pendekatan machine learning berdasarkan gambar mikroskopis cahaya

dari sel darah manusia. Penelitian ini menggunaka metode pembelajaran

Bayessian dan Support Machine Learning (SVM) dalam

pengklasifikasian parasit malaria. Hasil penelitian ini menunjukkan

bahwa metode Bayessian memiliki hasil akurasi tertinggi yaitu 84%

sementara SVM memiliki hasil akurasi 83,5%.

• Pada penelitian yang berjudul “Klasifikasi Jenis dan Fase Parasit

Malaria Plasmodium Falciparum dan Plasmodium Vivax Dalam Sel

Darah Merah Menggunakan Support Vector Machine. Penelitian ini

menggunaka metode pembelajaran Support Machine Learning (SVM)

dalam pengklasifikasian parasit malaria. Dalam pengklasifikasian kelas

parasit malaria, penelitian ini menghasilkan nilai akurasi 81,35%.

• Pada penelitian yang berjudul “Automated image processing method for

the diagnosis and classification of malaria on thin blood smears” pada

tahun 2006 yang ditulis oleh Nicholas E. Ross, Charles J. Pritchard,

David M. Robin dan Adriano G. Duse. Penelitian ini bertujuan untuk

menerapkan algoritma imge processing dalam pengidentifikasian parasit

71


malaria dalam sel darah manusia. Dalam pengklasifikasianya penelitian

ini menggunakan metode backpropogation feedforward neural network.

Penelitian ini mendapatkan hasil akurasi 73% dalam klasifikasi parasit

malaria.

Tabel 5.2 Perbandingan nilai Akurasi dengan literatur sejenis

No. Penelitian Akurasi

1. (Rais Amin, 2020) 97%

2. (Bibin et al., 2017) 96,3%

3. (Das et al., 2013) 84%

4. (Permata et al., 2012) 81,35%

5. (Ross et al., 2006) 73%

Kemudian data gambar hasil prediksi akan di visualisasikan berupa data sampel

gambar yang sudah diprediksi dan diberikan label pengenalan klasifikasi yaitu

Parasitized dan Uininfected.

72


Berikut adalah hasil visualisasi dari sampel proses prediksi sistem:

Gambar 5.6 Hasil prediksi sistem

73

BAB VI

PENUTUP

6.1 Kesimpulan

Berdasarkan pembahasan yang sudah diuraikan, maka dapat ditarik kesimpulan

sebagai berikut:

1. Model CNN yang menggunakan arsitektur jaringan ResNet pada penelitian

ini menggunakan input shape berukuran 64x64x3, ukuran filter 3x3, Jumlah

Epoch sebanyak 50. Data yang digunakan untuk proses training model

sebanyak 19.842 pada folder training dan 2.204 data pada folder validation.

Menghasilkan tingkat akurasi training dan validation dalam melakukan

deteksi parasit malaria sebesar 97,3% untuk training accuracy dan 96,23 %

untuk validation accuracy. Dengan hasil tersebut dapat dibuktikan bahwa

pemodelan berhasil dan sistem dapat dengan sangat baik membedakan data

gambar yang Parasitized dan Uninfected.

2. Penelitian ini menggunakan data testing sebanyak 5.512 gambar dimana per

kategori terdapat 2.726 gambar pada kelas Parasitized dan 2.786 gambar

pada kelas Uninfected untuk diujikan kedalam model yang telah dibuat.

Hasil testing menghasilkan tingkat akurasi baru dalam melakukan pendeteksi

parasit malaria sebesar 97 %. Dengan hasil tersebut dapat dibuktikan bahwa

pemodelan berhasil dan sistem menghasilkan tingkat akurasi yang sangat

baik dalam pengkategorian dan dapat dengan sangat baik membedakan dan

memberikan label yang benar pada data gambar yang Parasitized dan

Uninfected.

6.2 Saran

Adapun saran yang diberikan pada penulisan ini sebagai berikut:

1. Penelitian selanjutnya diharapkan dapat meningkatkan nilai akurasi pada

hasil training model.

74


2. Diharapkan penelitian ini dapat dikembangkan dan diaplikasikan pada

pengembangan Medical Image Analysis yang lainnya.

3. Membandingkan model arsitektur jaringan CNN lainnya untuk mengetahui

hasil maksimal dari sistem prediksi ini.

4. Penelitian ini dapat dikembangkan kedalam sebuah aplikasi berbasis web

maupun smartphone.

75

DAFTAR PUSTAKA

Ahmad, A. (2017). Mengenal Artificial Intelligence, Machine Learning, Neural

Network, dan Deep Learning. June.

Akromunnisa, K., Hidayat, R., Informatika, J. T., & Adisucipto, J. L. (2019).

KLASIFIKASI DOKUMEN TUGAS AKHIR (SKRIPSI) MENGGUNAKAN K-

NEAREST NEIGHBOR. 4(1), 69–75.

Al-Waisy, A. S., Qahwaji, R., Ipson, S., & Al-Fahdawi, S. (2017). A multimodal

biometrie system for personal identification based on deep learning approaches.

Proceedings - 2017 7th International Conference on Emerging Security

Technologies, EST 2017, September, 163–168.

https://doi.org/10.1109/EST.2017.8090417

Alarcón-Soto, Y., Espasandín-Domínguez, J., Guler, I., Conde-Amboage, M., Gude-

Sampedro, F., Langohr, K., Cadarso-Suárez, C., & Gómez-Melis, G. (2019). Data

Science in Biomedicine. September. http://arxiv.org/abs/1909.04486

Bergstra, J., & Bengio, Y. (2012). Random search for hyper-parameter optimization.

Journal of Machine Learning Research, 13, 281–305.

Bibin, D., Nair, M. S., & Punitha, P. (2017). Malaria Parasite Detection from Peripheral

Blood Smear Images Using Deep Belief Networks. IEEE Access, 5, 9099–9108.

https://doi.org/10.1109/ACCESS.2017.2705642

Botev, A., Lever, G., & Barber, D. (2017). Nesterov’s accelerated gradient and

momentum as approximations to regularised update descent. Proceedings of the

International Joint Conference on Neural Networks, 2017-May(2), 1899–1903.

https://doi.org/10.1109/IJCNN.2017.7966082

Bousetouane, F., & Morris, B. (2015). Off-the-Shelf CNN Features for Fine-Grained

76


Classification of Vessels in a Maritime Environment. Lecture Notes in Computer

Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture

Notes in Bioinformatics), 9475(1), 842–850. https://doi.org/10.1007/978-3-319-

27863-6

Byrne, C., Farnham, B., Tokyo, S., Boston, B., Sebastopol, F., & Beijing, T. (2017).

Development Workflows for Data Scientists. O’Reilly. http://oreilly.com/safari

Center for Disease Control and Prevention. (2018). CDC Parasites.

https://www.cdc.gov/parasites/malaria/index.html

Chollet, F. (2018). Deep Learning with Python. In 2018 21st International Conference

on Information Fusion, FUSION 2018.

https://doi.org/10.23919/ICIF.2018.8455530

Das, D. K., Ghosh, M., Pal, M., Maiti, A. K., & Chakraborty, C. (2013). Machine

learning approach for automated screening of malaria parasite using light

microscopic images. Micron, 45, 97–106.

https://doi.org/10.1016/j.micron.2012.11.002

Dineva, K., & Atanasova, T. (2018). Osemn Process for Working Over Data Acquired

By Iot. 7(13), 47–53.

Dinov, I. D. (2018). Data science and predictive analytics: Biomedical and health

applications using R. In Data Science and Predictive Analytics: Biomedical and

Health Applications using R. https://doi.org/10.1007/978-3-319-72347-1

Dong, Y., Jiang, Z., Shen, H., David Pan, W., Williams, L. A., Reddy, V. V. B.,

Benjamin, W. H., & Bryan, A. W. (2017). Evaluations of deep convolutional

neural networks for automatic identification of malaria infected cells. 2017 IEEE

EMBS International Conference on Biomedical and Health Informatics, BHI

2017, 101–104. https://doi.org/10.1109/BHI.2017.7897215

77


Eka Putra, W. S. (2016). Klasifikasi Citra Menggunakan Convolutional Neural

Network (CNN) pada Caltech 101. Jurnal Teknik ITS, 5(1).

https://doi.org/10.12962/j23373539.v5i1.15696

Ezer, D., & Whitaker, K. (2019). Data science for the scientific life cycle. ELife, 8, 1–

10. https://doi.org/10.7554/eLife.43979

Gao, X., James-Reynolds, C., & Currie, E. (2018). Analysing TB severity levels with

an enhanced deep residual learning - Depth-resnet. CEUR Workshop Proceedings,

2125.

He, K., Zhang, X., Ren, S., & Sun, J. (2015). Deep residual learning for image

recognition. Proceedings of the IEEE Computer Society Conference on Computer

Vision and Pattern Recognition, 2016-Decem, 770–778.

https://doi.org/10.1109/CVPR.2016.90

Kamal Hasan, M., Adiwijaya, & Said, A. F. (2019). Klasifikasi Citra Multi-Kelas

Menggunakan Convolutional Neural Network. E-Proceeding of Engineering,

6(1), 2127–2136.

Kartika, A., Irawan, B., & Triyanto, D. (2016). Prediksi Wilayah Rawan Kebakaran

Hutan dengan Metode Jaringan Syaraf Tiruan Propagasi Balik (Study Kasus :

Daerah Kabupaten Kuburaya). Coding Jurnal Komputer Dan Aplikasi Untan,

4(2), 66–75.

Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2017). ImageNet classification with

deep convolutional neural networks. Communications of the ACM, 60(6), 84–90.

https://doi.org/10.1145/3065386

Kumari, K., Bhardwaj, M., & Sharma, S. (2020). OSEMN Approach for Real Time

Data Analysis. International Journal of Engineering and Management Research,

10(02), 107–110. https://doi.org/10.31033/ijemr.10.2.11

78


Lecun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. Nature, 521(7553), 436–

444. https://doi.org/10.1038/nature14539

lhncbc.nlm.nih.gov,. (n.d.). https://lhncbc.nlm.nih.gov/publication/pub9932

Maeda-Gutiérrez, V., Galván-Tejada, C. E., Zanella-Calzada, L. A., Celaya-Padilla, J.

M., Galván-Tejada, J. I., Gamboa-Rosales, H., Luna-García, H., Magallanes-

Quintanar, R., Guerrero Méndez, C. A., & Olvera-Olvera, C. A. (2020).

Comparison of convolutional neural network architectures for classification of

tomato plant diseases. Applied Sciences (Switzerland), 10(4).

https://doi.org/10.3390/app10041245

Millar, S. B., & Cox-Singh, J. (2015). Human infections with Plasmodium knowlesi-

zoonotic malaria. Clinical Microbiology and Infection, 21(7), 640–648.

https://doi.org/10.1016/j.cmi.2015.03.017

Nurhikmat, T. (2018). Implementasi Deep Learning Untuk Image Classification

Menggunakan Algoritma Convolutional Neural Network (CNN) Pada Citra

Wayang Golek. In Mathematics Education Journal (Vol. 1, Issue 1).

https://doi.org/10.29333/aje.2019.423a

Patterson, J., & Gibson, A. (2017). Deep learning A: PRACTITIONER’S

APPROACH. In O’Reilly (Vol. 29, Issue 7553).

Perez, L., & Wang, J. (2017). The Effectiveness of Data Augmentation in Image

Classification using Deep Learning. http://arxiv.org/abs/1712.04621

Permata, E., Purnama, I. K. E., & Purnomo, M. H. (2012). Klasifikasi Jenis Dan Fase

Parasit Malaria Plasmodium Falciparum Dan Plasmodium Vivax Dalam Sel

Darah Merah Menggunakan Support Vector Machine One Against One. Setrum,

1(2), 1–8.

Poostchi, M., Silamut, K., Maude, R. J., Jaeger, S., & Thoma, G. (2018). Image analysis

79


and machine learning for detecting malaria. Translational Research, 194(2018),

36–55. https://doi.org/10.1016/j.trsl.2017.12.004

PUSDATINKemenkesRI. (2016). InfoDatin-Malaria-2016.pdf.

Putri, R. K. S. C. (2018). Implementasi Deep Learning Menggunakan Metode

Convolutional Neural Network Untuk Klasifikasi Gambar. Mathematics

Education Journal, 1(1), 75. https://doi.org/10.29333/aje.2019.423a

Rajaraman, S., Antani, S. K., Poostchi, M., Silamut, K., Hossain, M. A., Maude, R. J.,

Jaeger, S., & Thoma, G. R. (2018). Pre-trained convolutional neural networks as

feature extractors toward improved malaria parasite detection in thin blood smear

images. PeerJ, 2018(4), 1–17. https://doi.org/10.7717/peerj.4568

Razavian, A. S., Azizpour, H., Sullivan, J., & Carlsson, S. (2014). CNN features off-

the-shelf: An astounding baseline for recognition. IEEE Computer Society

Conference on Computer Vision and Pattern Recognition Workshops, 512–519.

https://doi.org/10.1109/CVPRW.2014.131

Ross, N. E., Pritchard, C. J., Rubin, D. M., & Dusé, A. G. (2006). Automated image

processing method for the diagnosis and classification of malaria on thin blood

smears. Medical and Biological Engineering and Computing, 44(5), 427–436.

https://doi.org/10.1007/s11517-006-0044-2

Sang, D. V., Van Dat, N., & Thuan, D. P. (2017). Facial expression recognition using

deep convolutional neural networks. Proceedings - 2017 9th International

Conference on Knowledge and Systems Engineering, KSE 2017, 2017-

Janua(June), 130–135. https://doi.org/10.1109/KSE.2017.8119447

Schmidhuber, J. (2015). Deep Learning in neural networks: An overview. Neural

Networks, 61, 85–117. https://doi.org/10.1016/j.neunet.2014.09.003

Sivaramakrishnan, R., Antani, S., Xue, Z., Candemir, S., Jaeger, S., & Thoma, G. R.

80


(2017). Visualizing abnormalities in chest radiographs through salient network

activations in Deep Learning. 2017 IEEE Life Sciences Conference, LSC 2017,

2018-Janua, 71–74. https://doi.org/10.1109/LSC.2017.8268146

Smith, L. N. (2017). Cyclical learning rates for training neural networks. Proceedings

- 2017 IEEE Winter Conference on Applications of Computer Vision, WACV

2017, April, 464–472. https://doi.org/10.1109/WACV.2017.58

Srivasta, N., Hinton, G., Krizhevsky, A., Sutskever, I., & Salakhutdinov, R. (2014).

Dropout: A simple Way to Prevent Neural Networks from Overfitting. Physics

Letters B, 299(3–4), 345–350. https://doi.org/10.1016/0370-2693(93)90272-J

WHO. (2019). World malaria report 2019. In WHO Regional Office for Africa. World

Health Organization. https://www.who.int/news-room/fact-sheets/detail/malaria

Zufar, M., & Setiyono, B. (2016). Convolutional Neural Networks Untuk Pengenalan

Wajah Secara Real-time. Jurnal Sains Dan Seni ITS, 5(2), 128862.

81