PENDETEKSIAN PARASIT MALARIA DALAM SEL DARAH
MANUSIA MENGGUNAKAN METODE CONVOLUTIONAL
NEURAL NETWORK
Skripsi
Oleh:
RAIS AMIN
NIM: 1113091000070
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2020 M/1441 H
i UIN Syarif Hidayatullah Jakarta
PENDETEKSIAN PARASIT MALARIA DALAM SEL DARAH
MANUSIA MENGGUNAKAN METODE CONVOLUTIONAL
NEURAL NETWORK
Skripsi
Sebagai Salah Satu Syarat untuk Memperoleh Gelar
Sarjana Komputer
Oleh :
RAIS AMIN
NIM : 1113091000070
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2020 M / 1441 H
ii UIN Syarif Hidayatullah Jakarta
PERNYATAAN ORISINALITAS
iii UIN Syarif Hidayatullah Jakarta
LEMBAR PERSETUJUAN
PENDETEKSIAN PARASIT MALARIA DALAM SEL DARAH MANUSIA
MENGGUNAKAN METODE CONVOLUTIONAL NEURAL NETWORK
Skripsi
Sebagai Salah Satu Syarat untuk Memperoleh Gelar
Sarjana Komputer (S.Kom)
Oleh :
Rais Amin - 1113091000070
Menyetujui,
Pembimbing I
Dr. Imam Marzuki Shofi, M.T
NIP. 197202052008011010
Pembimbing II
Drs. M. Tabah Rosyadi, M.A.
NIP. 196207141989031004
Mengetahui,
Ketua Prodi Teknik Informatika
Dr. Imam Marzuki Shofi, M.T
NIP. 197202052008011010
iv UIN Syarif Hidayatullah Jakarta
PENGESAHAN UJIAN
v UIN Syarif Hidayatullah Jakarta
PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI
Sebagai civitas akademik UIN Syarif Hidayatullah Jakarta, saya yang bertanda tangan
dibawah ini:
Nama : Rais Amin
NIM : 111309100070
Program Studi : Teknik Informatika
Fakultas : Sains dan Teknologi
Jenis Karya : Skripsi
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada
Universitas Islam Negeri Syarif Hidatullah Jakarta Hak Bebas Royalti Noneksklusif
(Non-exclusive Royalty Free Right) atas karya ilmiah saya yang berjudul:
PENDETEKSIAN PARASIT MALARIA DALAM SEL DARAH MANUSIA
MENGGUNAKAN METODE CONVOLUTIONAL NEURAL NETWORK
Beserta perangkat yang ada (jika diperlukan). Dengan hak Bebas Royalti Noneksklusif
ini Universitas Islam Negeri Syarif Hidayatullah Jakarta berhak menyimpan,
mengalihmedia/formatkan, merawat, dan mempubikasikan tugas akhir saya selama
tetap mencantumkan nama saya sebagai penulis/pencipta dan sebagai pemilik Hak
Cipta. Demikian pernyataan ini saya buat dengan sebenarnya.
Dibuat di: Jakarta
Pada Tangal: 10 Agustus 2020
Yang menyatakan
(Rais Amin)
vi UIN Syarif Hidayatullah Jakarta
KATA PENGANTAR
Assalamu’alaikum Wr. Wb.
Puji syukur senantiasa penulis panjatkan atas kehadirat Allah SWT yang telah
melimpahkan karunia, nikmat dan anugerah-Nya sehingga penulis dapat
menyelesaikan penelitian sampai akhir proses penulisan skripsi ini. Tak lupa shalawat
serta salam senantiasa dihaturkan kepada junjungan kita baginda Nabi Muhammad
SAW beserta keluarga dan para sahabatnya. Penyusunan skripsi ini adalah salah satu
syarat untuk memperoleh gelar Sarjana Komputer (S.Kom) pada program studi Teknik
Informatika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Syarif
Hidayatullah Jakarta.
Dalam proses penulisan skripsi ini, tidak terlepas dari bimbingan, bantuan,
dukungan, saran, dan motivasi yang penulis terima dari berbagai pihak. Oleh karena
itu, penulis ingin mengucapkan terima kasih banyak kepada :
1. Ibu Prof. Dr. Lily Surraya Eka Putri, M.Env.Stud., selaku Dekan Fakultas Sains
dan Teknologi.
2. Bapak Dr. Imam Marzuki Shofi, M.T, selaku ketua Program Studi Teknik
Informatika, serta Bapak selaku sekretaris Program Studi Teknik Informatika.
3. Bapak Dr. Imam Marzuki Shofi M.T, selaku Dosen Pembimbing I dan Bapak
Drs. M. Tabah Rosyadi, M.A., selaku Dosen Pembimbing II yang telah
memberikan bimbingan, motivasi, dan arahan kepada penulis sehingga skripsi
ini bisa selesai dengan baik.
4. Seluruh Dosen, Staf Karyawan Fakultas Sains dan Teknologi, khususnya
Program Studi Teknik Informatika yang telah memberikan bantuan dan
kerjasama dari awal perkuliahan.
6. Orang tua penulis, yaitu Ibu Yurnensi yang telah mencurahkan kasih sayang,
do’a, dan dukungan penuh kepada penulis dalam mengerjakan skripsi.
vii UIN Syarif Hidayatullah Jakarta
7. Teman-teman TI C 2013. Terima kasih atas perhatian dan dukungan serta
masukan yang membangun demi terselesaikannya skripsi ini. Semoga kita bisa
lebih baik lagi dan sukses di masa yang akan datang.
8. Seluruh teman-teman TI UIN angkatan 2013 yang tidak bisa disebutkan satu
persatu yang senantiasa mendukung dan memberikan semangat kepada penulis
dalam menyelesaikan skripsi ini. Semoga kita bisa sukses di masa mendatang.
9. Seluruh pihak yang tidak dapat disebutkan satu-persatu yang secara langsung
maupun tidak langsung membantu penulis dalam menyelesaikan skripsi ini.
Akhir kata, penulis berharap semoga skripsi ini bermanfaat serta
menambah wawasan dan pengetahuan bagi pembaca. Penulis menyadari bahwa
skripsi ini masih jauh dari sempurna, untuk itu kritik dan saran yang bersifat
membangun sangat diharapkan dengan mengirimkan melalui email
Jakarta, 10 Agustus 2020
Rais Amin
viii UIN Syarif Hidayatullah Jakarta
Nama : Rais Amin
Program Studi : Teknik Informatika
Judul : Pendeteksian Parasit Malaria Dalam Sel Darah Manusia
Menggunakan Metode Convolutional Neural Network
ABSTRAK
Malaria adalah penyakit dalam darah yang disebabkan oleh parasit Plasmodium
yang ditularkan oleh gigitan nyamuk Anopheles betina. Ahli mikroskopis biasanya
memeriksa sel darah untuk mendiagnosis penyakit malaria ini. Namun, akurasi mereka
tergantung pada kualitas alat dan keahlian dalam mengklasifikasikan dan menghitung
sel parasit dan yang tidak terinfeksi. Pemeriksaan semacam itu akan sangat sulit dalam
proses diagnosis skala besar dan menghasilkan kualitas yang buruk. Beberapa dataset
malaria telah dikembangkan, diantaranya adalah dataset yang dikembangkan oleh
LHNVBC yang berisikan 27.558 data gambar sel. Proses pengolahan data science
adalah salah satu proses yang dapat menggambarkan protokol analitik prediktif yang
umum untuk diinterogasikan pada dataset biomedis dan kesehatan yang besar dan
kompleks. Dalam penelitian ini dataset malaria akan di proses melalui pengolahan data
science dengan menggunakan model Convolutional Neural Network yang
menggunakan arsitektur ResNet dengan pembelajaran Deep Learning dimana sistem
akan melalui pelatihan dan kemudian dapat mengenali parasit malaria dalam sel darah
manusia. Hasil akurasi menjadi tolak ukur seberapa akurat pembelajaran yang diterima
untuk mengenali data gambar sel yang menjadi input pada sistem sebanyak 96,23 %
dan 97% setelah diuji coba pada data testing.
Kata Kunci : Malaria, Data Science, Deep Learning, Convolutional Neural Network
Daftar Pustaka : 45 (Tahun 2015 – 2020)
Jumlah Halaman : VI BAB + xiv Halaman + 80 Halaman + 27 Gambar + 5
Tabel
ix UIN Syarif Hidayatullah Jakarta
DAFTAR ISI
PERNYATAAN ORISINALITAS ............................................................................. ii
LEMBAR PERSETUJUAN ...................................................................................... iii
PENGESAHAN UJIAN ............................................................................................. iv
PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI ..................................... v
KATA PENGANTAR ................................................................................................ vi
ABSTRAK ................................................................................................................ viii
DAFTAR ISI ............................................................................................................... ix
DAFTAR GAMBAR ................................................................................................ xiii
DAFTAR TABEL .................................................................................................... xiv
BAB I PENDAHULUAN ............................................................................................ 1
1.1 Latar Belakang ............................................................................................... 1
1.2 Rumusan Masalah .......................................................................................... 6
1.3 Batasan Masalah ............................................................................................. 6
1.4 Tujuan Penelitian ............................................................................................ 6
1.5 Manfaat Penelitian .......................................................................................... 6
1.6 Sistematika Penulisan ..................................................................................... 7
BAB II LANDASAN TEORI ..................................................................................... 9
2.1 Malaria ............................................................................................................ 9
2.2 Data Science ................................................................................................. 11
2.3 Klasifikasi Gambar ....................................................................................... 11
2.4 Artificial Intellegence (AI) ........................................................................... 12
x UIN Syarif Hidayatullah Jakarta
2.5 Machine Learning ........................................................................................ 14
2.6 Deep Learning .............................................................................................. 15
2.7 Jaringan Syaraf Tiruan / Artificial Neural Network (ANN) .......................... 16
2.8 Convolutional Neural Network (CNN) ........................................................ 17
2.8.1 Arsitektur Jaringan CNN....................................................................... 19
2.8.2 Fungsi Aktivasi ..................................................................................... 22
2.8.3 Learning Rate ........................................................................................ 23
2.8.4 Data Augmentation/ Data Augmentasi ................................................. 24
2.9 Precision dan Recall ..................................................................................... 26
2.10 Epoch ........................................................................................................ 26
2.11 ResNet ....................................................................................................... 26
2.12 Python ....................................................................................................... 31
2.13 Keras ......................................................................................................... 32
2.14 Tensorflow ................................................................................................ 32
2.15 Open CV ................................................................................................... 33
2.16 OSEMN Framework ................................................................................. 33
2.17 Studi Literatur Sejenis .............................................................................. 35
BAB III METODOLOGI PENELITIAN ............................................................... 39
3.1 Metode Pengumpulan Data .......................................................................... 39
xi UIN Syarif Hidayatullah Jakarta
3.1.1 Studi pustaka ......................................................................................... 39
3.2 OSEMN Framework .................................................................................... 39
3.2.1 Obtain(Pengumpulan data) ................................................................... 39
3.2.2 Scrub(Data Preparation) ........................................................................ 40
3.2.3 Explore(Eksplorasi data) ....................................................................... 40
3.2.4 Modelling(Perancangan Model) ............................................................ 40
3.2.5 iNterpreting(Mengintrepretasikan hasil) ............................................... 40
3.3 Kerangka Berpikir ........................................................................................ 41
BAB IV IMPLEMENTASI ...................................................................................... 42
4.1 Obtain(Pengumpulan data) ........................................................................... 42
4.2 Scrub(Data Preparation) .............................................................................. 42
4.3 Explore(Eksplorasi data) .............................................................................. 45
4.4 Modelling(Perancangan Model) ................................................................... 46
4.5 iNterpreting(Mengintrepretasikan hasil) ...................................................... 50
BAB V HASIL DAN PEMBAHASAN .................................................................... 53
5.1 Pembagian training, test dan validation dataset ........................................... 53
5.2 Arsitektur Jaringan ....................................................................................... 54
5.2.1 Proses Convolution Layer ..................................................................... 65
5.2.2 Proses Pooling ....................................................................................... 66
xii UIN Syarif Hidayatullah Jakarta
5.2.3 Proses Fully Connected ......................................................................... 66
5.3 Akurasi ......................................................................................................... 66
5.4 Prediksi ......................................................................................................... 68
BAB VI PENUTUP ................................................................................................... 73
6.1 Kesimpulan ................................................................................................... 73
6.2 Saran ............................................................................................................. 73
DAFTAR PUSTAKA ................................................................................................ 75
xiii UIN Syarif Hidayatullah Jakarta
DAFTAR GAMBAR
Gambar 2.1 Diagram Kecerdasan Buatan ................................................................... 13
Gambar 2.2 Perbandingan Pemrograman Tradisional dengan Machine Learning ..... 14
Gambar 2.3 Contoh Jaringan Convolutional Neural Network (CNN) ........................ 19
Gambar 2.4 Ilustrasi Arsitektur CNN ......................................................................... 20
Gambar 2.5 Feature Map ............................................................................................ 21
Gambar 2.6 Plot learning rate terhadap loss .............................................................. 23
Gambar 2.7 Augmentasi dengan perputaran gambar maksimal 90 ° .......................... 24
Gambar 2.8 Blok Residual .......................................................................................... 27
Gambar 2.9 Contoh arsitektur keseluruhan dari ResNet ............................................. 28
Gambar 2.10 Ilustrasi operasi max pooling dan average pooling pada CNN ............. 30
Gambar 2.11 Hasil Penelitian Literatur 1 ................................................................... 35
Gambar 2.12 Hasil Penelitian Literatur 4 ................................................................... 36
Gambar 3.1 Kerangka Berpikir Penelitian .................................................................. 41
Gambar 4.1 tree susunan folder project ...................................................................... 43
Gambar 4.2 Konfigurasi pembagian dataset ............................................................... 43
Gambar 4.3 Source code pembagian dataset............................................................... 45
Gambar 4.4 Source Code Data augmentation ............................................................. 46
Gambar 4.5 Arsitektur model ResNet ......................................................................... 48
Gambar 4.6 Source code pelatihan model .................................................................. 49
Gambar 4.7 Source code pengujian akurasi prediksi .................................................. 50
Gambar 4.8 Source code untuk menampilkan visualisasi hasil prediksi gambar sel .. 51
Gambar 5.1 Dataset Malaria ....................................................................................... 53
Gambar 5.2 Model yang terbentuk dari hasil training ................................................ 64
Gambar 5.3 Uji Akurasi Model ................................................................................... 67
Gambar 5.4 Grafik model loss dan accuracy .............................................................. 68
Gambar 5.5 Hasil uji akurasi pada data testing ........................................................... 69
Gambar 5.6 Hasil prediksi sistem ............................................................................... 72
xiv UIN Syarif Hidayatullah Jakarta
DAFTAR TABEL
Tabel 2.1 Perbandingan ANN, CNN dan RNN .......................................................... 24
Tabel 2.2 Perbandingan Penelitian sejenis .................................................................. 36
Tabel 5.1 Sebaran data hasil pembagian dataset ......................................................... 54
Tabel 5.2 Perbandingan nilai Akurasi dengan literatur sejenis ................................... 71
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Penyakit Malaria masih merupakan masalah kesehatan masyarakat yang
menyebabkan kematian terutama pada kelompok resiko tinggi yaitu bayi, anak balita,
ibu hamil, selain itu malaria secara langsung menyebabkan anemia dan dapat
menurunkan produktivitas kerja.
Pada tahun 2018, diperkirakan 228 juta kasus malaria terjadi di seluruh dunia
dengan jumlah total kematian 405 ribu. Sebagian besar kasus malaria pada tahun 2018
berada di Wilayah Afrika (213 juta atau 93%), diikuti oleh Wilayah Asia Tenggara
dengan 3,4% dari kasus dan Wilayah Mediterania Timur dengan 2,1%.(WHO, 2019)
Penemuan kasus malaria dilakukan berdasarkan gejala klinis, melalui
pemeriksaan sediaan darah yang dilakukan dengan konfirmasi laboratorium
menggunakan mikroskop maupun Rapid Diagnostik Test (RDT).(WHO, 2019)
Tingkat akurasi pemeriksaan sediaan darah sangat tergantung kepada keahlian
manusia dan dapat dipengaruhi oleh variabilitas antar pengamat dan terbatasnya
sumber daya daerah dalam pemeriksaan skala besar pada wilayah dimana malaria
endemik. Teknik alternatif seperti Polymerase Chain Reaction (PCR) dan Rapid
Diagnostic Test (RDT) telah digunakan, namun analisis PCR terbatas dalam kinerjanya
dan RDT kurang efektif dalam hal biaya pada pemeriksaan skala besar di wilayah
dimana malaria endemik.(Rajaraman et al., 2018)
Beberapa dataset malaria telah dikembangkan guna membantu dalam hal
pemeriksaan dan diagnosis penyakit malaria. Penelitian ini meggunakan dataset
(Lhncbc.Nlm.Nih.Gov) yang berisikan repositori sel tersegmentasi dari aktivitas
penelitian Malaria Screener. Dataset ini dikembangkan oleh para peneliti di Lister Hill
2
UIN Syarif Hidayatullah Jakarta
National Center for Biomedical Communications (LHNVBC), yang tergabung dalam
bagian National Library of Medicine (NLM). Dataset ini diambil menggunakan
aplikasi seluler yang telah dikembangkan yang berjalan pada smartphone Android yang
terpasang pada mikroskop cahaya konvensional. Sel darah yang diwarnai cairan
Giemsa dari 150 pasien yang terinfeksi parasit dan sel darah dai 50 pasien sehat
dikumpulkan dan difoto di Rumah Sakit Chittagong Medical College, bangladesh.
Kamera yang terpasang pada smartphone memperoleh gambar slide untuk setiap
bidang pandang mikroskopis. Gambar-gambar tersebut dianotasikan secara manual
oleh pembaca slide yang ahli di Mahidol-Oxford Tropical Medicine Research Unit di
Bangkok, Thailand. Peneliti NLM menerapkan algoritma berbasis level-set untuk
mendeteksi dan mensegmentasi sel darah merah. Dataset ini dibuat untuk mengurangi
beban para mikroskopis di daerah yang sumber dayanya terbatas dan juga untuk
meningkatkan akurasi diagnostik malaria. Dataset berisi total 27.558 gambar sel
dengan jumlah data yang sama pada sel yang terkena parasit (Parasitized) dan sel yang
tidak terinfeksi (Uninfected). (Https://Lhncbc.Nlm.Nih.Gov/Publication/Pub9932, n.d.
diakses 18 juli 2020)
Jumlah, kompleksitas, dan kecepatan agregasi biomedis dan data layanan
kesehatan akan meningkat dengan cepat selama beberapa dekade berikutnya.
Kemungkinan akan berlipat ganda setiap 1-2 tahun. Ini didorong oleh langkah besar
dalam teknologi digital dan komunikasi, perangkat IoT, dan layanan Cloud, serta
kemajuan algoritmik, komputasi, dan perangkat keras yang cepat. Permintaan publik
yang semakin meningkat untuk deteksi waktu-nyata, interpretasi yang tepat, dan sistem
diagnosis yang dapat diandalkan manusia dalam hal kesehatan dan penyakit juga
mempercepat tren itu. Proses pengolahan data science adalah salah satu proses yang
dapat menggambarkan protokol analitik prediktif yang umum untuk diinterogasikan
pada dataset biomedis dan kesehatan yang besar dan kompleks. Prosesnya dimulai
dengan mengidentifikasi masalah, diikuti dengan menentukan sumber data dan meta-
data, pembersihan, penyelarasan komponent data, preprocessing data, inferensi ilmiah
3
UIN Syarif Hidayatullah Jakarta
berbasis model, dan diakhiri dengan prediksi, validasi dan penyebaran data, perangkat
lunak, protokol dan temuan penelitian (Dinov, 2018). Dari uraian tersebut, proses
pengolahan data science dapat menjadi jawaban untuk dapat membuat sistem diagnosis
otomatis dari dataset biomedis dan kesehatan, termasuk penyakit malaria.
Sistem diagnosis otomatis bertujuan untuk melakukan tugas pemeriksaan sediaan
darah ini tanpa campur tangan manusia dan untuk menyediakan alat yang obyektif,
dapat diandalkan, dan efisien untuk melakukannya. Sistem diagnosis otomatis dapat
dirancang dengan memahami keahlian diagnostik dan merepresentasikannya dengan
algoritma pemrosesan gambar, analisis, dan pengenalan pola khusus yang disesuaikan.
Meskipun ini bukan topik penelitian yang populer, sejumlah studi visi terlihat secara
langsung membahas diagnosis otomatis malaria. Meskipun sangat khusus, jika angka
kematian dianggap hasil, maka studi ini dapat dianggap penting seperti beberapa
aplikasi visi komputer populer lainnya. Studi ini memberikan tinjauan tentang studi
visi komputer diagnosis malaria dan bermaksud untuk mengisi celah pada tugas
pemeriksaan sediaan darah ini.
Sistem diagnosis otomatis ini dapat dirancang menggunakan proses penerapan
metode Machine Learning (ML), representasi fitur yang akurat merupakan inti dari
kesuksesan untuk mencapai hasil yang diinginkan. Mayoritas sistem diagnosis
otomatis berbasis analisis gambar menggunakan ML dengan representasi hand-
engineered features dalam pengambilan keputusan(Poostchi et al., 2018). Namun
proses ini menuntut keahlian khusus dalam menganalisis variabilitas ukuran, latar
belakang, sudut, dan Region Of Interest (ROI) pada gambar. Untuk mengatasi
tantangan dalam perancangan hand-engineered features yang menangkap variasi
dalam data dasar, digunakanlah model Deep Learning (DL) yang dikenal sebagai
hierarchical learning yang dapat digunakan dalam mencapai kesuksesan yang
signifikan(Lecun et al., 2015).
4
UIN Syarif Hidayatullah Jakarta
Model DL menggunakan lapisan unit kaskade non-linier untuk menemukan
reprentasi fitur hirarki pada data mentah. Fitur dengan tingkat yang lebih tinggi
diabstraksikan dari tingkat yang lebih rendah untuk membantu dalam proses
pembelaaran yang kompleks, fungsi pengambilan keputusan non-linier, yang
dihasilkan dalam ekstraksi dan klarifikasi end-to-end (Schmidhuber, 2015). Tidak
seperti algoritma berbasil kernel seperti Support Vector Machine (SVM) pada model
ML, model DL menunjukkan peningkatan kinerja dengan peningkatan ukuran data dan
sumber daya komputasi, dan membuatnya memiliki skala yang lebih tinggi. (Srivasta
et al., 2014)
Pada sebuah gambar, sumber informasi yang penting terletak pada korelasi lokal
spasial diantara piksel/voxel yang berdekatan. Covolutional Neural Networks (CNN)
yang merupakan sebuah kelas pada mode DL, dirancang untuk mengeksploitasi
iniformasi ini melalui mekanisme local receptive fields, shared weights dan pooling
(Hinton dkk, 2015). Dalam representasi dan pengembangan performa CNN beberapa
model seperti AlexNet, VGGNet, GoogleNet, Resnet dan DenseNet, model-model ini
telah mencapai peningkatan yang sangat signifikan dengan menggunakan lebih sedikit
parameter dan perhitungan. Kinerja CNN yang menanjikan disertai dengan
ketersidiaan jumlah data yang dianotasi yang sangat besar. Dengan kelangkaan data
anotasi pencitraan medis, digunakanlah metode Transfer Learning yang dimana model
pra-latih DL disesuaikan baik pada data yang mendasarinya atau digunakan sebagai
ekstraktor fitur untuk membantu dalam tugas-tugas pengenalan visual. Model-model
ini mentransfer pengetahuan mereka saat mempelaari fitur-fitur umum dari dataset
skala besar untuk tugas yang mendasarinya(Razavian et al., 2014). Dan diakui bahwa
CNN yang dilatih pada dataset skala besar dapat berfungsi sebagai ekstraktor fitur
untuk berbaai tugas computer vision dalam membantun peningkatan kinerja,
dibandingkan metode lain. (Bousetouane & Morris, 2015)
Saat ini, banyak penelitian yang telah menerapkan DL dan memperoleh hasil yan
menjanjikan dalam berbagai tugas analisis dan pemahaman gambar medis. Pada
5
UIN Syarif Hidayatullah Jakarta
Evaluations of deep convolutional neural networks for automatic identification of
malaria infected cells(Dong et al., 2017) dan Visualizing abnormalities in chest
radiographs through salient network activations in Deep Learning (Sivaramakrishnan
et al., 2017) membuktikan bahwa CNN memliki lebih sedikit parameter hasil, lebih
sedikit model kompleksitas dan waktu komputasi. Dan juga membuktikan bahwa CNN
memiliki akurasi yang tinggi dan juga dapat mengekstraksi banyak lapisan fiur input
data secara otomatis.
Pada penelitian (Sivaramakrishnan et al., 2017) dalam membandingkan
arsitektur CNN yaitu AlexNet, VGG-16, ResNet, Xception dan Densenet, penilitian ini
mengamati dari studi validasi silang bahwa ResNet mengungguli arsitektur CNN yang
lainnya dalam semua metrik kinerja untuk tugas mengklasifikasikan. Dan arsitektur
ResNet memperoleh tingkat akurasi sebesar 95,59 dan mengungguli arsitektur yan
lainnya.
Dalam penulisan ini, penulis akan menggunakan model DL berbasis pre-tained
CNN dengan arsitektur ResNet sebagai fitur ekstraktor dalam mengklasifikasi
parasitized dan uninfected cells untuk membantu dalam peningkatan sistem diagnosis
penyakit malaria.
6
UIN Syarif Hidayatullah Jakarta
1.2 Rumusan Masalah
Berdasarkan latar belakang tersebut, penulis merumuskan masalah
sebagai berikut :
“Bagaimana cara pengolahan Data Science dalam menghasilkan tingkat
akurasi yang baik pada pendeteksian parasit penyebab malaria menggunakan
metode Convolutional Neural Network?”
1.3 Batasan Masalah
Adapun batasan masalah pada penulisan ini adalah:
1. Pendeteksian dilakukan pada gambar sel darah manusia.
2. Analisis dan perancangan sistem aplikasi menggunakan bahasa
pemrograman python.
3. Dalam melakukan pengolahan data science, penulis menggunakan OSEMN
Framework.
4. Dalam melakukan pemodelan pada pengolahan data science, penulis
menggunakan metode Convolurional Neural Network dengan arsitektur
ResNet.
5. Dataset berdasarkan studi literatur (Lhncbc.Nlm.Nih.Gov).
1.4 Tujuan Penelitian
Proses pengolahan Data Science dalam menghasilkan tingkat akurasi yang baik
pada pendeteksi parasit malaria dalam sel darah manusia menggunakan metode
Convolotuional Neural Network.
1.5 Manfaat Penelitian
Manfaat dari penulisan ini antara lain:
Bagi pengguna
1. Dapat mengetahui bentuk dan kategori parasit penyebab malaria.
7
UIN Syarif Hidayatullah Jakarta
2. Memudahkan untuk mendapatkan informasi tentang parasit penyebab
malaria guna untuk memahami dan mendeteksi penyakit malaria.
Bagi penulis
1. Mendapatkan ilmu pengetahuan mengenai penyakit malaria.
2. Mendapatkan pemahaman tentang data science, image processing dan
metode Convolutional Neural Network.
1.6 Sistematika Penulisan
Untuk memudahkan dalam penulisan skripsi, penulis menyusunnya ke dalam
enam bab. Setiap bab-nya terdiri dari beberapa sub bab tersendiri. Bab tersebut secara
keseluruhan saling berkaitan satu sama lain, dimana diawali dengan bab pendahuluan
dan diakhiri bab penutup yang berisi kesimpulan dan saran. Secara singkat akan
diuraikan sebagai berikut:
BAB I PENDAHULUAN
Dalam bab ini akan dibahas mengenai latar belakang, batasan masalah,
tujuan, dan manfaat serta sistematika penulisan.
BAB II LANDASAN TEORI
Dalam bab ini akan dibahas mengenai berbagai teori yang mendasari
analisis permasalahan dan berhubungan dengan topik yang dibahas.
BAB III METODOLOGI PENELITIAN
Bab ini membahas mengenai metode penelitian yang akan digunakan
dalam pengolahan data science pada Pendeteksi Parasit Malaria
BAB IV IMPLEMENTASI
8
UIN Syarif Hidayatullah Jakarta
Pada bab ini membahas mengenai hasil dari analisis, perancangan,
implementasi dan pengujian sesuai dengan metode yang dilakukan pada
sistem yang dibuat serta hasil dari pengujian.
BAB V HASIL DAN PEMBAHASAN
Bab ini membahas mengenai hasil dan pembahasan tentang pengolahan
data science pada sistem pendeteksi parasit malaria menggunakan
metode Convolutional Neural Network.
BAB VI PENUTUP
Bab ini berisi tentang kesimpulan dari penelitian yang telah dilakukan
dan saran yang diusulkan untuk pengembangan lebih lanjut agar
tercapai hasil yang lebih baik.
9
BAB II
LANDASAN TEORI
2.1 Malaria
Malaria adalah suatu penyakit yang disebabkan oleh parasit yang termasuk dalam
anggota spesies dari genus Plasmodium. Plasmodium falciparum, Plasmodium vivax,
Plasmodium ovale dan Plasmodium malariae hampir disemua kasus terjadi pada
manusia. Malaria ditransmisikan dari manusia ke manusia oleh nyamuk Anopheles
betina kemudian berkembang dan bereplikasi didalam eritrosit inang vertebrata.
(Millar & Cox-Singh, 2015)
Malaria adalah penyakit menular yang disebabkan plasmodium, yaitu makhluk
hidup bersel satu yang termasuk ke dalam kelompok protozoa. Malaria ditularkan
melalui gigitan nyamuk Anopheles betina yang mengandung Plasmodium di dalamnya.
Plasmodium yang terbawa melalui gigitan nyamuk akan hidup dan berkembang biak
dalam sel darah merah manusia. Penyakit ini menyerang semua kelompok umur baik
laki-laki maupun perempuan. Orang yang terkena malaria akan memiliki gejala:
demam, menggigil, berkeringat, sakit kepala, mual atau muntah.
(PUSDATINKemenkesRI, 2016)
Sampai saat ini menurut (Center for Disease Control and Prevention, 2018)
dikenal 5 jenis spesies plasmodium penyebab malaria pada manusia, yaitu:
1. Plasmodium falciparum, adalah parasit malaria yang ditemukan di daerah
tropis dan subtropis di dunia. Diperkirakan setiap tahunnya ada 1 juta orang
yang terbunuh akibat parasit ini, terutama di Afrika. Plasmodium falciparum
adalah penyebab malaria tropika yang sering menyebabkan malaria yang berat,
karena memiliki kemampuan melipat ganda secara cepat dalam darah sehingga
dapat menyebabkan anemia. Selain itu Plasmodium falciparum dapat
menyumbat pembuluh darah kecil. Ketika ini terjadi di otak akanmenyebabkan
malaria serebral dengankomplikasiyang dapat berakibat fatal (kematian).
10
UIN Syarif Hidayatullah Jakarta
2. Plasmodium vivax, adalah parasit malaria penyebab malaria tertiana yang
kebanyakan ditemukan di Asia, Amerika Latin, dan beberapa bagian di Afrika.
Karena padatnya penduduk terutama di Asia menyebabkan Plasmodium vivax
merupakan parasit malaria yang paling umum ditemukan pada manusia.
Plasmodium vivax memiliki tahapan dormansi dalam hati (hypnozoites) yang
dapat aktif dan menyerang darah(relapse) dalam beberapa bulan atau tahun
setelah gigitan nyamuk yang terinfeksi.
3. Plasmodium malariae, adalah penyebab malaria quartana yang ditemukan di
seluruh dunia. Plasmodium malariae adalah satu-satunya spesies parasit
malaria pada manusia yang memiliki siklus quartan (siklus tiga hari),
sedangkan tiga spesies lainnya memiliki siklus tertiana (siklus dua hari). Infeksi
Plasmodium malariae mampu bertahan dalam waktu yang lama jika tidak
diobati. Dalam beberapa kasus, infeksi kronis dapat berlangsung seumur hidup.
Pada beberapa pasien kronis yang terinfeksi.
4. Plasmodium ovale dapat menyebabkan komplikasi yang serius seperti sindrom
nefrotik. Plasmodium ovale, adalah parasit malaria yang menyebabkan malaria
ovale tetapi jenis ini jarang dijumpai. Plasmodium ovale banyak ditemukandi
Afrika (terutama Afrika Barat) dan pulau-pulau di Pasifik Barat. Plasmodium
ovale secara biologis danmorfologis sangat mirip dengan Plasmodium vivax.
Plasmodium ovale dapat menginfeksi individu yang negatif untuk golongan
darah duffy (salah satu penggolongan darah selain ABO dan Rh) sedangkan
Plasmodium vivax tidak. Golongan darah duffy banyak ditemukan pada
penduduk Sub-Sahara Afrika. Hal ini menjelaskan prevalensi infeksi
Plasmodium ovale banyak terjadi di sebagian besar Afrika.
5. Plasmodium knowlesi merupakan parasit malaria baru yang bisa menginfeksi
manusia. Plasmodium knowlesi ditemukandi seluruh Asia Tenggara sebagai
pathogen alami dari kera ekor panjang dan babi. Baru-baru ini Plasmodium
knowlesi terbukti menjadi penyebab signifikan malaria zoonosis, terutama di
11
UIN Syarif Hidayatullah Jakarta
Malaysia. Plasmodium knowlesi memiliki siklus replikasi 24 jam dan begitu
cepat dapat berkembang menjadi infeksi yang parah.
2.2 Data Science
Data science adalah sebuah bidang baru yang muncul dan menjadi ilmu yang
sangat transdisipliner, yang menjembatani antara bidang teoritis, komputasi,
eksperimental, dan biososial. Data science juga berurusan dengan sejumlah besar data
yang kompleks, tidak selaras, dan dinamis yang berasal dari berbagai sumber. Data
Science bertujuan untuk mengembangkan algoritma, metode, alat, dan layanan yang
mampu mengolah dataset dan menghasilkan sistem penunjang keputusan semi-
otomatis. (Dinov, 2018)
Data Science adalah interdisipliner ilmu yang inheren dengan pendekatan sains.
Teknik eksperimental baru telah merevolusi biologi selama bertahun - tahun dari
sekuensing DNA dan mikroarray di masa lalu ke CRISPR dan cryo-EM baru-baru ini.
Data Science berbeda karena itu bukan merupakan teknik tunggal, melainkan kerangka
kerja untuk menyelesaikan seluruh jajaran masalah. Potensi Data Science untuk
menjawab pertanyaan dalam berbagai disiplin ilmu yang berbeda sangat
menggairahkan banyak peneliti. (Ezer & Whitaker, 2019)
2.3 Klasifikasi Gambar
Klasifikasi gambar atau citra adalah sebuah pekerjaan untuk memasukkan citra
dan menempatkan ke dalam suatu kategori. Ini merupakan salah satu dari permasalahan
yang ada pada Computer Vision yang dapat disederhanakan dan memiliki berbagai
macam aplikasinya. Salah satu aplikasi dalam klasifikasi citra adalah pengklasifikasian
nama tempat pada suatu citra.
Setiap citra yang di input pada training set data diberikan label atau penamaan.
Saat klasifikasi, label atau penamaan tersebut akan menjadi perbandingan dengan hasil
hipotesis yang diberikan oleh model pembelajaran dan akan menghasilkan nilai error.
Klasifikasi yang terawasi ini bisa sangat efektif dan akurat dalam mengklasifikasikan
12
UIN Syarif Hidayatullah Jakarta
citra tempat maupun objek lainnya. Banyak metode dan algoritma yang dapat
mendukung proses klasifikasi yang terawasi terutama dengan teknik Deep Learning
(Putri, 2018)
2.4 Artificial Intellegence (AI)
Kecerdasan Buatan atau Artificial Intelligence (AI) adalah teknik yang
digunakan untuk meniru kecerdasan yang dimiliki oleh makhluk hidup maupun benda
mati untuk menyelesaikan sebuah persoalan. Untuk melakukan hal ini, setidaknya ada
tiga metode yang dikembangkan.
• Fuzzy Logic(FL).
Teknik ini digunakan oleh mesin untuk mengadaptasi bagaimana makhluk hidup
menyesuaikan kondisi dengan memberikan keputusan yang tidak kaku 0 atau 1.
Sehingga dimunculkan sistem logika fuzzy yang tidak kaku. Penerapan logika fuzzy ini
salah satunya adalah untuk sistem pengereman kereta api di Jepang.
• Evolutionary Computing(EC).
Pendekatan ini menggunakan skema evolusi yang menggunakan jumlah individu
yang banyak dan memberikan sebuah ujian untuk menyeleksi individu terbaik untuk
membangkitkan generasi selanjutnya. Seleksi tersebut digunakan untuk mencari solusi
dari suatu permasalahan. Contoh dari pendekatan ini adalah Algoritma Genetika yang
menggunakan ide mutasi dan kawin silang, Particle Swarm Optimization (PSO) yang
meniru kumpulan binatang seperti burung dan ikan dalam mencari mangsa, Simulated
Annealing yang menirukan bagaimana logam ditempa, dan masih banyak lagi.
• Machine Learning (ML)
Machine Learning atau pembelajaran mesin merupakan teknik yang paling
populer karena banyak digunakan untuk menggantikan atau menirukan perilaku
manusia untuk menyelesaikan masalah. Sesuai namanya ML mencoba menirukan
13
UIN Syarif Hidayatullah Jakarta
bagaimana proses manusia atau makhluk cerdas belajar dan mengeneralisasi (Ahmad,
2017)
Skema utama dari AI bisa dilihat pada gambar berikut:
Sumber (Ahmad, 2017)
Berdasarkan diagram pada gambar 2.1. dapat dijelaskan bahwa AI dibagi
menjadi beberapa macam algortima seperti Machine Learning, Fuzzy Logic,
Evolutionary Computation, dan lain-lain. Fuzzy Logic adalah suatu cabang ilmu
Artificial Intellegence, yaitu suatu pengetahuan yang membuat komputer dapat meniru
kecerdasan manusia sehingga diharapkan komputer dapat melakukan hal- hal yang
apabila dikerjakan manusia memerlukan kecerdasan. Evolutionary Computation
adalah algoritma untuk optimisasi global yang terinspirasi oleh evolusi biologis, dan
subbidang kecerdasan buatan dan komputasi lunak mempelajari algoritma ini. Dalam
istilah teknis, mereka adalah keluarga pemecah masalah trial and error berbasis
populasi dengan karakter optimisasi metaheuristik atau stokastik.
Gambar 2.1 Diagram Kecerdasan Buatan
14
UIN Syarif Hidayatullah Jakarta
Didalam ANN terdapat Deep Learning yang mana mesin dilatih lebih mendalam.
Deep Learning adalah salah satu cabang Machine Learning (ML) yang menggunakan
Deep Neural Network untuk menyelesaikan permasalahan pada domain ML.
2.5 Machine Learning
Machine Learning adalah serangkaian teknik yang dapat membantu dalam
menangani dan memprediksi data yang sangat besar dengan cara merepresentasikan
data-data tersebut dengan algoritma pembelajaran. Machine Learning dapat membuat
komputer memprogram diri mereka sendiri. Jika pemrograman adalah pekerjaan untuk
membuat otomatis, maka Machine Learning mengotomatisasi proses otomatis. Berikut
gambaran umum Machine Learning dibandingkan dengan pemrograman secara
tradisional.
Gambar 2.2 Perbandingan Pemrograman Tradisional dengan Machine Learning
Dari gambar diatas dapat dilihat bahwa pemrograman secara tradisional data dan
programan dijalankan di komputer untuk menghasilkan output. Sedangkan pada
Machine Learning data dan output dijalankan di komputer untuk membuat sebuah
program.
Ada banyak algoritma Machine Learning yang dikembangkan setiap tahunnya.
Setiap algoritma pembelajaran mesin memiliki tiga komponen penting antara lain:
15
UIN Syarif Hidayatullah Jakarta
a. Representasi: bagaimana merepresentasikan pengetahuan.
Contohnya termasuk Decision tree, Neural Network, Support Vector
Machine dan lain-lain.
b. Evaluasi: cara mengevaluasi prediksi dan hipotesis. Contohnya
meliputi Mean Squared Error, Cost function dan lain-lain.
c. Optimasi: cara program dari model dihasilkan dan proses
pencarian parameter terbaik. Misalnya Convex Optimization dan
Gradient Descent.
Selain dari algoritma pembelajaran ada empat jenis cara pembelajaran pada
Machine Learning, yakni:
a. Supervised Learning: Data pembelajaran mencangkup keluaran
yang yang sudah ditentukan.
b. Unsupervised Learning: Data pembelajaran tidak mencangkup
keluaran yang ditentukan.
c. Semi-supervised Learning: Data pembelajaran mencangkup
beberapa keluaran yang ditentukan.
d. Reinforcement Learning: Pemberian hadiah dari setiap serangkaian
tindakanyang dilakukan.
2.6 Deep Learning
Deep Learning merupakan salah satu bidang dari Machine Learning yang
memanfaatkan jaringan syaraf tiruan untuk implementasi permasalahan dengan dataset
yang besar. Teknik Deep Learning memberikan arsitektur yang sangat kuat untuk
Supervised Learning. Dengan menambahkan lebih banyak lapisan maka model
pembelajaran tersebut bisa mewakili data citra berlabel dengan lebih baik.
16
UIN Syarif Hidayatullah Jakarta
Pada Machine Learning terdapat teknik untuk menggunakan ekstrak fitur dari
data pelatihan dan algoritma pembelajaran khusus mengklasifikasi citra maupun untuk
mengenali suara. Namun, metode ini masih memiliki beberapa kekurangan baik dalam
hal kecepatan dan akurasi. Aplikasi konsep jaringan syaraf tiruan yang dalam (banyak
lapisan) dapat ditangguhkan pada algoritma Machine Learning yang sudah ada
sehingga komputer sekarng bisa belajar dengan kecepatan, akurasi, dan skala yang
besar. Prinsip ini terus berkembangkan hingga Deep Learning semakin sering
digunakan pada komunitas riset dan industri untuk membantu memecahkan banyak
masalah data besar seperti Computer vision, Speech recognition, dan Natural
Language Processing.
Feature Engineering adalah salah satu fitur dari Deep Learning untuk
mengekstrak pola yang berguna dari data akan memudahkan model untuk
membedakan kelas. Feature Engineering juga merupakan teknik yang paling penting
untuk mencapai hasil yang baik pada tugas prekdiksi. Namun, sulit untuk dipelajari dan
dikuasai karena kumpulan data dan jenis data yang berbeda memerlukan pedekatan
teknik yang berbeda juga. Algoritma yang digunakan pada Feature Engineering dapat
menemukan pola umum yang penting untuk membedakan antara kelas.
Ekstraksi fitur otomatis merupakan keunggulan deep learning dibanding dengan
algoritma machine learning terdahulu . ekstrasi fitur mengutamakan pemberian label
pada dataset yang ada dalam proses jaringan.
Secara historis, pelatihan machine learning menghabiskan berbulan-bulan,
bertahun-tahun, bahkan puluhan tahun dalam pembuatan set fitur lengkap untuk
klasifikasi data secara manual. Deep learning merupakan algoritma paling akurat
sejauh ini (Patterson & Gibson, 2017)
2.7 Jaringan Syaraf Tiruan / Artificial Neural Network (ANN)
Jaringan Syaraf Tiruan / Artificial Neural Network (ANN) merupakan metode
yang biasanya digunakan dalam peramalan maupun pengenalan pola. Pada peramalan
17
UIN Syarif Hidayatullah Jakarta
jaringan syaraf tiruan biasa digunakan sebagai peramalan nilai tukar mata uang asing,
peramalan harga saham, peramalan cuaca dan lain sebagainya, sedangkan untuk
pengenalan pola biasanya jaringan syaraf tiruan digunakan untuk pengenalan pola
huruf, pola tanda tangan hingga pola suara serta wajah (Kartika et al., 2016)
Berdasarkan (Nurhikmat, 2018), ANN merupakan sistem adatif yang dapat
mengubah strukturnya untuk memecahkan suatu masalah berdasarkan informasi
internal maupun eksternal. Menurut Pham dalam jurnal Hermantoro (Pham, 1994)
mengatakan bahwa ANN bersifat fleksibel terhadap inputan data dan menghasilkan
output respon konsisten. ANN telah banyak digunakan dalam area yang luas. Menurut
Kumar & Haynes (Kumar, 2003) dalam jurnal Ulil Hamida (Hamida, 2014)
menjelaskan, penerapan ANN dapat mengidentifikasi beberapa aplikasi yaitu:
• Estimasi/prediksi (aproksimasi fungsi, peramalah)
• Pengenalan Pola (klasifikasi, diagnosis, dan analisis diskriminan)
• Klustering (pengelompokan tanpa adanya pengetahuan sebelumnya)
2.8 Convolutional Neural Network (CNN)
Convolutional Neural Network (CNN) adalah arsitektur deep learning yang
terkenal yang terinspirasi oleh mekanisme persepsi visual makhluk hidup di alam. Pada
tahun 1959, Hubel & Wiesel menemukan bahwa sel-sel pada hewan visual cortex
bertanggung jawab untuk mendeteksi cahaya pada bidang reseptif. Terinspirasi oleh
penemuan ini, Kunihiko Fukushima menguslkan teori neocognitron pada tahun 1980,
yang dainggap sebagai pendahulu CNN. Pada tahun 1990, LeCun dkk. menerbitkan
jurnal yang membentuk kerangka kerja modern dari CNN, dan kemudian
memperbaikinya lagi pada tahun 1998. Mereka mengembangkan jaringan saraf tiruan
multi-layer yang disebut LeNet-5 yang dapat mengklasifikasikan digit tulisan tangan.
Dimulai pada tahun 1990 sebuah studi paralel oleh Zhang dkk. menggunakan Shift-
Invariant Artificial Neural Network (SIANN) untuk mengenali karakter dari sebuah
18
UIN Syarif Hidayatullah Jakarta
gambar. Namun, karena kurangnya data training yang besar dan daya komputasi pada
waktu itu, jaringan mereka tidak dapat bekerja dengan baik pada masalah yang lebih
kompleks, mis., klasifikasi gambar dan video skala besar.
Sejak 2006, banyak metode telah dikembangkan untuk mengatasi kesulitan yang
dihadapi dalam pelatihan mendalam pada CNN. Paling menonjol pada tahun 2012,
Krizhevsky dkk. Mengusulkan arsitektur CNN klasik dan menunjukkan perbaikan
yang signifikan dari metode sebelumnya pada pengklasifikasian gambar. Keseluruhan
arsitektur dari metode mereka dikenal dengan sebutan AlexNet, mirip dengan LeNet-
5 tetapi dengan struktur yang lebih dalam. Dengan keberhasilan AlexNet, banyak karya
telah diusulkan untuk meningkatkan kinerja CNN. (J Gu et al, 2015)
CNN temasuk kedalam kategori metode neural network. CNN tidak hanya dapat
mempelajari representasi fitur gambar secara otomatis, tetapi CNN juga mengungguli
banyak teknik buatan konvensional lainnya. (Sang et al., 2017)
Model neural network memiliki representasi data hirarkis dan bergantung pada
perhitungan layer yang memiliki implementasi berurutan, output layer sebelumnya
akan menjadi input layer berikutnya. Setiap layer memberikan satu level representasi.
Dan, ada satu set bobot yang mengukur parameter layer. Dan juga, unit input terhubung
ke unit output melalui bobot di samping sekelompok bias. Bobot dalam CNN,
dibagikan secara lokal, yang berarti bahwa setiap lokasi input memiliki bobot yang
sama. Bentuk filter berdasarkan bobot yang dikaitkan dengan output yang sama.
(Romero et al, 2016)
19
UIN Syarif Hidayatullah Jakarta
Gambar 2.3 Contoh Jaringan Convolutional Neural Network (CNN)
Sumber: cs23ln.github.io
Pada gambar diatas menunjukkan setiap lapisan input yang dimasukkan memiliki
volume yang berbeda dan mewakili dengan kedalaman, tinggi dan lebar. Setiap besaran
yang didapatkan tergantung dari hasil filtrasi dari lapisan sebelumnya dan juga banyak
filter yang digunakan. Model jaringan seperti ini sudah terbukti sangat ampuh dalam
menangani permasalahan klasifikasi citra.
2.8.1 Arsitektur Jaringan CNN
Pada neural network, neuron dikumpulkan dalam lapisan-lapisan (layers)
yan disebut denan lapisan neuron (neuron layers). Neuron-neuron pada satu
lapisan dihubungkan dengan lapisan sebelumnya dan sesudahnya, kecuali pada
lapisan input dan output. Lapisan diantara lapisan biasa disebut dengan lapisan
tersembunyi atau hidden layer. Perambatan juga bisa dilakukan pada arah
sebaliknya tergantungg pada algoritma pembelajaran yang dipakai.
Faktor terpenting dalam menentukan sifat suatu neuron adalah pola bobot
(weights) dan fungsi aktivitas dari neuron tersebut. Pada setiap lapisan yang
sama, neuron-neuron memiliki fungsi aktivitas yang sama.
Arsitektur neural network biasa dibagi berdasarkan jumlah lapisannya
menjadi:
1. Jaringan dengan lapisan tunggal (Single layer network).
Jaringan dengan lapisan tunggal adalah sebuah jaringan dengan
semua input terhubung langsung pada output tanpa melewati lapisan
tersembunyi.
20
UIN Syarif Hidayatullah Jakarta
2. Jaringan dengan banyak lapisan (multi-layer networks)
Jaringan dengan lapis banyak memiliki satu atau lebih lapisan
tersembunyi di antara lapisan input dan output.
Convolutional Neural Network (CNN) merupakan multi-layer networks
yang terdiri dari alternating layer yang secara local terhubung pada
convolutional layer dimana setiap layer memiliki jumlah filter yang sama.
Downsampling layer dan fully connected layer berfungsi sebagai classifier.(Al-
Waisy et al., 2017)
Gambar 2.4 Ilustrasi Arsitektur CNN
Sumber: (Al-Waisy et al., 2017)
Arsitektur CNN memiliki tiga konsep yang membuatnya efektif: local
receptive fields, weights sharing, dan downsampling operations. Local
receptive fields berisikan setiap neuron yang menerima input berupa porsi kecil
dari layer sebelumnya dan juga memiliki ukuran yang sama dari convolution
filter. Local receptive fields digunakan pada convolutional dan downsampling
layer. Weight sharing diterapkan pada convolutional layer untuk mengontrol
kapasitas dan mengurangi kompleksitas model. Terakhir, nonlinear
downsampling yang digunakan pada downsampling layer berfungsi untuk
mengurangi ukuran spasial gambar serta mengurangi jumlah parameter bebas
dari model. Konsep-konsep ini membantu CNN menjadi kuat dan efektif dalam
tugas-tugas pengenalan gambar.(Al-Waisy et al., 2017)
Berikut adalah penjelasan beberapa layer yang terdapat pada CNN:
21
UIN Syarif Hidayatullah Jakarta
1. Convolutional layer
Bobot pada layer ini terbuat dari satu set learnable filters yang
diproduksi secara acak dan dipelajari melalui algoritma back-
propagation. Feature map adalah hasil dari setiap filter yang
terhubung melalui sebuah gambar. Feature map juga memiliki
jumlah yang sama dari filter yang diterapkan pada layer tersebut. (Al-
Waisy et al., 2017)
Gambar 2.5 Feature Map
Sumber oreilly.com
Seperti yang telah diilustrasikan pada Gambar 2.2, convolutional
layer yang pertama berisikan 6 filter yang menghasilkan 6 feature
map yang disusun bersama. Setiap feature map mewakili fitur spesifik
dari gambar, misalnya represented points atau represented vertical
edges seperti yang diilustrasikan pada Gambar 2.3. Operasi
convolution dirumuskan sebagai berikut.
𝑥𝑗𝑙 = 𝑓 (∑ 𝑥𝑗
𝑙−1 ∗ 𝑘𝑖𝑗𝑙 + 𝑏𝑗
𝑙𝑖∈𝑀𝑗
) (1)
l = layer pada CNN
j = specific convolution feature map
22
UIN Syarif Hidayatullah Jakarta
f = fungsi aktivasi
𝑀𝑗 = selection of input maps
𝑘𝑖𝑗 = filter
𝑏𝑗 = feature map bias
2. Pooling layer
Layer ini mengimplementasikan operasi downsampling untuk
mengurangi ukuran spasial dari convolutional layer. Pertama, ukuran
pooling mask dan jenis operasi pooling harus ditentukan dan setelah
itu dapatditerapkan pada pooling layer.
Operasi pooling diimplementasikan pada nilai-nilai piksel yang
ditangkap oleh pooling mask, lalu dikalikan dengan trainable
coefficient, setelah itu ditambahkan ke trainable bias. Operasi
pooling dirumuskan sebagai berikut.
𝑥𝑗𝑙 = 𝑓(𝐵𝑗
𝑙𝑝𝑜𝑜𝑙(𝑥𝑗𝑙−𝑖) + 𝑏𝑗
𝑙) (2)
3. Full Connected layers
Layer ini digunakan untuk mengekstrak feature pada layer
sebelumnya untuk selanjutnya dilakunnya tugas klasifikasi. Hasil dari
convolutional atau pooling layer terakhir akan diberikan ke fully
connected layers seperti dalam jaringan sraf asli.
2.8.2 Fungsi Aktivasi
Fungsi aktivasi adalah fungsi non linear yang memungkinkan sebuah
neural network untuk dapat mentransformasikan data input menjadi dimensi
yang lebih tinggi sehingga dapat dilakukan hyperlane sederhana yang
memungkinkannya dilakukan klasifikasi.(Eka Putra, 2016)
Setiap fungsi aktivasi mengambil sebuah nilai dan melakukan operasi
matematika. Pada arsitektur CNN, fungsi aktivasi terletak pada perhitungan
23
UIN Syarif Hidayatullah Jakarta
−
akhir output feature map atau sesudah proses operasi convolution atau pooling
untuk menghasilkan suatu pola fitur.(Zufar & Setiyono, 2016)
Beberapa macam fungsi aktivasi yang sering digunakan dalam penelitian
CNN antara lain fungsi sigmoid, tanh, Rectified Liniear Unit (ReLU), Leaky
ReLU (LReLU), SGD dan SoftMax.
2.8.3 Learning Rate
Learning rate adalah salah satu hyper parameter yang sangat
mempengaruhi performa suatu model CNN. Dalam melakukan pencarian
learning rate yang tepat, digunakan suatu metode yang bernama cyclical
learning rates (Smith, 2017), dalam metode ini, akan dilakukan beberapa
epochs training, dengan learning rate yang dimulai dari nilai yang kecil, dan
setiap iterasi akan diperbesar learning rate-nya, setiap iterasi akan dilihat loss
yang didapat, dan jika loss yang didapat meningkat cukup drastis maka proses
pencarian akan diberhentikan. Berdasarkan data loss yang didapat, maka dipilih
learning rate sesaat sebelum loss memiliki nilai terendah.
Gambar 2.6 Plot learning rate terhadap loss
Dapat dilihat pada Gambar 3 bahwa pada saat learning rate berada pada
titik 1e 02 titik ini memiliki nilai loss terkecil kedua, maka titik ini cocok untuk
dipilih untuk menjadi learning rate. (Smith, 2017)
24
UIN Syarif Hidayatullah Jakarta
2.8.4 Data Augmentation/ Data Augmentasi
Augmentasi data adalah suatu proses dalam pengolahan data gambar,
augmentasi merupakan proses mengubah atau memodifikasi gambar
sedemikian rupa sehingga komputer akan mendeteksi bahwa gambar yang
diubah adalah gambar yang berbeda, namun manusia masih dapat mengetahui
bahwa gambar yang diubah tersebut adalah gambar yang sama (Perez & Wang,
2017). Augmentasi dapat meningkatkan akurasi dari model CNN yang dilatih
karena dengan augmentasi model mendapatkan data-data tambahan yang dapat
berguna untuk membuat model yang dapat melakukan generalisasi dengan
lebih baik. Salah satu jenis augmentasi yang umum dilakukan adalah dengan
melakukan perputaran gambar dengan besar tertentu, contoh dari penggunaan
augmentasi ini dapat dilihat pada Gambar 2.7
Dalam pembelajaran Deep Learning terdapat beberapa metode yaitu Artificial
Neural Network (ANN), Recurrent Neural Network (RNN) dan Convolutional Neural
Network (CNN). Berikut perbedaan antara beberapa metode tersebut:
Tabel 2.1 Perbandingan ANN, CNN dan RNN
Perbedaan ANN CNN RNN
Tipe data Tabular Data, Text
data
Image Data Sequence Data
Gambar 2.7 Augmentasi dengan perputaran
gambar maksimal 90 °
25
UIN Syarif Hidayatullah Jakarta
Parameter Sharing No Yes Yes
Fixed Length input Yes Yes No
Recurrent
Connections
No No Yes
Vanishing dan
Exploding
Gradient
Yes Yes Yes
Spatial
Relationship
No Yes No
Performa ANN dianggap
kurang powerful
dibandingkan
CNN dan RNN.
CNN dianggap
lebih powerful
dibandingkan
ANN dan RNN.
RNN mencakup
lebih sedikit
kompabilitas fitur
dibandingkan
dengan CNN.
Pengaplikasian Facial Recognition
dan Computer
Vision
Facial
Recognition,
Image
Classification dan
Natural Language
Processing.
Text-to-Speech
Conversion.
Keuntungan Memiliki Fault
Tolerance,
kemampuan untuk
bekerja denan
pengetahuan yang
tidak lengkap.
Memiliki akurasi
yan tinggi dalam
pengenalan
gambar dan weight
sharing
Mampu mengingat
setiap informasi,
time series
prediction.
26
UIN Syarif Hidayatullah Jakarta
Kekurangan Bergantung kepada
perangkat keras
yang digunakan,
perilaku jaringan
tidak dapat
dijelaskan.
Membutuhkan data
pelatihan yang
besar.
Gradient vanishing
dan exploding
gradient.
2.9 Precision dan Recall
Precision adalah tingkat ketepatan antara informasi yang diminta oleh pengguna
dengan jawaban yang diberikan oleh sistem. Sedangkan recall adalah tingkat
keberhasilan sistem dalam menemukan kembali sebuah informasi. Gunanya fungsi ini
agar akurasi model tidak serta merta dipercaya namun cukup dapat
dipertanggungjawabkan kebenarannya karena melihat akurasi model dari sisi lain.
2.10 Epoch
Epoch adalah ketika seluruh dataset sudah melalui proses training pada Neural
Netwok sampai dikembalikan ke awal untuk sekali putaran, karena satu Epoch terlalu
besar untuk dimasukkan (feeding) kedalam komputer maka dari itu kita perlu
membaginya kedalam satuan kecil (batches). Didalam epoch inilah tiap bobot/ weight
ditambahkan.
2.11 ResNet
Residual neural network atau yang biasa disebut sebagai Resnet adalah salah satu
jenis arsitektur yang cukup populer, arsitektur ini dibuat oleh (He et al., 2015).
Arsitektur ini cukup revolusioner pada saat itu karena arsitektur ini menjadi state of the
art pada saat itu tidak hanya dalam klasifikasi, namun dalam semua kategori termasuk
object detection, dan semantic segmentation. Arsitektur CNN yang memiliki
kedalaman tinggi adalah salah satu hal penting dalam membangun model CNN yang
memiliki performa yang baik, namun model CNN yang memiliki kedalaman yang
27
UIN Syarif Hidayatullah Jakarta
tinggi juga memiliki masalah, yaitu vanishing gradient problem, yaitu suatu keadaan
dimana hasil gradien yang dipelajari oleh model, tidak dapat mencapai layer pertama
karena mengalami perkalian berkali-kali sehingga layer pertama tidak menerima
gradien apa-apa, atau secara singkatnya, hal ini menyebabkan suatu CNN tidak dapat
belajar dari error yang telah dikalkulasi. Resnet memiliki berbagai macam jenis
arsitektur, mulai dari 18, 34, 50, 101, sampai 152 layer (He et al., 2015). Pada penelitian
ini digunakan arsitektur Resnet34, yaitu arsitektur resnet yang memiliki 34 layer,
arsitektur ini dipilih karena arsitektur ini memiliki performa yang baik pada kompetisi
ILSVRC (He et al., 2015) dan karena keterbatasan hardware peneliti, maka arsitektur
yang dipilih hanya memiliki 34 layer. Dari dataset keseluruhan, akan digunakan data
training untuk melatih model CNN yang dibuat, dan data validasi untuk mengukur
performa model yang dibuat. Performa dari sistem yang dibangun akan diukur dengan
menggunakan metrik evaluasi akurasi, training loss, validation loss dan melihat matriks
kekeliruan. Metrik ini digunakan juga pada berbagai penelitian yang dilakukan dengan
CNN. (Krizhevsky et al., 2017)
Hal yang diusung oleh (He et al., 2015). pada saat itu adalah dengan
menggunakan sesuatu yang bernama residual block, blok ini adalah blok yang ada pada
tiap lapis arsitektur CNN Resnet dan menjadi fundamental dari arsitektur tersebut,
gambaran dari blok ini dapat dilihat pada Gambar 2.8
Gambar 2.8 Blok Residual
Sumber: (He et al., 2015)
28
UIN Syarif Hidayatullah Jakarta
Blok ini menambahkan suatu jalan pintas yang berfungsi sebagai fungsi identitas,
yang secara tidak langsung akan melewati proses training untuk satu layer atau lebih,
sehingga membuat sesuatu yang bernama residual block.
Gambar 2.9 Contoh arsitektur keseluruhan dari ResNet
Sumber: (He et al., 2015)
29
UIN Syarif Hidayatullah Jakarta
Penggunaan residual block dapat terlihat pada Gambar 2.9, dimana arsitektur
VGGnet berada pada paling kiri, arsitektur yang tanpa menggunakan residual block
terdapat pada bagian tengah, dan arsitektur yang menggunakan residual block terdapat
pada bagian paling kanan. Dapat dilihat bahwa dengan melewati beberapa layer,
arsitektur ini dapat mengatasi permasalah vanishing gradient problem karena gradien
dapat sampai kepada layer pertama tanpa harus melewati jumlah perkalian yang sama
dibandingkan dengan arsitektur yang sama tanpa menggunakan residual block.
S(i, j) = (I ∗K)(i, j) = ∑∑I(i + m, j + n)K(m, n) (3)
Pada baris pertama, hasil konvolusi akan membentuk filter sebanyak 64 buah,
operasi konvolusi dapat dilihat pada rumus (3) dimana setiap elemen yang pada matriks
I dan K mengalami perkalian matriks sehingga meng- hasilkan filter S. Pada tahap ini
model belum memasuki modul residual. Setelah tahap ini selesai, gambar akan
memasuki pooling layer, pooling layer adalah layer yang bertugas untuk mengurangi
resolusi dari suatu gambar yang telah diproses, pooling layer berfungsi untuk
mengurangi noise yang ada dalam gambar tersebut, terdapat dua jenis pooling yang
ada, yaitu max pooling dan average pooling, ilustrasi dari operasi ini dapat dilihat pada
Gambar 2.10, average pooling lebih umum digunakan pada berbagai macam arsitektur
CNN. (Krizhevsky et al., 2017)
30
UIN Syarif Hidayatullah Jakarta
Lalu tiga modul residual ditumpuk diatas masing-masing layer, dan setiap layer
akan mempelajari 128 filter untuk setiap proses konvolusi. Dimensi spasial dari gambar
akan berkurang, lalu akan ditumpuk kembali 4 buah modul residual, yang dimana
setiap modul akan mempelajari 256 filter. Tahap terakhir, kita akan mengurasi dimensi
spasialnya kembali dan masuk kepada tahap menumpuk 6 buah modul residual, dimana
setiap layer akan mempelajari 512 filter. Hasil dari setiap filter ini akan melewati
average pooling dan masuk ke dalam jaringan fully connected dengan fungsi aktivasi
softmax untuk diketahui hasil klasifikasi.
softmax(x)i = exp(xi)∑n j=1 exp(x j) (4)
Softmax adalah suatu fungsi yang biasanya digunakan untuk menghitung
probabilitas yang umum digunakan untuk melakukan klasifikasi multi kelas, nilai
softmax berada pada range 0 - 1 dan memiliki jumlah 1 jika seluruh elemennya
dijumlahkan (Goodfellow, 2016). Fungsi ini biasanya digunakan di ujung layer dari
fully connected layer yang digunak- an pada CNN untuk menghasilkan nilai
probabilitas suatu objek terhadap kelas yang ada. Rumus softmax dapat dilihat pada
Gambar 2.10 Ilustrasi operasi max pooling
dan average pooling pada CNN
31
UIN Syarif Hidayatullah Jakarta
(4), dimana kita akan menghitung nilai eksponen dari xi terhadap jumlah dari seluruh
nilai eksponen yang ada.
Untuk suatu model dapat memperbaiki dari kesalahan yang dibuat pada saat
training, digunakan fungsi cross entropy loss (5), dimana fungsi ini akan menghitung
kelas aktual ti berbanding dengan si yang akan menghitung jumlah log negatif dari
hasil perkalian nilai prediksi dikali kelas asli lalu dibagi dengan jumlah kelas.
CE = − ∑tilog(si) (5)
2.12 Python
Python merupakan salah satu contoh bahasa tingkat tinggi. Contoh lain bahasa
tingkat tinggi adalah Pascal, C++, Pert, Java, dan sebagainya. Sedangkan bahasa
tingkat rendah merupakan bahasa mesin atau bahasa assembly. Secara sederhana,
sebuah komputer hanya dapat mengeksekusi program yang ditulis dalam bentuk bahasa
mesin. Oleh karena itu, jika suatu program ditulis dalam bentuk bahasa tingkat tinggi,
maka program tersebut harus diproses dulu sebelum bisa dijalankan dalam komputer.
Hal ini merupakan salah satu kekurangan bahasa tingkat tinggi yang memerlukan
waktu untuk memproses suatu program sebelum program tersebut dijalankan. Akan
tetapi, bahasa tingkat tinggi mempunyai banyak sekali keuntungan. Bahasa tingkat
tinggi mudah dipelajari, mudah ditulis, mudah dibaca, dan tentu saja mudah dicari
kesalahannya. Bahasa tingkat tinggi juga mudah diubah portabel untuk disesuaikan
dengan mesin yang menjalankannya. Hal ini berbeda dengan bahasa mesin yang hanya
32
UIN Syarif Hidayatullah Jakarta
dapat digunakan untuk mesin tersebut. Dengan berbagai kelebihan ini, maka banyak
aplikasi ditulis menggunakan bahasa tingkat tinggi. Proses mengubah dad bentuk
bahasa tingkat tinggi ke tingkat rendah datam bahasa pemrograman ada dua tipe, yakni
interpreter dan compiler. (Utami, 2004)
2.13 Keras
Keras merupakan framework yang dibuat untuk mempermudah pembelajaran
terhadap komputer. Keras juga merupakan sebuah perangkat lunak yang berjalan diatas
platform Python untuk mendukung proses komputasi cerdas diantaranya adalah
jaringan Konvolusi. Keras diciptakan oleh Franchois Chollet. (Ilmiah et al., 2018)
Keras adalah API neural network berlevel tinggi yang ditulis dengan bahasa
pemrograman Python. Keras dapat berjalan diatas Tensorflow, CNTK, atau Theano
sebagai backend. Keras dapat digunakan dalam penelitian deep learning yang
memerlukan pembuatan prototipe yang mudah dan cepat dan user friendly. Selain itu
Keras juga mendukung komputasi pada Convolutional Neural Network dan Reccurent
Neural Network ataupun kombinasi dari keduanya. Keras dapat berjalan dengan baik
pada CPU maupun GPU. Keras kompatibel dengan Python versi 2.7 sampai versi 3.8
(Keras.io.).
2.14 Tensorflow
TensorFlow adalah perpustaka perangkat lunak, yang dikembangkan oleh Tim
Google Brain dalam organisasi penelitian Mesin Cerdas Google, untuk tujuan
melakukan pembelajaran mesin dan penelitian jaringan syaraf dalam. TensorFlow
kemudian menggabungkan aljabar komputasi teknik pengoptimalan kompilasi,
mempermudah penghitungan banyak ekspresi matematis dimana masalahnya adalah
waktu yang dibutuhkan untuk melakukan perhitungan.
Fitur utamanya meliputi:
33
UIN Syarif Hidayatullah Jakarta
1. Mendefinisikan, mengoptimalkan, dan menghitung secara efisien ekspresi
matematis yang melibatkan array multi dimensi (tensors).
2. Pemrograman pendukung jaringan syaraf dalam dan teknik pembelajaran
mesin.
3. Penggunaan GPU yang transparan, mengotomatisasi manajemen dan
optimalisasi memori yang sama dan data yang digunakan. Tensorflow bisa menulis
kode yang sama dan menjalankannya baik di CPU atau GPU. Lebih khusus lagi,
TensorFlow akan mengetahui bagian perhitungan mana yang harus dipindahkan ke
GPU.
4. Skalabilitas komputasi yang tinggi di seluruh mesin dan kumpulan data yang
besar.
2.15 Open CV
OpenCV adalah sebuah library (perpustakaan) yang digunakan untuk mengolah
gambar dan video hingga kita mampu meng-ekstrak informasi didalamnya. OpenCV
dapat berjalan di berbagai bahasa pemograman, seperti C, C++, Java, Python, dan juga
support diberbagai platform seperti Windows, Linux, Mac OS, iOS dan Android. Salah
satu contoh sederhana dalam penggunaan OpenCV adalah bagaimana kita dengan
mudah bisa mendeteksi wajah dalam sebuah gambar.
2.16 OSEMN Framework
OSEMN Framework adalah model penelitan yang terstandarisasi dan diterima
secara luas dalam bidang data science. OSEMN dapat memecahkan masalah data
science dalam skala besar. (Byrne et al., 2017)
OSEMN memiliki langkah-langkah yang mudah dipahami dan konsisten secara
logis dari alur kerja pemrosesan data, diperkaya dengan instruksi tambahan, catatan
dan dokumen sampel, memastikan kinerja kegiatan dan pencapaian hasil yang sama
dari aktifitas dan pengguna yang berbeda. (Dineva & Atanasova, 2018)
34
UIN Syarif Hidayatullah Jakarta
Menurut (Kumari et al., 2020)terdapat 5 tahapan pada OSEMN yang juga sesuai
dengan namanya:
1. O(Obtain)/ Pengumpulan data
Mengumpulkan data dari sumber yang relevan. Pada tahap ini kita harus
mengetahui data apa saja yang diperlukan, darimana sumbernya, bagaimana
mengumpulkannya, dan bagaimana menyiapkan datanya agar memenuhi
hasil yang diinginkan.
2. S(Scrub)/ Data Preparation
Pada tahap ini, data yang sudah dikumpulkan akan di bersihkan dan di filter
menjadi format yang dapat dimengerti mesin. Biasanya tahap ini meliputi:
- Handling missing data
- Correcting invalid values
- Removing duplicates
- Structuring the data to be fed in algorithm
- Feature engineering
3. E(Explore)/ Ekplorasi data
Pada tahap ini, data akan di eksplorasi dan menentukan karateristik dari data
tersebut. Kemudian data akan di ekstrak atribut dan variabel ujinya yang
kemudian akan dimasukkan ke tahap pemodelan.
4. M(Model)/Tahap Pemodelan
Pada tahap ini, data yang sudah di ekstrak akan masuk ke tahap pemodelan.
Pemodelan dibuat untuk menghasilkan parameter dan fitur data yang akan
digunakan pada tahap prediksi sebagai output.
5. N(iNterpreting)/Menginterpretasikan hasil
Tahap ini adalah tahap mengintrepretasikan hasil prediksi dan memberikan
hasil sedemikian rupa berupa presentasi data.
35
UIN Syarif Hidayatullah Jakarta
2.17 Studi Literatur Sejenis
Studi literatur di ambil dari beberapa skripsi dan jurnal yang berhubungan dengan
penelitian. Setiap literatur akan dibahas satu persatu secara singkat tentang judul, tools
dan hasil dari setiap penelitian.
• Pada penelitian yang berjudul “Comparison of Convolutional Neural
Network Architectures for Classification of Tomato Plant Diseases”
tahun 2020, yang ditulis oleh Valeria Maeda-Gutierrez dkk bertujuan
untuk membandingkan arsitektur CNN dalam klasifikasi Plant Diseases.
Penelitian ini membandingkan dan menguji arsitektur AlexNet,
GoogleNet, Inception V3, dan ResNet. Dan menghasilkan tingkat akurasi
seperti gambar dibawah:
Gambar 2.11 Hasil Penelitian Literatur 1
Penelitian ini menyimpulkan bahwa penggunaan arsitektur ResNet
memiliki tingkat akurasi yang sangat bagus dalam klasifikasi Tomato
Plant Diseases.
• Pada penelitian yang berjudul “Klasifikasi Citra Multi-Kelas
Menggunakan Convolutional Neural Network” tahun 2019, yang ditulis
oleh Kamal Hasan Mahmud, Adiwijaya dan Said Alfaraby bertujuan
untuk mengetahui strategi pembelajaran CNN yang memiliki performa
terbaik dengan berbagai skenario dalam klasifikasi citra dengan 100
kelas. Penelitian ini menyimpulkan bahwa arsitektur ResNet memiliki
nilai akurasi terbaik dari yang lainnya dengan nilai akurasi 75,82%.
36
UIN Syarif Hidayatullah Jakarta
• Pada penelitian yang berjudul “Malaria Parasite Detection from
Peripheral Blood Smear Images Using Deep Belief Networks” tahun
2017, yang ditulis oleh Dhanya Bibin, Madhu S. Nair dan P. Punitha
bertujuan untuk mengidentifikasi parasit malaria dalam sel darah manusia
menggunakan Deep Belief Networks (DBN). Penelitian ini menggunakan
model DBN dengan arsitektur 484-600-600-600-2. Penelitian ini
menghasilkan nilai akurasi 96,35%.
• Pada penelitian yang berjudul “Analysing TB Severity Levels With An
Enhanced Deep Residual Learning – Depth-Resnet” tahun 2018, yang
ditulis oleh Xiaohong Gao, Carl James-Reynolds, Ed Currie bertujuan
untuk menganalisis TB Severity Levels menggunakan arsitektur ResNet.
Penelitian ini menggunakan dataset dengan 5 kategori. Data di pre-proses
menjadi 128x128 piksel. Penelitian ini menghasilkan nilai akurasi seperti
gambar dibawah:
Gambar 2.12 Hasil Penelitian Literatur 4
• Pada penelitian yang berjudul “Data Science in biomedicine” tahun 2019,
yang ditulis oleh Yovaninna Alarcon-Soto dkk bertujuan untuk
menunjukkan tugas Data Science dalam pengolahan data Biomedicine.
Pada penelitian ini menunjukkan bahwa Data Science dapat digunakan
dalam pengolahan data biologikal dan penelitian medis lainnya.
Tabel 2.2 Perbandingan Penelitian sejenis
No. Penulis Judul Data
Science
CNN Transfer
Learning
Malaria
37
UIN Syarif Hidayatullah Jakarta
1 (Maeda-
Gutiérrez
et al.,
2020)
Comparison of
Convolutional
Neural Network
Architectures for
Classification of
Tomato
Plant Diseases
2 (Kamal
Hasan et
al., 2019)
Klasifikasi Citra
Multi-Kelas
Menggunakan
Convolutional
Neural Network
3 (Bibin et
al., 2017)
Malaria Parasite
Detection from
Peripheral Blood
Smear Images
Using Deep Belief
Networks
4 (Gao et al.,
2018)
Analysing TB
Severity Levels
With An Enhanced
Deep Residual
Learning
– Depth-Resnet
5 (Alarcón-
Soto et al.,
2019)
Data Science in
biomedicine
38
UIN Syarif Hidayatullah Jakarta
6 (Rais
Amin,
2020)
Penerapan Metode
Convolutional
Neural Network
Pada Pendeteksi
Parasit Malaria
Dalam Sel Darah
Manusia
39
BAB III
METODOLOGI PENELITIAN
Pada proses perancangan sistem, dibuatlah kerangka kerja dalam bentuk skema.
Metodologi penelitian dijadikan panduan untuk menentukan tahap-tahap yang harus
dilakukan. Tahap-tahap tersebut meliputi:
3.1 Metode Pengumpulan Data
3.1.1 Studi pustaka
Salah satu metode pengumpulan data yang penulis lakukan pada pembuatan
sistem ini adalah studi pustaka. Studi pustaka dilakukan dengan cara membaca,
mengutip, mengolah informasi yang berkaitan dengan pembuatan sistem, serta
membuat catatan yang bersumber pada bahan-bahan pustaka yang mendukung dan
berkaitan dengan pembuatan sistem ini. Sumber-sumber yang penulis kumpulkan
dan pelajari berupa data dan informasi definisi yang terdapat pada beberapa jurnal
dan buku yang terkait dengan penelitian dan pembuatan sistem ini serta dari
beberapa situs online yang terpercaya. Sumber-sumber tersebut diperlukan penulis
untuk membantu penyelesaian pada bab pendahuluan, landasan teori dan metode
penelitian.
3.2 OSEMN Framework
Dalam penelitian ini, penulis menggunakan OSEMN Framework dalam
pegolahan Data Science. Berikut ini merupakan langkah-langkah pada OSEMN
Framework:
3.2.1 Obtain(Pengumpulan data)
Pada tahap ini, penulis melakukan pengumpulan data masukan yang dibutuhkan
untuk membuat model sistem ini. Data yang dikumpulkan berupa gambar parasitized
dan Uninfected berdasarkan kelas yang penulis batasi pada penelitian ini. Data tersebut
40
UIN Syarif Hidayatullah Jakarta
penulis kumpulkan dari sumber internet. Data berupa kumpulan gambar sel yang
terinfksi parasit malaria dan yang tidak terinfeksi.
3.2.2 Scrub(Data Preparation)
Setelah seluruh data gambar berhasil dikumpulkan, data gambar tersebut
nantinya akan dibagi menjadi data latih, data uji dan data validasi pada proses
pembuatan model untuk mencapai nilai akurasi yang diinginkan, setelah data dilatih
dan diuji, dan telah mendapatkan nilai akurasi yang sesuai kemudian dibuatkan model
dengan metode Convolutional Recurrent Neural.
3.2.3 Explore(Eksplorasi data)
Data yang sudah ada kemudian masuk ke tahap eksplorasi data. Data-data yang
ada akan diubah ukurannya menjadi lebih kecil dari dataset aslinya. Data yang telah
diubah ukurannya kemudian melalui proses segmentasi citra dimana data diproses
untuk menentukan deteksi tepi, yang bertujuan untuk mengenali objek dan fitur yang
ada dalam data.
3.2.4 Modelling(Perancangan Model)
Pada tahap ini penulis melakukan pembuatan model dari dataset yang ada untuk
mengenali gambar dan proses klasifikasi menggunakan algoritma atau metode
Convolutional Neural Network dengan menggunakan arsitektur ResNet agar sistem
dapat mendeteksi parasit malaria.
3.2.5 iNterpreting(Mengintrepretasikan hasil)
Pada tahap ini akan meninterpretasikan hasil pemodelan yang telah dilakukan
yaitu hasil akurasi pengujian model dan visualisasi hasil prediksi pendeteksi parasit
malaria.
41
UIN Syarif Hidayatullah Jakarta
3.3 Kerangka Berpikir
Mulai
Studi Pustaka
Perumusan masalah
Scrub Obtain Explore Modelling iNterpreting
- Menentukan
Konsep Penelitian
- Mengumpulkan
data
Split dataset &
menyamakan
semua ukuran
gambar
Membuat
model
sistem
pendeteksi
parasit
malaria
-Membuat
kategori data
-Ekstrak fitur
data dan
augmentasi
- Menampilkan hasil
uji validasi dan
akurasi
- Menampilkan hasil
prediksi sistem
OSEMN Framework
Kesimpulan
Selesai
Gambar 3.1 Kerangka Berpikir Penelitian
42
BAB IV
IMPLEMENTASI
Pada bab ini akan dilakukan implementasi dan pembahasan dalam perancangan
sistem secara bertahap sesuai dengan metode penelitian yang digunakan selama
perancangan pembuatan sistem, yaitu menggunakan OSEMN Framework.
4.1 Obtain(Pengumpulan data)
Pengumpulan data dan informasi yang penulis lakukan yaitu dengan
menggunakan studi pustaka dan mendapatkan hasil berupa dataset yang diambil dari
National Library of Medicine yang dikembangkan oleh Stefan Jaeger pada tahun 2018
ftp://lhcftp.nlm.nih.gov/Open-Access-Datasets/Malaria/cell_images.zip yang dapat
diakses bebas untuk kepentingan pengembangan aplikasi dan pembelajaran. Dataset
ini nantinya akan digunakan sebagai data input sistem prediksi parasit malaria.
Dataset terdiri dari 27.558 gambar sel yang terbagi kedalam dua kategori yaitu
parasitized dan uninfected. Setiap kategori terdiri dari 13.779 gambar sel.
4.2 Scrub(Data Preparation)
Setelah data berhasil dikumpulkan, kemudian data tersebut dilanjutkan ke tahap
data preparation.
43
UIN Syarif Hidayatullah Jakarta
Gambar 4.1 tree susunan folder project
Setelah kita membuat susunan folder project, selanjutnya kita akan membuat
konfigurasi untuk membaca path folder dataset dengan ratio data training 80%,
validation data 10% .
Gambar 4.2 Konfigurasi pembagian dataset
Pada penentuan rasio pembagian dataset ini, untuk rasio pembagian data training
dan data testing menggunakan metode Simple Hold-Out Validation (Chollet, 2018),
metode ini menjadi acuan standar dalam pembagian data training dan testing dengan
44
UIN Syarif Hidayatullah Jakarta
rasio 80:20 dan untuk rasio pembagian data training dan data validation berdasarkan
penelitian (Akromunnisa et al., 2019) yang membandingkan antara nilai split 6:4, 7:3,
8:2 dan 9:1. Dari penelitian tersebut disimpulkan bahwa rasio 9:1 menghasilkan nilai
akurasi yang lebih besar dari rasio yang lainnya.
Kemudian data dibagi menjadi 3 folder training, testing dan validation dan semua
gambar diberikan label sesuai dengan folder yang telah dibuat.
45
UIN Syarif Hidayatullah Jakarta
Gambar 4.3 Source code pembagian dataset
4.3 Explore(Eksplorasi data)
Pada tahap ini, semua data yang telah dikumpulkan dan dibagi menjadi folder
training, testing dan validation di samakan seluruh ukuran yaitu 64x64 piksel dan
kategori warnanya yaitu “rgb”(“red”,”green”,”blue”) kemudian diberikan label
kategori “categorial” yang dikarenakan setiap folder berisikan dua kelas kategori yaitu
“Parasitized” dan “Uninfected”. Kemudian untuk data pada folder training akan di
augmentasikan menggunakan modul Keras ImageDataGenerator. Data training di
augmentasi dengan mengubah skala gambar dengan skala 1/255, dan gambar di rotasi
46
UIN Syarif Hidayatullah Jakarta
dengan range=20, dan zoom range=0.05, width shift range=0.05, height shift
range=0.05, shear range=0.05 dan data gambar di flip secara horizontal. Kemudian
data pada folder validation akan di augmentasikan juga menggunakan modul Keras
ImageDataGenerator dengan mengubah skala gambar menjadi 1/255. Data pada
validation ini tidak dirotasi dan di flip dikarenakan nantinya akan digunakan sebagai
uji validasi model data training yang sudah diubah dengan data validation yang skala
gambarnya sama. Data pada folder testing tidak di augmentasikan dikarenakan
nantinya akan digunakan sebagai data uji tahap prediksi model terhadap data yang asli.
Berikut adalah source code pada tahap eksplorasi data ini:
Gambar 4.4 Source Code Data augmentation
4.4 Modelling(Perancangan Model)
Kemudian dilakukan pembuatan pemodelan arsitektur CNN, dimana penulis
disini menggunakan arsitektur ResNet.
47
UIN Syarif Hidayatullah Jakarta
48
UIN Syarif Hidayatullah Jakarta
Gambar 4.5 Arsitektur model ResNet
Setelah pembuatan arsitektur model resnet, maka selanjutnya adalah melatih
model yang nantinya akan digunakan pada tahap prediksi yang disimpan dalam
malaria_model.h5.
49
UIN Syarif Hidayatullah Jakarta
Gambar 4.6 Source code pelatihan model
Dalam proses ini model akan dilatih dengan mengoptimalkan multinomial
logistic regression menggunakan Stochastic Gradient Descent (SGD) (Lecun et al.,
2015) dan nilai momentum Nesterov (Botev et al., 2017). Model yang disesuaikan
dioptimalkan untuk hiper-parameter dengan metode pencarian grid search (Bergstra &
Bengio, 2012).
Pada proses pelatihan model ini akan digunakan arsitektur model ResNet yang
telah dibuat yang diberi nilai input_shape= 64x64 pixel, 3 channel gambar RGB
(“red”,”green”,”blue”), nilai kelas 2 dimana pada dataset memiliki 2 kelas,
kernel_size=(3 , 4 , 6) dan dengan nilai regression=0.0005. Penentuan nilai dari epoch
untuk pelatihan model adalah 50 yang dimana suatu perulangan dari proses pelatihan
pada satu kali sesi lewatan sebanyak 50 kali guna mendapatkan error terkecil dan
menghasilkan kinerja yang baik untuk model yang dibuat. Sedangkan untuk kategori
loss yang digunakan adalah 'binary_crossentropy', dan untuk optimizer menggunakan
'SGD' dengan nilai learning rate = 1e-1 dan nilai momentum= 0.9.
50
UIN Syarif Hidayatullah Jakarta
4.5 iNterpreting(Mengintrepretasikan hasil)
Tahap ini akan menginterpretasikan hasil dari pengujian dari model yang telah
dibuat. Hasil yang akan diinterpretasikan berupa uji akurasi prediksi model terhadap
data testing dan visualisasi sistem prediksi yang dibuat.
Berikut adalah source code yang dibuat untuk menguji akurasi:
Gambar 4.7 Source code pengujian akurasi prediksi
Pada pengujian akurasi prediksi ini model yang telah tersimpan dalam
malaria_model.h5 akan di evaluasi dengan cara pembuatan prediksi pada data yang
terdapat pada folder testing dan selanjutnya dapat menentukan label dengan
probabilitas yang terbesar untuk setiap gambar yang ada. Dan hasil prediksi model ini
akan disimpan ke dalam prediction_model.h5.
Hasil model prediksi yang tersimpan dalam prediction_model.h5 selanjutnya
akan digunakan dalam visualisasi hasil prediksi sistem terhadap gambar sel yang ada
pada data testing. Berikut adalah source code untuk menampilkan hasil visualisasi
prediksi gambar sel.
51
UIN Syarif Hidayatullah Jakarta
Gambar 4.8 Source code untuk menampilkan visualisasi hasil prediksi gambar sel
Pada proses menampilkan visualisasi hasil prediksi ini, data input berupa data
gambar dari folder testing yang berisikan 5.512 gambar yang tergolong kedalam 2 kelas
dengan masing-masing kelas terdapat 2.786 gambar Uninfected dan 2.726 gambar
Parasitized. Data input dibaca menggunakan modul OpenCV cv2.imread, data diubah
kedalam bentuk RGB dan di resize menjadi 64x64 piksel dengan tipe data “float”
dengan skala gambar 1/255. Kemudian data diubah kedalam bentuk array guna
memudahkan proses prediksi kedalam bentuk matriks. Data yang telah diubah tersebut
52
UIN Syarif Hidayatullah Jakarta
akan diberi label “Parasitized” jika nilai prediksi = 0 dan label “Uninfected” jika nilai
prediksi = 1.
53
BAB V
HASIL DAN PEMBAHASAN
5.1 Pembagian training, test dan validation dataset
Setelah dataset telah terkumpul dan telah melalui tahap preprocessing,
selanjutnya dataset dibagi menjadi 3 folder training, testing dan validation. Yang
nantinya akan digunakan dalam proses modeling, pengujian dan prediksi.
Gambar 5.1 Dataset Malaria
Pembagian dataset menggunakan split data dengan persentase 80% untuk data
training dan 20 % untuk data testing guna proses modeling dan pegujian sistem dan
selajuntnya data validation berupa 10% dari data training guna proses prediksi.
Semua data pada folder training, testing dan validation dilabelkan dengan dua
kategori yaitu “0” untuk parasitized dan “1” untuk uninfected.
Berikut adalah sebaran data yang terdapat pada folder training, validation dan
testing:
54
UIN Syarif Hidayatullah Jakarta
Tabel 5.1 Sebaran data hasil pembagian dataset
No. Nama folder Kategori Jumlah data
Parasitized Uninfected
1. cell_images(dataset) 13779 13779 27558
2. training 9955 9887 19842
3. validation 1098 1106 2204
4. testing 2786 2726 5512
5.2 Arsitektur Jaringan
Setelah melalui tahap palabelan dan pengambilan data training dari dataset,
selanjutnya dataset akan dilatih menggunakan algoritma Convolutional Neural
Network (CNN). Dalam algoritma Convolutional Neural Network (CNN)
pembentukan arsitektur jaringan dapat mempengaruhi hasil dari akurasi model.
Pada proses pemodelan sistem penulis menggunakan arsitektur ResNet dan
dimodifikasi sesuai kebutuhan sistem.
Penelitian ini menggunakan input gambar dengan ukuran 64x64x3, tujuannya
adalah untuk membandingkan nilai akurasi berdasarkan ukuran gambarnya. Arsitektur
jaringan pada penelitian ini dijelaskan seperti penjelasan dibawah ini :
1. Proses Konvolusi pertama digunakan kernel berukuran 3x3 dan jumlah
filter sebanyak 64 filter , proses konvolusi ini adalah proses kombinasi
antara dua buah matriks yang berbeda untuk menghasilkan suatu nilai
matriks yang baru. Setelah proses konvolusi, maka ditambahkan sebuah
aktivasi fungsi yaitu RELU (Retrified Linear Unit). Fungsi aktivasi ini
bertujuan untuk mengubah nilai negative menjadi nol (menghilangkan
nilai negative dalam sebuah matriks hasil konvolusi). Hasil konvolusi ini
memiliki ukuran 64 x 64.
55
UIN Syarif Hidayatullah Jakarta
2. Proses pooling pertama. Penelitian ini menggunakan maxpooling untuk
mendapatkan nilai matriks yang baru hasil dari proses pooling.
Berdasarkan hasil pooling menghasilkan matriks baru berukuran 32x32
dari input hasil konvolusi pertama yang berukuran 64x64. Proses ini
menggunakan kernel pooling 3x3. Cara kerja maxpooling adalah
mengambil nilai paling maksimum berdasarkan pergeseran kernelnya
sebnayak nilai stridenya yaitu 2.
3. Proses Kovolusi kedua yaitu meneruskan hasil dari proses pooling
pertama yakni dengan input matriks gambar sebesar 32x32 pada 3 jumlah
filter yaitu 32, 32 dan 128 filter dan dengan ukuran kernel 3x3. Proses
konvolsi kedua ini sama-sama menggunakan fungsi aktivasi RELU.
Proses ini menghasilkan gambar berukuran 32x32.
4. Proses Kovolusi ketiga yaitu meneruskan hasil dari proses konvolusi
kedua yakni dengan input matriks gambar sebesar 32x32 pada 3 jumlah
filter yaitu 64, 64 dan 256 filter dan dengan ukuran kernel 4x4. Proses
konvolsi ketiga ini sama-sama menggunakan fungsi aktivasi RELU.
Proses ini menghasilkan gambar berukuran 16x16.
5. Proses Kovolusi keempat yaitu meneruskan hasil dari proses konvolusi
ketiga yakni dengan input matriks gambar sebesar 16x16 pada 3 jumlah
filter yaitu 128, 128 dan 512 filter dan dengan ukuran kernel 6x6. Proses
konvolusi keempat ini sama-sama menggunakan fungsi aktivasi RELU.
Proses ini menghasilkan gambar berukuran 8x8.
6. Proses selanjutnya masuk ke proses pooling yang kedua, proses ini
hampir sama dengan proses pooling yang pertama, namun pada proses ini
menggunakan average pooling dengan ukuran kernel 8x8. Proses ini
menghasilkan nilai output akhir dari matriksnya yaitu gambar berukuran
1x1.
56
UIN Syarif Hidayatullah Jakarta
7. Selanjutnya Flatten dan fully connected. Pada tahap ini digunakan hanya
satu hidden layer pada jaringan MLP (Multi Layer Perceptron). Flatten
disini mengubah output pooling layer menjadi sebuah vector.
8. Proses terakhir adalah menggunakan aktivasi fungsi Softmax. Fungsi ini
secara spesifiknya biasa digunakan pada metode klasifikasi multinomial
logistic regression dan multiclass linear discriminant analisys.
Berdasarkan uraian penjelasan dari arsitektur jaringan diatas, arsitektur tersebut
digunakan untuk proses training. Sehingga dari proses training didapatkan model dari
arsitektur tersebut. Berikut model yang terbentuk :
57
UIN Syarif Hidayatullah Jakarta
58
UIN Syarif Hidayatullah Jakarta
59
UIN Syarif Hidayatullah Jakarta
60
UIN Syarif Hidayatullah Jakarta
61
UIN Syarif Hidayatullah Jakarta
62
UIN Syarif Hidayatullah Jakarta
63
UIN Syarif Hidayatullah Jakarta
64
UIN Syarif Hidayatullah Jakarta
Gambar 5.2 Model yang terbentuk dari hasil training
65
UIN Syarif Hidayatullah Jakarta
Gambar 5.2 merupakan model yang terbentuk dari hasil training. Total parameter
yang terbentuk dari model sebanyak 2.164.174 neuron, dan parameter yang akan di
training sebanyak 2.150.472 neuron.
5.2.1 Proses Convolution Layer
Selanjutnya akan dibahas proses konvolusi yang terjadi berdasarkan arsitektur
jaringan yang telah dibahas diatas.
Konvolusi merupakan proses menggambungkan dua deret angka pada suatu
gambar sehingga menghasilkan deret angka yang baru, dengan kata lain gambar
tersebut dimanipulasi dengan menggunakan external mask / subwindows untuk
menghasilkan citra yang baru, angka konvolusi pada citra tersebut berbentuk matriks
array. Pada pemodelan ini digunakan input gambar dengan ukuran pixel 64x64x3, yang
menjelaskan ukuran tinggi dan lebar pixel gambar sebesar 64 pixel dan gambar input
tersebut memiliki 3 channel yaitu red, green, dan blue atau yang biasa disebut dengan
RGB.
Setiap channel piksel memiliki nilai matriks yang berbeda-beda. Input akan di
konvolusi dengan nilai filter yang sudah ditentukan. Filter merupakan blok lain atau
kubus dengan tinggi dan lebar yang lebih kecil namun kedalaman yang sama yang
tersapu di atas gambar dasar atau gambar asli. Filter digunakan untuk menentukan pola
apa yang akan dideteksi yang selanjutnya dikonvolusi atau dikalikan dengan nilai pada
matriks input, nilai pada masingmasing kolom dan baris pada matriks sangat bergantung
pada jenis pola yang akan dideteksi. Jumlah filter pada konvo ini sebanyak 64 dengan
ukuran kernel (3x3), ini artinya gambar yang dihasilkan dari hasil konvolusi akan
sebanyak 64 fitur map.
Berdasarkan arsitektur jaringan diatas digunakan aktivasi ReLU (Rectified
Linear Unit) setelah proses konvolusi. Fungsi dari aktivasi ini adalah melakukan
“treshold” dari 0 hingga infinity. Nilai yang ada pada hasil konvolusi yang bernilai
negatif akan diubah dengan aktivasi ini menjadi nol dan yang lainnya sampai infinity.
66
UIN Syarif Hidayatullah Jakarta
5.2.2 Proses Pooling
Pooling atau penggabungkan merupakan proses dari CNN dimana matriks input
disederhanakan menjadi matriks yang baru. Pada penelitian ini digunakan metode max
pooling dan average pooling pada proses poolingnya dimana diambil nilai terbesar dari
matriks input dan menghasilkan matriks baru sebagai outputnya.
5.2.3 Proses Fully Connected
Proses terakhir adalah fully-connected. Hasil dari proses terakhir dari model yang
ada pada feature extraction layer masih berbentuk multidimensional array, sehingga
harus dilakukan “flatten” atau reshape feature map menjadi sebuah vector agar bisa
digunakan sebagai input dari fully-connected layer. Setelah itu diberi fungsi dense.
Dense adalah fungsi untuk menambahkan layer pada fully connected.
Pada arsitektur jaringan ResNet ini menggunakan dense sebanyak 512 unit. Unit
tersebut artinya jumlah node yang harus ada di hidden layer, nilainya antara jumlah
input node dan output node. Fungsi dari fully connected layer ini adalah untuk
melakukan transformasi pada dimensi data agar data dapat diklasifikasikan secara
linear.
Kemudian di inialisasi layer outputnya, yang berupa 2 node, karena dalam
klasifikasi ini terdapat 2 kelas.
5.3 Akurasi
Setelah melewati tahap pemodelan, kemudian model tersebut diuji nilai akurasi
dan lossnya dengan menggunakan SGD optimizer dengan nilai learning rate = 1e-1
dan nilai momentum = 0.9.
67
UIN Syarif Hidayatullah Jakarta
Gambar 5.3 Uji Akurasi Model
Dengan menggunakan iterasi epoch sebanyak 50 kali selanjutnya didapatkan
hasil akurasi validasi sebagai berikut:
Epoch 50/50 620/620 [==============================] - 32s 522ms/step - loss: 0.1298 - accuracy: 0.973
- val_loss: 0.1392 - val_accuracy: 0.9623
Berdasarkan data diatas menunjukan hasil akurasi model, dapat diketahui besar
loss 12% dengan akurasi yang tinggi sebesar 97,3%. Sedangkan untuk data validasi,
nilai loss yaitu sebesar 13% dan akurasi sebesar 96,23%. Yang berarti menunjukkan
akurasi model sebesar 96,23%. Dengan hasil tersebut dapat dibuktikan bahwa
pemodelan berhasil dan sistem dapat dengan sangat baik membedakan data gambar
yang Parasitized dan Uninfected.
Berikut ini akan dipaparkan gambar grafik akurasi dan loss dari model training
dan validasi:
68
UIN Syarif Hidayatullah Jakarta
Gambar 5.4 Grafik model loss dan accuracy
Dari gambar 5.4 didapatkan hasil bahwa nilai akurasi training dan validasi
cenderung stabil dari setiap iterasi epochnya. Sedangkan untuk nilai loss training dan
validasi cenderung menurun dari setiap epochnya, hal ini menunjukkan hasil positif
dimana pada akhir pelatihan pemodelan berhasil mendapatkan akurasi yang sangat
bagus degan nilai loss yang sedikit.
5.4 Prediksi
Setelah pemodelan telah selesai dan tahap finalisasi, kemudian model tersebut
dihubungkan pada program prediksi agar dapat dijalankan, digunakan, dan diuji
dengan data pada folder testing yang berisikan 5.512 data gambar yang terbagi kedalam
2 folder parasitized yang berisikan 2.726 data gambar dan uninfected yang berisikan
2.786 data gambar . Dalam tahap pengujian model terhadap data pada gambar yang
69
UIN Syarif Hidayatullah Jakarta
terdapat pada folder testing menghasilkan nilai akurasi yang sangat bagus yaitu 97%,
dimana hasil ini sangat bagus yang membuktikan bahwa sistem dapat megenali dan
membedakan gambar yang Parasitized dan Uininfected.
Gambar 5.5 Hasil uji akurasi pada data testing
Dari data pada Gambar 5.5 didapatkan hasil bahwa dalam pengenalan dalam
kelas Parasitized tingkat akurasi pegenalan adalah 97 % dari data gambar sebanyak
2.726, dan tingkat akurasi yang sama 97 % pada pengenalan kelas Uninfected. Dan
rata-rata hasil dari kedua kelas tersebut adalah 97%. Data ini membuktikan bahwa
dalam pengenalan kelas Parasitized data yang berhasil di prediksi dengan benar adalah
sebanyak 2.644 data gambar, dan yang gagal adalah 82 data gambar. Sedangkan pada
kelas Uninfected data yang berhasil diprediksi dengan benar adalah sebanyak 2.702
data gambar dan yang gagal adalah sebanyak 84 data gambar.
Dari hasil tingkat akurasi pada penelitian ini, dapat dibandingkan dengan
beberapa literatur sejenis yang penelitiannya akan dijabarkan satu persatu berikut ini:
• Pada penelitian yang berjudul “Malaria Parasite Detection From
Peripheral Blood Smear Images Using Deep Belief Networks” pada
tahun 2017 yang ditulis oleh Dhanya Bibin, Madhu S. Nair dan P.
Punitha. Penelitian ini bertujuan untuk mendeteksi parasit malaria dalam
sel darah manusia menggunakan Deep Belief Network (DBN). Pada
penelitian ini model DBN bertujuan untuk mengklasifikasikan 4.100
gambar sel darah manusia ke dalam kelas parasit dan non-parasit.
70
UIN Syarif Hidayatullah Jakarta
Arsitektur DBN pada penelitian ini menggunakan 484 nodes visible layer
dan memiliki 2 kelas output layer dengan 4 lapisan hidden layer yang
mengandung 600 nodes pada setiap layernya. Penelitian ini menghasilkan
nilai akurasi sebesar 96,3% dalam dalam proses deteksi sel darah yang
mengandung parasit malaria dan yang tidak.
• Pada penelitian yang berjudul “Machine learning approach for
automated screening of malaria parasite using light microscopic
images” pada tahun 2013 yang ditulis oleh Dev Kumar Das, Madhumala
Ghosh, Malika Pal, Asok K. Maiti dan Chandan Chakraborty. Tujuan dari
penelitian ini adalah untuk membahas pengembangan karakterisasi dan
klasifikasi parasit malaria berbantuan komputer dengan menggunakan
pendekatan machine learning berdasarkan gambar mikroskopis cahaya
dari sel darah manusia. Penelitian ini menggunaka metode pembelajaran
Bayessian dan Support Machine Learning (SVM) dalam
pengklasifikasian parasit malaria. Hasil penelitian ini menunjukkan
bahwa metode Bayessian memiliki hasil akurasi tertinggi yaitu 84%
sementara SVM memiliki hasil akurasi 83,5%.
• Pada penelitian yang berjudul “Klasifikasi Jenis dan Fase Parasit
Malaria Plasmodium Falciparum dan Plasmodium Vivax Dalam Sel
Darah Merah Menggunakan Support Vector Machine. Penelitian ini
menggunaka metode pembelajaran Support Machine Learning (SVM)
dalam pengklasifikasian parasit malaria. Dalam pengklasifikasian kelas
parasit malaria, penelitian ini menghasilkan nilai akurasi 81,35%.
• Pada penelitian yang berjudul “Automated image processing method for
the diagnosis and classification of malaria on thin blood smears” pada
tahun 2006 yang ditulis oleh Nicholas E. Ross, Charles J. Pritchard,
David M. Robin dan Adriano G. Duse. Penelitian ini bertujuan untuk
menerapkan algoritma imge processing dalam pengidentifikasian parasit
71
UIN Syarif Hidayatullah Jakarta
malaria dalam sel darah manusia. Dalam pengklasifikasianya penelitian
ini menggunakan metode backpropogation feedforward neural network.
Penelitian ini mendapatkan hasil akurasi 73% dalam klasifikasi parasit
malaria.
Tabel 5.2 Perbandingan nilai Akurasi dengan literatur sejenis
No. Penelitian Akurasi
1. (Rais Amin, 2020) 97%
2. (Bibin et al., 2017) 96,3%
3. (Das et al., 2013) 84%
4. (Permata et al., 2012) 81,35%
5. (Ross et al., 2006) 73%
Kemudian data gambar hasil prediksi akan di visualisasikan berupa data sampel
gambar yang sudah diprediksi dan diberikan label pengenalan klasifikasi yaitu
Parasitized dan Uininfected.
72
UIN Syarif Hidayatullah Jakarta
Berikut adalah hasil visualisasi dari sampel proses prediksi sistem:
Gambar 5.6 Hasil prediksi sistem
73
BAB VI
PENUTUP
6.1 Kesimpulan
Berdasarkan pembahasan yang sudah diuraikan, maka dapat ditarik kesimpulan
sebagai berikut:
1. Model CNN yang menggunakan arsitektur jaringan ResNet pada penelitian
ini menggunakan input shape berukuran 64x64x3, ukuran filter 3x3, Jumlah
Epoch sebanyak 50. Data yang digunakan untuk proses training model
sebanyak 19.842 pada folder training dan 2.204 data pada folder validation.
Menghasilkan tingkat akurasi training dan validation dalam melakukan
deteksi parasit malaria sebesar 97,3% untuk training accuracy dan 96,23 %
untuk validation accuracy. Dengan hasil tersebut dapat dibuktikan bahwa
pemodelan berhasil dan sistem dapat dengan sangat baik membedakan data
gambar yang Parasitized dan Uninfected.
2. Penelitian ini menggunakan data testing sebanyak 5.512 gambar dimana per
kategori terdapat 2.726 gambar pada kelas Parasitized dan 2.786 gambar
pada kelas Uninfected untuk diujikan kedalam model yang telah dibuat.
Hasil testing menghasilkan tingkat akurasi baru dalam melakukan pendeteksi
parasit malaria sebesar 97 %. Dengan hasil tersebut dapat dibuktikan bahwa
pemodelan berhasil dan sistem menghasilkan tingkat akurasi yang sangat
baik dalam pengkategorian dan dapat dengan sangat baik membedakan dan
memberikan label yang benar pada data gambar yang Parasitized dan
Uninfected.
6.2 Saran
Adapun saran yang diberikan pada penulisan ini sebagai berikut:
1. Penelitian selanjutnya diharapkan dapat meningkatkan nilai akurasi pada
hasil training model.
74
UIN Syarif Hidayatullah Jakarta
2. Diharapkan penelitian ini dapat dikembangkan dan diaplikasikan pada
pengembangan Medical Image Analysis yang lainnya.
3. Membandingkan model arsitektur jaringan CNN lainnya untuk mengetahui
hasil maksimal dari sistem prediksi ini.
4. Penelitian ini dapat dikembangkan kedalam sebuah aplikasi berbasis web
maupun smartphone.
75
DAFTAR PUSTAKA
Ahmad, A. (2017). Mengenal Artificial Intelligence, Machine Learning, Neural
Network, dan Deep Learning. June.
Akromunnisa, K., Hidayat, R., Informatika, J. T., & Adisucipto, J. L. (2019).
KLASIFIKASI DOKUMEN TUGAS AKHIR (SKRIPSI) MENGGUNAKAN K-
NEAREST NEIGHBOR. 4(1), 69–75.
Al-Waisy, A. S., Qahwaji, R., Ipson, S., & Al-Fahdawi, S. (2017). A multimodal
biometrie system for personal identification based on deep learning approaches.
Proceedings - 2017 7th International Conference on Emerging Security
Technologies, EST 2017, September, 163–168.
https://doi.org/10.1109/EST.2017.8090417
Alarcón-Soto, Y., Espasandín-Domínguez, J., Guler, I., Conde-Amboage, M., Gude-
Sampedro, F., Langohr, K., Cadarso-Suárez, C., & Gómez-Melis, G. (2019). Data
Science in Biomedicine. September. http://arxiv.org/abs/1909.04486
Bergstra, J., & Bengio, Y. (2012). Random search for hyper-parameter optimization.
Journal of Machine Learning Research, 13, 281–305.
Bibin, D., Nair, M. S., & Punitha, P. (2017). Malaria Parasite Detection from Peripheral
Blood Smear Images Using Deep Belief Networks. IEEE Access, 5, 9099–9108.
https://doi.org/10.1109/ACCESS.2017.2705642
Botev, A., Lever, G., & Barber, D. (2017). Nesterov’s accelerated gradient and
momentum as approximations to regularised update descent. Proceedings of the
International Joint Conference on Neural Networks, 2017-May(2), 1899–1903.
https://doi.org/10.1109/IJCNN.2017.7966082
Bousetouane, F., & Morris, B. (2015). Off-the-Shelf CNN Features for Fine-Grained
76
UIN Syarif Hidayatullah Jakarta
Classification of Vessels in a Maritime Environment. Lecture Notes in Computer
Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture
Notes in Bioinformatics), 9475(1), 842–850. https://doi.org/10.1007/978-3-319-
27863-6
Byrne, C., Farnham, B., Tokyo, S., Boston, B., Sebastopol, F., & Beijing, T. (2017).
Development Workflows for Data Scientists. O’Reilly. http://oreilly.com/safari
Center for Disease Control and Prevention. (2018). CDC Parasites.
https://www.cdc.gov/parasites/malaria/index.html
Chollet, F. (2018). Deep Learning with Python. In 2018 21st International Conference
on Information Fusion, FUSION 2018.
https://doi.org/10.23919/ICIF.2018.8455530
Das, D. K., Ghosh, M., Pal, M., Maiti, A. K., & Chakraborty, C. (2013). Machine
learning approach for automated screening of malaria parasite using light
microscopic images. Micron, 45, 97–106.
https://doi.org/10.1016/j.micron.2012.11.002
Dineva, K., & Atanasova, T. (2018). Osemn Process for Working Over Data Acquired
By Iot. 7(13), 47–53.
Dinov, I. D. (2018). Data science and predictive analytics: Biomedical and health
applications using R. In Data Science and Predictive Analytics: Biomedical and
Health Applications using R. https://doi.org/10.1007/978-3-319-72347-1
Dong, Y., Jiang, Z., Shen, H., David Pan, W., Williams, L. A., Reddy, V. V. B.,
Benjamin, W. H., & Bryan, A. W. (2017). Evaluations of deep convolutional
neural networks for automatic identification of malaria infected cells. 2017 IEEE
EMBS International Conference on Biomedical and Health Informatics, BHI
2017, 101–104. https://doi.org/10.1109/BHI.2017.7897215
77
UIN Syarif Hidayatullah Jakarta
Eka Putra, W. S. (2016). Klasifikasi Citra Menggunakan Convolutional Neural
Network (CNN) pada Caltech 101. Jurnal Teknik ITS, 5(1).
https://doi.org/10.12962/j23373539.v5i1.15696
Ezer, D., & Whitaker, K. (2019). Data science for the scientific life cycle. ELife, 8, 1–
10. https://doi.org/10.7554/eLife.43979
Gao, X., James-Reynolds, C., & Currie, E. (2018). Analysing TB severity levels with
an enhanced deep residual learning - Depth-resnet. CEUR Workshop Proceedings,
2125.
He, K., Zhang, X., Ren, S., & Sun, J. (2015). Deep residual learning for image
recognition. Proceedings of the IEEE Computer Society Conference on Computer
Vision and Pattern Recognition, 2016-Decem, 770–778.
https://doi.org/10.1109/CVPR.2016.90
Kamal Hasan, M., Adiwijaya, & Said, A. F. (2019). Klasifikasi Citra Multi-Kelas
Menggunakan Convolutional Neural Network. E-Proceeding of Engineering,
6(1), 2127–2136.
Kartika, A., Irawan, B., & Triyanto, D. (2016). Prediksi Wilayah Rawan Kebakaran
Hutan dengan Metode Jaringan Syaraf Tiruan Propagasi Balik (Study Kasus :
Daerah Kabupaten Kuburaya). Coding Jurnal Komputer Dan Aplikasi Untan,
4(2), 66–75.
Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2017). ImageNet classification with
deep convolutional neural networks. Communications of the ACM, 60(6), 84–90.
https://doi.org/10.1145/3065386
Kumari, K., Bhardwaj, M., & Sharma, S. (2020). OSEMN Approach for Real Time
Data Analysis. International Journal of Engineering and Management Research,
10(02), 107–110. https://doi.org/10.31033/ijemr.10.2.11
78
UIN Syarif Hidayatullah Jakarta
Lecun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. Nature, 521(7553), 436–
444. https://doi.org/10.1038/nature14539
lhncbc.nlm.nih.gov,. (n.d.). https://lhncbc.nlm.nih.gov/publication/pub9932
Maeda-Gutiérrez, V., Galván-Tejada, C. E., Zanella-Calzada, L. A., Celaya-Padilla, J.
M., Galván-Tejada, J. I., Gamboa-Rosales, H., Luna-García, H., Magallanes-
Quintanar, R., Guerrero Méndez, C. A., & Olvera-Olvera, C. A. (2020).
Comparison of convolutional neural network architectures for classification of
tomato plant diseases. Applied Sciences (Switzerland), 10(4).
https://doi.org/10.3390/app10041245
Millar, S. B., & Cox-Singh, J. (2015). Human infections with Plasmodium knowlesi-
zoonotic malaria. Clinical Microbiology and Infection, 21(7), 640–648.
https://doi.org/10.1016/j.cmi.2015.03.017
Nurhikmat, T. (2018). Implementasi Deep Learning Untuk Image Classification
Menggunakan Algoritma Convolutional Neural Network (CNN) Pada Citra
Wayang Golek. In Mathematics Education Journal (Vol. 1, Issue 1).
https://doi.org/10.29333/aje.2019.423a
Patterson, J., & Gibson, A. (2017). Deep learning A: PRACTITIONER’S
APPROACH. In O’Reilly (Vol. 29, Issue 7553).
Perez, L., & Wang, J. (2017). The Effectiveness of Data Augmentation in Image
Classification using Deep Learning. http://arxiv.org/abs/1712.04621
Permata, E., Purnama, I. K. E., & Purnomo, M. H. (2012). Klasifikasi Jenis Dan Fase
Parasit Malaria Plasmodium Falciparum Dan Plasmodium Vivax Dalam Sel
Darah Merah Menggunakan Support Vector Machine One Against One. Setrum,
1(2), 1–8.
Poostchi, M., Silamut, K., Maude, R. J., Jaeger, S., & Thoma, G. (2018). Image analysis
79
UIN Syarif Hidayatullah Jakarta
and machine learning for detecting malaria. Translational Research, 194(2018),
36–55. https://doi.org/10.1016/j.trsl.2017.12.004
PUSDATINKemenkesRI. (2016). InfoDatin-Malaria-2016.pdf.
Putri, R. K. S. C. (2018). Implementasi Deep Learning Menggunakan Metode
Convolutional Neural Network Untuk Klasifikasi Gambar. Mathematics
Education Journal, 1(1), 75. https://doi.org/10.29333/aje.2019.423a
Rajaraman, S., Antani, S. K., Poostchi, M., Silamut, K., Hossain, M. A., Maude, R. J.,
Jaeger, S., & Thoma, G. R. (2018). Pre-trained convolutional neural networks as
feature extractors toward improved malaria parasite detection in thin blood smear
images. PeerJ, 2018(4), 1–17. https://doi.org/10.7717/peerj.4568
Razavian, A. S., Azizpour, H., Sullivan, J., & Carlsson, S. (2014). CNN features off-
the-shelf: An astounding baseline for recognition. IEEE Computer Society
Conference on Computer Vision and Pattern Recognition Workshops, 512–519.
https://doi.org/10.1109/CVPRW.2014.131
Ross, N. E., Pritchard, C. J., Rubin, D. M., & Dusé, A. G. (2006). Automated image
processing method for the diagnosis and classification of malaria on thin blood
smears. Medical and Biological Engineering and Computing, 44(5), 427–436.
https://doi.org/10.1007/s11517-006-0044-2
Sang, D. V., Van Dat, N., & Thuan, D. P. (2017). Facial expression recognition using
deep convolutional neural networks. Proceedings - 2017 9th International
Conference on Knowledge and Systems Engineering, KSE 2017, 2017-
Janua(June), 130–135. https://doi.org/10.1109/KSE.2017.8119447
Schmidhuber, J. (2015). Deep Learning in neural networks: An overview. Neural
Networks, 61, 85–117. https://doi.org/10.1016/j.neunet.2014.09.003
Sivaramakrishnan, R., Antani, S., Xue, Z., Candemir, S., Jaeger, S., & Thoma, G. R.
80
UIN Syarif Hidayatullah Jakarta
(2017). Visualizing abnormalities in chest radiographs through salient network
activations in Deep Learning. 2017 IEEE Life Sciences Conference, LSC 2017,
2018-Janua, 71–74. https://doi.org/10.1109/LSC.2017.8268146
Smith, L. N. (2017). Cyclical learning rates for training neural networks. Proceedings
- 2017 IEEE Winter Conference on Applications of Computer Vision, WACV
2017, April, 464–472. https://doi.org/10.1109/WACV.2017.58
Srivasta, N., Hinton, G., Krizhevsky, A., Sutskever, I., & Salakhutdinov, R. (2014).
Dropout: A simple Way to Prevent Neural Networks from Overfitting. Physics
Letters B, 299(3–4), 345–350. https://doi.org/10.1016/0370-2693(93)90272-J
WHO. (2019). World malaria report 2019. In WHO Regional Office for Africa. World
Health Organization. https://www.who.int/news-room/fact-sheets/detail/malaria
Zufar, M., & Setiyono, B. (2016). Convolutional Neural Networks Untuk Pengenalan
Wajah Secara Real-time. Jurnal Sains Dan Seni ITS, 5(2), 128862.
81
UIN Syarif Hidayatullah Jakarta
Top Related