Post on 06-Feb-2021
SEGMENTASI BARIS CITRA LONTAR AKSARA KUNO MENGGUNAKAN
METODE SHREDDING TEXT
SKRIPSI
Diajukan Untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
JOEVIAN CAESARIO JUHARDI
155314078
PROGRAM STUDI TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2019
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
ANCIENT PALM LEAVES HANDWRITTEN TEXT LINE SEGMENTATION
BY USING SHREDDING METHOD
THESIS
In a Partial Fulfilment of Requirements
for The Degree of Sarjana Komputer
Department of Informatic Engineering
JOEVIAN CAESARIO JUHARDI
155314078
INFORMATICS ENGINEERING STUDY PROGRAM
INFORMATICS ENGINEERING DEPARTMENT
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2019
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
ABSTRAK
Segmentasi terdiri dari 2 tahap yaitu segmentasi baris dan juga segmentasi
karakter. Masalah yang terjadi pada proses segmentasi baris, khususnya untuk
dokumen aksara kuno adalah terkadang terdapat aksara yang mempunyai tinggi yang
berbeda – beda, dan pada beberapa kasus aksara tersebut tersambung dengan aksara
dibaris atas atau bawahnya.Penelitian ini akan dibangun sistem yang melakukan
segmentasi baris menggunakan metode Shredding Text. Data citra yang dipakai adalah
citra daun lontar beraksara kuno berjumlah 10 buah citra. Preprocessing yang
dilakukan adalah grayscaling, binerisasi, reduksi noise, mencari tinggi karakter, dan
blurring image. Tahap segmentasi yang dilakukan adalah pelacakan untuk area baris,
pelabelan area baris, menghapus area kecil dan menghapus objek kecil. Hasil penelitian
memperoleh evaluasi hasil kinerja sistem untuk Detection Rate sebesar 93.079%,
Recognition Accuracy sebesar 90.2629%, dan Perfomance Metric sebesar 91.5326%.
Kata Kunci : daun lontar aksara kuno, preprocessing, segmentasi baris, Shredding
Text
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
ABSTRACT
Segmentation consists of two stages, namely line segmentation and character
segmentation. The problem that occurs in the line segmentation process, especially for
ancient script documents is that sometimes there are characters that have different
heights, and in some cases the letters are connected with letters in the upper or lower
lines. This study will build a system that segmented lines using methods Text
Shredding. The image data used is the image of ancient illusory palm leaves with 10
images. Preprocessing is done by grayscaling, binarization, noise reduction, looking
for high character, and blurring image. The segmentation phase that is carried out is
tracking for the line area, labeling the line area, removing small areas and removing
small objects. The results of the study obtained evaluation of system performance
results for Detection Rate of 93,079%, Recognition Accuracy of 90.2629%, and
Perfomance Metric of 91.5326%.
Keyword: ancient palm leaves, preprocessing, line segmentation, Shredding Text
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ix
KATA PENGANTAR
Puji dan syukur penulis panjatkan kehadirat Tuhan Yesus Kristus atas rahmat
dan karunia-Nya, sehingga penulis dapat menyelesaikan tugas akhir dengan judul
“Segmentasi Baris Citra Lontar Aksara Kuno Menggunakan Metode Shredding
Text” dengan baik dan tepat waktu. Tugas akhir ini merupakan salah satu persyaratan
yang wajib untuk ditempuh sebagai syarat akademik untuk memperoleh gelar sarjana
komputer program studi Teknik Informatika Universitas Sanata Dharma Yogyakarta.
Dalam menyelesaikan tugas akhir ini penulis mendapatkan dukungan dan
bimbingan dari berbagai pihak. Pada kesempatan ini, penulis mengucapkan banyak
terima kasih kepada:
1. Keluarga saya yang selalu mengingatkan saya dan juga telah memberikan
dukungan untuk saya menyelesaikan tugas akhir saya.
2. Ibu Dr. Anastasia Rita Widiarti, M.Kom selaku dosen pembimbing tugas
akhir yang telah bersedia memberikan arahan, masukan, waktu serta
motivasi kepada penulis selama menyelesaikan skripsi.
3. Bapak Yohannes Widodo, S.S selaku penjaga Perpustakaan Universitas
Sanata Dharma khususnya pada bagian koleksi Artati yang telah bersedia
meluangkan waktu, arahan, dan tempat untuk mengambil data serta
menyediakan data – data daun lontar yang dipakai dalam penelitian ini.
4. Seluruh dosen Teknik Informatika Universitas Sanata Dharma yang telah
mendidik dan memberikan ilmu pengetahuan selama proses perkuliahan.
5. Saudara – saudara Welok Played yang telah menjadi sumber inpirasi dan
motivasi karena telah menghidupkan kegiatan selama proses perkuliahan
saya dan juga kegiatan diluar perkuliahan.
6. Saudara Theodulus Titho dan Tubagus Rendy yang telah menemani saya
selama kegiatan perkuliahan dan juga kegiatan diluar perkuliahan serta
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xi
DAFTAR ISI
HALAMAN JUDUL ....................................................................................................i
TITLE PAGE ...............................................................................................................ii
HALAMAN PERSETUJUAN ...................................................................................iii
HALAMAN PENGESAHAN ....................................................................................iv
PERNYATAAN KEASLIAN KARYA ......................................................................v
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH
UNTUK KEPENTINGAN AKADEMIS ...................................................................vi
ABSTRAK ................................................................................................................vii
ABSTRACT .............................................................................................................viii
KATA PENGANTAR ................................................................................................ix
DAFTAR ISI ..............................................................................................................xi
DAFTAR GAMBAR ................................................................................................xiv
DAFTAR TABEL…. ...............................................................................................xvi
BAB I PENDAHULUAN ...........................................................................................1
1.1. Latar Belakang ..........................................................................................1
1.2. Rumusan Masalah .....................................................................................3
1.3. Tujuan Penelitian ......................................................................................4
1.4. Manfaat Penelitian ....................................................................................4
1.5. Batasan Masalah .......................................................................................4
1.6. Metodologi Penelitian ...............................................................................4
1.7. Sistematika Penulisan ...............................................................................5
BAB II LANDASAN TEORI .................................................................................... 7
2.1. Daun Lontar ............................................................................................ 7
2.2. Definisi dan Representasi Citra …........................................................... 7
2.2.1. Citra Warna …………………………………………………………… 8
2.2.2. Citra Abu – Abu ……………………………………………………….8
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xii
2.2.3. Citra Biner ……………………………………………………………..8
2.3. Akuisisi Data …………........................................................................... 9
2.4. Segmentasi Shredding Text …………..................................................... 9
2.4.1. Preprocessing …………………………………………………………10
2.4.1.1. Cropping ……………………………………………………………10
2.4.1.2. Grayscaling …………………………………………………………10
2.4.1.3. Binerisasi …………………………………………………………...11
2.4.1.4. Konektivitas Komponen ……………………………………………11
2.4.1.5. Reduksi Noise ………………………………………………………12
2.4.1.6. Blurring Image ……………………………………………………...12
2.4.2. Segmentasi Baris Shredding Text …………………………………….13
2.4.2.1. Membuat pelacak untuk area baris (Tracing line areas) ……………13
2.4.2.2. Pelabelan pelacak untuk area baris (Labelling line areas) ………….14
2.4.2.3. Menampilkan hasil segmentasi…………………………. ………….15
2.5. Evaluasi Kinerja Sistem………………………………………………... 15
BAB III METODE PENELITIAN .......................................................................... 16
3.1. Gambaran Umum ....................................................................................16
3.2. Desain Penelitian ................................................................................... 16
3.2.1. Studi Literatur ………………………………………………………...16
3.2.2. Pengumpulan Data Penelitian ………………………………………...16
3.2.2.1. Pengumpulan Citra Daun Lontar Beraksara Kuno …………………17
3.2.2.2. Cropping ……………………………………………………………18
3.3. Analisa Kebutuhan Proses ……………………………………………...19
3.3.1. Preprocessing …………………………………………………………21
3.3.2. Segmentasi Baris ……………………………………………………..25
3.4. Perancangan Antar Muka Alat Uji ……………………………………..31
3.5. Spesifikasi Perangkat Keras dan Perangkat Lunak …………………….32
3.5.1. Perangkat Keras ………………………………………………………32
3.5.2. Perangkat Lunak ……………………………………………………...33
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiii
BAB IV HASIL DAN PEMBAHASAN ...................................................................34
4.1. Data Masukan .........................................................................................34
4.2. Preprocessing ..........................................................................................33
4.2.1. Baca file citra …………………………………………………………35
4.2.2. Grayscaling …………………………………………………………...35
4.2.3. Binerisasi ……………………………………………………………..36
4.2.4. Reduksi Noise ………………………………………………………...37
4.2.5. Mencari Tinggi Karakter ……………………………………………..41
4.2.6. Blurring Image ………………………………………………………..42
4.3. Pencarian Jalur Pelacak ………………………………………………...44
4.3.1. Pencarian Jalur Pelacak LA …………………………………………..44
4.3.2. Pelabelan Jalur Pelacak LA …………………………………………..45
4.4. Menampilkan Hasil Segmentasi ………………………………………..48
4.5. Evaluasi Kinerja Sistem…………………………………………………53
BAB V PENUTUP ....................................................................................................57
5.1. Kesimpulan ..........................................................................................................57
5.2. Saran ...................................................................................................................57
DAFTAR PUSTAKA ................................................................................................58
LAMPIRAN…………………………………………………………………………59
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
DAFTAR GAMBAR
Gambar 2.1. Contoh citra daun lontar beraksara……….............................................. 7
Gambar 2.2. Contoh penerapan proses filter blur …………………………………...13
Gambar 2.3. Contoh hasil pencarian pelacak untuk area garis ……………………...14
Gambar 3.1. Diagram blok Segmentasi Baris Citra Lontar Aksara Menggunakan
Metode Shredding Text ……………………………………………………………..17
Gambar 3.2. Diagram Proses Segmentasi Baris Citra Lontar Aksara Menggunakan
Metode Shredding Text ……………………………………………………………..19
Gambar 3.3. Diagram Proses Preprocessing ………………………………………..21
Gambar 3.4. Diagram Proses Segmentasi Baris …………………………………….26
Gambar 3.5. Prototype Rancangan Antar Muka Alat Uji ……………...…………...31
Gambar 4.1. Data Citra Asli ………………………………………………………...34
Gambar 4.2. Data Citra Hasil Pemotongan …………………………………………34
Gambar 4.3. Hasil Baca File kuno 1.jpg …………………………………………….35
Gambar 4.4. Hasil Proses Grayscaling ……………………………………………...36
Gambar 4.5. Hasil Proses Binerisasi ………………………………………………...37
Gambar 4.6. Contoh Noise……………...…………………………………………...37
Gambar 4.7. Hasil Proses Reduksi Noise Memakai bwareaopen …………………..38
Gambar 4.8. Screenshoot Tabel Hasil Penyelidikan Label …………………………39
Gambar 4.9. Hasil Reduksi Noise Tahap 2 ………………………………………….40
Gambar 4.10. Screenshot Tabel Hasil Pencarian Tinggi Label ……………………..41
Gambar 4.11. Hasil Blurring Image ………………………………………………...43
Gambar 4.12. Contoh Bagian Filter Blur ……………………………………………43
Gambar 4.13. Hasil Pelacakan LA ………………………………………………….45
Gambar 4.14. Hasil Bagian Pelacakan LA…………………………………………..45
Gambar 4.15. Screenshoot Tabel Hasil Penyelidikan LLA …………………………46
Gambar 4.16. Screenshot Tabel LLA Hasil Penyelidikan Setelah Difilter …………48
Gambar 4.17. Screenshot Tabel Penyelidikan Area Objek Kecil……………………49
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xv
Gambar 4.18. Screenshot Tabel Hasil Setelah Proses Penghapusan Objek Kecil…..50
Gambar 4.19. Hasil Segmentasi 1 …………………………………………………..51
Gambar 4.20. Hasil Segmentasi 2 …………………………………………………..51
Gambar 4.21. Hasil Segmentasi 3 …………………………………………………..51
Gambar 4.22. Hasil Segmentasi 4 …………………………………………………..52
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xvi
DAFTAR TABEL
Tabel 3.1. Perangkat Keras (Hardware)…………………………………………......32
Tabel 3.2. Perangkat Lunak (Software)……………………………………………...33
Tabel 4.1. Tabel Evaluasi Sistem…………………………………………………....53
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1
BAB 1
PENDAHULUAN
1.1.Latar Belakang
Indonesia merupakan sebuah Negara yang terdiri dari lebih dari 10 ribu
pulau. Dengan banyaknya jumlahnya pulau tersebut, Indonesia dikenal dunia
sebagai Negara kepulauan terbesar di Asia bahkan Indonesia juga merupakan
Negara kepulauan terbesar di dunia. Indonesia merupakan terdiri dari beberapa
pulau besar diantaranya Pulau Sumatera, Pulau Jawa, Pulau Kalimantan, Pulau
Sulawesi, dan juga Pulau Papua. Setiap pulau yang ada di Indonesia masing –
masing mempunyai kebudayaan – kebudayaan yang berbeda - beda, bahkan di
dalam setiap pulau tersebut mempunyai kebudayaan yang berbeda – beda di hampir
setiap daerah di dalam sebuah pulau itu sendiri. Kebudayaan tersebut meliputi
rumah adat, pakaian adat, upacara adat, seni musik, seni tari tradisional, seni rupa,
senjata tradisional, suku bangsa, bahasa daerah, dan juga seni aksara atatu seni
tulisan.
Pada era yang semakin modern ini, sebagai Negara yang mempunyai
kebudayaan yang sangat besar dan beragam ini, Indonesia semakin dituntut untuk
mengikuti perkembangannya tanpa menghilangkan aspek kebudayaan –
kebudayaannya. Salah satu dari sekian banyak kebudayaan tersebut yaitu
kebudayaan tentang seni aksara atau seni tulis. Seni aksara atau seni tulisan sendiri
merupakan sebuah kesenian yang berbentuk tulisan tangan yang mengandung
unsur kesenian dan keiindahan di dalam setiap katanya. Salah satu bentuk dari seni
aksara adalah tulisan Aksara daerah kuno, misalnya Aksara Jawa, Aksara Sunda,
dan ada juga Aksara Bali.
Semakin bertambahnya waktu, usia daun lontar yang merupakan
peninggalan dari masa lalu pastilah semakin bertambah. Dengan bertambahnya
usia, daun lontar itu sendiri cepat atau lambat pasti semakin rapuh sehingga daun
lontar yang berisi aksara – aksara kuno peninggalan jaman dulu akan semakin
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2
mudah rusak. Di dalam era yang semakin canggih ini, era ini menawarkan banyak
sekali cara dalam perawatan ataupun pelestarian daun lontar kuno itu sendiri.
Digitalisasi merupakan salah satu contoh penawaran yang ditawarkan teknologi –
teknologi pada jaman yang modern ini. Digitalisasi sendiri merupakan sebuah
proses mengubah informasi yang sifatnya analog, seperti kertas, dokumen, dan
yang lainya menjadi bersifat digital. Media yang digunakan dalam mendigitalkan
sesuatu seperti dokumen ataupun daun lontar sangatlah beragam, antara lain adalah
kamera dan scanner. Dengan kamera, kita dapat mengabadikan sebuah momen
ataupun sebuah gambaran suatu benda ke dalam bentuk digital.
Bentuk digital yang berasal dari kamera itu dapat dinamakan sebagai citra
digital. Sebuah citra digital dapat diolah sedemikian rupa dengan bantuan media
olah lainya seperti komputer. Dengan bantuan komputer, gambar atau citra yang
telah kita simpan dapat diproses sehingga dapat mengeluarkan output sesuai yang
diinginkan. Transliterasi atau yang disebut alih aksara merupakan salah satu dari
sekian banyak contoh proses yang dapat kita lakukan dengan data berupa citra
digital, dalam hal ini citra tersebut merupakan citra dokumen.
Citra dokumen merupakan sebuah citra yang memuat tulis – tulisan. Dalam
proses transliterasi pada sebuah perangkat, seperti komputer, pastilah
membutuhkan beberapa pemrosesan citra. Pemrosesan tersebut bisa terdiri dari
preprocessing, ekstraksi ciri, klasifikasi dan yang lainnya. Dalam preprocessing
sendiri, proses tersebut dapat membantu dalam komputasi, misalnya binerisasi,
grayscaling, cropping, dan sebagainya.
Segmentasi merupakan salah satu contoh dalam tahap – tahap yang
diperlukan dalam alih aksara sebuah citra dokumen. Segmentasi terdiri dari 2 tahap
yaitu segmentasi baris dan juga segmentasi kata. Segmentasi baris merupakan
proses dimana program dapat memisahkan baris satu dengan baris lainnya.
Sedangkan segmentasi kata merupakan proses dimana program dapat memisahkan
setiap kata pada citra dokumen tersebut.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
Kedua proses segmentasi yaitu segmentasi baris dan segmentasi memiliki
masalah – masalahnya tersendiri dalam pemrosesannya. Pada kasus segmentasi
baris, proses segmentasi ini memiliki masalah tersendiri yaitu pada saat melakukan
segmentasi itu sendiri. Masalah yang terjadi pada umumnya, khususnya untuk
dokumen aksara kuno adalah terkadang terdapat aksara yang mempunyai tinggi
yang berbeda – beda, dan pada beberapa kasus aksara tersebut tersambung dengan
aksara dibaris atas atau bawahnya. Salah satu metode yang dapat digunakan untuk
menyelesaikan masalah segmentasi baris tersebut adalah metode Shredding Text.
Metode Shredding Text. Menurut Nicolaou dan Gatos (2009), sebuah citra
dokumen dapat dipotong (shred) menjadi kumpulan potongan di sepanjang celah
putih yang terdapat diantara baris – baris.
Metode Shredding Text telah diciptakan dan digunakan untuk penelitian
oleh A. Nicolau dan B. Gatos pada tahun 2009 dengan judul “Handwritten Text
Line Segmentation by Shredding Text into its Lines”. Penelitian tersebut bertujuan
untuk menciptakan gagasan atau ide metode baru terhadap segmentasi baris pada
citra dokumen. Persentase evaluasi kinerja sistem yang diperoleh dari penelitian
tersebut cukup tinggi yaitu Detection Rate sebesar 98,9%, Recognition Accuracy
sebesar 98,3%, dan Perfomance Metric sebesar 98,6%.
Oleh karena itu, penelitian ini dilakukan untuk mencoba menggunakan
Metode Shredding Text dalam pengukuran persentase keberhasilan segmentasi
baris pada kasus citra daun lontar.
1.2.Rumusan Masalah
Berapakah persentase keberhasilan segmentasi baris citra daun lontar
beraksara kuno dengan menggunakan metode Shredding Text?
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4
1.3.Tujuan Penelitian
Mengetahui tingkat keberhasilan sistem dalam melakukan segmentasi baris
menggunakan metode Shredding Text.
1.4.Manfaat Penelitian
Manfaat dari penelitian ini adalah untuk menambah referensi metode yang
dapat digunakan kepada peneliti yang selanjutnya mengenai segmentasi baris
ataupun kepada peneliti yang berkaitan dengan transliterasi citra dokumen.
1.5.Batasan Masalah
Batasan masalah yang digunakan pada penelitian ini adalah sebagai berikut:
1. Citra yang digunakan hanya citra daun lontar aksara kuno.
2. Pemotongan (cropping) terhadap citra yang digunakan dilakukan dengan
pemotongan manual.
3. Pemrosesan yang dilakukan hanya segmentasi baris.
4. Masukan hanya berupa gambar berformat .jpg atau .png
5. Perhitungan objek dalam evaluasi kinerja sistem dilakukan secara manual
1.6.Metodologi Penelitian
1. Studi Literatur
Pada tahap ini semua hal yang mendukung penelitian ini dipelajari
melalui sumber – sumber pengetahuan seperti buku referensi ataupun jurnal
yang berkatian dengan segmentasi baris dalam citra dokumen
2. Perancangan Sistem
Pada tahap ini akan dibangun sebuh sistem yang mempunyai fungsi
sebagai alat uji untuk mengetahui persentase akurasi segmentasi baris dengan
algoritma atau metode yang digunakan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5
3. Pengumpulan Data
Pada tahap ini data yang akan digunakan dalam penelitian merupakan
data citra daun lontar yang berisikan aksara kuno. Data akan dikumpulkan
dengan menggunakan alat bantu seperti kamera dan tambahan lampu
smartphone. Data yang dipakai merupakan daun lontar yang diambil di
Perpustakaan Universitas Sanata Dharma Yogyakarta
4. Pembuatan Sistem
Pada tahap ini pembangunan sistem akan diimplementasikan
berdasarkan rancangan sistem yang telah dibuat.
5. Pengujian
Pada tahap ini sistem akan diuji dengan menghitung persentase akurasi
yang didapatkan dalam segmentasi baris daun lontar aksara kuno menggunakan
metode Shredding Text.
6. Pembuatan Laporan
Pada tahap ini dilakukan proses pembuatan laporan penelitian yang
didasarkan tahap – tahap dan proses yang telah dilakukan.
1.7.Sistematika Penulisan
BAB I: PENDAHULUAN
Bab I merupakan Bab yang berisi tentang latar belakang tugas akhir dibuat,
rumusan masalah, tujuan penelitian, batasan masalah, metodologi penelitian, dan
sistematika penulisan.
BAB II LANDASAN TEORI
Bab II merupakan Bab yang berisikan tentang teori – teori yang digunakan
dalam penelitian ini.
BAB III METODE PENELITIAN
Bab III merupakan Bab yang berisikan tentang rencana tahapan yang akan
digunakan dalam penyusunan penelitian. Tahapan – tahapan penelitian yang
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6
direncanakan meliputi akusisi data / pengumpulan data, pengolahan data, desain
rancangan alat uji, analisis data, cara pengujian, dan juga desain interface user.
BAB IV IMPLEMENTASI DAN ANALISA HASIL
Bab IV merupakan Bab yang berisikan tentang penjelasan mengenai
impelementasi yang telah dibuat dengan penerapan algoritma yang digunakan serta
analisa hasil berupa analisis dan evaluasi
BAB V PENUTUP
Bab V merupakab Bab akhir yang berisikan kesimpulan dari seluruh
penelitian dan saran yang diusulkan kepada pengembangan lebih lanjut.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
BAB 2
LANDASAN TEORI
2.1.Daun Lontar
Lontar (dari bahasa Jawa: ron tal, "daun tal") adalah daun siwalan atau tal
(Borassus flabellifer atau palmyra) yang dikeringkan dan dipakai sebagai bahan
naskah dan kerajinan (Hinzler, 1993). Daun lontar merupakan salah satu media tulis
yang dipakai di Asia Selatan dan Asia Tenggara. Di Indonesia sendiri, daun lontar
sering ditemukan dan digunakan di Sunda (Jawa Barat), Jawa, Bali, Madura,
Lombok, dan juga Sulawesi. Di pulau Bali sendiri, saat ini daun lontar masih
banyak digunakan untuk keperluan adat ataupun sebagai cinderamata khas Bali.
Gambar 2.1. Contoh citra daun lontar beraksara
(Sumber : Perpustakaan Universitas Sanata Dharma(2019))
2.2.Definisi dan Representasi Citra Digital
Secara umum, pengolahan citra digital adalah manipulasi dan interprestasi
digital dari citra dengan bantuan komputer (Zhou, 1999). Menurut Gonzalez
(2012), citra digital dapat didefinisikan sebagai fungsi dua-dimensi, f (x, y), di
mana x dan y adalah spasial (bidang), dan amplitudo f pada setiap pasangan
koordinat (x, y) disebut intensitas atau tingkat abu-abu gambar pada saat itu. Ketika
x, y, dan nilai amplitudo dari f adalah semua finitie, kuantitas diskrit.
Dalam pemrosesan citra digital, terdapat 3 jenis umum citra yang
digunakan. Menurut Kadir dan Adhi. (2013) jenis citra digital dibagi menjadi 3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
jenis yaitu citra biner, citra abu, dan citra warna. Jenis – jenis citra dapat
didefinisikan sebagai berikut:
2.2.1. Citra Warna
Citra RGB merupakan citra yang terdiri dari 3 macam keping, yaitu
keping R (merah), G (hijau), dan B (biru). Setiap nilai dari keping tersebut
mempunyai rentang nilai dari nilai 0 sampai 255. Kemungkinan jumlah warna
terbanyak yang dihasilkan dari citra RGB adalah 255 x 255 x 255 atau
16.581.375 warna yang berbeda – beda.
2.2.2. Citra Abu – Abu
Citra grayscale adalah citra yang menangani gradasi antara warna hitam
dan putih (biner) yang secara visual akan dideskripsikan sebagai citra abu –
abu. Pada citra grayscale warna dinyatakan dengan intensitas. Intesitas citra
grayscale memiliki rentang nilai dari 0 sampai 255. Nilai 0 menyatakan warna
hitam dan nilai 255 menyatakan warna putih. Pada citra grayscale, citra yang
memiliki nilai yang mendekati 0 akan semakin gelap, sedangkan citra yang
memiliki nilai yang lebih mendekati 255 akan semakin terang. Dengan kata
lain, semakin kecil nilai grayscale pixel maka semakin gelap citra yang
dihasilkan, sebaliknya semakin besar nilai grayscale pixel maka citra yang
dihasilkan semakin terang.
2.2.3. Citra Biner
Citra biner atau yang biasa disebut sebagai citra hitam-putih. Citra biner
hanya memiliki satu channel warna dan hanya mempunyai 2 kemungkinan nilai
pikselnya, yaitu 1 atau 0. Nilai 0 menyatakan warna hitam sedangkan nilai 1
menyatakan warna putih.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
2.3.Akuisisi Data
Data Acqusisition atau akuisisi data merupakan suatu proses dalam sebuah
penelitian yang dilakukan dengan tujuan untuk memperoleh data dan juga
menentukan cara untuk mengukur data tersebut serta berapa jumlah data yang
diperlukan dalam penelitian. Dalam proses pengambilan data, khususnya untuk
data citra, data dapat diperoleh melalui pemotretan menggunakan kamera, atau
perangkat lain yang dapat digunakan untuk memotret citra. Data citra yang
didapatkan dapat berasal dari lingkungan sekitar dan dapat diubah kedalam bentuk
digital sehingga dapat diolah komputer.
2.4.Segmentasi Shredding Text
Segmentasi citra bertujuan mendapatkan objek-objek citra dengan cara
membagi citra ke dalam beberapa daerah yang memiliki kemiripan atribut (Kadir
dkk, 2013).
Pada penelitian ini segmentasi yang dilakukan berfokus pada proses
segmentasi baris pada sebuah citra dokumen. Metode yang digunakan untuk
segmentasi adalah metode Shredding Text. Metode ini diciptakan oleh A. Nicolau
dan B. Gatos pada tahun 2009 dengan mengusulkan sebuah strategi citra dokumen
dapat dipisah – pisah ke potongan-potongan baris dengan adanya kesenjangan
(gap) diantara baris-baris. Metode local minima digunakan pada data hasil proyeksi
baris, yang akan menjadi batas segmentasi baris teks. Pendekatan ini didasarkan
pada asumsi topologi bahwa setiap baris teks terdapat jalur dari sisi kanan ke sisi
kiri gambar yang melintasi hanya satu baris teks. Langkah pertama adalah
mengaburkan gambar kemudian menggunakan pelacak untuk mengikuti jalur
paling putih dan paling hitam dari kiri ke kanan dan juga sebaliknya untuk
memisahkan citra menjadi baris teks. Sebelum melakukan langkah pertama
dilakukan tahapan preprocessing yang meliputi grayscaling, binerisasi,
konektivitas komponen, dan reduksi noise terlebih dahulu. Langkah – langkah yang
dilakukan berikut didasarkan pada penelitian B. Gatos, dkk (2009) yaitu:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
2.4.1. Preprocessing
2.4.1.1.Cropping
Cropping pada sebuh citra merupakan sebuah proses dimana citra yang
diolah dilakukan pemotongan pada koordinat tertentu yang berada pada suatu
area pada citra tersebut. Proses cropping pada sebuah citra termasuk kedalam
kategori operasi geometri citra. Cropping dilakukan untuk menghilangkan
bagian citra yang tidak diinginkan. Cropping juga dapat diartikan dalam
pengolahan citra sebagai pengambilan sebuah bagian atau area dalam sebuah
citra yang diinginkan.
2.4.1.2.Grayscaling
Citra grayscale merupakan sebuah citra yang mempunyai warna
diantara warna hitam dan putih. Citra grayscale direpresentasikan dengan
variasi nilai intensitas tertentu yang berada dalam interval 0 hingga 255. Proses
grayscaling merupakan proses konversi citra dari citra warna atau RGB
menjadi citra grayscale (citra keabuan). Citra RGB memiliki 3 komponen
keping warna yaitu R(merah), G(hijau), B(biru) tersebut akan dikonversikan
menjadi citra grayscale. Citra berwarna dapat dikonversikan menjadi citra
grayscale menggunakan NTSC (National Television System Committee)
(Kadir, dkk, 2012). Operasi yang digunakan untuk melakukan konversi citra
warna RGB menjadi citra grayscale adalah sebagai berikut:
𝑔(𝑥, 𝑦) = 𝑤𝑟𝑅(𝑥, 𝑦) + 𝑤𝑔𝐺(𝑥, 𝑦) + 𝑤𝑏𝐵(𝑥, 𝑦) (2.1)
Dimana berdasarkan NTSC:
wr = bobot komponen R (bernilai 0.299)
wg = bobot komponen G (bernilai 0.587)
wb = bobot komponen B (bernilai 0.144)
g(x,y) = hasil konversi grayscale pada lokasi pixel (x,y)
R(x,y) = nilai piksel pada lokasi (x,y) untuk komponen R
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
G(x,y) = nilai piksel pada lokasi (x,y) untuk komponen G
B(x,y) = nilai piksel pada lokasi (x,y) untuk komponen B
2.4.1.3.Binerisasi
Binerisasi merupakan sebuah pemrosesan citra untuk melakukan
konversi citra dari citra grayscale (abu – abu) menjadi citra biner (hitam putih).
Citra biner merupakan memiliki 2 kemungkinan nilai pada setiap pikselnya
yaitu 1 (putih) dan 0 (hitam). Citra abu-abu dikonversi menjadi citra biner
dengan cara menentukan suatu level keabuan T dalam citra abu-abu, kemudian
setiap piksel pada citra abu-abu diubah menjadi piksel hitam atau putih
berdasarkan nilai level keabuan T tersebut.
𝐼(𝑥, 𝑦) = {1, 𝑗𝑖𝑘𝑎 𝑓(𝑥, 𝑦) > 𝑇0, 𝑗𝑖𝑘𝑎 𝑓(𝑥, 𝑦) ≤ 𝑇
(2.2)
Dengan:
I(x,y) = citra hasil binerisasi
f(x,y) = citra masukan
T = nilai thresholding (nilai ambang)
Pengambangan batas (thresholding) merupakan tahapan yang sangat
penting dalam segmentasi citra digital. Thresholding digunakan dengan tujuan
untuk memilah objek – objek karakter yang diinginkan dari latar belakang citra.
Dalam penelitian ini metode pengambangan batas yang digunakan adalah
metode Sauvola.
2.4.1.4.Konektivitas Komponen
Pada penelitian ini metode konektivitas komponen LI(x,y)
menggunakan fungsi bwlabel yang merupakan fungsi pelabelan dari citra biner
dari Matlab. Pelabelan menggunakan konektivitas 4 ketetanggaan.
𝐿𝐼(𝑥, 𝑦) = {0, 𝑗𝑖𝑘𝑎 𝐼(𝑥, 𝑦) = 0
𝐿𝑎𝑏𝑒𝑙, 𝑗𝑖𝑘𝑎 𝐼(𝑥, 𝑦) ≠ 0 (2.3)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
Dimana:
LI(x,y) = hasil pelabelan
Label = {1,2,3,4,….N}
2.4.1.5.Reduksi Noise
Noise atau derau pada sebuah citra dapat terjadi karena karakteristik
derajat keabuan (gray level) atau di karenakan adanya variabel acak yang
terjadi karena karakteristik fungsi probabilitas kepadatan (probability density
function (PDF)). Apabila citra yang mengandung noise langsung diproses dan
di ekstrak, maka fitur-fitur pentingnya dapat menimbulkan masalah akurasi.
Jadi sebaiknya citra tersebut dibersihkan dari noise terlebih dahulu, dan
kemudian diproses untuk diekstrak ciri - ciri pentingnya. (Gonzalez, 2002).
Pada penelitian ini metode yang digunakan untuk reduksi noise
dilakukan karena citra yang dibutuhkan untuk kebutuhan sistem merupakan
citra yang tidak memiliki noise. Dalam penelitian ini reduksi noise dilakukan
menggunakan fungsi bwareaopen yang merupakan fungsi dari Matlab untuk
menghilangkan semua konektivitas komponen yang mempunyai nilai piksel
kurang dari suatu nilai yang ditentukan.
2.4.1.6.Blurring Image
Blurring Image adalah proses citra yang dilakukan dengan tujuan untuk
mengkaburkan atau memblurkan citra. Blurring Image dapat dilakukan dengan
berbagai macam teknik. Sebelum melakukan bluring citra dilakukan operasi
histogram untuk mencari perkiraan tinggi huruf yang didefinisikan sebagai LH.
Dalam penelitian ini Blurring Image dilakukan dengan menggunakan rumus
sebagai berikut:
𝐵(𝑥, 𝑦) = ∑ 𝑖=
𝐵𝑊
2
𝑖=−𝐵𝑊
2
∑ 𝐼(𝑥 + 𝑖, 𝑦 + 𝑘)𝑘=
𝐵𝐻
2
𝑘=−𝐵𝐻
2
(2.4)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
Dengan:
B(x,y) = citra hasil Blurring Image
BW = lebar jendela yang mengaburkan
BH = tinggi jendela yang mengaburkan
B (x, y) adalah gambar yang difilter, BW = LH * 8 adalah lebar jendela
yang mengaburkan dan BH = LH * 0.8 adalah tinggi jendela yang
mengaburkan. BW bertujuan untuk mengaburkan spasi putih di antara kata-kata
secara berturut-turut dalam satu baris dan BH bertujuan untuk mengaburkan
huruf dalam garis yang menjaga celah putih antara dua baris berturut-turut (Du,
dkk, 2009).
Gambar 2.2. Contoh penerapan proses Blurring Image
2.4.2. Segmentasi Baris Shredding Text
Tahapan setelah proses preprocessing adalah tahap segmentasi baris
menggunakan Shredding Text. Tahap Shredding Text dilakukan dibagi menjadi
2 langkah yaitu membuat pelacak untuk area baris dan pelabelan pelacak untuk
area baris
2.4.2.1.Membuat pelacak untuk area baris (Tracing line areas)
Untuk setiap piksel pada citra hasil Blurring Image dari piksel paling
kiri hingga paling kanan terdapat sebuah jalur yang memuat piksel paling putih
(whitest pixel). Dalam perumusannya, dilakukan fungsi sebagai berikut:
𝑇𝑟𝑘,𝐵(1) = 𝑘
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
𝑇𝑟𝑘,𝐵(𝑛 + 1) =
{
𝑇𝑟𝑘,𝐵(𝑛) − 1 𝑖𝑓 𝐵 (𝑛, 𝑇𝑟𝑘,𝐵(𝑛) +
𝐵𝐻
2) > 𝐵(𝑛, 𝑇𝑟𝑘,𝐵(𝑛) −
𝐵𝐻
2)
𝑇𝑟𝑘,𝐵(𝑛) 𝑖𝑓 𝐵 (𝑛, 𝑇𝑟𝑘,𝐵(𝑛) +𝐵𝐻
2) = 𝐵(𝑛, 𝑇𝑟𝑘,𝐵(𝑛) −
𝐵𝐻
2)
𝑇𝑟𝑘,𝐵(𝑛) + 1 𝑖𝑓 𝐵 (𝑛, 𝑇𝑟𝑘,𝐵(𝑛) +𝐵𝐻
2) < 𝐵(𝑛, 𝑇𝑟𝑘,𝐵(𝑛) −
𝐵𝐻
2)
(2.5)
Semua kemungkinan pelacakan pada citra hasil Blurring Image
disimpan kedalam bentuk citra biner dan disimpan ke variabel LA (x, y).
𝐿𝐴(𝑥, 𝑦) = {0 𝑖𝑓 ∃ 𝑘 ∶ 𝑇𝑟𝑘,𝐵(𝑥) = 𝑦
1 𝑖𝑛 𝑎𝑙𝑙 𝑜𝑡ℎ𝑒𝑟 𝑐𝑎𝑠𝑒𝑠 (2.6)
Gambar 2.3. Contoh hasil pencarian pelacak untuk area garis
LA (x, y) berisikan garis strip dari area garis teks sebagai 1s dan titik
pemisahan mereka sebagai 0s. Kemudian proses yang sama untuk menelusuri
jalur putih dari kanan ke kiri dan menggambar lintasan pada LA (x, y) juga,
untuk mengurangi terjadinya garis yang tidak terhubung.
2.4.2.2.Pelabelan pelacak untuk area baris (Labelling line areas)
Setelah pelacak gambar jalur putih LA(x,) terbentuk, selanjutnya
dilakukan pelabelan untuk konektivitas komponen dengan 4 ketetanggaan dan
disimpan ke LLA(x,y).
𝐿𝐿𝐴(𝑥, 𝑦) = {0 𝑖𝑓 𝐿𝐴(𝑥, 𝑦) = 0
𝑙𝑎𝑏𝑒𝑙 𝑖𝑓 𝐿𝐴(𝑥, 𝑦) ≠ 0 (2.7)
Dalam pelabelan, komponen yang mewakili area garis teks dan
komponen yang sangat kecil yang dibuat saat pelacak terkumpul ke lokal
minima. Karena semua komponen dalam LLA (x, y) dianggap mewakili baris
teks yang berbeda, dilakukan filter terhadap komponen yang memiliki piksel
lebih sedikit dari LH^2 (tidak boleh ada garis yang lebih kecil dari huruf).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
2.4.2.3.Menampilkan hasil segmentasi
Dalam menampilkan hasil segmentasi, dilakukan penggabungan antara
hasil dari preprocessing yaitu hasil citra setelah reduksi noise dengan hasil dari
pelabelan untuk area baris. Sebelum menampilkan dilakukan proses filter untuk
menghapus objek yang memiliki piksel lebih sedikit dari LH * log(LH). Filter
dilakukan untuk menghilangkan objek yang terlalu kecil.
2.5.Evaluasi Kinerja Sistem
Pengukuran tingkat keberhasilan sistem dalam melakukan segmentasi baris
dilakukan dengan menghitung jumlah baris hasil dari sistem dibagi jumlah baris
sebenarnya dikalikan 100. Berikut rumus yang digunakan:
𝐴𝑘𝑢𝑟𝑎𝑠𝑖𝐵𝑎𝑟𝑖𝑠 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑏𝑎𝑟𝑖𝑠 ℎ𝑎𝑠𝑖𝑙 𝑠𝑖𝑠𝑡𝑒𝑚
𝑗𝑢𝑚𝑙𝑎ℎ 𝑏𝑎𝑟𝑖𝑠 𝑠𝑒𝑏𝑒𝑛𝑎𝑟𝑛𝑦𝑎 𝑥 100%
Metode yang digunakan untuk mengukur kinerja sistem dari algoritma yang
digunakan didasarkan pada penghitungan jumlah kecocokan antara entitas yang
terdeteksi oleh algoritma dan entitas dengan perhitungan secara manual (I. Philips,
dkk, 1999). Semakin tinggi nilai Detection Rate, Recognition Accuracy, dan
Performance Matric yang didapatkan, maka semakin baik kinerja sistem yang
dihasilkan. Perhitungan kinerja sistem ini dilakukan dengan tujuan untuk mengukur
seberapa besar tingkat keberhasilan sistem dalam menghitung jumlah objek
perbarisnya hasil dari sistem dengan jumlah objek sebenarnya yang terdapat pada
setiap barisnya.
Berikut rumus yang digunakan:
𝐷𝑅 =𝑜2𝑜
𝑁, 𝑅𝐴 =
𝑜2𝑜
𝑀 , 𝐹𝑀 =
2𝐷𝑅 𝑥 𝑅𝐴
𝐷𝑅+𝑅𝐴 (2.8)
Dengan:
DR = Detection Rate
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
RA = Recognition Accuracy
FM = Performance Metric
N = jumlah objek pada citra asli
M = jumlah objek hasik perhitungan mesin
o2o = jumlah objek yang sesuai
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
BAB 3
METODE PENELITIAN
3.1. Gambaran Umum
Perancangan sistem Segmentasi Baris Citra Daun Lontar Beraksara
menggunakan Metode Shredding Text bertujuan untuk membuat alat uji
perhitungan baris yang terdapat pada citra daun lontar. Gambaran umum sistem
yang akan dibangun dapat dilihat pada gambar diagram blok Gambar 3.1.
dibawah ini.
Gambar 3.1. Diagram blok Segmentasi Baris Citra Lontar Aksara Menggunakan
Metode Shredding Text
Masukan dari sistem merupakan citra daun lontar beraksara. Sistem
melakukan proses segmentasi pada masukan dan menghasilkan keluaran
berupa citra hasil segmentasi beserta jumlah baris yang dideteksi sistem
3.2. Desain Penelitian
3.2.1. Studi Literatur
Studi literatur dilakukan untuk mendapatkan informasi terkait
penelitian yang dilakukan. Studi literatur dilakukan dengan cara
mempelajari buku refrensi dan jurnal - jurnal yang berkaitan dengan
segmentasi baris pada citra menggunakan metode Shredding Text dan
juga segala hal yang berkaitan dengan teori pemrosesan citra.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
3.2.2. Pengumpulan Data Penelitian
Data penelitian adalah citra daun lontar beraksara yang
didapatkan dari Perpustakan Universitas Sanata Dharma Yogyakarta.
Citra daun lontar yang dipilih merupakan daun lontar beraksara yang
sekiranya mempunyai sedikit noise dan aksara – aksara yang tertulis
dapat dilihat dengan mata telanjang. Data diambil menggunakan
Kamera Canon EOS 600D dengan jarak pengambilan 30 cm dengan
daun lontar dan pencahayaan berasal dari lampu perpustakaan serta 2
lampu senter handphone disesuaikan dengan tingkat kelekukan daun
lontar.
Pada penelitan ini, data yang telah diambil disiapkan untuk alat
uji melalui beberapa tahapan antara lain tahap pengumpulan citra
lontar beraksara, tahap pemotongan (cropping) menggunakan Adobe
Photoshop CS6.
3.2.2.1. Pengumpulan Citra Daun Lontar Beraksara Kuno
Pengumpulan citra daun lontar dilaksanakan di
Perpustakaaan Universitas Sanata Dharma dengan
meminta perizinan terhadap penjaga perpustakaan. Daun
lontar didapatkan pada bagian Koleksi Artati yang
terdapat pada perpustakaan. Daun lontar yang
disediakan berupa satu ikat kumpulan daun lontar yang
beraksara. Kumpulan daun tersebut kemudian dipilih
dengan melihat apakah daun tersebut masih bagus atau
utuh sehingga pada saat pemrosesan ke sistem dapat
berjalan lebih baik. Citra daun lontar diambil dengan
bantuan Kamera Canon EOS 600D dengan jarak sekitar
30cm dari daun lontar dan menggunakan pencahayaan
yang disesuaikan dengan tingkat kelekukan daun lontar.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
3.2.2.2. Cropping
Citra yang telah diambil dilakukan pemotongan
manual sehingga bagian yang tidak diperlukan dapat
dihilangkan. Bagian yang dipotong hanyalah latar
belakang (background). Cropping manual dilakukan
menggunakan bantuan software Adobe Photosop CS6.
Proses cropping dilakukan secara manual karena
data yang didapatkan memiliki koordinat atau letak
posisi, panjang dan lebar yang berbeda – beda.
3.3. Analisa Kebutuhan Proses
Dalam penelitian ini terdapat 2 proses utama yaitu preprocessing,
segmentasi baris. Berikut diagram proses:
Gambar 3.2. Diagram Proses Segmentasi Baris Citra Lontar Aksara Menggunakan
Metode Shredding Text
Gambar 3.2. menggambarkan tentang urutan proses-proses yang
dilakukan sistem dalam melakukan segmentasi baris citra daun lontar. Proses
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
pertama yang dilakukan adalah membaca file input yang berupa citra daun
lontar, kemudian dilanjutkan dengan tahap preprocessing, segmentasi baris,
dan evaluasi sistem. Penjelasan mengenai langkah-langkah yang dilakukan
sebagai berikut:
3.3.1. Preprocessing
Sebelum data citra diolah maka data citra tersebut harus
disiapkan sedemikian rupa sehingga data tersebut siap untuk
diolah. Berikut diagram proses untuk tahap preprocessing:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
Gambar 3.3. Diagram Proses Preprocessing
Gambar 3.3. menggambarkan tentang urutan proses-proses yang
dilakukan sistem dalam melakukan proses preprocessing. Dalam tahapan
pertama preprocessing dilakukan proses grayscaling citra daun lontar aksara
menggunakan fungsi bawaan Matlab yaitu rgb2gray().
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
Tahap kedua adalah proses binerisasi citra daun lontar yang telah
dilakukan grayscaling menjadi citra biner. Proses binerisasi menggunakan
fungsi bawaan Matlab yang mengimplementasikan metode Sauvola dengan
parameter awal (default parameter).
Tahap selanjutnya adalah tahap reduksi noise. Reduksi noise pada
penelitian ini dilakukan dengan 2 tahap. Tahap 1 adalah reduksi noise
menggunakan toolbox bwareaopen yang disediakan oleh Matlab untuk
mengurangi beban komputasi. Tahap 2 adalah reduksi noise yang dilakukan
dengan cara mencari tinggi dan lebar dari setiap komponen label. Tahap awal
reduksi noise adalah dilakukan penyelidikan pada setiap komponen berlabel
dengan cara membuat tabel yang menampung tinggi dan lebar untuk setiap
label.
Berikut adalah pseudocode untuk menjelaskan algoritma reduksi noise
yang digunakan:
• Reduksi noise
1. Buat tabel penyelidikan berisi label, tinggi, dan lebar objek
i. Lakukan pelabelan pada citra
ii. Buat matriks zeros berukuran label tertinggi x 3
iii. Lakukan perulangan dari k=1 hingga label tertinggi
a. Cari koordinat dari tinggi dan lebar pada label k
b. Simpan label k ke tabel(k,1)
c. Simpan tinggi label dengan menghitung nilai koordinat
maksimum tinggi dikurang nilai koordinat minimum
tinggi ke tabel(k,2)
d. Simpan lebar label dengan menghitung nilai koordinat
maksimum dari lebar dikurang nilai koordinat minimum
lebar ke tabel(k,3)
e. Akhiri perulangan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
iv. Hitung nilai minimum dan standar deviasi dari semua tinggi dan
lebar pada tabel
2. Hapus noise
i. Hitung jumlah baris dan kolom citra berlabel
ii. Buat variabel baru berisi citra yang berlabel
iii. Lakukan perulangan dari i = 1 sampai sejumlah tabel
a. Buat variabel jumlahTinggi berisi tabel(i,2)
b. Buat variabel jumlahLebar berisi tabel(i,3)
c. Hitung nilai kewajaran tinggi dengan jumlahTinggi –
standar deviasi tinggi + nilai minimum dari semua tinggi
d. Hitung nilai kewajaran lebar dengan jumlahLebar –
standar deviasi lebar + nilai minimum dari semua lebar
e. Jika nilai kewajaran tinggi < 0 , maka
a. Lakukan perulangan sejumlah baris
i. Lakukan perulangan sejumlah kolom
1. Jika label(baris, kolom) = i, maka
2. label(baris, kolom) = 0
3. akhiri perulangan
ii. akhiri perulangan
f. Jika nilai kewajaran lebar < 0 , maka
a. Lakukan perulangan sejumlah baris
i. Lakukan perulangan sejumlah kolom
1. Jika label(baris,kolom) = i, maka
2. label(baris,kolom) = 0
3. akhiri perulangan
ii. akhiri perulangan
iv. Akhiri perulangan
v. Ubah tipe data citra hasil reduksi menjadi logical
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
Tahap berikutnya adalah mencari perkiraan tinggi karakter. Tahap
pertama dalam mencari tinggi karakter adalah dengan mencari tinggi untuk
setiap objek dan menyimpan pada suatu variabel. Setelah mencari tinggi untuk
setiap karakter dilakukan pencarian tinggi yang paling banyak muncul atau
mencari modus dari kumpulan tinggi karakter tersebut. Jika semua tinggi
karakter hanya muncul satu kali maka nilai modus ditentukan berdasarkan nilai
tinggi terendah.
Tahap terakhir dari proses preprocessing adalah Blurring Image.
Blurring Image dilakukan untuk mengkaburkan citra yang telah diproses dari
tahap diatas. Output akhir dari Blurring Image adalah citra bertipe double yang
nilai untuk setiap pikselnya diburamkan berdasarkan estimasi tinggi karakter
yang telah dicari pada proses sebelumnya.
Berikut adalah pseudocode untuk menjelaskan algoritma blurring
image yang digunakan:
• Blurring Image
1. Hitung bluring window width hwindow = tinggi karakter * 8
2. Hitung bluring window height vwindow = tingg karakter * 0.8
3. Lakukan pengecekan langkah 1 dan 2
i. Jika hwindow bernilai ganjil maka hwindow + 1
ii. Jika vwindow bernilai ganjil maka vwindow + 1
4. Buat matriks zeros tmpin berukuran (baris citra + vwindow) x (kolom
citra + hwindow )
5. Simpan nilai piksel tmpin pada koordinat (1 + vwindow / 2 sampai end
- vwindow/2) , 1 + hwindow / 2 : end – hwindow / 2) dengan nilai piksel
citra
6. Buat variabel cumsum1 berisi hasil perhitungan kumulatif dari tmpin
7. Buat variabel cumsum2 berisi hasil perhitungan kumulatif dari
cumsum1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
8. Buat variabel summed1 berisi nilai piksel cumsum2 pada koordinat
((vwindow+1) sampai end) , ((hwindow+1) sampai end)
9. Buat variabel summed2 berisi nilai piksel cumsum2 pada koordinat (1
sampai (end–vwindow)) , (1 sampai (end–hwindow))
10. Buat variabel summed3 berisi nilai piksel cumsum2 pada koordinat
((1+vwindow) sampai end) , (1 sampai (end-hwindow))
11. Buat variabel summed4 berisi nilai piksel cumsum2 pada koordinat (1
sampai (end-vwindow) ), ((hwindow+1) sampai end)
12. Buat variabel RES berisi penjumlahan summed1 dan summed2
dikurang dengan summed3 dan summed4
13. Lakukan perhitungan RES = RES dibagi dengan (vwindow+1 dikalikan
hwindow+1)
3.3.2. Segmentasi Baris
Segmentasi Baris menggunakan metode Shredding Text
dilakukan dengan cara membuat jalur pelacakan untuk area
baris, pelabelan pelacak untuk area baris, dan menampilkan
hasil segmentasi. Berikut adalah diagram proses segmentasi
baris:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
Gambar 3.4. Diagram proses Segmentasi Baris
Gambar 3.4. menggambarkan tentang urutan proses-proses yang
dilakukan sistem dalam melakukan proses segmentasi baris. Proses pencarian
pelacakan untuk area baris dan pusat baris dicari dengan perhitungan pada citra
hasil Blurring Image. Pencarian pelacak area baris LA dilakukan untuk mencari
jalur whitest pixels atau dapat disebut piksel terputih dari ujung kiri citra hasil
Blurring Image hingga ujung kanan citra hasil Blurring Image. Pelabelan
pelacak area baris LLA dilakukan dengan fungsi toolbox bwlabel dalam
Matlab. Setelah pelabelan, dilakukan filter untuk area – area yang kecil. Filter
dilakukan pada area yang memiliki nilai piksel yang kurang dari tinggi karakter
pangkat 2 karena tidak ada baris yang lebih kecil dari sebuah kata. Sebelum
menampilkan hasil segmentasi, dilakukan penggabungan antar hasil dari LLA
dan hasil dari preprocessing yaitu hasil setelah reduksi noise.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
Berikut adalah pseudocode untuk menjelaskan algoritma pencarian
pelacak area baris yang digunakan:
• Pelacakan area baris (LA)
1. Buat matriks ones bertipe logical dengan ukuran citra Blurring
Image
2. Hitung jumlah baris dan kolom citra Blurring Image
3. Hitung tinggi minimal = (tinggi karakter / 2) +1
4. Hitung penyeimbang = tinggi karakter / 2
5. Hitung tinggi maksimal = baris – tinggi minimal
6. Buat variabel laTracers berisi minHeight sampai maxHeight secara
urut
7. Pelacakan dari citra kiri ke citra kanan
Lakukan perulangan dari x = 1 sampai sejumlah kolom
i. Buat variabel b1 berisi nilai piksel Blurring Image pada
koordinat ((laTracers+penyeimbang) , x)
ii. Buat variabel b2 berisi nilai piksel Blurring Image pada
koordinat ((laTracers-penyeimbang) , x)
iii. Untuk laTracers yang memiliki nilai b1 kurang dari b2
maka ditambah 1 setiap nilainya
iv. Untuk laTracers yang memiliki nilai b1 lebih dari b2
maka dikurang 1 setiap nilainya
v. Untuk laTracers yang memiliki nilai laTracers kurang
dari offset+1 maka offset ditambah 1
vi. Untuk laTracers yang memiliki nilai laTracers lebih dari
(maxheigth-offset) maka diubah menjadi hasil
maxheigth-offset
vii. Untuk setiap piksel LA pada koordinat laTracers, x
diubah menjadi 0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
8. Pelacakan dari citra kanan ke citra kiri
Buat variabel seperti pada Langkah 6
Lakukan perulangan dari x = jumlah kolom sampai 1
i. Buat variabel b1 berisi nilai piksel Blurring Image pada
koordinat ((laTracers+penyeimbang) , x)
ii. Buat variabel b2 berisi nilai piksel Blurring Image pada
koordinat ((laTracers-penyeimbang) , x)
iii. Untuk laTracers yang memiliki nilai b1 kurang dari b2
maka ditambah 1 setiap nilainya
iv. Untuk laTracers yang memiliki nilai b1 lebih dari b2
maka dikurang 1 setiap nilainya
v. Untuk laTracers yang memiliki nilai laTracers kurang
dari offset+1 maka offset ditambah 1
vi. Untuk laTracers yang memiliki nilai laTracers lebih dari
(maxheigth-offset) maka diubah menjadi hasil
maxheigth-offset
vii. Untuk setiap piksel LA pada koordinat laTracers, x
diubah menjadi 0
Berikut adalah pseudocode untuk menjelaskan algoritma pelabelan
pelacak area baris yang digunakan:
• Pelabelan area baris (LLA)
1. Gunakan fungsi bwlabel Matlab untuk pelabelan LLA
2. Buat tabel penyelidikan untuk label LLA pada langkah 1
a. Buat tabel matriks zeros berukuran jumlah label x 3
b. Lakukan perulangan dari k sampai jumlah label
• Cari koordinat dari baris dan kolom pada label k
• Simpan label k pada tabelLLA(k,1)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
• Simpan nilai maksimum dari tinggi dikurang
minimum tinggi ke tabelLLA(k,2)
• Simpan nilai maksimum dari lebar dikurang
minimum lebar ke tabelLLA(k,3)
• Akhiri perulangan
3. Hapus area kecil
a. Hitung jumlah baris dan kolom dari LLA
b. Buat variabel LLA_baru = LLA
c. Kuadratkan tinggi karakter
d. Lakukan perulangan dari j = 1 sampai sejumlah tabel
i. Buat variabel untuk menampung tabelLLA(i,3)
ii. Jika langkah i. bernilai
30
4. Buat tabel penyelidikan untuk RES
a. Buat tabel matriks zeros berukuran jumlah label x 3
b. Lakukan perulangan dari k sampai jumlah label
i. Cari koordinat dari baris dan kolom pada label k
ii. Simpan label k pada tabelRES(k,1)
iii. Simpan nilai maksimum dari tinggi dikurang
minimum tinggi ke tabelRES(k,2)
iv. Simpan nilai maksimum dari lebar dikurang
minimum lebar ke tabelRES(k,3)
v. Akhiri perulangan
5. Hapus objek kecil
a. Hitung jumlah baris dan kolom dari RES
b. Buat variabel RES_baru = RES
c. Lakukan perkalian tinggi karakter dengan log(tinggi
karakter) dan simpan ke variabel lh_log
d. Lakukan perulangan dari i = 1 sampai sejumlah tabel
i. Buat variabel untuk menampung tabelRES(i,3)
ii. Jika langkah i. bernilai
31
3.3.3. Evaluasi Kinerja Sistem
Dalam melakukan evaluasi kinerja sistem, dilakukan
perhitungan secara manual mencari jumlah objek setiap baris
untuk citra hasil tahap preprocessing, perhitungan dengan
mengggunakan fungsi bwconncomp pada MATLAB untuk
menghitung jumlah objek untuk setiap hasil segmentasi oleh
sistem, dan perhitungan secara manual untuk mencarijumlah
objek yang sesuai antara jumlah objek setiap baris untuk citra hasil
tahap preprocessing dan jumlah objek untuk setiap hasil
segmentasi oleh sistem. Dari perhitungan tersebut, maka
dilakukan perhitungan untuk Detection Rate, Recognition
Accuracy, dan Performance Metric.
3.4. Perancangan Antar Muka Alat Uji
Prototype sistem segmentasi baris citra daun lontar aksara kuno
menggunakan metode Shredding Text yang akan dibangun memiliki desain
interface seperti pada gambar dibawah ini.
Gambar 3.5. Prototype Rancangan Antar Muka Alat Uji
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
32
Berikut penjelasan mengenai Gambar 3.5. Prototype Rancangan Antar Muka Alat Uji:
1. Axes1, digunakan untuk menampilkan logo Universitas Sanata Dharma
2. Axes7, digunakan untuk menampilkan citra masuk / citra asli
3. Axes6, digunakan untuk menampilkan citra hasil preprocessing
4. Axes4, digunakan untuk menampilkan citra Blurring Image
5. Axes9, digunakan untuk menampilkan citra hasil LA
6. Axes5, digunakan untuk menampilkan citra hasil segmentasi
7. Push button browse, digunakan untuk memilih file citra
8. Push button proses, digunakan untuk memproses sistem
3.5. Spesifikasi Perangkat Keras dan Perangkat Lunak
Berikut merupakan spesifikasi perangkat keras dan perangkat lunak
yang digunakan penulis dalam melakukan pembangunan dan pengujian sistem
yang dibuat:
3.5.1. Perangkat Keras (Hardware)
Tabel 3.1. Spesifikasi Perangkat Keras
RAM 8.00 GB
Tipe Sistem Sistem Operasi 64-bit
Harddisk 1 TB
Processor Intel Core i5-8250U, CPU @3.4 GHz
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
33
3.5.2. Perangkat Lunak (Software)
Tabel 3.2. Spesifikasi Perangkat Lunak
Sistem Operasi Windows 10
Program Pengembang Alat Uji Matlab 2014b
Program Pendukung Alat Uji Adobe Photosop CS6
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
34
BAB IV
HASIL DAN PEMBAHASAN
4.1.Data Masukan
Data masukan untuk pengujian didapatkan dari Perpustakaan Universitas
Sanata Dharma Yogyakarta. Data diambil menggunakan Kamera Canon EOS 600D
dengan jarak pengambilan 30 cm. Data yang diambil sebanyak 10 citra daun lontar
aksara kuno. Berikut adalah citra yang telah diambil:
Gambar 4.1. Data Citra Asli
Setelah data telah diambil dan disimpan, dilakukan proses cropping atau
pemotongan manual menggunakan Adobe Photoshop CS6. Adapun hasil proses
pemotongan yang telah dilakukan sekaligus penamaan untuk setiap file:
Gambar 4.2. Data Citra Hasil Pemotongan
4.2.Preprocessing
Seperti yang dapat dilihat pada Gambar 3.3 yaitu Gambar Diagram Proses
Preprocessing, penelitian ini melakukan preprocessing antara lain grayscaling,
binerisasi, reduksi noise, mencari tinggi karakter, dan blurring image. Berikut
adalah hasil percobaan dan analisis yang telah dilakukan:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
35
4.2.1. Baca file citra daun lontar
Langkah pertama adalah baca file citra daun lontar dilakukan
menggunakan fungsi imread yang terdapat pada MATLAB.
Gambar 4.3. Hasil Baca File kuno 1.jpg
Gambar 4.3 merupakan citra kuno 1.jpg yang akan menjadi contoh masukan
kedalam sistem. Citra yang digunakan merupakan sebuah citra yang berukuran 495 x
2544 dengan keping 3.
4.2.2. Grayscaling
Data yang telah dijadikan masukan kemudian diubah menjadi citra
berskala keabuan. Proses ini disebut dengan grayscaling. Grayscaling
dilakukan menggunakan fungsi rgb2gray()pada Matlab.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
Gambar 4.4. Hasil Proses Grayscaling
4.2.3. Binerisasi
Proses binerisasi merupakan proses dimana citra berskala abu – abu
diubah menjadi citra biner atau hitam putih. Proses ini dilakukan untuk
memisahkan objek citra dan latar belakang citra. Untuk proses binerisasi
dilakukan dengan menggunakan binerisasi metode Sauvola menggunakan
default parameter.
Berikut adalah code yang digunakan:
gambar_asli=imread('C:\Users\asus\Desktop\Skripsi\New folder\kuno
1.jpg');
gambar_gray=rgb2gray(gambar_asli);
gambar_sauvola=(sauvola(gambar_gray,[30 30], 0.15));
imshow(gambar_sauvola)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
Gambar 4.5. Hasil Proses Binerisasi
Jika Gambar 4.5. diperbesar maka masih terdapat noise atau objek yang tidak
dibutuhkan. Noise dapat dilihat seperti dibawah ini:
Gambar 4.6. Contoh Noise
4.2.4. Reduksi Noise
Reduksi Noise dalam penelitian ini menggunakan 2 langkah, yang
pertama adalah menggunakan fungsi Matlab yaitu bwareaopen untuk
membantu mempercepat komputasi dan menggunakan penyelidikan terdahap
tabel yang dibuat. Penyelidikan yang dilakukan dibagi menjadi 2 tahapan yaitu
membuat tabel yang berisikan label, tinggi dan lebar label, dan fungsi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
menghapus noise itu sendiri. Berikut adalah citra hasil binerisasi setelah dikenai
fungsi bwareaopen.
Gambar 4.7. Hasil Proses Reduksi Noise Memakai bwareaopen
Setelah dilakukan reduksi noise menggunakan fungsi bwareaopen dari Matlab,
dilakukan proses reduksi noise tahap 2 yaitu dengan menggunakan penyelidikan untuk
setiap objek. Reduksi noise tahap 2 dilakukan dengan 2 tahapan yaitu membentuk tabel
yang berisikan label beserta tinggi dan lebarnya, dan yang berikutnya menghapus noise
itu sendiri.
Berikut merupakan implementasi dari algoritma yang telah dibuat:
function [ tabel,tinggimin,lebarmin,stdevtinggi,stdevlebar] =
tabelReduksiNoise( label )
tabel=zeros(max(label(:)),3);
for k=1 : max(label(:))
[r,c] = find(label==k);
tabel(k,1) = k;
tabel(k,2) = (max(r) - min(r))+1;
tabel(k,3) = (max(c) - min(c))+1;
end
tinggimin=min(tabel(:,2));
lebarmin=min(tabel(:,3));
stdevtinggi=std(tabel(:,2));
stdevlebar=std(tabel(:,3));
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
end
Gambar 4.8. Screenshoot Tabel Hasil Penyelidikan Label
Gambar 4.8 merupakan tabel hasil dari perhitungan sistem yang telah
dilakukan. Baris 1 merupakan label, baris 2 merupakan tinggi label, dan baris 3
merupakan lebar label. Setelah didapatkan tabel penyelidikan, dilakukan penghapus
noise yang disesuasikan dengan ketentuan nilai kewajaran tinggi dan lebar label.
Berikut merupakan implementasi code yang dilakukan:
function [ labelBaru ] = hapusnoise
(label,tabel,tinggimin,lebarmin,stdevtinggi,stdevlebar)
[baris, kolom] = size(label);
labelBaru = label;
for i = 1 : length(tabel)
tinggiLabel = tabel(i,2);
lebarLabel = tabel(i,3);
wajar1=tinggiLabel - stdevtinggi + tinggimin;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
wajar2=lebarLabel - stdevlebar + lebarmin;
if(wajar1
41
4.2.5. Mencari Tinggi Karakter
Algoritma untuk mencari tinggi karakter yang telah dirancang
diimplementasikan kedalam bentuk code. Sebelum dilakukan pencarian terhadap tinggi
karakter dilakukan proses konversi hasil reduksi noise menjadi citra bertipe logical.
Berikut adalah implementasi dari algoritma yang telah dibuat:
function tinggi = cariTinggiKarakter( In )
[label]=bwlabel(In);
tabel=zeros(max(label(:)),3);
for k=1 : max(label(:))
[r,c] = find(label==k);
tabel(k,1) = k;
tabel(k,2) = (max(r) - min(r));
tabel(k,3) = max(c) - min(c);
end
tinggi=mode(tabel(:,2));
end
Gambar 4.10. Screenshot Tabel Hasil Pencarian Tinggi Label
Gambar 4.9. merupakan kumpulan tinggi untuk setiap label yang telah dicari.
Nilai 34 didapatkan dengan cara menggunakan menghitung nilai modus atau nilai yang
paling banyak keluar dari tabel tersebut.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
4.2.6. Blurring Image
Blurring image merupakan tahap lanjutan yang akan dilakukan setelah proses
reduksi noise dan pencarian tinggi karakter dilakukan. Berikut merupakan
implementasi dari algoritma yang telah dibuat:
function res=flatBlur(in,lh)
vwindow=ceil(lh*0.8);
hwindow=ceil(lh*8);
if(mod(vwindow,2)~=0)
vwindow=vwindow+1;
end
if(mod(hwindow,2)~=0)
hwindow=hwindow+1;
end
tmpin=zeros(size(in)+[vwindow hwindow]);
tmpin(1+vwindow/2:end-vwindow/2,1+hwindow/2:end-hwindow/2)=in;
summed=cumsum(cumsum(tmpin,1),2);
summed1=summed(vwindow+1:end,hwindow+1:end);
summed2=summed(1:end-vwindow,1:end-hwindow);
summed3=summed(1+vwindow:end,1:end-hwindow);
summed4=summed(1:end-vwindow,hwindow+1:end);
res=summed1+summed2-summed3-summed4;
res=res./((vwindow+1)*(hwindow+1));
end
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
43
Gambar 4.11. Hasil Blurring Image
Gambar 4.10. merupakan hasil Blurring Image yang telah dilakukan. Gambar
yang terlihat seperti putih samar diatas merupakan hasil perhitungan dari algoritma
yang dipakai. Adapun contoh tabel hasil perhitungan:
Gambar 4.12. Contoh Bagian Blurring Image
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
44
4.3.Pencarian Jalur Pelacak
4.3.1. Pencarian Jalur Pelacak LA
Hasil akhir dari pencarian jalur pelacak LA akan membentuk garis yang
terbentang dari sisi kiri citra hingga sisi kanan citra. Pencarian ini dilakukan
dengan mencari jalur yang dimulai dari salah satu sisi citra menuju sisi lain,
kemudian dilanjutkan sebaliknya.
Berikut adalah implementasi algoritma yang telah dibuat:
function [LA]=cariLA(b,lh)
LA=logical(ones(size(b)));
[height,width]=size(b);
minHeight=ceil(lh./2+1);
offset=ceil(lh./2);
maxHeight=height-ceil(lh./2+1);
laTracers=minHeight:maxHeight;
for x=1:width
b1=b(laTracers+offset,x);
b2=b(laTracers-offset,x);
laTracers(b1b2)-1;
laTracers(laTracersmaxHeight-offset)=maxHeight-offset;
LA(laTracers,x)=0;
end
laTracers=minHeight:maxHeight;
for x=width:-1:1
b1=b(laTracers+offset,x);
b2=b(laTracers-offset,x);
laTracers(b1b2)-1;
laTracers(laTracersmaxHeight-offset)=maxHeight-offset;
LA(laTracers,x)=0;
end
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
45
end
Gambar 4.13. Hasil Pelacakan LA
Gambar 4.12. merupakan jalur pelacak yang didapatkan dari sistem. Terlihat
pada gambar, terdapat garis yang membentang dari sisi kiri citra menuju sisi kanan
citra. Garis yang membentang terlihat seperti terputus – putus dikarenakan ukuran citra
yang terlalu besar. Jika diperbesar, maka garis – garis tersebut akan membentuk garis
yang terhubung seperti dibawah ini.
Gambar 4.14. Hasil Bagian Pelacakan LA
4.3.2. Pelabelan Jalur Pelacak LA
Pelabelan untuk LA akan dideklarasikan sebagai LLA. Dalam pelabelan
LA, proses juga akan dilakukan filter untuk area – area baris kecil. Tahap
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
46
pertama dalam pelabelan adalah pelabelan itu sendiri menggunakan fungsi
bwlabel dari Matlab. Tahap kedua adalah tahap untuk membentuk sebuah tabel
penyelidikan yang berisi label beserta tinggi dan lebarnya. Tahap ketiga
merupakan tahap untuk filter area – area yang mempunyai baris yang kecil.
Berikut adalah implementasi code untuk pelabelan LLA:
[LLA,jumlah_LA]=bwlabel(LA,4);
Jumlah label awal yang terdeteksi sebelum dilakukan proses filter area
baris kecil mendapatkan jumlah label sebanyak 27 label. Jumlah ini dapat
berkurang ataupun tetap setelah dilakukan proses filter area baris kecil. Berikut
adalah implementasi algoritma proses untuk mendapatkan tabel penyelidikan.
function [tabelLLA]=
selidikVerySmallAreas(LLA)
tabelLLA=zeros(max(LLA(:)),3);
for k=1 : max(LLA(:))
[r, c] = find(LLA==k);
tabelLLA(k,1) = k;
tabelLLA(k,2) = max(r) - min(r);
tabelLLA(k,3) = max(c) - min(c);
end
end
Berikut merupakan screenshot tabel hasil penyelidikan:
Gambar 4.15. Screenshoot Tabel Hasil Penyelidikan LLA
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
47
Gambar 4.14. memuat informasi yang dapat digunakan dalam proses
selanjutnya proses menghapus atau filter area – area yang mempunyai baris kecil.
Dalam prosesnya dilakukan ketentuan untuk setiap label yang mempunyai ukuran baris
lebih kecil dari huruf (lh^2) maka label tersebut akan dihapus. Berikut implementasi
dari algoritma yang telah dibuat:
function [ LLA_baru ] = hapusSmallAreas(LLA,tabelLLA,lh)
[baris, kolom] = size(LLA);
LLA_baru = LLA;
lh_kuadrat=lh^2;
for i = 1 : length(tabelLLA)
letter = tabelLLA(i,3);
if(letter
48
Berikut adalah tabel penyelidikan yang dilakukan:
Gambar 4.16. Screenshot Tabel LLA Hasil Penyelidikan Setelah Difilter
Dari tabel diatas diperoleh lebar label yaitu pada tabel kolom ke 3. Hasil
tersebut dari 27 label menjadi 6 label dikarenakan tidak boleh ada garis yang lebih kecil
dari huruf. Kolom ke 3 tersebut dibandingkan dengan LH kuadrat yang diperoleh
sebesar 1156. Dikarenakan label mempunyai kolom kurang dari 1156 maka label
beserta isinya dihapus.
4.4.Menampilkan hasil segmentasi
4.4.1. Menggabungkan citra hasil preprocessing (setelah reduksi noise) dengan hasil
pencarian pelacak area baris yang telah dilakukan pelabelan (Tahap 4.3).
Berikut adalah implementasi yang telah dilakukan kedalam code:
res=LLA_baru;
res(logical(1-In))=0;
Tahap pertama adalah membuat variabel res untuk menampung hasil pencarian
pelacak area baris (LLA_baru). Tahap kedua adalah melakukan proses konversi hasil
citra hasil preprocessing (In) yang telah dilakukan fungsi invers kemudian dikonversi
menjadi logical.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
49
4.4.2. Menghapus area untuk objek kecil
Tahap ini dibagi menjadi 2 tahap yaitu melakukan pencarian tinggi dan lebar
untuk semua objek dan melakukan penghapusan objek kecil. Berikut adalah
implementasi dari algoritma yang telah dibuat untuk tahap pertama:
function [tabelres]=tabelSelidikRES(res)
tabelres=zeros(max(res(:)),3);
for k=1 : max(res(:))
[r, c] = find(res==k);
if(r~=0)
if(c~=0)
tabelres(k,1) = k;
tabelres(k,2) = max(r) - min(r);
tabelres(k,3) = max(c) - min(c);
end
end
end
end
Berikut adalah hasil dari tabel yang telah dibuat:
Gambar 4.17. Screenshot Tabel Penyelidikan Area Objek Kecil
Setelah dilakukan pembuat tabel penyelidikan, dilakukan tahap selanjutnya
yaitu menghapus objek – objek yang kecil. Penghapusan ini dilakukan dengan
menggunakan nilai ambang batas yang didapatkan dari LH * log(LH).
Berikut adalah implementasi dari algoritma yang telah dibuat:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
50
function [ res_baru ] = hapusSmallTextLines(res,tabel_res,lh)
[baris, kolom] = size(res);
res_baru = res;
lh_log=(lh*log(lh));
for i = 1 : length(tabel_res)
letter = tabel_res(i,3);
if(letter
51
[r,c]=find(res_baru==i);
if(r~=0)
BW{i,1}=bwselect(res_baru,c,r);
figure, imshow(~cell2mat(BW(i,1)));
end
end
Gambar 4.19. Hasil Segmentasi 1
Gambar 4.20. Hasil Segmentasi 2
Gambar 4.21. Hasil Segmentasi 3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
52
Gambar 4.22. Hasil Segmentasi 4
Gambar 4.17. Gambar 4.18, Gambar 4.19, dan Gambar 4.20 adalah hasil
menampilkan segmentasi baris dari algoritma yang telah dibuat .
4.5.Evaluasi Kinerja Sistem
Proses pengukuran kinerja dari algoritma didasarkan pada penghitungan jumlah
kecocokan antara entitas yang terdeteksi oleh algoritma dan entitas dengan
perhitungan secara manual (I. Philips, dkk, 1999).
Langkah yang yang dilakukan adalah menghitung entitas atau objek pada citra
hasil preprocessing yaitu citra hasil binerisasi yang telah direduksi noise.
Penghitungan objek dilakukan secara manual dengan menghitung jumlah objek
secara baris perbaris disimbolkan dengan N. Kemudian menghitung objek hasil dari
proses segmentasi menggunakan fungsi bwlabel pada MATLAB disimbolkan
dengan M. Perhitungan kecocokan antar entitas dilakukan secara manual dengan
cara one-to-one matches atau menghitung jumlah yang sesuai disimbolkan dengan
o2o.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
53
Tabel 4.1. Tabel Evaluasi Sistem
No. Data
Bar
is
ke-
N M o2
o
Akurasi
Baris
(%)
DR
(%)
RA
(%)
FM
(%)
1 Kuno
1.jpg
1 59 6
0 59
100 91,4414 95,2569 93,3102
2 51 6
1 57
3 57 6
8 59
4 55 6
4 58
2 Kuno
2.jpg
1 46 5
0 46
100 95,9391 92,3423 94,1064
2 57 6
5 59
3 46 5
3 49
4 48 5
4 52
3 Kuno
3.jpg
1 41 5
8 50
100 95,939 92,342 94,106
2 51 6
0 42
3 52 5
9 48
4 55 5
9 58
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
54
4 Kuno
4.jpg
1 37 4
9 42
100 86,875 88,725 87,79
2 40 5
2 40
3 45 5
9 48
4 38 4
4 38
5 Kuno
5.jpg
1 44 5
3 46
100 93,333 87,273 90,201
2 45 5
8 46
3 46 6
1 54
4 41 4
8 46
6 Kuno
6.jpg
1 48 5
9 55
100 95,215 88,306 91,631
2 53 6
3 58
3 57 6
6 60
4 52 6
0 55
7 Kuno
7.jpg
1 50 5
5 54 100 85,185 95,595 90,09
2 52 6
5 63
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
55
3 48 5
9 55
4 39 4
8 47
8 Kuno
8.jpg
1 44 5
6 45
100 96,739 90,909 93,734
2 47 5
6 48
3 45 5
3 47
4 48 5
0 47
9 Kuno
9.jpg
1 42 4
2 43
100 92,442 90,686 91,556
2 43 4
3 47
3 45 4
5 50
4 40 4
0 44
10 Kuno
10.jpg
1 41 4
3
40
100 94,118 88,789 91,376
2 50 6
0
53
3 48 6
5
56
4 48 5
5
49
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
56
Dari tabel hasil percobaaan yang dilakukan maka Detection Rate, Recognition
Accuracy, dan Performance Metric untuk setiap setiap telah didapatkan. Maka dari itu,
dapat diambil rata – rata untuk masing-masingnya.
Rata-rata Detection Rate = (jumlah semua Detection Rate / jumlah citra)
* 100%
= (9.30785 / 10) * 100%
= 93.0785%
Rata-rata Recognition Accuracy= (jumlah semua Recognition Accuracy /
jumlah citra) * 100%
= (9.02629 / 10) * 100%
= 90.2629%
Rata-rata Detection Rate = (jumlah semua Performance Metric / jumlah
citra) * 100%
= (9.15326 / 10) * 100%
= 91.5326%
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
57
BAB V
PENUTUP
5.1. Kesimpulan
Berdasarkan penelitian tentang segmentasi baris citra daun lontar aksara
kuno yang telah dikerjakan maka dapat diambil kesimpulan sebagai berikut:
1. Algoritma Shredding Text dapat dipakai dalam melakukan segmentasi baris
pada data citra daun lontar aksara kuno yang digunakan dengan hasil kinerja
sistem mendapatkan rata-rata tingkat performa untuk Detection Rate sebesar
93.079%, Recognition Accuracy sebesar 90.2629%, dan Perfomance Metric
sebesar 91.5326%.
2. Kelemahan dari metode Shredding Text ini adalah citra yang digunakan harus
bebas dari noise karena akan berpengaruh pada saat pencarian tinggi karakter
sehingga akan mengganggu performa proses-proses selanjutnya.
5.2. Saran
Dari hasil penelitian ini dapat disarankan untuk penelitian selanjutnya
sebagai berikut:
1. Dilakukan proses cropping citra secara otomatis oleh sistem
2. Dilakukan percobaan lebih lanjut dalam melakukan proses reduksi noise agar
dapat mendapatkan hasil yang lebih maksimal
3. Penggunaan metode Shredding Text disarankan digunakan untuk citra yang
memiliki bebas noise untuk mendapatkan hasil yang lebih baik.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
58
DAFTAR PUSTAKA
A. Nicolaou, and B. Gatos (2009), Handwritten Text Line Segmentation by Shredding
Text into its Lines, 10th International Conference on Document Analysis and
Recognition.
Du, X. and Pan, W. and Bui, T.,“Text line segmentation in handwritten documents
using Mumford-Shah model””, Pattern Recognition, 2009,
doi:10.1016/j.patcog.2008.12.021
Hinzler, H.I.R., 1993, Balinese palm-leaf manuscripts di BKI, 149:438-474.
Gonzalez, Rafael C., Wood, Richard E.2002 Digital Image Processing Second Edition
New Jersey: Prentice Hall.
I. Phillips, A. Chhabra, "Empirical Performance Evaluation of Graphics Recognition
Systems", IEEE Trans. of Patt. Analysis and Machine Intell., 21(9), pp. 849-870,
1999.
Kadir, A. dan Adhi, S. (2013). Teori dan Aplikasi Pengolahan Citra. Yogyakarta, Andi
Offset.
M. Petrou dan P. Bosdogianni, Image Processing : The Fundamentals, New York:
Wiley, 1999
Priyanto Hidayatullah, Pengolahan Citra Digital, Penerbit Informatika, 2017
Zhou, Q. (1999), Digital Image Processing And Interpretation. Hongkong. Department
of Geography, Hong Kong Baptist University
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
59
LAMPIRAN
Lampiran 1 Hasil Segmentasi Baris
Data Baris Hasil Segmentasi
‘kuno
1.jpg’
1
2
3
4
‘kuno
2.jpg’
1
2
3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
60
4
‘kuno
3.jpg’
1
2
3
4
‘kuno
4.jpg’
1
2
3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
61
4
‘kuno
5.jpg’
1
2
3
4
‘kuno
6.jpg’
1
2
3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
62
4
‘kuno
7.jpg’
1
2
3
4
‘kuno
8.jpg’
1
2
3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
63
4
‘kuno
9.jpg’
1
2
3
4
‘kuno
10.jpg’
1
2
3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
64
4
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI