SEGMENTASI BARIS CITRA LONTAR AKSARA KUNO … · 2019. 8. 6. · Segmentasi merupakan salah satu...

80
SEGMENTASI BARIS CITRA LONTAR AKSARA KUNO MENGGUNAKAN METODE SHREDDING TEXT SKRIPSI Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika JOEVIAN CAESARIO JUHARDI 155314078 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2019 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Transcript of SEGMENTASI BARIS CITRA LONTAR AKSARA KUNO … · 2019. 8. 6. · Segmentasi merupakan salah satu...

  • SEGMENTASI BARIS CITRA LONTAR AKSARA KUNO MENGGUNAKAN

    METODE SHREDDING TEXT

    SKRIPSI

    Diajukan Untuk Memenuhi Salah Satu Syarat

    Memperoleh Gelar Sarjana Komputer

    Program Studi Teknik Informatika

    JOEVIAN CAESARIO JUHARDI

    155314078

    PROGRAM STUDI TEKNIK INFORMATIKA

    JURUSAN TEKNIK INFORMATIKA

    FAKULTAS SAINS DAN TEKNOLOGI

    UNIVERSITAS SANATA DHARMA

    YOGYAKARTA

    2019

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • ii

    ANCIENT PALM LEAVES HANDWRITTEN TEXT LINE SEGMENTATION

    BY USING SHREDDING METHOD

    THESIS

    In a Partial Fulfilment of Requirements

    for The Degree of Sarjana Komputer

    Department of Informatic Engineering

    JOEVIAN CAESARIO JUHARDI

    155314078

    INFORMATICS ENGINEERING STUDY PROGRAM

    INFORMATICS ENGINEERING DEPARTMENT

    FACULTY OF SCIENCE AND TECHNOLOGY

    SANATA DHARMA UNIVERSITY

    YOGYAKARTA

    2019

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • iii

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • iv

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • v

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • vi

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • vii

    ABSTRAK

    Segmentasi terdiri dari 2 tahap yaitu segmentasi baris dan juga segmentasi

    karakter. Masalah yang terjadi pada proses segmentasi baris, khususnya untuk

    dokumen aksara kuno adalah terkadang terdapat aksara yang mempunyai tinggi yang

    berbeda – beda, dan pada beberapa kasus aksara tersebut tersambung dengan aksara

    dibaris atas atau bawahnya.Penelitian ini akan dibangun sistem yang melakukan

    segmentasi baris menggunakan metode Shredding Text. Data citra yang dipakai adalah

    citra daun lontar beraksara kuno berjumlah 10 buah citra. Preprocessing yang

    dilakukan adalah grayscaling, binerisasi, reduksi noise, mencari tinggi karakter, dan

    blurring image. Tahap segmentasi yang dilakukan adalah pelacakan untuk area baris,

    pelabelan area baris, menghapus area kecil dan menghapus objek kecil. Hasil penelitian

    memperoleh evaluasi hasil kinerja sistem untuk Detection Rate sebesar 93.079%,

    Recognition Accuracy sebesar 90.2629%, dan Perfomance Metric sebesar 91.5326%.

    Kata Kunci : daun lontar aksara kuno, preprocessing, segmentasi baris, Shredding

    Text

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • viii

    ABSTRACT

    Segmentation consists of two stages, namely line segmentation and character

    segmentation. The problem that occurs in the line segmentation process, especially for

    ancient script documents is that sometimes there are characters that have different

    heights, and in some cases the letters are connected with letters in the upper or lower

    lines. This study will build a system that segmented lines using methods Text

    Shredding. The image data used is the image of ancient illusory palm leaves with 10

    images. Preprocessing is done by grayscaling, binarization, noise reduction, looking

    for high character, and blurring image. The segmentation phase that is carried out is

    tracking for the line area, labeling the line area, removing small areas and removing

    small objects. The results of the study obtained evaluation of system performance

    results for Detection Rate of 93,079%, Recognition Accuracy of 90.2629%, and

    Perfomance Metric of 91.5326%.

    Keyword: ancient palm leaves, preprocessing, line segmentation, Shredding Text

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • ix

    KATA PENGANTAR

    Puji dan syukur penulis panjatkan kehadirat Tuhan Yesus Kristus atas rahmat

    dan karunia-Nya, sehingga penulis dapat menyelesaikan tugas akhir dengan judul

    “Segmentasi Baris Citra Lontar Aksara Kuno Menggunakan Metode Shredding

    Text” dengan baik dan tepat waktu. Tugas akhir ini merupakan salah satu persyaratan

    yang wajib untuk ditempuh sebagai syarat akademik untuk memperoleh gelar sarjana

    komputer program studi Teknik Informatika Universitas Sanata Dharma Yogyakarta.

    Dalam menyelesaikan tugas akhir ini penulis mendapatkan dukungan dan

    bimbingan dari berbagai pihak. Pada kesempatan ini, penulis mengucapkan banyak

    terima kasih kepada:

    1. Keluarga saya yang selalu mengingatkan saya dan juga telah memberikan

    dukungan untuk saya menyelesaikan tugas akhir saya.

    2. Ibu Dr. Anastasia Rita Widiarti, M.Kom selaku dosen pembimbing tugas

    akhir yang telah bersedia memberikan arahan, masukan, waktu serta

    motivasi kepada penulis selama menyelesaikan skripsi.

    3. Bapak Yohannes Widodo, S.S selaku penjaga Perpustakaan Universitas

    Sanata Dharma khususnya pada bagian koleksi Artati yang telah bersedia

    meluangkan waktu, arahan, dan tempat untuk mengambil data serta

    menyediakan data – data daun lontar yang dipakai dalam penelitian ini.

    4. Seluruh dosen Teknik Informatika Universitas Sanata Dharma yang telah

    mendidik dan memberikan ilmu pengetahuan selama proses perkuliahan.

    5. Saudara – saudara Welok Played yang telah menjadi sumber inpirasi dan

    motivasi karena telah menghidupkan kegiatan selama proses perkuliahan

    saya dan juga kegiatan diluar perkuliahan.

    6. Saudara Theodulus Titho dan Tubagus Rendy yang telah menemani saya

    selama kegiatan perkuliahan dan juga kegiatan diluar perkuliahan serta

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • x

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • xi

    DAFTAR ISI

    HALAMAN JUDUL ....................................................................................................i

    TITLE PAGE ...............................................................................................................ii

    HALAMAN PERSETUJUAN ...................................................................................iii

    HALAMAN PENGESAHAN ....................................................................................iv

    PERNYATAAN KEASLIAN KARYA ......................................................................v

    LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH

    UNTUK KEPENTINGAN AKADEMIS ...................................................................vi

    ABSTRAK ................................................................................................................vii

    ABSTRACT .............................................................................................................viii

    KATA PENGANTAR ................................................................................................ix

    DAFTAR ISI ..............................................................................................................xi

    DAFTAR GAMBAR ................................................................................................xiv

    DAFTAR TABEL…. ...............................................................................................xvi

    BAB I PENDAHULUAN ...........................................................................................1

    1.1. Latar Belakang ..........................................................................................1

    1.2. Rumusan Masalah .....................................................................................3

    1.3. Tujuan Penelitian ......................................................................................4

    1.4. Manfaat Penelitian ....................................................................................4

    1.5. Batasan Masalah .......................................................................................4

    1.6. Metodologi Penelitian ...............................................................................4

    1.7. Sistematika Penulisan ...............................................................................5

    BAB II LANDASAN TEORI .................................................................................... 7

    2.1. Daun Lontar ............................................................................................ 7

    2.2. Definisi dan Representasi Citra …........................................................... 7

    2.2.1. Citra Warna …………………………………………………………… 8

    2.2.2. Citra Abu – Abu ……………………………………………………….8

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • xii

    2.2.3. Citra Biner ……………………………………………………………..8

    2.3. Akuisisi Data …………........................................................................... 9

    2.4. Segmentasi Shredding Text …………..................................................... 9

    2.4.1. Preprocessing …………………………………………………………10

    2.4.1.1. Cropping ……………………………………………………………10

    2.4.1.2. Grayscaling …………………………………………………………10

    2.4.1.3. Binerisasi …………………………………………………………...11

    2.4.1.4. Konektivitas Komponen ……………………………………………11

    2.4.1.5. Reduksi Noise ………………………………………………………12

    2.4.1.6. Blurring Image ……………………………………………………...12

    2.4.2. Segmentasi Baris Shredding Text …………………………………….13

    2.4.2.1. Membuat pelacak untuk area baris (Tracing line areas) ……………13

    2.4.2.2. Pelabelan pelacak untuk area baris (Labelling line areas) ………….14

    2.4.2.3. Menampilkan hasil segmentasi…………………………. ………….15

    2.5. Evaluasi Kinerja Sistem………………………………………………... 15

    BAB III METODE PENELITIAN .......................................................................... 16

    3.1. Gambaran Umum ....................................................................................16

    3.2. Desain Penelitian ................................................................................... 16

    3.2.1. Studi Literatur ………………………………………………………...16

    3.2.2. Pengumpulan Data Penelitian ………………………………………...16

    3.2.2.1. Pengumpulan Citra Daun Lontar Beraksara Kuno …………………17

    3.2.2.2. Cropping ……………………………………………………………18

    3.3. Analisa Kebutuhan Proses ……………………………………………...19

    3.3.1. Preprocessing …………………………………………………………21

    3.3.2. Segmentasi Baris ……………………………………………………..25

    3.4. Perancangan Antar Muka Alat Uji ……………………………………..31

    3.5. Spesifikasi Perangkat Keras dan Perangkat Lunak …………………….32

    3.5.1. Perangkat Keras ………………………………………………………32

    3.5.2. Perangkat Lunak ……………………………………………………...33

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • xiii

    BAB IV HASIL DAN PEMBAHASAN ...................................................................34

    4.1. Data Masukan .........................................................................................34

    4.2. Preprocessing ..........................................................................................33

    4.2.1. Baca file citra …………………………………………………………35

    4.2.2. Grayscaling …………………………………………………………...35

    4.2.3. Binerisasi ……………………………………………………………..36

    4.2.4. Reduksi Noise ………………………………………………………...37

    4.2.5. Mencari Tinggi Karakter ……………………………………………..41

    4.2.6. Blurring Image ………………………………………………………..42

    4.3. Pencarian Jalur Pelacak ………………………………………………...44

    4.3.1. Pencarian Jalur Pelacak LA …………………………………………..44

    4.3.2. Pelabelan Jalur Pelacak LA …………………………………………..45

    4.4. Menampilkan Hasil Segmentasi ………………………………………..48

    4.5. Evaluasi Kinerja Sistem…………………………………………………53

    BAB V PENUTUP ....................................................................................................57

    5.1. Kesimpulan ..........................................................................................................57

    5.2. Saran ...................................................................................................................57

    DAFTAR PUSTAKA ................................................................................................58

    LAMPIRAN…………………………………………………………………………59

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • xiv

    DAFTAR GAMBAR

    Gambar 2.1. Contoh citra daun lontar beraksara……….............................................. 7

    Gambar 2.2. Contoh penerapan proses filter blur …………………………………...13

    Gambar 2.3. Contoh hasil pencarian pelacak untuk area garis ……………………...14

    Gambar 3.1. Diagram blok Segmentasi Baris Citra Lontar Aksara Menggunakan

    Metode Shredding Text ……………………………………………………………..17

    Gambar 3.2. Diagram Proses Segmentasi Baris Citra Lontar Aksara Menggunakan

    Metode Shredding Text ……………………………………………………………..19

    Gambar 3.3. Diagram Proses Preprocessing ………………………………………..21

    Gambar 3.4. Diagram Proses Segmentasi Baris …………………………………….26

    Gambar 3.5. Prototype Rancangan Antar Muka Alat Uji ……………...…………...31

    Gambar 4.1. Data Citra Asli ………………………………………………………...34

    Gambar 4.2. Data Citra Hasil Pemotongan …………………………………………34

    Gambar 4.3. Hasil Baca File kuno 1.jpg …………………………………………….35

    Gambar 4.4. Hasil Proses Grayscaling ……………………………………………...36

    Gambar 4.5. Hasil Proses Binerisasi ………………………………………………...37

    Gambar 4.6. Contoh Noise……………...…………………………………………...37

    Gambar 4.7. Hasil Proses Reduksi Noise Memakai bwareaopen …………………..38

    Gambar 4.8. Screenshoot Tabel Hasil Penyelidikan Label …………………………39

    Gambar 4.9. Hasil Reduksi Noise Tahap 2 ………………………………………….40

    Gambar 4.10. Screenshot Tabel Hasil Pencarian Tinggi Label ……………………..41

    Gambar 4.11. Hasil Blurring Image ………………………………………………...43

    Gambar 4.12. Contoh Bagian Filter Blur ……………………………………………43

    Gambar 4.13. Hasil Pelacakan LA ………………………………………………….45

    Gambar 4.14. Hasil Bagian Pelacakan LA…………………………………………..45

    Gambar 4.15. Screenshoot Tabel Hasil Penyelidikan LLA …………………………46

    Gambar 4.16. Screenshot Tabel LLA Hasil Penyelidikan Setelah Difilter …………48

    Gambar 4.17. Screenshot Tabel Penyelidikan Area Objek Kecil……………………49

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • xv

    Gambar 4.18. Screenshot Tabel Hasil Setelah Proses Penghapusan Objek Kecil…..50

    Gambar 4.19. Hasil Segmentasi 1 …………………………………………………..51

    Gambar 4.20. Hasil Segmentasi 2 …………………………………………………..51

    Gambar 4.21. Hasil Segmentasi 3 …………………………………………………..51

    Gambar 4.22. Hasil Segmentasi 4 …………………………………………………..52

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • xvi

    DAFTAR TABEL

    Tabel 3.1. Perangkat Keras (Hardware)…………………………………………......32

    Tabel 3.2. Perangkat Lunak (Software)……………………………………………...33

    Tabel 4.1. Tabel Evaluasi Sistem…………………………………………………....53

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 1

    BAB 1

    PENDAHULUAN

    1.1.Latar Belakang

    Indonesia merupakan sebuah Negara yang terdiri dari lebih dari 10 ribu

    pulau. Dengan banyaknya jumlahnya pulau tersebut, Indonesia dikenal dunia

    sebagai Negara kepulauan terbesar di Asia bahkan Indonesia juga merupakan

    Negara kepulauan terbesar di dunia. Indonesia merupakan terdiri dari beberapa

    pulau besar diantaranya Pulau Sumatera, Pulau Jawa, Pulau Kalimantan, Pulau

    Sulawesi, dan juga Pulau Papua. Setiap pulau yang ada di Indonesia masing –

    masing mempunyai kebudayaan – kebudayaan yang berbeda - beda, bahkan di

    dalam setiap pulau tersebut mempunyai kebudayaan yang berbeda – beda di hampir

    setiap daerah di dalam sebuah pulau itu sendiri. Kebudayaan tersebut meliputi

    rumah adat, pakaian adat, upacara adat, seni musik, seni tari tradisional, seni rupa,

    senjata tradisional, suku bangsa, bahasa daerah, dan juga seni aksara atatu seni

    tulisan.

    Pada era yang semakin modern ini, sebagai Negara yang mempunyai

    kebudayaan yang sangat besar dan beragam ini, Indonesia semakin dituntut untuk

    mengikuti perkembangannya tanpa menghilangkan aspek kebudayaan –

    kebudayaannya. Salah satu dari sekian banyak kebudayaan tersebut yaitu

    kebudayaan tentang seni aksara atau seni tulis. Seni aksara atau seni tulisan sendiri

    merupakan sebuah kesenian yang berbentuk tulisan tangan yang mengandung

    unsur kesenian dan keiindahan di dalam setiap katanya. Salah satu bentuk dari seni

    aksara adalah tulisan Aksara daerah kuno, misalnya Aksara Jawa, Aksara Sunda,

    dan ada juga Aksara Bali.

    Semakin bertambahnya waktu, usia daun lontar yang merupakan

    peninggalan dari masa lalu pastilah semakin bertambah. Dengan bertambahnya

    usia, daun lontar itu sendiri cepat atau lambat pasti semakin rapuh sehingga daun

    lontar yang berisi aksara – aksara kuno peninggalan jaman dulu akan semakin

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 2

    mudah rusak. Di dalam era yang semakin canggih ini, era ini menawarkan banyak

    sekali cara dalam perawatan ataupun pelestarian daun lontar kuno itu sendiri.

    Digitalisasi merupakan salah satu contoh penawaran yang ditawarkan teknologi –

    teknologi pada jaman yang modern ini. Digitalisasi sendiri merupakan sebuah

    proses mengubah informasi yang sifatnya analog, seperti kertas, dokumen, dan

    yang lainya menjadi bersifat digital. Media yang digunakan dalam mendigitalkan

    sesuatu seperti dokumen ataupun daun lontar sangatlah beragam, antara lain adalah

    kamera dan scanner. Dengan kamera, kita dapat mengabadikan sebuah momen

    ataupun sebuah gambaran suatu benda ke dalam bentuk digital.

    Bentuk digital yang berasal dari kamera itu dapat dinamakan sebagai citra

    digital. Sebuah citra digital dapat diolah sedemikian rupa dengan bantuan media

    olah lainya seperti komputer. Dengan bantuan komputer, gambar atau citra yang

    telah kita simpan dapat diproses sehingga dapat mengeluarkan output sesuai yang

    diinginkan. Transliterasi atau yang disebut alih aksara merupakan salah satu dari

    sekian banyak contoh proses yang dapat kita lakukan dengan data berupa citra

    digital, dalam hal ini citra tersebut merupakan citra dokumen.

    Citra dokumen merupakan sebuah citra yang memuat tulis – tulisan. Dalam

    proses transliterasi pada sebuah perangkat, seperti komputer, pastilah

    membutuhkan beberapa pemrosesan citra. Pemrosesan tersebut bisa terdiri dari

    preprocessing, ekstraksi ciri, klasifikasi dan yang lainnya. Dalam preprocessing

    sendiri, proses tersebut dapat membantu dalam komputasi, misalnya binerisasi,

    grayscaling, cropping, dan sebagainya.

    Segmentasi merupakan salah satu contoh dalam tahap – tahap yang

    diperlukan dalam alih aksara sebuah citra dokumen. Segmentasi terdiri dari 2 tahap

    yaitu segmentasi baris dan juga segmentasi kata. Segmentasi baris merupakan

    proses dimana program dapat memisahkan baris satu dengan baris lainnya.

    Sedangkan segmentasi kata merupakan proses dimana program dapat memisahkan

    setiap kata pada citra dokumen tersebut.

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 3

    Kedua proses segmentasi yaitu segmentasi baris dan segmentasi memiliki

    masalah – masalahnya tersendiri dalam pemrosesannya. Pada kasus segmentasi

    baris, proses segmentasi ini memiliki masalah tersendiri yaitu pada saat melakukan

    segmentasi itu sendiri. Masalah yang terjadi pada umumnya, khususnya untuk

    dokumen aksara kuno adalah terkadang terdapat aksara yang mempunyai tinggi

    yang berbeda – beda, dan pada beberapa kasus aksara tersebut tersambung dengan

    aksara dibaris atas atau bawahnya. Salah satu metode yang dapat digunakan untuk

    menyelesaikan masalah segmentasi baris tersebut adalah metode Shredding Text.

    Metode Shredding Text. Menurut Nicolaou dan Gatos (2009), sebuah citra

    dokumen dapat dipotong (shred) menjadi kumpulan potongan di sepanjang celah

    putih yang terdapat diantara baris – baris.

    Metode Shredding Text telah diciptakan dan digunakan untuk penelitian

    oleh A. Nicolau dan B. Gatos pada tahun 2009 dengan judul “Handwritten Text

    Line Segmentation by Shredding Text into its Lines”. Penelitian tersebut bertujuan

    untuk menciptakan gagasan atau ide metode baru terhadap segmentasi baris pada

    citra dokumen. Persentase evaluasi kinerja sistem yang diperoleh dari penelitian

    tersebut cukup tinggi yaitu Detection Rate sebesar 98,9%, Recognition Accuracy

    sebesar 98,3%, dan Perfomance Metric sebesar 98,6%.

    Oleh karena itu, penelitian ini dilakukan untuk mencoba menggunakan

    Metode Shredding Text dalam pengukuran persentase keberhasilan segmentasi

    baris pada kasus citra daun lontar.

    1.2.Rumusan Masalah

    Berapakah persentase keberhasilan segmentasi baris citra daun lontar

    beraksara kuno dengan menggunakan metode Shredding Text?

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 4

    1.3.Tujuan Penelitian

    Mengetahui tingkat keberhasilan sistem dalam melakukan segmentasi baris

    menggunakan metode Shredding Text.

    1.4.Manfaat Penelitian

    Manfaat dari penelitian ini adalah untuk menambah referensi metode yang

    dapat digunakan kepada peneliti yang selanjutnya mengenai segmentasi baris

    ataupun kepada peneliti yang berkaitan dengan transliterasi citra dokumen.

    1.5.Batasan Masalah

    Batasan masalah yang digunakan pada penelitian ini adalah sebagai berikut:

    1. Citra yang digunakan hanya citra daun lontar aksara kuno.

    2. Pemotongan (cropping) terhadap citra yang digunakan dilakukan dengan

    pemotongan manual.

    3. Pemrosesan yang dilakukan hanya segmentasi baris.

    4. Masukan hanya berupa gambar berformat .jpg atau .png

    5. Perhitungan objek dalam evaluasi kinerja sistem dilakukan secara manual

    1.6.Metodologi Penelitian

    1. Studi Literatur

    Pada tahap ini semua hal yang mendukung penelitian ini dipelajari

    melalui sumber – sumber pengetahuan seperti buku referensi ataupun jurnal

    yang berkatian dengan segmentasi baris dalam citra dokumen

    2. Perancangan Sistem

    Pada tahap ini akan dibangun sebuh sistem yang mempunyai fungsi

    sebagai alat uji untuk mengetahui persentase akurasi segmentasi baris dengan

    algoritma atau metode yang digunakan.

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 5

    3. Pengumpulan Data

    Pada tahap ini data yang akan digunakan dalam penelitian merupakan

    data citra daun lontar yang berisikan aksara kuno. Data akan dikumpulkan

    dengan menggunakan alat bantu seperti kamera dan tambahan lampu

    smartphone. Data yang dipakai merupakan daun lontar yang diambil di

    Perpustakaan Universitas Sanata Dharma Yogyakarta

    4. Pembuatan Sistem

    Pada tahap ini pembangunan sistem akan diimplementasikan

    berdasarkan rancangan sistem yang telah dibuat.

    5. Pengujian

    Pada tahap ini sistem akan diuji dengan menghitung persentase akurasi

    yang didapatkan dalam segmentasi baris daun lontar aksara kuno menggunakan

    metode Shredding Text.

    6. Pembuatan Laporan

    Pada tahap ini dilakukan proses pembuatan laporan penelitian yang

    didasarkan tahap – tahap dan proses yang telah dilakukan.

    1.7.Sistematika Penulisan

    BAB I: PENDAHULUAN

    Bab I merupakan Bab yang berisi tentang latar belakang tugas akhir dibuat,

    rumusan masalah, tujuan penelitian, batasan masalah, metodologi penelitian, dan

    sistematika penulisan.

    BAB II LANDASAN TEORI

    Bab II merupakan Bab yang berisikan tentang teori – teori yang digunakan

    dalam penelitian ini.

    BAB III METODE PENELITIAN

    Bab III merupakan Bab yang berisikan tentang rencana tahapan yang akan

    digunakan dalam penyusunan penelitian. Tahapan – tahapan penelitian yang

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 6

    direncanakan meliputi akusisi data / pengumpulan data, pengolahan data, desain

    rancangan alat uji, analisis data, cara pengujian, dan juga desain interface user.

    BAB IV IMPLEMENTASI DAN ANALISA HASIL

    Bab IV merupakan Bab yang berisikan tentang penjelasan mengenai

    impelementasi yang telah dibuat dengan penerapan algoritma yang digunakan serta

    analisa hasil berupa analisis dan evaluasi

    BAB V PENUTUP

    Bab V merupakab Bab akhir yang berisikan kesimpulan dari seluruh

    penelitian dan saran yang diusulkan kepada pengembangan lebih lanjut.

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 7

    BAB 2

    LANDASAN TEORI

    2.1.Daun Lontar

    Lontar (dari bahasa Jawa: ron tal, "daun tal") adalah daun siwalan atau tal

    (Borassus flabellifer atau palmyra) yang dikeringkan dan dipakai sebagai bahan

    naskah dan kerajinan (Hinzler, 1993). Daun lontar merupakan salah satu media tulis

    yang dipakai di Asia Selatan dan Asia Tenggara. Di Indonesia sendiri, daun lontar

    sering ditemukan dan digunakan di Sunda (Jawa Barat), Jawa, Bali, Madura,

    Lombok, dan juga Sulawesi. Di pulau Bali sendiri, saat ini daun lontar masih

    banyak digunakan untuk keperluan adat ataupun sebagai cinderamata khas Bali.

    Gambar 2.1. Contoh citra daun lontar beraksara

    (Sumber : Perpustakaan Universitas Sanata Dharma(2019))

    2.2.Definisi dan Representasi Citra Digital

    Secara umum, pengolahan citra digital adalah manipulasi dan interprestasi

    digital dari citra dengan bantuan komputer (Zhou, 1999). Menurut Gonzalez

    (2012), citra digital dapat didefinisikan sebagai fungsi dua-dimensi, f (x, y), di

    mana x dan y adalah spasial (bidang), dan amplitudo f pada setiap pasangan

    koordinat (x, y) disebut intensitas atau tingkat abu-abu gambar pada saat itu. Ketika

    x, y, dan nilai amplitudo dari f adalah semua finitie, kuantitas diskrit.

    Dalam pemrosesan citra digital, terdapat 3 jenis umum citra yang

    digunakan. Menurut Kadir dan Adhi. (2013) jenis citra digital dibagi menjadi 3

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 8

    jenis yaitu citra biner, citra abu, dan citra warna. Jenis – jenis citra dapat

    didefinisikan sebagai berikut:

    2.2.1. Citra Warna

    Citra RGB merupakan citra yang terdiri dari 3 macam keping, yaitu

    keping R (merah), G (hijau), dan B (biru). Setiap nilai dari keping tersebut

    mempunyai rentang nilai dari nilai 0 sampai 255. Kemungkinan jumlah warna

    terbanyak yang dihasilkan dari citra RGB adalah 255 x 255 x 255 atau

    16.581.375 warna yang berbeda – beda.

    2.2.2. Citra Abu – Abu

    Citra grayscale adalah citra yang menangani gradasi antara warna hitam

    dan putih (biner) yang secara visual akan dideskripsikan sebagai citra abu –

    abu. Pada citra grayscale warna dinyatakan dengan intensitas. Intesitas citra

    grayscale memiliki rentang nilai dari 0 sampai 255. Nilai 0 menyatakan warna

    hitam dan nilai 255 menyatakan warna putih. Pada citra grayscale, citra yang

    memiliki nilai yang mendekati 0 akan semakin gelap, sedangkan citra yang

    memiliki nilai yang lebih mendekati 255 akan semakin terang. Dengan kata

    lain, semakin kecil nilai grayscale pixel maka semakin gelap citra yang

    dihasilkan, sebaliknya semakin besar nilai grayscale pixel maka citra yang

    dihasilkan semakin terang.

    2.2.3. Citra Biner

    Citra biner atau yang biasa disebut sebagai citra hitam-putih. Citra biner

    hanya memiliki satu channel warna dan hanya mempunyai 2 kemungkinan nilai

    pikselnya, yaitu 1 atau 0. Nilai 0 menyatakan warna hitam sedangkan nilai 1

    menyatakan warna putih.

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 9

    2.3.Akuisisi Data

    Data Acqusisition atau akuisisi data merupakan suatu proses dalam sebuah

    penelitian yang dilakukan dengan tujuan untuk memperoleh data dan juga

    menentukan cara untuk mengukur data tersebut serta berapa jumlah data yang

    diperlukan dalam penelitian. Dalam proses pengambilan data, khususnya untuk

    data citra, data dapat diperoleh melalui pemotretan menggunakan kamera, atau

    perangkat lain yang dapat digunakan untuk memotret citra. Data citra yang

    didapatkan dapat berasal dari lingkungan sekitar dan dapat diubah kedalam bentuk

    digital sehingga dapat diolah komputer.

    2.4.Segmentasi Shredding Text

    Segmentasi citra bertujuan mendapatkan objek-objek citra dengan cara

    membagi citra ke dalam beberapa daerah yang memiliki kemiripan atribut (Kadir

    dkk, 2013).

    Pada penelitian ini segmentasi yang dilakukan berfokus pada proses

    segmentasi baris pada sebuah citra dokumen. Metode yang digunakan untuk

    segmentasi adalah metode Shredding Text. Metode ini diciptakan oleh A. Nicolau

    dan B. Gatos pada tahun 2009 dengan mengusulkan sebuah strategi citra dokumen

    dapat dipisah – pisah ke potongan-potongan baris dengan adanya kesenjangan

    (gap) diantara baris-baris. Metode local minima digunakan pada data hasil proyeksi

    baris, yang akan menjadi batas segmentasi baris teks. Pendekatan ini didasarkan

    pada asumsi topologi bahwa setiap baris teks terdapat jalur dari sisi kanan ke sisi

    kiri gambar yang melintasi hanya satu baris teks. Langkah pertama adalah

    mengaburkan gambar kemudian menggunakan pelacak untuk mengikuti jalur

    paling putih dan paling hitam dari kiri ke kanan dan juga sebaliknya untuk

    memisahkan citra menjadi baris teks. Sebelum melakukan langkah pertama

    dilakukan tahapan preprocessing yang meliputi grayscaling, binerisasi,

    konektivitas komponen, dan reduksi noise terlebih dahulu. Langkah – langkah yang

    dilakukan berikut didasarkan pada penelitian B. Gatos, dkk (2009) yaitu:

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 10

    2.4.1. Preprocessing

    2.4.1.1.Cropping

    Cropping pada sebuh citra merupakan sebuah proses dimana citra yang

    diolah dilakukan pemotongan pada koordinat tertentu yang berada pada suatu

    area pada citra tersebut. Proses cropping pada sebuah citra termasuk kedalam

    kategori operasi geometri citra. Cropping dilakukan untuk menghilangkan

    bagian citra yang tidak diinginkan. Cropping juga dapat diartikan dalam

    pengolahan citra sebagai pengambilan sebuah bagian atau area dalam sebuah

    citra yang diinginkan.

    2.4.1.2.Grayscaling

    Citra grayscale merupakan sebuah citra yang mempunyai warna

    diantara warna hitam dan putih. Citra grayscale direpresentasikan dengan

    variasi nilai intensitas tertentu yang berada dalam interval 0 hingga 255. Proses

    grayscaling merupakan proses konversi citra dari citra warna atau RGB

    menjadi citra grayscale (citra keabuan). Citra RGB memiliki 3 komponen

    keping warna yaitu R(merah), G(hijau), B(biru) tersebut akan dikonversikan

    menjadi citra grayscale. Citra berwarna dapat dikonversikan menjadi citra

    grayscale menggunakan NTSC (National Television System Committee)

    (Kadir, dkk, 2012). Operasi yang digunakan untuk melakukan konversi citra

    warna RGB menjadi citra grayscale adalah sebagai berikut:

    𝑔(𝑥, 𝑦) = 𝑤𝑟𝑅(𝑥, 𝑦) + 𝑤𝑔𝐺(𝑥, 𝑦) + 𝑤𝑏𝐵(𝑥, 𝑦) (2.1)

    Dimana berdasarkan NTSC:

    wr = bobot komponen R (bernilai 0.299)

    wg = bobot komponen G (bernilai 0.587)

    wb = bobot komponen B (bernilai 0.144)

    g(x,y) = hasil konversi grayscale pada lokasi pixel (x,y)

    R(x,y) = nilai piksel pada lokasi (x,y) untuk komponen R

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 11

    G(x,y) = nilai piksel pada lokasi (x,y) untuk komponen G

    B(x,y) = nilai piksel pada lokasi (x,y) untuk komponen B

    2.4.1.3.Binerisasi

    Binerisasi merupakan sebuah pemrosesan citra untuk melakukan

    konversi citra dari citra grayscale (abu – abu) menjadi citra biner (hitam putih).

    Citra biner merupakan memiliki 2 kemungkinan nilai pada setiap pikselnya

    yaitu 1 (putih) dan 0 (hitam). Citra abu-abu dikonversi menjadi citra biner

    dengan cara menentukan suatu level keabuan T dalam citra abu-abu, kemudian

    setiap piksel pada citra abu-abu diubah menjadi piksel hitam atau putih

    berdasarkan nilai level keabuan T tersebut.

    𝐼(𝑥, 𝑦) = {1, 𝑗𝑖𝑘𝑎 𝑓(𝑥, 𝑦) > 𝑇0, 𝑗𝑖𝑘𝑎 𝑓(𝑥, 𝑦) ≤ 𝑇

    (2.2)

    Dengan:

    I(x,y) = citra hasil binerisasi

    f(x,y) = citra masukan

    T = nilai thresholding (nilai ambang)

    Pengambangan batas (thresholding) merupakan tahapan yang sangat

    penting dalam segmentasi citra digital. Thresholding digunakan dengan tujuan

    untuk memilah objek – objek karakter yang diinginkan dari latar belakang citra.

    Dalam penelitian ini metode pengambangan batas yang digunakan adalah

    metode Sauvola.

    2.4.1.4.Konektivitas Komponen

    Pada penelitian ini metode konektivitas komponen LI(x,y)

    menggunakan fungsi bwlabel yang merupakan fungsi pelabelan dari citra biner

    dari Matlab. Pelabelan menggunakan konektivitas 4 ketetanggaan.

    𝐿𝐼(𝑥, 𝑦) = {0, 𝑗𝑖𝑘𝑎 𝐼(𝑥, 𝑦) = 0

    𝐿𝑎𝑏𝑒𝑙, 𝑗𝑖𝑘𝑎 𝐼(𝑥, 𝑦) ≠ 0 (2.3)

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 12

    Dimana:

    LI(x,y) = hasil pelabelan

    Label = {1,2,3,4,….N}

    2.4.1.5.Reduksi Noise

    Noise atau derau pada sebuah citra dapat terjadi karena karakteristik

    derajat keabuan (gray level) atau di karenakan adanya variabel acak yang

    terjadi karena karakteristik fungsi probabilitas kepadatan (probability density

    function (PDF)). Apabila citra yang mengandung noise langsung diproses dan

    di ekstrak, maka fitur-fitur pentingnya dapat menimbulkan masalah akurasi.

    Jadi sebaiknya citra tersebut dibersihkan dari noise terlebih dahulu, dan

    kemudian diproses untuk diekstrak ciri - ciri pentingnya. (Gonzalez, 2002).

    Pada penelitian ini metode yang digunakan untuk reduksi noise

    dilakukan karena citra yang dibutuhkan untuk kebutuhan sistem merupakan

    citra yang tidak memiliki noise. Dalam penelitian ini reduksi noise dilakukan

    menggunakan fungsi bwareaopen yang merupakan fungsi dari Matlab untuk

    menghilangkan semua konektivitas komponen yang mempunyai nilai piksel

    kurang dari suatu nilai yang ditentukan.

    2.4.1.6.Blurring Image

    Blurring Image adalah proses citra yang dilakukan dengan tujuan untuk

    mengkaburkan atau memblurkan citra. Blurring Image dapat dilakukan dengan

    berbagai macam teknik. Sebelum melakukan bluring citra dilakukan operasi

    histogram untuk mencari perkiraan tinggi huruf yang didefinisikan sebagai LH.

    Dalam penelitian ini Blurring Image dilakukan dengan menggunakan rumus

    sebagai berikut:

    𝐵(𝑥, 𝑦) = ∑ 𝑖=

    𝐵𝑊

    2

    𝑖=−𝐵𝑊

    2

    ∑ 𝐼(𝑥 + 𝑖, 𝑦 + 𝑘)𝑘=

    𝐵𝐻

    2

    𝑘=−𝐵𝐻

    2

    (2.4)

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 13

    Dengan:

    B(x,y) = citra hasil Blurring Image

    BW = lebar jendela yang mengaburkan

    BH = tinggi jendela yang mengaburkan

    B (x, y) adalah gambar yang difilter, BW = LH * 8 adalah lebar jendela

    yang mengaburkan dan BH = LH * 0.8 adalah tinggi jendela yang

    mengaburkan. BW bertujuan untuk mengaburkan spasi putih di antara kata-kata

    secara berturut-turut dalam satu baris dan BH bertujuan untuk mengaburkan

    huruf dalam garis yang menjaga celah putih antara dua baris berturut-turut (Du,

    dkk, 2009).

    Gambar 2.2. Contoh penerapan proses Blurring Image

    2.4.2. Segmentasi Baris Shredding Text

    Tahapan setelah proses preprocessing adalah tahap segmentasi baris

    menggunakan Shredding Text. Tahap Shredding Text dilakukan dibagi menjadi

    2 langkah yaitu membuat pelacak untuk area baris dan pelabelan pelacak untuk

    area baris

    2.4.2.1.Membuat pelacak untuk area baris (Tracing line areas)

    Untuk setiap piksel pada citra hasil Blurring Image dari piksel paling

    kiri hingga paling kanan terdapat sebuah jalur yang memuat piksel paling putih

    (whitest pixel). Dalam perumusannya, dilakukan fungsi sebagai berikut:

    𝑇𝑟𝑘,𝐵(1) = 𝑘

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 14

    𝑇𝑟𝑘,𝐵(𝑛 + 1) =

    {

    𝑇𝑟𝑘,𝐵(𝑛) − 1 𝑖𝑓 𝐵 (𝑛, 𝑇𝑟𝑘,𝐵(𝑛) +

    𝐵𝐻

    2) > 𝐵(𝑛, 𝑇𝑟𝑘,𝐵(𝑛) −

    𝐵𝐻

    2)

    𝑇𝑟𝑘,𝐵(𝑛) 𝑖𝑓 𝐵 (𝑛, 𝑇𝑟𝑘,𝐵(𝑛) +𝐵𝐻

    2) = 𝐵(𝑛, 𝑇𝑟𝑘,𝐵(𝑛) −

    𝐵𝐻

    2)

    𝑇𝑟𝑘,𝐵(𝑛) + 1 𝑖𝑓 𝐵 (𝑛, 𝑇𝑟𝑘,𝐵(𝑛) +𝐵𝐻

    2) < 𝐵(𝑛, 𝑇𝑟𝑘,𝐵(𝑛) −

    𝐵𝐻

    2)

    (2.5)

    Semua kemungkinan pelacakan pada citra hasil Blurring Image

    disimpan kedalam bentuk citra biner dan disimpan ke variabel LA (x, y).

    𝐿𝐴(𝑥, 𝑦) = {0 𝑖𝑓 ∃ 𝑘 ∶ 𝑇𝑟𝑘,𝐵(𝑥) = 𝑦

    1 𝑖𝑛 𝑎𝑙𝑙 𝑜𝑡ℎ𝑒𝑟 𝑐𝑎𝑠𝑒𝑠 (2.6)

    Gambar 2.3. Contoh hasil pencarian pelacak untuk area garis

    LA (x, y) berisikan garis strip dari area garis teks sebagai 1s dan titik

    pemisahan mereka sebagai 0s. Kemudian proses yang sama untuk menelusuri

    jalur putih dari kanan ke kiri dan menggambar lintasan pada LA (x, y) juga,

    untuk mengurangi terjadinya garis yang tidak terhubung.

    2.4.2.2.Pelabelan pelacak untuk area baris (Labelling line areas)

    Setelah pelacak gambar jalur putih LA(x,) terbentuk, selanjutnya

    dilakukan pelabelan untuk konektivitas komponen dengan 4 ketetanggaan dan

    disimpan ke LLA(x,y).

    𝐿𝐿𝐴(𝑥, 𝑦) = {0 𝑖𝑓 𝐿𝐴(𝑥, 𝑦) = 0

    𝑙𝑎𝑏𝑒𝑙 𝑖𝑓 𝐿𝐴(𝑥, 𝑦) ≠ 0 (2.7)

    Dalam pelabelan, komponen yang mewakili area garis teks dan

    komponen yang sangat kecil yang dibuat saat pelacak terkumpul ke lokal

    minima. Karena semua komponen dalam LLA (x, y) dianggap mewakili baris

    teks yang berbeda, dilakukan filter terhadap komponen yang memiliki piksel

    lebih sedikit dari LH^2 (tidak boleh ada garis yang lebih kecil dari huruf).

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 15

    2.4.2.3.Menampilkan hasil segmentasi

    Dalam menampilkan hasil segmentasi, dilakukan penggabungan antara

    hasil dari preprocessing yaitu hasil citra setelah reduksi noise dengan hasil dari

    pelabelan untuk area baris. Sebelum menampilkan dilakukan proses filter untuk

    menghapus objek yang memiliki piksel lebih sedikit dari LH * log(LH). Filter

    dilakukan untuk menghilangkan objek yang terlalu kecil.

    2.5.Evaluasi Kinerja Sistem

    Pengukuran tingkat keberhasilan sistem dalam melakukan segmentasi baris

    dilakukan dengan menghitung jumlah baris hasil dari sistem dibagi jumlah baris

    sebenarnya dikalikan 100. Berikut rumus yang digunakan:

    𝐴𝑘𝑢𝑟𝑎𝑠𝑖𝐵𝑎𝑟𝑖𝑠 = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑏𝑎𝑟𝑖𝑠 ℎ𝑎𝑠𝑖𝑙 𝑠𝑖𝑠𝑡𝑒𝑚

    𝑗𝑢𝑚𝑙𝑎ℎ 𝑏𝑎𝑟𝑖𝑠 𝑠𝑒𝑏𝑒𝑛𝑎𝑟𝑛𝑦𝑎 𝑥 100%

    Metode yang digunakan untuk mengukur kinerja sistem dari algoritma yang

    digunakan didasarkan pada penghitungan jumlah kecocokan antara entitas yang

    terdeteksi oleh algoritma dan entitas dengan perhitungan secara manual (I. Philips,

    dkk, 1999). Semakin tinggi nilai Detection Rate, Recognition Accuracy, dan

    Performance Matric yang didapatkan, maka semakin baik kinerja sistem yang

    dihasilkan. Perhitungan kinerja sistem ini dilakukan dengan tujuan untuk mengukur

    seberapa besar tingkat keberhasilan sistem dalam menghitung jumlah objek

    perbarisnya hasil dari sistem dengan jumlah objek sebenarnya yang terdapat pada

    setiap barisnya.

    Berikut rumus yang digunakan:

    𝐷𝑅 =𝑜2𝑜

    𝑁, 𝑅𝐴 =

    𝑜2𝑜

    𝑀 , 𝐹𝑀 =

    2𝐷𝑅 𝑥 𝑅𝐴

    𝐷𝑅+𝑅𝐴 (2.8)

    Dengan:

    DR = Detection Rate

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 16

    RA = Recognition Accuracy

    FM = Performance Metric

    N = jumlah objek pada citra asli

    M = jumlah objek hasik perhitungan mesin

    o2o = jumlah objek yang sesuai

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 17

    BAB 3

    METODE PENELITIAN

    3.1. Gambaran Umum

    Perancangan sistem Segmentasi Baris Citra Daun Lontar Beraksara

    menggunakan Metode Shredding Text bertujuan untuk membuat alat uji

    perhitungan baris yang terdapat pada citra daun lontar. Gambaran umum sistem

    yang akan dibangun dapat dilihat pada gambar diagram blok Gambar 3.1.

    dibawah ini.

    Gambar 3.1. Diagram blok Segmentasi Baris Citra Lontar Aksara Menggunakan

    Metode Shredding Text

    Masukan dari sistem merupakan citra daun lontar beraksara. Sistem

    melakukan proses segmentasi pada masukan dan menghasilkan keluaran

    berupa citra hasil segmentasi beserta jumlah baris yang dideteksi sistem

    3.2. Desain Penelitian

    3.2.1. Studi Literatur

    Studi literatur dilakukan untuk mendapatkan informasi terkait

    penelitian yang dilakukan. Studi literatur dilakukan dengan cara

    mempelajari buku refrensi dan jurnal - jurnal yang berkaitan dengan

    segmentasi baris pada citra menggunakan metode Shredding Text dan

    juga segala hal yang berkaitan dengan teori pemrosesan citra.

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 18

    3.2.2. Pengumpulan Data Penelitian

    Data penelitian adalah citra daun lontar beraksara yang

    didapatkan dari Perpustakan Universitas Sanata Dharma Yogyakarta.

    Citra daun lontar yang dipilih merupakan daun lontar beraksara yang

    sekiranya mempunyai sedikit noise dan aksara – aksara yang tertulis

    dapat dilihat dengan mata telanjang. Data diambil menggunakan

    Kamera Canon EOS 600D dengan jarak pengambilan 30 cm dengan

    daun lontar dan pencahayaan berasal dari lampu perpustakaan serta 2

    lampu senter handphone disesuaikan dengan tingkat kelekukan daun

    lontar.

    Pada penelitan ini, data yang telah diambil disiapkan untuk alat

    uji melalui beberapa tahapan antara lain tahap pengumpulan citra

    lontar beraksara, tahap pemotongan (cropping) menggunakan Adobe

    Photoshop CS6.

    3.2.2.1. Pengumpulan Citra Daun Lontar Beraksara Kuno

    Pengumpulan citra daun lontar dilaksanakan di

    Perpustakaaan Universitas Sanata Dharma dengan

    meminta perizinan terhadap penjaga perpustakaan. Daun

    lontar didapatkan pada bagian Koleksi Artati yang

    terdapat pada perpustakaan. Daun lontar yang

    disediakan berupa satu ikat kumpulan daun lontar yang

    beraksara. Kumpulan daun tersebut kemudian dipilih

    dengan melihat apakah daun tersebut masih bagus atau

    utuh sehingga pada saat pemrosesan ke sistem dapat

    berjalan lebih baik. Citra daun lontar diambil dengan

    bantuan Kamera Canon EOS 600D dengan jarak sekitar

    30cm dari daun lontar dan menggunakan pencahayaan

    yang disesuaikan dengan tingkat kelekukan daun lontar.

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 19

    3.2.2.2. Cropping

    Citra yang telah diambil dilakukan pemotongan

    manual sehingga bagian yang tidak diperlukan dapat

    dihilangkan. Bagian yang dipotong hanyalah latar

    belakang (background). Cropping manual dilakukan

    menggunakan bantuan software Adobe Photosop CS6.

    Proses cropping dilakukan secara manual karena

    data yang didapatkan memiliki koordinat atau letak

    posisi, panjang dan lebar yang berbeda – beda.

    3.3. Analisa Kebutuhan Proses

    Dalam penelitian ini terdapat 2 proses utama yaitu preprocessing,

    segmentasi baris. Berikut diagram proses:

    Gambar 3.2. Diagram Proses Segmentasi Baris Citra Lontar Aksara Menggunakan

    Metode Shredding Text

    Gambar 3.2. menggambarkan tentang urutan proses-proses yang

    dilakukan sistem dalam melakukan segmentasi baris citra daun lontar. Proses

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 20

    pertama yang dilakukan adalah membaca file input yang berupa citra daun

    lontar, kemudian dilanjutkan dengan tahap preprocessing, segmentasi baris,

    dan evaluasi sistem. Penjelasan mengenai langkah-langkah yang dilakukan

    sebagai berikut:

    3.3.1. Preprocessing

    Sebelum data citra diolah maka data citra tersebut harus

    disiapkan sedemikian rupa sehingga data tersebut siap untuk

    diolah. Berikut diagram proses untuk tahap preprocessing:

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 21

    Gambar 3.3. Diagram Proses Preprocessing

    Gambar 3.3. menggambarkan tentang urutan proses-proses yang

    dilakukan sistem dalam melakukan proses preprocessing. Dalam tahapan

    pertama preprocessing dilakukan proses grayscaling citra daun lontar aksara

    menggunakan fungsi bawaan Matlab yaitu rgb2gray().

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 22

    Tahap kedua adalah proses binerisasi citra daun lontar yang telah

    dilakukan grayscaling menjadi citra biner. Proses binerisasi menggunakan

    fungsi bawaan Matlab yang mengimplementasikan metode Sauvola dengan

    parameter awal (default parameter).

    Tahap selanjutnya adalah tahap reduksi noise. Reduksi noise pada

    penelitian ini dilakukan dengan 2 tahap. Tahap 1 adalah reduksi noise

    menggunakan toolbox bwareaopen yang disediakan oleh Matlab untuk

    mengurangi beban komputasi. Tahap 2 adalah reduksi noise yang dilakukan

    dengan cara mencari tinggi dan lebar dari setiap komponen label. Tahap awal

    reduksi noise adalah dilakukan penyelidikan pada setiap komponen berlabel

    dengan cara membuat tabel yang menampung tinggi dan lebar untuk setiap

    label.

    Berikut adalah pseudocode untuk menjelaskan algoritma reduksi noise

    yang digunakan:

    • Reduksi noise

    1. Buat tabel penyelidikan berisi label, tinggi, dan lebar objek

    i. Lakukan pelabelan pada citra

    ii. Buat matriks zeros berukuran label tertinggi x 3

    iii. Lakukan perulangan dari k=1 hingga label tertinggi

    a. Cari koordinat dari tinggi dan lebar pada label k

    b. Simpan label k ke tabel(k,1)

    c. Simpan tinggi label dengan menghitung nilai koordinat

    maksimum tinggi dikurang nilai koordinat minimum

    tinggi ke tabel(k,2)

    d. Simpan lebar label dengan menghitung nilai koordinat

    maksimum dari lebar dikurang nilai koordinat minimum

    lebar ke tabel(k,3)

    e. Akhiri perulangan

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 23

    iv. Hitung nilai minimum dan standar deviasi dari semua tinggi dan

    lebar pada tabel

    2. Hapus noise

    i. Hitung jumlah baris dan kolom citra berlabel

    ii. Buat variabel baru berisi citra yang berlabel

    iii. Lakukan perulangan dari i = 1 sampai sejumlah tabel

    a. Buat variabel jumlahTinggi berisi tabel(i,2)

    b. Buat variabel jumlahLebar berisi tabel(i,3)

    c. Hitung nilai kewajaran tinggi dengan jumlahTinggi –

    standar deviasi tinggi + nilai minimum dari semua tinggi

    d. Hitung nilai kewajaran lebar dengan jumlahLebar –

    standar deviasi lebar + nilai minimum dari semua lebar

    e. Jika nilai kewajaran tinggi < 0 , maka

    a. Lakukan perulangan sejumlah baris

    i. Lakukan perulangan sejumlah kolom

    1. Jika label(baris, kolom) = i, maka

    2. label(baris, kolom) = 0

    3. akhiri perulangan

    ii. akhiri perulangan

    f. Jika nilai kewajaran lebar < 0 , maka

    a. Lakukan perulangan sejumlah baris

    i. Lakukan perulangan sejumlah kolom

    1. Jika label(baris,kolom) = i, maka

    2. label(baris,kolom) = 0

    3. akhiri perulangan

    ii. akhiri perulangan

    iv. Akhiri perulangan

    v. Ubah tipe data citra hasil reduksi menjadi logical

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 24

    Tahap berikutnya adalah mencari perkiraan tinggi karakter. Tahap

    pertama dalam mencari tinggi karakter adalah dengan mencari tinggi untuk

    setiap objek dan menyimpan pada suatu variabel. Setelah mencari tinggi untuk

    setiap karakter dilakukan pencarian tinggi yang paling banyak muncul atau

    mencari modus dari kumpulan tinggi karakter tersebut. Jika semua tinggi

    karakter hanya muncul satu kali maka nilai modus ditentukan berdasarkan nilai

    tinggi terendah.

    Tahap terakhir dari proses preprocessing adalah Blurring Image.

    Blurring Image dilakukan untuk mengkaburkan citra yang telah diproses dari

    tahap diatas. Output akhir dari Blurring Image adalah citra bertipe double yang

    nilai untuk setiap pikselnya diburamkan berdasarkan estimasi tinggi karakter

    yang telah dicari pada proses sebelumnya.

    Berikut adalah pseudocode untuk menjelaskan algoritma blurring

    image yang digunakan:

    • Blurring Image

    1. Hitung bluring window width hwindow = tinggi karakter * 8

    2. Hitung bluring window height vwindow = tingg karakter * 0.8

    3. Lakukan pengecekan langkah 1 dan 2

    i. Jika hwindow bernilai ganjil maka hwindow + 1

    ii. Jika vwindow bernilai ganjil maka vwindow + 1

    4. Buat matriks zeros tmpin berukuran (baris citra + vwindow) x (kolom

    citra + hwindow )

    5. Simpan nilai piksel tmpin pada koordinat (1 + vwindow / 2 sampai end

    - vwindow/2) , 1 + hwindow / 2 : end – hwindow / 2) dengan nilai piksel

    citra

    6. Buat variabel cumsum1 berisi hasil perhitungan kumulatif dari tmpin

    7. Buat variabel cumsum2 berisi hasil perhitungan kumulatif dari

    cumsum1

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 25

    8. Buat variabel summed1 berisi nilai piksel cumsum2 pada koordinat

    ((vwindow+1) sampai end) , ((hwindow+1) sampai end)

    9. Buat variabel summed2 berisi nilai piksel cumsum2 pada koordinat (1

    sampai (end–vwindow)) , (1 sampai (end–hwindow))

    10. Buat variabel summed3 berisi nilai piksel cumsum2 pada koordinat

    ((1+vwindow) sampai end) , (1 sampai (end-hwindow))

    11. Buat variabel summed4 berisi nilai piksel cumsum2 pada koordinat (1

    sampai (end-vwindow) ), ((hwindow+1) sampai end)

    12. Buat variabel RES berisi penjumlahan summed1 dan summed2

    dikurang dengan summed3 dan summed4

    13. Lakukan perhitungan RES = RES dibagi dengan (vwindow+1 dikalikan

    hwindow+1)

    3.3.2. Segmentasi Baris

    Segmentasi Baris menggunakan metode Shredding Text

    dilakukan dengan cara membuat jalur pelacakan untuk area

    baris, pelabelan pelacak untuk area baris, dan menampilkan

    hasil segmentasi. Berikut adalah diagram proses segmentasi

    baris:

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 26

    Gambar 3.4. Diagram proses Segmentasi Baris

    Gambar 3.4. menggambarkan tentang urutan proses-proses yang

    dilakukan sistem dalam melakukan proses segmentasi baris. Proses pencarian

    pelacakan untuk area baris dan pusat baris dicari dengan perhitungan pada citra

    hasil Blurring Image. Pencarian pelacak area baris LA dilakukan untuk mencari

    jalur whitest pixels atau dapat disebut piksel terputih dari ujung kiri citra hasil

    Blurring Image hingga ujung kanan citra hasil Blurring Image. Pelabelan

    pelacak area baris LLA dilakukan dengan fungsi toolbox bwlabel dalam

    Matlab. Setelah pelabelan, dilakukan filter untuk area – area yang kecil. Filter

    dilakukan pada area yang memiliki nilai piksel yang kurang dari tinggi karakter

    pangkat 2 karena tidak ada baris yang lebih kecil dari sebuah kata. Sebelum

    menampilkan hasil segmentasi, dilakukan penggabungan antar hasil dari LLA

    dan hasil dari preprocessing yaitu hasil setelah reduksi noise.

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 27

    Berikut adalah pseudocode untuk menjelaskan algoritma pencarian

    pelacak area baris yang digunakan:

    • Pelacakan area baris (LA)

    1. Buat matriks ones bertipe logical dengan ukuran citra Blurring

    Image

    2. Hitung jumlah baris dan kolom citra Blurring Image

    3. Hitung tinggi minimal = (tinggi karakter / 2) +1

    4. Hitung penyeimbang = tinggi karakter / 2

    5. Hitung tinggi maksimal = baris – tinggi minimal

    6. Buat variabel laTracers berisi minHeight sampai maxHeight secara

    urut

    7. Pelacakan dari citra kiri ke citra kanan

    Lakukan perulangan dari x = 1 sampai sejumlah kolom

    i. Buat variabel b1 berisi nilai piksel Blurring Image pada

    koordinat ((laTracers+penyeimbang) , x)

    ii. Buat variabel b2 berisi nilai piksel Blurring Image pada

    koordinat ((laTracers-penyeimbang) , x)

    iii. Untuk laTracers yang memiliki nilai b1 kurang dari b2

    maka ditambah 1 setiap nilainya

    iv. Untuk laTracers yang memiliki nilai b1 lebih dari b2

    maka dikurang 1 setiap nilainya

    v. Untuk laTracers yang memiliki nilai laTracers kurang

    dari offset+1 maka offset ditambah 1

    vi. Untuk laTracers yang memiliki nilai laTracers lebih dari

    (maxheigth-offset) maka diubah menjadi hasil

    maxheigth-offset

    vii. Untuk setiap piksel LA pada koordinat laTracers, x

    diubah menjadi 0

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 28

    8. Pelacakan dari citra kanan ke citra kiri

    Buat variabel seperti pada Langkah 6

    Lakukan perulangan dari x = jumlah kolom sampai 1

    i. Buat variabel b1 berisi nilai piksel Blurring Image pada

    koordinat ((laTracers+penyeimbang) , x)

    ii. Buat variabel b2 berisi nilai piksel Blurring Image pada

    koordinat ((laTracers-penyeimbang) , x)

    iii. Untuk laTracers yang memiliki nilai b1 kurang dari b2

    maka ditambah 1 setiap nilainya

    iv. Untuk laTracers yang memiliki nilai b1 lebih dari b2

    maka dikurang 1 setiap nilainya

    v. Untuk laTracers yang memiliki nilai laTracers kurang

    dari offset+1 maka offset ditambah 1

    vi. Untuk laTracers yang memiliki nilai laTracers lebih dari

    (maxheigth-offset) maka diubah menjadi hasil

    maxheigth-offset

    vii. Untuk setiap piksel LA pada koordinat laTracers, x

    diubah menjadi 0

    Berikut adalah pseudocode untuk menjelaskan algoritma pelabelan

    pelacak area baris yang digunakan:

    • Pelabelan area baris (LLA)

    1. Gunakan fungsi bwlabel Matlab untuk pelabelan LLA

    2. Buat tabel penyelidikan untuk label LLA pada langkah 1

    a. Buat tabel matriks zeros berukuran jumlah label x 3

    b. Lakukan perulangan dari k sampai jumlah label

    • Cari koordinat dari baris dan kolom pada label k

    • Simpan label k pada tabelLLA(k,1)

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 29

    • Simpan nilai maksimum dari tinggi dikurang

    minimum tinggi ke tabelLLA(k,2)

    • Simpan nilai maksimum dari lebar dikurang

    minimum lebar ke tabelLLA(k,3)

    • Akhiri perulangan

    3. Hapus area kecil

    a. Hitung jumlah baris dan kolom dari LLA

    b. Buat variabel LLA_baru = LLA

    c. Kuadratkan tinggi karakter

    d. Lakukan perulangan dari j = 1 sampai sejumlah tabel

    i. Buat variabel untuk menampung tabelLLA(i,3)

    ii. Jika langkah i. bernilai

  • 30

    4. Buat tabel penyelidikan untuk RES

    a. Buat tabel matriks zeros berukuran jumlah label x 3

    b. Lakukan perulangan dari k sampai jumlah label

    i. Cari koordinat dari baris dan kolom pada label k

    ii. Simpan label k pada tabelRES(k,1)

    iii. Simpan nilai maksimum dari tinggi dikurang

    minimum tinggi ke tabelRES(k,2)

    iv. Simpan nilai maksimum dari lebar dikurang

    minimum lebar ke tabelRES(k,3)

    v. Akhiri perulangan

    5. Hapus objek kecil

    a. Hitung jumlah baris dan kolom dari RES

    b. Buat variabel RES_baru = RES

    c. Lakukan perkalian tinggi karakter dengan log(tinggi

    karakter) dan simpan ke variabel lh_log

    d. Lakukan perulangan dari i = 1 sampai sejumlah tabel

    i. Buat variabel untuk menampung tabelRES(i,3)

    ii. Jika langkah i. bernilai

  • 31

    3.3.3. Evaluasi Kinerja Sistem

    Dalam melakukan evaluasi kinerja sistem, dilakukan

    perhitungan secara manual mencari jumlah objek setiap baris

    untuk citra hasil tahap preprocessing, perhitungan dengan

    mengggunakan fungsi bwconncomp pada MATLAB untuk

    menghitung jumlah objek untuk setiap hasil segmentasi oleh

    sistem, dan perhitungan secara manual untuk mencarijumlah

    objek yang sesuai antara jumlah objek setiap baris untuk citra hasil

    tahap preprocessing dan jumlah objek untuk setiap hasil

    segmentasi oleh sistem. Dari perhitungan tersebut, maka

    dilakukan perhitungan untuk Detection Rate, Recognition

    Accuracy, dan Performance Metric.

    3.4. Perancangan Antar Muka Alat Uji

    Prototype sistem segmentasi baris citra daun lontar aksara kuno

    menggunakan metode Shredding Text yang akan dibangun memiliki desain

    interface seperti pada gambar dibawah ini.

    Gambar 3.5. Prototype Rancangan Antar Muka Alat Uji

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 32

    Berikut penjelasan mengenai Gambar 3.5. Prototype Rancangan Antar Muka Alat Uji:

    1. Axes1, digunakan untuk menampilkan logo Universitas Sanata Dharma

    2. Axes7, digunakan untuk menampilkan citra masuk / citra asli

    3. Axes6, digunakan untuk menampilkan citra hasil preprocessing

    4. Axes4, digunakan untuk menampilkan citra Blurring Image

    5. Axes9, digunakan untuk menampilkan citra hasil LA

    6. Axes5, digunakan untuk menampilkan citra hasil segmentasi

    7. Push button browse, digunakan untuk memilih file citra

    8. Push button proses, digunakan untuk memproses sistem

    3.5. Spesifikasi Perangkat Keras dan Perangkat Lunak

    Berikut merupakan spesifikasi perangkat keras dan perangkat lunak

    yang digunakan penulis dalam melakukan pembangunan dan pengujian sistem

    yang dibuat:

    3.5.1. Perangkat Keras (Hardware)

    Tabel 3.1. Spesifikasi Perangkat Keras

    RAM 8.00 GB

    Tipe Sistem Sistem Operasi 64-bit

    Harddisk 1 TB

    Processor Intel Core i5-8250U, CPU @3.4 GHz

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 33

    3.5.2. Perangkat Lunak (Software)

    Tabel 3.2. Spesifikasi Perangkat Lunak

    Sistem Operasi Windows 10

    Program Pengembang Alat Uji Matlab 2014b

    Program Pendukung Alat Uji Adobe Photosop CS6

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 34

    BAB IV

    HASIL DAN PEMBAHASAN

    4.1.Data Masukan

    Data masukan untuk pengujian didapatkan dari Perpustakaan Universitas

    Sanata Dharma Yogyakarta. Data diambil menggunakan Kamera Canon EOS 600D

    dengan jarak pengambilan 30 cm. Data yang diambil sebanyak 10 citra daun lontar

    aksara kuno. Berikut adalah citra yang telah diambil:

    Gambar 4.1. Data Citra Asli

    Setelah data telah diambil dan disimpan, dilakukan proses cropping atau

    pemotongan manual menggunakan Adobe Photoshop CS6. Adapun hasil proses

    pemotongan yang telah dilakukan sekaligus penamaan untuk setiap file:

    Gambar 4.2. Data Citra Hasil Pemotongan

    4.2.Preprocessing

    Seperti yang dapat dilihat pada Gambar 3.3 yaitu Gambar Diagram Proses

    Preprocessing, penelitian ini melakukan preprocessing antara lain grayscaling,

    binerisasi, reduksi noise, mencari tinggi karakter, dan blurring image. Berikut

    adalah hasil percobaan dan analisis yang telah dilakukan:

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 35

    4.2.1. Baca file citra daun lontar

    Langkah pertama adalah baca file citra daun lontar dilakukan

    menggunakan fungsi imread yang terdapat pada MATLAB.

    Gambar 4.3. Hasil Baca File kuno 1.jpg

    Gambar 4.3 merupakan citra kuno 1.jpg yang akan menjadi contoh masukan

    kedalam sistem. Citra yang digunakan merupakan sebuah citra yang berukuran 495 x

    2544 dengan keping 3.

    4.2.2. Grayscaling

    Data yang telah dijadikan masukan kemudian diubah menjadi citra

    berskala keabuan. Proses ini disebut dengan grayscaling. Grayscaling

    dilakukan menggunakan fungsi rgb2gray()pada Matlab.

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 36

    Gambar 4.4. Hasil Proses Grayscaling

    4.2.3. Binerisasi

    Proses binerisasi merupakan proses dimana citra berskala abu – abu

    diubah menjadi citra biner atau hitam putih. Proses ini dilakukan untuk

    memisahkan objek citra dan latar belakang citra. Untuk proses binerisasi

    dilakukan dengan menggunakan binerisasi metode Sauvola menggunakan

    default parameter.

    Berikut adalah code yang digunakan:

    gambar_asli=imread('C:\Users\asus\Desktop\Skripsi\New folder\kuno

    1.jpg');

    gambar_gray=rgb2gray(gambar_asli);

    gambar_sauvola=(sauvola(gambar_gray,[30 30], 0.15));

    imshow(gambar_sauvola)

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 37

    Gambar 4.5. Hasil Proses Binerisasi

    Jika Gambar 4.5. diperbesar maka masih terdapat noise atau objek yang tidak

    dibutuhkan. Noise dapat dilihat seperti dibawah ini:

    Gambar 4.6. Contoh Noise

    4.2.4. Reduksi Noise

    Reduksi Noise dalam penelitian ini menggunakan 2 langkah, yang

    pertama adalah menggunakan fungsi Matlab yaitu bwareaopen untuk

    membantu mempercepat komputasi dan menggunakan penyelidikan terdahap

    tabel yang dibuat. Penyelidikan yang dilakukan dibagi menjadi 2 tahapan yaitu

    membuat tabel yang berisikan label, tinggi dan lebar label, dan fungsi

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 38

    menghapus noise itu sendiri. Berikut adalah citra hasil binerisasi setelah dikenai

    fungsi bwareaopen.

    Gambar 4.7. Hasil Proses Reduksi Noise Memakai bwareaopen

    Setelah dilakukan reduksi noise menggunakan fungsi bwareaopen dari Matlab,

    dilakukan proses reduksi noise tahap 2 yaitu dengan menggunakan penyelidikan untuk

    setiap objek. Reduksi noise tahap 2 dilakukan dengan 2 tahapan yaitu membentuk tabel

    yang berisikan label beserta tinggi dan lebarnya, dan yang berikutnya menghapus noise

    itu sendiri.

    Berikut merupakan implementasi dari algoritma yang telah dibuat:

    function [ tabel,tinggimin,lebarmin,stdevtinggi,stdevlebar] =

    tabelReduksiNoise( label )

    tabel=zeros(max(label(:)),3);

    for k=1 : max(label(:))

    [r,c] = find(label==k);

    tabel(k,1) = k;

    tabel(k,2) = (max(r) - min(r))+1;

    tabel(k,3) = (max(c) - min(c))+1;

    end

    tinggimin=min(tabel(:,2));

    lebarmin=min(tabel(:,3));

    stdevtinggi=std(tabel(:,2));

    stdevlebar=std(tabel(:,3));

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 39

    end

    Gambar 4.8. Screenshoot Tabel Hasil Penyelidikan Label

    Gambar 4.8 merupakan tabel hasil dari perhitungan sistem yang telah

    dilakukan. Baris 1 merupakan label, baris 2 merupakan tinggi label, dan baris 3

    merupakan lebar label. Setelah didapatkan tabel penyelidikan, dilakukan penghapus

    noise yang disesuasikan dengan ketentuan nilai kewajaran tinggi dan lebar label.

    Berikut merupakan implementasi code yang dilakukan:

    function [ labelBaru ] = hapusnoise

    (label,tabel,tinggimin,lebarmin,stdevtinggi,stdevlebar)

    [baris, kolom] = size(label);

    labelBaru = label;

    for i = 1 : length(tabel)

    tinggiLabel = tabel(i,2);

    lebarLabel = tabel(i,3);

    wajar1=tinggiLabel - stdevtinggi + tinggimin;

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 40

    wajar2=lebarLabel - stdevlebar + lebarmin;

    if(wajar1

  • 41

    4.2.5. Mencari Tinggi Karakter

    Algoritma untuk mencari tinggi karakter yang telah dirancang

    diimplementasikan kedalam bentuk code. Sebelum dilakukan pencarian terhadap tinggi

    karakter dilakukan proses konversi hasil reduksi noise menjadi citra bertipe logical.

    Berikut adalah implementasi dari algoritma yang telah dibuat:

    function tinggi = cariTinggiKarakter( In )

    [label]=bwlabel(In);

    tabel=zeros(max(label(:)),3);

    for k=1 : max(label(:))

    [r,c] = find(label==k);

    tabel(k,1) = k;

    tabel(k,2) = (max(r) - min(r));

    tabel(k,3) = max(c) - min(c);

    end

    tinggi=mode(tabel(:,2));

    end

    Gambar 4.10. Screenshot Tabel Hasil Pencarian Tinggi Label

    Gambar 4.9. merupakan kumpulan tinggi untuk setiap label yang telah dicari.

    Nilai 34 didapatkan dengan cara menggunakan menghitung nilai modus atau nilai yang

    paling banyak keluar dari tabel tersebut.

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 42

    4.2.6. Blurring Image

    Blurring image merupakan tahap lanjutan yang akan dilakukan setelah proses

    reduksi noise dan pencarian tinggi karakter dilakukan. Berikut merupakan

    implementasi dari algoritma yang telah dibuat:

    function res=flatBlur(in,lh)

    vwindow=ceil(lh*0.8);

    hwindow=ceil(lh*8);

    if(mod(vwindow,2)~=0)

    vwindow=vwindow+1;

    end

    if(mod(hwindow,2)~=0)

    hwindow=hwindow+1;

    end

    tmpin=zeros(size(in)+[vwindow hwindow]);

    tmpin(1+vwindow/2:end-vwindow/2,1+hwindow/2:end-hwindow/2)=in;

    summed=cumsum(cumsum(tmpin,1),2);

    summed1=summed(vwindow+1:end,hwindow+1:end);

    summed2=summed(1:end-vwindow,1:end-hwindow);

    summed3=summed(1+vwindow:end,1:end-hwindow);

    summed4=summed(1:end-vwindow,hwindow+1:end);

    res=summed1+summed2-summed3-summed4;

    res=res./((vwindow+1)*(hwindow+1));

    end

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 43

    Gambar 4.11. Hasil Blurring Image

    Gambar 4.10. merupakan hasil Blurring Image yang telah dilakukan. Gambar

    yang terlihat seperti putih samar diatas merupakan hasil perhitungan dari algoritma

    yang dipakai. Adapun contoh tabel hasil perhitungan:

    Gambar 4.12. Contoh Bagian Blurring Image

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 44

    4.3.Pencarian Jalur Pelacak

    4.3.1. Pencarian Jalur Pelacak LA

    Hasil akhir dari pencarian jalur pelacak LA akan membentuk garis yang

    terbentang dari sisi kiri citra hingga sisi kanan citra. Pencarian ini dilakukan

    dengan mencari jalur yang dimulai dari salah satu sisi citra menuju sisi lain,

    kemudian dilanjutkan sebaliknya.

    Berikut adalah implementasi algoritma yang telah dibuat:

    function [LA]=cariLA(b,lh)

    LA=logical(ones(size(b)));

    [height,width]=size(b);

    minHeight=ceil(lh./2+1);

    offset=ceil(lh./2);

    maxHeight=height-ceil(lh./2+1);

    laTracers=minHeight:maxHeight;

    for x=1:width

    b1=b(laTracers+offset,x);

    b2=b(laTracers-offset,x);

    laTracers(b1b2)-1;

    laTracers(laTracersmaxHeight-offset)=maxHeight-offset;

    LA(laTracers,x)=0;

    end

    laTracers=minHeight:maxHeight;

    for x=width:-1:1

    b1=b(laTracers+offset,x);

    b2=b(laTracers-offset,x);

    laTracers(b1b2)-1;

    laTracers(laTracersmaxHeight-offset)=maxHeight-offset;

    LA(laTracers,x)=0;

    end

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 45

    end

    Gambar 4.13. Hasil Pelacakan LA

    Gambar 4.12. merupakan jalur pelacak yang didapatkan dari sistem. Terlihat

    pada gambar, terdapat garis yang membentang dari sisi kiri citra menuju sisi kanan

    citra. Garis yang membentang terlihat seperti terputus – putus dikarenakan ukuran citra

    yang terlalu besar. Jika diperbesar, maka garis – garis tersebut akan membentuk garis

    yang terhubung seperti dibawah ini.

    Gambar 4.14. Hasil Bagian Pelacakan LA

    4.3.2. Pelabelan Jalur Pelacak LA

    Pelabelan untuk LA akan dideklarasikan sebagai LLA. Dalam pelabelan

    LA, proses juga akan dilakukan filter untuk area – area baris kecil. Tahap

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 46

    pertama dalam pelabelan adalah pelabelan itu sendiri menggunakan fungsi

    bwlabel dari Matlab. Tahap kedua adalah tahap untuk membentuk sebuah tabel

    penyelidikan yang berisi label beserta tinggi dan lebarnya. Tahap ketiga

    merupakan tahap untuk filter area – area yang mempunyai baris yang kecil.

    Berikut adalah implementasi code untuk pelabelan LLA:

    [LLA,jumlah_LA]=bwlabel(LA,4);

    Jumlah label awal yang terdeteksi sebelum dilakukan proses filter area

    baris kecil mendapatkan jumlah label sebanyak 27 label. Jumlah ini dapat

    berkurang ataupun tetap setelah dilakukan proses filter area baris kecil. Berikut

    adalah implementasi algoritma proses untuk mendapatkan tabel penyelidikan.

    function [tabelLLA]=

    selidikVerySmallAreas(LLA)

    tabelLLA=zeros(max(LLA(:)),3);

    for k=1 : max(LLA(:))

    [r, c] = find(LLA==k);

    tabelLLA(k,1) = k;

    tabelLLA(k,2) = max(r) - min(r);

    tabelLLA(k,3) = max(c) - min(c);

    end

    end

    Berikut merupakan screenshot tabel hasil penyelidikan:

    Gambar 4.15. Screenshoot Tabel Hasil Penyelidikan LLA

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 47

    Gambar 4.14. memuat informasi yang dapat digunakan dalam proses

    selanjutnya proses menghapus atau filter area – area yang mempunyai baris kecil.

    Dalam prosesnya dilakukan ketentuan untuk setiap label yang mempunyai ukuran baris

    lebih kecil dari huruf (lh^2) maka label tersebut akan dihapus. Berikut implementasi

    dari algoritma yang telah dibuat:

    function [ LLA_baru ] = hapusSmallAreas(LLA,tabelLLA,lh)

    [baris, kolom] = size(LLA);

    LLA_baru = LLA;

    lh_kuadrat=lh^2;

    for i = 1 : length(tabelLLA)

    letter = tabelLLA(i,3);

    if(letter

  • 48

    Berikut adalah tabel penyelidikan yang dilakukan:

    Gambar 4.16. Screenshot Tabel LLA Hasil Penyelidikan Setelah Difilter

    Dari tabel diatas diperoleh lebar label yaitu pada tabel kolom ke 3. Hasil

    tersebut dari 27 label menjadi 6 label dikarenakan tidak boleh ada garis yang lebih kecil

    dari huruf. Kolom ke 3 tersebut dibandingkan dengan LH kuadrat yang diperoleh

    sebesar 1156. Dikarenakan label mempunyai kolom kurang dari 1156 maka label

    beserta isinya dihapus.

    4.4.Menampilkan hasil segmentasi

    4.4.1. Menggabungkan citra hasil preprocessing (setelah reduksi noise) dengan hasil

    pencarian pelacak area baris yang telah dilakukan pelabelan (Tahap 4.3).

    Berikut adalah implementasi yang telah dilakukan kedalam code:

    res=LLA_baru;

    res(logical(1-In))=0;

    Tahap pertama adalah membuat variabel res untuk menampung hasil pencarian

    pelacak area baris (LLA_baru). Tahap kedua adalah melakukan proses konversi hasil

    citra hasil preprocessing (In) yang telah dilakukan fungsi invers kemudian dikonversi

    menjadi logical.

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 49

    4.4.2. Menghapus area untuk objek kecil

    Tahap ini dibagi menjadi 2 tahap yaitu melakukan pencarian tinggi dan lebar

    untuk semua objek dan melakukan penghapusan objek kecil. Berikut adalah

    implementasi dari algoritma yang telah dibuat untuk tahap pertama:

    function [tabelres]=tabelSelidikRES(res)

    tabelres=zeros(max(res(:)),3);

    for k=1 : max(res(:))

    [r, c] = find(res==k);

    if(r~=0)

    if(c~=0)

    tabelres(k,1) = k;

    tabelres(k,2) = max(r) - min(r);

    tabelres(k,3) = max(c) - min(c);

    end

    end

    end

    end

    Berikut adalah hasil dari tabel yang telah dibuat:

    Gambar 4.17. Screenshot Tabel Penyelidikan Area Objek Kecil

    Setelah dilakukan pembuat tabel penyelidikan, dilakukan tahap selanjutnya

    yaitu menghapus objek – objek yang kecil. Penghapusan ini dilakukan dengan

    menggunakan nilai ambang batas yang didapatkan dari LH * log(LH).

    Berikut adalah implementasi dari algoritma yang telah dibuat:

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 50

    function [ res_baru ] = hapusSmallTextLines(res,tabel_res,lh)

    [baris, kolom] = size(res);

    res_baru = res;

    lh_log=(lh*log(lh));

    for i = 1 : length(tabel_res)

    letter = tabel_res(i,3);

    if(letter

  • 51

    [r,c]=find(res_baru==i);

    if(r~=0)

    BW{i,1}=bwselect(res_baru,c,r);

    figure, imshow(~cell2mat(BW(i,1)));

    end

    end

    Gambar 4.19. Hasil Segmentasi 1

    Gambar 4.20. Hasil Segmentasi 2

    Gambar 4.21. Hasil Segmentasi 3

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 52

    Gambar 4.22. Hasil Segmentasi 4

    Gambar 4.17. Gambar 4.18, Gambar 4.19, dan Gambar 4.20 adalah hasil

    menampilkan segmentasi baris dari algoritma yang telah dibuat .

    4.5.Evaluasi Kinerja Sistem

    Proses pengukuran kinerja dari algoritma didasarkan pada penghitungan jumlah

    kecocokan antara entitas yang terdeteksi oleh algoritma dan entitas dengan

    perhitungan secara manual (I. Philips, dkk, 1999).

    Langkah yang yang dilakukan adalah menghitung entitas atau objek pada citra

    hasil preprocessing yaitu citra hasil binerisasi yang telah direduksi noise.

    Penghitungan objek dilakukan secara manual dengan menghitung jumlah objek

    secara baris perbaris disimbolkan dengan N. Kemudian menghitung objek hasil dari

    proses segmentasi menggunakan fungsi bwlabel pada MATLAB disimbolkan

    dengan M. Perhitungan kecocokan antar entitas dilakukan secara manual dengan

    cara one-to-one matches atau menghitung jumlah yang sesuai disimbolkan dengan

    o2o.

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 53

    Tabel 4.1. Tabel Evaluasi Sistem

    No. Data

    Bar

    is

    ke-

    N M o2

    o

    Akurasi

    Baris

    (%)

    DR

    (%)

    RA

    (%)

    FM

    (%)

    1 Kuno

    1.jpg

    1 59 6

    0 59

    100 91,4414 95,2569 93,3102

    2 51 6

    1 57

    3 57 6

    8 59

    4 55 6

    4 58

    2 Kuno

    2.jpg

    1 46 5

    0 46

    100 95,9391 92,3423 94,1064

    2 57 6

    5 59

    3 46 5

    3 49

    4 48 5

    4 52

    3 Kuno

    3.jpg

    1 41 5

    8 50

    100 95,939 92,342 94,106

    2 51 6

    0 42

    3 52 5

    9 48

    4 55 5

    9 58

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 54

    4 Kuno

    4.jpg

    1 37 4

    9 42

    100 86,875 88,725 87,79

    2 40 5

    2 40

    3 45 5

    9 48

    4 38 4

    4 38

    5 Kuno

    5.jpg

    1 44 5

    3 46

    100 93,333 87,273 90,201

    2 45 5

    8 46

    3 46 6

    1 54

    4 41 4

    8 46

    6 Kuno

    6.jpg

    1 48 5

    9 55

    100 95,215 88,306 91,631

    2 53 6

    3 58

    3 57 6

    6 60

    4 52 6

    0 55

    7 Kuno

    7.jpg

    1 50 5

    5 54 100 85,185 95,595 90,09

    2 52 6

    5 63

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 55

    3 48 5

    9 55

    4 39 4

    8 47

    8 Kuno

    8.jpg

    1 44 5

    6 45

    100 96,739 90,909 93,734

    2 47 5

    6 48

    3 45 5

    3 47

    4 48 5

    0 47

    9 Kuno

    9.jpg

    1 42 4

    2 43

    100 92,442 90,686 91,556

    2 43 4

    3 47

    3 45 4

    5 50

    4 40 4

    0 44

    10 Kuno

    10.jpg

    1 41 4

    3

    40

    100 94,118 88,789 91,376

    2 50 6

    0

    53

    3 48 6

    5

    56

    4 48 5

    5

    49

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 56

    Dari tabel hasil percobaaan yang dilakukan maka Detection Rate, Recognition

    Accuracy, dan Performance Metric untuk setiap setiap telah didapatkan. Maka dari itu,

    dapat diambil rata – rata untuk masing-masingnya.

    Rata-rata Detection Rate = (jumlah semua Detection Rate / jumlah citra)

    * 100%

    = (9.30785 / 10) * 100%

    = 93.0785%

    Rata-rata Recognition Accuracy= (jumlah semua Recognition Accuracy /

    jumlah citra) * 100%

    = (9.02629 / 10) * 100%

    = 90.2629%

    Rata-rata Detection Rate = (jumlah semua Performance Metric / jumlah

    citra) * 100%

    = (9.15326 / 10) * 100%

    = 91.5326%

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 57

    BAB V

    PENUTUP

    5.1. Kesimpulan

    Berdasarkan penelitian tentang segmentasi baris citra daun lontar aksara

    kuno yang telah dikerjakan maka dapat diambil kesimpulan sebagai berikut:

    1. Algoritma Shredding Text dapat dipakai dalam melakukan segmentasi baris

    pada data citra daun lontar aksara kuno yang digunakan dengan hasil kinerja

    sistem mendapatkan rata-rata tingkat performa untuk Detection Rate sebesar

    93.079%, Recognition Accuracy sebesar 90.2629%, dan Perfomance Metric

    sebesar 91.5326%.

    2. Kelemahan dari metode Shredding Text ini adalah citra yang digunakan harus

    bebas dari noise karena akan berpengaruh pada saat pencarian tinggi karakter

    sehingga akan mengganggu performa proses-proses selanjutnya.

    5.2. Saran

    Dari hasil penelitian ini dapat disarankan untuk penelitian selanjutnya

    sebagai berikut:

    1. Dilakukan proses cropping citra secara otomatis oleh sistem

    2. Dilakukan percobaan lebih lanjut dalam melakukan proses reduksi noise agar

    dapat mendapatkan hasil yang lebih maksimal

    3. Penggunaan metode Shredding Text disarankan digunakan untuk citra yang

    memiliki bebas noise untuk mendapatkan hasil yang lebih baik.

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 58

    DAFTAR PUSTAKA

    A. Nicolaou, and B. Gatos (2009), Handwritten Text Line Segmentation by Shredding

    Text into its Lines, 10th International Conference on Document Analysis and

    Recognition.

    Du, X. and Pan, W. and Bui, T.,“Text line segmentation in handwritten documents

    using Mumford-Shah model””, Pattern Recognition, 2009,

    doi:10.1016/j.patcog.2008.12.021

    Hinzler, H.I.R., 1993, Balinese palm-leaf manuscripts di BKI, 149:438-474.

    Gonzalez, Rafael C., Wood, Richard E.2002 Digital Image Processing Second Edition

    New Jersey: Prentice Hall.

    I. Phillips, A. Chhabra, "Empirical Performance Evaluation of Graphics Recognition

    Systems", IEEE Trans. of Patt. Analysis and Machine Intell., 21(9), pp. 849-870,

    1999.

    Kadir, A. dan Adhi, S. (2013). Teori dan Aplikasi Pengolahan Citra. Yogyakarta, Andi

    Offset.

    M. Petrou dan P. Bosdogianni, Image Processing : The Fundamentals, New York:

    Wiley, 1999

    Priyanto Hidayatullah, Pengolahan Citra Digital, Penerbit Informatika, 2017

    Zhou, Q. (1999), Digital Image Processing And Interpretation. Hongkong. Department

    of Geography, Hong Kong Baptist University

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 59

    LAMPIRAN

    Lampiran 1 Hasil Segmentasi Baris

    Data Baris Hasil Segmentasi

    ‘kuno

    1.jpg’

    1

    2

    3

    4

    ‘kuno

    2.jpg’

    1

    2

    3

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 60

    4

    ‘kuno

    3.jpg’

    1

    2

    3

    4

    ‘kuno

    4.jpg’

    1

    2

    3

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 61

    4

    ‘kuno

    5.jpg’

    1

    2

    3

    4

    ‘kuno

    6.jpg’

    1

    2

    3

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 62

    4

    ‘kuno

    7.jpg’

    1

    2

    3

    4

    ‘kuno

    8.jpg’

    1

    2

    3

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 63

    4

    ‘kuno

    9.jpg’

    1

    2

    3

    4

    ‘kuno

    10.jpg’

    1

    2

    3

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

  • 64

    4

    PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI