PENGENALAN KARAKTER TULISAN TANGAN AKSARA LAMPUNG ...digilib.unila.ac.id/32592/3/SKRIPSI TANPA BAB...

i

PENGENALAN KARAKTER TULISAN TANGAN AKSARA LAMPUNG

MENGGUNAKAN EKSTRAKSI FITUR CHAIN CODE 8 DIRECTION

DAN PROJECTION PROFILE

(Skripsi)

Oleh

TRI LESTARI

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS LAMPUNG

BANDARLAMPUNG

2018

http://www.kvisoft.com/pdf-merger/

ii

ABSTRACT

RECOGNITION OF HANDWRITTEN CHARACTER LAMPUNG SCRIPT

BY USING CHAIN CODE 8 DIRECTION AND PROJECTION PROFILE

FEATURE EXTRACTION

By

TRI LESTARI

Lampung script is one of the cultural heritages in the form of writing character

owned by Lampung society. The basic character consists of 20 characters with various

shapes. As the times progressed, the knowledge of the Lampung script increasingly

faded out. One of the efforts to preserve the script is by conducting research on the

recognition of Lampung script characters. This research is a continuation of previous

research on the recognition of handwritten characters of Lampung script. This research

is evolved from the previous research in terms of the use of features for character

recognition. The features used are chain code 8 direction, projection profile and the

combination of both. The number of characters in the dataset is 32140 files with

grayscale image format. The dataset is divided into three groups of data that are

training, validation, and testing. As classification tool, this research used LibSVM

(Library Support Vector Machine). The accuracy obtained on the use of chain code 8

iii

direction feature reached 90.08%, while the use of projection profile feature reached

the accuracy of 79.28%. Merging the two features results the highest accuracy with 4%

increasing number from the use of chain code 8 direction feature becoming 94.00%.

Keywords: chain code 8 direction, feature, handwriten character recognition,

Lampung script, projection profile.

iv

ABSTRAK




Oleh

TRI LESTARI

Aksara Lampung merupakan salah satu warisan budaya berupa karakter tulisan

yang dimiliki oleh masyarakat Lampung. Aksara dasar terdiri dari 20 karakter dengan

bentuk yang beragam. Seiring perkembangan zaman, pengetahuan akan Aksara

Lampung semakin tergerus. Salah satu upaya untuk melestarikan aksara tersebut adalah

dengan melakukan penelitian tentang pengenalan karakter Aksara Lampung. Penelitian

ini merupakan lanjutan dari penelitian sebelumnya tentang pengenalan karakter tulisan

tangan Aksara Lampung. Pengembangan dilakukan dari segi penggunaan fitur untuk

pengenalan karakter aksara. Fitur-fitur yang digunakan adalah chain code 8 direction,

projection profile dan gabungan keduanya. Jumlah karakter pada dataset secara

keseluruhan sebanyak 32140 file dengan format grayscale image. Dataset tersebut

terbagi menjadi tiga kelompok data yaitu training, validation, dan testing. Sebagai alat

klasifikasi digunakan LibSVM (Library Support Vector Machine). Akurasi yang

v

diperoleh pada penggunaan fitur chain code 8 direction sebesar 90,08%, sedangkan

penggunaan fitur projection profile menghasilkan akurasi sebesar 79,28%.

Penggabungan kedua fitur memberikan hasil akurasi tertinggi dengan peningkatan 4%

dari penggunaan fitur chain code 8 direction menjadi 94,00%.

Kata kunci : aksara Lampung, chain code 8 direction, fitur, pengenalan karakter

tulisan tangan, projection profile.

vi




Oleh

TRI LESTARI

Skripsi

Sebagai Salah Satu Syarat untuk Memperoleh Gelar

SARJANA KOMPUTER

Pada

Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS LAMPUNG

BANDAR LAMPUNG

2018

x

RIWAYAT HIDUP

Penulis dilahirkan pada tanggal 18 Oktober 1995 di Pringsewu,

dengan Ibu bernama Rumaeti dan Ayah bernama Aripin. Penulis

menyelesaikan pendidikan formal pertama kali di Taman Kanak-

kanak (TK) Aisyiyah 1 Pringsewu pada tahun 2002, menyelesaikan

Sekolah Dasar (SD) di SD Muhammadiyah Pringsewu pada tahun

2008, menyelesaikan Sekolah Menengah Pertama (SMP) di SMP Negeri 1 Pringsewu

pada tahun 2011, kemudian melanjutkan jenjang Sekolah Menengah Atas (SMA) di

SMA Negeri 1 Pringsewu dengan mengambil jurusan Ilmu Pengetahuan Alam (IPA)

dan lulus pada tahun 2014.

Pada tahun 2014, penulisan terdaftar sebagai mahasiswa Jurusan Ilmu Komputer

Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung melalui jalur

SBMPTN. Selama menjadi mahasiswa, penulis pernah bergabung dalam Lembaga Pers

Mahasiswa (LPM) Natural (2014) serta menjadi anggota Badan Khusus (2014) dan

Biro Kewirausahaan (2016) Himpunan Mahasiswa Ilmu Komputer (HIMAKOM).

Penulis pernah menjadi asisten praktikum untuk matakuliah Algoritma dan

Pemrograman, Sistem Operasi, Grafika Komputer, dan Basis Data (2015-2017). Bulan

Januari – Februari 2017, penulis melakukan kerja praktik di PT Adira Dinamika Multi

Finance RO Pringsewu dengan penempatan pada Divisi Operation. Bulan Juli –

xi

Agustus 2017, penulis melakukan Kuliah Kerja Nyata (KKN) di Desa Banjarmasin,

Kecamatan Penengahan, Kabupaten Lampung Selatan.

xii

PERSEMBAHAN

Puji dan syukur kepada Allah SWT atas segala limpahan berkah-Nya sehingga

skripsi ini dapat terselesaikan dengan tepat waktu.

Teruntuk kedua orang tua tercinta Bapak Aripin dan Ibu Rumaeti yang senantiasa

mengiringi langkah ini dengan do’a dan segala jerih payah demi tercapai segala

harapan dan cita-citaku.

Kakak tersayang Mohamad Ady Darmawan, panutanku.

Keluarga Ilmu Komputer 2014.

Serta Almamater tercinta,

Universitas Lampung.

xiii

MOTTO

xiv

SANWACANA

Alhamdulillahirobbil ‘alamin.

Puji syukur kehadirat Allah SWT, atas limpahan rahmat dan karunia-Nya penulis dapat

menyelesaikan penulisan skripsi yang berjudul “Pengenalan Karakter Tulisan Tangan

Aksara Lampung Menggunakan Ekstraksi Fitur Chain Code 8 Direction dan

Projection Profile” dengan baik. Terselesaikannya laporan ini tidak terlepas dari

bantuan banyak pihak, sehingga pada kesempatan ini dengan ketulusan hati dan penuh

rasa hormat penulis menghaturkan terimakasih kepada semua pihak yang telah

membantu dan berperan besar dalam proses penyusunan skripsi ini. Ungkapan

terimakasih penulis haturkan kepada :

1. Kedua orangtua tercinta, sumber motivasi terbesar, Bapak Aripin dan Ibu

Rumaeti yang selalu memberikan do’a, kasih sayang, dukungan, dan semangat

yang tak terhingga serta memfasilitasi segala kebutuhan dalam menyelesaikan

skripsi ini.

2. Kakak tersayang, Mohamad Ady Darmawan yang telah memberikan banyak

hal sehingga menjadi motivasi tersendiri dalam menjalani perkuliahan dan

menyelesaikannya dengan baik.

3. Bapak Dr.rer.nat.Akmal Junaidi, M.Sc sebagai pembimbing utama yang telah

memberikan tema penelitian, membimbing, memotivasi serta memberikan

xv

kritik dan saran selama masa perkuliahan dan penyusunan skripsi sehingga

penulis dapat sampai di tahap ini.

4. Bapak Ardiansyah, M.Kom sebagai pembimbing kedua yang telah

membimbing dan memberikan bantuan, ide, kritik serta saran dalam

penyusunan skripsi ini.

5. Bapak Didik Kurniwan, M.T sebagai pembahas, yang telah memberikan kritik

dan saran yang bermanfaat untuk perbaikan dalam penyusunan skripsi ini.

6. Bapak Prof. Warsito, S.Si., D.E.A., Ph.D selaku Dekan FMIPA Universitas

Lampung.

7. Bapak Dr. Ir. Kurnia Muludi, M.S.Sc., selaku Ketua Jurusan Ilmu Komputer

FMIPA Universitas Lampung.

8. Bapak Didik Kurniawan, M.T selaku Sekretaris Jurusan Ilmu Komputer

FMIPA Universitas Lampung.

9. Bapak Rico Andrian, S.Si., M.Kom selaku Pembimbing Akademik.

10. Bapak dan Ibu Dosen Jurusan Ilmu Komputer yang telah memberikan ilmu dan

pengalaman yang luar biasa kepada penulis selama menjadi mahasiswa.

11. Ibu Nora Ade Maela selaku Staff Administratif Jurusan Ilmu Komputer.

12. Tersetiaku Fitrianingsih, Wini Nur Handayani, Clara Viony Septiana yang

selalu menampung keluh kesah dan memberikan semangat.

13. Keluarga seatap, Desi, Paul, Laras, Sesa, Dina, Puput, Anis, Matsna, Dedew

yang selalu membagikan kerecehan-kerecehan sebagai hiburan di sela

kepenatan dalam menyusun skripsi.

xvi

14. Noni Kurniasih, Syifa Trianingsih, Maria Regina Caeli, Nuha Hanifah, Devi

Ranita yang telah menjadi partner sharing terbaik.

15. Keluarga Ilmu Komputer 2014 yang tidak bisa disebutkan satu per satu, terima

kasih banyak atas kebersamaannya.

16. Almamater tercinta, Universitas Lampung.

Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan, akan tetapi besar

harapan semoga skripsi ini dapat bermanfaat bagi perkembangan ilmu pengetahuan

terutama bagi teman-teman Ilmu Komputer serta semua pihak yang membacanya.

Bandar Lampung, 30 Juli 2018

Tri Lestari

xvii

DAFTAR ISI

Halaman

DAFTAR ISI ............................................................................................................ xvii

DAFTAR GAMBAR ................................................................................................ xix

DAFTAR TABEL .................................................................................................... xxi

I. PENDAHULUAN ................................................................................................ 1

1.1 Latar Belakang .............................................................................................. 1

1.2 Rumusan Masalah......................................................................................... 3

1.3 Batasan Masalah ........................................................................................... 3

1.4 Tujuan Penelitian .......................................................................................... 4

1.5 Manfaat Penelitian ........................................................................................ 4

II. TINJAUAN PUSTAKA ...................................................................................... 5

2.1 Aksara Lampung........................................................................................... 5

2.2 Character Recognition ................................................................................. 9

2.3 Fitur ............................................................................................................ 11

2.4 Chain Code 8-Direction ............................................................................. 12

2.5 Projection Profile ....................................................................................... 15

2.6 Support Vector Machine ............................................................................. 17

III. METODOLOGI PENELITIAN ..................................................................... 19

3.1 Waktu dan Tempat Pelaksanaan ................................................................. 19

3.2 Alat Pendukung .......................................................................................... 19

3.3 Dataset ........................................................................................................ 20

3.4 Tahapan Penelitian ..................................................................................... 21

3.4.1 Image Acquisition ........................................................................... 21

3.4.2 Preprocessing ................................................................................. 21

3.4.3 Feature Extraction .......................................................................... 22

xviii

3.4.4 Classification .................................................................................. 31

IV. HASIL DAN PEMBAHASAN ......................................................................... 33

4.1 Preprocessing ............................................................................................. 33

4.2 Pembagian Dataset ..................................................................................... 34

4.3 Connected Component ................................................................................. 35

4.4 Ekstraksi Fitur............................................................................................. 36

4.4.1 Ekstraksi Fitur Chain Code 8-Direction ......................................... 37

4.4.2 Ekstraksi Fitur Projection Profile................................................... 41

4.4.3 Ekstraksi Fitur Gabungan ............................................................... 43

4.5 Klasifikasi Fitur .......................................................................................... 44

4.6 Analisis Kesalahan Klasifikasi ................................................................... 50

4.6.1 Kesalahan Klasifikasi Fitur Chain Code 8 Direction ..................... 51

4.6.2 Kesalahan Klasifikasi Fitur Projection Profile .............................. 57

4.6.3 Kesalahan Klasifikasi Fitur Gabungan ........................................... 63

V. SIMPULAN DAN SARAN ................................................................................ 70

5.1 Simpulan ..................................................................................................... 70

5.2 Saran ........................................................................................................... 71

DAFTAR PUSTAKA ................................................................................................ 72

LAMPIRAN ............................................................................................................... 74

xix

DAFTAR GAMBAR

Halaman

Gambar 2.1 Karakter dasar aksara Lampung ................................................................ 5

Gambar 2.2 Karakter diakritik aksara Lampung ........................................................... 6

Gambar 2.3 Karakter diakritik atas ............................................................................... 6

Gambar 2.4 Karakter diakritik bawah ........................................................................... 7

Gambar 2.5 Karakter diakritik kanan ............................................................................ 7

Gambar 2.6 Tanda baca aksara Lampung ..................................................................... 8

Gambar 2.7 Arah dan kode nilai chain code 8 direction ............................................ 12

Gambar 2.8 Representasi chain code 8 direction........................................................ 13

Gambar 2.9 Proyeksi horizontal dan vertikal karakter ligatur Urdu ........................... 16

Gambar 2.10 Konsep Support Vector Machine .......................................................... 17

Gambar 3.1 Tahapan pengerjaan penelitian ................................................................ 21

Gambar 3.2 Ilustrasi pembagian blok citra aksara La ................................................. 23

Gambar 3.3 Penelusuran starting point blok citra aksara La ...................................... 24

Gambar 3.4 Nilai kode arah dan penelusuran chain code pada blok aksara La .......... 25

Gambar 3.5 Penelusuran jumlah piksel foreground pada baris citra aksara ............... 27

Gambar 3.6 Hasil projection profile citra aksara pada orientasi horizontal ............... 28

Gambar 3.7 Penelusuran jumlah piksel foreground pada kolom citra ........................ 29

Gambar 3.8 Hasil projection profile pada orientasi vertikal ....................................... 30

xx

Gambar 4.1 Hasil normalisasi ukuran dan binerisasi citra aksara La ......................... 33

Gambar 4.2 Contoh komponen-komponen terpisah pada (a) karakter Pa,

(b) karakter Nya, (c) karakter Nya ........................................................... 35

Gambar 4.3 Pembagian blok citra karakter aksara La ................................................ 37

Gambar 4.4 Output hasil ekstraksi fitur chain code 8 direction ................................. 40

Gambar 4.5 Output hasil ekstraksi fitur projection profile ......................................... 43

Gambar 4.6 Output hasil ekstraksi fitur gabungan chain code 8 direction dan

projection profile ..................................................................................... 44

Gambar 4.7 Perbedaan (a) aksara La dan (b) aksara A ............................................... 52

Gambar 4.8 Sampel kesalahan (a)garis bantu terlalu pendek, (b)garis bantu terlalu

rapat dengan badan karakter ................................................................... 53

Gambar 4.9 Sampel kesalahan (a) garis tengah terlalu menjorok ke kiri, (b) garis

tengah terlalu panjang .............................................................................. 55

Gambar 4.10 Kesamaan jumlah garis (a) aksara Nya dan (b) aksara A ..................... 58

Gambar 4.11 Sampel kesalahan posisi titik puncak kurva aksara Nya ....................... 61

Gambar 4.12 Kemiripan bentuk dasar (a) aksara Da dan (b) aksara Ga ..................... 64

Gambar 4.13 Kesalahan bentuk dan posisi garis vertikal aksara Da .......................... 65

xxi

DAFTAR TABEL

Halaman

Tabel 4.1 Rincian pembagian kelompok dataset......................................................... 34

Tabel 4.2 Sampel hasil ekstraksi fitur chain code 8 direction .................................... 38

Tabel 4.3 Sampel hasil ekstraksi fitur projection profile ............................................ 41

Tabel 4.4 Persentase akurasi pengujian data validation dan data testing ................... 48

Tabel 4.5 Confusion matrix fitur chain code 8 direction ............................................ 49

Tabel 4.6 Confusion matrix fitur projection profile .................................................... 49

Tabel 4.7 Confusion matrix fitur gabungan chain code 8 direction dan projection

profile........................................................................................................... 50

Tabel 4.8 Hasil ekstraksi fitur aksara A dan La pada blok (4,2) ................................. 54

Tabel 4.9 Hasil ekstraksi fitur aksara La dan A pada blok (4,2) ................................. 56

Tabel 4.10 Hasil ekstraksi fitur proyeksi vertikal aksara Nya dan A .......................... 59

Tabel 4.11 Hasil ekstraksi fitur proyeksi horizontal aksara Nya dan A ...................... 62

Tabel 4.12 Hasil ekstraksi fitur aksara Da dan Ga pada blok (1,4) ............................ 66

Tabel 4.13 Hasil ekstraksi fitur proyeksi horizontal aksara Da dan Ga ...................... 66

Tabel 4.14 Hasil ekstraksi fitur proyeksi vertikal aksara Da dan Ga .......................... 67

1

I. PENDAHULUAN

1.1 Latar Belakang

Indonesia merupakan negara yang kaya akan warisan budaya. Salah satu warisan

tersebut adalah bahasa daerah. Sejak zaman dahulu para nenek moyang telah

menggunakan bahasa daerah sebagai sarana komunikasi antar sesamanya baik

melalui lisan maupun tulisan. Untuk berkomunikasi melalui tulisan biasanya

mereka menggunakan simbol-simbol tertentu yang kemudian menjadi ciri khas

dari daerah tempat asalnya. Namun di Indonesia sendiri tidak semua daerah

memiliki warisan budaya tersebut sehingga sudah sepatutnya hal itu dapat dijaga

dan dilestarikan.

Lampung merupakan salah satu daerah yang memiliki warisan budaya berupa

simbol-simbol khusus yang digunakan untuk berkomunikasi melalui tulisan atau

disebut juga aksara. Aksara Lampung telah banyak ditemukan dibeberapa

dokumen kuno yang kini tersimpan di museum. Namun seiring perkembangan

zaman dan melihat kenyataan bahwa saat ini di wilayah Lampung tidak hanya

ditinggali oleh masyarakat asli suku Lampung, tetapi juga dihuni oleh suku-suku

lainnya sehingga menyebabkan pengetahuan akan aksara Lampung semakin lama

2

semakin tergerus. Apabila hal itu dibiarkan terus menerus maka bukan tidak

mungkin suatu saat nanti warisan budaya tersebut akan hilang termakan zaman.

Salah satu upaya yang dilakukan untuk menjaga kelestarian aksara Lampung

yaitu dengan melakukan penelitian berupa pemanfaatan teknologi komputer

untuk mengembangkan sistem yang dapat mengenali masukan gambar berupa

tulisan tangan aksara Lampung. Bidang ilmu yang membahas hal tersebut adalah

pengenalan pola, khususnya pengenalan pola tulisan tangan atau disebut juga

Handwritten Character Recognition. Salah satu tahapan penting yang terdapat

dalam proses pengenalan pola tulisan tangan adalah feature extraction. Tahapan

ini bertujuan untuk mengekstrak ciri khusus dari suatu karakter sehingga dapat

dijadikan sebagai pembeda dengan karakter lain.

Penelitian ini merupakan pengembangan dari penelitian yang telah dilakukan

sebelumnya oleh Akmal Junaidi tahun 2016 dengan judul Lampung Handwritten

Character Recognition. Penelitian tersebut telah menggunakan fitur-fitur seperti

branch point, end point, pixel density, water reservoir, dan chain code 4

direction. Namun masih banyak lagi fitur-fitur lainnya yang sangat berpotensi

untuk digunakan sebagai karakteristik dalam mengenali aksara Lampung. Oleh

karena itu, dalam penelitian ini akan diaplikasikan fitur-fitur lainnya seperti chain

code 8 direction dan projection profile untuk mengenali aksara tersebut.

3

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah dipaparkan, masalah pokok yang perlu

diselesaikan dan menjadi dasar dalam pengerjaan skripsi ini sebagai berikut.

1. Bagaimana cara mengekstraksi fitur chain code 8 direction dan projection

profile untuk mengenali tulisan tangan Aksara Lampung.

2. Bagaimana tingkat akurasi penggunaaan fitur chain code 8 direction dan

projection profile dalam pengenalan tulisan tangan aksara Lampung.

1.3 Batasan Masalah

Dalam penelitian ini diberikan pembatasan masalah diantaranya sebagai berikut.

1. Penelitian ini melanjutkan penelitian sebelumnya dengan cara memperluas

fitur yang telah digunakan.

2. Penelitian ini hanya menggunakan fitur chain code 8 direction dan projection

profile.

3. Dataset yang diolah dalam penelitian ini merupakan hasil pemrosesan gambar

tulisan tangan aksara Lampung dari penelitian sebelumnya.

4. Proses klasifikasi aksara Lampung menggunakan pendekatan SVM (Support

Vector Machine) dengan memanfaatkan tools pada LibSVM.

4

1.4 Tujuan Penelitian

Tujuan dari penelitian ini adalah mengeksplorasi, mengkaji, dan menganalisis

fitur chain code 8 direction dan projection profile untuk mengenali tulisan tangan

aksara Lampung serta mengklasifikasikannya ke dalam jenis aksara yang sesuai

menggunakan SVM (Support Vector Machine). Hasil klasifikasi tersebut

kemudian akan dievaluasi terhadap ground truth sehingga dapat diketahui tingkat

akurasinya.

1.5 Manfaat Penelitian

Manfaat yang diperoleh dari penelitian ini adalah sebagai berikut.

1. Manfaat Praktis

a) Mengembangkan penggunaan fitur-fitur dalam pengenalan pola tulisan

tangan aksara Lampung dengan menerapkan fitur chain code 8 direction

dan projection profile.

b) Mengetahui tingkat akurasi penggunaan fitur chain code 8 direction dan

projection profile dalam mengenali tulisan tangan aksara Lampung.

2. Manfaat Akademis

a) Mengaplikasikan ilmu yang telah dipelajari selama masa perkuliahan.

b) Sebagai acuan untuk penelitian atau pengembangan sistem yang terkait

dengan pengenalan tulisan tangan aksara Lampung.

5

II. TINJAUAN PUSTAKA

2.1 Aksara Lampung

Aksara Lampung berasal dari kelompok aksara Brahmi, yaitu aksara kuno yang

berasal dari wilayah India Selatan. Aksara Lampung hanya terdiri dari 20 karakter

dasar. Bentuk utama semua karakter adalah lengkungan atau kurva. Lebih

tepatnya setiap karakter mengandung setidaknya satu kurva yang bisa menghadap

ke atas dan/atau ke bawah. Bentuk-bentuk karakter dasar aksara Lampung

ditunjukkan pada Gambar 2.1 berikut.

Gambar 2.1 Karakter dasar aksara Lampung (Junaidi, 2016).

Setiap karakter dasar dalam aksara Lampung dibaca dengan komposisi bunyi

yang dihasilkan dari huruf konsonan dengan akhiran huruf vokal “a”. Dalam

penulisan setiap kata-kata tidak selalu berakhiran “a”, tetapi juga sering

digunakan huruf vokal lain. Untuk mengubah bunyi huruf vokal yang melekat

pada karakter dasar menjadi huruf vokal lain seperti i, u, e, dan o, sistem aksara

6

Lampung menggunakan diakritik (anak huruf). Bentuk-bentuk karakter diakritik

aksara Lampung ditunjukkan pada Gambar 2.2 berikut.

Gambar 2.2 Karakter diakritik aksara Lampung (Junaidi, 2016).

Karakter diaktritik aksara Lampung dapat dikelompokkan berdasarkan posisi

penulisannya terhadap karakter dasar. Kelompok karakter tersebut adalah

diakritik atas, diakritik bawah, dan diakritik kanan. Berikut merupakan

penjelasan dari ketiga kelompok tersebut.

1. Diakritik Atas

Diakritik atas terdiri dari enam karakter yang memiliki nama atau istilah

masing-masing. Keenam karakter diakritik tersebut ditunjukkan pada

Gambar 2.3 berikut.

Gambar 2.3 Karakter diakritik atas (Junaidi, 2016).

Diakritik ulan é dan bicek dapat menggantikan huruf vokal yang melekat pada

karakter dasar menjadi huruf vokal e. Perbedaan keduanya dapat terlihat dari

segi pengucapan misalnya ulan untuk pengucapan kata “absen” dan bicek

untuk pengucapan kata “pegawai”. Diakritik ulan i menggantikan huruf vokal

yang melekat pada karakter dasar menjadi huruf vokal i. Diakritik tekelubang,

datas, dan rejunjung dapat menimpa huruf vokal yang melekat pada aksara

7

dasar dan menambahkan ekspansi huruf konsonan “ng”, “n”, dan “r” di akhir

vokal.

2. Diakritik Bawah

Diakritik bawah terdiri dari tiga karakter dengan nama atau istilah masing-

masing. Bentuk ketiga karakter tersebut ditunjukkan pada Gambar 2.4.

Gambar 2.4 Karakter diakritik bawah (Junaidi, 2016).

Diakritik bitan u menggantikan huruf vokal yang melekat pada karakter dasar

menjadi huruf vokal u. Diakritik ulan o menggantikan huruf vokal yang

melekat pada karakter dasar menjadi huruf vokal o. Diakritik tekelungau

mengubah huruf vokal yang melekat pada karakter dasar menjadi gabungan

dua huruf vokal yang disebut diftong “au”.

3. Diakritik Kanan

Diakritik kanan terdiri dari tiga karakter dengan nama atau istilah yang

berbeda. Bentuk dari masing-masing karakter diakritik tersebut ditunjukkan

pada Gambar 2.5 berikut.

Gambar 2.5 Karakter diakritik kanan (Junaidi, 2016).

8

Diakritik tekelingai merupakan diftong yang merubah huruf vokal pada

karakter dasar menjadi dua huruf vokal “ai”. Diakritik keleniah dapat

menimpa huruf vokal yang melekat pada aksara dasar dan menambahkan

ekspansi huruf konsonan “h” di akhir vokal. Diakritik nengen digunakan

untuk membungkam huruf vokal (vocal silencer) yang melekat pada karakter

dasar sehingga bagian yang tersisa hanyalah konsonan dari karakter dasar.

Selain karakter dasar dan diakritik, dalam sistem penulisan aksara Lampung

juga menggunakan tanda baca. Jumlah tanda baca yang terdapat pada aksara

Lampung sebanyak lima tanda baca. Bentuk-bentuk kelima tanda baca

tersebut ditunjukkan pada Gambar 2.6 berikut.

Gambar 2.6 Tanda baca aksara Lampung (Junaidi, 2016).

Berikut merupakan penjelasan dari kelima tanda baca tersebut.

1. Ngemula

Ngemula merupakan simbol unik berbentuk seperti matahari. Fungsinya

adalah untuk memulai sebuah kalimat.

2. Beradu

Fungsi tanda beradu berlawanan dari tanda ngemula. Tanda ini diletakkan

di akhir kalimat untuk menyelesaikannya.

9

3. Kuma

Sebagai tanda baca, kuma digunakan untuk menjeda kalimat atau untuk

memisahkan elemen dalam serangkaian (tiga atau lebih) hal dalam satu

kalimat.

4. Ngulih

Tanda ngulih diletakkan di akhir kalimat sebagai tanda baca dalam

kalimat yang berisi pertanyaan tentang sesuatu.

5. Tanda Seru

Tanda seru adalah tanda baca untuk menyatakan bahwa kalimat

mengandung perintah atau pernyataan tegas (Junaidi, 2016).

2.2 Character Recognition

Character Recognition merupakan proses mendeteksi dan mengenali karakter

dari suatu input gambar. Terdapat dua macam Character Recognition, yaitu

Offline dan Online Character Recognition. Sistem offline mengolah data atau

dokumen yang sebelumnya memerlukan proses digitalisasi untuk menjadi file

gambar digital agar dapat dibaca oleh komputer. Sedangkan sistem online

mengolah data atau dokumen yang dibuat langsung menggunakan perangkat

digital sehingga dapat diproses seketika itu juga. Berdasarkan metode

penulisannya, terdapat jenis pengenalan karakter dengan input berupa tulisan

tangan yang disebut Handwritten Character Recognition (HCR) dan input berupa

aksara cetak atau printed character recognition. Akurasi pada HCR biasanya

10

masih rendah dikarenakan besarnya perbedaan bentuk dan tipe tulisan dari setiap

individu (Rao et al, 2016).

Proses character recognition terdiri dari beberapa fase. Urutan fase-fase tersebut

adalah sebagai berikut.

1. Image Acquisition

Image Acquisition adalah tahap pertama dalam character recognition. Ini

adalah metode untuk mendapatkan gambar melalui kamera atau pemindai.

Gambar didapat dalam bentuk format file yang ditentukan, misalnya JPEG

atau PNG.

2. Pre-Processing

Tahap preprocessing melibatkan berbagai tahap operasi untuk meningkatkan

kualitas citra agar dapat diproses lebih lanjut. Preprocessing melibatkan

pengurangan noise, binerisasi, deteksi tepi dan thresholding.

3. Segmentation

Keakuratan pengenalan karakter yang berhasil tergantung pada keakuratan

segmentasi yang dilakukan. Tujuan segmentasi adalah membagi serangkaian

karakter menjadi karakter-karakter yang terpisah.

11

4. Feature Extraction

Feature Extraction merupakan metode pengambilan data material penting

dari konten data mentah untuk memaksimalkan tingkat pengenalan karakter.

Data material penting yang dimaksud adalah representasi karakter yang

akurat dan efisien. Ekstraksi fitur tidak hanya merupakan fase penting dalam

pengenalan karakter tetapi juga pada aplikasi pengenalan pola apapun.

5. Classification and Recognition

Pada fase ini ketika input gambar dimasukkan ke dalam sistem pengenalan

karakter, semua fitur penting akan dimasukkan ke classifier yang sudah

terlatih. Perbandingan fitur input dengan pola tersimpan kemudian dilakukan

untuk menemukan pencocokan kelas yang sesuai dengan input gambar

(Sharma et al, 2017).

2.3 Fitur

Fitur atau atribut merupakan karakteristik pembeda dari suatu objek yang

diperoleh melalui pengukuran dan dapat berupa simbol, numerik, atau kedua-

duanya. Fitur dapat direpresentasikan dalam bentuk variabel kontinu, diskret,

atau diskret biner. Untuk memperoleh fitur dapat menggunakan berbagai metode

pencarian fitur atau disebut juga metode ekstraksi fitur (Putra, 2010).

12

Metode ekstraksi fitur digunakan untuk melakukan pengukuran atribut pola yang

paling sesuai dengan kriteria klasifikasi yang diberikan. Pemilihan metode

ekstraksi yang tepat sangat memungkinkan untuk menemukan subset fitur yang

cocok dengan kriteria klasifikasi sehingga dapat memaksimalkan keefektifan

pengenalan pola karakter dan atau memaksimalkan efisiensi proses dengan cara

meminimalkan jumlah fitur (Cheriet et al, 2007).

2.4 Chain Code 8-Direction

Chain code atau kode rantai yang pertama kali diperkenalkan oleh Freeman pada

tahun 1961 merupakan representasi kontur yang dilakukan dengan menggunakan

pendekatan delapan ketetanggaan (Kadir dan Susanto, 2013). Kode rantai setiap

tetangga piksel dinyatakan dengan sebuah angka 0 sampai dengan 7 seperti

ditunjukkan pada Gambar 2.7 berikut.

Gambar 2.7 Arah dan kode nilai chain code 8 direction (Putra, 2010).

13

Chain code 8-direction dapat digunakan untuk melakukan penelusuran piksel

objek sesuai dengan delapan arah mata angin. Dengan demikian struktur

pembentuk dari suatu objek dapat direpresentasikan menggunakan chain code.

Representasi kontur suatu objek menggunakan chain code 8-direction dari suatu

citra ditunjukkan pada Gambar 2.8.

Gambar 2.8 Representasi chain code 8 direction (Rajput dan Mali, 2010).

Gambar 2.8 menunjukkan representasi kontur suatu objek menggunakan chain

code 8-direction. Hasil penelusuran chain code dari objek tersebut berupa

urutan kode rantai dengan panjang 15 fitur. Panjang kode rantai untuk setiap

objek memiliki ukuran yang berbeda satu sama lain tergantung pada bentuk dan

ukuran kontur masing-masing objek yang ditelusuri. Proses normalisasi

dibutuhkan untuk menghasilkan kesamaan panjang fitur antar karakter yang

akan diklasifikasi.

14

Persamaan yang digunakan untuk menormalisasi fitur chain code 8 direction

direpresentasikan sebagai berikut (Rajput dan Mali, 2010).

𝑉 =𝑉𝑖

|𝑉1| dimana |𝑉1| = ∑ 𝑉𝑖

7𝑖=0 (2.1)

Keterangan :

𝑖 = kode arah 0,1,2,…, 7

Vi = Frekuensi kemunculan kode arah-i

V1 = Total jumlah frekuensi kemunculan semua kode arah

Nilai-nilai yang diperoleh menggunakan persamaan 2.1 dihimpun dalam variabel

V sehingga membentuk sekumpulan nilai fitur. Fitur inilah yang kemudian dapat

dijadikan sebagai pembeda antar objek.

Efektifitas penggunaan fitur chain code dalam pengenalan suatu karakter dapat

ditingkatkan dengan cara melakukan ekstraksi fitur per-area yang lebih spesifik.

Caranya adalah dengan membagi gambar karakter terlebih dahalu ke dalam

beberapa blok yang lebih kecil dengan ukuran NxN, kemudian menjalankan

proses ekstraksi fitur pada setiap blok, lalu pada akhir proses semua fitur yang

diperoleh dari masing-masing blok digabungkan sehingga membentuk satu

kesatuan fitur (Surinta, 2016).

15

2.5 Projection Profile

Projection Profile merupakan struktur data yang digunakan untuk menyimpan

jumlah piksel foreground ketika gambar diproyeksikan di atas sumbu normal XY

(Roberto et al, 2002). Projection profile dapat dilihat dalam orientasi vertikal dan

horizontal. Proyeksi vertikal ditemukan dengan menelusuri gambar karakter

sepanjang sumbu Y dan menghitung jumlah piksel foreground pada setiap

kolomnya. Misalkan untuk gambar karakter dengan ukuran baris 15 piksel dan

kolom 12 piksel maka fitur proyeksi vertikal memiliki ukuran panjang sama

dengan jumlah kolom yakni 12 fitur. Untuk proyeksi horizontal gambar karakter

ditelusuri secara horizontal sepanjang sumbu X. Jumlah piksel foreground pada

setiap baris citra merupakan nilai fitur proyeksi horizontal dari karakter

(Choudhary dan Kumar, 2017).

Pada citra dengan ukuran ‘m’ baris dan ‘n’ kolom, proyeksi horizontal dan

vertikal direpresentasikan oleh persamaan berikut (Javed et al, 2014).

𝐻𝑃𝑃(𝑥) = ∑ 𝑓(𝑥, 𝑦)

1≤𝑦≤𝑛

(2.2)

𝑉𝑃𝑃(𝑦) = ∑ 𝑓(𝑥, 𝑦)

1≤𝑥≤𝑚

(2.3)

Keterangan :

HPP = Horizontal Projection Profile

VPP = Vertical Projection Profile

x = indeks baris

16

y = indeks kolom

m = jumlah baris

n = jumlah kolom

f(x,y) = posisi baris dan kolom

Proyeksi horizontal dan vertikal suatu karakter diilustrasikan dalam Gambar 2.9

berikut.

Gambar 2.9 Proyeksi horizontal dan vertikal karakter ligatur Urdu (Shabbir

dan Siddiqi, 2016).

Proyeksi horizontal dan vertikal menghasilkan rangkaian nilai yang

merepresentasikan jumlah piksel foreground pada baris dan kolom citra. Nilai-

nilai tersebut dapat dinormalisasi ke dalam range 0-1 dengan cara membagi

setiap nilai proyeksi horizontal dengan jumlah kolom citra dan membagi setiap

nilai proyeksi vertikal dengan jumlah baris citra (Shabbir dan Siddiqi, 2016).

17

Hasil dari proses normalisasi berupa fitur proyeksi berbentuk rangkaian nilai

desimal antara 0 dan 1. Fitur yang telah ternormalisasi dapat dipadukan dengan

fitur lain yang juga berbentuk desimal sehingga menghasilkan kesatuan fitur baru

dengan nilai yang setara.

2.6 Support Vector Machine

Support Vector Machine pertama kali diperkenalkan oleh Vladimir Vapnik pada

tahun 1992. Support Vector Machine merupakan metode pembelajaran yang

digunakan untuk klasifikasi biner dengan mencari hyperplane terbaik yang

berfungsi sebagai pemisah dua class pada input space.

Konsep Support Vector Machine ditunjukkan dalam Gambar 2.10 berikut.

Gambar 2.10 Konsep Support Vector Machine (Nugroho et al, 2003).

Berdasarkan pada Gambar 2.10, klasifikasi SVM dapat didefinisikan sebagai

usaha menemukan garis (hyperplane) yang memisahkan antara kedua class.

18

Hyperplane pemisah terbaik antara kedua class dapat ditemukan dengan

mengukur titik maksimal margin dari hyperplane. Margin adalah jarak antara

hyperplane dengan pattern terdekat dari masing-masing class. Pattern yang

paling dekat dengan hyperplane ini disebut sebagai support vector.

SVM tidak hanya dirancang untuk dapat menyelesaikan permasalahan linear,

tetapi juga permasalahan non-linear. Untuk menyelesaikan masalah non-linear

menggunakan SVM, data �̅� dipetakan oleh suatu fungsi ke ruang vektor yang

berdimensi lebih tinggi. Fungsi yang memetakan suatu permasalahan non-linear

ke dalam ruang ciri yang lebih tinggi disebut dengan fungsi kernel (Nugroho et

al, 2003).

19

III. METODOLOGI PENELITIAN

3.1 Waktu dan Tempat Pelaksanaan

Penelitian ini dilaksanakan pada periode semester ganjil tahun ajaran 2017/2018,

di Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam

Universitas Lampung.

3.2 Alat Pendukung

Pengerjaan penelitian ini menggunakan peralatan pendukung sebagai berikut.

a. Perangkat Keras (Hardware)

Perangkat keras yang digunakan dalam penelitian ini berupa laptop dengan

spesifikasi sebagai berikut.

- Processor : Intel®Core™ i3-5005U CPU @ 2.00GHz

- Installed RAM : 4,00 GB

- System Type : 64-bit operating system, x64-based processor

b. Perangkat Lunak (Software)

Perangkat lunak yang digunakan dalam penelitian ini adalah sebagai berikut.

- Sistem Operasi Windows 10 Home Single Language 64-bit

- Matlab R2016

20

3.3 Dataset

Dataset yang digunakan dalam penelitian ini bersumber dari Lampung

Handwitten Characters Datasets yang tersedia di http://patrec.cs.tu-

dortmund.de/cms/en/home/Resources/. Data primer dari dataset berupa 82 lembar

dokumen yang diperoleh dari 82 orang kontributor pada tahun 2010. Kontributor

tersebut ialah siswa-siswi SMK N 14 Bandar Lampung yang duduk di kelas 10

dan 11, berusia rata-rata 16 tahun, serta memiliki pengetahuan yang cukup untuk

menulis aksara Lampung (Junaidi, 2011).

Dataset Lampung Handwritten Characters terdiri dari beberapa file yaitu gambar

dokumen tulisan tangan asli (raw image), komponen gambar dalam bentuk

graycale, dan file anotasi citra aksara Lampung. Total dokumen raw image

adalah 82 file dengan format gambar ppm dan terletak pada direktori raw_images

dalam file dataset. Total komponen grayscale adalah 32140 file gambar yang

terdistribusi dalam 82 sub direktori dengan format gambar pgm dan terletak pada

direktori char_css dalam file dataset. Informasi pada file anotasi terdiri dari enam

kolom. Kolom pertama merupakan nama file dari komponen yang diekstraksi.

Kolom kedua sampai kelima merupakan koordinat bounding box dari komponen

pada dokumen raw image. Kolom keenam merupakan keterangan karakter yang

merupakan label aksara Lampung dengan 18 kelas.

http://patrec.cs.tu-dortmund.de/cms/en/home/Resources/


21

Image Acquisition

PreprocessingFeature

ExtractionClassification

3.4 Tahapan Penelitian

Penelitian ini terdiri dari beberapa tahapan. Tahapan-tahapan tersebut

ditunjukkan pada Gambar 3.1.

Gambar 3.1 Tahapan pengerjaan penelitian.

3.4.1 Image Acquisition

Image acquisition merupakan tahap awal untuk memperoleh data gambar

melalui kamera atau pemindai. Tahap image acquisition telah dilakukan

pada penelitian sebelumnya sehingga dalam penelitian ini digunakan

dataset Lampung Handwritten Characters yang tersedia pada

http://patrec.cs.tu-dortmund.de/cms/en/home/Resources/.

3.4.2 Preprocessing

Preprocessing dilakukan untuk mengolah data citra menjadi lebih

terstruktur dan sesuai dengan kriteria yang diperlukan sebagai input pada

tahap selanjutnya. Pada tahapan ini data citra aksara dinormalisasi ke

dalam ukuran yang sama kemudian dikonversi menjadi bentuk biner

sesuai dengan kebutuhan ekstraksi fitur chain code 8 direction dan

projection profile.


22

3.4.3 Feature Extraction

Feature Extraction atau ekstraksi fitur merupakan tahap yang bertujuan

untuk mengekstraksi ciri khusus dari sebuah karakter. Ciri tersebut dapat

dijadikan sebagai pembeda antara satu karakter dengan karakter lainnya.

Dalam penelitian ini digunakan fitur Chain Code 8-Direction dan

Projection Profile. Berikut merupakan detail proses dari masing-masing

ekstraksi fitur chain code 8 direction dan projection profile.

a. Chain Code 8 Direction

Chain Code 8-Direction yaitu kode rantai yang bergerak sepanjang

kurva digital atau batas piksel (contour image) yang berurutan

berdasarkan 8 konektivitas dengan arah tertentu. Arah dari setiap

gerakan dikodekan dengan menggunakan skema nomor

{i|i=0,1,2,…,7} yang menunjukkan arah kelipatan sudut 45 derajat

berlawanan arah jarum jam dari posisi sumbu X positif.

Langkah-langkah yang dilakukan pada tahap ekstraksi fitur chain

code 8-direction adalah sebagai berikut.

1. Membagi gambar karakter menjadi beberapa blok yang lebih

kecil. Pada penelitian ini citra biner aksara Lampung dengan

dimensi 32x32 dibagi menjadi 16 blok dengan masing-masing

blok berukuran 8x8 piksel. Ukuran blok 8x8 dipilih agar luas area

23

yang akan diidentifikasi menggunakan 8 kode arah tidak terlalu

sempit sehingga dapat meminimalisir resiko error.

Ilustrasi pembagian blok citra akasara Lampung “La” ditunjukkan

pada Gambar 3.2 berikut.

Gambar 3.2 Ilustrasi pembagian blok citra aksara “La”.

2. Mengidentifikasi starting point untuk masing-masing blok.

Starting point yaitu piksel foreground pertama yang diperoleh

dengan menelusuri baris dan kolom piksel. Setiap blok gambar

ditelusuri sepanjang perbatasan blok. Penelusuran pertama

dilakukan sepanjang tepi kiri blok mulai dari baris pertama sampai

baris ke-m pada kolom pertama, kemudian terus bergeser satu

kolom ke kanan sampai batas piksel terakhir blok gambar. Piksel

24

foreground pertama yang ditemukan itulah yang diidentifikasi

sebagai starting point.

Pencarian starting point pada salah satu blok aksara “La”

diilustrasikan dalam Gambar 3.3 berikut.

Gambar 3.3 Penelusuran starting point blok citra aksara “La”.

Pada ilustrasi di atas, pencarian starting point pada blok(1,4)

berhenti ketika ditemukan piksel foreground pertama pada baris

ke-8 kolom ke-2. Piksel ini kemudian akan menjadi titik awal

penelusuran kontur pada blok citra tersebut.

3. Mengidentifkasi arah piksel tetangga menggunakan 8 arah chain

code. Setelah starting point ditemukan, arah piksel tetangga yang

25

telah teridentifikasi ditandai dengan kode angka untuk

menghindari pengidentifikasian berulang. Identifikasi tersebut

dilakukan sepanjang kontur aksara pada blok sesuai pergerakan

arah jarum jam.

Nilai kode arah dan contoh penelusuran chain kode pada blok

aksara “La” diilustrasikan dalam Gambar 3.4 berikut.

Gambar 3.4 Nilai kode arah dan penelusuran chain code pada

salah satu blok aksara “La”.

4. Penelusuran suatu blok akan selesai ketika sudah kembali

mencapai starting point. Kemudian penelusuran dilanjutkan

dengan cara yang sama untuk setiap blok gambar hingga semua

blok teridentifikasi.

26

5. Hasil penelusuran kontur menggunakan chain code 8-direction ini

berupa urutan kode rantai pembentuk aksara. Urutan kode tersebut

memiliki ukuran panjang yang berbeda-beda pada setiap blok

tergantung konturnya masing-masing. Untuk mengatasi hal

tersebut dilakukan proses normalisasi dengan cara membagi nilai

frekuensi kemunculan setiap kode arah dengan total nilai

frekuensi semua kode arah pada suatu blok. Dengan demikian

masing-masing blok hanya akan memiliki delapan nilai yang

merupakan hasil normalisasi kode rantai.

6. Pada akhir proses, nilai-nilai yang diperoleh dari hasil normalisasi

kode rantai pada 16 blok digabungkan untuk membentuk satu

kesatuan fitur. Secara keseluruhan, panjang fitur yang dihasilkan

dari ekstraksi fitur chain code 8 direction ini adalah 8x16 atau

sama dengan 128 fitur.

b. Projection Profile

Projection Profile merupakan struktur data yang menyimpan jumlah

piksel foreground ketika diproyeksikan di atas sumbu normal XY.

Piksel foreground yaitu piksel yang menjadi latar depan suatu citra

atau piksel yang membentuk badan objek.

27

Dalam penelitian ini diterapkan dua orientasi proyeksi, yaitu orientasi

horizontal dan orientasi vertikal. Langkah-langkah yang dilakukan

pada tahap ekstraksi fitur projection profile adalah sebagai berikut.

1. Menelusuri piksel gambar dan menghitung piksel foreground.

Pada proyeksi horizontal, setiap baris piksel ditelusuri sepanjang

sumbu X dan jumlah piksel foreground dihitung perbarisnya.

Ilustrasi penelusuran jumlah piksel foreground pada proyeksi

horizontal citra aksara ‘La’ ditunjukkan pada Gambar 3.5 berikut.

Gambar 3.5 Penelusuran jumlah piksel foreground pada baris

citra aksara.

Penelusuran baris piksel foreground (piksel putih dalam Gambar

3.5) menghasilkan nilai yang beragam. Nilai-nilai yang diperoleh

berdasarkan penelusuran tersebut kemudian dinormalisasi ke

dalam range 0-1. Hal ini dilakukan agar ketika dipadukan dengan

28

fitur chain code 8 direction akan membentuk fitur gabungan yang

memiliki nilai setara yaitu bilangan desimal antara 0 dan 1. Proses

normalisasi dilakukan dengan cara membagi setiap nilai yang

diperoleh dari penelusuran baris dengan jumlah kolom citra yaitu

32.

Proyeksi horizontal dari citra aksara ‘La’ ditunjukkan pada

Gambar 3.6 berikut.

Gambar 3.6 Hasil projection profile citra aksara pada orientasi

horizontal.

Gambar 3.6 menunjukkan grafik yang merepresentasikan 32 data

fitur proyeksi horizontal dari citra aksara tersebut. Jumlah ini

sesuai dengan jumlah baris yang dimiliki oleh citra.

jum

lah p

ikse

l (n

orm

alis

asi)

baris ke-

29

Pada proyeksi vertikal, setiap kolom piksel ditelusuri sepanjang

sumbu Y dan jumlah piksel foreground dihitung perkolomnya.

Ilustrasi penelusuran jumlah piksel foreground pada proyeksi

vertikal citra aksara ‘La’ ditunjukkan pada Gambar 3.7 berikut.

Gambar 3.7 Penelusuran jumlah piksel foreground pada kolom

citra.

Penelusuran kolom piksel foreground (piksel putih dalam Gambar

3.7) menghasilkan nilai yang beragam. Nilai-nilai yang diperoleh

berdasarkan penelusuran tersebut kemudian dinormalisasi ke

dalam range 0-1. Hal ini dilakukan agar ketika dipadukan dengan

fitur chain code 8 direction akan membentuk fitur gabungan yang

memiliki nilai setara yaitu bilangan desimal antara 0 dan 1. Proses

normalisasi dilakukan dengan cara membagi setiap nilai yang

30

diperoleh dari penelusuran kolom dengan jumlah baris citra yaitu

32.

Proyeksi vertikal dari citra aksara ‘La’ ditunjukkan pada Gambar

3.8 berikut.

Gambar 3.8 Hasil projection profile citra aksara pada orientasi

vertikal.

Gambar 3.8 menunjukkan grafik yang merepresentasikan 32 data

fitur proyeksi vertikal dari citra aksara tersebut. Jumlah ini sesuai

dengan jumlah kolom yang dimiliki oleh citra.

Jum

lah p

ikse

l (n

orm

alis

asi)

kolom ke-

31

2. Menggabungkan kedua fitur proyeksi.

Proyeksi horizontal dan vertikal masing masing menghasilkan

fitur dengan panjang 32 fitur. Untuk menghasilkan satu kesatuan

fitur dari proses ekstraksi projection profile, maka dilakukan

penggabungan kedua fitur. Hasil akhir dari proses ini adalah fitur

dengan panjang 64 dengan urutan indeks ke 1 sampai dengan 32

merupakan fitur proyeksi horizontal dan indeks ke 33 sampai

dengan 64 merupakan fitur proyeksi vertikal.

3.4.4 Classification

Tahap classification bertujuan untuk mengelompokkan fitur-fitur yang

telah diekstraksi pada tahap sebelumnya ke dalam kelas-kelas yang

sesuai. Dalam penelitian ini digunakan metode klasifikasi Support Vector

Machine (SVM) dengan memanfaatkan tool LibSVM. Proses

klasifikasinya dilakukan berdasarkan masing-masing fitur. Tahapan yang

pertama merupakan klasifikasi hasil ekstraksi fitur chain code 8 direction.

Tahapan kedua yaitu klasifikasi hasil ekstraksi fitur projection profile,

dan tahapan ketiga merupakan klasifikasi fitur gabungan dari hasil

ekstraksi chain code 8 direction dan projection profile.

Tujuan dari ketiga tahap klasifikasi tersebut adalah untuk mengetahui

perbedaan antara hasil klasifikasi menggunakan jenis fitur tunggal dan

32

fitur gabungan. Hasil klasifikasi tersebut dapat dianalisis dan ditarik

kesimpulan yang menyatakan tingkat akurasi paling baik dari penggunaan

kedua fitur tersebut dalam mengenali tulisan tangan aksara Lampung.

70

V. SIMPULAN DAN SARAN

5.1 Simpulan

Kesimpulan yang diperoleh berdasarkan penelitian yang telah dilakukan adalah

sebagai berikut :

1. Ekstraksi fitur chain code 8 direction dan projection profile telah berhasil

diimplementasikan pada pengenalan karakter tulisan tangan Aksara

Lampung.

2. Penggunaan fitur chain code 8 direction dan projection profile sudah cukup

baik dalam pengenalan karakter tulisan tangan Aksara Lampung.

3. Akurasi tertinggi didapatkan pada penggunaan kernel linear LibSVM dengan

nilai mencapai 90,08% untuk fitur chain code 8 direction, 79,28% untuk fitur

projection profile, dan 94,00% untuk fitur gabungan.

4. Penggabungan fitur chain code 8 direction dan projection profile

menghasilkan peningkatan akurasi sebesar 4% dari akurasi tertinggi yang

diperoleh dari klasifikasi chain code 8 direction yaitu 90,08% menjadi

94,00%.

71

5.2 Saran

Saran yang dapat diberikan untuk penelitian selanjutnya adalah sebagai berikut :

1. Mengembangkan penelitian tentang pengenalan karakter tulisan tangan

Aksara Lampung dengan menggunakan metode ekstrakasi fitur lainnya

seperti Discrete Wavelet Transform, Gray Level Coocurence Matrix, dan

sebagainya.

2. Mengembangkan penelitian tentang pengenalan karakter tulisan tangan

Aksara Lampung dengan menggunakan metode klasifikasi lain seperti Naïve

Bayes, Decision Tree, dan sebagainya.

72

DAFTAR PUSTAKA

Cheriet, Mohamed et al. 2007. Character Recognition System: A Guide for Students

and Practioner. New Jersey: John Wiley&Sons Inc.

Choudary, Amit dan Vinod Kumar. 2017. Performance Evaluation of MLP and RBF

Classifiers for Handwritten Character Recognition Using Hybrid Features.

International Journal of Advanced Research in Computer Science, Volume 8, No.

7.

Javed, Dr. Mohammed; Nagabhushan, P; dan Chaudhuri, Bidyut. 2014. Extraction of

Projection Profile, Run-Histogram and Entropy Features Straight from Run-

Length Compressed Text-Documents. Proceedings - 2nd IAPR Asian Conference

on Pattern Recognition, ACPR.

Junaidi, Akmal. 2016. Lampung Handwritten Character Recognition. Disertasi.

Program Doktoral Dortmund University. Dortmund. German.

Junaidi, Akmal; Szilard Vajda; dan Gernot A. Fink. 2011. Lampung- A New

Handwritten Character Benchmark: Database, Labeling and Recognition.

Proceedings of International Workshop on Multilingual OCR, MOCR. Page 105-

112.

Khadir, Abdul dan Adhi Susanto. 2013. Teori dan Aplikasi Pengolahan Citra.

Yogyakarta: ANDI.

Nugroho, A.Satriyo et al. 2003. Support Vector Machine Teori dan Aplikasinya. Kuliah

Umum IlmuKomputer.com.

Putra, Darma. 2010. Pengolahan Citra Digital. Yogyakarta: ANDI.

73

Rajput, G.G dan S.M Mali. 2010. Marathi Handwritten Numeral Recognition using

Fourier Descriptors and Normalized Chain Code. International Journal of

Computer Application, Special Issue on “Recent Trends in Image Processing and

Pattern Recognition”.

Rao, N.Venkata et al. 2016. Optical Character Recognition Technique Algorithm.

Journal of Theoritical and Applied Information Technology, Volume 83, No.2.

Roberto, J. Rodrigues dan Antonio Carlos Gay Thomé. 2002. Cursive Character

Recognition – a Character Segmentation Method Using Projection Profile-Based

Technique. Brasil: Universidade Federal do Rio de Janeiro.

Shabbir, Safia dan Imran Siddiqi. 2016. Optical Character Recognition System for

Urdu Words in Nastaliq Font. International Journal of Advanced Computer

Science and Applications, Vol. 7, No. 5.

Sharma, Anisha; Soumil Khare; dan Sachin Chavan. 2017. A Review on Handwritten

Character Recognition. International Journal of Computer Science and

Technology, Volume 8, Issue 1.

Surinta, Olarik. 2016. Multi-Script Handwritten Character Recognition using Feature

Descriptors and Machine Learning. Tesis. University of Groningen, Thailand.

PENGENALAN KARAKTER TULISAN TANGAN AKSARA LAMPUNG ...digilib.unila.ac.id/32592/3/SKRIPSI TANPA BAB...

Documents

Transcript of PENGENALAN KARAKTER TULISAN TANGAN AKSARA LAMPUNG ...digilib.unila.ac.id/32592/3/SKRIPSI TANPA BAB...