PENGENALAN KARAKTER TULISAN TANGAN AKSARA LAMPUNG ...digilib.unila.ac.id/32592/3/SKRIPSI TANPA BAB...
Transcript of PENGENALAN KARAKTER TULISAN TANGAN AKSARA LAMPUNG ...digilib.unila.ac.id/32592/3/SKRIPSI TANPA BAB...
i
PENGENALAN KARAKTER TULISAN TANGAN AKSARA LAMPUNG
MENGGUNAKAN EKSTRAKSI FITUR CHAIN CODE 8 DIRECTION
DAN PROJECTION PROFILE
(Skripsi)
Oleh
TRI LESTARI
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDARLAMPUNG
2018
ii
ABSTRACT
RECOGNITION OF HANDWRITTEN CHARACTER LAMPUNG SCRIPT
BY USING CHAIN CODE 8 DIRECTION AND PROJECTION PROFILE
FEATURE EXTRACTION
By
TRI LESTARI
Lampung script is one of the cultural heritages in the form of writing character
owned by Lampung society. The basic character consists of 20 characters with various
shapes. As the times progressed, the knowledge of the Lampung script increasingly
faded out. One of the efforts to preserve the script is by conducting research on the
recognition of Lampung script characters. This research is a continuation of previous
research on the recognition of handwritten characters of Lampung script. This research
is evolved from the previous research in terms of the use of features for character
recognition. The features used are chain code 8 direction, projection profile and the
combination of both. The number of characters in the dataset is 32140 files with
grayscale image format. The dataset is divided into three groups of data that are
training, validation, and testing. As classification tool, this research used LibSVM
(Library Support Vector Machine). The accuracy obtained on the use of chain code 8
iii
direction feature reached 90.08%, while the use of projection profile feature reached
the accuracy of 79.28%. Merging the two features results the highest accuracy with 4%
increasing number from the use of chain code 8 direction feature becoming 94.00%.
Keywords: chain code 8 direction, feature, handwriten character recognition,
Lampung script, projection profile.
iv
ABSTRAK
PENGENALAN KARAKTER TULISAN TANGAN AKSARA LAMPUNG
MENGGUNAKAN EKSTRAKSI FITUR CHAIN CODE 8 DIRECTION
DAN PROJECTION PROFILE
Oleh
TRI LESTARI
Aksara Lampung merupakan salah satu warisan budaya berupa karakter tulisan
yang dimiliki oleh masyarakat Lampung. Aksara dasar terdiri dari 20 karakter dengan
bentuk yang beragam. Seiring perkembangan zaman, pengetahuan akan Aksara
Lampung semakin tergerus. Salah satu upaya untuk melestarikan aksara tersebut adalah
dengan melakukan penelitian tentang pengenalan karakter Aksara Lampung. Penelitian
ini merupakan lanjutan dari penelitian sebelumnya tentang pengenalan karakter tulisan
tangan Aksara Lampung. Pengembangan dilakukan dari segi penggunaan fitur untuk
pengenalan karakter aksara. Fitur-fitur yang digunakan adalah chain code 8 direction,
projection profile dan gabungan keduanya. Jumlah karakter pada dataset secara
keseluruhan sebanyak 32140 file dengan format grayscale image. Dataset tersebut
terbagi menjadi tiga kelompok data yaitu training, validation, dan testing. Sebagai alat
klasifikasi digunakan LibSVM (Library Support Vector Machine). Akurasi yang
v
diperoleh pada penggunaan fitur chain code 8 direction sebesar 90,08%, sedangkan
penggunaan fitur projection profile menghasilkan akurasi sebesar 79,28%.
Penggabungan kedua fitur memberikan hasil akurasi tertinggi dengan peningkatan 4%
dari penggunaan fitur chain code 8 direction menjadi 94,00%.
Kata kunci : aksara Lampung, chain code 8 direction, fitur, pengenalan karakter
tulisan tangan, projection profile.
vi
PENGENALAN KARAKTER TULISAN TANGAN AKSARA LAMPUNG
MENGGUNAKAN EKSTRAKSI FITUR CHAIN CODE 8 DIRECTION
DAN PROJECTION PROFILE
Oleh
TRI LESTARI
Skripsi
Sebagai Salah Satu Syarat untuk Memperoleh Gelar
SARJANA KOMPUTER
Pada
Jurusan Ilmu Komputer
Fakultas Matematika dan Ilmu Pengetahuan Alam
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2018
x
RIWAYAT HIDUP
Penulis dilahirkan pada tanggal 18 Oktober 1995 di Pringsewu,
dengan Ibu bernama Rumaeti dan Ayah bernama Aripin. Penulis
menyelesaikan pendidikan formal pertama kali di Taman Kanak-
kanak (TK) Aisyiyah 1 Pringsewu pada tahun 2002, menyelesaikan
Sekolah Dasar (SD) di SD Muhammadiyah Pringsewu pada tahun
2008, menyelesaikan Sekolah Menengah Pertama (SMP) di SMP Negeri 1 Pringsewu
pada tahun 2011, kemudian melanjutkan jenjang Sekolah Menengah Atas (SMA) di
SMA Negeri 1 Pringsewu dengan mengambil jurusan Ilmu Pengetahuan Alam (IPA)
dan lulus pada tahun 2014.
Pada tahun 2014, penulisan terdaftar sebagai mahasiswa Jurusan Ilmu Komputer
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung melalui jalur
SBMPTN. Selama menjadi mahasiswa, penulis pernah bergabung dalam Lembaga Pers
Mahasiswa (LPM) Natural (2014) serta menjadi anggota Badan Khusus (2014) dan
Biro Kewirausahaan (2016) Himpunan Mahasiswa Ilmu Komputer (HIMAKOM).
Penulis pernah menjadi asisten praktikum untuk matakuliah Algoritma dan
Pemrograman, Sistem Operasi, Grafika Komputer, dan Basis Data (2015-2017). Bulan
Januari – Februari 2017, penulis melakukan kerja praktik di PT Adira Dinamika Multi
Finance RO Pringsewu dengan penempatan pada Divisi Operation. Bulan Juli –
xi
Agustus 2017, penulis melakukan Kuliah Kerja Nyata (KKN) di Desa Banjarmasin,
Kecamatan Penengahan, Kabupaten Lampung Selatan.
xii
PERSEMBAHAN
Puji dan syukur kepada Allah SWT atas segala limpahan berkah-Nya sehingga
skripsi ini dapat terselesaikan dengan tepat waktu.
Teruntuk kedua orang tua tercinta Bapak Aripin dan Ibu Rumaeti yang senantiasa
mengiringi langkah ini dengan do’a dan segala jerih payah demi tercapai segala
harapan dan cita-citaku.
Kakak tersayang Mohamad Ady Darmawan, panutanku.
Keluarga Ilmu Komputer 2014.
Serta Almamater tercinta,
Universitas Lampung.
xiii
MOTTO
xiv
SANWACANA
Alhamdulillahirobbil ‘alamin.
Puji syukur kehadirat Allah SWT, atas limpahan rahmat dan karunia-Nya penulis dapat
menyelesaikan penulisan skripsi yang berjudul “Pengenalan Karakter Tulisan Tangan
Aksara Lampung Menggunakan Ekstraksi Fitur Chain Code 8 Direction dan
Projection Profile” dengan baik. Terselesaikannya laporan ini tidak terlepas dari
bantuan banyak pihak, sehingga pada kesempatan ini dengan ketulusan hati dan penuh
rasa hormat penulis menghaturkan terimakasih kepada semua pihak yang telah
membantu dan berperan besar dalam proses penyusunan skripsi ini. Ungkapan
terimakasih penulis haturkan kepada :
1. Kedua orangtua tercinta, sumber motivasi terbesar, Bapak Aripin dan Ibu
Rumaeti yang selalu memberikan do’a, kasih sayang, dukungan, dan semangat
yang tak terhingga serta memfasilitasi segala kebutuhan dalam menyelesaikan
skripsi ini.
2. Kakak tersayang, Mohamad Ady Darmawan yang telah memberikan banyak
hal sehingga menjadi motivasi tersendiri dalam menjalani perkuliahan dan
menyelesaikannya dengan baik.
3. Bapak Dr.rer.nat.Akmal Junaidi, M.Sc sebagai pembimbing utama yang telah
memberikan tema penelitian, membimbing, memotivasi serta memberikan
xv
kritik dan saran selama masa perkuliahan dan penyusunan skripsi sehingga
penulis dapat sampai di tahap ini.
4. Bapak Ardiansyah, M.Kom sebagai pembimbing kedua yang telah
membimbing dan memberikan bantuan, ide, kritik serta saran dalam
penyusunan skripsi ini.
5. Bapak Didik Kurniwan, M.T sebagai pembahas, yang telah memberikan kritik
dan saran yang bermanfaat untuk perbaikan dalam penyusunan skripsi ini.
6. Bapak Prof. Warsito, S.Si., D.E.A., Ph.D selaku Dekan FMIPA Universitas
Lampung.
7. Bapak Dr. Ir. Kurnia Muludi, M.S.Sc., selaku Ketua Jurusan Ilmu Komputer
FMIPA Universitas Lampung.
8. Bapak Didik Kurniawan, M.T selaku Sekretaris Jurusan Ilmu Komputer
FMIPA Universitas Lampung.
9. Bapak Rico Andrian, S.Si., M.Kom selaku Pembimbing Akademik.
10. Bapak dan Ibu Dosen Jurusan Ilmu Komputer yang telah memberikan ilmu dan
pengalaman yang luar biasa kepada penulis selama menjadi mahasiswa.
11. Ibu Nora Ade Maela selaku Staff Administratif Jurusan Ilmu Komputer.
12. Tersetiaku Fitrianingsih, Wini Nur Handayani, Clara Viony Septiana yang
selalu menampung keluh kesah dan memberikan semangat.
13. Keluarga seatap, Desi, Paul, Laras, Sesa, Dina, Puput, Anis, Matsna, Dedew
yang selalu membagikan kerecehan-kerecehan sebagai hiburan di sela
kepenatan dalam menyusun skripsi.
xvi
14. Noni Kurniasih, Syifa Trianingsih, Maria Regina Caeli, Nuha Hanifah, Devi
Ranita yang telah menjadi partner sharing terbaik.
15. Keluarga Ilmu Komputer 2014 yang tidak bisa disebutkan satu per satu, terima
kasih banyak atas kebersamaannya.
16. Almamater tercinta, Universitas Lampung.
Penulis menyadari bahwa skripsi ini masih jauh dari kesempurnaan, akan tetapi besar
harapan semoga skripsi ini dapat bermanfaat bagi perkembangan ilmu pengetahuan
terutama bagi teman-teman Ilmu Komputer serta semua pihak yang membacanya.
Bandar Lampung, 30 Juli 2018
Tri Lestari
xvii
DAFTAR ISI
Halaman
DAFTAR ISI ............................................................................................................ xvii
DAFTAR GAMBAR ................................................................................................ xix
DAFTAR TABEL .................................................................................................... xxi
I. PENDAHULUAN ................................................................................................ 1
1.1 Latar Belakang .............................................................................................. 1
1.2 Rumusan Masalah......................................................................................... 3
1.3 Batasan Masalah ........................................................................................... 3
1.4 Tujuan Penelitian .......................................................................................... 4
1.5 Manfaat Penelitian ........................................................................................ 4
II. TINJAUAN PUSTAKA ...................................................................................... 5
2.1 Aksara Lampung........................................................................................... 5
2.2 Character Recognition ................................................................................. 9
2.3 Fitur ............................................................................................................ 11
2.4 Chain Code 8-Direction ............................................................................. 12
2.5 Projection Profile ....................................................................................... 15
2.6 Support Vector Machine ............................................................................. 17
III. METODOLOGI PENELITIAN ..................................................................... 19
3.1 Waktu dan Tempat Pelaksanaan ................................................................. 19
3.2 Alat Pendukung .......................................................................................... 19
3.3 Dataset ........................................................................................................ 20
3.4 Tahapan Penelitian ..................................................................................... 21
3.4.1 Image Acquisition ........................................................................... 21
3.4.2 Preprocessing ................................................................................. 21
3.4.3 Feature Extraction .......................................................................... 22
xviii
3.4.4 Classification .................................................................................. 31
IV. HASIL DAN PEMBAHASAN ......................................................................... 33
4.1 Preprocessing ............................................................................................. 33
4.2 Pembagian Dataset ..................................................................................... 34
4.3 Connected Component ................................................................................. 35
4.4 Ekstraksi Fitur............................................................................................. 36
4.4.1 Ekstraksi Fitur Chain Code 8-Direction ......................................... 37
4.4.2 Ekstraksi Fitur Projection Profile................................................... 41
4.4.3 Ekstraksi Fitur Gabungan ............................................................... 43
4.5 Klasifikasi Fitur .......................................................................................... 44
4.6 Analisis Kesalahan Klasifikasi ................................................................... 50
4.6.1 Kesalahan Klasifikasi Fitur Chain Code 8 Direction ..................... 51
4.6.2 Kesalahan Klasifikasi Fitur Projection Profile .............................. 57
4.6.3 Kesalahan Klasifikasi Fitur Gabungan ........................................... 63
V. SIMPULAN DAN SARAN ................................................................................ 70
5.1 Simpulan ..................................................................................................... 70
5.2 Saran ........................................................................................................... 71
DAFTAR PUSTAKA ................................................................................................ 72
LAMPIRAN ............................................................................................................... 74
xix
DAFTAR GAMBAR
Halaman
Gambar 2.1 Karakter dasar aksara Lampung ................................................................ 5
Gambar 2.2 Karakter diakritik aksara Lampung ........................................................... 6
Gambar 2.3 Karakter diakritik atas ............................................................................... 6
Gambar 2.4 Karakter diakritik bawah ........................................................................... 7
Gambar 2.5 Karakter diakritik kanan ............................................................................ 7
Gambar 2.6 Tanda baca aksara Lampung ..................................................................... 8
Gambar 2.7 Arah dan kode nilai chain code 8 direction ............................................ 12
Gambar 2.8 Representasi chain code 8 direction........................................................ 13
Gambar 2.9 Proyeksi horizontal dan vertikal karakter ligatur Urdu ........................... 16
Gambar 2.10 Konsep Support Vector Machine .......................................................... 17
Gambar 3.1 Tahapan pengerjaan penelitian ................................................................ 21
Gambar 3.2 Ilustrasi pembagian blok citra aksara La ................................................. 23
Gambar 3.3 Penelusuran starting point blok citra aksara La ...................................... 24
Gambar 3.4 Nilai kode arah dan penelusuran chain code pada blok aksara La .......... 25
Gambar 3.5 Penelusuran jumlah piksel foreground pada baris citra aksara ............... 27
Gambar 3.6 Hasil projection profile citra aksara pada orientasi horizontal ............... 28
Gambar 3.7 Penelusuran jumlah piksel foreground pada kolom citra ........................ 29
Gambar 3.8 Hasil projection profile pada orientasi vertikal ....................................... 30
xx
Gambar 4.1 Hasil normalisasi ukuran dan binerisasi citra aksara La ......................... 33
Gambar 4.2 Contoh komponen-komponen terpisah pada (a) karakter Pa,
(b) karakter Nya, (c) karakter Nya ........................................................... 35
Gambar 4.3 Pembagian blok citra karakter aksara La ................................................ 37
Gambar 4.4 Output hasil ekstraksi fitur chain code 8 direction ................................. 40
Gambar 4.5 Output hasil ekstraksi fitur projection profile ......................................... 43
Gambar 4.6 Output hasil ekstraksi fitur gabungan chain code 8 direction dan
projection profile ..................................................................................... 44
Gambar 4.7 Perbedaan (a) aksara La dan (b) aksara A ............................................... 52
Gambar 4.8 Sampel kesalahan (a)garis bantu terlalu pendek, (b)garis bantu terlalu
rapat dengan badan karakter ................................................................... 53
Gambar 4.9 Sampel kesalahan (a) garis tengah terlalu menjorok ke kiri, (b) garis
tengah terlalu panjang .............................................................................. 55
Gambar 4.10 Kesamaan jumlah garis (a) aksara Nya dan (b) aksara A ..................... 58
Gambar 4.11 Sampel kesalahan posisi titik puncak kurva aksara Nya ....................... 61
Gambar 4.12 Kemiripan bentuk dasar (a) aksara Da dan (b) aksara Ga ..................... 64
Gambar 4.13 Kesalahan bentuk dan posisi garis vertikal aksara Da .......................... 65
xxi
DAFTAR TABEL
Halaman
Tabel 4.1 Rincian pembagian kelompok dataset......................................................... 34
Tabel 4.2 Sampel hasil ekstraksi fitur chain code 8 direction .................................... 38
Tabel 4.3 Sampel hasil ekstraksi fitur projection profile ............................................ 41
Tabel 4.4 Persentase akurasi pengujian data validation dan data testing ................... 48
Tabel 4.5 Confusion matrix fitur chain code 8 direction ............................................ 49
Tabel 4.6 Confusion matrix fitur projection profile .................................................... 49
Tabel 4.7 Confusion matrix fitur gabungan chain code 8 direction dan projection
profile........................................................................................................... 50
Tabel 4.8 Hasil ekstraksi fitur aksara A dan La pada blok (4,2) ................................. 54
Tabel 4.9 Hasil ekstraksi fitur aksara La dan A pada blok (4,2) ................................. 56
Tabel 4.10 Hasil ekstraksi fitur proyeksi vertikal aksara Nya dan A .......................... 59
Tabel 4.11 Hasil ekstraksi fitur proyeksi horizontal aksara Nya dan A ...................... 62
Tabel 4.12 Hasil ekstraksi fitur aksara Da dan Ga pada blok (1,4) ............................ 66
Tabel 4.13 Hasil ekstraksi fitur proyeksi horizontal aksara Da dan Ga ...................... 66
Tabel 4.14 Hasil ekstraksi fitur proyeksi vertikal aksara Da dan Ga .......................... 67
1
I. PENDAHULUAN
1.1 Latar Belakang
Indonesia merupakan negara yang kaya akan warisan budaya. Salah satu warisan
tersebut adalah bahasa daerah. Sejak zaman dahulu para nenek moyang telah
menggunakan bahasa daerah sebagai sarana komunikasi antar sesamanya baik
melalui lisan maupun tulisan. Untuk berkomunikasi melalui tulisan biasanya
mereka menggunakan simbol-simbol tertentu yang kemudian menjadi ciri khas
dari daerah tempat asalnya. Namun di Indonesia sendiri tidak semua daerah
memiliki warisan budaya tersebut sehingga sudah sepatutnya hal itu dapat dijaga
dan dilestarikan.
Lampung merupakan salah satu daerah yang memiliki warisan budaya berupa
simbol-simbol khusus yang digunakan untuk berkomunikasi melalui tulisan atau
disebut juga aksara. Aksara Lampung telah banyak ditemukan dibeberapa
dokumen kuno yang kini tersimpan di museum. Namun seiring perkembangan
zaman dan melihat kenyataan bahwa saat ini di wilayah Lampung tidak hanya
ditinggali oleh masyarakat asli suku Lampung, tetapi juga dihuni oleh suku-suku
lainnya sehingga menyebabkan pengetahuan akan aksara Lampung semakin lama
2
semakin tergerus. Apabila hal itu dibiarkan terus menerus maka bukan tidak
mungkin suatu saat nanti warisan budaya tersebut akan hilang termakan zaman.
Salah satu upaya yang dilakukan untuk menjaga kelestarian aksara Lampung
yaitu dengan melakukan penelitian berupa pemanfaatan teknologi komputer
untuk mengembangkan sistem yang dapat mengenali masukan gambar berupa
tulisan tangan aksara Lampung. Bidang ilmu yang membahas hal tersebut adalah
pengenalan pola, khususnya pengenalan pola tulisan tangan atau disebut juga
Handwritten Character Recognition. Salah satu tahapan penting yang terdapat
dalam proses pengenalan pola tulisan tangan adalah feature extraction. Tahapan
ini bertujuan untuk mengekstrak ciri khusus dari suatu karakter sehingga dapat
dijadikan sebagai pembeda dengan karakter lain.
Penelitian ini merupakan pengembangan dari penelitian yang telah dilakukan
sebelumnya oleh Akmal Junaidi tahun 2016 dengan judul Lampung Handwritten
Character Recognition. Penelitian tersebut telah menggunakan fitur-fitur seperti
branch point, end point, pixel density, water reservoir, dan chain code 4
direction. Namun masih banyak lagi fitur-fitur lainnya yang sangat berpotensi
untuk digunakan sebagai karakteristik dalam mengenali aksara Lampung. Oleh
karena itu, dalam penelitian ini akan diaplikasikan fitur-fitur lainnya seperti chain
code 8 direction dan projection profile untuk mengenali aksara tersebut.
3
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah dipaparkan, masalah pokok yang perlu
diselesaikan dan menjadi dasar dalam pengerjaan skripsi ini sebagai berikut.
1. Bagaimana cara mengekstraksi fitur chain code 8 direction dan projection
profile untuk mengenali tulisan tangan Aksara Lampung.
2. Bagaimana tingkat akurasi penggunaaan fitur chain code 8 direction dan
projection profile dalam pengenalan tulisan tangan aksara Lampung.
1.3 Batasan Masalah
Dalam penelitian ini diberikan pembatasan masalah diantaranya sebagai berikut.
1. Penelitian ini melanjutkan penelitian sebelumnya dengan cara memperluas
fitur yang telah digunakan.
2. Penelitian ini hanya menggunakan fitur chain code 8 direction dan projection
profile.
3. Dataset yang diolah dalam penelitian ini merupakan hasil pemrosesan gambar
tulisan tangan aksara Lampung dari penelitian sebelumnya.
4. Proses klasifikasi aksara Lampung menggunakan pendekatan SVM (Support
Vector Machine) dengan memanfaatkan tools pada LibSVM.
4
1.4 Tujuan Penelitian
Tujuan dari penelitian ini adalah mengeksplorasi, mengkaji, dan menganalisis
fitur chain code 8 direction dan projection profile untuk mengenali tulisan tangan
aksara Lampung serta mengklasifikasikannya ke dalam jenis aksara yang sesuai
menggunakan SVM (Support Vector Machine). Hasil klasifikasi tersebut
kemudian akan dievaluasi terhadap ground truth sehingga dapat diketahui tingkat
akurasinya.
1.5 Manfaat Penelitian
Manfaat yang diperoleh dari penelitian ini adalah sebagai berikut.
1. Manfaat Praktis
a) Mengembangkan penggunaan fitur-fitur dalam pengenalan pola tulisan
tangan aksara Lampung dengan menerapkan fitur chain code 8 direction
dan projection profile.
b) Mengetahui tingkat akurasi penggunaan fitur chain code 8 direction dan
projection profile dalam mengenali tulisan tangan aksara Lampung.
2. Manfaat Akademis
a) Mengaplikasikan ilmu yang telah dipelajari selama masa perkuliahan.
b) Sebagai acuan untuk penelitian atau pengembangan sistem yang terkait
dengan pengenalan tulisan tangan aksara Lampung.
5
II. TINJAUAN PUSTAKA
2.1 Aksara Lampung
Aksara Lampung berasal dari kelompok aksara Brahmi, yaitu aksara kuno yang
berasal dari wilayah India Selatan. Aksara Lampung hanya terdiri dari 20 karakter
dasar. Bentuk utama semua karakter adalah lengkungan atau kurva. Lebih
tepatnya setiap karakter mengandung setidaknya satu kurva yang bisa menghadap
ke atas dan/atau ke bawah. Bentuk-bentuk karakter dasar aksara Lampung
ditunjukkan pada Gambar 2.1 berikut.
Gambar 2.1 Karakter dasar aksara Lampung (Junaidi, 2016).
Setiap karakter dasar dalam aksara Lampung dibaca dengan komposisi bunyi
yang dihasilkan dari huruf konsonan dengan akhiran huruf vokal “a”. Dalam
penulisan setiap kata-kata tidak selalu berakhiran “a”, tetapi juga sering
digunakan huruf vokal lain. Untuk mengubah bunyi huruf vokal yang melekat
pada karakter dasar menjadi huruf vokal lain seperti i, u, e, dan o, sistem aksara
6
Lampung menggunakan diakritik (anak huruf). Bentuk-bentuk karakter diakritik
aksara Lampung ditunjukkan pada Gambar 2.2 berikut.
Gambar 2.2 Karakter diakritik aksara Lampung (Junaidi, 2016).
Karakter diaktritik aksara Lampung dapat dikelompokkan berdasarkan posisi
penulisannya terhadap karakter dasar. Kelompok karakter tersebut adalah
diakritik atas, diakritik bawah, dan diakritik kanan. Berikut merupakan
penjelasan dari ketiga kelompok tersebut.
1. Diakritik Atas
Diakritik atas terdiri dari enam karakter yang memiliki nama atau istilah
masing-masing. Keenam karakter diakritik tersebut ditunjukkan pada
Gambar 2.3 berikut.
Gambar 2.3 Karakter diakritik atas (Junaidi, 2016).
Diakritik ulan é dan bicek dapat menggantikan huruf vokal yang melekat pada
karakter dasar menjadi huruf vokal e. Perbedaan keduanya dapat terlihat dari
segi pengucapan misalnya ulan untuk pengucapan kata “absen” dan bicek
untuk pengucapan kata “pegawai”. Diakritik ulan i menggantikan huruf vokal
yang melekat pada karakter dasar menjadi huruf vokal i. Diakritik tekelubang,
datas, dan rejunjung dapat menimpa huruf vokal yang melekat pada aksara
7
dasar dan menambahkan ekspansi huruf konsonan “ng”, “n”, dan “r” di akhir
vokal.
2. Diakritik Bawah
Diakritik bawah terdiri dari tiga karakter dengan nama atau istilah masing-
masing. Bentuk ketiga karakter tersebut ditunjukkan pada Gambar 2.4.
Gambar 2.4 Karakter diakritik bawah (Junaidi, 2016).
Diakritik bitan u menggantikan huruf vokal yang melekat pada karakter dasar
menjadi huruf vokal u. Diakritik ulan o menggantikan huruf vokal yang
melekat pada karakter dasar menjadi huruf vokal o. Diakritik tekelungau
mengubah huruf vokal yang melekat pada karakter dasar menjadi gabungan
dua huruf vokal yang disebut diftong “au”.
3. Diakritik Kanan
Diakritik kanan terdiri dari tiga karakter dengan nama atau istilah yang
berbeda. Bentuk dari masing-masing karakter diakritik tersebut ditunjukkan
pada Gambar 2.5 berikut.
Gambar 2.5 Karakter diakritik kanan (Junaidi, 2016).
8
Diakritik tekelingai merupakan diftong yang merubah huruf vokal pada
karakter dasar menjadi dua huruf vokal “ai”. Diakritik keleniah dapat
menimpa huruf vokal yang melekat pada aksara dasar dan menambahkan
ekspansi huruf konsonan “h” di akhir vokal. Diakritik nengen digunakan
untuk membungkam huruf vokal (vocal silencer) yang melekat pada karakter
dasar sehingga bagian yang tersisa hanyalah konsonan dari karakter dasar.
Selain karakter dasar dan diakritik, dalam sistem penulisan aksara Lampung
juga menggunakan tanda baca. Jumlah tanda baca yang terdapat pada aksara
Lampung sebanyak lima tanda baca. Bentuk-bentuk kelima tanda baca
tersebut ditunjukkan pada Gambar 2.6 berikut.
Gambar 2.6 Tanda baca aksara Lampung (Junaidi, 2016).
Berikut merupakan penjelasan dari kelima tanda baca tersebut.
1. Ngemula
Ngemula merupakan simbol unik berbentuk seperti matahari. Fungsinya
adalah untuk memulai sebuah kalimat.
2. Beradu
Fungsi tanda beradu berlawanan dari tanda ngemula. Tanda ini diletakkan
di akhir kalimat untuk menyelesaikannya.
9
3. Kuma
Sebagai tanda baca, kuma digunakan untuk menjeda kalimat atau untuk
memisahkan elemen dalam serangkaian (tiga atau lebih) hal dalam satu
kalimat.
4. Ngulih
Tanda ngulih diletakkan di akhir kalimat sebagai tanda baca dalam
kalimat yang berisi pertanyaan tentang sesuatu.
5. Tanda Seru
Tanda seru adalah tanda baca untuk menyatakan bahwa kalimat
mengandung perintah atau pernyataan tegas (Junaidi, 2016).
2.2 Character Recognition
Character Recognition merupakan proses mendeteksi dan mengenali karakter
dari suatu input gambar. Terdapat dua macam Character Recognition, yaitu
Offline dan Online Character Recognition. Sistem offline mengolah data atau
dokumen yang sebelumnya memerlukan proses digitalisasi untuk menjadi file
gambar digital agar dapat dibaca oleh komputer. Sedangkan sistem online
mengolah data atau dokumen yang dibuat langsung menggunakan perangkat
digital sehingga dapat diproses seketika itu juga. Berdasarkan metode
penulisannya, terdapat jenis pengenalan karakter dengan input berupa tulisan
tangan yang disebut Handwritten Character Recognition (HCR) dan input berupa
aksara cetak atau printed character recognition. Akurasi pada HCR biasanya
10
masih rendah dikarenakan besarnya perbedaan bentuk dan tipe tulisan dari setiap
individu (Rao et al, 2016).
Proses character recognition terdiri dari beberapa fase. Urutan fase-fase tersebut
adalah sebagai berikut.
1. Image Acquisition
Image Acquisition adalah tahap pertama dalam character recognition. Ini
adalah metode untuk mendapatkan gambar melalui kamera atau pemindai.
Gambar didapat dalam bentuk format file yang ditentukan, misalnya JPEG
atau PNG.
2. Pre-Processing
Tahap preprocessing melibatkan berbagai tahap operasi untuk meningkatkan
kualitas citra agar dapat diproses lebih lanjut. Preprocessing melibatkan
pengurangan noise, binerisasi, deteksi tepi dan thresholding.
3. Segmentation
Keakuratan pengenalan karakter yang berhasil tergantung pada keakuratan
segmentasi yang dilakukan. Tujuan segmentasi adalah membagi serangkaian
karakter menjadi karakter-karakter yang terpisah.
11
4. Feature Extraction
Feature Extraction merupakan metode pengambilan data material penting
dari konten data mentah untuk memaksimalkan tingkat pengenalan karakter.
Data material penting yang dimaksud adalah representasi karakter yang
akurat dan efisien. Ekstraksi fitur tidak hanya merupakan fase penting dalam
pengenalan karakter tetapi juga pada aplikasi pengenalan pola apapun.
5. Classification and Recognition
Pada fase ini ketika input gambar dimasukkan ke dalam sistem pengenalan
karakter, semua fitur penting akan dimasukkan ke classifier yang sudah
terlatih. Perbandingan fitur input dengan pola tersimpan kemudian dilakukan
untuk menemukan pencocokan kelas yang sesuai dengan input gambar
(Sharma et al, 2017).
2.3 Fitur
Fitur atau atribut merupakan karakteristik pembeda dari suatu objek yang
diperoleh melalui pengukuran dan dapat berupa simbol, numerik, atau kedua-
duanya. Fitur dapat direpresentasikan dalam bentuk variabel kontinu, diskret,
atau diskret biner. Untuk memperoleh fitur dapat menggunakan berbagai metode
pencarian fitur atau disebut juga metode ekstraksi fitur (Putra, 2010).
12
Metode ekstraksi fitur digunakan untuk melakukan pengukuran atribut pola yang
paling sesuai dengan kriteria klasifikasi yang diberikan. Pemilihan metode
ekstraksi yang tepat sangat memungkinkan untuk menemukan subset fitur yang
cocok dengan kriteria klasifikasi sehingga dapat memaksimalkan keefektifan
pengenalan pola karakter dan atau memaksimalkan efisiensi proses dengan cara
meminimalkan jumlah fitur (Cheriet et al, 2007).
2.4 Chain Code 8-Direction
Chain code atau kode rantai yang pertama kali diperkenalkan oleh Freeman pada
tahun 1961 merupakan representasi kontur yang dilakukan dengan menggunakan
pendekatan delapan ketetanggaan (Kadir dan Susanto, 2013). Kode rantai setiap
tetangga piksel dinyatakan dengan sebuah angka 0 sampai dengan 7 seperti
ditunjukkan pada Gambar 2.7 berikut.
Gambar 2.7 Arah dan kode nilai chain code 8 direction (Putra, 2010).
13
Chain code 8-direction dapat digunakan untuk melakukan penelusuran piksel
objek sesuai dengan delapan arah mata angin. Dengan demikian struktur
pembentuk dari suatu objek dapat direpresentasikan menggunakan chain code.
Representasi kontur suatu objek menggunakan chain code 8-direction dari suatu
citra ditunjukkan pada Gambar 2.8.
Gambar 2.8 Representasi chain code 8 direction (Rajput dan Mali, 2010).
Gambar 2.8 menunjukkan representasi kontur suatu objek menggunakan chain
code 8-direction. Hasil penelusuran chain code dari objek tersebut berupa
urutan kode rantai dengan panjang 15 fitur. Panjang kode rantai untuk setiap
objek memiliki ukuran yang berbeda satu sama lain tergantung pada bentuk dan
ukuran kontur masing-masing objek yang ditelusuri. Proses normalisasi
dibutuhkan untuk menghasilkan kesamaan panjang fitur antar karakter yang
akan diklasifikasi.
14
Persamaan yang digunakan untuk menormalisasi fitur chain code 8 direction
direpresentasikan sebagai berikut (Rajput dan Mali, 2010).
𝑉 =𝑉𝑖
|𝑉1| dimana |𝑉1| = ∑ 𝑉𝑖
7𝑖=0 (2.1)
Keterangan :
𝑖 = kode arah 0,1,2,…, 7
Vi = Frekuensi kemunculan kode arah-i
V1 = Total jumlah frekuensi kemunculan semua kode arah
Nilai-nilai yang diperoleh menggunakan persamaan 2.1 dihimpun dalam variabel
V sehingga membentuk sekumpulan nilai fitur. Fitur inilah yang kemudian dapat
dijadikan sebagai pembeda antar objek.
Efektifitas penggunaan fitur chain code dalam pengenalan suatu karakter dapat
ditingkatkan dengan cara melakukan ekstraksi fitur per-area yang lebih spesifik.
Caranya adalah dengan membagi gambar karakter terlebih dahalu ke dalam
beberapa blok yang lebih kecil dengan ukuran NxN, kemudian menjalankan
proses ekstraksi fitur pada setiap blok, lalu pada akhir proses semua fitur yang
diperoleh dari masing-masing blok digabungkan sehingga membentuk satu
kesatuan fitur (Surinta, 2016).
15
2.5 Projection Profile
Projection Profile merupakan struktur data yang digunakan untuk menyimpan
jumlah piksel foreground ketika gambar diproyeksikan di atas sumbu normal XY
(Roberto et al, 2002). Projection profile dapat dilihat dalam orientasi vertikal dan
horizontal. Proyeksi vertikal ditemukan dengan menelusuri gambar karakter
sepanjang sumbu Y dan menghitung jumlah piksel foreground pada setiap
kolomnya. Misalkan untuk gambar karakter dengan ukuran baris 15 piksel dan
kolom 12 piksel maka fitur proyeksi vertikal memiliki ukuran panjang sama
dengan jumlah kolom yakni 12 fitur. Untuk proyeksi horizontal gambar karakter
ditelusuri secara horizontal sepanjang sumbu X. Jumlah piksel foreground pada
setiap baris citra merupakan nilai fitur proyeksi horizontal dari karakter
(Choudhary dan Kumar, 2017).
Pada citra dengan ukuran ‘m’ baris dan ‘n’ kolom, proyeksi horizontal dan
vertikal direpresentasikan oleh persamaan berikut (Javed et al, 2014).
𝐻𝑃𝑃(𝑥) = ∑ 𝑓(𝑥, 𝑦)
1≤𝑦≤𝑛
(2.2)
𝑉𝑃𝑃(𝑦) = ∑ 𝑓(𝑥, 𝑦)
1≤𝑥≤𝑚
(2.3)
Keterangan :
HPP = Horizontal Projection Profile
VPP = Vertical Projection Profile
x = indeks baris
16
y = indeks kolom
m = jumlah baris
n = jumlah kolom
f(x,y) = posisi baris dan kolom
Proyeksi horizontal dan vertikal suatu karakter diilustrasikan dalam Gambar 2.9
berikut.
Gambar 2.9 Proyeksi horizontal dan vertikal karakter ligatur Urdu (Shabbir
dan Siddiqi, 2016).
Proyeksi horizontal dan vertikal menghasilkan rangkaian nilai yang
merepresentasikan jumlah piksel foreground pada baris dan kolom citra. Nilai-
nilai tersebut dapat dinormalisasi ke dalam range 0-1 dengan cara membagi
setiap nilai proyeksi horizontal dengan jumlah kolom citra dan membagi setiap
nilai proyeksi vertikal dengan jumlah baris citra (Shabbir dan Siddiqi, 2016).
17
Hasil dari proses normalisasi berupa fitur proyeksi berbentuk rangkaian nilai
desimal antara 0 dan 1. Fitur yang telah ternormalisasi dapat dipadukan dengan
fitur lain yang juga berbentuk desimal sehingga menghasilkan kesatuan fitur baru
dengan nilai yang setara.
2.6 Support Vector Machine
Support Vector Machine pertama kali diperkenalkan oleh Vladimir Vapnik pada
tahun 1992. Support Vector Machine merupakan metode pembelajaran yang
digunakan untuk klasifikasi biner dengan mencari hyperplane terbaik yang
berfungsi sebagai pemisah dua class pada input space.
Konsep Support Vector Machine ditunjukkan dalam Gambar 2.10 berikut.
Gambar 2.10 Konsep Support Vector Machine (Nugroho et al, 2003).
Berdasarkan pada Gambar 2.10, klasifikasi SVM dapat didefinisikan sebagai
usaha menemukan garis (hyperplane) yang memisahkan antara kedua class.
18
Hyperplane pemisah terbaik antara kedua class dapat ditemukan dengan
mengukur titik maksimal margin dari hyperplane. Margin adalah jarak antara
hyperplane dengan pattern terdekat dari masing-masing class. Pattern yang
paling dekat dengan hyperplane ini disebut sebagai support vector.
SVM tidak hanya dirancang untuk dapat menyelesaikan permasalahan linear,
tetapi juga permasalahan non-linear. Untuk menyelesaikan masalah non-linear
menggunakan SVM, data �̅� dipetakan oleh suatu fungsi ke ruang vektor yang
berdimensi lebih tinggi. Fungsi yang memetakan suatu permasalahan non-linear
ke dalam ruang ciri yang lebih tinggi disebut dengan fungsi kernel (Nugroho et
al, 2003).
19
III. METODOLOGI PENELITIAN
3.1 Waktu dan Tempat Pelaksanaan
Penelitian ini dilaksanakan pada periode semester ganjil tahun ajaran 2017/2018,
di Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Lampung.
3.2 Alat Pendukung
Pengerjaan penelitian ini menggunakan peralatan pendukung sebagai berikut.
a. Perangkat Keras (Hardware)
Perangkat keras yang digunakan dalam penelitian ini berupa laptop dengan
spesifikasi sebagai berikut.
- Processor : Intel®Core™ i3-5005U CPU @ 2.00GHz
- Installed RAM : 4,00 GB
- System Type : 64-bit operating system, x64-based processor
b. Perangkat Lunak (Software)
Perangkat lunak yang digunakan dalam penelitian ini adalah sebagai berikut.
- Sistem Operasi Windows 10 Home Single Language 64-bit
- Matlab R2016
20
3.3 Dataset
Dataset yang digunakan dalam penelitian ini bersumber dari Lampung
Handwitten Characters Datasets yang tersedia di http://patrec.cs.tu-
dortmund.de/cms/en/home/Resources/. Data primer dari dataset berupa 82 lembar
dokumen yang diperoleh dari 82 orang kontributor pada tahun 2010. Kontributor
tersebut ialah siswa-siswi SMK N 14 Bandar Lampung yang duduk di kelas 10
dan 11, berusia rata-rata 16 tahun, serta memiliki pengetahuan yang cukup untuk
menulis aksara Lampung (Junaidi, 2011).
Dataset Lampung Handwritten Characters terdiri dari beberapa file yaitu gambar
dokumen tulisan tangan asli (raw image), komponen gambar dalam bentuk
graycale, dan file anotasi citra aksara Lampung. Total dokumen raw image
adalah 82 file dengan format gambar ppm dan terletak pada direktori raw_images
dalam file dataset. Total komponen grayscale adalah 32140 file gambar yang
terdistribusi dalam 82 sub direktori dengan format gambar pgm dan terletak pada
direktori char_css dalam file dataset. Informasi pada file anotasi terdiri dari enam
kolom. Kolom pertama merupakan nama file dari komponen yang diekstraksi.
Kolom kedua sampai kelima merupakan koordinat bounding box dari komponen
pada dokumen raw image. Kolom keenam merupakan keterangan karakter yang
merupakan label aksara Lampung dengan 18 kelas.
21
Image Acquisition
PreprocessingFeature
ExtractionClassification
3.4 Tahapan Penelitian
Penelitian ini terdiri dari beberapa tahapan. Tahapan-tahapan tersebut
ditunjukkan pada Gambar 3.1.
Gambar 3.1 Tahapan pengerjaan penelitian.
3.4.1 Image Acquisition
Image acquisition merupakan tahap awal untuk memperoleh data gambar
melalui kamera atau pemindai. Tahap image acquisition telah dilakukan
pada penelitian sebelumnya sehingga dalam penelitian ini digunakan
dataset Lampung Handwritten Characters yang tersedia pada
http://patrec.cs.tu-dortmund.de/cms/en/home/Resources/.
3.4.2 Preprocessing
Preprocessing dilakukan untuk mengolah data citra menjadi lebih
terstruktur dan sesuai dengan kriteria yang diperlukan sebagai input pada
tahap selanjutnya. Pada tahapan ini data citra aksara dinormalisasi ke
dalam ukuran yang sama kemudian dikonversi menjadi bentuk biner
sesuai dengan kebutuhan ekstraksi fitur chain code 8 direction dan
projection profile.
22
3.4.3 Feature Extraction
Feature Extraction atau ekstraksi fitur merupakan tahap yang bertujuan
untuk mengekstraksi ciri khusus dari sebuah karakter. Ciri tersebut dapat
dijadikan sebagai pembeda antara satu karakter dengan karakter lainnya.
Dalam penelitian ini digunakan fitur Chain Code 8-Direction dan
Projection Profile. Berikut merupakan detail proses dari masing-masing
ekstraksi fitur chain code 8 direction dan projection profile.
a. Chain Code 8 Direction
Chain Code 8-Direction yaitu kode rantai yang bergerak sepanjang
kurva digital atau batas piksel (contour image) yang berurutan
berdasarkan 8 konektivitas dengan arah tertentu. Arah dari setiap
gerakan dikodekan dengan menggunakan skema nomor
{i|i=0,1,2,…,7} yang menunjukkan arah kelipatan sudut 45 derajat
berlawanan arah jarum jam dari posisi sumbu X positif.
Langkah-langkah yang dilakukan pada tahap ekstraksi fitur chain
code 8-direction adalah sebagai berikut.
1. Membagi gambar karakter menjadi beberapa blok yang lebih
kecil. Pada penelitian ini citra biner aksara Lampung dengan
dimensi 32x32 dibagi menjadi 16 blok dengan masing-masing
blok berukuran 8x8 piksel. Ukuran blok 8x8 dipilih agar luas area
23
yang akan diidentifikasi menggunakan 8 kode arah tidak terlalu
sempit sehingga dapat meminimalisir resiko error.
Ilustrasi pembagian blok citra akasara Lampung “La” ditunjukkan
pada Gambar 3.2 berikut.
Gambar 3.2 Ilustrasi pembagian blok citra aksara “La”.
2. Mengidentifikasi starting point untuk masing-masing blok.
Starting point yaitu piksel foreground pertama yang diperoleh
dengan menelusuri baris dan kolom piksel. Setiap blok gambar
ditelusuri sepanjang perbatasan blok. Penelusuran pertama
dilakukan sepanjang tepi kiri blok mulai dari baris pertama sampai
baris ke-m pada kolom pertama, kemudian terus bergeser satu
kolom ke kanan sampai batas piksel terakhir blok gambar. Piksel
24
foreground pertama yang ditemukan itulah yang diidentifikasi
sebagai starting point.
Pencarian starting point pada salah satu blok aksara “La”
diilustrasikan dalam Gambar 3.3 berikut.
Gambar 3.3 Penelusuran starting point blok citra aksara “La”.
Pada ilustrasi di atas, pencarian starting point pada blok(1,4)
berhenti ketika ditemukan piksel foreground pertama pada baris
ke-8 kolom ke-2. Piksel ini kemudian akan menjadi titik awal
penelusuran kontur pada blok citra tersebut.
3. Mengidentifkasi arah piksel tetangga menggunakan 8 arah chain
code. Setelah starting point ditemukan, arah piksel tetangga yang
25
telah teridentifikasi ditandai dengan kode angka untuk
menghindari pengidentifikasian berulang. Identifikasi tersebut
dilakukan sepanjang kontur aksara pada blok sesuai pergerakan
arah jarum jam.
Nilai kode arah dan contoh penelusuran chain kode pada blok
aksara “La” diilustrasikan dalam Gambar 3.4 berikut.
Gambar 3.4 Nilai kode arah dan penelusuran chain code pada
salah satu blok aksara “La”.
4. Penelusuran suatu blok akan selesai ketika sudah kembali
mencapai starting point. Kemudian penelusuran dilanjutkan
dengan cara yang sama untuk setiap blok gambar hingga semua
blok teridentifikasi.
26
5. Hasil penelusuran kontur menggunakan chain code 8-direction ini
berupa urutan kode rantai pembentuk aksara. Urutan kode tersebut
memiliki ukuran panjang yang berbeda-beda pada setiap blok
tergantung konturnya masing-masing. Untuk mengatasi hal
tersebut dilakukan proses normalisasi dengan cara membagi nilai
frekuensi kemunculan setiap kode arah dengan total nilai
frekuensi semua kode arah pada suatu blok. Dengan demikian
masing-masing blok hanya akan memiliki delapan nilai yang
merupakan hasil normalisasi kode rantai.
6. Pada akhir proses, nilai-nilai yang diperoleh dari hasil normalisasi
kode rantai pada 16 blok digabungkan untuk membentuk satu
kesatuan fitur. Secara keseluruhan, panjang fitur yang dihasilkan
dari ekstraksi fitur chain code 8 direction ini adalah 8x16 atau
sama dengan 128 fitur.
b. Projection Profile
Projection Profile merupakan struktur data yang menyimpan jumlah
piksel foreground ketika diproyeksikan di atas sumbu normal XY.
Piksel foreground yaitu piksel yang menjadi latar depan suatu citra
atau piksel yang membentuk badan objek.
27
Dalam penelitian ini diterapkan dua orientasi proyeksi, yaitu orientasi
horizontal dan orientasi vertikal. Langkah-langkah yang dilakukan
pada tahap ekstraksi fitur projection profile adalah sebagai berikut.
1. Menelusuri piksel gambar dan menghitung piksel foreground.
Pada proyeksi horizontal, setiap baris piksel ditelusuri sepanjang
sumbu X dan jumlah piksel foreground dihitung perbarisnya.
Ilustrasi penelusuran jumlah piksel foreground pada proyeksi
horizontal citra aksara ‘La’ ditunjukkan pada Gambar 3.5 berikut.
Gambar 3.5 Penelusuran jumlah piksel foreground pada baris
citra aksara.
Penelusuran baris piksel foreground (piksel putih dalam Gambar
3.5) menghasilkan nilai yang beragam. Nilai-nilai yang diperoleh
berdasarkan penelusuran tersebut kemudian dinormalisasi ke
dalam range 0-1. Hal ini dilakukan agar ketika dipadukan dengan
28
fitur chain code 8 direction akan membentuk fitur gabungan yang
memiliki nilai setara yaitu bilangan desimal antara 0 dan 1. Proses
normalisasi dilakukan dengan cara membagi setiap nilai yang
diperoleh dari penelusuran baris dengan jumlah kolom citra yaitu
32.
Proyeksi horizontal dari citra aksara ‘La’ ditunjukkan pada
Gambar 3.6 berikut.
Gambar 3.6 Hasil projection profile citra aksara pada orientasi
horizontal.
Gambar 3.6 menunjukkan grafik yang merepresentasikan 32 data
fitur proyeksi horizontal dari citra aksara tersebut. Jumlah ini
sesuai dengan jumlah baris yang dimiliki oleh citra.
jum
lah p
ikse
l (n
orm
alis
asi)
baris ke-
29
Pada proyeksi vertikal, setiap kolom piksel ditelusuri sepanjang
sumbu Y dan jumlah piksel foreground dihitung perkolomnya.
Ilustrasi penelusuran jumlah piksel foreground pada proyeksi
vertikal citra aksara ‘La’ ditunjukkan pada Gambar 3.7 berikut.
Gambar 3.7 Penelusuran jumlah piksel foreground pada kolom
citra.
Penelusuran kolom piksel foreground (piksel putih dalam Gambar
3.7) menghasilkan nilai yang beragam. Nilai-nilai yang diperoleh
berdasarkan penelusuran tersebut kemudian dinormalisasi ke
dalam range 0-1. Hal ini dilakukan agar ketika dipadukan dengan
fitur chain code 8 direction akan membentuk fitur gabungan yang
memiliki nilai setara yaitu bilangan desimal antara 0 dan 1. Proses
normalisasi dilakukan dengan cara membagi setiap nilai yang
30
diperoleh dari penelusuran kolom dengan jumlah baris citra yaitu
32.
Proyeksi vertikal dari citra aksara ‘La’ ditunjukkan pada Gambar
3.8 berikut.
Gambar 3.8 Hasil projection profile citra aksara pada orientasi
vertikal.
Gambar 3.8 menunjukkan grafik yang merepresentasikan 32 data
fitur proyeksi vertikal dari citra aksara tersebut. Jumlah ini sesuai
dengan jumlah kolom yang dimiliki oleh citra.
Jum
lah p
ikse
l (n
orm
alis
asi)
kolom ke-
31
2. Menggabungkan kedua fitur proyeksi.
Proyeksi horizontal dan vertikal masing masing menghasilkan
fitur dengan panjang 32 fitur. Untuk menghasilkan satu kesatuan
fitur dari proses ekstraksi projection profile, maka dilakukan
penggabungan kedua fitur. Hasil akhir dari proses ini adalah fitur
dengan panjang 64 dengan urutan indeks ke 1 sampai dengan 32
merupakan fitur proyeksi horizontal dan indeks ke 33 sampai
dengan 64 merupakan fitur proyeksi vertikal.
3.4.4 Classification
Tahap classification bertujuan untuk mengelompokkan fitur-fitur yang
telah diekstraksi pada tahap sebelumnya ke dalam kelas-kelas yang
sesuai. Dalam penelitian ini digunakan metode klasifikasi Support Vector
Machine (SVM) dengan memanfaatkan tool LibSVM. Proses
klasifikasinya dilakukan berdasarkan masing-masing fitur. Tahapan yang
pertama merupakan klasifikasi hasil ekstraksi fitur chain code 8 direction.
Tahapan kedua yaitu klasifikasi hasil ekstraksi fitur projection profile,
dan tahapan ketiga merupakan klasifikasi fitur gabungan dari hasil
ekstraksi chain code 8 direction dan projection profile.
Tujuan dari ketiga tahap klasifikasi tersebut adalah untuk mengetahui
perbedaan antara hasil klasifikasi menggunakan jenis fitur tunggal dan
32
fitur gabungan. Hasil klasifikasi tersebut dapat dianalisis dan ditarik
kesimpulan yang menyatakan tingkat akurasi paling baik dari penggunaan
kedua fitur tersebut dalam mengenali tulisan tangan aksara Lampung.
70
V. SIMPULAN DAN SARAN
5.1 Simpulan
Kesimpulan yang diperoleh berdasarkan penelitian yang telah dilakukan adalah
sebagai berikut :
1. Ekstraksi fitur chain code 8 direction dan projection profile telah berhasil
diimplementasikan pada pengenalan karakter tulisan tangan Aksara
Lampung.
2. Penggunaan fitur chain code 8 direction dan projection profile sudah cukup
baik dalam pengenalan karakter tulisan tangan Aksara Lampung.
3. Akurasi tertinggi didapatkan pada penggunaan kernel linear LibSVM dengan
nilai mencapai 90,08% untuk fitur chain code 8 direction, 79,28% untuk fitur
projection profile, dan 94,00% untuk fitur gabungan.
4. Penggabungan fitur chain code 8 direction dan projection profile
menghasilkan peningkatan akurasi sebesar 4% dari akurasi tertinggi yang
diperoleh dari klasifikasi chain code 8 direction yaitu 90,08% menjadi
94,00%.
71
5.2 Saran
Saran yang dapat diberikan untuk penelitian selanjutnya adalah sebagai berikut :
1. Mengembangkan penelitian tentang pengenalan karakter tulisan tangan
Aksara Lampung dengan menggunakan metode ekstrakasi fitur lainnya
seperti Discrete Wavelet Transform, Gray Level Coocurence Matrix, dan
sebagainya.
2. Mengembangkan penelitian tentang pengenalan karakter tulisan tangan
Aksara Lampung dengan menggunakan metode klasifikasi lain seperti Naïve
Bayes, Decision Tree, dan sebagainya.
72
DAFTAR PUSTAKA
Cheriet, Mohamed et al. 2007. Character Recognition System: A Guide for Students
and Practioner. New Jersey: John Wiley&Sons Inc.
Choudary, Amit dan Vinod Kumar. 2017. Performance Evaluation of MLP and RBF
Classifiers for Handwritten Character Recognition Using Hybrid Features.
International Journal of Advanced Research in Computer Science, Volume 8, No.
7.
Javed, Dr. Mohammed; Nagabhushan, P; dan Chaudhuri, Bidyut. 2014. Extraction of
Projection Profile, Run-Histogram and Entropy Features Straight from Run-
Length Compressed Text-Documents. Proceedings - 2nd IAPR Asian Conference
on Pattern Recognition, ACPR.
Junaidi, Akmal. 2016. Lampung Handwritten Character Recognition. Disertasi.
Program Doktoral Dortmund University. Dortmund. German.
Junaidi, Akmal; Szilard Vajda; dan Gernot A. Fink. 2011. Lampung- A New
Handwritten Character Benchmark: Database, Labeling and Recognition.
Proceedings of International Workshop on Multilingual OCR, MOCR. Page 105-
112.
Khadir, Abdul dan Adhi Susanto. 2013. Teori dan Aplikasi Pengolahan Citra.
Yogyakarta: ANDI.
Nugroho, A.Satriyo et al. 2003. Support Vector Machine Teori dan Aplikasinya. Kuliah
Umum IlmuKomputer.com.
Putra, Darma. 2010. Pengolahan Citra Digital. Yogyakarta: ANDI.
73
Rajput, G.G dan S.M Mali. 2010. Marathi Handwritten Numeral Recognition using
Fourier Descriptors and Normalized Chain Code. International Journal of
Computer Application, Special Issue on “Recent Trends in Image Processing and
Pattern Recognition”.
Rao, N.Venkata et al. 2016. Optical Character Recognition Technique Algorithm.
Journal of Theoritical and Applied Information Technology, Volume 83, No.2.
Roberto, J. Rodrigues dan Antonio Carlos Gay Thomé. 2002. Cursive Character
Recognition – a Character Segmentation Method Using Projection Profile-Based
Technique. Brasil: Universidade Federal do Rio de Janeiro.
Shabbir, Safia dan Imran Siddiqi. 2016. Optical Character Recognition System for
Urdu Words in Nastaliq Font. International Journal of Advanced Computer
Science and Applications, Vol. 7, No. 5.
Sharma, Anisha; Soumil Khare; dan Sachin Chavan. 2017. A Review on Handwritten
Character Recognition. International Journal of Computer Science and
Technology, Volume 8, Issue 1.
Surinta, Olarik. 2016. Multi-Script Handwritten Character Recognition using Feature
Descriptors and Machine Learning. Tesis. University of Groningen, Thailand.