Penerjemah Aksara Lampung

40
DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN DENGAN METODE PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP (SOM) PROPOSAL TUGAS AKHIR Disusun oleh : Cahyo Prarian 111060064 S1 Teknik Telekomunikasi FAKULTAS ELEKTRO & KOMUNIKASI INSTITUT TEKNOLOGI TELKOM

description

DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN DENGAN METODE PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUANSELF-ORGANIZING MAP (SOM)

Transcript of Penerjemah Aksara Lampung

Page 1: Penerjemah Aksara Lampung

DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA

LAMPUNG KE HURUF LATIN DENGAN METODE PENGOLAHAN

CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN

SELF-ORGANIZING MAP (SOM)

PROPOSAL TUGAS AKHIR

Disusun oleh :

Cahyo Prarian

111060064

S1 Teknik Telekomunikasi

FAKULTAS ELEKTRO & KOMUNIKASI

INSTITUT TEKNOLOGI TELKOM

BANDUNG

2010

Page 2: Penerjemah Aksara Lampung

ABSTRAKSI

Negara Indonesia merupakan negara yang memiliki keanekaragaman budaya. Salah

satunya adalah keanekaragaman bahasa daerah. Bahasa Lampung merupakan salah satu

bahasa daerah yang digunakan di Indonesia. Untuk membaca tulisan Aksara Lampung

tidaklah mudah. Karena kita harus menghafal bentuk – bentuk dari aksara lampung tersebut

serta pengucapannya. Hal ini dikarenakan bentuk dari aksara lampung yang sangat kompleks.

Pada tugas akhir ini akan dibuat alat bantu pembacaan aksara Lampung berupa

program aplikasi yang berfungsi untuk mengidentifikasi aksara Lampung kemudian

menerjemahkannya menjadi huruf Latin dengan menggunakan Optical Character

Recognition (OCR), yaitu sebuah sistem komputer yang digunakan untuk mengenali

serangkaian karakter yang berasal dari mesin ketik, mesin cetak, ataupun tulisan tangan.

Serangkaian aksara Lampung yang akan diidentifikasi dalam tugas akhir ini berasal dari teks

aksara Lampung yang berasal dari print-out atau huruf cetak yang kemudian gambarnya

diambil oleh webcam dan diproses secara langsung untuk diterjemahkan menjadi huruf Latin.

Pada prosesnya dilakukan 5 tahapan. Pada tahap preprocessing dilakukan

penghilangan bagian gambar selain karakter, pada tahap segmentasi dilakukan pemisahan

region pada tiap karakter yang akan dideteksi, dan pada tahap normalisasi dilakukan proses

perubahan dimensi dan ketebalan karakter. Selanjutnya, pada tahap ekstraksi ciri dilakukan

pengambilan ciri-ciri tertentu dari tiap karakter. Dan pada tahap pengenalan karakter yang

menggunakan JST Self Organizing Map (SOM) dilakukan penentuan vektor penyusun garis

karakter dengan cara menghubungkan titik-titik neuron yang ada pada suatu region karakter.

Rencana pengujian yang akan dilakukan terhadap sistem meliputi pengambilan

gambar dari font yang sudah dilatih maupun yang belum dilatih dan pengambilan gambar

oleh webcam dari kemiringan yang berbeda - beda. Dan dari masing-masing pengujian diatas

akan diukur akurasinya. Pengukuran juga akan dilakukan terhadap lamanya waktu yang

digunakan untuk proses penerjemahan tiap karakter.

Kata kunci: Aksara Lampung, print-out, OCR, webcam, ekstraksi ciri, Jaringan Syaraf

Tiruan SOM.

ii

Page 3: Penerjemah Aksara Lampung

Bab I Pendahuluan

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM)

iii

Page 4: Penerjemah Aksara Lampung

DAFTAR ISI

HALAMAN JUDUL.......................................................................................................... i

LEMBAR PENGESAHAN............................................................................................... ii

ABSTRAK.......................................................................................................................... iii

DAFTAR ISI ...................................................................................................................... iv

DAFTAR GAMBAR ......................................................................................................... vi

DAFTAR TABEL .............................................................................................................. vii

BAB I PENDAHULUAN

1.1 Latar Belakang............................................................................................................... 1

1.2 Tujuan dan Manfaat....................................................................................................... 2

1.3 Rumusan Masalah.......................................................................................................... 2

1.4 Batasan Masalah............................................................................................................. 2

1.5 Metodologi Penelitian.................................................................................................... 3

1.6 Sistematika Penulisan..................................................................................................... 3

BAB II DASAR TEORI

2.1 Aksara Lampung

................................................................................................................ 5

2.1.1 Huruf Dasar (Aksara Nglegena)............................................................................ 5

2.1.2 Aksara murda........................................................................................................ 6

2.1.3 Aksara Swara......................................................................................................... 7

2.1.4 Sandhangan........................................................................................................... 7

2.2 Webcam....................................................................................................................... 9

2.3 Citra Digital ................................................................................................................ 10

2.4 Optical Character Recognition (OCR)........................................................................ 11

2.4 Ekstraksi Ciri............................................................................................................... 12

2.5 Jaringan Syaraf Tiruan................................................................................................ 13

2.5.1 Self Organizing Map (SOM)................................................................................. 14

BAB III PERANCANGAN DAN SIMULASI SISTEM

3.1 Pemodelan Simulasi Sistem ....................................................................................... 15

3.2 Proses Akuisisi Gambar.............................................................................................. 15

iv

Page 5: Penerjemah Aksara Lampung

3.3 Proses Penerjemahan Aksara Lampung.............................................................................

15

3.3.1 Proses Belajar ....................................................................................................... 16

3.3.2 Proses Uji.............................................................................................................. 17

BAB IV BENTUK KELUARAN YANG DIHARAPKAN

4.1 Hasil Yang Diharapkan............................................................................................... 19

Rencana Kegiatan................................................................................................................. viii

DAFTAR PUSTAKA......................................................................................................... ix

v

Page 6: Penerjemah Aksara Lampung

DAFTAR GAMBAR

Gambar 2.1 Representasi Matriks Citra Digital ….………………..………………….. 9

Gambar 2.2 Struktur JST Self Organizing Map (SOM) ……………………………… 13

Gambar 3.1 Pemodelan Simulasi Sistem …................................................................... 14

Gambar 3.2 Diagram Alir Simulasi Sistem …………………………………………… 15

Gambar 3.3 Proses preprocessing, Segmentasi, Normalisasi, dan Output Sistem ..….. 17

vi

Page 7: Penerjemah Aksara Lampung

DAFTAR TABEL

Tabel 2.1 Aksara Nglegena.......................................................................................... 5

Tabel 2.2 Tabel Aksara Murda..................................................................................... 6

Tabel 2.3 Tabel Aksara Swara..................................................................................... 7

Tabel 2.4 Sandhangan Swara....................................................................................... 8

Tabel 2.5 Sandhangan Panyigeging Wanda................................................................. 8

Tabel 2.6 Sandangan gugus konsonan......................................................................... 9

vii

Page 8: Penerjemah Aksara Lampung

viii

Page 9: Penerjemah Aksara Lampung

BAB 1

PENDAHULUAN

1.1. Latar Belakang

Banyaknya budaya – budaya barat yang masuk Indonesia terkadang membuat budaya –

budaya kita terlupakan. Ironisnya banyak jiwa – jiwa muda Indonesia yang mengikuti budaya

barat namun tidak tahu sama sekali mengenai budaya negaranya itu sendiri. Hal ini perlu

segera dibenahi. Budaya – budaya nasional maupun budaya daerah perlu dilestarikan agar

tidak punah. Salah satu budaya daerah yang harus dilestarikan adalah aksara Lampung.

Aksara Lampung adalah salah satu bentuk penulisan bahasa lampung selain

menggunakan tulisan latin. Berbeda dengan bahasa Indonesia yang penulisannya

menggunakan tulisan latin. Bentuk – bentuk dari aksara lampung sangat kompleks, sehingga

sedikit sulit untuk menghapal dan memahami tulisan tersebut dikarenakan bentuknya yang

tidak familiar.

Oleh karena itu, dalam tugas akhir ini akan dibuat sebuah program aplikasi yang bisa

menerjemahkan aksara Lampung ke huruf Latin dengan menggunakan Optical Character

Recognition (OCR) sebagai media yang bisa membantu user dalam mempelajari aksara

Lampung dan membantu membaca berbagai tulisan Aksara Lampung dengan mudah.

Dari beberapa program penerjemah aksara lampung yang sudah ada, program tersebut

hanya bisa digunakan untuk menerjemahkan huruf dari sebuah file teks dan bukan dari

gambar. Dan pada penelitian sebelumnya, program aplikasi yang sudah dibuat dan bisa

menerjemahkan huruf dari gambar adalah penerjemah huruf Arab ke huruf Latin, serta huruf

ke latin. Dengan latar belakang ini juga akhirnya topik penerjemah Aksara Lampung ke huruf

Latin dari gambar bisa menarik untuk dipilih sebagai tugas akhir.

Adapun proses yang dilakukan dalam perancangan program aplikasi ini adalah

mengambil gambar aksara lampung hasil print-out atau cetak dari webcam kemudian

dilakukan preprocessing, ekstraksi ciri, dan pengenalan karakter menggunakan Jaringan

Syaraf Tiruan Self Organizing Map (SOM). Diharapkan melalui metode yang dipilih dapat

meningkatkan tingkat akurasi dan menjadi referensi sebagai salah satu metode untuk

mengidentifikasi karakter yang handal dan mempunyai tingkat akurasi lebih dari 75 persen.

1

Page 10: Penerjemah Aksara Lampung

Bab I Pendahuluan

1.2. Tujuan dan Manfaat

Tugas akhir ini memiliki beberapa tujuan diantaranya adalah:

1. Merancang dan membuat program aplikasi yang berfungsi untuk mengenali

Aksara Lampung yang diambil melalui webcam kemudian menerjemahkannya

ke huruf Latin melalui pengolahan citra digital dengan menggunakan Jaringan

Syaraf Tiruan Self Organizing Map (SOM).

2. Menganalisa performansi program aplikasi yang telah dibuat berdasarkan

parameter akurasi.

3. Menganalisa waktu yang dibutuhkan program untuk mendapatkan teks latin.

4. Menganalisa pengambilan gambar oleh webcam dari kemiringan yang berbeda

– beda.

Tugas akhir ini diharapkan dapat memberikan manfaat antara lain:

1. Sebagai media yang dapat membantu user mempelajari Aksara Lampung.

2. Sebagai media yang dapat membantu user membaca Aksara Lampung dalam

huruf Latin.

1.3. Rumusan Masalah

Permasalahan yang dijadikan obyek penelitian dan pengembangan tugas akhir ini

adalah sebagai berikut:

1. Bagaimana membentuk sebuah sistem pengambilan gambar aksara Lampung

dari webcam kemudian diproses secara langsung untuk diterjemahkan ke huruf

Latin dengan waktu yang cepat.

2. Bagaimana mengenali Aksara Lampung menggunakan Jaringan Syaraf Tiruan

Self-Organizing Map.

1.4. Batasan Masalah

Berdasarkan rumusan masalah yang telah diuraikan diatas maka batasan-batasan

masalah pada pembahasan tugas akhir ini adalah:

1. Text Aksara Lampung pada gambar yang akan diproses dalam posisi

mendatar.

2. Implementasi menggunakan bahasa pemrograman MATLAB

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

2

Page 11: Penerjemah Aksara Lampung

Bab I Pendahuluan

3. Text Aksara Lampung yang dapat di deteksi adalah Huruf dasar (aksara

nglegena) tanpa pasangannya, aksara Murda tanpa Pasangannya, aksara

Swara serta tanda baca.

1.5. Metodologi Penelitian

Metode penelitian pada tugas akhir ini meliputi beberapa tahapan, antara lain sebagai

berikut:

1. Mengumpulkan data melalui studi literatur dari buku-buku referensi dan jurnal

yang terkait. Studi literatur merupakan tahap pendalaman materi, identifikasi

permasalahan dan teori yang berkaitan dengan permasalahan dalam penelitian.

2. Menyusun algoritma untuk merancang program aplikasi yang akan dibuat dan

mengimplementasikannya dengan menggunakan bahasa pemrograman

MATLAB.

3. Pengujian dan analisa performansi yang bertujuan untuk mengukur akurasi

program aplikasi yang telah dibuat.

4. Pengambilan kesimpulan dari penelitian dalam membuat program aplikasi

penerjemah Aksara Lampung ke huruf Latin yang telah dilakukan.

1.6. Sistematika Penulisan

Sistematika Penulisan Laporan Tugas Akhir ini terdiri atas lima bab yang disusun

sebagai berikut:

BAB I : Pendahuluan

Bab ini membahas latar belakang pemilihan topik tugas akhir, tujuan

dan manfaat penelitian, perumusan masalah, batasan masalah, metode

penyelesaian masalah dan sistematika penulisan pada tugas akhir ini.

BAB II: Dasar Teori

Bab ini menjelaskan teori Aksara Lampung, citra digital, webcam,

Optical Character Recognition (OCR), Ekstraksi Ciri, Jaringan Syaraf

Tiruan Self Organizing Map (SOM).

BAB III: Perancangan dan Simulasi Sistem

Bab ini akan menguraikan tentang proses perancangan program

aplikasi pengenalan karakter Aksara Lampung.

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

3

Page 12: Penerjemah Aksara Lampung

Bab I Pendahuluan

BAB IV: Analisa Hasil

Bab ini akan menguraikan hasil dan analisa dari program aplikasi yang

telah dibuat.

BAB V: Kesimpulan dan Saran

Bab ini akan memberikan kesimpulan mengenai hal-hal yang telah

dibahas dalam tugas akhir ini dan diberikan pula saran-saran untuk

pengembangan topik yang dibahas dalam tugas akhir ini.

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

4

Page 13: Penerjemah Aksara Lampung

BAB II

DASAR TEORI

2.1. Pengertian Aksara Lampung

Aksara Lampung adalah salah satu bentuk penulisan bahasa lampung yang berbeda

dengan penulisan latin. Aksara ini lebih dikenal sebagai Hanacaraka. Struktur dari masing –

masing aksara Lampung paling tidak mewakili dua buah huruf (aksara) dalam huruf latin.

Sebagai contoh aksara Ha yang mewakili dua huruf yakni H dan A. Aksara Lampung

memiliki kedekatan dengan aksara Bali. Baik Aksara Lampung dan Aksara Bali merupakan

turunan dari aksara Brahmi, sebagaimana semua aksara Nusantara lainnya. Aksara Brahmi ini

sendiri adalah aksara yang digunakan di India semasa pemerintahan Raja Asoka (270 SM -

232 SM).

Aksara Lampung diantaranya terdiri dari 20 huruf dasar, empat sandhangan penutup

suku kata, dan beberapa tanda baca.

2.1.1. Huruf dasar (aksara nglegena)

Pada aksara Lampung hanacaraka baku terdapat 20 huruf dasar (aksara

nglegena),

Tabel 2.1 Aksara Nglegena

5

Page 14: Penerjemah Aksara Lampung

Bab II Dasar Teori

2.1.2. Aksara Murda

Pada aksara Lampung memiliki bentuk murda (hampir setara dengan huruf

kapital) yang seringkali digunakan untuk menuliskan kata-kata yang menunjukkan:

* Nama Gelar

* Nama Diri

* Nama Geografi

* Nama Lembaga Pemerintah

* Dan Nama Lembaga Berbadan Hukum.

(Kata-kata dalam Bahasa Indonesia yang menunjukkan hal-hal diatas biasanya diawali

dengan huruf besar atau kapital. Untuk itulah pada perangkat lunak ini kita gunakan

huruf kapital untuk menuliskan aksara murda atau pasangannya). Tidak semua aksara

yang ada di Hanacaraka memiliki bentuk Murdanya. Aksara murda dalam Hanacaraka

hanya berjumlah 7 buah.

Untuk aturan penulisan Aksara murda ini hampir sama dengan penulisan

aksara-aksara pokok di Hanacaraka, ditambah dengan beberapa aturan tambahan

yakni :

Murda tidak dapat dipakai sebagai sigeg (konsonan penutup suku kata).

Bila ditemui aksara murda menjadi sigeg, maka dituliskan bentuk

aksara pokoknya.

Bila dalam satu kata atau satu kalimat ditemui lebih dari satu aksara

murda, maka ada dua aturan yang dapat dipergunakan yakni dengan

menuliskan aksara murda terdepannya saja, atau dengan menuliskan

keseluruhan dari bentuk aksara mudra yang ditemui.

Berikut ini bentuk – bentuk dari Aksara Murda :

Tabel 2.2 Tabel Aksara Murda

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

6

Page 15: Penerjemah Aksara Lampung

Bab II Dasar Teori

2.1.3. Aksara Swara

Aksara Swara sebagaimana aksara Murda memiliki fungsi dan

kegunaan tertentu. Aksara Swara dalam penulisan Hanacaraka digunakan untuk

menuliskan aksara vokal yang menjadi suku kata, terutama yang berasal dari bahasa

asing, untuk mempertegas pelafalannya. Dalam menuliskan Aksara Swara, diikuti

aturan penulisan aksara swara sebagai berikut :

Aksara swara tidak dapat dijadikan sebagai aksara pasangan.

Bila aksara swara menemui sigegan (konsonan pada akhir suku kata

sebelumnya), maka sigegan itu harus dimatikan dengan pangkon.

Aksara swara dapat diberikan sandangan wignyan, layar, cecak, suku,

wulu dan lainnya.

Adapun bentuk Aksara Swara ini adalah sebagai berikut :

Tabel 2.3 Tabel Aksara Swara

2.1.4. Sandangan

Sandangan adalah tanda yang dipakai sebagai pengubah bunyi di dalam tulisan

Lampung. Di dalam tulisan lampung, aksara yang tidak mendapat sandangan

diucapkan sebagai gabungan anatara konsonan dan vokal a. Vokal a di dalam bahasa

Lampung mempunya dua macam varian, yakni /o / dan /a/.

Vokal a dilafalkan seperti o pada kata bom, pokok, tolong, tokoh doi

dalam bahasa Indonesia.

Vokal a dilafalkan /a/, seperti a pada kata pas, ada, siapa, semua di

dalam bahasa Indonesia.

Ada beberapa Sandangan di dalam aksara lampung, diantaranya adalah :

1. Sandangan Bunyi Vokal (Sandhangan Swara)

2. Sandangan Konsonan Penutup Suku Kata (Sandhangan Panyigeging

Wanda)

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

7

Page 16: Penerjemah Aksara Lampung

Bab II Dasar Teori

3. Sandangan gugus konsonan

2.1.4.1. Sandhangan Bunyi Vokal (Sandhangan Swara)

Sandangan bunyi vokal ada lima buah. Adapun bentuk dari

sandangan bunyi vokal ini adalah :

Tabel 2.4 Sandhangan Swara

2.1.4.2. Sandangan Konsonan Penutup Suku Kata (Sandhangan

Panyigeging Wanda)

Sandangan penutup suku kata ada 4 buah. Adapun bentuk dari

sandangan konsonan penutup suku kata ini adalah :

Tabel 2.5 Sandhangan Panyigeging Wanda

2.1.4.3. Sandangan gugus konsonan

Gugus konsonan adalah kumpulan dari dua konsonan dalam

Hanacaraka yang akan membentuk suatu suku kata. sebagai contoh kraton

yang dapat dipisah menjadi kra-ton. suku kata kra memiliki gugus konsonan

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

8

Page 17: Penerjemah Aksara Lampung

Bab II Dasar Teori

kr. Di dalam Hanacaraka ada lima buah gugus konsonan yang digunakan

dalam bentuk sandangan.

Tabel 2.6 Sandangan gugus konsonan

2.2 Webcam

Webcam (singkatan dari web camera) adalah sebutan bagi kamera real-time yang

gambarnya bisa diakses atau dilihat melalui World Wide Web, program instant messaging,

atau aplikasi video call. Istilah "webcam" juga merujuk kepada jenis kamera yang digunakan

untuk keperluan-keperluan tersebut.

Webcam termasuk kamera digital yang meng-upload gambar ke web server secara

kontinyu dan langsung dihubungkan ke PC. Tiap webcam memiliki spesifikasi tertentu, dan

memiliki resolusi tertentu juga.

Dalam tugas akhir yang akan dibuat, webcam digunakan untuk mengcapture gambar

Aksara Lampung yang akan diterjemahkan ke dalam huruf Latin.

2.3. Citra Digital

Citra merupakan suatu fungsi kontinu dari intensitas cahaya atau derajat keabuan

dalam bidang 2 dimensi yang dapat direpresentasikan dengan f(x,y), di mana x dan y

menyatakan koordinat posisi pixel itu berada, dan nilai f(x,y) menunjukkan intensitas (derajat

keabuan) pixel atau picture element pada koordinat tersebut [GON93]. Pixel itu sendiri

merupakan satuan atau elemen terkecil dari citra yang menempati suatu posisi yang

menentukan resolusi citra tersebut.

Ketika sebuah citra akan diolah dengan menggunakan komputer, maka nilai-nilai x, y,

dan f(x,y) harus berada pada jangkauan atau range tertentu yang jumlahnya terbatas. Citra

dengan ketentuan tersebut dinamakan citra digital. Secara matematis persamaan untuk fungsi

intensitas f(x,y) adalah:

0 ≤ f(x,y)<∞

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

9

Page 18: Penerjemah Aksara Lampung

Bab II Dasar Teori

Misalkan f merupakan sebuah citra digital 2 dimensi berukuran NxM. Maka

representasi f dalam sebuah matriks dapat dilihat pada gambar di bawah ini, di mana f(0,0)

berada pada sudut kiri atas dari matriks tersebut, sedangkan f(n-1,m-1) berada pada sudut

kanan bawah.

Gambar 2.1 Representasi Matriks Citra Digital

2.4. Optical Character Recognition (OCR)

OCR (Optical Character Recognition) adalah sebuah sistem komputer yang dapat

membaca huruf, baik yang berasal dari sebuah pencetak (printer atau mesin ketik) maupun

yang berasal dari tulisan tangan. Adanya sistem pengenal huruf ini akan meningkatkan

fleksibilitas ataupun kemampuan dan kecerdasan sistem komputer. Dengan adanya sistem

OCR maka user dapat lebih leluasa memasukkan data karena user tidak harus memakai papan

ketik tetapi bisa menggunakan pena elektronik untuk menulis sebagaimana user menulis di

kertas. Adanya OCR juga akan memudahkan penanganan pekerjaan yang memakai input

tulisan seperti penyortiran surat di kantor pos, pemasukan data buku di perpustakaan, dll.

Adanya sistem pengenal huruf yang cerdas akan sangat membantu usaha besar-besaran yang

saat ini dilakukan banyak pihak yakni usaha digitalisasi informasi dan pengetahuan, misalnya

dalam pembuatan koleksi pustaka digital, koleksi sastra kuno digital, dll.

OCR dapat dipandang sebagai bagian dari pengenal otomatis yang lebih luas yakni

pengenal pola otomatis (automatic pattern recognition). Dalam pengenal pola otomatis,

sistem pengenal pola mencoba mengenali apakah citra masukan yang diterima cocok dengan

salah satu citra yang telah ditentukan. Sistem ini misalnya dipakai untuk mendeteksi sidik

jari, tandatangan, bahkan wajah seseorang.

Ada banyak pendekatan yang dapat dipakai untuk mengembangkan pembuatan

pengenal pola otomatis antara lain memakai pendekatan numerik, statistik, sintaktik, neural

dan, aturan produksi (rule-based). Secara umum metode-metode tersebut dapat digolongkan

menjadi dua kelompok metode yakni metode berbasis statistik dan metode berbasis struktur.

Dalam metode yang berbasis statistik, setiap pola ditransformasi ke dalam vektor yang

memakai ukuran dan karakteristik tertentu. Karakteristik ini seringkali lebih bersifat statistik

misalnya distribusi pixel ataupun jarak pixel. Sedang dalam metode yang berbasis struktur,

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

10

Page 19: Penerjemah Aksara Lampung

Bab II Dasar Teori

setiap pola yang diproses dinyatakan sebagai gabungan beberapa struktur elementer.

Pengenalan selanjutnya dilakukan dengan mencocokkan komposisi struktur elementer dengan

struktur yang sudah disimpan memakai aturan tertentu misalnya memakai pendekatan teori

bahasa formal dan automata.

2.5. Ekstraksi Ciri

Ekstraksi Ciri merupakan cara untuk mengambil ciri (feature) yang ada pada sebuah

citra. Ciri tersebut bisa berupa simbolik, numerik, maupun keduanya. Ciri pada karakter dapat

dicari dengan perhitungan statistik pada tiap karakter. Hasil dari ekstraksi ciri, merupakan

input untuk pengenalan pola pada Jaringan Syaraf Tiruan.

2.6. Jaringan Syaraf Tiruan

Jaringan Syaraf Tiruan diinspirasikan oleh struktur jaringan sel-sel syaraf di dalam

otak, merupakan salah satu representasi buatan dari otak manusia yang selalu mencoba untuk

mensimulasikan proses pembelajaran pada otak manusia tersebut. Istilah buatan digunakan

karena jaringan syaraf ini diimplementasikan dengan menggunakan program komputer yang

mampu menyelesaikan sejumlah proses perhitungan selama proses pembelajaran,

pengenalan, pengamatan serta pengambilan keputusan. Menurut Haykin, S. (1994), ”Sebuah

jaringan saraf adalah sebuah prosesor yang terdistribusi paralel dan mempuyai

kecenderungan untuk menyimpan pengetahuan yang didapatkannya dari pengalaman dan

membuatnya tetap tersedia untuk digunakan. Hal ini menyerupai kerja otak dalam dua hal

yaitu:

1. Pengetahuan diperoleh oleh jaringan melalui suatu proses belajar,

2. Kekuatan hubungan antar sel saraf yang dikenal dengan bobot sinapsis digunakan untuk

menyimpan pengetahuan.”

Jaringan Syaraf Tiruan memanfaatkan struktur pengolahan paralel atas sejumlah

pengolah sederhana dan hubungan antar pengolah tersebut. Dalam jaringan syaraf tiruan,

terdapat elemen pengolah yang merupakan model dari neuron. Setiap hubungan elemen

pengolah menentukan kemampuan JST. Seperti halnya jaringan syaraf biologis, JST juga

memiliki kemampuan untuk belajar dan beradaptasi terhadap masukan-masukannya. JST

tidak perlu diprogram secara eksplisit, karena JST dapat belajar dari beberapa contoh

pelatihan. Secara umum proses pembelajaran pada jaringan syaraf tiruan dibagi menjadi dua

macam, yaitu:

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

11

Page 20: Penerjemah Aksara Lampung

Bab II Dasar Teori

1. Belajar dengan pengawasan (Supervised Learning)

Pada metode supervised learning jaringan diberikan vektor target yang harus

dicapai sebagai dasar untuk mengubah hubungan interkoneksi atau bobot pada

jaringan. Contoh jaringan yang belajar dengan pengawasan adalah

Backpropagation dan Perceptron.

2. Belajar Tanpa Pengawasan (Unsupervised Learning)

Berbeda dengan supervised learning yang masih membutuhkan pengawasan

dan sangat tergantung pada knowledge yang diberikan pada pembangunan

jaringan, metode unsupervised learning ini melatih jaringan terhadap suatu

inputan tanpa adanya pengawasan, dimana vektor target tidak ditentukan.

Vektor masukan dimasukkan ke dalam jaringan, kemudian sistem akan

mengatur dirinya sendiri sedemikian rupa sehingga dihasilkan keluaran yang

konsisten bilamana pola yang menyerupai vektor masukan tersebut diberikan.

Contoh jaringan yang belajar tanpa pengawasan adalah Adaptive Resonance

Theory 2 (ART 2), Self Organizing Map (SOM), dan Learning Vector

Quantization (LVQ).

2.6.1. Self Organizing Map (SOM)

JST SOM dikembangkan oleh Prof. Teuvo Kohonen (Finland) yang

merupakan model JST dengan metode pembelajaran unsupervised learning. Ide dasar

teknik ini sendiri diilhami dari bagaimana proses otak manusia menyimpan gambar

atau pola yang telah dikenalinya melalui mata, kemudian mampu mengungkapkannya

kembali gambar atau pola tersebut. Pada mata manusia hal tersebut merupakan hasil

proses pemetaan dari retina menuju cortex, sehingga aplikasi model JST ini banyak

digunakan pada pengenalan obyek atau pola citra visual dan juga untuk menganalisa

data pada dimensi tinggi. SOM ini merupakan proses klarifikasi yang mampu

mempertahankan pola kemiripan pola masukan agar tidak berubah sapa pada keluaran

proses. Topologi mempertahankan kemiripan pola inilah yang berguna bagi proses

pengklarifikasian data, terutama yang jumlahnya besar.

Jaringan ini tersusun dari dua buah layer, masing-masing lapisan input dan

lapisan output, dimana pada setiap neuron dalam lapisan input dan lapisan output

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

12

Page 21: Penerjemah Aksara Lampung

Bab II Dasar Teori

saling terhubung. Setiap neuron dalam lapisan output merepresentasikan kelas

(cluster) dari input yang diberikan. Pada SOM sejalan dengan proses belajar yang

dilakukan dengan mengumpankan data pada vektor masukan dan menghasilkan

keluaran jaringan dengan profil input yang paling mirip yang telah dikelompokkan ke

dalam wilayah yang sama pada lapisan cluster. Ukuran kedekatan atau kemiripan

yang biasa dipakai adalah jarak Euclidean yang paling minimum. Bobot vektor contoh

berfungsi sebagai penentu kedekatan suatu vector dengan input yang diberikan.

Selama proses pengaturan berlangsung, vector contoh yang berada paling dekat

dengan masukan inilah yang akan menjadi vector pemenang dan vektor-vektor

tetangganya akan dimodifikasi bobotnya.

Gambar 2.2 Struktur JST Self Organizing Map (SOM)

Algoritma SOM adalah sebagai berikut:

Langkah 1: Inisialisasi pembobotan Wij dengan nilai random. Mengeset parameter

laju pemahaman (α) dan faktor penurunannya serta radius

neighbourhood (R)

Langkah 2: Selama kondisi penghentian bernilai salah, lakukan langkah 2-7

Langkah 3: Untuk tiap vektor input x(xi, i =1,…,n), lakukan langkah 3-5

Langkah 4: Untuk setiap j (j =1,...m), hitung jarak Euclidean untuk mendapatkan

node output terbaik (Best Maching Unit / BMU)

…………(2.1)

Langkah 5: Mencari indeks J dengan jarak d(J) minimum

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

13

Page 22: Penerjemah Aksara Lampung

Bab II Dasar Teori

Langkah 6: Tentukan tetangga BMU yang masih berada dalam radius jari-jari dari

BMU

Langkah 7: Melakukan perbaikan nilai wji untuk setiap unit j di sekitar J, yaitu

wji(baru) = wji(lama) + α [xi – wji(lama)] …………(2.2)

α = laju pemahaman

w = bobot

x = input pixel

Langkah 8: Memodifikasi laju pemahaman. Laju pemahaman pada Kohonen SOM

tidak bernilai konstan untuk setiap iterasinya. Nilai laju pemahaman

selalu berubah tergantung dari faktor penurunan yang dipakai. Contoh

nilai laju pemahaman awal α=0.4 dan pada tiap iterasinya nilai laju

pemahaman akan diubah berdasarkan persamaan α^baru=0.5xα^lama.

Langkah 9: Uji kondisi penghentian

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

14

Page 23: Penerjemah Aksara Lampung

BAB III

PERANCANGAN DAN SIMULASI SISTEM

3.1. Pemodelan Simulasi Sistem

Gambar 3.1 Pemodelan Simulasi Sistem

Sistem terdiri dari perangkat akuisisi gambar, PC (personal computer), dan software.

Sedangkan perangkat akuisisi gambar itu sendiri adalah webcam yang berguna untuk

mencapture teksnya. Dimana webcam ini terhubung ke Personal Computer.

3.2. Proses Akuisisi Gambar

Proses pengambilan gambar dilakukan melalui GUI (Graphical User Interface) pada

software, gambar yang diakuisisi langsung diolah untuk mendapatkan terjemahan karakter

dari gambar yang diakuisisi tersebut.

3.3. Proses Penerjemahan Aksara Lampung

Secara umum implementasi pembacaan Aksara Lampung yang dirancang dapat

digambarkan dalam diagram alir berikut:

15

Page 24: Penerjemah Aksara Lampung

Bab III Perancangan dan Simulasi Sistem

(a) Proses Belajar (b) Proses Uji

Gambar 3.2 Diagram Alir Simulasi Sistem

Dari gambar di atas terlihat bahwa sistem akan terdiri dari 2 buah proses utama yang

saling berkaitan, yaitu proses learning (belajar) dan proses pengujian. Dalam hal ini proses

learning harus dilakukan sebelum proses pengujian karena output dari proses learning

menjadi salah satu input yang dibutuhkan dalam proses pengujian.

3.3.1. Proses Belajar

Proses Belajar terdiri dari :

1. Citra Latih

Citra latih merupakan citra digital dengan format .jpg yang telah dipotong

secara manual untuk mendapatkan citra karakter.

2. Preprocessing

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

16

Page 25: Penerjemah Aksara Lampung

Bab III Perancangan dan Simulasi Sistem

Tahap preprocessing merupakan suatu proses untuk menghilangkan bagian-

bagian yang tidak diperlukan pada gambar input untuk proses selanjutnya.

Beberapa contoh preprocessing adalah noise filtering.

3. Segmentasi

Pada segmentasi, prosesnya adalah memisahkan area pengamatan (region)

pada tiap karakter yang akan dideteksi.

4. Normalisasi

Normalisasi adalah proses merubah dimensi region tiap karakter dan

ketebalan karakter.

5. Ekstraksi Ciri

Ekstraksi Ciri adalah proses untuk mengambil ciri-ciri tertentu dari

karakter yang diamati.

6. Pelatihan dengan JST

Proses ini dilakukan untuk melatih data yang ada agar mendapatkan kelas-

kelas dari tiap karakter.

7. Hasil Pelatihan dan Klasifikasi

Dari hasil pelatihan dengan JST, akan didapatkan pengklasifikasian tiap

karakter yang akan dikenali.

3.3.2. Proses Uji

Proses Belajar terdiri dari :

1. Image Capturing

Pada proses ini dilakukan pengambilan gambar menggunakan webcam,

kemudian melalui program dilakukan snap-shoot untuk mendapatkan citra

yang mengandung karakter.

2. Preprocessing

Tahap preprocessing merupakan suatu proses untuk menghilangkan

bagian-bagian yang tidak diperlukan pada gambar input untuk proses

selanjutnya. Beberapa contoh preprocessing adalah noise filtering.

3. Segmentasi

Pada segmentasi, prosesnya adalah memisahkan area pengamatan (region)

pada tiap karakter yang akan dideteksi.

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

17

Page 26: Penerjemah Aksara Lampung

Bab III Perancangan dan Simulasi Sistem

4. Normalisasi

Normalisasi adalah proses merubah dimensi region tiap karakter dan

ketebalan karakter agar sesuai dengan ukuran karakter yang sudah dilatihkan.

5. Ekstraksi Ciri

Ekstraksi Ciri adalah proses untuk mengambil ciri-ciri tertentu dari

karakter yang diamati.

6. Pengenalan Karakter

Proses pengenalan menggunakan algoritma JST yang sudah dilatih

sebelumnya dan mengklasifikasikan karakter sesuai ciri yang dimiliki.

7. Hasil dan Kesimpulan

Penyajian dari hasil penerjemahan karakter.

(a) (b)

(c)

(d)

(e)

(a) Citra Input; (b) Citra Grayscale; (c) Hasil Segmentasi Tepi;

(d) Hasil Segmentasi Tiap Karakter dan Normalisasi; (e) Output Sistem

| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP

(SOM) |

18

Sa-ya – se-dang - si-dang - a-hir

Page 27: Penerjemah Aksara Lampung

BAB IV

BENTUK KELUARAN YANG DIHARAPKAN

4.1 Hasil Yang Diharapkan

Keluaran yang diharapkan dari tugas akhir ini adalah dihasilkan suatu alat bantu yang

bisa menerjemahkan aksara Lampung ke huruf Latin dengan tingkat akurasi lebih dari 75

persen, sehingga sistem layak untuk diaplikasikan di lapangan.

19

Page 28: Penerjemah Aksara Lampung

RENCANA KEGIATAN

Bulan Bulan I Bulan II Bulan III Bulan IV Bulan V Bulan VI

Minggu 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4

Tahap Awal                                                

Studi pustaka dan literatur                                                

Pendefinisian masalah                                                

Analisa kebutuhan                                                

Desain global                                                

Desain rinci                                                

Tahap Simulasi                                                

Pembuatan program                                                Penyusunan teori pendukung                                                

Pembahasan                                                

Tahap Akhir                                                

Evaluasi                                                

Revisi                                                

Penyusunan buku laporan                                                

viii

Page 29: Penerjemah Aksara Lampung

DAFTAR PUSTAKA

[1] Fitria, Whielda.Tugas Akhir.2008. Desain Dan Implementasi Sistem Penerjemah Huruf

Jepang Kana(Hiragana-Katakana) Ke Huruf Latin Berbasis Pengolahan Citra Digital

Dan Jaringan Syaraf Tiruan Self-Organizing Map (SOM) Menggunakan

Webcam.Jurusan Teknik Telekomunikasi IT Telkom Bandung.

[2] Sukmawan, Arief.Tugas Akhir.2008.Implementasi Pembacaan Huruf Hijaiyyah dengan

Pendekatan Struktur Melalui Ekstraksi Ciri Vektor dan Pengenalan Menggunakan Jaringan

Syaraf Tiruan SOMs (Self-Organizing Maps).Jurusan Teknik Telekomunikasi IT Telkom

Bandung.

[3] http://hanacaraka.fateback.com/

[4] http://id.wikipedia.org/wiki/Hanacaraka

[5] http://id.wikibooks.org/wiki/Pengantar_aksara_Lampung

[6] http://knightpion.multiply.com/journal/item/2

ix