Penerjemah Aksara Lampung
description
Transcript of Penerjemah Aksara Lampung
DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA
LAMPUNG KE HURUF LATIN DENGAN METODE PENGOLAHAN
CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN
SELF-ORGANIZING MAP (SOM)
PROPOSAL TUGAS AKHIR
Disusun oleh :
Cahyo Prarian
111060064
S1 Teknik Telekomunikasi
FAKULTAS ELEKTRO & KOMUNIKASI
INSTITUT TEKNOLOGI TELKOM
BANDUNG
2010
ABSTRAKSI
Negara Indonesia merupakan negara yang memiliki keanekaragaman budaya. Salah
satunya adalah keanekaragaman bahasa daerah. Bahasa Lampung merupakan salah satu
bahasa daerah yang digunakan di Indonesia. Untuk membaca tulisan Aksara Lampung
tidaklah mudah. Karena kita harus menghafal bentuk – bentuk dari aksara lampung tersebut
serta pengucapannya. Hal ini dikarenakan bentuk dari aksara lampung yang sangat kompleks.
Pada tugas akhir ini akan dibuat alat bantu pembacaan aksara Lampung berupa
program aplikasi yang berfungsi untuk mengidentifikasi aksara Lampung kemudian
menerjemahkannya menjadi huruf Latin dengan menggunakan Optical Character
Recognition (OCR), yaitu sebuah sistem komputer yang digunakan untuk mengenali
serangkaian karakter yang berasal dari mesin ketik, mesin cetak, ataupun tulisan tangan.
Serangkaian aksara Lampung yang akan diidentifikasi dalam tugas akhir ini berasal dari teks
aksara Lampung yang berasal dari print-out atau huruf cetak yang kemudian gambarnya
diambil oleh webcam dan diproses secara langsung untuk diterjemahkan menjadi huruf Latin.
Pada prosesnya dilakukan 5 tahapan. Pada tahap preprocessing dilakukan
penghilangan bagian gambar selain karakter, pada tahap segmentasi dilakukan pemisahan
region pada tiap karakter yang akan dideteksi, dan pada tahap normalisasi dilakukan proses
perubahan dimensi dan ketebalan karakter. Selanjutnya, pada tahap ekstraksi ciri dilakukan
pengambilan ciri-ciri tertentu dari tiap karakter. Dan pada tahap pengenalan karakter yang
menggunakan JST Self Organizing Map (SOM) dilakukan penentuan vektor penyusun garis
karakter dengan cara menghubungkan titik-titik neuron yang ada pada suatu region karakter.
Rencana pengujian yang akan dilakukan terhadap sistem meliputi pengambilan
gambar dari font yang sudah dilatih maupun yang belum dilatih dan pengambilan gambar
oleh webcam dari kemiringan yang berbeda - beda. Dan dari masing-masing pengujian diatas
akan diukur akurasinya. Pengukuran juga akan dilakukan terhadap lamanya waktu yang
digunakan untuk proses penerjemahan tiap karakter.
Kata kunci: Aksara Lampung, print-out, OCR, webcam, ekstraksi ciri, Jaringan Syaraf
Tiruan SOM.
ii
Bab I Pendahuluan
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM)
iii
DAFTAR ISI
HALAMAN JUDUL.......................................................................................................... i
LEMBAR PENGESAHAN............................................................................................... ii
ABSTRAK.......................................................................................................................... iii
DAFTAR ISI ...................................................................................................................... iv
DAFTAR GAMBAR ......................................................................................................... vi
DAFTAR TABEL .............................................................................................................. vii
BAB I PENDAHULUAN
1.1 Latar Belakang............................................................................................................... 1
1.2 Tujuan dan Manfaat....................................................................................................... 2
1.3 Rumusan Masalah.......................................................................................................... 2
1.4 Batasan Masalah............................................................................................................. 2
1.5 Metodologi Penelitian.................................................................................................... 3
1.6 Sistematika Penulisan..................................................................................................... 3
BAB II DASAR TEORI
2.1 Aksara Lampung
................................................................................................................ 5
2.1.1 Huruf Dasar (Aksara Nglegena)............................................................................ 5
2.1.2 Aksara murda........................................................................................................ 6
2.1.3 Aksara Swara......................................................................................................... 7
2.1.4 Sandhangan........................................................................................................... 7
2.2 Webcam....................................................................................................................... 9
2.3 Citra Digital ................................................................................................................ 10
2.4 Optical Character Recognition (OCR)........................................................................ 11
2.4 Ekstraksi Ciri............................................................................................................... 12
2.5 Jaringan Syaraf Tiruan................................................................................................ 13
2.5.1 Self Organizing Map (SOM)................................................................................. 14
BAB III PERANCANGAN DAN SIMULASI SISTEM
3.1 Pemodelan Simulasi Sistem ....................................................................................... 15
3.2 Proses Akuisisi Gambar.............................................................................................. 15
iv
3.3 Proses Penerjemahan Aksara Lampung.............................................................................
15
3.3.1 Proses Belajar ....................................................................................................... 16
3.3.2 Proses Uji.............................................................................................................. 17
BAB IV BENTUK KELUARAN YANG DIHARAPKAN
4.1 Hasil Yang Diharapkan............................................................................................... 19
Rencana Kegiatan................................................................................................................. viii
DAFTAR PUSTAKA......................................................................................................... ix
v
DAFTAR GAMBAR
Gambar 2.1 Representasi Matriks Citra Digital ….………………..………………….. 9
Gambar 2.2 Struktur JST Self Organizing Map (SOM) ……………………………… 13
Gambar 3.1 Pemodelan Simulasi Sistem …................................................................... 14
Gambar 3.2 Diagram Alir Simulasi Sistem …………………………………………… 15
Gambar 3.3 Proses preprocessing, Segmentasi, Normalisasi, dan Output Sistem ..….. 17
vi
DAFTAR TABEL
Tabel 2.1 Aksara Nglegena.......................................................................................... 5
Tabel 2.2 Tabel Aksara Murda..................................................................................... 6
Tabel 2.3 Tabel Aksara Swara..................................................................................... 7
Tabel 2.4 Sandhangan Swara....................................................................................... 8
Tabel 2.5 Sandhangan Panyigeging Wanda................................................................. 8
Tabel 2.6 Sandangan gugus konsonan......................................................................... 9
vii
viii
BAB 1
PENDAHULUAN
1.1. Latar Belakang
Banyaknya budaya – budaya barat yang masuk Indonesia terkadang membuat budaya –
budaya kita terlupakan. Ironisnya banyak jiwa – jiwa muda Indonesia yang mengikuti budaya
barat namun tidak tahu sama sekali mengenai budaya negaranya itu sendiri. Hal ini perlu
segera dibenahi. Budaya – budaya nasional maupun budaya daerah perlu dilestarikan agar
tidak punah. Salah satu budaya daerah yang harus dilestarikan adalah aksara Lampung.
Aksara Lampung adalah salah satu bentuk penulisan bahasa lampung selain
menggunakan tulisan latin. Berbeda dengan bahasa Indonesia yang penulisannya
menggunakan tulisan latin. Bentuk – bentuk dari aksara lampung sangat kompleks, sehingga
sedikit sulit untuk menghapal dan memahami tulisan tersebut dikarenakan bentuknya yang
tidak familiar.
Oleh karena itu, dalam tugas akhir ini akan dibuat sebuah program aplikasi yang bisa
menerjemahkan aksara Lampung ke huruf Latin dengan menggunakan Optical Character
Recognition (OCR) sebagai media yang bisa membantu user dalam mempelajari aksara
Lampung dan membantu membaca berbagai tulisan Aksara Lampung dengan mudah.
Dari beberapa program penerjemah aksara lampung yang sudah ada, program tersebut
hanya bisa digunakan untuk menerjemahkan huruf dari sebuah file teks dan bukan dari
gambar. Dan pada penelitian sebelumnya, program aplikasi yang sudah dibuat dan bisa
menerjemahkan huruf dari gambar adalah penerjemah huruf Arab ke huruf Latin, serta huruf
ke latin. Dengan latar belakang ini juga akhirnya topik penerjemah Aksara Lampung ke huruf
Latin dari gambar bisa menarik untuk dipilih sebagai tugas akhir.
Adapun proses yang dilakukan dalam perancangan program aplikasi ini adalah
mengambil gambar aksara lampung hasil print-out atau cetak dari webcam kemudian
dilakukan preprocessing, ekstraksi ciri, dan pengenalan karakter menggunakan Jaringan
Syaraf Tiruan Self Organizing Map (SOM). Diharapkan melalui metode yang dipilih dapat
meningkatkan tingkat akurasi dan menjadi referensi sebagai salah satu metode untuk
mengidentifikasi karakter yang handal dan mempunyai tingkat akurasi lebih dari 75 persen.
1
Bab I Pendahuluan
1.2. Tujuan dan Manfaat
Tugas akhir ini memiliki beberapa tujuan diantaranya adalah:
1. Merancang dan membuat program aplikasi yang berfungsi untuk mengenali
Aksara Lampung yang diambil melalui webcam kemudian menerjemahkannya
ke huruf Latin melalui pengolahan citra digital dengan menggunakan Jaringan
Syaraf Tiruan Self Organizing Map (SOM).
2. Menganalisa performansi program aplikasi yang telah dibuat berdasarkan
parameter akurasi.
3. Menganalisa waktu yang dibutuhkan program untuk mendapatkan teks latin.
4. Menganalisa pengambilan gambar oleh webcam dari kemiringan yang berbeda
– beda.
Tugas akhir ini diharapkan dapat memberikan manfaat antara lain:
1. Sebagai media yang dapat membantu user mempelajari Aksara Lampung.
2. Sebagai media yang dapat membantu user membaca Aksara Lampung dalam
huruf Latin.
1.3. Rumusan Masalah
Permasalahan yang dijadikan obyek penelitian dan pengembangan tugas akhir ini
adalah sebagai berikut:
1. Bagaimana membentuk sebuah sistem pengambilan gambar aksara Lampung
dari webcam kemudian diproses secara langsung untuk diterjemahkan ke huruf
Latin dengan waktu yang cepat.
2. Bagaimana mengenali Aksara Lampung menggunakan Jaringan Syaraf Tiruan
Self-Organizing Map.
1.4. Batasan Masalah
Berdasarkan rumusan masalah yang telah diuraikan diatas maka batasan-batasan
masalah pada pembahasan tugas akhir ini adalah:
1. Text Aksara Lampung pada gambar yang akan diproses dalam posisi
mendatar.
2. Implementasi menggunakan bahasa pemrograman MATLAB
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
2
Bab I Pendahuluan
3. Text Aksara Lampung yang dapat di deteksi adalah Huruf dasar (aksara
nglegena) tanpa pasangannya, aksara Murda tanpa Pasangannya, aksara
Swara serta tanda baca.
1.5. Metodologi Penelitian
Metode penelitian pada tugas akhir ini meliputi beberapa tahapan, antara lain sebagai
berikut:
1. Mengumpulkan data melalui studi literatur dari buku-buku referensi dan jurnal
yang terkait. Studi literatur merupakan tahap pendalaman materi, identifikasi
permasalahan dan teori yang berkaitan dengan permasalahan dalam penelitian.
2. Menyusun algoritma untuk merancang program aplikasi yang akan dibuat dan
mengimplementasikannya dengan menggunakan bahasa pemrograman
MATLAB.
3. Pengujian dan analisa performansi yang bertujuan untuk mengukur akurasi
program aplikasi yang telah dibuat.
4. Pengambilan kesimpulan dari penelitian dalam membuat program aplikasi
penerjemah Aksara Lampung ke huruf Latin yang telah dilakukan.
1.6. Sistematika Penulisan
Sistematika Penulisan Laporan Tugas Akhir ini terdiri atas lima bab yang disusun
sebagai berikut:
BAB I : Pendahuluan
Bab ini membahas latar belakang pemilihan topik tugas akhir, tujuan
dan manfaat penelitian, perumusan masalah, batasan masalah, metode
penyelesaian masalah dan sistematika penulisan pada tugas akhir ini.
BAB II: Dasar Teori
Bab ini menjelaskan teori Aksara Lampung, citra digital, webcam,
Optical Character Recognition (OCR), Ekstraksi Ciri, Jaringan Syaraf
Tiruan Self Organizing Map (SOM).
BAB III: Perancangan dan Simulasi Sistem
Bab ini akan menguraikan tentang proses perancangan program
aplikasi pengenalan karakter Aksara Lampung.
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
3
Bab I Pendahuluan
BAB IV: Analisa Hasil
Bab ini akan menguraikan hasil dan analisa dari program aplikasi yang
telah dibuat.
BAB V: Kesimpulan dan Saran
Bab ini akan memberikan kesimpulan mengenai hal-hal yang telah
dibahas dalam tugas akhir ini dan diberikan pula saran-saran untuk
pengembangan topik yang dibahas dalam tugas akhir ini.
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
4
BAB II
DASAR TEORI
2.1. Pengertian Aksara Lampung
Aksara Lampung adalah salah satu bentuk penulisan bahasa lampung yang berbeda
dengan penulisan latin. Aksara ini lebih dikenal sebagai Hanacaraka. Struktur dari masing –
masing aksara Lampung paling tidak mewakili dua buah huruf (aksara) dalam huruf latin.
Sebagai contoh aksara Ha yang mewakili dua huruf yakni H dan A. Aksara Lampung
memiliki kedekatan dengan aksara Bali. Baik Aksara Lampung dan Aksara Bali merupakan
turunan dari aksara Brahmi, sebagaimana semua aksara Nusantara lainnya. Aksara Brahmi ini
sendiri adalah aksara yang digunakan di India semasa pemerintahan Raja Asoka (270 SM -
232 SM).
Aksara Lampung diantaranya terdiri dari 20 huruf dasar, empat sandhangan penutup
suku kata, dan beberapa tanda baca.
2.1.1. Huruf dasar (aksara nglegena)
Pada aksara Lampung hanacaraka baku terdapat 20 huruf dasar (aksara
nglegena),
Tabel 2.1 Aksara Nglegena
5
Bab II Dasar Teori
2.1.2. Aksara Murda
Pada aksara Lampung memiliki bentuk murda (hampir setara dengan huruf
kapital) yang seringkali digunakan untuk menuliskan kata-kata yang menunjukkan:
* Nama Gelar
* Nama Diri
* Nama Geografi
* Nama Lembaga Pemerintah
* Dan Nama Lembaga Berbadan Hukum.
(Kata-kata dalam Bahasa Indonesia yang menunjukkan hal-hal diatas biasanya diawali
dengan huruf besar atau kapital. Untuk itulah pada perangkat lunak ini kita gunakan
huruf kapital untuk menuliskan aksara murda atau pasangannya). Tidak semua aksara
yang ada di Hanacaraka memiliki bentuk Murdanya. Aksara murda dalam Hanacaraka
hanya berjumlah 7 buah.
Untuk aturan penulisan Aksara murda ini hampir sama dengan penulisan
aksara-aksara pokok di Hanacaraka, ditambah dengan beberapa aturan tambahan
yakni :
Murda tidak dapat dipakai sebagai sigeg (konsonan penutup suku kata).
Bila ditemui aksara murda menjadi sigeg, maka dituliskan bentuk
aksara pokoknya.
Bila dalam satu kata atau satu kalimat ditemui lebih dari satu aksara
murda, maka ada dua aturan yang dapat dipergunakan yakni dengan
menuliskan aksara murda terdepannya saja, atau dengan menuliskan
keseluruhan dari bentuk aksara mudra yang ditemui.
Berikut ini bentuk – bentuk dari Aksara Murda :
Tabel 2.2 Tabel Aksara Murda
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
6
Bab II Dasar Teori
2.1.3. Aksara Swara
Aksara Swara sebagaimana aksara Murda memiliki fungsi dan
kegunaan tertentu. Aksara Swara dalam penulisan Hanacaraka digunakan untuk
menuliskan aksara vokal yang menjadi suku kata, terutama yang berasal dari bahasa
asing, untuk mempertegas pelafalannya. Dalam menuliskan Aksara Swara, diikuti
aturan penulisan aksara swara sebagai berikut :
Aksara swara tidak dapat dijadikan sebagai aksara pasangan.
Bila aksara swara menemui sigegan (konsonan pada akhir suku kata
sebelumnya), maka sigegan itu harus dimatikan dengan pangkon.
Aksara swara dapat diberikan sandangan wignyan, layar, cecak, suku,
wulu dan lainnya.
Adapun bentuk Aksara Swara ini adalah sebagai berikut :
Tabel 2.3 Tabel Aksara Swara
2.1.4. Sandangan
Sandangan adalah tanda yang dipakai sebagai pengubah bunyi di dalam tulisan
Lampung. Di dalam tulisan lampung, aksara yang tidak mendapat sandangan
diucapkan sebagai gabungan anatara konsonan dan vokal a. Vokal a di dalam bahasa
Lampung mempunya dua macam varian, yakni /o / dan /a/.
Vokal a dilafalkan seperti o pada kata bom, pokok, tolong, tokoh doi
dalam bahasa Indonesia.
Vokal a dilafalkan /a/, seperti a pada kata pas, ada, siapa, semua di
dalam bahasa Indonesia.
Ada beberapa Sandangan di dalam aksara lampung, diantaranya adalah :
1. Sandangan Bunyi Vokal (Sandhangan Swara)
2. Sandangan Konsonan Penutup Suku Kata (Sandhangan Panyigeging
Wanda)
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
7
Bab II Dasar Teori
3. Sandangan gugus konsonan
2.1.4.1. Sandhangan Bunyi Vokal (Sandhangan Swara)
Sandangan bunyi vokal ada lima buah. Adapun bentuk dari
sandangan bunyi vokal ini adalah :
Tabel 2.4 Sandhangan Swara
2.1.4.2. Sandangan Konsonan Penutup Suku Kata (Sandhangan
Panyigeging Wanda)
Sandangan penutup suku kata ada 4 buah. Adapun bentuk dari
sandangan konsonan penutup suku kata ini adalah :
Tabel 2.5 Sandhangan Panyigeging Wanda
2.1.4.3. Sandangan gugus konsonan
Gugus konsonan adalah kumpulan dari dua konsonan dalam
Hanacaraka yang akan membentuk suatu suku kata. sebagai contoh kraton
yang dapat dipisah menjadi kra-ton. suku kata kra memiliki gugus konsonan
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
8
Bab II Dasar Teori
kr. Di dalam Hanacaraka ada lima buah gugus konsonan yang digunakan
dalam bentuk sandangan.
Tabel 2.6 Sandangan gugus konsonan
2.2 Webcam
Webcam (singkatan dari web camera) adalah sebutan bagi kamera real-time yang
gambarnya bisa diakses atau dilihat melalui World Wide Web, program instant messaging,
atau aplikasi video call. Istilah "webcam" juga merujuk kepada jenis kamera yang digunakan
untuk keperluan-keperluan tersebut.
Webcam termasuk kamera digital yang meng-upload gambar ke web server secara
kontinyu dan langsung dihubungkan ke PC. Tiap webcam memiliki spesifikasi tertentu, dan
memiliki resolusi tertentu juga.
Dalam tugas akhir yang akan dibuat, webcam digunakan untuk mengcapture gambar
Aksara Lampung yang akan diterjemahkan ke dalam huruf Latin.
2.3. Citra Digital
Citra merupakan suatu fungsi kontinu dari intensitas cahaya atau derajat keabuan
dalam bidang 2 dimensi yang dapat direpresentasikan dengan f(x,y), di mana x dan y
menyatakan koordinat posisi pixel itu berada, dan nilai f(x,y) menunjukkan intensitas (derajat
keabuan) pixel atau picture element pada koordinat tersebut [GON93]. Pixel itu sendiri
merupakan satuan atau elemen terkecil dari citra yang menempati suatu posisi yang
menentukan resolusi citra tersebut.
Ketika sebuah citra akan diolah dengan menggunakan komputer, maka nilai-nilai x, y,
dan f(x,y) harus berada pada jangkauan atau range tertentu yang jumlahnya terbatas. Citra
dengan ketentuan tersebut dinamakan citra digital. Secara matematis persamaan untuk fungsi
intensitas f(x,y) adalah:
0 ≤ f(x,y)<∞
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
9
Bab II Dasar Teori
Misalkan f merupakan sebuah citra digital 2 dimensi berukuran NxM. Maka
representasi f dalam sebuah matriks dapat dilihat pada gambar di bawah ini, di mana f(0,0)
berada pada sudut kiri atas dari matriks tersebut, sedangkan f(n-1,m-1) berada pada sudut
kanan bawah.
Gambar 2.1 Representasi Matriks Citra Digital
2.4. Optical Character Recognition (OCR)
OCR (Optical Character Recognition) adalah sebuah sistem komputer yang dapat
membaca huruf, baik yang berasal dari sebuah pencetak (printer atau mesin ketik) maupun
yang berasal dari tulisan tangan. Adanya sistem pengenal huruf ini akan meningkatkan
fleksibilitas ataupun kemampuan dan kecerdasan sistem komputer. Dengan adanya sistem
OCR maka user dapat lebih leluasa memasukkan data karena user tidak harus memakai papan
ketik tetapi bisa menggunakan pena elektronik untuk menulis sebagaimana user menulis di
kertas. Adanya OCR juga akan memudahkan penanganan pekerjaan yang memakai input
tulisan seperti penyortiran surat di kantor pos, pemasukan data buku di perpustakaan, dll.
Adanya sistem pengenal huruf yang cerdas akan sangat membantu usaha besar-besaran yang
saat ini dilakukan banyak pihak yakni usaha digitalisasi informasi dan pengetahuan, misalnya
dalam pembuatan koleksi pustaka digital, koleksi sastra kuno digital, dll.
OCR dapat dipandang sebagai bagian dari pengenal otomatis yang lebih luas yakni
pengenal pola otomatis (automatic pattern recognition). Dalam pengenal pola otomatis,
sistem pengenal pola mencoba mengenali apakah citra masukan yang diterima cocok dengan
salah satu citra yang telah ditentukan. Sistem ini misalnya dipakai untuk mendeteksi sidik
jari, tandatangan, bahkan wajah seseorang.
Ada banyak pendekatan yang dapat dipakai untuk mengembangkan pembuatan
pengenal pola otomatis antara lain memakai pendekatan numerik, statistik, sintaktik, neural
dan, aturan produksi (rule-based). Secara umum metode-metode tersebut dapat digolongkan
menjadi dua kelompok metode yakni metode berbasis statistik dan metode berbasis struktur.
Dalam metode yang berbasis statistik, setiap pola ditransformasi ke dalam vektor yang
memakai ukuran dan karakteristik tertentu. Karakteristik ini seringkali lebih bersifat statistik
misalnya distribusi pixel ataupun jarak pixel. Sedang dalam metode yang berbasis struktur,
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
10
Bab II Dasar Teori
setiap pola yang diproses dinyatakan sebagai gabungan beberapa struktur elementer.
Pengenalan selanjutnya dilakukan dengan mencocokkan komposisi struktur elementer dengan
struktur yang sudah disimpan memakai aturan tertentu misalnya memakai pendekatan teori
bahasa formal dan automata.
2.5. Ekstraksi Ciri
Ekstraksi Ciri merupakan cara untuk mengambil ciri (feature) yang ada pada sebuah
citra. Ciri tersebut bisa berupa simbolik, numerik, maupun keduanya. Ciri pada karakter dapat
dicari dengan perhitungan statistik pada tiap karakter. Hasil dari ekstraksi ciri, merupakan
input untuk pengenalan pola pada Jaringan Syaraf Tiruan.
2.6. Jaringan Syaraf Tiruan
Jaringan Syaraf Tiruan diinspirasikan oleh struktur jaringan sel-sel syaraf di dalam
otak, merupakan salah satu representasi buatan dari otak manusia yang selalu mencoba untuk
mensimulasikan proses pembelajaran pada otak manusia tersebut. Istilah buatan digunakan
karena jaringan syaraf ini diimplementasikan dengan menggunakan program komputer yang
mampu menyelesaikan sejumlah proses perhitungan selama proses pembelajaran,
pengenalan, pengamatan serta pengambilan keputusan. Menurut Haykin, S. (1994), ”Sebuah
jaringan saraf adalah sebuah prosesor yang terdistribusi paralel dan mempuyai
kecenderungan untuk menyimpan pengetahuan yang didapatkannya dari pengalaman dan
membuatnya tetap tersedia untuk digunakan. Hal ini menyerupai kerja otak dalam dua hal
yaitu:
1. Pengetahuan diperoleh oleh jaringan melalui suatu proses belajar,
2. Kekuatan hubungan antar sel saraf yang dikenal dengan bobot sinapsis digunakan untuk
menyimpan pengetahuan.”
Jaringan Syaraf Tiruan memanfaatkan struktur pengolahan paralel atas sejumlah
pengolah sederhana dan hubungan antar pengolah tersebut. Dalam jaringan syaraf tiruan,
terdapat elemen pengolah yang merupakan model dari neuron. Setiap hubungan elemen
pengolah menentukan kemampuan JST. Seperti halnya jaringan syaraf biologis, JST juga
memiliki kemampuan untuk belajar dan beradaptasi terhadap masukan-masukannya. JST
tidak perlu diprogram secara eksplisit, karena JST dapat belajar dari beberapa contoh
pelatihan. Secara umum proses pembelajaran pada jaringan syaraf tiruan dibagi menjadi dua
macam, yaitu:
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
11
Bab II Dasar Teori
1. Belajar dengan pengawasan (Supervised Learning)
Pada metode supervised learning jaringan diberikan vektor target yang harus
dicapai sebagai dasar untuk mengubah hubungan interkoneksi atau bobot pada
jaringan. Contoh jaringan yang belajar dengan pengawasan adalah
Backpropagation dan Perceptron.
2. Belajar Tanpa Pengawasan (Unsupervised Learning)
Berbeda dengan supervised learning yang masih membutuhkan pengawasan
dan sangat tergantung pada knowledge yang diberikan pada pembangunan
jaringan, metode unsupervised learning ini melatih jaringan terhadap suatu
inputan tanpa adanya pengawasan, dimana vektor target tidak ditentukan.
Vektor masukan dimasukkan ke dalam jaringan, kemudian sistem akan
mengatur dirinya sendiri sedemikian rupa sehingga dihasilkan keluaran yang
konsisten bilamana pola yang menyerupai vektor masukan tersebut diberikan.
Contoh jaringan yang belajar tanpa pengawasan adalah Adaptive Resonance
Theory 2 (ART 2), Self Organizing Map (SOM), dan Learning Vector
Quantization (LVQ).
2.6.1. Self Organizing Map (SOM)
JST SOM dikembangkan oleh Prof. Teuvo Kohonen (Finland) yang
merupakan model JST dengan metode pembelajaran unsupervised learning. Ide dasar
teknik ini sendiri diilhami dari bagaimana proses otak manusia menyimpan gambar
atau pola yang telah dikenalinya melalui mata, kemudian mampu mengungkapkannya
kembali gambar atau pola tersebut. Pada mata manusia hal tersebut merupakan hasil
proses pemetaan dari retina menuju cortex, sehingga aplikasi model JST ini banyak
digunakan pada pengenalan obyek atau pola citra visual dan juga untuk menganalisa
data pada dimensi tinggi. SOM ini merupakan proses klarifikasi yang mampu
mempertahankan pola kemiripan pola masukan agar tidak berubah sapa pada keluaran
proses. Topologi mempertahankan kemiripan pola inilah yang berguna bagi proses
pengklarifikasian data, terutama yang jumlahnya besar.
Jaringan ini tersusun dari dua buah layer, masing-masing lapisan input dan
lapisan output, dimana pada setiap neuron dalam lapisan input dan lapisan output
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
12
Bab II Dasar Teori
saling terhubung. Setiap neuron dalam lapisan output merepresentasikan kelas
(cluster) dari input yang diberikan. Pada SOM sejalan dengan proses belajar yang
dilakukan dengan mengumpankan data pada vektor masukan dan menghasilkan
keluaran jaringan dengan profil input yang paling mirip yang telah dikelompokkan ke
dalam wilayah yang sama pada lapisan cluster. Ukuran kedekatan atau kemiripan
yang biasa dipakai adalah jarak Euclidean yang paling minimum. Bobot vektor contoh
berfungsi sebagai penentu kedekatan suatu vector dengan input yang diberikan.
Selama proses pengaturan berlangsung, vector contoh yang berada paling dekat
dengan masukan inilah yang akan menjadi vector pemenang dan vektor-vektor
tetangganya akan dimodifikasi bobotnya.
Gambar 2.2 Struktur JST Self Organizing Map (SOM)
Algoritma SOM adalah sebagai berikut:
Langkah 1: Inisialisasi pembobotan Wij dengan nilai random. Mengeset parameter
laju pemahaman (α) dan faktor penurunannya serta radius
neighbourhood (R)
Langkah 2: Selama kondisi penghentian bernilai salah, lakukan langkah 2-7
Langkah 3: Untuk tiap vektor input x(xi, i =1,…,n), lakukan langkah 3-5
Langkah 4: Untuk setiap j (j =1,...m), hitung jarak Euclidean untuk mendapatkan
node output terbaik (Best Maching Unit / BMU)
…………(2.1)
Langkah 5: Mencari indeks J dengan jarak d(J) minimum
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
13
Bab II Dasar Teori
Langkah 6: Tentukan tetangga BMU yang masih berada dalam radius jari-jari dari
BMU
Langkah 7: Melakukan perbaikan nilai wji untuk setiap unit j di sekitar J, yaitu
wji(baru) = wji(lama) + α [xi – wji(lama)] …………(2.2)
α = laju pemahaman
w = bobot
x = input pixel
Langkah 8: Memodifikasi laju pemahaman. Laju pemahaman pada Kohonen SOM
tidak bernilai konstan untuk setiap iterasinya. Nilai laju pemahaman
selalu berubah tergantung dari faktor penurunan yang dipakai. Contoh
nilai laju pemahaman awal α=0.4 dan pada tiap iterasinya nilai laju
pemahaman akan diubah berdasarkan persamaan α^baru=0.5xα^lama.
Langkah 9: Uji kondisi penghentian
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
14
BAB III
PERANCANGAN DAN SIMULASI SISTEM
3.1. Pemodelan Simulasi Sistem
Gambar 3.1 Pemodelan Simulasi Sistem
Sistem terdiri dari perangkat akuisisi gambar, PC (personal computer), dan software.
Sedangkan perangkat akuisisi gambar itu sendiri adalah webcam yang berguna untuk
mencapture teksnya. Dimana webcam ini terhubung ke Personal Computer.
3.2. Proses Akuisisi Gambar
Proses pengambilan gambar dilakukan melalui GUI (Graphical User Interface) pada
software, gambar yang diakuisisi langsung diolah untuk mendapatkan terjemahan karakter
dari gambar yang diakuisisi tersebut.
3.3. Proses Penerjemahan Aksara Lampung
Secara umum implementasi pembacaan Aksara Lampung yang dirancang dapat
digambarkan dalam diagram alir berikut:
15
Bab III Perancangan dan Simulasi Sistem
(a) Proses Belajar (b) Proses Uji
Gambar 3.2 Diagram Alir Simulasi Sistem
Dari gambar di atas terlihat bahwa sistem akan terdiri dari 2 buah proses utama yang
saling berkaitan, yaitu proses learning (belajar) dan proses pengujian. Dalam hal ini proses
learning harus dilakukan sebelum proses pengujian karena output dari proses learning
menjadi salah satu input yang dibutuhkan dalam proses pengujian.
3.3.1. Proses Belajar
Proses Belajar terdiri dari :
1. Citra Latih
Citra latih merupakan citra digital dengan format .jpg yang telah dipotong
secara manual untuk mendapatkan citra karakter.
2. Preprocessing
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
16
Bab III Perancangan dan Simulasi Sistem
Tahap preprocessing merupakan suatu proses untuk menghilangkan bagian-
bagian yang tidak diperlukan pada gambar input untuk proses selanjutnya.
Beberapa contoh preprocessing adalah noise filtering.
3. Segmentasi
Pada segmentasi, prosesnya adalah memisahkan area pengamatan (region)
pada tiap karakter yang akan dideteksi.
4. Normalisasi
Normalisasi adalah proses merubah dimensi region tiap karakter dan
ketebalan karakter.
5. Ekstraksi Ciri
Ekstraksi Ciri adalah proses untuk mengambil ciri-ciri tertentu dari
karakter yang diamati.
6. Pelatihan dengan JST
Proses ini dilakukan untuk melatih data yang ada agar mendapatkan kelas-
kelas dari tiap karakter.
7. Hasil Pelatihan dan Klasifikasi
Dari hasil pelatihan dengan JST, akan didapatkan pengklasifikasian tiap
karakter yang akan dikenali.
3.3.2. Proses Uji
Proses Belajar terdiri dari :
1. Image Capturing
Pada proses ini dilakukan pengambilan gambar menggunakan webcam,
kemudian melalui program dilakukan snap-shoot untuk mendapatkan citra
yang mengandung karakter.
2. Preprocessing
Tahap preprocessing merupakan suatu proses untuk menghilangkan
bagian-bagian yang tidak diperlukan pada gambar input untuk proses
selanjutnya. Beberapa contoh preprocessing adalah noise filtering.
3. Segmentasi
Pada segmentasi, prosesnya adalah memisahkan area pengamatan (region)
pada tiap karakter yang akan dideteksi.
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
17
Bab III Perancangan dan Simulasi Sistem
4. Normalisasi
Normalisasi adalah proses merubah dimensi region tiap karakter dan
ketebalan karakter agar sesuai dengan ukuran karakter yang sudah dilatihkan.
5. Ekstraksi Ciri
Ekstraksi Ciri adalah proses untuk mengambil ciri-ciri tertentu dari
karakter yang diamati.
6. Pengenalan Karakter
Proses pengenalan menggunakan algoritma JST yang sudah dilatih
sebelumnya dan mengklasifikasikan karakter sesuai ciri yang dimiliki.
7. Hasil dan Kesimpulan
Penyajian dari hasil penerjemahan karakter.
(a) (b)
(c)
(d)
(e)
(a) Citra Input; (b) Citra Grayscale; (c) Hasil Segmentasi Tepi;
(d) Hasil Segmentasi Tiap Karakter dan Normalisasi; (e) Output Sistem
| DESAIN DAN IMPLEMENTASI SISTEM PENERJEMAH AKSARA LAMPUNG KE HURUF LATIN BERBASIS PENGOLAHAN CITRA DIGITAL DAN JARINGAN SYARAF TIRUAN SELF-ORGANIZING MAP
(SOM) |
18
Sa-ya – se-dang - si-dang - a-hir
BAB IV
BENTUK KELUARAN YANG DIHARAPKAN
4.1 Hasil Yang Diharapkan
Keluaran yang diharapkan dari tugas akhir ini adalah dihasilkan suatu alat bantu yang
bisa menerjemahkan aksara Lampung ke huruf Latin dengan tingkat akurasi lebih dari 75
persen, sehingga sistem layak untuk diaplikasikan di lapangan.
19
RENCANA KEGIATAN
Bulan Bulan I Bulan II Bulan III Bulan IV Bulan V Bulan VI
Minggu 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
Tahap Awal
Studi pustaka dan literatur
Pendefinisian masalah
Analisa kebutuhan
Desain global
Desain rinci
Tahap Simulasi
Pembuatan program Penyusunan teori pendukung
Pembahasan
Tahap Akhir
Evaluasi
Revisi
Penyusunan buku laporan
viii
DAFTAR PUSTAKA
[1] Fitria, Whielda.Tugas Akhir.2008. Desain Dan Implementasi Sistem Penerjemah Huruf
Jepang Kana(Hiragana-Katakana) Ke Huruf Latin Berbasis Pengolahan Citra Digital
Dan Jaringan Syaraf Tiruan Self-Organizing Map (SOM) Menggunakan
Webcam.Jurusan Teknik Telekomunikasi IT Telkom Bandung.
[2] Sukmawan, Arief.Tugas Akhir.2008.Implementasi Pembacaan Huruf Hijaiyyah dengan
Pendekatan Struktur Melalui Ekstraksi Ciri Vektor dan Pengenalan Menggunakan Jaringan
Syaraf Tiruan SOMs (Self-Organizing Maps).Jurusan Teknik Telekomunikasi IT Telkom
Bandung.
[3] http://hanacaraka.fateback.com/
[4] http://id.wikipedia.org/wiki/Hanacaraka
[5] http://id.wikibooks.org/wiki/Pengantar_aksara_Lampung
[6] http://knightpion.multiply.com/journal/item/2
ix