PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB

23
PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB M. ALBADR LUTAN NASUTION 13508011

description

PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB. M. ALBADR LUTAN NASUTION 13508011. Latar Belakang. Rumusan Masalah. Tujuan. citra. alih aksara, terjemah, pencarian, suara , . teks. p iksel sulit diolah. huruf dapat disunting dapat dicari. OCR. Studi Literatur. - PowerPoint PPT Presentation

Transcript of PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB

Page 1: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

PENGEMBANGAN SISTEM PENGENALAN HURUF ARAB

M. ALBADR LUTAN NASUTION13508011

Page 2: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Latar Belakang

OCR sangat praktikal 50 bahasa 200 juta

jiwa

Tertinggal vs latin

Segmentasi minim

Page 3: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Rumusan Masalah

Segmentasi yg mendukungSkema hubungan komponenKinerja

Page 4: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Tujuan

citra• piksel• sulit diolah

teks• huruf• dapat disunting• dapat dicari

OCR

Page 5: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Studi Literatur

• Tulisan Arab: 31 huruf, kursif, 4 bentuk, titik• Akuisisi Data: Online vs Offline• Tahapan Umum OCR:

Praproses Segmentasi RepresentasiPelatihan

dan Pengenalan

Pascaproses

Piksel Fitur Huruf Kata Kalimat Makna

Page 6: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Penelitian Terkait• Sarfraz, dkk (2003): Pengenalan nomor plat kendaraan dg.

pencocokan templat

• Al-Taani dan Al-Haj (2010): Pengenalan huruf online dg. pohon keputusan

• Sarhan dan Al-Helalat (2007): Pengenalan huruf dg. JST dan fitur standar devisasi dan piksel

• Zidouri (2010): Metode segmentasi baru dan pengenalan dua tingkat: templat dan JST

• Abandah,dkk (2009): Ragam fitur huruf dan kombinasi pengenaan statistik

Nasution
Pelajari lagi.Itu yang templat di Zidouri apa ya?
Page 7: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Alur Proses

Praolah

Segmentasi

Penipisan

Ekstraksi Fitur

Klasifikasi

Nasution
Layout?Tambahi daftar praposes, daftar penipisan, dll.Satu halaman untuk skema pengujian, dan satu buat hasil pengujiannya.
Page 8: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Praolah

Median Filter Binerisasi

Tinggi 64 Piksel Lini Basis

64 piksellini basis

P1’ = median (P1..P9)

BLACK if RG||GB||RB

Page 9: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Penipisan

Algoritma Hilditch

Templat Cowell Hussain

Templat Ketebalan

2 < = B(p1) < = 6A(p1)=1

p2.p4.p8=0 or A(p2)!= 1p2.p4.p6=0 or A(p4)!= 1

Page 10: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Segmentasi

Baris• Proyeksi horizontal

Upakata• Analisis piksel bersambung• Badan utama vs objek sekunder

Huruf• Algoritma Zidouri (2010)

Page 11: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Segmentasi Baris

Page 12: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Segmentasi Upakata

Tiap sangkar digolongkan ke: “badan utama”, “objek sekunder”, dan “derau”

Amin (2000)

Page 13: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Segmentasi Huruf

Masukkan fitur ke rule

Ekstrak fitur setiap kandidat

Masukkan sebagai pita kandidat

Cek panjang deretan dan piksel atas bawah

Cari deretan piksel

Tipiskan

Zidouri (2010)

Page 14: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Ekstraksi Fitur

• Rasio aspek• Proyeksi• Distribusi piksel• Jumlah lubang

Badan Utama

• Titik minat• Rantai kode• Panjang keliling• Diag/keliling• Rasio kekompakan

Tulang & Keliling

• Jumlah• Posisi• Jenis komponen

Komponen Sekunder

Page 15: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Klasifikasi

C4.5 (J48)

Badan Utama

WekaPohon Keputusan

++ Objek Sekunder

Page 16: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Data Uji

Teks Arab 37 Halaman Sumber: Wikipedia

Page 17: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Prosedur Pengujian

Fungsional

• Cek sampel hasil setiap proses

• Hingga fungsi dianggap cukup baik

Segmentasi

• Data uji: seluruh citra dokumen

• Simpan citra hasil tiap segmentasi

• Hitung citra hasil (manual)

• Benar, Undersegmentasi, Oversegmentasi

Klasifikasi

• Pembelajaran dari citra huruf tunggal manual tiap font

• Kinerja komponen: validasi silang setiap font pada data latih

• Kinerja sistem: cek dan hitung tebakan seluruh huruf pada data uji citra dokumen

Page 18: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Skrinsyut

Citra asli

Setelah praolah

Penipisan

Pengotakan

Seg. huruf

Page 19: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Antarmuka

Page 20: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Hasil Uji: Seg. Baris

Jenis Huruf B O K

Arial 99% 1% 21%Arial Unicode MS 99% 1% 9%Microsoft Sans Serif 98% 2% 2%Segoe UI 98% 2% 27%Tahoma 98% 2% 13%Traditional Arabic 97% 3% 33%

Benar 98%. Under 0%. Over 2%.

Page 21: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Benar 86%. Under 8%. Over 6%.

Hasil Uji: Seg. Huruf

Jenis Huruf B U O

Arial 84% 11% 5%Arial Unicode MS 79% 17% 4%Microsoft Sans Serif 54% 43% 3%Segoe UI 91% 2% 7%Tahoma 92% 2% 6%Traditional Arabic 46% 50% 4%

Benar 74%. Under 21%. Over 5%.

Page 22: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

demo?

Page 23: PENGEMBANGAN SISTEM  PENGENALAN HURUF ARAB

Terima kasih.