Pengenalan Text Menggunakan Teknik Principal Component Analyst

3
Optical Character Recognition dengan PCA Oleh : www.softscients.web.id Setelah sukses handwriting recognition dengan teknik zoning, penulis juga berkeinginan untuk melakukan penerapan pada kasus lainnya yaitu untuk karakter huruf. Batasan masalahnya pada huruf besar (uppercase) saja. Algoritma didesain hanya untuk tahap recognition sehingga citra huruf sudah tersaji dengan baik alias tidak menggunakan tahap detection. Algoritma ini didesain untuk robust terhadap berbagai jenis font type dan size.

description

Pengenalan Text Menggunakan Teknik Principal Component Analyst, ahli matlab, text recognition, PCA, OCR recognition, softscients, IT outsourcing service

Transcript of Pengenalan Text Menggunakan Teknik Principal Component Analyst

Optical Character Recognition dengan PCAOleh : www.softscients.web.id

Setelah sukses handwriting recognition dengan teknik zoning, penulis juga berkeinginan untuk melakukan penerapan pada kasus lainnya yaitu untuk karakter huruf. Batasan masalahnya pada huruf besar (uppercase) saja. Algoritma didesain hanya untuk tahap recognition sehingga citra huruf sudah tersaji dengan baik alias tidak menggunakan tahap detection. Algoritma ini didesain untuk robust terhadap berbagai jenis font type dan size.

Lagi-lagi penulis menggunakan bahasa functional yaitu matlab dan pythonPython digunakan untuk membuat database ribuan citra huruf dari berbagai ratusan jenis font type, sedangkan matlab digunakan sebagai core languange nya (rencana mau diporting ulang ke python). Sebagai core engine nya menggunakan teknik PCA, penulis membutuhkan waktu sekitar 20 menit untuk membuat data pelatihan nya mengingat menggunakan ribuan data sehingga waktu komputasi menjadi bengkak!

Sebagai uji coba, penulis membuat sebuah tulisan yang terdiri dari jenis font type dan ukuran nya! Kamu bisa lihat! Ternyata cukup robust bukan!

Kamu pun bisa menggunakan algoritma yang penulis gunakan untuk riset selanjut nya yaitu plate recognition! Krena lebih mudah! Yaitu hanya terdiri dari karakter angka dan uppercase! Akan tetapi kamu juga jangan lupa untuk menerapkan algoritma detection nya!

Terkadang bagi pemula untuk istilah detection dan recognition dicampuradukan! Padahal hal tersebut berbeda jauh! Output dari detection berupa ADA TIDAK Sedangkan recognition berupa OBJEK INI ADALAH HURUF A atau B, jadi hati2 saja bagi kamu untuk nulis judul paper dan algoritma yang digunakan! Jangan terbalik ya!