PENGENALAN UCAPAN METODA MFCC-HMM UNTUK …

10
Vol: 2 No.1 Maret 2013 ISSN : 2302-2949 Jurnal Nasional Teknik Elektro 31 PENGENALAN UCAPAN METODA MFCC-HMM UNTUK PERINTAH GERAK ROBOT MOBIL PENJEJAK IDENTIFIKASI WARNA Fitrilina, Rahmadi Kurnia, Siska Aulia Program Studi Teknik Elektro, Fakultas Teknik Universitas Andalas Email: [email protected] ABSTRAK Dewasa ini, teknologi human machine cukup berkembang dan mendapatkan perhatian.. Dua bidang yang cukup berperan dalam perkembangan teknologi human machine adalah pemrosesan suara dan pemrosesan image. Penelitian ini mengimplementasikan pemrosesan suara dan image pada sistem robot mobil sehingga robot dapat mendengar, melihat, memberi respon dan diperintah berdasarkan ucapan. Sistem pengenalan ucapan menggunakan Mel Frequency Cepstrum Coefficient (MFCC) dan Hidden Markov Model (HMM). Robot mobil melakukan tracking objek berdasarkan empat jenis warna yaitu merah kuning, hijau dan biru. Pada penelitian ini segmentasi menggunakan metode multilevel color thresholding pada ruang warna HIS. Keluaran dari sistem robot mobil dihubungkan ke motor servo standar sebagai penggerak kamera dalam proses tracking objek. Keluaran sistem berupa gerakan horizontal kamera dan respon maju yang dilakukan robot mobil berdasarkan ucapan yang dikenali. Hasil pengujian untuk pengenalan ucapan sumber terlatih 83,33% dan untuk sumber tidak dilatih sebesar 80,25%. Sedangkan pengujian untuk objek tracking berdasarkan ucapan yang dikenali mencapai keberhasilan 100%. Oleh karena itu dapat disimpulkan bahwa robot dapat mentracking dan merespon objek. Kata kunci : pengenalan ucapan, segmentasi, tracking objek I. PENDAHULUAN Teknologi pada prinsipnya dikembang- kan sebagai alat atau sarana yang dapat membantu dan memberi kemudahan bagi manusia untuk melakukan kegiatan dalam hidupnya. Seiring dengan perkembangan teknologi, manusia selalu menginginkan peningkatan kualitas dan kepraktisan dari alat- alat tersebut. Oleh karena itu dibutuhkan mesin- mesin yang dapat berinteraksi dengan manusia atau yang dikenal dengan teknologi human machine. Dewasa ini, Teknologi human machine telah telah cukup berkembang. Salah satu bidang yang mendukung teknologi human machine adalah Automatic Speech Recognition (ASR). ASR berusaha menciptakan mesin yang memiliki kemampuan mengartikan informasi yang diucapkan manusia dan bertindak sesuai dengan informasi tersebut. Selain ASR, dalam bidang human machine juga berkembang teknologi visual mesin (Machine vision). Teknologi ini berusaha menciptakan mesin yang dapat mengenali area disekitarnya, mempunyai persepsi yang sama dengan mata manusia dalam mengamati sebuah objek. Pada penelitian ini, dikembangkan robot mobil yang dapat mendengar, melihat dan memberi respon berdasarkan perintah suara yang diberikan. Robot mobil dapat mencari warna yang sesuai dengan suatu perintah ucapan dari beberapa warna yang ditampilkan. Penelitian ini menggabungkan speech processing dengan image processing untuk object tracking video berdasarkan warna. Pada Penelitian ini sistem bersifat isolated word recognitions dengan ucapan merah, kuning, hijau dan biru, menggunakan kamera tunggal jenis web camera yang terhubung ke komputer dengan resolusi video adalah 320x240 piksel dan frame rate 30 fps, menggunakan robot jenis beroda, dimana motor servo DC satu poros dengan kamera. Motor servo yang digunakan adalah keluaran parallax jenis motor servo dc standar 180 0 dan menggunakan Mikrokontroler jenis AT89C51. II. TINJAUAN PUSTAKA 2.1 Sistem Pengenalan Ucapan

Transcript of PENGENALAN UCAPAN METODA MFCC-HMM UNTUK …

Page 1: PENGENALAN UCAPAN METODA MFCC-HMM UNTUK …

Vol: 2 No.1 Maret 2013 ISSN : 2302-2949

Jurnal Nasional Teknik Elektro 31

PENGENALAN UCAPAN METODA MFCC-HMM UNTUK PERINTAHGERAK ROBOT MOBIL PENJEJAK IDENTIFIKASI WARNA

Fitrilina, Rahmadi Kurnia, Siska AuliaProgram Studi Teknik Elektro, Fakultas Teknik

Universitas AndalasEmail: [email protected]

ABSTRAK

Dewasa ini, teknologi human machine cukup berkembang dan mendapatkan perhatian.. Dua bidangyang cukup berperan dalam perkembangan teknologi human machine adalah pemrosesan suara danpemrosesan image. Penelitian ini mengimplementasikan pemrosesan suara dan image pada sistem robotmobil sehingga robot dapat mendengar, melihat, memberi respon dan diperintah berdasarkan ucapan.Sistem pengenalan ucapan menggunakan Mel Frequency Cepstrum Coefficient (MFCC) dan HiddenMarkov Model (HMM). Robot mobil melakukan tracking objek berdasarkan empat jenis warna yaitumerah kuning, hijau dan biru. Pada penelitian ini segmentasi menggunakan metode multilevel colorthresholding pada ruang warna HIS. Keluaran dari sistem robot mobil dihubungkan ke motor servostandar sebagai penggerak kamera dalam proses tracking objek. Keluaran sistem berupa gerakanhorizontal kamera dan respon maju yang dilakukan robot mobil berdasarkan ucapan yang dikenali. Hasilpengujian untuk pengenalan ucapan sumber terlatih 83,33% dan untuk sumber tidak dilatih sebesar80,25%. Sedangkan pengujian untuk objek tracking berdasarkan ucapan yang dikenali mencapaikeberhasilan 100%. Oleh karena itu dapat disimpulkan bahwa robot dapat mentracking dan meresponobjek.

Kata kunci : pengenalan ucapan, segmentasi, tracking objek

I. PENDAHULUAN

Teknologi pada prinsipnya dikembang-kan sebagai alat atau sarana yang dapatmembantu dan memberi kemudahan bagimanusia untuk melakukan kegiatan dalamhidupnya. Seiring dengan perkembanganteknologi, manusia selalu menginginkanpeningkatan kualitas dan kepraktisan dari alat-alat tersebut. Oleh karena itu dibutuhkan mesin-mesin yang dapat berinteraksi dengan manusiaatau yang dikenal dengan teknologi humanmachine.

Dewasa ini, Teknologi human machinetelah telah cukup berkembang. Salah satubidang yang mendukung teknologi humanmachine adalah Automatic Speech Recognition(ASR). ASR berusaha menciptakan mesin yangmemiliki kemampuan mengartikan informasiyang diucapkan manusia dan bertindak sesuaidengan informasi tersebut. Selain ASR, dalambidang human machine juga berkembangteknologi visual mesin (Machine vision).Teknologi ini berusaha menciptakan mesinyang dapat mengenali area disekitarnya,

mempunyai persepsi yang sama dengan matamanusia dalam mengamati sebuah objek.

Pada penelitian ini, dikembangkan robotmobil yang dapat mendengar, melihat danmemberi respon berdasarkan perintah suarayang diberikan. Robot mobil dapat mencariwarna yang sesuai dengan suatu perintahucapan dari beberapa warna yang ditampilkan.Penelitian ini menggabungkan speechprocessing dengan image processing untukobject tracking video berdasarkan warna. PadaPenelitian ini sistem bersifat isolated wordrecognitions dengan ucapan merah, kuning,hijau dan biru, menggunakan kamera tunggaljenis web camera yang terhubung ke komputerdengan resolusi video adalah 320x240 pikseldan frame rate 30 fps, menggunakan robot jenisberoda, dimana motor servo DC satu porosdengan kamera. Motor servo yang digunakanadalah keluaran parallax jenis motor servo dcstandar 1800 dan menggunakan Mikrokontrolerjenis AT89C51.

II. TINJAUAN PUSTAKA

2.1 Sistem Pengenalan Ucapan

Page 2: PENGENALAN UCAPAN METODA MFCC-HMM UNTUK …

Vol: 2 No.1 Maret 2013 ISSN : 2302-2949

Jurnal Nasional Teknik Elektro 32

Gambar 1 : sistem pengenalan ucapan.a).pelatihan b).pengenalan[1]

Sistem pengenalan ucapan dibentukmelalui dua proses utama yaitu pelatihan(training) dan pengenalan (recognition). Secaraumum proses pembentukan sistem pengenalanucapan dapat dilihat pada gambar 1. Padaproses pelatihan dan pengenalan, dilakukanekstraksi ciri terhadap setiap sinyal ucapan darimasing-masing kata sehingga dihasilkan vektorciri untuk masing-masing ucapan. Pada prosespelatihan, vektor ciri digunakan untukmembentuk model akustik yang merepre-sentasikan suatu kata. Model akustik tersebutdisimpan dan dijadikan sebagai pola referensi.Pada proses pengenalan, vektor ciri dibanding-kan dengan semua model akustik pada basisdata. Model akustik dengan peluang terbesaryang akan dipilih sebagai model akustik darivektor ciri tersebut [1]. Pada penelitian iniekstraksi ciri menggunakan MFCC dan prosespelatihan dan pengenalan menggunakan HiddenMarkov Model (HMM).

2.2 Mel Frequency Cepstral Coefficient

Gambar 2. Proses MFCC

Ekstraksi sinyal ucapan dengan menggunakanMFCC dapat dilihat sperti pada gambar 2 danmengalami proses sebagai beikut :

Frame blocking : membagi suara menjadiframe-frame dengan durasi 20-30 mssehingga sinyal suara dapat dianggapstasioner

Pre-emphasis : cuplikan sinyal dalambentuk digital ditapis dengan menggunakanFIR filter orde satu untuk meratakan spektralsinyal .

Windowing : dilakukan pada setiap frameuntuk meminimalisasi ketidak kontinuan ataumengurangi distorsi spektrum pada awal danakhir frame. Window yang digunakanadalah Hamming window

Fast Fourier Transform : mengubahmasing-masing frame N sampel dari domainwaktu menjadi domain frekuensi.

Mel-Frequency Wrapping :Skala frekuensimel merupakan suatu skala yang bersifatlinier untuk frekuensi di bawah 1000 Hz danlogaritmis pada frekuensi diatas 1000 Hz.Untuk mendapatkan koefisien mel makadigunakan mel filter bank. Mel filter bankadalah filter bank berbentuk segitiga sepertipada gambar 3

Gambar 3 Filter Bank Segitiga

Secara matematis filter bank segitiga inidapat didefenisikan dalam bentuk hubunganseperti persamaan 4

0)/()(

1)/()(

0

),(

11

11

iii

iii

kkkk

kkkkkiF

1

1

1

1

i

ii

i

ii

i

kkkkk

kkkkk

kk

(1)

Dimana: F(i,k) = frekuensi dalam filter bankk = frekuensi yang bernilai 1000

Hz Cepstrum : Untuk mendapatkan koefisien

cepstrum maka koefisien mel diproses

Ucapan

Ekstraksi Ciri

HasilpengenalanPemodel

an

PencocokanModel

ModelAkustik

Keputusan

Vektor Ciri

a

b

b

Frame Blocking

Pre-emphasisframe

spektrum

mel spektrum

Mel Frequency Wrapping

FFT(Fast Fourier Transform)

Cepstrum

suara masukan

Windowing

mel cepstrum

Page 3: PENGENALAN UCAPAN METODA MFCC-HMM UNTUK …

Vol: 2 No.1 Maret 2013 ISSN : 2302-2949

Jurnal Nasional Teknik Elektro 33

dengan menggunakan Discrete cosinustransform (DCT).

2.3 Hidden Markov Model (HMM)Hidden Markov Model berdasarkan deret

observasi dapat dibedakan atas Diskrit HMM(DHMM) dan Continous HMM (CHMM). Padapenelitian ini deret observasi adalah hasilekstraksi ciri dari sinyal suara sehinggadiproses dengan menggunakan ContinousHMM. Pada CHMM ada beberapa parametermodel yaitu:1. N adalah jumlah state pada model.2. M adalah jumlah mixture gaussian3. Matrik probabilitas transisi antar state

adalah (A=aij), dimana

aij = P[qt+1 = j |qt = i] , 1 ≤ i, j≤ N (2)

4. Distribusi probabilitas observasi {B(j,k)}.Pada CHMM diperoleh denganmenggunakan Distribusi Gaussian

5. Probabilitas state awal , π= {πi } dimana

πi = P(q1 = Si) 1 ≤ i ≤ N

Masalah - masalah Dasar Pada HiddenMarkov Model Masalah evaluasi

Masalah evaluasi yaitu bagaimanamenghitung probabilitas deret observasi (O=O1, O2,…….OT) terhadap model yang diberikan(). Secara matematis dapat dirumuskan denganP(O|). Penyelesaian masalah ini dapatmenggunakan metoda forward-backward [2].

Metoda Forward1) Inisialisasi

NiObiii 1;1 1 (3)

2) Induksi

Nj

TtObatt tj

N

iijij

1

;11;1 11

(4)

3) Terminasi (terakhir)

N

ii tOP

1|

(5)

Dimana: j = Variabel forward

|OP = Peluang observasi terhadap λN = jumlah state

ija = matrik antar state = matrik peluang state awalbj(Ot) = distribusi probabilitas observasi

Metoda Backward1) Inisialisasi NiiT 1;1 (6)

2) Induksi

Ni

TTtjObaiN

jttjijt

1

;1,....,2,1;1

11 (7)

3) Terminasi

(8)

Dimana: T = Variabel backward

Masalah DecodingMasalah decoding yaitu bagaimana

memilih deret state yang optimal sehingga bisamerepsentasikan dengan baik deret observasidan parameter model yang diberikan. Untukmengatasi masalah ini dapat digunakanAlgoritma Viterbi. Algoritma Viterbi memilihsalah satu deret state yang terbaik sehinggadapat memaksimalkan peluang deret stateterhadap deret observasi dan model yangdiberikan[2][3].

Masalah Pelatihan (Training)Masalah pelatihan (training) yaitu

bagaima menentukan atau menyesuaikanparameter model (A,B,π) untukmemaksimalkan peluang deret observasi yangdiberikan terhadap model. Untuk mengatasi halini dapat dilakukan dengan menggunakanmetoda Baum-Welch atau disebut juga denganmetoda EM (Expectation-Maximalizationmethod [3][4][5].

2.4 Ruang WarnaWarna adalah persepsi yang dirasakan

oleh sistem visual manusia terhadap panjanggelombang cahaya yang dipantulkan oleh objek.Setiap warna mempunyai panjang gelombang(λ) yang berbeda. Warna sinar yang diresponoleh mata adalah sinar tampak (visible

NiiobOPN

iii

1;|1

11

Page 4: PENGENALAN UCAPAN METODA MFCC-HMM UNTUK …

Vol: 2 No.1 Maret 2013 ISSN : 2302-2949

Jurnal Nasional Teknik Elektro 34

spectrum) dengan panjang gelombang berkisardari 380 sampai 780 nm. Pada video digital adabanyak ruang warna yang telah dibuat. Namunpada penulisan ini hanya dijelaskan 2 jenisruang warna yaitu RGB dan HIS karena ruangwarna inilah yang dipakai dalam penelitian ini.

RGB (red, green, blue)Warna pada citra disusun oleh tiga

komponen warna yang disebut komponen RGB,yaitu merah (red), hijau (green), dan biru(blue). Pada citra ini masing – masing warnaprimernya yaitu merah, hijau, dan biru terdiridari 8 bit dan kemudian warna – warna inidigabungkan untuk menghasilkan warna yangsesuai [6]. Oleh karena itu, citra RGB terdiridari 24 bit per piksel (bpp). Ruang wana RGBdapat dilihat pada gambar 4. Dalam ungkapanini warna putih = RGB(255,255,255),sedangkan warna hitam = RGB(0,0,0).

Gambar 4. .Ruang warna RGB

HSI (Hue Saturation Intensity)Sistem HSI adalah cara lain penggunaan

ruang warna pada pengolahan citra, yang lebihintuitif untuk visi manusia. Sistem warna HSImerupakan warna pelengkap yang dihasilkandari pengaturan warna RGB yangdiproyeksikan ke diagonal utama yaitu dariwarna hitam ke warna putih.

Gambar 5. HSI color space

Gambar 5 menunjukan rentang warnanilai HSI dimana Hue menyatakan spektrumwarna dominan dalam cahaya. Huemenunjukkan kandungan warna sebenarnya darisuatu citra. Nilai warna dalam hue dari 0 derajatsampai 360 derajat. Saturation menyatakankejernihan spektrum warna dalam cahaya(ukuran kemurnian suatu warna). Semakin

jernih suatu warna, maka nilai saturasinyasemakin tinggi. Intensity atau value menyatakantingkat kecerahan cahaya dari warna yangdilihat dari batas yang paling redup atau gelapsampai batas yang paling terang. Berikutformula untuk konversi RGB ke HSI [8] :

1 2

10

1

1 ( ) ( )2arccos

( ) ( )( )

,

360 ,

31 min( , , )

3

R G R BH

R G R B G B

H ifB GH

H ifB G

S R G BR G B

R G BI

2. 5 Multilevel Color Thresholding

MultilevelColor Thresholding merupa-kan metode segmentasi yang menggunakanbanyak komponen warna pada ruang warnatertentu, seperti komponen Red, Green, Bluepada RGB atau komponen Hue,Sat,Int padaHSI. Dalam format HSI sebuah warna masihdikatakan sama jika nilai hue dari warnatersebut masih berada pada spektrum yang sama.Oleh karena itu nilai hue adalah parameterpemilih warna yang paling penting dalamsegmentasi multilevel color thresholding,sedangkan pada saturasi hanya menggunakanrange warna murni yakni 70 – 240 danintensitas pada range 70 – 190 [7], dimanaintensitas cahaya tidak terlalu gelap dan tidakterlalu terang. Beberapa sampel warna besertanilai hue dapat dilihat pada tabel 1.

Tabel 1. RGB dan range hue[7]

Warna RGB HueHitam 0,0,0 -Merah 255,0,0 0 - 5Hijau 0,255,0 80 - 110Biru 0,0,255 120 - 160Ungu 128,0,128 170 - 210Kuning 255,255,0 20 - 60Cokelat 150,75,0 10 - 20Putih 255,255,255 -

(9)

(10)

(11)

(12)

Page 5: PENGENALAN UCAPAN METODA MFCC-HMM UNTUK …

Vol: 2 No.1 Maret 2013 ISSN : 2302-2949

Jurnal Nasional Teknik Elektro 35

Proses thresholding selanjutnya adalahmelewatkan warna yang masuk kedalam rangehue warna yang ditentukan sesuai dengan nilaipada tabel 1 dan memblok semua warna yangberada diluar range tersebut, maka hasil darisegmentasi adalah piksel-piksel dengan warnayang sama (disebut objek) tidak terkecualiwarna pada latar belakang yang warnanya jugasama dengan warna objek. Proses segmentasidapat dilihat pada gambar 6.

Gambar 6. Proses Segmentasi

2.6 Pelabelan dan FilteringProses pelabelan komponen hanya

diperlukan bila dalam suatu citra biner terdapatlebih dari satu objek dengan tujuan memberitanda yang membedakan objek yang satudengan yang lainnya. Proses labelisasi nantinyaakan digunakan untuk menghitung luas setiapobjek. Penentuan luas dari piksel yangditempati oleh suatu objek yang merepre-sentasikan ukuran dari objek tersebut.

Rumusnya:

n

i

m

jjifA

0 0),( (13)

A = Area; Jumlah piksel.f(i,j) = 1, jika (i,j) adalah piksel objek.

Filtering merupakan proses untukmenghilangkan noise yang terdapat pada objek.Filtering dilakukan jika ditemukan objek yangmemiliki luas kurang dari threshold luas yangtelah ditetapkan. Jika objek dengan nilai luas iniditemukan, maka objek tersebut dianggapsebagai noise dan difilter dengan cara memberilabel 0 pada objek tersebut.

III. PERANCANGAN SISTEM

Pada penelitian ini dirancang sebuahrobot mobil yang mampu mendengar, melihat,merespon dan diperintah dengan suara. Adapun

prosesnya dapat dilihat pada gambar 7. Prosesperancangan diawali dengan pembentukansistem pengenalan ucapan. Pada penelitian ini,sistem pengenalan ucapan menggunakanmetoda HMM yang bersifat isolated word.Proses pengenalan ucapan untuk jenis isolatedword yang digunakan pada penelitian ini dapatdilihat pada gambar 8.

Gambar 7. Blok diagram penelitian

Gambar 8. Blok Diagram pengenalan HMMtipe Isolated word [2]

Gambar 8 menunjukan bahwa sinyal ucapanakan mengalami ekstraksi parametermenggunakan MFCC sehingga menghasilkanvektor ciri. Vektor ciri akan dihitungprobabilitasnya terhadap semua model kata

Objek yangakan

ditracking

Objek hasilsegmentasi yangakan di tracking

Segmentasi dan

filtering

SeleksiWarnaBiru

Page 6: PENGENALAN UCAPAN METODA MFCC-HMM UNTUK …

Vol: 2 No.1 Maret 2013 ISSN : 2302-2949

Jurnal Nasional Teknik Elektro 36

yang sudah dibentuk ketika proses pelatihandan akan dipilih probabilitas yang terbesar.

Capture dan Frame VideoSetelah perintah dapat dikenali,

penelitian ini dilanjutkan dengan prosespenangkapan (capture) video digitalmenggunakan web camera berupa frame-frameimage. Pertama dibuatkan window yang beradapada koordinat x=0 dan y=0, lebar jendela 320piksel dan tinggi jendela 240 piksel. Jadi jumlahtotal piksel dari window adalah 320 x 240piksel yaitu sebanyak 76.800 piksel.Selanjutnya window capture tersebutdikoneksikan dengan driver capture (webcamera). Kemudian sistem akan menangkapformat video yang digunakan oleh drivercapture untuk selanjutnya diubah dalam formatbitmap (bmp).

Tahap selanjutnya adalah melakukanpengecekan terhadap memori. Jika dalammemori terdapat image, baik image yang diolahmaupun image hasil capture pada kondisisebelumnya, maka image tersebut dihapus darimemori. Setelah image yang ada pada memorisebelumnya dihilangkan, maka kita mulaimengalokasikan alamat memori baru untukimage yang baru. Sistem akan memasukkanatau mengubah nilai yang sudah ada padaproperty window. Pada sistem dibuat sebuahfungsi yang berguna untuk memanggil frame-frame video kembali dari capture window yangterkoneksi dengan capture driver. Kecepatanframe-nya dibuat sebesar 30 frame per second(fps). Memori dialokasikan untuk setiap frame,sehingga tampilan video bisa dimunculkan.

Algoritma SegmentasiAdapun langkah-langkah untuk

memisahkan objek dengan background adalahsebagai berikut:

1. Scanning frame pada titik (i,j) mulai darititik (0,0) sampai titik (m,n) sebagairepresentasi piksel pada baris i dankolom j, dimana:m = lebar framen = tinggi frame

2. Definisikan piksel pada titik (i,j) sebagaiwarna. Karena piksel warna dikenalidengan 24 bit, maka masing-masingpiksel terdiri dari tiga komponen warnayaitu komponen red, green dan blue.Komponen blue terletak pada 8 bitpertama, komponen green terletak pada 8

bit kedua dan komponen red terletakpada 8 bit ketiga, jadi seolah-olah pikseldibaca sebagai warna blue, green danred.

3. Konversi warna RGB tersebut kedalamruang warna HSI.

4. Tentukan nilai threshold yang tepat padaparameter hue, saturasi dan intensitasuntuk warna objek target.

5. Piksel yang berada pada nilai thresholdakan di anggap sebagai objek dan akandiberi label 1. Sedangkan yang tidakmasuk kedalam nilai threshold akandianggap sebagai latar belakang dandiberi label 0.

Algoritma Pelabelan dan Pemfilteran1. Scan frame hasil segmentasi (label layer)

mulai dari titik (0,1) sampai titik (m,n-1)sebagai representasi piksel pada baris idan kolom j.

2. Jika piksel (i,j) adalah piksel objek (labellayer = 1) dan belum memiliki label(label 1 dan 0 dianggap bukan label),periksa 8 tetangganya (kiri atas, atas,kanan atas, samping kanan, kanan bawah,bawah, kiri bawah, dan samping kiri).Jika salah satu saja dari piksel tetanggatersebut memiliki label (label tetangga ≠1 atau ≠ 0), maka salin label tersebut kepiksel (i,j). Namun jika tidak satupunpiksel tetangganya memiliki label, makaberi label baru pada piksel (i,j) dansalinkan labelnya ke 8 tetanggasekitarnya.

3. Karena ada kemungkinan dalam satuobjek terdapat lebih dari 1 label, makadeteksi 2 label yang berdekatan (noldianggap bukan label) dan simpannilainya pada suatu tabel ekivalen (labelbesar dan label kecil) label-label yangberdekatan.

4. Urutkan data pada tebel ekivalenberdasarkan nilai label besar dari kecil kebesar.

5. Scan ulang frame, kemudian ganti labelyang besar dengan label kecil yangmerupakan pasangannya dalam tabel.Hasil dari proses ini yaitu setiap objekakan memiliki 1 label saja dan label iniberbeda dari objek lainnya.

6. Kembali ke langkah 3 jika masih adapiksel-piksel dalam sebuah objek belum

Page 7: PENGENALAN UCAPAN METODA MFCC-HMM UNTUK …

Vol: 2 No.1 Maret 2013 ISSN : 2302-2949

Jurnal Nasional Teknik Elektro 37

berlabel sama (berdekatan tapi berbeda),sehingga didapatkan 1 objek 1 label.

7. Hitung luas dari masing-masing objekyang terdeteksi.

8. Jika ditemukan objek yang memilikijumlah piksel (luas) lebih kecil darijumlah piksel objek yang telahditentukan, maka objek tersebut dianggapsebagai noise dan difilter dengan caramemberi label 0 pada objek tersebut.

Algoritma Menghitung Luas Objekdan Filtering

1. Scanning piksel hasil proses pelabelanpada titik (i,j) mulai dari titik (0,0)sampai titik (m,n) sebagai representasipiksel pada baris i dan kolom j. Lakukanhal ini pada setiap frame.

2. Jumlahkan setiap piksel yang memilikilabel yang sama. Simpan hasilpenjumlahan tersebut sesuai denganlabelnya. Lakukan hal ini pada setiapframe.

3. Jika ditemukan objek yang memilikijumlah piksel diluar dari jumlah pikselobjek yang ditentukan, maka objektersebut dianggap sebagai noise dandihilangkan (pemfilteran) dengan caramemberi label 0 pada objek tersebut.

Algoritma Penentuan Posisi ObjekPosisi objek dapat ditentukan dari 4 titik

terluar dari objek. Ke-4 titik ini membentuksebuah rektanguler sebagai indikator objekterdeteksi. Titik tengah dari rektanguler ini bisadiwakilkan sebagai posisi dari objek. Sebagianbesar algoritma menggunakan proses scaningframe yang berulang-ulang dengan lebar m dantinggi n. Prosedur penentuan 4 titik tersebutsebagai berikut:

1. Scan frame dari kiri ke kanan dan atas kebawah mulai piksel (0,0) ke (m,n) sampaiditemukan piksel objek (titik ymin).

2. Scan frame dari kiri ke kanan dan bawahke atas mulai piksel (m,0) ke (0,0)sampai ditemukan piksel objek (titikymax).

3. Scan frame dari atas ke bawah dan kiri kekanan mulai piksel (0,0) ke (m,n) sampaiditemukan piksel objek (titik xmin).

4. Scan frame dari atas ke bawah dan kananke kiri mulai piksel (0,n) ke (m,0)

sampai ditemukan piksel objek (titikxmax).

5. Tentukan titik tengah 4 titik tersebutdengan rumus: x = xmax + xmin / 2 (14)

y = ymax + ymin / 2 (15)

Algoritma Kalibrasi Pixel Kameraterhadap Sudut ServoResolusi frame adalah 320x240 piksel

sedangkan motor servo mampu bergerak sejauh180 derajat. Sehingga diperlukan kalibrasiantara satuan piksel terhadap derajat yang dapatditentukan dengan cara:

1. Tentukan jarak objek terhadap kamera(a), pada penelitian ini digunakan jarak50cm.

2. Ukur cakupan frame video terhadapjarak yang telah ditentukan sebelumnya(b) masing-masing untuk lebar dan tinggiframe.

3. Tentukan korelasi antara pixel denganjarak (cm). 320 pixel = b cm, sehingga

pixelb

cm 3201 (16)

4. Tentukan korelasi antara satuan derajatdengan piksel, yaitu dengan mencari nilaikeliling lingkaran dengan jarak yangtelah ditentukan, Keliling Lingkaran =2π x a, maka

cmxa360210 (17)

5. Tentukan korelasi antara satuan derjatterhadap pixel, berdasarkan persamaanpada point 3 dan 4.

pixelb

a 320180

10

(18)

Algoritma Penentuan Lebar PulsaPergerakan Motor ServoMotor servo standar dapat bergerak pada

setiap sudutnya yaitu pada range 00 sampai1800, dimana setiap sudut memiliki lebar pulsayang berbeda-beda, sehingga untuk dapatmenentukan lebar pulsa tesebut dapatditentukan dengan:

1. Tentukan sudut acuan, yaitu pada sudut00 dan 1800.

2. Tentukan lebar pulsa untuk 1 derjat,dengan menggunakan rumus:

Page 8: PENGENALAN UCAPAN METODA MFCC-HMM UNTUK …

Vol: 2 No.1 Maret 2013 ISSN : 2302-2949

Jurnal Nasional Teknik Elektro 38

18000

01800

1SS

per

TTT

(19)

3. Tentukan lebar pulsa sudut lain dengancara mengalikannya dengan lebar pulsa 1derjat.

01_ _ perxsudut TxsudutT (20)

IV. HASIL DAN ANALISA

Hasil Pengenalan UcapanPada penelitian ini dilakukan pengujian

terhadap sistem pengenalan ucapan danpengujian terhadap kemampuan tracking objek.Penggujian tracking object dilakukan setelahucapan dikenali. Pengujian terhadap sistempengenalan ucapan, dilakukan terhadap sumberterlatih dan sumber yang tidak dilatih.Pengujian terhadap sumber terlatih bertujuanuntuk mengetahui apakah sistem dapatmengenali kata yang diucapkan dari sumberyang sama dengan sumber pembentuk modelkata tetapi dengan pengucapan yang berbedadari pengucapan ketika pelatihan, sepertiperbedaan intonasi, perbedaaan posisimikrophone. Pengujian terhadap sumber yangtidak dilatih bertujuan untuk mengetahuikinerja sistem dalam mengenali kata meskipundiucapkan oleh sumber yang berbeda dengansumber pembentuk model. Hasil pengujian inidapat dilihat pada tabel 2.

Tabel 2. Hasil pengujian pengenalan ucapanKata yangdiucapkan

Sumberterlatih

Sumber tidakterlatih

MERAH 93,33 % 100%KUNING 66,67% 63%

HIJAU 80% 59%BIRU 93,33% 99%

Rata-rata 83,33 % 80,25%

Hasil SegmentasiSampel yang digunakan sebagai frame

input segmentasi dapat dilihat pada gambar 9,dan hasil segmentasi setiap warna dapat dilihatpada tabel 3.

Gambar 9. Sampel Objek

Tabel 3. Hasil segmentasi untuk setiap warna

Proses tracking objekSetelah ucapan warna berhasil dikenali

kemudian warna yang dicari berhasildisegmentasi maka robot akan bergerakmenuju warna tersebutdan robot berhentisampai buzzer berbunyi . Proses trackingini dapat dilihat pada tabel 4.

No Warna danRange Threshold

Gambar

1 Merah :0 ≤ H ≤ 580 ≤ I ≤ 19080≤ S ≤ 240

2 Kuning :20 ≤ H ≤ 6070 ≤ I ≤ 19080 ≤S ≤ 240

3 Hijau :80 ≤ H ≤ 11070 ≤ I ≤ 19060 ≤ S ≤ 240

4 Biru :120≤H≤ 16080 ≤ I ≤ 190120≤ S ≤ 240

Page 9: PENGENALAN UCAPAN METODA MFCC-HMM UNTUK …

Vol: 2 No.1 Maret 2013 ISSN : 2302-2949

Jurnal Nasional Teknik Elektro 39

Tabel 4. Proses hasil tracking objek dan responrobot mobil berdasarkan kata yang dikenali

(untuk kasus warna biru)

Hasil tracking objek sesuai kata yangdikenali

Setelah robot mampu melakukan trackingterhadap warna yang dicari, maka dilakukanpengujian terhadap semua ucapan yangdiujikan dan semua warna. Kemampuanrobot mobil untuk mencari semua warnayang sesuai dengan perintah ucapan yangdiberikan dapat dilihat pada tabel 5

Tabel 5. Trancking objek bedasarkan perintahwarna yang dikenali

Berdasarkan tabel 5, robot mobil akanmen-tracking dan memberi respon majuterhadap objek ketika perintah ucapan telahdikenali dan ketika jumlah piksel objek lebihbesar 2000 piksel dan kurang dari 10000.Ketika robot mobil telah selesai merespon maju(mendekati objek) sesuai dengan batas yangtelah diberikan maka buzzer akan berbunyi.

Jika sistem pengenalan ucapan salahdalam mengenali kata yang diucapkan makarobot mobil akan tetap mencari warna yangdikenali, sebagai contoh jika diucapkan warnaBIRU dan sistem pengenalan mengenalisebagai MERAH maka robot mobil akanmentracking objek berwarna MERAH.Berdasarkan percobaan, didapatkan bahwa

Posisi

DeteksiObjek

GerakkanKamera

dan responrobotmobil

Keterangan

1

Hasil rekamansuara, dibaca.,

Dikenali sebagaibiru, Lakukan

tracking objek biruAwal diaktifkan,

robot mobilmencari sudut 900.

2

Deteksi warna birudan penguncian

objek (kotakpersegi warnamerah), Servo

bergerak ke sebelahkanan (>900).

3

Cari titik tengahobjek, Putar motorDC disini, sampai

motor servo kameraberada pada posisi

900.

4

Titik tengah objekdipertahankan

(digeser) sampaisama dengan titik

tengah frame.Robot mobil

dirancang mampumengontrol

informasi koordinatx, Putar motor DCdisini untuk prosespengaturan sampaititik tengah objekberada pada titik

tengah frame

5

Jumlah piksel>10000

Motor DC berhentidan buzzerberbunyi.

No Perintah kata danwarna Objek

Proses trackingrobot mobil

1

Merah

0 ≤ H ≤ 5, 80 ≤ I ≤190 dan 80≤ S ≤

240

2

Kuning

20 ≤ H ≤ 60, 70 ≤ I≤ 190 dan 80 ≤S ≤

240

3

Hijau

80 ≤ H ≤ 110, 70 ≤I ≤ 190 dan 60 ≤ S

≤ 240

4

Biru

120≤H≤ 160, 80 ≤ I≤ 190 dan 120≤ S

≤ 240

Page 10: PENGENALAN UCAPAN METODA MFCC-HMM UNTUK …

Vol: 2 No.1 Maret 2013 ISSN : 2302-2949

Jurnal Nasional Teknik Elektro 40

robot mobil selalu berhasil mentracking objekberdasarkan warna yang dikenali. Hal inimenunjukan kemampuan tracking objekberdasarkan identifikasi warna sebesar 100 % .

Hal yang sangat menentukan kinerjasistem adalah akurasi dari sistem pengenalanucapan. Berdasarkan tabel 2 didapatkan akurasisistem pengenalan untuk sumber terlatih adalah83,33% (kesalahan 16,67 % ) dan sumber tidakterlatih adalah 80,25 % (kesalahan 19,75 % ).Kesalahan pengenalan disebabkan sistempengenalan ucapan dibentuk menggunakanmetoda HMM dengan pemodelan bersifatsingle observation, sehingga model yangterbentuk belum maksimal dalam mewakiliucapan kata MERAH, KUNING, HIJAU danBIRU untuk semua sumber dengan variasipengucapan kata.

V. PENUTUP

5.1 Kesimpulan1. Hasil Pengenalan ucapan sumber terlatih

sebesar 83,33% dan untuk sumber tidakdilatih sebesar 80,25% .

2. Keberhasilan robot mobil mengejar ataumemilih objek berdasarkan identifikasiwarna sesuai dengan kata yang dikenalisebesar 100%.

3. Media tracking berupa motor servo dcdan motor dc telah mampu melakukantracking objek dengan menggerakkankamera sehingga kamera mampumembaca posisi objek, dan respon majuyang dilakukan membuktikan motor DCmampu mempertahan titik tengah objekuntuk sama dengan titik tengah frame.

5.2 saranPada penelitian selanjutnya sebaiknya

menggunakan model ucapan yang dibentuk darimultiple observation. Penelitian selanjutnyasebaiknya real time dan Dalam melakukandeteksi terhadap objek, pergerakan kameratidak hanya sebatas horizontal saja tapi jugamampu bergerak secara vertikal.

DAFTAR PUSTAKA

[1] Fitrilina, Sistem Pengenalan IsolatedDigit yang Robust Dengan MenggunakanSpectral Subtraction Berdasarkan

Minimum Statistics, Teknika No 35 Vol1.THNXVII April 2011

[2] Rabiner, “A Tutorial on Hidden MarkovModel and Selected Aplications inSpeech Recognition,” Proceedings of theIEEE, vol 77, No 2, 1989

[3] Tomi Aarnio, “Speech Recognition withHidden Markov Models in VisualCommunication,” Master of ScienceThesis, University of Turki, 1999

[4] Ting Chee Ming,.” Malay ContinousSpeech Recognition using ContinousDensity Hidden Markov Model”, Thesis,Universiti Teknologi Malaysia, 2007.

[5] Mikael Nilson, marcus Ejnarson, “Speechrecognition using Hidden Markov Model,Performance Evaluation in NoisyEnvirontment”, Theiss Blekinge instituteof Technology, Sewen, 2002.

[6] Yao, Wang, J.Ostermann & Y.Q.Zhang.2002. ”Video Processing andCommunications”. New Jersey: PrenticeHall.

[7] Microsoft Corporation.2001. “MicrosoftPaint Software”. New York: MicrosoftCorporation.

[8] Hearn, Donald dan M. Pauline Baker.1996. “Computer Graphics C Version2nd Edition”. New York: Prentice Hall.

Biodata PenulisFitrilina, Lahir di Padang tanggal 25

Agustus 1981, Menamatkan S1 di TeknikElektro Fakultas Teknik UNAND 2005,Menamatkan S2 di Teknik Elektro STEI-ITB2010. Saat ini terdaftar sebagai dosen TeknikElektro FT-UNAND

Rahmadi Kurnia, Lahir tanggal 20Agustus 1969. Menamatkan S1 di TeknikElektro Universitas Indonesia tahun 1995.Menamatkan S2 di Teknik Elektro UniversitasIndonesia tahun 1998, bidang ImageProcessing. Menamatkan S3 di SaitamaUniversity, Jepang 2006. Saat ini terdaftarsebagai dosen Teknik Elektro FT-UNAND

Siska Aulia, Lahir di Payakumbuhtanggal 4 Maret 1988. Menamatkan S1 diTeknik Elektro Universitas Andalas tahun2011. Saat ini terdaftar sebagai mahasiswaPasca Sarjana di Teknik Elektro UniversitasAndalas