Post on 20-Mar-2019
i
PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL
FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN
VOICE COMMAND BERBAHASA INDONESIA
KOMPETENSI KOMPUTASI
SKRIPSI
I GEDE ARYA MAHARTA
NIM. 1108605025
JURUSAN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS UDAYANA
BUKIT JIMBARAN
2015
SURAT PERNYATAAN KEASLIAN KARYA ILMIAH
Yang bertanda tangan di bawah ini menyatakan bahwa naskah Skripsi dengan
judul:
“Penerapan Metode Hidden Markov Model dan Mel Frecuency Cepstral
Coefficient dalam Pengenalan Voice Command Berbahasa Indonesia”
Nama : I Gede Arya Maharta
NIM : 1108605025
Program Studi : Teknik Informatika
E-mail : aryamhrt@gmail.com
Nomor telp/HP : 082247550872
Alamat : Jalan Tukad Yeh Biu Gang Pudak no. 7, Denpasar, Bali
Belum pernah dipublikasikan dalam dokumen skripsi, jurnal nasional maupun
internasional atau dalam prosiding manapun, dan tidak sedang atau akan diajukan
untuk publikasi di jurnal atau prosiding manapun. Apabila di kemudian hari
terbukti terdapat pelanggaran kaidah-kaidah akademik pada karya ilmiah saya,
maka saya bersedia menanggung sanksi-sanksi yang dijatuhkan karena kesalahan
tersebut, sebagaimana diatur oleh Peraturan Menteri Pendidikan Nasional Nomor
17 Tahun 2010 tentang Pencegahan dan Penanggulangan Plagiat di Perguruan
Tinggi.
Demikian Surat Pernyataan ini saya buat dengan sesungguhnya untuk dapat
dipergunakan bilamana diperlukan.
Denpasar, 18 Agustus 2015
Yang membuat pernyataan,
(I Gede Arya Maharta)
NIM. 1108605025
ii
LEMBAR PENGESAHAN TUGAS AKHIR
Judul : Penerapan Metode Hidden Markov Model dan Mel
Frequency Cepstrum Coefficient dalam Pengenalan Voice
Command Berbahasa Indonesia
Kompetensi : Komputasi
Nama : I Gede Arya Maharta
NIM : 1108605025
Tanggal Seminar : 7 Juli 2015
Disetujui oleh:
Pembimbing I Penguji I
Agus Muliantara, S.Kom.,M.Kom.
NIP. 198006162005011001
I Gede Santi Astawa, S.T., M.Cs.
NIP. 198012062006041003
Pembimbing II Penguji II
Ngurah Agus Sanjaya, ER, S.Kom., M.Kom.
NIP. 197803212005011001 Ida Bagus Gede Dwidasmara,S.Kom.,M.Cs.
NIP. 198503152010121007
Penguji III
I Dewa Made Bayu Atmaja Darmawan, S.Kom, M.Cs.
NIP. 198901272012121001
Mengetahui,
Jurusan Ilmu Komputer FMIPA UNUD
Ketua,
Drs. I Wayan Santiyasa, M.Si
NIP. 196704141992031002
iii
Judul : Penerapan Metode Hidden Markov Model dan Mel Frecuency
Cepstral Coefficient dalam Pengenalan Voice Command
Berbahasa Indonesia
Nama : I Gede Arya Maharta
Pembimbing : 1. Agus Muliantara, S.Kom., M.Kom.
2. Ngurah Agus Sanjaya, ER, S.Kom., M. Kom.
ABSTRAK
Suara adalah cara berkomunikasi yang paling sederhana dan sering
digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi,
proses komunikasi juga terjadi antara manusia dan perangkat-perangkat seperti
komputer. Pengenalan suara atau Automatic Speech Recognition (ASR) adalah
teknik untuk mendukung interaksi antara manusia dan komputer yang saat ini
menjadi salah satu hal yang sangat potensial bagi para peneliti untuk
dikembangkan. ASR memungkinkan komputer untuk menerima masukan berupa
kata yang diucapkan untuk kemudian dikenali dengan cara mengolah sinyal
digital yang terkandung.
Dalam penelitian ini dirancang sebuah sistem pengenalan intruksi suara
dalam bahasa Indonesia menggunakan metode ekstraksi fitur Mel Frecuency
Cepstral Coefficient (MFCC) dan metode pengenalan Hidden Markov Model
(HMM). Serta menggunakan teknik segmentasi kata berdasarkan energi sinyal
untuk memecah wicara menjadi satuan kata untuk lebih mudah dikenali.
Berdasarkan penelitian dan pengujian yang dilakukan terhadap 20 kata
pada dataset, sistem mampu mengenali intruksi suara yang dengan panjang kata
bervariasi antara 2 hingga 4 kata dengan tingkat akurasi mencapai 92,49%.
Parameter-parameter pelatihan yang paling optimal yang diperoleh adalah jumlah
dataset pelatihan 5, jumlah filter-bank 24 filter, iterasi pelatihan maksimal 5 kali,
dan jumlah state 3 untuk setiap model.
Kata Kunci: Speech Recognition, MFCC, HMM, Instruksi Suara, Segmentasi
Wicara
iv
Title : Penerapan Metode Hidden Markov Model dan Mel Frecuency
Cepstral Coefficient dalam Pengenalan Voice Command
Berbahasa Indonesia
Name : I Gede Arya Maharta
Supervisor : 1. Agus Muliantara, S.Kom., M.Kom.
2. Ngurah Agus Sanjaya, ER, S.Kom., M. Kom.
ABSTRACT
As we know, speech is the simplest way to communicate with other
person. But, along with the development and innovation in the technology which
goes rapidly, present communication processes also occurred between human and
devices such as computer. Speech recognition or also known as Automatic Speech
Recognition (ASR) is a technique developed to assist the human computer
interaction now becomes one of potential research object for many researchers.
ASR allows computer devices to receive information in form of words or
sentences spoken by the human and then recognized by the system using
information contained in the speech signal.
In this research, voice command recognition in Indonesian language is
designed by using Mel Frequency Cepstral Coefficient (MFCC) as feature
extraction method, and Hidden Markov Model (HMM) as the recognition method.
The signal energy based segmentation is also performed to split the speech
utterance from speaker to several word segments because the system works on
word level recognition (Isolated Word Recognition).
Based in the research and testing for 20 determined words in the system
dataset, obtained that system is capable to recognize speech commands correctly
with various word length from 2 to 4 words with 92, 49% accuracy. The optimal
training parameters resulted from the experiment are number of training dataset 5
sample for each word, 24 filter-banks, 5 maximum iteration of training, and 3
states for each word model
Kata Kunci: Speech Recognition, MFCC, HMM, Voice Command, Speech
Segmentation
v
KATA PENGANTAR
Penelitian dengan judul “Penerapan Metode Hidden Markov Model dan
Mel Frecuency Cepstral Coefficient dalam Pengenalan Voice Command
Berbahasa Indonesia” ini disusun dalam rangkaian kegiatan pelaksanaan Tugas
Akhir di Jurusan Ilmu Komputer FMIPA UNUD. Penelitian ini dilaksanakan pada
periode Januari 2015 hingga Juni 2015 di Universitas Udayana.
Sehubungan dengan telah terselesaikannya penelitian ini, maka diucapkan
terimakasih dan penghargaan kepada berbagai pihak yang telah membantu
pengusul, antara lain
1. Bapak Agus Muliantara, S.Kom, M.Kom sebagai Pembimbing I yang telah
membantu dalam penyelesaian penelitian ini;
2. Bapak Ngurah Agus Sanjaya, ER, S.Kom., M.Kom sebagai Pembimbing II
yang telah bersedia meluangkan waktunya dalam penyelesaian penelitian
ini;
3. Bapak Drs. I Wayan Santiyasa selaku Ketua Jurusan Ilmu Komputer
Universitas Udayana yang telah banyak memberikan masukan dan
motivasi sehingga memperlancar dalam proses pelaksanaan penelitian ini;
4. Bapak-bapak dan ibu-ibu dosen di Jurusan Ilmu Komputer yang bersedia
meluangkan waktunya untuk memberikan masukan dalam penyempurnaan
penelitian ini;
5. Kawan-kawan di Jurusan Ilmu Komputer yang telah memberikan
dikungan moral dalam penyelesaian penelitian ini.
Disadari pula bahwa sudah tentu penelitian ini masih mengandung kelemahan dan
kekurangan. Memperhatikan hal ini, maka masukan dan saran-saran
penyempurnaan sangat diharapkan
Denpasar, Juli 2015
Penulis
vi
DAFTAR ISI
SKRIPSI ................................................................................................................... i
LEMBAR PENGESAHAN TUGAS AKHIR ........ Error! Bookmark not defined.
ABSTRAK ............................................................................................................. iii
ABSTRACT ........................................................................................................... iv
KATA PENGANTAR .............................................................................................. v
DAFTAR ISI .......................................................................................................... vi
DAFTAR GAMBAR .............................................................................................. x
DAFTAR TABEL .................................................................................................. xii
DAFTAR LAMPIRAN ........................................................................................ xiii
BAB I ...................................................................................................................... 1
PENDAHULUAN .................................................................................................. 1
1.1 Latar Belakang ........................................................................................ 1
1.2 Rumusan Masalah .................................................................................. 3
1.3 Batasan Masalah ..................................................................................... 4
1.4 Tujuan Penelitian .................................................................................... 4
1.5 Manfaat Penelitian .................................................................................. 4
1.6 Metodelogi Penelitian ............................................................................. 4
1.6.1 Desain Penelitian .......................................................................... 5
1.6.2 Pengumpulan data ........................................................................ 5
1.6.3 Pengolahan Data Awal ................................................................. 5
1.6.4 Metode yang Digunakan .............................................................. 6
BAB II ..................................................................................................................... 7
vii
TINJAUAN PUSTAKA .......................................................................................... 7
2.1 Suara (Wicara) ........................................................................................ 7
2.1.1 Karakteristik Sinyal Suara............................................................ 7
2.1.2 Representasi Sinyal Suara ............................................................ 8
2.1.3 Energi Sinyal Suara ...................................................................... 9
2.1.4 Filter pada Sinyal Suara ............................................................. 10
2.2 Automatic Speech Recognition (ASR) ................................................. 10
2.2.1 Karakteristik Sistem Pengenalan Suara ...................................... 11
2.2.2 Klasifikasi Sistem Pengenalan Suara ......................................... 12
2.3 Mel Frequency Cepstrum Coefficient(MFCC) ..................................... 14
2.4 Hidden Markov Model (HMM) ............................................................ 19
2.4.1 Markov Model ............................................................................ 19
2.4.2 Hidden Markov Model ............................................................... 19
2.4.3 Penyelesaian masalah dengan HMM ......................................... 21
2.4.4 Pemodelan Unit Wicara.............................................................. 25
BAB III ................................................................................................................. 27
ANALISIS DAN PERANCANGAN SISTEM .................................................... 27
3.1 Kebutuhan Fungsional .......................................................................... 27
3.1.1 Melakukan Pre-Processing ......................................................... 27
3.1.2 Melakukan Ekstraksi Fitur Suara ............................................... 27
3.1.3 Melakukan Pendeteksian Batasan Kata pada Suara ................... 27
3.1.4 Melakukan Pengenalan Instruksi yang Diucapkan .................... 28
3.2 Rancangan Data .................................................................................... 28
3.3 Rancangan Antarmuka Sistem .............................................................. 29
viii
3.4 Rancangan Pengolahan Data ................................................................ 32
3.4.1 Preprocessing ............................................................................. 32
3.4.2 Ekstraksi Fitur ............................................................................ 33
3.4.3 Pelatihan HMM .......................................................................... 34
3.4.4 Segmentasi Kata ......................................................................... 36
3.4.5 Pengenalan Suara ....................................................................... 37
3.5 Pengujian dan Evaluasi ......................................................................... 38
BAB IV ................................................................................................................. 41
HASIL DAN PEMBAHASAN ............................................................................. 41
4.1 Implementasi Sistem ............................................................................ 41
4.2 Implementasi Proses Ekstraksi Fitur .................................................... 41
4.3 Implementasi Inisialisasi Model HMM ................................................ 43
4.4 Implementasi Pelatihan Parameter Model HMM ................................. 45
4.5 Implementasi Proses Segmentasi Sinyal Suara .................................... 45
4.6 Implementasi Proses Pengenalan Insruksi ............................................ 48
4.7 Tampilan Antarmuka Pengenalan Intruksi Suara ................................. 49
4.8 Hasil Pengujian Sistem ......................................................................... 52
4.7.1 Pengujian Terhadap Jumlah Dataset per Kata ............................ 53
4.7.2 Pengujian Terhadap Jumlah Filter-Bank .................................... 54
4.7.3 Pengujian Terhadap Jumlah Iterasi Maksimum Pelatihan HMM
55
4.7.4 Pengujian Terhadap Jumlah State Model HMM ........................ 56
4.7.5 Pengujian Dengan Parameter Optimal ....................................... 57
4.7.6 Pengujian Durasi Pengucapan Instuksi ...................................... 59
ix
BAB V ................................................................................................................... 63
KESIMPULAN DAN SARAN ............................................................................. 63
5.1 Kesimpulan ........................................................................................... 63
5.2 Saran ..................................................................................................... 63
DAFTAR PUSTAKA ............................................................................................ 64
LAMPIRAN
x
DAFTAR GAMBAR
Gambar 2.1 Tiga Representasi Sinyal Suara ........................................................... 8
Gambar 2.2 Sinyal Domain Waktu dan Domain Frekuensi .................................... 9
Gambar 2.3 Diagram Sistem Pengenalan Suara. Tahap training(a), tahap
pengenalan(b) ........................................................................................................ 12
Gambar 2.4 Proses FrameBlocking....................................................................... 15
Gambar 2.5 Contoh hasil Windowing sinyal suara................................................ 16
Gambar 2.6 Mel Filter Bank dengan 24 buah filter .............................................. 18
Gambar 2.7 Parameter Probabilistik pada Hidden Markov Model ....................... 21
Gambar 2.8 Diagram Treilis Untuk Perhitungan Prosedur Maju ......................... 23
Gambar 2.9 Proses Rekursif Untuk Menentukan Jalur Terpendek Menggunakan
Algoritma Viterbi .................................................................................................. 24
Gambar 3.1 Rancangan tampilan awal sistem ...................................................... 29
Gambar 3.2 Rancangan tampilan input parameter training .................................. 29
Gambar 3.3 Rancangan tampilan pengenalan suara ............................................. 30
Gambar 3.4 Rancangan tampilan segmen kata ..................................................... 31
Gambar 3.5 Flowchart preprocessing ................................................................... 32
Gambar 3.6 Flowchart proses ekstraksi fitur suara ............................................... 33
Gambar 3. 7 Ilustrasi Hidden Markov Model ....................................................... 34
Gambar 3.8 Flowchart proses pelatihan model HMM .......................................... 35
Gambar 3.9 Flowchart proses segmentasi kata ..................................................... 36
Gambar 3.10 Flowchart proses pengenalan kata................................................... 38
Gambar 4.1 Sinyal suara untuk kata “ac” ............................................................. 41
Gambar 4.2 Fitur sinyal suara untuk kata “ac” ..................................................... 43
Gambar 4.3 Kandidat batas kata untuk kalimat “tolong turunkan volume tv” ..... 47
Gambar 4.4 Batas kata hasil segmentasi untuk kalimat “tolong turunkan volume
tv” .......................................................................................................................... 48
Gambar 4.5 Tampilan Antarmuka Sistem ............................................................. 50
xi
Gambar 4.6 Antarmuka Input Parameter Pelatihan HMM.................................... 50
Gambar 4.7 Tampilan Proses Pelatihan Model HMM .......................................... 51
Gambar 4.8 Tampilan Hasil Pengenalan Instruksi ................................................ 52
Gambar 4.9 Grafik Pengaruh Jumlah Filter-Bank Terhadap Akurasi Pengenalan 54
Gambar 4.10 Grafik Pengaruh Jumlah Iterasi Terhadap Akurasi Pengenalan ...... 55
Gambar 4.11 Grafik Pengaruh Jumlah State Terhadap Akurasi Pengenalan ........ 56
Gambar 4.12 Hasi Segmentasi Intruksi dengan Durasi 0-1,5 detik ...................... 59
Gambar 4.13 Hasi Segmentasi Intruksi dengan Durasi 1,5-2,5 detik ................... 60
Gambar 4.14 Hasi Segmentasi Intruksi dengan Durasi 2,5-4 detik ...................... 60
xii
DAFTAR TABEL
Tabel 4.1 Sintaks Proses Ekstraksi Fitur ............................................................... 42
Tabel 4.2 Sintaks Proses Inisialisasi Model HMM ............................................... 43
Tabel 4.3 Sintaks Proses Pelatihan Model HMM ................................................. 45
Tabel 4.4 Sintaks Proses Segmentasi Sinyal Suara ............................................... 45
Tabel 4.5 Sintaks Fungsi Segmentasi Sinyal Suara .............................................. 47
Tabel 4.6 Sintaks Proses Pengenalan Instruksi ..................................................... 49
Tabel 4.7 Hasil Pengujuan Terhadap Jumlah Dataset yang Digunakan ................ 53
Tabel 4.8 Hasil Pengujuan Terhadap Jumlah Filter-Bank ..................................... 54
Tabel 4.9 Hasil Pengujian Terhadap Jumlah Iterasi Maksimum Pelatihan HMM 55
Tabel 4.10 Hasil Pengujian Terhadap Jumlah State Model HMM ........................ 56
Tabel 4.11 Hasil Pengujian Sistem dengan Parameter Optimal ............................ 57
Tabel 4.12 Hasil Pengujian dengan Panjang Kata yang Berbeda ......................... 58
Tabel 4.13 Hasil Akurasi Pengenalan Masing-Masing Kata ................................. 58
Tabel 4.14 Hasil Pengujian Durasi Pengucapan Instruksi yang berbeda .............. 60
xiii
DAFTAR LAMPIRAN
Lampiran
1. Hasil Pengujian Jumlah Dataset
2. Hasil Pengujian Jumlah Filter-Bank
3. Hasil Pengujian Jumlah Iterasi Maksimum Pelatihan
4. Hasil Pengujian Banyak State HMM
5. Hasil Pengujian Sistem dengan Parameter Optimal