PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun,...

14
i PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN VOICE COMMAND BERBAHASA INDONESIA KOMPETENSI KOMPUTASI SKRIPSI I GEDE ARYA MAHARTA NIM. 1108605025 JURUSAN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS UDAYANA BUKIT JIMBARAN 2015

Transcript of PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun,...

Page 1: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

i

PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL

FREQUENCY CEPSTRUM COEFFICIENT DALAM PENGENALAN

VOICE COMMAND BERBAHASA INDONESIA

KOMPETENSI KOMPUTASI

SKRIPSI

I GEDE ARYA MAHARTA

NIM. 1108605025

JURUSAN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS UDAYANA

BUKIT JIMBARAN

2015

Page 2: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

SURAT PERNYATAAN KEASLIAN KARYA ILMIAH

Yang bertanda tangan di bawah ini menyatakan bahwa naskah Skripsi dengan

judul:

“Penerapan Metode Hidden Markov Model dan Mel Frecuency Cepstral

Coefficient dalam Pengenalan Voice Command Berbahasa Indonesia”

Nama : I Gede Arya Maharta

NIM : 1108605025

Program Studi : Teknik Informatika

E-mail : [email protected]

Nomor telp/HP : 082247550872

Alamat : Jalan Tukad Yeh Biu Gang Pudak no. 7, Denpasar, Bali

Belum pernah dipublikasikan dalam dokumen skripsi, jurnal nasional maupun

internasional atau dalam prosiding manapun, dan tidak sedang atau akan diajukan

untuk publikasi di jurnal atau prosiding manapun. Apabila di kemudian hari

terbukti terdapat pelanggaran kaidah-kaidah akademik pada karya ilmiah saya,

maka saya bersedia menanggung sanksi-sanksi yang dijatuhkan karena kesalahan

tersebut, sebagaimana diatur oleh Peraturan Menteri Pendidikan Nasional Nomor

17 Tahun 2010 tentang Pencegahan dan Penanggulangan Plagiat di Perguruan

Tinggi.

Demikian Surat Pernyataan ini saya buat dengan sesungguhnya untuk dapat

dipergunakan bilamana diperlukan.

Denpasar, 18 Agustus 2015

Yang membuat pernyataan,

(I Gede Arya Maharta)

NIM. 1108605025

Page 3: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

ii

LEMBAR PENGESAHAN TUGAS AKHIR

Judul : Penerapan Metode Hidden Markov Model dan Mel

Frequency Cepstrum Coefficient dalam Pengenalan Voice

Command Berbahasa Indonesia

Kompetensi : Komputasi

Nama : I Gede Arya Maharta

NIM : 1108605025

Tanggal Seminar : 7 Juli 2015

Disetujui oleh:

Pembimbing I Penguji I

Agus Muliantara, S.Kom.,M.Kom.

NIP. 198006162005011001

I Gede Santi Astawa, S.T., M.Cs.

NIP. 198012062006041003

Pembimbing II Penguji II

Ngurah Agus Sanjaya, ER, S.Kom., M.Kom.

NIP. 197803212005011001 Ida Bagus Gede Dwidasmara,S.Kom.,M.Cs.

NIP. 198503152010121007

Penguji III

I Dewa Made Bayu Atmaja Darmawan, S.Kom, M.Cs.

NIP. 198901272012121001

Mengetahui,

Jurusan Ilmu Komputer FMIPA UNUD

Ketua,

Drs. I Wayan Santiyasa, M.Si

NIP. 196704141992031002

Page 4: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

iii

Judul : Penerapan Metode Hidden Markov Model dan Mel Frecuency

Cepstral Coefficient dalam Pengenalan Voice Command

Berbahasa Indonesia

Nama : I Gede Arya Maharta

Pembimbing : 1. Agus Muliantara, S.Kom., M.Kom.

2. Ngurah Agus Sanjaya, ER, S.Kom., M. Kom.

ABSTRAK

Suara adalah cara berkomunikasi yang paling sederhana dan sering

digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi,

proses komunikasi juga terjadi antara manusia dan perangkat-perangkat seperti

komputer. Pengenalan suara atau Automatic Speech Recognition (ASR) adalah

teknik untuk mendukung interaksi antara manusia dan komputer yang saat ini

menjadi salah satu hal yang sangat potensial bagi para peneliti untuk

dikembangkan. ASR memungkinkan komputer untuk menerima masukan berupa

kata yang diucapkan untuk kemudian dikenali dengan cara mengolah sinyal

digital yang terkandung.

Dalam penelitian ini dirancang sebuah sistem pengenalan intruksi suara

dalam bahasa Indonesia menggunakan metode ekstraksi fitur Mel Frecuency

Cepstral Coefficient (MFCC) dan metode pengenalan Hidden Markov Model

(HMM). Serta menggunakan teknik segmentasi kata berdasarkan energi sinyal

untuk memecah wicara menjadi satuan kata untuk lebih mudah dikenali.

Berdasarkan penelitian dan pengujian yang dilakukan terhadap 20 kata

pada dataset, sistem mampu mengenali intruksi suara yang dengan panjang kata

bervariasi antara 2 hingga 4 kata dengan tingkat akurasi mencapai 92,49%.

Parameter-parameter pelatihan yang paling optimal yang diperoleh adalah jumlah

dataset pelatihan 5, jumlah filter-bank 24 filter, iterasi pelatihan maksimal 5 kali,

dan jumlah state 3 untuk setiap model.

Kata Kunci: Speech Recognition, MFCC, HMM, Instruksi Suara, Segmentasi

Wicara

Page 5: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

iv

Title : Penerapan Metode Hidden Markov Model dan Mel Frecuency

Cepstral Coefficient dalam Pengenalan Voice Command

Berbahasa Indonesia

Name : I Gede Arya Maharta

Supervisor : 1. Agus Muliantara, S.Kom., M.Kom.

2. Ngurah Agus Sanjaya, ER, S.Kom., M. Kom.

ABSTRACT

As we know, speech is the simplest way to communicate with other

person. But, along with the development and innovation in the technology which

goes rapidly, present communication processes also occurred between human and

devices such as computer. Speech recognition or also known as Automatic Speech

Recognition (ASR) is a technique developed to assist the human computer

interaction now becomes one of potential research object for many researchers.

ASR allows computer devices to receive information in form of words or

sentences spoken by the human and then recognized by the system using

information contained in the speech signal.

In this research, voice command recognition in Indonesian language is

designed by using Mel Frequency Cepstral Coefficient (MFCC) as feature

extraction method, and Hidden Markov Model (HMM) as the recognition method.

The signal energy based segmentation is also performed to split the speech

utterance from speaker to several word segments because the system works on

word level recognition (Isolated Word Recognition).

Based in the research and testing for 20 determined words in the system

dataset, obtained that system is capable to recognize speech commands correctly

with various word length from 2 to 4 words with 92, 49% accuracy. The optimal

training parameters resulted from the experiment are number of training dataset 5

sample for each word, 24 filter-banks, 5 maximum iteration of training, and 3

states for each word model

Kata Kunci: Speech Recognition, MFCC, HMM, Voice Command, Speech

Segmentation

Page 6: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

v

KATA PENGANTAR

Penelitian dengan judul “Penerapan Metode Hidden Markov Model dan

Mel Frecuency Cepstral Coefficient dalam Pengenalan Voice Command

Berbahasa Indonesia” ini disusun dalam rangkaian kegiatan pelaksanaan Tugas

Akhir di Jurusan Ilmu Komputer FMIPA UNUD. Penelitian ini dilaksanakan pada

periode Januari 2015 hingga Juni 2015 di Universitas Udayana.

Sehubungan dengan telah terselesaikannya penelitian ini, maka diucapkan

terimakasih dan penghargaan kepada berbagai pihak yang telah membantu

pengusul, antara lain

1. Bapak Agus Muliantara, S.Kom, M.Kom sebagai Pembimbing I yang telah

membantu dalam penyelesaian penelitian ini;

2. Bapak Ngurah Agus Sanjaya, ER, S.Kom., M.Kom sebagai Pembimbing II

yang telah bersedia meluangkan waktunya dalam penyelesaian penelitian

ini;

3. Bapak Drs. I Wayan Santiyasa selaku Ketua Jurusan Ilmu Komputer

Universitas Udayana yang telah banyak memberikan masukan dan

motivasi sehingga memperlancar dalam proses pelaksanaan penelitian ini;

4. Bapak-bapak dan ibu-ibu dosen di Jurusan Ilmu Komputer yang bersedia

meluangkan waktunya untuk memberikan masukan dalam penyempurnaan

penelitian ini;

5. Kawan-kawan di Jurusan Ilmu Komputer yang telah memberikan

dikungan moral dalam penyelesaian penelitian ini.

Disadari pula bahwa sudah tentu penelitian ini masih mengandung kelemahan dan

kekurangan. Memperhatikan hal ini, maka masukan dan saran-saran

penyempurnaan sangat diharapkan

Denpasar, Juli 2015

Penulis

Page 7: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

vi

DAFTAR ISI

SKRIPSI ................................................................................................................... i

LEMBAR PENGESAHAN TUGAS AKHIR ........ Error! Bookmark not defined.

ABSTRAK ............................................................................................................. iii

ABSTRACT ........................................................................................................... iv

KATA PENGANTAR .............................................................................................. v

DAFTAR ISI .......................................................................................................... vi

DAFTAR GAMBAR .............................................................................................. x

DAFTAR TABEL .................................................................................................. xii

DAFTAR LAMPIRAN ........................................................................................ xiii

BAB I ...................................................................................................................... 1

PENDAHULUAN .................................................................................................. 1

1.1 Latar Belakang ........................................................................................ 1

1.2 Rumusan Masalah .................................................................................. 3

1.3 Batasan Masalah ..................................................................................... 4

1.4 Tujuan Penelitian .................................................................................... 4

1.5 Manfaat Penelitian .................................................................................. 4

1.6 Metodelogi Penelitian ............................................................................. 4

1.6.1 Desain Penelitian .......................................................................... 5

1.6.2 Pengumpulan data ........................................................................ 5

1.6.3 Pengolahan Data Awal ................................................................. 5

1.6.4 Metode yang Digunakan .............................................................. 6

BAB II ..................................................................................................................... 7

Page 8: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

vii

TINJAUAN PUSTAKA .......................................................................................... 7

2.1 Suara (Wicara) ........................................................................................ 7

2.1.1 Karakteristik Sinyal Suara............................................................ 7

2.1.2 Representasi Sinyal Suara ............................................................ 8

2.1.3 Energi Sinyal Suara ...................................................................... 9

2.1.4 Filter pada Sinyal Suara ............................................................. 10

2.2 Automatic Speech Recognition (ASR) ................................................. 10

2.2.1 Karakteristik Sistem Pengenalan Suara ...................................... 11

2.2.2 Klasifikasi Sistem Pengenalan Suara ......................................... 12

2.3 Mel Frequency Cepstrum Coefficient(MFCC) ..................................... 14

2.4 Hidden Markov Model (HMM) ............................................................ 19

2.4.1 Markov Model ............................................................................ 19

2.4.2 Hidden Markov Model ............................................................... 19

2.4.3 Penyelesaian masalah dengan HMM ......................................... 21

2.4.4 Pemodelan Unit Wicara.............................................................. 25

BAB III ................................................................................................................. 27

ANALISIS DAN PERANCANGAN SISTEM .................................................... 27

3.1 Kebutuhan Fungsional .......................................................................... 27

3.1.1 Melakukan Pre-Processing ......................................................... 27

3.1.2 Melakukan Ekstraksi Fitur Suara ............................................... 27

3.1.3 Melakukan Pendeteksian Batasan Kata pada Suara ................... 27

3.1.4 Melakukan Pengenalan Instruksi yang Diucapkan .................... 28

3.2 Rancangan Data .................................................................................... 28

3.3 Rancangan Antarmuka Sistem .............................................................. 29

Page 9: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

viii

3.4 Rancangan Pengolahan Data ................................................................ 32

3.4.1 Preprocessing ............................................................................. 32

3.4.2 Ekstraksi Fitur ............................................................................ 33

3.4.3 Pelatihan HMM .......................................................................... 34

3.4.4 Segmentasi Kata ......................................................................... 36

3.4.5 Pengenalan Suara ....................................................................... 37

3.5 Pengujian dan Evaluasi ......................................................................... 38

BAB IV ................................................................................................................. 41

HASIL DAN PEMBAHASAN ............................................................................. 41

4.1 Implementasi Sistem ............................................................................ 41

4.2 Implementasi Proses Ekstraksi Fitur .................................................... 41

4.3 Implementasi Inisialisasi Model HMM ................................................ 43

4.4 Implementasi Pelatihan Parameter Model HMM ................................. 45

4.5 Implementasi Proses Segmentasi Sinyal Suara .................................... 45

4.6 Implementasi Proses Pengenalan Insruksi ............................................ 48

4.7 Tampilan Antarmuka Pengenalan Intruksi Suara ................................. 49

4.8 Hasil Pengujian Sistem ......................................................................... 52

4.7.1 Pengujian Terhadap Jumlah Dataset per Kata ............................ 53

4.7.2 Pengujian Terhadap Jumlah Filter-Bank .................................... 54

4.7.3 Pengujian Terhadap Jumlah Iterasi Maksimum Pelatihan HMM

55

4.7.4 Pengujian Terhadap Jumlah State Model HMM ........................ 56

4.7.5 Pengujian Dengan Parameter Optimal ....................................... 57

4.7.6 Pengujian Durasi Pengucapan Instuksi ...................................... 59

Page 10: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

ix

BAB V ................................................................................................................... 63

KESIMPULAN DAN SARAN ............................................................................. 63

5.1 Kesimpulan ........................................................................................... 63

5.2 Saran ..................................................................................................... 63

DAFTAR PUSTAKA ............................................................................................ 64

LAMPIRAN

Page 11: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

x

DAFTAR GAMBAR

Gambar 2.1 Tiga Representasi Sinyal Suara ........................................................... 8

Gambar 2.2 Sinyal Domain Waktu dan Domain Frekuensi .................................... 9

Gambar 2.3 Diagram Sistem Pengenalan Suara. Tahap training(a), tahap

pengenalan(b) ........................................................................................................ 12

Gambar 2.4 Proses FrameBlocking....................................................................... 15

Gambar 2.5 Contoh hasil Windowing sinyal suara................................................ 16

Gambar 2.6 Mel Filter Bank dengan 24 buah filter .............................................. 18

Gambar 2.7 Parameter Probabilistik pada Hidden Markov Model ....................... 21

Gambar 2.8 Diagram Treilis Untuk Perhitungan Prosedur Maju ......................... 23

Gambar 2.9 Proses Rekursif Untuk Menentukan Jalur Terpendek Menggunakan

Algoritma Viterbi .................................................................................................. 24

Gambar 3.1 Rancangan tampilan awal sistem ...................................................... 29

Gambar 3.2 Rancangan tampilan input parameter training .................................. 29

Gambar 3.3 Rancangan tampilan pengenalan suara ............................................. 30

Gambar 3.4 Rancangan tampilan segmen kata ..................................................... 31

Gambar 3.5 Flowchart preprocessing ................................................................... 32

Gambar 3.6 Flowchart proses ekstraksi fitur suara ............................................... 33

Gambar 3. 7 Ilustrasi Hidden Markov Model ....................................................... 34

Gambar 3.8 Flowchart proses pelatihan model HMM .......................................... 35

Gambar 3.9 Flowchart proses segmentasi kata ..................................................... 36

Gambar 3.10 Flowchart proses pengenalan kata................................................... 38

Gambar 4.1 Sinyal suara untuk kata “ac” ............................................................. 41

Gambar 4.2 Fitur sinyal suara untuk kata “ac” ..................................................... 43

Gambar 4.3 Kandidat batas kata untuk kalimat “tolong turunkan volume tv” ..... 47

Gambar 4.4 Batas kata hasil segmentasi untuk kalimat “tolong turunkan volume

tv” .......................................................................................................................... 48

Gambar 4.5 Tampilan Antarmuka Sistem ............................................................. 50

Page 12: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

xi

Gambar 4.6 Antarmuka Input Parameter Pelatihan HMM.................................... 50

Gambar 4.7 Tampilan Proses Pelatihan Model HMM .......................................... 51

Gambar 4.8 Tampilan Hasil Pengenalan Instruksi ................................................ 52

Gambar 4.9 Grafik Pengaruh Jumlah Filter-Bank Terhadap Akurasi Pengenalan 54

Gambar 4.10 Grafik Pengaruh Jumlah Iterasi Terhadap Akurasi Pengenalan ...... 55

Gambar 4.11 Grafik Pengaruh Jumlah State Terhadap Akurasi Pengenalan ........ 56

Gambar 4.12 Hasi Segmentasi Intruksi dengan Durasi 0-1,5 detik ...................... 59

Gambar 4.13 Hasi Segmentasi Intruksi dengan Durasi 1,5-2,5 detik ................... 60

Gambar 4.14 Hasi Segmentasi Intruksi dengan Durasi 2,5-4 detik ...................... 60

Page 13: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

xii

DAFTAR TABEL

Tabel 4.1 Sintaks Proses Ekstraksi Fitur ............................................................... 42

Tabel 4.2 Sintaks Proses Inisialisasi Model HMM ............................................... 43

Tabel 4.3 Sintaks Proses Pelatihan Model HMM ................................................. 45

Tabel 4.4 Sintaks Proses Segmentasi Sinyal Suara ............................................... 45

Tabel 4.5 Sintaks Fungsi Segmentasi Sinyal Suara .............................................. 47

Tabel 4.6 Sintaks Proses Pengenalan Instruksi ..................................................... 49

Tabel 4.7 Hasil Pengujuan Terhadap Jumlah Dataset yang Digunakan ................ 53

Tabel 4.8 Hasil Pengujuan Terhadap Jumlah Filter-Bank ..................................... 54

Tabel 4.9 Hasil Pengujian Terhadap Jumlah Iterasi Maksimum Pelatihan HMM 55

Tabel 4.10 Hasil Pengujian Terhadap Jumlah State Model HMM ........................ 56

Tabel 4.11 Hasil Pengujian Sistem dengan Parameter Optimal ............................ 57

Tabel 4.12 Hasil Pengujian dengan Panjang Kata yang Berbeda ......................... 58

Tabel 4.13 Hasil Akurasi Pengenalan Masing-Masing Kata ................................. 58

Tabel 4.14 Hasil Pengujian Durasi Pengucapan Instruksi yang berbeda .............. 60

Page 14: PENERAPAN METODE HIDDEN MARKOV MODEL DAN MEL … Halaman... · digunakan sesama manusia. Namun, seiring dengan perkembangan teknologi, proses komunikasi juga terjadi antara manusia

xiii

DAFTAR LAMPIRAN

Lampiran

1. Hasil Pengujian Jumlah Dataset

2. Hasil Pengujian Jumlah Filter-Bank

3. Hasil Pengujian Jumlah Iterasi Maksimum Pelatihan

4. Hasil Pengujian Banyak State HMM

5. Hasil Pengujian Sistem dengan Parameter Optimal