Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih...

26
Ekstraksi Ciri Ucapan Menggunakan Analisis Komponen Utama (Principal Components Analysis - PCA) Dr. R. Rizal Isnanto, S.T., M.M., M.T. Program Studi Sistem Komputer Universitas Diponegoro Semarang, Indonesia Matakuliah Speech Recognition (Pertemuan ke-6 dan ke-7)

Transcript of Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih...

Page 1: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Ekstraksi Ciri Ucapan Menggunakan

Analisis Komponen Utama

(Principal Components Analysis - PCA)

Dr. R. Rizal Isnanto, S.T., M.M., M.T.

Program Studi Sistem Komputer

Universitas Diponegoro

Semarang, Indonesia

Matakuliah Speech Recognition

(Pertemuan ke-6 dan ke-7)

Page 2: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Pendahuluan

Pada proses pengenalan ucapan, langkah yang dilakukan

setelah pengambilan data atau sampel ucapan adalah

EKSTRAKSI CIRI.

Ekstraksi ciri bertujuan mengambil ciri-ciri utama dari data

dengan mengambil informasi yang dominan dan membuang

informasi lain. Ciri bersifat unik, seringkali hanya memiliki

sejumlah kecil nilai, namun mewakili satu entitas yang besar.

Dengan ekstraksi ciri, maka pengenalan, pembandingan,

ataupun analisis dilakukan pada sejumlah nilai terbatas, misal

vektor yang terdiri atas beberapa nilai, bukan pada

keseluruhan nilai pada data.

Dengan ekstraksi ciri diharapkan proses pengenalan dapat

dilakukan dengan lebih cepat.

9-2

2

Page 3: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Contoh makalah

9-3

3

Page 4: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Background Mathematics

9-4

4Statistika

1. Rerata (mean)

Page 5: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

2. Simpangan Baku

(Standard Deviation)

9-5

5

Page 6: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

3. Varians

9-6

6

Page 7: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

4. Kovarians (covariance) (1)

9-7

7

Page 8: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Kovarians (covariance) (2)

9-8

8

Page 9: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Kovarians (covariance) (3)

9-9

9

Page 10: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

5. Matriks Kovarians (1)

9-10

10

Page 11: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Matriks Kovarians (2)

9-11

11

Page 12: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

PR (2)

9-12

12

Page 13: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

6. Aljabar Matriks

9-13

13

Page 14: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Eigenvector dan Eigenvalues (1)

9-14

14

Page 15: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Eigenvector dan Eigenvalues (2)

9-15

15

Page 16: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Eigenvector dan Eigenvalues (2)

9-16

16

Page 17: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

9-17

17

Page 18: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

PenutupMinggu depan: baru PCA-nya!!

Demikian paparan saya

sampaikan

Terima kasih…

Pa

ge18

© 2015 R. Rizal Isnanto, All rights reserved.

Page 19: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

PCA (Pertemuan ke-7)

Pada pengolahan sinyal ucapan, satu gelombang

ucapan dibagi menjadi blok-blok berukuran sama.

Blok 1 dimensi (vektor) dibuat sebagai matriks

bujursangkar (n x n)

Setiap blok dicari nilai-nilai eigen-nya (ada n nilai eigen)

Setelah semua blok dicari nilai-nilai eigen-nya, maka

semua nilai eigen tersebut diurutkan dari yang terbesar

sampai yang terkecil (l1, l2, l3, l4, dst.)

Nilai-nilai eigen itulah yang disebut sebagai komponen-

komponen utama (principal components)

9-19

Page 20: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Lanjutan PCA (2)

Setelah itu, diambil beberapa komponen utama

terbesar, misalnya 75 terbesar, 50 terbesar, atau 10

terbesar.

Komponen-komponen utama tersebut dimasukkan ke

dalam vektor ciri.

Vektor ciri dari sinyal ucapan uji dibandingkan dengan

vektor ciri dari sinyal ucapan data latih menggunakan

model similarity measures, misalnya Jarak Euclidean,

Jarak Minkowski dan sebagainya.

9-20

Page 21: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Lanjutan PCA (3)

Jarak yang paling kecil (minimum) terhadap satu vektor

ciri data latih menunjukkan bahwa data uji dikenali

sebagai paling dekat kemiripannya dengan data latih

tersebut, atau dikenali sebagai data latih tersebut

Untuk implementasi, sering digunakan nilai ambang

(threshold) untuk menentukan suatu data uji bisa

dikenali atau tidak bisa dikenali. Jika jarak > nilai

ambang, maka akan diperoleh keluaran “TIDAK

DIKENALI”.

Jika jarak <= nilai ambang, maka data uji dikenali

sebagai salah satu dari data latih yang menghasilkan

jarak (selisih) minimum.9-21

Page 22: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Efisiensi komputasi dengan PCA

Misal dari seluruh komponen utamanya diambil 25%

terbesarnya

Dari n x n ciri (atau dalam sinyal ucapan adalah n2 ciri

dalam baris yang sama) akan diperoleh n komponen

utama

Maka jumlah ciri uji yang harus dicocokkan dengan ciri

pada data latih = 0,25n.

Sehingga efisiensi komputasi = 1 – [(0,25n) / n2]

= 1 – [0,25 / n]

= {1 – [1/(4n)]} x 100%9-22

Page 23: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Penutup

Ada pertanyaan?

Kita lanjutkan dengan “Everything about UTS”

9-23

Page 24: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Everything about UTS (1)

Buka ringkasan 1 lbr double folio asli (tulis tangan)

Tutup buku, laptop, HP, dan sejenisnya

Boleh buka kalkulator

Waktu: 90 menit

9-24

Page 25: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Everything about UTS (2)

Materi yang harus dipersiapkan:

1. Konversi analog ke digital

2. Speaker Recognition vs Speech Recognition

3. Teknologi Text-To-Speech (TTS) dan Speech-To-Text

(STT)

4. Similarity measures: Jarak Euclidean, Minkowski, dsb.

5. PCA: mean, varians, kovarians, nilai dan vektor eigen.

6. Sistem Biometrika: iris, sidik-jari, dsb., selain suara

9-25

Page 26: Dr. R. Rizal Isnanto, S.T., M.M., M.T. filePada pengolahan sinyal ucapan, ... ciri data latih menunjukkan bahwa data uji dikenali ... Buka ringkasan 1 lbr double folio asli ...

Selamat Belajar

Semoga sukses

9-26