Klastering Suara Laki Laki Dan Perempuan Menggunakan Algoritma K Means Berdasarkan Hasil Ekstraksi...
-
Upload
cicik-dian-pratywi -
Category
Documents
-
view
224 -
download
0
Transcript of Klastering Suara Laki Laki Dan Perempuan Menggunakan Algoritma K Means Berdasarkan Hasil Ekstraksi...
-
7/26/2019 Klastering Suara Laki Laki Dan Perempuan Menggunakan Algoritma K Means Berdasarkan Hasil Ekstraksi FFT
1/4
Klastering Suara Laki-Laki dan Perempuan
Menggunakan Algoritma K-Means
Berdasarkan Hasil Ekstraksi FFT (Fast Fourier Transform)
Eko Aditya Santoso, Umar Sagaf, Muhammad Efendi, Reza Fahrur Rasyid, Teguh Adi Gunawan
email :[email protected], [email protected], [email protected],
[email protected], [email protected]
ABSTRAK
Klastering suara adalah salah satu dari bidang ilmu pengenalan pola yang dibuat agar suatu sistem dapat
melakukan pengelompokan untuk membedakan suara laki - laki ataupun perempuan. Mekanisme kerja yang
dilakukan adalah dengan mengumpulkan contoh-contoh suara, kemudian dilakukan ekstraksi ciri menggunakan
FFT yang dimana menghasilkan dua fitur utama yaitu nilai maksimum frekuensi dan nilai maksimum
simpangan frekuensi yang lalu disimpan dalam file. Pada saat ada input suara yang dimasukan, sistem akan
mengolahnya dengan menggabungkan hasil ekstrasi cirinya dengan hasil ekstraksi ciri yang terdapat dalam file,
lalu algoritma K-means digunakan untuk menghitung jarak terdekat antar centroid sehingga dapat
dikelompokkan menjadi cluster 0 (laki laki) dan cluster 1 (perempuan).
Hasil dari uji coba ini menggunakan 20 data latih dan 10 data uji menghasilkan tingkat akurasi 80% untuk
data latih dan 70% untuk data uji. ABSTRACT
Voice clustering is part of Patern Recognition science. So, system can perform clustering to distinguish
male or female voices. Application mechanism is to collect sound samples, then using the extraction of FFT
feature, which produces two main features, namely maximum frequency value and maximum frequency
deviation value then stored in a file. At the moment when the sound input is entered, the system will process
them by combining the results of the extraction characteristics with feature extraction that stored in the file, then
K-means clustering algorithm is used to calculate the shortest distance between the centroid, thus the system can
grouped them into clusters 0 (male) and cluster 1 (female).
The results of this research by using 20 training data and 10 testing data will produced 80% accuracy rate
for training data and 70% for the testing data.
Kata kunci :K-Means,FFT,frekuensi,amplitude,cluster
1. Pendahuluan
Suara manusia memiliki keragaman bentuk
yang berbeda-beda, keragaman tersebut dapat
terlihat dari persepsi fisik manusia terhadap suara
antara lain: frekuensi, jenis suara, pitch, timbre dan
volume. Perbedaan tersebut dapat terdengar secara
jelas antara seseorang berjenis kelamin laki-laki
dan perempuan. Kemudahan untuk
mengidentifikasi tersebut bertambah apabila
seseorang dapat mendengar dan melihat secara
langsung ucapan dan suara dari lawan
pembicaranya [1].
Aplikasi deteksi jenis kelamin berdasarkansuara adalah system yang dapat melakukan
klusterisasi data suara ke dalam kluster laki-laki
dan perempuan.
Tujuan Penelitian ini adalah untuk membangun
aplikasi yang dapat mengenali jenis kelamin
berdasarkan suaranya, rencana pengembangannya
selanjutnya adalah mampu diaplikasikan pada robot
atau mesin penjawab otomatis. Dengan adanya
pengenalan gender ini nantinya robot atau mesin
penjawab otomatis dapat menggunakan
istilahistilah yang tepat sebagai kata sapa
(contohnya: Pak, Ibu, Mr, Mrs) sehingga terkesan
lebih interaktif. Selain itu dengan mengenali antaraperbedaan suara laki-laki dan perempuan
diharapkan nantinya akan dibuat suara artificial
sesuai dengan jenis kelaminnya.
2. Audio Feature
1. Amplitudo
Amplitudo Yaitu fungsi periodik yang
mempunyai maksimum dan minimum, dan
Amplitudo adalah setengah dari jarak antara titik
terendah dan titik tertinggi pada grafik. Dengan
kata lain Amplitudo merupakan simpangan terjauh
dari sebuah getaran [2].
2. Periode
Secara umum periode didefinisikan sebagaiwaktu yang dibutuhkan untuk sebuah isyarat atau
gelombang mencapai satu gelombang penuh.
Pengertian ini berlaku untuk isyarat monokromatis.
Isyarat monokromatis yang dimaksud adalah
gelombangnya bersifat tunggal, dimana dia pasti
memiliki sebuah periode. Dengan demikian isyarat
itu dikenal dengan istilah periodis. Secara
gamblang kita bisa mengenali nilai-nilai yang
terkandung di dalam isyarat termasuk nilai periode
nya. Perhatikan Gambar 1 di bawah untuk
memperjelas pengertian di atas [2].
-
7/26/2019 Klastering Suara Laki Laki Dan Perempuan Menggunakan Algoritma K Means Berdasarkan Hasil Ekstraksi FFT
2/4
Gambar 1. Periode
3.Frekuensi
Secara umum frekuensi diartikan sebagai
jumlah gelombang yang terjadi dalam 1 detik.
Frekuensi didefinisikan secara sederhana sebagaikebalikan dari waktu. Sehingga waktu yang
satuannya adalah detik (second) akan menjadi
Hertz (1/second) untuk frekuensi. Frekuensi hanya
akan memiliki tepat satu nilai spektrum. Yang
dikenal dengan spektrum frekuensi. Pengertian
frekuensi ini juga berlaku untuk gelombang
monokromatis [2].
4.FFT (Fast Fourier Transform)
FFT merupakan metode untuk pemecahan
sinyal diskret. FFT adalah algoritma komputasional
yang efisien untuk menghitung DFT (Discrete
Fourier Transform) bila ukuran N adalah pangkat 2dan bila pangkat 4. DFT akan menghasilkan jumlah
komputasi sebesar N2 sedangkan FFT akan
menghasilkan jumlah komputasi sebesar (N) log
(N) [4].
Perhitungan FFT menggunakan butterfly Radix-
2 menghasilkan jumlah komputasi lebih sedikit
yakni (N/2) log 2 (N). Jumlah titik dalam ketika
menggunakan FFT juga memenuhi syarat 2 [3].
FFT digunakan untuk memisahkan isyarat
menjadi komponen penyusun frekuensinya yang
tidak bisa dipisahkan secara gamblang hanya
dengan melihat isyarat tersebut dalam kawasan
waktu. Perhatikan gambar berikut ini untukmenjelaskan seperti apa hasil dari FFT terhadap
sebuah isyarat yang memiliki beragam komponen
frekuensi [3].
3. Klastering K-Means
K-Means merupakan salah satu metode data
klasterisasi non hirarki yang berusaha mempartisi
data yang ada ke dalam bentuk satu atau lebih
cluster/kelompok. Metode ini mempartisi data ke
dalam klaster/kelompok sehingga data yang
memiliki karakteristik yang sama dikelompokkan
ke dalam satu cluster yang sama dan data yang
mempunyai karakteristik yang berbedadikelompokkan ke dalam kelompok yang lain.
Adapun tujuan dari data klasterisasi ini adalah
untuk meminimalisasikan objective function yang
diset dalam proses clustering, yang pada umumnya
berusaha meminimalisasikan variasi di dalam suatu
cluster dan memaksimalisasikan variasi antar
cluster. Data clustering menggunakan metode K-
Means ini secara umum dilakukan dengan
algoritma dasar untuk mempartisi suatu dataset kedalam cluster-cluster sebagai berikut [5]:
1. Tentukan jumlah cluster
2. Tentukan centrioid
3. Hitung centroid dari data yang ada di masing-
masing cluster
4. Alokasikan masing-masing data ke centroid
dengan menghitung jaraknya yang paling dekat.
5. Kembali ke Step 3, apabila masih ada data yang
berpindah cluster atau jika perubahan nilai
centroid ada yang di atas nilai threshold yang
ditentukan atau jika perubahan nilai pada
objective function yang digunakan di atas nilai
threshold yang ditentukan
4. Metode Penelitian
Proses klastering diaplikai ini bertujuan untuk
mencari klaster sebuah data file suara (data uji),
dimana untuk melakukan hal tersebut dibutuhkan
sekumpulan data latih untuk nantinya keduanya
digabungkan dan kemudian dilakukan proses
klastering. Kemudian diperiksa berada diklaster
manakah data uji tersebut berada [5]. Untuk lebih
jelasnya perhatikan Gambar 2.
Gambar 2. Flow Chart Training Data
4.1. Pengumpulan Data
Data suara didapatkan dengan merekam secara
langsung, dimana output hasil rekaman sudah
otomatis memiliki format wav. Selain itu
digunakan pula pengaturan sampling rate sebesar
-
7/26/2019 Klastering Suara Laki Laki Dan Perempuan Menggunakan Algoritma K Means Berdasarkan Hasil Ekstraksi FFT
3/4
44100 Hz pada alat perekam, untuk mendapatkan
kualitas rekaman yang maksimal.
Jumlah data yang digunakan sebagai data latih
sebanyak 20 yang terdiri dari 10 suara laki laki
dan 10 suara perempuan, serta 10 data uji yang
terdiri dari 5 suara laki laki dan 5 suara
perempuan.
4.2. Pre-Processing
Pada tahap ini dilakukan pemeriksaan, apakah
data memang sudah baik atau belum. Yaitu dengan
melakukan pemeriksaan format file yang
digunakan, merupakan file berformat wav atau
tidak. Kemudian memeriksa apakah data suara
benar benar menggunakan sampling ratesebesar
44100 Hz atau tidak.
4.3. Ekstraksi Fitur
Ekstraksi fitur dimulai dengan meng-ekstrak
tiap-tiap data latih sebanyak 20 buah data, sertasatu dari 10 data uji yang ingin ditentukan
klasternya. Hasil ekstraksi tadi akan menghasilkan
fitur berupa frequensi maksimal dan |Y(freq)|.
Setelah itu semua data tersebut dimasukan ke
dalam file untuk nantinya dilakukan klastering.
4.4. Klastering
Klastering dilakukan dengan meng-klaster 21
data yang terdiri dari 20 data latih dan 1 data uji
menggunakan algorima K-Means, dimana kami
menentukan jumlah klaster sebanyak dua buah,
yaitu cluster 0 (laki laki) dan cluster 1
(perempuan). Setelah itu kami tentukan centroidmasing-masing klaster secara acak dari 20 data
latih untuk kemudian dihitung jarak terdekat antar
centroid tersebut dengan data lainnya. Untuk
menghitung jaraknya kami menggunakan
Euclidean Distance, dengan persamaan 1 berikut:
a = centroid 1 atau 2
b = data
Persamaan 1. Euclidean Distance
5. Hasil dan Pembahasan
Jumlah data yang digunakan sebagai data latih
sebanyak 20 yang terdiri dari 10 suara laki laki
dan 10 suara perempuan dengan rincian pada Tabel
1, serta 10 data uji yang terdiri dari 5 suara laki
laki dan 5 suara perempuan dengan rincian pada
Tabel 1 dan Tabel 2. Untuk mengetahui jalannya
dalam melakukan testing data perhatikan Gambar 3.
Gambar 3. Flow Chart Testing Data
Tabel 1 Data Latih
Data Freq |Y(freq)|
L1 25908 432
L2 23703 627
L3 22417 389
L4 23887 430
L5 24805 1309
L6 25459 623
L7 24484 1011L8 22600 506
L9 24805 1663
L10 22894 347
P1 36381 511
P2 29767 454
P3 27049 1152
P4 25357 628
P5 23703 762
P6 24254 2059
P7 24622 142
P8 27562 270
P9 25537 88
P10 30869 479
Tabel 2 Data Uji
Data Freq |Y(freq)|
TL1 23703 337
TL2 28664 225
TL3 24254 2059
TL4 25357 88
TL5 29767 454
TP1 27562 376TP2 29215 260
-
7/26/2019 Klastering Suara Laki Laki Dan Perempuan Menggunakan Algoritma K Means Berdasarkan Hasil Ekstraksi FFT
4/4
TP3 29215 209
TP4 37484 1011
TP5 23703 627
Dari uji coba data latih sebanyak 20 buah,
didapatkan sebanyak 16 data yang benar, atausekitar 80% data yang akurat. Sedangkan 10 data
uji menghasilkan sekitar 70% data yang benar.
Hasil yang tidak akurat biasanya disebabkan
adanya kemiripan suara laki-laki dan perempuan
berdasarkan frekuensi, jenis suara, pitch, timbre
dan volume.
6. Kesimpulan
Kesimpulan yang didapatkan dari hasil uji coba
adalah sebagai berikut :
1.Algoritma K-Means merupakan salah satu
algoritma yang sering digunakan dalam proses
klasterisasi dikarenakan kemudahannya.
2.Ketidaktepatan akurasi dikarenakan adanya
kemiripan beberapa suara antara laki-laki dan
perempuan dalam hal frekuensi, jenis suara,
pitch, timbre dan volume. Oleh karena itu,
didapatkan akurasi sekitar 70% untuk data uji
dan 80% untuk data latih.
7. Daftar Pustaka
[1] Bhaskoro, Susetyo Bagas dan W. D, Altedzar
Riedho.(2012).Aplikasi Pengenalan GenderMenggunakan Suara.Seminar Nasional
Aplikasi Teknologi Informasi 2012.
[2] Kanginan, Marthein.(2011).Bilingual Physics
For Senior High School Jl.3B. Jakarta:Erlangga.
[3] Rao, K.R, Kim, D.N, dkk.(2010).Fast Fourier
Transform:Algorithms And Applications.
London:Springer Theses.
[4] Tanudjaja, Harlianto.(2008).Pengolahan
Sinyal Digital & Sistem Pemrosesan
Sinyal.Yogyakarta:Andi Publisher.
[5] Wu, Junjie.(2012).Advances in K-Menas
Clustering:A Data Mining
Thinking.London:Springer Theses.