Speech Recognition

20
Assalamu’alaikum Wr. Wb

description

DOWNLOAD AJA

Transcript of Speech Recognition

Assalamualaikum Wr. Wb

Assalamualaikum Wr. WbSpeech RecognitionDi Susun Oleh :Muhammad AlvianMuksal MinaSyahrialDefinisi Speech RecognitionSpeech Recognition atau Automatic Speech Recognition (ASR) atau pengenalan suara adalah sebuah proses konversi sinyal suara menjadi kata atau perintah.

Alat pengenal ucapan, yang sering disebut denganspeech recognizer, membutuhkan sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan dalamkomputer, dan kemudian digunakan sebagai basis data dalam mencocokkan kata yang diucapkan selanjutnyaSejarah Speech RecognitionTahun 1874 : Alexander Graham Bell berhasil membuktikkan bahwa frekuensi harmoni dari sebuah sinyal elektrik dapat dibagi-bagi yang kemudian hari berlanjut pada digitalisasi ucapan. Tahun 1952 : Bell Labs mengembangkan speech recognizer pertama dengan menggunakan teknologi pemisah frekuensi yang serupa dengan teknologi yang dikembangkan oleh Alexander Graham Bell. 1971-1976 : Defence Advance Research Project Agency dibentuk yang merupakan proyek riset dengan dana dari pemerintah ASBagaimana Speech Recognition Kerja?input audioAplikasikan "tata bahasa" sehingga pengenal ucapan diketahui apa yang diharapkan.Model akustikteks diakui

Bagaimana komputer mungkin melakukannya?7/34Bagaimana Manusia melakukannyaArticulation producessound waves whichthe ear conveys to the brainfor processing

78/34Bagaimana komputer mungkin melakukannya?digitalisasiAnalisis akustik sinyal suarainterpretasi linguistik

Acoustic waveformAcoustic signalSpeech recognition

8Proses Produksi dan Pengenalan Suara ManusiaProses produksi suara adalah suatu proses untuk menghasilkan sinyal suara manusia dimana sinyal suara pada awalnya berasal dari otak yang memformulasikan pesan yang ingin disampaikan melalui mulut. Pesan tersebut sebenarnya adalah seperti halnya teks/tulisan kemudian diolah menjadi kode bahasa (languange code). Kode bahasa ini sebenarnya adalah sebuah database (memori) dalam otak kita yang mencocokkan pesan dengan kode-kode tersebutProses Produksi dan Pengenalan Suara ManusiaDiagram produksi dan pengenalan suara pada manusia

Jenis-jenis Speech RecognitionKata-kata yang terisolasiKata-kata yang berhubunganKata-kata yang berkelanjutanKata-kata spontanVerifikasi atau identifikasi suara

Kata-kata yang terisolasiProses pengidentifikasian kata yang hanya dapat mengenal kata yang diucapkan jika kata tersebut memiliki jeda waktu pengucapan antar kata.

Kata-kata yang berhubunganProses pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namunmembutuhkan jeda waktu pengucapan antar kata yang lebih singkat.Kata-kata yang berkelanjutanProses pengidentifikasian kata yang sudah lebih maju karena dapat mengenal kata kata yang diucapkan secara berkesinambungan dengan jeda waktu yang sangat sedikit atau tanpa jeda waktu. Proses pengenalan suara ini sangat rumit karena membutuhkan metode khusus untuk membedakan kata-kata yang diucapkan tanpa jeda waktu. Pengguna perangkat ini dapat mengucapkan kata-kata secara natural.Kata-kata spontanProses pengidentifikasian kata yang dapat mengenal kata-kata yang diucapkan secara spontan tanpa jeda waktu antar kata.Verifikasi atau identifikasi suaraProses pengidentifikasian kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicaraKelebihan Speech RecognitionCepatTeknologi ini mempercepat transmisi informasi dan umpan balik dari transmisi tersebut. Contohnya pada komando suara. Hanya dalam selang waktu sekitar satu atau dua detik setelah kita mengkomandokan perintah melalui suara, komputer sudah memberi umpan balik atas komando kita.

Mudah digunakanKemudahan teknologi ini juga dapat dilihat dalam aplikasi komando suara. Komando yang biasanya kita masukkan ke dalam komputer dengan menggunakan tetikus atau papan ketik kini dapat dengan mudahnya kita lakukan tanpa perangkat keras, yakni dengan komando suaraKekurangan Speech RecognitionRawan terhadap gangguanHal ini disebabkan oleh proses sinyal suara yang masih berbasis frekuensi. Ketika sebuah informasi dalam sinyal suara mempunyai komponen frekuensi yang sama banyaknya dengan komponen frekuensi gangguannya, akan sulit untuk memisahkan gangguan dari sinyal suara.

Jumlah kata yang dapat dikenal terbatasHal ini disebabkan pengenal ucapan bekerja dengan cara mencari kemiripan dengan basis data yang dimilikiKesimpulanSuara atau ucapan adalah cara berkomunikasi yang paling sering dilakukan oleh manusia. Komunikasi yang dilakukan antara manusia dan komputer sering disebut sebagai Human Computer Interface (HCI) atau Interaksi manusia dan komputer (IMK). Pengenalan suara atau Speech Recognition menjadi salah satu hal potensial penting yang menjadi perhatian dalam interaksi antara manusia dan komputer.

Aplikasi pengenalan suara yang telah diimplementasikan hingga saat ini antara lain untuk melakukan panggilan (Misalnya, "Come Here"), Melakukan input data sederhana (Misalnya, memasukkan nomor kartu kredit), Pengolahan kata menjadi teks (Misal, google translate), sistem pesawat (Misal, pengatur lalu-lintas udara atau yang dikenal dengan Air Traffic Controllers ).Terima Kasih Atas Perhatiannya

Wassalamualaikum Wr. Wb