Pengubahan Grafem Ke Fonem Bahasa Jawa ? g:j't
Transcript of Pengubahan Grafem Ke Fonem Bahasa Jawa ? g:j't
Pengubahan Grafem Ke Fonem Bahasa Jawa
Yohanes SuYantol dan Sri iFrartaJ2
Elins Fisika FMIPA' UGM'
SekiP Utara' YogYakarta
E-mail : 1 ) v ant o6,usm' a c' i d' 1 ) sh art a ti @'ugm' ac' id
Abstrak
Grafemadalahsatuanterkecilsebagaipembedadalamsebuahsistemaksarasedangkanfonemadalahadalah kesatuan bunyi yang terkecil aufu.."u'in;;;;t"g dapat mern-bedakan makna' Dalam sistem sintesis
ucapan dari teks p"rlrffire, pengubahan g;;i; menjadi-fone-' Gtuf"rn bahasa Jawa menggunakan jika
menggukan aksara l"*"""i" i u'Ji au.r 20 i;;;;"r, ."dung.;ifca menesunakan aksara Lalin ada 5 vokal dan
22 konsonan. Fonem b;h"r; l*u uau r0 r"k;;;;'tt"r"*r, a^n i-r-"?i-uotal' Pada makalah ini dijelaskan
;ngu*ffi;;*it- uurtu*u Jawa dalam aksara Latin menjadi fonem'
Katu Kunci : grafem, fonem, bahasa Jawq' sintesis ucapan
PENDAHULUANUcapan adalah kegiatan yang menghasilkan
suara dengan "u.u
rntngubah tekanan udara dalam
;ir; aiimlusi (Dutoit, 1997)' Sintesis ucapal
adalah tiruan ucapan manusia sedangkan slntesls
teks menjadi ucapan adalah konversi otomatis dari
il; ;;;fii ,r"upu' dengan mengtodekal. t:ks ke
dalam sinyal yung -"ngu*ndun g info rmasi .
I in guistik
il;;iilutut" ot"t'-*esin' Fungsi utama dari
;it;;; ,i.,t"ris teks menjadi ucagan adalah
*ergubut representasi linguistik' misalnya deretan
ri*U""f fonetii<, ke dalam mesin penghasil ucapan'
Sistesis teks menjadi ucapan melibatkan proses
o"n"ri".rnut",un dari " graphe'me (huruf) menjadi
'f;;;;;.- e;; ; i, m e adalah Luruf dalam kamus daftar
i"" t"O-itan fonem adalah satuan terkecil dari
;;;; ";r; membedakan satu kata dengan lainnva'
;;k '..-n"gto,,'"tsi dari huruf menjadi - fonem'
Jt-*" ,i",."tis teks menjadi ucapan melibatkan
modul pengolah bahasa alami (natural language-rr*"rrirn"- NLP) untuk menganalisis teks dalam
fi;*;";r.liri, ion"t, analisis sintaktis' analisis
r.ri"rit, dan pembangkit prosody'-Kalimat yang
;;"h;lpt"ses oleh -mod"l tersebut kemudian
ai-"""t"t sebagai masukan oleh modul p-engolah
-rir.i J[i,.r @isital signal processing - DSP)'""'' -blirJn
J"'*ilti*it ittem s intesi s teks menj adi
,"up*-liput dibagi menjaai ? g:j't {i'} *:1llXii' au" modul DSP' Modul NLP mengkonversl
i.[t *"r:"ai bentuk yang mengaldung, informasi
fl*tit, -'intonmi,
t"iing..giun nldu'.. O.un durasi
;;;;. Modul DSP mJJproses hasil dari modul
NLP menjadi suara ucapan' Gambar I menunjukkan
hubungan modul NLP dan DSP'
Gambar 1: Modul dalam sistem sintesis teks menjadi
ucapan
Makalah ini membahas konversi grafem
*."j;Jii;;;; (grapheme to phoneme - G2P) untuk
ffi;t; ia*a. G-.af"* (hurufl) dala-m bahasa Jawa
;;;;;;;t;nakan aksara Jawa (Hanacaraka) atau
ilffi;;,f:nu*ututu terdiri atas 20 huruf pokok
sedang fonem Bahasa Jawa ada l0'
GRAFEM DALAM BAHASA JAWA
Grafem adalah satuan terkecil sebagai pembeda
aufurn--r"U"uf, sistem aksara (Pusat-Bahasa' )' Dalam
iliilt, l"*^ awalnya menggunakan aksara, Jawa'
Akso:; i"*":it" ditransliterasi dalam huruf Latin
;;#i";;t tha/, lna/, lca/' ha/' lkal.',ldal,' l,ta/' lsa/''i i,' nJ,\oi, i dhu/, 1ul, lv al' l nv al' l
-mal' l ga/' lba/'
'tiiii, -T"e;l' Selain
- itu ada tanda-tanda vang
;;;"d-tebagai representasi vokal' huruf mati'
dan angka."-^'-V;fu dalam aksara Jawa ada lal' lil' -lul'
lel'
rct, tot,"iotit/O/ dinamakan 'pepet' "*l"l 'e' vang
t"i'a"p" pada kata sepuluh' iedang /e{ alymatan
liuil.,g' uaurun 'e' yang terdapat padakalasate'
Pada dasarnya -seUuah aksara (huruf) Jawa
,n"*iutu, ,"Ut'ut' suku kata..dalam huruf Latin''K;;;il;;
suatu aksara Jawa ditulis sesuai dengan
i*ri"n"""fisan huruf Latin suatu suku kata atau
pengubahan Grarem ke r"l,TfltffiJ;il: I ss
berdasarkan bunyi pengucapannya (Cahyono and
Suyanto,2005).
FONEM BAIIASA JAWA
Fonem adalah kesatuan bunyi yang terkecil
dalam sebuah bahasa yang dapat membedakan
makna (Pusat-Bahasa, )'Fonetik Qthonetics) adalah ilmu . yang
,.r"ry"iialn bunli bahasa ianpa melihat fungsi bunyi
iJ t"tugui penrbeda makna dalam suatu bahasa'
Fonetik irenyelidiki bunyi bahasa aarl sy$yj tuturan
utu" ".;u.un.
Dalam fonetik diselidiki dan
dirumuskan secara teratur tentang hal ikhwal bunyi
bahasa. Bagaimana cara terbentuknya bunyi; berapa
frekuensi, -intensitas, timbrenya sebagai
- getaran
,i*u; a^n bagaimana bunyi itu diterima oleh telinga
(Marsono, 1999).' Secara umum bunyi bahasa dibedakan menj{i
vokal, konsonan, dan semivokal' Pembedaan tnt
didasarkun pada ada tidaknya hambatan .(proses
"*t"i"tO pua utut bicara' Bunyi disebut vokal jika
t"r:rairy" iia* t"4uai hambatan pada alat bicara'
j"di ,ii* ada artikulasi. Hambatan untuk vokal
hanya pada pita suara saja' Hambatan yang hanya
terjadi puaa plta suara tidak lazim disebut artikulasi
(Marsono, 1999).' Bunyi disebut konsonan, bila terjadinya
dibentuk dengan menghambat arus udara pada
sebagian alat bicata, jadi ada artikulasi- Proses
hamiatan atau artikulasi ini dapat disertai dengan
bergetarnya pita suara. Jika artikulasi disertai dengan
berletamya pita suara maka yang t:!1di adalah
konsonan bersuara. Jika artikulasi tidak disertai
dengan bergetarnya pita suara maka dihasilkan
konsonan tak bersuara'Bunyi semi-vokal ialah bunyi yang secara
praktis tennasuk konsonan tetapi saat diartikulasikan
telum membentuk konsonan murni' Misalnya bunyi
lwl yang mempunyai tempat artikulasi bibir atas
e;g;, 6iuit uu*ut, atau bibir bawah dengan gigi
atas.
Jumlah vokal bahasa Jawa sama dengan jumlah
vokal bahasa Indonesia, yaitu sepuluh: [i' I' e' €' a' 'o; , U, ul. Contoh kaii yang menggunakan vokal
i"tt"Uut iapat dilihat pada Tabel 1 yang disusun
oleh Marsono (1999)'
Secara praktis biasanya konsonan dibedakan
menurut
1. cara dihambat (cara artikulasi);
2. tempat hambatan (tempat artikulasi);
t. hubungan posisional antara penghambat-
penghimbatnya atau hubungan antata
uttik lutot aktif dengan Pasif;
4. bergetar tidaknYaPita suara'
Konsonan bahasa Jawa hasil pengolahan dari
Marsono (1999) terlihat pada Tabel 2'
Tabel 1: Vokal bahasa Jawa dan contoh katanya
ln1
tulang rusukkecilkulitsakitsabit
100 I r".iir,1i:'3lrq?,i"'ke Fonem Bahasa rawa
N( Kon9-nm
Awal kata Tenqah kata Akilr kata
lontoh {rtl lotrtoh {di Contoh Ani
l.
3.
4.
5.
6.
'1.
8.
9.
10.
ll.
12.
13.
14.
15.
16.
11.
18.
19.
20.
2t.
22.
tpl<rl
tdl
tltq1
lcl
Lil
tkl
tel
t?l
Im]
lnl
till
fl
trl
tfl
lvI
tsl
lz\
thl
kl
otP?
bapak
lawa
dawa
,rukul
dhzleg
(&lala
tula
gula
ha|eng
nugla
n)at^
,8OnO
lali
Foto
wterm
segu
zakat
iawa
nda
sl8
gula
prpa
bapak
taw{
pmjagtumbuh
dalug
c&iala
matang
nmgka
nyata
begitu
lupa
foto
vetero
b€kal
z*at
udm
agak
\Pasarrtua
rada
cethak
ce/hak
w&wEa
sala
iaca
salwat
sui
8ua
lulo
sugu
ba.li
tq6it
delalusi
rua
,j*uh
tulu
pm
butlr n4rsab{
Bta
agak
legit-lmgit
dekat
brca
baja
timg
jag
seketika
sama
guM
licin
tdduk
pulmg
laGir
devaluci
N
rjuah
setia bmil
bagi
freteI
lawug
smbei
sey'
alu
sava,fi
l,*
teteP
papd
ana*
ulu
piw
iembatan
anak
ikil
etu kali
Iekp
empat
piotu
mbal
sef
hutm
letih
plM
Tabel2: Konsonan bahasa Jawa dan contoh katanya
Menurut Verhaar dalam (Marsono, 1999) bunyisemi-vokal secara praktis termasuk konsonan tetapikarena pada waktu diartikulasikan belummembentuk konsonan murni, maka bunyi-bunyi itudisebut semi-vokal. Dalam bahasa Jawa ada 2 semi-
vokal yaitu [w] dan [y]. Keduanya tidak pemah
berada di akhir kata, tetapi hanya di awal dan tengahkata saja. Tabel 3 menunjukkan 2 semi-vokaltersebut beserta contohnya.
Tabel 3: Semi-vokal bahasa Jawa dan contohkatanya
GRAFEM MENJADI FONEM DALAMBAIIASA JAWA
Pengubahan dari grafem menjadi fonemGrapheme to Phoneme - G2P adalah Proses
penetapan fonem berdasarkan huruf dari kata dalamkalimat diperlukan dalam sistem pengubahan teks
menjadi ucapan (text-to-speech - ff$ untukmenghasilkan pengucapan yang cocok dari katatersebut (Kee et a1.,2004).
Walaupun dimungkinkan untuk membuatdaftar fonem untuk setiap kata dalam suatu bahasayang dikerjakan oleh ahli bahasa tersebut, namunmetode ini akan memakan waktu, tergantung pada
bahasa, mudah terjadi kesalahan, dan tidak dapat
menangangi kata yang belum terdaftar (out ofvocabulary - OOn secara langsung. Dengan
demikian diperlukan sistem yang secara otomatismenghasilkan bentuk fonetik dari setiap kata baikyang ada dalam daftar maupun tidak. Metode yangdapat diggnakan untuk transkripsi fonem antara lainaturan fonologis (pendekatan berdasarkan aturan)
dan pengucapan dengan analogi (pendekatan
statistis) (Kee dkk, 2004).Aturan fonologis adalah penerapan ide bahwa
pengucapan huruf atau diftong dapat diketahui jikakonteksnya diketahui, yaitu huruf-hurufdisekitarnya. Bentuk aturan ini didasarkan pada
konsep fonologi generatif (Chomsky dan Halle, -):Dari bentuk tersebut huruf B, dengan konteks I
di kiri dan C di kanan akan dihasilkan pengucapan
D. Aturan ini dapat dengan mudah diterapkan dalampemrograman bahasa tingkat tinggi rnenjadi bentukTF ... THEN.
Pengucapan dengan analogi pronunciation by
analogy - PbA menerapkan pengetahuan fonologisyang didapat secara implisit pada kamus kata yang
dilengkapi dengan pengucapannya. Idenya adalah
bahwa pengucapan kata yang belum diketahui cara
pengucapannya dapat disusun dari pengucapan
penggalan kata yang sudah diketahui dari kata-kata
lain. Menurut R. I. Damper 0 ada 2PbA dasar yaitueksplisit dan implisit. Analogi eksplisit (Dedina and
Nusbaum, ) mensyaratkan kamus yang berisi daftarkata dan cara pengucapannya.
Pada saat penentuan cara pengucapan dari katayang belum dikenal diperlukan komputasi proses
penggandengan. Pada analogi implisit (Sullivan and
Damper, ) basisdata kamus disusun terlebih dahulu
untuk membangun basis pengetahuan fonologis,yang nantinya basisdata ini digunakan sebagai acuan
saat dilakukan proses transkripsi fonemik. ContohPbA antara lain sistem grafem-ke-fonern (Andersen,
1996), pemodelan pengucapan (Byrne, 1998),
translasi huruf-ke-suara (Pagel, 1998) dan
pemodelan teks-ke-fonem (Suontausta dan
Hiikkinenen, 2000).
No- Konso-
nm
Awal kata Tengah kata Akhir kata
Contoh Arti lontoh Arti lontoh Ani
I
2
Iw.]
tvl
watu
yen
batu
kalau
aru
alru
abu
cantik
pengubahan Grarem ke."ff,flXigjg I ror
Proses transkipsi fonetik secara-umum adalah
sulit, tidak ,"-rru g.rf". i'r* Jii."a*"'l:T:'ilain pihak grafem yung
'utnu dapat mempunyat
rimJir"r"iir yang b;beda gTuigu)' tergantung
konteksnva. Dari hasil p"n"iitiunnyu *:"^-.U*;
i;*ft;illr.un tut'*u pada proses konverst
grafem menjadi ro,,i* 'jikl. mempethatikan
ionteksnya dapat mengurangi ambiguitas'
Gambar 2: Hubungan grafem dan fonem
Hubungan grafem bahasa J:Yi^j::g*fonemnya dapat digambarkan seperti Gambar 2
dengan adalah aksara sedang adalah tl*"1*"*'" aa" i aksara berpatut'gun dengan I tonem'
""pi
t-"a" -:"t" gub"eun beberapa aKsara
t.tp;rfi;; oLG* i simb-ot fonem atau.l ,aksara
mempunyai beberapa simbol fonem' Beberapa
aksara yang b"rpurungui--J"ngutt 1 fonem adalah
h/';#;'"d; tnl,1l'-uefrasansan dengan []'
'tt' U"rpurung'un a"ng* []' dan 'dh PerpTTcan
a.ngun'Ldj. Iatu aksara vang dapat *T::"**dengan beberapa t'*Uof
-fo""* adalah 'k'
;;d;;r*;a-."e", [kl atau [? ]; 'e' berpasangan
dengan [e], [e], atau [];"u' Ut'put*gan^de.ngan [u1
atau [U]; 'a' berpasairgan dengan [a] atau.[]; 'o'
b6":;tt"; dengan [ofatau []' Daftar selengkapnva
dapat dilihat pada Tabel4'
Table 4: Tabel hubungan grafem (aksara) dan fonem
Dengan demikian untuk 1 aksara yang hanya
u"rpl'r-Jni,.'*9:'l,qr"ro""t?il"*r.T"i[r#"1eabungan beberaPa ax
i"""*"J"p" dilakukan pengubahan langsung dengan
ffi;ffi;;n iuu"t +''Nu"*un untuk vang lainnva
dioerlukan pemahamana" font"ftt agar dapat dipilih
;o"n;;;^t cocok sesuai konteks'
KESIMPULANProses pengubahan grafem ke
ion11-. untuk
bahasa Jawa memerl'tun fr"*uhuman konteks unruk
mengurangi ambi guitas'
DAFTAR PUSTAKA
I1l. Andersen, O, Octob er 1996' Comparison of
Two rr""-si*ttut"A APProaches for
C.Jpn"*"-to-pt'on"*" Conversion-'Ir' Proc'
;;i;i,pue"' r zoo-l 703' Philadelphia' PA'
[2]' Byrne, W,Mry iss8' pton'nciation Modeling
Using u duna-Labelled .gotPut for
Conversationut if""tt' \ttoq'itl:,n; ln Proc'
lCASSP'pages 3 13-3 I 6' Seattle' wa'
r3r'c';hv";;' l, 1i-11J,f,Hl"i;,J' J'';il::;2005, Transltl
lu*lu" Uuaio Teknika' 5(2): I01-106'-'
[4]. chomskv, -N
";;;'"Htiil' v' -'- The sound
Pattern o1 nn*glish' Harper and Row' New
York't5l. Dedina, M' J and Nusbaum' H' C't"'
;*o'N6LrNcE; u p'og'u* for pronunciation
Lv unurogv' Con'piter Speech and Language'
(5):55-64'
1.
2.
3.
4.5.
6.'7.
8.
9.10.
11.
t2.13.
14.15.
16.
17.
lpl[b]ttltdlIrdlIc]Liltklteli?lIm]In]tnlu0ltfl
p
btdthdhcjka
kmnnyng
1
f
lvlIslLz)thlIr][wltvltilullelleluIa]tlu[o]tul
S
Z
hrwviie
e
e
a
a
oouu
18.
19.
20.21.1',)
23.24.25.26.11
28.29.30.31.32.33.34.35.
bahasa Jawa
. ^^ I Pensubahan Grafem ke Fonem Bahasa Jawa
tuz I Yoh"urr., Suyanto
[6]. Dutoit, T, 1997, An Introduction to Test-To-
Speech Synthesis. Kluwer Academics
Publisher, The Netherlands.
[7]. Kee, T. Y, Seong, T. B, and Haizhou, L,2004.Grapheme to Phoneme Conversion forStandard Malay.
[8]. Marsono, 1999, Fonetik. Gadjah Mada
University Press, Yogyakarta.
[9]. Pagel, V, December 1998, Letter-to-SoundRules for Accented Lexicon Compression' IuProc. ICSLP, pages 20151018, SYdneY,
Australia.
[0]. Pusat-Bahasa, Kamus Besar Bahasa Indonesia.edisi III.
tlll.R.LDamper, J. F. G.E, Pronunciation byanalogy: impact of implementational choices
on performance. Language and Speech, (a0):1-23.
[12]. Sullivan, K. P.H and Damper, R.I, Novel-word pronunciation: a cross language study.
Sp eech Communication, (13):441452.
[13]. Suontausta, J and H[kkinenen, J, October
2000, Decision Tree Based Text-to-PhonemeMapping for Speech Recognition. ln Proc.
ICSLP,pages 83 1-834, Beijing,China.
CV PENULIS
l. Yohanes Suyanto, lulusan Sl Fisika UGM dan
52 Ilmu Komputer UI, bekerja sebagai dosen diProgram Studi Elekronika dan Instrumentasi
UGM.2. Sri Hartati, lulusan S1 Fisika UGM, mendapat
gelar M.Sc. Dan Ph.D dari University of NewBrunswick Canada.
Pengubahan Grafem ke Fonem Bahasa ru*u I 103YohanesSuyantol ---