PENDAHULUAK 2. n-gra111s siringrepository.ipb.ac.id/bitstream/handle/123456789/18271/Tinjauan... ·...

4
PENDAHULUAK Latar Belakang Setiap ~~lallusia melluliki nama diri uutuk ~lienunjukkan suatu identitas yang illudah diingat oleh orang lain. Nama diri kedudukannya berbeda dengall kata biasa. Nallia diri, betapapun aneh ejaa~u~ya, tetap ditulis sesuai dexlgiln ejaan yang diyllaknn ole11 pemiliknya. Lain hal~lyadengan kata biasa, terutalna kata-kata asing yang disenp menjadi kata dalam bahasa Indonesia, ejamlya discsuilik;~~~ dcng;~n eja;in yang bcrklku (Mustakim, 1990). Pencariall llallla diri dalam basis data, katalog pengaralg atau buku telepoli ~llempakall suatu yang ullluln &lam sisteru infor~nasi. Jika diketallui dengall pasti ejaan nania diri itu, aka11 secan mudah ditenlukan llallla tersebut dala111 d d a r nama. Banyak nletode yang diken~bal~gkan untuk nlencari sebuah string dalanl s e k u ~ ~ ~ p u l m string yalig bisa dipakai untuk pe~icaria~~ nama. Jika tidak diketallui atau tidak illgat ejaiu~ yang tepat atau jika terjadi kesalahan lllengetik saat mencu' I na111a dalalil daftar llallla lllaka pellcarim lllungkin aknn mengalami kegagalan, kecuali diyllakan teknik pencarian tertentu. Dalalll bahast Indoucsia ke~lluligki~lan kesalahan dalall~ pencarian atau pelilbacaan nalila diri aka11 terjadi kare~ia ada llallla yang mcllgyllakan Ejaan Lama. Penulistn liallla din dalall~ ballast Indonesia disesuaikan dengall aturm Ejaan Y N I ~ Dise~llpurnakall (EYD), kecuali untuk llalila diri yang telah disalkan scbelu~ll EYD dan yang lllell~iliki pertirnba~lgan kllusus, ~llistlnya adat istiadat, huku~n,kesejanhan, dan kesi~la~l~bungai identitas pribadi (Mustakim, 1990). Penelitian untuk ~llencari llallla yang lnellliliki kesalnaan fonetik per~iah dilakukali ole11 Prilliasari (1999) yang mengynakan algorit~lle Soundex dan Phonis. Dalam penerapan pada bahasa I~~donesia, kedua nletode tersebut mendapalkan nlasalah jika ~l~elakuka~ pellcarian terlladap nana yang masih me~lgynakan Ejaan Lama. Maka pada penelitia~ ini aka11 dicoba lnetode kesamaan string untuk mengatasi masalah pe~lcariann m a yang masill ~lle~lgynakan Ejam Lama. Tujuan Tujuan dari penelitinn ini yaitu : 1. Melllpelajari dan ~llellenpkali nletode kesanlaan string pada pencarial~llalua yang ~llc~l~iliki kesalllaan fonetik untuk mengatasi masalah Ejaan Lama. 2. Menlbandingkan algoritme kesalllaal~ string yang diken~bangkal ole11 Uratani-T<&eda dengall algoritnle Sekuensial. TINJAUAN PUSTAICA Me~~urut Pfeifer et. al. (1996), ukura~ kesa~llaan non-linguistik dapat dibagi me~ijadi tiga kategori yang berbeda yaitu kesanlaan string, kesamaan yang berllubu~igan dengall kesalahan pengetikan, dan kesalllaa~i1011ctik. Dari katcgori pertarna metode n-gra111s paling umum dipakai. Contoh dari kategori yang kedua yailu metode Damerau-Levenstein-Metric, dimaia lnetode ini menglutullg penyisipan, penghapusan, substitusi, dac transposisi yang dibutuhkan untuk me~~transfornasi satu slrillg ke siring yang lain. Dalanl dua kategori ini pelllbandillgan kata-kata dilak~kan tanpa ~ilelllperdulikall jenis bahasa yalig digunakan. Sedangkan untuk jenis kategori ketiga, ukuran kesaulaan sangat tergmtulg pada bahasa yang diyllakan. Algorit~ne Soundes dan Phonix addall llietode yang terkenal unluk l~le~llbandingkan kata dengall me~ilperl~atikan kesamam fonetik. Arti kesamaan fonetik atau kesanlaan bunyi yaitu adallya beberapa huruf dalan~abjad yang lllellliliki bunyi pengucapan ~lurip alltar llilruf satu dengall liuruf lai~u~ya (Primasari, 1999). Sebagai contoh 1la111a "Joko" dan "Djoko" 111erupakan dua 11a11iayeng memiliki kesa~llaali fonetik. Beberapa ha1 yang menyebabkan adanya kesanlaan fo~letik yaitu : 1. Kesalalian pendengann, seperti pada llallla Rina dan Rima. 2. Ingatan yang lemah, llal i ~ u karelia seseoralig lupa aka1 nama yang aka11 dicari dan akibatnya dia lnelakukan pe~~carian dengm mencoba beberapa 11al11a yang mirip bunyinya. 3. Kullur, seperli pada na111a Ferri yang sering diucapkan dengan kata Perri. 4. Ejaan, seperti pada nallla Ku~coro dan Koentjoro. 5. Kebiasaan. Pada pe~ielitian ini penyebab admya kesamaan fonetik dibatasi pada faktor ejaal~ saja karena ballasa Indonesia mengalallu berbagai pembahan ejaan dari senlenjak pe~ljajahanBelanda lungga IIIUIIC~~ Ejaan Yalg Disemp~ullak;u~. Pcngertian Ejnan Pel~gertiali ejaan secara UIIIUIII berarti keseluruliall ketentuan yang mengatur

Transcript of PENDAHULUAK 2. n-gra111s siringrepository.ipb.ac.id/bitstream/handle/123456789/18271/Tinjauan... ·...

Page 1: PENDAHULUAK 2. n-gra111s siringrepository.ipb.ac.id/bitstream/handle/123456789/18271/Tinjauan... · Nallia diri, betapapun aneh ejaa~u~ya, tetap ditulis sesuai dexlgiln ejaan yang

PENDAHULUAK

Latar Belakang Setiap ~~lallusia melluliki nama diri uutuk

~lienunjukkan suatu identitas yang illudah diingat oleh orang lain. Nama diri kedudukannya berbeda dengall kata biasa. Nallia diri, betapapun aneh ejaa~u~ya, tetap ditulis sesuai dexlgiln ejaan yang diyllaknn ole11 pemiliknya. Lain hal~lya dengan kata biasa, terutalna kata-kata asing yang disenp menjadi kata dalam bahasa Indonesia, ejamlya discsuilik;~~~ dcng;~n eja;in yang bcrklku (Mustakim, 1990).

Pencariall llallla diri dalam basis data, katalog pengaralg atau buku telepoli ~llempakall suatu yang ullluln &lam sisteru infor~nasi. Jika diketallui dengall pasti ejaan nania diri itu, aka11 secan mudah ditenlukan llallla tersebut dala111 d d a r nama. Banyak nletode yang diken~bal~gkan untuk nlencari sebuah string dalanl s e k u ~ ~ ~ p u l m string yalig bisa dipakai untuk pe~icaria~~ nama. Jika tidak diketallui atau tidak illgat ejaiu~ yang tepat atau jika terjadi kesalahan lllengetik saat mencu' I na111a dalalil daftar llallla lllaka pellcarim lllungkin aknn mengalami kegagalan, kecuali diyllakan teknik pencarian tertentu.

Dalalll bahast Indoucsia ke~lluligki~lan kesalahan dalall~ pencarian atau pelilbacaan nalila diri aka11 terjadi kare~ia ada llallla yang mcllgyllakan Ejaan Lama. Penulistn liallla din dalall~ ballast Indonesia disesuaikan dengall aturm Ejaan Y N I ~ Dise~llpurnakall (EYD), kecuali untuk llalila diri yang telah disalkan scbelu~ll EYD dan yang lllell~iliki pertirnba~lgan kllusus, ~llistlnya adat istiadat, huku~n, kesejanhan, dan kesi~la~l~bungai identitas pribadi (Mustakim, 1990).

Penelitian untuk ~llencari llallla yang lnellliliki kesalnaan fonetik per~iah dilakukali ole11 Prilliasari (1999) yang mengynakan algorit~lle Soundex dan Phonis. Dalam penerapan pada bahasa I~~donesia, kedua nletode tersebut mendapalkan nlasalah jika ~ l ~ e l a k u k a ~ pellcarian terlladap nana yang masih me~lgynakan Ejaan Lama. Maka pada penelitia~ ini aka11 dicoba lnetode kesamaan string untuk mengatasi masalah pe~lcarian n m a yang masill ~lle~lgynakan Ejam Lama.

Tujuan Tujuan dari penelitinn ini yaitu :

1. Melllpelajari dan ~llellenpkali nletode kesanlaan string pada pencarial~ llalua yang ~llc~l~iliki kesalllaan fonetik untuk mengatasi masalah Ejaan Lama.

2. Menlbandingkan algoritme kesalllaal~ string yang diken~bangkal ole11 Uratani-T<&eda dengall algoritnle Sekuensial.

TINJAUAN PUSTAICA

Me~~urut Pfeifer et. al. (1996), ukura~ kesa~llaan non-linguistik dapat dibagi me~ijadi tiga kategori yang berbeda yaitu kesanlaan string, kesamaan yang berllubu~igan dengall kesalahan pengetikan, dan kesalllaa~i 1011ctik. Dari katcgori pertarna metode n-gra111s paling umum dipakai. Contoh dari kategori yang kedua yailu metode Damerau-Levenstein-Metric, dimaia lnetode ini menglutullg penyisipan, penghapusan, substitusi, dac transposisi yang dibutuhkan untuk m e ~ ~ t r a n s f o r n a s i satu slrillg ke siring yang lain. Dalanl dua kategori ini pelllbandillgan kata-kata dilak~kan tanpa ~ilelllperdulikall jenis bahasa yalig digunakan. Sedangkan untuk jenis kategori ketiga, ukuran kesaulaan sangat tergmtulg pada bahasa yang diyllakan. Algorit~ne Soundes dan Phonix addall llietode yang terkenal unluk l~le~llbandingkan kata dengall me~ilperl~atikan kesamam fonetik.

Arti kesamaan fonetik atau kesanlaan bunyi yaitu adallya beberapa huruf dalan~ abjad yang lllellliliki bunyi pengucapan ~lurip alltar llilruf satu dengall liuruf lai~u~ya (Primasari, 1999). Sebagai contoh 1la111a "Joko" dan "Djoko" 111erupakan dua 11a11ia yeng memiliki kesa~llaali fonetik. Beberapa ha1 yang menyebabkan adanya kesanlaan fo~letik yaitu : 1. Kesalalian pendengann, seperti pada llallla

Rina dan Rima. 2. Ingatan yang lemah, llal i ~ u karelia seseoralig

lupa aka1 nama yang aka11 dicari dan akibatnya dia lnelakukan pe~~carian dengm mencoba beberapa 11al11a yang mirip bunyinya.

3. Kullur, seperli pada na111a Ferri yang sering diucapkan dengan kata Perri.

4. Ejaan, seperti pada nallla Ku~coro dan Koentjoro.

5. Kebiasaan. Pada pe~ielitian ini penyebab admya kesamaan

fonetik dibatasi pada faktor ejaal~ saja karena ballasa Indonesia mengalallu berbagai pembahan ejaan dari senlenjak pe~ljajahan Belanda lungga IIIUIIC~~ Ejaan Yalg Disemp~ullak;u~.

Pcngertian Ejnan Pel~gertiali ejaan secara UIIIUIII berarti

keseluruliall ketentuan yang mengatur

Page 2: PENDAHULUAK 2. n-gra111s siringrepository.ipb.ac.id/bitstream/handle/123456789/18271/Tinjauan... · Nallia diri, betapapun aneh ejaa~u~ya, tetap ditulis sesuai dexlgiln ejaan yang

pelamba~lgan bunyi bahasa, tenuasuk penusahan dan penggabuugannya, yang dilengkapi pula dengan pengguiaan tan& baca. Secara khusus ejaan berarti sebagai pelan~ba~igan bnnyi-bunyi ballam dengan huruF, baik berupa l~uruf demi imrur lnaupun huruf yang telal~ disusun ~nenjadi kata, kelo~lipok kata, atau kali~nat (Mustakim, 1990).

Dalani suatu ballasa sistenl eja;ul Iazinulya ll~elnpuliyai tiga aspek, yaitu aspek fonologis yang menyangkut p c l a ~ l b a n ~ n Conem dengan lluruf dan peliyusunall abjad; aspek morfologis yang lnenyangkut pelamba~gai satuan-satuan morfemis, dan aspek siutaksis yang ~neuya~~gkut pela~ubangan ujaran dengan tanda baca. Dengan denlikian, ketentuan-ketentuan yang lnengatur pelalnbangan Co~onem dengan lluruf yang ada dalan bahasa Indonesia, serta pelafalan, pengakroniman, dan penyusunan abjad terniasuk di dalan aspek fonologis. Ketentuan yang lnengatur pernbentukan kata dengan pengi~nbuhan, penggabungan kata, pemenggalan kata, penulisal kata, penyesnaian kosakata asilig ke dalani ballasa Indonesia tennasuk aspek morfologis. Di pihak lain, penulisan dan pelaralal fmsa, klausa, serta kalin~at ter~uasuk aspek sintaksis.

Perkembangan Ejaan di 111donesia Menurut Mustakiln (1990), sejak nlasa

penjajahan Belanda hhgga mass kemerdekaan, ejaan dalanl bahasa Indonesia ~ne~~galanu bernlacanl perubahan. Perkenlba~igai~ ejaail yang terjadi di Indonesia yaitu :

1. Ejaan Van Ophuysen Ejaan ini ~nulai bcrlaku sejak tal~nn 1901 yailn

saat ditcrbilk;~~mnya buku yang bcrjudul Kilnb Logo1 AJelayn yang disnsun ole11 Ch.A. Van Ophuysen, yang dibantu ole11 Engku Nawawi gelar Sutan Ma'moer d a i Moellam~~md Taib Sutan Ibnldm. Beberapa ha1 yang lnenonjol dari Ejaan Van Oplluysen ini antara lain : (1) Hurufy ditulis dengan j .

Contoh : yaitu + jaitu (2) Humflf ditulis dengall oe

Contoh : nmzfm + oellloelll (3) Humf k pada aW~ir kata alau suku kata ditulis

dengan talda ko~na di atas. Contoh : nlcyat + n'jat

(4) FIurufj ditulis dengan dj Contoh : Jakarta + Djakarta

(5) Hu~uf c ditulis dengan tj Coiltoh : can + t jaa

(6) Gabungal konsonan MI ditnlis dengall ch

2. Ejaan Republik @jam Soewandi) Ejaan Republik adalah ejaan barn yang disusnn

ole11 Panilia Ejaan Ballasa Indonesia yang diketuai oleh Mr. Soewandi. Ejaan ini diresnukan pada tanggal 19 Maret 1947 dan ditetapkan berdasarkan Surat Keputusan Menteri Pendidikan, Pengajaran, dan Kebudayaan Republik Indonesia No~nor 264/Bhg.A, tanggal 19 Maret 1947.

Beberapa perbedaan autan E j a a ~ Republik dengan Ejaan Van Opl~uysen yaitu : (1) Gabungal huruf oe dalanl Ejaan Van

Opl~uysen diganti dengan u dalam Ejaan Republik.

(2) Bunyi l ~ a ~ ~ u a l ~ ( ' ) dalanl Ejaan Van Oplluyseu diganti dengan k dala~n Ejaan Republik.

(3) Kata ulang bole11 ditandai dengan angka dua dala~il Ejaan Republik.

(4) Huruf e taling dan e pepet dalanl E j a a ~ Republik tidak dibedakan.

(5) Tanda trellla (") dalanl Ejaan Van Ophuyse~i dihilangkan dala~il Ejaai Republik.

Ccntoh perubahan dari Ejaan Van Ophuysen ke Ejaan Republik dapat dilihat pada Tabel 1.

Tabel 1. Contoh perubal~ai kata dari Ejaan Val 0 I u sen ke E'aan Re ublik

E'aan Van 0 hu sen Eiaan Re ublik oelnoer ulnur Ivia'locm maklum nla-rala rala2 Ekor senang seliailg mukll mulai

3. Ejaa~t Melindo AJeli17do ialah akroninl dari Melayu-Indonesia.

Ejaan Melindo, sesuai dengan nananya, merupakan ejaan yang disusu~ atas kerja sama anhra pihak Indonesia, yang diwakili oleh Slametmuljana, dan pillak Persekutuan Tanah Melayu (Malaysia), yang dipin1piil ole11 Syed Nasir bin Ismail.

Se~nnla Ejaan Melinda itu dinlaksudkan ultuk menyeragaukan ejaan yang diynakan di kedua negara tersebut. Nrunun, karena pada lnam itu terjadi ketegangan politik antarn Indonesia d;ln Mahysia, ejaan itu pun aklurnya gaga1 diresmikan. Sebagai akibatnya, pemberlnkuan ejaan itu tidak pemah diumumnkan.

Page 3: PENDAHULUAK 2. n-gra111s siringrepository.ipb.ac.id/bitstream/handle/123456789/18271/Tinjauan... · Nallia diri, betapapun aneh ejaa~u~ya, tetap ditulis sesuai dexlgiln ejaan yang

4. Ejaan Baru (Ejaan LBK) Ejaan Baru pada dasan~ya nlerupakan lanjutan

dari usaha yailg telal~ diriiitis ole11 panitia Ejaan Melindo. Karena panitia yang nlenyusliil ejaan tersebut dibentuk oleh Kepala Lenlbaga Bahasa dan Kesusaslra;~~ (LBK) dan diberi llama Panitia Ejaai~ LBK, ejaan baru yang diruniuskan itu pun dikenal dengan nalna Ejaan LBK.

Perubalian yang terdapat dalain Ejaan Barn atau Ejaan LBK antara lain : (1) Gabungan konsonan dj diubali ~nei~jadi j.

Conloh : reiliadja + reinaja (2) Gabungan konsonan tj diuball men-jadi c.

Contoh : tjipta + cipta (3) Gabungan konsonan nj diubah menjadi ny.

Conloll : njala + nyala (4) Gabungaii konsonan sj diubah nlenjadi sy.

Conloh : isjarat + isyarat (5) Gabungan konsonan ch diubah menjadi kh

Contoli : macliluk -> iiiakhluk (6) Huruf j diubal~ 111enjadi y

Contoh : saja -+ saya (7) Huruf e taling dru~ e pepet penulisannya tidak

dibedakan dan llanya ditulis denga~ e, tanpa penanda.

(8) Huruf asii~g f, v, dan z diinasukkan ke dala~n sistem ejaai~ bahasa Indonesia karena huruf- lmruf ilu bailyak diguiiakan.

Beberapa perubalian itu ternyata illeninlbulkan berbagai pendapat yang bernada keberalm, baik dari kalangan ahli bahasa sendiri lllaupun dari nlasyarakat uinum. Dengan kata lain, ejaan barn itu belun~ disetujui beberapa piliak selungga peresii~ian~~ya pun belunl dapat dilaksanakan.

5. Ejam Bahasa Indonesia Yang Diselnpurnakan ( E D )

Ejaan Ballasa Indonesia Yang Disempurnakan atau yang lazi~u disebut EYD dinyatakall liiulai berlaku sejak penggunamu1ya diresnukan oleli Preside11 Republik I~~donesia snat itu, Soeliarto, pada tnnggal 16 Aguslus 1972.

Ejaan Bahasa Indonesia yailg Disenlpurnakan it11 pad;) dasanlya tidak disusun secara tiba-tiba. Akan telapi, bahan-baliaiulya tclah dipersiapkan dan dirintis sejak penyusunall konsep Ejaaii Baru. Ole11 karena itu dapat dikatakan balnva konsep- konsep dasar yang ditelapkan dalan~ Ejaau Bahasa 1ndonesi;i yang Disen~purnakali sebenarnya iilerul-lakan kelanjutnn dnri Ejaan Barn atau Ejaan LBK:

Beberapa kebijakan baru yang ditetapkai~ di dalain EYD alltara lain :

(1) Peruballan Huruf Ejaan Lanu Ejaan Baru dj + djika j -+ jika tj + tjakap c + cakap nj + sunji 11y -+ sunyi sj -+ sjukur sy + syukur cli + achir kh -+ akhir j + supaja y + supaya

(2) Huruf f, v, dan z yang iilerupakan unsnr serapan dari bahasa asing dires~uukan pemakaiannya. Misalnya : klulaf, fisik, universitas, &at, kllilmmli.

(3) Huruf q dan x yang tidak laziin diynakan dalani bidang illnu pengetahiuan tetap diynakan, ~nisalnya pada kata fwqon dan Selloll.

(I) Penulisan di- sebagai awalan dibedakan dengall di yang ~llerupakan kata dcpan. Sebagai awalan, di- ditulis serangkai kata' dengan unsur yang menyertainya, sedangkan di sebagai kata depan ditulis teryisal~ dari kata yang mengikutinya.

(5) Kata ulang ditulis penuh dengan menylang unsur-unsunlya. Angka dua lidak digunakan sebagai penanda perulangan.

Secara ringkas, lluruf-liuruf yang nlengalailli perubahnn dari Ejaan Lailia ke Ejaan Baru dapat diliiiat pada Tabel 2.

Tabel 2. Perubaliai huruf dari Ejailn Lanla ke Ejaan Baru.

Ejaan Laina I Ejaan Baru I C

Huruf-liuruf dalan~ Tabcl 2 tersebut akan dipakai untuk ~neinbentuk varian dari illput nanla yang akan dicari.

Algoritme ICesamaan String. 1. Algoritn~e Uratani-Takeda

Algoritn~e yang dipakai pada penelitian iiu yailu algoritine yang dikeiubai~gkai~ ole11 Uratani dzu~Takeda (1993).

Algoritine ini digunakan unluk ~lielicari ballyak input ke dalan~ string yang ide dasi~rnya nlengadopsi dari algoritn~e pencarim string yang dikeiubangkan oleh Boyer dan Moore dinlana pencarian slring dilakukan dari kanan ke kiri, digabung dengan algoritnle yaiig dikenbangkan

Page 4: PENDAHULUAK 2. n-gra111s siringrepository.ipb.ac.id/bitstream/handle/123456789/18271/Tinjauan... · Nallia diri, betapapun aneh ejaa~u~ya, tetap ditulis sesuai dexlgiln ejaan yang

oleli Aho dan Corasick yailu yang ii~elakukan pei~carian string untuk baiiyak input.

Untuk iiielihat c a n kerja dari algorihne ini perl~atikan contoh berikut :

Misalkan terdapat sekuinpulan input yaitu (trace, artist, snrart) yang akan dicari kedalaii~ teks "tl?e- greatest-artist.. ". Pertaiia kita ~ilenyaiiiakan liuruf teraldiir dari seinua input. Karena panjailg input yg paling peudek adalali 5 ~iiaka kita ii~ulai ilieilyesuaikaii dengan liurur ke-5 dari leks daii poir7ter berada di liuruf ke-j dari teks. Pada contoh di bawah ini, * ~iieliandakan sesuai, seda~ig s iiie~~unjuMta~~ lidak sesuai.

t r a c e a r t i s t

smart t h e - g r e a t e s t - a r t i s t

X

Karena huruf g tidak sesuai dengall l~uruf tenkhir semua input da i~ tidak inuncul di setiap kueri, kita iliciiggcscr input-iiipul itu ke kaiian sebaiiyak 5 lluruf.

t r a c e a r t i s t

Smart t h e - g r e a t e s t - a r t i s t

X'

Pads ko~idisi ini, 11urilf c pada lcks scsuai dengan huruf e pada input "trace". Karei~ailya kita ine~iggeser poir?ter di teks ke kiri satu humf. Karei~a tidak sesuai dan string te dari teks tidak ~iluncnl di semua input, kita geser lagi input-input itu sebanyak 5 huruf ke kanan (atau inenggeser pointer sebai~yak 6 huruf).

t r a c e a r t i s t

Smart t h e - g r e a t e s t - a r t i s t . .

Huruf r yang sekarang dibmdingkan tid'ak sesuai dengall huruf tenkliir dari seillua kueri. Lalu kita illelumskall lluruf r itu dengan huruf r yang ada di input "sr?zart". Jadi kita iuenggeser input- input ke k a ~ a n sebanyak satu.

t r a c e a r t i s t

smart t h e - g r e a t e s t - a r t i s t . .

X I i r

Kita dapat menyesuaikan 1 1 d t, r, dan a dan gagal pada liuruf -. Kare~ia string art iiiuncul pada input "artist" inaka kita nlenggeser input tiga h d ke kanan (dm menggeser pohiter ke kanan sebanyak enam).

t r a c e a r t i s t

Smart t h e - g r e a t e s t - a r t i s t

******

Pada s a t i ~ , kita ii~elihat bahwa seiilua bud dari input "ortist" sesuai deng;~ii huruf yaiig ada di dalam leks.

Pada algoritn~e Uratani-Takeda terdapat liga fungsi may: goto, otrtpot, dan failrire. Fungsi goto beryiia unluk iiiengetaliui apakali kankter yalig dibandiiigkan saiiia atau tidak. Fungsi ini bemilai lebih besar dari no1 jika karakter yang dibandingkaii saiiia. Fungsi oatpzrt untuk inengetaliui apakali input yalig dicari ditemukan atau tidak. Seda~igka~i fungsi failure diynakan uiilnk ilicnggescr input-input kc kana11 jika terjadi kesalalian atau dengan kata lain jika fiu~gsi goto bernilai 0 atau -1.

Secara umun, proses penyesuaian string dari algcrihne Uratani-Takeda adalali sebagai berikut: inu:ai dari posisi (state) 0, dan inelakukan pencaria~i n~ui~dur dari posisi karakter ke-rrrinler? (nrinler? yaitu panjang idput lerpendek) dari teks. Pcrubal~;~n posisi dilakukarl scbaiiyak iiiongkiii inengyl~akan fungsi goto. Jika posisi iiieiiu~ijultkan ujung kiri dari suatu inpul, bcrarli input tcrsebut il~uncul pada posisi Lerscbut. Jika telali i~ieiicapai posisi di~ilaiia fu~igsi goto bernilai 0 atau -1, poir?ler digeser ke kana1 seb;ulyak nilai yailfi didapat dari fungsi 'ilure, da~ i niulai dari posisi 0 lagi.

Algoritme Uratani-Takeda, isi dari fungsi goto, ontprit daii hiltire, serta algoritine pelnbentukkan ketiga fn~igsi tersebut dapat dilillat pada Lainpirim 1-3.

2. Algoritine Sekuensial Algorit~i~e ini iiierupakaii algoritiilc kesaii~aan

string yang paling scderllana dari algoritme- algori(l11e kesamaal string yang ada. Ada juga yang inenyebut algorit~i~e ini algorit~ile BRUTE FORCE. Algorit~ne Sekueiisial nlelakukan pencariai string input tcrhadap lcks dari kiri ke kaiian dan dilakukan satu per satu karakter.

Misalkan S=s1s2.. .$, i~dalal~ tcks dan =pi@. ..p., adalah string input diinaiia 111 < n illaka algorihne Sekuensial adalah sebagai berikut :