eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini...

15
eminar Nasional Teknologi Informasi, Komunikasi Malang, 11 November 2011 diorganisasi oleh: ga Penelitian dan Pengabdian pada Masyarakat Mil'

Transcript of eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini...

Page 1: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

eminar Nasional Teknologi Informasi, Komunikasi

Malang, 11 November 2011 diorganisasi oleh:

ga Penelitian dan Pengabdian pada Masyarakat M i l '

Page 2: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

Prosiding ISSN 2089-1083

SNATIKA 2011 Volume 01, Tahun 2011

Seminar Nasional Teknologi Informasi, Komunikasi dan Api ikasinya

Batu - M a l a n g , 11 N o p e m b e r 2011

Diorganisasi oleh:

Lembaga Penelitian 8t Pengabdian kepada Masyarakat

SEKOLAH TINGGI IN FORM ATI KA 8t KOMPUTER INDONESIA

Page 3: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

ISSN 2089-1083

SNATIKA 2011 Seminar Nasional Teknoiogi Informasi, Komunikasi dan Aplikasinya Volume 01, Tahun 2011

PROGRAM COMMITTEE Prof. Dr. Ir. Richardus Eko Indrajit M.Sc., MBA., Mphil., MA (Perbanas Jakarta) Prof. Dr. Ir. Kuswara Setiawan, MT (UPH Surabaya) Prof. Dr. Ir. Joko Lianto Buliali, M.Sc (ITS Surabaya) Prof. Dr. IpingSupriana Suwardi (Institut Teknoiogi Bandung) Ir. Zainal Arifin Hasibuan, M.Sc, PhD (Universitas Indonesia) Retantyo Wardoyo, PhD (UGM) Dr. Jazi Eko Istiyanto, PhD (UGM)

STEERING COMMITTEE Tri Y. Evelina, SE, MM Gembong Edhi Setyawan, ST, MT

ORGANIZING COMMITTEE Rahmad Adi Puranto Deddy Wahyu Hermawan

Sekretariat Lembaga Penelitian & Pengabdian pada Masyarakat Sekolah Tinggi Informatika & Komputer Indonesia (STIKI) - Malang SNATIKA 2011 Jl. Raya Tidar 100 Malang 65146 Tel. +62-341560823 Fax. +62-341 562525 Website : www.stiki.ac.id Email: [email protected]

ii

Page 4: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

1 KATA PENGANTAR

Bapak/lbu/ Sdr. Peserta dan Pemakalah SNATIKA 2011 yang saya hormati, pertama-tama

saya ucapkan selamat datang atas kehadiran Bapak/lbu/Sdr, dan tak lupa kami

mengucapkan terima kasih atas partisipasi dan peran serta Bapak/lbu/Sdr dalam kegiatan

ini.

SNATIKA 2011 adalah Seminar Nasional Teknologi Informasi, Komunikasi dan Aplikasinya

yang diselenggarakan oleh STIKI Malang bekerjasama dengan APTIKOM Pusat dalam

acara RAKORNAS APTIKOM tahun 2011 yang pelaksanaannya diadakan di Batu, Malang.

Sesuai tujuannya SNATIKA 2011 merupakan sarana bagi peneliti, akademisi dan praktisi

untuk mempublikasikan hasil-hasil penelitian, ide-ide terbaru mengenai Teknologi

Informasi, Komunikasi dan aplikasinya. Selain itu sesuai dengan tema Rakornas APTIKOM

2011 "Synchronising Motions for Actions", topik-topik yang diambil disesuaikan dengan

kompetensi dasar dari APTIKOM yang diharapkan dapat mensinergikan penelitian yang

dilakukan oleh para peneliti di bidang Informatika dan Komputer. Semoga acara ini

bermanfaat bagi kita semua terutama bagi perkembangan ilmu dan teknologi di bidang

teknologi informasi, komunikasi dan aplikasinya.

Akhir kata, kami ucapkan selamat mengikuti seminar, dan semoga kita bisa bertemu

kembali pada SNATIKA yang akan datang.

Malang, 11 Nopember 2011

Panitia SNATIKA 2011

Tri Y. Evelina, SE, MM

iii

Page 5: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

SAMBUTAN KETUA SEKOLAH TINGGI INFORMATIKA & KOMPUTER INDONESIA (STIKI) MALANG

Yang saya hormati peserta Seminar Nasional APTIKOM 2011,

Puji & Syukur kita panjatkan kepada Tuhan yang Maha Esa, atas terselenggaranya Seminar Nasional sebagai rangkaian dari kegiatan RAKORNAS APTIKOM 2011 di Kota Batu Malang. Kami ucapkan selamat datang kepada peserta RAKORNAS APTIKOM dan Seminar Nasional serta rekan-rekan perguruan tinggi maupun mahasiswa yang telah berpartisipasi aktif sebagai pemakalah maupun peserta dalam kegiatan seminar nasional ini. Konferensi ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di Indonesia, dimana anggota APTIKOM khususnya harus haus akan ilmu untuk mampu •nemajukan ICT di Indonesia.

Konferensi ICT bertujuan untuk menjadi forum komunikasi antara peneliti, penggiat, birokrat pemerintah, pengembang sistem, kalangan industri dan seluruh komunitas ICT Indonesia yang ada didalam APTIKOM maupun diluar APTIKOM. Kegiatan ini diharapkan memberikan masukan kepada stakeholder ICT di Indonesia, yang meliputi masyarakat, pemerintah, industry dan lainnya, sehingga mampu sebagai penggerak dalam memajukan ICT di Indonesia

Akhir kata, semoga forum seperti ini dapat terus dilaksanakan secara perodik sesuai dengan kegiatan tahunan APTIKOM. Dengan demikian kualitas makalah, maupun hasil penelitian dapat semakin meningkat sehingga mampu bersinergi dengan ilmuwan dan praktisi ICT Internasional.

Sebagai ketua STIKI Malang, kami mengucapkan terima kasih kepada semua pihak atas segala bantuan demi suksesnya acara ini.

"Mari Bersama Memajukan ICT Indonesia"

Malang, 11 Nopember 2011 Ketua STIKI,

Eva Handriyantini, S.Kom,M.MT

iv

Page 6: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

DAFTAR ISi

ISSN 2089-1083 SNATIKA 2011, Volume 01

Halaman

Halaman Judul Kata Pengantar Sambutan Ketua STIKI Daftar Isi

HI

iv v-ix

Anak Agung Kompiang Oka Sudana, Ida Ayu Gde Kurnia Jayanti

Zainul Arham

3 Mochamad Wahyudi, Muanam

4 Mochamad Wahyudi, Miwan Kurniawan Hidayat

5 Yusuf Durachman, Arini, Ryan Sofyan

6 Nur Aeni Hidayah

7 Nur Aeni Hidayah

8 Marson James Budiman, Jufri

9 Husni Thamrin, Susilo Veri Yulianto, Julpitriadi

10 Juni Nurma Sari, Febriliyan Samopa

11 Puji Rahayu, Bandi Ashari

Implementasi Struktur Tree Untuk Pemodelan Sistem 1-6 Informasi Bebantenan On-Line Dalam Upacara Yadnya Agama Hindu

Evaluasi Kesesuaian Lahan Buah Pisang Kepok 7-9 Didasarkan Agroklimat Dengan Pendekatan Sistem Informasi Geografis

Rancangan Aplikasi Sistem Informasi Keuangan Pada 10-16 Universitas Sains Dan Teknologi Jayapura (Ustj)

Rancangan Aplikasi Sistem Informasi Manajemen Aset 17-21 Pada Universitas Sains Dan Teknologi Jayapura (Ustj)

Pengembangan Framework Sisfo Kampus Berbasis Web 23-28 Menggunakan Metodologi Fast (Studi Kasus Stmik lij)

Sistem Informasi Studi Pelacakan Jejak Alumni (Tracer 29-33 Study) Program Studi Sistem Informasi Fakultas Sains Dan Teknologi (Studi Kasus : Uin Syarif Hidayatullah Jakarta)

Sistem Informasi Penunjang Keputusan Penerimaan 34-39 Nasabah Pembiayaan Murabahah Menggunakan Model Ahp (Studi Kasus : Bni Syariah)

Klasifikasi Penilaian Kinerja Dosen Dengan 39-44 Menggunakan Algoritma Backpropagation

Model Pengembangan Sistem Informasi Pengelolaan 45-51 Pondok Pesantren Mahasiswa

Pembuatan Prototipe Aplikasi Wireless Menggunakan 52-57 Teknologi Java Pada Sistem Informasi Akademik Politeknik Caltex Riau

Aplikasi Pengunduh Dan Pembaca Data Nilai Jual Objek 58-63 Pajak (NJOP) Pada Direktorat Jenderal Pajak

v

Page 7: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

12 Jozua F. Palandi

13 Tri Y Evelina, Tias A. Indarwati

14 Bambang Hariyanto, Ririn Dwi Agustin

15 Joko Lianto Buliali, Ahmad Saikhu

16 Ketut Agustini

17 Sawalludin, Opim Salim Sitompul, Erna Budhiarti Nababan

18 Eko Budi Cahyono, Mochamad Hariadi

19 Taufiq, Rahmadi

Desain Sistem Toefl Untuk Membantu Persiapan Tes 64-70 Toefl

Adaptasi Search Engine Yahoo Dan Google: Analisis 71-78 Diskriminan Dengan Pendekatan Technology Acceptance Model (TAM) Dan Usability

Pengkajian Peraturan Bank Indonesia No 9/15/PBI/2007 79-83 Tahun 2007 Sebagai Pedoman Tata Kelola Teknologi Informasi (IT Governance) Bank Umum Di Indonesia

Uji Bilangan Acak Dari Fungsi Pembangkit Bilangan Acak 84-87 Pada Bahasa Pemrograman Java

Pengembangan Simulasi Binary Tree Berbasis CAI Untuk 88-91 Pembelajaran Matematika Diskrit

Isomorphic Solutions Of The N-Queens Problem 92-97

Interaksi Gerak Tangan Alami Dengan Lingkungan 98-101 Augmented Reality Berbasis Metoda Projective Reconstruction

Penerapan Fuzzy Multi Criteria Decision Making 102-108 (Fmcdm) Untuk Pemilihan Lokasi Spbu Pada Kota Banjarbaru

20 Endah Purwanti

21 Jufri Wahyudi, Taufik Fuadi Abidin

22 Muhammad Ainur Rony

23 Galan Tri Suseno, Ina Agustina, Firman Anindra

24 Gunawan Putrodjojo

25 Ida Ayu Made Widiadnyani Pertiwi, Made Windu Antara Kesiman, I MadeAgus Wirawan

Logika Fuzzy Untuk Uji Kelayakan Lahan Singkong 109-114 Sebagai Bahan Baku Bioetanol

Penentuan Secara Otomatis Akronim Dan Ekspansinya 115-119 Dari Data Teks Berbahasa Indonesia

Sistem Pakar Untuk Mengidentifikasi Kerusakan Kulkas 120-124 Lg Tipe Gr-S512 Menggunakan Aplikasi Mobile

Aplikasi Sistem Pakar Untuk Diagnosa Penyakit Menular 125-130 Pada Kambing

Aplikasi Multimedia Untuk Pembelajaran Berbasis 131-138 Simulasi Heuristik Dengan Konektifitas Scorm

Pengembangan Aplikasi E-Learning Berbasis Model 139-144 Pembelajaran Kooperatif TipeTgt (Teams Game Tournament)

vi

Page 8: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

26 Eva Hariyanti, Kartono, Endah Purwanti

27 Endra

28 Tien Kusumasari

29 Taqwa Hariguna, Berlilana

30 Budi Rahmani, Hugo Aprilianto

31 ZaenalAbidin

32 Irwan Budi Santoso,Fachrul Kurniawan

33 Titin Pramiyati, Jayanta

34 I KetutGede Darma Putra, Ari Made Santosa

35 Yoki Irawan, Eko Adi Sarwoko, Sukmawati Nur Endah

35 Shelvie Nidya Neyman, Ayi Dianitasari

3~ Chairunnisa, ina Agustina, Firman Anindra

38 Yusuf Durrachman, Arini, Muhamad Soleh

35 3oltak Sihombing

Pengukuran E-Learning Readiness Untuk Mendukung 145-150 Keberhasilan Pengembangan E-Learning (Studi Kasus: Fst- Universitas Airlangga)

Optimasi Bersama Kamus-Basis Dan Matriks 151-156 Pengukuran Pada Penginderaan Kompresif

Pengembangan Prototipe Humanreadable Knowledge 157-162 Based Dengan Menggunakan Wiki

Isu Cloud Computing E-Government Di Indonesia 2014 163-166

Implementasi Neural Network Dalam Mengklasifikasi 167-171 Hasil Ekstraksi Ciri Tepi Objek Dua Dimensi

Pengaruh Ukuran Citra Terhadap Hasil Pengenalan 172-177 Ekspresi Wajah Menggunakan Jaringan Syaraf Tiruan Backpropagation

Membangun Model Tree-Augmented Network (Tan) 178-184 Dengan Estimator Rime Dan Ml Untuk Mengenali Objek

Pengembangan Model Sistem Identifikasi Pembicara 185-188 Dengan Kombinasi Teknik Ekstraksi Ciri Suara Mel-Frequency Cepstral Coefficients (MFCC) Dan Principal Component Analys (PCA)

Verifikasi Biometrika Geometri Tangan Dengan Metode 189-192 Chain Code

Pencocokan SidikJari Menggunakan Metode Ekstraksi 193-197 Minusi (Minutiae Extraction)

Evaluasi Perfomansi Metode Phase Coding Pada Teknik 198-203 Audio Watermaking

Pemanfaatan Guide Dalam Watermarking Pada Citra 204-209 Digital Menggunakan Metode Fast Fourier Transform (Fft)

Aplikasi Watermarking Dengan Algoritma Aes Untuk 210-216 Pemberian Data Hak Cipta Pada File Audio

Pendeteksi Kemiripan Dokumen Menggunakan Posi 217-223 (Percentage Of Similarity) Dengan Algoritma Genetika

vii

Page 9: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

40 Rangga Firdaus, Didik Kumiawan, Eri/vin Cesar Simamora

41 Yoyok Seby Dwanoko, Hari Lugis Purwanto

42 Paskalis Andrianus Nani

43 Chatarina Eka Oktavila, Arif Aliyanto

44 Eko Subiyantoro, Yan Permana Agung Putra

45 Nicholas Ongalia, N. Tri Suswanto Saptadi

46 Khodijah Hulliyah, Imron Fauzi

47 Anik Vega Vitianingsih, Achmad Choiron, Muhammad Dwi Jayanto

48 Saiful Bukhori

49 Anang Andrianto

50 Gembong Edhi Setyawan, Meivi Kartikasari, Mukhlis Amien

51 Izzah Fadhilah Akmaliah, Naniek Andiani

Implementasi Metode Autentikasi One Time Password (Otpa) Berbasis Mobile Token Pada Aplikasi Ujian Online (Studi Kasus : Jurusan Matematika Fmipa Unila)

Model Otentifikasi E-Surat Menggunakan Metode Digital Signature Dengan Algoritma Md5

Penerapan Enkripsi Algoritma Blowfish Pada Proses Steganografi Metode Eof

Aplikasi Konversi Notasi Balok Ke Notasi Angka (Studi Kasus Di Sekolah Tinggi Musi)

Penentuan Kualitas Daun Tembakau Dengan Perangkat Mobile Berdasarkan Ekstrasi Fitur Rata-Rata Rgb Menggunakan Algoritma K-Nearest Neighbor

Aplikasi Permainan UlarTangga Berbasis Multimedia

Implementasi Algoritma Dijkstra Untuk Mendapatkan Jalur Tercepat Dan Jalur Terpendek

Game Mathematics In The Jungle

Parrondo's Paradox Based Strategies In The Serious Game Of RTGS Using Sandpile Model

Chaos Detection In The Serious Game Of Clearinghouse Using Business Intelligence

Aplikasi Kamera Pengawas Untuk Deteksi Dan Tracking Objek

Alat Pendeteksi Golongan Darah Manusia Berbasis Mikrokontroler 89s51

224-231

232-235

236-241

242-247

248-253

254-260

261-265

266-272

273-277

278-283

284-291

292-297

52 I Putu Agus Swastika, Siti Saibah Pua Luka, Yanno Dwi Ananda

Rancang Bangun Aplikasi Smart Card Interface 298-303

53 Edy Victor

54 Muhammad Subali, Jalinas, Jonifan

Simulasi Visualisasi Antrian Pada Elevator Dengan Algoritma Priority Service (Ps)

Implementasi Simulink Matlab Untuk Analisis Kestabilan Sistem Pengendalian Temperatur Furnace

304-310

311-314

viii

Page 10: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

55 Eneng Tita Tosida Visualisasi Traffic Light Dengan Model Matriks Identitas 315-31S ' Menggunakan Macromedia Flash 8

56 Faula Meisa Loura, Ina Pembuatan Iklan 3D Rumah Sebagai Media Promosi 319-324 Agustina, Tri Fajar Pemasaran Dengan Menggunakan 3D Max ( Studi Kasus Yurmama PT. Purigraha Asripermai)

ix

Page 11: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

Penentuan Secara Otomatis Akronim dan Ekspansinya Dari Data Teks Berbahasa Indonesia

Jufri Wahyudi, Taufik Fuadi Abidin Jur us an Informatika

FMEPA TJniversitas Syiah Kuala Email: vudi.mathfgkmail.co.id. taufik, abidin@,unsviah.ac.id

ABSTRAK Akronim didefinisikan sebagai singkatan yang dibentuk oleh huruf awal atau gabungan beberapa huruf dari ^lah penting dalam sebuah frase. Menemukan akronim dan kepanjangannya secara otomatis dalam suatu idkumen teks adalah masalah yang menantang dalam teks mining. Artikel ini membahas tentang penentuan tzpamjangan dari akronim berbahasa Indonesia secara otomatis. Ada tiga tahap yang dilakukan. Pertama, Oiiidat akronim diidentifikasi dalam dokumen teks. Kemudian, kandidat ekspansi dibangun berdasarkan teks Wg mengelilingi akronim, dan ketiga, klasifikasi k-NN digunakan untuk memilih ekspansi yang benar dari aruah akronim. Percobaan dilakukan menggunakan teks yang diperoleh dari empat web berbahasa Indonesia ;>crg berbeda. Hasil menunjukkan bahwa algoritma yang dikembangkan dapat beradaptasi dengan baik pada Moap domain dan memiliki rata-rata akurasi sebesar 89,75%.

Kata Kunci: Penentuan akronim dan ekspansinya, klasifikasi kNN

1. PENDAHULUAN

Akronim dan kepanjangannya sering ditemukan a > m sebuah tulisan. Pada umumnya, kepanjangan p i i f ill i) dari sebuah akronim diuraikan pada saat pertama sebuah akronim diperkenalkan dalam r. -san. Setelah diperkenalkan, akronim digunakan •cara berulang-ulang dalam tulisan karena lebih xadek dan ringkas dibanding kepanjangannya.

Database akronim dan kepanjangannya sangat fibntuhkan oleh mesin pencari dalam menentukan as:l pencarian yang relevan. Sebagai contoh, bila 'Basil Ujian Nasional 2011" merupakan query yang rimputkan pada mesin pencari maka selain dokumen ytzx mengandung kata Ujian Nasional, dokumen-ackumen yang mengandung kata UN pun harus •periiitungkan oleh mesin pencari karena akronim ran Ujian Nasional adalah UN. Kemampuan mesin aencari mengganti akronim dengan ekspansinya atau •baliknya dapat membuat hasil pencarian menjadi *cih relevan. Contoh ini menunjukkan bahwa iaberadaan data akronim dan kepanjangannya secara bpgkap diperlukan dalam bidang penelusuran •itt'aimasi (information retrieval). Selain itu, eberadaan database akronim dan kepanjangannya uga dibutuhkan dalam menentukan kemiripan antar Jeberapa dokumen secara semantiks.

Akronim pada umumnya didefinisikan sebagai scgkatan yang dibentuk dari huruf awal atau nbungan huruf dari suatu istilah. Akronim yang mmcul dalam sebuah tulisan dapat menyulitkan rembaca memahami isi tulisan bila kepanjangan dari Kcuah akronim tidak diketahui. Akronim dalam ncang tertentu belum tentu diketahui artinya oleh tembaca dalam bidang yang lain. Sebagai contoh,

SVM bagi komputer saintis berarti Support Vector Machine, namun SVM bagi para manajer dapat pula berarti Sourcingand Vendor Management.

Menemukan akronim dan kepanjangannya secara otomatis dalam dokumen teks merupakan salah satu hal yang penting dan menantang dalam bidang teks mining. Menentukan akronim dan kepanjangannya dalam tulisan teks sebenarnya pernah diusulkan oleh [1] menggunakan pendekatan aturan (rule-based) yang diamati secara manuai. Namun, cara ini sangat tidak efisien karena pola penulisan aknonim dan kepanjangannya sangat beragam, variatif, dan sulit ditentukan polanya secara menyeluruh. Akibatnya, algoritma yang dibuat berdasarkan ride-based tidak dapat beradaptasi secara baik pada domain yang berbeda. Tulisan ini merijabarkan tentang algoritma untuk menentukan secara otomatis akronim dan kepanjangannya dalam tulisan berbahasa Indonesia menggunakan metode k-NN.

2. PENELITIAN T E R K A I T

Penelitian tentang cara mengambil akronim dan ekspansinya dari dokumen teks telah dilakukan oleh [1]. Penelitian itu menggunakan Support Vector Machine (SVM) sebagai metode klasifikasi dan tulisan berbahasa Inggris sebagai data pembelajaran dan pengujian. Mereka mengidentifikasi kandidat akronim, membangun kandidat ekspansi dari teks yang mengelilingi akronim, dan menentukan akronim dan ekspansi sebenarnya menggunakan SVM Hasil penelitian menunjukkan bahwa pendekatan machine learning lebih unggul dari pada pendekatan rule-based. Akurasi model SVM adalah 89% dan model

SNATIKA 2011, ISSN 2089-1083( 115

Page 12: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

Penertuan Secara Otomatis Akronim dan Ekspans^

yang dikembangkan dapat beradaptasi dengan baik pada domain yang berbeda.

Penelitian serupa juga pernah dilakukan oleh Chang [2]. Hasil penelitian mereka dipublikasikan dalam Journal of the American Medical Informatics Association pada tahun 2002. Mereka membangun kamus online dari akronim bidang biomedical dan dapat menentukan akronim dan ekspansi yang ditulis secara tidak teratur. Mereka menggunakan regresi logistik dan memberi skor kepada pasangan akronim dan kandidat ekspansi berdasarkan kemiripan pasangan tersebut dengan data pembelajaran. Data pembelajaran yang digunakan adalah medstract yang merupakan kumpulan akronim dan ekspansi yang ditentukan secara manual. Algoritma yang dibangun kemudian diuji keakuratannya menggunakan data China Medical Tribune. Penelitian tentang ekstraksi akronim menggunakan Hidden Markov Models (HMMs) juga diperkenalkan oleh [3]. Model yang dikembangkan dapat menentukan akronim dalam bidang biomedik yang ambigius dan rumit.

3. EKSTRAK AKRONIM DAN EKSPANSI

Dalam kajian ini, ada beberapa langkah yang dilakukan dalam menentukan akronim dan ekspansinya. Pertama, kandidat akronim dan ekspansi ditentukan seperti pada penelitian [1], kemudian fitur dan skor numerik untuk setiap pasangan ditentukan. Ketiga, proses pembelajaran dan pengujian algoritma menggunakan metode k-Nearest Neighbors dilakukan. 3.1 Membangkitkan Kandidat Akronim

Bila A diasumsikan sebagai sebuah kata dalam teks, maka A dianggap sebagai kandidat akronim jika jumlah Ck atau huruf kapital dan angka dalam kata A, dibagi jumlah Cs yahu huruf dan angka pembentuk kata A melebihi threshold (75%). Dengan kata lain, penentuan kandidat akronim dihitung dengan pertidaksamaan berikut:

f(A) = ^ ± > 0.75 (1)

3.2 Membangkitkan Kandidat Ekspansi Setelah kandidat akronim ditemukan dalam

sebuah kalimat maka kandidat ekspansi dibangkitkan dari teks yang mengelilingi kandidat akronim tersebut. Kandidat ekspansi dari sebuah akronim dibangkitkan menggunakan metode n-grams. Semua kata yang berada sebelum akronim disebut konten kiri dan semua kata yang berada setelah akronim disebut konten kanan [1]. Jika n adalah jumlah kata dari kandidat ekspansi, K merupakan kata pada konten kiri atau kanan, dan A merupakan huruf dan

angka pembentuk akronim, maka nilai n dite dengan persamaan berikut:

M = min (£A: , ; £> + 2) Rumus tersebut digunakan untuk membatasi maksimum kata dalam kandidat kepanjangan akronim. 4. MENENTUKAN FITUR PAS AN

AKRONIM-EKSPANSI Fitur akronim-ekspansi merupakan skor ata.

yang diberikan kepada setiap pasangan akronn kandidat ekspansinya berdasarkan karakteristi pasangan tersebut. Dalam kajian ini mendefiiiisikan lima fitur yang merepresct keterkaitan antara akronim dan ekspansinya. fitur tersebut adalah: 1) Fitur pertama merepresentasikan hubungar

jumlah karakter pada akronim dengan ' pada ekspansinya. Jika A adalah pembentuk akronim baik yang ditulis huruf kapital maupun huruf kecil dan £ kata dalam ekspansi akronim yang bukzx penghubung dan kata depan maka n ^ a pertama ini dihitung dengan rumus:

\( YA , YA j ( YE .

Fi akan bernilai 1 jika jumlah I pembentuk akronim dan jumlah kata ekspansi adaiah sama dan akan bem. . sebaliknya.

2) Fitur kedua merepresentasikan rasio *. ekspansi yang huruf awalnya ditulis dea kapital. Jika EK adalah kata pada ekspa huruf awalnya ditulis dengan huruf tacmm kata tersebut tidak termasuk golongan tza dan kata penghubung dan Ek adalah t a t ekspansi yang huruf awalnya tidak k tidak termasuk kelompok kata depac penghubung dan \A\ merupakan panjaru maka F2 dihitung dengan persamaan berioK

' \A Bank Syariah Mandiri yang 3t

ekspansi dari akronim BSM akan mezm F2 = 1 karena jumlah huruf kapital paea a ekspansi dan panjang akronim sama-saam 3 sementara jumlah huruf kecil paca m ekspansi tidak ada. Namun unci. Matematika dan Ilmu Pengetahuar - _ J merupakan ekspansi dari FMIPA, fir_r • 0,80.

SNATIKA 2011, ISSN 208.- : E

Page 13: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

Penentuan Secara Otomatis Akronim dan Ekspansinya Dari Data TeksBemebasahdaTesa

Fitur ketiga menilai keterkaitan antara huruf pada akronim dan kombinasi huruf pada kata dalam ekspansi. Karena sebuah akronim dapat disingkat berdasarkan huruf yang ada dalam ekspansinya, maka atas dasar tersebut fitur ketiga ini dibangun berdasarkan sesuaian huruf pada akronim dan huruf pada kata ekspansinya. Algoritma penentuan fitur ketiga ini adalah:

penieciksnhinuf . akronimpc] dcnnn

setiap huruf pada km tkjpanlirki

Ckmbar 1. Algoritma penentuan fitur F3

• i , dan S„ adalah skor positif dan negatif dan •a_ah huruf-huruf pembentuk akronim, maka anmuskan sebagai berikut

(5)

aketahui FbPS merupakan akronim dari Prabowo Subianto maka berdasarkan

nna pada di atas, langkah awal yang •an adalah memeriksa huruf awal akronim • kiruf awal pada kata pertama dalam e=. Karena huruf F cocok dengan kata •a calam ekspansi yaitu Facebook maka

renjadi 1. Selanjutnya, huruf b pada • t ibandingkan dengan huruf awal kata - - i— ekspansi yaitu P dari kata Prabowo.

sesuai maka huruf b kemudian ^ « dengan setiap huruf pada kata

dalam ekspansi yaitu Facebook. ~d pertama dalam kata tersebut tidak

T r a v - - Untuk contoh ini, karena huruf b subkata book, maka huruf b pada

• t real perhitungkan. Selanjutnya huruf P i ^ p o r dengan huruf awal kata Prabowo. •tt .'- sekarang bernilai 2. Terakhir, huruf S •^aa.- dengan huruf awal kata Subianto • a -eniadi 3. Karena panjang akronim ': itanpa memperhitungkan huruf b

"3= FbPS) dan Sp juga bernilai 3 remilai 0, maka fitur F j bernilai 1.

-enunjukkan hubungan antara - ::nim dengan huruf awal kata

pertama dalam ekspansi dan huruf terakhir akronim dengan huruf awal pada kata terakhir dalam ekspansi. Fitur ini dimaksudkan untuk menyelesaikan masalah akronim yang dibangun bukan sepenuhnya oleh huruf awal setiap kata ekspansinya. Jika A adalah huruf pembentuk akronim dan WE adalah huruf awal kata dalam ekspansi, maka keterkaitan ditunjukkan oleh persamaan berikut:

F ^ A 1 = W E 1 A A „ =WE„ ->1

F 4 = Al = WEL vA„ = WE„ -> 0.5 (6)

F 4 =AL*WEL AAN*WEN - » 0

5) Fitur kelima diperkenalkan karena ekspansi dari sebuah akronim biasanya tidak mengandung banyak kata depan dan kata penghubung. Fitur ini bernilai rendah xmtuk ekspansi yang memuat banyak kata depan dan kata penghubung dan sebaliknya. Jika S merupakan kata depan atau kata penghubung dalam ekspansi dan W adalah kata-kata pembentuk ekspansi maka fitur Fs dapat dihitung dengan rumus:

F 5 = l - dimana

(7)

Sebagai contoh, pasangan akronim dan ekspansi FMIPA - Fakultas Matematika dan Ilmu Pengetahuan Alam. Jumlah kata dalam ekspansi akronim FMIPA adalah 6 dan jumlah kata penghubung dalam ekspansi adalah 1 yaitu kata 'dan'. Oleh karena itu maka nilai F5 untuk pasangan tersebut adalah 0,83.

5. D A T A

5.1 Data Pembelajaran {Training Set) Jumlah data pembelajaran yang digunakan dalam

penelitian ini sebanyak 4.570 pasangan akronim dan ekspansi yang dibangun menggunakan tahapan yang telah diuraikan pada sub bab sebelumnya. Setiap pasangan diberi klas {label) secara manual. Pasangan akronim dan ekspansi yang benar diberi klas 1 dan pasangan yang salah diberi klas 0. Dari 4.570 data pembelajaran, ditemukan sebanyak 54 pasangan dengan klas 1. Pasangan tersebut adalah pasangan akronim dan ekspansi yang benar, sedangkan 4.516 pasangan dengan klas 0 merupakan pasangan akronim dan ekspansi yang salah.

5.2 Data Pengujian {Testing Set) Data pengujian digunakan untuk menguji tingkat

akurasi dari algoritrna yang dikembangkan. Data pengujian diekstrak dari 4 situs berbeda berbahasa Indonesia yaitu www, mediaiurnalindonesia. com, www.okezone.com, www.republika.com, dan portal

S N A T 1 K A 2 0 1 1 . I S S N 2089-10831 117

Page 14: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

Penertuan Secara Otomatis Akronim dan Ek^

sosial, dari budaya. Pada masing-masing situs diambil 50 dokumen. Secara rinci, jumlah data pengujian dari situs Okezone.com adalah I7.258i portal Detik.com adalah 15.731, Media Jurnal Indonesia adalah 18.970, dan situs Republika.com sebanyak 27.370. 5.3 Precision, Recall dan F-Score

Dalam penelitian ini, Precision, Recall, dan F-Score dihitung untuk mengevaluasi akurasi dari algorhma yang diusulkan. Precision mengukur jumlah pasangan akrcnim dan ekspansi yang relevan dibagi dengan total pasangan akronim dan ekspansi yang ada, sementara Recall didefinisikan sebagai jumlah pasangan akronim dan ekspansi yang berhasil dhemukan. Rumus Precision dan Recall adalah [4]:

TP P-;

r = •

TP+FP

TP TP + FN

(8)

K Actual Classified

Sum Precision Recat' F-sccte K +

Sum Precision Recat' F-sccte

K=3 + 53 3

15731 0.66 0.96 USS K=3 2 15673

15731 0.66 0.96 USS

k=S + 53 3

15731 0.96 0.95 k=S 2 15673

15731 0.96 0.95

k=7 53 1

15731 0.96 0.95 O K k=7 2 15673

15731 0.96 0.95 O K

Tabel 3. Hasil klasifikasi data Jurnal Indonesia

Classified

18876

18970

18970

18970

0.95

0,95

0.95

0.90

0.90

0) Tabel 4. Hasil klasifikasi data Republikaj

TP atau True Positive adalah jumlah hasil klasifikasi yang benar dari data berklas positif. FN atau False Negative adalah jumlah hasil klasifikasi yang salah dari sampel dengan klas positif. FP atau False Positive adalah jumlah hasil klasifikasi yang salah dari sampel dengan klas negatif dan TN atau True Negative adalah jumlah hasil klasifikasi yang bcnar dari sampel dengan label negatif Selanjutnya, F-Score yang merupakan Harmonic mean dari precision dan recall [4] dapat dihitung dengan rumus:

2pr F =

p + r (9)

6. HASIL PENGUJIAN

Setelah fitur pasangan akronim dan ekspansi dari tulisan teks berbahasa Indonesia dhentukan, algoritma yang dikembangkan kemudian diuji mengunakan data pengujian dan metode k-Nearest Neighbors (k-NN) [5]. Tabel 1, 2, 3, dan 4 memperlihatkan hasil pengujian terhadap masing-masing domain.

Tabel 1. Hasil klasifikasi data Okezone.com

k Actual Classified

Sum Precision Recall F-score •

Recall F-score

K=3 84 29

17258 0.93 0.74 0.83 K=3 6 17139

17258 0.93 0.74 0.83

k=5 84 29

17258 0.93 0 74 0 8 3 k=5 6 17139

17258 0.93 0 74 0 8 3

k=7 84 29

17258 0.93 0 74 0 8 3 k=7 6 1 1 1

17258 0.93 0 74 0 8 3

Tabel 2. Hasil klasifikasi data Detik.com

k Actual Classified

Sum Precision Recat +

Sum Precision Recat

k=i + 103 23

27370 0 9 5 0.82 : * k=i 5 27233

27370 0 9 5 0.82

k=5 103 23

27370 0.95 0.82 im k=5 5 27239

27370 0.95 0.82

k=T 103 23

27370 0 9 5 0 8 2 : • k=T 5 27239

27370 0 9 5 0 8 2

Tabel 5 dan 6 secara berurut merangkum contoh pasangan akt onirn dan ditentukan secara benar dan salah oleh yang dikembangkan.

Tabel 5. Contoh akronim dan ekspansi yang

Akronim

ATM BPM FhPS LP3I

COAST CD-ROM DPR FeRAM

Ekspansi UjianNasional Anjungan Tunai Mandiri Badan Pemberdayaan NL-Facebook Prabowo SuboMi Lembaga Pengembangan Profesi'. Cache On A Stick Compact Disk Read OnI> V Dewan Perwakilan Rak~ E Ferroelectric Random Memory

Tabel 6. Contoh akronim dan ekspansi >ang

Akronim HMSP PTBA BPMIGAS

PT TPI KSSK

Ekspansi H M Sampoerna PT Tambang Batubara Badan Pelaksana Keg:. Hulu Minyak dan Gas E. perekonomian tambL tangkapan ikan khususnya mengenai katanya

SNATIKA 2011, JSSN 2089-" A

Page 15: eminar Nasional Teknologi Informasi, · PDF fileProsiding ISSN 2089-1083 SNATIKA 2011 ... ini merupakan bagian dari 10 Flag APTIKOM untuk meningkatkan kualitas SDM ICT di ... Using

Penentuan Secara Otomatis Akroram dan Ekspanar̂ a Dan DanTacs

ITB internasional yang bersifat PKP2B pertambangan KP BUMN

7. KESIMPULAN

Keberhasilan dalam menentukan akronim dan esspansinya secara otomatis sangat tergantung pada jenis akronim. Algoritma yang diperkenalkan ini atpat menebak dengan baik akronim yang nerupakan kombinasi antara huruf awal atau kombinasi antara huruf awal dan huruf selanjutnya. Algoritma gagal menebak akronim dan ekspansi ?ang terbentuk dari gabungan karakter kata tetapi ^CTmgan kata tersebut tidak ditulis menggunakan iuiuf kapital seperti Panja, Bappeda, atau Unsyiah. fcnun, algoritma dapat menentukan akronim-•ronim tersebut bila akronim tersebut ditulis •ffijadi PANJA, BAPPEDA, atau UNSYIAH.

.Algoritma yang diperkenalkan dalam paper ini •Bcihki tingkat akurasi lebih dari 89%, namun tidak • B E menentukan kandidat akronim dalam tulisan jna jumlah huruf kecil dalam akronim lebih dari 2?% dari total huruf pembentuk akronim.

DAFTAR R E F E R E N S I

." Xu, Y. Huang, "Using SVM to Extract Acronyms from Text: Soft Computing - A Fusion v Foundations", Methodologies and Applications, 11:369-373, 2006. I Chang, H. Schutze, R. Altman, "Creating an Online Dictionary of Abbreviations from MEDLINE", Journal of the American Medical jcbrmatics Association, p. 613-620,2002. 3 A Osiek, Xexeo, G. de Carvalho, "A

ge-Independent Acronym Extraction Biomedical Texts with Hidden Markov

Models", Journal of IEEE Trans, on Biomedical mgneering, vol. 57(11), p. 2677 - 2688, 2010. E Liu, "Web Data Mining', Springer Berlin aecselberg, New York, 2007.

. NL Cover, P. E. Hart, Nearest neighbor • • e r a classification. IEEE Transaction on Mkrmation Theory, 13:21-27, 1967.

SNATIKA 2011, ISSN 2089-1083| 119