SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …
Transcript of SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …
SISTEM PENJAWAB FAQ (FREQUENTLY ASKED
QUESTION) SEPUTAR UNIVERSITAS BUMIGORA
MENGGUNAKAN METODE PEMBOBOTAN TF-IDF DAN
JACCARD SIMILARITY
SKRIPSI
Oleh :
RIZWAN AFANDI
1610530093
PROGRAM STUDI ILMU KOMPUTER
FAKULTAS TEKNIK DAN DESAIN
UNIVERSITAS BUMIGORA
MATARAM
2020
SISTEM PENJAWAB FAQ (FREQUENTLY ASKED
QUESTION) SEPUTAR UNIVERSITAS BUMIGORA
MENGGUNAKAN METODE PEMBOBOTAN TF-IDF DAN
JACCARD SIMILARITY
SKRIPSI
Diajukan sebagai salah satu syarat untuk memenuhi kebulatan studi jenjang Strata
Satu (S1) program studi Ilmu Komputer pada Fakultas Teknik Dan Kesehatan
Universitas Bumigora.
Oleh :
RIZWAN AFANDI
1610530093
PROGRAM STUDI ILMU KOMPUTER
FAKULTAS TEKNIK DAN DESAIN
UNIVERSITAS BUMIGORA
MATARAM
2020
SISTEM PENJAWAB FAQ (FREQUENTLY ASKED
QUESTION) SEPUTAR UNIVERSITAS BUMIGORA
MENGGUNAKAN METODE PEMBOBOTAN TF-IDF DAN
JACCARD SIMILARITY
SKRIPSI
Diajukan Sebagai Salah Satu Syarat untuk Memenuhi Kebulatan Studi
Jenjang Strata Satu (S1) Program Studi Ilmu Komputer
Pada Universitas Bumigora
Oleh:
Rizwan Afandi
1610530093
SKRIPSI
JUDUL : Sistem Penjawab FAQ (Frequently Asked Question)
Seputar Universitas Bumigora Menggunakan metode
Pembobotan TF-IDF dan Jaccard Similarity
NAMA : Rizwan Afandi
NIM : 1610530093
NPM : 16.8.349.74.75.0.5.0093
PROGRAM STUDI : Ilmu Komputer
JENJANG : Sastra Satu (S1)
DIUJIKAN : 13 Agustus 2020
Menyetujui,
Suriyati M.Kom
Pembimbing
Tanggal Menyetujui 26/08/2020
Telah diterima dan disetujui sebagai salah satu syarat untuk memperoleh
Gelar Akademik Sarjana Komputer (S.Kom)
Mengetahui
Lilik Widayawati, M.Kom.
Ketua Program Studi S1 Ilmu Komputer
Tanggal Mengetahui: 26/02/2020
SISTEM PENJAWAB FAQ (FREQUENTLY ASKED
QUESTION) SEPUTAR UNIVERSITAS BUMIGORA
MENGGUNAKAN METODE PEMBOBOTAN TF-IDF DAN
JACCARD SIMILARITY
LEMBAR PENGESAHAN PENGUJI
Diajukan sebagai salah satu syaratu untuk memenuhi kebulatan studi jenjang
Strata Satu (S1) Program Studi Ilmu Komputer pada Fakultas Teknik dan
Kesehatan Universitas Bumigora.
Oleh:
RIZWAN AFANDI
1610530093
Disetujui Oleh Penguji:
1. Ria Rismayati S.Kom M.Kom
NIK: 12.6.165
2. Mayadi M.Kom
NIK: 16.6.253
26/02/2020
26/02/2020
i
KATA PENGANTAR Puji syukur kita panjatkan kehadirat Allah SWT, yang telah memberikan
kesehatan dan keselamatan bagi kita semua dalam menjalankan aktivitas seperti
biasa serta tak lupa shalawat serta salam selalu tercurah kepada Rasulullah
Muhammad SAW. Alhamdulillah, berkat rahmat dan karunia-Nya juga, peneliti
dapat menyelesaikan pengerjaan tugas akhir skripsi dengan judul “Sistem
Penjawab FAQ (Frequently Asked Question) Seputar Universitas Bumigora
Menggunakan Metode Pembobotan TF-IDF dan Jaccard Similarity” dibuat
sebagai salah satu syarat memperoleh gelar sarjana komputer (S.Kom) untuk
Jurusan Ilmu Komputer di Universitas Bumigora.
Bersamaan dengan ini, peneliti ingin mengucapkan terimakasih kepada
pihak-pihak yang telah banyak mendukung dan membantu secara langsung maupun
tidak langsung dalam penyelesaian penelitian skripsi ini. Pada kesempatan ini
peneliti ingin mengucapkan terimakasih kepada :
1. Bapak Dr. Ir. Anthony Anggrawan, M.T., Ph.D selaku Rektor Universitas
Bumigora.
2. Ibu Ni Gusti Ayu Dasriani, M.Kom, selaku Wakil Rektor I Universitas
Bumigora
3. Ibu Lilik Widyawati, M.Kom selaku Ketua Program Studi S1 Ilmu
Komputer.
4. Ibu Suriyati M.Kom selaku Dosen Pembimbing yang selalu memberikan
semangat, motivasi serta arahan yang sangat bermanfaat yang tentunya akan
selalu saya ingat.
5. Kedua orang tua tercinta, yang senantiasa selalu memberikan semangat serta
mendoakan saya sehingga mampu menyelesaikan skripsi saya sampai pada
titik ini.
6. Sahabat-sahabat saya, teman-teman seperjuangan, yang telah memberikan
banyak bantuan dan dukungan kepada saya dalam menyelesaikan penelitian
skripsi ini.
ii
Skripsi yang peneliti kerjakan bertema sistem penjawab ini merupakan
sistem sederhana yang memanfaatkan metode string matching dalam
pemrosesannya yang diharapkan dapat membantu dalam menjawab FAQs secara
otomatis melalui input user. Peneliti berharap skripsi ini dapat memberi manfaat
kepada semua pihak khususnya yang terlibat langsung dalam bidang informatika
dan mengembangkannya menjadi lebih jauh atau dalam bentuk yang berbeda.
Peneliti menyadari bahwa dalam penelitian skripsi ini masih banyak
terdapat kekurangan yang perlu dibenahi, baik itu teknik penelitian maupun
pembahasan yang semata disebabkan oleh keterbatasan ilmu dan pemahaman
peneliti. Oleh karena itu, peneliti mengharapkan segala bentuk saran serta
masukan yang membangun dari berbagai pihak. Semoga skripsi ini dapat
bermanfaat bagi para pembaca untuk mendorong penelitian-penelitian
selanjutnya.
Mataram, Juli 2020
Peneliti,
iii
LEMBAR PERNYATAAN KEASLIAN
Saya yang bertanda tangan dibawah ini:
NAMA : Rizwan Afandi
NIM : 1610530093
Program Studi : Ilmu Komputer
Kompetisi : Rekayasa Perangkat Lunak
Menyatakan bahwa skripsi yang berjudul:
Sistem Penjawab FAQ (Frequently Asked Question) Seputar Universitas
Bumigora Menggunakan Metode Pembobotan TF-IDF dan Jaccard
Similarity
Benar-benar merupakan hasil karya pribadi dan seluruh sumber yang dikutip
maupun dirujuk telah saya nyatakan dengan benar dan apabila dikemudian hari
terdapat penyimpangan dan ketidakbenaran dalam pernyataan ini, maka saya
bersedia menerima sanksi akademik sesuai dengan aturan yang belaku.
Mataram, 13 Agustus 2020
RIZWAN AFANDI
NIM.1610520083
iv
IZIN PENGGUNA Skripsi ini merupakan syarat kelulusan pada Program Studi S1 Ilmu Komputer
Universitas Bumigora, dengan ini peneliti setuju jika skripsi ini digandakan
(diduplikasi) baik sebagian maupun seluruhnya, ataupun dikembangkan untuk
kepentingan akademis yang disetujui oleh pembimbing peneliti, Ketua Program
Studi, Dekan Fakultas Teknik dan Desain.
Untuk dimaklumi, bahwa menduplikasi, mempublikasikan atau menggunakan
skripsi ini, maupun bagian-bagiannya dengan tujuan komersial / keuntungan
finansial, tidak diizinkan tanpa adanya izin tertulis dari Universitas Bumigora. Jika
hal ini dilanggar maka Universitas Bumigora akan memberikan sanksi sesuai
dengan hukum yang berlaku.
Penghargaan akademis terkait isi dari skripsi ini adalah pada peneliti dan
Universitas Bumigora.
Permintaan izin untuk menduplikasi atau menggunakan materi dari skripsi ini baik
sebagian maupun seluruhnya harus ditujukan pada:
Dekan Fakultas Teknik dan Desain
Ketua Program Studi S1 Ilmu Komputer
Universitas Bumigora
v
ABSTRAK
Melimpahnya informasi di media informasi pada era digital saat ini membuat
beberapa orang kesulitan untuk mendapatkan informasi yang sesuai. Hal ini juga
memungkinkan menumpuknya informasi penting yang saling berkaitan tidak bisa
digunakan secara maksimal oleh penggunanya. Sejalan dengan bagian PMB
(Penerimaan Mahasiswa Baru) Universitas Bumigora yang memanfaatkan salah
satu media sosial sebagai sarana komunikasi dengan masyarakat yang ingin
mendaftar ataupun mencari informasi mengenai UBG, tidak jarang masyarakat
menanyakan pertanyaan yang sejenis pada bagian PMB. Banyaknya informasi yang
masuk ke media sosial milik Bumigora tersebut memicu munculnya FAQs
(Frequently Asked Questions) yang merupakan kumpulan pertanyaan yang umum
ditanyakan. Lahirnya FAQs berfungsi sebagai solusi untuk mendapatkan informasi
yang tepat dan sesuai dengan apa yang menjadi masalah bagi pengguna, khususnya
calon mahasiswa baru yang akan mendaftar di Universitas Bumigora. Pencarian
informasi berupa jawaban dari pertanyaan umum seputar Universitas Bumigora
seperti proses daftar, biaya, perkuliahan dan lain-lain bisa diperoleh dengan
bertanya kepada sumber informasi atau membaca dokumen terkait informasi yang
diinginkan tersebut. Sistem penjawab FAQs seputar Universitas Bumigora
bertujuan untuk membantu dalam pencarian jawaban berdasarkan FAQs yang
diterima staf PMB menggunakan salah satu metode similarity measure yakni
jaccard similarity dengan pembobotan kata TF-IDF(Term Frequency-Invers
Document Frequency). Implementasi dari penelitian ini terbatas sampai pada
bentuk sistem saja. Proses similarity menggunakan metode pembobotan TF-IDF
dan jaccard similarity diujicobakan pada 6 dokumen dengan query yang di-input
oleh pengguna dan mendapatkan tingkat akurasi sebesar 54.8%. Persentase ini
diperoleh dari hasil similarity ke-6 dokumen dengan query yang mengandung kata
kunci berbeda.
Kata kunci: FAQs, jaccard similarity, TF-IDF, Universitas Bumigora, PMB
vi
DAFTAR ISI
LEMBAR PENGESAHAN PENGUJI
KATA PENGANTAR ............................................................................................ i
LEMBAR PERNYATAAN KEASLIAN ........................................................... iii
IZIN PENGGUNA ............................................................................................... iv
ABSTRAK ............................................................................................................. v
DAFTAR ISI ......................................................................................................... vi
DAFTAR GAMBAR ............................................................................................ ix
DAFTAR TABEL ................................................................................................. x
DAFTAR LAMPIRAN ........................................................................................ xi
BAB I PENDAHULUAN ...................................................................................... 1
1.1. Latar Belakang ......................................................................................... 1
1.2. Rumusan Masalah .................................................................................... 2
1.3. Batasan Masalah ....................................................................................... 2
1.4. Tujuan dan Manfaat Penelitian ................................................................. 2
1.4.1. Tujuan ............................................................................................... 2
1.4.2. Manfaat ............................................................................................. 2
1.5. Metodologi ............................................................................................... 3
1.5.1. Metode Pengumpulan data ................................................................ 3
1.5.2. Metode Penelitian.............................................................................. 3
1.6. Sistematika Penelitian .............................................................................. 4
BAB II LANDASAN TEORI ............................................................................... 6
2.1. FAQ (Frequently Asked Question) ........................................................... 6
2.1.1. Perkembangan FAQs dalam web desain ........................................... 6
2.1.2. Manfaat FAQ .................................................................................... 6
2.1.3. Membangun FAQ .............................................................................. 7
2.2. Sistem ....................................................................................................... 8
2.2.1. Unsur dan elemen dalam sistem ........................................................ 8
2.2.2. Jenis Sistem ....................................................................................... 9
2.2.3. Ciri-ciri sistem yang baik ................................................................ 10
2.3. Flowchart ............................................................................................... 11
vii
2.3.1. Jenis-jenis Flowchart ...................................................................... 12
2.4. Text Mining ............................................................................................. 13
2.4.1. Preprocessing .................................................................................. 14
2.5. TF-IDF (Term Frequency – Invers Document Frequency) .................... 15
2.6. Jaccard Similarity .................................................................................. 17
2.7. Bahasa Pemrograman ............................................................................. 18
2.7.1. Tingkatan bahasa program .............................................................. 18
2.7.2. Library ............................................................................................ 19
2.8. Universitas Bumigora ............................................................................. 20
2.8.1. Penerimaan Mahasiswa Baru (PMB) .............................................. 21
BAB III ANALISIS DAN PERANCANGAN SISTEM ................................... 22
3.1. Kebutuhan Penelitian ............................................................................. 22
3.1.1. Data ................................................................................................. 22
3.2. Analisis pre-processing .......................................................................... 25
3.2.1. Case Folding ................................................................................... 26
3.2.2. Tokenizing ....................................................................................... 26
3.2.3. Filtering (Stopword Removal)......................................................... 27
3.2.4. Stemming ......................................................................................... 28
3.3. Analisis proses pembobotan TF-IDF ..................................................... 30
3.4. Analisis proses jaccard similarity .......................................................... 32
3.5. Flowchart sistem penjawab .................................................................... 34
BAB IV HASIL DAN PEMBAHASAN ............................................................ 37
4.1. Persiapan software untuk sistem penjawab ............................................ 37
4.1.1. Instalasi Python ............................................................................... 37
4.1.2. Instalasi library ............................................................................... 40
4.1.3. Penempatan data.............................................................................. 41
4.2. Implementasi pada Python ..................................................................... 41
4.1.1. Preprocessing .................................................................................. 42
4.1.1.1. Case Folding ............................................................................ 42
4.1.1.2. Stemming .................................................................................. 42
4.1.1.3. Filtering ................................................................................... 43
4.1.1.4. Tokenizing ................................................................................ 43
viii
4.1.2. TF-IDF ............................................................................................ 46
4.1.3. Jaccard Similarity ........................................................................... 48
4.3. Hasil dan output sistem .......................................................................... 49
4.3.1. Output Jawaban ............................................................................... 51
BAB V PENUTUP ............................................................................................... 53
2.1. Kesimpulan ............................................................................................. 53
2.2. Saran ....................................................................................................... 53
REFRENSI .......................................................................................................... 54
ix
DAFTAR GAMBAR Halaman
Gambar 1.1 Alur proses ................................................................................... 4
Gambar 2.1 simbol flowchart ........................................................................... 12
Gambar 3.1 Brosur UBG.................................................................................. 24
Gambar 3.2 Halaman web UBG ...................................................................... 25
Gambar 3.3 Tahap preprocessing .................................................................... 25
Gambar 3.4 List stopword library sastrawi ...................................................... 27
Gambar 3.5 Flowchart stemming kata ............................................................. 28
Gambar 3.6 Irisan dan Gabungan antara set A dan B ...................................... 33
Gambar 3.7 Flowchart Sistem Penjawab ......................................................... 34
Gambar 3.8 Perulangan pada flowchart ........................................................... 35
Gambar 4.1 Web Python .................................................................................. 37
Gambar 4.2 Installer x64/x86 .......................................................................... 38
Gambar 4.3 Instalasi Python ............................................................................ 38
Gambar 4.4 Proses Instalasi Python ................................................................. 39
Gambar 4.5 Proses instalasi selesai .................................................................. 40
Gambar 4.6 Aplikasi Python ............................................................................ 40
Gambar 4.7 Update pip .................................................................................... 41
Gambar 4.8 Direktori File ................................................................................ 41
Gambar 4.9 Membaca file data pada python ................................................... 41
Gambar 4.10 Nilai tf-idf file 1 ......................................................................... 47
Gambar 4.11 Nilai tf-idf file 2 ......................................................................... 47
Gambar 4.12 Hasil similarity doc 1 dan doc 2 ................................................. 49
Gambar 4.13 Error result ................................................................................. 51
Gambar 4.14 Output Jawaban 1 ....................................................................... 51
Gambar 4.15 Output Jawaban 2 ....................................................................... 52
x
DAFTAR TABEL Halaman
Tabel 3.1 List FAQs ......................................................................................... 23
Tabel 3.2 Contoh tokenizing ............................................................................ 26
Table 3.3 Matriks TF-IDF................................................................................ 32
Tabel 4.1 Hasil case folding ............................................................................. 42
Tabel 4.2 Hasil stemming ................................................................................. 42
Tabel 4.3 Hasil filtering ................................................................................... 43
Tabel 4.4 Hasil tokenizing ................................................................................ 43
Tabel 4.5 Hasil Preprocessing ......................................................................... 45
Tabel 4.6 Similarity dokumen dengan kata kunci ............................................ 49
xi
DAFTAR LAMPIRAN
Lampiran A Surat Izin Penelitian dan Data rincian Biaya Per Prodi ............... A.1
Lampiran B Hasil Wawancara ......................................................................... B.1
Lampiran C Script Program ............................................................................. C.1