Download - SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

Transcript
Page 1: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

SISTEM PENJAWAB FAQ (FREQUENTLY ASKED

QUESTION) SEPUTAR UNIVERSITAS BUMIGORA

MENGGUNAKAN METODE PEMBOBOTAN TF-IDF DAN

JACCARD SIMILARITY

SKRIPSI

Oleh :

RIZWAN AFANDI

1610530093

PROGRAM STUDI ILMU KOMPUTER

FAKULTAS TEKNIK DAN DESAIN

UNIVERSITAS BUMIGORA

MATARAM

2020

Page 2: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

SISTEM PENJAWAB FAQ (FREQUENTLY ASKED

QUESTION) SEPUTAR UNIVERSITAS BUMIGORA

MENGGUNAKAN METODE PEMBOBOTAN TF-IDF DAN

JACCARD SIMILARITY

SKRIPSI

Diajukan sebagai salah satu syarat untuk memenuhi kebulatan studi jenjang Strata

Satu (S1) program studi Ilmu Komputer pada Fakultas Teknik Dan Kesehatan

Universitas Bumigora.

Oleh :

RIZWAN AFANDI

1610530093

PROGRAM STUDI ILMU KOMPUTER

FAKULTAS TEKNIK DAN DESAIN

UNIVERSITAS BUMIGORA

MATARAM

2020

Page 3: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

SISTEM PENJAWAB FAQ (FREQUENTLY ASKED

QUESTION) SEPUTAR UNIVERSITAS BUMIGORA

MENGGUNAKAN METODE PEMBOBOTAN TF-IDF DAN

JACCARD SIMILARITY

SKRIPSI

Diajukan Sebagai Salah Satu Syarat untuk Memenuhi Kebulatan Studi

Jenjang Strata Satu (S1) Program Studi Ilmu Komputer

Pada Universitas Bumigora

Oleh:

Rizwan Afandi

1610530093

Page 4: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

SKRIPSI

JUDUL : Sistem Penjawab FAQ (Frequently Asked Question)

Seputar Universitas Bumigora Menggunakan metode

Pembobotan TF-IDF dan Jaccard Similarity

NAMA : Rizwan Afandi

NIM : 1610530093

NPM : 16.8.349.74.75.0.5.0093

PROGRAM STUDI : Ilmu Komputer

JENJANG : Sastra Satu (S1)

DIUJIKAN : 13 Agustus 2020

Menyetujui,

Suriyati M.Kom

Pembimbing

Tanggal Menyetujui 26/08/2020

Telah diterima dan disetujui sebagai salah satu syarat untuk memperoleh

Gelar Akademik Sarjana Komputer (S.Kom)

Mengetahui

Lilik Widayawati, M.Kom.

Ketua Program Studi S1 Ilmu Komputer

Tanggal Mengetahui: 26/02/2020

Page 5: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

SISTEM PENJAWAB FAQ (FREQUENTLY ASKED

QUESTION) SEPUTAR UNIVERSITAS BUMIGORA

MENGGUNAKAN METODE PEMBOBOTAN TF-IDF DAN

JACCARD SIMILARITY

LEMBAR PENGESAHAN PENGUJI

Diajukan sebagai salah satu syaratu untuk memenuhi kebulatan studi jenjang

Strata Satu (S1) Program Studi Ilmu Komputer pada Fakultas Teknik dan

Kesehatan Universitas Bumigora.

Oleh:

RIZWAN AFANDI

1610530093

Disetujui Oleh Penguji:

1. Ria Rismayati S.Kom M.Kom

NIK: 12.6.165

2. Mayadi M.Kom

NIK: 16.6.253

26/02/2020

26/02/2020

Page 6: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

i

KATA PENGANTAR Puji syukur kita panjatkan kehadirat Allah SWT, yang telah memberikan

kesehatan dan keselamatan bagi kita semua dalam menjalankan aktivitas seperti

biasa serta tak lupa shalawat serta salam selalu tercurah kepada Rasulullah

Muhammad SAW. Alhamdulillah, berkat rahmat dan karunia-Nya juga, peneliti

dapat menyelesaikan pengerjaan tugas akhir skripsi dengan judul “Sistem

Penjawab FAQ (Frequently Asked Question) Seputar Universitas Bumigora

Menggunakan Metode Pembobotan TF-IDF dan Jaccard Similarity” dibuat

sebagai salah satu syarat memperoleh gelar sarjana komputer (S.Kom) untuk

Jurusan Ilmu Komputer di Universitas Bumigora.

Bersamaan dengan ini, peneliti ingin mengucapkan terimakasih kepada

pihak-pihak yang telah banyak mendukung dan membantu secara langsung maupun

tidak langsung dalam penyelesaian penelitian skripsi ini. Pada kesempatan ini

peneliti ingin mengucapkan terimakasih kepada :

1. Bapak Dr. Ir. Anthony Anggrawan, M.T., Ph.D selaku Rektor Universitas

Bumigora.

2. Ibu Ni Gusti Ayu Dasriani, M.Kom, selaku Wakil Rektor I Universitas

Bumigora

3. Ibu Lilik Widyawati, M.Kom selaku Ketua Program Studi S1 Ilmu

Komputer.

4. Ibu Suriyati M.Kom selaku Dosen Pembimbing yang selalu memberikan

semangat, motivasi serta arahan yang sangat bermanfaat yang tentunya akan

selalu saya ingat.

5. Kedua orang tua tercinta, yang senantiasa selalu memberikan semangat serta

mendoakan saya sehingga mampu menyelesaikan skripsi saya sampai pada

titik ini.

6. Sahabat-sahabat saya, teman-teman seperjuangan, yang telah memberikan

banyak bantuan dan dukungan kepada saya dalam menyelesaikan penelitian

skripsi ini.

Page 7: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

ii

Skripsi yang peneliti kerjakan bertema sistem penjawab ini merupakan

sistem sederhana yang memanfaatkan metode string matching dalam

pemrosesannya yang diharapkan dapat membantu dalam menjawab FAQs secara

otomatis melalui input user. Peneliti berharap skripsi ini dapat memberi manfaat

kepada semua pihak khususnya yang terlibat langsung dalam bidang informatika

dan mengembangkannya menjadi lebih jauh atau dalam bentuk yang berbeda.

Peneliti menyadari bahwa dalam penelitian skripsi ini masih banyak

terdapat kekurangan yang perlu dibenahi, baik itu teknik penelitian maupun

pembahasan yang semata disebabkan oleh keterbatasan ilmu dan pemahaman

peneliti. Oleh karena itu, peneliti mengharapkan segala bentuk saran serta

masukan yang membangun dari berbagai pihak. Semoga skripsi ini dapat

bermanfaat bagi para pembaca untuk mendorong penelitian-penelitian

selanjutnya.

Mataram, Juli 2020

Peneliti,

Page 8: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

iii

LEMBAR PERNYATAAN KEASLIAN

Saya yang bertanda tangan dibawah ini:

NAMA : Rizwan Afandi

NIM : 1610530093

Program Studi : Ilmu Komputer

Kompetisi : Rekayasa Perangkat Lunak

Menyatakan bahwa skripsi yang berjudul:

Sistem Penjawab FAQ (Frequently Asked Question) Seputar Universitas

Bumigora Menggunakan Metode Pembobotan TF-IDF dan Jaccard

Similarity

Benar-benar merupakan hasil karya pribadi dan seluruh sumber yang dikutip

maupun dirujuk telah saya nyatakan dengan benar dan apabila dikemudian hari

terdapat penyimpangan dan ketidakbenaran dalam pernyataan ini, maka saya

bersedia menerima sanksi akademik sesuai dengan aturan yang belaku.

Mataram, 13 Agustus 2020

RIZWAN AFANDI

NIM.1610520083

Page 9: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

iv

IZIN PENGGUNA Skripsi ini merupakan syarat kelulusan pada Program Studi S1 Ilmu Komputer

Universitas Bumigora, dengan ini peneliti setuju jika skripsi ini digandakan

(diduplikasi) baik sebagian maupun seluruhnya, ataupun dikembangkan untuk

kepentingan akademis yang disetujui oleh pembimbing peneliti, Ketua Program

Studi, Dekan Fakultas Teknik dan Desain.

Untuk dimaklumi, bahwa menduplikasi, mempublikasikan atau menggunakan

skripsi ini, maupun bagian-bagiannya dengan tujuan komersial / keuntungan

finansial, tidak diizinkan tanpa adanya izin tertulis dari Universitas Bumigora. Jika

hal ini dilanggar maka Universitas Bumigora akan memberikan sanksi sesuai

dengan hukum yang berlaku.

Penghargaan akademis terkait isi dari skripsi ini adalah pada peneliti dan

Universitas Bumigora.

Permintaan izin untuk menduplikasi atau menggunakan materi dari skripsi ini baik

sebagian maupun seluruhnya harus ditujukan pada:

Dekan Fakultas Teknik dan Desain

Ketua Program Studi S1 Ilmu Komputer

Universitas Bumigora

Page 10: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

v

ABSTRAK

Melimpahnya informasi di media informasi pada era digital saat ini membuat

beberapa orang kesulitan untuk mendapatkan informasi yang sesuai. Hal ini juga

memungkinkan menumpuknya informasi penting yang saling berkaitan tidak bisa

digunakan secara maksimal oleh penggunanya. Sejalan dengan bagian PMB

(Penerimaan Mahasiswa Baru) Universitas Bumigora yang memanfaatkan salah

satu media sosial sebagai sarana komunikasi dengan masyarakat yang ingin

mendaftar ataupun mencari informasi mengenai UBG, tidak jarang masyarakat

menanyakan pertanyaan yang sejenis pada bagian PMB. Banyaknya informasi yang

masuk ke media sosial milik Bumigora tersebut memicu munculnya FAQs

(Frequently Asked Questions) yang merupakan kumpulan pertanyaan yang umum

ditanyakan. Lahirnya FAQs berfungsi sebagai solusi untuk mendapatkan informasi

yang tepat dan sesuai dengan apa yang menjadi masalah bagi pengguna, khususnya

calon mahasiswa baru yang akan mendaftar di Universitas Bumigora. Pencarian

informasi berupa jawaban dari pertanyaan umum seputar Universitas Bumigora

seperti proses daftar, biaya, perkuliahan dan lain-lain bisa diperoleh dengan

bertanya kepada sumber informasi atau membaca dokumen terkait informasi yang

diinginkan tersebut. Sistem penjawab FAQs seputar Universitas Bumigora

bertujuan untuk membantu dalam pencarian jawaban berdasarkan FAQs yang

diterima staf PMB menggunakan salah satu metode similarity measure yakni

jaccard similarity dengan pembobotan kata TF-IDF(Term Frequency-Invers

Document Frequency). Implementasi dari penelitian ini terbatas sampai pada

bentuk sistem saja. Proses similarity menggunakan metode pembobotan TF-IDF

dan jaccard similarity diujicobakan pada 6 dokumen dengan query yang di-input

oleh pengguna dan mendapatkan tingkat akurasi sebesar 54.8%. Persentase ini

diperoleh dari hasil similarity ke-6 dokumen dengan query yang mengandung kata

kunci berbeda.

Kata kunci: FAQs, jaccard similarity, TF-IDF, Universitas Bumigora, PMB

Page 11: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

vi

DAFTAR ISI

LEMBAR PENGESAHAN PENGUJI

KATA PENGANTAR ............................................................................................ i

LEMBAR PERNYATAAN KEASLIAN ........................................................... iii

IZIN PENGGUNA ............................................................................................... iv

ABSTRAK ............................................................................................................. v

DAFTAR ISI ......................................................................................................... vi

DAFTAR GAMBAR ............................................................................................ ix

DAFTAR TABEL ................................................................................................. x

DAFTAR LAMPIRAN ........................................................................................ xi

BAB I PENDAHULUAN ...................................................................................... 1

1.1. Latar Belakang ......................................................................................... 1

1.2. Rumusan Masalah .................................................................................... 2

1.3. Batasan Masalah ....................................................................................... 2

1.4. Tujuan dan Manfaat Penelitian ................................................................. 2

1.4.1. Tujuan ............................................................................................... 2

1.4.2. Manfaat ............................................................................................. 2

1.5. Metodologi ............................................................................................... 3

1.5.1. Metode Pengumpulan data ................................................................ 3

1.5.2. Metode Penelitian.............................................................................. 3

1.6. Sistematika Penelitian .............................................................................. 4

BAB II LANDASAN TEORI ............................................................................... 6

2.1. FAQ (Frequently Asked Question) ........................................................... 6

2.1.1. Perkembangan FAQs dalam web desain ........................................... 6

2.1.2. Manfaat FAQ .................................................................................... 6

2.1.3. Membangun FAQ .............................................................................. 7

2.2. Sistem ....................................................................................................... 8

2.2.1. Unsur dan elemen dalam sistem ........................................................ 8

2.2.2. Jenis Sistem ....................................................................................... 9

2.2.3. Ciri-ciri sistem yang baik ................................................................ 10

2.3. Flowchart ............................................................................................... 11

Page 12: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

vii

2.3.1. Jenis-jenis Flowchart ...................................................................... 12

2.4. Text Mining ............................................................................................. 13

2.4.1. Preprocessing .................................................................................. 14

2.5. TF-IDF (Term Frequency – Invers Document Frequency) .................... 15

2.6. Jaccard Similarity .................................................................................. 17

2.7. Bahasa Pemrograman ............................................................................. 18

2.7.1. Tingkatan bahasa program .............................................................. 18

2.7.2. Library ............................................................................................ 19

2.8. Universitas Bumigora ............................................................................. 20

2.8.1. Penerimaan Mahasiswa Baru (PMB) .............................................. 21

BAB III ANALISIS DAN PERANCANGAN SISTEM ................................... 22

3.1. Kebutuhan Penelitian ............................................................................. 22

3.1.1. Data ................................................................................................. 22

3.2. Analisis pre-processing .......................................................................... 25

3.2.1. Case Folding ................................................................................... 26

3.2.2. Tokenizing ....................................................................................... 26

3.2.3. Filtering (Stopword Removal)......................................................... 27

3.2.4. Stemming ......................................................................................... 28

3.3. Analisis proses pembobotan TF-IDF ..................................................... 30

3.4. Analisis proses jaccard similarity .......................................................... 32

3.5. Flowchart sistem penjawab .................................................................... 34

BAB IV HASIL DAN PEMBAHASAN ............................................................ 37

4.1. Persiapan software untuk sistem penjawab ............................................ 37

4.1.1. Instalasi Python ............................................................................... 37

4.1.2. Instalasi library ............................................................................... 40

4.1.3. Penempatan data.............................................................................. 41

4.2. Implementasi pada Python ..................................................................... 41

4.1.1. Preprocessing .................................................................................. 42

4.1.1.1. Case Folding ............................................................................ 42

4.1.1.2. Stemming .................................................................................. 42

4.1.1.3. Filtering ................................................................................... 43

4.1.1.4. Tokenizing ................................................................................ 43

Page 13: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

viii

4.1.2. TF-IDF ............................................................................................ 46

4.1.3. Jaccard Similarity ........................................................................... 48

4.3. Hasil dan output sistem .......................................................................... 49

4.3.1. Output Jawaban ............................................................................... 51

BAB V PENUTUP ............................................................................................... 53

2.1. Kesimpulan ............................................................................................. 53

2.2. Saran ....................................................................................................... 53

REFRENSI .......................................................................................................... 54

Page 14: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

ix

DAFTAR GAMBAR Halaman

Gambar 1.1 Alur proses ................................................................................... 4

Gambar 2.1 simbol flowchart ........................................................................... 12

Gambar 3.1 Brosur UBG.................................................................................. 24

Gambar 3.2 Halaman web UBG ...................................................................... 25

Gambar 3.3 Tahap preprocessing .................................................................... 25

Gambar 3.4 List stopword library sastrawi ...................................................... 27

Gambar 3.5 Flowchart stemming kata ............................................................. 28

Gambar 3.6 Irisan dan Gabungan antara set A dan B ...................................... 33

Gambar 3.7 Flowchart Sistem Penjawab ......................................................... 34

Gambar 3.8 Perulangan pada flowchart ........................................................... 35

Gambar 4.1 Web Python .................................................................................. 37

Gambar 4.2 Installer x64/x86 .......................................................................... 38

Gambar 4.3 Instalasi Python ............................................................................ 38

Gambar 4.4 Proses Instalasi Python ................................................................. 39

Gambar 4.5 Proses instalasi selesai .................................................................. 40

Gambar 4.6 Aplikasi Python ............................................................................ 40

Gambar 4.7 Update pip .................................................................................... 41

Gambar 4.8 Direktori File ................................................................................ 41

Gambar 4.9 Membaca file data pada python ................................................... 41

Gambar 4.10 Nilai tf-idf file 1 ......................................................................... 47

Gambar 4.11 Nilai tf-idf file 2 ......................................................................... 47

Gambar 4.12 Hasil similarity doc 1 dan doc 2 ................................................. 49

Gambar 4.13 Error result ................................................................................. 51

Gambar 4.14 Output Jawaban 1 ....................................................................... 51

Gambar 4.15 Output Jawaban 2 ....................................................................... 52

Page 15: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

x

DAFTAR TABEL Halaman

Tabel 3.1 List FAQs ......................................................................................... 23

Tabel 3.2 Contoh tokenizing ............................................................................ 26

Table 3.3 Matriks TF-IDF................................................................................ 32

Tabel 4.1 Hasil case folding ............................................................................. 42

Tabel 4.2 Hasil stemming ................................................................................. 42

Tabel 4.3 Hasil filtering ................................................................................... 43

Tabel 4.4 Hasil tokenizing ................................................................................ 43

Tabel 4.5 Hasil Preprocessing ......................................................................... 45

Tabel 4.6 Similarity dokumen dengan kata kunci ............................................ 49

Page 16: SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …

xi

DAFTAR LAMPIRAN

Lampiran A Surat Izin Penelitian dan Data rincian Biaya Per Prodi ............... A.1

Lampiran B Hasil Wawancara ......................................................................... B.1

Lampiran C Script Program ............................................................................. C.1