SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …
of 16
/16
Embed Size (px)
Transcript of SISTEM PENJAWAB FAQ FREQUENTLY ASKED QUESTION) …
QUESTION) SEPUTAR UNIVERSITAS BUMIGORA
JACCARD SIMILARITY
QUESTION) SEPUTAR UNIVERSITAS BUMIGORA
JACCARD SIMILARITY
SKRIPSI
Diajukan sebagai salah satu syarat untuk memenuhi kebulatan studi jenjang Strata
Satu (S1) program studi Ilmu Komputer pada Fakultas Teknik Dan Kesehatan
Universitas Bumigora.
QUESTION) SEPUTAR UNIVERSITAS BUMIGORA
JACCARD SIMILARITY
Jenjang Strata Satu (S1) Program Studi Ilmu Komputer
Pada Universitas Bumigora
Seputar Universitas Bumigora Menggunakan metode
Pembobotan TF-IDF dan Jaccard Similarity
NAMA : Rizwan Afandi
Telah diterima dan disetujui sebagai salah satu syarat untuk memperoleh
Gelar Akademik Sarjana Komputer (S.Kom)
Mengetahui
Tanggal Mengetahui: 26/02/2020
QUESTION) SEPUTAR UNIVERSITAS BUMIGORA
JACCARD SIMILARITY
Diajukan sebagai salah satu syaratu untuk memenuhi kebulatan studi jenjang
Strata Satu (S1) Program Studi Ilmu Komputer pada Fakultas Teknik dan
Kesehatan Universitas Bumigora.
NIK: 12.6.165
26/02/2020
26/02/2020
i
KATA PENGANTAR Puji syukur kita panjatkan kehadirat Allah SWT, yang telah memberikan
kesehatan dan keselamatan bagi kita semua dalam menjalankan aktivitas seperti
biasa serta tak lupa shalawat serta salam selalu tercurah kepada Rasulullah
Muhammad SAW. Alhamdulillah, berkat rahmat dan karunia-Nya juga, peneliti
dapat menyelesaikan pengerjaan tugas akhir skripsi dengan judul “Sistem
Penjawab FAQ (Frequently Asked Question) Seputar Universitas Bumigora
Menggunakan Metode Pembobotan TF-IDF dan Jaccard Similarity” dibuat
sebagai salah satu syarat memperoleh gelar sarjana komputer (S.Kom) untuk
Jurusan Ilmu Komputer di Universitas Bumigora.
Bersamaan dengan ini, peneliti ingin mengucapkan terimakasih kepada
pihak-pihak yang telah banyak mendukung dan membantu secara langsung maupun
tidak langsung dalam penyelesaian penelitian skripsi ini. Pada kesempatan ini
peneliti ingin mengucapkan terimakasih kepada :
1. Bapak Dr. Ir. Anthony Anggrawan, M.T., Ph.D selaku Rektor Universitas
Bumigora.
2. Ibu Ni Gusti Ayu Dasriani, M.Kom, selaku Wakil Rektor I Universitas
Bumigora
3. Ibu Lilik Widyawati, M.Kom selaku Ketua Program Studi S1 Ilmu
Komputer.
4. Ibu Suriyati M.Kom selaku Dosen Pembimbing yang selalu memberikan
semangat, motivasi serta arahan yang sangat bermanfaat yang tentunya akan
selalu saya ingat.
5. Kedua orang tua tercinta, yang senantiasa selalu memberikan semangat serta
mendoakan saya sehingga mampu menyelesaikan skripsi saya sampai pada
titik ini.
banyak bantuan dan dukungan kepada saya dalam menyelesaikan penelitian
skripsi ini.
sistem sederhana yang memanfaatkan metode string matching dalam
pemrosesannya yang diharapkan dapat membantu dalam menjawab FAQs secara
otomatis melalui input user. Peneliti berharap skripsi ini dapat memberi manfaat
kepada semua pihak khususnya yang terlibat langsung dalam bidang informatika
dan mengembangkannya menjadi lebih jauh atau dalam bentuk yang berbeda.
Peneliti menyadari bahwa dalam penelitian skripsi ini masih banyak
terdapat kekurangan yang perlu dibenahi, baik itu teknik penelitian maupun
pembahasan yang semata disebabkan oleh keterbatasan ilmu dan pemahaman
peneliti. Oleh karena itu, peneliti mengharapkan segala bentuk saran serta
masukan yang membangun dari berbagai pihak. Semoga skripsi ini dapat
bermanfaat bagi para pembaca untuk mendorong penelitian-penelitian
selanjutnya.
NAMA : Rizwan Afandi
Sistem Penjawab FAQ (Frequently Asked Question) Seputar Universitas
Bumigora Menggunakan Metode Pembobotan TF-IDF dan Jaccard
Similarity
Benar-benar merupakan hasil karya pribadi dan seluruh sumber yang dikutip
maupun dirujuk telah saya nyatakan dengan benar dan apabila dikemudian hari
terdapat penyimpangan dan ketidakbenaran dalam pernyataan ini, maka saya
bersedia menerima sanksi akademik sesuai dengan aturan yang belaku.
Mataram, 13 Agustus 2020
NIM.1610520083
iv
IZIN PENGGUNA Skripsi ini merupakan syarat kelulusan pada Program Studi S1 Ilmu Komputer
Universitas Bumigora, dengan ini peneliti setuju jika skripsi ini digandakan
(diduplikasi) baik sebagian maupun seluruhnya, ataupun dikembangkan untuk
kepentingan akademis yang disetujui oleh pembimbing peneliti, Ketua Program
Studi, Dekan Fakultas Teknik dan Desain.
Untuk dimaklumi, bahwa menduplikasi, mempublikasikan atau menggunakan
skripsi ini, maupun bagian-bagiannya dengan tujuan komersial / keuntungan
finansial, tidak diizinkan tanpa adanya izin tertulis dari Universitas Bumigora. Jika
hal ini dilanggar maka Universitas Bumigora akan memberikan sanksi sesuai
dengan hukum yang berlaku.
Penghargaan akademis terkait isi dari skripsi ini adalah pada peneliti dan
Universitas Bumigora.
Permintaan izin untuk menduplikasi atau menggunakan materi dari skripsi ini baik
sebagian maupun seluruhnya harus ditujukan pada:
Dekan Fakultas Teknik dan Desain
Ketua Program Studi S1 Ilmu Komputer
Universitas Bumigora
v
ABSTRAK
Melimpahnya informasi di media informasi pada era digital saat ini membuat
beberapa orang kesulitan untuk mendapatkan informasi yang sesuai. Hal ini juga
memungkinkan menumpuknya informasi penting yang saling berkaitan tidak bisa
digunakan secara maksimal oleh penggunanya. Sejalan dengan bagian PMB
(Penerimaan Mahasiswa Baru) Universitas Bumigora yang memanfaatkan salah
satu media sosial sebagai sarana komunikasi dengan masyarakat yang ingin
mendaftar ataupun mencari informasi mengenai UBG, tidak jarang masyarakat
menanyakan pertanyaan yang sejenis pada bagian PMB. Banyaknya informasi yang
masuk ke media sosial milik Bumigora tersebut memicu munculnya FAQs
(Frequently Asked Questions) yang merupakan kumpulan pertanyaan yang umum
ditanyakan. Lahirnya FAQs berfungsi sebagai solusi untuk mendapatkan informasi
yang tepat dan sesuai dengan apa yang menjadi masalah bagi pengguna, khususnya
calon mahasiswa baru yang akan mendaftar di Universitas Bumigora. Pencarian
informasi berupa jawaban dari pertanyaan umum seputar Universitas Bumigora
seperti proses daftar, biaya, perkuliahan dan lain-lain bisa diperoleh dengan
bertanya kepada sumber informasi atau membaca dokumen terkait informasi yang
diinginkan tersebut. Sistem penjawab FAQs seputar Universitas Bumigora
bertujuan untuk membantu dalam pencarian jawaban berdasarkan FAQs yang
diterima staf PMB menggunakan salah satu metode similarity measure yakni
jaccard similarity dengan pembobotan kata TF-IDF(Term Frequency-Invers
Document Frequency). Implementasi dari penelitian ini terbatas sampai pada
bentuk sistem saja. Proses similarity menggunakan metode pembobotan TF-IDF
dan jaccard similarity diujicobakan pada 6 dokumen dengan query yang di-input
oleh pengguna dan mendapatkan tingkat akurasi sebesar 54.8%. Persentase ini
diperoleh dari hasil similarity ke-6 dokumen dengan query yang mengandung kata
kunci berbeda.
vi
1.4.1. Tujuan ............................................................................................... 2
1.4.2. Manfaat ............................................................................................. 2
1.5. Metodologi ............................................................................................... 3
1.5.2. Metode Penelitian.............................................................................. 3
2.1. FAQ (Frequently Asked Question) ........................................................... 6
2.1.1. Perkembangan FAQs dalam web desain ........................................... 6
2.1.2. Manfaat FAQ .................................................................................... 6
2.1.3. Membangun FAQ .............................................................................. 7
2.2.2. Jenis Sistem ....................................................................................... 9
2.3. Flowchart ............................................................................................... 11
2.6. Jaccard Similarity .................................................................................. 17
2.7. Bahasa Pemrograman ............................................................................. 18
2.7.2. Library ............................................................................................ 19
BAB III ANALISIS DAN PERANCANGAN SISTEM ................................... 22
3.1. Kebutuhan Penelitian ............................................................................. 22
3.5. Flowchart sistem penjawab .................................................................... 34
BAB IV HASIL DAN PEMBAHASAN ............................................................ 37
4.1. Persiapan software untuk sistem penjawab ............................................ 37
4.1.1. Instalasi Python ............................................................................... 37
4.1.2. Instalasi library ............................................................................... 40
4.1.1. Preprocessing .................................................................................. 42
4.3.1. Output Jawaban ............................................................................... 51
BAB V PENUTUP ............................................................................................... 53
Gambar 3.1 Brosur UBG.................................................................................. 24
Gambar 3.3 Tahap preprocessing .................................................................... 25
Gambar 3.4 List stopword library sastrawi ...................................................... 27
Gambar 3.5 Flowchart stemming kata ............................................................. 28
Gambar 3.6 Irisan dan Gabungan antara set A dan B ...................................... 33
Gambar 3.7 Flowchart Sistem Penjawab ......................................................... 34
Gambar 3.8 Perulangan pada flowchart ........................................................... 35
Gambar 4.1 Web Python .................................................................................. 37
Gambar 4.2 Installer x64/x86 .......................................................................... 38
Gambar 4.3 Instalasi Python ............................................................................ 38
Gambar 4.4 Proses Instalasi Python ................................................................. 39
Gambar 4.5 Proses instalasi selesai .................................................................. 40
Gambar 4.6 Aplikasi Python ............................................................................ 40
Gambar 4.7 Update pip .................................................................................... 41
Gambar 4.8 Direktori File ................................................................................ 41
Gambar 4.9 Membaca file data pada python ................................................... 41
Gambar 4.10 Nilai tf-idf file 1 ......................................................................... 47
Gambar 4.11 Nilai tf-idf file 2 ......................................................................... 47
Gambar 4.12 Hasil similarity doc 1 dan doc 2 ................................................. 49
Gambar 4.13 Error result ................................................................................. 51
Gambar 4.14 Output Jawaban 1 ....................................................................... 51
Gambar 4.15 Output Jawaban 2 ....................................................................... 52
x
Table 3.3 Matriks TF-IDF................................................................................ 32
Tabel 4.2 Hasil stemming ................................................................................. 42
Tabel 4.3 Hasil filtering ................................................................................... 43
Tabel 4.4 Hasil tokenizing ................................................................................ 43
Tabel 4.5 Hasil Preprocessing ......................................................................... 45
Tabel 4.6 Similarity dokumen dengan kata kunci ............................................ 49
xi
DAFTAR LAMPIRAN
Lampiran A Surat Izin Penelitian dan Data rincian Biaya Per Prodi ............... A.1
Lampiran B Hasil Wawancara ......................................................................... B.1
Lampiran C Script Program ............................................................................. C.1
JACCARD SIMILARITY
QUESTION) SEPUTAR UNIVERSITAS BUMIGORA
JACCARD SIMILARITY
SKRIPSI
Diajukan sebagai salah satu syarat untuk memenuhi kebulatan studi jenjang Strata
Satu (S1) program studi Ilmu Komputer pada Fakultas Teknik Dan Kesehatan
Universitas Bumigora.
QUESTION) SEPUTAR UNIVERSITAS BUMIGORA
JACCARD SIMILARITY
Jenjang Strata Satu (S1) Program Studi Ilmu Komputer
Pada Universitas Bumigora
Seputar Universitas Bumigora Menggunakan metode
Pembobotan TF-IDF dan Jaccard Similarity
NAMA : Rizwan Afandi
Telah diterima dan disetujui sebagai salah satu syarat untuk memperoleh
Gelar Akademik Sarjana Komputer (S.Kom)
Mengetahui
Tanggal Mengetahui: 26/02/2020
QUESTION) SEPUTAR UNIVERSITAS BUMIGORA
JACCARD SIMILARITY
Diajukan sebagai salah satu syaratu untuk memenuhi kebulatan studi jenjang
Strata Satu (S1) Program Studi Ilmu Komputer pada Fakultas Teknik dan
Kesehatan Universitas Bumigora.
NIK: 12.6.165
26/02/2020
26/02/2020
i
KATA PENGANTAR Puji syukur kita panjatkan kehadirat Allah SWT, yang telah memberikan
kesehatan dan keselamatan bagi kita semua dalam menjalankan aktivitas seperti
biasa serta tak lupa shalawat serta salam selalu tercurah kepada Rasulullah
Muhammad SAW. Alhamdulillah, berkat rahmat dan karunia-Nya juga, peneliti
dapat menyelesaikan pengerjaan tugas akhir skripsi dengan judul “Sistem
Penjawab FAQ (Frequently Asked Question) Seputar Universitas Bumigora
Menggunakan Metode Pembobotan TF-IDF dan Jaccard Similarity” dibuat
sebagai salah satu syarat memperoleh gelar sarjana komputer (S.Kom) untuk
Jurusan Ilmu Komputer di Universitas Bumigora.
Bersamaan dengan ini, peneliti ingin mengucapkan terimakasih kepada
pihak-pihak yang telah banyak mendukung dan membantu secara langsung maupun
tidak langsung dalam penyelesaian penelitian skripsi ini. Pada kesempatan ini
peneliti ingin mengucapkan terimakasih kepada :
1. Bapak Dr. Ir. Anthony Anggrawan, M.T., Ph.D selaku Rektor Universitas
Bumigora.
2. Ibu Ni Gusti Ayu Dasriani, M.Kom, selaku Wakil Rektor I Universitas
Bumigora
3. Ibu Lilik Widyawati, M.Kom selaku Ketua Program Studi S1 Ilmu
Komputer.
4. Ibu Suriyati M.Kom selaku Dosen Pembimbing yang selalu memberikan
semangat, motivasi serta arahan yang sangat bermanfaat yang tentunya akan
selalu saya ingat.
5. Kedua orang tua tercinta, yang senantiasa selalu memberikan semangat serta
mendoakan saya sehingga mampu menyelesaikan skripsi saya sampai pada
titik ini.
banyak bantuan dan dukungan kepada saya dalam menyelesaikan penelitian
skripsi ini.
sistem sederhana yang memanfaatkan metode string matching dalam
pemrosesannya yang diharapkan dapat membantu dalam menjawab FAQs secara
otomatis melalui input user. Peneliti berharap skripsi ini dapat memberi manfaat
kepada semua pihak khususnya yang terlibat langsung dalam bidang informatika
dan mengembangkannya menjadi lebih jauh atau dalam bentuk yang berbeda.
Peneliti menyadari bahwa dalam penelitian skripsi ini masih banyak
terdapat kekurangan yang perlu dibenahi, baik itu teknik penelitian maupun
pembahasan yang semata disebabkan oleh keterbatasan ilmu dan pemahaman
peneliti. Oleh karena itu, peneliti mengharapkan segala bentuk saran serta
masukan yang membangun dari berbagai pihak. Semoga skripsi ini dapat
bermanfaat bagi para pembaca untuk mendorong penelitian-penelitian
selanjutnya.
NAMA : Rizwan Afandi
Sistem Penjawab FAQ (Frequently Asked Question) Seputar Universitas
Bumigora Menggunakan Metode Pembobotan TF-IDF dan Jaccard
Similarity
Benar-benar merupakan hasil karya pribadi dan seluruh sumber yang dikutip
maupun dirujuk telah saya nyatakan dengan benar dan apabila dikemudian hari
terdapat penyimpangan dan ketidakbenaran dalam pernyataan ini, maka saya
bersedia menerima sanksi akademik sesuai dengan aturan yang belaku.
Mataram, 13 Agustus 2020
NIM.1610520083
iv
IZIN PENGGUNA Skripsi ini merupakan syarat kelulusan pada Program Studi S1 Ilmu Komputer
Universitas Bumigora, dengan ini peneliti setuju jika skripsi ini digandakan
(diduplikasi) baik sebagian maupun seluruhnya, ataupun dikembangkan untuk
kepentingan akademis yang disetujui oleh pembimbing peneliti, Ketua Program
Studi, Dekan Fakultas Teknik dan Desain.
Untuk dimaklumi, bahwa menduplikasi, mempublikasikan atau menggunakan
skripsi ini, maupun bagian-bagiannya dengan tujuan komersial / keuntungan
finansial, tidak diizinkan tanpa adanya izin tertulis dari Universitas Bumigora. Jika
hal ini dilanggar maka Universitas Bumigora akan memberikan sanksi sesuai
dengan hukum yang berlaku.
Penghargaan akademis terkait isi dari skripsi ini adalah pada peneliti dan
Universitas Bumigora.
Permintaan izin untuk menduplikasi atau menggunakan materi dari skripsi ini baik
sebagian maupun seluruhnya harus ditujukan pada:
Dekan Fakultas Teknik dan Desain
Ketua Program Studi S1 Ilmu Komputer
Universitas Bumigora
v
ABSTRAK
Melimpahnya informasi di media informasi pada era digital saat ini membuat
beberapa orang kesulitan untuk mendapatkan informasi yang sesuai. Hal ini juga
memungkinkan menumpuknya informasi penting yang saling berkaitan tidak bisa
digunakan secara maksimal oleh penggunanya. Sejalan dengan bagian PMB
(Penerimaan Mahasiswa Baru) Universitas Bumigora yang memanfaatkan salah
satu media sosial sebagai sarana komunikasi dengan masyarakat yang ingin
mendaftar ataupun mencari informasi mengenai UBG, tidak jarang masyarakat
menanyakan pertanyaan yang sejenis pada bagian PMB. Banyaknya informasi yang
masuk ke media sosial milik Bumigora tersebut memicu munculnya FAQs
(Frequently Asked Questions) yang merupakan kumpulan pertanyaan yang umum
ditanyakan. Lahirnya FAQs berfungsi sebagai solusi untuk mendapatkan informasi
yang tepat dan sesuai dengan apa yang menjadi masalah bagi pengguna, khususnya
calon mahasiswa baru yang akan mendaftar di Universitas Bumigora. Pencarian
informasi berupa jawaban dari pertanyaan umum seputar Universitas Bumigora
seperti proses daftar, biaya, perkuliahan dan lain-lain bisa diperoleh dengan
bertanya kepada sumber informasi atau membaca dokumen terkait informasi yang
diinginkan tersebut. Sistem penjawab FAQs seputar Universitas Bumigora
bertujuan untuk membantu dalam pencarian jawaban berdasarkan FAQs yang
diterima staf PMB menggunakan salah satu metode similarity measure yakni
jaccard similarity dengan pembobotan kata TF-IDF(Term Frequency-Invers
Document Frequency). Implementasi dari penelitian ini terbatas sampai pada
bentuk sistem saja. Proses similarity menggunakan metode pembobotan TF-IDF
dan jaccard similarity diujicobakan pada 6 dokumen dengan query yang di-input
oleh pengguna dan mendapatkan tingkat akurasi sebesar 54.8%. Persentase ini
diperoleh dari hasil similarity ke-6 dokumen dengan query yang mengandung kata
kunci berbeda.
vi
1.4.1. Tujuan ............................................................................................... 2
1.4.2. Manfaat ............................................................................................. 2
1.5. Metodologi ............................................................................................... 3
1.5.2. Metode Penelitian.............................................................................. 3
2.1. FAQ (Frequently Asked Question) ........................................................... 6
2.1.1. Perkembangan FAQs dalam web desain ........................................... 6
2.1.2. Manfaat FAQ .................................................................................... 6
2.1.3. Membangun FAQ .............................................................................. 7
2.2.2. Jenis Sistem ....................................................................................... 9
2.3. Flowchart ............................................................................................... 11
2.6. Jaccard Similarity .................................................................................. 17
2.7. Bahasa Pemrograman ............................................................................. 18
2.7.2. Library ............................................................................................ 19
BAB III ANALISIS DAN PERANCANGAN SISTEM ................................... 22
3.1. Kebutuhan Penelitian ............................................................................. 22
3.5. Flowchart sistem penjawab .................................................................... 34
BAB IV HASIL DAN PEMBAHASAN ............................................................ 37
4.1. Persiapan software untuk sistem penjawab ............................................ 37
4.1.1. Instalasi Python ............................................................................... 37
4.1.2. Instalasi library ............................................................................... 40
4.1.1. Preprocessing .................................................................................. 42
4.3.1. Output Jawaban ............................................................................... 51
BAB V PENUTUP ............................................................................................... 53
Gambar 3.1 Brosur UBG.................................................................................. 24
Gambar 3.3 Tahap preprocessing .................................................................... 25
Gambar 3.4 List stopword library sastrawi ...................................................... 27
Gambar 3.5 Flowchart stemming kata ............................................................. 28
Gambar 3.6 Irisan dan Gabungan antara set A dan B ...................................... 33
Gambar 3.7 Flowchart Sistem Penjawab ......................................................... 34
Gambar 3.8 Perulangan pada flowchart ........................................................... 35
Gambar 4.1 Web Python .................................................................................. 37
Gambar 4.2 Installer x64/x86 .......................................................................... 38
Gambar 4.3 Instalasi Python ............................................................................ 38
Gambar 4.4 Proses Instalasi Python ................................................................. 39
Gambar 4.5 Proses instalasi selesai .................................................................. 40
Gambar 4.6 Aplikasi Python ............................................................................ 40
Gambar 4.7 Update pip .................................................................................... 41
Gambar 4.8 Direktori File ................................................................................ 41
Gambar 4.9 Membaca file data pada python ................................................... 41
Gambar 4.10 Nilai tf-idf file 1 ......................................................................... 47
Gambar 4.11 Nilai tf-idf file 2 ......................................................................... 47
Gambar 4.12 Hasil similarity doc 1 dan doc 2 ................................................. 49
Gambar 4.13 Error result ................................................................................. 51
Gambar 4.14 Output Jawaban 1 ....................................................................... 51
Gambar 4.15 Output Jawaban 2 ....................................................................... 52
x
Table 3.3 Matriks TF-IDF................................................................................ 32
Tabel 4.2 Hasil stemming ................................................................................. 42
Tabel 4.3 Hasil filtering ................................................................................... 43
Tabel 4.4 Hasil tokenizing ................................................................................ 43
Tabel 4.5 Hasil Preprocessing ......................................................................... 45
Tabel 4.6 Similarity dokumen dengan kata kunci ............................................ 49
xi
DAFTAR LAMPIRAN
Lampiran A Surat Izin Penelitian dan Data rincian Biaya Per Prodi ............... A.1
Lampiran B Hasil Wawancara ......................................................................... B.1
Lampiran C Script Program ............................................................................. C.1