PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI,...

106
PERBANDINGAN UNJUK KERJA STRUKTUR DATA LINKEDLIST DAN ARRAY LIST DALAM INVERTED INDEX UNTUK MENDUKUNG SISTEM PEMEROLEHAN INFORMASI JUDUL BUKU KOLEKSI PERPUSTAKAAN Studi Kasus Perpustakaan Universitas Sanata Dharma SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika Diajukan Oleh: Gabriel Indra Widi Tamtama 135314075 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2017 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Transcript of PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI,...

Page 1: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

PERBANDINGAN UNJUK KERJA STRUKTUR DATA

LINKEDLIST DAN ARRAY LIST DALAM INVERTED INDEX

UNTUK MENDUKUNG SISTEM PEMEROLEHAN INFORMASI

JUDUL BUKU KOLEKSI PERPUSTAKAAN

Studi Kasus Perpustakaan Universitas Sanata Dharma

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Teknik Informatika

Diajukan Oleh:

Gabriel Indra Widi Tamtama 135314075

PROGRAM STUDI TEKNIK INFORMATIKA

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2017

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 2: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

i

PERBANDINGAN UNJUK KERJA STRUKTUR DATA

LINKEDLIST DAN ARRAY LIST DALAM INVERTED INDEX

UNTUK MENDUKUNG SISTEM PEMEROLEHAN INFORMASI

JUDUL BUKU KOLEKSI PERPUSTAKAAN

Studi Kasus Perpustakaan Universitas Sanata Dharma

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Teknik Informatika

Diajukan Oleh:

Gabriel Indra Widi Tamtama 135314075

PROGRAM STUDI TEKNIK INFORMATIKA

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2017

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 3: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

ii

COMPARISON OF THE PERFORMANCE OF LINKEDLIST AND

ARRAYLIST DATA STRUCTURE USING INVERTED INDEX TO SUPPORT

INFORMATION RETRIEVAL OF TITLE LIBRARY COLLECTION

Case Study: Sanata Dharma University Library

THESIS

Presented as Partial Fullfilment of the Requirements

To Obtain the Sarjana Komputer Degree

In Informatics Engineering

By:

Gabriel Indra Widi Tamtama 135314075

INFORMATICS ENGINEERING STUDY PROGRAM

DEPARTMENT OF INFORMATICS ENGINEERING

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2017

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 4: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

iii

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 5: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

iv

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 6: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

v

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 7: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

vi

ABSTRAKSI

Perpustakaan merupakan tempat koleksi berbagai macam buku dan

memungkinkan setiap pengunjung untuk membaca dan meminjam buku di

perpustakaan. Tidak dipungkiri bahwa koleksi perpustakaan setiap tahun mengalamai

penambahan koleksi baik jenis buku maupun kategori. Begitu juga dengan

Perpustakaan Universitas Sanata Dharma. Sebelum adanya sistem pencarian judul

buku koleksi perpustakaan, pengunjung sering mengalami kesulitan ketika akan

mencari buku yang diinginkan. Maka untuk memudahkan pencarian buku dibuatlah

sistem pencarian yang mampu mencari judul buku sesuai dengan kebutuhan

pengunjung. Sistem pemerolehan informasi yang dibangun menggunakan struktur

data inverted index dengan arraylist dan linkedlist menawarkan kelebihan dalam

membantu pengunjung untuk mencari judul buku yang diinginkan.

Struktur data inverted index yang dibangun dengan arraylist dan linkedlist

diuji performanya dalam melakukan pencarian judul buku perpustakaan kemudian

dibandingkan hasilnya dengan sistem pencarian yang dimiliki oleh Perpustakaan

Universitas Sanata Dharma. Perbandingan dilakukan dengan membandingkan nilai

relevansi antara sistem pemerolehan informasi dan sistem pencarian yang dimiliki

perpustakaan. Hasil yang didapat yaitu kedua sistem pencarian mampu mencari judul

buku yang diinginkan sesuai dengan kebutuhan pengunjung. Selain itu, ditemukan

perbedaan antara sistem pemerolehan informasi dengan sistem pencarian yang

dimiliki perpustakaan Sanata Dharma.

Kata kunci: inverted index, arraylist, linkedlist, sistem pencarian, perpustakaan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 8: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

vii

ABSTRACT

Library is a book collection place where people can read and borrow book.

There is no doubt of the fact that books collection is increasing, whether it is from the

kinds of the book or the categories. It also happens with Sanata Dharma University

Library. Prior to the existence of the search system to find the collection of the book

from the library, many visitors have difficulties to find the desired book. From that

fact, the researcher designed a system which will help the visitor to find the collection

of the book that suit the needs of the visitor. Information retrieval system which is

made from inverted index data structure with arraylist and linkendlist offers some

advantages to help the visitor to find the desired collection of the book.

Inverted Index data structure which is built from the arraylist and the

linkedlist is tested by the performance and the result is compared with search system

of Sanata Dharma University Library. The comparison is done by comparing the

value of relevance between information acquisition system and search system which

the library has. The result is both of the systems can find the title of the desired book

according to the needs of visitors. Furthermore, the researcher found differences

between the information acquisition system and search system which Sanata Dharma

University Library has.

Keyword: inverted index, arraylist, linkedlist, search engine, library.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 9: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

viii

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 10: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

ix

KATA PENGANTAR

Puji dan syukur saya panjatkan kepada Tuhan Yang Maha Kuasa, karena

berkat kuasa dan rahmat-Nya saya dapat menyelesaikan Tugas Akhir ini dengan

lancar. Tugas akhir merupakan syarat dalam memperoleh gelar sarjana bagi

mahasiswa dan untuk Teknik Informatika untuk memperoleh gelar Sarjana Komputer

(S. Kom).

Tugas akhir ini selesai tak lepas dari bantuan dosen pembimbing, orang tua,

teman seperguruan, dan pihak-pihak lain yang turut membantu. Oleh karena itu,

perkenankan saya selaku penulis mengucapkan terima kasih kepada:

1. Bapak JB. Budi Darmawan, S.T., M.Sc., selaku dosen pembimbing yang

dengan sabar senantiasa memberi masukan dan bimbingan dalam

penyusunan tugas akhir ini.

2. Segenap dosen jurusan Teknik Informatika Universitas Sanata Dharma.

3. Keluarga, Agustinus Sukaryadi (Bapak), Maria Wahyuni (Ibu), dan

Monica Warih Widi Kristanti (Adik) yang selalu memberi dukungan

dalam penyusunan tugas akhir ini.

4. Responden yang membantu dalam pengujian sistem.

5. Teman-teman seperjuangan Teknik Informatika khususnya Arka, Kris,

Kasih, Medi, Windi, Valen, Baptista, Awan, Kris Hendra, Andre, Advent,

Joseph, Adit, Adhi, Ekky, Bagus, Lukas, Rusydi dan teman-teman yang

tidak dapat saya sebutkan satu persatu.

6. Seluruh pihak yang sudah membantu dalam pengerjaan tugas akhir saya

secara langsung maupun tidak langsung.

Saya selaku penulis menyadari bahwa tugas akhir ini masih banyak

kekurangan. Oleh karena itu, besar harapan saya untuk memberikan kritik dan saran

sehingga bisa saya gunakan di masa yang mendatang. Akhir kata semoga karya saya

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 11: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

x

ini dapat digunakan dan bermanfaat bagi civitas akademika Universitas Sanata

Dharma maupun bagi pembaca yang lain.

Yogyakarta, 2017

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 12: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

xi

DAFTAR ISI

HALAMAN PERSETUJUAN ..................................................................................... iii

PERNYATAAN KEASLIAN KARYA ...................................................................... iv

ABSTRAKSI ............................................................................................................... vi

ABSTRACT ................................................................................................................ vii

KATA PENGANTAR ............................................................................................... viii

DAFTAR ISI ................................................................................................................ xi

Daftar Tabel ............................................................................................................... xiv

Daftar Gambar ............................................................................................................. xv

BAB I

PENDAHULUAN ........................................................................................................ 1

1.1 Latar Belakang ............................................................................................... 1

1.2 Rumusan Masalah .......................................................................................... 4

1.3 Tujuan ............................................................................................................. 4

1.4 Batasan Masalah ............................................................................................. 5

1.5 Sistematika Penulisan ..................................................................................... 5

BAB II

TINJAUAN PUSTAKA ............................................................................................... 7

2.1 Pemerolehan Informasi ................................................................................... 7

2.2 Logical View Pada Document ........................................................................ 8

2.2.1 Stopwords ................................................................................................ 9

2.2.2 Stemming ................................................................................................. 9

2.3 Inverted Index ............................................................................................... 11

2.4 Pembobotan TF-IDF ..................................................................................... 15

2.5 Struktur Data ................................................................................................ 16

2.5 Precision dan Recall ..................................................................................... 17

BAB III METODOLOGI PENELITIAN.................................................................... 18

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 13: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

xii

3.1 Gambaran Umum Penelitian ........................................................................ 18

3.2 Sumber Data ................................................................................................. 18

3.3 Spesifikasi Alat ............................................................................................. 18

3.4 Perbandingan Struktur Data ......................................................................... 19

3.5 Tahap-Tahap Penelitian .................................................................................... 20

BAB IV

ANALISA DAN PERANCANGAN SISTEM ........................................................... 23

4.1 Analisa Sistem .............................................................................................. 23

4.2 Analisis Kebutuhan Pengguna ...................................................................... 25

4.3 Perancangan Sistem ...................................................................................... 27

4.4 Rancangan Struktur Data Inverted Index ..................................................... 33

4.5 Algoritma pencarian dengan operator AND................................................. 34

4.6 Rancangan Basis Data .................................................................................. 34

4.7 Rancangan Desain Antarmuka ..................................................................... 37

BAB V

IMPLEMENTASI DAN ANALISIS HASIL ............................................................. 39

5.1 Spesifikasi Software dan Hardware ............................................................. 39

5.2 Implementasi Antar Muka (Interface) .......................................................... 40

5.3 Implementasi Stemming ............................................................................... 41

5.4 Implementasi inverted index ........................................................................ 41

5.5 Pengujian dan Analisa Hasil ....................................................................... 42

5.6 Perbandingan Relevansi Hasil Pencarian Judul Buku ................................. 42

5.7 Perbandingan Rata-Rata Precision Sistem Pemerolehan Informasi dengan

Sistem Pencarian Perpustakaan Sanata Dharma ..................................................... 48

5.8 Perbandingan Kecepatan Struktur Data Linked List dan Array List ................. 50

BAB VI

KESIMPULAN DAN SARAN ................................................................................... 52

DAFTAR PUSTAKA ................................................................................................. 54

Lampiran ..................................................................................................................... 56

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 14: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

xiii

Lampiran I ............................................................................................................... 56

Lampiran II.............................................................................................................. 59

Lampiran III ............................................................................................................ 71

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 15: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

xiv

Daftar Tabel

Tabel 4. 1 Tabel buku_perpus ..................................................................................... 34

Tabel 4. 2 Table Terms ............................................................................................... 35

Tabel 4. 3 Tabel Sourceterm ....................................................................................... 35

Tabel 4. 4 Tabel Posting.............................................................................................. 36

Tabel 4. 5 Tabel posting_stopword ............................................................................. 36

Tabel 4. 6 Tabel stopwords ......................................................................................... 37

Tabel 5. 7 recall and precision ................................................................................... 46

Tabel 5. 8 precision dalam 11 titik recall ................................................................... 47

Tabel 5. 10 Perbedaan waktu pencarian ArrayList dan Linkedlist ............................. 50

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 16: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

xv

Daftar Gambar

Gambar 2. 1 Proses Pemerolehan Informasi (Baeza-Yates, 1999) ............................... 7

Gambar 2. 2 Logical view ............................................................................................. 8

Gambar 2. 3 Inverted index (Manning, 2008) ............................................................. 12

Gambar 2. 4 Membangun inverted index (Manning, 2008) ........................................ 13

Gambar 2. 5 Intersection posting list (Manning, 2008) .............................................. 14

Gambar 2. 7 Linked list (Robert, 2003) ...................................................................... 17

Gambar 3. 1 Linked List .............................................................................................. 19

Gambar 3. 2 Array List ............................................................................................... 19

Gambar 3. 3 Metode waterfall (Pressman & Roger(2001)) ........................................ 21

Gambar 4. 1 LinkedList ............................................................................................... 23

Gambar 4. 2 Struktur Pemerolehan Informasi (Nazief & Andriani, 1996) ................. 24

Gambar 4. 3 Use Case Diagram ................................................................................. 25

Gambar 4. 4 Desain Kelas Analisis ............................................................................ 28

Gambar 4. 5 Entity Relationship Diagram .................................................................. 30

Gambar 4. 6 Logical design ........................................................................................ 32

Gambar 4. 7 Representasi Inverted Index ................................................................... 33

Gambar 4. 8 Halaman awal ......................................................................................... 37

Gambar 4. 9 Halaman hasil ......................................................................................... 38

Gambar 5. 1 Tampilan Awal ....................................................................................... 40

Gambar 5. 2 Halaman Hasil Pencarian ....................................................................... 40

Gambar 5. 4 Inverted index ......................................................................................... 41

Gambar 5. 5 Grafik precision dalam 11 titik recall .................................................... 73

Gambar 5. 6 Grafik precision dalam 11 titik recall ................................................... 44

Gambar 5. 7 Grafik precision dalam 11 titik recall .................................................... 46

Gambar 5. 8 Grafik precision dalam 11 titik recall .................................................... 48

Gambar 5. 9 Grafik relevansi sistem pencarian dan pemerolehan informasi ............. 49

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 17: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Perpustakaan merupakan tempat koleksi buku-buku dan

memungkinkan orang untuk bisa membaca maupun meminjam buku di

perpustakaan. Buku-buku yang dikoleksi pun beraneka ragam jenis dan

kategori seperti pendidikan, kuliner, artikel, teknologi, agama dan jurnal.

Buku-buku yang dikoleksi ditempatkan sesuai dengan pengkategorian dan

jenis buku tersebut sehingga tidak jarang orang mengalami kesulitan ketika

mencari buku tersebut.

Secara konkrit, perpustakaan didefinisikan sebagai unit kesatuan dari

sebuah lembaga pendidikan yang berupa tempat penyimpanan koleksi buku-

buku pustaka. Ada beberapa jenis perpustakaan berdasarkan fungsi dan

tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan

umum, perpustakaan perguruan tinggi, perpustakaan sekolah, perpustakaan

khusus, perpustakaan keagamaan, perpustakaan internasional, perpustakaan

pribadi dan perpustakaan digital.

Seiring dengan kemajuan dan perkembangan teknologi informasi dan

komunikasi, maka keinginan orang untuk mendapat pengetahuan harus

semakin cepat dan ringkas. Namun, seringkali pengunjung perpustakaan

sering kehabisan waktu untuk mencari buku yang akan dibaca sehingga di

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 18: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

2

perpustakaan dibutuhkan suatu layanan yang dapat memberikan

kemudahan dalam menelusuri informasi tentang suatu buku dengan cepat,

ringkas, mudah dan efisien. Perpustakaan dituntut untuk bisa menyesuaikan

diri dengan perkembangan dan kemajuan teknologi dan mampu

menerapkannya untuk mendukung proses pencarian judul buku.

Perpustakaan perlu mengorganisasikan kembali koleksi dan informasi

yang ada dengan cara menciptakan katalog dan indeks dalam format web

sehingga bisa ditelusuri informasi yang ada dengan mudah.

Pemerolehan informasi (information retrieval) menjadi alternatif dan

memberikan kemudahan dalam mencari judul buku dalam web perpustakaan

karena mampu mencari dan mencocokkan kata kunci yang dimasukkan oleh

pengguna. Pemerolehan informasi merupakan salah satu bidang ilmu

komputer yang berhubungan dengan pengambilan informasi dari dokumen-

dokumen yang disimpan dalam basis data. Informasi atau data yang dicari

dapat berupa berupa teks, gambar, audio, video dan lain-lain. Koleksi data

teks yang dapat dijadikan sumber pencarian juga dapat berupa pesan teks,

seperti e-mail, fax, dan dokumen berita, bahkan dokumen yang beredar di

internet. Dengan jumlah dokumen koleksi yang besar sebagai sumber

pencarian, maka dibutuhkan suatu sistem yang dapat membantu user

menemukan buku yang sesuai dalam waktu yang efisien.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 19: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

3

Inverted index terbukti efisien dalam menjawab query dan diterapkan

pada kebanyakan sistem pemerolehan informasi berbasis web (Baeza-Yates,

2009).

Penelitian yang berkaitan dengan pemerolehan informasi sudah pernah

dilakukan oleh Puspitaningrum (2011) tentang pemerolehan informasi pada

undang-undang dengan menerapkan struktur data inverted index yang

bertujuan untuk mencari pasal-pasal dalam perundang-undangan.

Struktur data yang menjadi perhatian penulis adalah struktur data

array list dan linkedlist. Kedua struktur data tersebut sama-sama dapat

digunakan untuk membuat inverted index berdasarkan indexing dokumen.

Tujuan dari membandingkan kedua struktur data tersebut adalah mencari

keefisien pencarian yang diukur dengan kecepatan pencarian dalam mencari

judul buku koleksi perpustakaan Universitas Sanata Dharma. Alasan lain

penulis membandingkan dengan website perpustakaan Universitas Sanata

Dharma karena penulis ingin mengetahui bila pencarian judul buku

perpustakaan menggunakan model pemerolehan informasi jauh lebih baik

atau tidak dari sistem yang ada sekarang.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 20: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

4

1.2 Rumusan Masalah

- Bagaimana hasil unjuk kerja kecepatan sistem pemerolehan informasi

yang dibangun menggunakan struktur data arraylist dan linkedlist

dalam inverted index untuk pencarian judul buku perpustakaan

Universitas Sanata Dharma menggunakan operator AND?

1.3 Tujuan

Tujuan dari tugas akhir ini adalah:

- Mengetahui hasil unjuk kerja kecepatan sistem pemerolehan informasi

yang dibangun menggunakan struktur data arraylist dan linkedlist

dalam inverted index untuk pencarian judul buku perpustakaan

Universitas Sanata Dharma menggunakan operator AND.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 21: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

5

1.4 Batasan Masalah

Batasan-batasan masalah yang dijadikan dalam penulisan tugas akhir

adalah sebagai berikut :

- Pencarian berdasarkan judul buku dan kata kunci (query).

- Judul buku disimpan dalam basis data yang sama.

- Jumlah data yang disimpan sama.

- Perbedaan terletak pada penerapan struktur data array list dan

linkedlist.

1.5 Sistematika Penulisan

Untuk memudahkan penulisan tugas akhir, maka sistematika penulisan

dibagi menjadi lima bagian yaitu:

Bab I Pendahuluan

Bab ini berisi latar belakang, rumusan masalah, tujuan, batasan

masalah dan sistematika penulisan.

Bab II Tinjauan Pustaka

Bab ini berisi mengenai landasan teori berupa konsep dasar

pemerolehan informasi, struktur data, algoritma dan pengertian TF-

IDF.

Bab III Metodologi Penelitian

Bab ini berisi tentang metode penelitian yang akan digunakan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 22: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

6

Bab IV Perancangan dan Analisis Kebutuhan Sistem

Bab ini berisi penelitian yang dilakukan disertai dengan

pembahasan yang didapat setelah melakukan penelitian.

Bab V Implementasi dan Analisa Hasil

Bab ini berisi implementasi sistem yang telah dibuat beserta

analisis hasil yang diperoleh dari pengujian sistem.

Bab VI Kesimpulan dan Saran

Bab ini berisi mengenai kesimpulan dan saran yang didapat

setelah menyelesaikan tugas akhir.

DAFTAR PUSTAKA

LAMPIRAN

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 23: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

7

BAB II

TINJAUAN PUSTAKA

2.1 Pemerolehan Informasi

Pemerolehan informasi merupakan sistem untuk menemukan kembali

informasi-informasi yang berguna dan relevan terhadap kebutuhan pengguna

dari suatu kumpulan informasi secara otomatis. Mesin pencari atau search

engine merupakan salah satu contoh penerapan pemerolehan informasi

(Hasibuan & Andri, 2001).

Ingwersen (1992) mengartikan bahwa pemerolehan informasi

merupakan proses yang terlibat dalam representation, storage, pencarian, dan

mendapatkan informasi yang relevan untuk kebutuhan yang diperlukan

pengguna. Tipe dari informasi tersebut bisa berupa dokumen, halaman web,

katalog online, dan objek multimedia. Seiring dengan perkembangan

teknologi, pemerolehan informasi sudah melibatkan pemodelan, pencarian

web, visualisasi data, penyaringan dan bahasa dalam memperoleh informasi

yang relevan (Baeza-Yates, 1999).

Tahap-tahap pemerolehan informasi menurut Baeza-Yates (1999)

disajikan dalam Gambar 2.1 berikut ini:

Gambar 2. 1 Proses Pemerolehan Informasi (Baeza-Yates, 1999)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 24: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

8

Terdapat lima (5) langkah dalam proses pemerolehan informasi yang

dijelaskan melalui Gambar 2.1. Tahap pertama yaitu text operation yakni

menghilangkan kata umum (stop words removal), pencarian kata dasar

(stemming), dan sebagainya. Sebagai contoh kata umum dalam bahasa

Indonesia adalah dan, di, ini, itu, yang, dan lain-lain.

Tahap kedua adalah query operations seperti penggunaan operator

AND, OR, dan NOT pada query. Tahap ketiga yaitu pengindeksan yang

bertujuan untuk mempercepat proses pencarian. Tahap keempat yaitu

pencarian yang dilakukan pada inverted file yang sudah dibangun. Tahap

kelima adalah pembobotan (ranking) terhadap dokumen yang diperoleh dari

proses pencarian.

2.2 Logical View Pada Document

Dokumen-dokumen pada koleksi tertentu sering digambarkan secara

langsung melalui keyword (kata kunci). Kata kunci tersebut diekstraksi

langsung dari teks pada dokumen atau dibuat secara manual oleh manusia.

Kata kunci atau index term ini menyediakan logical view dari dokumen.

Logical view dokumen merupakan gambaran proses dalam

membangun suatu rangkaian teks dalam dokumen. Untuk lebih jelas dalam

memahami logical view pada dokumen dari bentuk full text menjadi indexing

dapat dilihat pada Gambar 2.2 berikut ini:

Gambar 2. 2 Logical view

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 25: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

9

2.2.1 Stopwords

Merupakan kata umum yang biasanya muncul dalam jumlah

besar dan dianggap tidak memiliki makna. Stopwords perlu dieliminasi

dengan tujuan mengurangi waktu eksekusi query. Cara mengeliminasi

stopwords yaitu menghindari proses list yang panjang (Büttcher-

Clarke-Cormark, 2010), sehingga pengolahan teks (text processing)

akan berhenti ketika menemukan stopwords dan langsung

mengeliminasinya. Tujuan dari eliminasi stopwords adalah

mengurangi ukuran indeks, meningkatkan efisiensi dan keefektifan

dari pemerolehan informasi (Croft-Metzler-Strohman, 2010).

Beberapa kata yang termasuk dalam stopwords yaitu “the”, “a”,

“an”, “that”, “those”. Sedangkan dalam bahasa Indonesia, contoh kata

yang termasuk stopwords yaitu kata ganti orang (“dia”, “mereka”,

“beliau”, “kami”), kata penghubung (“lalu”, “namun”, “padahal”)

(Oktaviani, 2011).

2.2.2 Stemming

Stemming merupakan proses untuk menghilangkan prefik dan

sufik suatu kata bentukan menjadi kata dasar (Nazief & Adriani,

1996). Dalam pemerolehan informasi, stemming sangat diperlukan

untuk meningkatkan performa pemerolehan informasi dengan cara

mentranformasi kata-kata dalam sebuah dokumen teks menjadi kata

dasar.

Nazief & Adriani (1996) menggambarkan kata dasar Bahasa

Indonesia terdiri dari kombinasi berikut:

Prefiks 1+Prefiks 2+ kata dasar + Sufiks 3+Sufiks 2+Sufiks 1 ….(2.1)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 26: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

10

Algoritma stemming yang dibuat oleh Bobby Nazief dan Mirna

Adriani adalah sebagai berikut:

1. Cari kata yang akan di-stem dalam kamus kata dasar. Bila ditemukan

maka kata tersebut adalah kata dasar, maka algoritma berhenti.

2. Inflection Suffixes (“-lah”, “-kah”, “-ku”, “-mu”, atau “-nya”)

dibuang. Jika berupa particles (“-lah”, “-kah”, “-tah” atau “-pun”)

maka langkah ini diulangi lagi untuk menghapus possesive pronouns

(“-ku”, “-mu”, atau “-nya”).

3. Hapus Derivation Suffix (“-i”, “-an”, atau “-kan”). Jika kata

ditemukan dalam kamus maka algoritma berhenti, jika tidak maka

diteruskan ke langkah 3a.

a. Jika “-an” telah dihapus dan huruf terakhir adalah “-k” maka “-

k” juga dihapus. Jika ditemukan dalam kamus maka algoritma

berhenti. Jika tidak ditemukan maka menuju langkah 3b.

b. Akhiran yang dihapus (“-i”, “-an”, atau “-kan”) akan

dikembalikan dan selanjutnya masuk langkah 4.

4. Hilangkan Derivation Prefix (“di-“, “ke-“, “se-”,“me-”, “be-”,“pe”,

“te-”). Jika pada langkah 3 ada sufiks yang dihapus maka masuk

langkah 4a, jika tidak, lanjut ke langkah 4b.

a. Periksa tabel kombinasi awalan-akhiran yang tidak diijinkan.

Jika ditemukan maka algoritma berhenti, jika tidak lanjut ke

langkah 4b.

b. For i = 1 to 3, tentukan tipe awalan kemudian hapus awalan.

Jika kata dasar belum juga ditemukan lakukan langkah 5, jika

sudah maka algoritma berhenti.

Catatan: jika awalan kedua sama dengan awalan pertama maka

algoritma berhenti.

5. Melakukan recording. Recording dilakukan dengan menambahkan

karakter recording di awal kata yang dipenggal.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 27: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

11

6. Jika langkah 1-5 sudah dilalui namun tidak membuahkan hasil, maka

kata awal diasumsikan sebagai kata dasar.

Terdapat juga beberapa aturan sebagai berikut:

1. Aturan reduplikasi

a. Jika kedua kata yang dihubungkan oleh kata penghubung

adalah kata yang sama maka kata dasarnya adalah bentuk

tunggalnya. Contoh “mata-mata” maka kata dasarnya adalah

“mata”.

b. Misalkan ada kata “bolak-balik”, “berbalas-balasan” maka

untuk mendapatkan kata dasarnya harus mengartikan kedua

kata secara terpisah. Jika kedua kata memiliki kata dasar yang

sama maka diubah menjadi bentuk tunggal. Contoh kata

“berbalas-balasan” terdiri dari kata “berbalas” dan “balasan”

yang memiliki kata dasar sama yaitu “balas”. Sedangkan pada

kata “bolak-balik” memiliki kata dasar yang berbeda maka

“bolak-balik” adalah kata dasar.

2. Tambahan bentuk awalan dan akhiran serta aturannya:

a. Setiap tipe awalan “mem-“, kata yang diawali dengan

awalan “memp-” memiliki tipe awalan “mem-”.

b. Tipe awalan “meng-“, kata yang diawali dengan awalan

“mengk-” memiliki tipe awalan “meng-”.

2.3 Inverted Index

Inverted index atau inverted file merupakan struktur data pokok yang

terdapat dalam sistem pemerolehan informasi (Büttcher-Clarke-Cormark,

2010). Tujuan adanya inverted index adalah untuk mempercepat proses

pencarian terms pada koleksi dokumen (Grossman-Frieder, 2004).

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 28: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

12

Inverted index memiliki dua komponen pokok yaitu dictionary dan

posting lists. Dictionary menyimpan daftar kata, sedangkan posting list

menyimpan identitas dokumen yang mengandung kata bersangkutan.

Contoh melakukan pengindeksan terhadap dokumen-dokumen yang

mengandung istilah tertentu dengan membuat inverted index yang terdiri dari

dictionary dan postings digambarkan pada gambar 2.3 berikut:

Gambar 2. 3 Inverted index (Manning, 2008)

Pada gambar 2.4 berikut merupakan gambaran secara keseluruhan dari

proses membangun inverted index (Manning, 2008):

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 29: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

13

Gambar 2. 4 Membangun inverted index (Manning, 2008)

Di sebelah kiri pada gambar 2.4, terdapat beberapa istilah yang

disimpan

dalam kolom term dan diurutkan sesuai abjad. Di sebelah kolom term terdapat

kolom docID yang menunjukkan dokumen yang mengandung term tersebut.

Sebelah kanan pada gambar 2.4 menjelaskan bahwa istilah yang terdapat pada

kolom term dan docID dipisah ke dalam kolom term beserta doc. freq

(document frequency) dan disimpan dalam dictionary.

Dictionary berfungsi untuk menyimpan istilah-istilah dan mempunyai

pointer untuk menuju ke posting list pada setiap istilah. Sedangkan posting

list berfungsi untuk menyimpan list dari dokumen yang mengandung istilah

tertentu (Manning, 2008).

Misalkan mencari query AND dengan contoh “Brutus AND

Calpurnia”, maka langkah-langkahnya adalah sebagai berikut:

1. Temukan lokasi Brutus dalam Dictionary.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 30: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

14

2. Dapatkan posting list milik Brutus.

3. Temukan lokasi Calpurnia dalam Dictionary.

4. Dapatkan posting list milik Calpurnia.

5. Lakukan interseksi kedua dokumen yang hanya

mengandung kedua posting list tersebut.

Interseksi atau operasi pemotongan sangat penting untuk bisa

mendapatkan dokumen yang mengandung istilah dari kedua posting list

(Brutus dan Calpurnia) dengan cepat. Interseksi ini digambarkan dalam

gambar 2.5 berikut:

Gambar 2. 5 Intersection posting list (Manning, 2008)

Berikut ini merupakan algoritma untuk melakukan pemotongan kedua

posting list pada gambar 2.5 (Manning, 2008):

INTERSECT (p1,p2)

1. answer ← ( )

2. while p1 ≠ NIL and p2 ≠ NIL

3. do if docID(p1) = docID(p2)

4. then ADD(answer, docID(p1))

5. p1 ← next(p1)

6. p2 ← next(p2)

7. else if docID(p1) < docID(p2)

8. then p1 ← next(p1)

9. else p2 ← next(p2)

10. return answer

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 31: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

15

2.4 Pembobotan TF-IDF

Term Frequency (TF) dan Inverse Document Frequency (IDF)

merupakan skema pembobotan yang populer pada pemerolehan informasi

(Baeza-Yates, 1999). Metode TF-IDF merupakan metode untuk menghitung

bobot setiap kata yang paling umum digunakan.

Savoy (1993) merumuskan pembobotan TF-IDF sebagai berikut:

Wij = ntfij * nidfj …………(2.2)

dimana

dan

…………(2.3)

Keterangan:

- Wij adalah bobot istilah pada Tj pada dokumen Di.

- tfij adalah frekuensi dari Tj dalam dokumen Di.

- m adalah jumlah dokumen Di.

- dfj adalah jumlah dokumen yang mengandung istilah Tj.

- Max tfi merupakan frekuensi terbesar pada satu dokumen.

Pada teknik ini, bobot istilah sudah dalam keadaan dinormalisasi.

Penentuan bobot ditentukan dari jumlah frekuensi kemunculan istilah di satu

dokumen dan frekuensi terbesar pada suatu istilah yang dimiliki dokumen

bersangkutan. Jumlah dokumen pun diperhitungkan dalam teknik pembobotan

TF-IDF untuk mengetahui posisi relatif bobot istilah yang bersangkutan pada

suatu dokumen dibandingkan dengan dokumen-dokumen lain yang memiliki

istilah yang sama. Oleh karena itu, jika sebuah istilah memiliki jumlah

frekuensi kemunculan yang sama pada dua dokumen maka nilai bobotnya

belum tentu sama (Hasibuan, 2001).

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 32: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

16

2.5 Struktur Data

Sebelum lebih lanjut berbicara tentang arraylist terlebih dahulu

membahas mengenai array. Array merupakan sekelompok variable (disebut

elemen atau komponen) yang memiliki nilai dan bertipe sama. Namun, array

tidak mendukung untuk mengubah ukuran kapasitas secara otomatis (Deitel,

2012). Maka, untuk memberi solusi permasalahan pada array tersebut

dikembangkan struktur data yaitu ArrayList.

ArrayList merupakan implementasi dari sebuah array dalam suatu list.

ArrayList memiliki sifat fleksibel dan dapat ditingkatkan kapasitas

penyimpanannya secara otomatis. ArrayList memungkinkan untuk mengakses

elemen-elemennya secara acak dalam waktu yang bersamaan.

Gambar 2. 6 Array

Linked list adalah suatu bentuk struktur data, berisi kumpulan data

(node) yang terhubung secara sekuensial, saling sambung menyambung,

dinamis, dan terbatas. Ukuran linked list menjadi dinamis karena

menyesuaikan jumlah node yang dimasukkan kedalam rantai node (Robert,

2003). Linked list pertama kali dikembangkan oleh Allen Newell, Cliff Shaw

dan Herbert Simon di RAND Corporation pada tahun 1955-1956 sebagai

struktur data utama untuk bahasa Information Processing Language (IPL).

Dalam linked list, setiap data terhubung dalam sebuah link. Setiap link

objek mengandung referensi (biasa disebut next) pada setiap link selanjutnya.

Gambar 2.7 menggambarkan pengertian dari linked list (Robert, 2003):

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 33: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

17

Gambar 2. 7 Linked list (Robert, 2003)

Data yang satu terhubung pada link yang lain sehingga membentuk

seperti suatu rantai.

2.5 Precision dan Recall

Dalam pemerolehan informasi, keakurasian perlu diukur dan

dianalisis. Untuk menganalisis keakurasian diperlukan precision dan recall.

Recall adalah istilah yang digunakan untuk dokumen terpanggil yang relevan

dengan query yang dimasukkan pengguna dalam pemerolehan informasi.

Precision adalah jumlah dokumen relevan dari total jumlah dokumen yang

ditemukan oleh sistem.

Precision dan recall dirumuskan sebagai berikut (Manning, 2008):

Precision=

……....(2.4)

Recall =

.……(2.5)

Interpolasi = …………..(2.6)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 34: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

18

BAB III

METODOLOGI PENELITIAN

3.1 Gambaran Umum Penelitian

Penelitian ini dilakukan untuk membandingkan kecepatan struktur

data arraylist dan linked list. Objek yang menjadi penelitian adalah judul buku

koleksi perpustakaan Universitas Sanata Dharma. Diharapkan penelitian ini

bermanfaat bagi pihak perpustakaan maupun pihak mahasiswa yang akan

mencari buku-buku yang dikoleksi oleh perpustakaan Universitas Sanata

Dharma.

3.2 Sumber Data

Sumber data berasal perpustakaan Universitas Sanata Dharma. Data

yang diambil berupa judul buku yang merupakan koleksi dari perpustakaan

Universitas Sanata Dharma.

Teknik pengumpulan data dilakukan dengan survey di perpustakaan

Universitas Sanata Dharma dan melakukan wawancara dengan berbagai pihak

pengelola perpustakaan.

3.3 Spesifikasi Alat

Sistem dibuat dengan minimal spesifikasi software dan hardware

sebagai berikut:

a. Spesifikasi hardware:

- Processor Intel Core i-5 4200U CPU @ 1.60 GHz 2.30 GHz

- RAM 4 GB

- Hard Disk Drive 500 GB

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 35: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

19

b. Spesifikasi software:

- Windows 10 Pro 64 bit Operating System

- Compiler IDE NetBeans 8.0

- Oracle Database

3.4 Perbandingan Struktur Data

Struktur data yang akan dibandingkan oleh peneliti adalah struktur

data inverted index dengan menggunakan arraylist dan linked list. Struktur

data inverted index akan dijelaskan lebih lanjut pada bab 4. Adapun gambar

mengenai arraylist dan linkedlist ditampilkan pada gambar 2.8 dan 2.9 berikut

ini:

Gambar 3. 1 Linked List

Dibandingkan dengan:

Gambar 3. 2 Array List

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 36: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

20

3.5 Tahap-Tahap Penelitian

3.5.1 Studi Kasus

Kasus yang akan dipelajari adalah kebiasaan pengunjung

perpustakaan dalam memasukkan kata kunci pada saat melakukan

pencarian buku di perpustakaan Universitas Sanata Dharma.

3.5.2 Studi Pustaka

Studi pustaka yang dilakukan adalah mencari dan memahami

informasi-informasi beserta teori yang berkaitan dengan materi

pemerolehan informasi maupun struktur data. Dalam penelitian ini,

penulis mempelajari literatur yang berkaitan dengan struktur data

arraylist dan linked list yang keduanya sama-sama dapat digunakan

untuk membuat inverted index. Literature yang dipelajari akan

membantu peneliti untuk membangun sistem pencarian judul buku

perpustakaan Universitas Sanata Dharma.

3.5.3 Pengembangan Perangkat Lunak

3.5.3.1 Metode Pengembangan Perangkat Lunak

Metode yang digunakan peneliti dalam

mengembangkan perangkat lunak adalah waterfall. Pressman

& Roger (2001) menuturkan bahwa metode waterfall

merupakan metode pengembangan perangkat lunak yang

dilakukan secara berurutan, dan kemajuan dipantau secara

terus menerus mengalir ke bawah. Fase-fase yang dilalui dalam

pengembangan perangkat lunak metode waterfall yaitu

perencanaan, pemodelan, implementasi, dan pengujian.

Gambar 3.5.3 menggambarkan alur proses dari metode

waterfall dan disajikan seperti berikut ini:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 37: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

21

Gambar 3. 3 Metode waterfall (Pressman & Roger(2001))

Ada lima tahap yang digunakan dalam metode

waterfall yaitu:

a. Analisa

Langkah ini merupakan analisa terhadap kebutuhan sistem.

Pengumpulan data dalam tahap ini bisa melalui wawancara,

studi literatur, dan studi kasus. Wawancara yang dilakukan

adalah mewawancarai pengunjung perpustakaan.

Wawancara digunakan untuk mencari informasi sebanyak

mungkin dari pengguna sehingga sistem pencarian yang

dibuat sesuai dengan kebutuhan pengguna.

b. Design

Proses design adalah proses mengubah hasil analisa

menjadi representasi kebutuhan perangkat lunak yang dapat

diprediksi bentuk dan fungsinya sebelum diubah ke dalam

bahasa pemrograman. Titik fokus pada proses ini terletak

pada struktur data, arsitektur perangkat lunak, tampilan

user interface, dan algoritma.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 38: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

22

c. Implementasi (Coding)

Coding merupakan proses penerjemahan dari desain ke

dalam bahasa pemrograman. Dalam tahap ini, programmer

akan membangun sistem yang dibutuhkan oleh pengguna.

d. Testing (Pengujian)

Testing merupakan tahap yang dilalui setelah pengkodean

selesai. Tujuan dari pengujian adalah menguji kemampuan

dan performa dari sistem yang telah dibangun. Selain itu,

pengujian juga bermanfaat untuk menemukan kesalahan

maupun error yang kemungkinan masih dapat ditemukan

dan selanjutnya dilakukan perbaikan.

e. Pemeliharaan

Merupakan tahap akhir dari metode waterfall. Sistem yang

sudah selesai dibangun dan melewati beberapa tahap

kemudian dijalankan dan dilakukan pemeliharaan.

Pemeliharaan yang dimaksud adalah meningkatkan

performa dan perbaikan fitur-fitur yang mungkin masih

bisa terjadi error.

f. Analisis Hasil

Hasil pencarian judul buku yang ditemukan dari sistem

pemerolehan informasi dengan sistem pencarian

perpustakaan minimal sama. Selanjutnya adalah menguji

unjuk kerja struktur data inverted index yang dibangun

menggunakan arraylist dan linkedlist.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 39: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

23

BAB IV

ANALISA DAN PERANCANGAN SISTEM

4.1 Analisa Sistem

4.1.1 Analisis Kerja ArrayList dan Linkedlist

Cara Kerja Linked List

Linked list merupakan struktur data yang memungkinkan untuk

menyimpan obyek. Obyek yang dimaksud adalah obyek yang

mengimplementasikan antarmuka dari list tersebut. Obyek tersebut disimpan

dalam bentuk elemen-elemen. Elemen-elemen tersebut saling terhubung

dalam suatu reference yang disebut dengan link. Gambar 4.1 berikut

memudahkan dalam pemahaman mengenai linked list.

Gambar 4. 1 LinkedList

Linked list mendukung berbagai metode berbasis indeks seperti get

dan indexOf. Indeks selalu dimulai dari angka nol (0) sehingga bila terdapat

tiga elemen, maka elemen pertama terletak pada indeks nol (0), elemen kedua

pada indeks pertama (1) dan begitu seterusnya (Collins, 2001).

Cara Kerja ArrayList

ArrayList dapat dikatakan sebagai perbaikan dari satu dimensi array.

Seperti array, kelas ArrayList mendukung akses semua elemennya secara

acak. Artinya, semua elemen dapat diakses dalam waktu yang sangat singkat

dan setiap elemen mempunyai indeks. Tidak seperti array, ukuran obyek

dalam ArrayList secara otomatis dipertahankan selama eksekusi program.

Ukuran default arraylist adalah 10 (sepuluh) dan ketika penuh maka akan

mengalamai penggembungan ukuran dengan cara kapasitas yang lama

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 40: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

24

ditambah nilai kapasitas lama + 1. Jika data penuh, maka elemen lama

dikopikan ke kapasitas baru ditambah dengan data baru.

Gambar 6. 1 ArrayList

4.1.2 Gambaran Sistem

Sistem Pemerolehan Informasi Judul Buku Perpustakaan Universitas

Sanata Dharma dikembangkan untuk membantu mahasiswa dalam mencari

judul buku yang dibutuhkan. Namun, sistem pemerolehan informasi yang

akan dikembangkan adalah sistem yang membandingkan kecepatan dalam

pencarian judul buku perpustakaan. Tujuannya adalah mencari metode

pencarian yang efekif, cepat dan mampu mengembangkan pencarian dalam

website perpustakaan Universitas Sanata Dharma.

Arsitektur perancangan sistem pemerolehan informasi ditunjukkan

dalam gambar berikut ini:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 41: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

24

Gambar 4. 2 Struktur Pemerolehan Informasi (Nazief & Andriani, 1996)

Berdasarkan struktur tersebut, sistem melakukan text operation pada

koleksi judul buku, berupa pembuangan kata dan stemming. Langkah

selanjutnya sistem melalukan indexing kata dan dokumen pada RDBMS.

Sistem mengambil index dari RDBMS ke random access memory secara

periodik di dalam inverted index serta melakukan pembobotan.

Proses pencarian melibatkan user yang memasukkan pencarian

menggunakan query yang selanjutnya masuk pada tahap text processing.

Sistem melakukan pencarian pada inverted index dengan operasi AND

kemudian melakukan ranking berdasarkan bobot dokumen. Hasil dokumen

yang sudah memiliki peringkat ditampilkan melalui user interface.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 42: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

25

4.2 Analisis Kebutuhan Pengguna

4.2.1 Use Case Diagram

Sistem ini diperuntukkan kepada pengguna (user) sehingga use case

diagram digambarkan sebagai berikut:

Gambar 4. 3 Use Case Diagram

Sistem pemerolehan informasi judul buku perpustakaan diakses oleh

satu aktor yaitu pengguna. Gambar use case diagram diatas dijelaskan dengan

tabel berikut ini:

Tabel 4. 1 Keterangan Use Case Diagram

Aktor Keterangan

Pengguna 1. Dapat melakukan

searching judul buku

perpustakaan.

4.2.2 Skenario Use Case

a. Mencari Judul Buku Perpustakaan

Tabel 4. 2 Mencari Judul Buku Perpustakaan

Nama Use Case Mencari judul buku perpustakaan

ID Use Case 1

Prioritas Tinggi

Aktor Pengguna

Deskripsi Use case ini merupakan proses untuk pencarian

judul buku perpustakaan

Pra kondisi Aktor berada di halaman utama

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 43: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

26

Pemicu Aktor akan melakukan pencarian judul buku

perpustakaan.

Langkah utama Aksi Aktor Reaksi Sistem

Langkah 1:

Aktor memasukkan

kata kunci dan

menekan tombol cari.

Langkah 2:

Sistem akan

mengecek kata kunci

yang dimasukkan

Langkah 3:

Sistem akan

menampilkan hasil

pencarian

Langkah

alternatif

Jika kata kunci yang dimasukkan tidak ada,

maka sistem akan memberi tahu aktor bahwa

kata kunci yang dicari tidak ditemukan.

Kesimpulan Use case ini digunakan untuk pencarian judul

buku perpustakaan dan akan berhenti bila aktor

menemukan judul buku yang dicari

Pasca kondisi Aktor menemukan judul buku yang dicari.

Aktor tidak berhasil menemukan judul buku

yang dicari karena kata kunci yang dimasukkan

tidak ditemukan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 44: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

27

4.3 Perancangan Sistem

4.3.1 Desain Logikal

4.3.1.1 Diagram Aktifitas

4.3.1.1.1 Mencari Judul Buku

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 45: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

28

4.3.1 Desain Model Kelas Analisis

Berikut ini merupakan desain model kelas analisis untuk sistem

pemerolehan informasi judul buku:

Gambar 4. 4 Desain Kelas Analisis

4.3.2 Diagram Sequence

4.3.2.1 Mencari Judul Buku

Berikut ini merupakan diagram sequence alur pencarian judul

buku yang dilakukan oleh pengguna:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 46: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

29

Gambar 4. 5 Diagram Sequence

4.3.3 Perancangan Database

4.3.3.1 Desain Konseptual

Desain konseptual database disajikan dalam bentuk ERD yang

ditunjukkan pada gambar 4.6 berikut ini:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 47: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

30

Gambar 4. 6 Entity Relationship Diagram

4.3.3.2 Desain Logical

Hubungan relasi antar tabel pada database perpustakaan ditunjukkan

pada gambar 4.6 berikut ini:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 48: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

32

Gambar 4. 7 Logical design

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 49: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

33

4.4 Rancangan Struktur Data Inverted Index

Inverted index merupakan indeks yang terbentuk dari proses

pengindeksan. Pengindeksan (indexing) merupakan cara untuk memudahkan

proses pencarian dengan tujuan meningkatkan efisiensi pencarian. Dengan

melakukan pengindeksan pada dokumen yang akan dicari, maka pencarian

dokumen dengan query tertentu tidak perlu dilakukan secara sekuensial atau

diperiksa satu persatu. Inverted index memotong tiap kata (term) yang berbeda

dari suatu daftar dokumen.

Struktur data inverted index merupakan pasangan term dan posting list

di dalam sebuah dokumen (t{d1,d2,3}). Istilah t merujuk pada term sedangkan

d1-d3 merujuk pada dokumen. Sebagai contoh, misalkan jika t1 terdapat pada

dokumen d1, d2, d5 sedangkan t2 terdapat pada dokumen d2, d5 maka inverted

index yang dihasilkan adalah sebagai berikut:

t1 d1, d2, d5

t2 d2, d5

Rancangan struktur data untuk inverted index akan dijelaskan pada

diagram berikut ini:

Gambar 4. 8 Representasi Inverted Index

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 50: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

34

4.5 Algoritma pencarian dengan operator AND

Sistem pemerolehan informasi yang dibangun menggunakan operator

AND. Operator AND merupakan fungsi yang digunakan untuk menguji

beberapa nilai atau kondisis sekaligus untuk menghasilkan nilai true or false.

Operator AND memiliki ketentuan yaitu bernilai true jika semua kondisi

argument terpenuhi dan bernilai false jika salah satu argument tidak terpenuhi.

Algoritma AND dijelaskan berikut ini:

1. answer ← ( )

2. while p1 ≠ NIL and p2 ≠ NIL

3. do if docID(p1) = docID(p2)

4. then ADD(answer, docID(p1))

5. p1 ← next(p1)

6. p2 ← next(p2)

7. else if docID(p1) < docID(p2)

8. then p1 ← next(p1)

9. else p2 ← next(p2)

10. return answer

4.6 Rancangan Basis Data

Basis data yang digunakan yaitu Oracle 11g dengan tools yaitu aplikasi SQL

Developer. Database ini digunakan untuk menyimpan teks judul-judul buku

yang merupakan koleksi Perpustakaan Universitas Sanata Dharma.

Berikut ini merupakan rancangan tabel-tabel untuk membangun sistem

pemerolehan informasi judul buku perpustakaan:

1. Tabel buku_perpus

Tabel 4. 1 Tabel buku_perpus

Nama Field Tipe Data Ukuran Keterangan

ID_Buku bigint Merupakan id buku

perpustakaan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 51: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

35

ISBN varchar 300 Nomor ISBN Buku

Judul_Buku Varchar 500 Judul dari buku

Klasifikasi Varchar 300 Klasifikasi dari buku

Tahun Integer 11 Tahun dari sebuah buku

Id_status_ready Integer Status untuk buku

Id_status2 Integer Status untuk pencarian

2. Tabel terms

Tabel 4. 2 Table Terms

Nama Field Tipe Data Ukuran Keterangan

Id_term Integer ID untuk term

terms varchar 50 Term dari sebuah judul

buku

Stemmed_word varchar 50 Term yang sudah di

stemming

Is_root_word char 1 Untuk mengecek sebuah

kata termasuk kata dasar

atau bukan

3. Tabel sourceterm

Tabel 4. 3 Tabel Sourceterm

Nama Field Tipe Data Ukuran Keterangan

Id_sourceterm Integer Merupakan primary key

untuk tabel sourceterm

Id_term Integer Merupakan foreign key

untuk tabel terms

Word varchar 50 Kata tanpa proses

stemming

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 52: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

36

Is_root_word char 1 Keterangan yang

menunjukkan bila kata

terdapat dalam kamus. 1

untuk benar, dan 0 untuk

salah

4. Tabel posting

Tabel 4. 4 Tabel Posting

Nama Field Tipe data Ukuran Keterangan

ID_Buku Bigint 10 Merupakan foreign key

dari tabel buku_perpus

Id_term Integer - Merupakan foreign key

dari tabel terms

frequency Integer - Merupakan frequency dari

sebuah kata

Ntfik Integer - Merupakan hasil

perhitungan frequency

w integer - Bobot dari sebuah term

5. Tabel posting_stopword

Tabel 4. 5 Tabel posting_stopword

Nama Field Tipe Data Ukuran Keterangan

ID_Buku Integer - Merupakan foreign key

dari tabel buku_perpus

Id_stopword Integer - Merupakan foreign key

dari tabel stopword

Frequency integer - Merupakan frequency

stopword pada buku.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 53: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

37

6. Tabel stopwords

Tabel 4. 6 Tabel stopwords

Nama Field Tipe data Ukuran Keterangan

Id_stopword integer - Merupakan primary key

pada tabel stopwords

stopword varchar 50 Merupakan daftar kata

yang merupakan

stopword

4.7 Rancangan Desain Antarmuka

Antar muka sistem pemerolehan informasi terdiri dari satu tampilan yakni

halaman pencarian. Pada halaman pencarian, pengguna diminta untuk

memasukkan keyword yang akan dicari, kemudian bisa menekan Enter atau

mengklik tombol Search.

Tampilan dari halaman pencarian digambarkan dalam ilustrasi berikut ini:

Gambar 4. 9 Halaman awal

Sedangkan hasil pencarian masih merujuk pada halaman utama, namun

hasil dari pencarian akan ditampilkan di bawah tombol Search sebagaimana

ditampilkan berikut ini:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 54: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

38

Gambar 4. 10 Halaman hasil

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 55: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

39

BAB V

IMPLEMENTASI DAN ANALISIS HASIL

5.1 Spesifikasi Software dan Hardware

5.1.1 Spesifikasi Software (Perangkat Lunak)

Sistem yang dibangun menggunakan perangkat lunak yang

mendukung untuk implementasi pemrosesan teks dan pencarian judul buku

yaitu:

a. Sistem Operasi : Windows 10 Pro

b. SQL Developer

c. NetBeans IDE 8.0

d. Browser: Mozilla Firefox

5.1.2 Spesifikasi Hardware (Perangkat Keras)

Perangkat keras yang diperlukan untuk membuat sistem pencarian

judul buku koleksi perpustakaan Universitas Sanata Dharma yaitu:

a. Memory RAM: 4GB DDR3

b. Processor Intel i5 4200U

c. Harddisk: 500GB

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 56: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

40

5.2 Implementasi Antar Muka (Interface)

5.2.1 Implementasi Halaman Awal

Gambar 5. 1 Tampilan Awal

5.2.2 Implementasi Halaman Hasil Pencarian

Gambar 5. 2 Halaman Hasil Pencarian

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 57: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

41

5.3 Implementasi Stemming

Stemming digunakan untuk menghilangkan prefix dan suffix suatu kata

bentukan menjadi kata dasar. Stemming sangat diperlukan untuk

meningkatkan performa pemerolehan informasi dengan cara mentransformasi

kata-kata dalam sebuah dokumen teks menjadi kata dasar.

Proses stemming didukung dengan daftar kata-kata dasar yang

diperoleh dari Kamus Besar Bahasa Indonesia. Implementasi stemming

diambil dari kelas Stemming yang dibuat oleh Reza Darojad (2008)

menggunakan algoritma Nazief dan Andriani.

5.4 Implementasi inverted index

Inverted index digunakan untuk menambahkan data posting yang baru

dari indeks posisi 0 dan menemukan posisi indeks yang tepat berdasarkan

nomor id_document data posting baru dibandingkan dengan id dokumen yang

sudah ada.

Berikut ini merupakan listing program untuk inverted index yang

berfungsi untuk menambahkan kata dalam posting:

Gambar 5. 3 Inverted index

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 58: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

42

5.5 Pengujian dan Analisa Hasil

5.5.1 Hasil Pengujian

Data judul buku perpustakaan yang digunakan sebanyak 135425 buah

judul. Data tersebut diambil sampel sebanyak 538 judul buku dengan

memastikan jumlah judul buku yang diambil sama dengan hasil pencarian

pada website perpustakaan. Data-data tersebut diperoleh dari pihak

Perpustakaan Universitas Sanata Dharma. Kamus kata yang digunakan

diambil dari Kamus Besar Bahasa Indonesia sebanyak 28526 kata dasar yang

digunakan untuk proses stemming. Jumlah stopword yang dipakai sebanyak

399 kata dan menghasilkan term sebanyak 60531.

Salah satu tujuan dari pengujian ini adalah membandingkan unjuk

kerja struktur data inverted index yang dibuat menggunakan arraylist dan

linkedlist. Cara pengujian adalah memasukkan keyword pada sistem

pemerolehan informasi yang dibangun.

Cara melakukan pengujian yaitu dengan mencari responden sebanyak

10 orang. Masing-masing orang memasukkan kata kunci judul buku

perpustakaan yang akan dicari.

5.6 Perbandingan Relevansi Hasil Pencarian Judul Buku

Perbandingan relevansi yang dimaksud adalah membandingkan antara

sistem pemerolehan informasi yang dibuat dengan website dari Perpustakaan

Universitas Sanata Dharma. Adapun cara membandingkan adalah dengan

memasukkan kata kunci yang sama kemudian dihitung recall and precision

untuk menentukan relevansi judul buku yang dicari. Berikut ini adalah hasil

perbandingan antara sistem pemerolehan informasi dengan website

perpustakaan Universitas Sanata Dharma.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 59: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

43

5.6.1 Kata Kunci “struktur data”

5.6.1.1 Pencarian pada Sistem Pencarian Perpustakaan

Responden mencoba untuk mencari judul buku yang berkaitan dengan

kata kunci “struktur data”. Hasilnya, sistem menemukan 17 judul buku yang

relevan dalam bahasa Indonesia. Maka perhitungan recall (persamaan (2.4))

dan precision (persamaan (2.5)) adalah sebagai berikut

Recall =

=

= 1

Precision =

=

= 1

Tabel 5. 1 recall and precision

Relevan Recall Precision

R 0.0588 1

R 0.1176 1

R 0.1765 1

R 0.2353 1

R 0.2941 1

R 0.3529 1

R 0.4118 1

R 0.4706 1

R 0.5294 1

R 0.5882 1

R 0.6471 1

R 0.7059 1

R 0.7647 1

R 0.8235 1

R 0.8824 1

R 0.9412 1

R 1.0000 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 60: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

44

Percision menjadi bernilai 1 semua dikarenakan tidak menyertakan

judul buku dalam bahasa Inggris dari kata kunci “struktur data”. Maka

perhitungan precision dalam 11 titik recall menjadi seperti berikut:

Tabel 5. 2 precision dalam 11 titik recall

Recall precision

0% 1

10% 1

20% 1

30% 1

40% 1

50% 1

60% 1

70% 1

80% 1

90% 1

100% 1

Rata-rata 1

Dan bila digambarkan dalam bentuk grafik adalah seperti berikut:

Gambar 5. 3 Grafik precision dalam 11 titik recall

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0% 10% 20% 30% 40% 50% 60% 70% 80% 90%100%

Interpolation

Interpolation

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 61: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

45

5.6.1.2 Pencarian pada Sistem Pemerolehan Informasi dengan Arraylist

Responden mencoba untuk mencari buku dengan kata kunci pencarian

“struktur data”. Hasilnya sistem menemukan 17 buku yang relevan dengan

kata kunci pencarian. Maka perhitungan recall and precision adalah sebagai

berikut:

Tabel 5. 3 recall and precision

Relevan Recall Precision

R 0.0588 1

R 0.1176 1

R 0.1765 1

R 0.2353 1

R 0.2941 1

R 0.3529 1

R 0.4118 1

R 0.4706 1

R 0.5294 1

R 0.5882 1

R 0.6471 1

R 0.7059 1

R 0.7647 1

R 0.8235 1

R 0.8824 1

R 0.9412 1

R 1.0000 1

Maka perhitungan precision dalam 11 titik recall menjadi seperti

berikut:

Tabel 5. 4 precision dalam 11 titik recall

Recall Precision

0% 1

10% 1

20% 1

30% 1

40% 1

50% 1

60% 1

70% 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 62: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

46

80% 1

90% 1

100% 1

Rata-rata 1

Berdasarkan tabel nilai precision dalam 11 titik recall tersebut, jika

digambarkan dalam grafik menjadi seperti berikut:

Gambar 5. 4 Grafik precision dalam 11 titik recall

5.6.1.3 Pencarian pada Sistem Pemerolehan Informasi dengan Linkedlist

Dengan menggunakan kata kunci yang sama yakni “struktur data”

hasilnya adalah website perpustakaan Universitas Sanata Dharma menemukan

16 buku yang relevan dengan kata kunci pencarian. Maka perhitungan recall

and precision adalah sebagai berikut:

Tabel 5. 5 recall and precision

Relevan Recall Precision

R 0.0625 1

R 0.1250 1

R 0.1875 1

R 0.2500 1

R 0.3125 1

R 0.3750 1

R 0.4375 1

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0% 10%20%30%40%50%60%70%80%90%100%

Interpolation

Interpolation

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 63: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

47

R 0.5000 1

R 0.5625 1

R 0.6250 1

R 0.6875 1

R 0.7500 1

R 0.8125 1

R 0.8750 1

R 0.9375 1

R 1.0000 1

Maka perhitungan precision dalam 11 titik recall adalah seperti

berikut:

Tabel 5. 6 precision dalam 11 titik recall

recall precision

0% 1

10% 1

20% 1

30% 1

40% 1

50% 1

60% 1

70% 1

80% 1

90% 1

100% 1

Rata-rata 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 64: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

48

Maka bila digambarkan dengan bentuk grafik adalah seperti berikut ini:

Gambar 5. 5 Grafik precision dalam 11 titik recall

5.7 Perbandingan Rata-Rata Precision Sistem Pemerolehan Informasi

dengan Sistem Pencarian Perpustakaan Sanata Dharma

Berdasarkan perhitungan recall and precision untuk perbandingan

hasil pencarian antara sistem pencarian yang dimiliki dengan sistem

pemerolehan informasi yang dibangun, maka dapat disimpulkan perbandingan

rata-rata precision sebagai berikut:

Tabel 5. 7 Perbandingan rata-rata precision

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Interpolation

Interpolation

Recall

Rata-rata precision

sistem pencarian

perpustakaan

rata-rata precision sistem

pemerolehan informasi

menggunakan arraylist

rata-rata precision sistem

pemerolehan informasi

menggunakan linkedlis

0% 1 1 1

10% 1 1 1

20% 1 1 1

30% 1 1 1

40% 1 1 1

50% 1 1 1

60% 1 1 1

70% 1 1 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 65: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

49

Berdasarkan tabel tersebut maka dapat disajikan dalam bentuk grafik sebagai

berikut:

Gambar 5. 6 Grafik relevansi sistem pencarian dan pemerolehan informasi

Berdasarkan grafik tersebut, sistem pemerolehan informasi judul buku

perpustakaan berhasil dikembangkan dibuktikan dengan hasil yang sama dengan

sistem pencarian yang dimiliki oleh perpustakaan Sanata Dharma. Dalam proses

evaluasi dan pengujian lebih lanjut, penulis menemukan bahwa sistem

pemerolehan informasi lebih baik dibandingkan sistem pencarian yang dimiliki

oleh perpustakaan Sanata Dharma. Evaluasi dilakukan dengan melakukan

pengujian terhadap sistem pencarian dengan kondisi kata kunci yang berbeda

yaitu terbalik dan tidak urut (hasil perhitungan akurasi dapat dilihat pada

Lampiran III).

0

0.2

0.4

0.6

0.8

1

1.2

0% 20% 40% 60% 80% 100% 120%

Rata-rata precision sistempencarian perpustakaan

rata-rata precision sistempemerolehan informasimenggunakan arraylist

rata-rata precision sistempemerolehan informasimenggunakan linkedlist

80% 1 1 1

90% 1 1 1

100% 1 1 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 66: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

50

5.8 Perbandingan Kecepatan Struktur Data Linked List dan Array List

Perbandingan kecepatan yang diteliti adalah kecepatan pencarian antara

struktur data linked list dengan array list. Cara menguji kecepatan tersebut

dengan cara memasukkan kata kunci pencarian, kemudian melihat hasil waktu

pencarian yang ditempuh oleh sistem. Pengujian dilakukan sebanyak 400 kali

untuk memperoleh hasil yang stabil. Tabel pengujian ditampilkan pada tabel 5.8

dibawah ini:

Tabel 5. 8 Perbedaan waktu pencarian ArrayList dan Linkedlist

Jumlah

kata (dalam 100

kali ujicoba

dengan

keyword

yang

berbeda)

Total waktu

pencarian

Rata-rata waktu

pencarian

Selisih waktu

rata-rata

Arraylist

(dalam

detik)

Linkedlist

(dalam

detik)

Arraylist

(dalam

detik)

Linkedlist

(dalam

detik)

Satu kata 0.674 1.254 0.007 0.013 0.006

Dua kata 3.842 5.956 0.038 0.060 0.022

Tiga kata 9.507 14.213 0.095 0.142 0.047

Empat kata 174.708 234.42 1.747 2.344 0.597

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 67: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

51

Sistem pemerolehan informasi yang dibuat dengan arraylist lebih cepat dalam

melakukan pencarian dibandingkan dengan linkedlist dibuktikan dengan selisih rata-

rata waktu pencarian. Pengujian satu kata kunci membutuhkan waktu kecepatan rata-

rata 0.006 miliseconds (ms), dua kata kunci dalam waktu 0.022 ms, tiga kata

kuncidalam waktu 0.047 ms, dan empat kata kunci dalam waktu 0.597 ms lebih cepat

arraylist daripada linkedlist.

Perhitungan tersebut berdasarkan ketelitian sistem yang mencapai tiga angka

nol dibelakang koma. Ketelitian sistem mencapai tiga angka nol dibelakang koma

dikarenakan method timer yang digunakan pada java menggunakan parameter period

dalam satuan miliseconds untuk menjaga agar frekuensi tetap akurat dalam jangka

pendek ketika program masih berjalan.

Berdasarkan tabel 5.8 tersebut, dapat dilihat bahwa struktur data arraylist

lebih cepat dibandingkan dengan linkedlist. Hal ini dikarenakan arraylist berkaitan

dengan alamat memory. Alamat memori atau memory address register merupakan

register yang mencatat alamat memory yang akan diakses (baik yang akan ditulis

maupun yang akan dibaca) (Hariyanto, 2009). Dengan kata lain, data yang akan

diambil dimasukkan ke dalam memory address kemudian mengirimkan alamat

tersebut ke dalam RAM. Sedangkan linkedlist harus mencari satu persatu data yang

dicari karena bentuk dari linkedlist yang seperti rantai. Pada saat build index dengan

lima kali percobaab, struktur data inverted index yang dibangun menggunakan

arraylist memerlukan waktu rata-rata 0.013 miliseconds (ms) sedangkan struktur data

inverted index yang dibangun menggunakan linkedlist memerlukan waktu rata-rata

0.02 ms.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 68: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

52

BAB VI

KESIMPULAN DAN SARAN

6.1 Kesimpulan

Kesimpulan yang didapat dari perbandingan antara sistem pencarian

judul buku yang dimiliki oleh Perpustakaan Universitas Sanata Dharma

dengan sistem pemerolehan informasi yang dibangun menggunakan struktur

data LinkedList dan ArrayList dalam inverted index adalah sebagai berikut:

1. Sistem pemerolehan informasi perpustakaan yang dibangun

menggunakan struktur data arraylist dan linkedlist dalam inverted

index telah berhasil dikembangkan dibuktikan mampu mencari

judul buku dengan hasil yang minimal sama dengan sistem

pencarian perpustakaan.

2. Sistem pemerolehan informasi yang dibuat dengan arraylist lebih

cepat dalam melakukan pencarian dibandingkan dengan linkedlist

dibuktikan dengan selisih rata-rata waktu pencarian. Pengujian

satu kata kunci mempunyai selisih waktu kecepatan rata-rata 0.006

miliseconds (ms), dua kata kunci dalam waktu 0.022 ms, tiga kata

kunci dalam waktu 0.047 ms, dan empat kata kunci dalam waktu

0.597 ms lebih cepat arraylist daripada linkedlist.

3. Pembentukan struktur data inverted index yang menggunakan

arraylist membutuhkan waktu rata-rata 0.013 miliseconds (ms)

lebih cepat dibandingkan linkedlist yang membutuhkan waktu rata-

rata 0.015 ms.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 69: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

53

6.2 Saran

Saran yang mendukung pengembangan dari sistem pemerolehan

informasi judul buku perpustakaan yaitu:

Hasil evaluasi dan pengujian sistem pemerolehan informasi

dibandingkan sistem pencarian perpustakaan Universitas Sanata

Dharma memiliki beberapa kelebihan sebagai berikut:

a. Sistem pemerolehan informasi ini mampu mencari judul

dengan kata kunci pencarian yang dibalik, sedangkan

sistem pencarian milik Perpustakaan Universitas Sanata

Dharma tidak dapat melakukan pencarian judul buku.

b. Sistem pemerolehan informasi ini mampu mencari judul

buku dengan kata kunci pencarian yang tidak urut,

sedangkan sistem pencarian milik Perpustakaan

Universitas Sanata Dharma tidak dapat melakukan

pencarian judul buku.

Untuk lebih detail dapat dilihat pada Lampiran III

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 70: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

54

DAFTAR PUSTAKA

Adriani, M., Asian, J., Nazief, B., Tahaghoghi, S.M.M. & Williams, H.E. 2007.

Stemming Indonesian : A Confix-Stripping Approach. Transaction on Asian

Langeage Information Processing. Vol. 6, No. 4, Articel 13. Association for

Computing Machinery : New York .

Agusta, Ledy. (2009). Perbandingan Algoritma Stemming Porter dengan

Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa

Indonesia. Jurnal Konferensi Nasional Sistem dan Informatika 2009, Bali.

Baeza-Yates, R., Riberio-Neto, B. (1999). Modern Information Retrieval the

Concepts and Technology Behind Search. England: A division of the

association for Computing Machinary

Büttcher, Stefan., Clarke, L.A Charles., Cormack, V. Gordon. (2010).

Information Retrieval Implementing and Evaluating Search Engines. USA:

Massachusetts Institute of Technology.

Darojad, Reza Mohammad. (2013). Sistem Temu Balik Informasi Dokumen

Makalah Ilmiah Berbahasa Indonesia Menggunakan Struktur Data

Inverted Index Berbasis Hash Table dan Linked List. Universitas Sanata

Dharma: Yogyakarta.

Hariyanto, Bambang. (2009). Sistem Operasi revisi keempat. Informatika:

Bandung.

Hasibuan, Zainal A., & Andri, Yofi. (2001). Penerapan Berbagai Teknik

Sistem Temu-Kembali Informasi Berbasis Hiperteks. Jurnal Ilmu Komputer

dan Teknologi Informasi, Vol. 1, No. 2

Ingwersen, Peter. (2002). Information Retrieval Interaction. Denmark: Royal

School of Library and Information Science.

Manning, Christopher, D., Raghavan, Prakbhakar., Schütze, Hinrich. (2008).

Introduction to Information Retrieval. England: Cambridge University

Press.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 71: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

55

P.J, Deitel., Deitel H.M. (2012). Java How to Program, 9th

Edition. Pearson

Education Inc:USA.

Pressman, Roger S. (2001). Software Enginerring: A Practitioner’s Approach,

7th

Edition. The McGraw-Hill Companies: USA.

Puspitaningrum, Fredes Winda Oktaviani. (2011). Sistem Pemerolehan

Informasi Undang-Undang dan Kasus Menggunakan Struktur Data

Inverted Index dengan Pembobotan TF-IDF. Universitas Sanata Dharma:

Yogyakarta.

Wulandari, Justina Septiani. (2013). Sistem Pemerolehan Informasi Makalah

Ilmiah Berbahasa Indonesia Menggunakan Struktur Data Inverted Index

Dengan Metode Pembobotan TF-IDF Berbasis ORDBMS. Universitas

Sanata Dharma: Yogyakarta.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 72: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

56

Lampiran

Lampiran I

Source code Stemming.java

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 73: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

57

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 74: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

58

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 75: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

59

Lampiran II

A. Uji coba satu kata

no kata arraylist linkedlist

1 akademik 0.001 0.001

2 agama 0.036 0.092

3 sistem 0.018 0.217

4 informasi 0.128 0.226

5 pemerolehan 0.001 0.001

6 java 0.001 0.001

7 data 0.001 0.001

8 struktur 0.001 0.001

9 katolik 0.001 0.001

10 hindu 0.001 0.001

11 budha 0.001 0.001

12 islam 0.001 0.001

13 kristen 0.001 0.001

14 sanata 0.001 0.001

15 dharma 0.001 0.001

16 retrieval 0.001 0.001

17 information 0.001 0.001

18 mining 0.001 0.001

19 structures 0.157 0.252

20 framework 0.001 0.001

21 collections 0.001 0.001

22 basis 0.145 0.151

23 algoritma 0.001 0.001

24 modeling 0.001 0.001

25 classification 0.001 0.001

26 methods 0.001 0.001

27 business 0.001 0.001

28 industry 0.001 0.001

29 accounting 0.001 0.001

30 akuntansi 0.001 0.001

31 analisa 0.001 0.001

32 analisis 0.001 0.001

33 disain 0.001 0.001

34 implementasi 0.001 0.001

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 76: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

60

35 auditing 0.001 0.001

36 bunga 0.001 0.001

37 evaluasi 0.001 0.001

38 studi 0.096 0.222

39 dampak 0.001 0.001

40 kredit 0.001 0.001

41 keamanan 0.001 0.001

42 program 0.001 0.001

43 manajemen 0.001 0.001

44 teknologi 0.001 0.001

45 technology 0.001 0.001

46 perpustakaan 0.001 0.001

47 geografis 0.001 0.001

48 bisnis 0.001 0.001

49 autocad 0.001 0.001

50 fotografi 0.001 0.001

51 statistical 0.001 0.001

52 professionals 0.001 0.001

53 concepts 0.001 0.001

54 techniques 0.001 0.001

55 multimedia 0.001 0.001

56 computing 0.001 0.001

57 bioinformatics 0.001 0.001

58 machine 0.001 0.001

59 learning 0.001 0.001

60 implementations 0.001 0.001

61 introduction 0.001 0.001

62 preparation 0.001 0.001

63 mastering 0.001 0.001

64 aplikasi 0.001 0.001

65 apriori 0.001 0.001

66 analysis 0.001 0.001

67 practical 0.001 0.001

68 clustering 0.001 0.001

69 konsep 0.001 0.001

70 discovering 0.001 0.001

71 knowledge 0.001 0.001

72 hypertext 0.001 0.001

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 77: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

61

73 modern 0.001 0.001

74 warehousing 0.001 0.001

75 visualization 0.001 0.001

76 core 0.001 0.001

77 support 0.001 0.001

78 decision 0.001 0.001

79 systems 0.001 0.001

80 programmer 0.001 0.001

81 recognition 0.001 0.001

82 pattern 0.001 0.001

83 algorithms 0.001 0.001

84 perancangan 0.001 0.001

85 relational 0.001 0.001

86 scientific 0.001 0.001

87 perspective 0.001 0.001

88 teori 0.001 0.001

89 delphi 0.001 0.001

90 turbo 0.001 0.001

91 pascal 0.001 0.001

92 simulasi 0.001 0.001

93 kamus 0.001 0.001

94 time 0.001 0.001

95 databases 0.001 0.001

96 penelusuran 0.001 0.001

97 filsafat 0.001 0.001

98 ilmu 0.001 0.001

99 ontologi 0.001 0.001

100 aksiologi 0.001 0.001

TOTAL 0.674 1.254

Rata-Rata 0.00674 0.01254

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 78: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

62

B. Uji coba dua kata

no kata arraylist linkedlist

1 accounting systems 0.001 0.001

2 accounting information 0.099 0.166

3 sistem akuntansi 0.208 0.41

4 teori bisnis 0.001 0.001

5 analisis desain 0.001 0.001

6 Informasi sistem 0.114 0.256

7 praktek bisnis 0.001 0.001

8 desain sistem 0.224 0.152

9 smart card 0.001 0.001

10 Informasi parkir 0.001 0.001

11 audit sistem 0.222 0.282

12 audit Informasi 0.001 0.001

13 aplikasi informasi 0.001 0.001

14 aplikasi smart 0.001 0.001

15 card smart 0.001 0.001

16 disain analisis 0.001 0.001

17 bunga rampai 0.001 0.001

18 evaluasi Informasi 0.001 0.001

19 unit informasi 0.001 0.001

20 penggajian pengupahan 0.001 0.001

21 sistem pengendalian 0.16 0.222

22 resiko keamanan 0.001 0.001

23 kasus studi 0.029 0.225

24 studi kasus 0.029 0.225

25 indeks pencarian 0.001 0.001

26 implementasi oracle 0.001 0.001

27 information systems 0.018 0.181

28 web tourism 0.001 0.001

29 berbasis web 0.021 0.221

30 internal auditing 0.001 0.001

31 tinjauan sistem 0.115 0.077

32 informasi manajemen 0.001 0.001

33 kamus sistem 0.198 0.302

34 sistem pendukung 0.269 0.335

35 pendukung keputusan 0.001 0.001

36 sistem keputusan 0.075 0.085

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 79: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

63

37 keamanan Informasi 0.001 0.001

38 sistem keamanan 0.211 0.243

39 kerangka dasar 0.001 0.001

40 sistem manajemen 0.097 0.158

41 manajemen informasi 0.001 0.001

42 organisasi perusahaan 0.001 0.001

43 manajemen pendidikan 0.001 0.001

44 informasi data 0.084 0.099

45 konsep tuntunan 0.001 0.001

46 sistem penjualan 0.062 0.086

47 sistem informasi 0.134 0.275

48 toko buku 0.001 0.001

49 model kesuksesan 0.001 0.001

50 sistem teknologi 0.081 0.156

51 teknologi informasi 0.028 0.218

52 informasi teknologi 0.001 0.001

53 model teknologi 0.001 0.001

54 sistem geografis 0.133 0.12

55 Informasi geografis 0.001 0.001

56 Informasi akademik 0.001 0.001

57 perangkat bergerak 0.001 0.001

58 pemetaan pengawasan 0.001 0.001

59 Informasi perpustakaan 0.001 0.001

60 metodologi Informasi 0.001 0.001

61 metodologi sistem 0.308 0.172

62 pengantar sistem 0.041 0.081

63 pengantar manajemen 0.001 0.001

64 perspektif bisnis 0.001 0.001

65 bisnis manajerial 0.001 0.001

66 aplikasi akademik 0.001 0.001

67 perangkat lunak 0.001 0.001

68 sistem pariwisata 0.032 0.209

69 open source 0.001 0.001

70 pengembangan sistem 0.176 0.214

71 template pengembangan 0.001 0.001

72 pengenalan informasi 0.001 0.001

73 book shop 0.001 0.001

74 sistem bisnis 0.107 0.247

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 80: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

64

75 sistem dokumentasi 0.242 0.186

76 algoritma mining 0.001 0.001

77 data mining 0.028 0.119

78 mining concepts 0.001 0.001

79 bisnis perusahaan 0.001 0.001

80 structures abstractions 0.001 0.001

81 structures java 0.001 0.004

82 mining multimedia 0.001 0.001

83 machine tools 0.001 0.001

84 data preparation 0.227 0.161

85 java programming 0.001 0.001

86 relasional kabur 0.001 0.001

87 data relasional 0.001 0.001

88 analysis modeling 0.001 0.001

89 learning tools 0.001 0.001

90 programmer java 0.001 0.001

91 web discovering 0.001 0.001

92 pattern recognition 0.001 0.001

93 pattern algorithms 0.001 0.001

94 kamus besar 0.001 0.001

95 technology information 0.001 0.001

96 introduction computers 0.001 0.001

97 computers communications 0.001 0.001

98 buku ajar 0.001 0.001

99 farmasi kedokteran 0.001 0.001

100 mikrobiologi imunologi 0.001 0.001

TOTAL 3.842 5.956

Rata-rata 0.03842 0.05956

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 81: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

65

C. Uji coba tiga kata

no kata arraylist linkedlist

1 data mining algoritma 0.001 0.001

2 accounting information systems 0.248 0.268

3 analisa sistem Informasi 0.075 0.241

4 analisis desain sistem 0.095 0.3

5 audit sistem Informasi 0.203 0.105

6 analisis disain implementasi 0.001 0.001

7 implementasi sistem Informasi 0.192 0.225

8 praktek aplikasi bisnis 0.001 0.001

9 dampak teknologi Informasi 0.222 0.262

10 bunga rampai sistem 0.059 0.122

11 pengelolaan sistem manajemen 0.091 0.121

12 akuntansi sistem Informasi 0.121 0.222

13 pengontrolan sistem Informasi 0.106 0.231

14 kerangka dasar sistem 0.123 0.136

15 keamanan sistem Informasi 0.026 0.122

16 sistem manajemen pendidikan 0.101 0.055

17 geografis Informasi sistem 0.27 0.322

18 pengantar sistem Informasi 0.005 0.109

19 pengembangan sistem Informasi 0.038 0.232

20 perspektif bisnis Informasi 0.001 0.001

21 perangkat lunak sistem 0.168 0.269

22 sistem pemetaan pengawasan 0.132 0.31

23 perpustakaan sistem Informasi 0.89 1.113

24 pengantar Informasi manajemen 0.001 0.001

25 pengembangan perangkat lunak 0.001 0.001

26 pengelolaan sistem informasi 0.085 0.174

27 sistem Informasi administrasi 0.156 0.274

28 pengenalan sistem Informasi 0.112 0.282

29 perancangan sistem Informasi 0.145 0.228

30 prototipe sistem Informasi 0.141 0.156

31 desain pemrograman komputer 0.001 0.001

32 Informasi berbasis web 0.087 0.168

33 sistem berbasis web 0.222 0.391

34 prestasi akademik mahasiswa 0.001 0.001

35 sistem Informasi bisnis 0.145 0.223

36 studi konsultasi kanker 0.001 0.001

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 82: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

66

37 sistem Informasi data 0.034 0.087

38 algoritma data mining 0.212 0.222

39 business industry methods 0.003 0.001

40 data mining applied 0.106 0.222

41 preparation mining data 0.112 0.234

42 java programming introduction 0.001 0.001

43 data relasional kabur 0.222 0.238

44 implementasi data mining 0.29 0.36

45 web discovering knowledge 0.001 0.001

46 algorithms pattern recognition 0.001 0.001

47 warehousing mining visualization 0.001 0.001

48 modern data warehousing 0.222 0.274

49 visualization core concepts 0.001 0.001

50 decision support systems 0.001 0.001

51 data mining scalability 0.005 0.018

52 scalability discovery algorithms 0.001 0.001

53 perancangan basis data 0.124 0.234

54 penerapan data mining 0.108 0.231

55 metode naïve bayessian 0.001 0.001

56 naïve bayessian clasification 0.001 0.001

57 data mining relational 0.005 0.082

58 data mining scientific 0.188 0.245

59 pengantar struktur data 0.122 0.224

60 simulasi algoritma aplikasi 0.001 0.001

61 pencarian pengurutan data 0.051 0.145

62 algoritma struktur data 0.242 0.352

63 databases mining data 0.258 0.358

64 information retrieval evaluating 0.283 0.342

65 information retrieval systems 0.372 0.222

66 information retrieval modern 0.122 0.135

67 search engines practice 0.001 0.001

68 kemajuan pengetahuan ilmu 0.134 0.322

69 filsafat hukum kodrat 0.001 0.001

70 epistemologi logika studi 0.143 0.232

71 filsafat studi orientasi 0.001 0.001

72 logika ilmu pengetahuan 0.002 0.001

73 ontologi filsafat ilmu 0.001 0.001

74 ontologi epistemologi aksiologi 0.001 0.001

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 83: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

67

75 filsafat ilmu pengetahuan 0.097 0.142

76 asketik dimensi etik 0.001 0.001

77 ilmu pengetahuan manusia 0.001 0.001

78 filsafat ilmu kajian 0.001 0.001

79 buku ajar filsafat 0.002 0.001

80 analitis dinamis dialektis 0.001 0.001

81 pencerahan ilmu pengetahuan 0.001 0.001

82 cakrawala pluralitas ilmu 0.222 0.421

83 susunan ilmu pengetahuan 0.001 0.001

84 bidang teknologi informasi 0.001 0.001

85 komunikasi dunia pendidikan 0.021 0.033

86 teknologi informasi komunikasi 0.338 0.378

87 tantangan teknologi informasi 0.001 0.001

88 globalisasi pemanfaatan informasi 0.001 0.001

89 peluang perguruan tinggi 0.001 0.001

90 information technology management 0.222 0.391

91 integrasi teknologi informasi 0.001 0.001

92 penerapan pemanfaatan dampak 0.001 0.001

93 teknologi informasi kualitas 0.191 0.222

94 konsep dasar aplikasi 0.001 0.001

95 informasi komunikasi pendidikan 0.222 0.341

96 perancangan perpustakaan digital 0.001 0.001

97 it research metodologi 0.001 0.001

98 teknologi informasi penelitian 0.262 0.356

99 matematika teknologi informasi 0.234 0.342

100 teknologi informasi bisnis 0.039 0.105

TOTAL 9.507 14.213

Rata-rata 0.09507 0.14213

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 84: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

68

D. Uji coba empat kata

no kata arraylist linkedlist

1 pengenalan teknologi komputer informasi 0.104 0.222

2 kamus istilah teknologi informasi 0.222 0.371

3 peranana matematika pengembangan teknologi 0.243 0.356

4 ergonomika manajemen teknologi informasi 0.104 0.222

5 sistem tatakelola teknologi informasi 0.425 0.585

6 algorithms data structures design 0.007 0.234

7 structures design correctness analysis 0.001 0.002

8 data structures algorithm analysis 0.541 0.699

9 c++ plus data structures 0.305 0.408

10 data structures algorithms java 0.231 0.333

11 data structures program design 0.23 0.322

12 data structures personal computers 0.268 0.469

13 object oriented programming algoritmsm 0.001 0.001

14 open source aplikasi quantum 0.234 0.366

15 sms konseling kesehatan pengaturan 0.002 0.002

16 open source wireless java 0.212 0.321

17 windows aplikasi statistika gratis 0.001 0.001

18 panduan buku pengantar mikrobiologi 0.091 0.221

19 mini riset mikrobiologi terapan 0.001 0.001

20 medical microbiology review of 0.252 0.662

21 mikrobiologi kedokteran laboratorium klinik 0.234 0.354

22 unjuk kerja access point 0.001 0.001

23 implementasi unjuk kerja perbandingan 0.231 0.422

24 mikrobiologi dasar praktek teknik 0.222 0.345

25 praktek teknik prosedur laboratorium 0.342 0.442

26 kamus besar ilmu pengetahuan 0.435 0.532

27 kamus bahasa besar indonesia 0.421 0.534

28 kamus bahasa korea besar 0.342 0.356

29 intisari mikrobiologi imunologi hardcore 0.444 0.531

30 panduan mahasiswa farmasi kedokteran 0.564 0.754

31 buku ajar mikrobiologi panduan 0.765 1.081

32 information technology business evolution 0.776 0.897

33 using information technology practical 1.231 1.453

34 change business evolution information 1.001 1.232

35 information technology effectively teaching 2.452 3.423

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 85: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

69

36 teaching learning information technology 3.245 4.323

37 teacher education information technology 2.222 3.421

38 visually impaired learning technology 1.221 2.221

39 library information system active 1.568 2.763

40 active server pages technology 2.561 3.645

41 architecture computer hardware software 3.241 4.653

42 hardware software systems computer 3.568 4.032

43 revolution impact science technology 2.456 3.241

44 information technology revolution science 3.234 4.236

45 information weapon customers markets 2.346 3.212

46 information technology weapon customers 3.256 5.321

47 market beyond cooperation competition 4.352 5.463

48 information technology development competition 3.462 5.231

49 cooperation competition technology information 2.344 3.452

50 technology connection strategy information 3.214 4.252

51 technology information change age 3.241 4.643

52 relationship computer mediated communication 6.743 9.143

53 communicaton learner autonomy technology 3.124 4.342

54 learning achievement information technology 3.425 3.421

55 disease information system built 2.314 3.245

56 activex data object technology 3.241 4.352

57 pendidikan agama para remadja 1.231 2.225

58 media audiovisual pendidikan agama 1.224 2.453

59 pendidikan agama iman katolik 1.341 2.314

60 service operations strategy technology 1.463 2.412

61 operations service technology information 2.314 3.452

62 information technology service operations 3.425 2.412

63 sejarah nasional perjuangan indonesia 5.435 6.312

64 kebangkitan nasional hindia belanda 1.231 2.311

65 sejarah jaman pertumbuhan kerajaan 1.021 2.092

66 sejarah jaman prasejarah indonesia 3.009 4.063

67 sejarah indonesia baru pergerakan 2.314 3.412

68 pergerakan nasional kolonialisme nasionalisme 3.124 2.231

69 pendidikan iman anak keluarga 2.123 2.001

70 kawin campur beda agama 3.124 4.231

71 pengembangan kepribadian pendidikan pancasila 2.421 3.245

72 pendidikan agama pancasila kewarganegaraan 3.241 4.324

73 kewarganegaraan pancasila pendidikan agama 1.201 2.221

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 86: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

70

74 kurikulum pendidikan agama katolik 2.001 3.121

75 lokakarya kurikulum agama katolik 6.754 7.534

76 cendekiawan beriman dewasa katolik 1.785 2.098

77 pendidikan agama kristen protestan 0.987 1.273

78 materi pokok pendidikan agama 2.321 3.474

79 materi pokok agama islam 0.321 0.234

80 konsep karakteristik metodologi islam 4.125 5.321

81 information technology management systems 2.124 3.212

82 essentials management information systems 3.212 4.213

83 refleksi mahasiswa pendidikan agama 3.321 4.212

84 sejarah nasional kolonialisme kemerdekaan 2.123 3.244

85 information social context technology 1.231 2.222

86 social context technology information 3.121 3.212

87 sistem hukum pertahanan indonesia 1.231 4.231

88 ensiklopedia sejarah budaya indonesia 2.422 3.211

89 budaya sejarah indonesia raya 2.125 2.221

90 agama pendidikan ekonomi budaya 3.212 2.242

91 encyclopedia information technology communication 2.314 4.231

92 english learning communication technology 0.342 0.763

93 information computers technology perspective 0.421 0.432

94 pendidikan putera puteri agama 2.152 1.231

95 membaca sejarah nasional indonesia 3.242 2.123

96 programming methods algorithms structures 4.232 5.312

97 java structures designing software 1.092 1.221

98 java collections framework structures 0.975 2.021

99 pengembangan teknologi informasi komunikasi 0.754 2.121

100 cepat menguasai teknologi informasi 0.212 1.212

TOTAL 174.708 234.42

Rata-rata 1.74708 2.3442

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 87: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

71

Lampiran III

Perbandingan Hasil Pencarian dan Relevansi Sistem Pemerolehan Informasi dengan

Sistem Pencarian Perpustakaan

1. Kata kunci “struktur data”

1.1 Pencarian pada web perpustakaan dan sistem pemerolehan informasi.

Sistem pencarian yang dimiliki oleh perpustakaan Sanata Dharma dan sistem

pemerolehan informasi mampu mencari judul buku dengan kata kunci tersebut

dan diperoleh hasil 17 judul buku yang ditemukan dalam bahasa Indonesia.

Namun, ada buku-buku lain dalam bahasa Inggris yang juga berkaitan dengan

struktur data

Hasil perhitungan selengkapnya disajikan dalam tabel 5.1 berikut ini:

Recall =

=

= 0.3036

Precision =

=

= 1

Tabel 1 recall and precision

No R/N recall precision

1 R 0.0179 0.0588

2 R 0.0357 0.1176

3 R 0.0536 0.1765

4 R 0.0714 0.2353

5 R 0.0893 0.1852

6 R 0.1071 0.2222

7 R 0.1250 0.2593

8 R 0.1429 0.4706

9 R 0.1607 0.5294

10 R 0.1786 0.5882

11 R 0.1964 0.6471

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 88: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

72

12 R 0.2143 0.7059

13 R 0.2321 0.7647

14 R 0.2500 0.8235

15 R 0.2679 0.8824

16 R 0.2857 0.9412

17 R 0.3036 1

Maka perhitungan precision untuk 11 titik recall yang terinterpolasi

menjadi seperti berikut:

Tabel 2 precision dalam 11 titik recall

recall Precision

0% 1

10% 1

20% 1

30% 1

40% 0

50% 0

60% 0

70% 0

80% 0

90% 0

100% 0

Rata-rata 0.36 Dari perhitungan tersebut, nilai relevansi untuk recall diatas 30% tidak

bernilai 1 mungkin dikarenakan terdapat buku struktur data dalam bahasa

Inggris. Dalam hal ini, pengguna harus memperluas pencarian dengan

memasukkan kata kunci dalam bahasa Inggris. Maka bila pengguna

memasukkan kata kunci struktur data, maka sistem akan mencari juga kata

struktur data dalam bahasa Inggris. Salah satu contoh judul buku yang

berbahasa Inggris yaitu “Data Structures And The Java Collections

Framework“. Dengan demikian maka bila digambarkan dalam bentuk grafik

akan menjadi seperti berikut:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 89: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

73

Gambar 1 Grafik precision dalam 11 titik recall

Maka sistem pencarian yang dimiliki oleh sistem pencarian

perpustakaan maupun sistem pemerolehan informasi sama-sama mampu

mencari judul buku dalam bahasa Indonesia namun belum mampu mencari

dalam dua bahasa yang berbeda sekaligus.

1. Kata kunci “pendidikan agama”

1.1 Pencarian pada Sistem Pemerolehan Informasi

Responden mencari judul buku yang berkaitan dengan

pendidikan agama. Hasilnya, sistem pemerolehan informasi

menemukan judul buku sebanyak 30 yang relevan dengan kata kunci

pencarian. Maka perhitungan recall and precision sebagai berikut:

Tabel 3 recall and precision

Relevan Recall Precision

R 0.0333 1

R 0.0667 1

R 0.1000 1

R 0.1333 1

R 0.1667 1

R 0.2000 1

R 0.2333 1

R 0.2667 1

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0% 20% 40% 60% 80% 100% 120%

interpolation

interpolation

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 90: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

74

R 0.3000 1

R 0.3333 1

R 0.3667 1

R 0.4000 1

R 0.4333 1

R 0.4667 1

R 0.5000 1

R 0.5333 1

R 0.5667 1

R 0.6000 1

R 0.6333 1

R 0.6667 1

R 0.7000 1

R 0.7333 1

R 0.7667 1

R 0.8000 1

R 0.8333 1

R 0.8667 1

R 0.9000 1

R 0.9333 1

R 0.9667 1

R 1 1

Berdasarkan tabel tersebut, maka perhitungan precision dalam 11 titik

recall adalah sebagai berikut:

Tabel 4 precision dalam 11 titik recall

recall Precision

0% 1

10% 1

20% 1

30% 1

40% 1

50% 1

60% 1

70% 1

80% 1

90% 1

100% 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 91: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

75

Maka grafik precision yang sudah diinterpolasi menjadi seperti

berikut:

Gambar 2 Grafik precision dalam 11 titik recall

1.2 Pencarian pada Sistem Pencarian Perpustakaan Sanata Dharma

Menggunakan kata kunci yang sama, maka pada sistem

pencarian yang dimiliki oleh Perpustakaan Universitas Sanata Dharma

menemukan 30 judul buku yang relevan. Maka hasil perhitungan

recall and precision adalah sebagai berikut:

Tabel 5 recall and precision

Relevan Recall Precision

R 0.0333 1

R 0.0667 1

R 0.1000 1

R 0.1333 1

R 0.1667 1

R 0.2000 1

R 0.2333 1

R 0.2667 1

R 0.3000 1

R 0.3333 1

R 0.3667 1

R 0.4000 1

R 0.4333 1

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0% 50% 100% 150%

Precision

Precision

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 92: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

76

R 0.4667 1

R 0.5000 1

R 0.5333 1

R 0.5667 1

R 0.6000 1

R 0.6333 1

R 0.6667 1

R 0.7000 1

R 0.7333 1

R 0.7667 1

R 0.8000 1

R 0.8333 1

R 0.8667 1

R 0.9000 1

R 0.9333 1

R 0.9667 1

R 1 1

Berdasarkan tabel tersebut, maka perhitungan precision dalam 11 titik

recall adalah sebagai berikut:

Tabel 6 precision dalam 11 titik recall

recall Precision

0% 1

10% 1

20% 1

30% 1

40% 1

50% 1

60% 1

70% 1

80% 1

90% 1

100% 1

Maka grafik precision yang sudah diinterpolasi menjadi seperti

berikut:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 93: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

77

Gambar 3 Grafik precision dalam 11 titik recall

2. Kata kunci “teknologi informasi”

2.1 Pencarian pada Sistem Pemerolehan Informasi

Responden mencari judul buku yang berkaitan dengan

teknologi informasi. Hasilnya, sistem pemerolehan informasi

menemukan 25 judul buku yang relevan dengan kata kunci. Maka

perhitungan recall and precision adalah sebagai berikut:

Tabel 6 recall and precision

no R recall precision

1 r 0.04 1

2 r 0.08 1

3 r 0.12 1

4 r 0.16 1

5 r 0.2 1

6 r 0.24 1

7 r 0.28 1

8 r 0.32 1

9 r 0.36 1

10 r 0.4 1

11 r 0.44 1

12 r 0.48 1

13 r 0.52 1

14 r 0.56 1

15 r 0.6 1

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0% 50% 100% 150%

Precision

Precision

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 94: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

78

16 r 0.64 1

17 r 0.68 1

18 r 0.72 1

19 r 0.76 1

20 r 0.8 1

21 r 0.84 1

22 r 0.88 1

23 r 0.92 1

24 r 0.96 1

25 r 1 1

Maka tabel tersebut, maka perhitungan precision dalam 11 titik recall

adalah sebagai berikut:

Tabel 7 precision dalam 11 titik recall Recall precision

0% 1

10% 1

20% 1

30% 1

40% 1

50% 1

60% 1

70% 1

80% 1

90% 1

100% 1

Grafik disajikan sebagai berikut:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 95: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

79

Gambar 4 Grafik precision dalam 11 titik recall

2.2 Pencarian pada Sistem Pencarian Perpustakaan Sanata Dharma

Responden mencari judul buku yang berkaitan dengan

teknologi informasi. Hasilnya, sistem pemerolehan informasi

menemukan 25 judul buku yang relevan dengan kata kunci. Maka

perhitungan recall and precision adalah sebagai berikut:

Tabel 8 recall and precision

no R recall precision

1 r 0.04 1

2 r 0.08 1

3 r 0.12 1

4 r 0.16 1

5 r 0.2 1

6 r 0.24 1

7 r 0.28 1

8 r 0.32 1

9 r 0.36 1

10 r 0.4 1

11 r 0.44 1

12 r 0.48 1

13 r 0.52 1

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

interpolasi

interpolasi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 96: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

80

14 r 0.56 1

15 r 0.6 1

16 r 0.64 1

17 r 0.68 1

18 r 0.72 1

19 r 0.76 1

20 r 0.8 1

21 r 0.84 1

22 r 0.88 1

23 r 0.92 1

24 r 0.96 1

25 r 1 1

Maka tabel tersebut, maka perhitungan precision dalam 11 titik recall

adalah sebagai berikut:

Tabel 9 precision dalam 11 titik recall Recall precision

0% 1

10% 1

20% 1

30% 1

40% 1

50% 1

60% 1

70% 1

80% 1

90% 1

100% 1

Grafik disajikan sebagai berikut:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 97: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

81

Gambar 5 Grafik precision dalam 11 titik recall

Kesimpulan yang dapat diambil yaitu baik sistem pemerolehan

informasi maupun sistem pencarian yang dimiliki oleh perpustakaan

Universitas Sanata Dharma sama-sama mampu mencari kata kunci yang dicari

dengan kata kunci yang urut.

3. Kata kunci “data struktur”

3.1 Pencarian pada Sistem Pemerolehan Informasi

Penulis sengaja untuk memasukkan kata kunci terbalik, dari

“struktur data” menjadi “data struktur”. Tujuan dari pengujian ini untuk

mengetahui sistem pemerolehan informasi mampu mencari buku dengan kata

kunci yang terbalik atau tidak.

Hasil yang didapat yaitu sistem pemerolehan informasi mampu

untuk mencari buku dengan kata kunci yang tidak berurutan tersebut.

Diperoleh 17 judul buku yang relevan. Maka perhitungan recall and precision

adalah sebagai berikut:

Tabel 10 recall and precision

Relevan Recall Precision

R 0.0588 1

R 0.1176 1

R 0.1765 1

R 0.2353 1

R 0.2941 1

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

interpolasi

interpolasi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 98: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

82

R 0.3529 1

R 0.4118 1

R 0.4706 1

R 0.5294 1

R 0.5882 1

R 0.6471 1

R 0.7059 1

R 0.7647 1

R 0.8235 1

R 0.8824 1

R 0.9412 1

R 1.0000 1

Maka perhitungan precision dalam 11 titik recall menjadi seperti

berikut:

Tabel 11 precision dalam 11 titik recall

Recall precision

0% 1

10% 1

20% 1

30% 1

40% 1

50% 1

60% 1

70% 1

80% 1

90% 1

100% 1

Rata-rata 1

Berdasarkan tabel nilai precision dalam 11 titik recall tersebut, jika

digambarkan dalam grafik menjadi seperti berikut:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 99: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

83

Gambar 6 Grafik precision dalam 11 titik recall

3.2 Pencarian pada Website Perpustakaan Sanata Dharma

Menggunakan kata kunci yang sama yakni “data struktur”

penulis mencoba untuk mengetahui sistem pencarian yang dimiliki

oleh perpustakaan Sanata Dharma mampu melakukan pencarian atau

tidak. Hasilnya adalah sistem pencarian yang dimiliki oleh

perpustakaan tidak bisa mencari dibuktikan dengan hasil pencarian

yang nol (0). Maka perhitungan relevansi adalah sebagai berikut:

Tabel 12 recall and precision

R Recall Precision

0 0 0

Maka nilai precision dalam 11 titik recall dapat diperoleh sebagai

berikut:

Tabel 13 precision dalam 11 titik recall

Recall precision

0% 0

10% 0

20% 0

30% 0

40% 0

50% 0

60% 0

70% 0

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0% 10% 20% 30% 40% 50% 60% 70% 80% 90%100%

Interpolation

Interpolation

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 100: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

84

80% 0

90% 0

100% 0

Rata-rata 0

Grafik dapat disajikan sebagai berikut berdasarkan data tersebut:

Gambar 7 Grafik precision dalam 11 titik recall

Kesimpulan yang bisa diambil adalah sistem pemerolehan informasi

pencarian judul buku perpustakaan mampu mencari judul buku walaupun kata

kunci terbalik, sedangkan sistem pencarian yang dimiliki oleh perpustakaan

Universitas Sanata Dharma tidak mampu melakukan pencarian jika kata kunci

dibalik.

4. Kata Kunci “teori data struktur ”

4.1 Pencarian pada Sistem Pemerolehan Informasi

Selain menguji dengan kata kunci yang terbalik, penulis juga meminta

kepada responden untuk mencari dengan tiga kata kunci yang tidak urut.

Salah satu contoh adalah buku dengan judul lengkap “Teori Dan Aplikasi

Struktur Data Menggunakan Java” dan diambil kata kunci pencarian “teori

data struktur”. Hasilnya yaitu sistem menghasilkan satu judul buku yang

relevan dengan kata kunci pencarian. Maka perhitungan recall and precision

menjadi seperti berikut:

Tabel 14 recall and precision

Relevan Recall Precision

R 0.0584 1

0

0.2

0.4

0.6

0.8

1

0% 50% 100% 150%

Interpolation

Interpolation

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 101: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

85

Maka perhitungan precision dalam 11 titk recall dari kata kunci “teori

data struktur” adalah sebagai berikut:

Tabel 15 precision dalam 11 titik recall

Recall precision

0% 1

10% 0

20% 0

30% 0

40% 0

50% 0

60% 0

70% 0

80% 0

90% 0

100% 0

Rata-rata 0.09

Dengan demikian maka bila digambarkan dalam bentuk grafik akan

menjadi seperti berikut:

Gambar 8 Grafik precision dalam 11 titik recall

0

0.2

0.4

0.6

0.8

1

1.2

0% 20% 40% 60% 80% 100% 120%

precision

precision

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 102: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

86

4.2 Pencarian pada Sistem Perpustakaan Sanata Dharma

Dengan kata kunci dan cara yang sama website perpustakaan

Universitas Sanata Dharma menemukan sebanyak 0 judul buku yang

mengandung kata kunci pencarian. Maka hasil perhitungan adalah sebagai

berikut:

Tabel 16 recall and precision

R Recall Precision

0 0 0

Maka nilai precision dalam 11 titik recall adalah sebagai berikut:

Tabel 17 precision dalam 11 titik recall

Recall Precision

0% 0

10% 0

20% 0

30% 0

40% 0

50% 0

60% 0

70% 0

80% 0

90% 0

100% 0

Rata-rata 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 103: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

87

Grafik dapat disajikan sebagai berikut berdasarkan data tersebut:

Gambar 9 Grafik precision dalam 11 titik recall

Kesimpulan yang bisa diambil adalah sistem pencarian yang dimiliki

oleh Perpustakaan Universitas Sanata Dharma tidak mampu untuk mencari

bila kata kunci pencarian bila judul yang dimasukkan tidak berurutan

sedangkan sistem pemerolehan informasi pencarian judul buku yang dibangun

mampu untuk mencari judul dengan kata kunci yang tidak berurutan.

Rata-Rata Grafik Relevansi yang diperoleh Sistem dan Perpustakaan

Berdasarkan grafik-grafik interpolasi yang sudah diperoleh

sebelumnya, maka rata-rata relevansi sistem pemerolehan informasi judul

buku perpustakaan dapat digambarkan dalam gambar grafik di bawah ini:

Tabel 18 rata-rata precision dalam 11 titik recall sistem pemerolehan informasi

Recall precision

0% 1

10% 0.6667

20% 0.6667

30% 0.6667

40% 0.6667

50% 0.6667

60% 0.6667

70% 0.6667

0

0.2

0.4

0.6

0.8

1

0% 50% 100% 150%

Interpolation

Interpolation

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 104: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

88

80% 0.6667

90% 0.6667

100% 0.6667

Maka bila disajikan dalam bentuk grafik adalah sebagai berikut:

Gambar 10 Grafik rata-rata precision dalam 11 titik recall

Sedangkan relevansi sistem pencarian yang dimiliki oleh Perpustakaan

Universitas Sanata Dharma adalah sebagai berikut:

Tabel 19 rata-rata precision dalam 11 titik recall sistem pencarian

Recall Precision

0% 0.333333

10% 0.333333

20% 0.333333

30% 0.333333

40% 0.333333

50% 0.333333

60% 0.333333

70% 0.333333

80% 0.333333

90% 0.333333

100% 0.333333

0

0.2

0.4

0.6

0.8

1

1.2

0% 50% 100% 150%

rata-rata precision

rata-rata precision

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 105: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

89

Gambar 11 Grafik rata-rata precision dalam 11 titik recall

Hasil rata-rata tersebut kemudian dibandingkan dengan rata-rata interpolasi

yang dihasilkan oleh sistem pemerolehan informasi. Tujuan dibandingkan adalah

untuk mencari tahu sistem pencarian judul buku yang lebih baik. Grafik rata-rata

ditampilkan pada gambar 5.13 berikut ini:

Gambar 12 Perbandingan grafik rata-rata precision dalam 11 titik recall

0.0000

0.0500

0.1000

0.1500

0.2000

0.2500

0.3000

0.3500

0% 50% 100% 150%

rata-rata precision

rata-rata precision

0

0.2

0.4

0.6

0.8

1

1.2

0% 20% 40% 60% 80% 100% 120%

Rata-rata Precision SistemPemerolehan InformasiPencarian Judul BukuPerpustakaan

Rata-rata Precision SistemPencarian PerpustakaanSanata Dharma

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 106: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI - core.ac.uk · tujuannya yaitu perpustakaan nasional RI, perpustakaan daerah, perpustakaan ... bertujuan untuk mencari pasal-pasal dalam

90

Berdasarkan grafik yang ditunjukkan gambar 5.17 di atas, terlihat bahwa

grafik yang dimiliki oleh sistem pemerolehan informasi lebih condong ke kanan atas

daripada sistem pencarian yang dimiliki oleh Perpustakaan Universitas Sanata

Dharma. Maka dapat disimpulkan bahwa sistem pemerolehan informasi yang

dibangun lebih baik dalam melakukan pencarian judul buku perpustakaan daripada

sistem pencarian yang dimiliki oleh Perpustakaan Universitas Sanata Dharma saat ini.

Tabel 20 Perbedaan Sistem Pemerolehan Informasi dengan Sistem Pencarian Judul

Buku Perpustakaan

No Perbedaan

Sistem Pemerolehan Informasi Web Perpustakaan USD

1 Belum dapat mencari judul buku

dalam dua bahasa sekaligus

dibuktikan dengan nilai akurasi

dibawah satu.

Belum dapat mencari judul buku dalam

dua bahasa sekaligus dibuktikan dengan

nilai akurasi dibawah satu.

2 Mampu mencari judul buku dengan

kata kunci yang dibalik, dibuktikan

dengan nilai akurasi sama dengan

satu.

Tidak mampu mencari judul buku bila

kata kunci dibalik, dibuktikan dengan

nilai akurasi nol.

3 Mampu mencari judul buku dengan

kata kunci yang tidak urut.

Dibuktikan dengan nilai akurasi

sama dengan satu.

Tidak mampu mencari judul buku bila

kata kunci tidak urut, dibuktikan dengan

nilai akurasi nol.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI