OTOMATIS BERBASIS TEXT MINING DENGAN MENGGUNAKAN …kc.umn.ac.id/1184/1/HALAMAN AWAL.pdfpembuatan...

12
Team project ©2017 Dony Pratidana S. Hum | Bima Agus Setyawan S. IIP Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis dan melisensikan ciptaan turunan dengan syarat yang serupa dengan ciptaan asli. Copyright and reuse: This license lets you remix, tweak, and build upon work non-commercially, as long as you credit the origin creator and license it on your new creations under the identical terms.

Transcript of OTOMATIS BERBASIS TEXT MINING DENGAN MENGGUNAKAN …kc.umn.ac.id/1184/1/HALAMAN AWAL.pdfpembuatan...

Team project ©2017 Dony Pratidana S. Hum | Bima Agus Setyawan S. IIP 

 

 

 

 

 

Hak cipta dan penggunaan kembali:

Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis dan melisensikan ciptaan turunan dengan syarat yang serupa dengan ciptaan asli.

Copyright and reuse:

This license lets you remix, tweak, and build upon work non-commercially, as long as you credit the origin creator and license it on your new creations under the identical terms.

RANCANG BANGUN SISTEM PERINGKAS BERITA

OTOMATIS BERBASIS TEXT MINING DENGAN

MENGGUNAKAN NAIVE BAYES CLASSIFIER

SKRIPSI

Diajukan sebagai salah satu syarat untuk memperoleh gelar

Sarjana Komputer (S.Kom.)

Nicholas Adi Suryatama

12110110104

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNOLOGI INFORMASI DAN KOMUNIKASI

UNIVERSITAS MULTIMEDIA NUSANTARA

TANGERANG

2016

ii

LEMBAR PENGESAHAN SKRIPSI

RANCANG BANGUN SISTEM PERINGKAS BERITA OTOMATIS

BERBASIS TEXT MINING DENGAN MENGGUNAKAN

NAIVE BAYES CLASSIFIER

Oleh

Nama : Nicholas Adi Suryatama

NIM : 12110110104

Program Studi : Teknik Informatika

Fakultas : Teknologi Informasi dan Komunikasi

Tangerang, 15 Agustus 2016

Menyetujui,

Ketua Sidang Dosen Penguji

Ir. Andrey Andoko, M.Sc. Ni Made Satvika Iswari, S.T., M.T.

Dosen Pembimbing

Ranny, S.Kom., M.Kom.

Ketua Program Studi

Maria Irmina Prasetiyowati, S.Kom., M.T.

Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016

iii

PERNYATAAN TIDAK MELAKUKAN PLAGIAT

Dengan ini saya,

Nama : Nicholas Adi Suryatama

NIM : 12110110104

Program Studi : Teknik Informatika

Fakultas : Teknologi Informasi dan Komunikasi

Menyatakan bahwa skripsi yang berjudul “Rancang Bangun Sistem Peringkas

Berita Otomatis Berbasis Text Mining dengan Menggunakan Naive Bayes

Classifier” ini adalah karya ilmiah saya sendiri, bukan plagiat dari karya ilmiah

yang ditulis oleh orang lain atau lembaga lain, dan semua karya ilmiah orang lain

atau lembaga lain yang dirujuk dalam skripsi ini telah disebutkan sumber

kutipannya serta dicantumkan di Daftar Pustaka.

Jika di kemudian hari terbukti ditemukan kecurangan / penyimpangan, baik dalam

pelaksanaan skripsi maupun dalam penulisan laporan skripsi, saya bersedia

menerima konsekuensi dinyatakan TIDAK LULUS untuk mata kuliah skripsi

yang telah saya tempuh.

Tangerang, 25 Juli 2016

Nicholas Adi Suryatama

Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016

iv

KATA PENGANTAR

Puji syukur kepada Tuhan Yang Maha Esa karena berkat rahmat-Nya penulis

dapat menyelesaikan penelitian ini. Laporan skripsi yang berjudul “Rancang

Bangun Sistem Peringkas Berita Otomatis Berbasis Text Mining dengan

Menggunakan Naive Bayes Classifier” diajukan kepada Program Studi Teknik

Informatika, Fakultas Teknik dan Informatika, Universitas Multimedia Nusantara.

Selama penulis melakukan penelitian, tentunya tidak terlepas daripada semua

orang yang memberi dukungan dan bantuan kepada penulis. Dengan ini, penulis

mengucapkan terima kasih kepada :

1. Dr. Ninok Leksono, selaku Rektor Universitas Multimedia Nusantara, yang

memberi inspirasi bagi penulis untuk berprestasi,

2. Kanisius Karyono, S.T., M.T., selaku Dekan Fakultas Teknologi Informasi

dan Komunikasi Universitas Multimedia Nusantara,

3. Maria Irmina Prasetiyowati, S.Kom., M.T., selaku Ketua Program Studi

Teknik Informatika Universitas Multimedia Nusantara, yang menerima

penulis dengan baik untuk berkonsultasi,

4. Ranny, S.Kom., M.Kom. selaku dosen pembimbing yang telah membimbing

dengan sabar selama proses pembuatan skripsi dan yang telah mengajar

penulis tata cara menulis karya ilmiah dengan benar,

5. Niknik M.K., S.Pd., M.Hum, selaku pakar Bahasa Indonesia yang telah

membantu dalam pengumpulan data.

6. Orang tua dan keluarga penulis yang senantiasa mendukung penulis dalam

menyelesaikan rangkaian proses skripsi,

Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016

v

7. Teman-teman penulis yang membantu memberikan dukungan moral dan

saran agar penelitian menjadi lebih baik.

Semoga skripsi ini dapat bermanfaat, baik sebagai sumber informasi maupun

sumber inspirasi, bagi para pembaca.

Tangerang, 25 Juli 2016

Nicholas Adi Suryatama

Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016

vi

RANCANG BANGUN SISTEM PERINGKAS BERITA OTOMATIS

BERBASIS TEXT MINING DENGAN MENGGUNAKAN

NAIVE BAYES CLASSIFIER

ABSTRAK

Naive Bayes Classifier merupakan salah satu teknik klasifikasi data yang

paling sering digunakan. Text summarization adalah proses untuk mendapatkan

informasi paling penting dari satu atau lebih sumber informasi dan menghasilkan

versi yang lebih singkat dari informasi tersebut. Terdapat dua jenis ringkasan

yaitu ekstraktif dan abstraktif. Ringkasan yang akan diperoleh dari sistem

merupakan ringkasan ekstraktif. Ringkasan ekstraktif merupakan ringkasan yang

didapatkan dari kalimat-kalimat yang dianggap penting dari suatu sumber

informasi. Dalam penelitian ini, Naive Bayes Classifier digunakan untuk

melakukan text summarization pada berita. Berita yang digunakan adalah berita

dengan kategori ekonomi, nasional, dan olahraga. Berita yang digunakan

bersumber dari www.kompas.com. Dari berita yang ada, akan dicari tahu

ringkasan manualnya melalui seorang ahli Bahasa Indonesia. Ringkasan tersebut

akan dibandingkan dengan ringkasan yang dihasilkan oleh sistem. Parameter yang

digunakan adalah posisi kalimat, panjang kalimat, nama entitas, data numerik, dan

kemiripan kalimat dengan judul. Setelah melakukan beberapa pengujian,

diketahui bahwa dengan menggunakan Naive Bayes Classifier ringkasan terbaik

didapatkan pada berita dengan kategori olahraga dengan rata-rata nilai f-measure

sebesar 0,77.

Kata kunci : Automatic Summarization, Naive Bayes Classifier, ringkasan

ekstraktif, Text Mining, Text Summarization

Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016

vii

DESIGN AND DEVELOPMENT OF AUTOMATIC NEWS

SUMMARIZER BASED ON TEXT MINING USING

NAIVE BAYES CLASSIFIER

ABSTRACT

Naive Bayes Classifier is one of the data classification techniques that

often used. Text summarization is a process to find the most important

information from one or more information source and produce a shorter version of

that information. There are two kinds of summary, an abstract and an extract. The

summary generated by the system is an extract. Extractive summary is a

summary that consist of the important sentences from information source. In this

research, Naive Bayes Classifier will be used to do the news text summarization.

The news that will be used are economic news, national news, and sport news.

The source of the news is from www.kompas.com. From the original news, the

manual summary will be found from Indonesian language expert. The manual

summary will be compared to the system’s summary. The parameters are sentence

position, sentence length, entity name, numeric data, and sentence similarity to

title. After doing some experiments on system, the best summary generated by

using Naive Bayes Classifier is for sport news, the average f-measure is 0,77.

Key words : Automatic Summarization, Extractive Summary, Naive Bayes

Classifier, Text Mining, Text Summarization

Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016

viii

DAFTAR ISI

LEMBAR PENGESAHAN SKRIPSI .................................................................... ii

PERNYATAAN TIDAK MELAKUKAN PLAGIAT .......................................... iii

KATA PENGANTAR ........................................................................................... iv

BAB I PENDAHULUAN ...................................................................................... 1

1.1 Latar Belakang .............................................................................................. 1

1.2 Rumusan Masalah ......................................................................................... 2

1.3 Batasan Masalah ............................................................................................ 2

1.4 Tujuan Penelitian ........................................................................................... 3

1.5 Manfaat Penelitian ......................................................................................... 3

1.6 Sistematika Penulisan .................................................................................... 3

BAB II LANDASAN TEORI ................................................................................. 5

2.1 Natural Language Processing ........................................................................ 5

2.2 Data Mining ................................................................................................... 5

2.3 Text Summarization ...................................................................................... 6

2.4 Text Mining ................................................................................................... 6

2.5 Naive Bayes Classifier .................................................................................. 8

2.6 Teknik Uji Coba dan Evaluasi ..................................................................... 14

BAB III METODE DAN PERANCANGAN SISTEM ........................................ 16

3.1 Metode Penelitian ........................................................................................ 16

3.2 Spesifikasi Sistem ........................................................................................ 17

3.3 Perancangan Sistem ..................................................................................... 17

3.3.1 Data Flow Diagram (DFD) ................................................................... 18

3.3.2 Flowchart .............................................................................................. 20

3.3.3 Struktur Tabel ....................................................................................... 25

3.4 Perancangan Antarmuka .............................................................................. 26

3.4.1 Mockup Halaman Utama ...................................................................... 26

3.4.2 Mockup Halaman Login ....................................................................... 27

BAB IV IMPLEMENTASI DAN UJI COBA SISTEM ....................................... 28

4.1 Implementasi Data Training ........................................................................ 28

4.2 Implementasi Algoritma .............................................................................. 29

4.3 Implementasi Sistem ................................................................................... 32

4.3.1 Halaman Utama .................................................................................... 32

4.3.2 Halaman Login ..................................................................................... 33

Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016

ix

4.3.3 Halaman Admin .................................................................................... 34

4.4 Pengujian Sistem ......................................................................................... 35

BAB V KESIMPULAN DAN SARAN ................................................................ 50

KESIMPULAN DAN SARAN ............................................................................. 50

5.1 Kesimpulan .................................................................................................. 50

5.2 Saran ............................................................................................................ 51

DAFTAR PUSTAKA ........................................................................................... 52

DAFTAR LAMPIRAN ......................................................................................... 54

Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016

x

DAFTAR GAMBAR

Gambar 3.1 Context Diagram ............................................................................... 18

Gambar 3.2 DFD Level 1 ...................................................................................... 18

Gambar 3.3 DFD Level 2 ...................................................................................... 19

Gambar 3.4 Flowchart Sistem .............................................................................. 20

Gambar 3.5 Flowchart Tokenizing ........................................................................ 21

Gambar 3.6 Flowchart Filtering ........................................................................... 22

Gambar 3.7 Flowchart Bayes ................................................................................ 23

Gambar 3.8 Flowchart Login ................................................................................ 24

Gambar 3.9 Flowchart Tambah Berita Training .................................................. 24

Gambar 3.10 Rancangan Halaman Utama ............................................................ 26

Gambar 3.11 Rancangan Halaman Login ............................................................. 27

Gambar 4.1 Halaman Utama Sistem ..................................................................... 32

Gambar 4.2 Halaman Login .................................................................................. 33

Gambar 4.3 Tampilan Pesan Error ....................................................................... 34

Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016

xi

DAFTAR TABEL

Tabel 2.1 Contoh Data Set (Lestari, 2015) ............................................................. 9

Tabel 2.2 Contoh Data Prediksi (Lestari, 2015) ................................................... 10

Tabel 3.1 Struktur Tabel Admin ........................................................................... 25

Tabel 3.2 Struktur Tabel Kategori ........................................................................ 25

Tabel 3.3 Struktur Tabel Parameter ...................................................................... 25

Tabel 3.3 Struktur Tabel Parameter (Lanjutan) .................................................... 26

Tabel 4.1 Hasil Uji Berita Ekonomi (8 data training, batas kata = 5) .................. 35

Tabel 4.1 Hasil Uji Berita Ekonomi (8 data training, batas kata = 5)

(Lanjutan) ............................................................................................. 36

Tabel 4.2 Hasil Uji Berita Ekonomi (10 data training, batas kata = 5) ................ 36

Tabel 4.3 Hasil Uji Berita Ekonomi (8 data training, batas kata = 7) .................. 37

Tabel 4.4 Hasil Uji Berita Ekonomi (10 data training, batas kata = 7) ................ 38

Tabel 4.5 Hasil Uji Berita Ekonomi (8 data training, batas kata = 15) ................ 39

Tabel 4.6 Hasil Uji Berita Ekonomi (10 data training, batas kata = 15) .............. 39

Tabel 4.7 Hasil Uji Berita Nasional (8 data training, batas kata = 5) ................... 40

Tabel 4.7 Hasil Uji Berita Nasional (8 data training, batas kata = 5)

(Lanjutan) ............................................................................................. 41

Tabel 4.8 Hasil Uji Berita Nasional (10 data training, batas kata = 5) ................. 41

Tabel 4.9 Hasil Uji Berita Nasional (8 data training, batas kata = 6) ................... 42

Tabel 4.9 Hasil Uji Berita Nasional (8 data training, batas kata = 6)

(Lanjutan) ............................................................................................. 43

Tabel 4.10 Hasil Uji Berita Nasional (10 data training, batas kata = 6) ............... 43

Tabel 4.11 Hasil Uji Berita Nasional (8 data training, batas kata = 15) ............... 44

Tabel 4.12 Hasil Uji Berita Nasional (10 data training, batas kata = 15) ............. 44

Tabel 4.13 Hasil Uji Berita Olahraga (8 data training, batas kata = 5) ................ 45

Tabel 4.14 Hasil Uji Berita Olahraga (10 data training, batas kata = 5) .............. 46

Tabel 4.15 Hasil Uji Berita Olahraga (8 data training, batas kata = 15) .............. 46

Tabel 4.15 Hasil Uji Berita Olahraga (8 data training, batas kata = 15)

(Lanjutan) ............................................................................................. 47

Tabel 4.16 Hasil Uji Berita Olahraga (10 data training, batas kata = 15) ............ 47

Rancang bangun..., Nicholas Adi Suryatama, FTI UMN, 2016