SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA...

14
i KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Program Studi Informatika Disusun oleh : FAIRLY OKTA’MAL NIM. M0509026 PROGRAM STUDI INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2015

Transcript of SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA...

Page 1: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

i

KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN

STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI

DINI HAMA DAN PENYAKIT PADA TANAMAN PADI

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu

Program Studi Informatika

Disusun oleh :

FAIRLY OKTA’MAL

NIM. M0509026

PROGRAM STUDI INFORMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET

SURAKARTA

2015

Page 2: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

ii

Page 3: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

iii

Page 4: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

iv

MOTTO

“Lebih baik dibenci sebagai burung gagak, daripada burung malang yang dikurung dalam

sangkar dan lupa bagaimana cara terbang.”

(Bouya Harumichi)

“Jangan pernah takut mati untuk hidup.

Dan jangan pernah takut hidup untuk mati.”

(Penulis)

Page 5: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

v

PERSEMBAHAN

1. Kedua orang tua

2. Arofiah

3. Afif, Prima, Hedik, Fakrunnisak

4. Teman ku Endro, Beni, KCX, dan lain-lain

5. TI angkatan 2009 dan 2010

Page 6: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

vi

KATA PENGANTAR

Segala puji dan syukur penulis ucapkan kepada Allah SWT, yang hanya karena rahmat dan

karunia-Nya, penulis dapat menyelesaikan Tugas Akhir dengan judul “Koreksi Input Tekstual

Menggunakan Jaro-Winkler Distance dan Stemming dengan Algoritma Nazief dan Andriani

untuk Deteksi Dini Hama dan Penyakit pada Tanaman Padi”. Penulis menyadari akan

keterbatasan yang dimiliki. Begitu banyak bantuan dan bimbingan yang diberikan dalam

penyusunan Tugas Akhir ini. Oleh karena itu, penulis mengucapkan terima kasih kepada :

1. Ayah, Ibu, selaku orang tua yang senantiasa memberikan kasih sayang, doa, dukungan

dan motivasi tiada henti.

2. Bapak Ristu Saptono, S.Si., M.T. selaku Dosen Pembimbing I yang penuh kesabaran

membimbing, mengarahkan dan memberi motivasi kepada penulis selama proses

penyusunan Tugas Akhir ini,

3. Bapak Meiyanto Eko Sulistyo S.T., M.Eng. selaku Dosen Pembimbing II yang telah

memberikan pengarahan dan masukan selama proses penyusunan Tugas Akhir ini,

4. Bapak Didiek Sri Wiyono S.T., M.T. dan Ibu Esti Suryani S.Si., M. Kom. sebagai

Pembimbing Akademik yang telah memberikan bimbingan dan pengarahan selama

Penulis menempuh studi di Program Studi Informatika,

5. Ibu Sari Widya Sihwi, S.Kom., M.T.I dan Bapak Afrizal Doewes, S.Kom., M.Sc. selaku

anggota penguji yang telah memberikan masukan, kritik dan saran yang membangun,

6. Teman-teman informatika angkatan 2009 dan 2010 yang senantiasa selalu berbagi

pengetahuan, pengalaman, dan memberikan dukungan dan motivasi.

Semoga Tugas Akhir ini dapat memberikan manfaat sekaligus inspirasi kepada pembaca.

Surakarta, 26 Oktober 2015

Penulis

Page 7: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

vii

KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE

DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK

DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI

FAIRLY OKTA’MAL

Program Studi Informatika. Fakultas Matematika dan Ilmu Pengetahuan Alam.

Universitas Sebelas Maret

ABSTRAK

Deteksi hama dan penyakit tanaman padi sangat dibutuhkan untuk mendapatkan hasil

panen yang maksimal. Pada kasus yang kerap terjadi, petani sering kali menganggap bahwa

untuk mengatasi berbagai gejala penyakit tanaman yang berbeda hanya dibutuhkan suatu

penanggulangan yang sama. Padahal kesalahan dalam penaggulangan hama dan penyakit

berakibat berkurangnya hasil panen.

Penelitian ini digunakan metode Stemming dengan algoritma Nazief dan Andriani untuk

menyederhanakan database yang digunakan untuk mendeteksi inputan user. Jika inputan user

terjadi kesalahan, maka akan dicari kemiripan teks gejala dengan menggunakan algoritma Jaro-

Winkler Distance selanjutnya inputan diidentifikasi dengan menggunakan Hamming Distance.

Pada penelitian ini, data gejala pada percobaan pertama diperoleh dari input random sedangkan

pada percobaan kedua, data diperoleh dari hasil survey di Desa Pondok Kabupaten Sukoharjo.

Pada percobaan input didapatkan hasil akurasi sebesar 99%. Pada percobaan output

didapatkan nilai akurasi sebesar 98%, nilai precision 94,86%, dan nilai recall 98,15%.

Kata Kunci — Hama dan Penyakit Padi, Hamming Distance, Jaro-Winkler Distance, Stemming

Nazief dan Andriani.

Page 8: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

viii

TEXTUAL INPUT CORRECTION USING JARO-WINKLER ALGORITHM AND

STEMMING WITH AN NAZIEF AND ANDRIANI ALGORITHM FOR EARLY

DETECTION OF PESTS AND DISEASE IN RICE PLANTS

FAIRLY OKTA’MAL

Department of Informatics. Faculty of Mathematics and Natural Sciences

Sebelas Maret University

ABSTRACT

The detection of pests and diseases of rice plant is urgently needed to get the maximum

crop yields. In the case that often occur, farmers often assume that to solve variety symptoms of

diseases from different crops need the same method. In fact, it need different method and the

wrong method to cope with the problem can reduce of harvest's result.

This research using Nazief Stemming algorithm and Andriani to simplify the database

that can be used to detect the input from user. If the user's input has any mistake, the text

similarity will be searched using jaro wrinkler distance algorithm, then it will be identified with

humming distance. In this study, the symptom’s data in the first experiments using random input,

while in the second experiment, the symptom's data is obtained from the survey which is held in

Pondok Village district Sukoharjo.

In the input experiment, it showed an accuracy of 99%. The result of the output

experiment produce 98% accuracy, 94,86% precision and 98,15% of recall value.

Keywords: Hamming Distance, Jaro Winkler Distance, Pests and Diseases of Rice Plants,

Stemming Nazief and Andriani.

Page 9: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

ix

DAFTAR ISI

HALAMAN JUDUL ............................................................................................ i

HALAMAN PERSETUJUAN............................................................................. ii

HALAMAN PENGESAHAN ............................................................................. ii

MOTTO ……….................................................................................................. iv

PERSEMBAHAN ................................................................................................. v

KATA PENGANTAR ......................................................................................... vi

ABSTRAK .................................................................................................. vii

ABSTRACT ................................................................................................. viii

DAFTAR ISI ................................................................................................... ix

DAFTAR TABEL .............................................................................................. xii

DAFTAR GAMBAR ........................................................................................ xiii

DAFTAR LAMPIRAN ...................................................................................... xii

BAB I PENDAHULUAN ................................... Error! Bookmark not defined.

1.1 Latar Belakang ........................................ Error! Bookmark not defined.

1.2 Rumusan Masalah .....................................................................................2

1.3 Batasan Masalah ........................................................................................2

1.4 Tujuan Penelitian .......................................................................................3

1.5 Manfaat Penelitian.....................................................................................3

1.6 Sistematika Penulisan ................................................................................3

BAB II LANDASAN TEORI ............................................................................... 5

2.1 Dasar Teori ................................................................................................5

2.1.1 Hama dan Penyakit Tanaman Padi ....................................................5

2.1.2 Preprocessing Input ...........................................................................5

2.1.2.1 Stemming .....................................................................................5

2.1.2.1.1 Algoritma Nazief dan Andriani ...........................................6

Page 10: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

x

2.1.3 Jaro-Winkler Distance .......................................................................7

2.1.3 Hamming Distance.............................................................................9

2.1.3 Tanaman Padi.....................................................................................9

2.2 Penelitian Terkait .....................................................................................10

2.3 Kerangka Pemikiran ................................................................................12

BAB III METODOLOGI PENELITIAN ........................................................... 13

3.1 Tahap Penelitian ......................................................................................13

3.1.1 Pengumpulan Data ...........................................................................13

3.1.2 Pemodelan Data ...............................................................................13

3.1.3 Implementasi ....................................................................................13

3.1.3.1 Proses Deteksi Input Gejala User .............................................14

3.1.3.2 Proses Deteksi Hama dan Penyakit Tanaman Padi...................15

3.1.4 Pengembangan Aplikasi ...................................................................15

3.1.5 Pengujian dan Analisis Hasil ...........................................................16

BAB IV HASIL DAN PEMBAHASAN ............................................................ 17

4.1 Deskripasi Data .......................................................................................17

4.2 Implementasi ..........................................................................................20

4.2.1 Deteksi Input Gejala ........................................................................20

4.2.2 Identifikasi Term Kata ....................................................................21

4.2.3 Identifikasi Input Gejala User ..........................................................24

4.2.4 Deteksi Hama dan Penyakit Tanaman Padi .....................................25

4.3 Pengembangan Aplikasi ..........................................................................25

4.4 Pengujian .................................................................................................27

4.4.1 Pengujian Identifikasi Input .............................................................27

4.4.2 Pengujian Identifikasi Output .........................................................27

4.5 Analisis Hasil ..........................................................................................27

BAB V PENUTUP .............................................................................................. 28

Page 11: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

xi

5.1 Kesimpulan..............................................................................................28

5.2 Saran ........................................................................................................28

DAFTAR PUSTAKA .......................................................................................... 29

Page 12: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

xii

DAFTAR TABEL

Tabel 4.1 Daftar penyakit .................................................................................... 17

Tabel 4.2 Daftar Gejala ....................................................................................... 18

Tabel 4.3 Hubungan Antara Gejala dan Penyakit ............................................... 19

Tabel 4.4 Contoh Input Gejala oleh User ........................................................... 20

Tabel 4.5 Hasil deteksi Term Kata oleh Aplikasi ................................................ 21

Tabel 4.6 Table Gejala yang Terdeteksi oleh Sistem .......................................... 21

Tabel 4.7 Table Gejala yang Terdeteksi oleh Sistem .......................................... 25

Page 13: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

xiii

DAFTAR GAMBAR

Gambar 3.1 Alur Implementasi ...................................................................... 14

Gambar 4.1 Penentuan Transposisi dan Karakter Sama Persis antara “danu” dengan “daun”

................................................................................................... 22

Gambar 4.2 Penentuan Transposisi dan Karakter Sama Persis antara “kuneng” dengan

“kuning” .................................................................................... 23

Gambar 4.3 Penentuan Transposisi dan Karakter Sama Persis antara “menggulug” dengan

“menggulung” ........................................................................... 24

Gambar 4.4 Textarea Input Gejala ................................................................. 26

Gambar 4.5 Identifikasi Input dan Output Hama dan Penyakit ..................... 26

Page 14: SKRIPSI KOREKSI INPUT TEKSTUAL MENGGUNAKAN JARO-WINKLER DISTANCE DAN STEMMING DENGAN ALGORITMA NAZIEF DAN ANDRIANI UNTUK DETEKSI DINI HAMA DAN PENYAKIT PADA TANAMAN PADI SKRIPSI

xiv

DAFTAR LAMPIRAN

LAMPIRAN A ................................................................................................ 30

LAMPIRAN B ................................................................................................ 31

LAMPIRAN C ................................................................................................ 36