PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis,...

11
PERBANDINGAN DISTANCE, D NEAREST NEIG PU PROG FAKULTAS MA PENERAPAN EUCLIDEAN DISTANCE, DAN ADAPTIVE DISTANCE MEASURE D GHBOR PADA IDENTIFIKASI PENYAK KOMPETENSI KOMPUTASI SKRIPSI UTU RIKA PRATAMA ANGGARANI NIM. 1108605006 GRAM STUDI TEKNIK INFORMATIKA JURUSAN ILMU KOMPUTER ATEMATIKA DAN ILMU PENGETAHU UNIVERSITAS UDAYANA BUKIT JIMBARAN 2015 MANHATTAN DALAM K- KIT KULIT A UAN ALAM

Transcript of PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis,...

Page 1: PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris.

PERBANDINGAN PENERAPAN

DISTANCE, DAN

NEAREST NEIGHBOR

PUTU RIKA PRATAMA ANGGARANI

PROGRAM STUDI TEK

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE,

, DAN ADAPTIVE DISTANCE MEASURE DALAM

NEAREST NEIGHBOR PADA IDENTIFIKASI PENYAKIT KULIT

KOMPETENSI KOMPUTASI

SKRIPSI

PUTU RIKA PRATAMA ANGGARANI

NIM. 1108605006

PROGRAM STUDI TEKNIK INFORMATIKAJURUSAN ILMU KOMPUTER

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAMUNIVERSITAS UDAYANA

BUKIT JIMBARAN 2015

, MANHATTAN

DALAM K-

PADA IDENTIFIKASI PENYAKIT KULIT

NIK INFORMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Page 2: PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris.

ii

SURAT PERNYATAAN KEASLIAN KARYA ILMIAH

Yang bertanda tangan di bawah ini menyatakan bahwa naskah Skripsi dengan

judul :

“Perbandingan Penerapan Euclidean Distance, Manhattan Distance, Dan

Adaptive Distance Measure Dalam K-Nearest Neighbor Pada Identifikasi

Penyakit Kulit”

Nama : Putu Rika Pratama Anggarani

NIM : 1108605006

Program Studi : Teknik Informatika

E-mail : [email protected]

Nomor telp/HP : 087761125688

Alamat : Jl.Maluku 3, gg I/7, Denpasar Barat

Belum pernah dipublikasikan dalam dokumen skripsi, jurnal nasional maupun

internasional atau dalam prosiding manapun, dan tidak sedang atau akan diajukan

untuk publikasi di jurnal atau prosiding manapun. Apabila di kemudian hari

terbukti terdapat pelanggaran kaidah – kaidah akademik pada karya ilmiah saya,

maka saya bersedia menanggung sanksi-sanksi yang dijatuhkan karena kesalahan

tersebut, sebagaimana diatur oleh Peraturan Menteri Pendidikan Nasional Nomor

17 Tahun 2010 tentang Pencegahan dan Penanggulangan Plagiat di Perguruan

Tinggi.

Demikian Surat Pernyataan ini saya buat dengan sesungguhnya untuk dapat

dipergunakan bilamana diperlukan.

Denpasar, 30 September 2015

Yang membuat pernyataan,

(Putu Rika Pratama Anggarani)

NIM. 1108605006

Page 3: PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris.

iii

PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE, MANHATTAN

DISTANCE, DAN ADAPTIVE DISTANCE MEASURE DALAM K-

NEAREST NEIGHBOR PADA IDENTIFIKASI PENYAKIT KULIT

KOMPETENSI KOMPUTASI

[SKRIPSI]

Sebagai syarat untuk memperoleh gelar Sarjana Komputer

pada Fakultas Matematika dan Ilmu Pengetahuan Alam

Universitas udayana

Tulisan ini merupakan hasil penelitian yang belum pernah dipublikasikan

PUTU RIKA PRATAMA ANGGARANI

NIM. 1108605006

Pembimbing I

I Made Widiartha, S.Si, M.Kom

NIP. 198212202008011008

Pembimbing II

I Gede Santi Astawa, S.T., M.Cs

NIP.198012062006041003

Page 4: PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris.

iv

LEMBAR PENGESAHAN TUGAS AKHIR

Judul Skripsi : Perbandingan Penerapan Euclidean Distance, Manhattan

Distance, dan Adaptive Distance Measure dalam K-

Nearest Neighbor Pada Identifikasi Penyakit Kulit

Kompetensi : Komputasi

Nama : Putu Rika Pratama Anggarani

NIM : 1108605006

Tanggal Seminar : 15/10/2015

Disetujui oleh:

Pembimbing I

I Made Widiartha, S.Si., M.Kom.

NIP. 198212202008011008

Penguji I

Agus Muliantara, S.Kom., M.Kom.

NIP. 198006162005011001

Pembimbing II

I Gede Santi Astawa, S.T., M.Cs.

NIP. 198012062006041003

Penguji II

Ida Bagus Gede Dwidasmara, S.Kom., M.Cs.

NIP. 198503152010121007

Penguji III

I Putu Gede Hendra Suputra, S.Kom., M.Kom.

NIP. 198812282014041001

Mengetahui,

Jurusan Ilmu Komputer FMIPA UNUD

Ketua,

I Komang Ari Mogi, S.Kom., M.Kom

NIP. 198409242008011007

Page 5: PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris.

v

Judul : Perbandingan Penerapan Euclidean Distance, Manhattan Distance, dan Adaptive Distance Measure dalam K-Nearest Neighbor Pada Identifikasi Penyakit Kulit

Nama : Putu Rika Pratama Anggarani NIM : 1108605006 Pembimbing I : I Made Widiartha, S.Si, M.Kom. Pembimbing II : I Gede Santi Astawa, S.T., M.Cs.

ABSTRAK

Penalaran berbasis kasus (Case-Based Reasoning) merupakan salah satu teknik penalaran yang sering digunakan dalam sistem pakar yang menggunakan pengalaman lama atau kasus-kasus lama untuk menyelesaikan masalah baru. Metode penalaran berbasis kasus berkembang setelah diketahui bahwa kasus-kasus sukses di masa lalu ternyata dapat dipakai sebagai acuan dalam pengambilan keputusan jika terdapat kemiripan dalam beberapa kondisi. Pada penelitian sebelumnya algoritma Nearest Neighbor dengan menggunakan Adaptive Distance Measure memiliki akurasi yang lebih baik dalam melakukan pencarian kemiripan dibandingkan dengan algoritma Nearest Neighbor. Sehingga pada penelitian ini penulis menggunakan Nearest Neighbor dengan Adaptive Distance Measure. Untuk melihat keunggulan Adaptive Distance Measure, penulis membandingkan dengan Euclidean Distance, dan Manhattan distance. Studi kasus pada penelitian ini adalah mencari kelasifikasi dari 6 kelas penyakit kulit yaitu Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, dan Pityriasis rubra pilaris. Data penelitian yang digunakan adalah dataset penyakit kulit yang didapat dari uci.edu. dataset berjumlah 358 yang telah dibagi menjadi 2 kelomok data yaitu 250 data untuk data training dan 108 data untuk data testing. Dari penelitian ini dihasilkan bahwa algoritma penghitungan jarak Euclidean Distance, Manhattan Distance, dan Adaptive Distance Measure dapat digunakan untuk menghitung jarak similarity dalam algoritma Nearest Neighbor. Berdasarkan dari hasil pengujian perubahan jumlah k mempengaruhi akurasi yang dihasilkan oleh algoritma Euclidean Distance, Manhattan Distance, dan Adaptive Distance Measure. Manhattan Distance memiliki akurasi yang paling baik dengan jumlah akurasi tertinggi yaitu 98.15%, sedangkan Euclidean Distance dan Adaptive Distance Mesure memiliki jumlah eror terendah 97.22%.

Kata kunci : K-Nearest Neighbor, Adaptive Distance Measure, penyakit kulit.

Page 6: PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris.

vi

Title : A comparison of the application of Euclidean Distance, Manhattan Distance, and the Adaptive Distance Measure in K-Nearest Neighbor On the identification of skin diseases

Name : Putu Rika Pratama Anggarani NIM : 1108605006 Supervisor : I Made I Widiartha, S.Si, m. Kom. Supervisor II : I Gede Santi Astawa, S.T., M.Cs.

ABSTRACT

Case-based reasoning is one of the techniques frequently used reasoning in expert system that uses old experiences or old cases to solve new problems. Case-based reasoning methods developed after it is known that successful cases in the past turned out to be used as a reference in decisions if there are similarities in some conditions. Previous research on the Nearest Neighbor algorithm using Adaptive Distance Measure has better accuracy in searching similarities compared with the Nearest Neighbor algorithm. So in this study the author uses Nearest Neighbor with Adaptive Distance Measure. To see the superiority of Adaptive Distance Measure, the author compares with the Euclidean Distance, Manhattan distance and. Case study on research is looking for clasification of the 6 classes of the skin disease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris. Research data used is skin disease datasets obtained from uci.edu. datasets amounted to 358 which has been divided into 2, 250 data for the training data and 108 data for testing data. From this research generated Euclidean distance calculation algorithm that Distance, Manhattan Distance, and Adaptive Distance Measure can be used to calculate the distance of the Nearest Neighbor algorithm in similarity. Based on the results of testing changes the amount of k affects the accuracy of the generated by the Euclidean Distance, Manhattan Distance, and Adaptive Distance Measure algorithm. Manhattan Distance have the best accuracy with the highest amount of accuracy 98.15%, where as Euclidean Distance and Adaptive Distance Measure has amount of accuracy 97.22%.

Keywords: K-Nearest Neighbor, adaptive distance measure, skin disease.

Page 7: PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris.

vii

KATA PENGANTAR

Puji syukur penulis panjatkan kepada Tuhan Yang Maha Esa, karena berkat rahmat dan karunia-Nya, Tugas Akhir dengan judul “Perbandingan Penerapan Euclidean Distance, Manhattan Distance, dan Adaptive Distance Measure dalam K-Nearest Neighbor Pada Identifikasi Penyakit Kulit” ini dapat diselesaikan tepat pada waktu yang diberikan. Secara khusus penulis mengucapkan terima kasih dan penghargaan kepada berbagai pihak yang telah membantu tugas akhir ini, yaitu : 1. Bapak I Made Widiartha, S.Si, M.Kom sebagai Pembimbing I yang telah

bersedia mengkritisi, membantu dan memeriksa serta menyempurnakan proposal ini.

2. Bapak I Gede Santi Astawa, S.T., M.Cs sebagai Pembimbing II yang telah bersedia mengkritisi, membantu dan memeriksa serta menyempurnakan proposal ini.

3. Bapak dan Ibu dosen di Jurusan Ilmu Komputer yang telah meluangkan waktu turut memberikan saran dan masukan dalam penyempurnaan proposal ini.

4. Komisi Tugas Akhir Jurusan Ilmu Komputer FMIPA UNUD, yang telah memberikan petunjuk dalam penyusunan proposal tugas akhir ini.

5. Rekan-rekan mahasiswa yang telah memberi dukungan, motivasi, semangat dan kerja sama dalam pembuatan proposal tugas akhir ini.

6. Keluarga dan kerabat serta semua pihak yang turut serta memberi dukungan sehingga laporan ini dapat diselesaikan sesuai dengan waktu yang ditentukan.

Pada akhirnya penulis berharap agar adanya perbaikan pada Tugas Akhir ini mengingat keterbatasan penulis, sehingga sangat diharapkan untuk adanya kritik dan saran yang membangun untuk pencapaian yang lebih baik.

Denpasar, Oktober 2015

Penulis

Page 8: PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris.

viii

DAFTAR ISI

LEMBAR PENGESAHAN TUGAS AKHIR ...................................................... iv

KATA PENGANTAR ....................................................................................... vii

DAFTAR ISI .................................................................................................... viii

DAFTAR GAMBAR ........................................................................................... x

DAFTAR TABEL .............................................................................................. xi

BAB I PENDAHULUAN .................................................................................... 1

1.1 Latar Belakang ......................................................................................... 1

1.2 Rumusan Masalah .................................................................................... 2

1.3 Tujuan Penelitian ...................................................................................... 2

1.4 Batasan Masalah ....................................................................................... 3

1.5 Manfaat Penelitian .................................................................................... 3

1.6 Metodelogi Penelitian ............................................................................... 3

1.6.1 Data Penelitian ......................................................................... 3

1.6.2 Metode yang Digunakan ........................................................... 6

1.6.3 Evaluasi dan Pengujian ........................................................... 10

BAB II TINJAUAN PUSTAKA ........................................................................ 11

2.1 Penyakit Kulit ........................................................................................ 11

2.2 Sistem Pakar ........................................................................................... 11

2.3 Case-Based Reasoning ........................................................................... 12

2.4 Jenis Data ............................................................................................... 13

2.4.1 Katagorik (Kualitatif) ............................................................. 13

a. Nominal ................................................................................. 13

b. Ordinal ................................................................................... 14

2.4.2 Numerik (Kuantitatif) ............................................................. 14

a. Interval ................................................................................... 14

b. Rasio ...................................................................................... 14

2.5 K-Nearest Neighbor................................................................................ 14

BAB III ANALISIS DAN PERANCANGAN .................................................... 16

3.1 Flowchart Alur Pengujian ....................................................................... 16

3.2 Flowchart K-Nearest Neighbor............................................................... 17

3.3 Data Penelitian ....................................................................................... 22

BAB IV HASIL DAN PEMBAHASAN ............................................................ 23

4.1 Pengujian Data Kasus Baru .................................................................... 23

Page 9: PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris.

ix

4.1.1 Pengujian Data Kasus Baru Dengan Penghitungan Jarak Euclidean Distance ................................................................................. 23

4.1.2 Pengujian Data Kasus Baru Dengan Penghitungan Jarak Manhattan Distance ............................................................................... 26

4.1.3 Pengujian Data Kasus Baru Dengan Penghitungan Jarak Adaptive Distance Measure .................................................................... 29

4.2 Hasil Pengujian ...................................................................................... 33

4.2.1 Grafik Perbandingan Tingkat Eror .......................................... 33

BAB V KESIMPULAN DAN SARAN ............................................................. 35

5.1 Kesimpulan ............................................................................................ 35

5.2 Saran ...................................................................................................... 35

DAFTAR PUSTAKA ........................................................................................ 36

Page 10: PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris.

x

DAFTAR GAMBAR

Gambar 1. 1 Grafik Tingkat Eror ....................................................................... 10

Gambar 2. 1 Struktur Sistem Pakar .................................................................... 12

Gambar 3. 1 Flowchart Alur Pengujian .............................................................. 16

Gambar 3. 2 Flowchart Euclidean Distance ....................................................... 17

Gambar 3. 3 Flowchart Manhattan Distance ....................................................... 19

Gambar 3. 4 Flowchart Adaptive Distance Measure ........................................... 21

Gambar 4. 1 Implementasi Euclidean Distance .................................................. 25

Gambar 4. 2 Implementasi Manhattan Distance ................................................. 28

Gambar 4. 3 Implementasi Adaptive Distance Measure ..................................... 31

Gambar 4. 4 Implementasi hasil similarity ......................................................... 32

Gambar 4. 5 Grafik Perbandingan Tingkat Eror dari Euclidean Distance,

Manhattan Distance dan Adaptive Distance Measure ........................................ 33

Page 11: PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris.

xi

DAFTAR TABEL

Tabel 1. 1 Atribut Klinis ...................................................................................... 4

Tabel 1. 2 Atribut Penampakan Sel ...................................................................... 5

Tabel 1. 3 Contoh Kasus ...................................................................................... 7

Tabel 4. 1 Source code penghitungan jarak Euclidean Distance ......................... 23

Tabel 4. 2 Source code proses retrieve Euclidean Distance ................................ 24

Tabel 4. 3 Source code penghitungan Manhattan Distance ................................ 26

Tabel 4. 4 Source code proses retrieve Manhattan Distance ............................... 26

Tabel 4. 5 Source code proses retrieve Adaptive Distance Measure ................... 29