PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis,...
Transcript of PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE … awal.pdfdisease namely Psoriasis, Seboreic dermatitis,...
PERBANDINGAN PENERAPAN
DISTANCE, DAN
NEAREST NEIGHBOR
PUTU RIKA PRATAMA ANGGARANI
PROGRAM STUDI TEK
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE,
, DAN ADAPTIVE DISTANCE MEASURE DALAM
NEAREST NEIGHBOR PADA IDENTIFIKASI PENYAKIT KULIT
KOMPETENSI KOMPUTASI
SKRIPSI
PUTU RIKA PRATAMA ANGGARANI
NIM. 1108605006
PROGRAM STUDI TEKNIK INFORMATIKAJURUSAN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAMUNIVERSITAS UDAYANA
BUKIT JIMBARAN 2015
, MANHATTAN
DALAM K-
PADA IDENTIFIKASI PENYAKIT KULIT
NIK INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
ii
SURAT PERNYATAAN KEASLIAN KARYA ILMIAH
Yang bertanda tangan di bawah ini menyatakan bahwa naskah Skripsi dengan
judul :
“Perbandingan Penerapan Euclidean Distance, Manhattan Distance, Dan
Adaptive Distance Measure Dalam K-Nearest Neighbor Pada Identifikasi
Penyakit Kulit”
Nama : Putu Rika Pratama Anggarani
NIM : 1108605006
Program Studi : Teknik Informatika
E-mail : [email protected]
Nomor telp/HP : 087761125688
Alamat : Jl.Maluku 3, gg I/7, Denpasar Barat
Belum pernah dipublikasikan dalam dokumen skripsi, jurnal nasional maupun
internasional atau dalam prosiding manapun, dan tidak sedang atau akan diajukan
untuk publikasi di jurnal atau prosiding manapun. Apabila di kemudian hari
terbukti terdapat pelanggaran kaidah – kaidah akademik pada karya ilmiah saya,
maka saya bersedia menanggung sanksi-sanksi yang dijatuhkan karena kesalahan
tersebut, sebagaimana diatur oleh Peraturan Menteri Pendidikan Nasional Nomor
17 Tahun 2010 tentang Pencegahan dan Penanggulangan Plagiat di Perguruan
Tinggi.
Demikian Surat Pernyataan ini saya buat dengan sesungguhnya untuk dapat
dipergunakan bilamana diperlukan.
Denpasar, 30 September 2015
Yang membuat pernyataan,
(Putu Rika Pratama Anggarani)
NIM. 1108605006
iii
PERBANDINGAN PENERAPAN EUCLIDEAN DISTANCE, MANHATTAN
DISTANCE, DAN ADAPTIVE DISTANCE MEASURE DALAM K-
NEAREST NEIGHBOR PADA IDENTIFIKASI PENYAKIT KULIT
KOMPETENSI KOMPUTASI
[SKRIPSI]
Sebagai syarat untuk memperoleh gelar Sarjana Komputer
pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas udayana
Tulisan ini merupakan hasil penelitian yang belum pernah dipublikasikan
PUTU RIKA PRATAMA ANGGARANI
NIM. 1108605006
Pembimbing I
I Made Widiartha, S.Si, M.Kom
NIP. 198212202008011008
Pembimbing II
I Gede Santi Astawa, S.T., M.Cs
NIP.198012062006041003
iv
LEMBAR PENGESAHAN TUGAS AKHIR
Judul Skripsi : Perbandingan Penerapan Euclidean Distance, Manhattan
Distance, dan Adaptive Distance Measure dalam K-
Nearest Neighbor Pada Identifikasi Penyakit Kulit
Kompetensi : Komputasi
Nama : Putu Rika Pratama Anggarani
NIM : 1108605006
Tanggal Seminar : 15/10/2015
Disetujui oleh:
Pembimbing I
I Made Widiartha, S.Si., M.Kom.
NIP. 198212202008011008
Penguji I
Agus Muliantara, S.Kom., M.Kom.
NIP. 198006162005011001
Pembimbing II
I Gede Santi Astawa, S.T., M.Cs.
NIP. 198012062006041003
Penguji II
Ida Bagus Gede Dwidasmara, S.Kom., M.Cs.
NIP. 198503152010121007
Penguji III
I Putu Gede Hendra Suputra, S.Kom., M.Kom.
NIP. 198812282014041001
Mengetahui,
Jurusan Ilmu Komputer FMIPA UNUD
Ketua,
I Komang Ari Mogi, S.Kom., M.Kom
NIP. 198409242008011007
v
Judul : Perbandingan Penerapan Euclidean Distance, Manhattan Distance, dan Adaptive Distance Measure dalam K-Nearest Neighbor Pada Identifikasi Penyakit Kulit
Nama : Putu Rika Pratama Anggarani NIM : 1108605006 Pembimbing I : I Made Widiartha, S.Si, M.Kom. Pembimbing II : I Gede Santi Astawa, S.T., M.Cs.
ABSTRAK
Penalaran berbasis kasus (Case-Based Reasoning) merupakan salah satu teknik penalaran yang sering digunakan dalam sistem pakar yang menggunakan pengalaman lama atau kasus-kasus lama untuk menyelesaikan masalah baru. Metode penalaran berbasis kasus berkembang setelah diketahui bahwa kasus-kasus sukses di masa lalu ternyata dapat dipakai sebagai acuan dalam pengambilan keputusan jika terdapat kemiripan dalam beberapa kondisi. Pada penelitian sebelumnya algoritma Nearest Neighbor dengan menggunakan Adaptive Distance Measure memiliki akurasi yang lebih baik dalam melakukan pencarian kemiripan dibandingkan dengan algoritma Nearest Neighbor. Sehingga pada penelitian ini penulis menggunakan Nearest Neighbor dengan Adaptive Distance Measure. Untuk melihat keunggulan Adaptive Distance Measure, penulis membandingkan dengan Euclidean Distance, dan Manhattan distance. Studi kasus pada penelitian ini adalah mencari kelasifikasi dari 6 kelas penyakit kulit yaitu Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, dan Pityriasis rubra pilaris. Data penelitian yang digunakan adalah dataset penyakit kulit yang didapat dari uci.edu. dataset berjumlah 358 yang telah dibagi menjadi 2 kelomok data yaitu 250 data untuk data training dan 108 data untuk data testing. Dari penelitian ini dihasilkan bahwa algoritma penghitungan jarak Euclidean Distance, Manhattan Distance, dan Adaptive Distance Measure dapat digunakan untuk menghitung jarak similarity dalam algoritma Nearest Neighbor. Berdasarkan dari hasil pengujian perubahan jumlah k mempengaruhi akurasi yang dihasilkan oleh algoritma Euclidean Distance, Manhattan Distance, dan Adaptive Distance Measure. Manhattan Distance memiliki akurasi yang paling baik dengan jumlah akurasi tertinggi yaitu 98.15%, sedangkan Euclidean Distance dan Adaptive Distance Mesure memiliki jumlah eror terendah 97.22%.
Kata kunci : K-Nearest Neighbor, Adaptive Distance Measure, penyakit kulit.
vi
Title : A comparison of the application of Euclidean Distance, Manhattan Distance, and the Adaptive Distance Measure in K-Nearest Neighbor On the identification of skin diseases
Name : Putu Rika Pratama Anggarani NIM : 1108605006 Supervisor : I Made I Widiartha, S.Si, m. Kom. Supervisor II : I Gede Santi Astawa, S.T., M.Cs.
ABSTRACT
Case-based reasoning is one of the techniques frequently used reasoning in expert system that uses old experiences or old cases to solve new problems. Case-based reasoning methods developed after it is known that successful cases in the past turned out to be used as a reference in decisions if there are similarities in some conditions. Previous research on the Nearest Neighbor algorithm using Adaptive Distance Measure has better accuracy in searching similarities compared with the Nearest Neighbor algorithm. So in this study the author uses Nearest Neighbor with Adaptive Distance Measure. To see the superiority of Adaptive Distance Measure, the author compares with the Euclidean Distance, Manhattan distance and. Case study on research is looking for clasification of the 6 classes of the skin disease namely Psoriasis, Seboreic dermatitis, Lichen planus, Pityriasis rosea, Cronic dermatitis, and Pityriasis rubra pilaris. Research data used is skin disease datasets obtained from uci.edu. datasets amounted to 358 which has been divided into 2, 250 data for the training data and 108 data for testing data. From this research generated Euclidean distance calculation algorithm that Distance, Manhattan Distance, and Adaptive Distance Measure can be used to calculate the distance of the Nearest Neighbor algorithm in similarity. Based on the results of testing changes the amount of k affects the accuracy of the generated by the Euclidean Distance, Manhattan Distance, and Adaptive Distance Measure algorithm. Manhattan Distance have the best accuracy with the highest amount of accuracy 98.15%, where as Euclidean Distance and Adaptive Distance Measure has amount of accuracy 97.22%.
Keywords: K-Nearest Neighbor, adaptive distance measure, skin disease.
vii
KATA PENGANTAR
Puji syukur penulis panjatkan kepada Tuhan Yang Maha Esa, karena berkat rahmat dan karunia-Nya, Tugas Akhir dengan judul “Perbandingan Penerapan Euclidean Distance, Manhattan Distance, dan Adaptive Distance Measure dalam K-Nearest Neighbor Pada Identifikasi Penyakit Kulit” ini dapat diselesaikan tepat pada waktu yang diberikan. Secara khusus penulis mengucapkan terima kasih dan penghargaan kepada berbagai pihak yang telah membantu tugas akhir ini, yaitu : 1. Bapak I Made Widiartha, S.Si, M.Kom sebagai Pembimbing I yang telah
bersedia mengkritisi, membantu dan memeriksa serta menyempurnakan proposal ini.
2. Bapak I Gede Santi Astawa, S.T., M.Cs sebagai Pembimbing II yang telah bersedia mengkritisi, membantu dan memeriksa serta menyempurnakan proposal ini.
3. Bapak dan Ibu dosen di Jurusan Ilmu Komputer yang telah meluangkan waktu turut memberikan saran dan masukan dalam penyempurnaan proposal ini.
4. Komisi Tugas Akhir Jurusan Ilmu Komputer FMIPA UNUD, yang telah memberikan petunjuk dalam penyusunan proposal tugas akhir ini.
5. Rekan-rekan mahasiswa yang telah memberi dukungan, motivasi, semangat dan kerja sama dalam pembuatan proposal tugas akhir ini.
6. Keluarga dan kerabat serta semua pihak yang turut serta memberi dukungan sehingga laporan ini dapat diselesaikan sesuai dengan waktu yang ditentukan.
Pada akhirnya penulis berharap agar adanya perbaikan pada Tugas Akhir ini mengingat keterbatasan penulis, sehingga sangat diharapkan untuk adanya kritik dan saran yang membangun untuk pencapaian yang lebih baik.
Denpasar, Oktober 2015
Penulis
viii
DAFTAR ISI
LEMBAR PENGESAHAN TUGAS AKHIR ...................................................... iv
KATA PENGANTAR ....................................................................................... vii
DAFTAR ISI .................................................................................................... viii
DAFTAR GAMBAR ........................................................................................... x
DAFTAR TABEL .............................................................................................. xi
BAB I PENDAHULUAN .................................................................................... 1
1.1 Latar Belakang ......................................................................................... 1
1.2 Rumusan Masalah .................................................................................... 2
1.3 Tujuan Penelitian ...................................................................................... 2
1.4 Batasan Masalah ....................................................................................... 3
1.5 Manfaat Penelitian .................................................................................... 3
1.6 Metodelogi Penelitian ............................................................................... 3
1.6.1 Data Penelitian ......................................................................... 3
1.6.2 Metode yang Digunakan ........................................................... 6
1.6.3 Evaluasi dan Pengujian ........................................................... 10
BAB II TINJAUAN PUSTAKA ........................................................................ 11
2.1 Penyakit Kulit ........................................................................................ 11
2.2 Sistem Pakar ........................................................................................... 11
2.3 Case-Based Reasoning ........................................................................... 12
2.4 Jenis Data ............................................................................................... 13
2.4.1 Katagorik (Kualitatif) ............................................................. 13
a. Nominal ................................................................................. 13
b. Ordinal ................................................................................... 14
2.4.2 Numerik (Kuantitatif) ............................................................. 14
a. Interval ................................................................................... 14
b. Rasio ...................................................................................... 14
2.5 K-Nearest Neighbor................................................................................ 14
BAB III ANALISIS DAN PERANCANGAN .................................................... 16
3.1 Flowchart Alur Pengujian ....................................................................... 16
3.2 Flowchart K-Nearest Neighbor............................................................... 17
3.3 Data Penelitian ....................................................................................... 22
BAB IV HASIL DAN PEMBAHASAN ............................................................ 23
4.1 Pengujian Data Kasus Baru .................................................................... 23
ix
4.1.1 Pengujian Data Kasus Baru Dengan Penghitungan Jarak Euclidean Distance ................................................................................. 23
4.1.2 Pengujian Data Kasus Baru Dengan Penghitungan Jarak Manhattan Distance ............................................................................... 26
4.1.3 Pengujian Data Kasus Baru Dengan Penghitungan Jarak Adaptive Distance Measure .................................................................... 29
4.2 Hasil Pengujian ...................................................................................... 33
4.2.1 Grafik Perbandingan Tingkat Eror .......................................... 33
BAB V KESIMPULAN DAN SARAN ............................................................. 35
5.1 Kesimpulan ............................................................................................ 35
5.2 Saran ...................................................................................................... 35
DAFTAR PUSTAKA ........................................................................................ 36
x
DAFTAR GAMBAR
Gambar 1. 1 Grafik Tingkat Eror ....................................................................... 10
Gambar 2. 1 Struktur Sistem Pakar .................................................................... 12
Gambar 3. 1 Flowchart Alur Pengujian .............................................................. 16
Gambar 3. 2 Flowchart Euclidean Distance ....................................................... 17
Gambar 3. 3 Flowchart Manhattan Distance ....................................................... 19
Gambar 3. 4 Flowchart Adaptive Distance Measure ........................................... 21
Gambar 4. 1 Implementasi Euclidean Distance .................................................. 25
Gambar 4. 2 Implementasi Manhattan Distance ................................................. 28
Gambar 4. 3 Implementasi Adaptive Distance Measure ..................................... 31
Gambar 4. 4 Implementasi hasil similarity ......................................................... 32
Gambar 4. 5 Grafik Perbandingan Tingkat Eror dari Euclidean Distance,
Manhattan Distance dan Adaptive Distance Measure ........................................ 33
xi
DAFTAR TABEL
Tabel 1. 1 Atribut Klinis ...................................................................................... 4
Tabel 1. 2 Atribut Penampakan Sel ...................................................................... 5
Tabel 1. 3 Contoh Kasus ...................................................................................... 7
Tabel 4. 1 Source code penghitungan jarak Euclidean Distance ......................... 23
Tabel 4. 2 Source code proses retrieve Euclidean Distance ................................ 24
Tabel 4. 3 Source code penghitungan Manhattan Distance ................................ 26
Tabel 4. 4 Source code proses retrieve Manhattan Distance ............................... 26
Tabel 4. 5 Source code proses retrieve Adaptive Distance Measure ................... 29