Slide DM 09 K-Nearest Neighbour

download Slide DM 09 K-Nearest Neighbour

of 21

Transcript of Slide DM 09 K-Nearest Neighbour

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    1/21

    Data Mining

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    2/21

    Overview

    NN adalah pendekatan untuk mencari kasusdengan menghitung antara kasus baru dengankasus lama, yaitu dengan berdasarkan kpdpencocokan bobot dari jumlah fitur yang ada.

    Contoh; jika diinginkan mencari solusi terhadap seorang pasien

    baru dengan menggunakan solusi dari pasienterdahulu.

    Untuk mencari kasus pasien lain mana yang akan

    digunakan, maka akan dihitung kedekatan kasuspasien baru dengan semua pasien lama.

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    3/21

    B

    (lama)

    A

    (lama)

    C

    (baru) d1

    d2

    Dua pasien lama A dan B. Ketika ada pasien baru C,

    maka akan dicari solusi dari pasien yg terdekat.

    Seandainya d1 dan d2 adalah kedekatan antara C

    dgn A dan B, maka solusi dari pasien B lah yg akan

    digunakan sebagai solusi utk pasien baru C

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    4/21

    Rumus utk melakukan penghitungan

    kedekatan antara dua kasus

    n

    f(Ti, Si) * Wii=1

    Similarity (T,S) =

    Wi Keterangan:

    T : kasus baru

    S : kasus yg ada dlm penyimpanan

    n : jumlah atribut dlm setiap kasus i : atribut individu antara 1 s.d n

    f : fungsi similarity atribut i antara kasus T dan kasus S

    W : bobot yg diberikan pada atribut ke-i

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    5/21

    Kedekatan umumnya berada pada nilai antara

    0 dan 1

    Nilai 0 kedua kasus mutlak tdk mirip

    Nilai 1

    mirip dengan mutlak

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    6/21

    Contoh Kasus :

    Untuk menentukan seorang calon nasabahakan bermasalah atau tdk bermasalah, kriteriayg diperlukan meliputi:

    Jenis kelamin Pendidikan

    Agama

    Salah satu atribut merupakan data solusi peritem data yg disebut target atributmisalnyaatribut bermasalah dgn nilai ya atautidak

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    7/21

    Tabel Contoh Kasus

    Algoritma NN

    No Jenis kelamin Pendidikan Agama Bermasalah

    1 L S1 ISLAM YA

    2 P SMA KRISTEN TIDAK3 L SMA ISLAM TIDAK

    4 L SMA KRISTEN ?

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    8/21

    Contoh

    Berdasarkan tabel diatas akan dibuat bobotbagi masing-masing atribut terpilih yg bukan

    atribut target/tujuan/dipengaruhi.

    Pembobotan akan diberikan kpd atribut Jenis kelamin 0,5

    Pendidikan 1

    Agama 0,75 Kedekataan antara nilai-nilai dlm atribut juga

    perlu didefinisikan.

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    9/21

    Kedekatan nilai atributjenis kelamin

    Nilai1 Nilai2 kedekatan

    L L 1P P 1

    L P 0,5

    P L 0,5

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    10/21

    Kedekatan nilai atribut pendidikan

    Nilai1 Nilai2 kedekatan

    S1 S1 1SMA SMA 1

    S1 SMA 0,4

    SMA S1 0,4

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    11/21

    Kedekatan nilai atribut Agama

    Nilai1 Nilai2 kedekatan

    Islam Islam 1Kristen Kristen 1

    Islam Kristen 0,75

    Kristen Islam 0,75

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    12/21

    Apabila terdpt kasus calon nasabah baru

    Jensi kelamin : L

    Pendidikan : SMA

    Agama : Kristen

    Apakah calon nasabah tsb akan bermasalahatau tidak ?

    Caranya: Hitung kedekatan kasus baru dengankasus yang sudah ada (kasus yg sudahterjadi ada 3 kasus/record).

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    13/21

    Langkah 1 : Hitung kedekatan kasus

    baru dengan kasus/record #1

    A = Kedekatan nilai atribut jenis kelamin (kasus baru : L, Rec#1 : L) 1

    B = Bobot atribut jenis kelamin 0,5

    C = kedekatan nilai atribut pendidikan (kasus baru : SMA,Rec #1 : S1) 0,4

    D = Bobot atribut pendidikan 1

    E = Kedekatan nilai atribut agama ( Kristen, Islam) 0,75

    F = Bobot atribut agama 0,75

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    14/21

    Hitung jarak kedekatan kasus 1/rec#1

    Jarak = (A*B) + (C*D) + (E*F)

    B+D+F

    Jarak = (1 * 0,5) + (0,4 * 1) + (0,75 * 0,75)0,5 + 1 + 0,75

    Jarak = 1,4625

    2,25

    Jarak = 0,65

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    15/21

    Langkah 2 : Hitung kedekatan kasus

    baru dengan kasus/record #2

    A = Kedekatan nilai atribut jenis kelamin (kasus baru : L, Rec#2 :P) 0,5

    B = Bobot atribut jenis kelamin 0,5

    C = kedekatan nilai atribut pendidikan (kasus baru : SMA,Rec #2 : SMA) 1

    D = Bobot atribut pendidikan 1

    E = Kedekatan nilai atribut agama ( Kristen, Islam) 0,75

    F = Bobot atribut agama 0,75

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    16/21

    Hitung jarak kedekatan kasus/rec#2

    Jarak = (A*B) + (C*D) + (E*F)

    B+D+F

    Jarak = (0,5* 0,5) + (1 * 1) + (0,75 * 0,75)0,5 + 1 + 0,75

    Jarak = 1,8125

    2,25

    Jarak = 0,8

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    17/21

    Langkah 3 : Hitung kedekatan kasus

    baru dengan kasus/record #3

    A = Kedekatan nilai atribut jenis kelamin (kasus baru : L, Rec#3 : L) 1

    B = Bobot atribut jenis kelamin 0,5

    C = kedekatan nilai atribut pendidikan (kasus baru : SMA,Rec #3 : SMA) 1

    D = Bobot atribut pendidikan 1

    E = Kedekatan nilai atribut agama ( Kristen, Islam) 0,75

    F = Bobot atribut agama 0,75

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    18/21

    Hitung jarak kedekatan kasus/rec#3

    Jarak = (A*B) + (C*D) + (E*F)

    B+D+F

    Jarak = (1* 0,5) + (1 * 1) + (0,75 * 0,75)0,5 + 1 + 0,75

    Jarak = 2,0625

    2,25

    Jarak = 0,9

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    19/21

    Langkah 4 : Memilih kasus dengan

    kedekatan yg paling dekat

    Berdasarkan langkah 1,2,3 diketahui nilai

    masing-masing adalah:

    Langkah 1 jarak=0,65

    Langkah 2 jarak=0,8

    Langkah 3 jarak=0,9

    Maka kasus dengan kedekatan terdekat adalahnilai tertinggi 0,9

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    20/21

    Langkah 5 : Menggunakan klasifikasi

    dari kasus dengan kedekatan terdekat

    Berdasarkan langkah 4, maka klasifikasi dari

    kasus 3 yang akan digunakna untuk

    memprediksi kasus baru. Maka kemungkinan kasus nasabah baru akan

    Tidak bermasalah.

  • 7/31/2019 Slide DM 09 K-Nearest Neighbour

    21/21

    Selesai