DM Pertemuan 3. Data

download DM Pertemuan 3. Data

of 53

Transcript of DM Pertemuan 3. Data

  • 7/24/2019 DM Pertemuan 3. Data

    1/53

    DATAMustakim, S.T., M.Kom.

    Program Studi Sistem Informasi

    Fakultas Sains dan Teknologi UIN Sultan Syarif Kasim RiauJl. HR. Soebrantas No. 155 KM 18 Tampan Pekanbaru - Riau

    Pertemuan 3 - Ganjil 2015-2016

    Data Mining

    NIK : 130511023

    NIDN : 2002068801

    Email : [email protected]

    Web : http://mustakimtelematika.wordpress.com/

  • 7/24/2019 DM Pertemuan 3. Data

    2/53

    Pengantar Data

    Mustakim, S.T., M.Kom. Data Mining 2

    1

    Data adalah sesuatu yang belum mempunyai arti bagi

    penerimanya dan masih memerlukan adanya suatupengolahan.

  • 7/24/2019 DM Pertemuan 3. Data

    3/53

    Pengantar Data

    Mustakim, S.T., M.Kom. Data Mining 3

    1

    Data bisa berwujut suatu:

    Keadaan

    Gambar

    Suara

    Huruf Angka

    Matematika

    Bahasa

    Simbol-simbol lainnya

  • 7/24/2019 DM Pertemuan 3. Data

    4/53

    Pengantar Data

    Mustakim, S.T., M.Kom. Data Mining 4

    1

    DNA RASTER

    VEKTOR VOICE

  • 7/24/2019 DM Pertemuan 3. Data

    5/53

    Tipe Data

    Mustakim, S.T., M.Kom. Data Mining 5

    2

    NO KODE JUDUL PENGARANG SEGMEN TAHUN BULAN HARGA

    1 0071080010PEMIKIRAN2 YANG MEMBENTUK DUNIA

    MODERN

    F. BUDI

    HARDIMANBK TEKS 2011 5 78,000

    2 0071500020 TES PSIKOLOGI JL.1

    ROBERT J.

    GREGORY BK TEKS 2013 6 186,000

    3 0071500050 LIFE SPAN DEVELOPMENT 13/2JOHN W.

    SANTROCKBK TEKS 2014 3 162,000

    4 0071500060 PSIKOLOGI KOGNITIF JONATHAN LING BK REF 2013 3 115,000

    5 0071550010 PSIKOLOGI PERKEMBANGAN PENNEY UPTON BK TEKS 2013 3 122,000

    6 0071580010PSIKOLOGI KLINIS: PENGANTAR

    TERAPAN MIKRO&MAKROJ.E. PRAWITASARI BK TEKS 2011 4 107,000

    7 0072200010AL-ISLAM (PENDIDIKAN AGAMA ISLAM

    U/ PERTI)ROIS MAHFUD BK REF 2011 6 68,000

    8 0073210010 PERTUMBUHAN & PENYELENGGARAANPEMERINTAHAN DESA HANIFNURCHOLIS BK TEKS 2011 5 71,000

    Objek

    Atribut: Sifat atau karakteristik dari suatu objek

    Kumpulan dari beberapa atribut

    Record, titik, kasus, sample, entitas atau intance

  • 7/24/2019 DM Pertemuan 3. Data

    6/53

    Tipe Data

    Atribut Kategorikal (Categorical Attribute)

    Mustakim, S.T., M.Kom. Data Mining 6

    2

    Nominal

    Ordinal

    Data berjenis nominal membedakan data dalam kelompok yang bersifat

    kualitatif.

    Dalam ilmu statistika, data nominal merupakan data dengan level pengukuranyang paling rendah

    Nilainya tidak dapat diurutkan (bersifat distinctness

    Pada data nominal semua data dianggap bersifat kualitatif dan setara sedangkan pada data ordinal terdapat klasifikasi data berdasarkan

    tingkatannya.

  • 7/24/2019 DM Pertemuan 3. Data

    7/53

    Tipe Data

    Atribut Numerik (Numeric Attribute)

    Mustakim, S.T., M.Kom. Data Mining 7

    2

    Interval

    Rasio

    Data berjenis interval termasuk dalam kelompok data kuantitatif.

    Angka yang digunakan dalam data ini, selain menunjukkan urutan juga dapat

    dilakukan operasi matematika. Angka nol yang digunakan pada data interval bukan merupakan nilai nol yang

    nyata.

    Data dengan level pengukuran yang paling tinggi dan bersifat kuantitatif Angka yang digunakan pada data ini menunjukkan angka yang

    sesungguhnya

    bukan hanya sebagai symbol dan memiliki nilai nol yang sesungguhnya.

    Pada data ini, dapat dilakukan berbagai operasi matematika.

  • 7/24/2019 DM Pertemuan 3. Data

    8/53

    Tipe Data

    Mustakim, S.T., M.Kom. Data Mining 8

    2

    Contoh Nominal

    Data jenis kelamin pada sampel penelitian Departemen Pendidikan,

    data siswa dikategorikan menjadi laki-laki yang diwaliki angka 1 dan

    perempuan yang diwakili angka 2.

    Mengelompokan eskul disuatu SMA dari bidang olahraga, data eskul

    dikategorikan menjadi basket yang diwakili dengan huruf A,kemudian footsal diwakili dengan huruf B dan bolavoli diwakili oleh

    huruf C.

    Pengelompokan rumah-rumah dalam suatu perumahan, misal dari

    sebelah utara komplek A, barat adalah komplek B, selatan

    adalah C dan arah timur adlah komplek D.

    Konsekuensi dari data nominal adalah tidak mungkin seseorangmemiliki dua kategori sekaligus dan angka yang digunakan di sini

    hanya sebagai kode/simbol saja sehingga tidak dapat dilakukan

    operasi matematika.

  • 7/24/2019 DM Pertemuan 3. Data

    9/53

    Tipe Data

    Mustakim, S.T., M.Kom. Data Mining 9

    2

    Contoh Ordinal

    Mengenai tingkat pendidikan yang dikategorikan menjadi SD yang

    diwakili angka 1, SMP yang diwakili angka 2, SMA yang diwakili

    angka 3, Diploma yang diwakili angka 4, dan Sarjana yang diwakili

    angka 5. Sama halnya dengan data nominal, meskipun tingkatannya

    lebih tinggi, data ordinal tetap tidak dapat dilakukan operasimatematika. Angka yang digunakan hanya sebagai kode/simbol saja,

    dalam contoh tadi tingkat pendidikan tertinggi adalah Sarjana dan

    terendah adalah SD (Sarjana > Diploma > SMA > SMP > SD).

    Suatu peringkat ranking disuatu kelas misalkan Ihsan ranking 1 dan

    udin ranking 2 berarti ihsan lebih pintar dari pada udin.

    Penghitungan suara dalam pemilu, misalkan total suara Demokrat60%, PDI 30%, Golkar 20% berarti suara tertinggi di pegang oleh

    demokrat sebagai peringkat 1, sehinnga menjadi pemenang dalam

    pemilu tersebut.

  • 7/24/2019 DM Pertemuan 3. Data

    10/53

    Tipe Data

    Mustakim, S.T., M.Kom. Data Mining 10

    2

    Contoh Interval

    Interval nilai pelajaran matematika siswa SMA 4 Surabaya adalah

    antara 0 sampai 100. Bila siswa A dan B masing-masing mempunyai

    nilai 45 dan 90, bukan berarti tingkat kecerdasan B dua kali A. Nilai 0

    sampai 100 hanya merupakan rentang yang dibuat berdasarkan

    kategori pelajaran matematika dan mungkin berbeda dengan matapelajaran lain.

    Dasar Pemrograman memiliki 1 SKS, waktunya adalah 50 menit,

    begitupun dengan Teknik Digital yang memiliki 2 sks berarti waktunya

    100 menit, dan yang terakhir yaitu kalkulus memiliki 3 SKS waktunya

    adalah 150 menit sehingga dapat disimpulkan bahwa selisih data

    diatas adalah 50 menit.

  • 7/24/2019 DM Pertemuan 3. Data

    11/53

    Tipe Data

    Mustakim, S.T., M.Kom. Data Mining 11

    2

    Contoh Rasio

    Dalam sebuah bank, seseorang mempunyai tabungan dengan saldo

    10.000.000 rupiah. Angka tersebut menunjukkan bahwa orang

    tersebut benar-benar mempunyai saldo sebesar 10.000.000 rupiah.

    Jika seseorang mempunyai saldo -1.000.000 rupiah berarti orang

    tersebut mempunyai hutang sebesar 1.000.000 rupiah. Sedangkanjika seseorang mempunyai saldo 0 rupiah berarti orang tersebut tidak

    mempunyai tabungan maupun hutang.

    Nilai raport siswa SMA dimana masing masing siswa memiliki

    nilaiyang berbeda yaitu Muiz mendapatkan nilai 100 (A), Cinta 80 (B),

    dan Putri 60 (C) jika dilihat dariskala rasio nilai Muiz memiliki nilai

    lebih 20 dari pada nilai Cinta, Cinta memiliki nilai lebih 20dari padanilai Putri, dan nilai putri kurang 40 untuk sama dengan Muiz.

  • 7/24/2019 DM Pertemuan 3. Data

    12/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 12

    3

    Dimensionalitas, dari data set adalah banyaknya

    atribut yang dimiliki objek dalam data set.

    Sparsity. Untuk beberapa data set, misal pada data

    set yang mengandug atribut asimetrik, kebanyakanatribut memiliki nilai 0.

    Resolusi. Data pada tingkat resolusi yang berbeda

    seringkali diperoleh, dan sering pula sifat-sifat dari

    data berbeda pada resolusi yang berbeda.

  • 7/24/2019 DM Pertemuan 3. Data

    13/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 13

    3

    Merupakan kumpulan record (objek data)

    Masing-masing record mengandung sekumpulan field

    data (atribut)

    Tidak ada hubungan yang eksplisit diantara record

    ataufield data.

    Setiap record (objek) memiliki himpunan atribut yang

    sama

    Data record biasanya disimpan dalam flat file ataudalam basis data relasioanal.

    Data record

  • 7/24/2019 DM Pertemuan 3. Data

    14/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 14

    3

    Data record

  • 7/24/2019 DM Pertemuan 3. Data

    15/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 15

    3

    Merupakan bentuk khusus dari data record

    setiap record (transaksi) meliputi sekumpulan item

    dinamakan data market basket

    koleksi dari himpunan-himpunan item

    data tersebut dapat dipandang sebagai sekumpulan

    record yang memiliki field-field berupa atribut

    asimetrik

    Data transaksi

  • 7/24/2019 DM Pertemuan 3. Data

    16/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 16

    3

    Data transaksi

    Pada toko grosir, sekumpulan produk yang dibeli oleh

    seorang pelanggan selama satu kali perjalanan belanja

    merupakan sebuah transaksi, dengakan produk

    individual yang dibeli merupakan item. Setiap baris menyatakan pembelian dari seorang

    pelanggan pada waktu tertentu.

  • 7/24/2019 DM Pertemuan 3. Data

    17/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 17

    3

    Data Matriks

    Objek-objek data dalam koleksi dari data seluruhnya

    memiliki kumpulan atribut-atribut numerik yang sama

    Objek data tersebut dapat dipandang sebagai titik

    atau vektor dalam ruang multidimesi

    Setiap dimensi menyatakan atribut yang berbeda yang

    menjelaskan objek.

    Himpunan objek data demikian dapat diiterpretasikan

    sebagai matriks berukuran m n

  • 7/24/2019 DM Pertemuan 3. Data

    18/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 18

    3

    Data Matriks

    Matriks data adalah variasi dari data record,

    Diaplikasikan untuk mentranformasi atau

    memanipulasi data.

    Merupakan format data standar untuk kebanyakan

    data statsitik.

  • 7/24/2019 DM Pertemuan 3. Data

    19/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 19

    3

    Matriks Data Jarang

    Matriks data jarang (sparse data matrix) adalah kasus

    khusus dari matriks data dimana atribut-atribut

    memiliki tipe yang sama dan merupakan atribut

    asimetrik (hanya nilai yang tak nol yang penting).

    Document-term matrix merupakan dokumen baris

    dari matriks, sedangkan istilah adalah kolom dari

    matriks tersebut.

  • 7/24/2019 DM Pertemuan 3. Data

    20/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 20

    3

    Matriks Data Jarang

  • 7/24/2019 DM Pertemuan 3. Data

    21/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 21

    3

    Data Sekuensial

    Data sekuensial jika dirujuk sebagai data temporal.

    Data tersebut dapat dipandang sebagai perluasan dari

    data record

    Setiap record memiliki nilai waktu yang berkaitandengan record tersebut.

  • 7/24/2019 DM Pertemuan 3. Data

    22/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 22

    3

    Data Urutan (Sequence Data)

    Data urutan terdiri dari data set yang merupakan

    urutan dari entitas individual seperti urutan kata atau

    huruf.

    Data ini hampir mirip dengan data sekuesial, kecuali

    bahwa dalam data urutan tidak ada unsur waktu

    Akan tetapi terdapat posisi dalam rangkaian yang

    terurut.

  • 7/24/2019 DM Pertemuan 3. Data

    23/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 23

    3

    Data Urutan (Sequence Data)

    Sebagai contoh, informasi genetik dari tanaman dan

    binatang dapat direpresentasikan dalam bentuk

    rangkaian nucleotide yang dikenal sebagai gen

  • 7/24/2019 DM Pertemuan 3. Data

    24/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 24

    3

    Data Time Series

    Merupakan bentuk khusus dari data sekuensial

    dimana setiap record adalah sebuah time series

    Sebuah rangkaian dari pengukuran yang diambil

    sepanjang waktu.

  • 7/24/2019 DM Pertemuan 3. Data

    25/53

    Tipe Data Set

    Mustakim, S.T., M.Kom. Data Mining 25

    3

    Data Spasial

    Objek yang memiliki atribut-atribut spasial, seperti

    posisi atau area, juga tipe atribut lainnya.

    Salah satu contoh dari data spasial adalah data cuaca

    (curah hujan, temperatur, dan tekanan) yang

    dikumpulkan dari berbegai lokasi geografis

  • 7/24/2019 DM Pertemuan 3. Data

    26/53

    Kualitas Data

    Mustakim, S.T., M.Kom. Data Mining 26

    4

    Aspek Pengukuran Data dan

    Pengumpulan Data

    Kesalahan Pengukuran

    Kesalahan Pengumpulan

    Duplikasi Data

  • 7/24/2019 DM Pertemuan 3. Data

    27/53

    Kualitas Data

    Mustakim, S.T., M.Kom. Data Mining 27

    4

    Kesalahan Pengukuran

    Nilai yang dicatat berbeda dari nilai sebenarnya untuk

    beberapa tingkat.

    Noise

    Bias

    Precision

    Accuracy

    Komponen random dari error pengukuran

    Kuantitas pengukuran yang dikurangi mean

    Kedekatan dari pengukuran berulang/ STDEV

    Kedekatan pengukuran terhadap nilai

    sebenarnya dari kuantitas yang diukur

  • 7/24/2019 DM Pertemuan 3. Data

    28/53

    Kualitas Data

    Mustakim, S.T., M.Kom. Data Mining 28

    4

    Kesalahan Penumpulan

    Hilangnya objek data atau nilai atribut serta lingkup

    objek data yang tidak tepat

    Outliers

    Missing

    Value

    Objek data dengan sifat yang berbeda sekalidari kebanyakan objek data dalam data set

    Nilai dari suatu atribut yang tidak ditemukan.

    Misal: Informasi tidak diperoleh atau atribut

    yang mungkin tidak bisa diterapkan kesemua

    kasus.

  • 7/24/2019 DM Pertemuan 3. Data

    29/53

    Kualitas Data

    Mustakim, S.T., M.Kom. Data Mining 29

    4

    Duplikasi Data

    Data set yang terdiri dari data ganda atau hampir

    selalu terjadi duplikasi data satu dengan yang lainnya.

    Contoh Orang yang sama dengan alamat email yanglebih dari satu.

    Persoalan: Penggabungan data dari sumber-sumber yangbervariasi (heterogen)

  • 7/24/2019 DM Pertemuan 3. Data

    30/53

    Pengolahan Awal (Prepocessing) Data

    Mustakim, S.T., M.Kom. Data Mining 30

    5

    Pengumpulan (Agregation)

    Penarikan Contoh (Sampling)

    Pengurangan Dimensi (Dimensionality Reduction)

    Pemilihan Fitur (Feature Selection)

    Pembuatan Fitur (Feature Creation) Pendiskritan dan Pembineran (Discretization and

    Binarization)

    Transformasi Atribut (Attribute Transformation)

  • 7/24/2019 DM Pertemuan 3. Data

    31/53

    Agregation

    Mustakim, S.T., M.Kom. Data Mining 31

    5

    Kombinasi dua atau lebih objek ke dalam sebuahobjek tunggal.

    Sebagai contoh, data set yang berisi transaksi (objek

    data) yang mencatat penjualan produk harian di

    berbagai lokasi toko Salah satu cara untuk meng-agregasi transaksi untuk

    data set ini adalah mengganti semua transaksi dari

    toko-toko dengan sebuah transaksi tunggal.

  • 7/24/2019 DM Pertemuan 3. Data

    32/53

    Sampling

    Mustakim, S.T., M.Kom. Data Mining 32

    5

    Sampling adalah pendekatan yang umum digunakanuntuk menyeleksi sebuah subset dari objek data

    untuk dianalisis.

    Prinsip utamapenggunaan sample akan bekerja

    hampir seperti menggunakan keseluruhan data setjika sample adalah representatif.

  • 7/24/2019 DM Pertemuan 3. Data

    33/53

    Sampling

    Mustakim, S.T., M.Kom. Data Mining 33

    5

    Sampling adalah pendekatan yang umum digunakanuntuk menyeleksi sebuah subset dari objek data

    untuk dianalisis.

    Prinsip utamapenggunaan sample akan bekerja

    hampir seperti menggunakan keseluruhan data setjika sample adalah representatif.

  • 7/24/2019 DM Pertemuan 3. Data

    34/53

    Dimensionality Reduction

    Mustakim, S.T., M.Kom. Data Mining 34

    5

    Satu pendekatan terkait dengan dimensi yang tinggiadalah mengurangi dimensi data tersebut.

    Memproyeksikan data dimensi tinggi ke dimensi

    yang rendah menggunakan transformasi linier dan

    non-linier Principal Component Analysis (PCA) dan Singular

    Value Decomposition (SVD)

  • 7/24/2019 DM Pertemuan 3. Data

    35/53

    Feature Selection

    Mustakim, S.T., M.Kom. Data Mining 35

    5

    Pendekatan embedded, algoritme dengan sendirinya

    menentukan atribut yang mana yang akan digunakan

    dan atribut yang mana yang diabaikan

    Pendekatanfilter, menggunakan pendekatan yang

    tidak tergantung pada pekerjaan datamining

    Pendekatan wrapper, menggunakan algortime data

    mining target sebagai black box untuk menentukan

    subset atribut yang paling baik, tanpa menghitung

    semua subset yang mungkin

  • 7/24/2019 DM Pertemuan 3. Data

    36/53

    Feature Creation

    Mustakim, S.T., M.Kom. Data Mining 36

    5

    Feature extraction: pembuatan sekumpulan fitur

    yang baru dari data mentah awal.

    Pemetaan data ke ruang yang baru menggunakan

    fourier transformation atau wavelet transformation.

    Konstruksi fitur: menggabungkan fitur-fitur.

  • 7/24/2019 DM Pertemuan 3. Data

    37/53

    Discretization and Binarization

    Mustakim, S.T., M.Kom. Data Mining 37

    5

    Teknik Binarization Jika ada m nilai kategorikal, maka beri untuk setiap

    nilai tersebut dengan sebuah nilai integer yang unik

    pada interval [0,m-1]. Jika atributnya ordinal maka

    urutan harus diperhatikan. Konversikan tiap nilai integer tersebut kedalam

    bilangan biner

  • 7/24/2019 DM Pertemuan 3. Data

    38/53

    Discretization and Binarization

    Mustakim, S.T., M.Kom. Data Mining 38

    5

    Discretization, untuk kelas Klasifikasi:

    Unsuvervised Discretization: tanpa menggunakan

    informasi kelas:

    1. Equal WidthMembagi kedalam interval yang

    ditentukan dengan lebar yang sama

    2. Equal FrequencyMenempatkan objek dengan

    jumlah yang sama dalam tiap interval

  • 7/24/2019 DM Pertemuan 3. Data

    39/53

    Discretization and Binarization

    Mustakim, S.T., M.Kom. Data Mining 39

    5

    Contoh:

    Rubah atribut Taxable Income

    menjadi atribut kategorikal

    dengan kategori:

    Rendah, Sedang dan Tinggi

  • 7/24/2019 DM Pertemuan 3. Data

    40/53

    Discretization and Binarization

    Mustakim, S.T., M.Kom. Data Mining 40

    5

    1. Pendekatan Equal Width:

    Rank data: [60-220]

    Rendah: range [60-113]

    Sedang: range [114-167]

    Tinggi: range [168-220]

  • 7/24/2019 DM Pertemuan 3. Data

    41/53

    Discretization and Binarization

    Mustakim, S.T., M.Kom. Data Mining 41

    5

    2. Pendekatan Equal Frequency:

    Sort data: [60, 70, 75, , 220]

    Rendah: 60, 70, 75

    Sedang: 85, 90, 95

    Tinggi: 100, 120, 125, 220

  • 7/24/2019 DM Pertemuan 3. Data

    42/53

    Discretization and Binarization

    Mustakim, S.T., M.Kom. Data Mining 42

    5

    Discretization, untuk kelas Klasifikasi: Suvervised Discretization: Entropy Based Approach

    1. Menentukan Entropi

    Misalnya:k : Jumlah klas

    mi : Jumlah nilai dalam interval ke-I dari partisi

    mij : jumlah nilai dari kelas j dalam interval i

    Dimana: pij = mij/miprobabilitas kelas j dalam

    interval i

  • 7/24/2019 DM Pertemuan 3. Data

    43/53

    Atribute Transformation

    Mustakim, S.T., M.Kom. Data Mining 43

    5

    Suatu fungsi yang memetakan keseluruhan

    himpunan nilai dari atribut yang diberikan kesuatu

    himpunan nilai-nilai pengganti yang baru sedemikian

    hingga nilai yang lama dapat dikenali dengan satui

    dari nilai-nilai baru tersebut.

    Fungsi TranformasiStandarisasi dan normalisasi

    Tujuan Standarisasi dan normalisasimembuat

    keseluruhan nilai mempunyai suatu sifat khusus

  • 7/24/2019 DM Pertemuan 3. Data

    44/53

    Atribute Transformation

    Mustakim, S.T., M.Kom. Data Mining 44

    5

    Salah satu contoh transformasi standarisasi adalahdengan:

    Hitung nilai tengah dengan median

    Hitung absolute standard deviation dengan

    persamaan Lakukan transformasi dengan:

  • 7/24/2019 DM Pertemuan 3. Data

    45/53

    Atribute Transformation

    Mustakim, S.T., M.Kom. Data Mining 45

    5

    Contoh:

    Lakukan standarisasi dari data-set berikut:

    x ={2.5, 0.5, 2.2, 1.9, 3.1, 2.3, 2, 1, 1.5, 1.1}

    Jawab:

    Dari data diatas dapat dihitung median =

    = (1.9 + 2)/2 = 1.95

  • 7/24/2019 DM Pertemuan 3. Data

    46/53

    Atribute Transformation

    Mustakim, S.T., M.Kom. Data Mining 46

    5

    Maka,X = {

  • 7/24/2019 DM Pertemuan 3. Data

    47/53

    Similaritas dan Jarak

    Mustakim, S.T., M.Kom. Data Mining 47

    6

    Similaritas (kemiripan) antara dua onjek merupakanukuran numerik dari seberapa mirip dua buah objek

    Range nilai similaritas adalah [0,1]

    Lawan dari Similaritas adalah Dissimilaritas, yang

    memiliki nilai minimum 0 dan maksimum tidakterbatas

    Dissimilaritasdistance (jarak)

  • 7/24/2019 DM Pertemuan 3. Data

    48/53

    Similaritas dan Jarak

    Mustakim, S.T., M.Kom. Data Mining 48

    6

    Pengukuran Jarak (Distance) dari Dua Objek

    1. Jarak Euclidian (Euclidian Distance)

  • 7/24/2019 DM Pertemuan 3. Data

    49/53

    Similaritas dan Jarak

    Mustakim, S.T., M.Kom. Data Mining 49

    6

    Pengukuran Jarak (Distance) dari Dua Objek

    Contoh:

    Hitung ukuran jarak euclidian antara semua titik dalam

    data set dua dimensi berikut:

  • 7/24/2019 DM Pertemuan 3. Data

    50/53

    Similaritas dan Jarak

    Mustakim, S.T., M.Kom. Data Mining 50

    6

    Pengukuran Jarak (Distance) dari Dua Objek

    Jawab:

  • 7/24/2019 DM Pertemuan 3. Data

    51/53

    Similaritas dan Jarak

    Mustakim, S.T., M.Kom. Data Mining 51

    6

    Pengukuran Jarak (Distance) dari Dua Objek

    Semua nilai jarak antara titik-titik diatas dapat

    dinyatakan dalam sebuah Matiks Jarak (Distance Matrix)

  • 7/24/2019 DM Pertemuan 3. Data

    52/53

  • 7/24/2019 DM Pertemuan 3. Data

    53/53

    Tugas Kelompok

    Mustakim, S.T., M.Kom. Data Mining 53

    7

    Terima Kasih