Modul Praktikum 5 - Klasifikasi I (Fix)

20
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0 MATERI PRAKTIKUM Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

description

klhdjsddsds

Transcript of Modul Praktikum 5 - Klasifikasi I (Fix)

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    PERTEMUAN KE-13

    KLASIFIKASI I

    1. Tujuan Praktikum

    1) Mahasiswa mempunyai pengetahuan dan kemampuan dasar mengenai metode

    pencarian pengetahuan / pola data dari sejumlah data dengan menggunakan teknik

    klasifikasi.

    2) Mahasiswa mampu menyelesaikan kasus klasifikasi data dengan menerapkan teknik

    klasifikasi.

    3) Mahasiswa mampu memahami konsep dan menerapkan salah satu algoritma klasifikasi

    yaitu decision tree.

    2. Definisi Klasifikasi

    Klasifikasi merupakan proses untuk menemukan sekumpulan model yang menjelaskan dan

    membedakan kelas-kelas data, sehingga model tersebut dapat digunakan untuk memprediksi

    nilai suatu kelas yang belum diketahui pada sebuah objek.

    Gambar 1. Klasifikasi sebagai suatu tugas memetakan atribut x ke dalam label kelas y

    Klasifikasi adalah proses untuk menempatkan objek tertentu (konsep) dalam satu set

    kategori, berdasarkan sifat masing-masing objek (konsep) (Gorunescu, 2011). Klasifikasi

    tergolong dalam supervised methods.

    Supervised methods adalah metode yang berusaha untuk menemukan hubungan antara

    atribut input (variabel independen) dan atribut target / kelas (variabel dependen). Hubungan

    ditemukan diwakili dalam struktur yang disebut sebagai model. Biasanya model

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    menggambarkan dan menjelaskan fenomena yang tersembunyi dalam dataset dan dapat

    digunakan untuk memprediksi nilai atribut target mengetahui nilai-nilai atribut masukan

    (Maimon, 2010).

    Proses klasifikasi didasarkan pada empat komponen dasar (Gorunescu, 2011) :

    1) Kelas (class) atau label kelas yaitu variabel dependen dari model yang merupakan variabel

    kategori yang menjelaskan sebuah 'label' pada objek setelah proses klasifikasi. Contoh :

    loyalitas pelanggan (label : loyal / tidak loyal), kelas bintang (galaksi), dll.

    2) Prediktor (predictor) atau atribut (attribute) yaitu variabel independen dari model yang

    diwakili oleh karakteristik (atribut) dari data yang akan diklasifikasikan dan berdasarkan

    klasifikasi yang dibuat. Contoh prediktor tersebut adalah: merokok, konsumsi alkohol,

    tekanan darah, frekuensi pembelian, status perkawinan, dan kecepatan angin, musim, dll.

    3) Training set atau dataset latihan (training dataset) yaitu merupakan kumpulan data yang

    berisi nilai-nilai atau record untuk dua komponen sebelumnya (kelas dan prediktor /

    atribut) dapat berupa variabel kontinyu maupun kategoris, dan digunakan untuk 'pelatihan'

    atau pembangunan model untuk menyesuaikan dengan kelasnya berdasarkan prediktor

    yang tersedia. Contoh set tersebut adalah: kelompok pasien diidentifikasi pada kasus

    serangan jantung berdasarkan faktor-faktor yang mempengaruhinya, kelompok pelanggan

    dari supermarket, dll.

    4) Dataset pengujian (testing dataset) yaitu berisi data baru yang akan diklasifikasikan oleh

    model klasifikasi (classifier) dan untuk mengukur tingkat akurasi klasifikasi (kinerja

    model) sehingga performansi model klasifikasi dapat dievaluasi.

    Model dalam klasifikasi antara lain yaitu (Bertalya, 2009) :

    1) Pemodelan Deskriptif

    Sebagai alat penggambaran yang bersifat menjelaskan untuk membedakan objek-objek

    dari kelas yang berbeda.

    2) Pemodelan Prediktif

    Pemodelan prediktif digunakan untuk memprediksi label kelas untuk record yang belum

    diketahui.

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    3. Penerapan Klasifikasi

    Klasifikasi dapat diaplikasikan dalam beberapa bidang antara lain kesehatan, perbankan, ritel,

    dll. Masing-masing memiliki atribut yang sesuai dengan kasus masing-masing. Misalnya

    dalam ritel, kasus yang biasanya digunakan adalah pemberian diskon/bonus.

    4. Tahapan Klasifikasi

    Tahapan dalam klasifikasi antara lain adalah :

    1) Preprocessing Data

    Tahap awal yang dilakukan sebelum proses klasifikasi adalah melakukan preprocessing

    data, terdapat beberapa langkah preprocessing data, yaitu :

    a) Data Cleaning

    Data cleaning merupakan suatu pemrosesan terhadap data untuk menghilangkan noise dan

    penanganan terhadap missing value pada suatu record.

    b) Transformasi Data

    Pada data dapat dilakukan generalisasi menjadi data dengan level yang lebih tinggi.

    Misalnya dengan melakukan diskretisasi terhadap atribut degan nilai kontinyu.

    Pembelajaran terhadap data hasil generalisasi dapat mengurangi kompleksitas

    pembelajaran yang harus dilakukan karena ukuran data yang harus diproses lebih kecil.

    2) Pembuatan Model Dalam Klasifikasi

    Klasifikasi dapat digunakan untuk memprediksi nama atau nilai kelas dari suatu obyek

    data. Proses klasifikasi data dapat dibedakan dalam 2 tahap, yaitu :

    a) Pembelajaran / Pembangunan Model

    Tiap tiap record pada data latih (training set) dianalisis berdasarkan nilai nilai

    atributnya, dengan menggunakan suatu algoritma klasifikasi untuk mendapatkan model.

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    Gambar 2. Learning : Training data.

    Sebagai contoh, pada gambar 2. menjelaskan tahap awal proses klasifikasi yaitu

    mendapatkan model klasifikasi (classifier) dari data latihan (training data)

    menggunakan algoritma klasifikasi. Atribut label kelas adalah Tenured, dan Learned

    Model atau classifier di gambarkan pada blok aturan klasifikasi.

    b) Klasifikasi

    Pada tahap ini, data uji (test set) digunakan untuk mengetahui tingkat akurasi dari

    model yang dihasilkan. Jika tingkat akurasi yang diperoleh sesuai dengan nilai yang

    ditentukan, maka model tersebut dapat digunakan untuk mengklasifikasikan record

    pada data yang baru.

    Gambar 3. Classification: Test data.

    Pada gambar 3., data uji (test set) digunakan untuk mengetahui tingkat akurasi dari

    model yang dihasilkan (classifier). Jika keakuratan tersebut dianggap dapat diterima,

    maka aturan itu dapat diaplikasikan untuk mengklasifikasikan data records yang baru.

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    5. Asumsi Dalam Klasifikasi

    Pembuatan model menguraikan sebuah set dari penentuan kelas-kelas sebagai:

    1. Setiap record diasumsikan sudah mempunyai kelas yang dikenal seperti ditentukan oleh

    label kelas atribut,

    2. Kumpulan record yang digunakan untuk membuat model disebut kumpulan pelatihan

    (training set),

    3. Model direpresentasikan sebagai classification rules, decision tree atau formula

    matematis.

    Penggunaan model menguraikan pengklasifikasian masa yang akan datang atau obyek yang

    belum diketahui, yaitu taksiran keakuratan dari model yang terdiri dari:

    1. Label yang telah diketahui dari contoh tes dibandingkan dengan hasil klasifikasi dari

    model,

    2. Nilai keakuratan adalah prosentase dari kumpulan contoh tes yang diklasifikasikan secara

    tepat oleh model,

    3. Kumpulan tes tidak terikat pada kumpulan pelatihan,

    4. Jika akurasi diterima, model dapat digunakan untuk mengklasifikasikan data record yang

    label kelasnya belum diketahui.

    Untuk mengevaluasi performansi sebuah model yang dibangun oleh algoritma klasifikasi,

    dapat dilakukan dengan menghitung jumlah dari test record yang diprediksi secara benar

    (akurasi) dan salah (error rate) oleh model tersebut. Akurasi dan error rate didefinisikan

    sebagai berikut.

    Algoritma klasifikasi adalah dapat menemukan model yang mempunyai akurasi yang tinggi

    atau error rate yang rendah ketika model diterapkan pada test set.

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    6. Algoritma Klasifikasi

    Pada teknik klasifikasi terdapat beberapa algoritma klasifikasi yang dapat digunakan, antara

    lain: pohon keputusan (decision tree), rule based, neural network, support vector machine,

    naive bayes, rough set, dan nearest neighbour.

    7. Algoritma Decision Tree

    Salah satu metode teknik klasifikasi data mining yang umum digunakan adalah decision tree.

    Decision tree adalah struktur flowchart yang menyerupai tree (pohon), dimana setiap simpul

    internal menandakan suatu tes pada atribut, setiap cabang merepresentasikan hasil tes, dan

    simpul daun merepresentasikan kelas atau distribusi kelas. Alur pada decision tree di telusuri

    dari simpul akar ke simpul daun yang memegang prediksi kelas untuk contoh tersebut.

    Decision tree mudah untuk dikonversi ke aturan klasifikasi. Teknik pohon keputusan lebih

    mudah digunakan, karena beberapa alasan:

    a) Dibandingkan dengan classifier JST atau bayesian, sebuah pohon keputusan mudah

    diinterpretasi/ ditangani oleh manusia.

    b) Sementara training JST dapat menghabiskan banyak waktu dan ribuan iterasi, pohon

    keputusan efisien dan sesuai untuk himpunan data besar.

    c) Algoritma dengan pohon keputusan tidak memerlukan informasi tambahan selain yang

    terkandung dalam training data (yaitu, pengetahuan domain dari distribusi-distribusi pada

    data atau kelas-kelas).

    d) Pohon keputusan menunjukkan akurasi klasifikasi yang baik dibandingkan dengan teknik-

    teknik yang lainnya.

    1) Konsep Decision Tree

    Mengubah data menjadi pohon keputusan (decision tree) dan aturan-aturan keputusan

    (rule).

    Gambar 4. Konsep Decision Tree

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    2) Tipe Simpul Pada Tree

    Tree mempunyai 3 tipe simpul, yaitu:

    1. Simpul akar dimana tidak ada masukan edge dan 0 atau lebih keluaran edge (tepi),

    2. Simpul internal, masing-masing 1 masukan edge dan 2 atau lebih edge keluaran,

    3. Simpul daun atau simpul akhir, masing-masing 1 masukan edge dan tidak ada edge

    keluaran.

    Pada decision tree setiap simpul daun menandai label kelas. Simpul yang bukan

    simpul akhir terdiri dari akar dan simpul internal yang terdiri dari kondisi tes atribut pada

    sebagian record yang mempunyai karakteristik yang berbeda. Simpul akar dan simpul

    internal ditandai dengan bentuk oval dan simpul daun ditandai dengan bentuk segi empat.

    Gambar 5. Decision tree untuk masalah klasifikasi

    3) Konsep Data Dalam Decision Tree

    a) Data dinyatakan dalam bentuk tabel dengan atribut dan record.

    b) Atribut menyatakan suatu parameter yang dibuat sebagai kriteria dalam pembentukan

    tree. Misalkan untuk menentukan main tenis, kriteria yang diperhatikan adalah cuaca,

    angin dan temperatur. Salah satu atribut merupakan atribut yang menyatakan data solusi

    per-item data yang disebut dengan target atribut.

    c) Atribut memiliki nilai-nilai yang dinamakan dengan instance. Misalkan atribut cuaca

    mempunyai instance berupa cerah, berawan dan hujan.

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    Gambar 6. Contoh data untuk Decision Tree

    4) Proses Dalam Decision Tree

    a) Proses Mengubah Data Menjadi Tree

    Gambar 7. Mengubah Data Menjadi Tree

    b) Ukuran untuk Memilih Split Terbaik

    Dalam membangun sebuah decision tree secara top-down (dari atas ke bawah), tahap

    awal yang dilakukan adalah mengevaluasi semua atribut yang ada menggunakan suatu

    ukuran statistik (yang banyak digunakan adalah information gain) untuk mengukur

    efektifitas suatu atribut dalam mengklasifikasikan suatu kumpulan sampel data. Atribut

    yang diletakkan pada root node adalah atribut yang memiliki information gain terbesar.

    Semua atribut adalah bersifat kategori yang bernilai diskrit. Atribut dengan nilai

    continuous harus didiskritkan (Zalilia, 2007). Terlebih dahulu kita harus mencari nilai

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    informasi dari data yang merupakan nilai yang diperlukan untuk mengklasifikasikan

    keputusan akhir. Secara matematis dapat dirumuskan dengan:

    c) Entropy

    Entropy (S) adalah jumlah bit yang diperkirakan dibutuhkan untuk dapat mengekstrak

    suatu kelas (+ atau -) dari sejumlah data acak pada ruang sample S.

    Entropy bisa dikatakan sebagai kebutuhan bit untuk menyatakan suatu kelas. Semakin

    kecil nilai Entropy maka semakin baik untuk digunakan dalam mengekstraksi suatu

    kelas.

    Entropi adalah suatu parameter untuk mengukur heterogenitas dari suatu data. Panjang

    kode untuk menyatakan informasi secara optimal adalah p2log bits untuk messages

    yang mempunyai probabilitas p.

    Untuk menghitung information gain, terlebih dahulu kita harus memahami suatu

    ukuran lain yang disebut Entropy. Entropy biasa digunakan sebagai sautu parameter

    untuk mengukur heterogenitas (keberagaman) dari suatu kumpulan sampel data. Jika

    kumpulan sampel data semakin heterogen, maka semakin besar nilai entropy. Secara

    matematis, nilai entropy masing-masing instance dirumuskan sebagai berikut:

    Keterangan :

    S = ruang (data) sample yang digunakan untuk training.

    P(+) = jumlah yang bersolusi positif (mendukung) pada data sample untuk kriteria

    tertentu.

    P(-) = jumlah yang bersolusi negatif (tidak mendukung) pada data sample untuk

    kriteria tertentu.

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    Sedangkan untuk nilai entropy masing-masing atribut dirumuskan dengan:

    d) Information Gain

    Setelah mendapatkan nilai entropy untuk suatu kumpulan sampel data, maka dapat

    diukuer efektifitas suatu atribut dalam mengklasifikasikan data. Ukuran efektifitas ini

    disebut Information Gain. Secara matematis, information gain dari suatu atribut,

    dituliskan sebagai berikut:

    Dengan kata lain, Gain (A) adalah reduksi yang diharapkan dalam entropy yang

    disebabkan oleh pengetahuan nilai pada atribut A. Algoritma menghitung information

    gain pada setiap atribut. Atribut dengan nilai gain terbesar dipilih sebagai tes atribut

    (simpul akar). Simpul A dibuat dan dilabelkan dengan atribut, cabang dibuat untuk

    setiap nilai atribut.

    Klasifikasi pada umumnya digunakan untuk kasus-kasus pada kelas-kelas

    keputusan yang bernilai diskrit dengan keputusan seperti diterima = ya atau tidak.

    Namun jika kita menemukan kasus yang mempunyai nilai keputusan kontinyu cara

    untuk menyelesaikannya adalah dengan mengubah nilai-nilai kontinyu menjadi nilai-

    nilai diskrit dengan cara mempartisi nilai kontinyu ke dalam interval-interval bernilai

    diskrit.

    Tabel 1. Contoh Data penerimaan karyawan dengan atribut IPK bernilai kontinyu

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    Untuk menyelesaikannya kita misal atribut IPK kita ubah menjadi 3 nilai diskrit

    dengan membentuk interval bagus=[3,00-4,00], cukup=[2,75-3,00] lalu kembali

    dengan melanjutkan langkah-langkah selanjutnya.

    e) Mengubah Tree Menjadi Rules

    Tahap terakhir dalam algoritma decision tree adalah mengubah tree menjadi rules

    seperti pada gambar di bawah ini.

    Gambar 8. Mengubah Tree Menjadi Rules

    Sebagai contoh, terdapat sebuah kasus seseorang menentukan akan main tenis di

    lapangan atau tidak berdasarkan faktor cuaca dan angin, maka berdasarkan tree yang

    terbentuk dapat diubah menjadi beberapa rule seperti gambar di bawah ini.

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    Gambar 9. Mengubah Tree Menjadi Rules

    5) Contoh Kasus Decision Tree

    a) Menentukan Node Terpilih

    Dari data sampel ditentukan node terpilih, yaitu dengan menghitung nilai entropy

    masing-masing atribut. (jumlah beli, harga, dan keadaan barang).

    Catatan Node terpilih adalah kriteria dengan Information Gain yang paling besar.

    Entropy untuk harga:

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    Nilai Informasi untuk data tersebut adalah:

    Information Gain (I) =0.9183-0.36 =0.558296

    Dengan menggunakan cara yang sama nilai entropy atribut yang lain adalah sebagai

    berikut:

    Tabel 2. Nilai Entropy untuk Jumlah Beli dan keadaan Barang

    Terpilih atribut HARGA sebagai node awal karena memiliki information gain

    terbesar.

    b) Menyusun Tree Awal

    Gambar 10. Tree Awal yang Terbentuk

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    Node berikutnya dapat dipilih pada bagian yang mempunyai nilai + dan -, pada contoh

    di atas hanya harga = sedang yang mempunyai nilai + dan , maka semuanya pasti

    mempunyai internal node. Untuk menyusun internal node lakukan satu-persatu.

    c) Internal Node untuk harga = sedang

    Tabel 3. Internal Node Harga Sedang

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    d) Menyusun Tree Lanjutan

    Gambar 11. Tree Lanjutan 1

    Gambar 12. Tree Lanjutan 2

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    e) Hasil Tree Akhir

    Gambar 13. Tree Akhir

    f) Mengubah Tree Menjadi Rule

    Rule yang terbentuk dari hasil tree akhir adalah sebagai berikut:

    R1: IF Harga = mahal THEN diskon = ya

    R2: IF Harga = murah THEN diskon = tidak

    R3: IF Harga = sedang dan Jumlah Beli = sedikit THEN diskon = tidak

    R4: IF Harga = sedang dan Jumlah Beli = banyak dan Keadaan Barang = cacat

    THEN diskon = ya

    R5: IF Harga = sedang dan Jumlah Beli = banyak dan Keadaan Barang=baik

    THEN diskon = tidak

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    g) Menghitung Akurasi dan Error

    Hasil Prediksi pada training set adalah sebagai berikut:

    Tabel 4. Hasil Model Klasifikasi dan Prediksi

    Keterangan:

    Warna kuning menunjukkan ketidaksesuaian atau tingkat error

    Tingkat error = 3/18 *100% = 16.67 %.

    Sedangkan untuk akurasi adalah sebesar = 15/18*100% = 83.33 %.

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015

    REFERENSI

    Bertalya. 2009. Konsep Data Mining. Jakarta: Universitas Gunadarma.

    Florin Gorunescu. 2011. Data Mining : Concept, Model and Techniques. Berlin : Springer.

    Oded Maimon dan Lior Rokach. 2010. Data Mining and Knowledge Discovery Handbook.

    London : Springer.

  • UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0

    MATERI PRAKTIKUM

    Fakultas : Teknologi Industri Pertemuan ke : 13 Jurusan/Program Studi : Teknik Industri Modul ke : 5 Kode Mata Kuliah : 52213604 Jumlah Halaman : 18 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2015