Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa...
Transcript of Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa...
![Page 1: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/1.jpg)
Konsep Dasar Data Mining Pada Era 4.0
Oleh: Dr. Indra, S.Kom , M.T.I
![Page 2: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/2.jpg)
Sumber:
https://www-users.cs.umn.edu/~kumar001/dmbook/index.php
![Page 3: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/3.jpg)
3
Outline
● Pengenalan Data Mining● Alasan Penggunaan Data Mining● Definisi Data mining● Data Mining Task● Praktikum Data Mining dengan Orange (Visual
Programming)
![Page 4: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/4.jpg)
4
Data Berskala Besar ada di Sekitar Kita
Telah berkembang dengan pesat pertumbuhan data yang sangat besar dalam database E-Commerce dan database ilmiah karena kemajuan teknologi menghasilkan data dalam jumlah besar dan majunya teknologi pengumpulan New mantraKumpulkan data apa pun yang Anda bisa kapanpun dan dimanapun. ExpectationsData yang terkumpul akan memiliki nilai tinggi untuk tujuan tertentu atau untuk tujuan yang tidak dibayangkan
Social Networking: Twitter
Sensor Networks
Traffic Patterns
Cyber Security
Introduction to Data Mining, 2nd Edition 401/17/2018
E-Commerce
![Page 5: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/5.jpg)
5
Mengapa ada Data Mining
● Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan Data (Data Warehoused)– Web Data: Twitter, Google, Facebook, Instagram– E-Commerce: Amazon, Tokopedia, Bukalapak
● Komputer menjadi lebih murah dan teknologi lebih powerful
● Tingkat persaingan yang semakin tinggi● Datamining membantu Ilmuwan untuk menganalisis
dataset dalam jumlah besar dan membangun hipotesis
![Page 6: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/6.jpg)
6
Definisi Data Mining (Tan et al, 2010)
● Ekstraksi informasi pada suatu data dengan ukuran besar, yang sebelumnya tidak diketahui, dan berpotensi memberikan informasi dari data tertentu
● Eksplorasi & analisis, dengan cara otomatis atau semi-otomatis, data dalam jumlah besar untuk menemukan pola yang bermakna
![Page 7: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/7.jpg)
7
Definisi Data Mining
![Page 8: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/8.jpg)
8
Asal Usul Penambangan Data
● Menarik ide dari pembelajaran mesin / AI, pengenalan pola, statistik, dan sistem basis data
● Teknik tradisional mungkin tidak cocok untuk data dengan kriteria:– Skala besar– Dimensi tinggi– Heterogen– Kompleks– Didistribusikan
● Komponen utama dari bidang baru yang muncul dari ilmu data science dan penemuan berbasis data (KDD)
![Page 9: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/9.jpg)
9
Data Mining Task
● Metode Prediksi– Menggunakan beberapa variabel atau atribut untuk
memprediksi nilai variabel atau atribut lain yang tidak diketahui untuk kebutuhan di masa mendatang.
● Metode Deskripsi– Menemukan pola yang bisa ditafsirkan oleh manusia dan
menggambarkan dataset yang digunakan.
![Page 10: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/10.jpg)
10
Data Mining Task
![Page 11: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/11.jpg)
11
Model Prediksi: Klasifikasi
● Mencari model untuk kelas atribut sebagai target dari atribut yang lain
●
![Page 12: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/12.jpg)
12
![Page 13: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/13.jpg)
13
Contoh Klasifikasi
● Klasifikasi transaksi kartu kredit dengan kategori normal atau menipu
● Klasifikasi wilayah (badan air, daerah perkotaan, hutan, dll.) Menggunakan data satelit
● Mengkategorikan berita sebagai berita keuangan,cuaca, hiburan, olahraga, dll
![Page 14: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/14.jpg)
14
Regression
● Memprediksi nilai variabel bernilai kontinu yang diberikan berdasarkan nilai-nilai variabel lain, dengan asumsi model ketergantungan linear atau nonlinear.
● Diperdalam pada Statistik dan neural network● Contoh:
– Memprediksi jumlah penjualan produk baru berdasarkan pembelanjaan yang menguntungkan.
– Prediksi deret waktu dari indeks pasar saham.
![Page 15: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/15.jpg)
15
Clustering
Menemukan kelompok objek sedemikian rupa sehingga objek dalam klaster akan serupa (atau terkait) satu sama lain dan berbeda dari (atau tidak terkait dengan) objek dalam grup lain
![Page 16: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/16.jpg)
16
Contoh Klasterisasi
● Pengelompokkan pelanggan untuk target marketing
● Pengelompokan dokumen berdasarkan kesamaan dokumen yang dicari
● Summarization : Abstrak dan Keyword
![Page 17: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/17.jpg)
17
Definisi Association Rule
● Berisi sekumpulan transaksi pembelian barang yang berisi item-item barang (susu, keju, indomie)
● Menghasilkan aturan ketergantungan yang akan memprediksi terjadinya pembelian barang berdasarkan kemunculan barang-barang lainnya.
![Page 18: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/18.jpg)
18
Contoh Association Analysis
● Market Based analysis● Medical Informatics● Telecommunication alarm diagnosis● Keterkaitan Peristiwa Bencana Alam● Kelulusan Tepat waktu Mahasiswa
![Page 19: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/19.jpg)
19
Anomaly Detection
● Mendeteksi penyimpangan yang signifikan dari perilaku normal
● Contoh:– Deteksi Penipuan Kartu Kredit– Network Intrusion– Identifikasi perilaku anomali dari jaringan sensor untuk
pemantauan dan pengawasan.
![Page 20: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/20.jpg)
20
Dataset dan Data Preprocessing (Praktikum)
● Aggregation● Sampling● Dimensionality Reduction● Feature subset selection● Feature creation● Discretization and Binarization● Attribute Transformation
![Page 21: Konsep Dasar Data Mining Pada Era 4staff.budiluhur.ac.id/indra/files/2020/11/Materi-Data...5 Mengapa ada Data Mining Data terkumpul dalam jumlah besar dan ditempatkan pada Pangkalan](https://reader034.fdokumen.com/reader034/viewer/2022052502/609101ee2d7e987a5f0d39ee/html5/thumbnails/21.jpg)
21
Matur Nuwun (Terima Kasih)