Konsep data mining
-
Upload
catanowaterfilter -
Category
Documents
-
view
152 -
download
26
description
Transcript of Konsep data mining
PENGENALAN
DATA MINING
1.Apa itu Data Mining?2.Peran Utama Data
Mining3.Algoritma Data Mining
Pengantar• Perkembangan teknologi dalam bidang
basis data makin meningkat dengan sangat cepat.
• Memungkinkan suatu perusahaan atau organisasi mengumpulkan data dari berbagai sumber dengan mudah dan cepat.
• Kemudahan dalam mengumpulkan data ini membuat volume data menjadi semakin besar dan terus bertambah.
20/04/23
•Data bisa saja dianalisis dan diinterpretasi secara manual untuk mendapatkan informasi dan pengetahuan yang terkandung didalamnya,
•Analisis data manual bersifat lambat, mahal dan sangat subjektif.
Pengantar
• Teknik manual atau dapat juga disebut teknik tradisional
• Tidak mungkin digunakan untuk menemukan informasi dan pengetahuan yang terkandung pada sekumpulan data dalam ukuran yang sangat besar.
• Kebutuhan analisis data tersebut dapat dijawab dengan adanya teknologi data mining
• Yaitu suatu teknologi untuk mengekstraksi atau menambang pengetahuan dari data skala besar
Pengantar
• Proses penggalian pola dari data
• Mengubah data menjadi informasi
• Sering dilakukan hanya pada sampel data
Apa itu Data Mining?
Apa itu Data Mining?
• Disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data1. Data: fakta yang terekam dan tidak
membawa arti2. Pengetahuan: pola, aturan atau model
yang muncul dari data
• Sehingga Data mining sering disebut Knowledge Discovery in Database (KDD)
• Konsep TransformasiDataInformasiPengetahuan
•Proses secara otomatis menemukan informasi yang berguna yang tersimpan pada data dengan ukuran besar.
•Tujuan utama penggunaan data mining adalah deskripsi dan prediksi.
Apa itu Data Mining?
• Deskripsi berarti menemukan pola yang mudah dipahami oleh pengguna dalam menggambarkan data.
• Prediksi berarti menemukan pola untuk memprediksi nilai dari suatu variabel dalam basis data dengan melibatkan penggunaan beberapa variabel yang nilainya sudah diketahui.
Apa itu Data Mining?
Mengapa Data Mining?
• Manusia dalam suatu organisasi, sadar atau tidak sadar telah memproduksi berbagai data yang jumlahnya sangat besar– Contoh data: bisnis, kedokteran,
ekonomi, geografi, olahraga, …
• Pada dasarnya, data adalah entitas yang tidak memiliki arti, meskipun kemungkinan memiliki nilai di dalamnya
Data•Tidak membawa arti,
merupakan kumpulan dari fakta-fakta tentang suatu kejadian
•Suatu catatan terstruktur dari suatu transaksi
•Merupakan materi penting dalam membentuk informasi
Pengetahuan• Gabungan dari suatu pengalaman,
nilai, informasi kontekstual dan juga pandangan pakar yang memberikan suatu framework untuk mengevaluasi dan menciptakan pengalaman baru dan informasi(Thomas H. Davenport, Laurence Prusak)
• Bisa berupa solusi pemecahan suatu masalah, petunjuk suatu pekerjaan dan ini bisa ditingkatkan nilainya, dipelajari dan juga bisa diajarkan kepada yang lain
•Memperbaiki teknik tradisional
•Pengelolaan Jumlah data yang sangat besar
•Pengelolaan Dimensi data yang tinggi
•Pengelolaan Data yang heterogen dan berbeda sifat
Tujuan
Bidang Ilmu
Irisan Ilmu Data Mining
1.Statistik: •Lebih bersifat teori•Fokus ke pengujian hipotesis
2.Machine Learning:•Lebih bersifat heuristik•Fokus pada perbaikan performansi dari
suatu teknik learning
3.Data Mining:•Gabungan teori dan heuristik•Fokus pada seluruh proses penemuan
knowledge dan pola•Termasuk data cleaning, learning dan
visualisasi hasilnya
CONTOH KASUS:Komponen : Komponen : tgl. pasangtgl. pasang, , tgl. Rusaktgl. Rusak, , km pakaikm pakai, , AsalAsal, , lokasi pakailokasi pakai
Q : Menentukan kesesuaian antara Asal komponen, dengan kondisi operasi komponen
Tgl. Pasang
Tgl. Rusak
KM Pakai
Asal Lokasi Pakai
Okt.05 Agu.06 53.000 Korea Jakarta
Mar.05 Jul.06 40.000 Taiwan Bandung
Jan.06 Sep.06 35.000 Jepang Jakarta
CONTOH KASUS:
Mhs : Mhs : ProdiProdi, , IPIP, , lama kuliahlama kuliah, , Asal SMAAsal SMA, , Asal SDAsal SD, , SukuSuku
Q : Menentukan keterkaitan antara SUKU dengan prestasi pada prodi tertentu.
Prodi IP Lama Kuliah
Asal SMA
Asal SD
Suku
IF 3,6 11 Jogya Jogya Jawa
EL 3,4 10 Makssar Makssar Minang
AR 3,7 12 Bandung Majalaya Sunda
TL 3,2 9 Jakarta Jakarta Ambon
Data - Informasi – Pengetahuan
Data Kehadiran Pegawai
NIPNIP TGLTGL DATANGDATANG PULANGPULANG
11031103 02/12/200402/12/2004 07:2007:20 15:4015:40
11421142 02/12/200402/12/2004 07:4507:45 15:3315:33
11561156 02/12/200402/12/2004 07:5107:51 16:0016:00
11731173 02/12/200402/12/2004 08:0008:00 15:1515:15
11801180 02/12/200402/12/2004 07:0107:01 16:3116:31
11831183 02/12/200402/12/2004 07:4907:49 17:0017:00
Informasi Akumulasi Bulanan KehadiranPegawai
NIPNIP MasukMasuk AlpaAlpa CutiCuti SakitSakit TelatTelat
11031103 2222
11421142 1818 22 22
11561156 1010 11 1111
11731173 1212 55 55
11801180 1010 1212
Data - Informasi – Pengetahuan
Informasi Kondisi Kehadiran Mingguan Pegawai
SeninSenin SelasaSelasa RabuRabu KamisKamis JumatJumat
TerlambatTerlambat 77 00 11 00 55
Pulang Pulang CepatCepat
00 11 11 11 88
IzinIzin 33 00 00 11 44
AlpaAlpa 11 00 22 00 22
Data - Informasi – Pengetahuan
Pengetahuan tentang kebiasaan pegawai dalam jam datang/pulang kerja
Pengetahuan tentang bagaimana teknik meningkatkan kehadiran pegawai kebijakan
Data - Informasi – Pengetahuan
• Kebijakan penataan jam kerja karyawan khusus untuk hari senin dan jumat
• Peraturan jam kerja:– Hari Senin dimulai jam 10:00– Hari Jumat diakhiri jam 14:00– Sisa jam kerja dikompensasi ke hari lain:
1. Senin pulang setelah maghrib, toh jalanan jakarta macet total di sore hari (bayar hutang 2 jam)
2. Rabu dan kamis bayar hutang setengah jam di pagi hari dan setengah jam di sore hari (bayar hutang 2 jam)
Data - Informasi – Pengetahuan- Kebijakan
TOOLS DATA MINING
Cognitive-Performance Test
1.Jelaskan dengan kalimat sendiri apa yang dimaksud dengan data mining?
2.Apa perbedaan antara data dan pengetahuan (knowledge)?