Chapter 11 Data Management

37
Data Management Warehousing, Analyzing, Mining, And Visualization Chapter 11 1 Kelompok : Ika Prihartati – Hani Novita – Christy Aprilia – Lady Christiani

Transcript of Chapter 11 Data Management

Page 1: Chapter 11   Data Management

Data ManagementWarehousing, Analyzing, Mining, And Visualization

Chapter 11 1

Kelompok : Ika Prihartati – Hani Novita – Christy Aprilia – Lady Christiani

Page 2: Chapter 11   Data Management

Chapter 11 2

CHAPTER OBJECTIVES

Page 3: Chapter 11   Data Management

Data adalah aset, bila dikonversi ke informasi, data dan pengetahuan memberikan keunggulan kompetitif perusahaan. Tetapi pengelolaan data itu sulit karena berbagai alasan :•Jumlah data bertambah seiring bertambahnya waktu.•Data yang tersebar di seluruh organisasi.•Data dikumpulkan oleh banyak orang menggunakan beberapa metode.•Data eksternal perlu dipertimbangkan dalam membuat keputusan organisasi.•Data keamanan, kualitas, dan integritas sangat penting.

Chapter 11 3

Data Management : A Crit ical Success Factor11.1

Page 4: Chapter 11   Data Management

Chapter 11 4

Data Life Cycle Process

Kegiatan Data Life Cycle menghasilkan pendukung keputusan dan pengetahuan untuk perusahaan.

Page 5: Chapter 11   Data Management

Sumber data internal biasanya disimpan dalam database perusahaan dan berisi tentang orang-orang, produk, jasa, dan proses.Sumber data ekternal berkisar dari database komersial sampai laporan pemerintah, internet dan layanan database komersial yang dapat diakses melalui Internet.Data pribadi adalah dokumentasi dari expertise pegawai perusahaan yang umumnya dipelihara oleh karyawanChapter 11 5

Sumber Data

Page 6: Chapter 11   Data Management

 Pengumpulan data dapat berlangsung : di lapangan, dari individu, melalui metode pembelajaran manual (waktu, survei, pengamatan, kontribusi dari para ahli), menggunakan instrumen dan sensor, Sistem Pengolahan Transaksi (TPS), melalui transfer elektronik, dari sebuah situs web

Chapter 11 6

Metode Pengumpulan Data Mentah

Page 7: Chapter 11   Data Management

Data Flow Manager (DFM) : mengambil informasi dari sumber eksternal dan menempatkan di mana diperlukan , bila diperlukan , dalam bentuk yang mudah digunakan. 

DFM terdiri dari : •sistem pendukung keputusan•prosesor permintaan data sentral•komponen integritas data •link ke pemasok data eksternal•proses yang digunakan oleh pemasok data eksternal.

Chapter 11 7

Metode untuk mengelola pengumpulan data

Page 8: Chapter 11   Data Management

Kualitas data (DQ) menentukan kegunaan data serta kualitas keputusan.Aspek DQ :•Intrinsik DQ : ketepatan , objektivitas , kepercayaan, dan reputasi.•Aksesibilitas DQ : kemudahahan dan akses keamanan.•Kontekstual DQ : relevans, nilai tambah , ketepatan waktu, kelengkapan, jumlah data.•Representasi DQ : mudah diinterpretasi, kemudahan dalam pemahaman , representasi ringkas, yang konsisten representasi.

Chapter 11 8

Kualitas Data dan Integritas

Page 9: Chapter 11   Data Management

Manajemen dokumen adalah kontrol otomatis dari dokumen elektronik, gambaran, s p re a d she e t, dokumen pengolah kata, dan dokumen-dokumen kompleks lainnya dalam sebuah organisasi, siklus dari penciptaan awal sampai pengarsipan akhir.

Chapter 11 9

Manajemen Dokumen

Page 10: Chapter 11   Data Management

Pengolahan transaksional mengambil tempat dalam sistem operasional (TPS) yang menyediakan organisasi dengan kemampuan yang untuk melakukan transaksi bisnis dan menghasilkan transaksi laporan, terutama untuk pengolahan yang cepat dan efisien dari data rutin & berulang-ulang.pengolahan analisis, melibatkan analisis dari akumulasi data. Pengolahan analisis (intelijen bisnis), meliputi data mining, Sistem Pendukung Keputusan (DSS), query, dan kegiatan analisis lainnya.

Chapter 11 10

Transaksional vs Analisis Pengolahan Data

Page 11: Chapter 11   Data Management

Data Warehouse adalah tempat penyimpanan data historis berorientasi subjek yang terorganisir sehingga dapat diakses dalam bentuk yang mudah diterima untuk kegiatan pengolahan analisis.

Keuntungan dari Data Warehouse :Kemampuan untuk mendapatkan data yang cepat, mudah bagi end user via web browser, akan mempermudah pembuatan aplikasi-aplikasi DSS dan EIS (Enterprise Information System)

Chapter 11 11

Data Warehouse11.2

Page 12: Chapter 11   Data Management

7 Karakteristik Data Warehouse :•Organization. Data diatur oleh subjek•Konsistensi. Data akan diberi kode secara konsisten.•Rentang Waktu. Data disimpan selama bertahun-tahun sehingga mereka dapat digunakan untuk tren, peramalan, dan perbandingan dari waktu ke waktu.•Nonvolatile. Setelah masuk ke tempat penyimpanan, data tidak diperbarui secara realtime & menjadi koleksi tetap.

Chapter 11 12

Data Warehouse

Page 13: Chapter 11   Data Management

7 Karakteristik Data Warehouse :•Relational. Biasanya data warehouse menggunakan Struktur relasional.•Client / Server. Data warehouse menggunakan arsitektur client / server terutama untuk memberikan akses yang mudah ke data bagi pengguna akhir.•Web-based. Data warehouse dirancang untuk memberikan sebuah lingkungan komputasi yang efisien untuk Web berbasis aplikasi.

Chapter 11 13

Data Warehouse

Page 14: Chapter 11   Data Management

Chapter 11 14

Data Warehouse

Page 15: Chapter 11   Data Management

Data Mart adalah versi kecil dari data warehouse yang dirancang untuk unit bisnis strategis atau departemen, data mart memberikan respon yang lebih cepat dan lebih mudah dinavigasi.Dua jenis type utama dari data mart :•Direplikasi : mereplikasi sub set dari data warehouse ke dalam data mart kecil•Data mart yang berdiri sendiri.

Chapter 11 15

Data Mart

Page 16: Chapter 11   Data Management

Database multidimensi (kadang-kadang disebut OLAP) khusus menyimpan data yang mengatur fakta-fakta dengan dimensi, seperti wilayah geografis, lini produk, tenaga penjual, waktu.

Data Cubes menyediakan : Query, Slices dan Dices information, Rollups, Drill Downs dengan lebih cepat.

Chapter 11 16

Data Cube

Page 17: Chapter 11   Data Management

adalah sebuah database untuk sistem proses transaksi yang menggunakan konsep data warehouse untuk menyediakan data yang bersih dan tidak ada kesalahan ke TPS.

Biasanya digunakan untuk keputusan jangka pendek yang membutuhkan waktu analisis data sensitif. Secara logika berada diantara data operasional dan data warehouse.

Chapter 11 17

Penyimpanan Data Operasional

Page 18: Chapter 11   Data Management

adalah kategori yang luas dari aplikasi dan teknik untuk mengumpulkan, menyimpan, menganalisis dan menyediakan akses data.

BI membantu pengguna perusahaan membuat bisnis yang lebih baik dan keputusan strategis.

Aplikasi utama meliputi kegiatan query dan pelaporan, OLAP, DSS, data mining, peramalan dan analisis statistik.  

Chapter 11 18

Business Intelligence11.3

Page 19: Chapter 11   Data Management

Dimulai dengan pencarian informasi.

Chapter 11 19

Business Intelligence

Page 20: Chapter 11   Data Management

Tujuan utama Knowledge Discovery (KDD) dalam database adalah untuk mengidentifikasi dengan valid, data yang baru dan tidak diketahui, berpotensi untuk menemukan pola yang berguna dan mudah dipahami dalam data.KDD didukung oleh tiga teknologi :•Pengumpulan data besar•Komputer multiprosesor kuat•Data mining dan algoritma lainnya. 

Chapter 11 20

Knowledge Discovery

Page 21: Chapter 11   Data Management

 

Chapter 11 21

Knowledge Discovery

KDD terutama menggunakan tiga alat untuk penemuan informasi :•Bahasa query tradisional ( SQL , ... )•OLAP•Data mining

Page 22: Chapter 11   Data Management

Chapter 11 22

Knowledge Discovery

Page 23: Chapter 11   Data Management

Query memungkinkan pengguna untuk meminta informasi dari komputer yang tidak tersedia dalam laporan periodik .Sistem permintaan sering didasarkan pada menu atau jika data disimpan dalam database terstruktur melalui bahasa query (SQL) atau menggunakan metode query-by -example (QBE). Permintaan pengguna dinyatakan dalam bahasa query dan hasilnya himpunan bagian dari hubungan :•Penjualan oleh departemen dengan jenis pelanggan untuk jangka waktu tertentu•Kondisi cuaca untuk tanggal tertentu•Penjualan dari hari ke tiap mingguChapter 11 23

Queries

Page 24: Chapter 11   Data Management

Pengolahan analisis online adalah satu set alat yang menganalisis dan keseluruhan data untuk mencerminkan kebutuhan bisnis perusahaan. OLAP dilakukan pada data warehouse dan data marts.•ROLAP (Relational OLAP) adalah database OLAP yang diimplementasikan di atas sebuah database relasional yang ada. Multidimensional view dibuat setiap kali untuk pengguna.•MOLAP (Multidimensional OLAP) adalah penyimpanan data khusus multidimensi seperti data cube. Tampilan multidimensi secara fisik disimpan dalam mengkhususkan file data.

Chapter 11 24

Online Analytical Processing

Page 25: Chapter 11   Data Management

Data Mining adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar.

Kegunaan data mining adalah untuk menspesifikasikan pola yang harus ditemukan dalam tugas data mining. Seperti (data pembelian, data penjualan, data nasabah, data transaksi dsb.)

Chapter 11 25

Data Mining11.4

Page 26: Chapter 11   Data Management

Teknologi data mining dapat menghasilkan peluang bisnis baru dengan menyediakan :•Prediksi otomatis dari tren dan perilaku .•Penemuan otomatis dari sebelumnya tidak diketahui atau pola yang disembunyikan.Alat Data Mining dapat dikombinasikan dengan :•Spreadsheets•Pengguna akhir dari pengembangan perangkat lunak lainData Mining menciptakan kubus data yang kemudian mengekstrak data.

Chapter 11 26

Data Mining

Page 27: Chapter 11   Data Management

• Berbasis dari pertimbangan, menggunakan kasus historis untuk mengenali pola

• Komputasi Neural adalah pendekatan pembelajaran mesin yang menguji data historis untuk pola.

• Intelligent Agents mengambil informasi dari internet atau dari database berbasis intranet .

• Analisis Asosiasi menggunakan satu set khusus dari algoritma khusus melalui set data yang besar dan mengekspresikan aturan statistic antara barang-barang.

• Alat lainnya : Susunan Keputusan , Algoritma Genetika , Metode Tetangga TerdekatChapter 11 27

Teknik Data Mining

Page 28: Chapter 11   Data Management

• Klasifikasi. Menentukan karakteristik dari kelompok tertentu.

• Clustering. Mengidentifikasi kelompok barang yang berbagi karakteristik tertentu. Clustering berbeda dari klasifikasi dalam karakteristik karena tidak ada penentuan terlebih dulu.

• Asosiasi. Mengidentifikasi hubungan antara peristiwa yang terjadi pada satu waktu.

Chapter 11 28

Tugas Data Mining

Page 29: Chapter 11   Data Management

• Sequencing. Mengidentifikasi hubungan yang ada lebih dari satu periode waktu.

• Peramalan. Perkiraan nilai masa depan berdasarkan pola dalam set data yang besar.

• Regresi. Memetakan sebuah item data ke sebuah variabel prediksi .

• Analisis Time Series memeriksa nilai yang bervariasi dari waktu.

Chapter 11 29

Tugas Data Mining

Page 30: Chapter 11   Data Management

Selain data yang tersimpan dalam database tradisional ada " Struktur " yang lain yang bisa dipilih untuk pola. •Text Mining adalah aplikasi dari data mining untuk file teks tidak terstruktur atau kurang terstruktur.•Web Mining adalah aplikasi dari teknik data mining untuk data yang terkait dengan World Wide Web. Data mungkin ada dalam halaman web atau terkait dengan aktivitas web.•Tata Ruang Mining adalah aplikasi dari teknik data mining untuk data yang memiliki komponen lokasi.•Temporal Mining adalah aplikasi dari teknik data mining kepada data yang dipelihara secara berkala.

Chapter 11 30

Lingkungan Lain Data Mining

Page 31: Chapter 11   Data Management

Visualisasi data mengacu pada penyajian data dengan teknologi seperti gambar digital, sistem informasi geografis, pengguna grafis antarmuka, tabel dan grafik multidimensi, virtual reality, presentasi tiga dimensi, video dan animasi.

Visualisasi Multidimensi : Data modern dan Informasi mungkin memiliki beberapa dimensi :•Dimensi•Ukuran•Waktu

Chapter 11 31

Data Visualization11.5

Page 32: Chapter 11   Data Management

• Sistem Informasi geografis (GIS) adalah sistem berbasis komputer untuk menangkap, menyimpan, memeriksa, mengintegrasikan, memanipulasi, dan menampilkan data menggunakan peta digital. Setiap record atau digital objek memiliki lokasi geografis yang diidentifikasi.

• Visual Interaktif Modeling (VIM) menggunakan tampilan komputer grafis mewakili dampak yang berbeda dari keputusan manajemen atau operasional pada tujuan seperti keuntungan atau pangsa pasar.

• Virtual reality (VR) adalah interaktif, grafis tiga dimensi disampaikan kepada pengguna . Isyarat sensorik buatan ini menyebabkan pengguna untuk “percaya“ bahwa apa yang mereka lakukan adalah nyata.

Chapter 11 32

Data Visualization

Page 33: Chapter 11   Data Management

Data warehouse dan data mart melayani pengguna akhir di seluruh daerah fungsional. Kebanyakan database saat ini adalah statis, mereka hanya mengumpulkan dan menyimpan informasi. Lingkungan bisnis saat ini juga memerlukan database khusus.Database Transaksi Pemasaran (MTD)•menggabungkan banyak karakteristik database saat ini dan sumber data pemasaran menjadi database baru yang memungkinkan pemasar untuk terlibat secara real–time dan target setiap interaksi dengan pelangganKemampuan Interaktif •transaksi interaktif terjadi dengan pelanggan bertukar informasi dan memperbarui database di real time, yang bertentangan dengan periodik (mingguan, bulanan, atau kuartal) update data warehouse dan data mart

Chapter 11 33

Specialized Databases11.6

Page 34: Chapter 11   Data Management

Data manajemen dan kegiatan intelijen bisnis –dari akuisisi data ke data mining- sering dilakukan dengan alat-alat Web, atau saling berkaitan dengan teknologi Web dan e-bisnis. Hal ini dilakukan melalui intranet, bagi orang luar melalui extranet.•Perusahaan BI suite dan portal corporate mengintegrasikan permintaan, pelaporan, OLAP, dan alat-alat lainnya•Data Warehouse Intelligent : Sistem berbasis web menggunakan mesin pencari untuk aplikasi tertentu yang dapat meningkatkan operasi data warehouse•Clickstream Data Warehouse terjadi di dalam lingkungan Web, ketika pelanggan mengunjungi situs web.

Chapter 11 34

Web Based Data Management System11.7

Page 35: Chapter 11   Data Management

Chapter 11 35

Web Based Data Management System

Page 36: Chapter 11   Data Management

Chapter 11 36

Web Based Data Management System

Page 37: Chapter 11   Data Management

Chapter 11 37

Pertanyaan