Data Warehouse

39
Data Warehouse Business Intelligence Hendrik

description

ppt ini adalah bahan materi ajar dosen UII

Transcript of Data Warehouse

Page 1: Data Warehouse

Data WarehouseBusiness Intelligence

Hendrik

Page 2: Data Warehouse

Arsitektur BI

Page 3: Data Warehouse

Fragmentasi sistem informasi secara vertical

Menghasilkan pengembangan sistem operasional yang berbasis aplikasi (pengguna)

Problem: Manajemen Data pada Perusahaan Besar

Sales Administration Finance Manufacturing ...

Sales PlanningStock Mngmt

...

Suppliers

...Debt Mngmt

Num. Control

...Inventory

Page 4: Data Warehouse

Mengumpulkan dan menggabungkan informasi Menyediakan sudut pandang yang terintegrasi,

antaramuka pengguna yang seragam Mendukung berbagi pakai

Goal: Penyatuan Akses ke Data

Integration System

WorldWideWeb

Digital Libraries Scientific Databases

PersonalDatabases

Page 5: Data Warehouse

Pendekatan Tradisional (Query-Driven/ Lazy/ on-demand approach)

Pendekatan Warehousing

Solusi

Page 6: Data Warehouse

Pendekatan Tradisional

Source SourceSource. . .

Integration System

. . .

Metadata

Clients

Wrapper WrapperWrapper

Page 7: Data Warehouse

Kelemahan◦ Delay saat pemrosesan query

Sumber informasi yang lambat atau tidak tersedia Proses integrasi dan penyaringan data yang

kompleks◦ Untuk penggunaan yang sangat intens,

berpotensi tidak efisien dan mahal◦ Adanya kompetisi pemrosesan pada sumber data

Pendekatan Tradisional

Page 8: Data Warehouse

Pendekatan Warehousing

DataWarehouse

Clients

Source SourceSource. . .

Extractor/Monitor

Integration System

. . .

Metadata

Extractor/Monitor

Extractor/Monitor

Informasi terintegrasi di awal

Tersimpan pada gudang data (WH) untuk query dan analisis langsung

Page 9: Data Warehouse

Kinerja query yang tinggi Tidak saling mengganggu saat pemrosesan

pada sumber data◦ Query kompleks dilakukan pada DW◦ OLTP dilakukan pada sumber informasi

Informasi digandakan pada DW◦ Dapat digunakan untuk memodifikasi,

mendokumentasi, merangkum dan merestruktutisasi data.

◦ Dapat menyimpan informasi historis Banyak digunakan pada dunia industri

Pendekatan Warehousing

Page 10: Data Warehouse

Pendekatan Query-driven tetap lebih baik dalam kasus◦ Perubahan informasi yang sangat cepat◦ Perubahan sumber informasi yang sangat cepat◦ Klien dengan kebutuhan yang sulit diprediksi

Page 11: Data Warehouse

“A data warehouse is simply a single, complete, and consistent store of data obtained from a variety of sources and made available to end users in a way they can understand and use it in a business context.” -- Barry Devlin, IBM Consultant

Definisi DataWarehouse (DW)-sudut pandang praktisi

Page 12: Data Warehouse

Berorientasi subjek Terintegrasi Runtun waktu (time series) Tak berubah (non volatile)

Karakteristik DataWarehouse (DW)

Page 13: Data Warehouse

Data disimpan dan dikategorisasikan berdasarkan subjek bisnis.

Data diorganisir sedemikian rupa sehingga semua elemen data berelasi dengan kejadian atau objek dunia nyata yang dihubungkan bersama

Menyediakan pandangan menyeluruh terhadap data

Karakteristik - Berorientasi Subjek

Page 14: Data Warehouse

Aplikasi vs berorientasi subjek

Page 15: Data Warehouse

Mengambil data dari berbagai sumber data Disajikan dalam format yang konsisten Menangani konflik nama dan satuan

Karakteristik - Terintegrasi

OLTP Applications

Savings

Currentaccounts

Loans

Data Warehouse

Customer

Page 16: Data Warehouse

Digunakan untuk keperluan analisis trend, deviasi, peramalan, perbandingan, …

Waktu: harian, mingguan, bulanan

Karakteristik – Runtun Waktu

Page 17: Data Warehouse

Data tidak untuk diubah (read-only)

Karakteristik – Tak Berubah

Insert UpdateDelete

Read Read

Operational Warehouse

Load

Page 18: Data Warehouse

Perubahan dianggap sebagai data baru

Karakteristik – Tak Berubah

Warehouse Database

First time load

Refresh

Refresh

Refresh

Operational Database

Page 19: Data Warehouse

Data Operasional vs DWProperty

ResponseTime

Operations

Nature of Data

Data Organization

Size

Data Source

Activities

Operational

Sub seconds to seconds

DML

30-60 days

Applications

Small to large

Operational, Internal

Processes

Data Warehouse

Seconds to hours

Snapshots over time

Subject, time

Large to very large

Operational, Internal,External

Analysis

Primarily read only

Page 20: Data Warehouse

Meningkatkan produktivitas knowledge worker

mendukung semua kebutuhan data pembuat keputusan

Menyediakan akses ke data kritis yang senantiasa siap

Memisahkan basisdata operasi dengan ad-hoc processing

Menyediakan rangkuman informasi bagi level manajemen tingkat tinggi

Menyediakan kemampuan drill-down

Keuntungan

Page 21: Data Warehouse

Organisasi yang ….◦ Memiliki data pada berbagai macam

sistem/aplikasi◦ Menggunakan pendekatan manajemen berbasis

informasi◦ Besar, memiliki pelanggan dengan lokasi yang

terpisah atau berbeda-beda◦ Memiliki data yang sama namun dengen

representasi yang berbeda pada berbagai sistem yang berbeda pula

Sesuai untuk……

Page 22: Data Warehouse

Data detil kini Detil data lampau Data terangkum tingkat rendah Data terangkum tingkat tinggi Metadata

◦ Merupakan direktori terkait apa yang ada di DW, panduan pemetaan data dari data operasional ke bentuk DW, aturan yang digunakan untuk perangkuman (summarization)

Struktur DW

Page 23: Data Warehouse

Bagian dari DW yang berisi data yang relevan untuk fungsi bisnis tertentu (fokus pada 1 subjek)◦ Dependent DM : Subset DW◦ Independent DM: DW kecil (mis: untuk 1

departemen/unit bisnis)

Memerlukan detil data level rendah

Data Mart

Page 24: Data Warehouse

DW vs DM

DataWarehouse

DataMart

Page 25: Data Warehouse

Dependent Data Mart

MarketingSales

FinanceHuman Resources

Marketing

Marketing

Marketing

External Data

DataWarehouse

OperationalSystems

Flat Files

Data Marts

Page 26: Data Warehouse

Independent Data Mart

OperationalSystems

External Data

Sale or Marketing

Flat Files

Page 27: Data Warehouse

Arsitektur

Metadata respository Serves

Extract Clean

Transform Load

Refresh OLAP

Data Warehouse

External Data Sources

Operational Databases

Visualisation

Data Mining

Page 28: Data Warehouse

Data Mart Centric Virtual Federated Hub-and-Spoke DW Enterprise DW

Arsitektur Integrasi Data

Page 29: Data Warehouse

Data Mart Centric (1)

Page 30: Data Warehouse

Plus◦ Secara organisasi dan teknis mudah dibangun

Minus◦ Tidak ada sudut pandang enterprise◦ Redundansi biaya data◦ Biaya ETL dan operasional tinggi

Data Mart Centric (2)

Page 31: Data Warehouse

Virtual Federated (1)

Page 32: Data Warehouse

Plus◦ Tidak perlu platform tersendiri

Minus◦ Cocok hanya untuk volume rendah◦ Kompleksitas tinggi◦ Perlu bandwith besar◦ Masalah pada metadata

Virtual Federated (2)

Page 33: Data Warehouse

Hub and Spoke DW (1)

Page 34: Data Warehouse

Plus◦ Kustomisasi UI dan laporan mudah

Minus◦ Tantangan pada sudut pandang enterprise◦ Redundan biaya data◦ Biaya operasi tinggi◦ Data terlambat

Hub and Spoke DW (2)

Page 35: Data Warehouse

Enterprise DW (1)

Page 36: Data Warehouse

Plus◦ Menyediakan sudut pandang enterprise◦ Konsistensi data tinggi◦ Data dapat dipakai ulang (reusable)

Minus◦ Perlu visi, komitmen dan kepemimpinan

enterprise

Enterprise DW (2)

Page 37: Data Warehouse

Inmon Model (pendekatan EDW)◦ Top-Down◦ Adaptasi dari basisdata relasional untuk

keperluan enterprise

Kimball Model (pendekatan DM)◦ Bottom-Up◦ “Plan Big, Build Small”

Pengembangan DW

Page 38: Data Warehouse

InMon vs Kimball Model (1)

Page 39: Data Warehouse

InMon vs Kimball Model (2)