Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... •...

77
Arsitektur Data Warehouse Minggu 4

Transcript of Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... •...

Page 1: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Arsitektur Data WarehouseMinggu 4

Page 2: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

PengantarMengapa Pemodelan Data itu penting ? …

• Tujuan Meyakinkan semua objek datayang diperlukan oleh database telahterpenuhi.

Mengapa Pemodelan Data itu penting ? …

• Tujuan Meyakinkan semua objek datayang diperlukan oleh database telahterpenuhi.

Page 3: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Tabel Relational• Tabel Relasional dibangun oleh baris dan kolom• Terdapat dua sudut pandang , yaitu :

– Baris sebagai sumbu x dan kolom sebagi sumbu y

Tapi sebenarnya tabel relasional tersebut hanya mempunyaisatu dimensi

Lihat pada slide berikut ini

• Tabel Relasional dibangun oleh baris dan kolom• Terdapat dua sudut pandang , yaitu :

– Baris sebagai sumbu x dan kolom sebagi sumbu y

Tapi sebenarnya tabel relasional tersebut hanya mempunyaisatu dimensi

Lihat pada slide berikut ini

Page 4: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

• Karakteristik :• setiap record atau baris merepresentasikan data buku

yang berbeda-beda.• Satu baris dengan baris lainnya diidentifikasikan dengan

sebuah key yaitu primary key.• Sedangkan bagian kolom seperti, judul, jenis buku,

pengarang menyimpan fakta yang sama atau sejenis,dimana setiap fakta tersebut merujuk pada primary keyyaitu Kode Buku.

• Hal inilah yang menunjukkan bahwa tabel relasionalhanya mempunyai satu dimensi.

• Karakteristik :• setiap record atau baris merepresentasikan data buku

yang berbeda-beda.• Satu baris dengan baris lainnya diidentifikasikan dengan

sebuah key yaitu primary key.• Sedangkan bagian kolom seperti, judul, jenis buku,

pengarang menyimpan fakta yang sama atau sejenis,dimana setiap fakta tersebut merujuk pada primary keyyaitu Kode Buku.

• Hal inilah yang menunjukkan bahwa tabel relasionalhanya mempunyai satu dimensi.

Page 5: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Data Multidimensi• Data multidimensi adalah “ketika kita dapat melihat

sebuah data dari berbagai sudut pandang atau dimensi”• Sebagai contoh, penjualan buku dapat dilihat dari segi

Buku, waktu, lokasi penjualan / toko dan sebagainya.• Jika digambarkan , maka akan terdapat tiga koordinat

yaitu sumbu x mewakili buku, sumbu y mewakili dimensiwaktu dan sumbu z untuk dimensi lokasi.

• Hal inilah yang menjadi perbedaan mendasar antaratabel relasional dan data multidimensi.

• Data multidimensi adalah “ketika kita dapat melihatsebuah data dari berbagai sudut pandang atau dimensi”

• Sebagai contoh, penjualan buku dapat dilihat dari segiBuku, waktu, lokasi penjualan / toko dan sebagainya.

• Jika digambarkan , maka akan terdapat tiga koordinatyaitu sumbu x mewakili buku, sumbu y mewakili dimensiwaktu dan sumbu z untuk dimensi lokasi.

• Hal inilah yang menjadi perbedaan mendasar antaratabel relasional dan data multidimensi.

Page 6: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Spreadsheet

WaktuPenj

Page 7: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Pemodelan data MultidimensiWhat is Dimensional Modeling ? …..• Menggunakan dua konsep yaitu tabel fakta

(fact table) dan tabel dimensi (dimensionaltable)

• Berbeda dengan konsep normalisasi (3rd

normal form)

What is Dimensional Modeling ? …..• Menggunakan dua konsep yaitu tabel fakta

(fact table) dan tabel dimensi (dimensionaltable)

• Berbeda dengan konsep normalisasi (3rd

normal form)

Page 8: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Pengantar

Tabel Fakta? … danTabel Dimensi ? …

• Tabel Fakta berisi measurement ataumetric dari proses bisnis dan foreign key daritabel dimensi. Tabel fakta merupakan tabelutama dari cube. Karakteristik dari tabelfakta :– kumpulan key dimensi dari tabel– ada measure(yang ingin diukur)– data akan selalu berubah

Tabel Fakta? … danTabel Dimensi ? …

• Tabel Fakta berisi measurement ataumetric dari proses bisnis dan foreign key daritabel dimensi. Tabel fakta merupakan tabelutama dari cube. Karakteristik dari tabelfakta :– kumpulan key dimensi dari tabel– ada measure(yang ingin diukur)– data akan selalu berubah

Page 9: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Pengantar• Measurement ?Misal :Jika anda mempunyai bisnis penjualan sepeda motor maka

measurement dari bisnis anda adalah “jumlahpenjualan motor” atau “rata-rata penjualan sepedamotor merk x”

Contoh lainJika Proses bisnis anda pruduksi kertas maka

measurementnya adalah ” rata-rata produksi kertaspada suatu mesin” atau “produksi kertas setiapbulan”

• Measurement ?Misal :Jika anda mempunyai bisnis penjualan sepeda motor maka

measurement dari bisnis anda adalah “jumlahpenjualan motor” atau “rata-rata penjualan sepedamotor merk x”

Contoh lainJika Proses bisnis anda pruduksi kertas maka

measurementnya adalah ” rata-rata produksi kertaspada suatu mesin” atau “produksi kertas setiapbulan”

Page 10: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

• Tabel Dimensi berisi atribut darimeasurement yang disimpan pada tabelfakta.

• Tabel dimensi merupakan hierarki, kategoridan logic yang dapat digunakan untukmenganalisa measurement dari sudutpandang tertentu.

• Tabel dimensi bersifat statis(tidak berubah)

• Tabel Dimensi berisi atribut darimeasurement yang disimpan pada tabelfakta.

• Tabel dimensi merupakan hierarki, kategoridan logic yang dapat digunakan untukmenganalisa measurement dari sudutpandang tertentu.

• Tabel dimensi bersifat statis(tidak berubah)

Page 11: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

From Requirement (analisakebutuhan) to Data Design(design data)

From Requirement (analisakebutuhan) to Data Design(design data)

Page 12: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan
Page 13: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan
Page 14: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Contoh Information Package Diagram

Page 15: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan
Page 16: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Sebagai contoh Automaker Sales, terdapat tiga tipe entity,yaitu :

1. Measurement atau metric2. Business dimension3. Atribut untuk masing-masing business dimension

MeasurementAutomaker Sales

Sebagai contoh Automaker Sales, terdapat tiga tipe entity,yaitu :

1. Measurement atau metric2. Business dimension3. Atribut untuk masing-masing business dimension

MeasurementAutomaker Sales

Page 17: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan
Page 18: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan
Page 19: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan
Page 20: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan
Page 21: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Contoh : Automaker Sales

Page 22: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Dimensi Produk

Page 23: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Menaruh semuanya bersama-sama. Itu menunjukkanbagaimana berbagai dimension tables dibentuk dariinformation package diagram

Page 24: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

E-R Modeling Vs Dimensional Modeling

Kita telah familiar dengan data modeling untuk operasional atau OLTPsistem. E-R modeling untuk membuat data model sistem.

Untuk Dimensional Model sesuai digunakan untuk modeling datawarehouse.

Page 25: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Definisi Arsitektur

Sekumpulan aturan-aturan atau strukturyang menyediakan kerangka kerja untukdisain keseluruhan sistem atau produk.

Page 26: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Tiga Komponen Utama Arsitektur DW

• Populasi WarehouseDownloading vs Volume Data

• Administrasi WarehousePerawatan Metadata

• Mesin Pendukung KeputusanQuery dan Pelaporan

• Populasi WarehouseDownloading vs Volume Data

• Administrasi WarehousePerawatan Metadata

• Mesin Pendukung KeputusanQuery dan Pelaporan

Page 27: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Hal yang perlu diperhatikan dalam ArsitekturDW

• Cost Effective• Adaptable• Easily Implemented

• Cost Effective• Adaptable• Easily Implemented

Page 28: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Hal yang perlu dipertimbangkan dalammemilih Media & Metode Penyimpanan

• Data load times• Synchronization• Recovery• Summarization levels• Method of data security implementation• Data distribution• Data access and query speed• Ease of maintenance

• Data load times• Synchronization• Recovery• Summarization levels• Method of data security implementation• Data distribution• Data access and query speed• Ease of maintenance

Page 29: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Akses Informasi• Komponen kunci teknik

– Memberikan akses pada orang yang tepatuntuk informasi yang tepat pada waktu yangtepat.

– Memudahkan pengambilan informasi secaracepat dan mudah.

• Komponen kunci teknik– Memberikan akses pada orang yang tepat

untuk informasi yang tepat pada waktu yangtepat.

– Memudahkan pengambilan informasi secaracepat dan mudah.

Page 30: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Tujuan Utama Arsitektur DW• Mendefinisikan suatu struktur yang

membantu customer membuat implementasidata warehouse yang efektif, yaituimplementasi yang memberikan kemudahanakses data pada pengguna dan aplikasi.

• Arsitektur mengidentifikasi danmendefinisikan komponen-komponen, antarmuka, dan protokol-protokol.

• Mendefinisikan suatu struktur yangmembantu customer membuat implementasidata warehouse yang efektif, yaituimplementasi yang memberikan kemudahanakses data pada pengguna dan aplikasi.

• Arsitektur mengidentifikasi danmendefinisikan komponen-komponen, antarmuka, dan protokol-protokol.

Page 31: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Masalah Akses Data/Informasi

• Data yang banyak dan tersebar• Kebutuhan sistem analisis yang cepat dan

mudah dalam mengakses data• Mempertahankan investasi organisasi

terhadap sistem informasi yang telah ada.

• Data yang banyak dan tersebar• Kebutuhan sistem analisis yang cepat dan

mudah dalam mengakses data• Mempertahankan investasi organisasi

terhadap sistem informasi yang telah ada.

Page 32: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Permasalahan Customer yangdiselesaikan dengan Arsitektur DW

• No single view of data• Different user tools• Lack of consistency• Lack of useful historical capability• Conflict between application type• Problems in administering data• Proliferation of complex extract application

• No single view of data• Different user tools• Lack of consistency• Lack of useful historical capability• Conflict between application type• Problems in administering data• Proliferation of complex extract application

Page 33: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Konfigurasi Data

• Single copy configuration• Reconciled data configuration• Derived data configuration• Hybrid data configuration

• Single copy configuration• Reconciled data configuration• Derived data configuration• Hybrid data configuration

Page 34: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Komponen-komponen Kunci ArsitekturalDW

• Model data yang mendefinisikan isi warehouse• Disain database warehouse, apakah hirarsikal,

relasional, atau multidimensional.• Utilitas untuk data scrubbing, copy management,

data transport, data replication, cross platformcommunication

• Optimasi warehouse server untuk pelaporan danpemrosesan query yang cepat

• DSS untuk pelaporan dan analisis

• Model data yang mendefinisikan isi warehouse• Disain database warehouse, apakah hirarsikal,

relasional, atau multidimensional.• Utilitas untuk data scrubbing, copy management,

data transport, data replication, cross platformcommunication

• Optimasi warehouse server untuk pelaporan danpemrosesan query yang cepat

• DSS untuk pelaporan dan analisis

Page 35: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Bagian dari Model Arsitektural DW

• Operational database/external database layer(Lapisan database Operational)

• Information access layer (Lapisan Akses Informasi)• Data access layer (Lapisan Akses Data)• Data directory (metadata) layer• Process management layer• Application messaging layer• Data warehouse layer• Data staging layer

• Operational database/external database layer(Lapisan database Operational)

• Information access layer (Lapisan Akses Informasi)• Data access layer (Lapisan Akses Data)• Data directory (metadata) layer• Process management layer• Application messaging layer• Data warehouse layer• Data staging layer

Page 36: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Pilihan Pemindahan ke DataWarehousing

• Rehosting mainframe applications• Two tier architecture using mainframe as a

server• Three tier data warehouse architecture• Four tier data warehouse architecture

• Rehosting mainframe applications• Two tier architecture using mainframe as a

server• Three tier data warehouse architecture• Four tier data warehouse architecture

Page 37: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Definisi istilah di pendukung keputusan• Facts

variabel-variabel atau pengukuran yang biasanyadisimpan dalam bentuk numerik yang merupakan fokusdari investigasi pendukung keputusan

• MetricsAnalisis pengukuran yang dikalkulasi dari fakta secaralangsung

• DimensionsPengelompokkan secara logika dari atribut-atribut yangmemiliki relasi kunci terkecil yang sama.

• Factsvariabel-variabel atau pengukuran yang biasanyadisimpan dalam bentuk numerik yang merupakan fokusdari investigasi pendukung keputusan

• MetricsAnalisis pengukuran yang dikalkulasi dari fakta secaralangsung

• DimensionsPengelompokkan secara logika dari atribut-atribut yangmemiliki relasi kunci terkecil yang sama.

Page 38: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Permasalahan Disain Skema

Keseimbangan kebutuhan-kebutuhan yangkonflik dari:– fungsionalitas analisis– kinerja query– kemampuan perawatan database

Page 39: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Dua tipe tabel utama yang ada dalamData Warehouse

• Fact Tables• Dimensions Tables

Page 40: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Conceptual Modeling of Data Warehouses

• Modeling data warehouses: dimensions &measures– Star schema: A fact table in the middle connected

to a set of dimension tables– Snowflake schema: A refinement of star schema

where some dimensional hierarchy is normalizedinto a set of smaller dimension tables, forming ashape similar to snowflake

– Fact constellations: Multiple fact tables sharedimension tables, viewed as a collection of stars,therefore called galaxy schema or factconstellation

• Modeling data warehouses: dimensions &measures– Star schema: A fact table in the middle connected

to a set of dimension tables– Snowflake schema: A refinement of star schema

where some dimensional hierarchy is normalizedinto a set of smaller dimension tables, forming ashape similar to snowflake

– Fact constellations: Multiple fact tables sharedimension tables, viewed as a collection of stars,therefore called galaxy schema or factconstellation

Page 41: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Skema Star

1. Sebuah fact table yang besar dan tersentralisasi.

2. Satu tabel untuk setiap dimensi.

3. Setiap fact points untuk satu tuple dalam setiap dimensinya dan

memiliki atribut tambahan.

4. Mudah dimengerti dan mengurangi jumlah dari “physical joins”.

5. Mudah untuk mendefinisikan hirarkinya.

Page 42: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Skema Star (cont’d)

Time

cust

date, custno, prodno, cityname, ...

fact

prod

City

Time

cust

date, custno, prodno, cityname, ...

fact

prod

City

Page 43: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan
Page 44: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Skema Star (cont’d)

Time Dimension

Period Key

Year

Quarter

Month

Store Dimension

Store Key

Store Name

City

State

Region

Fact Table

Store Key

Product Key

Period Key

Units

Price

Product Key

Product Desc

Product Dimension

Time Dimension

Period Key

Year

Quarter

Month

Store Dimension

Store Key

Store Name

City

State

Region

Fact Table

Store Key

Product Key

Period Key

Units

Price

Product Key

Product Desc

Product Dimension

Page 45: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Karakteristik Star Schema• Karakteristik dari model ini adalah :• Pusat dari star disebut fact table• Fact table mempunyai sebuah nilai aggregate dari data-data

yang berasal dari tabel dimensi• Setiap tabel dimensi berelasi langsung dengan fact table• Tabel dimensi beisikan data tentang informasi atau waktu• Relasi antara fact table dengan dimensi-dimensinya adalah 1 –

N (one to many)• Primary key pada tabel dimensi akan menjadi key pada fact

table atau dapat diakatakan bahwa fact table memilikikombinasi key dari tabel dimensi tersebut

• Karakteristik dari model ini adalah :• Pusat dari star disebut fact table• Fact table mempunyai sebuah nilai aggregate dari data-data

yang berasal dari tabel dimensi• Setiap tabel dimensi berelasi langsung dengan fact table• Tabel dimensi beisikan data tentang informasi atau waktu• Relasi antara fact table dengan dimensi-dimensinya adalah 1 –

N (one to many)• Primary key pada tabel dimensi akan menjadi key pada fact

table atau dapat diakatakan bahwa fact table memilikikombinasi key dari tabel dimensi tersebut

Page 46: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Contoh Lain (Model Star)

Page 47: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Keuntungan :• Lebih simple• Mudah dipahami.• Hasil dari proses query juga relatif lebih

cepat.Kerugian :• boros dalam space.

Keuntungan & Kerugian StarKeuntungan :• Lebih simple• Mudah dipahami.• Hasil dari proses query juga relatif lebih

cepat.Kerugian :• boros dalam space.

Page 48: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Skema Snowflake

1. Merupakan variant dari model skema star.

2. Sebuah fact tables yang besar dan tersentralisasi serta satu atau

lebih tabel untuk setiap dimensi.

3. Tabel dimensi dinormalisasi dengan cara men-split data pada

tabel dimensi ke dalam tabel tambahan.

4. Mudah untuk maintenance dan menghemat storage.

Page 49: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Snowflake Schema• Model snowflake merupakan perluasan dari

star dimana ia juga mempunyai satu ataulebih dimensi. Hanya saja pada snowflake,tabel yang berelasi pada fact table hanyatabel dimensi utama, sedangkan tabel yanglain dihubungkan pada tabel dimensi utama.

• Model snowflake ini hampir sama sepertiteknik normalisasi

• Model snowflake merupakan perluasan daristar dimana ia juga mempunyai satu ataulebih dimensi. Hanya saja pada snowflake,tabel yang berelasi pada fact table hanyatabel dimensi utama, sedangkan tabel yanglain dihubungkan pada tabel dimensi utama.

• Model snowflake ini hampir sama sepertiteknik normalisasi

Page 50: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Keuntungan & Kerugian Snowflake

Keuntungan menggunakan model Snowflake• Pemakain space yang lebih sedikit• Update dan maintenance yang lebih mudahKerugian menggunakan model ini yaitu :• Model lebih komplek dan rumit• Proses query lebih lambat• Performance yang kurang bagus

Keuntungan menggunakan model Snowflake• Pemakain space yang lebih sedikit• Update dan maintenance yang lebih mudahKerugian menggunakan model ini yaitu :• Model lebih komplek dan rumit• Proses query lebih lambat• Performance yang kurang bagus

Page 51: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Skema Snowflake (cont’d)

prod

Time

cust

date, custno, prodno, cityname, ...

fact

Time

cust

city

date, custno, prodno, cityname, ...

fact r

egion

Page 52: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Skema Snowflake (cont’d)

Time Dimension

Period Key

Year

Quarter

Month

Fact Table

Store Key

Product Key

Period Key

Units

Price

Product Key

Product Desc

Product Dimension

Store Dimension

Store Key

Store Name

City Key

City Dimension

City Key

City

State

Region

Time Dimension

Period Key

Year

Quarter

Month

Fact Table

Store Key

Product Key

Period Key

Units

Price

Product Key

Product Desc

Product Dimension

Store Dimension

Store Key

Store Name

City Key

City Dimension

City Key

City

State

Region

Page 53: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Skema Snowflake (cont’d)

Page 54: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Skema Fact Constellation

1. Beberapa fact tables berbagi tabel dimensi.

2. Ditampilkan sebagai koleksi dari kumpulan skema bintang yang

sering disebut sebagai skema galaxy.

3. Dibutuhkan oleh aplikasi yang canggih.

Page 55: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Skema Fact Constellation (cont’d)

Hotels

Travel Agents

Promotion

Room Type

Booking

Checkout

Customer

Hotels

Travel Agents

Promotion

Room Type

Booking

Checkout

Customer

Page 56: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Skema Fact Constellation (cont’d)Sales Fact Table

Store Key

Product Key

Period Key

Units

Price

Product Dimension

Product Key

Product Desc

Shipping Fact Tabl eShipper Key

Store Key

Product Key

Period Key

Units

Sales Fact Table

Store Key

Product Key

Period Key

Units

Price

PriceStore Dimension

Store Key

Store Name

City

State

Region

Shipping Fact Tabl eShipper Key

Store Key

Product Key

Period Key

Units

Page 57: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Data cube• A data cube, such as sales, allows data to be

modeled and viewed in multiple dimensions

• Suppose ALLELETRONICS create a sales datawarehouse with respect to dimensions

– Time

– Item

– Location

• A data cube, such as sales, allows data to bemodeled and viewed in multiple dimensions

• Suppose ALLELETRONICS create a sales datawarehouse with respect to dimensions

– Time

– Item

– Location

Page 58: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Cube

Page 59: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

3D Data cube Example

Page 60: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

4D Data cube Example

Page 61: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Membuat model untukData Warehouse

Page 62: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

PersiapanUntuk membuat data model untuk data

warehouse sebaiknya harus diketahui :• Spesifikasi kebutuhan informasi• Data yang tersedia (sumber data) sudah

harus tersedia

Untuk membuat data model untuk datawarehouse sebaiknya harus diketahui :

• Spesifikasi kebutuhan informasi• Data yang tersedia (sumber data) sudah

harus tersedia

Page 63: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

ContohKasus yang ada saat ini hanya untuk

kebutuhan spesifikasi kebutuhan fungsionalsaja, Tetapi nanti kenyataan akan lebihlengkap dan detil .

• Tidak membahas kecepatan respons• Tidak membahas spesifikasi teknis misal

format ,ukuran data , volume dan kualitas

Kasus yang ada saat ini hanya untukkebutuhan spesifikasi kebutuhan fungsionalsaja, Tetapi nanti kenyataan akan lebihlengkap dan detil .

• Tidak membahas kecepatan respons• Tidak membahas spesifikasi teknis misal

format ,ukuran data , volume dan kualitas

Page 64: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Untuk menjawab :• Berapa besar penjualan dan laba per bulan, per produk,

per tipe pelanggan/pembeli (grosir, pabrikan, industrirumah, atau exportir), jenis industri (daripelanggan/pembeli), dan kemana barang pesanan dikirim(propinsi atau nama negara)

• Output tersebut biasa disebut analisa multi-dimensi(multidimensional analysis). Besaran (measure) yangditanyakan (dianalisa) adalah ‘penjualan’ dan ‘laba’.

• Batasan (dimension) dari besaran tersebut adalah bulan(period), produk, tipe pelanggan, jenis industri, dan tujuanpengiriman (location).

Output

Untuk menjawab :• Berapa besar penjualan dan laba per bulan, per produk,

per tipe pelanggan/pembeli (grosir, pabrikan, industrirumah, atau exportir), jenis industri (daripelanggan/pembeli), dan kemana barang pesanan dikirim(propinsi atau nama negara)

• Output tersebut biasa disebut analisa multi-dimensi(multidimensional analysis). Besaran (measure) yangditanyakan (dianalisa) adalah ‘penjualan’ dan ‘laba’.

• Batasan (dimension) dari besaran tersebut adalah bulan(period), produk, tipe pelanggan, jenis industri, dan tujuanpengiriman (location).

Page 65: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Batasan• Output semacam diatas biasa disebut

analisa multi-dimensi (multidimensionalanalysis). Besaran (measure) yangditanyakan (dianalisa) adalah ‘penjualan’dan ‘laba’. Batasan (dimension) dari besarantersebut adalah bulan (period), produk, tipepelanggan, jenis industri, dan tujuanpengiriman (location).

• Output semacam diatas biasa disebutanalisa multi-dimensi (multidimensionalanalysis). Besaran (measure) yangditanyakan (dianalisa) adalah ‘penjualan’dan ‘laba’. Batasan (dimension) dari besarantersebut adalah bulan (period), produk, tipepelanggan, jenis industri, dan tujuanpengiriman (location).

Page 66: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Tabel transaksi

ER Diagram

Page 67: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Solusi Data model

Model yang digunakan adalah STARSCHEMA dengan bentuk :

Page 68: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Data 3 dimension

• 3 dimensi dibuat umum (common dimension), dapat dimanfaatkanuntuk analisa lain (mendatang)1. Waktu - untuk memenuhi spesifikasi “per bulan”, yang akan

dihubungkan dengan data “tanggal pesan”. Table ini akandiisi semua bulan dan sekian tahun (harus diputuskanberapa tahun, karena tabel ini kecil volumenya, misalnyadiisi untuk 50 tahun pada awal implementasi datawarehouse)

2. Jenis industri – untuk memenuhi spesifikasi “jenis industri”,yang akan dihubungkan dengan data “industri pelanggan”;

3. Lokasi – untuk memenuhi spesifikasi “propinsi/negarapemakai”, yang akan dihubungkan dengan bagian data“alamat kirim’, dengan kata lain didalam prosesmemasukkan data dari sumber kedalam warehouse harusmencari dan menentukan propinsi atau negara didalam/daridata alamat kirim.

• 3 dimensi dibuat umum (common dimension), dapat dimanfaatkanuntuk analisa lain (mendatang)1. Waktu - untuk memenuhi spesifikasi “per bulan”, yang akan

dihubungkan dengan data “tanggal pesan”. Table ini akandiisi semua bulan dan sekian tahun (harus diputuskanberapa tahun, karena tabel ini kecil volumenya, misalnyadiisi untuk 50 tahun pada awal implementasi datawarehouse)

2. Jenis industri – untuk memenuhi spesifikasi “jenis industri”,yang akan dihubungkan dengan data “industri pelanggan”;

3. Lokasi – untuk memenuhi spesifikasi “propinsi/negarapemakai”, yang akan dihubungkan dengan bagian data“alamat kirim’, dengan kata lain didalam prosesmemasukkan data dari sumber kedalam warehouse harusmencari dan menentukan propinsi atau negara didalam/daridata alamat kirim.

Page 69: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Output1. Penjualan diakumulasikan per bulan (monthly aggregated),

juga per dimensi yang lain sesuai spesifikasi: produk, tipepelanggan, jenis industry, dan lokasi kirim. Pajak penjualandan Ongkos kirim tidak diperhitungkan.

2. Data hasi perhitungan “laba” ikut disimpan (pre calculated),agar query cepat. Formula yang diberikan oleh user adalah:Laba penjualan = (Harga satuan – (Harga bahan baku +Ongkos produksi)) x Jumlah pesanan

1. Penjualan diakumulasikan per bulan (monthly aggregated),juga per dimensi yang lain sesuai spesifikasi: produk, tipepelanggan, jenis industry, dan lokasi kirim. Pajak penjualandan Ongkos kirim tidak diperhitungkan.

2. Data hasi perhitungan “laba” ikut disimpan (pre calculated),agar query cepat. Formula yang diberikan oleh user adalah:Laba penjualan = (Harga satuan – (Harga bahan baku +Ongkos produksi)) x Jumlah pesanan

Page 70: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

ISI Tabel

311 Food Manufacturing312 Beverage and Tobacco Product Manufacturing313 Textile Mills314 Textile Product Mills315 Apparel Manufacturing316 Leather and Allied Product Manufacturing321 Wood Product Manufacturing322 Paper Manufacturing323 Printing and Related Support Activities… …

Manufacturing

311 Food Manufacturing312 Beverage and Tobacco Product Manufacturing313 Textile Mills314 Textile Product Mills315 Apparel Manufacturing316 Leather and Allied Product Manufacturing321 Wood Product Manufacturing322 Paper Manufacturing323 Printing and Related Support Activities… …

Page 71: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

ISI Tabel

Page 72: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

ISI Table

Page 73: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Table-table data warehouse

Berikut contoh isi tabel-tabel data warehouse dari model diatas. Semua tabeldimensi diisi data pada awal data warehouse di implementasikan (pre-loaded). Sedang untuk tabel fakta (Penjualan) datanya berasal dari sumber.

Page 74: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Table-table data warehouse

Page 75: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Hasil Data ware house

Page 76: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Job Schedulers

RDBMS Utilities

Replication/Distribution ToolsCASE

DB Design

RepositoriesDesign/Transform/Extract/Aggregate/Monitor/Manage Suites / Environments

Database & System Monitors

MOLAP/ROLAP

Data MiningEIS

Data VisualizationMetadata Browsers

Data Warehouse Tools

RDBMS UtilitiesExtract//Transform/Load

•Design•Mapping•Design•Mapping

•Extract•Scrub•Transform

•Extract•Scrub•Transform

•Load•Index•Aggregation

•Load•Index•Aggregation

•Replication•Data Set Distribution•Replication•Data Set Distribution

•Access & Analysis•Resource Scheduling & Distribution•Access & Analysis•Resource Scheduling & Distribution

Meta DataMeta Data

System MonitoringSystem Monitoring

Page 77: Arsitektur Data Warehouse - akfaryarsiptk.ac.id · yang diperlukan oleh database telah ... • Berbeda dengan konsep normalisasi (3rd ... penjualan motor” atau “rata-rata penjualan

Data Warehouse Development MethodologyWAREHOUSE

PL

WAREHOUSE

DE

and

TechnologyKnowledge Team

BusinessKnowledge Team

LANNI

NG

STAGE

EVELOPMENT

STAGE

Knowledge Team

BusinessSponsor