9
BAB 2
LANDASAN TEORI
2.1 Data Warehouse Data warehouse merupakan database relasional yang dirancang untuk
keperluan query dan analisis. Data warehouse berisikan data historis yang
berasal dari sumber data transaksi, namun juga berasal dari berbagai sumber
data lainnya. Data warehouse memisahkan beban kerja analisis dari transaksi
dan memungkinkan perusahaan untuk menggabungkan data dari beberapa
sumber (Mohammed, 2014, p. 643).
Data warehouse mendukung penyediaan data yang tepat dan juga
mengubah data menjadi informasi yang sangat akurat, serta dapat digunakan
untuk menemukan pola dan fakta untuk mengidentifikasi masalah dan
menyediakan data dan informasi pada waktu yang tepat (Aloush, 2015, p.
216).
Selain itu, data warehouse memainkan peran yang signifikan bagi
pegambilan keputusan di level strategis. Data warehouse menyediakan
pandangan multidimensional dari data historis berjumlah besar yang berasal
dari sumber operasional sehingga dapat memberikan informasi yang berguna
untuk para pengambil keputusan (Kaur, Sandhu, & Kaur, 2015, p. 47).
Data warehouse merupakan sebuah kumpulan data yang memiliki
karakteristik terintegrasi, berorientasi-subjek, non-volatile dan time variant
sebagai pendukung dalam proses pengambilan keputusan manajemen
(Imhoff, Galemmo, & Geiger, 2003)
Sebuah data warehouse dapat memberikan laporan-laporan yang
bersifat dinamis karena dapat dilihat dari berbagai dimensi dan memiliki
kemampuan untuk diperinci lebih detail maupun diringkas sesuai kebutuhan
pengguna. Tanpa menggunakan data warehouse, maka laporan-laporan yang
akan dihasilkan bersifat statis sesuai dengan output aplikasi berdasarkan
permintaan pengguna sistem (Ma, Yao-Jan Wu, & Yinhai Wang, 2014).
10
2.1.1 Karakteristik Data warehouse Menurut Inmon yang dikutip Connolly & Begg (2015, p. 1225)
karakteristik data warehouse adalah sebagai berikut:
a) Subject-oriented
Data warehouse diorganisasikan subjek utama perusahaan (seperti
pelanggan, produk, dan penjualan) daripada area utama aplikasi
(seperti pelanggan, faktur, pengendalian stok, dan penjualan produk).
Hal ini tercermin dalam kebutuhan untuk menyimpan data pendukung
keputusan daripada data berorientasi aplikasi.
b) Integrated
Karena sumber data datang secara bersamaan dari berbagai
enterprise-wide application system. Sumber data ini sering tidak
konsisten, misalnya berbeda format. Sumber data harus terintegrasi
dan dibuat konsisten untuk menyajikan pandangan satu data ke
pengguna.
c) Time variant
Karena data dalam warehouse hanya akurat dan berlaku di
beberapa titik di suatu waktu atau selama beberapa interval waktu.
Variansi waktu dari data warehouse juga dalam waktu yang
ditentukan, asosiasi implisit maupun eksplisit waktu dengan semua
data.
d) Non-volatile
Data tidak di perbarui secara real time tapi memperbarui dari
operasional sistem secara teratur. Data baru selalu ditambahkan
sebagai suplemen ke database, database terus menyerap data baru
secara bertahap dengan mengintegrasikan data sebelumnya.
11
2.1.2 Arsitektur Data Warehouse Arsitektur data warehouse menurut Connolly & Begg (2015, p. 1231)
Gambar 2. 1 Arsitektur Data warehouse Sumber: Database Management Book, 2015, p. 1261
2.1.2.1 Operational Data Sumber data untuk data warehouse berasal dari:
• Mainframe operasional data yang memegang kendali di hierarki
generasi pertama dan di database jaringan.
• Departemental data yang memegang kendali di kepemilikan
sistem file seperti VSAM, RMS, dan relational DBMS.
• Private data yang memegang kendali di workstation dan private
server.
• External sistem seperti internet, database komersial yang
tersedia atau database yang berhubungan dengan organisasi
pelanggan.
2.1.2.2 Operational Data Store (ODS) Operational Data Store (ODS) adalah suatu media penyimpanan
untuk data operasional saat ini yang terintegrasi dan digunakan untuk
analisis. ODS menyediakan data dengan cara yang sama seperti data
warehouse, tetapi sesungguhnya bertindak secara sederhana sebagai
12
tempat penampungan data sementara untuk dipindahkan ke data
warehouse. ODS diciptakan ketika sistem operasional tidak mampu
mencapai kebutuhan sistem pelaporan. ODS menyediakan manfaat
yang berguna dari suatu relasional database dalam mengambil
keputusan yang mendukung fungsi data warehouse.
2.1.2.3 Load Manager Load Manager melakukan semua operasi yang berhubungan
dengan extract dan load data ke dalam data warehouse. Data dapat di-
extract secara langsung dari sumber data atau lebih umumnya berasal
dari ODS.
2.1.2.4 Warehouse Manager Warehouse Manager melakukan semua operasi yang
berhubungan dengan pengelolaan data di dalam warehouse. Operasi
yang dilakukan oleh warehouse manager antara lain :
• Analisa terhadap data untuk memastikan konsistensi.
• Transformasi dan penggabungan sumber data dari tempat
penyimpanan sementara menjadi tabel-tabel data warehouse.
• Pembuatan index dan view berdasarkan tabel-tabel dasar.
• Menghasilkan denormalisasi (jika diperlukan).
• Menghasilkan agregasi (jika diperlukan).
• Backup dan archieve data.
2.1.2.5 Query Manager Query manager melakukan operasi yang berhubungan dengan
manajemen dari pengguna query. Operasi yang dilakukan oleh query
manager seperti pengarahan query pada tabel yang sesuai dan
penjadwalan pelaksanaan query. Dalam beberapa kasus, query manager
juga menghasilkan profil query yang memungkinkan warehouse
manager menentukan kesusuaian indeks dan agregasi.
2.1.2.6 Detailed Data Area ini menyimpan semua data detil di dalam skema database,
yang bertujuan untuk melengkapkan kumpulan data untuk data
warehouse. Dalam banyak kasus, data yang terperinci tidaklah disimpan
secara online tetapi dapat disediakan melalui agregasi data pada
tingkatan detil berikutnya.
13
2.1.2.7 Lightly and Highly Summarized Data Area ini menyimpan semua lightly dan highly summarized data
yang dihasilkan oleh warehouse manager. Area ini adalah tempat
penampungan sementara sebelum dilakukan perubahan secara
berkelanjutan untuk merespon perubahan profil query. Tujuan
ringkasan informasi ini adalah untuk mempercepat penyampaian query.
2.1.2.8 Achieve / Backup Data Area warehouse yang menyimpan data detil dan ringkasan data
dengan tujuan sebagai arsip dan backup data. Data ditransfer ke
penyimpanan arsip seperti magnetic tape atau optical disk.
2.1.2.9 Metadata Area warehouse ini menyimpan semua definisi metadata (data
mengenai data) menggunakan semua proses yang ada pada data
warehouse. Metadata digunakan untuk beberapa tujuan :
• Proses ekstraksi dan loading Metadata digunakan untuk
memetakan data source menjadi bentuk data yang lebih umum
dalam warehouse.
• Proses manajemen warehouse Metadata digunakan untuk
mengotomatisasi produksi dari tabel ringkasan.
• Bagian dari proses manajemen query Metadata digunakan untuk
query secara langsung pada sumber data yang paling sesuai.
2.1.2.10 End-User Access Tools Pengguna akan berinteraksi dengan data warehouse guna
mendukung pengambilan keputusan melalui end-user access tool.
Lima kelompok utama dari end-user access tool adalah :
• Reporting dan Query Tools Reporting tool meliputi production
Reporting tool dan Report writer. Production Reporting tool
digunakan untuk menghasilkan laporan operasional regular.
Report writer adalah desktop tool yang dirancang untuk end-
user. Query tool untuk data warehouse dirancang untuk
menerima SQL atau menghasilkan pernyataan SQL untuk proses
query data yang tersimpan dalam warehouse.
• Application Development Tools Aplikasi yang dapat digunakan
user yaitu graphical data access yang dirancang untuk client
14
server. Beberapa application development tools terintegrasi
dengan OLAP tools dan mengakses semua sistem database
utama.
• Executive Information Sistem (EIS) Tools Executive Information
Sistem mendukung pengambilan keputusan semua tingkat
menajemen. EIS tools yang terhubung dengan mainframe
memungkinkan pengguna membuat aplikasi pendukung
pengambilan keputusan untuk menyediakan overview data
organisasi dan mengakses sumber data eksternal.
• Online Analytical Processing (OLAP) Tools OLAP tools
berbasis pada konsep multidimensional database dan
memperbolehkan pengguna untuk menganalisis data dengan
menggunakan view yang kompleks dan multidimensional view.
Tool ini mengasumsikan bahwa data diatur dalam model
multidimensi yang didukung oleh multidimensional database
(MDDB) atau oleh relational database yang dirancang untuk
mendapatkan multidimensional queries.
• Data Mining Tools Data mining adalah proses menemukan
korelasi, pola, dan arah baru yang mempunyai arti dengan
mining sejumlah besar data dengan menggunakan teknik
statistic, matematika, dan Artificial Intelligence (AI). Data
mining memiliki potensi untuk mengganti kemampuan dari
OLAP tools.
2.1.3 Perancangan Data Warehouse Terdapat 9 langkah dalam membangun sebuah data warehouse
menurut Girsang (2017) yang dikutip dari Ralph Kimball, dikenal
dengan nine-step design methodology, jika langkah-langkah dalam nine-
step design methodology dilakukan secara sistematis, maka dapat
membangun sebuah data warehouse yang baik. Kita ambil sebuah kasus
pada sebuah perusahaan sederhana penjualan untuk menggambarkan
kesembilan langkah tersebut.
15
1. Choose the Process
Memilih proses berarti menentukan subjek utama. Subjek
utama merujuk pada suatu kegiatan bisnis perusahaan yang dapat
menjawab semua pertanyaan bisnis yang penting serta memiliki ciri-
ciri tertentu. Misalnya adalah proses penjualan.
2. Choose the Grain
Memilih grain berarti menentukan apa yang akan diwakili atau
dipresentasikan oleh sebuah tabel fakta. Setelah
menentukan grain dari tabel fakta, selanjutnya dapat ditentukan tabel-
tabel dimensi yang berhubungan dengan tabel fakta
tersebut. Grain pada tabel fakta juga menentukan grain tabel dimensi.
Pada kasus ini grain bisa diperoleh dari invoice yang dikeluarkan
kepada pembeli.
3. Identify and Conform the Dimensions
Mengidentifikasi dan menghubungkan tabel dimensi dengan
tabel fakta. Dimensi merupakan kumpulan sudut pandang yang
penting untuk menggambarkan fakta-fakta yang terdapat pada tabel
fakta. Sebagai contoh adalah dimensi customer, waktu, dan jenis
produk.
4. Choose the Facts
Grain dari suatu tabel fakta menentukan fakta-fakta yang bisa
digunakan. Pada tahap ini, tentukan measure yang dibutuhkan pada
tabel fakta. Informasi apa saja yang ingin dibutuhkan.
5. Store Pre calculations in the Fact Table
Pada tahap ini, hasil perhitungan pada suatu atribut perlu
dipertimbangkan untuk disimpan di database. Hal ini untuk
mengurangi risiko kesalahan pada program setiap kali melakukan
perhitungan pada atribut-atribut tersebut.
6. Round Out the Dimension Tables
Dari dimensi-dimensi yang telah diidentifikasi, dibuat
deskripsi yang memuat informasi terstruktur mengenai atribut-atribut
pada tabel dimensi. Tabel dimensi tersebut harus diberi keterangan
secara lengkap dan mudah dipahami oleh pengguna.
16
7. Choose the Durations of the Database
Durasi waktu dari data-data yang akan dimasukkan ke
dalam data warehouse akan ditentukan pada tahap ini. Misalnya,
data perusahaan dua tahun lalu atau lebih diambil dan
dimasukkan ke dalam tabel fakta.
8. Determine the Need to Track Slowly Changing Dimensions
Dimensi dapat berubah dengan lambat dan menjadi sebuah
masalah. Terdapat tiga tipe dasar dari perubahan dimensi yang lambat,
yaitu:
• Menulis ulang atribut yang berubah.
• Membuat record baru pada dimensi.
• Membuat suatu atribut alternatif untuk menampung nilai
yang baru.
9. Decide Physical Design
Pada tahap ini, dilakukan perancangan fisik dari data
warehouse. Selain itu, penentuan masalah-masalah yang mungkin ada
pada perancangan fisik.
2.1.4 Keuntungan Data Warehouse Menurut Connolly dan Begg (2015, p. 1226), implementasi yang
sukses dari sebuah data warehouse dapat memberikan keuntungan –
keuntungan utama bagi organisasi, yaitu:
1. Potential high returns on investment
Suatu organisasi harus berkomitmen dengan jumlah
sumber daya yang besar untuk menjamin kesuksesan dalam
membuat data warehouse dan biayanya bervariasi tergantung
kondisi teknis yang ada. Namun, studi oleh International Data
Ccorpoation (IDC) melaporkan bahwa proyek – proyek data
warehouse memberikan rata – rata tiga tahun laba atas investasi
(ROI) dari 401% (IDC, 1996).
2. Competitive advantage
Dengan adanya kemungkinan balik modal yang besar
tehadap investasi merupakan bukti adanya keuntungan
kompetitif. Keuntungan kompetitif ini diperoleh dengan
17
memungkinkan para pengambilan keputusan untuk mengakses
data yang dapat mengungkapkan hal yang sebelumnya tidak
tersedia, tidak diketahui, dan informasi yang tidak tercatat
contohnya pelanggan, tren, dan permintaan.
3. Increased productivity of corporate decision makers
Data warehouse mengintegrasikan data dari beberapa
sistem yang tidak terstruktur menjadi bentuk yang menyediakan
satu pandangan dari suatu perusahaan. Dengan mengubah data
menjadi informasi yang bermakna, data warehouse
memungkinkan para pembuat keputusan untuk melakukan
analisis yang lebih substantive, dan akurat.
2.2 Online Transactional Processing (OLTP) OLTP mengandung tabel yang telah dinormalisasi dan data online yang
mana memiliki frekuensi insert/update/delete yang sering. OLTP merupakan
seperangkat program yang memfasilitasi dan mengatur aplikasi berbasis
transaksi, khususnya untuk memasukkan data dan pengambilan transaksi di
beberapa industri seperti keuangan, institusi, industri penerbangan,
supermarket dan manufaktur (Singh & Sood, 2013, p. 188).
Pengumpulan data di tingkat operational biasa disebut dengan OLTP
(Darudiato, 2010, p. 354). Sistem database OLTP mengandung data yang
bersifat detail dan terkini. OLTP berurusan dengan data yang penting yang
digunakan untuk kepentingan operasional sehari-hari pada suatu indutri. Pada
OLTP data yang tetrsimpan berfokus pada akses yang banyak dan update yang
sering (Ramzan, Nawaz, & Javed, 2015, p. 3). Selain itu menurut Namrata &
Singh (2014, p. 188) OLTP sistem berperan dalam memberikan sumber
informasi terhadap data warehouse.
Menurut Connolly & Begg (2015, p. 1226) Online Transaction
Processing (OLTP) adalah sistem yang dapat mengoptimalkan transaksi dalam
jumlah besar, yang diprediksi, berulang, dan diperbarui secara intensif. Data
dalam Online Transaction Processing (OLTP) dapat diatur sesuai dengan
persyaratan dari transaksi yang terkait dengan aplikasi bisnis dan mendukung
keputusan perhari dalam jumlah besar pada pengguna operasional.
18
2.3 Online Analytical Processing (OLAP) OLAP digunakan untuk keperluan analisis data oleh manajer, eksekutif
bisnis dan analis pemasaran. Data warehouse dan OLAP telah muncul sebagai
teknologi yang terkemuka yang dapat memfasilitasi penyimpanan data,
pengaturan dan pencarian data. Teknologi OLAP memungkinkan data
warehouse untuk digunakan secara efektif untuk kepentingan analisis online,
menyediakan respon cepat terhadap iterative complex analytical queries.
Mutidimensional data model OLAP dan teknik data aggregation mengatur dan
menyederhanakan data dalam jumlah yang besar sehingga dapaat dievaluasi
secara cepat menggunakan online analysis dan graphical tools (Singh & Sood,
2013, p. 189).
Menurut Connolly & Begg (2015, p. 1286) Online Analytical Processing
(OLAP) adalah sebuah teknologi yang menggunakan tampilan multidimensi
dari data agregat untuk menghasilkan akses yang cepat ke informasi yang
strategis untuk tujuan analisis.
OLAP merupakan suatu alat yang disediakan oleh data warehouse untuk
kepentingan pengambilan keputusan yang intensif dimana data disimpan
kedalam model multidimensional. OLAP biasanya digunakan untuk
mendeskripsikan analisis dari informasi kompleks data warehouse. Selain itu
OLAP menyediakan ringkasan data dan melakukan rich computation (Namrata
& Singh, 2014, p. 187). Dengan adanya OLAP, informasi dapat dilihat dengan
detail yang disebut dengan drill down, atau secara lebih ringkas disebut dengan
roll up (Wijaya, 2017, p. 3)
Pada OLAP, query yang digunakan sering kali lebih rumit termasuk pada
agregasinya. Waktu merupakan pengukuran yang sangat berharga pada sistem
OLAP (Ramzan, Nawaz, & Javed, 2015, p. 3).
2.4 OLAP vs. OLTP
Menurut Han, Kamber, & pei (2012, p. 128) perbedaan antara sistem
OLAP dan OLTP adalah sebagai berikut:
19
Tabel 2. 1 Perbedaan OLAP dan OLTP
2.5 Extract Transform Load Terdapat tiga tahap dalam proses ETL, yaitu:
2.5.1 Extract Menurut Darudiato (2010, p. 353) langkah pertama pada proses
ETL adalah mengekstrak data dari sumber-sumber data. Kebanyakan
proyek data warehouse menggabungkan data dari sumber-sumber yang
Fitur OLTP OLAP
Karakteristik Memproses kebutuhan
operasional Memproses informasi
Orientasi transaksi analisis
Pengguna petugas, DBA, database
profesional
pekerja pengetahuan ex:
manajer, eksekutif, analis
Fungsi Membantu kegiatan
operasional harian
Mendukung kebutuhan
informasi jangka panjang
dalam pengambilan
keputusan
Desain Database berorientasi pada
aplikasi, ER-based
berorientasi pada subjek,
star/snowflake
Data data sekarang, terjamin
keupdateannya
berupa data historis,
keakuratan data diatur
secara berkala waktu
View secara detail, flat
relational
secara ringkas,
multidimensional
Berfokus pada pemasukan data keluaran informasi
Jumlah Pengguna ribuan jutaan
Kapasitas DB GB sampai high GB >TB
Prioritas performa yang tinggi,
ketersediaan yang tinggi
fleksibilitas yang tinggi,
end-user autonomy
Metric transaction throughput query throughput, waktu
respon
20
berbeda. Sistem-sistem yang terpisah sangat mungkin menggunakan
format data yang berbeda.
Extract adalah langkah dalam menargetkan satu atau lebih
sumber data untuk Enterprise Data warehouse (EDW), sumber-sumber
ini biasanya mencakup database OLTP tetapi juga dapat menyertakan
sumber-sumber seperti operasional database dan lembar kerja,
Enterprise Resource Planning (ERP) file, dan file pengguna web.
Langkah extract umumnya menyalin extract data ke penyimpanan data
sementara disebut Operational Data Store (ODS) atau Staging Area
(SA) (Connolly & Begg, 2015, pp. 1236-1237).
Extract merupakan proses pemilahan dan pengambilan data dari
satu atau lebih sumber data (Prasetyo, Nugroho, & Aji, 2012, p. 17).
Pada proses ekstak, pertama-tama data diambil dari database
operasional (Ahmed, Islam, & Karim, 2017, p. 14). Proses ekstraksi
informasi dari sumber asli dan dipindahkan ke dalam data warehouse
merupakan hal yang sangat penting. Hal ini disebabkan sejumlah besar
volume data akan dipindahkan dari sistem sumber (legacy) ke dalam
data warehouse dengan ekstraksi data dilakukan secara otomatis.
Hanya item yang dibutuhkan yang dipindahkan ke dalam data
warehouse. Informasi yang masuk ke dalam data warehouse dapat
datang dari internal sistem (legacy system) maupun dari eksternal
organisasi (Safril, 2009, p. 135).
2.5.2 Transformation Tahapan transformasi menggunakan serangkaian aturan atau
fungsi untuk mengekstrak data dari sumber dan selanjutnya akan
dimasukkan ke data warehouse (Darudiato, 2010, p. 3).
Menurut Connolly & Begg (2015, pp. 1236-1237) Transformasi
adalah serangkaian aturan atau fungsi untuk extract data, yang mana
menentukan bagaimana data akan digunakan untuk analisis dan dapat
melibatkan data transformasi seperti pengkodean data, penggabungan
data, pemisahan data, perhitungan data, dan pembuatan Surrogate Key.
Output dari transformasi adalah data yang bersih dan konsisten dengan
21
data yang sudah di warehouse dan selanjutnya adalah dalam bentuk
yang siap untuk dianalisis oleh pengguna warehouse.
Selain itu menurut Safril (2009, p. 135) Transformasi dilakukan
dengan melakukan proses penyeragaman (cleaning). Proses cleaning
dilakukan karena data yang dicatat di organisasi dalam bentuk yang
berbeda. Data bisa disimpan dalam format yang berbeda dan
penyimpanan yang berbeda. Data warehouse membutuhkan informasi
yang telah dilakukan penyeragaman sehingga bentuk data tersebut
menjadi seragam.
Transformasi dilakukan untuk menyesuaikan terhadap standar
dari data warehouse (Ahmed, Islam, & Karim, 2017, p. 14).
Penyesuaian data manakala terjadi integrasi data dari berberapa sumber
(Prasetyo, Nugroho, & Aji, 2012, p. 17).
2.5.3 Loading Menurut Darudiato (2010, p. 3) fase load merupakan tahapan
yang berfungsi untuk memasukkan data ke dalam target akhir, yang
biasanya ke dalam suatu data warehouse. Jangka waktu proses ini
tergantung pada kebutuhan organisasi. Beberapa data warehouse dapat
setiap minggu mengisi keseluruhan informasi yang ada secara
kumulatif, data diubah, sementara data warehouse yang lain (atau
bagian lain dari data warehouse yang sama) dapat menambahkan data
baru dalam suatu bentuk yang historikal, contohnya setiap jam.
Loading merupakan proses pemuatan data ke dalam target data
warehouse (Prasetyo, Nugroho, & Aji, 2012, p. 17). Loading data ke
dalam warehouse dapat terjadi setelah semua transformasi mengambil
tempat atau bagian dari proses transformasi (Connolly & Begg, 2015,
pp. 1236-1237).
Pada proses load data akan masuk ke data warehouse (Ahmed,
Islam, & Karim, 2017, p. 14). Data yang masuk ke dalam data
warehouse haruslah benar. Apabila data yang masuk merupakan
informasi yang salah maka informasi tersebut tidak akan digunakan
pengguna (Safril, 2009, p. 135).
22
2.6 Metadata Metadata merupakan “data tentang data” atau “data yang digunakan
untuk mendefinisikan data lain”. Metadata mendefinisikan sumber, nilai,
penggunaan dan fitur dari data data warehouse dan mendefinisikan mengenai
bagaimana data dapat diubah dan diproses pada tiap lapisan arsitektur.
Metadata disimpan dalam repositori metadata yang dapat digunakan oleh tiap
komponen arsitektur. Metadata merupakan kebutuhan wajib untuk
menggunakan, membangun, dan mengelola data warehouse. Bagi end-user,
metadata diibaratkan sebagai peta untuk menuju isi dari data warehouse
(Parekh, 2013, p. 2569).
Metadata merupakan suatu bentuk informasi yang berisi data yang akan
digunakan, tipe data, panjang datanya serta sumber datanya yang akan
digunakan dalam data warehouse (Darudiato, 2010, p. 351).
Seperti yang dikatakan oleh Inmon (2005, p. 393), metadata adalah data
mengenai data atau deskripsi dari struktur, isi, kunci, indeks, dan lainlain
mengenai data. Terlebih menurut Prasetyo, Nugroho, & Aji (2012, p. 18)
Metadata ini akan mendiskripsikan tabel-tabel database, kolom-kolom beserta
relasinya sehingga akan nampak sebagai kesatuan dalam sebuah laporan
Sedangkan menurut Efrem G. (2000, p. 474) metadata adalah data
tentang data yang berguna sebagai pusat penyimpanan informasi untuk
menjelaskan kepada user tentang apakah data warehouse itu, dari mana
asalnya dan siapa yang bertanggung jawab atas hal tersebut.
2.7 Multidimensional Data Model Multidimensional data model merupakan teknik desain logis yang
bertujuan untuk menyajikan data secara standar, merupakan bentuk intuitif
yang memungkinkan adanya akses performa yang tinggi (Connolly & Begg,
2015, p. 1261). Menurut Lane (2007, pp. 18-56) untuk mengoptimalkan
penggunaan resource pada multidimensional data, aplikasi dapat menggunakan
query SQL yang kompleks, bahasa pemrograman C atau fungsi-fungsi tabel
untuk menampilkan data dari database.
Pada konsep multidimensi, data yang berupa fakta yang sama dapat
dilihat dengan menggunakan fungsi yang berbeda. (Wijaya, 2017, p. 3).
23
Multidimensional data model juga diketahui sebagai data cube yang
mana memungkinkan data untuk dimodelkan dan dilihat dari berbagai dimensi
atau sudut pandang (Mohammed, 2014, p. 642). Multidimensional data model
mengorganisir dan meringkas data yang berjumlah banyak agar data dapat
dievaluasi secara cepat menggunakan analisis online dan graphical tools
(Singh & Sood, 2013, p. 189).
2.7.1 Tabel Dimensi Dimensi berisikan referensi informasi mengenai fakta seperti
tanggal, produk atau pelanggan (Kaur, Sandhu, & Kaur, 2015, p. 49).
Menurut Connolly & Begg (2015, p. 1281) tabel dimensi berisi
informasi tekstual deskriptif dan dimensi atribut digunakan sebagai
batasan dalam query data warehouse. Terlebih lagi, tabel dimensi
adalah tabel yang diperlukan untuk melengkapi tabel fakta. tabel
dimensi berisi konteks tekstual data yang terkait dengan bisnis proses
(Kimball & Ross, 2013, p. 13).
Dimensi merupakan struktur yang mengkatagorikan data agar
memungkinkan pengguna dalam menjawab pertanyaan bisnis.
Sebagai contoh, setiap saluran penjualan retail pakaian dapat
mengumpulkan dan menyimpan data terkait penjualan dan reklamasi
dari berbagai jenis kain mereka. Salahsatu pendekatan untuk
mengidentifikasi dimensi adalah dengan meninjau tabel referensi,
seperti tabel produk yang berisikan semua informasi mengenai produk
atau tabel promosi yang berisi semua informasi mengenai promosi
(Lane, 2007, pp. 10-1).
Dimensi merupakan sekumpulan atribut. Pada hal ini atribut
yang digunakan mengacu pada kolom dalam tabel dimensi, sedangkan
pada permodelan relasional atribut yang digunakan lebih spesifik
(Imhoff, Galemmo, & Geiger, 2003, p. 152).
2.7.2 Tabel Fakta Fakta merupakan suatu kejadian yang dapat dihitung atau diukur,
seperti penjualan atau login menurut (Kaur, Sandhu, & Kaur, 2015, p.
48). Tabel fakta terdiri dari satu tabel dengan composite primary key
(Connolly & Begg, 2015, p. 1261).
24
Menurut Lane (2007, pp. 2-3, 2-4) tabel fakta adalah tabel besar
didalam susunan data warehouse yang menyimpan pengukuran bisnis.
Tabel Fakta mereprentasikan data, biasanya dalam bentuk angka dan
data tambahan, yang dapat dianalisa dan diperiksa. Contohnya termasuk
penjualan, biaya dan, keuntungan.
Selain itu, menurut Kimball & Ross (2013, p. 41) tabel fakta
mengandung angka yang mempunyai arti yang dibuat berdasarkan
kejadian yang sebenarnya.
Sebuah fakta didalamnya berisikan pengukuran dan foreign keys
dari tabel dimensi. Sebuah pengukuran biasanya berupa nilai numerik
yang merepresentasikan sebuah kejadian yang telah terjadi pada bisnis
(Imhoff, Galemmo, & Geiger, 2003, p. 152). Terlebih menurut
Mohammed (2014, p. 642) fakta digunakan untuk menghafalkan
perhitungan terhadap situasi atau kejadian.
2.7.3 Surrogate Key Menurut Kimball & Ross (2013, p. 58) Surrogate Key digunakan
untuk menjadi primary key dari hampir semua tabel dimensi dan juga
sebagai fact key (kunci fakta) yang digunakan setiap kolom, meskipun
tidak selalu wajib.
Surrogate key adalah semua natural key yang diganti dengan
surrogate key, dalam artian tiap gabungan fakta dengan tabel dimensi
berdasarkan surrogate key bukan natural key dan setiap surrogate key
harus memiliki struktur generalisasi yang berdasarkan bilangan bulat
(Connolly & Begg, 2015, p. 1261).
Surrogate key merupakan kunci primer yang bersifat unik untuk
mengidentifikasi setiap record yang disebut dengan kunci dimensi
surrogate. Kunci ini merupakan sebuah identifier yang dibangkitkan
oleh sistem database ataupun oleh aplikasi proses ETL (Prasetyo,
Nugroho, & Aji, 2012, p. 16).
Menurut Link, Lukovic, & Mogin (2009, p. 2) keberadaan
surrogate key dan nilainya tidak terlihat oleh user. Ini merupakan
sebuah keuntungan untuk menggunakan surrogate key sebagai primary
key karena memisahkan dari logika bisnis.
25
Terlebih lagi surrogate key menghindari data warehouse dari
adanya perubahan data oleh user. Hal ini dilakukan agar
mempertahankan integritas data dari waktu ke waktu terlepas dari apa
yang terjadi pada sistem operasional. (Imhoff, Galemmo, & Geiger,
2003, p. 330).
2.7.4 Star Schema Star schema merupakan dimensional data model yang memiliki
tabel fakta ditengahnya dan dikelilingi oleh tabel dimensi yang di
denormalisasi (Connolly & Begg, 2015, pp. 1261-1262).
Gambar 2. 2 Contoh Star schema Penjualan Properti
Sumber: Database Management Book, 2015, p.1261
Tabel fakta memiliki beberapa key yang merupakan kunci indeks
individual dalam tabel dimensi (Wijaya, 2017, p. 3). Star schema merupakan
bentuk yang paling sederhana dari model dimensional, yang mana data
diorganisir ke dalam fakta dan dimensi. Star schema ditandai oleh satu atau
lebih tabel fakta yang sangat besar yang berisikan informasi utama pada data
warehouse dan sejumlah tabel dimensi yang lebih kecil, yang masing-masing
berisikan informasi mengenai entri untuk atribut tertentu pada tabel fakta.
Fitur utama dari star schema adalah tabel fakta yang dikelilingi oleh tabel
26
dimensional, yang masing-masing berisikan informasi mengenai entri untuk
atribut tertentu di tabel fakta (Kaur, Sandhu, & Kaur, 2015, p. 49).
Menurut Ponniah (2001, p. 210) skema bintang (star schema) adalah
teknik dasar perancangan data untuk data warehouse. Struktur skema bintang
adalah suatu struktur yang dapat dengan mudah dipahami dan digunakan oleh
pengguna. Struktur tersebut mencerminkan bagaimana pengguna biasanya
memandang ukuran-ukuran kritis mengikuti dimensi-dimensi bisnis yang ada.
Selain itu, menurut Kimball & Ross (2013, p. 16) pengguna bisnis
lebih mudah mendapatkan manfaat dengan menggunakan Star Schema karena
data lebih mudah untuk dipahami dan dikendalikan, selain itu mengurangi
jumlah tabel yang akan digunakan dan kecil kemungkinan kesalahan akan
terjadi.
2.8 Dashboard Menurut Pramudijono (2013, p. 1) dashboard adalah sebuah tampilan
visual berisikan informasi yang dibutuhkan oleh pemangku kepentingan dalam
rangka melakukan monitoring dan sebagai dasar analisa untuk melakukan
pengambilan keputusan. Fungsi utama dashboard secara umum adalah untuk
menyediakan data atau informasi penting dan memberikan sinyal mengenai
suatu kondisi yang perlu segera mendapatkan respon.
Dashboard merupakan suatu alat atau sarana yang dikembangkan pada
unit sektor bisnis, dimana pada mulanya diperkenalkan untuk
menyederhanakan serta mengintegrasikan KPI ke seluruh bagian perusahaan
yang berupa tampilan visual segai cara untuk menampilkan informasi
pengambilan keputusan operasional (Dowding, 2014, p. 4).
Selain itu, dashboard didefinisikan oleh Pauwels (2009, p. 177)
sebagai koleksi kecil dari metrik kinerja utama yang saling terhubung dan
mendasari performa yang merepresentasikan kepentingan jangka pendek
maupun panjang terhadap perusahaan.
Dashboard menyatukan data dari berbagai sumber yang berbeda dan
menampilkannya melalui grafik yang informatif lengkap dengan keterangan
penjelasan (Ganapati, 2011, p. 47).
Dashboard digunakan pada berbagai macam keadaan untuk membantu
manajemen dan pengambilan keputusan. Dashboard dapat membantu dalam
27
mengelola orang atau proses untuk mengarahkan pengguna ke arah yang benar
(Baskett, 2008, p. 16).
2.8.1 Tipe-tipe Dashboard Terdapat 3 Tipe Dashboard Menurut (Smith, 2015):
• Operational Dashboards
Dashboard ini menampilkan data yang memfasilitasi
sisi operasional dari bisnis. contohnya saja, bisnis dengan
website, sangat penting untuk memastikan bahwa website yang
kita bangun tetap aktif dan berjalan, sehingga kita dapat
memantau dari segi waktu dan penggunaan server secara
maksimal. Dashboard ini terkadang membutuhkan data real-
time atau yang hampir mendekati data real-time.
• Strategic / Executive Dashboards
Dashboard strategis biasanya menyediakan KPI (Key
Performance Indicators) yang dapat diikuti oleh eksekutif
perusahaan secara periodik (harian, mingguan ataupun
bulanan). Strategic dashboard harus dapat menyediakan tim
eksekutif dengan gambaran high level mengenai keadaan
bisnis bersamaan dengan berbagai kesempatan yang dihadapi
oleh bisnis tersebut. Data tersebut dapat berupa pendapatan
periodik (vs periode sebelumnya), biaya (vs periode
sebelumnya), headcount (vs berdasarkan departemen).
• Analytical Dashboards
Setiap user yang berbeda membutuhkan tipe
dashboard yang berbeda juga. Contohnya saja pada manajer
marketing mungkin membutuhkan dashboard dari sisi
strategical dan operational. Dan hal tersebut sangat
memungkinkan sehingga akan dibentuk dua dashboard yang
terpisah.
2.8.2 Karakteristik Dashboard Menurut (Eckerson, 2011), Karakteristik utama dashboard adalah
sebagai berikut:
28
Tabel 2. 2 Karakteristik Dashboard
2.9 Fishbone
Diagram sebab akibat sering disebut diagram tulang ikan, dapat
membantu dalam mengidentifikasi kemungkinan penyebab suatu masalah dan
memilah ide kedalam kategori yang bermanfaat.
Gambar 2. 3 Diagram Fishbone Analysis
Sumber: QAPI, 2016, p.1
29
Diagram diatas mengilustrasikan sebab dan sub-sebab yang
menyebabkan adanya suatu efek atau gejala. Pada diagram tersebut yang
menjadi efek biasanya merupakan sebuah masalah yang perlu dipecahkan dan
ditempatkan di posisi “kepala ikan”. Penyebab dari efeknya kemudian
diletakkan di sepanjang “tulang” dan dikelompokkan menjadi beberapa jenis di
sepanjang cabang (QAPI, 2016, p. 1).
Menurut Atmaja (2005, p. 26) Diagram fishbone menggambarkan garis
dan simbol-simbol yang menunjukkan hubungan antara akibat dan suatu
masalah. Diagram tersebut memang digunakan untuk mengetahui akibat dari
suatu masalah untuk selanjutnya diambil tindakan perbaikan.
Fishbone diagram akan mengidentifikasi berbagai sebab potensial dari
satu efek atau masalah, dan menganalisis masalah tersebut melalui sesi
brainstorming. Masalah akan dipecah menjadi sejumlah kategori yang
berkaitan, mencakup manusia, material, mesin, prosedur, kebijakan, dan
sebagainya. Setiap kategori mempunyai sebab-sebab yang perlu diuraikan
melalui sesi brainstorming (Kusnadi, 2013, p. 1).
Selain itu menurut (Slameto, 2015, p. 5) diagram fishbone adalah
sebuah teknik grafis yang berguna untuk menganalisia dan menemukan faktor-
faktor yang berpengaruh atau efek secara signifikan di dalam menentukan
karakteristik kualitas hasil kerja.
Diagram Fishbone adalah suatu diagram yang menunjukkan hubungan
antara penyebab dan akibat dari suatu masalah dan berguna dalam
brainstorming karena dapat menyusun ide-ide yang muncul (Alamsyah, 2015,
p. 293).
2.10 6 Golden Rules Menurut Smith (2015) terdapat enam langkah dalam pembuatan
dashboard yang baik. Adapun langkah-langkahnya sebagai berikut:
1. Menentukan Siapa Pengguna yang Ingin Diberi Kesan
Desain dashboard yang efektif menargetkan kepada single user dan
hanya menampilkan data yang spesifik terhadap permasalahan atau
kejadian yang dihadapi. Dashboard harus benar-benar dipahami siapa
target dari penggunanya dan untuk kepentingan apa digunakan. Apakah
30
dashboard akan digunakan oleh tim eksekutif untuk memonitor keuangan
perusahaan atau akan digunakan oleh tim marketing untuk memonitor
aktivitas harian? hal tersebut sangat penting untuk memastikan bahwa data
dashboard yang kita sajikan bersifat spesifik kepada satu pengguna.
2. Memilih Tipe Dashboard yang Tepat
Dashboard memiliki tiga tipe yang berbeda dan setiap tipe
menjalankan tujuan yang spesifik. Ketiga tipe tersebut adalah:
o Operational Dashboards
Dashboard ini menampilkan data yang memfasilitasi sisi
operasional dari bisnis. contohnya saja, bisnis dengan website, sangat
penting untuk memastikan bahwa website yang kita bangun tetap
aktif dan berjalan, sehingga kita dapat memantau dari segi waktu dan
penggunaan server secara maksimal. Dashboard ini terkadang
membutuhkan data real-time atau yang hampir mendekati data real-
time.
o Strategic / Executive Dashboards
Dashboard strategis biasanya menyediakan KPI (Key
Performance Indicators) yang dapat diikuti oleh eksekutif
perusahaan secara periodik (harian, mingguan ataupun bulanan).
Strategic dashboard harus dapat menyediakan tim eksekutif dengan
gambaran high level mengenai keadaan bisnis bersamaan dengan
berbagai kesempatan yang dihadapi oleh bisnis tersebut. Data
tersebut dapat berupa pendapatan periodik (vs periode sebelumnya),
biaya (vs periode sebelumnya), headcount (vs berdasarkan
departemen).
o Analytical Dashboards
Setiap user yang berbeda membutuhkan tipe dashboard yang
berbeda juga. Contohnya saja pada manajer marketing mungkin
membutuhkan dashboard dari sisi strategical dan operational. Dan
hal tersebut sangat memungkinkan sehingga akan dibentuk dua
dashboard yang terpisah.
3. Mengelompokkan Dashboard Berdasarkan Data yang Saling Terkait
Dashboard yang dirancang dengan baik akan memastikan bahwa
data yang ditampilkan sudah dikelompokan secara logis. Misalnya, jika
31
sebuah dashboard menyertakan Financial KPIs and Sales Pipeline,
pastikan bahwa data keuangan ditampilkan di posisi yang sejajar secara
bersampingan satu sama lain. Pengelompokan sering dilakukan oleh
departemen atau area fungsional dan dapat mencakup: Produk (Inventaris,
pengembangan), Penjualan / Pemasaran, Keuangan (Aktual dan prakiraan).
4. Membuat Data yang Relevan Terhadap Audiens
Dashboard eksekutif dapat memiliki sejumlah pengguna yang
berbeda. Pastikan data yang Anda tampilkan relevan dengan pengguna.
Pikirkan cakupan dan jangkauan data Anda: Seluruh perusahaan,
Departemen, Individu, Pemasok.
Pastikan Anda mengerti dengan pasti siapa khalayak yang dituju
dan lingkup persyaratan mereka. Dalam sebuah organisasi kecil,
dashboard Eksekutif cenderung menyertakan data KPI di semua
departemen. Namun, di perusahaan yang lebih besar, masing-masing
departemen mungkin memiliki dashboard eksekutif mereka sendiri.
5. Menampilkan Metric yang Paling Penting
Dashboard seringkali tidak beraturan. Tampilan yang tidak
beraturan membelokkan fokus pada pesan penting dashboard tersebut.
Ada yang tidak beraturan dengan informasi yang berguna dan relevan dan
ada juga yang tidak beraturan dengan informasi yang tidak berguna dan
tidak relevan. Tak satu pun dari situasi ini diinginkan. Setiap tipe
dashboard mungkin memerlukan jumlah data yang berbeda (misalnya,
dashboard Eksekutif hanya memerlukan 6 nomor, sedangkan dashboard
operasional mungkin memerlukan lebih dari 20). Tidak ada peraturan yang
sulit dan cepat untuk diikuti di sini, kecuali memastikan bahwa semua
yang Anda tampilkan relevan dan bermakna bagi penonton.
6. Menentukan Interval Periode Data Harus di Perbaharui
Memastikan data dashboard diperbaharui pada interval yang tepat.
Contoh refresh rate pada dashboard meliputi: Real-time (atau mendekati
real-time), Harian, mingguan, bulanan. Sebagai aturan praktis, dashboard
operasional memerlukan data secara real-time atau mendekati waktu
nyata, sedangkan dashboard eksekutif / strategis memerlukan data yang
diperbaharui secara tidak sering.
Top Related