Digital 124556-SK-620-Perancangan dan implementasi-Literatur
Transcript of Digital 124556-SK-620-Perancangan dan implementasi-Literatur
Bab 2
Data Warehouse
Pengambilan keputusan di dalam sebuah institusi, yang tidak lagi dapat dilakukan
hanya berdasarkan intuisi saja, dapat mengalami hambatan karena letak geografis yang
memisahkan data sistem. Selain itu, sistem-sistem yang ada menyimpan representasi data
satu entitas secara berbeda. Akibatnya sebagian besar data sistem hanya dimanfaatkan
sebagai arsip perusahaan. Padahal, jika hambatan tersebut dapat diatasi, data sistem
dapat menunjang pengambilan keputusan yang dapat menguntungkan institusi.
Data pada umumnya diambil dari OLTP atau Online Transaction Processing. OLTP
menyimpan setiap data transaksi yang terjadi pada perusahaan. Data transaksi dapat
berupa data penjualan pada perusahaan retail, atau data produksi pada perusahaan
manufaktur, atau data penilaian mata kuliah pada institusi pendidikan.
Data pada OLTP belum dapat memenuhi kebutuhan analisis yang dibutuhkan oleh
pengambil keputusan, karena hanya menggambarkan entitas bisnis dalam satu sudut
pandang sistem saja. Contohnya data transaksi penjualan (sales) dalam sebuah sistem
penjualan dirancang untuk menghindari data redundancy melalui proses normalisasi.
Sehingga dihasilkan banyak tabel yang membutuhkan proses join untuk menganalisis
data penjualan dari berbagai sudut pandang.
Karena itu dibutuhkan mekanisme untuk mengubah format data pada OLTP menjadi
sebuah format data yang mudah diolah menjadi informasi. Format data tersebut akan
menggambarkan sebuah entitas bisnis pada OLTP dari berbagai sudut pandang sehingga
lebih mudah dianalisis. Mekanisme tersebut dimulai dari perancangan dan penerapan
data warehouse, pengambilan data dari data warehouse oleh OLAP dan proses dari
OLAP untuk menampilkan data menjadi informasi.
Perbedaan data pada OLTP dengan data pada OLAP terletak pada isi dan frekuensi
4Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006
2. Data Warehouse
pemuktahiran (update) isi. Dari segi isi, data pada OLAP berupa data warehouse yang
merupakan data OLTP yang telah ditransformasi (dijelaskan lebih rinci pada bagian 2.3.1)
agar lebih mudah untuk dianalisis. Sedangkan dari segi frekuensi pemuktahiran isi,
OLAP mengalami pemuktahiran (update) isi atau penambahan data secara berkala
atau dalam periode tertentu. Kedua hal ini harus dijadikan pertimbangan tentang
rentang waktu pemuktahiran data pada OLAP. Contohnya untuk melakukan analisis
terhadap tren penjualan tidak dapat diperoleh dari data transaksi per hari, sehingga pe-
muktahiran data dilakukan setiap sebulan sekali untuk dapat menganalisis tren penjualan.
Perbedaan lainnya terletak pada metode pengembangan dan pemodelan data. Data
OLTP dikembangkan sesuai dengan kebutuhan bisnis dengan menggunakan metode
pengembangan waterfall atau iterative. Sedangkan sebuah OLAP lebih baik dikem-
bangkan dengan metode iterative karena kebutuhan yang meningkat dari pengambil
keputusan. Misalkan kebutuhan OLAP penjualan dapat berkembang dari berbagai
sudut pandang seperti sudut pandang customer, sudut pandang produk, promosi, dan
sebagainya.
Dari segi data model, OLTP menggunakan data model ER untuk melihat transaksi
sebagai proses model yang tunggal dan dinormalisasi untuk menjaga integritas data.
Sedangkan data model pada OLAP menggunakan dimensional model (dijelaskan lebih
rinci pada bagian 2.3.1). Sebuah OLAP menggunakan dimensional model yang me-
rancang bentuk data dari OLTP menjadi bentuk yang lebih mudah untuk diambil dan
dianalisis (seperti yang dijelaskan pada bagian: 2.3.1). Perancangan dan penerapan di-
mensional model dilakukan pada data warehouse untuk diambil dan dianalisis oleh OLAP.
Berdasarkan latar belakang diatas, pada subbab dibawah ini dijelaskan definisi,
tahapan pengembangan, data model, dan kemungkinan penerapan dari data warehouse
di dunia pendidikan untuk menunjang OLAP.
2.1 Definisi Data Warehouse
Data warehouse didefinisikan sebagai salinan data transaksi yang dirancang khusus,
sehingga bersifat subject-oriented, terintegrasi, non-volatile, dan time variant, untuk
mendukung kebutuhan query, analisis kompleks, penemuan knowledge dan pengambilan
keputusan dari pihak manajemen [Les03, EN00].
Data warehouse bersifat subject-oriented berarti dirancang berdasarkan subjek-subjek
5Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006
2. Data Warehouse
bisnis. Misalkan data warehouse penjualan dirancang berdasarkan subjek customer,
branch, dan barang sebagai dimensi untuk fact penjualan. Di lain pihak, perancangan
OLTP bertujuan untuk menghilangkan redundancy agar tidak terjadi anomali terhadap
data yang disimpan dengan melakukan normalisasi. Akibatnya, data pada OLTP menjadi
sulit untuk dianalisis [Kim97].
OLTP akademik dirancang agar pengambilan mata kuliah seorang mahasiswa,
yang merupakan kegiatan akademik, tidak mengalami redundancy data sehingga pada
level logic akan terdapat banyak tabel. Sedangkan data warehouse dirancang agar
dapat dilihat dari berbagai subjek bisnis institusi pendidikan. Data warehouse bersifat
terintegrasi berarti menyatukan atau mengintegrasikan berbagai sumber data. Setiap
OLTP, sebagai sumber data, merepresentasikan entitas dalam sudut pandang yang
berbeda-beda. Contohnya mahasiswa dalam sistem akademik akan direpresentasikan
dengan nilai dan pribadi dari mahasiswa. Sedangkan dalam sistem perpustakaan entitas
mahasiswa akan direpresentasikan sebagai peminjam buku. Di sistem lain, seperti sistem
finance, mahasiswa direpresentasikan sebagai objek yang membayar uang akademik setiap
semester. Data warehouse dalam hal ini mengintegrasikan representasi-representasi yang
berbeda tersebut. Hal ini membuat sebuah data warehouse dapat dilihat dari berbagai
sudut representasi yang berbeda. Contohnya dalam data warehouse terdapat beberapa
star schema yang menggabungkan semua sumber data. Dengan data warehouse seperti
ini, dimungkinkan dilakukan analisis korelasi antara pola peminjaman dan nilai MK.
Data warehouse bersifat non-volatile berarti disimpan pada media non-volatile.
Tujuannya agar rancangan yang telah dilakukan tidak perlu dibuat ulang untuk suatu
kebutuhan analisis. Pada OLTP, setiap rancangan untuk proses analisis tidak disimpan
ke dalam sebuah media non-volatile. Hal ini membuat pengulangan proses perancangan
untuk proses analisis yang sama. Sedangkan pada data warehouse, hal ini tidak perlu
dilakukan karena data disimpan di media non-volatile seperti hard-disk sehingga menun-
jang proses analisis terhadap data.
Data warehouse bersifat time variant berarti sebuah data warehouse mengandung da-
ta yang mempunyai waktu berlainan. Sebuah data warehouse menyimpan data history
dan data terkini (sampai proses update terakhir). Sedangkan sebuah OLTP hanya me-
nyimpan data transaksi yang pada waktu tertentu saja. Biasanya data dari OLTP akan
dihapus setelah proses back-up. Hal ini dilakukan agar performance dari setiap proses
transaksi tetap terjaga. Karena semakin banyak data yang ada pada sebuah sistem dapat
menghambat performance dari sistem tersebut. Dalam data warehouse, setiap data tetap
disimpan untuk dianalisis. Hal ini membuat sebuah data warehouse menyimpan data
6Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006
2. Data Warehouse
historis dan data terkini (sampai update terakhir). Untuk memenuhi definisi diatas, data
warehouse dikembangkan melalui tahapan-tahapan tertentu yang dijelaskan pada subbab
dibawah ini.
2.2 Tahapan Pengembangan Data Warehouse
Gambar 2.1: Komponen dari Warehouse Builder [KR02]
Tahapan pengembangan data warehouse menurut [KR02] terdiri dari data operasional,
data staging, dan data presentation area atau data target (Gambar 2.1).
Data operasional berisi data transaksi(data OLTP) yang di-salin, di-integrasi, dan
disimpan. Karena data warehouse dapat berasal dari berbagai OLTP(sesuai definisi
pada bagian 2.1), maka data yang diperlukan dari OLTP harus di-salin, disatukan dan
disimpan di dalam bagian data operasional.
Selanjutnya data operasional di-ekstrak dan di-transform. Proses ektraksi dan
transformasi terhadap data operasional dilakukan dengan denormalisasi dan standarisasi
(jika perlu) untuk dimasukkan ke tahap data staging. Standarisasi diperlukan sebab data
warehouse bersifat terintegrasi, sehingga setiap format data (sintaks dan semantik) yang
tidak seragam harus diubah mengacu pada sebuah konvensi tertentu untuk disatukan di
dalam data staging. Contohnya format data number dapat merepresentasikan mata uang
euro dan dollar. Selain itu, perlu juga dilakukan integrasi database jika data operasional
berasal dari database yang berbeda-beda.
7Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006
2. Data Warehouse
Integrasi database dilakukan jika data warehouse berasal dari sistem OLTP yang
berbeda, atau dari DBMS yang berbeda dalam satu sistem, atau sumber data berada
pada lokasi yang berbeda. Misalkan sistem kepegawaian menggunakan database MySQL,
sistem aset menggunakan database PostGre SQL, dan sistem penggajian menggunakan
database Oracle. Ketiga sumber tersebut, pada tahap data staging, disalin dan diinte-
grasi. Contoh lainnya, sistem transaksi yang diimplementasikan di toko-toko cabang
sebuah perusahaan yang letaknya berjauhan, juga memerlukan proses integrasi pada
tahap data staging.
Integrasi format(sintaks) dan semantik dilakukan jika format dari OLTP berbeda-
beda. Misalnya jenis kelamin karyawan pada sistem inventaris menggunakan laki-laki
dan perempuan dengan singkatan L dan P. Sedangkan sistem lainnya yang menjadi
sumber data menggunakan pria dan wanita dengan singkatan P dan W. Contoh lainnya
jika representasi pria 1 dan representasi wanita 0, sedangkan pada sistem lain yang
menjadi sumber data, representasi pria 0 dan representasi wanita 1. Contoh lainnya
ialah pada perbedaan currency, misalnya sistem keuangan dengan mata uang rupiah dan
sistem kepegawaian dengan mata uang dollar. Sehingga proses integrasi format data
pada data warehouse perlu dilakukan untuk mengubah ke format standar yang disepakati.
Selanjutnya data staging diambil, dibersihkan, dan dikombinasi sesuai kebutuhan.
Data tersebut dibersihkan sesuai dengan kebutuhan dan dikombinasikan melalui agregrasi
data, pembentukan dimensi, dan cubes. Lalu hasil kombinasi data tersebut disimpan
pada tahap representation area.
Pada data representation area, data telah siap di-load oleh OLAP menjadi informasi.
Representasi data pada tahap ini berbentuk dimensi dan cubes.
2.3 Data Model pada Data Warehouse
Untuk membentuk sebuah data warehouse, dibutuhkan data model yang tepat. Pada
awalnya data model yang digunakan untuk mengembangkan data warehouse ialah ER
diagram. Data Model ini biasanya digunakan sebagai data model bagi data transaksi
perusahaan dengan tujuan untuk menghilangkan redundancy data, sehingga proses
transaksi menjadi efisien dan tidak memiliki anomali. Tujuan ini membuat ER men-
dukung analisis relasi antar entitas [Ams97].
Karena relasi antar entitas pada ER dirancang untuk menghindari anomali, maka
sulit untuk melihat sebuah entitas dari sudut pandang yang berbeda. Sehingga proses
8Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006
2. Data Warehouse
analisis memerlukan penggabungan atau join terhadap tabel. Misalkan untuk menge-
tahui prestasi seorang karyawan dalam data pada OLTP penjualan produk memerlukan
proses join terhadap tabel penjualan dan tabel karyawan. Jika tabel penjualan dan
tabel karyawan cukup besar (misalkan lebih besar dari 10 ribu data), maka proses
penggabungan (join) akan memakan waktu dan resource yang cukup signifikan sehingga
menghambat proses analisis.
Jika untuk memenuhi kebutuhan analisis membutuhkan lebih dari dua tabel, maka
proses join akan memakan waktu dan resource yang lebih besar. Untuk meminimalisir
hal ini, dilakukan optimisasi pada query/optimized query. Namun cara ini tidak dapat
menangani perubahan kebutuhan secara dinamis karena setiap perubahan rancangan
membutuhkan optimized query yang berbeda juga. Selain itu, setiap analisis terhadap
tabel-tabel yang sama menuntut proses penggabungan tabel yang sama sehingga tidak
efisien.
Hal ini mendorong dimensional model sebagai solusi data model bagi data warehouse.
Setiap masalah yang sebelumnya dihadapi oleh ER seperti penggabungan tabel dan proses
akses dengan menggunakan query yang sama dapat di-minimalkan dengan menggunakan
data model ini. Selain itu, data model ini juga dapat menangani setiap perubahan ter-
hadap kebutuhan data warehouse secara dinamis.
2.3.1 Dimensional Model
Dimensional model merupakan permodelan data yang terdiri dari tabel dimensi dan
tabel fact yang relasinya dapat digambarkan pada star schema. Tabel fact merupakan
tabel utama dalam dimensional model yang berisi pengukuran nilai angka dari bisnis
yang disimpan [KR02]. Tabel dimensi merupakan tabel pelengkap dari tabel fact yang
berisi penjelasan tekstual dari bisnis [KR02].
Tabel Fact ialah tabel utama pada dimensional model yang berisi pengukuran nilai
angka dari bisnis yang disimpan. Setiap baris di dalam tabel fact berisi nilai pengukuran
yang merupakan sebuah kesatuan data. Nilai pengukuran tersebut direpresentasikan
dalam bentuk angka dan bersifat additive. Sebuah tabel fact terdiri dari dua atau lebih
foreign key yang akan berhubungan dengan primary key pada tabel dimensi.
Tabel dimensi merupakan tabel pelengkap dari tabel fact yang berisi penjelasan
tekstual dari bisnis yang disimpan. Tabel dimensi berisi parameter-parameter dari
suatu subjek bisnis perusahaan. Contohnya tabel dimensi mahasiswa berisi NPM, nama
mahasiswa, dan asal daerah yang merupakan parameter dari mahasiswa. Setiap tabel
9Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006
2. Data Warehouse
dimensi memiliki satu primary key yang berhubungan dengan satu foreign key dari
multipart key pada tabel fact [KR02]. Hal ini dilanggar oleh [Far05] dengan membuat
dua primary key pada dua dimensi yang berbeda yang berhubungan dengan satu foreign
key pada tabel fact tanpa ada justifikasi, sehingga menyulitkan proses implementasi dari
rancangan tersebut.
Star Schema digunakan untuk menggambarkan hubungan tabel fact dan tabel
dimensi. Tabel dimensi dan tabel fact dihubungkan dengan menghubungkan primary key
pada tabel dimensi dan foreign key pada tabel fact. Setiap foreign key pada tabel fact
berhubungan dengan satu primary key pada tabel dimensi agar tabel tersebut memenuhi
referential integrity.
Jika dibutuhkan sebuah Star Schema yang meminimalkan redundancy data, maka
dapat digunakan snowflake sebagai dimensional model yang dinormalisasi. Proses
normalisasi dilakukan untuk menyimpan data detail dari dimensi. Snowflake dalam
hal ini secara virtual tidak memiliki efek pada ukuran keseluruhan database, namun
harus selalu diperhatikan perbandingan antara pertukaran space yang digunakan dengan
tingkat normalisasi data dan kecepatan akses.
Tabel fact dan tabel dimensi dalam dimensional model dikombinasikan menjadi
multi-dimension atau cubes. Kombinasi ini membuat data warehouse mudah untuk
dilihat dari berbagai dimensi. Data warehouse dapat dinavigasi dan diputar melalui slice
dan dice. Slice dan dice ialah proses membagi data menjadi bagian yang lebih kecil,
sehingga mudah dianalisis dari sudut pandang yang berbeda.
Keuntungan dari penggunaan dimensional model ialah memisahan rancangan logika
tabel dengan tipe query yang digunakan pengguna. Rancangan OLTP mengharuskan
perancangan logika tabel dan tipe query secara bersama-sama, agar tabel tersebut dapat
terakses dengan cepat. Pada dimensional model, rancangan logika tabel dapat dirancang
terpisah dengan query. Karena dimensional model tidak memerlukan optimized query
untuk mengakses tabel dengan cepat. Pengaksesan tabel dengan optimized query
terhadap tabel dengan dimensional model akan memerlukan waktu yang sama cepat
dengan ad-hoc query. Akibatnya, perancangan dimensional model lebih dititikberatkan
pada rancangan logika tabel.
Keuntungan lainnya penggunaan dimensional model ialah kemudahan pengawasan
terhadap penambahan data, kemudahan penambahan kolom dan rancangan baru, serta
menangani pergantian kebutuhan bisnis. Pengawasan terhadap penambahan data dapat
10Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006
2. Data Warehouse
dilakukan dengan menggunakan fungsi agregrasi. Penambahan kolom dan rancangan
baru dapat dengan mudah ditangani dengan melakukan perintah alter,tanpa mempen-
garuhi query yang digunakan. Sehingga sistem yang menggunakan tabel tersebut tidak
akan terpengaruh oleh penambahan kolom tersebut. Pergantian bisnis lain yang dapat
diatasi oleh dimensional model ialah pergantian dimensi, penambahan produk, pem-
buatan pelaporan yang berubah, dan kejadian tanpa tabel fact (factless table) [KR02].
Factless table ialah rancangan dimensional model dimana sebuah tabel fact tidak memi-
liki nilai pengukuran. Pada rancangan ini, tabel fact hanya berisi foreign key dari dimensi.
Penggunaan dimensional model menurut Bill Inmon tidak mendukung tujuan jangka
panjang dari data warehouse [Ams97] karena dimensional model mengubah sudut
pandang pengguna dari data kepada bisnis proses. Sehingga relasi antar data yang
selama ini ada pada OLTP, dihilangkan oleh dimensional modeling. Akibatnya sebuah
data tidak dapat dianalisis relasi antar datanya.
Namun eliminasi terhadap relasi antar data pada dimensional model tetap mendukung
penemuan terhadap relasi baru pada data OLTP dengan cara memasukkan ke dalam
tabel dimensi atau tabel fact yang baru [Ams97]. Jadi penemuan terhadap relasi baru
pada data OLTP dapat tetap diakomodasi dalam rancangan data warehouse. Jadi untuk
meminimalisir kekurangan ini, perancang data warehouse harus mengetahui hubungan
ER dengan Dimensional Model.
Pengetahuan tentang hubungan Dimensional model dan ER diagram untuk mem-
bangun data warehouse, akan memudahkan pembuatan rancangan dimensional model.
Sebuah ER dapat membentuk banyak Dimensional Model dengan memisahkan setiap
bisnis proses pada ER, memodelkannya menjadi dimensi, dan memilih relasi many to
many yang mengandung angka dan agregrasi fakta yang bukan key menjadi tabel fact,
serta melakukan denormalisasi setiap relasi yang berhubungan dengan tabel fact menjadi
tabel dimensi.
Sesuai dengan tujuan dari tugas akhir ini, penerapan data warehouse dari Sistem Infor-
masi Akademik Universitas Indonesia(SIAK UI), maka dijelaskan tentang latar belakang
penerapan data warehouse pada dunia akademik.
11Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006
2. Data Warehouse
2.4 Penerapan Data Warehouse pada Dunia
Akademik
Pada awalnya data warehouse digunakan pada area yang mengutamakan keuntungan
untuk melakukan perhitungan kinerja dari karyawan, penjualan barang yang sesuai, atau
penentuan produksi barang yang sesuai [KR02]. Namun pada perkembangannya, data
warehouse mulai digunakan pada dunia pendidikan.
Data warehouse digunakan pada dunia pendidikan untuk mengevaluasi kualitas
pendidikan, mengukur efektifitas kegiatan pengajaran di sebuah institusi pendidikan,
mengukur kinerja pengajar, dan sebagainya. Sehingga data warehouse dapat menun-
jang institusi untuk menggunakan data yang dipunyai untuk mendapatkan informasi.
Selain kegunaan diatas, Data warehouse dalam sebuah institusi pendidikan juga dapat
digunakan untuk menganalisis data mahasiswa aktif, data mahasiswa pada semester
baru, data fasilitas akademik, data kehadiran mahasiswa, dan data perkembangan alum-
ni [KR02]. Dari proses analisis diatas, seorang pengambil keputusan dapat memberikan
kebijakan yang sesuai dengan keadaan data tersebut. Misalkan analisis fasilitas akademik
dapat membantu menunjukkan utilitas penggunaan fasilitas akademik.
Contoh lainnya ialah analisis terhadap data mahasiswa aktif seperti asal daerah, nilai
ujian, indeks prestasi, sks yang diambil, tanggal lahir, dan lain sebagainya. Melalui data
tersebut, diharapkan seorang pengambil keputusan dapat menentukan apakah metode
pengajaran yang telah dilakukan cukup efektif. Hal lain yang dapat dianalisis ialah cara
belajar yang efektif berdasarkan data mahasiswa aktif atau efektifitas metode pengajaran
baru.
Selain analisis terhadap data mahasiswa aktif, analisis juga dapat dilakukan pada
data mahasiswa semester baru seperti syarat sks, nilai indeks pada semester lalu, dan
fakultas dari mahasiswa. Analisis terhadap data tersebut dapat membantu pengambil
keputusan untuk melakukan klasifikasi mata kuliah yang dapat diambil dan potensi
mahasiswa seperti potensi DO atau sebaliknya.
Seperti yang telah dituliskan diatas, analisis terhadap utilisasi fasilitas akademik
akan sangat membantu pengambil keputusan untuk memaksimalkan segala potensi
fasilitas akademik yang ada. Misalkan jika komputer di sebuah ruangan tidak digunakan
secara maksimal, maka seorang pengambil keputusan dapat memberikan regulasi agar
penggunaan fasilitas tersebut dapat lebih maksimal. Sebaliknya, jika komputer tersebut
terlalu sering digunakan, maka pengambil keputusan dapat menambah jumlah komputer
12Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006
2. Data Warehouse
di ruangan tersebut.
Hal lainnya yang dapat dianalisis dalam sebuah institusi pendidikan ialah data
kehadiran mahasiswa dan data perkembangan alumni di dunia kerja. Analisis terhadap
kehadiran mahasiswa dapat membuat pengambil keputusan mengetahui efektifitas dari
sebuah kelas. Sehingga pengambil keputusan dapat memberikan solusi yang tepat untuk
meningkatkan efektifitas dari sebuah kelas. Analisis terhadap perkembangan alumni
di dunia kerja dapat memberikan masukan untuk meningkatkan kualitas pendidikan
yang ada saat ini. Misalkan analisis terhadap data alumni menunjukkan kekurangan
pengetahuan dalam hal bisnis, maka dapat diadakan kebijakan untuk menambahkan
mata kuliah yang berkaitan dengan dunia bisnis.
Setelah melihat definisi, tahap pengembangan, manfaat, dan penerapannya pada dunia
akademik, diperlukan alat untuk melakukan setiap tahap pengembangan yang membantu
menerapkan proses transformasi (ETL) data transaksi menjadi bentuk data warehouse.
Alat yang digunakan untuk membantu tahap pengembangan data warehouse pada tugas
akhir ini ialah Oracle Warehouse Builder.
2.5 Oracle Warehouse Builder
Oracle Warehouse Builder atau OWB ialah seperangkat alat komperhensif bagi praktisi
yang memindahkan dan men-transformasikan data, mengembangkan dan melakukan
implementasi terhadap sistem BI, melakukan manajemen terhadap metadata, dan
membuat dan mengatur database Oracle beserta metadatanya [Ste04].
Oracle Warehouse Builder(OWB) membantu tahap pengembangan dari data transak-
si ke data warehouse dengan melakukan simulasi terhadap bentuk dimensi dan cubes,
sehingga pembuatan keduanya menjadi mudah untuk dilakukan. Selain itu, OWB juga
memisahkan tahap perancangan dengan implementasi sehingga mempermudah proses
perancangan terhadap data warehouse.
Oracle Warehouse Builder (OWB) juga membantu menjaga kerahasiaan data, karena
OWB hanya menampilkan metadata dari tabel yang dirancang dan diimplementasikan.
Sehingga kerahasiaan isi data dapat tetap terjaga.
Untuk mendukung tahap pengembangan tersebut, OWB memiliki arsitektur yang
terdiri dari design client, design repository, runtime instance, runtime access, runtime
repository, dan target schema (Gambar 2.2).
13Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006
2. Data Warehouse
Design Client berfungsi untuk menyediakan antarmuka untuk mendefinisikan sumber
dan desain dari target dan proses ETL. Bagian ini melakukan perancangan terhadap data
warehouse secara terpisah dengan melakukan akses pada design repository. Jika proses
perancangan telah selesai dilakukan, implementasi dapat dilakukan secara otomatis
dengan melakukan deploy. Design Client dapat di-install tanpa Oracle database untuk
client user.
Design Repository berisi Design Repository schema pada server yang dapat diakses
oleh beberapa Design Clients. Design Repository menyimpan definisi metadata untuk
seluruh sumber daya, target, dan proses ETL yang berhubungan dengan desain metadata.
Metadata ini selanjutnya diimplementasi oleh Runtime Instance untuk diterapkan pada
database. Isi dari Design Repository dapat diakses melalui Design Browser read only
mode.
Gambar 2.2: Arsitektur dari Warehouse Builder [Ste04]
14Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006
2. Data Warehouse
Runtime Instance dari Oracle Database ada pada server dengan tiga tipe pengguna
pada target database, yaitu Runtime Access User, Runtime Repository Schema, dan
Target Schema [Ste04]. Runtime Access User merupakan tipe pengguna terpisah yang
tidak mempunyai privileges, namun dapat mengakses Runtime Repository Schema
untuk men-deploy dan mengeksekusi proses ETL. Runtime Repository schema ialah tipe
pengguna yang mengatur koneksi untuk target yang berbeda dalam Target Schema.
Sedangkan Target Schema merupakan tipe pengguna yang mempunyai schema tempat
data hasil proses ETL di-representasikan.
Dengan kata lain, Target Schema merupakan tempat sebenarnya untuk me-load target
data dan melakukan proses ETL yang mengakses paket pada Runtime Repository Schema.
Target data pada target schema berupa cube, dimension, view, dan mapping.
15Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006