Digital 124556-SK-620-Perancangan dan implementasi-Literatur

12
Bab 2 Data Warehouse Pengambilan keputusan di dalam sebuah institusi, yang tidak lagi dapat dilakukan hanya berdasarkan intuisi saja, dapat mengalami hambatan karena letak geografis yang memisahkan data sistem. Selain itu, sistem-sistem yang ada menyimpan representasi data satu entitas secara berbeda. Akibatnya sebagian besar data sistem hanya dimanfaatkan sebagai arsip perusahaan. Padahal, jika hambatan tersebut dapat diatasi, data sistem dapat menunjang pengambilan keputusan yang dapat menguntungkan institusi. Data pada umumnya diambil dari OLTP atau Online Transaction Processing. OLTP menyimpan setiap data transaksi yang terjadi pada perusahaan. Data transaksi dapat berupa data penjualan pada perusahaan retail, atau data produksi pada perusahaan manufaktur, atau data penilaian mata kuliah pada institusi pendidikan. Data pada OLTP belum dapat memenuhi kebutuhan analisis yang dibutuhkan oleh pengambil keputusan, karena hanya menggambarkan entitas bisnis dalam satu sudut pandang sistem saja. Contohnya data transaksi penjualan (sales ) dalam sebuah sistem penjualan dirancang untuk menghindari data redundancy melalui proses normalisasi. Sehingga dihasilkan banyak tabel yang membutuhkan proses join untuk menganalisis data penjualan dari berbagai sudut pandang. Karena itu dibutuhkan mekanisme untuk mengubah format data pada OLTP menjadi sebuah format data yang mudah diolah menjadi informasi. Format data tersebut akan menggambarkan sebuah entitas bisnis pada OLTP dari berbagai sudut pandang sehingga lebih mudah dianalisis. Mekanisme tersebut dimulai dari perancangan dan penerapan data warehouse, pengambilan data dari data warehouse oleh OLAP dan proses dari OLAP untuk menampilkan data menjadi informasi. Perbedaan data pada OLTP dengan data pada OLAP terletak pada isi dan frekuensi 4 Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006

Transcript of Digital 124556-SK-620-Perancangan dan implementasi-Literatur

Bab 2

Data Warehouse

Pengambilan keputusan di dalam sebuah institusi, yang tidak lagi dapat dilakukan

hanya berdasarkan intuisi saja, dapat mengalami hambatan karena letak geografis yang

memisahkan data sistem. Selain itu, sistem-sistem yang ada menyimpan representasi data

satu entitas secara berbeda. Akibatnya sebagian besar data sistem hanya dimanfaatkan

sebagai arsip perusahaan. Padahal, jika hambatan tersebut dapat diatasi, data sistem

dapat menunjang pengambilan keputusan yang dapat menguntungkan institusi.

Data pada umumnya diambil dari OLTP atau Online Transaction Processing. OLTP

menyimpan setiap data transaksi yang terjadi pada perusahaan. Data transaksi dapat

berupa data penjualan pada perusahaan retail, atau data produksi pada perusahaan

manufaktur, atau data penilaian mata kuliah pada institusi pendidikan.

Data pada OLTP belum dapat memenuhi kebutuhan analisis yang dibutuhkan oleh

pengambil keputusan, karena hanya menggambarkan entitas bisnis dalam satu sudut

pandang sistem saja. Contohnya data transaksi penjualan (sales) dalam sebuah sistem

penjualan dirancang untuk menghindari data redundancy melalui proses normalisasi.

Sehingga dihasilkan banyak tabel yang membutuhkan proses join untuk menganalisis

data penjualan dari berbagai sudut pandang.

Karena itu dibutuhkan mekanisme untuk mengubah format data pada OLTP menjadi

sebuah format data yang mudah diolah menjadi informasi. Format data tersebut akan

menggambarkan sebuah entitas bisnis pada OLTP dari berbagai sudut pandang sehingga

lebih mudah dianalisis. Mekanisme tersebut dimulai dari perancangan dan penerapan

data warehouse, pengambilan data dari data warehouse oleh OLAP dan proses dari

OLAP untuk menampilkan data menjadi informasi.

Perbedaan data pada OLTP dengan data pada OLAP terletak pada isi dan frekuensi

4Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006

2. Data Warehouse

pemuktahiran (update) isi. Dari segi isi, data pada OLAP berupa data warehouse yang

merupakan data OLTP yang telah ditransformasi (dijelaskan lebih rinci pada bagian 2.3.1)

agar lebih mudah untuk dianalisis. Sedangkan dari segi frekuensi pemuktahiran isi,

OLAP mengalami pemuktahiran (update) isi atau penambahan data secara berkala

atau dalam periode tertentu. Kedua hal ini harus dijadikan pertimbangan tentang

rentang waktu pemuktahiran data pada OLAP. Contohnya untuk melakukan analisis

terhadap tren penjualan tidak dapat diperoleh dari data transaksi per hari, sehingga pe-

muktahiran data dilakukan setiap sebulan sekali untuk dapat menganalisis tren penjualan.

Perbedaan lainnya terletak pada metode pengembangan dan pemodelan data. Data

OLTP dikembangkan sesuai dengan kebutuhan bisnis dengan menggunakan metode

pengembangan waterfall atau iterative. Sedangkan sebuah OLAP lebih baik dikem-

bangkan dengan metode iterative karena kebutuhan yang meningkat dari pengambil

keputusan. Misalkan kebutuhan OLAP penjualan dapat berkembang dari berbagai

sudut pandang seperti sudut pandang customer, sudut pandang produk, promosi, dan

sebagainya.

Dari segi data model, OLTP menggunakan data model ER untuk melihat transaksi

sebagai proses model yang tunggal dan dinormalisasi untuk menjaga integritas data.

Sedangkan data model pada OLAP menggunakan dimensional model (dijelaskan lebih

rinci pada bagian 2.3.1). Sebuah OLAP menggunakan dimensional model yang me-

rancang bentuk data dari OLTP menjadi bentuk yang lebih mudah untuk diambil dan

dianalisis (seperti yang dijelaskan pada bagian: 2.3.1). Perancangan dan penerapan di-

mensional model dilakukan pada data warehouse untuk diambil dan dianalisis oleh OLAP.

Berdasarkan latar belakang diatas, pada subbab dibawah ini dijelaskan definisi,

tahapan pengembangan, data model, dan kemungkinan penerapan dari data warehouse

di dunia pendidikan untuk menunjang OLAP.

2.1 Definisi Data Warehouse

Data warehouse didefinisikan sebagai salinan data transaksi yang dirancang khusus,

sehingga bersifat subject-oriented, terintegrasi, non-volatile, dan time variant, untuk

mendukung kebutuhan query, analisis kompleks, penemuan knowledge dan pengambilan

keputusan dari pihak manajemen [Les03, EN00].

Data warehouse bersifat subject-oriented berarti dirancang berdasarkan subjek-subjek

5Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006

2. Data Warehouse

bisnis. Misalkan data warehouse penjualan dirancang berdasarkan subjek customer,

branch, dan barang sebagai dimensi untuk fact penjualan. Di lain pihak, perancangan

OLTP bertujuan untuk menghilangkan redundancy agar tidak terjadi anomali terhadap

data yang disimpan dengan melakukan normalisasi. Akibatnya, data pada OLTP menjadi

sulit untuk dianalisis [Kim97].

OLTP akademik dirancang agar pengambilan mata kuliah seorang mahasiswa,

yang merupakan kegiatan akademik, tidak mengalami redundancy data sehingga pada

level logic akan terdapat banyak tabel. Sedangkan data warehouse dirancang agar

dapat dilihat dari berbagai subjek bisnis institusi pendidikan. Data warehouse bersifat

terintegrasi berarti menyatukan atau mengintegrasikan berbagai sumber data. Setiap

OLTP, sebagai sumber data, merepresentasikan entitas dalam sudut pandang yang

berbeda-beda. Contohnya mahasiswa dalam sistem akademik akan direpresentasikan

dengan nilai dan pribadi dari mahasiswa. Sedangkan dalam sistem perpustakaan entitas

mahasiswa akan direpresentasikan sebagai peminjam buku. Di sistem lain, seperti sistem

finance, mahasiswa direpresentasikan sebagai objek yang membayar uang akademik setiap

semester. Data warehouse dalam hal ini mengintegrasikan representasi-representasi yang

berbeda tersebut. Hal ini membuat sebuah data warehouse dapat dilihat dari berbagai

sudut representasi yang berbeda. Contohnya dalam data warehouse terdapat beberapa

star schema yang menggabungkan semua sumber data. Dengan data warehouse seperti

ini, dimungkinkan dilakukan analisis korelasi antara pola peminjaman dan nilai MK.

Data warehouse bersifat non-volatile berarti disimpan pada media non-volatile.

Tujuannya agar rancangan yang telah dilakukan tidak perlu dibuat ulang untuk suatu

kebutuhan analisis. Pada OLTP, setiap rancangan untuk proses analisis tidak disimpan

ke dalam sebuah media non-volatile. Hal ini membuat pengulangan proses perancangan

untuk proses analisis yang sama. Sedangkan pada data warehouse, hal ini tidak perlu

dilakukan karena data disimpan di media non-volatile seperti hard-disk sehingga menun-

jang proses analisis terhadap data.

Data warehouse bersifat time variant berarti sebuah data warehouse mengandung da-

ta yang mempunyai waktu berlainan. Sebuah data warehouse menyimpan data history

dan data terkini (sampai proses update terakhir). Sedangkan sebuah OLTP hanya me-

nyimpan data transaksi yang pada waktu tertentu saja. Biasanya data dari OLTP akan

dihapus setelah proses back-up. Hal ini dilakukan agar performance dari setiap proses

transaksi tetap terjaga. Karena semakin banyak data yang ada pada sebuah sistem dapat

menghambat performance dari sistem tersebut. Dalam data warehouse, setiap data tetap

disimpan untuk dianalisis. Hal ini membuat sebuah data warehouse menyimpan data

6Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006

2. Data Warehouse

historis dan data terkini (sampai update terakhir). Untuk memenuhi definisi diatas, data

warehouse dikembangkan melalui tahapan-tahapan tertentu yang dijelaskan pada subbab

dibawah ini.

2.2 Tahapan Pengembangan Data Warehouse

Gambar 2.1: Komponen dari Warehouse Builder [KR02]

Tahapan pengembangan data warehouse menurut [KR02] terdiri dari data operasional,

data staging, dan data presentation area atau data target (Gambar 2.1).

Data operasional berisi data transaksi(data OLTP) yang di-salin, di-integrasi, dan

disimpan. Karena data warehouse dapat berasal dari berbagai OLTP(sesuai definisi

pada bagian 2.1), maka data yang diperlukan dari OLTP harus di-salin, disatukan dan

disimpan di dalam bagian data operasional.

Selanjutnya data operasional di-ekstrak dan di-transform. Proses ektraksi dan

transformasi terhadap data operasional dilakukan dengan denormalisasi dan standarisasi

(jika perlu) untuk dimasukkan ke tahap data staging. Standarisasi diperlukan sebab data

warehouse bersifat terintegrasi, sehingga setiap format data (sintaks dan semantik) yang

tidak seragam harus diubah mengacu pada sebuah konvensi tertentu untuk disatukan di

dalam data staging. Contohnya format data number dapat merepresentasikan mata uang

euro dan dollar. Selain itu, perlu juga dilakukan integrasi database jika data operasional

berasal dari database yang berbeda-beda.

7Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006

2. Data Warehouse

Integrasi database dilakukan jika data warehouse berasal dari sistem OLTP yang

berbeda, atau dari DBMS yang berbeda dalam satu sistem, atau sumber data berada

pada lokasi yang berbeda. Misalkan sistem kepegawaian menggunakan database MySQL,

sistem aset menggunakan database PostGre SQL, dan sistem penggajian menggunakan

database Oracle. Ketiga sumber tersebut, pada tahap data staging, disalin dan diinte-

grasi. Contoh lainnya, sistem transaksi yang diimplementasikan di toko-toko cabang

sebuah perusahaan yang letaknya berjauhan, juga memerlukan proses integrasi pada

tahap data staging.

Integrasi format(sintaks) dan semantik dilakukan jika format dari OLTP berbeda-

beda. Misalnya jenis kelamin karyawan pada sistem inventaris menggunakan laki-laki

dan perempuan dengan singkatan L dan P. Sedangkan sistem lainnya yang menjadi

sumber data menggunakan pria dan wanita dengan singkatan P dan W. Contoh lainnya

jika representasi pria 1 dan representasi wanita 0, sedangkan pada sistem lain yang

menjadi sumber data, representasi pria 0 dan representasi wanita 1. Contoh lainnya

ialah pada perbedaan currency, misalnya sistem keuangan dengan mata uang rupiah dan

sistem kepegawaian dengan mata uang dollar. Sehingga proses integrasi format data

pada data warehouse perlu dilakukan untuk mengubah ke format standar yang disepakati.

Selanjutnya data staging diambil, dibersihkan, dan dikombinasi sesuai kebutuhan.

Data tersebut dibersihkan sesuai dengan kebutuhan dan dikombinasikan melalui agregrasi

data, pembentukan dimensi, dan cubes. Lalu hasil kombinasi data tersebut disimpan

pada tahap representation area.

Pada data representation area, data telah siap di-load oleh OLAP menjadi informasi.

Representasi data pada tahap ini berbentuk dimensi dan cubes.

2.3 Data Model pada Data Warehouse

Untuk membentuk sebuah data warehouse, dibutuhkan data model yang tepat. Pada

awalnya data model yang digunakan untuk mengembangkan data warehouse ialah ER

diagram. Data Model ini biasanya digunakan sebagai data model bagi data transaksi

perusahaan dengan tujuan untuk menghilangkan redundancy data, sehingga proses

transaksi menjadi efisien dan tidak memiliki anomali. Tujuan ini membuat ER men-

dukung analisis relasi antar entitas [Ams97].

Karena relasi antar entitas pada ER dirancang untuk menghindari anomali, maka

sulit untuk melihat sebuah entitas dari sudut pandang yang berbeda. Sehingga proses

8Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006

2. Data Warehouse

analisis memerlukan penggabungan atau join terhadap tabel. Misalkan untuk menge-

tahui prestasi seorang karyawan dalam data pada OLTP penjualan produk memerlukan

proses join terhadap tabel penjualan dan tabel karyawan. Jika tabel penjualan dan

tabel karyawan cukup besar (misalkan lebih besar dari 10 ribu data), maka proses

penggabungan (join) akan memakan waktu dan resource yang cukup signifikan sehingga

menghambat proses analisis.

Jika untuk memenuhi kebutuhan analisis membutuhkan lebih dari dua tabel, maka

proses join akan memakan waktu dan resource yang lebih besar. Untuk meminimalisir

hal ini, dilakukan optimisasi pada query/optimized query. Namun cara ini tidak dapat

menangani perubahan kebutuhan secara dinamis karena setiap perubahan rancangan

membutuhkan optimized query yang berbeda juga. Selain itu, setiap analisis terhadap

tabel-tabel yang sama menuntut proses penggabungan tabel yang sama sehingga tidak

efisien.

Hal ini mendorong dimensional model sebagai solusi data model bagi data warehouse.

Setiap masalah yang sebelumnya dihadapi oleh ER seperti penggabungan tabel dan proses

akses dengan menggunakan query yang sama dapat di-minimalkan dengan menggunakan

data model ini. Selain itu, data model ini juga dapat menangani setiap perubahan ter-

hadap kebutuhan data warehouse secara dinamis.

2.3.1 Dimensional Model

Dimensional model merupakan permodelan data yang terdiri dari tabel dimensi dan

tabel fact yang relasinya dapat digambarkan pada star schema. Tabel fact merupakan

tabel utama dalam dimensional model yang berisi pengukuran nilai angka dari bisnis

yang disimpan [KR02]. Tabel dimensi merupakan tabel pelengkap dari tabel fact yang

berisi penjelasan tekstual dari bisnis [KR02].

Tabel Fact ialah tabel utama pada dimensional model yang berisi pengukuran nilai

angka dari bisnis yang disimpan. Setiap baris di dalam tabel fact berisi nilai pengukuran

yang merupakan sebuah kesatuan data. Nilai pengukuran tersebut direpresentasikan

dalam bentuk angka dan bersifat additive. Sebuah tabel fact terdiri dari dua atau lebih

foreign key yang akan berhubungan dengan primary key pada tabel dimensi.

Tabel dimensi merupakan tabel pelengkap dari tabel fact yang berisi penjelasan

tekstual dari bisnis yang disimpan. Tabel dimensi berisi parameter-parameter dari

suatu subjek bisnis perusahaan. Contohnya tabel dimensi mahasiswa berisi NPM, nama

mahasiswa, dan asal daerah yang merupakan parameter dari mahasiswa. Setiap tabel

9Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006

2. Data Warehouse

dimensi memiliki satu primary key yang berhubungan dengan satu foreign key dari

multipart key pada tabel fact [KR02]. Hal ini dilanggar oleh [Far05] dengan membuat

dua primary key pada dua dimensi yang berbeda yang berhubungan dengan satu foreign

key pada tabel fact tanpa ada justifikasi, sehingga menyulitkan proses implementasi dari

rancangan tersebut.

Star Schema digunakan untuk menggambarkan hubungan tabel fact dan tabel

dimensi. Tabel dimensi dan tabel fact dihubungkan dengan menghubungkan primary key

pada tabel dimensi dan foreign key pada tabel fact. Setiap foreign key pada tabel fact

berhubungan dengan satu primary key pada tabel dimensi agar tabel tersebut memenuhi

referential integrity.

Jika dibutuhkan sebuah Star Schema yang meminimalkan redundancy data, maka

dapat digunakan snowflake sebagai dimensional model yang dinormalisasi. Proses

normalisasi dilakukan untuk menyimpan data detail dari dimensi. Snowflake dalam

hal ini secara virtual tidak memiliki efek pada ukuran keseluruhan database, namun

harus selalu diperhatikan perbandingan antara pertukaran space yang digunakan dengan

tingkat normalisasi data dan kecepatan akses.

Tabel fact dan tabel dimensi dalam dimensional model dikombinasikan menjadi

multi-dimension atau cubes. Kombinasi ini membuat data warehouse mudah untuk

dilihat dari berbagai dimensi. Data warehouse dapat dinavigasi dan diputar melalui slice

dan dice. Slice dan dice ialah proses membagi data menjadi bagian yang lebih kecil,

sehingga mudah dianalisis dari sudut pandang yang berbeda.

Keuntungan dari penggunaan dimensional model ialah memisahan rancangan logika

tabel dengan tipe query yang digunakan pengguna. Rancangan OLTP mengharuskan

perancangan logika tabel dan tipe query secara bersama-sama, agar tabel tersebut dapat

terakses dengan cepat. Pada dimensional model, rancangan logika tabel dapat dirancang

terpisah dengan query. Karena dimensional model tidak memerlukan optimized query

untuk mengakses tabel dengan cepat. Pengaksesan tabel dengan optimized query

terhadap tabel dengan dimensional model akan memerlukan waktu yang sama cepat

dengan ad-hoc query. Akibatnya, perancangan dimensional model lebih dititikberatkan

pada rancangan logika tabel.

Keuntungan lainnya penggunaan dimensional model ialah kemudahan pengawasan

terhadap penambahan data, kemudahan penambahan kolom dan rancangan baru, serta

menangani pergantian kebutuhan bisnis. Pengawasan terhadap penambahan data dapat

10Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006

2. Data Warehouse

dilakukan dengan menggunakan fungsi agregrasi. Penambahan kolom dan rancangan

baru dapat dengan mudah ditangani dengan melakukan perintah alter,tanpa mempen-

garuhi query yang digunakan. Sehingga sistem yang menggunakan tabel tersebut tidak

akan terpengaruh oleh penambahan kolom tersebut. Pergantian bisnis lain yang dapat

diatasi oleh dimensional model ialah pergantian dimensi, penambahan produk, pem-

buatan pelaporan yang berubah, dan kejadian tanpa tabel fact (factless table) [KR02].

Factless table ialah rancangan dimensional model dimana sebuah tabel fact tidak memi-

liki nilai pengukuran. Pada rancangan ini, tabel fact hanya berisi foreign key dari dimensi.

Penggunaan dimensional model menurut Bill Inmon tidak mendukung tujuan jangka

panjang dari data warehouse [Ams97] karena dimensional model mengubah sudut

pandang pengguna dari data kepada bisnis proses. Sehingga relasi antar data yang

selama ini ada pada OLTP, dihilangkan oleh dimensional modeling. Akibatnya sebuah

data tidak dapat dianalisis relasi antar datanya.

Namun eliminasi terhadap relasi antar data pada dimensional model tetap mendukung

penemuan terhadap relasi baru pada data OLTP dengan cara memasukkan ke dalam

tabel dimensi atau tabel fact yang baru [Ams97]. Jadi penemuan terhadap relasi baru

pada data OLTP dapat tetap diakomodasi dalam rancangan data warehouse. Jadi untuk

meminimalisir kekurangan ini, perancang data warehouse harus mengetahui hubungan

ER dengan Dimensional Model.

Pengetahuan tentang hubungan Dimensional model dan ER diagram untuk mem-

bangun data warehouse, akan memudahkan pembuatan rancangan dimensional model.

Sebuah ER dapat membentuk banyak Dimensional Model dengan memisahkan setiap

bisnis proses pada ER, memodelkannya menjadi dimensi, dan memilih relasi many to

many yang mengandung angka dan agregrasi fakta yang bukan key menjadi tabel fact,

serta melakukan denormalisasi setiap relasi yang berhubungan dengan tabel fact menjadi

tabel dimensi.

Sesuai dengan tujuan dari tugas akhir ini, penerapan data warehouse dari Sistem Infor-

masi Akademik Universitas Indonesia(SIAK UI), maka dijelaskan tentang latar belakang

penerapan data warehouse pada dunia akademik.

11Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006

2. Data Warehouse

2.4 Penerapan Data Warehouse pada Dunia

Akademik

Pada awalnya data warehouse digunakan pada area yang mengutamakan keuntungan

untuk melakukan perhitungan kinerja dari karyawan, penjualan barang yang sesuai, atau

penentuan produksi barang yang sesuai [KR02]. Namun pada perkembangannya, data

warehouse mulai digunakan pada dunia pendidikan.

Data warehouse digunakan pada dunia pendidikan untuk mengevaluasi kualitas

pendidikan, mengukur efektifitas kegiatan pengajaran di sebuah institusi pendidikan,

mengukur kinerja pengajar, dan sebagainya. Sehingga data warehouse dapat menun-

jang institusi untuk menggunakan data yang dipunyai untuk mendapatkan informasi.

Selain kegunaan diatas, Data warehouse dalam sebuah institusi pendidikan juga dapat

digunakan untuk menganalisis data mahasiswa aktif, data mahasiswa pada semester

baru, data fasilitas akademik, data kehadiran mahasiswa, dan data perkembangan alum-

ni [KR02]. Dari proses analisis diatas, seorang pengambil keputusan dapat memberikan

kebijakan yang sesuai dengan keadaan data tersebut. Misalkan analisis fasilitas akademik

dapat membantu menunjukkan utilitas penggunaan fasilitas akademik.

Contoh lainnya ialah analisis terhadap data mahasiswa aktif seperti asal daerah, nilai

ujian, indeks prestasi, sks yang diambil, tanggal lahir, dan lain sebagainya. Melalui data

tersebut, diharapkan seorang pengambil keputusan dapat menentukan apakah metode

pengajaran yang telah dilakukan cukup efektif. Hal lain yang dapat dianalisis ialah cara

belajar yang efektif berdasarkan data mahasiswa aktif atau efektifitas metode pengajaran

baru.

Selain analisis terhadap data mahasiswa aktif, analisis juga dapat dilakukan pada

data mahasiswa semester baru seperti syarat sks, nilai indeks pada semester lalu, dan

fakultas dari mahasiswa. Analisis terhadap data tersebut dapat membantu pengambil

keputusan untuk melakukan klasifikasi mata kuliah yang dapat diambil dan potensi

mahasiswa seperti potensi DO atau sebaliknya.

Seperti yang telah dituliskan diatas, analisis terhadap utilisasi fasilitas akademik

akan sangat membantu pengambil keputusan untuk memaksimalkan segala potensi

fasilitas akademik yang ada. Misalkan jika komputer di sebuah ruangan tidak digunakan

secara maksimal, maka seorang pengambil keputusan dapat memberikan regulasi agar

penggunaan fasilitas tersebut dapat lebih maksimal. Sebaliknya, jika komputer tersebut

terlalu sering digunakan, maka pengambil keputusan dapat menambah jumlah komputer

12Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006

2. Data Warehouse

di ruangan tersebut.

Hal lainnya yang dapat dianalisis dalam sebuah institusi pendidikan ialah data

kehadiran mahasiswa dan data perkembangan alumni di dunia kerja. Analisis terhadap

kehadiran mahasiswa dapat membuat pengambil keputusan mengetahui efektifitas dari

sebuah kelas. Sehingga pengambil keputusan dapat memberikan solusi yang tepat untuk

meningkatkan efektifitas dari sebuah kelas. Analisis terhadap perkembangan alumni

di dunia kerja dapat memberikan masukan untuk meningkatkan kualitas pendidikan

yang ada saat ini. Misalkan analisis terhadap data alumni menunjukkan kekurangan

pengetahuan dalam hal bisnis, maka dapat diadakan kebijakan untuk menambahkan

mata kuliah yang berkaitan dengan dunia bisnis.

Setelah melihat definisi, tahap pengembangan, manfaat, dan penerapannya pada dunia

akademik, diperlukan alat untuk melakukan setiap tahap pengembangan yang membantu

menerapkan proses transformasi (ETL) data transaksi menjadi bentuk data warehouse.

Alat yang digunakan untuk membantu tahap pengembangan data warehouse pada tugas

akhir ini ialah Oracle Warehouse Builder.

2.5 Oracle Warehouse Builder

Oracle Warehouse Builder atau OWB ialah seperangkat alat komperhensif bagi praktisi

yang memindahkan dan men-transformasikan data, mengembangkan dan melakukan

implementasi terhadap sistem BI, melakukan manajemen terhadap metadata, dan

membuat dan mengatur database Oracle beserta metadatanya [Ste04].

Oracle Warehouse Builder(OWB) membantu tahap pengembangan dari data transak-

si ke data warehouse dengan melakukan simulasi terhadap bentuk dimensi dan cubes,

sehingga pembuatan keduanya menjadi mudah untuk dilakukan. Selain itu, OWB juga

memisahkan tahap perancangan dengan implementasi sehingga mempermudah proses

perancangan terhadap data warehouse.

Oracle Warehouse Builder (OWB) juga membantu menjaga kerahasiaan data, karena

OWB hanya menampilkan metadata dari tabel yang dirancang dan diimplementasikan.

Sehingga kerahasiaan isi data dapat tetap terjaga.

Untuk mendukung tahap pengembangan tersebut, OWB memiliki arsitektur yang

terdiri dari design client, design repository, runtime instance, runtime access, runtime

repository, dan target schema (Gambar 2.2).

13Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006

2. Data Warehouse

Design Client berfungsi untuk menyediakan antarmuka untuk mendefinisikan sumber

dan desain dari target dan proses ETL. Bagian ini melakukan perancangan terhadap data

warehouse secara terpisah dengan melakukan akses pada design repository. Jika proses

perancangan telah selesai dilakukan, implementasi dapat dilakukan secara otomatis

dengan melakukan deploy. Design Client dapat di-install tanpa Oracle database untuk

client user.

Design Repository berisi Design Repository schema pada server yang dapat diakses

oleh beberapa Design Clients. Design Repository menyimpan definisi metadata untuk

seluruh sumber daya, target, dan proses ETL yang berhubungan dengan desain metadata.

Metadata ini selanjutnya diimplementasi oleh Runtime Instance untuk diterapkan pada

database. Isi dari Design Repository dapat diakses melalui Design Browser read only

mode.

Gambar 2.2: Arsitektur dari Warehouse Builder [Ste04]

14Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006

2. Data Warehouse

Runtime Instance dari Oracle Database ada pada server dengan tiga tipe pengguna

pada target database, yaitu Runtime Access User, Runtime Repository Schema, dan

Target Schema [Ste04]. Runtime Access User merupakan tipe pengguna terpisah yang

tidak mempunyai privileges, namun dapat mengakses Runtime Repository Schema

untuk men-deploy dan mengeksekusi proses ETL. Runtime Repository schema ialah tipe

pengguna yang mengatur koneksi untuk target yang berbeda dalam Target Schema.

Sedangkan Target Schema merupakan tipe pengguna yang mempunyai schema tempat

data hasil proses ETL di-representasikan.

Dengan kata lain, Target Schema merupakan tempat sebenarnya untuk me-load target

data dan melakukan proses ETL yang mengakses paket pada Runtime Repository Schema.

Target data pada target schema berupa cube, dimension, view, dan mapping.

15Perancangan dan implementasi..., Antonius Hermawan, FASILKOM UI, 2006