BAB 2 LANDASAN TEORI -...
Transcript of BAB 2 LANDASAN TEORI -...
6
BAB 2
LANDASAN TEORI
2.1 Teori Umum
2.1.1 Pengertian Data dan Informasi
Menurut McLeod (Management Information Systems 9th, 2004, p18) data terdiri
dari fakta-fakta dan angka yang secara relatif tidak berarti bagi pemakai. Sedangkan
informasi adalah data yang telah diproses atau data yang memiliki arti.
2.1.2 Pengertian Database
Menurut Date (2000, p10), database adalah kumpulan dari data yang bersifat
persistent, yaitu data yang berbeda satu dengan yang lainnya, data tersebut bersifat
sementara dan digunakan oleh sistem aplikasi perusahaan.
Menurut Fathansyah (Sistem Basis Bata, 2004, p2), database adalah kumpulan
data yang saling berhubungan yang disimpan secara bersama sedemikian rupa dan tanpa
pengulangan (redudansi) yang tidak perlu, untuk memenuhi berbagai kebutuhan.
Database operasional terdiri dari 3 operasi, yaitu : Insert, Update, Delete.
Menurut Connoly-Begg (Database Systems, A Practical Approach to Design,
Implementation, and Management, 4th edition, 2005, p15), database adalah sebuah
kumpulan data logical yang berhubungan dan penjelasan akan data tersebut, didesain
agar menemukan kebutuhan informasi dari sebuah organisasi (perusahaan).
7
2.1.3 Pengertian Data Warehouse
Menurut Poe (Building a Data Warehouse for Decision Support, 1998, p18),
data warehouse adalah database bersifat analisis yang digunakan sebagai landasan
dalam sistem pendukung keputusan. Data warehouse dirancang untuk data yang hanya
dapat dibaca (read-only data), yang memungkinkan akses secara intuitif ke informasi
yang akan digunakan dalam pengambilan keputusan.
Menurut Kimball (The Data Warehouse lifecycle toolkit, 1998, p19), data
warehouse adalah sumber data yang mendukung fungsi query dalam perusahaan dan
merupakan gabungan dari seluruh data mart.
Menurut W.H. Inmon (Building the Data Warehouse, 2002, p31), data
warehouse adalah kumpulan dari database yang terintegrasi dan bersifat subject-
oriented yang digunakan untuk mendukung pengambilan keputusan, di mana setiap unit
data relevan dengan suatu waktu tertentu. Data warehouse mengandung data yang
atomik dan berupa lightly summarized data. Data warehouse memiliki beberapa
karakteristik utama, antara lain: subject-oriented, integrated, nonvolatile, dan time
variant.
Menurut McLeod (Management Information Systems 9th, 2004, p191), data
warehouse adalah perkembangan dari konsep database yang menyediakan sumber daya
data yang lebih baik bagi para pemakai, memungkinkan pemakai untuk memanipulasi
dan menggunakan data tersebut secara intuitif.
Jadi data warehouse adalah sebuah tempat penyimpanan data secara lengkap dan
konsisten, yang memudahkan proses pengolahan data menjadi informasi, dimana
informasi tersebut digunakan untuk mendukung pengambilan keputusan oleh pihak
eksekutif.
8
2.1.4 Karakteristik Data Warehouse
Inmon (Building The Data Warehouse, 2002, p31) mengemukakan bahwa data
warehouse sebagai kumpulan data yang mendukung pengambilan keputusan manajemen
yang berkarakteristik subject oriented, integrated, nonvolatile, dan time-variant.
2.1.4.1 Subject Oriented (Berorientasi Subyek)
Karakteristik pertama dari data warehouse yaitu berorientasi pada subyek-
subyek utama dari perusahaan. Sebaliknya, OLTP berorientasi pada proses/fungsi.
Contohnya, dalam dunia perbankan, data warehouse akan berorientasi pada subyek
utama antara lain customer, vendor, dan product. Sedangkan OLTP berorientasi pada
proses atau fungsinya, antara lain tabungan, peminjaman, dan kartu kredit.
Perbedaan orientasi ini kemudian berpengaruh pada rancangan dan implementasi
data dari data warehouse. OLTP berhubungan dengan database design dan process
design. Sedangkan data warehouse secara khusus berpusat pada data modelling dan
database design. Process design bukanlah bagian dari lingkungan data warehouse.
Perbedaan yang lain terlihat pada kandungan data pada level terinci. Data
warehouse tidak menyimpan data yang tidak digunakan untuk proses pengambilan
keputusan, sedangkan OLTP mengandung data yang memenuhi kebutuhan
fungsional/proses, yang mungkin dibutuhkan ataupun tidak oleh analis dalam kegiatan
pengambilan keputusan.
Berikut ini perbandingan antara Data Primitif / Data Operasional dan Derived
Data / Data DSS secara umum :
9
Data Primitif / Data Operasional • Berorientasi aplikasi • Detail • Akurat, ketika diakses • Melayani komunitas pegawai • Dapat diupdate • Berjalan repetitively • Kebutuhan untuk proses dimengerti
sebagai yang utama • Kompatibel dengan SDLC • Performance sensitive • Mengakses suatu unit pada suatu
waktu • Transaction driven • Kendali update menjadi perhatian
utama dalam persyaratan kepemilikan. • High availability • Diolah secara keseluruhan • Tidak berulang • Strukturnya static; content variable • Sejumlah data kecil yang digunakan
dalam proses • Mendukung operasi harian • Besar kemungkinannya untuk diakses
Derived Data / Data DSS • Berorientasi subjek • Sudah diringkas atau disaring • Merepresentasikan nilai dalam
beberapa waktu, snapshot • Melayani komunitas manajerial • Tidak boleh diupdate • Berjalan heuristically • Kebutuhan untuk proses tidak
dimengerti sebagai yang utama • Sama sekali berbeda dengan SDLC • Performance relaxed • Mengakses suatu set pada suatu waktu • Analisis driven • Kendali update tidak menjadi soal • Relaxed availability • Diolah dengan subset-subset • Perulangan adalah satu kenyataan
dalam hidup • Strukturnya flexible • Sejumlah besar data digunakan dalam
proses • Mendukung kebutuhan manajerial • Kemungkinannya rendah untuk
diakses Tabel 2.1 Perbandingan data operasional dengan data warehouse
(Sumber : Inmon, Building The Data Warehouse, 2002, p15)
Di bawah ini adalah beberapa perbedaan antara data primitif dengan derived data
atau data turunan :
• Data primitif adalah data detail yang digunakan untuk melaksanakan operasi
perusahaan sehari-hari. Derived data telah diringkas atau dikalkulasi untuk
mengetahui keperluan akan manajemen dari sebuah perusahaan.
• Data primitif dapat di-update. Derived data dapat dikalkulasi ulang tetapi tidak
dapat secara langsung di-update.
• Data primitif adalah nilai data sekarang. Derived data biasanya data historical.
10
• Data primitif dioperasikan dengan prosedur yang berulang. Derived data
dioperasikan dengan proses heuristic, program dan prosedur yang tidak berulang.
• Data operasional adalah data primitif, data DSS adalah derived data.
• Data primitif mendukung fungsi clerical. Derived data mendukung fungsi
manajerial.
2.1.4.2 Integrated (Terintegrasi)
Untuk menciptakan subyek area yang berguna, sumber data yang berasal dari
beberapa sistem yang berbeda terlebih dahulu harus terintegrasi sebelum digabungkan
ke dalam sebuah data warehouse. Sebagai contoh, terdapat empat aplikasi yang
menyimpan kode jenis kelamin dalam database secara berbeda. Aplikasi A menyimpan
kode jenis kelamin dalam bentuk ‘m’ untuk laki-laki dan ‘f’ untuk perempuan,
sedangkan aplikasi B dalam bentuk ‘1’ dan ‘0’, aplikasi C dalam bentuk ‘x’ dan ‘y’,
aplikasi D dalam bentuk ‘male’ dan ‘female’. Melalui proses integrasi dihasilkan kode
jenis kelamin yang seragam untuk data warehouse yaitu ‘m’ dan ‘f’. Untuk lebih
jelasnya dapat dilihat pada gambar berikut ini:
Gambar 2.1 Aspek Terintegrasi dari data warehouse
(Sumber : Inmon, Building the Data Warehouse, 2002, p33)
Appl A m,f m,f Appl B 1,0 Appl C x,y Appl D male, female
11
2.1.4.3 Nonvolatile (Tidak Berubah)
Proses update, insert dan delete biasanya dilakukan pada OLTP dengan basis
record. Tetapi manipulasi data pada data warehouse lebih sederhana. Hanya ada 2
macam operasi dalam data warehouse yaitu loading data dan akses data. Dalam data
warehouse tidak ada proses update terhadap data.
Gambar 2.2 Aspek Nonvolatile data warehouse
(Sumber : Inmon, Building the Data Warehouse, 2002, p34)
2.1.4.4 Time-variant (Bervariasi Menurut Waktu)
Data yang tersimpan dalam data warehouse bersifat time variant atau bersifat
akurat pada periode tertentu. Karakteristik dasar data dalam data warehouse sangat
berbeda dengan data pada OLTP, dimana data hanya akurat untuk waktu sesaat setelah
data diakses, sedangkan data pada data warehouse akurat selama periode waktu tertentu,
maka dikatakan memiliki perbedaan waktu / rentang waktu (time variance).
Aspek yang menunjukkan karakteristik time variant dalam data warehouse
adalah sebagai berikut :
Operational
chng
access
dletdlet
isrt chng
isrt
loadacces
Data Warehouse
record-by-record manipulation of data
mass load/ access of data
12
• Data warehouse mempresentasikan data untuk kurun waktu 5-10 tahun.
Sedangkan pada OLTP memrepresentasikan data untuk jangka waktu yang lebih
singkat mulai dari 60-90 hari. Karena pada OLTP, aplikasi yang digunakan harus
memiliki response time yang singkat maka data yang diproses harus optimal.
• Secara implisit maupun eksplisit, setiap struktur data pada data warehouse
mengandung elemen waktu seperti hari, minggu, bulan, dan sebagainya. Elemen
waktu ini hampir selalu menjadi dasar yang mengintegrasi data dalam data
warehouse.
• Data pada data warehouse merupakan serangkaian snapshot. Yaitu potongan
data yang dikelompokkan sesuai dengan urutan waktu.
Gambar 2.3 Aspek Time Variant data warehouse
(Sumber : Inmon, Building the Data Warehouse, 2002, p35)
Terlihat bahwa keempat karakteristik ini saling terkait, semuanya harus
diimplementasikan agar suatu data warehouse dapat berjalan efektif untuk mendukung
pengambilan keputusan. Dan, implementasi keempat karakteristik ini membutuhkan
struktur data dari data warehouse yang berbeda dengan database sistem operasional.
13
2.1.5 Struktur Data Warehouse
Data warehouse memiliki struktur yang berbeda dimana terdapat beberapa
tingkat summary dan umur data.
Gambar 2.4 Struktur data warehouse
(Sumber : Inmon, Building the Data Warehouse, 2002, p36)
Komponen-komponen struktur data warehouse adalah :
• Current Detail Data (Data Detil Saat Ini)
Data ini adalah data yang aktif saat ini, merupakan level terendah dari
data warehouse, dan biasanya memerlukan tempat penyimpanan (storage) yang
besar.
Beberapa alasan mengapa current detail data menjadi perhatian utama :
a. Menggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian
utama,
14
b. Sangat besar jumlahnya dan disimpan pada tingkatan penyimpanan
terendah,
c. Hampir selalu disimpan di media penyimpanan karena cepat diakses
tetapi mahal dan kompleks diatur,
d. Biasa digunakan dalam membuat rekapitulasi data sehingga current
detail data harus akurat.
• Older Detail Data (Data Detil Yang Lalu)
Data ini merupakan data historis yang disimpan pada media penyimpanan
yang terpisah dengan current detail data. Penamaan media penyimpanan
sebaiknya mencerminkan umur dari data untuk memudahkan pengaksesan
kembali. Contoh : Perincian penjualan pada tahun 1995-2000.
• Lightly Summarized Data
Data ini merupakan ringkasan atau rangkuman dari current detail data,
namun belum bersifat total summary. Data dirangkum berdasarkan periode
waktu atau dimensi lainnya sesuai dengan kebutuhan, memiliki tingkatan detil
yang lebih tinggi dan mendukung kebutuhan data warehouse pada tingkatan
departemental. Akses terhadap data jenis ini banyak digunakan untuk view dari
suatu kondisi yang sedang dan sudah berjalan. Contoh : Penjualan produk per
periode pada suatu wilayah tahun 2002-2004
• Highly Summarized Data
Data ini merupakan ringkasan atau rangkuman yang dihasilkan dari
lightly summarized data yang bersifat total dan mudah diakses terutama untuk
15
melakukan analisis perbandingan data berdasarkan urutan waktu dan analisis
yang menggunakan data multi-dimensi.
Database multi-dimensi adalah suatu teknologi software komputer yang
dirancang untuk meningkatkan efisiensi dalam pencarian (query) data sehingga
menjadi media penyimpanan yang lebih baik serta memudahkan pengambilan
data dengan volume yang besar. Contoh : Penjualan produk nasional tahun 1999-
2003.
• Metadata
Metadata merupakan data yang menjelaskan tentang data dan merupakan
suatu bentuk jaringan yang sangat penting bagi penggunaan data warehouse.
Metadata dibuat untuk menjawab kebutuhan dari suatu fungsi tertentu karena
setiap departemen biasanya menggunakan struktur data yang spesifik meskipun
asal datanya sama.
Peranan metadata yaitu:
o Sebagai directory untuk membantu pengguna data warehouse
menempatkan isi data dan mengetahui lokasi data dalam data
warehouse,
o Sebagai panduan untuk menempatkan (mapping) data pada saat data
ditransformasikan dari OLTP ke dalam lingkungan data warehouse,
o Sebagai panduan untuk menghasilkan rangkuman dari current detailed
data menjadi lightly summarized data dan dari lightly summarized data
menjadi highly summarized data.
16
2.1.6 Anatomi Data Warehouse
Arsitektur data warehouse dibuat berdasarkan konsep bahwa data warehouse
mengambil data dari berbagai sumber dan memindahkannya ke dalam sebuah pusat
pengumpulan data yang besar. Konsep ini sebetulnya lebih cenderung pada sebuah
lingkungan main frame yang terpusat. Keunggulan teknologi client-server
memungkinkan data warehouse diterapkan dalam berbagai macam cara untuk
menampung kebutuhan pemakai sistem secara lebih proposional. Misalnya pemakai
tertentu perlu menggabungkan data dari sebuah sistem pengumpulan data yang statis,
dengan data dari sistem operasional yang dinamis hanya dalam sebuah query saja. Di
dalam memutuskan bentuk mana yang akan kita gunakan dalam suatu perusahaan,
terlebih dahulu kita harus mengetahui kebutuhan yang kita perlukan dalam menjalankan
aplikasi yang ingin kita rancang. Berikut ini adalah tiga jenis dasar sistem data
warehouse:
• Data Warehouse Fungsional (Functional Data Warehouse)
Data warehouse Fungsional mempergunakan pendekatan kebutuhan dari tiap
bagian fungsi bisnis untuk departemen, divisi, dan lain sebagainya, untuk
mendefinisikan jenis data yang akan ditampung di dalam sistem.
Setiap unit fungsi dapat mempunyai gambaran datanya masing-masing.
Penerapan jenis sistem pengumpulan data seperti ini beresiko kehilangan konsistensi
data di luar lingkungan bisnis bersangkutan. Apabila pendekatan ini lingkupnya
diperbesar dari lingkungan fungsional menjadi lingkup perusahaan, konsistensi data
perusahaan tidak lagi dapat dijamin. Sebab utama dipergunakan pendekatan seperti
ini adalah bahwa sistem ini dapat memberi solusi yang mudah untuk dibangun
17
dengan biaya investasi yang relatif rendah dan dapat memberikan kelompok pemakai
sebuah kemampuan sistem pengumpulan data yang terbatas
• Data Warehouse Terpusat (Centralized Data Warehouse)
Data warehouse Terpusat adalah pendekatan yang paling banyak digunakan,
sebagian besar karena keterbiasaan pemakai dengan lingkungan main frame yang
terpusat. Data diambil dari seluruh sistem operasional dan disimpan di dalam pusat
penyimpanan data. Pemakai kemudian bekerja dengan mempergunakan data yang
telah terkumpul tersebut untuk membangun data warehouse Fungsional masing-
masing. Keuntungan sistem ini dibandingkan dengan data warehouse Fungsional
adalah bahwa data benar-benar terpadu.
Sistem ini mengharuskan pemasok data harus mengirimkan data tepat pada
waktunya agar supaya tetap konsisten dengan pemasok lainnya. Di samping itu,
pemakai hanya dapat mengambil data dari bagian pengumpulan saja, dan tidak dapat
secara langsung berhubungan dengan pemasok datanya sendiri.
Gambar 2.5 Data Warehouse Terpusat
(Sumber : http://www.dmreview.com/editorial/dmdirect/080198_bhend_2.gif)
18
• Data Warehouse Terdistribusi (Distributed Data Warehouse).
Data warehouse Terdistribusi dikembangkan berdasarkan konsep data
warehouse “gateway” yang memungkinkan pemakai untuk langsung berhubungan
dengan sumber data maupun dengan pusat pengumpul data lainnya. Gambaran
pemakai atas data adalah berupa gambaran logik karena data mungkin diambil dari
berbagai sumber yang berbeda. Pendekatan ini mengandalkan keunggulan teknologi
client-server untuk mengambil data dari berbagai sumber. Pendekatan ini
memungkinkan tiap departemen atau divisi untuk membangun pengumpul data
fungsionalnya masing-masing atau bahkan sistem operasionalnya dan memadukan
bagian-bagian tersebut dengan teknologi client-server. Pendekatan ini memerlukan
biaya yang sangat besar karena setiap sistem pengumpulan data fungsional dan
sistem operasinya dikelolah secara terpisah. Di samping itu, supaya berguna bagi
perusahaan, data harus disinkronisasikan untuk memelihara keterpaduannya. Metode
ini akan efektif apabila data telah tersedia dalam bentuk yang konsisten dan pemakai
ingin dapat menambah data tersebut dengan informasi baru apabila ingin membantu
gambaran baru atas informasi.
Gambar 2.6 Data Warehouse Terdistribusi
(Sumber : http://tdwi.org/Publications/WhatWorks/display.aspx?id=7316 )
19
2.1.7 Kegunaan Data Warehouse
Menurut Williams(1998, p533), data warehouse biasanya digunakan untuk
melakukan empat tugas yang berbeda, antara lain :
• Pembuatan Laporan
Pembuatan laporan merupakan salah satu kegunaan data warehouse yang
paling umum. Dengan menggunakan query sederhana dalam data warehouse,
dapat dihasilkan informasi per tahun, per bulan, dan bahkan per hari.
• On-Line Analyical Processing (OLAP)
Dengan OLAP, data warehouse dapat digunakan dalam melakukan analisis
bisnis untuk mengetahui kecenderungan pasar dan faktor-faktor penyebabnya, hal
ini disebabkan karena dengan adanya data warehouse, semua informasi baik rinci
maupun ringkasan yang dibutuhkan untuk proses analisa mudah didapat.
OLAP menggunakan konsep data multidimensi dan memungkinkan
pemakai untuk menganalisa data sampai mendetil, tanpa perlu mengetikkan suatu
perintah pemrograman. Hal ini dimungkinkan karena pada konsep data
multidimensi, maka data berupa fakta yang sama bisa dilihat dengan menggunakan
dimensi yang berbeda.
• Data Mining
Data mining dimaksudkan untuk menggali data-data yang ada pada data
warehouse untuk mencari informasi dan pengetahuan baru, dengan memakai
berbagai macam alat bantu diantaranya statistik, kecerdasan buatan dan lain-lain.
Data Mining diharapkan dapat membantu menjembatani komunikasi antara data
dan pemakainya.
20
• Proses Informasi Eksekutif
Tujuan lain pokok data warehouse digunakan untuk mencapai ringkasan
informasi yang penting dengan tujuan membuat keputusan bisnis, tanpa harus
melihat keseluruhan data. Informasi dan data pada laporan data warehouse
menjadi targer informatif bagi pemakai dalam hal ini adalah pihak eksekutif.
Menurut Connolly (Database Systems, A Practical Approach to Design,
Implementation, and Management, 4th edition, 2002, p1048), data warehouse
yang telah diimplementasikan dengan baik dapat memberikan keuntungan yang
besar bagi organisasi, yaitu :
• Potensi nilai balik yang besar pada investasi
Sebuah organisasi harus mengeluarkan uang dan sumber daya dalam
jumlah yang cukup besar untuk memastikan kalau data warehouse telah
diimplementasikan dengan baik dan biaya yang dikeluarkan dapat berkisar
antara 50.000 pound sampai 10.000.000 pound, tergantung dari solusi
teknikal yang diinginkan.
• Keuntungan kompetitif
Keuntungan kompetitif didapatkan apabila pengambil keputusan
mengakses data yang dapat mengungkapkan informasi yang sebelumnya
tidak diketahui, tidak tersedia, misalnya informasi mengenai konsumen, tren,
dan permintaan.
• Meningkatkan produktivitas para pengambil keputusan perusahaan
Data warehouse meningkatkan produktivitas para pengambil
keputusan perusahaan dengan menciptakan sebuah database yang terintegrasi
21
secara konsisten, berorientasi pada subjek, dan data historis. Data warehouse
mengintegrasikan data dari beberapa sistem yang tidak kompatibel ke dalam
bentuk yang menyediakan satu pandangan yang konsisten dari organisasi.
Dengan mengubah data menjadi informasi yang berguna, maka seorang
manajer bisnis dapat membuat analisa yang lebih akurat dan konsisten.
2.1.8 Perencanaan dan Perancangan Data Warehouse
2.1.8.1 Perencanaan Data Warehouse
Dalam perencanaan data warehouse faktor-faktor di bawah ini harus
diperhatikan.
1. Tujuan.
Tujuan pembangunan data warehouse harus memenuhi kriteria di bawah ini:
• Meningkatkan kemampuan akses informasi
• Meningkatkan kualitas keputusan yang diambil
• Memberikan integrasi dan interfungsi dalam organisasi perusahaan
• Meningkatkan apresiasi pemakai dalam menangkap/menyentuh data
2. Terkait dengan perencanaan strategi organisasi dalam menjalankan aktivitasnya.
3. Merujuk pada kebutuhan masa depan dan pada kemungkinan pemakai (user) baru
dalam organisasi.
4. Kriteria fasilitas yang dapat diberikan oleh data warehouse:
• Akuisisi data yang mendukung integrasi data
• Navigasi yang memudahkan pemakai (user) untuk mencari dan load data
• Akses yang mudah dan cepat
22
2.1.8.2 Perancangan Data Warehouse
Menurut Kimball dalam buku yang ditulis oleh Connoly-Begg (Database
Systems, A Practical Approach to Design, Implementation, and Management, 4th
edition, 2005,p1187), tahap-tahap perancangan data warehouse adalah sebagai berikut:
1. Choosing the process (Memilih Proses)
Menentukan proses berarti menentukan subyek utama. Subyek utama merujuk
pada suatu kegiatan bisnis perusahaan yang terpenting.
2. Choosing the grain
Menentukan grain maksudnya menentukan apa yang direpresentasikan oleh
suatu tabel fakta. Setelah menentukan grain dari tabel fakta maka untuk
selanjutnya dapat ditentukan tabel-tabel dimensi yang berhubungan dengan tabel
fakta tersebut. Penentuan grain dari suatu tabel fakta berarti juga menentukan
grain dari setiap tabel dimensi.
3. Identifying and conforming the dimensions (Mengidentifikasi dan
Menkonfirmasi dimensi - dimensi)
Tahap selanjutnya adalah mengidentifikasi dan menghubungkan dimensi tersebut
dengan tabel fakta. Dimensi merupakan kumpulan sudut pandang mengenai
suatu fakta yang terdapat pada tabel fakta.
4. Choosing the facts (Memilih Fakta)
Grain dari suatu tabel fakta menentukan fakta-fakta yang bisa ditampilkan. Pada
tahap ini, hal yang dilakukan adalah menentukan measure (ukuran) yang
dibutuhkan pada tabel fakta.
23
5. Storing pre-calculations in the fact table (Menyimpan Pra-kalkulasi Di Dalam
Tabel Fakta)
Umumnya hasil perhitungan dari atribut di database tidak disimpan pada suatu
atribut khusus pada database tersebut, namun pada tahap ini, perlu
dipertimbangkan kembali penyimpanan hasil perhitungan pada suatu atribut
tersendiri di database dengan alasan mengurangi resiko kesalahan pada program
setiap kali melakukan perhitungan pada atribut-atribut tersebut.
6. Rounding out the dimension tables (Melengkapi Tabel-Tabel Dimensi)
Dari dimensi-dimensi yang telah diidentifikasi, pada tahap ini dibuat deskripsi
dari tabel-tabel dimensi yang memuat informasi terstruktur mengenai atribut-
atribut pada tabel dimensi.
7. Choosing the duration of the database (Memilih Durasi Dari Database)
Pada tahap ini ditentukan durasi atau periode waktu dari data-data yang akan
dimasukkan ke data warehouse.
8. Tracking slowly changing dimensions (Mencari Perubahan-Perubahan Pada
Dimensi Secara Teliti)
Dimensi dapat berubah, untuk mengantisipasinya ada 3 cara untuk mengubah
data di dimensi, yaitu :
1. Menulis ulang atribut yang berubah
2. Membuat record baru pada dimensi
3. Membuat suatu atribut alternatif untuk menampung nilai yang baru,
sehingga nilai lama dan nilai baru dari atribut tersebut bisa diakses secara
bersamaan.
24
9. Deciding the query priorities and the query models (Menentukan Prioritas
Query dan Model Query)
Pada tahap terakhir ini, pertimbangan yang dilakukan lebih berupa perancangan
fisik dari data warehouse.
2.1.8.3 Metode Analisis Perancangan Data Warehouse
Dalam pengembangan data warehouse, ada yang disebut Dimensional Lifecycle.
Dimensional Lifecycle merupakan siklus pembuatan datawarehouse. Tahap – tahap
dalam Dimensional Lifecycle adalah sebagai berikut :
a. Project Planning
b. Project Management
c. Business Requirement Definition
d. Technical Architecture Design
e. Product selection and installation
f. Dimensional Modelling
g. Physical design
h. Data Staging design and development
i. Analitic Application Specification
j. Analitic Application Development
k. Deployment
l. Maintenance and Growth
25
Gambar 2.7 Dimensional Lifecycle Diagram
(Sumber: Kimball,The Data Warehouse Toolkit, 2002, p332)
Terdapat beberapa metode yang dapat digunakan untuk menganalisis dan
merancang sebuah data warehouse, yaitu :
1. Top-Down
Metode ini dimulai dengan mengidentifikasikan apa yang dibutuhkan oleh suatu
organisasi atau instansi yang dapat dipenuhi aplikasi data warehouse yang akan
dibangun. Dengan metode ini dapat dikembangkan data warehouse secara terencana
dan dapat memenuhi kebutuhan yang ada.
2. Bottom-Up
Metode ini dimulai dengan percobaan dan pembuatan prototype. Keuntungan
metode ini adalah waktu pengembangan yang dibutuhkan relatif singkat.
3. Gabungan Top-Down dan Bottom-Up
Metode ini merupakan gabungan dari metode Top-Down dan Bottom-Up yang
digunakan untuk memperoleh keuntungan dari kedua metode tersebut.
26
2.1.9 Perancangan Data Warehouse dengan Skema Bintang
Menurut Poe (Building a Data Warehouse for Decision Support, 1998, p26)
metode yang digunakan untuk merancang data warehouse adalah dengan menggunakan
skema bintang, yaitu metode perancangan yang dilakukan dengan struktur yang
sederhana dengan menggunakan beberapa tabel dan jalur yang terhubung dengan baik
dan jelas.
2.1.9.1 Keuntungan menggunakan Skema Bintang
Dengan menggunakan skema bintang, dapat diperoleh keuntungan yang tidak
dapat diperoleh melalui struktur relasional biasa. Keuntungan yang dapat diperoleh
(Poe, Building a Data Warehouse for Decision Support,1998, p192) antara lain:
• Menciptakan rancangan database yang menyediakan respon time yang cepat.
• Menyediakan rancangan yang dapat dimodifikasi atau ditambah secara berulang-
ulang dengan mudah sesuai dengan perkembangan data warehouse.
• Perancangan database memungkinkan pengguna akhir menyesuaikan cara berpikir
dengan kegunaan data secara paralel.
• Menyederhanakan pemahaman dan pengarahan dari metadata bagi pengembang
dan pengguna akhir.
• Memberikan banyak pilihan terhadap alat untuk mengakses front end data.
2.1.9.2 Tabel Fakta dan Tabel Dimensi
Terdapat dua tipe tabel dalam skema bintang yaitu tabel fakta dan tabel dimensi.
Tabel fakta seringkali disebut sebagai tabel mayor, terdiri dari data kuantitatif atau data
fakta mengenai bisnis, informasi yang di-query. Informasi ini sering diukur secara
27
numerik dan dapat mengandung banyak kolom dan jutaan baris. Tabel dimensi
seringkali disebut sebagai tabel minor karena lebih kecil dan menunjang data deskriptif
yang mencerminkan dimensi bisnis.
Contoh tabel fakta dalam database penjualan berisi pendapatan penjualan produk
untuk setiap konsumen, di setiap daerah pemasaran, dalam suatu periode waktu tertentu.
2.1.9.3 Ketentuan pembacaan Skema Bintang
Adapun ketentuan dalam pembacaan skema bintang adalah sebagai berikut :
• bagian yang ada di bawah judul tabel adalah kolom-kolom dari tabel.
• Primary key dan foreign key diberi kotak
• Primary key diarsir, sedangkan foreign key yang bukan primary key tidak diarsir
• Foreign key yang berhubungan ditunjukan dengan garis yang menghubungkan
tabel.
• Kolom yang bukan kunci disebut kolom data pada tabel fakta dan atribut tabel
dimensi.
2.1.9.4 Jenis-jenis Skema Bintang
Dalam penggunaannya terdapat dua buah jenis skema bintang yang tergantung
dengan kebutuhan, yaitu Skema Bintang Sederhana dan Skema Bintang Majemuk yang
akan dirinci lebih lanjut berikut ini.
o Skema Bintang Sederhana
Dalam skema bintang sederhana, setiap tabel harus mempunyai primary
key yang dapat terdiri dari sebuah kolom atau lebih. Primary key tersebut
28
membuat setiap baris menjadi unik. Dalam skema bintang sederhana, primary
key pada tabel fakta terdiri dari satu atau lebih foreign key. Foreign key adalah
sebuah kolom pada sebuah tabel yang nilainya didefinisikan oleh primary key di
tabel yang lain. Ketika database dibuat, perintah-perintah SQL digunakan untuk
membuat tabel yang akan merancang kolom-kolom, yang nantinya akan
membentuk primary key dan foreign key.
Tabel utama memiliki primay key yang terdiri dari tiga foreign key yaitu
kunci 1, kunci 2, dan kunci 3, yang masing-masing merupakan primary key di
tabel dimensi-masing-masing. Di sini terjadi hubungan many to one antara
foreign key pada tabel fakta dengan primary key pada tabel dimensi.
Tabel Dimensi 1 Tabel FaktaKunci 1 Kunci 1Atribut Kunci 2 Tabel Dimensi 3Atribut Tabel Dimensi 2 Kunci 3 Kunci 3
… Kunci 2 Kolom Data AtributAtribut Atribut Kolom Data Atribut
Atribut … …… Kolom Data Atribut
Atribut
Gambar 2.8 Hubungan antara tabel dimensi pada Skema Bintang Sederhana
(Sumber : Poe, Building a Data Warehouse for Decision Support,1998, p192)
Alasan memilih skema bintang sederhana antara lain:
1. Struktur rancangannya yang sederhana mudah dimengerti end-user.
2. Menyediakan response times yang lebih baik.
29
Gambar 2.9 Skema Bintang dengan lebih dari Satu Tabel Fakta
(Sumber : Poe, Building a Data Warehouse for Decision Support,1998, p194)
Pada gambar 2.9 terlihat bahwa dua tabel fakta dan tiga tabel dimensi. Di
sini hubungan many to one antara foreign key pada kedua fakta tersebut dengan
primary key pada masing-masing tabel dimensi.
Penggunaan lain dari tabel fakta adalah untuk mendefinisikan hubungan
many to many antara berbagai tabel dimensi yang sudah jelas dalam bisnis. Jenis
skema bintang ini sering disebut tabel asosiasi. Tabel ini dibuat untuk
menyelaraskan hubungan many to many di antara dimensi yang berbeda. Dalam
gambar 2.10 yang berfungsi sebagai penyelaras adalah tabel fakta 2.
30
Gambar 2.10 Skema Bintang sebagai Tabel Asosiasi
(Sumber: Poe, Building a Data Warehouse for Decision Support, 1998, p 195)
Tabel dimensi mungkin mengandung foreign key yang merefensikan
primary key di tabel dimensi lain. Tabel dimensi yang direferensikan ini disebut
outboard table atau secondary dimension table. Pada gambar 2.11 akan terlihat
Tabel Dimensi 3 mempunyai dua buah outboard table yaitu Tabel Dimensi 4 dan
Tabel Dimensi 5.
Gambar 2.11 Skema Bintang dengan outboard table atau secondary dimension table
(Sumber: Poe, Building a Data Warehouse for Decision Support, 1998, p197)
31
Salah satu variasi yang ada pada skema bintang adalah menyimpan
seluruh informasi tabel dimensi dalam bentuk normal ke tiga. Sementara fakta
tetap dalam keadaan semula. Hal ini biasanya disebut dengan Skema Snowflake
yang ditunjukkan pada gambar 2.12. Ciri-ciri Snowflake adalah:
o Tidak ada level di tabel dimensi.
o Tabel dimensi dinormalisasi dengan dekomposisi pada level atribut.
o Setiap dimensi mempunyai satu key untuk setiap level pada hirarki dimensi.
o Kunci level terendah menghubungkan tabel dimensi dengan tabel fakta dan
tabel atribut berlevel terendah.
Gambar 2.12 Skema Bintang Snowflake
(Sumber: Poe, Building a Data Warehouse for Decision Support, 1998, p198)
o Skema Bintang Majemuk
Pada sebuah skema bintang sederhana, primary key yang ada pada tabel
fakta dibentuk dengan menggabungkan kolom-kolom foreign key. Dalam
beberapa aplikasi, foreign key yang akan digabungkan tersebut kadang-kadang
32
tidak menyediakan suatu identifikasi yang unik terhadap setiap baris yang ada
pada tabel fakta. Oleh karena itu diperlukan sebuah skema bintang majemuk.
Di dalam skema bintang majemuk, tabel fakta memiliki dua kumpulan
foreign key, yang satu mengandung suatu referensi dengan tabel dimensi, dan
yang lain adalah primay key yang merupakan gabungan dari satu atau lebih
kolom yang menghasilkan suatu identifikasi unik untuk setiap barisnya. Primay
key dan foreign key saling tidak identik di dalam skema bintang majemuk, yang
membedakannya dengan skema bintang sederhana. Skema bintang majemuk
dapat dilihat pada gambar 2.13.
Gambar 2.13 Skema Bintang Majemuk
(Sumber: Poe, Building a Data Warehouse for Decision Support,1998, p 199)
2.1.9.5 Granularitas
Granularitas adalah level detail dalam data warehouse dan salah satu prinsip
dalam mendesain data warehouse. Granularitas data yang tinggi menyediakan sejumlah
besar informasi yang detail dan volume data yang besar pula. Granularitas data yang
rendah menyediakan data yang kurang detail, lebih pada level ringkasan data dan
33
volume data yang lebih kecil (Poe, Building a Data Warehouse for Decision Support,
1998, p26).
2.1.9.6 Drill Down dan Rolling Up
Melihat data dari sudut pandang yang berbeda dapat memberikan jawaban yang
diperlukan. Konsep Drill Down dan Rolling Up membuat pengguna dapat menganalisa
data melalui sudut pandang atau level yang ber beda. Drill Down adalah suatu cara
untuk melihat data dari level yang tinggi melalui dimensi yang berbeda ke level yang
lebih detail dari suatu data. Rolling Up adalah suatu cara untuk melihat data dari level
yang detail ke level yang lebih tinggi atau ringkasan (Poe, Building a Data Warehouse
for Decision Support, 1998, p203).
2.1.10 Agregasi
Agregasi adalah proses perhitungan data fakta terhadap atribut-atribut yang telah
didefinisikan. Sebagai contoh dapat dibuat ringkasan dari jumlah penjualan barang
berdasarkan wilayah dan jenis produk dengan menghitung nilai penjualan dari data
transaksi yang terjadi. Agregasi dapat dibuat selama proses transformasi dan
pengambilan data dalam data warehouse. Faktor yang mendorong pembuatan Agregasi
adalah (Poe, Building a Data Warehouse for Decision Support,1998, p204):
1. Peningkatan performance pencarian.
2. Pengurangan jumlah dari penggunaan CPU cycles.
Suatu agregasi yang baik dapat dibuat untuk digunakan oleh tiga ratus pemakai
dalam satu hari, karena akan lebih bermanfaat jika dibandingkan dengan membuat
34
agregasi yang membutuhkan waktu dua jam tetapi hanya digunakan sekali dalam
setahun oleh satu pemakai saja.
Salah satu teknik yang harus dicatat adalah saat permulaan data warehouse, kita
tetap membutuhkan teknik database klasik seperti tabel secara fisik. Hal ini menjadi
penting bilamana data warehouse mencapai ukuran besar.
2.1.11 Denormalisasi
Denormalisasi adalah suatu proses yang merubah bentuk normalisasi dari
database dengan cara penggabungan tabel dan merupakan sebuah proses yang secara
sengaja dilakukan dengan melanggar peraturan bentuk normal dari normalisasi dengan
tujuan untuk meningkatkan kinerja pengaksesan data yang ada.
Alasan utama untuk melakukan hal ini (Poe, Building a Data Warehouse for
Decision Support,1998, p207):
1. Untuk mengurangi jumlah hubungan yang terjadi antar tabel-tabel yang harus
mengalami proses pada waktu dilakukan pencarian. Dengan inilah performance
database dapat ditingkatkan.
2. Untuk membuat struktur fisik dari database yang semakin mendekati model
dimensi dari pemakai. Membuat struktur tabel sesuai dengan yang ingin
ditanyakan oleh pemakai, memungkinkan terjadinya akses langsung, yang sekali
lagi akan meningkatkan performance.
Kelemahan dalam proses denormalisasi adalah :
1. Proses denormalisasi secara tidak langsung akan membuat redundansi data.
35
2. Proses denormalisasi memerlukan alokasi memory dan storage (tempat
penyimpanan) yang besar.
2.1.12 CSF ( Critical Success Factor )
Menurut McLeod (Management Information Systems 9th,2004, p109) CSF
merupakan salah satu bentuk dari aktifitas perusahaan yang mempunyai pengaruh kuat
terhadap kemampuan perusahaan. Dalam mencapai tujuannya. Biasanya suatu
perusahaan mempunyai beberapa CSF. CSF hampir sama dengan management by
exception, yaitu hanya memperhatikan sebagian dari operasional perusahaan saja, bukan
seluruhnya. Perbedaannya, CSF relatif lebih stabil, dalam arti faktor-faktornya dapat
berubah namun dalam jangka waktu yang agak lama. Ada tiga hal yang harus
diperhatikan dalam CSF, yaitu :
• Informasi yang bersifat kritis
Adalah informasi yang berhubungan dengan CSF, informasi ini dapat diperoleh
dari data internal
• Asumsi kritis
Merupakan asumsi yang digunakan untuk mengetahui sejauh mana tujuan dan CSF
suatu perusahaan berkembang atau tercapai. Asumsi yang diberikan dapat berubah
berdasarkan kondisi atau keadaan tertentu.
• Keputusan kritis
Adalah keputusan yang bersifat kritis didalam menjalankan suatu perusahaan.
Kebanyakan dari keputusan kritis ini digunakan sebagai dasar untuk membangun
suatu sistem pendukung keputusan.
36
2.1.13 Analisis SWOT
Analisis SWOT (Strengths, Weaknesses, Opportunities and Threats) menurut
http://www.stfrancis.edu/ba/ghkickul/stuwebs/btopics/works/swot.htm, “SWOT analysis
is an important step in planning and its value is often underestimated despite the
simplicity in creation”, dengan kata lain analisis SWOT merupakan langkah penting
dalam perencanaan dan nilainya sering kali tidak diperkirakan. Menurut
http://www.mindtools.com/pages/article/newTMC_05.htm, “SWOT Analysis is an
effective way of identifying your Strengths and Weaknesses, and of examining the
Opportunities and Threats you face”, dengan kata lain analisis SWOT merupakan
sebuah langkah efektif dalam mengidentifikasikan Kekuatan dan Kelemahan (Strengths
and Weaknesses), dan mempelajari Peluang dan Ancaman (Opportunities and Threats).
Analisis SWOT yang merupakan langkah penting dalam menjalankan strategi
bisnis terdiri dari :
• Strengths
Melakukan analisis kekuatan yang ada pada perusahaan dengan cara
mengidentifikasikan kekuatan-kekuatan atau kelebihan yang dimiliki perusahaan.
• Weaknesses
Melakukan analisis terhadap kelemahan yang ada pada perusahaan dengan cara
mengidentifikasi kelemahan yang dimiliki, apa yang harus diperbaiki, dan apa
yang harus dihindari.
• Opportunities
Melakukan analisis terhadap peluang yang dapat dimanfaatkan dari situasi pasar.
• Threats
37
Melakukan analisis terhadap ancaman yang mungkin dapat mempengaruhi kinerja
perusahaan, seperti kompetitor, kemajuan teknologi, atau pun kelemahan yang
dimiliki menjadi hambatan besar.
2.2 Teori Khusus
2.2.1 Pengertian Manajemen Pendidikan
Menurut Kamus Besar Bahasa Indonesia (2002, p476) manajemen adalah
penggunaan sumber daya secara efektif untuk mencapai sasaran. Pendidikan adalah
pengajaran keahlian khusus, dan juga sesuatu yang tidak dapat dilihat tetapi lebih
mendalam yaitu pemberian pengetahuan, pertimbangan dan kebijaksanaan. Menurut Cut
Zahri Harun dalam situs resmi Departemen Pendidikan Nasional Indonesia, manajemen
pendidikan adalah suatu ilmu yang mempelajari bagaimana menata sumber daya, baik
SDM maupun sumber daya lain untuk mencapai tujuan pendidikan.
2.2.2 Pengertian Perguruan Tinggi, Fakultas dan Jurusan
Menurut Kamus Besar Bahasa Indonesia (2002), perguruan tinggi yang terdiri
atas sejumlah fakultas yang menyelenggarakan pendidikan ilmiah dan atau professional
dalam sejumlah disiplin ilmu tertentu. Fakultas merupakan bagian perguruan tinggi
tempat mempelajari suatu bidang ilmu yang terdiri atas beberapa jurusan. Jurusan
merupakan bagian dari suatu fakultas atau sekolah tinggi yang bertanggung jawab untuk
mengelola dan mengembangkan suatu bidang studi.
38
2.2.3 Pengertian Dosen
Menurut Kamus Besar Bahasa Indonesia (2002), Dosen merupakan tenaga
pengajar yang ada pada perguruan tinggi.
2.2.4 Mahasiswa
Menurut Kamus Besar Bahasa Indonesia (2002), Mahasiswa merupakan orang
yang belajar di perguruan tinggi. Jenjang ini merupakan lanjutan dari Sekolah Menengah
Tingkat Atas.
2.2.5 Ilmu Komputer
Menurut Kamus Besar Bahasa Indonesia (2002), Komputer adalah alat
elektronik otomatis yang dapat menghitung atau mengolah data secara cermat menurut
yang diinstruksikan, dan memberikan hasil pengolahan, serta dapat menjalankan sistem
multimedia (film, musik, televisi, faksimile, dsb.), biasanya terdiri atas unit pemasukan,
unit pengeluaran, unit penyimpanan, serta unit pengontrolan. Sedangkan ilmu komputer
adalah pengetahuan tentang bidang komputer yang disusun secara bersistem menurut
metode tertentu.
2.2.6 Teknik Informatika
Menurut Kamus Besar Bahasa Indonesia (2002), Teknik Informatika adalah ilmu
tentang klasifikasi, penyimpanan, pengeluaran dan penyebaran pengetahuan yang
direkam yaitu hal-hal yang berkaitan dengan informasi