BAB 2 LANDASAN TEORI -...

6

BAB 2

LANDASAN TEORI

2.1 Teori Umum

2.1.1 Pengertian Data dan Informasi

Menurut McLeod (Management Information Systems 9th, 2004, p18) data terdiri

dari fakta-fakta dan angka yang secara relatif tidak berarti bagi pemakai. Sedangkan

informasi adalah data yang telah diproses atau data yang memiliki arti.

2.1.2 Pengertian Database

Menurut Date (2000, p10), database adalah kumpulan dari data yang bersifat

persistent, yaitu data yang berbeda satu dengan yang lainnya, data tersebut bersifat

sementara dan digunakan oleh sistem aplikasi perusahaan.

Menurut Fathansyah (Sistem Basis Bata, 2004, p2), database adalah kumpulan

data yang saling berhubungan yang disimpan secara bersama sedemikian rupa dan tanpa

pengulangan (redudansi) yang tidak perlu, untuk memenuhi berbagai kebutuhan.

Database operasional terdiri dari 3 operasi, yaitu : Insert, Update, Delete.

Menurut Connoly-Begg (Database Systems, A Practical Approach to Design,

Implementation, and Management, 4th edition, 2005, p15), database adalah sebuah

kumpulan data logical yang berhubungan dan penjelasan akan data tersebut, didesain

agar menemukan kebutuhan informasi dari sebuah organisasi (perusahaan).

7

2.1.3 Pengertian Data Warehouse

Menurut Poe (Building a Data Warehouse for Decision Support, 1998, p18),

data warehouse adalah database bersifat analisis yang digunakan sebagai landasan

dalam sistem pendukung keputusan. Data warehouse dirancang untuk data yang hanya

dapat dibaca (read-only data), yang memungkinkan akses secara intuitif ke informasi

yang akan digunakan dalam pengambilan keputusan.

Menurut Kimball (The Data Warehouse lifecycle toolkit, 1998, p19), data

warehouse adalah sumber data yang mendukung fungsi query dalam perusahaan dan

merupakan gabungan dari seluruh data mart.

Menurut W.H. Inmon (Building the Data Warehouse, 2002, p31), data

warehouse adalah kumpulan dari database yang terintegrasi dan bersifat subject-

oriented yang digunakan untuk mendukung pengambilan keputusan, di mana setiap unit

data relevan dengan suatu waktu tertentu. Data warehouse mengandung data yang

atomik dan berupa lightly summarized data. Data warehouse memiliki beberapa

karakteristik utama, antara lain: subject-oriented, integrated, nonvolatile, dan time

variant.

Menurut McLeod (Management Information Systems 9th, 2004, p191), data

warehouse adalah perkembangan dari konsep database yang menyediakan sumber daya

data yang lebih baik bagi para pemakai, memungkinkan pemakai untuk memanipulasi

dan menggunakan data tersebut secara intuitif.

Jadi data warehouse adalah sebuah tempat penyimpanan data secara lengkap dan

konsisten, yang memudahkan proses pengolahan data menjadi informasi, dimana

informasi tersebut digunakan untuk mendukung pengambilan keputusan oleh pihak

eksekutif.

8

2.1.4 Karakteristik Data Warehouse

Inmon (Building The Data Warehouse, 2002, p31) mengemukakan bahwa data

warehouse sebagai kumpulan data yang mendukung pengambilan keputusan manajemen

yang berkarakteristik subject oriented, integrated, nonvolatile, dan time-variant.

2.1.4.1 Subject Oriented (Berorientasi Subyek)

Karakteristik pertama dari data warehouse yaitu berorientasi pada subyek-

subyek utama dari perusahaan. Sebaliknya, OLTP berorientasi pada proses/fungsi.

Contohnya, dalam dunia perbankan, data warehouse akan berorientasi pada subyek

utama antara lain customer, vendor, dan product. Sedangkan OLTP berorientasi pada

proses atau fungsinya, antara lain tabungan, peminjaman, dan kartu kredit.

Perbedaan orientasi ini kemudian berpengaruh pada rancangan dan implementasi

data dari data warehouse. OLTP berhubungan dengan database design dan process

design. Sedangkan data warehouse secara khusus berpusat pada data modelling dan

database design. Process design bukanlah bagian dari lingkungan data warehouse.

Perbedaan yang lain terlihat pada kandungan data pada level terinci. Data

warehouse tidak menyimpan data yang tidak digunakan untuk proses pengambilan

keputusan, sedangkan OLTP mengandung data yang memenuhi kebutuhan

fungsional/proses, yang mungkin dibutuhkan ataupun tidak oleh analis dalam kegiatan

pengambilan keputusan.

Berikut ini perbandingan antara Data Primitif / Data Operasional dan Derived

Data / Data DSS secara umum :

9

Data Primitif / Data Operasional • Berorientasi aplikasi • Detail • Akurat, ketika diakses • Melayani komunitas pegawai • Dapat diupdate • Berjalan repetitively • Kebutuhan untuk proses dimengerti

sebagai yang utama • Kompatibel dengan SDLC • Performance sensitive • Mengakses suatu unit pada suatu

waktu • Transaction driven • Kendali update menjadi perhatian

utama dalam persyaratan kepemilikan. • High availability • Diolah secara keseluruhan • Tidak berulang • Strukturnya static; content variable • Sejumlah data kecil yang digunakan

dalam proses • Mendukung operasi harian • Besar kemungkinannya untuk diakses

Derived Data / Data DSS • Berorientasi subjek • Sudah diringkas atau disaring • Merepresentasikan nilai dalam

beberapa waktu, snapshot • Melayani komunitas manajerial • Tidak boleh diupdate • Berjalan heuristically • Kebutuhan untuk proses tidak

dimengerti sebagai yang utama • Sama sekali berbeda dengan SDLC • Performance relaxed • Mengakses suatu set pada suatu waktu • Analisis driven • Kendali update tidak menjadi soal • Relaxed availability • Diolah dengan subset-subset • Perulangan adalah satu kenyataan

dalam hidup • Strukturnya flexible • Sejumlah besar data digunakan dalam

proses • Mendukung kebutuhan manajerial • Kemungkinannya rendah untuk

diakses Tabel 2.1 Perbandingan data operasional dengan data warehouse

(Sumber : Inmon, Building The Data Warehouse, 2002, p15)

Di bawah ini adalah beberapa perbedaan antara data primitif dengan derived data

atau data turunan :

• Data primitif adalah data detail yang digunakan untuk melaksanakan operasi

perusahaan sehari-hari. Derived data telah diringkas atau dikalkulasi untuk

mengetahui keperluan akan manajemen dari sebuah perusahaan.

• Data primitif dapat di-update. Derived data dapat dikalkulasi ulang tetapi tidak

dapat secara langsung di-update.

• Data primitif adalah nilai data sekarang. Derived data biasanya data historical.

10

• Data primitif dioperasikan dengan prosedur yang berulang. Derived data

dioperasikan dengan proses heuristic, program dan prosedur yang tidak berulang.

• Data operasional adalah data primitif, data DSS adalah derived data.

• Data primitif mendukung fungsi clerical. Derived data mendukung fungsi

manajerial.

2.1.4.2 Integrated (Terintegrasi)

Untuk menciptakan subyek area yang berguna, sumber data yang berasal dari

beberapa sistem yang berbeda terlebih dahulu harus terintegrasi sebelum digabungkan

ke dalam sebuah data warehouse. Sebagai contoh, terdapat empat aplikasi yang

menyimpan kode jenis kelamin dalam database secara berbeda. Aplikasi A menyimpan

kode jenis kelamin dalam bentuk ‘m’ untuk laki-laki dan ‘f’ untuk perempuan,

sedangkan aplikasi B dalam bentuk ‘1’ dan ‘0’, aplikasi C dalam bentuk ‘x’ dan ‘y’,

aplikasi D dalam bentuk ‘male’ dan ‘female’. Melalui proses integrasi dihasilkan kode

jenis kelamin yang seragam untuk data warehouse yaitu ‘m’ dan ‘f’. Untuk lebih

jelasnya dapat dilihat pada gambar berikut ini:

Gambar 2.1 Aspek Terintegrasi dari data warehouse

(Sumber : Inmon, Building the Data Warehouse, 2002, p33)

Appl A m,f m,f Appl B 1,0 Appl C x,y Appl D male, female

11

2.1.4.3 Nonvolatile (Tidak Berubah)

Proses update, insert dan delete biasanya dilakukan pada OLTP dengan basis

record. Tetapi manipulasi data pada data warehouse lebih sederhana. Hanya ada 2

macam operasi dalam data warehouse yaitu loading data dan akses data. Dalam data

warehouse tidak ada proses update terhadap data.

Gambar 2.2 Aspek Nonvolatile data warehouse


2.1.4.4 Time-variant (Bervariasi Menurut Waktu)

Data yang tersimpan dalam data warehouse bersifat time variant atau bersifat

akurat pada periode tertentu. Karakteristik dasar data dalam data warehouse sangat

berbeda dengan data pada OLTP, dimana data hanya akurat untuk waktu sesaat setelah

data diakses, sedangkan data pada data warehouse akurat selama periode waktu tertentu,

maka dikatakan memiliki perbedaan waktu / rentang waktu (time variance).

Aspek yang menunjukkan karakteristik time variant dalam data warehouse

adalah sebagai berikut :

Operational

chng

access

dletdlet

isrt chng

isrt

loadacces

Data Warehouse

record-by-record manipulation of data

mass load/ access of data

12

• Data warehouse mempresentasikan data untuk kurun waktu 5-10 tahun.

Sedangkan pada OLTP memrepresentasikan data untuk jangka waktu yang lebih

singkat mulai dari 60-90 hari. Karena pada OLTP, aplikasi yang digunakan harus

memiliki response time yang singkat maka data yang diproses harus optimal.

• Secara implisit maupun eksplisit, setiap struktur data pada data warehouse

mengandung elemen waktu seperti hari, minggu, bulan, dan sebagainya. Elemen

waktu ini hampir selalu menjadi dasar yang mengintegrasi data dalam data

warehouse.

• Data pada data warehouse merupakan serangkaian snapshot. Yaitu potongan

data yang dikelompokkan sesuai dengan urutan waktu.

Gambar 2.3 Aspek Time Variant data warehouse


Terlihat bahwa keempat karakteristik ini saling terkait, semuanya harus

diimplementasikan agar suatu data warehouse dapat berjalan efektif untuk mendukung

pengambilan keputusan. Dan, implementasi keempat karakteristik ini membutuhkan

struktur data dari data warehouse yang berbeda dengan database sistem operasional.

13

2.1.5 Struktur Data Warehouse

Data warehouse memiliki struktur yang berbeda dimana terdapat beberapa

tingkat summary dan umur data.

Gambar 2.4 Struktur data warehouse


Komponen-komponen struktur data warehouse adalah :

• Current Detail Data (Data Detil Saat Ini)

Data ini adalah data yang aktif saat ini, merupakan level terendah dari

data warehouse, dan biasanya memerlukan tempat penyimpanan (storage) yang

besar.

Beberapa alasan mengapa current detail data menjadi perhatian utama :

a. Menggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian

utama,

14

b. Sangat besar jumlahnya dan disimpan pada tingkatan penyimpanan

terendah,

c. Hampir selalu disimpan di media penyimpanan karena cepat diakses

tetapi mahal dan kompleks diatur,

d. Biasa digunakan dalam membuat rekapitulasi data sehingga current

detail data harus akurat.

• Older Detail Data (Data Detil Yang Lalu)

Data ini merupakan data historis yang disimpan pada media penyimpanan

yang terpisah dengan current detail data. Penamaan media penyimpanan

sebaiknya mencerminkan umur dari data untuk memudahkan pengaksesan

kembali. Contoh : Perincian penjualan pada tahun 1995-2000.

• Lightly Summarized Data

Data ini merupakan ringkasan atau rangkuman dari current detail data,

namun belum bersifat total summary. Data dirangkum berdasarkan periode

waktu atau dimensi lainnya sesuai dengan kebutuhan, memiliki tingkatan detil

yang lebih tinggi dan mendukung kebutuhan data warehouse pada tingkatan

departemental. Akses terhadap data jenis ini banyak digunakan untuk view dari

suatu kondisi yang sedang dan sudah berjalan. Contoh : Penjualan produk per

periode pada suatu wilayah tahun 2002-2004

• Highly Summarized Data

Data ini merupakan ringkasan atau rangkuman yang dihasilkan dari

lightly summarized data yang bersifat total dan mudah diakses terutama untuk

15

melakukan analisis perbandingan data berdasarkan urutan waktu dan analisis

yang menggunakan data multi-dimensi.

Database multi-dimensi adalah suatu teknologi software komputer yang

dirancang untuk meningkatkan efisiensi dalam pencarian (query) data sehingga

menjadi media penyimpanan yang lebih baik serta memudahkan pengambilan

data dengan volume yang besar. Contoh : Penjualan produk nasional tahun 1999-

2003.

• Metadata

Metadata merupakan data yang menjelaskan tentang data dan merupakan

suatu bentuk jaringan yang sangat penting bagi penggunaan data warehouse.

Metadata dibuat untuk menjawab kebutuhan dari suatu fungsi tertentu karena

setiap departemen biasanya menggunakan struktur data yang spesifik meskipun

asal datanya sama.

Peranan metadata yaitu:

o Sebagai directory untuk membantu pengguna data warehouse

menempatkan isi data dan mengetahui lokasi data dalam data

warehouse,

o Sebagai panduan untuk menempatkan (mapping) data pada saat data

ditransformasikan dari OLTP ke dalam lingkungan data warehouse,

o Sebagai panduan untuk menghasilkan rangkuman dari current detailed

data menjadi lightly summarized data dan dari lightly summarized data

menjadi highly summarized data.

16

2.1.6 Anatomi Data Warehouse

Arsitektur data warehouse dibuat berdasarkan konsep bahwa data warehouse

mengambil data dari berbagai sumber dan memindahkannya ke dalam sebuah pusat

pengumpulan data yang besar. Konsep ini sebetulnya lebih cenderung pada sebuah

lingkungan main frame yang terpusat. Keunggulan teknologi client-server

memungkinkan data warehouse diterapkan dalam berbagai macam cara untuk

menampung kebutuhan pemakai sistem secara lebih proposional. Misalnya pemakai

tertentu perlu menggabungkan data dari sebuah sistem pengumpulan data yang statis,

dengan data dari sistem operasional yang dinamis hanya dalam sebuah query saja. Di

dalam memutuskan bentuk mana yang akan kita gunakan dalam suatu perusahaan,

terlebih dahulu kita harus mengetahui kebutuhan yang kita perlukan dalam menjalankan

aplikasi yang ingin kita rancang. Berikut ini adalah tiga jenis dasar sistem data

warehouse:

• Data Warehouse Fungsional (Functional Data Warehouse)

Data warehouse Fungsional mempergunakan pendekatan kebutuhan dari tiap

bagian fungsi bisnis untuk departemen, divisi, dan lain sebagainya, untuk

mendefinisikan jenis data yang akan ditampung di dalam sistem.

Setiap unit fungsi dapat mempunyai gambaran datanya masing-masing.

Penerapan jenis sistem pengumpulan data seperti ini beresiko kehilangan konsistensi

data di luar lingkungan bisnis bersangkutan. Apabila pendekatan ini lingkupnya

diperbesar dari lingkungan fungsional menjadi lingkup perusahaan, konsistensi data

perusahaan tidak lagi dapat dijamin. Sebab utama dipergunakan pendekatan seperti

ini adalah bahwa sistem ini dapat memberi solusi yang mudah untuk dibangun

17

dengan biaya investasi yang relatif rendah dan dapat memberikan kelompok pemakai

sebuah kemampuan sistem pengumpulan data yang terbatas

• Data Warehouse Terpusat (Centralized Data Warehouse)

Data warehouse Terpusat adalah pendekatan yang paling banyak digunakan,

sebagian besar karena keterbiasaan pemakai dengan lingkungan main frame yang

terpusat. Data diambil dari seluruh sistem operasional dan disimpan di dalam pusat

penyimpanan data. Pemakai kemudian bekerja dengan mempergunakan data yang

telah terkumpul tersebut untuk membangun data warehouse Fungsional masing-

masing. Keuntungan sistem ini dibandingkan dengan data warehouse Fungsional

adalah bahwa data benar-benar terpadu.

Sistem ini mengharuskan pemasok data harus mengirimkan data tepat pada

waktunya agar supaya tetap konsisten dengan pemasok lainnya. Di samping itu,

pemakai hanya dapat mengambil data dari bagian pengumpulan saja, dan tidak dapat

secara langsung berhubungan dengan pemasok datanya sendiri.

Gambar 2.5 Data Warehouse Terpusat

(Sumber : http://www.dmreview.com/editorial/dmdirect/080198_bhend_2.gif)

18

• Data Warehouse Terdistribusi (Distributed Data Warehouse).

Data warehouse Terdistribusi dikembangkan berdasarkan konsep data

warehouse “gateway” yang memungkinkan pemakai untuk langsung berhubungan

dengan sumber data maupun dengan pusat pengumpul data lainnya. Gambaran

pemakai atas data adalah berupa gambaran logik karena data mungkin diambil dari

berbagai sumber yang berbeda. Pendekatan ini mengandalkan keunggulan teknologi

client-server untuk mengambil data dari berbagai sumber. Pendekatan ini

memungkinkan tiap departemen atau divisi untuk membangun pengumpul data

fungsionalnya masing-masing atau bahkan sistem operasionalnya dan memadukan

bagian-bagian tersebut dengan teknologi client-server. Pendekatan ini memerlukan

biaya yang sangat besar karena setiap sistem pengumpulan data fungsional dan

sistem operasinya dikelolah secara terpisah. Di samping itu, supaya berguna bagi

perusahaan, data harus disinkronisasikan untuk memelihara keterpaduannya. Metode

ini akan efektif apabila data telah tersedia dalam bentuk yang konsisten dan pemakai

ingin dapat menambah data tersebut dengan informasi baru apabila ingin membantu

gambaran baru atas informasi.

Gambar 2.6 Data Warehouse Terdistribusi

(Sumber : http://tdwi.org/Publications/WhatWorks/display.aspx?id=7316 )

19

2.1.7 Kegunaan Data Warehouse

Menurut Williams(1998, p533), data warehouse biasanya digunakan untuk

melakukan empat tugas yang berbeda, antara lain :

• Pembuatan Laporan

Pembuatan laporan merupakan salah satu kegunaan data warehouse yang

paling umum. Dengan menggunakan query sederhana dalam data warehouse,

dapat dihasilkan informasi per tahun, per bulan, dan bahkan per hari.

• On-Line Analyical Processing (OLAP)

Dengan OLAP, data warehouse dapat digunakan dalam melakukan analisis

bisnis untuk mengetahui kecenderungan pasar dan faktor-faktor penyebabnya, hal

ini disebabkan karena dengan adanya data warehouse, semua informasi baik rinci

maupun ringkasan yang dibutuhkan untuk proses analisa mudah didapat.

OLAP menggunakan konsep data multidimensi dan memungkinkan

pemakai untuk menganalisa data sampai mendetil, tanpa perlu mengetikkan suatu

perintah pemrograman. Hal ini dimungkinkan karena pada konsep data

multidimensi, maka data berupa fakta yang sama bisa dilihat dengan menggunakan

dimensi yang berbeda.

• Data Mining

Data mining dimaksudkan untuk menggali data-data yang ada pada data

warehouse untuk mencari informasi dan pengetahuan baru, dengan memakai

berbagai macam alat bantu diantaranya statistik, kecerdasan buatan dan lain-lain.

Data Mining diharapkan dapat membantu menjembatani komunikasi antara data

dan pemakainya.

20

• Proses Informasi Eksekutif

Tujuan lain pokok data warehouse digunakan untuk mencapai ringkasan

informasi yang penting dengan tujuan membuat keputusan bisnis, tanpa harus

melihat keseluruhan data. Informasi dan data pada laporan data warehouse

menjadi targer informatif bagi pemakai dalam hal ini adalah pihak eksekutif.

Menurut Connolly (Database Systems, A Practical Approach to Design,

Implementation, and Management, 4th edition, 2002, p1048), data warehouse

yang telah diimplementasikan dengan baik dapat memberikan keuntungan yang

besar bagi organisasi, yaitu :

• Potensi nilai balik yang besar pada investasi

Sebuah organisasi harus mengeluarkan uang dan sumber daya dalam

jumlah yang cukup besar untuk memastikan kalau data warehouse telah

diimplementasikan dengan baik dan biaya yang dikeluarkan dapat berkisar

antara 50.000 pound sampai 10.000.000 pound, tergantung dari solusi

teknikal yang diinginkan.

• Keuntungan kompetitif

Keuntungan kompetitif didapatkan apabila pengambil keputusan

mengakses data yang dapat mengungkapkan informasi yang sebelumnya

tidak diketahui, tidak tersedia, misalnya informasi mengenai konsumen, tren,

dan permintaan.

• Meningkatkan produktivitas para pengambil keputusan perusahaan

Data warehouse meningkatkan produktivitas para pengambil

keputusan perusahaan dengan menciptakan sebuah database yang terintegrasi

21

secara konsisten, berorientasi pada subjek, dan data historis. Data warehouse

mengintegrasikan data dari beberapa sistem yang tidak kompatibel ke dalam

bentuk yang menyediakan satu pandangan yang konsisten dari organisasi.

Dengan mengubah data menjadi informasi yang berguna, maka seorang

manajer bisnis dapat membuat analisa yang lebih akurat dan konsisten.

2.1.8 Perencanaan dan Perancangan Data Warehouse

2.1.8.1 Perencanaan Data Warehouse

Dalam perencanaan data warehouse faktor-faktor di bawah ini harus

diperhatikan.

1. Tujuan.

Tujuan pembangunan data warehouse harus memenuhi kriteria di bawah ini:

• Meningkatkan kemampuan akses informasi

• Meningkatkan kualitas keputusan yang diambil

• Memberikan integrasi dan interfungsi dalam organisasi perusahaan

• Meningkatkan apresiasi pemakai dalam menangkap/menyentuh data

2. Terkait dengan perencanaan strategi organisasi dalam menjalankan aktivitasnya.

3. Merujuk pada kebutuhan masa depan dan pada kemungkinan pemakai (user) baru

dalam organisasi.

4. Kriteria fasilitas yang dapat diberikan oleh data warehouse:

• Akuisisi data yang mendukung integrasi data

• Navigasi yang memudahkan pemakai (user) untuk mencari dan load data

• Akses yang mudah dan cepat

22

2.1.8.2 Perancangan Data Warehouse

Menurut Kimball dalam buku yang ditulis oleh Connoly-Begg (Database

Systems, A Practical Approach to Design, Implementation, and Management, 4th

edition, 2005,p1187), tahap-tahap perancangan data warehouse adalah sebagai berikut:

1. Choosing the process (Memilih Proses)

Menentukan proses berarti menentukan subyek utama. Subyek utama merujuk

pada suatu kegiatan bisnis perusahaan yang terpenting.

2. Choosing the grain

Menentukan grain maksudnya menentukan apa yang direpresentasikan oleh

suatu tabel fakta. Setelah menentukan grain dari tabel fakta maka untuk

selanjutnya dapat ditentukan tabel-tabel dimensi yang berhubungan dengan tabel

fakta tersebut. Penentuan grain dari suatu tabel fakta berarti juga menentukan

grain dari setiap tabel dimensi.

3. Identifying and conforming the dimensions (Mengidentifikasi dan

Menkonfirmasi dimensi - dimensi)

Tahap selanjutnya adalah mengidentifikasi dan menghubungkan dimensi tersebut

dengan tabel fakta. Dimensi merupakan kumpulan sudut pandang mengenai

suatu fakta yang terdapat pada tabel fakta.

4. Choosing the facts (Memilih Fakta)

Grain dari suatu tabel fakta menentukan fakta-fakta yang bisa ditampilkan. Pada

tahap ini, hal yang dilakukan adalah menentukan measure (ukuran) yang

dibutuhkan pada tabel fakta.

23

5. Storing pre-calculations in the fact table (Menyimpan Pra-kalkulasi Di Dalam

Tabel Fakta)

Umumnya hasil perhitungan dari atribut di database tidak disimpan pada suatu

atribut khusus pada database tersebut, namun pada tahap ini, perlu

dipertimbangkan kembali penyimpanan hasil perhitungan pada suatu atribut

tersendiri di database dengan alasan mengurangi resiko kesalahan pada program

setiap kali melakukan perhitungan pada atribut-atribut tersebut.

6. Rounding out the dimension tables (Melengkapi Tabel-Tabel Dimensi)

Dari dimensi-dimensi yang telah diidentifikasi, pada tahap ini dibuat deskripsi

dari tabel-tabel dimensi yang memuat informasi terstruktur mengenai atribut-

atribut pada tabel dimensi.

7. Choosing the duration of the database (Memilih Durasi Dari Database)

Pada tahap ini ditentukan durasi atau periode waktu dari data-data yang akan

dimasukkan ke data warehouse.

8. Tracking slowly changing dimensions (Mencari Perubahan-Perubahan Pada

Dimensi Secara Teliti)

Dimensi dapat berubah, untuk mengantisipasinya ada 3 cara untuk mengubah

data di dimensi, yaitu :

1. Menulis ulang atribut yang berubah

2. Membuat record baru pada dimensi

3. Membuat suatu atribut alternatif untuk menampung nilai yang baru,

sehingga nilai lama dan nilai baru dari atribut tersebut bisa diakses secara

bersamaan.

24

9. Deciding the query priorities and the query models (Menentukan Prioritas

Query dan Model Query)

Pada tahap terakhir ini, pertimbangan yang dilakukan lebih berupa perancangan

fisik dari data warehouse.

2.1.8.3 Metode Analisis Perancangan Data Warehouse

Dalam pengembangan data warehouse, ada yang disebut Dimensional Lifecycle.

Dimensional Lifecycle merupakan siklus pembuatan datawarehouse. Tahap – tahap

dalam Dimensional Lifecycle adalah sebagai berikut :

a. Project Planning

b. Project Management

c. Business Requirement Definition

d. Technical Architecture Design

e. Product selection and installation

f. Dimensional Modelling

g. Physical design

h. Data Staging design and development

i. Analitic Application Specification

j. Analitic Application Development

k. Deployment

l. Maintenance and Growth

25

Gambar 2.7 Dimensional Lifecycle Diagram

(Sumber: Kimball,The Data Warehouse Toolkit, 2002, p332)

Terdapat beberapa metode yang dapat digunakan untuk menganalisis dan

merancang sebuah data warehouse, yaitu :

1. Top-Down

Metode ini dimulai dengan mengidentifikasikan apa yang dibutuhkan oleh suatu

organisasi atau instansi yang dapat dipenuhi aplikasi data warehouse yang akan

dibangun. Dengan metode ini dapat dikembangkan data warehouse secara terencana

dan dapat memenuhi kebutuhan yang ada.

2. Bottom-Up

Metode ini dimulai dengan percobaan dan pembuatan prototype. Keuntungan

metode ini adalah waktu pengembangan yang dibutuhkan relatif singkat.

3. Gabungan Top-Down dan Bottom-Up

Metode ini merupakan gabungan dari metode Top-Down dan Bottom-Up yang

digunakan untuk memperoleh keuntungan dari kedua metode tersebut.

26

2.1.9 Perancangan Data Warehouse dengan Skema Bintang

Menurut Poe (Building a Data Warehouse for Decision Support, 1998, p26)

metode yang digunakan untuk merancang data warehouse adalah dengan menggunakan

skema bintang, yaitu metode perancangan yang dilakukan dengan struktur yang

sederhana dengan menggunakan beberapa tabel dan jalur yang terhubung dengan baik

dan jelas.

2.1.9.1 Keuntungan menggunakan Skema Bintang

Dengan menggunakan skema bintang, dapat diperoleh keuntungan yang tidak

dapat diperoleh melalui struktur relasional biasa. Keuntungan yang dapat diperoleh

(Poe, Building a Data Warehouse for Decision Support,1998, p192) antara lain:

• Menciptakan rancangan database yang menyediakan respon time yang cepat.

• Menyediakan rancangan yang dapat dimodifikasi atau ditambah secara berulang-

ulang dengan mudah sesuai dengan perkembangan data warehouse.

• Perancangan database memungkinkan pengguna akhir menyesuaikan cara berpikir

dengan kegunaan data secara paralel.

• Menyederhanakan pemahaman dan pengarahan dari metadata bagi pengembang

dan pengguna akhir.

• Memberikan banyak pilihan terhadap alat untuk mengakses front end data.

2.1.9.2 Tabel Fakta dan Tabel Dimensi

Terdapat dua tipe tabel dalam skema bintang yaitu tabel fakta dan tabel dimensi.

Tabel fakta seringkali disebut sebagai tabel mayor, terdiri dari data kuantitatif atau data

fakta mengenai bisnis, informasi yang di-query. Informasi ini sering diukur secara

27

numerik dan dapat mengandung banyak kolom dan jutaan baris. Tabel dimensi

seringkali disebut sebagai tabel minor karena lebih kecil dan menunjang data deskriptif

yang mencerminkan dimensi bisnis.

Contoh tabel fakta dalam database penjualan berisi pendapatan penjualan produk

untuk setiap konsumen, di setiap daerah pemasaran, dalam suatu periode waktu tertentu.

2.1.9.3 Ketentuan pembacaan Skema Bintang

Adapun ketentuan dalam pembacaan skema bintang adalah sebagai berikut :

• bagian yang ada di bawah judul tabel adalah kolom-kolom dari tabel.

• Primary key dan foreign key diberi kotak

• Primary key diarsir, sedangkan foreign key yang bukan primary key tidak diarsir

• Foreign key yang berhubungan ditunjukan dengan garis yang menghubungkan

tabel.

• Kolom yang bukan kunci disebut kolom data pada tabel fakta dan atribut tabel

dimensi.

2.1.9.4 Jenis-jenis Skema Bintang

Dalam penggunaannya terdapat dua buah jenis skema bintang yang tergantung

dengan kebutuhan, yaitu Skema Bintang Sederhana dan Skema Bintang Majemuk yang

akan dirinci lebih lanjut berikut ini.

o Skema Bintang Sederhana

Dalam skema bintang sederhana, setiap tabel harus mempunyai primary

key yang dapat terdiri dari sebuah kolom atau lebih. Primary key tersebut

28

membuat setiap baris menjadi unik. Dalam skema bintang sederhana, primary

key pada tabel fakta terdiri dari satu atau lebih foreign key. Foreign key adalah

sebuah kolom pada sebuah tabel yang nilainya didefinisikan oleh primary key di

tabel yang lain. Ketika database dibuat, perintah-perintah SQL digunakan untuk

membuat tabel yang akan merancang kolom-kolom, yang nantinya akan

membentuk primary key dan foreign key.

Tabel utama memiliki primay key yang terdiri dari tiga foreign key yaitu

kunci 1, kunci 2, dan kunci 3, yang masing-masing merupakan primary key di

tabel dimensi-masing-masing. Di sini terjadi hubungan many to one antara

foreign key pada tabel fakta dengan primary key pada tabel dimensi.

Tabel Dimensi 1 Tabel FaktaKunci 1 Kunci 1Atribut Kunci 2 Tabel Dimensi 3Atribut Tabel Dimensi 2 Kunci 3 Kunci 3

… Kunci 2 Kolom Data AtributAtribut Atribut Kolom Data Atribut

Atribut … …… Kolom Data Atribut

Atribut

Gambar 2.8 Hubungan antara tabel dimensi pada Skema Bintang Sederhana

(Sumber : Poe, Building a Data Warehouse for Decision Support,1998, p192)

Alasan memilih skema bintang sederhana antara lain:

1. Struktur rancangannya yang sederhana mudah dimengerti end-user.

2. Menyediakan response times yang lebih baik.

29

Gambar 2.9 Skema Bintang dengan lebih dari Satu Tabel Fakta

(Sumber : Poe, Building a Data Warehouse for Decision Support,1998, p194)

Pada gambar 2.9 terlihat bahwa dua tabel fakta dan tiga tabel dimensi. Di

sini hubungan many to one antara foreign key pada kedua fakta tersebut dengan

primary key pada masing-masing tabel dimensi.

Penggunaan lain dari tabel fakta adalah untuk mendefinisikan hubungan

many to many antara berbagai tabel dimensi yang sudah jelas dalam bisnis. Jenis

skema bintang ini sering disebut tabel asosiasi. Tabel ini dibuat untuk

menyelaraskan hubungan many to many di antara dimensi yang berbeda. Dalam

gambar 2.10 yang berfungsi sebagai penyelaras adalah tabel fakta 2.

30

Gambar 2.10 Skema Bintang sebagai Tabel Asosiasi

(Sumber: Poe, Building a Data Warehouse for Decision Support, 1998, p 195)

Tabel dimensi mungkin mengandung foreign key yang merefensikan

primary key di tabel dimensi lain. Tabel dimensi yang direferensikan ini disebut

outboard table atau secondary dimension table. Pada gambar 2.11 akan terlihat

Tabel Dimensi 3 mempunyai dua buah outboard table yaitu Tabel Dimensi 4 dan

Tabel Dimensi 5.

Gambar 2.11 Skema Bintang dengan outboard table atau secondary dimension table

(Sumber: Poe, Building a Data Warehouse for Decision Support, 1998, p197)

31

Salah satu variasi yang ada pada skema bintang adalah menyimpan

seluruh informasi tabel dimensi dalam bentuk normal ke tiga. Sementara fakta

tetap dalam keadaan semula. Hal ini biasanya disebut dengan Skema Snowflake

yang ditunjukkan pada gambar 2.12. Ciri-ciri Snowflake adalah:

o Tidak ada level di tabel dimensi.

o Tabel dimensi dinormalisasi dengan dekomposisi pada level atribut.

o Setiap dimensi mempunyai satu key untuk setiap level pada hirarki dimensi.

o Kunci level terendah menghubungkan tabel dimensi dengan tabel fakta dan

tabel atribut berlevel terendah.

Gambar 2.12 Skema Bintang Snowflake

(Sumber: Poe, Building a Data Warehouse for Decision Support, 1998, p198)

o Skema Bintang Majemuk

Pada sebuah skema bintang sederhana, primary key yang ada pada tabel

fakta dibentuk dengan menggabungkan kolom-kolom foreign key. Dalam

beberapa aplikasi, foreign key yang akan digabungkan tersebut kadang-kadang

32

tidak menyediakan suatu identifikasi yang unik terhadap setiap baris yang ada

pada tabel fakta. Oleh karena itu diperlukan sebuah skema bintang majemuk.

Di dalam skema bintang majemuk, tabel fakta memiliki dua kumpulan

foreign key, yang satu mengandung suatu referensi dengan tabel dimensi, dan

yang lain adalah primay key yang merupakan gabungan dari satu atau lebih

kolom yang menghasilkan suatu identifikasi unik untuk setiap barisnya. Primay

key dan foreign key saling tidak identik di dalam skema bintang majemuk, yang

membedakannya dengan skema bintang sederhana. Skema bintang majemuk

dapat dilihat pada gambar 2.13.

Gambar 2.13 Skema Bintang Majemuk

(Sumber: Poe, Building a Data Warehouse for Decision Support,1998, p 199)

2.1.9.5 Granularitas

Granularitas adalah level detail dalam data warehouse dan salah satu prinsip

dalam mendesain data warehouse. Granularitas data yang tinggi menyediakan sejumlah

besar informasi yang detail dan volume data yang besar pula. Granularitas data yang

rendah menyediakan data yang kurang detail, lebih pada level ringkasan data dan

33

volume data yang lebih kecil (Poe, Building a Data Warehouse for Decision Support,

1998, p26).

2.1.9.6 Drill Down dan Rolling Up

Melihat data dari sudut pandang yang berbeda dapat memberikan jawaban yang

diperlukan. Konsep Drill Down dan Rolling Up membuat pengguna dapat menganalisa

data melalui sudut pandang atau level yang ber beda. Drill Down adalah suatu cara

untuk melihat data dari level yang tinggi melalui dimensi yang berbeda ke level yang

lebih detail dari suatu data. Rolling Up adalah suatu cara untuk melihat data dari level

yang detail ke level yang lebih tinggi atau ringkasan (Poe, Building a Data Warehouse

for Decision Support, 1998, p203).

2.1.10 Agregasi

Agregasi adalah proses perhitungan data fakta terhadap atribut-atribut yang telah

didefinisikan. Sebagai contoh dapat dibuat ringkasan dari jumlah penjualan barang

berdasarkan wilayah dan jenis produk dengan menghitung nilai penjualan dari data

transaksi yang terjadi. Agregasi dapat dibuat selama proses transformasi dan

pengambilan data dalam data warehouse. Faktor yang mendorong pembuatan Agregasi

adalah (Poe, Building a Data Warehouse for Decision Support,1998, p204):

1. Peningkatan performance pencarian.

2. Pengurangan jumlah dari penggunaan CPU cycles.

Suatu agregasi yang baik dapat dibuat untuk digunakan oleh tiga ratus pemakai

dalam satu hari, karena akan lebih bermanfaat jika dibandingkan dengan membuat

34

agregasi yang membutuhkan waktu dua jam tetapi hanya digunakan sekali dalam

setahun oleh satu pemakai saja.

Salah satu teknik yang harus dicatat adalah saat permulaan data warehouse, kita

tetap membutuhkan teknik database klasik seperti tabel secara fisik. Hal ini menjadi

penting bilamana data warehouse mencapai ukuran besar.

2.1.11 Denormalisasi

Denormalisasi adalah suatu proses yang merubah bentuk normalisasi dari

database dengan cara penggabungan tabel dan merupakan sebuah proses yang secara

sengaja dilakukan dengan melanggar peraturan bentuk normal dari normalisasi dengan

tujuan untuk meningkatkan kinerja pengaksesan data yang ada.

Alasan utama untuk melakukan hal ini (Poe, Building a Data Warehouse for

Decision Support,1998, p207):

1. Untuk mengurangi jumlah hubungan yang terjadi antar tabel-tabel yang harus

mengalami proses pada waktu dilakukan pencarian. Dengan inilah performance

database dapat ditingkatkan.

2. Untuk membuat struktur fisik dari database yang semakin mendekati model

dimensi dari pemakai. Membuat struktur tabel sesuai dengan yang ingin

ditanyakan oleh pemakai, memungkinkan terjadinya akses langsung, yang sekali

lagi akan meningkatkan performance.

Kelemahan dalam proses denormalisasi adalah :

1. Proses denormalisasi secara tidak langsung akan membuat redundansi data.

35

2. Proses denormalisasi memerlukan alokasi memory dan storage (tempat

penyimpanan) yang besar.

2.1.12 CSF ( Critical Success Factor )

Menurut McLeod (Management Information Systems 9th,2004, p109) CSF

merupakan salah satu bentuk dari aktifitas perusahaan yang mempunyai pengaruh kuat

terhadap kemampuan perusahaan. Dalam mencapai tujuannya. Biasanya suatu

perusahaan mempunyai beberapa CSF. CSF hampir sama dengan management by

exception, yaitu hanya memperhatikan sebagian dari operasional perusahaan saja, bukan

seluruhnya. Perbedaannya, CSF relatif lebih stabil, dalam arti faktor-faktornya dapat

berubah namun dalam jangka waktu yang agak lama. Ada tiga hal yang harus

diperhatikan dalam CSF, yaitu :

• Informasi yang bersifat kritis

Adalah informasi yang berhubungan dengan CSF, informasi ini dapat diperoleh

dari data internal

• Asumsi kritis

Merupakan asumsi yang digunakan untuk mengetahui sejauh mana tujuan dan CSF

suatu perusahaan berkembang atau tercapai. Asumsi yang diberikan dapat berubah

berdasarkan kondisi atau keadaan tertentu.

• Keputusan kritis

Adalah keputusan yang bersifat kritis didalam menjalankan suatu perusahaan.

Kebanyakan dari keputusan kritis ini digunakan sebagai dasar untuk membangun

suatu sistem pendukung keputusan.

36

2.1.13 Analisis SWOT

Analisis SWOT (Strengths, Weaknesses, Opportunities and Threats) menurut

http://www.stfrancis.edu/ba/ghkickul/stuwebs/btopics/works/swot.htm, “SWOT analysis

is an important step in planning and its value is often underestimated despite the

simplicity in creation”, dengan kata lain analisis SWOT merupakan langkah penting

dalam perencanaan dan nilainya sering kali tidak diperkirakan. Menurut

http://www.mindtools.com/pages/article/newTMC_05.htm, “SWOT Analysis is an

effective way of identifying your Strengths and Weaknesses, and of examining the

Opportunities and Threats you face”, dengan kata lain analisis SWOT merupakan

sebuah langkah efektif dalam mengidentifikasikan Kekuatan dan Kelemahan (Strengths

and Weaknesses), dan mempelajari Peluang dan Ancaman (Opportunities and Threats).

Analisis SWOT yang merupakan langkah penting dalam menjalankan strategi

bisnis terdiri dari :

• Strengths

Melakukan analisis kekuatan yang ada pada perusahaan dengan cara

mengidentifikasikan kekuatan-kekuatan atau kelebihan yang dimiliki perusahaan.

• Weaknesses

Melakukan analisis terhadap kelemahan yang ada pada perusahaan dengan cara

mengidentifikasi kelemahan yang dimiliki, apa yang harus diperbaiki, dan apa

yang harus dihindari.

• Opportunities

Melakukan analisis terhadap peluang yang dapat dimanfaatkan dari situasi pasar.

• Threats

37

Melakukan analisis terhadap ancaman yang mungkin dapat mempengaruhi kinerja

perusahaan, seperti kompetitor, kemajuan teknologi, atau pun kelemahan yang

dimiliki menjadi hambatan besar.

2.2 Teori Khusus

2.2.1 Pengertian Manajemen Pendidikan

Menurut Kamus Besar Bahasa Indonesia (2002, p476) manajemen adalah

penggunaan sumber daya secara efektif untuk mencapai sasaran. Pendidikan adalah

pengajaran keahlian khusus, dan juga sesuatu yang tidak dapat dilihat tetapi lebih

mendalam yaitu pemberian pengetahuan, pertimbangan dan kebijaksanaan. Menurut Cut

Zahri Harun dalam situs resmi Departemen Pendidikan Nasional Indonesia, manajemen

pendidikan adalah suatu ilmu yang mempelajari bagaimana menata sumber daya, baik

SDM maupun sumber daya lain untuk mencapai tujuan pendidikan.

2.2.2 Pengertian Perguruan Tinggi, Fakultas dan Jurusan

Menurut Kamus Besar Bahasa Indonesia (2002), perguruan tinggi yang terdiri

atas sejumlah fakultas yang menyelenggarakan pendidikan ilmiah dan atau professional

dalam sejumlah disiplin ilmu tertentu. Fakultas merupakan bagian perguruan tinggi

tempat mempelajari suatu bidang ilmu yang terdiri atas beberapa jurusan. Jurusan

merupakan bagian dari suatu fakultas atau sekolah tinggi yang bertanggung jawab untuk

mengelola dan mengembangkan suatu bidang studi.

38

2.2.3 Pengertian Dosen

Menurut Kamus Besar Bahasa Indonesia (2002), Dosen merupakan tenaga

pengajar yang ada pada perguruan tinggi.

2.2.4 Mahasiswa

Menurut Kamus Besar Bahasa Indonesia (2002), Mahasiswa merupakan orang

yang belajar di perguruan tinggi. Jenjang ini merupakan lanjutan dari Sekolah Menengah

Tingkat Atas.

2.2.5 Ilmu Komputer

Menurut Kamus Besar Bahasa Indonesia (2002), Komputer adalah alat

elektronik otomatis yang dapat menghitung atau mengolah data secara cermat menurut

yang diinstruksikan, dan memberikan hasil pengolahan, serta dapat menjalankan sistem

multimedia (film, musik, televisi, faksimile, dsb.), biasanya terdiri atas unit pemasukan,

unit pengeluaran, unit penyimpanan, serta unit pengontrolan. Sedangkan ilmu komputer

adalah pengetahuan tentang bidang komputer yang disusun secara bersistem menurut

metode tertentu.

2.2.6 Teknik Informatika

Menurut Kamus Besar Bahasa Indonesia (2002), Teknik Informatika adalah ilmu

tentang klasifikasi, penyimpanan, pengeluaran dan penyebaran pengetahuan yang

direkam yaitu hal-hal yang berkaitan dengan informasi

BAB 2 LANDASAN TEORI -...

Documents

Transcript of BAB 2 LANDASAN TEORI -...