BAB 2 LANDASAN TEORI 2.1. Teori Umum 2.1.1. Pengertian...

8

BAB 2

LANDASAN TEORI

2.1. Teori Umum

2.1.1. Pengertian Data

Menurut Frost, Day dan Slyke (2006, p6), secara tradisional data

adalah nilai yang disimpan ke dalam database.

Menurut Indrajani (2009, p2), data adalah fakta atau observasi

mentah yang biasanya mengenai fenomena bisnis atau transaksi bisnis.

Lebih khusus lagi, data adalah ukuran objektif dari atribut (karakteristik)

dari entitas seperti orang, tempat, benda atau kejadian.

2.1.2. Database dan DBMS (Database Management Sistem)

2.1.2.1. Pengertian Database

Menurut Connolly dan Begg (2010,p65), database

adalah kumpulan data secara logis terkait, dan deskripsi dari

data ini, didesain untuk memenuhi kebutuhan informasi

sebuah organisasi. Database adalah tunggal, tempat

penyimpanan data yang besar yang dapat digunakan secara

bersama-sama oleh banyak departemen dan pengguna.

9

Menurut Frost, Day dan Slyke (2006, p6), database

adalah sekumpulan data yang digunakan oleh sebuah sistem.

2.1.2.2. Pengertian DBMS (Database Management System)

Menurut Connolly dan Begg (2010, p66), database

management system adalah sebuah sistem software yang

memungkinkan pengguna untuk mendefinisikan, membuat,

memelihara, dan mengontrol akses ke database.

Menurut Frost, Day dan Slyke (2006, p6), database

management system adalah sekumpulan program yang

membantu menyimpan, mengatur dan menggunakan

sekumpulan data, tanpa memperhatikan form. Secara formal,

database management sistem adalah software yang membuat,

mengatur dan menggunakan database.

2.1.2.3. Keuntungan DBMS (Database Management System)

Keuntungan DBMS yang diuraikan Connolly dan Beg

(2010, p77) :

1. Mengontrol pengulangan data

2. Data yang konsisten

3. Dapat memperoleh informasi yang lebih banyak dari

jumlah data yang sama.

4. Pemakaian data secara bersama-sama

10

5. Meningkatkan integritas data

6. Meningkatkan keamanan

7. Penetapan standarisasi

8. Perbandingan skala ekonomi

9. Menyeimbangi konflik kebutuhan

10. Meningkatkan akses dan respon dari data

11. Meningkatkan produktifitas

12. Meningkatkan pemeliharaan data melalui data independen

13. Meningkatkan konkurensi

14. Meningkatkan layanan backup dan recovery

Menurut William dan Sawyer (2007, p422) ,

keuntungan dari DBMS adalah :

1. Pengulangan data berkurang

Pengulangan data atau repetisi, berarti bahwa field

data yang sama muncul berkali-kali dalam file yang

berbeda dan terkadang format yang berbeda. Dalam sistem

pemrosesan yang lama, file-file yang berbeda akan

mengulang data yang sama sehingga memboroskan ruang

penyimpanan. Dalam DBMS, informasi hanya muncul

sekali, karena itulah kapasitas penyimpanan banyak

tersisa.

11

2. Integritas data meningkat

Integritas data berarti data itu akurat, konsisten,

dan terbaru. Dalam sistem lama, ketika ada perubahan

dalam suatu file, perubahan ini tidak perlu dibuat dalam

file lain. Akibatnya, beberapa laporan memiliki informasi

yang tidak akurat. Dalam DBMS, berkurangnya

pengulangan berarti meningkatkan kesempatan integritas

data, kesempatan bahwa data akurat, konsisten dan terbaru

karena semua perubahan hanya dilakukan di satu tempat.

Selain itu, banyak DBMS menyediakan sistem cek

bawaan yang membantu memastikan akurasi data yang

dimasukkan. Ungkapan GIGO (garbage in garbage out)

menunjukkan bahwa sebuah database dengan data yang

tidak benar akan menghasilkan informasi yang tidak benar

juga.

3. Keamanan meningkat.

Walaupun berbagai departemen bisa berbagi akses

data, namun akses ke informasi bisa dibatasi hanya untuk

pengguna tertentu.

12

4. Kemudahan memelihara data.

DBMS menawarkan prosedur standar untuk

menambahkan, mengedit dan menghapus rekaman juga

untuk memvalidasi pemeriksaan untuk memastikan bahwa

data yang tepat sudah dimasukkan dengan benar dan

lengkap ke dalam masing-masing jenis field.

Utilitas backup data membantu memastikan

tersedianya data jika terjadi kegagalan sistem primer.

2.1.2.4. Kekurangan DBMS (Database Management System)

Kekurangan dari Database Management System

(DBMS) menurut Connolly dan Beg (2010, p80):

1. Kompleksitas

2. Ukuran yang besar karena kompleksitas yang terjadi

3. Biaya DBMS yang beragam tergantung pada lingkungan

dan fungsi yang disediakan

4. Tambahan biaya untuk hardware

5. Biaya konversi yang dibutuhkan untuk penggunaan

DBMS yang baru

6. Performa kinerja menurun

7. Tingkat kegagalan yang lebih besar

13

2.1.2.5. Fasilitas DBMS (Database Management System)

Menurut Conolly dan Begg (2010,p66), fasilitas-

fasilitas yang disediakan oleh DBMS adalah :

a. DDL (Data Definition Language) adalah suatu bahasa

yang memperbolehkan DBA (Database Administrator)

ataupun user untuk menentukan tipe, struktur, dan batasan

keamanan data yang akan disimpan pada database.

b. DML (Data Manipulation Language) adalah suatu bahasa

yang memiliki fasilitas untuk mengoperasikan data yang

ada dalam database. Misalnya insert, edit, delete, dan

update.

c. SQL (Structured Query Language) adalah suatu bahasa

yang memberikan layanan akses terhadap data. Contoh

dari layanan akses yang diberikan adalah :

- Sistem keamanan, yang mencegah pengguna yang tidak

memiliki hak untuk mengakses database;

- Sistem integritas, yang mempertahankan konsistensi

data yang tersimpan;

- Sistem kontrol konkurensi, yang memungkinkan untuk

mengakses database secara bersama-sama.

14

2.1.3. ERD (Entity Relationship Diagram)

2.1.3.1. Pengertian ERD

Menurut Frost, Day dan Slyke (2006, p17), entity

relationship diagram adalah sebuah model visual dari berbagi

entitas dan hubungannya. Sebuah diagram yang terdiri dari

entitas, hubungan antar entitas dan batasan kardinalitas.

2.1.3.2. Entitas

Menurut Frost, Day dan Slyke (2006, p16), entitas

adalah kata benda, mereka adalah orang, tempat atau benda

yang menjadi objek di dunia , sebagai contoh pegawai,

pesanan atau buku).

Menurut Conolly dan Begg (2010,p372), entitas

adalah sekelompok objek dengan properti yang sama, yang

diidentifikasi oleh perusahaan.

Gambar 2.1 di bawah menjelaskan contoh diagram

untuk entitas dengan nama Staff dan Branch. Dimana bentuk

gambar untuk menyatakan entitas adalah persegi dan nama

entitas diletakkan didalam entitas.

15

Gambar 2.1 Diagram untuk Tipe Entitas Staff dan Branch (Connolly dan Begg, 2010, p374)

2.1.3.3. Relationship

Menurut Frost, Day dan Slyke (2006, p16),

relationship adalah kata kerja , mereka menunjukkan aksi atau

kepunyaan, sebagai contoh pelanggan memberikan pesanan,

pegawai memiliki kewajiban, dokter mengobati pasien dan

pasien mengunjungi beberapa dokter. Jadi, relationship

adalah hubungan secara logis antara banyak record yang

berasal dari dua atau lebih tabel.

Menurut Connolly dan Begg (2010, p374),

relationship adalah sekumpulan hubungan antara satu atau

lebih entitas yang memiliki arti.

Gambar 2.2 di bawah menjelaskan contoh diagram

untuk entitas dengan nama Staff dan Branch. Dimana bentuk

gambar untuk menyatakan entitas adalah persegi dan nama

entitas diletakkan didalam entitas. Dan hubungan antara Staff

16

dan Branch adalah ‘memiliki’ dengan panah yang menunjuk

pada Staff yang artinya Branch memiliki Staff.

Gambar 2.2 Diagram Untuk Tipe Relationship Branch Memiliki Staff (Connolly dan Begg, 2010, p376)

2.1.3.4. Keys

Menurut Indrajani (2009, p154), jenis-jenis key adalah

sebagai berikut :

1. Candidate key adalah jumlah minimal atribut-atribut yang

dapat mengidentifikasikan setiap kejadian atau record

secara unik.

2. Primary key adalah candidate key yang dipilih untuk

mengidentifikasikan setiap kejadian atau record dari suatu

entitas secara unik.

3. Composite key adalah candidate key yang terdiri atas dua

atau lebih atribut.

17

2.1.3.5. Cardinality

Menurut Frost, Day dan Slyke (2006, p20), cardinality

adalah istilah teknis yang digunakan untuk mendefinisikan

banyak record dalam relationship.

Cardinality pada umumnya ditunjukkan dalam bentuk

one-to-many, walupun ada juga desain yang menggunakan

kardinalitas one-to-one dan many-to-many.

Menurut Connolly dan Begg (2010, p390), cardinality

mengidentifikasi nilai maksimum relationship yang mungkin

terjadi antara entity yang terlibat dalam tipe relationship yang

ada.

Berikut adalah simbol-simbol notasi cardinalitas :

Interpretasi

kardinalitas

Minim

um

Maksim

um Notasi Grafis

Tepat satu

(Satu dan

hanya satu)

1 1 atau

Nol atau satu 0 1

18

Satu atau

lebih 1

Banyak

(>1)

Nol, satu atau

lebih 0

Banyak

(>1)

Lebih dari

satu

Banya

k

(>1)

Banyak

(>1)

Tabel 2.1 Notasi Kardinalitas

2.1.4. DFD (Data Flow Diagram)

Menurut Whitten, Bentley, dan Dittman (2004, p357), data flow

diagram adalah sebuah sarana yang menggambarkan aliran data dan

proses kerja data yang terjadi pada sistem.

Untuk merancang data flow diagram kita dapat menggunakan

simbol-simbol yang dikutip oleh Whitten, Bentley, dan Dittman menurut

DeMarco dan Gene dan Sarson adalah sebagai berikut :

DeMarco Yourdan Gene dan Sarson

Proses

19

Data Store

Source/Sink

Data flow

Tabel 2.2 Perbandingan Simbol Diagram Aliran Data

2.1.5. OLTP (Online Transaction Processing)

Menurut Connolly dan Begg (2010, p1199), OLTP adalah sebuah

sistem yang dirancang untuk memproses transaksi dalam jumlah yang

besar, berulang, dan mengalamani perubahan secara intensif setiap

waktunya. Data di dalam OLTP diatur sesuai transaksi terkait dengan

aplikasi bisnis dan mendukung keputusan sejumlah pengguna operasional

bersamaan setiap hari.

2.1.6. Data Warehouse

2.1.6.1. Pengertian Data Warehouse

Menurut Connolly dan Begg (2010, p321), data

warehouse adalah sebuah kumpulan data yang bersifat

subject-oriented, time-varriant, dan non-volatile dalam rangka

mendukung proses pengambilan keputusan manajemen.

20

2.1.6.2. OLAP (Online Analytical Processing)

Menurut Connolly dan Begg (2010, p1250), OLAP

adalah perpaduan dinamis, analisis, dan konsolidasi volume

data multidimensional yang besar. Dalam Codde et al., OLAP

merupakan istilah yang menggambarkan teknologi view

multidimensional kumpulan data yang menyediakan akses

yang cepat pada informasi strategis untuk tujuan anlisis lebih

lanjut. OLAP memungkinkan pengguna untuk lebih mengerti

dan mengetahui bermacam-macam aspek data perusahaan

melalui akses yang cepat, konsisten, dan interaktif pada

bermacam-macam kemungkinan view data.

2.1.6.3. Perbandingan Sistem OLTP dengan Sistem Data

Warehouse

Menurut Connolly dan Begg (2010, p1199), secara

umum perbedaan data warehouse dan OLTP adalah

Karakteristik OLTP Data Warehouse

Tujuan utama Mendukung proses

operasional

Mendukung proses

analisis

Umur data Saat ini

Dahulu (tapi juga

termasuk data saat

ini)

21

Data laten Real-time

Tergantung dari

panjangnya siklus

tambahan data ke

data warehouse

(tapi juga termasuk

data tambahan yang

real-time)

Data

glanularitas Data detail

Data detail, data

ringkas yang tinggi

dan sedikit

Pemrosesan

data

Pola dari

pemasukan,pengha

pusan dan queries

data yang dapat

diprediksi.

Transaksi tingkat

tinggi

Pola dari proses

query data kurang

bisa diprediksi.

Transaksi tingkat

sedang sampai

rendah

Reporting

Dapat diprediksi,

satu dimensi,

reporting yang

tetap, statis dan

relatif

Tidak dapat

diprediksi,

multidimensi,

reporting dinamis

22

Pengguna

Melayani

pengguna

operasional dalam

jumlah banyak

Melayani pengguna

manajerial dalam

jumlah sedikit (tapi

juga mendukung

kebutuhan analisis

bagi pengguna

operasional)

Tabel 2.3 Perbandingan Sistem OLTP Dengan Sistem Data Warehouse

2.1.6.4. Karakteristik Data warehouse

Menurut Inmon (2005, p29), karakteristik data

warehouse, yaitu:

1. Berpusat pada subjek

Data warehouse lebih diorganisasikan pada

subjek-subjek utama dari perusahaan (seperti pelanggan,

produk, penjualan) dibandingkan pada area aplikasi utama

(seperti faktur pelanggan, kontrol stok, dan penjualan

produk). Hal ini mencerminkan kebutuhan untuk

menyimpan data pendukung keputusan dibandingkan data

berorientasi aplikasi.

23

Gambar 2.3 Contoh Data Berorientasi Subjek (Inmon, 2005, p30)

2. Terintegrasi

Data warehouse terintegrasi dikarenakan oleh

penggabungan sumber-sumber data dari beberapa sistem

aplikasi yang berbeda-beda. Sumber data sering tidak

konsisten misalnya pada format data yang berbeda.

Sumber data yang terintegrasi harus dibuat konsisten

untuk menampilkan data yang menyatukan pandangan

user.

24

Gambar 2.4 Contoh Data Terintegrasi (Inmon, 2005, p31)

3. Rentang Waktu

Rentang waktu karena data warehouse hanya

akurat dan valid pada suatu waktu tertentu. Perbedaan

waktu pada data warehouse juga dtunjukkan pada saat

yang bersamaan pada saat data dijalankan.

Gambar 2.5 Contoh Rentang Waktu (Inmon, 2005, p32)

25

4. Tidak berubah

Data tidak berubah pada saat itu juga tetapi

diperbaharui dari sistem operasional pada basis umum.

Data baru selalu ditambahkan sebagai suatu suplemen ke

database, daripada sebagai pengganti. Database terus

menerus menyerap data baru, meningkatkan integrasinya

dengan data sebelumnya.

Gambar 2.6 Contoh data tidak berubah (Inmon, 2005, p32)

2.1.6.5. Keuntungan Data warehouse

Keuntungan data warehouse menurut Connolly dan

Beg ( 2010, p1198) :

1. Tingkat pengembalian modal tinggi

2. Keuntungan yang kompetitif

3. Meningkatkan produktifitas dari para pembuat keputusan.

26

2.1.6.6. Struktur Data warehouse

Data warehouse memiliki struktur yang spesifik serta

perbedaan tingkatan summary dan detail datanya, dan juga

perbedaan tentang umur data di dalamnya.

Menurut Deliana, Cahya, dan Kaisariza (2009, p184),

lingkungan data warehouse dibagi menjadi beberapa

tingkatan detail. Tingkatan ini dikategorikan menjadi empat,

yaitu older detail level, current detail level, lightly

summarized data level, dan highly summarized data level.

Aliran data berawal dari lingkungan operasional ke dalam

data warehouse. Pada aliran data inilah proses transformasi

terjadi. Aliran data warehouse selanjutnya berada pada

tingkatan detail. Seiring berjalannya waktu , data dari current

detail level mengalir menuju older detail level. Apabila terjadi

summarize, maka data akan beralih dari current detail level

menuju lightly summarized data level yang kemudian akan

menuju highly summarized data level.

27

Gambar 2.7 Struktur Data Warehouse (Deliana, Cahya, dan Kaisariza ,2009, p183)

Komponen – komponen struktur data warehouse

sebagai berikut :

1. Current Detail Data

Data yang mencerminkan keadaan yang sedang berjalan

saat ini dan merupakan level terendah dari data warehouse.

Oleh karena itu, data di level ini belum efisien untuk

digunakan sekalipun datanya detail. Hal ini dikarenakan

proses analisis data menjadi rumit jika dilakukan dengan

data dalam jumlah besar. Biasanya current detail

memerlukan penyimpanan yang besar.

28

2. Old Detail Data

Data lama (histori) berupa hasil backup yang disimpan

dalam media penyimpanan yang terpisah, seperti tape atau

disk dengan frekuensi akses yang relatif rendah. File atau

direktori dari data ini disusun berdasarkan umur dari data

untuk mempermudah pencarian atau pengaksesan kembali.

3. Lightly Summarized Data

Data yang merupakan hasil ringkasan dari current detail

data, namun sifatnya belum merupakan ringkasan secara

total dan masih bersifat detail. Akses data ini biasanya

digunakan untuk view dari suatu kondisi yang sedang atau

sudah berjalan

4. Highly Summarized Data

Data hasil summary yang bersifat total dan mudah diakses.

Data di level ini dapat digunakan untuk mengambil

keputusan di tingkat eksekutif perusahaan karena dianggap

sudah representatif dan ringkas. Data ini mencerminkan

keseluruhan sehingga eksekutif tidak perlu membaca dan

menganalisis data dalam waktu yang lama. Selain itu,

untuk melakukan analisis perbandingan data berdasarkan

urutan waktu dan multidimensinya.

29

5. Metadata

Metadata adalah informasi yang ada di dalam data

warehouse yang mendeskripsikan mengenai struktur, isi,

kunci, indeks, dan hal lain mengenai data. Metadata

dipakai sebagai direktori bagi user dalam mencari data

yang dibutuhkan dalam data warehouse.

2.1.6.7. Arsitektur Data Warehouse

Gambaran arsitektur dan komponen utama data

warehouse menurut Anahory dan Murray (Connolly dan

Begg, 2005, p1203-p1206) :

Gambar 2.8 Arsitektur Data Warehouse (Connolly dan Begg, 2010, p1204)

30

Dengan detail keterangan sebagai berikut :

1. Data Operasional

Sumber data data warehouse berasal dari :

a. Data operasional mainframe dalam hirarki generasi

pertama dan jaringan database. Diperkirakan sebagian

besar data operasional berada dalam sistem ini.

b. Data departemen dalam sistem file, seperti VSAM,

RMS, dan DBMS relasional, seperti Informix dan

Oracle.

c. Data privat yang berada di workstation dan server

privat.

d. Sistem eksternal seperti internet, database yang

tersedia secara komersial, atau database yang

berhubungan dengan pemasok atau pelanggan

organisasi.

2. Operational Data Store

Operational Data Store (ODS) adalah gudang data

operasional sekarang dan terintegrasi yang digunakan

untuk analisis. Membangun ODS dapat membantu data

warehouse karena ODS dapat menyediakan data yang

telah diekstrasi dari source sistem dan dibersihkan. Hal ini

31

berarti pekerjaan yang tersisa untuk mengintegrasikan dan

merekstrusisasi data data warehouse disederhanakan.

3. ETL Manager

ETL Manager menampilkan semua operasi yang

berkaitan dengan ETL suatu data ke dalam data

warehouse. Data dapat diekstrak langsung dari sumber

data atau secara umum dari penyimpanan data operasional.

4. Warehouse Manager

Operasi yang dilakukan oleh warehouse manager

meliputi:

a. Analisis data untuk memastikan konsistensi.

b. Transformasi dan penggabungan sumber data dari

penyimpanan sementara ke tabel data warehouse.

c. Pembuatan indeks dan viewbase table.

d. Generasi denormalisasi (jika perlu).

e. Generasi agregasi (jika perlu).

f. Back up dan pengarsipan data.

Pada beberapa kasus, warehouse manager juga

menghasilkan profil query untuk menentukan indeks dan

agregasi yang tepat. Profil query dapat dihasilkan untuk

setiap pengguna, kelompok pengguna, atau data

32

warehouse dan berdasarkan pada informasi yang

mendeskripsikan karakteristik query, seperti frekuensi,

tabel target, dan ukuran result set.

5. Query Manager

Query Manager menampilkan semua operasi yang

berkaitan dengan pengaturan user queries. Kompleksitas

dari query manager ditentukan dari fasilitas yang

disediakan oleh end-user access tools dan database.

Operasi ditampilkan oleh komponen ini termasuk

queries yang mengarahkan ke table sebenarnya dan

melakukan schedule dari eksekusi queries.

6. Detail Data

Area warehouse ini menyimpan semua detail data

dalam skema database. Pada kebanyakan kasus, detail

data tidak disimpan online, tapi dibuat tersedia dengan

mengagregasikan data ke tingkat berikutnya. Akan tetapi,

secara rutin, detail data dimasukkan ke warehouse untuk

menambah agregat data.

33

7. Lightly and Highly Summarized Data

Area warehouse ini bersifat sementara karena akan

berubah secara terus menerus sebagai respon perubahan

profil query. Tujuan ringkasan informasi yaitu

mempercepat kinerja query. Walaupun ada peningkatan

biaya operasional yang berhubungan dengan ringkasan

awal data, hal ini juga diimbangi dengan penghilangan

kebutuhan untuk melakukan operasi summary terus

menerus (seperti sorting atau grouping) dalam menjawab

permintaan pengguna. Ringkasan data terus diperbarui

ketika ada data baru masuk ke warehouse.

8. Pengarsipan atau Back Up Data

Area warehouse menyimpan detail dan ringkasan

data untuk pengarsipan dan back up. Walaupun ringkasan

data dihasilkan dari detail data, mungkin perlu untuk back

up ringkasan data online jika data tersebut disimpan di luar

waktu penyimpanan detail data. Data ditransfer ke arsip

penyimpanan, seperti pita magnetik atau disk optik.

34

9. Metadata

Struktur metadata berbeda antara tiap proses

karena tujuannya berbeda. Hal ini berarti beberapa salinan

metadata mendeskripsikan item data yang sama di data

warehouse.

10. End-User Access Tools

Tujuan utama dari data warehouse adalah untuk

memberikan informasi kepada business user untuk

mengambil keputusan strategis. User berinteraksi dengan

data warehouse menggunakan end-user access tools. Data

warehouse harus secara efisien mendukung ad hoc dan

analisis rutin. Kinerja tinggi dicapai dengan pra

perencanaan persyaratan untuk join, summation, dan

laporan periodik oleh end user.

Walaupun definisi dari end-user access tools

tumpang tindih , end-user access tools dikategorikan

menjadi empat kelompok utama, yaitu :

a. Reporting dan query tools.

b. Application development tools.

c. Online Analytical Processing (OLAP) tools.

d. Data mining tools.

35

2.1.6.8. Aliran Data dalam Data Warehouse

Menurut Hackatorn (Connolly dan Begg, 2005, p1161-

p1162), aliran data warehouse berfokus pada manajemen lima

data flow primer, yaitu :

1. Inflow : Ekstrak, penghapusan, dan loading sumber data.

2. Upflow : Menambahkan nilai pada data di data warehouse

melalui ringkasan, packaging, dan distribusi data.

3. Downflow : Pengarsipan dan back up data di data

warehouse.

4. Outflow : Membuat data tersedia untuk pengguna akhir.

5. Metaflow : Mengatur metadata.

Gambar 2.9 Aliran Informasi Data Warehouse (Connolly dan Begg, 2005, p1162)

36

2.1.6.9. Surrogate Key

Menurut Imhoff, Galemmo, dan Geiger (2003, p149),

surrogate key adalah nilai pengganti. Biasanya merupakan

nilai numerik acak yang diberikan oleh proses load atau

sistem database. Keuntungannya yaitu dapat terstruktur

sehingga selalu unik di rentang integrasi untuk data

warehouse.

2.1.6.10. Bentuk Data Warehouse

Menurut Deliana, Cahya, dan Kaisariza (2009,

p185), bentuk data warehouse yaitu :

1. Functional Data Warehouse (Data Warehouse

Fungsional)

Data warehouse ini dibuat berdasarkan fungsi

yang berada di dalam perusahaan. Kata operasional disini

merupakan basis data yang diperoleh dari kegiatan sehari-

hari. Data Warehouse dibuat lebih dari satu dan

dikelompokkan berdasarkan fungsi-fungsi yang ada di

dalam perusahaan seperti fungsi keuangan (financial),

marketing, personalia, dan lain-lain.

Keuntungan membangun data warehouse dengan

bentuk seperti ini adalah sistem mudah dibangun dan

biaya relative murah, sedangkan kerugiannya adalah

37

resiko dalam konsistensi data dan terbatasnya kemampuan

dalam pengumpulan data bagi pengguna.

Gambar 2.10 Data Warehouse Fungsional (Deliana, Cahya, dan Kaisariza, 2009, p185)

2. Centralized Data Warehouse (Data Warehouse

Terpusat)

Sekilas bentuknya menyerupai functional data

warehouse namun dalam centralized data warehouse

data dikumpulkan terlebih dahulu dalam satu tempat

terpusat, setelah itu data-datanya dipisahkan berdasakan

fungsi-fungsi yang dibutuhkan oleh perusahaan.

Keuntungan menggunakan bentuk ini adalah

tingkat konsistensi data yang tinggi karena data yang ada

di dalamnya benar-benar terpadu, sedangkan kerugiannya

38

adalah biaya yang mahal serta memerlukan waktu yang

cukup lama untuk membangunnya.

Gambar 2.11 Data Warehouse Terpusat (Deliana, Cahya, dan Kaisariza, 2009, p186)

3. Distributed Data Warehouse (Data Warehouse

Terdistribusi)

Distributed data warehouse merupakan gateway yang

berfungsi sebagai jembatan atau penghubung antara source

(lokasi data dari data warehouse) dengan workstation yang

menggunakan sistem yang beraneka ragam dan berbeda,

sehingga memungkinkan bagi pengguna untuk dapat

mengakses sumber data yang berada di luar lokasi perusahaan.

Keuntungan distributed data warehouse adalah

memungkinkan adanya pengaksesan data dari luar perusahaan,

karena sebelumnya telah dilakukan sinkronisasi terlebih

dahulu pada data-data yang ada di dalamnya agar konsistensi

39

data tetap terjaga. Kerugiannya adalah harga serta sistem

pembuatan data dari data warehouse bentuk ini yang paling

mahal serta paling kompleks apabila dibandingkan dengan

bentuk-bentuk data warehouse yang lainnya.

Gambar 2.12 Data Warehouse Terdistribusi (Deliana, Cahya, dan Kaisariza, 2009, p187)

2.1.7. Tabel Fakta

Menurut Deliana, Cahya, dan Kaisariza (2009, p188), tabel fakta

merupakan tabel yang pada umumnya mengandung angka dan data

history dimana key (kunci) yang dihasilkan sangat unik karena key-nya

merupakan kumpulan foreign key dari primary key yang ada pada

masing-masing tabel dimensi yang berhubungan.

2.1.8. Tabel Dimensi

Menurut Deliana, Cahya, dan Kaisariza (2009, p188), tabel

dimensi adalah tabel yang berisikan kategori dengan ringkasan data detail

yang dapat dilaporkan, seperti laporan keuntungan pada tabel fakta yang

40

dilaporkan sebagai dimensi waktu (berupa per bulan, per kuartal dan per

tahun).

2.1.9. Cube

Menurut Jensen, Pedersen, dan Thomsen (2010, p7), cube adalah

struktur data multidimensional untuk menangkap dan menganalisis data.

Walaupun istilah “cube” memberikan kesan terdiri dari tiga dimensi,

cube dapat terdiri dari beberapa dimensi. Untuk alasan itu, istilah

hypercube digunakan sebagai pengganti istilah cube. Kumpulan cube

yang berkaitan biasanya disebut database multidimensional atau data

warehouse multidimensional.

2.1.10. Dimensionality Modeling

Menurut Connolly dan Begg (2010, p1227), dimensionality

modeling adalah teknik perancangan logikal yang bertujuan untuk

mewakili data dalam sebuah standar, bentuk intuitif yang memungkinkan

untuk akses dengan kinerja yang tinggi. Dimensionality modelling

menggunakan konsep Entity Relationship (ER) modeling dengan

beberapa batasan penting. Setiap model dimensi tersusun dari satu tabel

dengan sebuah composite primary key, yang disebut tabel fakta, dan

kumpulan tabel yang lebih kecil yaitu tabel dimensi. Setiap tabel dimensi

memiliki sebuah primary key yang berhubungan dengan satu komponen

composite key di tabel fakta. Fitur lain yang penting pada model dimensi

41

yaitu semua natural key digantikan dengan surrogate key. Hal ini berarti

setiap penggabungan antara tabel fakta dan dimensi berdasarkan pada

surrogate key, bukan natural key. Surrogate key digunakan untuk

mengizinkan data di data warehouse tidak bergantung dari data yang

digunakan dan dihasilkan oleh sistem OLTP.

2.1.11. Star Schema

Menurut Connolly dan Begg (2010, p1227-1229) star schema

adalah struktur logika yang di tengahnya merupakan tabel fakta yang

berisi data faktual yang dikelilingi tabel dimensi yang berisi data

referensi (yang bisa didenormalisasi). Sangat penting untuk membuat

tabel fakta sebagai data read-only yang tidak berubah dari waktu ke

waktu. Fakta yang paling berguna dalam tabel fakta adalah numerik dan

aditif karena aplikasi data warehouse hampir tidak pernah mengakses

single record dibandingkan ratusan, ribuan, bahkan jutaan record pada

suatu waktu dan hal yang paling berguna dilakukan dengan banyak

record adalah dengan menyatukannya. Tabel dimensi, sebaliknya

umumnya berisi informasi tekstual deskriptif. Atribut dimensi digunakan

sebagai pembatas dalam query data warehouse. Star schema dapat

digunakan untuk mempercepat kinerja query dengan denormalisasi

informasi reference ke dalam satu tabel dimensi.

42

Gambar 2.13 Star Schema (Connolly dan Begg, 2010, p1228)

2.1.12. ETL (Extract Transform Load)

Menurut Connolly dan Begg (2010, p1208-1209) Extract

Transform Load adalah proses pencarian data, mengintegrasikannya, dan

menempatkannya dalam data warehouse.

Extract

Tujuan dari proses ekstrak adalah untuk mencapai sumber sistem

dan mengumpulkan data yang diperlukan untuk data warehouse.

Biasanya data dikonsolidasi dari sumber sistem yang berbeda yang

43

mungkin menggunakan data organisasi atau format yang berbeda

sehingga ekstraksi harus mengubah data menjadi format yang sesuai

untuk pemrosesan transformasi. Kompleksitas ekstraksi dapat bervariasi

dan tergantung pada tipe sumber data. Proses ekstraksi juga mencakup

seleksi data sebagai sumber yang biasanya berisi data redundansi atau

data yang kurang penting.

Agar ekstraksi ETL sukses, dibutuhkan pemahaman tentang data

layout. Tool ETL yang baik juga memungkinkan penyimpanan data versi

intermediate diekstrak. Hal ini disebut “staging area” dan memungkin

reload data mentah pada kasus masalah loading lebih lanjut, tanpa re-

ekstraksi. Data mentah juga harus di-backup dan diarsipkan.

Transform

Tahap transformasi pada proses ETL mencakup aplikasi dari

rangkaian aturan atau fungsi untuk data diekstraksi. Hal ini mencakup

validasi record dan penolakannnya jika tidak diterima sebagai bagian dari

integrasi. Jumlah manipulasi yang dibutuhkan untuk proses transformasi

tergantung pada data. Sumber data yang baik akan membutuhkan sedikit

transformasi, sementara yang lain mungkin membutuhkan satu atau lebih

teknik transformasi untuk memenuhi persyaratan bisnis dan teknis dari

target database atau data warehouse. Proses yang paling umum

digunakan untuk transformasi adalah konversi, menghilangkan duplikasi,

standarisasi, menyaring, mengurutkan, menerjemahan dan mencari atau

44

memverifikasi jika sumber data tidak konsisten. Tool ETL yang baik

harus memungkinkan membangun proses yang kompleks dan

memperluas tool library sehingga fungsi custom user dapat ditambahkan.

Load

Loading adalah tahap terakhir proses ETL dan load data yang

diekstrak dan ditransformasi menjadi target repository. Ada beberapa

cara ETL load data. Beberapa di antaranya, menambahkan tiap record

secara fisik sebagai baris baru ke dalam tabel target data warehouse yang

melibatkan SQL insert statement build-in, sedangkan yang lain

menghubungkan proses ekstraksi, transformasi, dan loading dengan tiap

record dari sumber. (http://www.etltools.org/)

2.1.13. Data mart

Menurut Connolly dan Begg (2002, p1171-p1173), data mart

adalah bagian dari data warehouse yang mendukung kebutuhan

departemen atau fungsi bisnis tertentu.

Data mart dapat berdiri sendiri atau dihubungkan secara terpusat

dengan data warehouse perusahaan. Karakteristik yang membedakan

data mart dan data warehouse adalah :

• Data mart hanya berfokus pada kebutuhan user yang berhubungan

dengan satu departemen atau fungsi bisnis.

45

• Data mart biasanya tidak berisi data operasional, tidak seperti data

warehouse.

• Karena data mart berisi data yang lebih sedikit dibandingkan dengan

data warehouse, data mart lebih mudah dimengerti dan dinavigasi.

Ada beberapa pendekatan dalam membangun data mart.

Pendekatan yang pertama yaitu membangun beberapa data mart

kemudian mengintegrasikannya pada data warehouse. Pendekatan yang

lain yaitu membangun infrastruktur untuk data warehouse perusahaan

dan membangun satu atau lebih data mart untuk memenuhi segera

kebutuhan perusahaan pada saat yang bersamaan.

Alasan perlu dibuat data mart, yaitu:

• Untuk memberikan pengguna akses pada data yang sering mereka

butuhkan untuk analisis.

• Untuk menyediakan data dalam bentuk yang sesuai dengan

pandangan data bersama oleh sekelompok pengguna pada suatu

departemen atau fungsi bisnis.

• Meningkatkan waktu respon pengguna karena pengurangan volume

data yang diakses.

• Menyediakan data terstruktur sesuai kebutuhan access tool pengguna

akhir, seperti online anlytical processing (OLAP) dan data mining

tools yang membutuhkan struktur database internalnya.

46

• Data mart biasanya menggunakan data yang sedikit sehingga tugas

seperti membersihkan data, loading, transformasi, dan integrasi jauh

lebih mudah. Oleh karena itu, implementasi dan pengaturan data mart

lebih sederhana daripada membangun data warehouse perusahaan.

• Biaya implementasi data mart biasanya lebih sedikit daripada

membangun data warehouse.

• Pengguna data mart yang potensial lebih jelas dan lebih mudah

ditargetkan untuk memperoleh dukungan untuk proyek data mart

dibandingkan dengan proyek data warehouse perusahaan.

2.1.14. Metodologi Perancangan Database untuk Data Warehouse

Menurut Kimball (Connolly dan Begg, 2010, p1231-1238),

metodologi perancangan database untuk data warehouse, yaitu:

1. Memilih proses

Proses (fungsi) yang mengacu pada subjek data mart tertentu.

Data mart yang pertama kali dibangun seharusnya yang pertama kali

dikirim tepat waktu, dalam anggaran, dan untuk menjawab

pertanyaan-pertanyaan bisnis yang paling penting secara komersial.

2. Memilih grain

Memilih grain berarti memutuskan apa yang diwakili record

tabel fakta. Dimensi dari tabel fakta baru bisa diidentifikasi hanya jika

grain untuk tabel fakta telah dipilih. Keputusan grain untuk tabel

fakta juga menentukan grain untuk setiap tabel dimensi.

47

3. Mengidentifikasi dan menyesuaikan dimensi

Dimensi menetapkan konteks untuk mengajukan pertanyaan

tentang fakta di tabel fakta. Serangkaian dimensi yang dibangun

dengan baik membuat data mart lebih mudah dimengerti dan

digunakan. Jika ada dimensi pada dua data mart, dimensi tersebut

harus sama, atau salah satunya merupakan bagian matematis dari

yang lain.

4. Memilih fakta

Grain dari tabel fakta menentukan fakta mana yang digunakan

di data mart. Semua fakta harus diekspresikan pada tingkat yang

disiratkan oleh grain. Selain itu, fakta harus numerik dan aditif.

5. Menyimpan pra kalkulasi di tabel fakta

Setelah fakta telah dipilih, setiap fakta harus diperiksa kembali

untuk menentukan apakah ada peluang untuk menggunakan pra

kalkulasi. Contoh umum kebutuhan menyimpan pra kalkulasi terjadi

ketika fakta terdiri dari pernyataan laba rugi.

6. Menyempurnakan tabel dimensi

Pada tahap ini kembali ke tabel dimensi dan tambahkan

deskripsi teks pada dimensi. Deskripsi teks harus intuitif dan

dimengerti oleh pengguna. Kegunaan data mart ditentukan oleh ruang

lingkup dan sifat atribut dari tabel dimensi.

48

7. Memilih durasi database

Di banyak perusahaan ada kebutuhan untuk melihat periode

waktu yang sama satu atau dua tahun sebelumnya. Tabel fakta yang

sangat besar menimbulkan setidaknya dua masalah besar pada

rancangan data warehouse. Pertama, semakin tua data, semakin besar

kemungkinan munculnya masalah dalam membaca dan

menginterpretasikan file atau tape lama. Kedua, wajib menggunakan

versi lama dimensi yang penting, bukan versi terbaru.

8. Melacak perubahan dimensi secara perlahan

Ada tiga tipe perubahan dimensi secara perlahan: Tipe

pertama, dimana atribut dimensi yang berubah ditimpa; Tipe kedua

dimana atribut dimensi yang berubah menyebabkan record dimensi

baru dibuat; Tipe ketiga, di mana atribut dimensi yang berubah

menyebabkan atribut alternatif dibuat sehingga nilai atribut yang lama

dan baru dapat diakses secara bersamaan pada record dimensi yang

sama.

9. Menentukan prioritas dan mode query

Pada tahap ini pertimbangkan masalah rancangan fisik.

Masalah rancangan fisik yang paling penting yang mempengaruh

persepsi data mart pengguna akhir yaitu urutan tabel fakta pada

disk dan adanya pre-stored summaries atau aggregations. Di luar

masalah-masalah tersebut, ada beberapa masalah isu yang

49

mempengaruhi masalah administrasi, backup, kinerja pengindeksan,

dan keamanan.

2.1.15. LAN (Local Area Network)

Menurut Williams dan Sawyer yang diterjemahkan oleh Rahayu,

N.W. dan Prabawati, T.A. (2007, p321), LAN menghubungkan komputer

dan peranti dalam cakupan geografis yang terbatas, misalnya pada satu

kantor, satu gedung, atau kumpulan gedung yang berdekatan.

2.1.16. Server


N.W. dan Prabawati, T.A. (2007, p23), server adalah komputer sentral

yang menangani kumpulan data (database) dan program untuk

menghubungkan dan member layanan ke PC / workstation dan alat-alat

yang disebut komputer client.

2.1.17. Client


N.W. dan Prabawati, T.A. (2007, p109), client adalah komputer yang

meminta data atau layanan.

50

2.2. Teori Khusus

2.2.1. Yellow Pages

Yellow Pages adalah media informasi dalam bentuk direktori

produk dan jasa disusun menurut abjad berdasarkan kelas bisnis. PIB

(Petunjuk Informasi Bisnis) Yellow Pages dapat menjadi media promosi

yang tepat dan efektif bagi orang-orang bisnis dengan distribusi yang luas

mampu menjangkau seluruh pelosok negeri. Semua informasi dalam PIB

Yellow Pages dapat diperoleh melalui berbagai multi akses, yaitu:

1. E-book dapat diakses melalui www.yellowpages.co.id

2. CD ROM E-book Yellow Pages

3. Layanan pelanggan - 5000 57

4. My Mobile Directory – 8108

5. Akses informasi 108: Ketik * 108 # tekan OK (khusus Telkomsel)

6. Aplikasi Mobile Yellow Pages, dapat di-download secara gratis

melalui Blackberry di http:/ / odp.yellowpages.co.id

Sebagai media promosi yang efektif, Yellow Pages memiliki

manfaat sebagai berikut :

• Multi-akses

• Ekonomis

• Efektif

• Target yang sesuai sasaran

(http://www.infomedianusantara.com/dmrc.asp?r=1&loc=Id)

51

2.2.2. Pemasaran

Menurut Kotler dan Keller ( 2006, p5-p6 ), pemasaran berhubungan dengan

identifikasi dan mempertemukan manusia dengan kebutuhan sosial. Salah satu

definisi singkat pemasaran yaitu “memenuhi kebutuhan yang menguntungkan”.

Definisi formal marketing menurut Asosiasi Marketing Amerika adalah : Suatu

fungsi organisasi dan kumpulan proses dalam pembentukan, komunikasi, dan

membawakan hasil kepada pelanggan dan untuk mengatur hubungan pelanggan

dengan cara yang menguntungkan organisasi dan pemengang saham perusahaan.

2.2.3. Oracle Warehouse Builder 10g

Menurut Oracle Team (2009, p1-1, p1-2), Oracle Warehouse Builder

(OWB) merupakan tool tunggal yang komprehensif untuk seluruh aspek

manajemen data. OWB menjembatani database Oracle untuk mengubah data

menjadi informasi dengan kualitas yang tinggi. OWB menyediakan manajemen

kualitas data, audit data, permodelan relasional dan dimensional yang terintegrasi

penuh serta daur hidup manajamen data dan metadata yang lengkap. OWB

memungkinkan user untuk membuat data warehouse, memindahkan data dari

sistem terdahulu, mengkonsolidasi data dari sumber data yang terpisah,

membersihkan dan mengubah data untuk menyediakan informasi berkualitas dan

mengatur metadata perusahaan.

52

Untuk mengubah kualitas data yang rendah menjadi informasi yang

berkualitas tinggi diperlukan :

• Akses ke dalam beragam sumber data

OWB menjembatani database Oracle untuk membuat koneksi yang

transparan ke banyak database third-party, aplikasi, file dan data store.

• Kemampuan untuk mem-profile, mengubah dan membersihkan data

OWB menyediakan library transformasi data yang luas untuk tipe

data seperti text, numeric, date, dan lainnya. Sebelum dimuat ke dalam

penyimpanan data yang baru, dapat dilakukan profiling terhadap data untuk

mengevaluasi kualitas dan kelayakannya. Berikutnya, dapat dilakukan

matchmerge terhadap record menggunakan rule yang direncanakan.

• Kemampuan untuk mengimplementasi desain untuk berbagai aplikasi

Dengan menggunakan OWB, user dapat mendesain dan

mengimplementasikan penyimpanan data apapun yang diperlukan oleh

aplikasi, baik relasional maupun dimensional.

• Menelusuri jejak audit (audit trails)

Setelah mengkonsolidasi data dari berbagai sumber ke dalam

penyimpanan data tunggal, tantangan yang akan ditemui adalah untuk

membuktikan validitas dari informasi output. Sebagai contoh, dapatkah dicari

dan dibuktikan bagaimana angka ini dihasilkan? Ini merupakan pertanyaan

yang seringkali ditanyakan para pembuat keputusan dan oleh petugas

pemerintah.

53

Fungsi utama dari OWB adalah penggabungan sumber data yang

beragam dalam pembuatan Data Warehouse dan migrasi data dari sistem

sebelumnya. Lebih jauh lagi, OWB menawarkan kemampuan untuk

permodelan data relasional, dimensional dan metadata, data profiling, data

cleansing dan data auditing.

2.2.4. PHP

PHP merupakan bahasa script open source yang banyak digunakan dan

sangat cocok digunakan untuk pengembangan web dan dapat dilekatkan dengan

HTML. Kode PHP menggunakan instruksi <?php pada awal pemrosesan dan ?>

pada akhir pemrosesan yang memungkinkan untuk masuk dan keluar dari mode

PHP. PHP berbeda dari Java Script karena kode dieksekusi pada server,

menghasilkan HTML yang dikirimkan ke client. Client akan menerima hasilnya

tanpa mengetahui kode yang mendasarinya. (http://php.net/manual/en/intro-

whatis.php)

BAB 2 LANDASAN TEORI 2.1. Teori Umum 2.1.1. Pengertian...

Documents

Transcript of BAB 2 LANDASAN TEORI 2.1. Teori Umum 2.1.1. Pengertian...