BAB 2 LANDASAN TEORI 2.1. Teori Umum 2.1.1. Pengertian...
Transcript of BAB 2 LANDASAN TEORI 2.1. Teori Umum 2.1.1. Pengertian...
8
BAB 2
LANDASAN TEORI
2.1. Teori Umum
2.1.1. Pengertian Data
Menurut Frost, Day dan Slyke (2006, p6), secara tradisional data
adalah nilai yang disimpan ke dalam database.
Menurut Indrajani (2009, p2), data adalah fakta atau observasi
mentah yang biasanya mengenai fenomena bisnis atau transaksi bisnis.
Lebih khusus lagi, data adalah ukuran objektif dari atribut (karakteristik)
dari entitas seperti orang, tempat, benda atau kejadian.
2.1.2. Database dan DBMS (Database Management Sistem)
2.1.2.1. Pengertian Database
Menurut Connolly dan Begg (2010,p65), database
adalah kumpulan data secara logis terkait, dan deskripsi dari
data ini, didesain untuk memenuhi kebutuhan informasi
sebuah organisasi. Database adalah tunggal, tempat
penyimpanan data yang besar yang dapat digunakan secara
bersama-sama oleh banyak departemen dan pengguna.
9
Menurut Frost, Day dan Slyke (2006, p6), database
adalah sekumpulan data yang digunakan oleh sebuah sistem.
2.1.2.2. Pengertian DBMS (Database Management System)
Menurut Connolly dan Begg (2010, p66), database
management system adalah sebuah sistem software yang
memungkinkan pengguna untuk mendefinisikan, membuat,
memelihara, dan mengontrol akses ke database.
Menurut Frost, Day dan Slyke (2006, p6), database
management system adalah sekumpulan program yang
membantu menyimpan, mengatur dan menggunakan
sekumpulan data, tanpa memperhatikan form. Secara formal,
database management sistem adalah software yang membuat,
mengatur dan menggunakan database.
2.1.2.3. Keuntungan DBMS (Database Management System)
Keuntungan DBMS yang diuraikan Connolly dan Beg
(2010, p77) :
1. Mengontrol pengulangan data
2. Data yang konsisten
3. Dapat memperoleh informasi yang lebih banyak dari
jumlah data yang sama.
4. Pemakaian data secara bersama-sama
10
5. Meningkatkan integritas data
6. Meningkatkan keamanan
7. Penetapan standarisasi
8. Perbandingan skala ekonomi
9. Menyeimbangi konflik kebutuhan
10. Meningkatkan akses dan respon dari data
11. Meningkatkan produktifitas
12. Meningkatkan pemeliharaan data melalui data independen
13. Meningkatkan konkurensi
14. Meningkatkan layanan backup dan recovery
Menurut William dan Sawyer (2007, p422) ,
keuntungan dari DBMS adalah :
1. Pengulangan data berkurang
Pengulangan data atau repetisi, berarti bahwa field
data yang sama muncul berkali-kali dalam file yang
berbeda dan terkadang format yang berbeda. Dalam sistem
pemrosesan yang lama, file-file yang berbeda akan
mengulang data yang sama sehingga memboroskan ruang
penyimpanan. Dalam DBMS, informasi hanya muncul
sekali, karena itulah kapasitas penyimpanan banyak
tersisa.
11
2. Integritas data meningkat
Integritas data berarti data itu akurat, konsisten,
dan terbaru. Dalam sistem lama, ketika ada perubahan
dalam suatu file, perubahan ini tidak perlu dibuat dalam
file lain. Akibatnya, beberapa laporan memiliki informasi
yang tidak akurat. Dalam DBMS, berkurangnya
pengulangan berarti meningkatkan kesempatan integritas
data, kesempatan bahwa data akurat, konsisten dan terbaru
karena semua perubahan hanya dilakukan di satu tempat.
Selain itu, banyak DBMS menyediakan sistem cek
bawaan yang membantu memastikan akurasi data yang
dimasukkan. Ungkapan GIGO (garbage in garbage out)
menunjukkan bahwa sebuah database dengan data yang
tidak benar akan menghasilkan informasi yang tidak benar
juga.
3. Keamanan meningkat.
Walaupun berbagai departemen bisa berbagi akses
data, namun akses ke informasi bisa dibatasi hanya untuk
pengguna tertentu.
12
4. Kemudahan memelihara data.
DBMS menawarkan prosedur standar untuk
menambahkan, mengedit dan menghapus rekaman juga
untuk memvalidasi pemeriksaan untuk memastikan bahwa
data yang tepat sudah dimasukkan dengan benar dan
lengkap ke dalam masing-masing jenis field.
Utilitas backup data membantu memastikan
tersedianya data jika terjadi kegagalan sistem primer.
2.1.2.4. Kekurangan DBMS (Database Management System)
Kekurangan dari Database Management System
(DBMS) menurut Connolly dan Beg (2010, p80):
1. Kompleksitas
2. Ukuran yang besar karena kompleksitas yang terjadi
3. Biaya DBMS yang beragam tergantung pada lingkungan
dan fungsi yang disediakan
4. Tambahan biaya untuk hardware
5. Biaya konversi yang dibutuhkan untuk penggunaan
DBMS yang baru
6. Performa kinerja menurun
7. Tingkat kegagalan yang lebih besar
13
2.1.2.5. Fasilitas DBMS (Database Management System)
Menurut Conolly dan Begg (2010,p66), fasilitas-
fasilitas yang disediakan oleh DBMS adalah :
a. DDL (Data Definition Language) adalah suatu bahasa
yang memperbolehkan DBA (Database Administrator)
ataupun user untuk menentukan tipe, struktur, dan batasan
keamanan data yang akan disimpan pada database.
b. DML (Data Manipulation Language) adalah suatu bahasa
yang memiliki fasilitas untuk mengoperasikan data yang
ada dalam database. Misalnya insert, edit, delete, dan
update.
c. SQL (Structured Query Language) adalah suatu bahasa
yang memberikan layanan akses terhadap data. Contoh
dari layanan akses yang diberikan adalah :
- Sistem keamanan, yang mencegah pengguna yang tidak
memiliki hak untuk mengakses database;
- Sistem integritas, yang mempertahankan konsistensi
data yang tersimpan;
- Sistem kontrol konkurensi, yang memungkinkan untuk
mengakses database secara bersama-sama.
14
2.1.3. ERD (Entity Relationship Diagram)
2.1.3.1. Pengertian ERD
Menurut Frost, Day dan Slyke (2006, p17), entity
relationship diagram adalah sebuah model visual dari berbagi
entitas dan hubungannya. Sebuah diagram yang terdiri dari
entitas, hubungan antar entitas dan batasan kardinalitas.
2.1.3.2. Entitas
Menurut Frost, Day dan Slyke (2006, p16), entitas
adalah kata benda, mereka adalah orang, tempat atau benda
yang menjadi objek di dunia , sebagai contoh pegawai,
pesanan atau buku).
Menurut Conolly dan Begg (2010,p372), entitas
adalah sekelompok objek dengan properti yang sama, yang
diidentifikasi oleh perusahaan.
Gambar 2.1 di bawah menjelaskan contoh diagram
untuk entitas dengan nama Staff dan Branch. Dimana bentuk
gambar untuk menyatakan entitas adalah persegi dan nama
entitas diletakkan didalam entitas.
15
Gambar 2.1 Diagram untuk Tipe Entitas Staff dan Branch (Connolly dan Begg, 2010, p374)
2.1.3.3. Relationship
Menurut Frost, Day dan Slyke (2006, p16),
relationship adalah kata kerja , mereka menunjukkan aksi atau
kepunyaan, sebagai contoh pelanggan memberikan pesanan,
pegawai memiliki kewajiban, dokter mengobati pasien dan
pasien mengunjungi beberapa dokter. Jadi, relationship
adalah hubungan secara logis antara banyak record yang
berasal dari dua atau lebih tabel.
Menurut Connolly dan Begg (2010, p374),
relationship adalah sekumpulan hubungan antara satu atau
lebih entitas yang memiliki arti.
Gambar 2.2 di bawah menjelaskan contoh diagram
untuk entitas dengan nama Staff dan Branch. Dimana bentuk
gambar untuk menyatakan entitas adalah persegi dan nama
entitas diletakkan didalam entitas. Dan hubungan antara Staff
16
dan Branch adalah ‘memiliki’ dengan panah yang menunjuk
pada Staff yang artinya Branch memiliki Staff.
Gambar 2.2 Diagram Untuk Tipe Relationship Branch Memiliki Staff (Connolly dan Begg, 2010, p376)
2.1.3.4. Keys
Menurut Indrajani (2009, p154), jenis-jenis key adalah
sebagai berikut :
1. Candidate key adalah jumlah minimal atribut-atribut yang
dapat mengidentifikasikan setiap kejadian atau record
secara unik.
2. Primary key adalah candidate key yang dipilih untuk
mengidentifikasikan setiap kejadian atau record dari suatu
entitas secara unik.
3. Composite key adalah candidate key yang terdiri atas dua
atau lebih atribut.
17
2.1.3.5. Cardinality
Menurut Frost, Day dan Slyke (2006, p20), cardinality
adalah istilah teknis yang digunakan untuk mendefinisikan
banyak record dalam relationship.
Cardinality pada umumnya ditunjukkan dalam bentuk
one-to-many, walupun ada juga desain yang menggunakan
kardinalitas one-to-one dan many-to-many.
Menurut Connolly dan Begg (2010, p390), cardinality
mengidentifikasi nilai maksimum relationship yang mungkin
terjadi antara entity yang terlibat dalam tipe relationship yang
ada.
Berikut adalah simbol-simbol notasi cardinalitas :
Interpretasi
kardinalitas
Minim
um
Maksim
um Notasi Grafis
Tepat satu
(Satu dan
hanya satu)
1 1 atau
Nol atau satu 0 1
18
Satu atau
lebih 1
Banyak
(>1)
Nol, satu atau
lebih 0
Banyak
(>1)
Lebih dari
satu
Banya
k
(>1)
Banyak
(>1)
Tabel 2.1 Notasi Kardinalitas
2.1.4. DFD (Data Flow Diagram)
Menurut Whitten, Bentley, dan Dittman (2004, p357), data flow
diagram adalah sebuah sarana yang menggambarkan aliran data dan
proses kerja data yang terjadi pada sistem.
Untuk merancang data flow diagram kita dapat menggunakan
simbol-simbol yang dikutip oleh Whitten, Bentley, dan Dittman menurut
DeMarco dan Gene dan Sarson adalah sebagai berikut :
DeMarco Yourdan Gene dan Sarson
Proses
19
Data Store
Source/Sink
Data flow
Tabel 2.2 Perbandingan Simbol Diagram Aliran Data
2.1.5. OLTP (Online Transaction Processing)
Menurut Connolly dan Begg (2010, p1199), OLTP adalah sebuah
sistem yang dirancang untuk memproses transaksi dalam jumlah yang
besar, berulang, dan mengalamani perubahan secara intensif setiap
waktunya. Data di dalam OLTP diatur sesuai transaksi terkait dengan
aplikasi bisnis dan mendukung keputusan sejumlah pengguna operasional
bersamaan setiap hari.
2.1.6. Data Warehouse
2.1.6.1. Pengertian Data Warehouse
Menurut Connolly dan Begg (2010, p321), data
warehouse adalah sebuah kumpulan data yang bersifat
subject-oriented, time-varriant, dan non-volatile dalam rangka
mendukung proses pengambilan keputusan manajemen.
20
2.1.6.2. OLAP (Online Analytical Processing)
Menurut Connolly dan Begg (2010, p1250), OLAP
adalah perpaduan dinamis, analisis, dan konsolidasi volume
data multidimensional yang besar. Dalam Codde et al., OLAP
merupakan istilah yang menggambarkan teknologi view
multidimensional kumpulan data yang menyediakan akses
yang cepat pada informasi strategis untuk tujuan anlisis lebih
lanjut. OLAP memungkinkan pengguna untuk lebih mengerti
dan mengetahui bermacam-macam aspek data perusahaan
melalui akses yang cepat, konsisten, dan interaktif pada
bermacam-macam kemungkinan view data.
2.1.6.3. Perbandingan Sistem OLTP dengan Sistem Data
Warehouse
Menurut Connolly dan Begg (2010, p1199), secara
umum perbedaan data warehouse dan OLTP adalah
Karakteristik OLTP Data Warehouse
Tujuan utama Mendukung proses
operasional
Mendukung proses
analisis
Umur data Saat ini
Dahulu (tapi juga
termasuk data saat
ini)
21
Data laten Real-time
Tergantung dari
panjangnya siklus
tambahan data ke
data warehouse
(tapi juga termasuk
data tambahan yang
real-time)
Data
glanularitas Data detail
Data detail, data
ringkas yang tinggi
dan sedikit
Pemrosesan
data
Pola dari
pemasukan,pengha
pusan dan queries
data yang dapat
diprediksi.
Transaksi tingkat
tinggi
Pola dari proses
query data kurang
bisa diprediksi.
Transaksi tingkat
sedang sampai
rendah
Reporting
Dapat diprediksi,
satu dimensi,
reporting yang
tetap, statis dan
relatif
Tidak dapat
diprediksi,
multidimensi,
reporting dinamis
22
Pengguna
Melayani
pengguna
operasional dalam
jumlah banyak
Melayani pengguna
manajerial dalam
jumlah sedikit (tapi
juga mendukung
kebutuhan analisis
bagi pengguna
operasional)
Tabel 2.3 Perbandingan Sistem OLTP Dengan Sistem Data Warehouse
2.1.6.4. Karakteristik Data warehouse
Menurut Inmon (2005, p29), karakteristik data
warehouse, yaitu:
1. Berpusat pada subjek
Data warehouse lebih diorganisasikan pada
subjek-subjek utama dari perusahaan (seperti pelanggan,
produk, penjualan) dibandingkan pada area aplikasi utama
(seperti faktur pelanggan, kontrol stok, dan penjualan
produk). Hal ini mencerminkan kebutuhan untuk
menyimpan data pendukung keputusan dibandingkan data
berorientasi aplikasi.
23
Gambar 2.3 Contoh Data Berorientasi Subjek (Inmon, 2005, p30)
2. Terintegrasi
Data warehouse terintegrasi dikarenakan oleh
penggabungan sumber-sumber data dari beberapa sistem
aplikasi yang berbeda-beda. Sumber data sering tidak
konsisten misalnya pada format data yang berbeda.
Sumber data yang terintegrasi harus dibuat konsisten
untuk menampilkan data yang menyatukan pandangan
user.
24
Gambar 2.4 Contoh Data Terintegrasi (Inmon, 2005, p31)
3. Rentang Waktu
Rentang waktu karena data warehouse hanya
akurat dan valid pada suatu waktu tertentu. Perbedaan
waktu pada data warehouse juga dtunjukkan pada saat
yang bersamaan pada saat data dijalankan.
Gambar 2.5 Contoh Rentang Waktu (Inmon, 2005, p32)
25
4. Tidak berubah
Data tidak berubah pada saat itu juga tetapi
diperbaharui dari sistem operasional pada basis umum.
Data baru selalu ditambahkan sebagai suatu suplemen ke
database, daripada sebagai pengganti. Database terus
menerus menyerap data baru, meningkatkan integrasinya
dengan data sebelumnya.
Gambar 2.6 Contoh data tidak berubah (Inmon, 2005, p32)
2.1.6.5. Keuntungan Data warehouse
Keuntungan data warehouse menurut Connolly dan
Beg ( 2010, p1198) :
1. Tingkat pengembalian modal tinggi
2. Keuntungan yang kompetitif
3. Meningkatkan produktifitas dari para pembuat keputusan.
26
2.1.6.6. Struktur Data warehouse
Data warehouse memiliki struktur yang spesifik serta
perbedaan tingkatan summary dan detail datanya, dan juga
perbedaan tentang umur data di dalamnya.
Menurut Deliana, Cahya, dan Kaisariza (2009, p184),
lingkungan data warehouse dibagi menjadi beberapa
tingkatan detail. Tingkatan ini dikategorikan menjadi empat,
yaitu older detail level, current detail level, lightly
summarized data level, dan highly summarized data level.
Aliran data berawal dari lingkungan operasional ke dalam
data warehouse. Pada aliran data inilah proses transformasi
terjadi. Aliran data warehouse selanjutnya berada pada
tingkatan detail. Seiring berjalannya waktu , data dari current
detail level mengalir menuju older detail level. Apabila terjadi
summarize, maka data akan beralih dari current detail level
menuju lightly summarized data level yang kemudian akan
menuju highly summarized data level.
27
Gambar 2.7 Struktur Data Warehouse (Deliana, Cahya, dan Kaisariza ,2009, p183)
Komponen – komponen struktur data warehouse
sebagai berikut :
1. Current Detail Data
Data yang mencerminkan keadaan yang sedang berjalan
saat ini dan merupakan level terendah dari data warehouse.
Oleh karena itu, data di level ini belum efisien untuk
digunakan sekalipun datanya detail. Hal ini dikarenakan
proses analisis data menjadi rumit jika dilakukan dengan
data dalam jumlah besar. Biasanya current detail
memerlukan penyimpanan yang besar.
28
2. Old Detail Data
Data lama (histori) berupa hasil backup yang disimpan
dalam media penyimpanan yang terpisah, seperti tape atau
disk dengan frekuensi akses yang relatif rendah. File atau
direktori dari data ini disusun berdasarkan umur dari data
untuk mempermudah pencarian atau pengaksesan kembali.
3. Lightly Summarized Data
Data yang merupakan hasil ringkasan dari current detail
data, namun sifatnya belum merupakan ringkasan secara
total dan masih bersifat detail. Akses data ini biasanya
digunakan untuk view dari suatu kondisi yang sedang atau
sudah berjalan
4. Highly Summarized Data
Data hasil summary yang bersifat total dan mudah diakses.
Data di level ini dapat digunakan untuk mengambil
keputusan di tingkat eksekutif perusahaan karena dianggap
sudah representatif dan ringkas. Data ini mencerminkan
keseluruhan sehingga eksekutif tidak perlu membaca dan
menganalisis data dalam waktu yang lama. Selain itu,
untuk melakukan analisis perbandingan data berdasarkan
urutan waktu dan multidimensinya.
29
5. Metadata
Metadata adalah informasi yang ada di dalam data
warehouse yang mendeskripsikan mengenai struktur, isi,
kunci, indeks, dan hal lain mengenai data. Metadata
dipakai sebagai direktori bagi user dalam mencari data
yang dibutuhkan dalam data warehouse.
2.1.6.7. Arsitektur Data Warehouse
Gambaran arsitektur dan komponen utama data
warehouse menurut Anahory dan Murray (Connolly dan
Begg, 2005, p1203-p1206) :
Gambar 2.8 Arsitektur Data Warehouse (Connolly dan Begg, 2010, p1204)
30
Dengan detail keterangan sebagai berikut :
1. Data Operasional
Sumber data data warehouse berasal dari :
a. Data operasional mainframe dalam hirarki generasi
pertama dan jaringan database. Diperkirakan sebagian
besar data operasional berada dalam sistem ini.
b. Data departemen dalam sistem file, seperti VSAM,
RMS, dan DBMS relasional, seperti Informix dan
Oracle.
c. Data privat yang berada di workstation dan server
privat.
d. Sistem eksternal seperti internet, database yang
tersedia secara komersial, atau database yang
berhubungan dengan pemasok atau pelanggan
organisasi.
2. Operational Data Store
Operational Data Store (ODS) adalah gudang data
operasional sekarang dan terintegrasi yang digunakan
untuk analisis. Membangun ODS dapat membantu data
warehouse karena ODS dapat menyediakan data yang
telah diekstrasi dari source sistem dan dibersihkan. Hal ini
31
berarti pekerjaan yang tersisa untuk mengintegrasikan dan
merekstrusisasi data data warehouse disederhanakan.
3. ETL Manager
ETL Manager menampilkan semua operasi yang
berkaitan dengan ETL suatu data ke dalam data
warehouse. Data dapat diekstrak langsung dari sumber
data atau secara umum dari penyimpanan data operasional.
4. Warehouse Manager
Operasi yang dilakukan oleh warehouse manager
meliputi:
a. Analisis data untuk memastikan konsistensi.
b. Transformasi dan penggabungan sumber data dari
penyimpanan sementara ke tabel data warehouse.
c. Pembuatan indeks dan viewbase table.
d. Generasi denormalisasi (jika perlu).
e. Generasi agregasi (jika perlu).
f. Back up dan pengarsipan data.
Pada beberapa kasus, warehouse manager juga
menghasilkan profil query untuk menentukan indeks dan
agregasi yang tepat. Profil query dapat dihasilkan untuk
setiap pengguna, kelompok pengguna, atau data
32
warehouse dan berdasarkan pada informasi yang
mendeskripsikan karakteristik query, seperti frekuensi,
tabel target, dan ukuran result set.
5. Query Manager
Query Manager menampilkan semua operasi yang
berkaitan dengan pengaturan user queries. Kompleksitas
dari query manager ditentukan dari fasilitas yang
disediakan oleh end-user access tools dan database.
Operasi ditampilkan oleh komponen ini termasuk
queries yang mengarahkan ke table sebenarnya dan
melakukan schedule dari eksekusi queries.
6. Detail Data
Area warehouse ini menyimpan semua detail data
dalam skema database. Pada kebanyakan kasus, detail
data tidak disimpan online, tapi dibuat tersedia dengan
mengagregasikan data ke tingkat berikutnya. Akan tetapi,
secara rutin, detail data dimasukkan ke warehouse untuk
menambah agregat data.
33
7. Lightly and Highly Summarized Data
Area warehouse ini bersifat sementara karena akan
berubah secara terus menerus sebagai respon perubahan
profil query. Tujuan ringkasan informasi yaitu
mempercepat kinerja query. Walaupun ada peningkatan
biaya operasional yang berhubungan dengan ringkasan
awal data, hal ini juga diimbangi dengan penghilangan
kebutuhan untuk melakukan operasi summary terus
menerus (seperti sorting atau grouping) dalam menjawab
permintaan pengguna. Ringkasan data terus diperbarui
ketika ada data baru masuk ke warehouse.
8. Pengarsipan atau Back Up Data
Area warehouse menyimpan detail dan ringkasan
data untuk pengarsipan dan back up. Walaupun ringkasan
data dihasilkan dari detail data, mungkin perlu untuk back
up ringkasan data online jika data tersebut disimpan di luar
waktu penyimpanan detail data. Data ditransfer ke arsip
penyimpanan, seperti pita magnetik atau disk optik.
34
9. Metadata
Struktur metadata berbeda antara tiap proses
karena tujuannya berbeda. Hal ini berarti beberapa salinan
metadata mendeskripsikan item data yang sama di data
warehouse.
10. End-User Access Tools
Tujuan utama dari data warehouse adalah untuk
memberikan informasi kepada business user untuk
mengambil keputusan strategis. User berinteraksi dengan
data warehouse menggunakan end-user access tools. Data
warehouse harus secara efisien mendukung ad hoc dan
analisis rutin. Kinerja tinggi dicapai dengan pra
perencanaan persyaratan untuk join, summation, dan
laporan periodik oleh end user.
Walaupun definisi dari end-user access tools
tumpang tindih , end-user access tools dikategorikan
menjadi empat kelompok utama, yaitu :
a. Reporting dan query tools.
b. Application development tools.
c. Online Analytical Processing (OLAP) tools.
d. Data mining tools.
35
2.1.6.8. Aliran Data dalam Data Warehouse
Menurut Hackatorn (Connolly dan Begg, 2005, p1161-
p1162), aliran data warehouse berfokus pada manajemen lima
data flow primer, yaitu :
1. Inflow : Ekstrak, penghapusan, dan loading sumber data.
2. Upflow : Menambahkan nilai pada data di data warehouse
melalui ringkasan, packaging, dan distribusi data.
3. Downflow : Pengarsipan dan back up data di data
warehouse.
4. Outflow : Membuat data tersedia untuk pengguna akhir.
5. Metaflow : Mengatur metadata.
Gambar 2.9 Aliran Informasi Data Warehouse (Connolly dan Begg, 2005, p1162)
36
2.1.6.9. Surrogate Key
Menurut Imhoff, Galemmo, dan Geiger (2003, p149),
surrogate key adalah nilai pengganti. Biasanya merupakan
nilai numerik acak yang diberikan oleh proses load atau
sistem database. Keuntungannya yaitu dapat terstruktur
sehingga selalu unik di rentang integrasi untuk data
warehouse.
2.1.6.10. Bentuk Data Warehouse
Menurut Deliana, Cahya, dan Kaisariza (2009,
p185), bentuk data warehouse yaitu :
1. Functional Data Warehouse (Data Warehouse
Fungsional)
Data warehouse ini dibuat berdasarkan fungsi
yang berada di dalam perusahaan. Kata operasional disini
merupakan basis data yang diperoleh dari kegiatan sehari-
hari. Data Warehouse dibuat lebih dari satu dan
dikelompokkan berdasarkan fungsi-fungsi yang ada di
dalam perusahaan seperti fungsi keuangan (financial),
marketing, personalia, dan lain-lain.
Keuntungan membangun data warehouse dengan
bentuk seperti ini adalah sistem mudah dibangun dan
biaya relative murah, sedangkan kerugiannya adalah
37
resiko dalam konsistensi data dan terbatasnya kemampuan
dalam pengumpulan data bagi pengguna.
Gambar 2.10 Data Warehouse Fungsional (Deliana, Cahya, dan Kaisariza, 2009, p185)
2. Centralized Data Warehouse (Data Warehouse
Terpusat)
Sekilas bentuknya menyerupai functional data
warehouse namun dalam centralized data warehouse
data dikumpulkan terlebih dahulu dalam satu tempat
terpusat, setelah itu data-datanya dipisahkan berdasakan
fungsi-fungsi yang dibutuhkan oleh perusahaan.
Keuntungan menggunakan bentuk ini adalah
tingkat konsistensi data yang tinggi karena data yang ada
di dalamnya benar-benar terpadu, sedangkan kerugiannya
38
adalah biaya yang mahal serta memerlukan waktu yang
cukup lama untuk membangunnya.
Gambar 2.11 Data Warehouse Terpusat (Deliana, Cahya, dan Kaisariza, 2009, p186)
3. Distributed Data Warehouse (Data Warehouse
Terdistribusi)
Distributed data warehouse merupakan gateway yang
berfungsi sebagai jembatan atau penghubung antara source
(lokasi data dari data warehouse) dengan workstation yang
menggunakan sistem yang beraneka ragam dan berbeda,
sehingga memungkinkan bagi pengguna untuk dapat
mengakses sumber data yang berada di luar lokasi perusahaan.
Keuntungan distributed data warehouse adalah
memungkinkan adanya pengaksesan data dari luar perusahaan,
karena sebelumnya telah dilakukan sinkronisasi terlebih
dahulu pada data-data yang ada di dalamnya agar konsistensi
39
data tetap terjaga. Kerugiannya adalah harga serta sistem
pembuatan data dari data warehouse bentuk ini yang paling
mahal serta paling kompleks apabila dibandingkan dengan
bentuk-bentuk data warehouse yang lainnya.
Gambar 2.12 Data Warehouse Terdistribusi (Deliana, Cahya, dan Kaisariza, 2009, p187)
2.1.7. Tabel Fakta
Menurut Deliana, Cahya, dan Kaisariza (2009, p188), tabel fakta
merupakan tabel yang pada umumnya mengandung angka dan data
history dimana key (kunci) yang dihasilkan sangat unik karena key-nya
merupakan kumpulan foreign key dari primary key yang ada pada
masing-masing tabel dimensi yang berhubungan.
2.1.8. Tabel Dimensi
Menurut Deliana, Cahya, dan Kaisariza (2009, p188), tabel
dimensi adalah tabel yang berisikan kategori dengan ringkasan data detail
yang dapat dilaporkan, seperti laporan keuntungan pada tabel fakta yang
40
dilaporkan sebagai dimensi waktu (berupa per bulan, per kuartal dan per
tahun).
2.1.9. Cube
Menurut Jensen, Pedersen, dan Thomsen (2010, p7), cube adalah
struktur data multidimensional untuk menangkap dan menganalisis data.
Walaupun istilah “cube” memberikan kesan terdiri dari tiga dimensi,
cube dapat terdiri dari beberapa dimensi. Untuk alasan itu, istilah
hypercube digunakan sebagai pengganti istilah cube. Kumpulan cube
yang berkaitan biasanya disebut database multidimensional atau data
warehouse multidimensional.
2.1.10. Dimensionality Modeling
Menurut Connolly dan Begg (2010, p1227), dimensionality
modeling adalah teknik perancangan logikal yang bertujuan untuk
mewakili data dalam sebuah standar, bentuk intuitif yang memungkinkan
untuk akses dengan kinerja yang tinggi. Dimensionality modelling
menggunakan konsep Entity Relationship (ER) modeling dengan
beberapa batasan penting. Setiap model dimensi tersusun dari satu tabel
dengan sebuah composite primary key, yang disebut tabel fakta, dan
kumpulan tabel yang lebih kecil yaitu tabel dimensi. Setiap tabel dimensi
memiliki sebuah primary key yang berhubungan dengan satu komponen
composite key di tabel fakta. Fitur lain yang penting pada model dimensi
41
yaitu semua natural key digantikan dengan surrogate key. Hal ini berarti
setiap penggabungan antara tabel fakta dan dimensi berdasarkan pada
surrogate key, bukan natural key. Surrogate key digunakan untuk
mengizinkan data di data warehouse tidak bergantung dari data yang
digunakan dan dihasilkan oleh sistem OLTP.
2.1.11. Star Schema
Menurut Connolly dan Begg (2010, p1227-1229) star schema
adalah struktur logika yang di tengahnya merupakan tabel fakta yang
berisi data faktual yang dikelilingi tabel dimensi yang berisi data
referensi (yang bisa didenormalisasi). Sangat penting untuk membuat
tabel fakta sebagai data read-only yang tidak berubah dari waktu ke
waktu. Fakta yang paling berguna dalam tabel fakta adalah numerik dan
aditif karena aplikasi data warehouse hampir tidak pernah mengakses
single record dibandingkan ratusan, ribuan, bahkan jutaan record pada
suatu waktu dan hal yang paling berguna dilakukan dengan banyak
record adalah dengan menyatukannya. Tabel dimensi, sebaliknya
umumnya berisi informasi tekstual deskriptif. Atribut dimensi digunakan
sebagai pembatas dalam query data warehouse. Star schema dapat
digunakan untuk mempercepat kinerja query dengan denormalisasi
informasi reference ke dalam satu tabel dimensi.
42
Gambar 2.13 Star Schema (Connolly dan Begg, 2010, p1228)
2.1.12. ETL (Extract Transform Load)
Menurut Connolly dan Begg (2010, p1208-1209) Extract
Transform Load adalah proses pencarian data, mengintegrasikannya, dan
menempatkannya dalam data warehouse.
Extract
Tujuan dari proses ekstrak adalah untuk mencapai sumber sistem
dan mengumpulkan data yang diperlukan untuk data warehouse.
Biasanya data dikonsolidasi dari sumber sistem yang berbeda yang
43
mungkin menggunakan data organisasi atau format yang berbeda
sehingga ekstraksi harus mengubah data menjadi format yang sesuai
untuk pemrosesan transformasi. Kompleksitas ekstraksi dapat bervariasi
dan tergantung pada tipe sumber data. Proses ekstraksi juga mencakup
seleksi data sebagai sumber yang biasanya berisi data redundansi atau
data yang kurang penting.
Agar ekstraksi ETL sukses, dibutuhkan pemahaman tentang data
layout. Tool ETL yang baik juga memungkinkan penyimpanan data versi
intermediate diekstrak. Hal ini disebut “staging area” dan memungkin
reload data mentah pada kasus masalah loading lebih lanjut, tanpa re-
ekstraksi. Data mentah juga harus di-backup dan diarsipkan.
Transform
Tahap transformasi pada proses ETL mencakup aplikasi dari
rangkaian aturan atau fungsi untuk data diekstraksi. Hal ini mencakup
validasi record dan penolakannnya jika tidak diterima sebagai bagian dari
integrasi. Jumlah manipulasi yang dibutuhkan untuk proses transformasi
tergantung pada data. Sumber data yang baik akan membutuhkan sedikit
transformasi, sementara yang lain mungkin membutuhkan satu atau lebih
teknik transformasi untuk memenuhi persyaratan bisnis dan teknis dari
target database atau data warehouse. Proses yang paling umum
digunakan untuk transformasi adalah konversi, menghilangkan duplikasi,
standarisasi, menyaring, mengurutkan, menerjemahan dan mencari atau
44
memverifikasi jika sumber data tidak konsisten. Tool ETL yang baik
harus memungkinkan membangun proses yang kompleks dan
memperluas tool library sehingga fungsi custom user dapat ditambahkan.
Load
Loading adalah tahap terakhir proses ETL dan load data yang
diekstrak dan ditransformasi menjadi target repository. Ada beberapa
cara ETL load data. Beberapa di antaranya, menambahkan tiap record
secara fisik sebagai baris baru ke dalam tabel target data warehouse yang
melibatkan SQL insert statement build-in, sedangkan yang lain
menghubungkan proses ekstraksi, transformasi, dan loading dengan tiap
record dari sumber. (http://www.etltools.org/)
2.1.13. Data mart
Menurut Connolly dan Begg (2002, p1171-p1173), data mart
adalah bagian dari data warehouse yang mendukung kebutuhan
departemen atau fungsi bisnis tertentu.
Data mart dapat berdiri sendiri atau dihubungkan secara terpusat
dengan data warehouse perusahaan. Karakteristik yang membedakan
data mart dan data warehouse adalah :
• Data mart hanya berfokus pada kebutuhan user yang berhubungan
dengan satu departemen atau fungsi bisnis.
45
• Data mart biasanya tidak berisi data operasional, tidak seperti data
warehouse.
• Karena data mart berisi data yang lebih sedikit dibandingkan dengan
data warehouse, data mart lebih mudah dimengerti dan dinavigasi.
Ada beberapa pendekatan dalam membangun data mart.
Pendekatan yang pertama yaitu membangun beberapa data mart
kemudian mengintegrasikannya pada data warehouse. Pendekatan yang
lain yaitu membangun infrastruktur untuk data warehouse perusahaan
dan membangun satu atau lebih data mart untuk memenuhi segera
kebutuhan perusahaan pada saat yang bersamaan.
Alasan perlu dibuat data mart, yaitu:
• Untuk memberikan pengguna akses pada data yang sering mereka
butuhkan untuk analisis.
• Untuk menyediakan data dalam bentuk yang sesuai dengan
pandangan data bersama oleh sekelompok pengguna pada suatu
departemen atau fungsi bisnis.
• Meningkatkan waktu respon pengguna karena pengurangan volume
data yang diakses.
• Menyediakan data terstruktur sesuai kebutuhan access tool pengguna
akhir, seperti online anlytical processing (OLAP) dan data mining
tools yang membutuhkan struktur database internalnya.
46
• Data mart biasanya menggunakan data yang sedikit sehingga tugas
seperti membersihkan data, loading, transformasi, dan integrasi jauh
lebih mudah. Oleh karena itu, implementasi dan pengaturan data mart
lebih sederhana daripada membangun data warehouse perusahaan.
• Biaya implementasi data mart biasanya lebih sedikit daripada
membangun data warehouse.
• Pengguna data mart yang potensial lebih jelas dan lebih mudah
ditargetkan untuk memperoleh dukungan untuk proyek data mart
dibandingkan dengan proyek data warehouse perusahaan.
2.1.14. Metodologi Perancangan Database untuk Data Warehouse
Menurut Kimball (Connolly dan Begg, 2010, p1231-1238),
metodologi perancangan database untuk data warehouse, yaitu:
1. Memilih proses
Proses (fungsi) yang mengacu pada subjek data mart tertentu.
Data mart yang pertama kali dibangun seharusnya yang pertama kali
dikirim tepat waktu, dalam anggaran, dan untuk menjawab
pertanyaan-pertanyaan bisnis yang paling penting secara komersial.
2. Memilih grain
Memilih grain berarti memutuskan apa yang diwakili record
tabel fakta. Dimensi dari tabel fakta baru bisa diidentifikasi hanya jika
grain untuk tabel fakta telah dipilih. Keputusan grain untuk tabel
fakta juga menentukan grain untuk setiap tabel dimensi.
47
3. Mengidentifikasi dan menyesuaikan dimensi
Dimensi menetapkan konteks untuk mengajukan pertanyaan
tentang fakta di tabel fakta. Serangkaian dimensi yang dibangun
dengan baik membuat data mart lebih mudah dimengerti dan
digunakan. Jika ada dimensi pada dua data mart, dimensi tersebut
harus sama, atau salah satunya merupakan bagian matematis dari
yang lain.
4. Memilih fakta
Grain dari tabel fakta menentukan fakta mana yang digunakan
di data mart. Semua fakta harus diekspresikan pada tingkat yang
disiratkan oleh grain. Selain itu, fakta harus numerik dan aditif.
5. Menyimpan pra kalkulasi di tabel fakta
Setelah fakta telah dipilih, setiap fakta harus diperiksa kembali
untuk menentukan apakah ada peluang untuk menggunakan pra
kalkulasi. Contoh umum kebutuhan menyimpan pra kalkulasi terjadi
ketika fakta terdiri dari pernyataan laba rugi.
6. Menyempurnakan tabel dimensi
Pada tahap ini kembali ke tabel dimensi dan tambahkan
deskripsi teks pada dimensi. Deskripsi teks harus intuitif dan
dimengerti oleh pengguna. Kegunaan data mart ditentukan oleh ruang
lingkup dan sifat atribut dari tabel dimensi.
48
7. Memilih durasi database
Di banyak perusahaan ada kebutuhan untuk melihat periode
waktu yang sama satu atau dua tahun sebelumnya. Tabel fakta yang
sangat besar menimbulkan setidaknya dua masalah besar pada
rancangan data warehouse. Pertama, semakin tua data, semakin besar
kemungkinan munculnya masalah dalam membaca dan
menginterpretasikan file atau tape lama. Kedua, wajib menggunakan
versi lama dimensi yang penting, bukan versi terbaru.
8. Melacak perubahan dimensi secara perlahan
Ada tiga tipe perubahan dimensi secara perlahan: Tipe
pertama, dimana atribut dimensi yang berubah ditimpa; Tipe kedua
dimana atribut dimensi yang berubah menyebabkan record dimensi
baru dibuat; Tipe ketiga, di mana atribut dimensi yang berubah
menyebabkan atribut alternatif dibuat sehingga nilai atribut yang lama
dan baru dapat diakses secara bersamaan pada record dimensi yang
sama.
9. Menentukan prioritas dan mode query
Pada tahap ini pertimbangkan masalah rancangan fisik.
Masalah rancangan fisik yang paling penting yang mempengaruh
persepsi data mart pengguna akhir yaitu urutan tabel fakta pada
disk dan adanya pre-stored summaries atau aggregations. Di luar
masalah-masalah tersebut, ada beberapa masalah isu yang
49
mempengaruhi masalah administrasi, backup, kinerja pengindeksan,
dan keamanan.
2.1.15. LAN (Local Area Network)
Menurut Williams dan Sawyer yang diterjemahkan oleh Rahayu,
N.W. dan Prabawati, T.A. (2007, p321), LAN menghubungkan komputer
dan peranti dalam cakupan geografis yang terbatas, misalnya pada satu
kantor, satu gedung, atau kumpulan gedung yang berdekatan.
2.1.16. Server
Menurut Williams dan Sawyer yang diterjemahkan oleh Rahayu,
N.W. dan Prabawati, T.A. (2007, p23), server adalah komputer sentral
yang menangani kumpulan data (database) dan program untuk
menghubungkan dan member layanan ke PC / workstation dan alat-alat
yang disebut komputer client.
2.1.17. Client
Menurut Williams dan Sawyer yang diterjemahkan oleh Rahayu,
N.W. dan Prabawati, T.A. (2007, p109), client adalah komputer yang
meminta data atau layanan.
50
2.2. Teori Khusus
2.2.1. Yellow Pages
Yellow Pages adalah media informasi dalam bentuk direktori
produk dan jasa disusun menurut abjad berdasarkan kelas bisnis. PIB
(Petunjuk Informasi Bisnis) Yellow Pages dapat menjadi media promosi
yang tepat dan efektif bagi orang-orang bisnis dengan distribusi yang luas
mampu menjangkau seluruh pelosok negeri. Semua informasi dalam PIB
Yellow Pages dapat diperoleh melalui berbagai multi akses, yaitu:
1. E-book dapat diakses melalui www.yellowpages.co.id
2. CD ROM E-book Yellow Pages
3. Layanan pelanggan - 5000 57
4. My Mobile Directory – 8108
5. Akses informasi 108: Ketik * 108 # tekan OK (khusus Telkomsel)
6. Aplikasi Mobile Yellow Pages, dapat di-download secara gratis
melalui Blackberry di http:/ / odp.yellowpages.co.id
Sebagai media promosi yang efektif, Yellow Pages memiliki
manfaat sebagai berikut :
• Multi-akses
• Ekonomis
• Efektif
• Target yang sesuai sasaran
(http://www.infomedianusantara.com/dmrc.asp?r=1&loc=Id)
51
2.2.2. Pemasaran
Menurut Kotler dan Keller ( 2006, p5-p6 ), pemasaran berhubungan dengan
identifikasi dan mempertemukan manusia dengan kebutuhan sosial. Salah satu
definisi singkat pemasaran yaitu “memenuhi kebutuhan yang menguntungkan”.
Definisi formal marketing menurut Asosiasi Marketing Amerika adalah : Suatu
fungsi organisasi dan kumpulan proses dalam pembentukan, komunikasi, dan
membawakan hasil kepada pelanggan dan untuk mengatur hubungan pelanggan
dengan cara yang menguntungkan organisasi dan pemengang saham perusahaan.
2.2.3. Oracle Warehouse Builder 10g
Menurut Oracle Team (2009, p1-1, p1-2), Oracle Warehouse Builder
(OWB) merupakan tool tunggal yang komprehensif untuk seluruh aspek
manajemen data. OWB menjembatani database Oracle untuk mengubah data
menjadi informasi dengan kualitas yang tinggi. OWB menyediakan manajemen
kualitas data, audit data, permodelan relasional dan dimensional yang terintegrasi
penuh serta daur hidup manajamen data dan metadata yang lengkap. OWB
memungkinkan user untuk membuat data warehouse, memindahkan data dari
sistem terdahulu, mengkonsolidasi data dari sumber data yang terpisah,
membersihkan dan mengubah data untuk menyediakan informasi berkualitas dan
mengatur metadata perusahaan.
52
Untuk mengubah kualitas data yang rendah menjadi informasi yang
berkualitas tinggi diperlukan :
• Akses ke dalam beragam sumber data
OWB menjembatani database Oracle untuk membuat koneksi yang
transparan ke banyak database third-party, aplikasi, file dan data store.
• Kemampuan untuk mem-profile, mengubah dan membersihkan data
OWB menyediakan library transformasi data yang luas untuk tipe
data seperti text, numeric, date, dan lainnya. Sebelum dimuat ke dalam
penyimpanan data yang baru, dapat dilakukan profiling terhadap data untuk
mengevaluasi kualitas dan kelayakannya. Berikutnya, dapat dilakukan
matchmerge terhadap record menggunakan rule yang direncanakan.
• Kemampuan untuk mengimplementasi desain untuk berbagai aplikasi
Dengan menggunakan OWB, user dapat mendesain dan
mengimplementasikan penyimpanan data apapun yang diperlukan oleh
aplikasi, baik relasional maupun dimensional.
• Menelusuri jejak audit (audit trails)
Setelah mengkonsolidasi data dari berbagai sumber ke dalam
penyimpanan data tunggal, tantangan yang akan ditemui adalah untuk
membuktikan validitas dari informasi output. Sebagai contoh, dapatkah dicari
dan dibuktikan bagaimana angka ini dihasilkan? Ini merupakan pertanyaan
yang seringkali ditanyakan para pembuat keputusan dan oleh petugas
pemerintah.
53
Fungsi utama dari OWB adalah penggabungan sumber data yang
beragam dalam pembuatan Data Warehouse dan migrasi data dari sistem
sebelumnya. Lebih jauh lagi, OWB menawarkan kemampuan untuk
permodelan data relasional, dimensional dan metadata, data profiling, data
cleansing dan data auditing.
2.2.4. PHP
PHP merupakan bahasa script open source yang banyak digunakan dan
sangat cocok digunakan untuk pengembangan web dan dapat dilekatkan dengan
HTML. Kode PHP menggunakan instruksi <?php pada awal pemrosesan dan ?>
pada akhir pemrosesan yang memungkinkan untuk masuk dan keluar dari mode
PHP. PHP berbeda dari Java Script karena kode dieksekusi pada server,
menghasilkan HTML yang dikirimkan ke client. Client akan menerima hasilnya
tanpa mengetahui kode yang mendasarinya. (http://php.net/manual/en/intro-
whatis.php)