BAB 2 LANDASAN TEORI 2.1 Konsep Dasar Data Warehouse...

34
7 BAB 2 LANDASAN TEORI 2.1 Konsep Dasar Data Warehouse 2.1.1 Pengertian Data dan Informasi Pengertian data dan informasi menurut Turban, Rainer, dan Potter (2003,p15), data adalah fakta-fakta yang belum diolah atau gambaran-gambaran lebih lanjut dari benda-benda, kejadian-kejadian, kegiatan-kegiatan, dan transaksi-transaksi yang ditangkap, direkam, disimpan, dan diklasifikasikan tetapi tidak disusun untuk menyampaikan arti khusus lainnya. Informasi adalah sebuah kumpulan dari fakta-fakta (data) yang disusun di dalam beberapa cara sehingga kumpulan fakta tersebut bisa berarti untuk penerimanya. 2.1.2 Pengertian Teknologi Informasi Menurut Steven Alter (1999, p42) teknologi informasi adalah perangkat keras dan piranti lunak yg digunakan dalam sistem informasi. 1. Perangkat keras Mengarah pada peralatan dan obyek fisik lain yang terlibat dalam proses informasi seperti komputer, workstation, physical network, data storage, dan transmission device. 2. Piranti lunak Mengarah pada program komputer untuk proses penerjemahan input user dan menyampaikan pada perangkat keras mengenai apa yang harus dilakukan. Yang termasuk dalam piranti lunak yaitu sistem operasi, end

Transcript of BAB 2 LANDASAN TEORI 2.1 Konsep Dasar Data Warehouse...

7

BAB 2

LANDASAN TEORI

2.1 Konsep Dasar Data Warehouse

2.1.1 Pengertian Data dan Informasi

Pengertian data dan informasi menurut Turban, Rainer, dan Potter

(2003,p15), data adalah fakta-fakta yang belum diolah atau gambaran-gambaran

lebih lanjut dari benda-benda, kejadian-kejadian, kegiatan-kegiatan, dan

transaksi-transaksi yang ditangkap, direkam, disimpan, dan diklasifikasikan

tetapi tidak disusun untuk menyampaikan arti khusus lainnya. Informasi adalah

sebuah kumpulan dari fakta-fakta (data) yang disusun di dalam beberapa cara

sehingga kumpulan fakta tersebut bisa berarti untuk penerimanya.

2.1.2 Pengertian Teknologi Informasi

Menurut Steven Alter (1999, p42) teknologi informasi adalah perangkat

keras dan piranti lunak yg digunakan dalam sistem informasi.

1. Perangkat keras

Mengarah pada peralatan dan obyek fisik lain yang terlibat dalam proses

informasi seperti komputer, workstation, physical network, data storage,

dan transmission device.

2. Piranti lunak

Mengarah pada program komputer untuk proses penerjemahan input user

dan menyampaikan pada perangkat keras mengenai apa yang harus

dilakukan. Yang termasuk dalam piranti lunak yaitu sistem operasi, end

8

user software seperti word processor, dan application software yang

berhubungan dengan tugas bisnis yang khusus seperti merekam transaksi

kartu kredit atau merancang mobil.

Menurut Wikipedia, http://en.wikipedia.org/wiki/infromation_technology,

“Information technology is the technology required for information processing,

deals with the use of electronic computers and computer software to convert,

store, protect, process, transmit, and retrieve information.“, yang artinya

teknologi informasi adalah teknologi yang dibutuhkan dalam pengolahan

informasi, yang berhubungan dengan penggunaan komputer elektronik dan

piranti lunak untuk mengubah, menyimpan, memproteksi, mengolah, mengirim

dan mengambil informasi.

2.1.3 Pengertian Database

Menurut Connoly & Begg (2002,p14), “Database is a shared collections of

logically related data, and a description of this data, designed to meet the

information needs of an organization”, artinya database adalah suatu kumpulan

logikal data yang terhubung satu sama lain dan deskripsi dari suatu data yang

dirancang sebagai informasi yang dibutuhkan oleh suatu organisasi.

2.1.4 Pengertian Data Warehouse

Pengertian data warehouse dari beberapa ahli dapat bermacam – macam

namun mempunyai inti yang sama, seperti dari beberapa ahli di bawah ini :

9

Menurut W.H. Inmon (2002, p31), “A data warehouse is a subject-

oriented, integrated, nonvolatile and time-variant colection of data in support of

management’s decisions.”, artinya data warehouse adalah koleksi data yang

mempunyai sifat berorientasi subjek, terintegrasi, tidak mengalami perubahan

dan memiliki rentang waktu tertentu yang mendukung pengambilan keputusan

dari pihak manajemen.

Menurut Vidette Poe (1996, p6), “A data warehouse is a read only

analytical database that is used as the foundation of a decision support system”,

artinya data warehouse adalah database yang bersifat analis dan hanya dapat

dibaca saja, yang digunakan sebagai dasar dari sistem pendukung keputusan.

Menurut Wikipedia (2007), http://id.wikipedia.org/wiki/Gudang_data,

Gudang data (data warehouse) adalah suatu sistem komputer untuk

mengarsipkan dan menganalisis data historis suatu organisasi seperti data

penjualan, gaji, dan informasi lain dari operasi harian.

Jadi, data warehouse merupakan kumpulan data yang berasal dari berbagai

sumber yang memiliki sifat hanya dapat dibaca serta dapat membantu dalam

proses pengambilan keputusan dari pihak manajemen.

2.1.5 Pengertian Data Mart

Menurut Thomas Connoly (2002,p1067), “ Data mart is a subset of a data

warehouse that support the requirements of a particular department of business

function”, artinya data mart merupakan subset / bagian dari data warehouse yang

mendukung kebutuhan informasi dari suatu departemen atau fungsi bisnis

tertentu.

10

Perbedaan antara data mart dengan data warehouse adalah :

1 Data mart hanya berfokus pada kebutuhan user yang berkaitan dengan

suatu departemen atau fungsi bisnis.

2 Data mart tidak mengandung data operasional secara detil, tidak seperti

data warehouse.

3 Data yang ada dalam data mart lebih sedikit daripada yang ada dalam data

warehouse, data mart juga lebih mudah dimengerti karena lebih

sederhana.

2.2 Karakteristik Data Warehouse

Menurut W.H. Inmon (2000, p467), “A subject-oriented, integrated, non-

volatile, and time-variant colection of data in support of management’s

decision.” Berdasarkan definisi menurut W.H. Immon, karakteristik data

warehouse adalah sebagai berikut:

2.2.1 Subject oriented (Berorientasi subjek)

Karakteristik pertama dari data warehouse adalah berorientasi pada subjek

yang memiliki makna bahwa data warehouse berfokus pada masing-masing

subjek yang terdapat dalam suatu perusahaan, bukan berdasarkan proses sehari –

hari yang dilakukan perusahaan. Untuk memudahkan pemahaman, dapat dilihat

pada tabel perbandingan antara subjek pada data warehouse dengan subjek yang

ada pada proses sehari – hari atau kegiatan operasional.

11

Tabel 2.1 Perbandingan subjek pada data warehouse dengan

subjek yang ada pada proses sehari – hari atau kegiatan operasional

Perbedaaan Data Warehouse Data Operasional

Maksud perancangan Untuk kegiatan analisis

perusahaan

Untuk kegiatan

operasional perusahaan

Lingkungan

perancangan Pada subjek utama

Pada proses yang

dilakukan perusahaan

Data yang disimpan Data analisis dari

kumpulan data

operasional dan bersifat

statis

Data detil dari hasil

kegiatan perusahaan dan

bersifat dinamis

Pengguna Managerial user dalam

jumlah yang relatif sedikit

Operational user dalam

jumlah yang relatif

banyak

2.2.2 Time variant (variasi waktu)

Dalam pembuatan data warehouse, dimensi waktu adalah suatu hal yang

penting, dimana rentang waktu yang digunakan merupakan rentang waktu yang

panjang atau bentuk variasi waktu. Horizon waktu yang digunakan dapat berkisar

antara 5 – 10 tahun dan semakin banyak data yang kita miliki, semakin baik kita

menganalisa masalah dalam perusahaan kita. Karena dimensi ini merupakan hal

yang penting maka pada bagian waktu diperlukan suatu pembagian dengan

aturan-aturan tertentu seperti per bulan, per kuartal, per tahun dan sebagainya.

12

2.2.3 Integrated (saling terintegrasi)

Sifat ini berarti bahwa data yang digunakan dalam pembuatan data

warehouse harus data yang terpadu atau terintegrasi, sehingga tercipta

konsistensi yang tinggi pada data warehouse. Konsistensi yang ditunjukkan data

warehouse dapat dilihat pada :

1. Encoding (pengkodean)

Sebagai contoh, software developer harus memberi kode “m” untuk jenis

kelamin pria, “f” untuk jenis kelamin wanita. Dapat juga memberi kode “1”

atau “male” untuk pria serta “0” atau “female” untuk wanita.

2. Attribute measurement (pengukuran atribut)

Sebagai contoh, ada beberapa satuan ukuran yang digunakan untuk satuan

panjang dalam database seperti cm, inchi, meter, dan yard. Dengan

karakteristik integrasi data, maka ukuran tersebut harus konsisten seperti

menetapkan ukuran satuan panjang yaitu cm.

3. Multiple source (banyak sumber)

Dalam database ada kemungkinan banyaknya deskripsi dari suatu

informasi, namun dengan prinsip integrasi data, seluruh informasi tersebut

harus memiliki kesamaan deskripsi yang konsisten.

4. Confilcting Keys (kunci yang berbeda)

Sebagai contoh, dalam database ada beberapa tipe data yang berbeda dalam

field yang sama seperti field kode barang dalam tabel penjualan memiliki

tipe data character (char) dengan field size 10 sedangkan dalam tabel lain

berbeda, misal char (12). Semua perbedaan itu harus dintegrasikan menjadi

satu tipe data yaitu char dengan ukuran 12.

13

2.2.4 Non-volatile (tidak berubah-ubah)

Data pada data warehouse tidak dapat mengalami perubahan, lain halnya

pada database operasional dimana dapat dilakukan operasi update, insert, dan

delete terhadap data yang menyebabkan perubahan isi pada database namun pada

data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data

(mengambil data yang dibutuhkan data warehouse) dan akses data (proses

mengakses data warehouse, seperti melakukan query atau menampilkan laporan

yang dibutuhkan), tidak ada kegiatan update data.

2.3 Granularity

Salah satu aspek terpenting dalam perancangan data warehouse adalah

granularity. Granularity menunjukkan tingkat kerincian atau keringkasan data

dalam data warehouse. Semakin rinci atau detil suatu data, maka tingkat

granularitynya semakin rendah, dan juga sebaliknya. Contoh : Sebuah transaksi

memiliki tingkat granularity yang rendah. Dengan meringkas seluruh transaksi

tersebut selama sebulan akan menyebabkan tingkat granularitynya menjadi

tinggi. Keuntungan dari granularity, yaitu :

1. Sebagai kunci untuk reusability, karena data warehouse dapat digunakan

oleh banyak user dalam berbagai cara. Misalnya dalam sebuah perusahaan,

bagian marketing dapat melihat penjualan bulanan berdasarkan wilayah

pemasaran sedangkan bagian penjualan per sales person menurut wilayah

penjualan dalam rentang waktu minggu.

2. Fleksibilitas dalam penampilan data

3. Dapat mengakomodasi kebutuhan mendatang yang belum diketahui

14

2.4 Kegiatan Inti Data Warehouse

Untuk melakukan penganalisaan dan pelaporan informasi bagi pihak –

pihak yang mengambil keputusan maka dalam merancang data warehouse

terdapat kegiatan – kegiatan yang harus ada di dalamnya, antara lain :

1. Memperoleh dan menggabungkan Data

Mendapatkan data dari berbagai sumber dan melakukan penggabungan

pada suatu tempat tertentu, data yang digabung adalah data yang akan

membantu kita dalam pembuatan laporan, karena data tersebut merupakan

suatu bentuk kesatuan.

2. Transformasi data

Pengolahan data dari awal ke bentuk data yang telah disepakati. Dengan

mengalami pemrosesan atau pengolahan terlebih dahulu, yang sama artinya

dengan pengubahan data ke bentuk yang diharapkan.

3. Pendistribusian data

Data yang akan kita gunakan dalam data warehouse berkaitan dengan

lingkungan kerja dalam lingkungan perusahaan. Bagi perusahaan yang

terhubung dengan jaringan, pemakaian data warehouse mendukung

kegiatan ini secara lebih fleksibel dan merata pada masing – masing bagian

yang ada dalam perusahaan.

4. Penggunaan data

Data yang telah disaring akan menghasilkan ringkasan yang dapat

memudahkan pengguna dalam mengambil suatu keputusan. Kegiatan

pemakaian data ini akan menjadi lebih sering jika misalnya para pengambil

15

keputusan ingin menganalisa performa karyawan dalam menjalankan dan

mengembangkan perusahaan.

2.5 Struktur Data Warehouse

Menurut W.H. Inmon (2002, p35) terdapat tingkat detil data yang berbeda

dalam data warehouse mulai dari current detail data, old detail data, lightly

summarized data dan highly summarized data. Tingkat detil data tersebut

merupakan hasil transformasi data dari tingkat operasional menuju tingkat data

warehouse. Perbedaan tingkat detil data ini dikenal dengan struktur data

warehouse. Di bawah ini akan dijelaskan lebih lanjut mengenai struktur data

warehouse.

2.5.1 Current Detail Data (Detil data saat ini)

Current detail data adalah data detil yang aktif sekarang, mencerminkan

keadaan yang sedang berjalan dan merupakan level terendah dalam data

warehouse. Curent detail data ini biasanya memerlukan media penyimpanan

data yang besar. Berikut ini beberapa alasan mengapa current detail data

menjadi perhatian utama :

1. Menggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian

utama.

2. Sangat banyak jumlahnya dan disimpan pada tingkat penyimpanan

terendah.

3. Hampir selalu disimpan di media penyimpanan karena cepat diakses tetapi

mahal dan kompleks dalam pengaturannya.

16

4. Bisa digunakan dalam membuat rekapitulasi sehingga datanya harus

akurat.

2.5.2 Old Detail Data (Detil data historis)

Old Detail data merupakan data history yang dapat berupa hasil back up

yang disimpan dalam media penyimpanan yang terpisah dan pada saat tertentu

dapat diakses kembali. Data ini jarang diakses sehingga biasanya disimpan dalam

media penyimpanan alternatif seperti tape disk. Penyusunan direktori untuk data

ini harus menggambarkan umur dari data agar memudahkan untuk pengaksesan

kembali.

2.5.3 Lightly Summarized Data (Rangkuman data secara khusus)

Lightly summarized data merupakan ringkasan dari curent detil data. Di

dalam tahap ini data belum dapat digunakan untuk pengambilan keputusan

karena sifat data belum “total summary” yang artinya data masih bersifat detil.

Lightly summarized data seringkali digunakan sebagai gambaran dari keadaan

yang sedang berlangsung maupun yang belum berlangsung. Data ini hampir

selalu tersimpan dalam disk dan yang diperlukan adalah satuan waktu ringkasan

dan atribut Lightly Summarized Data.

2.5.4 Highly Summarized Data (Rangkuman data secara umum)

Highly summarized data (rangkuman data secara umum) merupakan hasil

proses ringkasan yang bersifat total, solid, serta mudah diakses. Digunakan untuk

melakukan analisa perbandingan data berdasarkan urutan waktu dan analisa yang

17

menggunakan data multidimensi. Database multi dimensi adalah suatu

tekonologi software komputer yang dirancang untuk meningkatkan efisiensi

dalam mencari tabel (query) sehingga menjadi media penyimpanan yang lebih

baik, serta memudahkan pengambilan data dengan volume yang besar.

2.5.5 Metadata

Metadata bukanlah merupakan hasil kegiatan operasional seperti keempat

jenis data diatas, namun merupakan komponen penting dalam data warehouse.

Metadata seringkali disebut ‘data tentang data’. Metadata memberikan peranan

yang penting untuk keefektifan penggunaan data warehouse karena dengan

adanya metadata, maka akan mempermudah end user dalam melakukan analisis

dan menghemat waktu. Metadata bertindak seperti indeks mengenai isi dari data

warehouse. Metadata mengandung :

1. Struktur Data

Suatu direktori untuk membantu analisis DSS (Decision Support System)

untuk mencari lokasi / tempat data dalam data warehouse.

2. Algoritma untuk meringkas data

Suatu algoritma untuk proses summary data antara curent detail data

dengan lightly summarized data dan antara lightly summarized data dengan

highly summarized data, dan lain-lain.

3. Pemetaan dari data operasional ke data warehouse

Suatu panduan pemetaan data pada saat data ditransformasi / diubah dari

lingkup data operasional menjadi lingkup data warehouse.

18

Gambar 2.1 Struktur Data warehouse

2.6 Arsitektur Data Warehouse

Menurut Vidette Poe (1996, p24), arsitektur adalah sekumpulan aturan atau

struktur yang memberikan kerangka untuk keseluruhan rancangan pada suatu

sistem atau produk. Arsitektur data menyediakan kerangka dengan

mengidentifikasi dan memahami bagaimana data akan dipindahkan melalui

sistem dan digunakan dalam perusahaan. Arsitektur data untuk data warehouse

mempunyai komponen utama yaitu database yang hanya dapat dibaca atau read-

only database. Menurut Vidette Poe (1996, p40 – 41) karakteristik arsitektur

data warehouse yaitu :

1. Data diambil dari sistem asal (sistem informasi yang ada), database dan

file.

Highly summarized

Monthly sales by product line 1981-1992

Monthly sales by subproduct line 1984-1992

lightly summarized ( datamart )

Current detail

Sales detail 1990-1991

Sales detail 1984-1989

Old detail

Operational transformatin

metadata

19

2. Data dari sistem asal dintegrasikan dan ditransformasikan sebelum

disimpan ke dalam Database Management System (DBMS) seperti Oracle,

Ms SQL Server, IBM DB2, Sybase dan masih banyak yang lainnya.

3. Data warehouse adalah jenis database read-only yang diciptakan untuk

mengambil keputusan.

4. User mengakses data warehouse melalui front - end tool atau aplikasi.

Front End Tool

Gambar 2.2 Arsitektur Data warehouse

(Sumber : Poe,1996,p41)

2.7 Bentuk / Anatomi Data warehouse

Dalam menentukan bentuk data warehouse yang akan digunakan oleh suatu

perusahaan, terlebih dahulu harus diketahui kebutuhan yang diperlukan dalam

menjalankan aplikasi yang dirancang. Bentuk umum yang sering digunakan

dalam data warehouse adalah :

1. Functional Data Warehouse (Data warehouse Fungsional)

2. Centralized Data Warehouse (Data warehouse Terpusat)

3. Distributed Data Warehouse (Data warehouse Terdistribusi)

source

source

Data

Warehouse

source

Transformasi data dan informasi

20

2.7.1 Functional Data Warehouse (Data warehouse Fungsional)

Data warehouse dibuat lebih dari satu dan dikelompokkan berdasarkan

masing–masing fungsinya seperti fungsi keuangan (financial), fungsi marketing,

fungsi kinerja personalia dan lain- lainnya. Keuntungan dari bentuk ini adalah

dapat dengan mudah dibangun dengan biaya yang relatif murah, sedangkan

kerugiannya adalah terbatasnya kemampuan dalam pengumpulan data bagi

pengguna. Penerapan jenis sistem pengumpulan data seperti ini beresiko

kehilangan konsistensi data di luar lingkungan bisnis bersangkutan. Apabila

pendekatan ini lingkupnya diperbesar dari lingkungan fungsional menjadi

lingkup perusahaan, konsistensi data perusahaan tidak lagi dapat dijamin.

Gambar 2.3 Functional Data Warehouse

2.7.2 Centralized Data Warehouse (Data warehouse Terpusat)

Bentuk ini terlihat seperti bentuk functional data warehouse, namun disini

sumber data terlebih dahulu dikumpulkan dan dintegrasikan pada suatu tempat

terpusat, kemudian barulah data tersebut dibagi – bagi berdasarkan fungsi –

source

source

source

Functional Data

Warehouse

Workstation

Workstation

Functional Data

Warehouse

21

fungsi yang dibutuhkan oleh perusahaan dan bentuk ini sering digunakan oleh

perusahaan yang belum memiliki jaringan eksternal. Keuntungan bentuk ini

dibandingkan dengan data warehouse fungsional adalah data benar-benar

terpadu. Bentuk ini mengharuskan pemasok data mengirimkan data tepat pada

waktunya supaya tetap konsisten dengan pemasok lainnya. Di samping itu,

pemakai hanya dapat mengambil data dari bagian pengumpulan saja, dan tidak

dapat secara langsung berhubungan dengan pemasok datanya sendiri.

Gambar 2.4 Centralized Data Warehouse

2.7.3 Distributed Data Warehouse (Data warehouse Terdistribusi)

Bentuk ini dikembangkan berdasarkan konsep data warehouse gateway

yang memungkinkan pemakai untuk langsung berhubungan dengan sumber data

maupun dengan pusat pengumpul data lainnya. Gambaran pemakai atas data

adalah berupa gambaran logikal karena data mungkin diambil dari berbagai

sumber yang berbeda. Pendekatan ini mengandalkan keunggulan teknologi

“client-server” untuk mengambil data dari berbagai sumber. Pendekatan ini

memungkinkan tiap departemen atau divisi untuk membangun pengumpul data

source

source

source

Centralized Data

Warehouse

Functional Data

Warehouse

Functional Data

Warehouse

Workstation

Workstation

22

fungsionalnya masing-masing atau bahkan sistem operasionalnya dan

memadukan bagian-bagian tersebut dengan teknologi client-server. Pendekatan

ini memerlukan biaya yang sangat besar karena setiap sistem pengumpulan data

fungsional dan sistem operasinya dikelola secara terpisah. Di samping itu,

supaya berguna bagi perusahaan data harus disinkronisasikan untuk memelihara

keterpaduannya. Metode ini akan sangat efektif apabila data telah tersedia dalam

bentuk yang konsisten dan pemakai dapat menambah data tersebut dengan

informasi baru apabila ingin memperoleh gambaran baru atas informasi.

Gambar 2.5 Distributed Data Warehouse

2.8 Kegunaan dan Keuntungan Data warehouse

Ada beberapa kegunaan dari Data warehouse, yaitu :

1. Pembuatan laporan

Pembuatan laporan adalah salah satu kegunaan data warehouse yang paling

umum. Dengan melakukan query data dalam data warehouse dapat

source

source

source

Data Warehouse Gateway

Workstation

Workstation

23

dihasilkan informasi pertahun, perkuartal, dan bahkan perhari. Query

tersebut digunakan dengan tujuan memperoleh jawaban atas pertanyaan-

pertanyaan khusus, seperti siapa, kapan, dimana dan sebagainya.

2. On-Line Analytical Processing (OLAP)

Data warehouse digunakan dalam melakukan analisis bisnis untuk

menyelidiki kecenderungan pasar atau faktor-faktor penyebabnya. Dengan

adanya data warehouse semua informasi baik rincian maupun ringkasan

yang dibutuhkan dalam proses analisis mudah didapat. Dalam hal ini, data

warehouse merupakan tool yang handal dalam menganalisis data yang

kompleks.

3. Data mining

Penggunaan data warehouse tingkat lanjut, dimana data warehouse

digunakan dalam pencarian pola dan hubungan antara data dengan tujuan

membuat keputusan bisnis bagi pihak manajemen. Dalam hal ini, software

dirancang untuk pola statistik dalam data sehingga dapat mengetahui

kecenderungan yang ada.

4. Proses Informasi Eksekutif

Data warehouse digunakan untuk mencari ringkasan informasi yang

penting dengan tujuan membuat keputusan bisnis tanpa harus menjelajahi

keseluruhan data. Dengan menggunakan data warehouse, segala laporan

telah diringkas dan dapat pula diketahui rinciannya secara lengkap

sehingga mempermudah proses pengambilan keputusan. Informasi dan data

pada laporan menjadi lebih informatif bagi pengguna, dalam hal ini pihak

manajemen dan eksekutif.

24

Berdasarkan Connoly (2002, p1048), implementasi yang baik dari data

warehouse dapat memberikan banyak keuntungan terhadap suatu perusahaan

meliputi :

1. Potensi yang Tinggi terhadap Return of Investment (ROI)

Perusahaan harus mengakui bahwa implementasi data warehouse

membutuhkan sumber daya dan biaya yang sangat besar. Tapi berdasarkan

penelitian yang dilakukan oleh International Data Corporation (IDC)

tahun 1996, dilaporkan bahwa rata – rata ROI dalam 3 tahun, dengan data

warehouse, mencapai 401%.

2. Keuntungan dalam persaingan

ROI yang besar bagi perusahaan – perusahaan yang berhasil menerapkan

data warehouse adalah fakta atas keuntungan bersaing yang tinggi yang

menyertai teknologi tersebut. Kelebihan ini bertambah dengan

menyediakan akses bagi para pembuat keputusan, ke data yang dapat

menampilkan informasi yang sebelumnya tidak tersedia dan tidak

diketahui, seperti trends dan demands.

3. Peningkatan produktivitas pada Corporate Decision-Makers

Data warehouse meningkatkan produktivitas para pembuat keputusan

dengan membuat database gabungan yang konsisten, subject – oriented

dan berisi data historis. Data gabungan dari berbagai sistem menghasilkan

satu pandangan yang konsisten dari sebuah perusahaan. Jadi, dengan

mengubah data menjadi informasi yang berarti, data warehouse membuat

para manajer bisnis menghasilkan analisa yang lebih akurat dan konsisten.

25

2.9 Perancangan Data warehouse

Menurut Kimball (2002, p30), urutan tahap-tahap perancangan logical data

warehouse yaitu :

1 Memilih proses bisnis

User memegang peranan penting dalam pemilihan proses bisnis. Ukuran

performance data warehouse yang diharapkan oleh user merupakan hasil

dari proses pengukuran bisnis. Contoh proses bisnis meliputi, pembelian

bahan mentah, pemesanan, pengiriman, invoice, dan persediaan.

Dengan berfokus pada proses bisnis, dan bukan pada departemen bisnis,

maka dapat dicapai informasi yang konsisten bagi perusahaan secara

keseluruhan. Jika data warehouse dibangun berdasarkan departemen,

maka akan terdapat data duplikat dengan label dan istilah yang berbeda-

beda, yang mengakibatkan data tidak konsisten.

2 Menentukan grain dari proses bisnis

Menentukan grain berarti menspesifikasikan secara tepat apa yang

direpresentasikan oleh baris tabel fakta individual. Grain menyampaikan

level detil yang berhubungan dengan tabel fakta. Penentuan grain

merupakan tahap critical dalam perancangan logikal data warehouse.

3 Memilih dimensi-dimensi untuk setiap tabel fakta

Jika grain telah ditentukan dengan benar maka dimensi-dimensi dapat

diidentifikasikan dengan mudah. Pada dimensi, atribut-atribut berupa teks

dapat disertakan guna menyempurnakan tabel dimensi. Contoh lazim dari

dimensi meliputi waktu, produk, pelanggan, tipe transaksi, dan status.

26

4 Mengidentifikasi fakta-fakta

Fakta dapat diidentifikasi dengan memberikan jawaban atas pertanyaan

“Apa yang ingin diukur?“. Semua candidate fact haruslah sesuai dengan

grain yang telah didefinisikan dalam tahap 2. Fakta bagi grain yang

berbeda ditempatkan dalam tabel fakta terpisah. Nilai fakta berupa

numerik, seperti jumlah pesanan atau total dolar.

Menurut Vidette Poe (1996, p133), alat yang digunakan untuk merancang

data warehouse adalah skema bintang (star schema). Skema bintang merupakan

struktur sederhana dengan tabel – tabel yang relatif sedikit dan menggambarkan

hubungan antara tabel fakta dan tabel dimensi dengan jelas. Rancangan ini

mampu melakukan query dengan cepat serta mudah dimengerti bahkan oleh

analis dan pengguna akhir atau orang awam yang tidak mengerti struktur

database.

2.9.1 Definisi Skema Bintang

Menurut Thomas Connoly (2002,p1079), “Star schema is a logical

structure that has a fact table containing factual data in the center, surrounded

by dimension tables containing reference data (which can be denormalized)”,

yang berarti skema bintang merupakan struktur logikal yang memiliki tabel fakta

yang berisi data fakta, dikelilingi oleh tabel dimensi yang berisi data referensi

(yang dapat didenormalisasikan). Teori Connoly ini didukung oleh

A.Silberschatz., Korth, H. F. Sudarshan, S.(2003) dan Ralph Kimball (1996).

27

2.9.2 Keuntungan Skema Bintang

Keuntungan menggunakan skema bintang menurut Connoly adalah :

1. Efisiensi, struktur database yang konsisten sehingga lebih efisien dalam

mengakses data dengan menggunakan alat / tool untuk menampilkan data

termasuk laporan tertulis dan query.

2. Kemampuan untuk mengatasi perubahan kebutuhan, skema bintang dapat

beradaptasi terhadap perubahan kebutuhan pengguna, karena semua tabel

dimensi memiliki kesamaan dalam hal menyediakan akses ke tabel fakta.

3. Extensibility, model dimensional dapat dikembangkan. Seperti menambah

tabel fakta selama data masih konsisten, menambah tabel dimensi selama

ada nilai tunggal di tabel dimensi tersebut yang mendefinisikan setiap

record tabel fakta yang ada, menambahkan attribute tabel dimensi, dan

memecah record tabel dimensi yang ada menjadi level yang lebih rendah

dari level sebelumnya.

4. Kemampuan untuk menggambarkan situasi bisnis pada umumnya,

pendekatan standar untuk menangani situasi umum didunia bisnis yang

terus bertambah.

5. Proses query yang bisa diprediksi, aplikasi data warehouse yang mencari

data dari level yang dibawahnya akan dengan mudah menambah jumlah

atribut pada tabel dimensi dari sebuah skema bintang. Aplikasi yang

mencari data dari level yang setara akan menghubungkan tabel fakta yang

terpisah melalui tabel dimensi yang dapat diakses bersama.

28

2.9.3 Tabel dalam Skema Bintang

Dalam skema bintang terdapat dua tipe tabel, yaitu tabel fakta dan tabel

dimensi. Tabel fakta disebut juga sebagai tabel mayor, berisi data aktual yang

akan dianalisis, yang terdiri dari data kuantitatif atau data fakta mengenai bisnis

serta informasi yang diquery. Informasi pada tabel fakta ini berupa :

• Measure, biasanya diukur secara numerik karena bersifat data kuantitatif.

• Foreign key dari primary key yang ada pada masing – masing tabel

dimensi yang berhubungan.

• Mengandung banyak kolom dan jutaan baris.

Tabel dimensi disebut juga sebagai tabel minor karena lebih kecil dan

berisi kategori dengan ringkasan data detil, yang merupakan deskripsi lebih

lanjut dari data yang ada pada tabel fakta (mencerminkan dimensi bisnis).

Misalnya laporan mutasi pada tabel fakta dapat dilaporkan dalam dimensi waktu,

yang berupa per-bulan atau per-tahun. Kolom pada tabel fakta yang bukan

primary key atau foreign key disebut kolom data, sedangkan pada tabel dimensi

disebut atribut.

2.9.4 Jenis Skema Bintang

Dalam perancangan data warehouse, terdapat beberapa jenis skema bintang

yang dapat digunakan sesuai dengan kebutuhan, yaitu skema bintang sederhana,

skema bintang majemuk, dan skema bintang snowflake.

2.9.4.1 Skema Bintang Sederhana

Alasan memilih skema bintang sederhana antara lain :

29

1. Menyediakan response time yang lebih baik.

2. Struktur rancangan yang sederhana mudah dimengerti pemakai.

Dalam skema ini, setiap tabel harus memiliki primary key yang terdiri dari

satu kolom atau lebih dan primary key tersebut harus bersifat unik. Primary key

dari tabel fakta terdiri dari satu atau lebih foreign key. Foreign key adalah kolom

pada satu tabel yang nilainya didefinisikan oleh primary key pada tabel yang lain.

Gambar dibawah ini menggambarkan hubungan antara tabel fakta dan tabel

dimensi. Tabel fakta memiliki tiga foreign key, dimana masing-masing foreign

key itu merupakan primary key pada tabel dimensi.

Gambar 2.6 Skema Bintang Sederhana

Dalam sebuah skema bintang, dapat juga memiliki lebih dari satu tabel

fakta, karena adanya fakta yang tidak saling berhubungan. Misalnya disamping

penjualan terdapat tabel fakta forecasting dan tabel fakta result. Tetapi

walaupun terdapat banyak tabel fakta, tabel dimensinya tetap digunakan secara

30

bersama-sama. Skema ini juga disebut Constellation Schema dan sering

digunakan untuk jumlah data yang besar.

Gambar di bawah ini menunjukkan adanya dua tabel fakta dan tiga tabel

dimensi yang memperlihatkan hubungan many to one antara foreign key pada

kedua tabel fakta tersebut dengan primary key pada masing – masing tabel

dimensi.

Gambar 2.7 Skema Bintang Dengan Beberapa Tabel Fakta

Tabel fakta juga dapat digunakan untuk menggambarkan hubungan many-

to-many antara berbagai tabel dimensi yang sudah jelas dalam bisnis. Jenis

skema bintang ini dikenal dengan tabel asosiasi. Tabel asosiasi berguna untuk

menyelaraskan hubungan many-to-many di antara dimensi yang berbeda.

31

Gambar 2.8 Skema bintang dengan tabel Asosiasi

Tabel dimensi mungkin mengandung foreign key yang mereferensikan

primary key di tabel dimensi yang lain. Tabel dimensi yang direferensikan ini

yang dinamakan outboard table / secondary dimension table. Pada gambar

berikut, tabel dimensi-2 mempunyai 2 outboard table, yaitu tabel dimensi-4 dan

tabel dimensi-5.

32

Gambar 2.9 Skema Bintang Dengan Tabel Dimensi Tambahan

2.9.4.2 Skema Bintang Majemuk

Dalam skema bintang majemuk, tabel fakta memiliki dua kumpulan

foreign key, yang pertama mengandung suatu referensi dengan tabel dimensi

yang lain sedangkan sisanya adalah primary key yang merupakan gabungan dari

satu atau lebih kolom yang menghasilkan suatu identifikasi untuk setiap barisnya.

Bedanya skema bintang majemuk dengan skema bintang sederhana adalah saling

tidak identiknya primary key dan foreign key dalam skema bintang majemuk.

33

Gambar 2.10 Skema Bintang Majemuk

2.9.4.3 Skema Snowflake

Menurut Thomas Connoly (2002, p1080), “Snowflake schema is a variant

of the star schema where dimension table do not contain denormalized data”,

yang berarti skema snowflake merupakan bentuk lain dari skema bintang dimana

data dalam tabel dimensi belum dinormalisasi. Suatu tabel dimensi dapat

memiliki tabel dimensi lainnya.

Ciri-ciri dari skema snowflake adalah:

1. Tabel dimensi dinormalisasi dengan dekomposisi pada level atribut.

2. Setiap dimensi mempunyai satu key untuk setiap level pada hirarki dimensi

3. Kunci level terendah menghubungkan tabel dimensi dengan tabel fakta dan

tabel atribut berlevel rendah

Keuntungan dari skema snowflake adalah :

1. Kecepatan memindahkan data dari data OLTP kedalam metadata

2. Sebagai kebutuhan dari alat pengambil keputusan tingkat tinggi dimana

dengan tipe yang seperti ini seluruh struktur dapat digunakan sepenuhnya

34

3. Banyak yang beranggapan lebih nyaman merancang dalam bentuk normal

ketiga.

Sedangkan kerugiannya adalah mempunyai masalah yang besar dalam hal

kinerja (performance), hal ini disebabkan semakin banyaknya join antar tabel-

tabel yang dilakukan dalam skema snowflake ini, maka semakin lambat juga

kinerja yang dilakukan.

Gambar 2.11 Skema Snowflake

2.10 Agregasi

Agregasi adalah proses perhitungan data fakta terhadap atribut – atribut

yang telah didefinisikan. Sebagai contoh, dapat dibuat dari jumlah mahasiswa

berdasarkan jurusan dan program studi dengan menghitung jumlah mahasiswa

dari data transaksi yang terjadi. Agregasi dapat dibuat selama proses transformasi

dan pemuatan data ke dalam data warehouse. Menurut Poe (1996, p136), faktor

yang mendorong pembuatan agregasi adalah :

• Meningkatkan penampilan pencarian (searching).

35

• Mengurangi jumlah penggunaan kode produk universal.

Suatu agregasi yang baik dapat dibuat untuk digunakan oleh tiga ratus user

dalam satu hari, karena akan lebih bermanfaat jika dibandingkan dengan

membuat agregasi yang membutuhkan waktu dua jam tetapi hanya digunakan

sekali dalam setahun oleh satu user saja.

Salah satu teknik yang harus dicatat adalah saat pemuatan data warehouse,

kita tetap membutuhkan teknik data warehouse klasik seperti partisi tabel secara

fisik. Hal ini menjadi penting bilamana data warehouse mencapai gigabyte data.

2.11 Denormalisasi

Menurut Inmon (2002, p389) denormalisasi adalah teknik dari penempatan

data normalisasi dalam lokasi fisik yang mengoptimasikan kinerja dari sistem.

Menurut Vidette Poe (1996,p137) denormalisasi adalah proses

penggabungan table-tabel untuk meningkatkan penampilan

Jadi, denormalisasi adalah suatu proses yang merubah bentuk normalisasi

dari database dengan cara penggabungan tabel dan merupakan sebuah proses

yang secara sengaja dilakukan dengan melanggar peraturan bentuk normal dari

normalisasi dengan tujuan untuk meningkatkan kinerja (performance)

pengaksesan data yang ada.

Keuntungan melakukan proses denormalisasi adalah :

• Mengurangi jumlah relasi yang terjadi antar tabel – tabel yang harus

mengalami proses pada waktu pencarian sehingga akan meningkatkan

kecepatan proses query data.

36

• Membuat struktur fisik database agar mudah dimengerti menurut model

dimensi dari pemakai. Struktur tabel yang dibuat sesuai keinginan

pemakai memungkinkan terjadinya akses langsung yang sekali lagi akan

meningkatkan kinerja.

Kelemahan melakukan proses denormalisasi adalah :

• Proses denormalisasi secara tidak langsung akan membuat redundansi

data.

• Proses ini memerlukan alokasi memori dan storage (tempat

penyimpanan) yang besar.

2.12 Matriks

Matriks menurut Kimball (2002, p398) adalah tool yang digunakan untuk

membuat, mendokumentasikan, dan mengkomunikasikan arsitektur data, di

mana baris-baris pada matriks mengidentifikasikan proses bisnis perusahaan dan

kolom – kolomnya merepresentasikan dimensi-dimensi yang sesuai dengan

proses bisnis perusahaan. Intersection dari dimensi-dimensi yang relevan dengan

masing - masing proses bisnis diberi tanda untuk menunjukkan ada hubungan

antara dimensi dengan proses bisnis tertentu.

Matriks merupakan suatu device yang membantu penggunanya baik dalam

hal perencanaan maupun proses komunikasi. Meskipun matriks hanya terdiri dari

baris dan kolom, namun mampu mendefinisikan keseluruhan arsitektur data bagi

warehouse. Matriks memperlihatkan keseluruhan rencana yang dirancang dalam

suatu bentuk yang ringkas sehingga dapat digunakan untuk membantu senior IT

37

dan manajemen bisnis dalam mengkomunikasikan rancangan rencana

(Kimball,2002, p81).

2.13 State Transition Diagram (STD)

State-Transition Diagram (STD) menggambarkan bagaimana perilaku

sistem saat mendapatkan event dari luar (External Events). STD mewakili

berbagai mode perilaku dari sistem dan perlakuan yang terdapat pada transisi

antar state. STD menjadi dasar dari model perilaku.

Gambar 2.12 State Transition Diagram (STD)

2.14 Kunci Sukses Data warehouse

Membangun data warehouse tidaklah mudah seperti membalikkan

telapak tangan, kita harus memperhatikan hal-hal berikut ini untuk mencapai

kesuksesan dalam perancangan kita (Vidette Poe, 1996,p90-95), hal-hal tersebut

adalah:

1. Kejelasan dalam tujuan, yang memberikan gambaran awal untuk memulai data

warehouse sesuai dengan kebutuhan perusahaan, di mana akan membatasi

State 1

State 2

Condition

Action

38

ruang kerja kita untuk selalu konsisten.

2. Memahami arsitektur data warehouse yang digunakan, ini merupakan blue

print yang akan digunakan dalam mengembangkan sistem pendukung

keputusan, dan menyangkut dengan banyak aspek dalam hal bagaimana

sistem tersebut akan dikembangkan.

3. Dukungan infrastruktur teknikal yang benar, seperti alat-alat, platform,

database, jaringan komunikasi, pelatihan dan sebagainya yang akan

menentukan proses pembuatan sebelum data warehouse mulai

dikembangkan.

4. Kejelasan tanggung jawab tim, masing-masing anggota tim harus bertanggung

jawab untuk masing-masing bagian yang ia tangani, seperti pemodelan data,

pelatihan dan pengaturan jaringan.

5. Menjamin anggota tim dan pengguna memahami perbedaan antara data

operasional dan data pendukung keputusan, dengan memperhatikan definisi awal

dari data warehouse yang digunakan dalam pemrosesan analisis

perusahaan.

6. Mendapatkan pelatihan secara benar, untuk mendapatkan landasan yang

kuat berupa pengetahuan yang mendukung keputusan bagi semua anggota

sebelum proyek mulai dijalankan.

7. Mendapatkan sumber yang benar, untuk mendapatkan ini kita dapat

mencari suatu badan atau konsultan yang memahami benar proses data

warehouse yang akan kita buat atau kita dapat pula mencari perusahaan

yang sukses dalam mengimplementasikan data warehousenya, sehingga

kita dapat belajar dari pengalaman yang telah mereka miliki sebelumnya.

39

8. Pemilihan aplikasi pengaksesan data front end berdasarkan kebutuhan

dan kemampuan, sehingga aplikasi yang dipakai benar-benar terpakai

secara optimal dan memudahkan dalam pengaksesan data yang dibutuhkan

oleh pengguna.

2.15 Teori Persediaan dan Penjualan

2.13.1 Pengertian Persediaan

Dalam perusahaan manufaktur, persediaan terdiri dari persediaan produk

jadi, persediaan produk dalam proses, persediaan bahan baku, persediaan bahan

penolong, persediaan bahan habis pakai pabrik, dan persediaan suku cadang.

Dalam perusahaan dagang, persediaan hanya terdiri dari 1 (satu) golongan, yaitu

persediaan barang dagangan, yang merupakan barang yang dibeli untuk tujuan

dijual kembali. Transaksi persediaan yang terjadi di gudang, biasanya mencakup

hal berikut ini :

• Penerimaan produk

• Penempatan produk di bagian pemeriksaan

• Pengambilan produk dari bagian pemeriksaan

• Pengembalian produk kepada vendor jika produk tidak sesuai dengan

yang diharapkan

• Penempatan produk pada tempat penyimpanannya

• Pengesahan produk untuk dijual

• Pengambilan produk dari tempat penyimpanannya

• Pengepakan produk untuk pengiriman

• Pengiriman produk ke pelanggan

40

• Penerimaan produk dari pelanggan

• Pengembalian produk ke bagian persediaan dari pengembalian pelanggan

• Produk yang dikembalikan pelanggan dipisahkan dari bagian persediaan

2.13.2 Pengertian Penjualan

Mulyadi (1997, p204) berpendapat bahwa kegiatan penjualan terdiri dari

transaksi penjualan barang atau jasa, baik secara kredit maupun secara tunai.

Dalam transaksi penjualan kredit, jika order dari pelanggan telah dipenuhi

dengan pengiriman barang atau penyerahan jasa, untuk jangka waktu tertentu

perusahaan memiliki piutang kepada pelanggannya. Dalam transaksi penjualan

tunai, barang atau jasa baru diserahkan oleh perusahaan kepada pembeli jika

perusahaan telah menerima kas dari pembeli.

Jadi dapat dikatakan bahwa penjualan merupakan suatu kegiatan yang

dilakukan oleh penjual (perusahaan) dengan jalan menukarkan barang/ jasanya

kepada pembeli, dengan timbal balik berupa suatu imbalan yang sepadan dengan

besarnya nilai dari barang/ jasa yang diberikan tersebut. Imbalan tersebut dapat

diperoleh sebelum penyerahan barang/ jasa dilakukan (penjualan tunai), ataupun

dalam jangka waktu tertentu setelah barang/ jasa diserahkan (penjualan kredit).