2000000
-
Upload
alexsanderz-frei -
Category
Documents
-
view
15 -
download
1
description
Transcript of 2000000
BAB 2
LANDASAN TEORI
2.1 Teori – Teori Umum
2.1.1 Pengertian Database
Menurut Thomas Connolly dan Carolyn Begg (2010, p65), database adalah
koleksi dari berbagai data secara logis yang terkait, dan deskripsi dari data ini dirancang
untuk memenuhi kebutuhan informasi suatu organisasi.
Menurut Coronel, Morris, dan Rob (2012, p7), database adalah struktur
komputer yang terintegrasi yang menyimpan koleksi dari end-user data (fakta baku
untuk kepentingan pengguna) dan metadata (data yang menjelaskan data) .
2.1.2 Pengertian Data Warehouse
Menurut Ajit Singh (2011, p1, volume1), data warehouse adalah sistem
kompleks yang terdiri dari banyak komponen yang menyimpan highly-aggregated data
for decision support.
Menurut Thomas Connolly dan Carolyn Begg (2010, p1197), data warehouse
adalah sebuah koleksi data yang terdiri dari subject-oriented, integrated, time variant,
dan non volatile yang mendukung manajemen dalam proses pengambilan keputusan.
8
9
Menurut Thomas Connolly, Carolyn Begg, dan Richard Holowczak (2008,
p444), data warehouse adalah sebuah sistem basis data yang dirancang untuk
mendukung keputusan dengan menyajikan sudut pandang yang terintegrasi terhadap
data perusahaan yang disalin dalam sumber data yang berbeda.
Menurut Steve Williams dan Nancy Williams (2007, p201) data warehouse
adalah sebuah struktur data yang dioptimalkan untuk distribusikan. Ia mengoleksi dan
menyimpan data historis yang diintegrasikan dari berbagai sistem operasional dan
mengumpan satu atau lebih datamart. (Standar definisi dari institusi data warehouse).
Menurut Coronel, Morris, dan Rob (2012, p10), data warehouse adalah
database khusus untuk menyimpan data dalam bentuk optimal untuk mendukung
keputusan.
2.1.3 Karakteristik Data Warehouse
Karakteristik pada data warehouse menurut Thomas Connolly dan Carolyn
Begg (2010, p1197) adalah sebagai berikut:
a. Subject-oriented
Data warehouse harus berorientasi pada subjek yaiu data warehouse dibuat
berdasarkan subjek-subjek utama di didalam bisnis (seperti kontrak
konstruksi, nilai kontrak, dan jenis bangunan).
b. Integrated
Data warehouse harus terintegrasi karena sumber-sumber data warehouse
berasal dari berbagai lingkungan bisnis dengan sistem aplikasi yang berbeda.
10
Sumber data yang terintegrasi harus dibuat konsisten untuk menampilkan
tampilan data kepada user.
c. Time variant
Data warehouse hanya akurat dan valid pada beberapa poin dalam waktu
atau dalam waktu atau dalam interval waktu tertentu.
d. Non-volatile
Data tidak di update dalam waktu nyata tetapi di refresh dari sistem
orepasional secara rutin. Data baru selalu ditambahkan sebagai suplemen
untuk database, bukan pengganti.
2.1.4 Manfaat Data Warehouse
Menurut Mutaz M. Al-Debei (2011, p155-156, Issue33), berbagai macam
manfaat berwujud dan tidak berwujud dapat diperoleh dari aplikasi data warehouse.
Teknologi data warehouse dapat membantu manajer membuat keputusan yang lebih
efektif dengan menyediakan informasi yang digunakan dalam operasi bisnis sehari –
hari mereka.
Gambar 2.1 Manfaat data warehouse
(European Journal of Economics, Finance and Administrative Sciences, 2011, p156)
11
Menurut Thomas Connolly dan Carolyn Begg (2010, p1198), kesuksesan dalam
mengimplementasi data warehouse bisa memberikan manfaat besar bagi organisasi,
meliputi:
1. Adanya kemungkinan balik modal yang tinggi pada investasi.
Suatu organisasi harus memberikan sumber daya yang besar untuk menjamin
kesuksesan dalam membuat data warehouse dan biayanya bervariasi tergantung
dari solusi teknis yang ada. Namun, kemungkinan adanya kondisi balik modal
terhadap biaya yang dikeluarkan untuk investasi data warehouse relatif lebih
besar. Sehingga tidak perlu ada kekhawatiran akan anggapan adanya
pemborosan untuk investasi data warehouse ini.
2. Keuntungan yang kompetitif
Adanya kemungkinan balik modal yang besar terhadap investasi merupakan
bukti adanya keuntungan kompetitif dengan adanya teknologi ini. Keuntungan
kompetitif ini dicapai dengan memungkinkan para pengambil keputusan untuk
mengakses data sebelumnya tidak tersedia, tidak diketahui, atau informasi yang
tidak tercatat.
3. Meningkatkan produktivitas para pengambil keputusan di perusahaan.
Data warehouse dapat memungkinkan hal ini dengan mengtransformasikan data
menjadi informasi yang berarti. Teknologi ini menyediakan para manajer bisnis
untuk dapat melakukan analisis yang lebih konsisten sehingga pada akhirnya
terjadi peningkatan produktivitas.
12
2.1.5 Online Transaction Processing (OLTP)
Menurut Steve Williams dan Nancy Williams (2007, p201), OLTP adalah
program pengolahan real-time untuk tujuan operasional (bukan analitis) seperti
pencatatan deposit nasabah bank di mesin teller otomatis atau pelacakan pesanan
pelanggan baru.
Menurut Coronel, Morris, dan Rob (2012, p9), OLTP adalah database yang
dirancang untuk mendukung operasi perusahan sehari-hari.
Menurut Thomas Connolly, Carolyn Begg, dan Richard Holowczak (2008,
p548), OLTP adalah sistem database untuk proses bisnis seperti pengendalian persedian,
faktur pelanggan, dan point-of-sale. Sistem ini menghasilkan data operasional yang
rinci, saat ini, dan dapat berubah.
Menurut Thomas Connolly dan Carolyn Begg (2010, p1199) perbandingan
karakteristik utama sistem OLTP dan data warehouse dijelaskan pada tabel berikut ini:
Tabel 2.1 Perbedaan OLTP system dan data warehouse
(Thomas Connolly dan Carolyn Begg, 2010, p1199)
13
2.1.6 Arsitektur Data Warehouse
Gambar 2.2 Arsitektur Data Warehouse
(Thomas Connolly dan Carolyn Begg, 2010, p1204)
Menurut Thomas Connolly, dan Carolyn Begg (2010, p1203-1207), Komponen-
komponen utama data warehouse terdiri atas:
1. Operational Data Source
Sumber data untuk data warehouse diberikan dalam bentuk:
- Mainframe operasional data dalam database hirarki generasi pertama dan
jaringan database.
- Departmental data dalam sistem file prorietary seperti VSAM, RMS, dan
relational DBMS seprti informix dan oracle.
- Private data diselenggarakan pada workstation dan private servers.
- External system seperti database, internet tersedia secara komersial atau
database yang terkait dengan suppliers organisasi atau customers.
2. Operational Data Store
Arus repositori dan integrasi data operasional yang digunakan untuk analisis.
14
3. Load Manager
Load manager bertugas melaksanakan semua operasi yang berhubungan dengan
extraction dan loading data ke dalam warehouse, termasuk transformasi data
sederhana sebagai persiapan data untuk dimasukkan ke dalam warehouse.
Menurut Karina Novita Suryani dan Hira Laksmiwati Zoro (2012, p165, vol.1)
bahwa secara umum proses ETL bisa dibagi menjadi empat modul utama yaitu:
- Ekstrasi Data, data dari sumber diekstraksi dan biasanya langsung ditulis ke
dalam sebuah disk sementara dengan beberapa rekonstruksi minimal (karena
nantinya akan ada tahapan konversi/transformasi)
- Pembersihan Data, untuk menyaring data yang tidak diperlukan seperti data
yang tidak lengkap, data yang hilang, data yang terduplikasi, dan lain-
lainnya.
- Transformasi Data, data yang telah dibersihkan kemudian diubah agar sesuai
dengan format basis data sumber.
- Pemasukan Data, data akan dimasukkan ke dalam relasi target di dalam data
warehouse agar data siap di-query.
4. Warehouse Manager
Warehouse manager berupa:
- Melakukan analisis data untuk menjaga konsistensi data.
- Melakukan transformasi dan penggabungan sumber data dari penyimpanan
sementara ke dalam tabel-tabel data warehouse.
- Menciptakan index dan view pada base tables.
- Melakukan agregasi. (jika diperlukan)
- Melakukan back-up dan archieve / back-up data.
15
5. Query Manager
Query manager melakukan semua operasi yang berhubungan dengan
management user queries. Kompleksitas queries manager ditentukan oleh
fasilitas yang disediakan oleh end-user access tools dan basis data. Operasi yang
dilakukan komponen ini berupa pengarahan query pada tabel yang tepat dan
penjadwalan eksekusi query.
6. Detailed Data
Komponen ini menyimpan semua data detail dalam skema database. Pada
umumnya beberapa data tidak disimpan secara fisik tetapi dapat dilakukan
dengan cara agregasi. Secara periodik data detail ditambahkan ke data
warehouse untuk mendukung agregasi data.
7. Lightly and Highly Summarized Data
Komponen ini menyimpan semua data yang diringkas oleh warehouse manager.
Data perlu diringkas dengan tujuan untuk mempercepat kinerja query.
Rangkuman data turut diperlukan seiring dengan adanya data yang baru masuk
ke dalam data warehouse.
8. Archieve / Back-up Data
Komponen ini menyimpan data detail dan ringkasan data dengan tujuan untuk
menyimpan dan back-up data. Walaupun ringkasan yang diperoleh dari data
mendetail, ringkasan perlu di back-up juga apabila data tersebut disimpan
melampaui periode penyimpanan data detail.
16
9. Metadata
Komponen ini menyimpan semua definisi metadata (informasi mengenai data)
yang digunakan dalam proses dalam data warehouse. Metadata digunakan untuk
berbagai tujuan, antara lain:
- Proses extracting dan loading, metadata digunakan untuk menentukan
sumber data dalam data warehouse.
- Proses warehouse management, metadata digunakan untuk menghasilkan
tabel ringkasan.
- Sebagai bagian dari proses query management, metadata digunakan untuk
mengarahkan sebuah query pada sumber data yang tepat.
10. End-user Access Tools
Tujuan utama dari data warehouse adalah menyediakan informasi bagi pengguna
untuk pembuatan keputusan yang strategis dalam berbisnis. Para pengguna
berintetaksi dengan data warehose menggunakan end user access tools.
Berdasarkan kegunaan data warehouse, terdapat lima kategori end-user access
tools, yaitu:
- Reporting and Query Tools
Reporting tools meliputi production reporting tools dan report writers.
Production reporting tools digunakan untuk menghasilkan laporan
operasional secara berkala. Query Tools untuk relasional data warehouse
dirancang untuk menerima SQL, dan proses query data yang tersimpan di
warehouse.
17
- Application Development Tools
Application Development Tools menggunakan graphical data access tools
yang dirancang khusus untuk lingkungan client-server. Beberapa aplikasi
tersebut diintegrasikan dengan OLAP tools, dan dapat mengakses semua
database system utama.
- Executive Information System (EIS) Tools
EIS sering dikenal sebagai “everyone’s information system” (sistem
informasi setiap orang). Awalnya dikembangkan untuk mendukung
pembuatan kebutuhan top-level yang strategis. Akan tetapi, kemudian
meluas untuk mendukung semua tingkat manajemen.
EIS tools pada awalnya berhubungan dengan mainframes yang
memungkinkan para pengguna untuk membangun aplikasi pendukung
keputusan yang bersifat grafik untuk menyediakan sebuah overview
mengenai data perusahaan dan akses pada sumber data eksternal. Kini, EIS
banyak dilengkapi dengan fasilitas query dan menyediakan custom-build
applications untuk area bisnis seperti penjualan, pemasaran dan keuangan.
- Online Analytical Processing (OLAP) Tools
OLAP tools didasarkan pada konsep database yang bersifat
multidimensional dan memperbolehkan pengguna untuk menganalisis data
dari sudut pandang yang kompleks dan multidimensi. Alat Bantu ini
mengasumsikan bahwa data diatur dengan model multidimensi yang khusus
(MDDB) atau oleh sebuah relationaldatabase yang dirancang untuk
memungkinkan query multidimensi.
18
- Data Mining Tools
Data mining adalah proses menemukan korelasi, pola dan tren yang baru,
yaitu dengan melakukan penggalian sejumlah data menggunakan teknik
statistik, matematis, dan artificial intelligent (AI). Data mining memiliki
potensi untuk menggatikan kemampuan OLAPtools.
2.1.7 Konsep Pemodelan Data Warehouse
2.1.7.1 Entity Relationship Modelling (ER Modelling)
Menurut Thomas Connolly dan Carolyn Begg (2010, p342), ERModelling
adalah sebuah pendekatan top–down untuk perancangan basis data yang mulai dengan
mengindentifikasi data yang penting disebut entites dan relationship antar data harus
direpresentasikan dalam model.
Menurut Ms. Alpa R. Patel dan Jayesh M. Patel(2012, p240, vol2(2)), model ER
diwakili oleh diagram ER, yang menggunakan tiga simbol grafis dasar untuk konsep
data: entitas, relasi, dan atribut.
- Entitas
Entitas didefinisikan sebagai orang, tempat, benda, atau peristiwa yang
menarik bagi bisnis atau organisasi. Entitas merupakan kelas obyek, dimana
merupakan hal-hal di dunia nyata yang dapat diamati dan digolongkan oleh
sifat dan karakteristik.
- Relasi
Sebuah relasi dihubungkan dengan garis yang ditarik antara entitas. Ini
menggambarkan interaksi struktural dan asosiasi di antara entitas dan model.
Sebuah hubungan gramatikal ditunjuk oleh kata kerja, seperti memiliki,
19
milik, dan memiliki. Hubungan antara dua entitas dapat didefinisikan dalam
hal kardinalitas. Ini adalah jumlah maksimum contoh satu kesatuan yang
berhubungan dengan satu kejadian di tabel lain dan sebaliknya. Kardinalitas
yang mungkin adalah: satu-ke-satu(1:1), satu-ke-banyak (1:M), dan banyak-
ke-banyak (M:M).
- Atribut
Atribut menggambarkan karakteristik properti dari entitas. Untuk klarifikasi,
penamaan atribut konvensi adalah hal yang sangat penting. Nama atribut
harus unik dalam suatu entitas dan harus cukup jelas. Ketika sebuah instance
tidak memiliki nilai atribut, kardinalitas minimum atribut adalah nol, yang
berarti baik nullable atau opsional. Dalam pemodalan ER, jika kardinalitas
maksimum atribut lebih dari 1, pemodel akan mencoba untuk
menormalisasikan entitas dan akhirnya meningkatkan entitas lainnya. Oleh
karena itu, biasanya kardinaliatas maksimum atribut adalah 1.
2.1.7.2 Dimensionality Modelling
Menurut Thomas Connolly dan Carolyn Begg (2010, p1227) dimensionality
modeling adalah teknik logical design yang bertujuan untuk menyajikan data standar,
bentuk intuitif yang memungkinkan untuk mengakses high performance.
Dimensionality modeling menggunakan konsep dari Entity Relationship (ER)
dengan beberapa batasan yang penting. Setiap Dimensional model terdiri dari satu buat
tabel yang memiliki banyak Primary key (composite Primary key), yang disebut tabel
dimensi (dimensional table). Setiap tabel dimensi memiliki satu buah (non-composite)
20
primary key yang berhubungan dengan salah satu primarykey di tabel fakta.
Karakteristik ini disebut skema bintang (strar schema) atu starjoin.
Menurut Ms. Alpa R. Patel dan Jayesh M. Patel(2012, p242, vol2(2)),
Pemodelan multidimensi adalah teknik untuk konseptualisasi dan memvisualisasi model
data sebagai serangkaian langkah-langkah yang dijelaskan oleh aspek umum dari bisnis.
Hal ini terutama berguna untuk merangkum dan menata ulang data dan menyajikan view
dari data untuk mendukung analisis data. Pemodelan multidimensi berfokus pada data
numerik, seperti nilai-nilai, jumlah, berat, saldo, dan kejadian pemodelan. Multidimensi
memiliki beberapa konsep dasar: fakta, dimensi, dan ukuran (variable).
2.1.8 Komponen Dimensionality Modeling
2.1.8.1 Tabel Fakta (Fact table)
Menurut Thomas Connolly dan Carolyn Begg (2010, p1227), every dimensional
model (DM) is composed of one table with a composite primary key, called the fact
table”, yang berarti suatu tabel pada dimensional model (DM) yang isinya satu table
dengan composite primary key (PK), di sebut dengan fact table. Jadi primary key (PK)
pada tabel fakta merupakan beberapa foreign key.
Disebut juga tabel utama (major table), merupakan inti dari skema bintang dan
berisi data aktual yang akan dianalisis (data kuantitatif dan transaksi). Tabel fakta
adalah tabel yang umumnya mengandung angka dan data historis di mana key (kunci)
yang dihasilkan sangat unik karena key-nya merupakan kumpulan foreign key dan
primary key yang ada pada masing-masing tabel dimensi yang berhubungan atau
merupakan tabel terpusat dari skema bintang. Tabel fakta menyimpan tipe-tipe measure
21
yang berbeda, seperti measure, yang secara langsung terhubung dengan tabel dimensi
dan measure yang tidak berhubungan dengan tabel dimensi.
2.1.8.2 Tabel Dimensi (Dimensional Table)
Menurut Thomas Connolly dan Carolyn Begg(2010, p1227), tabel dimensi
(Dimensional Table) a set of smallertables called dimension tables”, yang berarti
sekumpulan tabel-tabel yang lebih kecil dari fact table pada dimensional model (DM),
disebut dimension tables. Setiap dimension tables mempunyai non-composite primary
key.
Disebut juga tabel kecil (minor table), biasanya lebih kecil dan memegang data
deskriptif yang mencerminkan dimensi suatu bisnis. Tabel dimensi adalah tabel yang
berisikan kategori dengan ringkasan detail data yang dapat dilaporkan seperti laporan
keuntungan pada tabel fakta dapat dilaporkan sebagai dimensi waktu (yang berupa per
bulan, perkuartal, dan pertahun).
2.1.9 Komponen Dimensionality Modeling
2.1.9.1 Star Schema
Menurut Thomas Connolly dan Carolyn Begg(2010, p1227), Star Schema adalah
model dimensional data yang memiliki fact table di tengah,dikelilingi oleh
denormalized dimension tables.
Selain itu star schema memudahkan end user untuk memahami struktur database
pada data warehouse yang di rancang.
Keuntungan dari penggunaan star schema:
1. Respon data lebih cepat daripada perancangan database operasional.
22
2. Mempermudah dalam hal modifikasi atau pengembangan data warehouse
yang terus menerus.
3. End-user dapat menyesuaikan cara berpikir dan menggunakan data.
4. Menyederhanakan pemahaman dan penulusuran metadata bagi pemakai dan
pengembang.
Gambar 2.3 Star Schema (dimensional model) for property sales of Dream
Homes
(Thomas Connolly dan Carolyn Begg, 2010, p1228)
2.1.9.2 Snowflake Schema
Menurut Thomas Connolly dan Carolyn Begg(2010, p1229), snowflake schema
adalah model dimensional data yang memiliki fact table di tengah, dikelilingi oleh
normalized dimension tables.
Keuntungan dari skema snowflake:
1. Kecepatan memindahkan data dari data OLTP ke dalam metadata.
23
2. Sebagai kebutuhan dari alat pengambilan keputusan tingkat tinggi dimana
dengan tipe yang seperti ini seluruh struktur dapat digunakan sepenuhnya.
3. Banyak yang beranggapan lebih nyaman merancang dalam bentuk normal
ketiga.
Gambar 2.4 Part of star schema (dimensional model) for property sales of Dream Home
with normalized version of Branch dimension table
(Thomas Connolly dan Carolyn Begg, 2010, p1229)
2.1.9.3 Starflake Schema
Menurut Thomas Connolly dan Carolyn Begg (2010, p1229), starflake schema
adalah model dimensional data yang memiliki fact table di tengah, dikelilingi oleh
normalized dan denormalized dimension tables.
24
Gambar 2.5 Starflake Schema
(Thomas Connolly dan Carolyn Begg, 2010, p1229)
2.1.10 Kekurangan Data Warehouse
Menurut Ofori Boateng (2011, p230, vol5(2)), data warehouse tidak optimal
dalam lingkungan data tidak terstruktur dikarenakan:
- Karena data harus diekstrak, transform, dan dimuat ke dalam data
warehouse, ada unsur keterlambatan data dalam data warehouse.
- Biaya yang tinggi.
- Data warehouse bisa usang dalam tempo yang relatif cepat.
- Duplikasi fungsional mahal mungkin harus dikembangkan.
25
2.2 Teori Khusus
2.2.1 Teori Penjualan
Mengacu pada pendapat Kotler (2006, p457), penjualan merupakan proses dimana
pembeli dan penjual dipertemukan karena adanya suatu kebutuhan, melalui pertukaran
informasi dan ketertarikan suatu kebutuhan. Penjualan membutuhkan dorongan dengan
menggunakan iklan atau publish kepada masyarakat luas untuk menampilkan dorongan
efektivitas antara penjual dan pembeli. Dengan adanya informasi yang ditarik keluar,
maka penjualan barang atau jasa tertentu menjadi meningkat sesuai berjalannya waktu
Penjualan merupakan kegiatan yang dilakukan oleh para pengusaha untuk
menawarkan barang atau jasa sesuai dengan kebutuhan masing – masing pihak.
Penjualan sendiri memiliki fungsi yang penting dalam perputaran suatu nilai, dimana
nilai tersebut berguna untuk memenuhi kebutuhan hidup setiap orang
2.2.2 Teori Pembelian
Menurut Mulyadi (2008,p316), Pembelian adalah serangkaian tindakan untuk
mendapatkan barang dan jasa melalui pertukaran, dengan maksud untuk digunakan
sendiri atau dijual kembali.
2.2.3 Teori Retur
Menurut Achun (2010,p1), retur penjualan adalah pengembalian barang dari
pelanggan karena hal tertentu mungkin karena rusak dalam perjalanan atau pengiriman
barang yang tidak memenuhi spesifikasi yang diinginkan pelanggan.