BAB 2 LANDASAN TEORI - Universitas Islam Indonesia
Transcript of BAB 2 LANDASAN TEORI - Universitas Islam Indonesia
7
BAB 2
LANDASAN TEORI
2.1. Linked Data
Linked data merupakan sekumpulan langkah/metode terbaik untuk
mempublikasikan sekaligus menghubungkan data terstruktur pada web (Heath,
2011). Hal ini didasarkan pada asumsi dimana nilai dan kegunaan sesuatu data akan
meningkat apabila terhubung dengan sumber data lainnya. Untuk itu model RDF
digunakan sebagai format representasi data beserta RDF link untuk menghubungkan
sekumpulan data dari berbagai sumber. RDF link memiliki fungsi seperti hyperlink
yang menghubungkan sekumpulan halaman web di internet, hanya saja pada RDF
link dapat dinyatakan sebagai sesuatu data memiliki relasi tertentu dengan data
lainnya. Contohnya seperti penggunaan RDF link pada sekumpulan orang untuk
menyatakan relasi bahwa mereka saling kenal satu sama lainnya, atau pada
perpustakaan untuk menyatakan sekumpulan buku yang dikarang oleh pengarang
tertentu. Dengan ini, sekumpulan data yang tadinya terisolir atau terpisah satu sama
lain dapat saling terhubung menjadi satu kesatuan membentuk global data space atau
yang dikenal juga dengan web of data.
Linked Data pada prinsipnya terdiri dari empat prinsip dasar yaitu :
1. Menggunakan Unified Resource Identifier (URI) untuk
mengidentifikasi things (segala sesuatu yang dapat dianggap sebagai
sumber daya web, seperti nama benda, tempat, kejadian, dan
sebagainya).
2. Menggunakan HTTP URI yang memungkinkan pengguna dapat
mengakses detil dari things tersebut..
3. Memanfaatkan RDF dan SPARQL (SPARQL Protocol and RDF Query
Language) sebagai standar untuk menyediakan informasi yang
bermanfaat bagi pengguna ketika seseorang melihat detil sebuah URI.
4. Menyediakan tautan ke URI lainnya, sehingga pengguna dapat
menemukan informasi terkait lainnya berkenaan dengan things tersebut
8
Prinsip-prinsip dalam dokumen tersebut menyediakan panduan untuk
merealisasikan generasi web masa mendatang yakni web of data. Kemunculan
generasi web baru ini ditandai dengan proyek Linking Open Data yang didanai dan
didukung oleh W3C Semantic Web Education and Outreach (SWEO) Interest Group.
Proyek ini sendiri bertujuan untuk memperluas web dengan data-data yang dapat
dibagi-pakai dengan cara mempublikasikan berbagai macam open data set dalam
format RDF di web dan mengatur tautan-tautan RDF di antara item-item data dari
berbagai sumber data. Hingga September 2010, proyek tersebut telah
mempublikasikan dan menghubungkan berbagai data set yang terdiri dari lebih 19
miliar RDF triple Data set tersebut disebut sebagai “LOD cloud” sebagaimana
ditunjukkan pada gambar 2.1 (per Agustus 2014).
(http://esw.w3.org/TaskForces/CommunityProjects/LinkingOpenData/DataSets).
Gambar 2.1 Linked Open Data Cloud per Agustus 2014
Berbeda dengan visi web semantik yang baku, linked data secara umum
adalah penerbitan data secara terstruktur dalam RDF dengan menggunakan URI dari
pada fokus pada level ontology atau interface (Hasusenblas, 2009). Pada linked data,
tiap item data yang ada terbagi atas dua macam, yaitu information resource (berupa
9
data atau dokumen digital) dan non-information resource (berupa identitas di dunia
nyata). Pada information resource, apabila item tersebut ditelusuri, maka server akan
merespon dengan HTTP response code 200 (ok) dan mengirim ke client item data
tersebut. Sedangkan pada no-information resource HTTP redirecting item/entitas
tersebut. Server cukup merespon dengan HTTP response code 300 (see other).
Kemudian client akan diarahkan ke file RDF yang mendeskripsikan item/entitas
yang diminta.
2.1.1. URI (Uniform Resource Identifier)
Dalam komputer, satu URI (Uniform Reource Identifier) adalah sebuah
string karakter yang digunakan untuk mengidentifikasi nama atau sumber di internet.
Dengan URI yang sudah di identifikasikan memungkinkan untuk mengakses
representasi sumber daya melalui jaringan (www) dengan menggunakan protocol
tertentu. URI menunjuk ke sebuah resource di internet, URI biasanya terdiri dari
bagian yang disebut skema (scheme) yang diikuti sebuah alamat. URI diakses
dengan format skema://alamat.resource atau skema:alamat.resource. Misalnya URI
http://yahoo.com menunjukkan alamat resource yahoo.com yang dipanggil lewat
skema HTTP walaupun HTTP adalah skema yang yang sering digunakan, namun
masih tersedia skema-skema lain, misalnya telnet, FTP, News, dan sebagianya.
Secara umum URI terdiri dari dua jenis yaitu, URL (Uniform Resource
Location) dan URN (Uniform Resource Name). URL dugunakan untuk menetukan
dimana letak dari nama atau sumber daya yang dicari, sedangkan URN digunakan
untuk menunjukkan identitas dari sumber daya yang dicari. Dengan kata lain, URL
dapat digambarkan seperti alamat rumah seseorang, sedang URN merupakan nama
dari orang tersebut.
2.2. Vocabulary
Pada linked data, vocabulary mendefinisikan konsep-konsep dan
hubungan-hubungan (disebut juga dengan term) yang digunakan untuk
mendeskripsikan dan merepresentasikan suatu bidang tertentu, vocabulary digunakan
untuk mengelompokkan istilah-istilah yang dapat digunakan dalam aplikasi tertentu,
10
katerteristik hubungan dan menentukan batasan-batasan yang mungkin menggunakan
istilah tersebut. Dalam implementasinya, vocabulary bisa sangat kompleks (dengan
ribuan istilah) atau sangat sederhana (menggambarkan satu atau dua konsep saja).
Peran dari vocabulary dalam linked data adalah untuk menentukan
integrasi data, ketika misalnya adanya ambiguitas pada istilah yang digunakanan
dalam kumpulan data yang berbeda, atau ketika sedikit pengetahuan tambahan dapat
menyebabkan penemuan hubungan baru. Misalnya data di bidang perawatan
kesehatan, professional medis menggunakannya untuk merepresentasikan
pengetahun tentang gejala, penyakit dan perawatan. Perusahaan farmasi
menggunakannya untuk mewakili informasi tentang obat, dosis dan alergi.
Menggabungkan pengetahuan ini dari masyarakat medis dan farmasi dengan data
pasien memungkinkan berbagai macam aplikasi cerdas seperti alat-alat pendukung
keputusan yang mencari pengobatan, sistem memantau khasiat obat dan efek
samping yang mungkin timbul dan alat-alat yang mendukung penelitian
epidemologi. Jenis lain dengan menggunakan vocabulary adalah untuk mengatur
pengetahuan. Perpustakaan, museum, perusahaan, aplikasi jaringan sosial dan
komunitas lain yang mengolah sejarah, dam item lainnya yang dapat menggunakan
vocabulary, menggunakan stadart formal untuk memanfaatkan linked data.
Dalam linked data, disarankan untuk menggunakan vocabulary yang telah
dibuat sebelumnya. Pembuatan vocabulary baru dilakukan apabila vocabulary yang
sudah ada dianggap tidak cocok untuk digunakan. Untuk memenuhi kebutuhan yang
berbeda, W3C menawarkan beberapa teknik untuk menggambarkan dan menentukan
berbagai bentuk vocabulary dalam format standart. Pilihan antara teknologi yang
berbeda tergantung pada tingkat kerumitan dan perlakuan yang diperlukan oleh
aplikasi tertentu. Berikut sejumlah petunjuk terkait dengan penggunaan vocabulary
pada linked data (Hausenblas, 2009) :
1. Tidak diciptakan kembali vocabulary yang serupa dari nol, tetapi lengkapi
yang telah ada untuk mempresentasikan data yang digunakan.
2. Data disediakan dalam format yang dapat dikonsumsi oleh manusia dan
mesin.
11
3. URI yang digunakan harus bersifat deferent agar client dapat menulusuri
vocabulary tersebut.
4. Jika memungkinkan, dapat digunakan vocabulary yang dipakai orang lain
5. Seluruh informasi disajikan secara eksplisit.
2.3. RDF (Resource Description Framework)
RDF (Resource Description Framework) adalah framework yang
mendefinisikan resource di dalam web (W3C, 2014). RDF memungkinkan
pengembang web untuk membuat statement terhadap resources yang ada dari sebuah
web. RDF statement memiliki struktur yang sederhana. Tiap statement memiliki
bentuk yang disebut triple yang terdiri dari predicate, subject, dan object (Daum,
2003). Contohnya, dalam sebuah kalimat “Ellen Siever is author of Linux in A
Nutshell”, subjeknya adalah “Ellen Siever”, predikatnya adalah “is author of”, dan
objeknya adalah “Linux in A Nutshell”. Semua statement dalam RDF memiliki
bentuk yaitu subject has property. Pada contoh statement sebelumnya, property-nya
adalah “is author of”. Property memiliki dua tipe, yaitu object property dan literal.
Object property adalah sebuah objek dari suatu statement yang dapat
mengarahkan/mereferensikan kepada resources yang lain. Literal adalah objek dari
suatu stement yang bernilai string. Berikut adalah anatomi dari sebuah RDF
statement yang dapat dilihat pada table 2.1.
Tabel 2.1 Anatomi RDF statement
Statement Property Domain Example
Subject Resource Ellen Siever
Predicate Property
name
Is auhtor of
Object Property
value
Resource or literal “Linux in A Nutshell”.
RDF juga merupakan model berbentuk graf untuk merepresentasikan resource dan
relasinya. Resource yang direpresentasikan adalah seluruh pengetahuan manusia
yang kemudian dimodelkan kedalam bentuk subyek, predikat, dan objek. Statement
RDF berupa triple, yaitu subject, predicate, object (Manola et al, 2004). Sumber
12
(subject) memiliki property (predicate) dengan nilai khusus (object). Subject,
predicate, dan object dapat didefinisikan dalam hal resource, property dan value
sebagai :
1. Subject : Resource (seseorang, tempat, atau barang), pernyataan tesebut
digambarkan. Suatu RDF dapat berupa sesuatu hal dalm model data
(dokumen, penggunaan, produk dll) dan secara unik diidentifikasi oleh
URI yang dapat berupa URL.
2. Predicate : Property (nama, kota, gelar, warna, bentuk dan karakteristik)
dari subjek (orang, tempat, dan benda) dan secara unik diidentifikasi
oleh URI.
3. Object : Value dapat ditentukan untuk property (nama, kota,
gelar,/judul, warna, bentuk, karakteristik) yang mendeskripsikan subjek
(orang, tempat atau benda). Nilai tersebut dapat berlaku pada jenis data
RDF (RDF mendukung seluruh jenis data XML).
Subyek dan objek pada konsep triple merupakan entitas fisik (nyata).
Sedangkan predikat pada konsep tersebut merupakan entitas virtual (tidak nyata)
seperti sebuah relasi yang menyatakan adanya hubungan namun tidak dapat
dipegang/disentuh seperti yang digambarkan pada gambar 2.2
Gambar 2.2 model graph RDF
Agar RDF dapat dipahami oleh komputer maka diperlukan sebuah
identifier. Nantinya identifier ini akan diberikan pada entitas yang memiliki
informasi yang saling berkaitan. Bentuk identifier pada RDF adalah URI (uniform
http://www.example.org/index.html
Jhon
Has a creator
13
resource identifier) yang merupakan sebuah string yang mirip dengan URL (uniform
resource locator), seperti pada contoh berikut ini :
1. Subject http://www.example.org/index.html
2. Predicate http://purl.org/dc/elements/1.1/creator
3. Object http://www.example.org/staffid/85740
2.4. RDF Schema
RDF menyediakan langkah sederhana untuk membuat pernyataan tentang
sumber data (resource), menggunakan penamaan properti dan nilai. Selain itu RDF
juga memiliki kemampuan untuk mendefinisikan perbendaharaan kata (vocabularies)
untuk digunakan dalam pernyataan-pernyataan, khusunya untuk mengindikasikan
penjelasan mengenai jenis-jenis spesifik atau kelas-kelas dari sumber daya-nya.
Model RDF schema memiliki kemiripan dengan yang digunakan oleh object
oriented, yaitu dengan memiliki class, relation dan instance. Class adalah kumpulan
dari obyek yang memiliki kesamaan karakter. Relation adalah sifat hubungan antar
kelas. Property adalah karakter dari sebuah kelas. Instances adalah sebuah obyek
yang sesungguhnya.
RDF schema tidak menghasilkan spesifikasi kelas dan properti secara
nyata. Sebagai gantinya bagan RDF menyediakan kerangka untuk menguraikan
spesifikasi kelas dan properti-propertinya.Kelas-kelada didalam bagan RDF
didefinisikan seperti kelas didalam bahasa pemrograman berorientasi obyek. Gambar
2.3 adalah salah satu con dari penggunan bagan RDF yang menjelaskan kelas Horse
yang merupakan subkelas dari kelas Animal.
14
<?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xml:base="http://www.animals.fake/animals#"> <rdf:Description rdf:ID="animal"> <rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/> </rdf:Description> <rdf:Description rdf:ID="horse"> <rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/> <rdfs:subClassOf rdf:resource="#animal"/> </rdf:Description> </rdf:RDF>
Gambar 2.3 RDF Schema yang diimplementasikan denga kelas “Animal”
2.5. D2R Server
D2R server adalah proyek yang dikembangkan di Universitas Freie di
Berlin yang mengadopsi standar W3 Consortium didasarkan pada bahasa pemetaan
D2R server. Tujuan D2R server adalah menerbitkan konten database relasional
dalam bentuk RDF. Dasar fungsi D2R server tergantung pada mekanisme pemetaan
untuk mengubah dan relasional (contoh SQL) kedalam RDF. Selain itu, D2R server
memberikan fungsionalitas sebagai WebAgen untuk menampilkan data dengan
SPARQL.
Distribusi D2R dibagi ke dalam dua bagian utama (Bizer, 2009)
ditunjukkan pada gambar 2.4, yang pertama adalah merupakan bagian server yang
sebenarnya adalah antarmuka D2RQ engine, yang merupakan logical core dari
penerapan yang bertugas mengelola database (RDF dan non-RDF) dengan file
pemetaan, dan resource eksternal lain pada internet. D2R server menyediakan tiga
interface yang berbeda untuk pertukaran data dengan menggunakan protocol HTTP,
SPARQL, untuk semantic query, RDF untuk linked data clients dan HTML untuk
normal browser. Bagian kedua, dan mungkin adalah bagian yang terpenting dari
aplikasi mesin D2RQ adalah mengatur proses penerjemahan dari data relasional
menjadi RDF. Untuk menggunakan D2RQ file mapping yang ditentukan pengguna
dengan menentukan vocabularies pada data yang ada dalam database non-RDF.
15
Gambar 2.4 arsitektur D2R server
2.6. DR2Q Mapping
D2RQ mapping adalah model untuk mendeskripsikan hubungan antar data
dan vocabularies dengan bahasa pemetaan deklaratif. Sebuah pemetaan D2RQ itu
sendiri merupakan sebuah dokumen RDF yang ditulis dalam format Turtle sintaks
(Cyganiak, 2009). Pemetaan/mapping dinyatakan dengan menggunakan istilah-
istilah dalam namespace D2RQ :
http://www.wiwiss.fu-berlin.de/suhl/bizer/D2RQ/0.1#
Contoh dari D2RQ mapping yang didefinisikan dalam skema RDF D2RQ
(Turtle, RDF/XML) (Cyganiak, 2012) :
# D2RQ Namespace
@prefix d2rq:<http://www.wiwiss.fu-berlin.de/suhl/bizer/D2RQ/0.1#> .
# Namespace of the ontology
@prefix : <http://annotation.semanticweb.org/iswc/iswc.daml#> .
# Namespace of the mapping file; does not appear in mapped data
@prefix map: <file:///Users/d2r/example.ttl#> .
# Other namespaces
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
16
map:Database1 a d2rq:Database;
d2rq:jdbcDSN "jdbc:mysql://localhost/iswc";
d2rq:jdbcDriver "com.mysql.jdbc.Driver";
d2rq:username "user";
d2rq:password "password";
.
# -----------------------------------------------
# CREATE TABLE Conferences (ConfID int, Name text, Location text);
map:Conference a d2rq:ClassMap;
d2rq:dataStorage map:Database1;
d2rq:class :Conference;
d2rq:uriPattern "http://conferences.org/comp/confno@@Conferences.ConfID@@";
.
map:eventTitle a d2rq:PropertyBridge;
d2rq:belongsToClassMap map:Conference;
d2rq:property :eventTitle;
d2rq:column "Conferences.Name";
d2rq:datatype xsd:string;
.
map:location a d2rq:PropertyBridge;
d2rq:belongsToClassMap map:Conference;
d2rq:property :location;
d2rq:column "Conferences.Location";
d2rq:datatype xsd:string;
Pemetaan mendefinisikan virtual graph RDF yang berisi informasi dari
database. Hal ini mirip dengan konsep pandangan di SQL, kecuali bahwa struktur
data virtual adalah graph RDF buka relasional table virtual. Virtual RDF graph dapat
diakses dengan berbagai cara. D2RQ Platform menyediakan SPARQL akses, linked
data server, RDF dump generator, dan antarmuka HTML yang sederhana.Pemetaan
D2RQ dapat ditulis langsung pada editor teks yang ada dalam sistem operasi.
Data dipetakan ke dalam bentuk RDF, ditampilkan pada gambar 2.5
menggunakan d2rq:ClassMaps dan d2rq:PropertyBridge, objek-objek yang penting
dalam mapping adalah dalam class map. Sebuah class map merepresentasikan class
atau kelompok class yang sama dari sebuah vocabularies. Sebuah class map
17
menentukan bagaiman URI di generate untuk setiap instance pada class. Setiap class
map memiliki property bridge yang menentukan bagaimana property dan instance
dibuat.
Gambar 2.5 mapping data ke dalam bentuk RDF
2.7. SPARQL
SPARQL adalah akronim untuk Simple Protocol And RDF Query
Languange. Standar SPARQL mendefinisikan protocol jaringan untuk bertukar query
dan bahasa untuk mengekpresikan query. SPQRQL mengadopsi sintak SQL-like
untuk mengekpresikan query atau untuk mengambil data yang ditulis menggunakan
RDF atau XML. Dengan adanya SPARQL, maka masing-masing sumber data bisa
terhubung satu dengan lainnya. Pada dasarnya, SPARQL merupakan query untuk
mencocokan bentuk graph (Perez, 2006). Graph tersebut dicocokan dengan berbagai
endpoint dari repository yang dituju untuk mencari kemungkinan dari solusi yang
ada. SPARQL dianggap setara denga bahasa SQL. Hanya saja struktur dari SPARQL
lebih sederhana dan gampang untuk diimplementasikan.
Contoh berikut menunjukkan query SPARQL untuk mencari judul sebuah
buku dari graph data yang diberikan. Query ini terdiri dari dua bagian : klausa
SELECT mengidentifikasi variabel yang akan di tampilkan dari hasi query dan
18
klausa WHERE untuk memberikan pola graph dasar yang di cocokan dengan graph
data. Pola grafik dasar dalam contoh ini terdiri dari pola triple tunggal dengan
variabel tunggal ( ?judul ) di posisi objek.
SPARQL memungkinkan pengguna untuk menulis secara global perintah
query yang jelas. Hasil dari query adalah urutan solusi, sesuai dengan cara dimana
pola graph permintaan itu sesuai data. Mungkin ada nol, satu atau beberapa solusi
untuk hasil dari sebuah query SPARQL.
Data :
@perfix schema: < http://schema.org/> .
:a schema:name “Perpustakaan digital : perspektif perpustakaan
perguruan tinggi Indonesia” .
:a schema:contribution “Putu Laxman Pendit” .
:b schema:name “Interaction design in service compositions” .
:b schema:contribution “T. Dirgahayu” .
Query :
PREFIX schema: < http://schema.org/>
SELECT ?title ?author
WHERE{
?x schema:name ?title .
?x schema:contribution ?author.
}
Hasil query SPARQL :
Title Mbox Perpustakaan digital : perspektif perpustakaan perguruan tinggi Indonesia
Putu Laxman Pendit
Interaction design in service compositions T. Dirgahayu
Hasil query bisa berupa bentuk tabel (HTML) ataupun dalam bentuk RDF
– XML. Query dalam bentuk tabel disesuikan dengan subjek, predikat dan objek.
Menurut W3C (2008), SPARQL menspesifikasikan empat variasi query yang
berbeda-beda yang memilik tujuan berbeda-beda, yaitu :
19
1. PREFIX
Statement PREFIX merupakan sebuah metode yang digunakan sebagai
penunjuk yang membawa informasi dalam suatu halaman web. Pada
dasarnya PREFIX digunakan untuk menyingkat sebuah resource, dalam
hal ini dapat diwakili oleh URI (Uniform Resource Identifier).
2. SELECT query
Mengembalikan keseluruhan, atau sekumulan dari variabel yang diikat di
dalam pola dari suatu query.
3. CONSTRUCT query
Mengembalikan grafik RDF yang dikonstruksioleh variabel pengganti
dalam sekumpulan kerangka triple.
4. ASK query
Mengembalikan boolean yang menunjukkan apalak pola dari query cocok
atau tidak.
5. OPTIONAL
Statement OPTIONAL digunakan untuk mangatasi ketidak cocokan
struktur pola query dengan pola yang ada pada graf RDF.
6. DESCRIBE query
Mengembalikan keseluruhan grafik RDF yang menggambarkan sumber-
sumber data yang ditentukan.
2.8. Perpustakaan
Perpustakaan berdasarkan dari kata pustaka, yang artinya kita atau buku.
Sementara di dalam bahasa Inggris, diistilahkan dengan library. Istilah ini mengacu
dari kata latin liber atau libri yang mempunyai arti buku sehingga istilah
perpustakaan, library selalu dikaitkan dengan buku (Basuki, 2003). Dengan demikian
definisi dari perpustakaan adalah sebuah ruangan, bagian dari sebuah gedung yang
digunakan untuk menyimpan buku dan terbitan lainnya yang biasanya disimpan
menurut tata susunan tertentu untuk digunakan pembaca dan bukan untuk dijual.
Oleh karena itu dikatakan bahwa definisi perpustakaan adalah institusi yang
20
menyediakan koleksi bahan pustaka tertulis, tercetak dan terekam sebagai pusat
sumber informasi.
Berdasarkan klasifikasi, perpustakaan dapat di kelompokkan menjadi dua
klasifikasi yaitu yang pertama berdasarkan penerapan teknologi dan yang kedua
berdasarkan keragaman sumber daya informasinya. Kelompok perpustakaan yang
berdasarkan penerapan teknologi (Qalyubi, 2003) yaitu :
1. Perpustakaan Tradisional : Perpustakaan tradisional adalah
perpustakaan yang penyajian koleksinya dengan berbagai rak koleksi
buku dan pencatatan dilakukan secara manual oleh petugas
pustakawan.
2. Perpustakaan Terotomasi : Perpustakaan terotomasi yaitu
perpustakaan yang dalam pengelolaanya seperti pencatatan,
perekapan, dan pencetakan telah menggunakan teknologi komputer.
3. Perpustakaan Digital : Perpustakaan digital yaitu perpustakaan dengan
sistem informasi manajemen menggunakan teknologi informasi
ditambah koleksi-koleksi digital baik berupa jurnal, e-book, CD audio,
maupun koleksi video.
Kemudian menurut Pendit (2007), klasifikasi kelompok perpustakaan yang
kedua adalah berdasarkan keragaman sumber daya informasinya yaitu :
1. Perpustakaan biasa, Perpustakaan yang koleksi dokumennya semata-
mata masih menggunakan bahan tercetak.
2. Perpustakaan Multiple Media, Perpustakaan yang koleksinya sama
dengan perpustakaan biasa ditambah media analog dan elektronik.
3. Perpustakaan Hybrida, Perpustakaan yang koleksinya sama denga
perpustakaan Multiple Media tetapi ditambah dengan koleksi digital
yang interaktif.
4. Perpustakaan Multimedia Digital, Perpustakaan yang semua
koleksinya digital, bersifat iteraktif, dan dapat merupakan
perpustakaan tanpa koleksi fisik (virtual).
Belakangan ini seiring dengan perkembangan teknologi telah banyak
perpustakaan yang menerapkan sistem perpustakaan digital. Sistem perpustakaan
21
digital memiliki konsep yang sama dengan perpustakaan konvesional, namun definisi
perpustakaan digital masih sering diperdebatkan. Berikut beberapa definisi
perpustakaan digital yang diperoleh dari berbagai sumber, antara lain :
1. Menurut Digital Library Federation (DLF), Digital Library merupakan
suatu organisasi yang menyediakan sumber-sumber, termasuk staf-staf
ahli, untuk memilih, menyusun, menawarkan akses intelektual,
menterjemahkan, mendistribusikan, memelihara integritas koleksi-
koleksi dari perkerjaan-pekerjaan digital sehingga mereka tersedia
secara cepat dan ekonomis untuk digunakan/dimanfaatkan oleh
komunitas tertentu atau kumpulan komunitas.
2. Menurut Arms (2000), Digital library adalah kumpulan infortmasi
yang tertata dengan baik beserta layanan-layanan yang disediakannya.
Informasi ini disimpan dalam format digital dan dapat diakses melalui
jaringan computer.
3. Menurut Borbinha dkk (1998), perpustakaan digital bukan hanya
sebagai tempat penyimpanan yang menyediakan layanan untuk
menjaga, mengorganisasikan dan memberikan akses terhadap data
yang dimilikinya. Perpustakan digital seharusnya juga berperan
sebagai sistem untuk menyebarkan informasi, dan sebagai sarana yang
aktif mempromosikan,meyokong dan merekam proses
pembentukannya.
2.9. Bibliografi
Istilah bibliografi berasal dari kata Yunani yaitu “biblion” dan “graphien”.
“Biblion” berati buku sedangkan “graphien” artinya menulis. Jadi secara etimologis
bibliografi berarti penulisan buku. Basuki (1993) mendefinisikan bahwa bibliografi
berarti teknik sistematik untuk mebuat daftar deskriptif cantuman tertulis atau yang
diterbitkan terutama buku dan bahan pustaka yang sejenis.
Definisi lain dikemukakan oleh Neil (2004) yang mendefinisikan
bibliografi (bibliography) adalah daftar buku-buku dan karya ilmiah seperti artikel
jurnal yang tersusun secara sistematis. Bentuk bibliografi mulai dari daftar kutipan
22
pada akhir sebuah buku sampai dengan artikel lengkap sebagai sebuah publikasi
yang idependen.
Bibliografi mempunyai peranan sangat penting dalam bebagai bidang.
Beberapa ilmuwan telah membuktikan bahwa dengan bibliografi dapat diperoleh
keuntungan-keuntungan sebagai berikut (Basuki, 2003) :
1. Informasi mudah diperoleh secara lengkap beserta literatur terakhir di
berbagai bidang.
2. Memungkinkan akses cepat dan mudah terhadap informasi vital
mengenai perkembangan bebagai cabang pengetahuan
3. Bibliografi secara tidak langsung dapat mempromosikan
pendayaguaan buku dan bahan pustaka atau aplikasi bermanfaat dari
ilmu pengetahuan.
Sedangkan untuk tujuan utama dari bibliografi adalah membantu pengguna
dalam menentukan lokasi keberadaan sebuah bahan pustaka. Tujuan lainnya adalah
dengan adanya bibliografi yaitu sebagai sarana dalam pemilihan buku, identifikasi
dan verfikasi rincian bibliografis sebuah buku, serta lokasi bahan pustaka dalam
kaitannya dengan tempat penerbit, lokasi diperpustakaan atau tempat memesan
(Basuki, 2003).
2.10. SLiMS (Senayan Library Management System)
Salah satu aplikasi perpustakaan yang berfungsi sebagai perangkat digital
yang bisa mendukung kegiatan operasional di perpustakaan adalah aplikasi yang
bernama SENAYAN. Senayan, atau lengkapnya Senayan Library Management
System (SLiMS), adalah perangkat lunak sistem manajemen perpustakaan (library
management system) sumber terbuka yang dilisensikan di bawah GPL v3. Aplikasi
web yang dikembangkan oleh tim dari Pusat Informasi dan Humas Departemen
Pendidikan Nasional Republik Indonesia ini dibangun dengan menggunakan bahasa
pemrograman PHP, basis data MySQL, dan pengontrol versi Git. Pada tahun 2009,
Senayan memenangi INAICTA 2009 untuk kategori open source.
Sampai dengan saat ini aplikasi senayan telah diunduh lebih kurang
250.000 (dua ratus lima puluh ribu) kali. Sedikitnya ada sekitar 1589 perpustakaan
23
dan lembaga lain yang mengaku memakai aplikasi Senayan, diantaranya adalah
Pusat Studi Jepang UI, Perpustakaan Kedokteran Tropis UGM, Sekolah Indonesia-
Kairo di Mesir, Perpustakaan Indonesian Visual Art Archive, Lembaga Bantuan
Hukum Jakarta, Rumah Sakit PKU Muhammadiyah Yogyakarta, Rumah Sakit M.H.
Thamrin Cileungsi, Institut Bisnis dan Informatika Indonesia, Perpustakaan Institut
Seni Yogyakarta, Perpustakaan Pusat Univ Riau, Perpustakaan Umum Kabupaten
Pekalongan dan masih banyak lagi (www.slims.web.id, 2015).
2.11. Worldcat
WorldCat adalah suatu kumpulan katalog yang mencatat isi koleksi
72.000 perpustakaan di 170 negara dan teritori yang termasuk ke dalam koperasi
global Online Computer Library Center (OCLC). Dioperasikan oleh OCLC Online
Computer Library Center, Inc. sementara databasenya dipelihara secara kolektif oleh
perpustakaan yang terdaftar di OCLC. Worldcat dapat diakses melalui alamat situs
http://worldcat.org.
OCLC didirikan pada tahun 1967, dan pada tahun yang sama Fred
Kilgour mendirikan WorldCat. Catatan katalog pertama kedalam OCLC Online
Union Catalog (OLUC) pada tahun 1971. Tercatat hingga November 2014 worldcat
telah memuat lebih dari 330 juta catatan, mewakili lebih dari 2 milyar aset fisik dan
digital dalam 485 bahasa. Catalog worldcat dapat diakses melalui alamat
http://www.worldcat.org (www.wikipedia.org)
2.12. DBPedia
DBpedia adalah sebuah komunitas yang bergerak untuk mengekstrak
informasi terstruktur dari Wikipedia dan menyediakan informasi tersebut dalam
sebuah Web. DBpedia Indonesia merupakan Web yang menyediakan data hasil
ekstraksi dari Wikipedia Indonesia. Dengan DBpedia kita dapat melakukan
pencarian yang kompleks terhadap data dari Wikipedia. Dengan melalui DBpedia
dapat memudahkan penggunaan informasi dari Wikipedia dengan berbagai cara yang
lebih menarik.
Contoh aplikasi yang dikembangkan menggunakan data dari DBpedia
Indonesia dapat di akses melalui alamat http://id.dbpedia.org sedangkan untuk versi
24
global dapat diakases melalui alamat http://dbpedia.org. Aplikasi id.dbpedia.org
dirancang untuk memudahkan dalam mencari artikel-artikel dari Wikipedia yang
berkaitan dengan tempat-tempat, tokoh-tokoh yang ada di Indonesia. Data diperoleh
dengan melakukan query pada DBpedia Indonesia.
Untuk mengakses sebuah entitas dapat menggunakan URI resource dari
entitas tersebut. Apabila URI resourcediakses menggunakan Semantic Web
agents maka mengembalikan RDF descriptions, sedangkan apabila diakses
menggunakan Web Browser akan menampilkan informasi dari entitas yang diakses
dalam tampilan HTML sederhana. Setiap artikel Wikipedia dengan URL
http://id.wikipedia.org/wiki/JUDULARTIKEL akan memiliki
URI resource http://id.dbpedia.org/resource/JUDULARTIKEL. Di bawah ini adalah
beberapa contoh URI resource,
http://id.dbpedia.org/resource/Universitas_Islam_Indonesia
http://id.dbpedia.org/resource/Indonesia
2.13. VIAF
Virtual International Authority File (VIAF) adalah sebuah berkas
otoritas internasional. VIAF merupakan proyek gabungan dari beberapa perusahaan
nasional dan dioperasikan oleh Online Computer Library Center (OCLC). Proyek ini
awalnya diprakarsai oleh Perpustakaan Nasional Jerman dan Perpustakaan
Kongres Amerika Serikat.
Tujuan VIAF adalah untuk menyatukan berkas-berkas otoritas nasional
(seperti Name Authority File Jerman) menjadi satu berkas otoritas virtual. Pada
berkas-berkas ini, catatan identik dari berbagai data berbeda disatukan bersama-
sama. VIAF menerima jumlah data standar, yang terdiri dari pilihan "lihat" dan "lihat
juga" dari berkas asli, dan merujuk pada berkas otoritas asli. Data-data ini tersedia
secara daring dan tersedia untuk kepentingan penelitian dan pertukaran data. VIAF
diperbarui dengan protokol Open Archives Initiative. Nomor berkas juga disertakan
dalam artikel-artikel biografi di Wikipedia.
25
Sejak VIAF menjadi layanan OCLC pada awal tahun 2012, jumlah
lembaga yang berpartisipasi dengan VIAF telah berkembang dari 19 lembaga di 22
negara menjadi 34 lembaga di 29 negara (per Juli 2014). Dua puluh empat (24) dari
Kontributor VIAF perpustakaan nasional, dan tambahan 11 perpustakaan nasional
menyediakan data untuk VIAF melalui lembaga perpustakaan federal, konsorsium
atau pengaturan lainnya, sehingga total dari perpustakaan.
2.14. Penelitian Terdahulu
Beberapa penelitian yang berkaitan dengan linked data di antaranya adalah
penelitan yang dilakukan oleh Hausenblas (2009). Dalam penelitianya membahas
tentang web site yang menyediakan linked data dan pemanfaatan resource eksternal
seperti dbpedia. Selain itu dalam penelitiannya juga dimplementasikan bagaimana
memanfaatkan beberapa sumber daya external untuk membuat sebuah aplikasi linked
data yang bertopik “Cold War”. Dalam pencarian yang berhubungan dengan cold
war dalam beberapa linked data digunakan void (Vocabulary of Interlinked Dataset).
Void mendeskripsikan kelas dan property yang menggambarkan isi data dan
interlinking dengan data lainya.
Chavose (2013), Menggambungkan dan mengkoneksikan data internal dan
beberapa sumber linked data lain. Dalam penelitian tersbut membahas penerapan
informasi tentang pertanahan dengan pendekatan model linked data untuk membantu
penyebaran informasi tentang wilayah-wilayah yang memiliki potensi
pengembangan lahan. Untuk penyediaan informasi pertanahan, data-data dari setiap
data portal yang telah di definisikan ditulis langsungn kedalam RDF melalui antar
muka yang telah dibuat sebelumnya dan dipublikasikan menggunak pubby server.
Terdapat sumber lain yang dimanfaatkan dalam pengembangan system yaitu
Dbpedia untuk keterangan setiap data daerah, deskripsi lokasi tertentu dan
meanfaatkan peta daru google maps untuk menunjukkan peta suatu wilayah.
Informasi daerah didapatkan dengan memanfaatkan data pada Dbpedia diantaranya
adalah nama daerah, ibu kota, luas wilayah, populasi, koordinat walayah daerah,
daerah perbatasan wilayah tertentu, dan informasi dari badan pertanahan setempat.
26
Brandt (2013), melakukan penelitian tentang transparansi dana bantuan dari
beberapa lembaga atas perusahaan yang tergabung dalam organisasi IATI (The
international Aid Transparency Initiative) dengan pendekatan linked data. Penelitian
ini dilakukan untuk mempermudah lembaga-lembaga pemberi bantuan yang
tergabung dalam IATI dalam menyusun laporan bantuan. Dalam penelitian ini
dilakukan pengumpulan data tentang lembaga-lembaga yang tergabung dalam IATI,
informasi lembaga tersebut diambil dari beberapa sumber termasuk Dbpedia,
GeoNames dan dari IATI itu sendiri. Menggunakan bahasa pemrograman phyton
membentuk data-data IATI kedalam bentuk XML.
Patricia (2012), topik yang diangkat adalah tentang e-learning. Ide
penelitiannya didasari dari banyaknya data materi e-learning di internet yang tidak
terstruktur dan beragam, sehingga hal demikian menyulitkan dalam pencarian
sumber daya e-learning dan memerlukan banyak waktu karena proses pencarian,
mengetik, memilih , bookmark dan sebagainya dan itu dilaksanakan oleh manusia,
meskipun beberapa dari pencarian sumber daya tersebut dapat di eksekusi oleh
komputer. Untuk mengatasi masalah hal tersebut menggunakan pendektan linked
data dengan memanfaatkan sumber-sumber artikel dari Dbpedia, BibBas,
education.data.go.uk. Pada umumnya web hypertext membuat informasi cukup sulit
untuk dijelajahi oleh manusia. Dalam penelitian tersebut menggunakan langkah-
langkah standart dalam linked data yaitu menggunakan URI sebagai things dan
menggunaka SPARQL untuk query bahasa RDF.
Jhonson T dan Boock (2012), Linked data tentang ETD (electronic theses
and desertation ) yang mempublikasikan data ETD sebagai linked data, dari studi
kasus tersebut mengambil data-data koleksi ETD yang ada di Oregon State
University, menggunak R2RML untuk mempublikasikan database ke bentuk linked
data, memanfaatkan dataset dari Dublin Core medata dan menggunakan pubby
server untuk engine publikasi linked data.
Saquicela dkk (2010), membentuk geographical linked data untuk kasus
wilayah Spanyol. Dalam liked data yang dibangun menyediakan batas-batas wilayah,
populasi, gedung-gedung penting, lokasi industry. Pemanfaatan sumber linked data
lain yaitu DBpedia dan Geonames. Dari pemanfaatan sumber data diambil letak-letak
27
geografis suatu wilayah berupa pengumpulan URI dari sumber-sumber linked data
ditulis dalam spread sheets kemudian di konversi kedalam RDF menggunakn
framework R2O ODEMapster. Data yang sudah dipublikasikan kemudian
dintergrasikan dengan google maps untuk melihat peta wilayah sesuai letak-letak
geografis wilayah yang sudah dibuat dalam linked data.
Daniel Vila-Suero dkk (2012), mengangkat topik membentuk dataset
bibliografi dan penulis di perpustakaan nasional Spanyol Biblioteca Nacional de
España (BNE). Perpustakaan BNE yang memiliki lebih kurang 7 juta katalog
bibliografi mentrasformasi data katalog yang menggunakan format MARC 21 ke
dalam bentuk linked data dengan menggunakan MARiMbA sebagai alat pembentuk
linked data. Perpustakaan BNE menggunakan IFLA (International Federation of
Library Associations) sebagai ontologi serta memanfatkan eksternal resource
DBpedia, VIAF dan GND (Gemeinsame Normdatei, authority dataset dari
perpustakaan nasional Jerman).
Dari beberapa penelitian yang telah diuraikan sebelumnya terdapat beberapa
perbedaan metode yang ditunjukan pada tabel 2.1 dimana telah diringkas dari
masing-masing penelitian.
Table 2.1 Perbedaan tema penelitian
Peneliti Tema Penelitian Metode Hasil Hausenbals (2009)
Exploting Linked Data
RDF – SPARQL Aplikasi linked data “Cold War” dengan memanfaatkan linked data yang sudah ada
Saquicela dkk (2010)
Geographical Linked Data : a spanish Use Case
Framework R20+ODEMapster – SPARQL
Aplikasi geolinked data Spanyol
Chavose (2013) Linked Data for land portal
Drupal core, RDF, SPARQL
Menyediakan land portal sebagai linked data, menggunakan Drupal CMS
Patricia (2012) Linked data for improving student experience in searching e-learning resource
RDF-SPARQL Linked data e-learning. Hanya memanfaatkan sumber e-learning linked data yang sudah ada
Jhonson T dan Linked data service R2RML, RDF, Publikasi linked data ETD
28
Boock (2012) ETD (electronic theses and dissertation)
SPARQL
Brandt (2013) Linked data IATI Database, OWL, SPARQL
Publikasi linked data IATI
Daniel Vila-Suero dkk (2012)
datos.bne.es: a Library Linked Data Dataset
RDF, MARiMbA Membangun dataset bibliografi dalam bentuk linked data dengan memanfaatkan eksternal resource
Eko Budi Prasetyo (2015)
Prototipe repository linked data bibliografi
SLiMS, D2RQ, RDF, SPARQL
Membangun repository bibliografi dalam bentuk linked data pada aplikasi perpustakaan SLiMS
Dari beberapa penelitian tersebut umumnya membahas tentang bagaimana
penggunaan metode linked data yang sudah tersedia. Perbedaan pada penelitian ini
adalah selain menggunakan sumber linked data juga mempublish linked data yang
didalamnya sudah terdapat data yang diambil dari sumber data lain. Sumber data lain
yang diambil berbentuk sebuah alamat URI (Uniform Reource Identifier) yang
merujuk kepada data yang berkaitan dengan data bibliografi yang dimaksud.
Model proses mapping dari basis data menggunakan D2RQ mapping yang
memetakan setiap tabel-tabel dalam basis data menjadi bentuk RDF linked data.
Sebelum proses mapping dilakukan terlebih dahulu didesain URI untuk mewakili
setiap entitas data yang ada. Untuk menggambarkan bagaimana linked data
bibliografi dibentuk maka dibuat model RDF graph pada setiap class sesuai dengan
data basis data bibliografi.
Data bibliografi yang telah dirancang kemudian dipublish dengan
menggunakan D2R server. D2R server berfungsi menampilkan data sebagai
informasi dan untuk membuktikan bahwa data yang dibuat dalam bentuk RDF linked
data bisa diakses untuk menampilkan informasi sesuai dari data linked data
bibliografi yang telah dibuat.