BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

22
BAB 2 LANDASAN TEORI 2.1. Linked Data Linked data merupakan sekumpulan langkah/metode terbaik untuk mempublikasikan sekaligus menghubungkan data terstruktur pada web (Heath, 2011). Hal ini didasarkan pada asumsi dimana nilai dan kegunaan sesuatu data akan meningkat apabila terhubung dengan sumber data lainnya. Untuk itu model RDF digunakan sebagai format representasi data beserta RDF link untuk menghubungkan sekumpulan data dari berbagai sumber. RDF link memiliki fungsi seperti hyperlink yang menghubungkan sekumpulan halaman web di internet, hanya saja pada RDF link dapat dinyatakan sebagai sesuatu data memiliki relasi tertentu dengan data lainnya. Contohnya seperti penggunaan RDF link pada sekumpulan orang untuk menyatakan relasi bahwa mereka saling kenal satu sama lainnya, atau pada perpustakaan untuk menyatakan sekumpulan buku yang dikarang oleh pengarang tertentu. Dengan ini, sekumpulan data yang tadinya terisolir atau terpisah satu sama lain dapat saling terhubung menjadi satu kesatuan membentuk global data space atau yang dikenal juga dengan web of data. Linked Data pada prinsipnya terdiri dari empat prinsip dasar yaitu : 1. Menggunakan Unified Resource Identifier (URI) untuk mengidentifikasi things (segala sesuatu yang dapat dianggap sebagai sumber daya web, seperti nama benda, tempat, kejadian, dan sebagainya). 2. Menggunakan HTTP URI yang memungkinkan pengguna dapat mengakses detil dari things tersebut.. 3. Memanfaatkan RDF dan SPARQL (SPARQL Protocol and RDF Query Language) sebagai standar untuk menyediakan informasi yang bermanfaat bagi pengguna ketika seseorang melihat detil sebuah URI. 4. Menyediakan tautan ke URI lainnya, sehingga pengguna dapat menemukan informasi terkait lainnya berkenaan dengan things tersebut

Transcript of BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

Page 1: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

7

BAB 2

LANDASAN TEORI

2.1. Linked Data

Linked data merupakan sekumpulan langkah/metode terbaik untuk

mempublikasikan sekaligus menghubungkan data terstruktur pada web (Heath,

2011). Hal ini didasarkan pada asumsi dimana nilai dan kegunaan sesuatu data akan

meningkat apabila terhubung dengan sumber data lainnya. Untuk itu model RDF

digunakan sebagai format representasi data beserta RDF link untuk menghubungkan

sekumpulan data dari berbagai sumber. RDF link memiliki fungsi seperti hyperlink

yang menghubungkan sekumpulan halaman web di internet, hanya saja pada RDF

link dapat dinyatakan sebagai sesuatu data memiliki relasi tertentu dengan data

lainnya. Contohnya seperti penggunaan RDF link pada sekumpulan orang untuk

menyatakan relasi bahwa mereka saling kenal satu sama lainnya, atau pada

perpustakaan untuk menyatakan sekumpulan buku yang dikarang oleh pengarang

tertentu. Dengan ini, sekumpulan data yang tadinya terisolir atau terpisah satu sama

lain dapat saling terhubung menjadi satu kesatuan membentuk global data space atau

yang dikenal juga dengan web of data.

Linked Data pada prinsipnya terdiri dari empat prinsip dasar yaitu :

1. Menggunakan Unified Resource Identifier (URI) untuk

mengidentifikasi things (segala sesuatu yang dapat dianggap sebagai

sumber daya web, seperti nama benda, tempat, kejadian, dan

sebagainya).

2. Menggunakan HTTP URI yang memungkinkan pengguna dapat

mengakses detil dari things tersebut..

3. Memanfaatkan RDF dan SPARQL (SPARQL Protocol and RDF Query

Language) sebagai standar untuk menyediakan informasi yang

bermanfaat bagi pengguna ketika seseorang melihat detil sebuah URI.

4. Menyediakan tautan ke URI lainnya, sehingga pengguna dapat

menemukan informasi terkait lainnya berkenaan dengan things tersebut

Page 2: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

8

Prinsip-prinsip dalam dokumen tersebut menyediakan panduan untuk

merealisasikan generasi web masa mendatang yakni web of data. Kemunculan

generasi web baru ini ditandai dengan proyek Linking Open Data yang didanai dan

didukung oleh W3C Semantic Web Education and Outreach (SWEO) Interest Group.

Proyek ini sendiri bertujuan untuk memperluas web dengan data-data yang dapat

dibagi-pakai dengan cara mempublikasikan berbagai macam open data set dalam

format RDF di web dan mengatur tautan-tautan RDF di antara item-item data dari

berbagai sumber data. Hingga September 2010, proyek tersebut telah

mempublikasikan dan menghubungkan berbagai data set yang terdiri dari lebih 19

miliar RDF triple Data set tersebut disebut sebagai “LOD cloud” sebagaimana

ditunjukkan pada gambar 2.1 (per Agustus 2014).

(http://esw.w3.org/TaskForces/CommunityProjects/LinkingOpenData/DataSets).

Gambar 2.1 Linked Open Data Cloud per Agustus 2014

Berbeda dengan visi web semantik yang baku, linked data secara umum

adalah penerbitan data secara terstruktur dalam RDF dengan menggunakan URI dari

pada fokus pada level ontology atau interface (Hasusenblas, 2009). Pada linked data,

tiap item data yang ada terbagi atas dua macam, yaitu information resource (berupa

Page 3: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

9

data atau dokumen digital) dan non-information resource (berupa identitas di dunia

nyata). Pada information resource, apabila item tersebut ditelusuri, maka server akan

merespon dengan HTTP response code 200 (ok) dan mengirim ke client item data

tersebut. Sedangkan pada no-information resource HTTP redirecting item/entitas

tersebut. Server cukup merespon dengan HTTP response code 300 (see other).

Kemudian client akan diarahkan ke file RDF yang mendeskripsikan item/entitas

yang diminta.

2.1.1. URI (Uniform Resource Identifier)

Dalam komputer, satu URI (Uniform Reource Identifier) adalah sebuah

string karakter yang digunakan untuk mengidentifikasi nama atau sumber di internet.

Dengan URI yang sudah di identifikasikan memungkinkan untuk mengakses

representasi sumber daya melalui jaringan (www) dengan menggunakan protocol

tertentu. URI menunjuk ke sebuah resource di internet, URI biasanya terdiri dari

bagian yang disebut skema (scheme) yang diikuti sebuah alamat. URI diakses

dengan format skema://alamat.resource atau skema:alamat.resource. Misalnya URI

http://yahoo.com menunjukkan alamat resource yahoo.com yang dipanggil lewat

skema HTTP walaupun HTTP adalah skema yang yang sering digunakan, namun

masih tersedia skema-skema lain, misalnya telnet, FTP, News, dan sebagianya.

Secara umum URI terdiri dari dua jenis yaitu, URL (Uniform Resource

Location) dan URN (Uniform Resource Name). URL dugunakan untuk menetukan

dimana letak dari nama atau sumber daya yang dicari, sedangkan URN digunakan

untuk menunjukkan identitas dari sumber daya yang dicari. Dengan kata lain, URL

dapat digambarkan seperti alamat rumah seseorang, sedang URN merupakan nama

dari orang tersebut.

2.2. Vocabulary

Pada linked data, vocabulary mendefinisikan konsep-konsep dan

hubungan-hubungan (disebut juga dengan term) yang digunakan untuk

mendeskripsikan dan merepresentasikan suatu bidang tertentu, vocabulary digunakan

untuk mengelompokkan istilah-istilah yang dapat digunakan dalam aplikasi tertentu,

Page 4: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

10

katerteristik hubungan dan menentukan batasan-batasan yang mungkin menggunakan

istilah tersebut. Dalam implementasinya, vocabulary bisa sangat kompleks (dengan

ribuan istilah) atau sangat sederhana (menggambarkan satu atau dua konsep saja).

Peran dari vocabulary dalam linked data adalah untuk menentukan

integrasi data, ketika misalnya adanya ambiguitas pada istilah yang digunakanan

dalam kumpulan data yang berbeda, atau ketika sedikit pengetahuan tambahan dapat

menyebabkan penemuan hubungan baru. Misalnya data di bidang perawatan

kesehatan, professional medis menggunakannya untuk merepresentasikan

pengetahun tentang gejala, penyakit dan perawatan. Perusahaan farmasi

menggunakannya untuk mewakili informasi tentang obat, dosis dan alergi.

Menggabungkan pengetahuan ini dari masyarakat medis dan farmasi dengan data

pasien memungkinkan berbagai macam aplikasi cerdas seperti alat-alat pendukung

keputusan yang mencari pengobatan, sistem memantau khasiat obat dan efek

samping yang mungkin timbul dan alat-alat yang mendukung penelitian

epidemologi. Jenis lain dengan menggunakan vocabulary adalah untuk mengatur

pengetahuan. Perpustakaan, museum, perusahaan, aplikasi jaringan sosial dan

komunitas lain yang mengolah sejarah, dam item lainnya yang dapat menggunakan

vocabulary, menggunakan stadart formal untuk memanfaatkan linked data.

Dalam linked data, disarankan untuk menggunakan vocabulary yang telah

dibuat sebelumnya. Pembuatan vocabulary baru dilakukan apabila vocabulary yang

sudah ada dianggap tidak cocok untuk digunakan. Untuk memenuhi kebutuhan yang

berbeda, W3C menawarkan beberapa teknik untuk menggambarkan dan menentukan

berbagai bentuk vocabulary dalam format standart. Pilihan antara teknologi yang

berbeda tergantung pada tingkat kerumitan dan perlakuan yang diperlukan oleh

aplikasi tertentu. Berikut sejumlah petunjuk terkait dengan penggunaan vocabulary

pada linked data (Hausenblas, 2009) :

1. Tidak diciptakan kembali vocabulary yang serupa dari nol, tetapi lengkapi

yang telah ada untuk mempresentasikan data yang digunakan.

2. Data disediakan dalam format yang dapat dikonsumsi oleh manusia dan

mesin.

Page 5: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

11

3. URI yang digunakan harus bersifat deferent agar client dapat menulusuri

vocabulary tersebut.

4. Jika memungkinkan, dapat digunakan vocabulary yang dipakai orang lain

5. Seluruh informasi disajikan secara eksplisit.

2.3. RDF (Resource Description Framework)

RDF (Resource Description Framework) adalah framework yang

mendefinisikan resource di dalam web (W3C, 2014). RDF memungkinkan

pengembang web untuk membuat statement terhadap resources yang ada dari sebuah

web. RDF statement memiliki struktur yang sederhana. Tiap statement memiliki

bentuk yang disebut triple yang terdiri dari predicate, subject, dan object (Daum,

2003). Contohnya, dalam sebuah kalimat “Ellen Siever is author of Linux in A

Nutshell”, subjeknya adalah “Ellen Siever”, predikatnya adalah “is author of”, dan

objeknya adalah “Linux in A Nutshell”. Semua statement dalam RDF memiliki

bentuk yaitu subject has property. Pada contoh statement sebelumnya, property-nya

adalah “is author of”. Property memiliki dua tipe, yaitu object property dan literal.

Object property adalah sebuah objek dari suatu statement yang dapat

mengarahkan/mereferensikan kepada resources yang lain. Literal adalah objek dari

suatu stement yang bernilai string. Berikut adalah anatomi dari sebuah RDF

statement yang dapat dilihat pada table 2.1.

Tabel 2.1 Anatomi RDF statement

Statement Property Domain Example

Subject Resource Ellen Siever

Predicate Property

name

Is auhtor of

Object Property

value

Resource or literal “Linux in A Nutshell”.

RDF juga merupakan model berbentuk graf untuk merepresentasikan resource dan

relasinya. Resource yang direpresentasikan adalah seluruh pengetahuan manusia

yang kemudian dimodelkan kedalam bentuk subyek, predikat, dan objek. Statement

RDF berupa triple, yaitu subject, predicate, object (Manola et al, 2004). Sumber

Page 6: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

12

(subject) memiliki property (predicate) dengan nilai khusus (object). Subject,

predicate, dan object dapat didefinisikan dalam hal resource, property dan value

sebagai :

1. Subject : Resource (seseorang, tempat, atau barang), pernyataan tesebut

digambarkan. Suatu RDF dapat berupa sesuatu hal dalm model data

(dokumen, penggunaan, produk dll) dan secara unik diidentifikasi oleh

URI yang dapat berupa URL.

2. Predicate : Property (nama, kota, gelar, warna, bentuk dan karakteristik)

dari subjek (orang, tempat, dan benda) dan secara unik diidentifikasi

oleh URI.

3. Object : Value dapat ditentukan untuk property (nama, kota,

gelar,/judul, warna, bentuk, karakteristik) yang mendeskripsikan subjek

(orang, tempat atau benda). Nilai tersebut dapat berlaku pada jenis data

RDF (RDF mendukung seluruh jenis data XML).

Subyek dan objek pada konsep triple merupakan entitas fisik (nyata).

Sedangkan predikat pada konsep tersebut merupakan entitas virtual (tidak nyata)

seperti sebuah relasi yang menyatakan adanya hubungan namun tidak dapat

dipegang/disentuh seperti yang digambarkan pada gambar 2.2

Gambar 2.2 model graph RDF

Agar RDF dapat dipahami oleh komputer maka diperlukan sebuah

identifier. Nantinya identifier ini akan diberikan pada entitas yang memiliki

informasi yang saling berkaitan. Bentuk identifier pada RDF adalah URI (uniform

http://www.example.org/index.html

Jhon

Has a creator

Page 7: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

13

resource identifier) yang merupakan sebuah string yang mirip dengan URL (uniform

resource locator), seperti pada contoh berikut ini :

1. Subject http://www.example.org/index.html

2. Predicate http://purl.org/dc/elements/1.1/creator

3. Object http://www.example.org/staffid/85740

2.4. RDF Schema

RDF menyediakan langkah sederhana untuk membuat pernyataan tentang

sumber data (resource), menggunakan penamaan properti dan nilai. Selain itu RDF

juga memiliki kemampuan untuk mendefinisikan perbendaharaan kata (vocabularies)

untuk digunakan dalam pernyataan-pernyataan, khusunya untuk mengindikasikan

penjelasan mengenai jenis-jenis spesifik atau kelas-kelas dari sumber daya-nya.

Model RDF schema memiliki kemiripan dengan yang digunakan oleh object

oriented, yaitu dengan memiliki class, relation dan instance. Class adalah kumpulan

dari obyek yang memiliki kesamaan karakter. Relation adalah sifat hubungan antar

kelas. Property adalah karakter dari sebuah kelas. Instances adalah sebuah obyek

yang sesungguhnya.

RDF schema tidak menghasilkan spesifikasi kelas dan properti secara

nyata. Sebagai gantinya bagan RDF menyediakan kerangka untuk menguraikan

spesifikasi kelas dan properti-propertinya.Kelas-kelada didalam bagan RDF

didefinisikan seperti kelas didalam bahasa pemrograman berorientasi obyek. Gambar

2.3 adalah salah satu con dari penggunan bagan RDF yang menjelaskan kelas Horse

yang merupakan subkelas dari kelas Animal.

Page 8: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

14

<?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xml:base="http://www.animals.fake/animals#"> <rdf:Description rdf:ID="animal"> <rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/> </rdf:Description> <rdf:Description rdf:ID="horse"> <rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/> <rdfs:subClassOf rdf:resource="#animal"/> </rdf:Description> </rdf:RDF>

Gambar 2.3 RDF Schema yang diimplementasikan denga kelas “Animal”

2.5. D2R Server

D2R server adalah proyek yang dikembangkan di Universitas Freie di

Berlin yang mengadopsi standar W3 Consortium didasarkan pada bahasa pemetaan

D2R server. Tujuan D2R server adalah menerbitkan konten database relasional

dalam bentuk RDF. Dasar fungsi D2R server tergantung pada mekanisme pemetaan

untuk mengubah dan relasional (contoh SQL) kedalam RDF. Selain itu, D2R server

memberikan fungsionalitas sebagai WebAgen untuk menampilkan data dengan

SPARQL.

Distribusi D2R dibagi ke dalam dua bagian utama (Bizer, 2009)

ditunjukkan pada gambar 2.4, yang pertama adalah merupakan bagian server yang

sebenarnya adalah antarmuka D2RQ engine, yang merupakan logical core dari

penerapan yang bertugas mengelola database (RDF dan non-RDF) dengan file

pemetaan, dan resource eksternal lain pada internet. D2R server menyediakan tiga

interface yang berbeda untuk pertukaran data dengan menggunakan protocol HTTP,

SPARQL, untuk semantic query, RDF untuk linked data clients dan HTML untuk

normal browser. Bagian kedua, dan mungkin adalah bagian yang terpenting dari

aplikasi mesin D2RQ adalah mengatur proses penerjemahan dari data relasional

menjadi RDF. Untuk menggunakan D2RQ file mapping yang ditentukan pengguna

dengan menentukan vocabularies pada data yang ada dalam database non-RDF.

Page 9: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

15

Gambar 2.4 arsitektur D2R server

2.6. DR2Q Mapping

D2RQ mapping adalah model untuk mendeskripsikan hubungan antar data

dan vocabularies dengan bahasa pemetaan deklaratif. Sebuah pemetaan D2RQ itu

sendiri merupakan sebuah dokumen RDF yang ditulis dalam format Turtle sintaks

(Cyganiak, 2009). Pemetaan/mapping dinyatakan dengan menggunakan istilah-

istilah dalam namespace D2RQ :

http://www.wiwiss.fu-berlin.de/suhl/bizer/D2RQ/0.1#

Contoh dari D2RQ mapping yang didefinisikan dalam skema RDF D2RQ

(Turtle, RDF/XML) (Cyganiak, 2012) :

# D2RQ Namespace

@prefix d2rq:<http://www.wiwiss.fu-berlin.de/suhl/bizer/D2RQ/0.1#> .

# Namespace of the ontology

@prefix : <http://annotation.semanticweb.org/iswc/iswc.daml#> .

# Namespace of the mapping file; does not appear in mapped data

@prefix map: <file:///Users/d2r/example.ttl#> .

# Other namespaces

@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .

@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

Page 10: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

16

map:Database1 a d2rq:Database;

d2rq:jdbcDSN "jdbc:mysql://localhost/iswc";

d2rq:jdbcDriver "com.mysql.jdbc.Driver";

d2rq:username "user";

d2rq:password "password";

.

# -----------------------------------------------

# CREATE TABLE Conferences (ConfID int, Name text, Location text);

map:Conference a d2rq:ClassMap;

d2rq:dataStorage map:Database1;

d2rq:class :Conference;

d2rq:uriPattern "http://conferences.org/comp/confno@@Conferences.ConfID@@";

.

map:eventTitle a d2rq:PropertyBridge;

d2rq:belongsToClassMap map:Conference;

d2rq:property :eventTitle;

d2rq:column "Conferences.Name";

d2rq:datatype xsd:string;

.

map:location a d2rq:PropertyBridge;

d2rq:belongsToClassMap map:Conference;

d2rq:property :location;

d2rq:column "Conferences.Location";

d2rq:datatype xsd:string;

Pemetaan mendefinisikan virtual graph RDF yang berisi informasi dari

database. Hal ini mirip dengan konsep pandangan di SQL, kecuali bahwa struktur

data virtual adalah graph RDF buka relasional table virtual. Virtual RDF graph dapat

diakses dengan berbagai cara. D2RQ Platform menyediakan SPARQL akses, linked

data server, RDF dump generator, dan antarmuka HTML yang sederhana.Pemetaan

D2RQ dapat ditulis langsung pada editor teks yang ada dalam sistem operasi.

Data dipetakan ke dalam bentuk RDF, ditampilkan pada gambar 2.5

menggunakan d2rq:ClassMaps dan d2rq:PropertyBridge, objek-objek yang penting

dalam mapping adalah dalam class map. Sebuah class map merepresentasikan class

atau kelompok class yang sama dari sebuah vocabularies. Sebuah class map

Page 11: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

17

menentukan bagaiman URI di generate untuk setiap instance pada class. Setiap class

map memiliki property bridge yang menentukan bagaimana property dan instance

dibuat.

Gambar 2.5 mapping data ke dalam bentuk RDF

2.7. SPARQL

SPARQL adalah akronim untuk Simple Protocol And RDF Query

Languange. Standar SPARQL mendefinisikan protocol jaringan untuk bertukar query

dan bahasa untuk mengekpresikan query. SPQRQL mengadopsi sintak SQL-like

untuk mengekpresikan query atau untuk mengambil data yang ditulis menggunakan

RDF atau XML. Dengan adanya SPARQL, maka masing-masing sumber data bisa

terhubung satu dengan lainnya. Pada dasarnya, SPARQL merupakan query untuk

mencocokan bentuk graph (Perez, 2006). Graph tersebut dicocokan dengan berbagai

endpoint dari repository yang dituju untuk mencari kemungkinan dari solusi yang

ada. SPARQL dianggap setara denga bahasa SQL. Hanya saja struktur dari SPARQL

lebih sederhana dan gampang untuk diimplementasikan.

Contoh berikut menunjukkan query SPARQL untuk mencari judul sebuah

buku dari graph data yang diberikan. Query ini terdiri dari dua bagian : klausa

SELECT mengidentifikasi variabel yang akan di tampilkan dari hasi query dan

Page 12: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

18

klausa WHERE untuk memberikan pola graph dasar yang di cocokan dengan graph

data. Pola grafik dasar dalam contoh ini terdiri dari pola triple tunggal dengan

variabel tunggal ( ?judul ) di posisi objek.

SPARQL memungkinkan pengguna untuk menulis secara global perintah

query yang jelas. Hasil dari query adalah urutan solusi, sesuai dengan cara dimana

pola graph permintaan itu sesuai data. Mungkin ada nol, satu atau beberapa solusi

untuk hasil dari sebuah query SPARQL.

Data :

@perfix schema: < http://schema.org/> .

:a schema:name “Perpustakaan digital : perspektif perpustakaan

perguruan tinggi Indonesia” .

:a schema:contribution “Putu Laxman Pendit” .

:b schema:name “Interaction design in service compositions” .

:b schema:contribution “T. Dirgahayu” .

Query :

PREFIX schema: < http://schema.org/>

SELECT ?title ?author

WHERE{

?x schema:name ?title .

?x schema:contribution ?author.

}

Hasil query SPARQL :

Title Mbox Perpustakaan digital : perspektif perpustakaan perguruan tinggi Indonesia

Putu Laxman Pendit

Interaction design in service compositions T. Dirgahayu

Hasil query bisa berupa bentuk tabel (HTML) ataupun dalam bentuk RDF

– XML. Query dalam bentuk tabel disesuikan dengan subjek, predikat dan objek.

Menurut W3C (2008), SPARQL menspesifikasikan empat variasi query yang

berbeda-beda yang memilik tujuan berbeda-beda, yaitu :

Page 13: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

19

1. PREFIX

Statement PREFIX merupakan sebuah metode yang digunakan sebagai

penunjuk yang membawa informasi dalam suatu halaman web. Pada

dasarnya PREFIX digunakan untuk menyingkat sebuah resource, dalam

hal ini dapat diwakili oleh URI (Uniform Resource Identifier).

2. SELECT query

Mengembalikan keseluruhan, atau sekumulan dari variabel yang diikat di

dalam pola dari suatu query.

3. CONSTRUCT query

Mengembalikan grafik RDF yang dikonstruksioleh variabel pengganti

dalam sekumpulan kerangka triple.

4. ASK query

Mengembalikan boolean yang menunjukkan apalak pola dari query cocok

atau tidak.

5. OPTIONAL

Statement OPTIONAL digunakan untuk mangatasi ketidak cocokan

struktur pola query dengan pola yang ada pada graf RDF.

6. DESCRIBE query

Mengembalikan keseluruhan grafik RDF yang menggambarkan sumber-

sumber data yang ditentukan.

2.8. Perpustakaan

Perpustakaan berdasarkan dari kata pustaka, yang artinya kita atau buku.

Sementara di dalam bahasa Inggris, diistilahkan dengan library. Istilah ini mengacu

dari kata latin liber atau libri yang mempunyai arti buku sehingga istilah

perpustakaan, library selalu dikaitkan dengan buku (Basuki, 2003). Dengan demikian

definisi dari perpustakaan adalah sebuah ruangan, bagian dari sebuah gedung yang

digunakan untuk menyimpan buku dan terbitan lainnya yang biasanya disimpan

menurut tata susunan tertentu untuk digunakan pembaca dan bukan untuk dijual.

Oleh karena itu dikatakan bahwa definisi perpustakaan adalah institusi yang

Page 14: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

20

menyediakan koleksi bahan pustaka tertulis, tercetak dan terekam sebagai pusat

sumber informasi.

Berdasarkan klasifikasi, perpustakaan dapat di kelompokkan menjadi dua

klasifikasi yaitu yang pertama berdasarkan penerapan teknologi dan yang kedua

berdasarkan keragaman sumber daya informasinya. Kelompok perpustakaan yang

berdasarkan penerapan teknologi (Qalyubi, 2003) yaitu :

1. Perpustakaan Tradisional : Perpustakaan tradisional adalah

perpustakaan yang penyajian koleksinya dengan berbagai rak koleksi

buku dan pencatatan dilakukan secara manual oleh petugas

pustakawan.

2. Perpustakaan Terotomasi : Perpustakaan terotomasi yaitu

perpustakaan yang dalam pengelolaanya seperti pencatatan,

perekapan, dan pencetakan telah menggunakan teknologi komputer.

3. Perpustakaan Digital : Perpustakaan digital yaitu perpustakaan dengan

sistem informasi manajemen menggunakan teknologi informasi

ditambah koleksi-koleksi digital baik berupa jurnal, e-book, CD audio,

maupun koleksi video.

Kemudian menurut Pendit (2007), klasifikasi kelompok perpustakaan yang

kedua adalah berdasarkan keragaman sumber daya informasinya yaitu :

1. Perpustakaan biasa, Perpustakaan yang koleksi dokumennya semata-

mata masih menggunakan bahan tercetak.

2. Perpustakaan Multiple Media, Perpustakaan yang koleksinya sama

dengan perpustakaan biasa ditambah media analog dan elektronik.

3. Perpustakaan Hybrida, Perpustakaan yang koleksinya sama denga

perpustakaan Multiple Media tetapi ditambah dengan koleksi digital

yang interaktif.

4. Perpustakaan Multimedia Digital, Perpustakaan yang semua

koleksinya digital, bersifat iteraktif, dan dapat merupakan

perpustakaan tanpa koleksi fisik (virtual).

Belakangan ini seiring dengan perkembangan teknologi telah banyak

perpustakaan yang menerapkan sistem perpustakaan digital. Sistem perpustakaan

Page 15: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

21

digital memiliki konsep yang sama dengan perpustakaan konvesional, namun definisi

perpustakaan digital masih sering diperdebatkan. Berikut beberapa definisi

perpustakaan digital yang diperoleh dari berbagai sumber, antara lain :

1. Menurut Digital Library Federation (DLF), Digital Library merupakan

suatu organisasi yang menyediakan sumber-sumber, termasuk staf-staf

ahli, untuk memilih, menyusun, menawarkan akses intelektual,

menterjemahkan, mendistribusikan, memelihara integritas koleksi-

koleksi dari perkerjaan-pekerjaan digital sehingga mereka tersedia

secara cepat dan ekonomis untuk digunakan/dimanfaatkan oleh

komunitas tertentu atau kumpulan komunitas.

2. Menurut Arms (2000), Digital library adalah kumpulan infortmasi

yang tertata dengan baik beserta layanan-layanan yang disediakannya.

Informasi ini disimpan dalam format digital dan dapat diakses melalui

jaringan computer.

3. Menurut Borbinha dkk (1998), perpustakaan digital bukan hanya

sebagai tempat penyimpanan yang menyediakan layanan untuk

menjaga, mengorganisasikan dan memberikan akses terhadap data

yang dimilikinya. Perpustakan digital seharusnya juga berperan

sebagai sistem untuk menyebarkan informasi, dan sebagai sarana yang

aktif mempromosikan,meyokong dan merekam proses

pembentukannya.

2.9. Bibliografi

Istilah bibliografi berasal dari kata Yunani yaitu “biblion” dan “graphien”.

“Biblion” berati buku sedangkan “graphien” artinya menulis. Jadi secara etimologis

bibliografi berarti penulisan buku. Basuki (1993) mendefinisikan bahwa bibliografi

berarti teknik sistematik untuk mebuat daftar deskriptif cantuman tertulis atau yang

diterbitkan terutama buku dan bahan pustaka yang sejenis.

Definisi lain dikemukakan oleh Neil (2004) yang mendefinisikan

bibliografi (bibliography) adalah daftar buku-buku dan karya ilmiah seperti artikel

jurnal yang tersusun secara sistematis. Bentuk bibliografi mulai dari daftar kutipan

Page 16: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

22

pada akhir sebuah buku sampai dengan artikel lengkap sebagai sebuah publikasi

yang idependen.

Bibliografi mempunyai peranan sangat penting dalam bebagai bidang.

Beberapa ilmuwan telah membuktikan bahwa dengan bibliografi dapat diperoleh

keuntungan-keuntungan sebagai berikut (Basuki, 2003) :

1. Informasi mudah diperoleh secara lengkap beserta literatur terakhir di

berbagai bidang.

2. Memungkinkan akses cepat dan mudah terhadap informasi vital

mengenai perkembangan bebagai cabang pengetahuan

3. Bibliografi secara tidak langsung dapat mempromosikan

pendayaguaan buku dan bahan pustaka atau aplikasi bermanfaat dari

ilmu pengetahuan.

Sedangkan untuk tujuan utama dari bibliografi adalah membantu pengguna

dalam menentukan lokasi keberadaan sebuah bahan pustaka. Tujuan lainnya adalah

dengan adanya bibliografi yaitu sebagai sarana dalam pemilihan buku, identifikasi

dan verfikasi rincian bibliografis sebuah buku, serta lokasi bahan pustaka dalam

kaitannya dengan tempat penerbit, lokasi diperpustakaan atau tempat memesan

(Basuki, 2003).

2.10. SLiMS (Senayan Library Management System)

Salah satu aplikasi perpustakaan yang berfungsi sebagai perangkat digital

yang bisa mendukung kegiatan operasional di perpustakaan adalah aplikasi yang

bernama SENAYAN. Senayan, atau lengkapnya Senayan Library Management

System (SLiMS), adalah perangkat lunak sistem manajemen perpustakaan (library

management system) sumber terbuka yang dilisensikan di bawah GPL v3. Aplikasi

web yang dikembangkan oleh tim dari Pusat Informasi dan Humas Departemen

Pendidikan Nasional Republik Indonesia ini dibangun dengan menggunakan bahasa

pemrograman PHP, basis data MySQL, dan pengontrol versi Git. Pada tahun 2009,

Senayan memenangi INAICTA 2009 untuk kategori open source.

Sampai dengan saat ini aplikasi senayan telah diunduh lebih kurang

250.000 (dua ratus lima puluh ribu) kali. Sedikitnya ada sekitar 1589 perpustakaan

Page 17: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

23

dan lembaga lain yang mengaku memakai aplikasi Senayan, diantaranya adalah

Pusat Studi Jepang UI, Perpustakaan Kedokteran Tropis UGM, Sekolah Indonesia-

Kairo di Mesir, Perpustakaan Indonesian Visual Art Archive, Lembaga Bantuan

Hukum Jakarta, Rumah Sakit PKU Muhammadiyah Yogyakarta, Rumah Sakit M.H.

Thamrin Cileungsi, Institut Bisnis dan Informatika Indonesia, Perpustakaan Institut

Seni Yogyakarta, Perpustakaan Pusat Univ Riau, Perpustakaan Umum Kabupaten

Pekalongan dan masih banyak lagi (www.slims.web.id, 2015).

2.11. Worldcat

WorldCat adalah suatu kumpulan katalog yang mencatat isi koleksi

72.000 perpustakaan di 170 negara dan teritori yang termasuk ke dalam koperasi

global Online Computer Library Center (OCLC). Dioperasikan oleh OCLC Online

Computer Library Center, Inc. sementara databasenya dipelihara secara kolektif oleh

perpustakaan yang terdaftar di OCLC. Worldcat dapat diakses melalui alamat situs

http://worldcat.org.

OCLC didirikan pada tahun 1967, dan pada tahun yang sama Fred

Kilgour mendirikan WorldCat. Catatan katalog pertama kedalam OCLC Online

Union Catalog (OLUC) pada tahun 1971. Tercatat hingga November 2014 worldcat

telah memuat lebih dari 330 juta catatan, mewakili lebih dari 2 milyar aset fisik dan

digital dalam 485 bahasa. Catalog worldcat dapat diakses melalui alamat

http://www.worldcat.org (www.wikipedia.org)

2.12. DBPedia

DBpedia adalah sebuah komunitas yang bergerak untuk mengekstrak

informasi terstruktur dari Wikipedia dan menyediakan informasi tersebut dalam

sebuah Web. DBpedia Indonesia merupakan Web yang menyediakan data hasil

ekstraksi dari Wikipedia Indonesia. Dengan DBpedia kita dapat melakukan

pencarian yang kompleks terhadap data dari Wikipedia. Dengan melalui DBpedia

dapat memudahkan penggunaan informasi dari Wikipedia dengan berbagai cara yang

lebih menarik.

Contoh aplikasi yang dikembangkan menggunakan data dari DBpedia

Indonesia dapat di akses melalui alamat http://id.dbpedia.org sedangkan untuk versi

Page 18: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

24

global dapat diakases melalui alamat http://dbpedia.org. Aplikasi id.dbpedia.org

dirancang untuk memudahkan dalam mencari artikel-artikel dari Wikipedia yang

berkaitan dengan tempat-tempat, tokoh-tokoh yang ada di Indonesia. Data diperoleh

dengan melakukan query pada DBpedia Indonesia.

Untuk mengakses sebuah entitas dapat menggunakan URI resource dari

entitas tersebut. Apabila URI resourcediakses menggunakan Semantic Web

agents maka mengembalikan RDF descriptions, sedangkan apabila diakses

menggunakan Web Browser akan menampilkan informasi dari entitas yang diakses

dalam tampilan HTML sederhana. Setiap artikel Wikipedia dengan URL

http://id.wikipedia.org/wiki/JUDULARTIKEL akan memiliki

URI resource http://id.dbpedia.org/resource/JUDULARTIKEL. Di bawah ini adalah

beberapa contoh URI resource,

http://id.dbpedia.org/resource/Universitas_Islam_Indonesia

http://id.dbpedia.org/resource/Indonesia

2.13. VIAF

Virtual International Authority File (VIAF) adalah sebuah berkas

otoritas internasional. VIAF merupakan proyek gabungan dari beberapa perusahaan

nasional dan dioperasikan oleh Online Computer Library Center (OCLC). Proyek ini

awalnya diprakarsai oleh Perpustakaan Nasional Jerman dan Perpustakaan

Kongres Amerika Serikat.

Tujuan VIAF adalah untuk menyatukan berkas-berkas otoritas nasional

(seperti Name Authority File Jerman) menjadi satu berkas otoritas virtual. Pada

berkas-berkas ini, catatan identik dari berbagai data berbeda disatukan bersama-

sama. VIAF menerima jumlah data standar, yang terdiri dari pilihan "lihat" dan "lihat

juga" dari berkas asli, dan merujuk pada berkas otoritas asli. Data-data ini tersedia

secara daring dan tersedia untuk kepentingan penelitian dan pertukaran data. VIAF

diperbarui dengan protokol Open Archives Initiative. Nomor berkas juga disertakan

dalam artikel-artikel biografi di Wikipedia.

Page 19: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

25

Sejak VIAF menjadi layanan OCLC pada awal tahun 2012, jumlah

lembaga yang berpartisipasi dengan VIAF telah berkembang dari 19 lembaga di 22

negara menjadi 34 lembaga di 29 negara (per Juli 2014). Dua puluh empat (24) dari

Kontributor VIAF perpustakaan nasional, dan tambahan 11 perpustakaan nasional

menyediakan data untuk VIAF melalui lembaga perpustakaan federal, konsorsium

atau pengaturan lainnya, sehingga total dari perpustakaan.

2.14. Penelitian Terdahulu

Beberapa penelitian yang berkaitan dengan linked data di antaranya adalah

penelitan yang dilakukan oleh Hausenblas (2009). Dalam penelitianya membahas

tentang web site yang menyediakan linked data dan pemanfaatan resource eksternal

seperti dbpedia. Selain itu dalam penelitiannya juga dimplementasikan bagaimana

memanfaatkan beberapa sumber daya external untuk membuat sebuah aplikasi linked

data yang bertopik “Cold War”. Dalam pencarian yang berhubungan dengan cold

war dalam beberapa linked data digunakan void (Vocabulary of Interlinked Dataset).

Void mendeskripsikan kelas dan property yang menggambarkan isi data dan

interlinking dengan data lainya.

Chavose (2013), Menggambungkan dan mengkoneksikan data internal dan

beberapa sumber linked data lain. Dalam penelitian tersbut membahas penerapan

informasi tentang pertanahan dengan pendekatan model linked data untuk membantu

penyebaran informasi tentang wilayah-wilayah yang memiliki potensi

pengembangan lahan. Untuk penyediaan informasi pertanahan, data-data dari setiap

data portal yang telah di definisikan ditulis langsungn kedalam RDF melalui antar

muka yang telah dibuat sebelumnya dan dipublikasikan menggunak pubby server.

Terdapat sumber lain yang dimanfaatkan dalam pengembangan system yaitu

Dbpedia untuk keterangan setiap data daerah, deskripsi lokasi tertentu dan

meanfaatkan peta daru google maps untuk menunjukkan peta suatu wilayah.

Informasi daerah didapatkan dengan memanfaatkan data pada Dbpedia diantaranya

adalah nama daerah, ibu kota, luas wilayah, populasi, koordinat walayah daerah,

daerah perbatasan wilayah tertentu, dan informasi dari badan pertanahan setempat.

Page 20: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

26

Brandt (2013), melakukan penelitian tentang transparansi dana bantuan dari

beberapa lembaga atas perusahaan yang tergabung dalam organisasi IATI (The

international Aid Transparency Initiative) dengan pendekatan linked data. Penelitian

ini dilakukan untuk mempermudah lembaga-lembaga pemberi bantuan yang

tergabung dalam IATI dalam menyusun laporan bantuan. Dalam penelitian ini

dilakukan pengumpulan data tentang lembaga-lembaga yang tergabung dalam IATI,

informasi lembaga tersebut diambil dari beberapa sumber termasuk Dbpedia,

GeoNames dan dari IATI itu sendiri. Menggunakan bahasa pemrograman phyton

membentuk data-data IATI kedalam bentuk XML.

Patricia (2012), topik yang diangkat adalah tentang e-learning. Ide

penelitiannya didasari dari banyaknya data materi e-learning di internet yang tidak

terstruktur dan beragam, sehingga hal demikian menyulitkan dalam pencarian

sumber daya e-learning dan memerlukan banyak waktu karena proses pencarian,

mengetik, memilih , bookmark dan sebagainya dan itu dilaksanakan oleh manusia,

meskipun beberapa dari pencarian sumber daya tersebut dapat di eksekusi oleh

komputer. Untuk mengatasi masalah hal tersebut menggunakan pendektan linked

data dengan memanfaatkan sumber-sumber artikel dari Dbpedia, BibBas,

education.data.go.uk. Pada umumnya web hypertext membuat informasi cukup sulit

untuk dijelajahi oleh manusia. Dalam penelitian tersebut menggunakan langkah-

langkah standart dalam linked data yaitu menggunakan URI sebagai things dan

menggunaka SPARQL untuk query bahasa RDF.

Jhonson T dan Boock (2012), Linked data tentang ETD (electronic theses

and desertation ) yang mempublikasikan data ETD sebagai linked data, dari studi

kasus tersebut mengambil data-data koleksi ETD yang ada di Oregon State

University, menggunak R2RML untuk mempublikasikan database ke bentuk linked

data, memanfaatkan dataset dari Dublin Core medata dan menggunakan pubby

server untuk engine publikasi linked data.

Saquicela dkk (2010), membentuk geographical linked data untuk kasus

wilayah Spanyol. Dalam liked data yang dibangun menyediakan batas-batas wilayah,

populasi, gedung-gedung penting, lokasi industry. Pemanfaatan sumber linked data

lain yaitu DBpedia dan Geonames. Dari pemanfaatan sumber data diambil letak-letak

Page 21: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

27

geografis suatu wilayah berupa pengumpulan URI dari sumber-sumber linked data

ditulis dalam spread sheets kemudian di konversi kedalam RDF menggunakn

framework R2O ODEMapster. Data yang sudah dipublikasikan kemudian

dintergrasikan dengan google maps untuk melihat peta wilayah sesuai letak-letak

geografis wilayah yang sudah dibuat dalam linked data.

Daniel Vila-Suero dkk (2012), mengangkat topik membentuk dataset

bibliografi dan penulis di perpustakaan nasional Spanyol Biblioteca Nacional de

España (BNE). Perpustakaan BNE yang memiliki lebih kurang 7 juta katalog

bibliografi mentrasformasi data katalog yang menggunakan format MARC 21 ke

dalam bentuk linked data dengan menggunakan MARiMbA sebagai alat pembentuk

linked data. Perpustakaan BNE menggunakan IFLA (International Federation of

Library Associations) sebagai ontologi serta memanfatkan eksternal resource

DBpedia, VIAF dan GND (Gemeinsame Normdatei, authority dataset dari

perpustakaan nasional Jerman).

Dari beberapa penelitian yang telah diuraikan sebelumnya terdapat beberapa

perbedaan metode yang ditunjukan pada tabel 2.1 dimana telah diringkas dari

masing-masing penelitian.

Table 2.1 Perbedaan tema penelitian

Peneliti Tema Penelitian Metode Hasil Hausenbals (2009)

Exploting Linked Data

RDF – SPARQL Aplikasi linked data “Cold War” dengan memanfaatkan linked data yang sudah ada

Saquicela dkk (2010)

Geographical Linked Data : a spanish Use Case

Framework R20+ODEMapster – SPARQL

Aplikasi geolinked data Spanyol

Chavose (2013) Linked Data for land portal

Drupal core, RDF, SPARQL

Menyediakan land portal sebagai linked data, menggunakan Drupal CMS

Patricia (2012) Linked data for improving student experience in searching e-learning resource

RDF-SPARQL Linked data e-learning. Hanya memanfaatkan sumber e-learning linked data yang sudah ada

Jhonson T dan Linked data service R2RML, RDF, Publikasi linked data ETD

Page 22: BAB 2 LANDASAN TEORI - Universitas Islam Indonesia

28

Boock (2012) ETD (electronic theses and dissertation)

SPARQL

Brandt (2013) Linked data IATI Database, OWL, SPARQL

Publikasi linked data IATI

Daniel Vila-Suero dkk (2012)

datos.bne.es: a Library Linked Data Dataset

RDF, MARiMbA Membangun dataset bibliografi dalam bentuk linked data dengan memanfaatkan eksternal resource

Eko Budi Prasetyo (2015)

Prototipe repository linked data bibliografi

SLiMS, D2RQ, RDF, SPARQL

Membangun repository bibliografi dalam bentuk linked data pada aplikasi perpustakaan SLiMS

Dari beberapa penelitian tersebut umumnya membahas tentang bagaimana

penggunaan metode linked data yang sudah tersedia. Perbedaan pada penelitian ini

adalah selain menggunakan sumber linked data juga mempublish linked data yang

didalamnya sudah terdapat data yang diambil dari sumber data lain. Sumber data lain

yang diambil berbentuk sebuah alamat URI (Uniform Reource Identifier) yang

merujuk kepada data yang berkaitan dengan data bibliografi yang dimaksud.

Model proses mapping dari basis data menggunakan D2RQ mapping yang

memetakan setiap tabel-tabel dalam basis data menjadi bentuk RDF linked data.

Sebelum proses mapping dilakukan terlebih dahulu didesain URI untuk mewakili

setiap entitas data yang ada. Untuk menggambarkan bagaimana linked data

bibliografi dibentuk maka dibuat model RDF graph pada setiap class sesuai dengan

data basis data bibliografi.

Data bibliografi yang telah dirancang kemudian dipublish dengan

menggunakan D2R server. D2R server berfungsi menampilkan data sebagai

informasi dan untuk membuktikan bahwa data yang dibuat dalam bentuk RDF linked

data bisa diakses untuk menampilkan informasi sesuai dari data linked data

bibliografi yang telah dibuat.