Cara Google Memahami Kemauan Anda
-
Upload
anggara-wiguna -
Category
Documents
-
view
4 -
download
0
Transcript of Cara Google Memahami Kemauan Anda
-
5/26/2018 Cara Google Memahami Kemauan Anda
1/5
118 | CHIP| APRIL 2009
Internet berada di ambang titik balik.
Kalimat inilah yang terdengar pada
konferensi dan seminar serta dapat di-
baca di beberapa blog dan tulisan me-
ngenai Internet dan prospeknya. Era Se-
mantic Web akan datang. Tanda-tandanyamulai terlihat pada beberapa perusahaan
yang mulai meninggalkan web yang ber-
basis dokumen menuju web yang berbasis
content. Setiap tahun, pada konferensi se-
perti International Semantic Web Con-
ference (ISWC) atau Semantic Technology
Conference (SemTech) dapat dilihat hasil
penelitian intensifnya. WWW Consortium
(W3C) bahkan telah bersiap-siap untuk
menetapkan standar yang tepat.
Kondisi:mesin tidak dapatmembaca informasi di web
Saat ini, web terdiri atas banyak sekali in-
formasi dalam bentuk website yang diran-
cang untuk penggunaan secara manual
oleh manusia. Tidak seperti mesin, seorang
pembaca dengan mudah dapat mengambil
informasi dari sebuah website dan me-
ngaitkannya dengan informasi lain. Aki-
batnya, sulit menyaring informasi tertentu
dari sekian banyak informasi yang tersedia.
Search engine seperti Google atau Yahoo
"hanya" memberikan hit list (hasil penca-
rian) berdasarkan metode statistik. Apakah
informasi yang Anda inginkan juga ditam-
pilkan? Biasanya, hampir tidak pernah se-
cara langsung ditampilkan.
Contoh: Pencarian jawaban yang tepat
biasanya dilakukan dengan membuka dan
membaca berbagai website dari hit list.
Pencarian istilah, seperti "python" akan
menghasilkan hit mengenai bahasa pro-
gram dan jenis ular yang bernama sama.
Algoritma pencarian (search engine) kini sulit mengatasi belantara data yang tumbuhliar seperti semak belukar. Dengan hadirnya metode penyimpanan yang lebih
terstruktur, diharapkan hasil pencariannya menjadi lebih tepat dan terjamin.
Semantic Web: Cara Google
Memahami Kemauan Anda
Sebuah pencarian yang tidak terlalu ber-
basis istilah dan lebih semantik (berbasis
content) tentu akan lebih "mengena".
Kini informasi di web disajikan dengan
beragam cara dan hampir tidak mungkin
membuat sebuah perbandingan langsung.
Dengan demikian, informasi yang tersebar
di Internet sulit disatukan dan ditampil-
kan secara seragam. Pencarian "Semantic
Web" misalnya, akan menampilkan banyak
website dengan isi yang sama, saling me-
lengkapi, atau bisa juga bertentangan. Ak-
hirnya, hit tidak ditemukan secara ekspli-
sit, melainkan harus secara implisit.
Terlebih lagi pada pertanyaan sederhana
seperti "Berapa usia Tony Blair?". Perta-
nyaan tersebut akan membutuhkan bebe-
rapa kali pencarian dan pemahaman lan-
jutan terhadap hasil pencarian. Solusinya,
ganti pencarian menjadi "Tony Blair, usia".
Solusi: mengelola isi webdan merelasikannya
Istilah "Semantic Web" berawal dari gagas-an untuk menyediakan data di Internet se-
demikian rupa agar proses logis dengan
mesin dapat dilakukan. Untuk itu, website
semantik, selain informasi murni, terdapat
pula keterangan mengenai keterkaitan in-
formasinya. Agar dapat direalisasi, W3C te-
lah menetapkan beberapa open standard.
Peranan penting dalam hal ini ada pada ba-
hasa komputer XML, RDF, OWL, dan
SPARQL (query language RDF). Bahasa-ba-
hasa ini memungkinkan penyajian infor-
masi secara semantik dalam bentuk onto-logi dan taksonomi.
Metode:tiga cara menujuSemantic Web
Bagaimana mengubah web berbasis doku-
men ke web berbasis content? Cara perta-
ma adalah menyusun informasi sejak awal
secara semantik di web. Beberapa bidang
ilmu telah menyediakan informasinya se-
cara semantik. Namun, bagaimana me-
nangani sekian banyak informasi berbasis
dokumen tersebut? Para programmer be-
rupaya mengonversinya dengan bantuan
teknik-teknik kecerdasan buatan dan lingu-
istik komputer. Ambil contoh, "Natural
Language Processing" yang mencoba meng-
gabungkan metode-metode untuk meng-
analisis teks dengan meniru pembaca ma-
nusia. Biasanya sebuah teks dipecah kali-
mat demi kalimat. Dengan struktur yang
didapat (misalnya subjek, predikat, objek),
maknanya (semantik) lebih mudah disim-
Apa itu W3C?Tim Berners-Lee, yang menemukan
WWW pada 1989 ketika bekerja di risetCERN, adalah Direktur W3C sejak didiri-kan pada 1994. W3C mengembangkanstandar web dan aturan-aturan yang di-sediakan dalam bentuk "Recommenda-tions". Kendali dipegang MIT ComputerScience & Artificial Intelligence Lab(CSAIL) di AS, European ResearchConsortium for Informatics & Mathe-matics (ERCIM) di Perancis dan Universi-tas Keio di Jepang. Aktivitas W3C dibia-yai dengan sumbangan dari para ang-gota, dana penelitian, dan sumber-sum-ber lain yang bersifat publik maupunswasta. Sekadar info, semantic Web
yang kini mulai hangat dibicarakan, se-benarnya telah diformulasikan Tim Ber-ners-Lee sejak tahun 1999. (sumber:www.w3.org)
INFO
TES & TEKNOLOGITeknologi Internet
-
5/26/2018 Cara Google Memahami Kemauan Anda
2/5
APRIL 2009 | CHIP| 119
pulkan. Sebuah pencarian setidaknya da-
pat mengidentifikasi orang, tempat, objek,
dan kejadian, serta mengaitkannya satu sa-
ma lain. Ini menurunkan tingkat kesalahan
pencarian secara drastis. Contoh pendeka-
tan "top-down" ini bisa Anda lihat gamba-
rannya pada bagian "Aplikasi".
Pendekatan lainnya disebut Microfor-
mats (http://microformats.org). Gagasan-
nya adalah memperluas website (X)HTML
yang ada dengan metadata atau atribut
standar (X)HTML lainnya secara manual,
sehingga lebih dipahami "mesin". Con-
tohnya pada format yang menunjukkan
kontak, tenggat, dan bookmark. Platform
seperti MobileMe, Facebook, Flickr, Goo-
gle Maps, Technorati, atau Yahoo diketahui
telah menggunakan format ini.
W3C juga menyediakan sebuah alter-
natif untuk mengintegrasikan informasi
yang dapat dibaca mesin ke dalam website
(X)HTML biasa dengan RDFa (Resource
Description Framework - in - attributes).
Pendekatannya sendiri berbeda. Pengem-
bang Microformats memilih pendekatan
untuk merealisasi tuntutan terpenting
dengan sesederhana mungkin. W3C ingin
mendefinisikan sebuah kerangka umum
untuk mengintegrasikan metadata, yang
sayangnya membutuhkan upaya ekstra
dalam aplikasinya. Walau demikian, RDFa
tetap dipublikasikan sebagai "Recommen-
dation" sehingga bisa saja menggantikan
Microformats untuk jangka panjang.
Standar: tool yang tepatuntuk web programmer
Standar mana yang akan digunakan dalam
Semantic Web? Berikut ini adalah aplikas
terpenting untuk melakukan aktivita
pemrograman dan query.
EXTENSIBLE MARKUP LANGUAGE (XML)
Standar dasar untuk Semantic Web adalah
bahasa Meta-XML yang menyimpan in
formasi terstruktur serta dapat menggam
barkan bahasa markup lainnya. Sintaksis
nya sudah ditentukan dan memiliki banyak
aturan untuk menyusun karakter dan ka
rakter string-nya sehingga membentuk se
buah dokumen yang valid. Sebuah contoh
populer adalah bahasa XHTML (varian
HTML berbasis XML). Baik RDF dan
OWL yang merupakan basis dalam pem
buatan dokumen terstruktur memilik
XML syntax-nya tersendiri.
RESOURCE DESCRIPTION FRAMEWORK
(RDF):RDF adalah sebuah bahasa forma
Instansi
Ontologi
Pewarisa
Relasi
Ontologi: Menggambarkan Hubungan yang Kompleks
Diagram ontologi bidang seni rupa - Apabiladibaca vertikal, setiap bagian mewariskan ka-rakteristiknya ke bagian-bagian di bawahnya(mengikuti kaidah taksonomi). Setiap pelukisjuga seorang artis, setiap museum juga se-buah bangunan. Antara setiap elemen dapatditemukan relasi yang hampir tidak terbatas.Lukisan seorang pelukis beraliran tertentu
tergantung di dalam gedung seorang arsitek.Gedung tersebut bisa sebuah museum, tetapibisa juga di tempat tinggalnya.
Leonardo
Da VinciNama
dibuat olehmembuat
menulisditulis oleh
Pengarang
Nama
M
Oil onwood
Artis Karya seni
Buku
Pelukis
Ekspresionis
Impresionis Tehnik
Kubis
Museum
Lukisan
Ruangtamu
BangunanArsitek
merancangdirancang oleh
melukisdilukis oleh
Gereja
Nama
Nama
dilukis dalam ditampilkanUser
-
5/26/2018 Cara Google Memahami Kemauan Anda
3/5
120 | CHIP| APRIL 2009
TES & TEKNOLOGITeknologi Internet
untuk menggambarkan informasi yang
terstruktur. Berbeda dengan HTML, RDF
lebih menitikberatkan pada kemungkinan
dalam memroses informasi lanjutan atau
kombinasi dengan dokumen lain daripa-
da isi yang sesuai.
Sebuah dokumen RDF menggambar-
kan sebuah diagram atau skema. Simpul-
simpul tersebut saling terkait dengan tepi-
tepi terarah (secara grafis ditampilkan se-
bagai panah). Setiap panah dan simpul di-
lengkapi dengan sebuah nama yang unik
yang disebut Uniform Resource Identifier
(URI). Rangkaian karakter ini menandai
sebuah sumber abstrak atau fisik, dan te-
rutama terdiri atas sintaksis "Skema: Bagi-
an selanjutnya". URI dapat berupa alamat
website atau alamat mail. Namun, URI ju-
ga dapat diaplikasikan (bukan hanya un-
tuk web) sebagai mekanisme umum untuk
membuat nama unik. Biasanya, URI dalam
sebuah dokumen RDF tidak menunjuk ke
website yang valid.
Sebuah skema RDF (gambar sebuah on-
tologi) digambarkan secara lengkap bes-
erta panahnya. Setiap dataset RDF setara
dengan sebuah data tripel (subjek, predi-
kat, objek). Ini memungkinkan diagram
dikonversi ke penulisan berbasis XML. Se-
lain itu, ada beberapa bentuk lain RDF,
misalnya triple syntax "Turtle". Namun,
dengan dominasi XML untuk membuat
dan menyebarkan informasi terstruktur,
bentuk ini jarang digunakan.
RDF(S), dimana "S" untuk Schema
(Skema), merupakan sebuah perluasan
RDF yang memungkinkan spesifikasi in-
formasi terminologi atau skema. Pertama,
RDF menggambarkan objek-objek dan
kaitannya satu sama lain. RDF(S) juga da-
pat mengklasifikasikan objek dalam sebuah
kelas. Kelas-kelas tersebut merupakan ba-
gian sebuah atau beberapa kelas di bawah
atau di atasnya. Dengan demikian, hierarki
kelas relatif menjadi lebih mudah ditampil-
kan seperti taksonomi dalam biologi. Titik
penting: Sebuah objek bukan hanya meru-
pakan instance (bagian informasi) dari
kelasnya, tetapi juga semua kelas di atasnya
(lihat boks Taksonomi serta contohnya
dalam Listing 1).
Perluasan lainnya adalah "Property"
yang menggambarkan karakteristik objek.Sebuah karakteristik, misalnya isHappi-
lyMarriedTo dapat berada di bawah satu
atau beberapa karakteristik lain, misalnya
"isMarriedTo". Pada property, area definisi
(definition field) dan nilai (value field)
dapat dibatasi pada kelas. Misalnya pem-
batasan pada kelas "Persons". Untuk itu,
resources harus diklasifikasikan sebagai
"Persons". Dalam RDF-(Scheme) Vocabu-
lary terdapat juga "rdf:Statement" sebagai
indikator kelas untuk pernyataan model-
ling. Dengan bantuannya sebuah pernya-taan dapat dipasangkan dengan sebuah
objek. Kalimat "Menurut Michael: Semua
burung biru" dengan demikian disimpan
sebagai pernyataan Michael dan tidak se-
bagai kalimat yang berlaku umum.
WEB ONTOLOGY LANGUAGE (OWL): Kom-
ponen dasar OWL (sebenarnya WOL, se-
ngaja disebut OWL yang berarti burung
hantu) terdiri atas kelas dan properti se-
perti pada RDF(S), serta atas individu yang
dideklarasi sebagai instance RDF kelas.
OWL dapat mengaitkan kelas-kelas dan
properties dalam hubungan yang kom-
pleks. Kelas juga dapat dideklarasi sebagai
disjunkt atau sebagai sama. Tetapi kita juga
dapat menutupnya dan menetapkan, indi-
vidu mana termasuk suatu kelas. Operasi
himpunan "Gabungan", "Potongan", dan
"Pelengkap" adalah kemungkinan lainnya
untuk menyempurnakan sistem.
OWL tersedia dalam tiga bagian bahasa
OWL Lite, OWL DL, dan OWL Full yang
Taksonomi: Susunan yang DibuatBerdasarkan Hirarki yang Ketat
Tampilan sebuah taksonomi Di sini se-jumlah elemen yang sudah ada dicoba di-susun secara sistematis dan hierarkis. Con-tohnya adalah taksonomi dunia hewanyang seiring waktu mengalami banyakperubahan. Apabila dunia hewan Brehm(lihat di bawah) masih cukup denganbeberapa tingkatan sederhana (hinggasimpanse), sistematik modern dapat me-nampilkan hingga tingkatan ke-17 (kiri).
Dunia hewan
Hewan bersel banyak
Hewan berjaringan
Deuterostomia
Chordata
Vertebrata (bertulang belakang)
Hewan memiliki rahang
Hewan darat bertulang belakang
Hewan menyusui
Hewan menyusui tingkat tinggi
Euarchontologlires
Primata
Primata dry-nosed
Kera dunia lama
Kera
Monyet dan Kera (besar)
Simpanse
Simpanse biasa
Simpanse barat
SUMBER: WIKIPEDIA
-
5/26/2018 Cara Google Memahami Kemauan Anda
4/5
APRIL 2009 | CHIP| 121
dibangun satu di atas lainnya. Yang terak-
hir menawarkan tingkat kebebasan ter-
tinggi untuk menggambarkan informasi.
Namun, justru itulah timbul masalah, se-
hingga dikembangkan OWL DL dan OWL
Lite. OWL DL dirancang sedemikian rupa
untuk menghindari masalah-masalah ter-
sebut. Ia hampir sepenuhnya didukung
oleh aplikasi-aplikasi aktual (bagian "Apli-
kasi" Protg, Pellet, KAON2). Adapun
OWL Lite hanya menawarkan elemen ba-
hasa terpenting dan dalam prakteknya ti-
dak terlalu penting.
SIMPLE PROTOCOL AND RDF QUERY LAN-
GUAGE (SPARQL): Bagaimana kita meng-
akses informasi dari ontologi-ontologi di
atas? Bagi RDF tersedia SPARQL sebuah
standar yang baru ditetapkan untuk per-
mintaan RDF dan menampilkan hasilnya.Sebuah permintaan berisi tiga komponen
utama, antara lain "PREFIX" yang dipakai
untuk memilih sebuah ruang nama, "SE-
LECT" untuk mendefinisikan format out-
put, dan "WHERE" untuk memformulasi-
kan pertanyaan (querry) aktual. Di dalam
"WHERE" dapat diformulasikan persyara-
tan filter yang memeriksa nilai-nilai karak-
ter (Listing 2). Objek-objek yang memiliki
karakteristik tertentu dapat ditemukan.
Hasilnya juga dapat disortir dengan "SORT
BY" dan dibatasi pada sejumlah objek mel-alui "LIMIT" dan "OFFSET".
Saat ini, W3C belum memiliki query
language untuk OWL. Namun, ada upaya
untuk membuat SPARQL tersedia bagi on-
tologi OWL. Berbeda dengan RDF, OWL
DL menawarkan sarana ekspresi sebagai
bagian bahasa untuk menemukan semua
instance yang relevan sebuah gambaran
kelas. Untuk pertanyaan lain pada OWL
DL, digunakan pengajuan pertanyaan con-
junctivesebagai format dasar querry. Teta-
pi seperti telah disebutkan, sayangnya
hingga kini belum ada bahasa query spesi-
fik yang resmi.
RDFA:Dengan RDFa (dan juga Microfor-
mats), website (X)HTML "diperkaya" de-
ngan metadata. RDFa menggunakan Na-
mespace dan Vocabulary untuk menyim-
pan informasi. Pada tahun 1994, Dublin
Core Metadata Initiative (http://dublin-
core.org) telah mempublikasi Dublin Core
(DC) yaitu sebuah vocabularyyang sering
-
5/26/2018 Cara Google Memahami Kemauan Anda
5/5
122 | CHIP| APRIL 2009
TES & TEKNOLOGITeknologi Internet
digunakan untuk menambahkan informa-
si, seperti penulis, judul, atau tanggal pem-
buatan sebuah dokumen.
Penggunaannya dalam RDFa bisa di-
gambarkan sebagai berikut ini. Dengan
"xmlns:dc" yang diindikasikan sebagai Du-
blin Core Namespace. Adapun "dc:title"
adalah metode penulisan singkat untuk
http://purl.org/dc/elements/1.1/title dan
menandai judul dokumen. Sedangan "dc:
creator", menunjukkan si pengarang (aut-
hor). Informasi ini juga dapat ditampilkan
sebagai RDF triple dengan (document, dc:
title, title) dan (document, dc:creator, aut-
hor). "about" dipakai untuk mengontak
sebuah elemen website. Contoh hasilnya
tremuat dalam sebuah foto dengan ke-
terangan judul dan pengarang (Listing 3).
Contoh lainnya, Namespace Friend-of-a-Friend (FOAF, www.foaf-project.org)
menawarkan suatu Vocabulary untuk
menggambarkan informasi kontak. "ty-
peof" menentukan tipe sebuah elemen
HTML, di mana "foaf:name", "foaf:mbox"
dan "foaf:phone" untuk mengidentifikasi
data kontak lainnya dalam bentuk yang
dapat dibaca dengan mesin (Listing 4).
Aplikasi: editor dan searchengine semantik masa kini
Dengan apa ontologi dibuat dan tools ma-na saja yang memakai ontologi? Editor on-
tologi paling populer adalah Protg
(http://protege.stanford.edu ) yang terse-
dia gratis dan open source. Dengan editor
ini ontologi dapat dirawat, divisualisasi
dan diekspor. Individu juga dapat diklasi-
fikasi.
Inference Engine Pellet (http://clark-
parsia.com/pellet) dan KAON2 (http://
kaon2.semanticweb.org) memungkinkan
membuat pernyataan-pernyataan baru da-
ri ontologi OWL. Pellet tersedia gratis dan
open source, sementara KAON2 hanya
gratis untuk aplikasi non-komersial.
Editor dan inference engine memben-
tuk dasar bagi serangkaian aplikasi yang
menggunakan teknik-teknik Semantic Web
dalam bentuk startup. Database Freebase
(www.freebase.com) dibuat dengan tek-
nologi Metaweb bertujuan menyediakan
informasi terstruktur agar engine (mesin)
dan manusia dapat menggunakannya seca-
Listing 5). Pengikut pendekatan "top-
down" lainnya adalah Open Calais. Docu-
ment Viewer-nya (www.opencalais.com/
DocViewer) mengumpulkan informasi
dari sebuah dokumen web biasa seperti
objek-objek, fakta, dan peristiwa, lalu
mengekstraknya ke dalam format RDF.
Addon Firefox Gnosis (http://addons.mozilla.org/firefox/3999) bisa dijadikan
gambaran, bagaimana ia diaplikasikan.
Prospek:Semantic Web pastiakan "datang"
Semantic Web menawarkan solusi untuk
menemukan informasi yang relevan,
mengintegrasikan informasi dari berbagai
sumber, dan mengaitkan informasi dari
masalah yang ada. Standar untuk peng-
gambaran informasi telah ditetapkan. Me-
tode untuk menyimpulkan informasi yangtermuat telah tersedia. Sekarang ini data-
basenya masih kecil. Upaya menganalisis
website (klasik) secara semantik atau
memperkayanya dengan metadata mela-
lui RDF telah menunjukkan bahwa transi-
si ke website yang berbasis content telah
dimulai. Transfer content dari database
terbuka, seperti Wikipedia atau Music-
Brainz adalah langkah awalnya.
Semantic Web baru benar-benar ber-
fungsi jika ketersediaan beragam content
telah terwujud. Tanda-tandanya seperti,
content yang lebih mudah ditemukan dan
hubungan/keterkaitan antar-informasi
dapat diidentifikasi dengan lebih baik. Be-
gitu juga dengan elemen-elemen seperti
kontak atau jadwal juga dapat diproses le-
bih mudah. Kelak, kita bukan lagi mencari
jawaban melalui rangkaian kalimat/istilah
tertentu tetapi langsung bertanya layaknya
berbicara dengan manusia.
Iwan. [email protected] (Autor)
No
I used the following facts to provide this answer:
* thing that was created is the left class of is older tha * thing that was created is the right class of is older th * the 26th of October 1947 is the birthdate of Hillary Clin(endorse) (contradict) * the 4th of August 1961 is the birthdate of Barack Obama(endorse) (contradict) * is older than is permanent (endorse) (contradict)
(SUMBER: HTTP://BETA.TRUEKNOWLEDGE.COM/ANSWER.PHP?INPUT=IS+BARACK+OBAMA+OLDER+THAN+HILLARY+CLINTON%
LISTING 5
ra optimal. Sebagai basis data digunakan
artikel-artikel dari database populer seperti
Wikipedia atau MusicBrainz (http://mu-
sicbrainz.org). Website-website dianalisis
isinya dan dimasukkan ke dalam ontologi.
Sebagai contoh Freebase sekarang ini me-
miliki lebih dari 3 juta tema, 750.000 orang,
450.000 tempat, 50.000 perusahaan, dan40.000 film. Freebase juga menggunakan
ontologi sendiri dan sebuah bahasa per-
mintaan yang berbeda dengan SPARQL.
Sebuah database terbuka yang berbasis
RDF adalah Dbpedia (http://dbpedia.
org). Di sana tersedia artikel-artikel Wiki-
pedia yang berisi 2,5 juta tema, 108.000
orang, 392.000 tempat, 57.000 album mu-
sik, 36.000 film). Data-data ini dapat di-
minta melalui SPARQL. Selain itu tersedia
serangkaian aplikasi yang bisa dipakai un-
tuk tujuan riset. Penggunaan untuk halbiasa kurang tepat karena terlalu rumit.
Search engine semantik Powerset
(www. powerset.com) mengaitkan isi dua
sumber informasi. Ia memakai artikel-ar-
tikel yang disiapkan secara semantik dari
Wikipedia dan Freebase yang sudah dapat
dibaca dengan mesin. Powerset memung-
kinkan permintaan pencarian melalui ba-
hasa sehari-hari (natural language). Yang
menarik adalah kemungkinan mendapat-
kan informasi yang merupakan kesimpu-
lan dari fakta-fakta. Misalnya pertanyaan
"how old is megawati sukarnoputri" meng-
hasilkan "January 23, 1947 (62 years ago)"
dengan daftar informasi sumbernya.
Hasil pencarian yang sama juga di-
hadirkan search engine True Knowledge
(www.trueknowledge.com) yang tampi-
lannya mirip Powerset. Namun, engine
tersebut juga mendukung bentuk-bentuk
permintaan lainnya seperti "Is Barack Ob-
ama older than Hillary Clinton?" (lihat