MODELTEMU BALIKINFORMASI
LOGO
MODELTEMU BALIKINFORMASI
SUGENG PRIYANTO
LOGO
DQ
R
LOGOFormal Karakteristik Sistem TB
Himpunan yang terdiri dari logical view bagikoleksi-koleksi dokumen D
Himpunan yang terdiri dari logical view bagikebutuhan informasi user. Representasi tersebutdisebut query Q
Framework bagi representasi dokumen, query,dan hubungannya F
R(qi, dj) adalah fungsi rangking (peringkat) yangberasosiasi antara bilangan real dengan query qi Q dan representasi dokumen dj D. Rangkingtersebut mendefinisikan urutan di antaradokumen-dokumen yang diambil denganmenggunakan query qi
Himpunan yang terdiri dari logical view bagikoleksi-koleksi dokumen D
Himpunan yang terdiri dari logical view bagikebutuhan informasi user. Representasi tersebutdisebut query Q
Framework bagi representasi dokumen, query,dan hubungannya F
R(qi, dj) adalah fungsi rangking (peringkat) yangberasosiasi antara bilangan real dengan query qi Q dan representasi dokumen dj D. Rangkingtersebut mendefinisikan urutan di antaradokumen-dokumen yang diambil denganmenggunakan query qi
LOGO
LOGO3 MODEL KLASIK
Model BooleanVector Space ModelProbabilistic
Model BooleanVector Space ModelProbabilistic
http://iperpin.wordpress.com/category/information-retrieval/page/3/
LOGOModel BooleanMerupakan model yang paling sederhanaberdasarkan teori himpunan dan aljabar
BooleanModel ini menggunakan operator boolean
yaitu AND, OR atau NOTMetode ini merupakan metode yang paling
sering digunakan pada mesin penelusur(search engine) karena kecepatannya
Merupakan model yang paling sederhanaberdasarkan teori himpunan dan aljabar
BooleanModel ini menggunakan operator boolean
yaitu AND, OR atau NOTMetode ini merupakan metode yang paling
sering digunakan pada mesin penelusur(search engine) karena kecepatannya
LOGOTeori Himpunan
LOGODiagram Vena Boolean
LOGOTutorials
http://lib.colostate.edu/tutorials/boolean.html
http://lib.colostate.edu/tutorials/boolean.html
LOGOKeuntungan model Booleanmerupakan model sederhana
sehingga mudah diimplementasikanBerguna bagi pengguna yang tidak
memiliki pengetahuan banyakmengenai formulasi kueriEfisien
merupakan model sederhanasehingga mudah diimplementasikanBerguna bagi pengguna yang tidak
memiliki pengetahuan banyakmengenai formulasi kueriEfisien
LOGOKerugianTidak ada peringkat dokumen
(ranking)Tidak mendukung partial matchingSecara keseluruhan tergantung
kepada definisi keyterm danpembobotanDokumen yang terambil hanya
dokumen yang benar-benar sesuaidengan pernyataan boolean/kueriyang diberikan
Tidak ada peringkat dokumen(ranking)Tidak mendukung partial matchingSecara keseluruhan tergantung
kepada definisi keyterm danpembobotanDokumen yang terambil hanya
dokumen yang benar-benar sesuaidengan pernyataan boolean/kueriyang diberikan
LOGOModel Ruang VektorModel vektor berdasarkan keytermModel vektor mendukung partial
matching dan penentuan peringkatdokumenModel vektor memerlukan : Bobot keyterm untuk vektor dokumen Bobot keyterm untuk kueri Perhitungan jarak untuk vektor
document-keyterm
Model vektor berdasarkan keytermModel vektor mendukung partial
matching dan penentuan peringkatdokumenModel vektor memerlukan : Bobot keyterm untuk vektor dokumen Bobot keyterm untuk kueri Perhitungan jarak untuk vektor
document-keyterm
LOGOKonsep
Model ruang vektor dibuat berdasarkanpemikiran bahwa isi dari dokumenditentukan oleh kata-kata yang digunakandalam dokumen tersebut.Model ini menentukan kemiripan
(similarity) antara dokumen dengan querydengan cara merepresentasikan dokumendan query masing-masing ke dalambentuk vektor.Tiap kata yang ditemukan pada dokumen
dan query diberi bobot dan disimpansebagai salah satu elemen vektor
Model ruang vektor dibuat berdasarkanpemikiran bahwa isi dari dokumenditentukan oleh kata-kata yang digunakandalam dokumen tersebut.Model ini menentukan kemiripan
(similarity) antara dokumen dengan querydengan cara merepresentasikan dokumendan query masing-masing ke dalambentuk vektor.Tiap kata yang ditemukan pada dokumen
dan query diberi bobot dan disimpansebagai salah satu elemen vektor
LOGO
http://elib.unikom.ac.id/files/disk1/522/jbptunikompp-gdl-agusmaulan-26077-6-unikom_a-i.pdf
http://elib.unikom.ac.id/files/disk1/522/jbptunikompp-gdl-agusmaulan-26077-6-unikom_a-i.pdf
LOGOKeuntungan
EfisienMudah dalam representasiDapat diimplementasikan pada
document-matching
EfisienMudah dalam representasiDapat diimplementasikan pada
document-matching
LOGOKerugian
Teoritical Frameworknya tidak jelasMenghasilkan indeks yang
berdekatanAsumsi yang digunakan adalah
independensi index term
Teoritical Frameworknya tidak jelasMenghasilkan indeks yang
berdekatanAsumsi yang digunakan adalah
independensi index term
LOGOMODEL PROBABILITAS
model probabilistik mengasumsikanbahwa setiap dokumen dideskripsikanlewat “ada” atau “tidak ada”nya termindeksMenggunakan pendugaan probabilistik
untuk menentukan dokumen yang relevandengan keyterm yang diberikanCukup kompleksKinerjanya lebih efisien dibandingkan
dengan model ruang vektorProbability : Menggunakan semantik
model probabilistik mengasumsikanbahwa setiap dokumen dideskripsikanlewat “ada” atau “tidak ada”nya termindeksMenggunakan pendugaan probabilistik
untuk menentukan dokumen yang relevandengan keyterm yang diberikanCukup kompleksKinerjanya lebih efisien dibandingkan
dengan model ruang vektorProbability : Menggunakan semantik
LOGO
Top Related