UNIVERSITAS MERCU BUANA - Fakultas Ilmu...
Transcript of UNIVERSITAS MERCU BUANA - Fakultas Ilmu...
UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI
No. Dokumen 02-3.04.1.02 Distribusi
Tgl. Efektif
RENCANA PEMBELAJARAN SEMESTER
Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester Tanggal Penyusunan
Informartion Retrieval XXX 3 7 10-07-2017
Otorisasi
Dosen Pengemban RPS Koordinator RMK Ketua Program Studi
Hendra Prastiawan, S.SI., MT
Hendra Prastiawan, S.SI., MT
Nur Ani, ST, MMSI
Capaian Pembelajaran
CPL – Prodi
Mahasiswa mempelajari dan memahami prinsip, teknik, dan metode IR.
Mampu menyelesaikan masalah teknologi informasi dan komunikasi dengan keahlian komputasi cerdas dan visualisasi
CP – Mata Kuliah
Mahasiswa mampu mengaplikasikan prinsip, teknik, dan metode IR secara umum seperti pengindeksan, mesin pencari, klasifikasi, peringkasan dokumen, web search, dan berbagai aplikasi IR lainnya.
Mahasiswa dapat mengimplementasikan teknik IR dari berbagai bentuk dokumen teks, baik desktop maupun web.
Mahasiswa mendapat topik riset (skripsi), berlatih menelaah jurnal, dan presentasi.
Mahasiswa mengimplementasikan teknik-teknik penyelesaian masalah seperti pengindeksan, pencarian, pemrosesan query dalam kebutuhan temu kembali informasi.
Mahasiswa mampu membuat suatu mesin pencari untuk ektraksi informasi sebagai contoh implementasi sederhana dan mengkategorikan hasil demi kemudahan visualisasi.
Deskripsi Singkat Mata Kuliah
Matakuliah ini mempelajari prosedur-prosedur dan metode-metode untuk menemukan kembali informasi yang tersimpan dari berbagai sumber (resources) yang relevan atau koleksi sumber informasi yang dicari atau dibutuhkan. Dengan tindakan index (indexing), panggilan (searching), pemanggilan data kembali (recalling). Mahasiswa akan mempelajari teknik-teknik pengolahan data teks untuk menemukan kembali informasi pada data berbentuk teks. Bahasan perkuliahan meliputi pengolahan awal, ekstraksi fitur, penghitungan tingkat kemiripan teks sesuai masukan query, dan menampilkan hasil pencarian. Bahasan lanjut adalah teknik relevance feedback, klasifikasi dan klasterisasi teks untuk membantu
pengguna dalam pencarian. Mahasiswa akan merancang, menganalisis serta mengaplikasikan metode-metode sistem temu kembali informasi pada berbagai permasalahan nyata baik secara mandiri atau kerjasama tim.
Materi Pembelajaran/ Pokok Bahasan
1. Konsep dasar Information Retrieval (IR)
2. Pemodelan IR dan Evaluasi IR
3. Query Expansion dan Algoritma Rocchio
4. Text Classification dan Clustering
5. Probabilistic Information Retrieval, CLIR dan Web Information Retrieval
Pustaka Utama (1,2)
1. C.J. van Rijsbergen. Information Retrieval
2. Christopher D. Manning, Prabhakar Raghavan, Hinrich Schutze, Introduction to Information Retrieval, Cambridge University Press, 2008
Pendukung (3, 4, 5, 6, 7)
3. Baeza-Yates & Ribeiro-Neto, Modern Information Retrieval Complete, 2011
4. Gerald Kowalski, Information Retrieval Architecture and Algorithm, Springer, 2011
5. B. Croft, D. Metzler, & T. Strohman, Search Engines: Information Retrieval in Practice, Addison Wesley, 2009.
6. D. Grossman & O. Frieder, Information Retrieval: Algorithms and Heuristics 2nd Edition, Springer, 2004.
7. I. H. Witten, Managing Gigabytes, Morgan Kaufman, 1999
Media Pembelajaran
Perangkat Lunak Perangkat Keras
Team Teaching
Mata Kuliah Prasyarat
Sistem Basis Data
Minggu Ke-
Sub-CP-MK (Sebagai Kemampuan Akhir yang
diharapkan)
Materi Pembelajaran [Pustaka]
Indikator Kriteria & Bentuk Penilaian
Metode Pembelajaran
[estimasi waktu]
Pengalaman Belajar
Mahasiswa
Bobot Penilaian
(1) (2) (3) (4) (5) (6) (7) (8)
1. ● Membedakan antara
Information Retrieval dan
Data Mining serta
menggambarkan gagasan
tentang aplikasi
information retrieval
● Definisi
Information
Retrieval, Ruang
Lingkup dan
Penerapan
Information
● Dapat menjelaskan
definisi
information
retrieval,
memberikan
contoh information
retrieval, dan
● Penyampaian
materi
konsep,
sejarah,
lingkup dan
penerapan,
serta contoh
● Penyampaian
materi: 60
menit ● Diskusi
mahasiswa: 60
menit
● Mahasiswa
dapat
menjelaskan
definisi dan
konsep dari
information
retrieval serta
5%
Retrieval, Contoh
Information
Retrieval
merencanakan
suatu aplikasi
information
retrieval
information
retrieval ● Melakukan
tanya jawab
pemahaman
mahasiswa
● Presentasi hasil
diskusi: 30
menit
dapat
memberikan
contoh dari
information
retrieval
2. ● Memiliki kemampuan
dalam pemrosesan teks
dan kalimat dengan
menggunakan bahasa
pemrograman perl/phyton
● Pemrosesan Teks,
Pengantar bahasa
PERL/Phyton
● Dapat melakukan
pemrosesan teks
berupa kata dan
kalimat dengan
menggunakan
bahasa
pemrograman
perl/phyton
● Penyampaian
materi
mengenai
definisi
korpus
beserta
contohnya,
pemrosesan
kata yang
dimulai dari
melacak teks,
statistik teks
serta
menghitung
frekuensi
kata melalui
stopwords
dan
tokenisasi ● melakukan
simulasi
pemrosesan
teks
menggunaka
n bahasa
pemrograma
n perl/phyton
● Penyampaian
materi: 90
menit ● Pengantar
bahasa
pemrograman
perl/phyton
beserta simulasi
pemrosesan
teks: 60 menit
● Mahasiswa
dapat
memahami
pengertian
dari teks, kata
dan kalimat
dalam sebuah
pemrosesan
teks dengan
menggunakan
hukum Zipf ● Mahasiswa
dapat
melakukan
pemrosesan
teks dengan
menggunakan
bahasa
pemrograman
perl/phyton ● Mahasiswa
dapat
melakukan
beberapa
manipulasi
teks dengan
bahasa
pemrograman
perl/phyton
5%
3. ● Kemampuan dalam
pengindeksan secara
manual dan otomatis,
tokenisasi, stopwords, dan
stemming serta
pembobotan sebuah kata
● Inverted Text
● Indexing
● Tokenisasi
● Stopwords
● Stemming
● Pembobotan kata
● Dapat melakukan
pengindeksan teks,
pembagian teks
berupa kalimat,
paragraf, dan
dokumen ● Dapat melakukan
proses stopwords
dan stemming
untuk efisiensi dan
efektivitas
pemrosesan teks ● Dapat melakukan
pembobotan kata
dengan beberapa
pendekatan seperti
term frequency,
document
frequency, dan
inverse document
frequency
● Penyampaian
materi
mengenai
indexing,
tokenisasi,
stopwords,
dan proses
stemming ● Menyelesaik
an beberapa
contoh
pemrosesan
teks baik
berupa
kalimat
maupun
dokumen ● Memberikan
bobot pada
sebuah kata
didalam
pemrosesan
teks dengan
menggunaka
n beberapa
pendekatan
● Penyampaian
materi: 90
menit ● Latihan dan
penyelesaian
studi kasus: 60
menit
● Mahasiswa
dapat
mengetahui
dan
melakukan
tahapan-
tahapan
didalam
pemrosesan
teks dan juga
melakukan
pembobotan
kata
5%
4. ● Memiliki pengetahuan
mengenai pemodelan
Information Retrieval (IR)
seperti Boolean Model,
dan Vector Space Model
● Pemodelan IR ● Boolean Model ● Vector Space
Model
● Dapat
mendefinisikan
beberapa model
dari Information
Retrieval beserta
tahapan-tahapan
dari masing-
masing model IR
● Mendefinisik
an masing-
masing
model IR
beserta
proses-proses
didalamnya
● Penyampaian
materi: 90
menit ● Latihan dan
penyelesaian
studi kasus: 60
menit
● Mahasiswa
dapat
menjelaskan
model-model
IR beserta
memberikan
contoh dari
proses setiap
model IR
5%
5. ● Memiliki kemampuan
dalam mengukur tingkat
relevansi dan akurasi dari
pemrosesan teks
● Evaluasi IR:
Recall &
Precision, Single
Value Summaries,
User Oriented
Measures, Web
Search Approach
● Dapat melakukan
pengukuran dasar
keefektifan IR
untuk
mendapatkan
tingkat relevansi
dan akurasi dari
pemrosesan teks
● Melakukan
evaluasi IR
dari hasil
pemrosesan
teks yang
sudah
melalui
proses
perhitungan
dan
pengolahan
teks
● Penyampaian
Materi: 60
Menit ● Latihan dan
penyelesaian
studi kasus: 90
menit
● Mahasiswa
dapat
melakukan
pengukuran
evaluasi IR
untuk
mendapatkan
tingkat
relevansi dan
akurasi dari
hasil
pemrosesan
teks
5%
6. ● Memiliki kemampuan
untuk memberikan umpan
balik pada dokumen hasil
pemrosesan teks yang
dianggap relevan
● Memiliki kemampuan
untuk memformulasikan
query yang lebih baik
ketika tidak ada informasi
dari koleksi yang ada
● Relevance
Feedback ● Query Expansion
● Algoritma
Rocchio
● Dapat memberikan
umpan balik dari
dokumen hasil
pemrosesan teks
untuk
memformulasikan
query yang lebh
baik sehingga
dapat memperoleh
hasil yang lebih
relevan
● Penyampaian
materi
mengenai
Relevance
Feedback,
Query
Expansion
dan
Algoritma
Rocchio
disertai
dengan
penyelesaian
studi kasus
● Penyampaian
Materi: 60
Menit ● Latihan dan
penyelesaian
studi kasus: 90
menit
● Mahasiswa
dapat
memberikan
umpan balik
dan
memformulasi
kan kembali
query
sehingga
dapat
memperoleh
hasil yang
lebih relevan
5%
7. ● Memiliki kemampuan
untuk pengelompokan
dokumen ke dalam kelas
yang berbeda
● Text Classification ● Dapat
mengelompokan
dokumen-
dokumen ke dalam
kelas yang berbeda
● Penyampaian
materi
mengenai
Text
Classificatio
n yang
disertai
dengan
penyelesaian
studi kasus
● Penyampaian
Materi: 60
Menit ● Latihan dan
penyelesaian
studi kasus
mengenai Text
Classification:
90 menit
● Mahasiswa
mampu
mengelompok
an dokumen-
dokumen
kedalam kelas
yang berbeda
dari studi
kasus yang
diselesaikan
5%
8. Evaluasi tengah semester : melakukan validasi hasil penilaian, evaluasi dan perbaikan proses pembelajaran berikutnya 15%
9. ● Memiliki kemampuan
mengelompokkan
dokumen dengan teks
yang mirip memiliki
keterkaitan baik yang
memiliki kesamaan
semantik maupun
kesamaan statistik
● Clustering ● Partitional
Algorithm
● Hierarchical
Algorithms
● Dapat melakukan
proses clustering
dokumen dengan
menggunakan
salah satu
algoritma yang
tersedia
● Penyampaian
materi
mengenai
clustering
dalam IR
dengan
disertai
algoritma-
algoritma
yang tersedia
di dalam
proses
clustering
● Penyampaian
Materi: 60
Menit ● Latihan dan
penyelesaian
studi kasus
mengenai
Clustering: 90
menit
● Mahasiswa
mampu
mengelompok
an dokumen-
dokumen
dengan
menggunakan
algoritma
yang tersedia
di dalam
proses
clustering
5%
10. ● Memiliki kemampuan
untuk meringkas informasi
yang terdapat didalam
sebuah dokumen sehingga
menghasilkan suatu versi
yang ringkas untuk
pengguna informasi
● Peringkasan Teks
● Jenis Ringkasan ● Hasil Ringkasan
● Dapat melakukan
proses penyaringan
informasi yang
paling penting dari
suatu sumber (atau
beberapa sumber)
untuk
menghasilkan
suatu versi yang
ringkas untuk user.
● Penyampaian
materi dan
juga latihan
melakukan
proses
peringkasan
teks dari
beberapa
dokumen
● Penyampaian
Materi: 60
Menit ● Latihan dan
penyelesaian
studi kasus
mengenai Text
Summarization:
60 menit ● Diskusi
kelompok hasil
dari
peringkasan
teks: 60 menit
● Mahasiswa
dapat
melakukan
text
summarization
dari dokumen-
dokumen yang
tersedia
5%
11. ● Memiliki kemampuan
untuk memformulasikan
dan menerapkan Question
Answering System (QAS)
untuk mengevaluasi
pemrosesan teks
● Definisi QAS ● QA vs Search
Engine ● Pengembangan
QAS
● Definisi Passages
● Dapat menjelaskan
QAS dan
menerapkan QAS
didalam bagian
dari sebuah
pemrosesan teks
● Simulasi dari
penerapan
QAS
● Penyampaian
materi QAS: 60
menit ● Latihan dan
simulasi QAS:
90 menit
● Mahasiswa
dapat
memahami
dan penerapan
dari QAS
5%
12. ● Memiliki kemampuan
dalam menganalisa
kemungkinan-
lemungkinan yang muncul
dari hasil pemrosesan teks
untuk memastikan
kebutuhan user
● Probabilistic
relevance
feedback ● Probability
Ranking Principle ● Binary
Independence
Model
● Dapat memahami
mengenai
Probabilistic
relevance feedback
serta memberikan
contohnya
● Studi Kasus
penerapan
Probabilistic
relevance
feedback
● Diskusi
kelompok: 60
menit ● Penyelesaian
studi kasus: 90
menit
● Mahasiswa
dapat
memiliki
wawasan baru
mengenai
Probabilistic
relevance
feedback dan
dapat
menerapkanny
a didalam
studi kasus
yang sudah
diberikan
5%
13. ● Memiliki kemampuan
dalam membaca dan
menginterpretasikan
informasi dan
menggabungkannya
dengan informasi pada
bahasa-bahasa lain
● Cross-Language
Information
Retrieval (CLIR) ● Monolingual vs
CLIR
● Dokumen vs
Query
● Metode
Penterjemahan
● Mengimplementasi
kan dasar dari
mesin penterjemah
sehingga hasil
akan baik jika
query ditulis dalam
kalimat sesuai
dengan tata bahasa
yang baik
● Studi kasus
penerapan
CLIR dengan
bebrapa
metode
penterjemaha
n
● Penyampaian
materi: 60
menit ● Studi kasus
tentang CLIR:
90 menit
● Mahasiswa
dapat
menerapkan
konsep CLIR
dengan
menggunakan
beberapa
metode
penterjemahan
yang tersedia
5%
14. ● Memiliki kemampuan
dalam memahami web
search dan search engine
sebagai bagian dalam
Information Retrieval
● Dasar dan
komponen Web
Search
● Markov chain
● Mendefisikan dan
memberikan
contoh proses dari
Web Search dsn
Search Engine
● Penyampaian
materi
mengenai
Web Search
dan Search
Engine
● Penyampaian
materi: 90
menit ● Tanya jawab:
60 menit
● Mahasiswa
dapat
menjelaskan
penggunaan
Web Search
dan dapat
membedakann
ya dengan
Search Engine
5%
15. ● Mahasiswa dapat mengerti
tugas yang akan dikerjakan
● Final Project
Information
Retrieval
● Menyelesaikan
tugas akhir mata
kuliah Information
Retrieval
● Presentasi
kelompok
dengen
ketentuan: ● Slide 1:
sekilah
tentang topik
yang di
ambil ● Slide 2:
Ruang
lingkup dan
batasan ● Slide 3:
Arsitektur
sistem yang
dibuat ● Slide 4:
pembagian
tugas setiap
anggota ● Demo sisem
● Presentasi dan
penilaian: 150
menit
● Mahasiswa
mampu
menbuat
arsitektur
sistem dari
Information
Retrieval serta
mendemokann
ya
5%
16. Evaluasi Akhir Semester : Melakukan validasi penilaian akhir dan menentukan kelulusan mahasiswa 15%