Search Engine, Subject Directory, MetaSearch Engine, Focused Crawler

21
Search Engine, Subject Directory, Metasearch Engine Chandra P. Setiawan

Transcript of Search Engine, Subject Directory, MetaSearch Engine, Focused Crawler

Search Engine, Subject Directory, Metasearch Engine

Chandra P. Setiawan

Search Engine

Google: http://www.google.comYahoo: http://www.yahoo.comInfoSeek: http://www.infoseek.comExcite:http://www.excite.comAOL Anywhere: http://www.aol.comVivisimo: http://www.vivisimo.comAltavista : http://www.altavista.comLycos: http://www.lycos.comAlltheweb: http://www.alltheweb.comAsk : http://www.ask.comScience.gov

Open Google

Google.com Or http://www.google.com/advanced_search

• Find Results memberikan empat kemudahan pencarian

terhadap kata, frase, atau kalimat dengan empat kategori, yaitu: “with all of the words”, “with the exactphrase”, “with any of the words”, dan “without the words” yang berfungsi sebagai filter dalam melakukanseleksi terhadap dokumen. • Language menawarkan batasan pencarian terhadap

situs-situs yang ditulis di dalam bahasa tertentu.

• File Format memerintahkan pencarian terhadap file-file

khusus yang memiliki initial akhir (sufiks) semacam .doc, .pdf, .ppt, dan lain sebagainya.• Date membatasi pencarian pada situs-

situs yang baru saja dilakukan update untuk beberapa waktu terakhir(misalnya satu bulan terakhir, tiga bulan terakhir, satu tahun terakhir, dan lain sebagainya).

• Occurences memberitahukan dimana saja letak kata,

frase, atau kalimat yang dipergunakan sebagaisearching key akan dicari di seluruh situs, seperti pada title situs, judul artikel, isi artikel, URL, atau links yangada pada situs. • Domains membatasi pencarian pada sebuah

alamatdomain tertentu, seperti misalnya: situs-situs berinisial “.org”, situs-situs berinisial “.com”, situs-situs padadomain utama “cnn.com”, situs-situs pada sub-domain “das.harvard.edu”, dan lain sebagainya.• Safe Search untuk mencegah hasil

pencarian menunjuk pada situs-situs yang berbau pornografi.

Power Searching

Host Searching Terkadang seseorang ingin mencari informasi di sebuah situs tertentu dan tidak ingin mencarinya di seluruh jagad internet yang ada; maka yang bersangkutan dapat menggunakan sebuah perintah pencarian “host” (atau “site”). Contoh berikut ini, yaitu:

host:detik.com korupsi host:kompas.com ”computer architecture” host:edu presiden –host:ri.go.id

Generic URL Searching exploration URL:mars.jpl.nasa.gov memiliki arti bahwa search engine akan mencari berbagai dokumen yang berkaitan dengan kata “exploration” di dalam sebuah alamat unik website “mars.jpl.nasa.gov” saja.

exploration –URL:nasa.gov akan memerintahkan search engine untuk mencari seluruh dokumen di internet yang mengandung kata “exploration” kecuali yang terdapat di alamat “nasa.gov”.

Special URL Searching holiday inurl:jakarta akan berfungsi memerintahkan search engine untuk mencari berbagai dokumen yang URL-nya mengandung kata jakarta, dimana di dalamnya terkandung kata “holiday”.

Filetype Searching +management +finance filetype:ppt maka Google akan menampilkan semua file berinisial .ppt yang ada di seluruh internet yang siap untuk didownload.

+computer +security filetype:pdf host:edu akan memperoleh sejumlah file-file Adobe Acrobat yang berinisial akhir .pdf di seluruh situs-situs pendidikan yang ada di internet, dimana di dalamnya terdapat teks “computer” dan “security”

Calculator 1 pound to kg 1 mile to km

Subject Directories

Let Have a try

Ipl.org Resources by subject Social sciences Psychology Psychology information online Depression

Let’s have a try

About.com Depression psychology Psychotherapy All topics

Medline plus http://www.nlm.nih.gov/medlineplus/ Drugs and supplement Drugs browse by generic name

DMOZ.org

Health Fitness Yoga Shopping

Digital-librarian.com

Focused Crawler –hybrid search tool-

center on specific subjects or topics and attempt to find and index as many pages as possible within particular subject area by spidering a limited domain of we sites known to cover a particular topic. (Sherman, 2001) It does so not with human editors, but with automated crawler (Schlein, 2004)

Let’s have a try: http://lp.findlaw.com/ http://psycnet.apa.org/index.cfm?fa=search.advancedSearchForm (American Psychology Association)

http://www.politicalinformation.com/ http://www.usa.gov/ (government information of all kinds in the USA)

Metasearch Engines

Ixquick.com An Ixquick result is awarded one star (     ) for every search engine that chooses it as one of the ten best results for your search. So a five star (               ) result means that five search engines agreed on the result.

Kartoo.comKartoo is a visual meta search engine, "with visual display interfaces. 

Info.com results from the leading search engines including Google, Yahoo!, Bing, Yandex, Ask and Open Directory

Simply enter info.com/whatever you want into the address box. For example, typing info.com/jeep or info.com/jeeps car into the address bar will automatically lead you to the results for 'jeep cars

Yippy.com Search strategy Klik search Details

Another metasearch engine: dogpile

Webscale discovery

http://www.lib.nus.edu.sg/ Findmore