BAB 2 LANDASAN TEORI - thesis.binus.ac.idthesis.binus.ac.id/doc/Bab2/2010-2-00252-if bab 2.pdf · 8...
Transcript of BAB 2 LANDASAN TEORI - thesis.binus.ac.idthesis.binus.ac.id/doc/Bab2/2010-2-00252-if bab 2.pdf · 8...
7
BAB 2
LANDASAN TEORI
Pada bab ini, penulis akan membahas mengenai teori yang digunakan dalam
penyusunan skripsi seperti Content Based Image Retrieval (CBIR), Latent Semantic
Indexing (LSI). Sebelum penulis membahas CBIR dan LSI, terlebih dahulu penulis
menjelaskan beberapa definisi dasar mengenai citra dan pengolahan citra.
2.1 Citra
2.1.1 Definisi
Adapun beberapa definisi citra sebagai berikut:
• Menurut Pearson (1991), citra adalah representasi dua dimensi dari
dunia visual, menyangkut berbagai macam disiplin ilmu yang mencakup
seni, human vision, astronomi, teknik, dan sebagainya. Merupakan suatu
kumpulan piksel-piksel atau titik-titik yang berwarna yang berbentuk
dua dimensi.
• Menurut Michael C. Fairhust (1994), suatu fungsi 2 dimensi, dimana
harga-harga fungsi tersebut f(x,y) pada koordinat spasial (x,y) di bidang
x dan y mendefinisikan suatu ukuran intensitas cahaya atau
kecermerlangan titik tersebut.
8
• Menurut Foley, James D (1996), citra adalah array dari nilai-nilai
dimana sebuah nilai tersebut adalah sekumpulan angka yang
mendeskripsikan atribut dari piksel di dalamnya.
• Menurut Wolfram Research, Inc (2002), citra adalah sinyal diskrit 2
dimensi. Secara matematis, sinyal ini dapat direpresentasikan sebagai
fungsi dari variable-variable 2 dimensi. Setiap elemen dari array
tersebut disebut piksel.
Citra sebagai keluaran dari suatu sistem perekaman data dapat bersifat
sebagai berikut :
1. Optik berupa foto,
2. Analog berupa sinyal video contohnya gambar pada monitor televisi,
3. Digital yang dapat langsung disimpan pada suatu pita magnetik.
Terdapat dua macam citra, yaitu:
• Citra diam
Merupakan citra tunggal yang tidak bergerak tetap, biasa disebut citra.
• Citra bergerak (moving images)
Merupakan rangkaian citra diam yang ditampilkan secara beruntun
(sekuensial) sehingga memberikan kesan pada mata kita sebagai gambar
yang bergerak. Setiap citra di dalam rangkaian tersebut disebut frame.
9
2.1.2 Citra Digital
Citra digital secara umum didefinisikan sebagai pemrosesan citra dua
dimensi dengan komputer. Dalam definisi yang lebih luas, pengolahan citra digital
juga mencakup semua data dua dimensi. Citra digital adalah barisan bilangan
nyata maupun kompleks yang diwakili oleh bit – bit tertentu. Unit terkecil dari
data digital adalah bit, yaitu angka biner, 0 atau 1. Kumpulan dari data sejumlah 8
bit data adalah sebuah unit data yang disebut byte, dengan nilai dari 0 – 255.
Dalam hal citra digital, nilai level energi dituliskan dalam satuan byte. Kumpulan
byte ini dengan struktur tertentu bisa dibaca oleh software dan disebut citra digital
8 bit.
Citra digital dapat didefinisikan sebagai fungsi dua variabel f(x,y), dimana x
dan y adalah koordinat spasial dan nilai f(x,y) adalah intensitas citra pada koordinat
tersebut, hal tersebut diilustrasikan pada gambar 2.1. Teknologi dasar untuk
menciptakan dan menampilkan warna pada citra digital berdasarkan penelitian
bahwa sebuah warna merupakan kombinasi dari tiga warna dasar, yaitu merah,
hijau, dan biru (Red, Green, Blue - RGB).
10
Gambar 2.1 Letak koordinat x1,y1, pada sebuah citra
Tiga tipe citra:
1. Citra grayscale (tingkat keabuan)
2. Citra berwarna (color)
3. Citra rumit/komplek (complex)
2.1.3 Citra Grayscale
Suatu citra dikatakan sebagai citra grayscale apabila sebuah citra tidak
memiliki warna RGB atau dapat dikatakan sebuah citra yang memiliki nilai dari
putih yang memiliki intensitas paling besar sampai hitam yang memiliki intensitas
paling rendah seperti yang dapat dilihat pada gambar 2.2. Citra grayscale terdiri
dari x dan y dalam spasial koordinat dan memiliki nilai intensitasnya masing-
masing. Pada citra grayscale setiap gambar memiliki intensitas antara 0 (hitam)
hingga 255 (putih) dalam citra 8 bitnya.
11
Gambar 2.2 Intensitas grayscale
254 255 255252 252 114255 205 101
254 . . . .7 . . . .
199 . . . .
. . 33 41 44
. . 180 100 128
. . 65 61 57205 181 122198 200 21597 213 115
234 . . . .245 . . . .217 . . . .
. . 123 143 98
. . 245 253 252
. . 221 224 24387 100 18423 35 65
211 211 67
142 . . . .43 . . . .
43. .. .
. .
. .
. . 233 211 215
. . 33 121 211. .
. . 254 121 213
Gambar 2.3 Citra grayscale yang diubah menjadi nilai matriks
12
Dengan algoritma perhitungan tingkat keabuan, piksel dari suatu citra yang
mengandung warna-warna RGB (Red, Green, Blue) diubah menjadi warna dalam
berbagai tingkat keabuan (I) dengan menjumlahkan nilau warna merah, hijau, dan
biru kemudian dibagi tiga sehingga didapatkan nilai rata-rata dari ketiga warna.
3
Gambar 2.4 Rumus grayscale berdasarkan RGB
2.1.4 Citra Berwarna
Citra berwarna merupakan citra yang ditampilkan dengan menggunakan Red
Green Blue (RGB) atau Hue Saturation Intensity (HSI) model. Intensitas
(intensity) merupakan tingkat kecerahan (lightness) dan ketajaman (brightness)
dari warna yang dipilih. Hitam asli (pure black) diangka 0 dan putih walaupun
hue ataupun saturation telah diatur. Saturation merupakan tingkat dari kemurnian
dari sebuah hue atau berkurangnya warna putih. Intensitas atau value merupakan
sebuah pengukuran dari sejumlah cahaya yang direfleksikan dari hue. Hue
merupakan dominan dari wavelength.
15
2.1.5 Citra Kompleks (complex)
Citra kompleks disimpan dalam 64 bit floating point yang terdiri dari 32 bit
real (asli) dan 32 bit imaginary parts (bagian khayalan). Citra kompleks
mengandung informasi frekuensi yang menampilkan sebuah citra grayscale dan
sangat bermanfaat untuk diterapkan pada proses domain frekuensi ke citra data.
2.1.6 Histogram
Salah satu cara untuk memperbaiki suatu citra digital adalah dengan
mengatur level dari brightness dan contrast-nya. Variasi sebuah brightness akan
digambarkan pada suatu citra dengan menggunakan histogram tersebut dan
dimanipulasi dengan merubah histogram citra tersebut.
Histogram akan menempatkan beberapa piksel dengan brightness level
mereka yang sesuai. Untuk piksel dengan ukuran level brightness sebesar 8 bit,
maka brightness akan memiliki grey level yang berkisar antara 0 (hitam) sampai
255 (putih). Sehingga histogram yang memiliki nilai brightness yang lebih kecil
akan terlihat lebih gelap dibandingkan dengan yang memiliki nilai lebih besar.
Histogram yang memiliki grey level dibawah 120 memiliki tingkat
kegelapan yang lebih gelap, dimana warna gelap tersebut seperti ditunjukan
gambar 2.10 yang dimiliki oleh ban mobil dan bagian bawah mobil, serta
bayangan mobil yang memiliki warna cenderung hitam. Disini juga terlihat bahwa
apabila suatu gambar memiliki warna yang cenderung gelap maka secara
keseluruhan histogram akan berkonsentrasi ke arah kiri (hitam).
16
Gambar 2.10 Ban mobil dan histogramnya dengan grey level < 120
Gambar 2.11 Ban mobil dan histogramnya setelah dinaikkan nilai
brightness nya
Dengan penaikkan nilai brightness seperti yang ditunjukan gambar 2.11,
histogram cenderung merata dan agak sedikit terkonsentrasi ke arah kanan (putih).
2.2 Karakteristik Citra
2.2.1 Piksel (Pixel)
Piksel (pixel) atau picture element, dan kadang-kadang disebut juga dengan
“pel” merupakan satuan terkecil dari sebuah citra digital. Pada citra digital, jika
17
dilihat dengan teliti, maka terdapat banyak titik kecil berbentuk segi empat yang
membentuk citra, titik kecil tersebut disebut piksel.
Beberapa definisi piksel menurut para ahli:
• Oliver (1996)
Piksel merupakan titik yang merupakan penyusun dari citra yang
ditampilkan komputer.
• Michael C. Fairhust (1995)
Piksel merupakan titik terkecil yang telah didigitkan secara spasial dan
terdiri dari N x N sample yang terdistribusi secara sama.
• J.R Parker (1994)
Piksel merupakan bagian array 2 dimensi dari suatu raster image.
Setiap piksel mempresentasikan warna atau tingkat keabuan dan
terletak pada posisi vertikal dan horizontal, atau yang lebih dikenal
dengan baris dan kolom.
• Murni (1992)
Piksel merupakan bagian terkecil dari gambar yang mengandung
informasi.
• Adrian Low (1991)
Piksel dianggap sebagai bagian terkecil dari citra. Dapat berupa logika
maupun fisik. Dengan kata lain, dapat berupa lokasi elemen dari suatu
citra atau menampilkan salah satu dari tingkat keabuan.
18
Jumlah piksel per-satuan panjang menentukan resolusi citra tersebut. Makin
banyak piksel yang mewakili sebuah citra, maka makin tinggi resolusinya dan
makin halus citra digital tersebut.
piksel
Gambar 2.12 Piksel
Gambar 2.13 Citra 180x240 Gambar 2.14 Citra 100x133
Perbandingan citra 180 x 240 piksel dengan citra 100 x 133 piksel, tampak
kelihatan lebih jelas jika dengan citra 180 x 240 piksel dibandingkan dengan citra
100 x 133.
19
2.2.2 Kontras (Contrast)
Kontras adalah perbedaan brightness relative antara sebuah benda dengan
sekelilingnya pada citra. Sebuah bentuk tertentu mudah terdeteksi apabila pada
sebuah citra kontras antara bentuk tersebut dengan background tinggi. Teknik
pengolahan citra bisa dipakai untuk mempertajam kontras. Citra dapat
dimanipulasi menggunakan algoritma (persamaan matematik).
2.2.3 Resolusi
Resolusi dari sebuah citra adalah karakteristik yang menunjukkan level
kedetailan yang dimiliki oleh sebuah citra. Resolusi diwakili oleh sebuah piksel
sebagai elemen terkecil dari sebuah citra. Resolusi merupakan hal penting yang
perlu dipertimbangkan dalam rangka pemilihan citra yang akan digunakan
terutama dalam hal aplikasi, waktu, biaya, ketersediaan citra, dan fasilitas
komputasi.
Semakin tinggi tingkat resolusi suatu citra, berarti semakin banyak jumlah
piksel yang digunakan dalam citra tersebut, sehingga citra yang dihasilkan menjadi
lebih bersih dan halus.
2.3 Matriks (Matrix)
Matriks adalah suatu kumpulan angka-angka atau elemen-elemen yang disusun
menurut baris dan kolom, dimana jumlah baris dan kolom bisa sama maupun berbeda,
dimana panjang dan lebarnya ditunjukkan oleh banyaknya kolom-kolom dan baris-baris.
20
Matriks dalam suatu citra, menunjuk kepada ukuran pikselnya. Contohnya, jika
suatu citra grayscale memiliki ukuran 1024 x 768 piksel, maka jika diubah ke dalam
data matriks, maka akan berukuran matriks 1024 x 768.
Gambar 2.15 Matriks
2.4 Pengolahan Citra Digital (Digital Image Processing)
Image Processing merupakan bentuk dari signal processing, yang dimana
inputnya berupa citra (image), seperti foto atau video, dan output dari image processing
tersebut berupa karakteristik atau parameter yang berhubungan dengan citra tersebut.
Pengertian pengolahan citra yang lain adalah pemrosesan citra, khususnya dengan
menggunakan komputer menjadi citra yang kualitasnya lebih baik. Hasil output dari
pengolahan citra tidaklah harus berupa citra, tetapi dapat berupa bagian dari citra
tersebut.
Umumnya, operasi-operasi pada pengolahan citra diterapkan pada citra bila :
1. Perbaikan atau memodifikasi citra perlu dilakukan untuk meningkatkan
kualitas penampakan atau untuk menonjolkan beberapa aspek informasi
yang terkandung di dalam citra,
2. Elemen di dalam citra perlu dikelompokkan, dicocokkan, atau diukur,
21
3. Sebagian citra perlu digabung dengan bagian citra yang lain
Secara umum, operasi pengolahan citra dapat diklasifikasikan dalam beberapa
jenis sebagai berikut:
1. Perbaikan kualitas citra (image enhancement).
Jenis operasi ini bertujuan untuk memperbaiki kualitas citra dengan cara
memanipulasi parameter-parameter citra. Dengan operasi ini, ciri-ciri khusus
yang terdapat di dalam citra lebih ditonjolkan. Contoh-contoh operasi
perbaikan citra:
• Perbaikan kontras gelap/terang
• Perbaikan tepian objek (edge enhancement)
• Penajaman (sharpening)
• Pemberian warna semu (pseudocoloring)
• Penapisan derau (noise filtering)
2. Pemugaran citra (image restoration).
Operasi ini bertujuan menghilangkan atau meminimalkan cacat pada citra.
Tujuan pemugaran citra hampir sama dengan operasi perbaikan citra.
Bedanya, pada pemugaran citra penyebab degradasi gambar diketahui.
Contoh-contoh operasi pemugaran citra:
• Penghilangan kesamaran (deblurring).
• Penghilangan derau (noise)
3. Pemampatan citra (image compression).
Jenis operasi ini dilakukan agar citra dapat direpresentasikan dalam bentuk
yang lebih kompak sehingga memerlukan memori yang lebih sedikit. Hal
22
penting yang harus diperhatikan dalam pemampatan adalah citra yang telah
dimampatkan harus tetap mempunyai kualitas gambar yang bagus. Contoh
metode pemampatan citra adalah metode JPEG.
4. Segmentasi citra (image segmentation).
Jenis operasi ini bertujuan untuk memecah suatu citra ke dalam beberapa
segmen dengan suatu kriteria tertentu. Jenis operasi ini berkaitan erat dengan
pengenalan pola.
5. Penganalisa citra (image analysis)
Jenis operasi ini bertujuan menghitung besaran kuantitif dari citra untuk
menghasilkan deskripsinya. Teknik ini mengekstraksi ciri-ciri tertentu yang
membantu dalam identifikasi objek. Proses segmentasi kadangkala
diperlukan untuk melokalisasi objek yang diinginkan dari sekelilingnya.
Contoh-contoh operasi analisa citra:
• Pendeteksian tepi objek (edge detection)
• Ekstraksi batas (boundary)
• Representasi daerah (region)
6. Rekonstruksi citra (image reconstruction)
Jenis operasi ini bertujuan untuk membentuk ulang objek dari beberapa citra
hasil proyeksi. Operasi rekonstruksi citra banyak digunakan dalam bidang
medis. Misalnya beberapa foto rontgen dengan sinar X digunakan untuk
membentuk ulang gambar organ tubuh.
23
Beberapa macam proses dalam image processsing:
• Eucladean Geometry Transformation, meliputi pembesaran citra,
pengurangan citra, dan rotasi citra.
• Color Corrections, meliputi pengaturan kontras, dan kecerahan citra
(contras dan brightness), Quantization (Color translation ke pallet
warna yang lain).
• Digital Compositing, meliputi penggabungan antara 2 gambar atau
lebih. Proses ini biasa digunakan dalam proses pembuatan film untuk
membuat “Mattes”.
• Interpolation dengan menggunakan Bayer Filter Pattern,
Bayer Filter Pattern digunakan untuk menyusun ulang presentasi
komposisi pewarnaan RGB (Red Green Blue). Metode Bayer Filter
Pattern ditemukan oleh Dr.Bryce E.Bayer, sekarang ini metode Bayer
Filter banyak digunakan di teknologi single chip digital image censors
pada kamera digital, camcorder, dan scanner.
• Image Registrasition, meliputi kesesuaian antara dua gambar atau
lebih.
• Image Differencing, meliputi morphing yaitu efek khusus dalam film
dan animasi yang berubah (morphs) satu gambar ke lainnya melalui
transisi yang halus.
• Image Recognition, misalnya mengambil teks dari gambar dengan
menggunakan optical character recognition.
24
• Image Segmentation, mengacu pada proses partisi gambar digital
menjadi beberapa segmen (bagian dari pixels) (Juga dikenal sebagai
superpixels).
• High Dynamic Range Imaging, dengan menggunakan teknik
penggabungan dua atau beberapa gambar.
• Geometric Hashing, digunakan untuk pengenalan objek atau gambar
dua dimensi (dimensi x dan y) yang mewakili affine invariance.
Image processing biasanya mengarah kepada digital image processing. Digital
image processing adalah penggunaan dari algoritma komputer (computer algorithm)
untuk melakukan image processing yang lebih rumit (complex) pada citra digital (digital
image), dengan demikian dapat menyajikan kinerja yang lebih canggih dengan tugas
yang sederhana (simple task). Digital image processing, khususnya, merupakan satu-
satunya praktek teknologi untuk classification, feature extraction, pattern recognition,
projection, multi scale signal analysis.
2.4.1 Classification (Statistical Classification)
Merupakan suatu prosedur pembelajaran mesin yang di mana setiap item
akan ditempatkan dalam kelompok – kelompok berdasarkan informasi kuantitatif
pada satu atau lebih karakteristik yang melekat pada item seperti ciri-ciri, variabel,
karakter, dan didasarkan pada serangkaian pelatihan sebelumnya.
2.4.2 Feature Extraction
Melibatkan sejumlah sumber daya yang diperlukan untuk menjelaskan
sebuah set data besar secara akurat. Ketika melakukan analisis terhadap data yang
kompleks, salah satu masalah utama yang berasal dari jumlah variabel yang terlibat
25
analisis dengan sejumlah besar variabel biasanya membutuhkan sejumlah memori
yang besar dan daya komputasi atau algoritma klasifikasi yang overfits. Feature
extraction merupakan istilah umum untuk membangun metode kombinasi dari
variabel-variabel sekelilingnya. Masalah saat ini masih menggambarkan data
dengan akurasi yang memadai
2.4.3 Pattern Recognition
Merupakan “tindakan mengambil data mentah dan mengambil tindakan
berdasarkan kategori pola”. Tujuannya adalah untuk mengelompokan data pola
yang didasarkan pada apriori baik pengetahuan atau informasi statistik diambil
dari pola-pola. Pola harus diklasifikasikan kelompok pengukuran atau
pengamatan, menentukan titik dalam ruang multidimensi yang tepat.
2.4.4 Multiscale Signal Analysis (Signal Processing)
Merupakan suatu spesialisasi dalam teknik elektro yang mempelajari dan
mengembangkan metode algoritma, manipulasi, analisa dan interpretasi sinyal.
Sinyal dapat berarti suara, citra, waktu berbagai nilai dan sensor data, misalnya
data biologis seperti elektrokardiogram, sistem kontrol sinyal.
2.5 Kecerdasan Buatan (Artificial Intelligence)
2.5.1 Definisi Kecerdasan Buatan
Kecerdasan buatan (Artificial Intelligence), atau disebut juga dengan
intelegensia semu, merupakan kecerdasan atau pengetahuan dari suatu mesin dan
merupakan cabang dari ilmu komputer (computer science), yang bertujuan untuk
menciptakan kecerdasan mesin. Kecerdasan buatan merupakan ilmu yang
26
membahas mengenai perancangan mesin supaya mesin dapat menemukan solusi
untuk menyelesaikan masalah yang kompleks (rumit) dalam kehidupan manusia
sehari – hari.
Beberapa definisi kecerdasan buatan, diantaranya:
• Charniak dan mcdermot (1984)
Kecerdasan buatan adalah kemampuan berpikir melalui model-
model dan perhitungan atau komputasi.
• H.A. Simon (1987)
Kecerdasan buatan merupakan kawasan penelitian, aplikasi dan
instruksi yang terkait dengan pemrograman komputer untuk
melakukan sesuatu hal yang dalam pandangan manusia adalah
cerdas.
• Levine et al (1990)
Kecerdasan buatan adalah suatu cara membuat komputer dapat
berpikir secara pintar.
• Rich and Knight [1991]:
Kecerdasan buatan merupakan studi tentang bagaimana
membuat komputer melakukan hal-hal yang pada saat ini dapat
dilakukan lebih baik oleh manusia.
• Turban (1992)
27
Kecerdasan buatan adalah bagian dari ilmu komputer yang
ditujukan untuk membuat software dan hardware menghasilkan
sesuatu seperti yang dihasilkan seperti yang dihasilkan manusia.
• Encyclopedia Britannica
Kecerdasaan buatan merupakan cabang dari ilmu komputer yang
dalam merepresentasi pengetahuan lebih banyak menggunakan
bentuk simbol-simbol daripada bilangan, dan memproses
informasi berdasarkan metode heuristic atau dengan berdasarkan
sejumlah aturan.
Tujuan dari kecerdasan buatan menurut Winston dan Prendergast, yaitu:
1. Membuat mesin menjadi lebih pintar, (tujuan utama)
2. Memahami apa itu kecerdasaan, (tujuan ilmiah)
3. Membuat mesin lebih bermanfaat.(tujuan entrepreneurial)
Menurut Stuart Russell dan Peter Norvig, definisi artificial intelligence
dapat dibagi menjadi :
• Sistem berpikir seperti manusia
• Sistem bertingkah seperti manusia
• Sistem bertingkah secara rasional
28
Gambar 2.16 Domain penelitian dalam kecerdasan buatan
2.5.2 Sejarah Artificial Intelligence
Kecerdasan buatan (artificial intelligence), termasuk dalam bidang ilmu yang
relative muda. Tahun 1950, para ilmuwan mulai meneliti bagaimana agar mesin
dapat melakukan perkerjaan dan berpikir seperti manusia. Alan Turing, seoran g
matematika dari Inggris, yang pertama kali mengusulkan adanya test untuk
mengetahui apakah suatu mesin dapat dikatakan cerdas.
Artificial intelligence (AI) atau disebut juga dengan kecerdasan buatan,
dimunculkan oleh seorang profesor dari Massachusettes institute of technology,
yang bernama John McCarthy pada tahun 1956 pada Darthmouth Conferrence
yang dihadiri oleh para peneliti AI.
Adapun beberapa program AI. yang mulai dibuat pada tahun 1956 – 1966
antara lain:
29
1. Logic Theorist, diperkenalkan pada Darthmouth Conferrence
Program ini dapat membuktikan teorema-teorema matematika.
2. Sad Sam, diprogram oleh Robert K. Lindsay 1960
Program ini dapat mengetahui kalimat – kalimat sederhana yang
ditulis dalam bahasa inggris, dan mampu memberikan jawaban
atas fakta – fakta yang didengar dalam sebuah percakapan.
3. ELIZA, diprogramkan oleh Joseph Weizenbaun 1967
Program ini mampu melakukan terapi terhadap pasien dengan
memberikan beberapa pertanyaan.
2.5.3 Ruang Lingkup Artificial Intelligence
Adapun ruang lingkup utama dalam Artificial Intelligence (kecerdasan
buatan) adalah sebagai berikut :
1. Sistem Pakar, atau disebut juga dengan Expert System
Komputer digunakan sebagai sarana untuk menyimpan
pengetahuan para pakar, dengan demikian mesin akan memiliki
keahlian untuk menyelesaikan permasalahan dengan keahlian
yang dimiliki oleh pakar.
2. Pengolahan Bahasa Alami (Natural Language Processing)
Dengan pengolahan bahasa alami ini, diharapkan user dapat
berkomunikasi dengan mesin dengan menggunakan bahasa
sehari-hari.
3. Pengenalan Ucapan (Speech Recognition)
30
Melalui pengenalan ucapan, diharapkan manusia dapat
berkomunikasi dengan mesin dengan menggunakan suara.
4. Robotika system sensor (Robotic and sensory system)
Sistem sensor, seperti system vision, system tactile, dan system
pemrosesan sinyal jika dikombinasikan dengan AI, dapat
dikategorikan kedalam suatu system yang luas yang disebut
system robotic.
5. Computer Vision
Mencoba untuk dapat menginterprestasikan gambar atau objek –
objek tampak melalui computer.
6. Intelligent Computer-Aided Instruction,
Komputer dapat digunakan sebagai tutor yang dapat melatih dan
mengajar.
7. Permainan (Game)
Menurut Sri Kusuma Dewi, games adalah fasilitas yang sangat
menarik dalam komputer. Ide games pertama kali dikenalkan
oleh Claude Shannon (1950) yang menuliskan paper tentang
permainan catur.
Keuntungan kecerdasan buatan dibanding kecerdasan alamiah:
• Lebih permanen,
• Memberikan kemudahan dalam duplikasi dan penyebaran,
• Relatif lebih murah dari kecerdasan alamiah,
• Konsisten dan teliti,
31
• Dapat didokumentasi,
• Dapat mengerjakan beberapa task dengan lebih cepat dan lebih
baik dibandingkan dengan manusia.
Keuntungan kecerdasan alamiah dibanding kecerdasan buatan :
• Bersifat kreatif,
• Dapat melakukan proses pembelajaran secara langsung,
sementara kecerdasan buatan harus mendapatkan masukan
berupa symbol dan reperesentasi-representasi.
• Fokus yang luas sebagai referensi untuk pengambilan keputusan
sebaliknya kecerdasan buatan menggunakan fokus yang sempit.
Sistem yang menggunakan kecerdasan buatan akan memberikan output
berupa solusi dari suatu masalah berdasarkan kumpulan pengetahuan yang ada.
Secara umum, untuk membangun suatu system yang mampu menyelesaikan
masalah, perlu dipertimbangkan 4 hal yaitu :
1. Mendefinisikan masalah dengan tepat.
Pendefinisian ini mencakup spesifikasi yang tepat mengenai
keadaan awal dan solusi yang diharapkan.
2. Menganalisis masalah tersebut serta mencari beberapa
teknik penyelesaian masalah yang sesuai.
3. Merepresentasikan pengetahuan yang perlu untuk
menyelesaikan masalah tersebut.
4. Memilih teknik penyelesaian masalah yang terbaik.
32
Sehingga untuk mendeskripsikan masalah dengan baik harus:
1. Mendefinisikan suatu keadaan ruang keadaan (state space).
2. Menetapkan satu atau lebih keadaan awal (initial state).
3. Menetapkan satu atau lebih tujuan (goal state).
4. Menetapkan kumpulan aturan.
2.6 Computer Vision
Pada hakikatnya, computer vision mencoba meniru cara kerja system visual
manusia (human vision). Computer Vision merupakan proses otomatis yang
mengintegrasikan sejumlah besar proses untuk persepsi visual, seperti akuisisi citra,
pengolahan citra, klasifikasi, pengenalan (recognition), dan membuat keputusan.
Computer Vision berkaitan dengan teori dibalik sistem buatan (artificial systems), yang
mengekstrak informasi dari suatu citra.
Proses-proses di dalam computer vision dapat dibagi menjadi tiga aktivitas:
1. Memperoleh atau mengakuisisi citra digital.
2. Melakukan teknik komputasi untuk memperoses atau memodifikasi
data citra (operasi-operasi pengolahan citra).
3. Menganalisis dan menginterpretasi citra dan menggunakan hasil
pemrosesan untuk tujuan tertentu, misalnya memandu robot,
mengontrol peralatan, memantau proses manufaktur, dan lain -lain.
Beberapa ahli mendefinisikan Computer Vision sebagai berikut:
• Menurut Michael C. Fairhurst (1995)
33
Computer vision sesuai dengan sifatnya, merupakan suatu objek yang
merangkul berbagai disiplin tradisional secara luas guna mendasari prinsip-
prinsip formalnya, dan dalam mengembangkan suatu metodologi yang
berlainan dari apa yang dimilikinya, pertama-tama harus menggabungkan
dan secara berurutan membangun materi yang mendasarkan ini.
• Adrian Low (1991)
Computer vision berhubungan dengan perolehan gambar, pemrosesan,
klasifikasi, pengenalan, dan menjadi penggabungan, pengurutan pembuatan
keputusan menuju pengenalan.
• J.R. Parker (1994)
Computer vision menyangkut pengekstrakan informasi dari citra, dan dalam
identifikasi dan klasifikasi objek-objek dalam citra.
Daerah atau bagian yang paling erat dengan Computer Vision itu sendiri yaitu,
image processing, machine vision, dan image analysis.
Image processing dan image analysis, berfokus pada pemrosesan citra 2 dimensi,
bagaimana merubah suatu citra menjadi citra yang lain, seperti contrast enhancement
(penambahan terang), edge extraction (penambahan garis tepi), noise removal, atau
geometrical transformation seperti rotasi citra.
Machine vision cenderung berfokus terhadap aplikasi terutama dalam bidan g
manufaktur seperti robot otonom berbasis vision dan sistem untuk vision berdasarkan
pengukuran. Ini mengimplementasi teknologi sensor citra dan teori control seringkali
terintegrasi dengan pengolahan data citra untuk mengendalikan robot dan yang real time
processing ditekankan dengan cara yang efisien implementasi di hardware dan software.
34
Hal ini juga menyiratkan bahwa kondisi-kondisi eksternal seperti pencahayaan dapat dan
sering lebih terkontrol dalam machine vision daripada di computer vision pada
umumnya.
2.7 Content Based Image Retrieval (CBIR)
2.7.1 Sejarah
Istilah CBIR berasal dari tahun 1992, ketika digunakan oleh T. Kato untuk
mendeskripsikan eksperimen automatic retrieval image dari sebuah database
berdasarkan warna dan bentuk. Istilah tersebut untuk menggambarkan proses
pengambilan citra yang diinginkan dari sebuah koleksi database besar berdasarkan
fitur sintaksis gambar. Teknik-teknik, alat dan algoritma yang digunakan berasal
dari bidang-bidang seperti statistik, pengenalan pola, pemrosesan sinyal.
2.7.2 Konsep Dasar
CBIR (Content Based Image Retrieval), atau disebut juga Query by Image
Content (QBIC) merupakan suatu aplikasi dari Computer Vision untuk masalah
image retrieval (pengambilan citra), yaitu sebuah teknik yang menggunakan
content visual dari citra tetap dalam mencari kesamaan citra dalam citra database
yang sangat besar menurut input atau sesuai dengan keinginan pengguna (user).
Content based berarti pencarian akan menganalisa isi sebenarnya dari citra.
Menganalisa dalam konteks dapat berarti berupa warna, bentuk, tekstur, atau
informasi lain yang terdapat dalam citra tersebut. Tanpa kemampuan dalam
35
memeriksa konten citra, pencarian harus tergantung pada metadata seperti judul
dan kata kunci yang susah payah atau mahal untuk diproduksi.
2.7.3 Sistem Software dan Teknik
Banyaknya sistem CBIR dibangun, namun masalah mengambil citra
berdasarkan konten piksel sebagian besar sampai saaat ini belum terpecahkan.
Teknik Query, Implementasi berbeda dari CBIR memanfaatkan berbagai
jenis query user sebagai berikut :
1. Query by example
Teknik query yang melibatkan sistem CBIR dengan contoh gambar yang
kemudian mendasarkan pada pencarian.
2. Semantic Retrieval
Sistem ideal CBIR dari perspektif pengguna akan melibatkan apa yang
disebut sebagai semantic retrieval dimana pengguna melakukan
permintaan seperti contoh “find pictures of dogs”.
3. Metode query lain seperti :
• browsing for example images,
• navigating customized / hierarchical categories,
• querying by image region,
• querying by multiple example images,
• querying by visual sketch,
• querying by direct specification of image features,
• multimodal queries.
36
Konten teknik perbandingan, metode yang digunakan untuk mengekstrak
konten dari citra sehingga memudahkan untuk dibandingkan.
1. Colour, pengambilan citra berdasarkan kesamaan warna yang ada
dengan menghitung sebuah color histogram untuk setiap citra yang ada
untuk mengidentifikasikan piksel dalam nilai-nilai sebuah citra.
2. Teksture, ukuran tekstur dilihat untuk pola visual dalam citra dan
bagaimana mereka terdefinisikan secara spasial.
3. Shape, bentuk tidak harus kepada bentuk citra tetapi bentuk berdasarkan
citra daerah tertentu yang sedang dicari.
CBIR merupakan kombinasi dari beberapa pengetahuan yang berbeda, seperti:
• pattern recognition,
• wavelet filtering,
• machine learning,
• object matching,
CBIR ditujukan untuk pengertian karakteristik visual dari suatu citra tanpa
penjelasan tulisan. Penelitian dan isu pembangunan di CBIR mencakup berbagai
topik, banyak berbagi dengan arus utama pengolahan gambar dan pengambilan
informasi. Beberapa yang paling penting adalah :
• Pemahaman citra kebutuhan pengguna dan informasi perilaku mencari.
• Identifikasi cara-cara yang sesuai untuk menggambarkan isi citra.
37
• Mengekstraksikan fitur tersebut dari citra mentah.
• Menyediakan penyimpanan untuk citra database yang besar.
• Mencocokkan query dan citra yang disimpan dengan sebuah cara yang
mencerminkan kesamaan.
• Mengakses citra yang disimpan secara efisien berdasarkan isi.
• Menyediakan antarmuka yang dapat digunakan manusia untuk sistem
CBIR.
Contoh penerapan aplikasi CBIR:
• Pencegah kejahatan (crime prevention)
Contohnya: Automatic Face Recognition.
• Pengecekan keamanan (security check)
Contohnya: Fingerprint, retina scanning
• Diagnosis medis (medical diagnosis)
Contohnya: CT-scan, MRI, Ultrasound Intellectual Property: untuk
Trademark (menjaga property kepemilikan)
• Image Search Engine (WWW-World Wide Web)
2.8 Image Retrieval
Image Retrieval (Pengambilan citra) adalah suatu sistem komputer untuk
menelusuri (browsing), mencari (searching), dan pengambilan citra (image retrieval)
dari suatu database yang besar pada citra-citra digital (digital images). Sebagian besar
cara lama dan umum metode pada image retrieval memanfaatkan metode penambahan
38
metadata seperti captioning, keywords, atau deskripsi dari pada citra tersebut sendiri
sehingga dapat disajikan dengan penjelasan kata – kata.
2.9 Latent Semantic Indexing (LSI)
2.9.1 Definisi
Latent Semantic Indexing merupakan metode pengambilan (retrieval) dan
indexing menggunakan teknik matematika yang disebut dengan Singular Value
Decomposition (SVD). Pengambilan citra menggunakan Latent Semantic Indexing
telah digunakan, yaitu dengan pengindeksan berdasarkan teks (context based) atau
dengan pengindeksan berdasarkan citra (content based).
2.9.2 Penerapan LSI
LSI dapat diterapkan dalam Context Based Information Retrieval dan
Content Based Image Retrieval. LSI dalam Context Based Information Retrieval
dapat berdasarkan penjelasan–penjelasan yang dimana ditambahkan untuk
menyingkapkan citra (kata kunci (keyword), keterangan ), atau pada teks tambahan
yang “sengaja” tersedia dengan sebuah citra (judul halaman, judul tambahan, dekat
teks). Dari teks tersebut, pengindeksan dapat diciptakan menggunakan teknik
standard pengambilan teks. Kesamaan antara citra dimana yang pada gilirannya
sering didasarkan pada kesamaan penggunaan kata. Masalah yang penting dengan
pendekatan Context Based Information Retrieval ini adalah perbedaan pada
penggunaan kata diantara dokumen-dokumen, diantaranya:
39
• Dokumen dapat membahas topik yang sama dengan menggunakan
kata-kata berbeda (sinonim)
• Menggunakan kata-kata yang sama yang menggambarkan konsep-
konsep yang berbeda (ambiguitas)
LSI dalam Content Based Image Retrieval (CBIR) menggunakan query by
example (QBE) telah menjadi terkenal beberapa tahun belakangan ini. Sistem
CBIR mencoba untuk mengenal citra yang secara visual paling mirip untuk contoh
citra. kesamaan didasarkan pada seperangkat citra dengan fitur-fitur tingkat
rendah. Fitur yang dapat digunakan untuk pengindeksan citra yaitu warna, tekstur,
bentuk dan tata ruang.
Beberapa penelitian tentang fitur yang paling cocok dengan persepsi
manusia telah dilakukan, misalnya penelitian yang dilakukan oleh Gargi dan
Kasturi (1996) serta Liu dan Picard (1996), tetapi fitur apa yang paling cocok
dengan persepsi manusia sebagian karena adanya keterlibatan subjektivitas karena
mustahil bahwa fitur ada secara keseluruhan.
Masalah penting dalam pengindeksan berbasis konten adalah kenyataan
kesamaan visual yang tidak sesuai dengan kesamaan semantik. Oleh karena itu,
bahkan jika fitur ada yang sesuai dengan visi manusia, tetap pengambilan citra
tidak selalu berkaitan dengan contoh citra pada tingkat semantik. Masalah ini
dikenal sebagai kesenjangan semantik (semantic gap) dan menyebabkan sistem
pengambilan citra untuk mengambil citra yang agak mirip dengan fitur.
40
2.9.3 Keuntungan dan Kerugian LSI
Keuntungan LSI adalah sebagai berikut :
1. True(latent)dimensions
Asumsi di LSI (dan juga untuk bentuk-bentuk lain dari dimensi
pengurangan seperti analisis komponen utama) adalah bahwa dimensi
baru adalah lebih baik representasi dokumen dan query. Metafora yang
mendasari istilah "laten" adalah bahwa dimensi-dimensi baru adalah
representasi benar. Ini benar representasi kemudian tertutup oleh proses
generasi yang menyatakan dimensi tertentu dengan satu set kata-kata
dalam beberapa dokumen dan berbagai set kata-kata dalam dokumen
lain. analisis LSI pulih asli semantik struktur ruang dan dimensi aslinya.
2. Synonymy
Sinonim mengacu pada fakta bahwa konsep dasar yang sama dapat
dijelaskan menggunakan istilah yang berbeda. strategi pengambilan
tradisional mengalami kesulitan menemukan dokumen pada topik yang
sama yang menggunakan kosa kata yang berbeda. Dalam LSI, konsep
dalam pertanyaan serta semua dokumen yang terkait dengan itu semua
mungkin diwakili oleh kombinasi variable indeks.
3. Polysemy
Polisemi menggambarkan kata-kata yang memiliki lebih dari satu arti,
yang umum. Besar jumlah kata polysemous dalam query dapat
mengurangi ketepatan pencarian secara signifikan. Dengan
menggunakan sistem di LSI, satu kesempatan untuk menghapus
beberapa noisy dari data, yang dapat digambarkan sebagai penggunaan
41
langka dan kurang penting istilah tertentu. . Karena istilah vektor LSI
hanya menimbang rata-rata yang berbeda makna dari istilah, ketika
makna sesungguhnya berbeda dari arti rata-rata, LSI benar-benar dapat
mengurangi kualitas pencarian.
4. Term Dependence
Model ruang vektor tradisional menganggap merdeka dan istilah istilah
melayani sebagai dasar vektor ortogonal dari ruang vektor. Karena ada
yang kuat asosiasi antara istilah dalam bahasa, asumsi ini tidak pernah
puas. Sementara istilah kemerdekaan merupakan pendekatan orde
pertama yang paling masuk akal, mungkin untuk mendapatkan
peningkatan kinerja dengan menggunakan istilah dalam asosiasi proses
pengambilan. Menambahkan frasa umum sebagai item pencarian yang
sederhana penerapan pendekatan ini.
Kerugian LSI adalah sebagai berikut :
1. Storage
Satu juga dapat berargumentasi bahwa representasi SVD lebih kompak.
Banyak dokumen yang memiliki lebih dari 150 istilah yang unik. Jadi
representasi vektor jarang akan memakan ruang penyimpanan lebih dari
representasi SVD kompak jika kita mengurangi sampai 150 dimensi.
2. Efficiency
Salah satu kecepatan yang paling penting dalam pencarian vektor ruang
berasal dari menggunakan indeks terbalik. Akibatnya, hanya dokumen
yang memiliki beberapa istilah umum dengan query harus diperiksa
selama pencarian. Dengan LSI, bagaimanapun pertanyaan harus
42
dibandingkan dengan setiap dokumen dalam koleksi. Namun, beberapa
faktor yang dapat mengurangi atau menghilangkan kekurangan ini. Jika
query memiliki jangka lebih dari perwakilannya dalam ruang vektor
LSI, maka hasil kali dalam nilai kemiripan akan mengambil lebih
banyak waktu untuk menghitung dalam ruang panjang.
3. LSI and normally-distributed data
Keberatan lain untuk SVD adalah bahwa dengan semua metode lain,
benar-benar dirancang untuk data terdistribusi normal, namun distribusi
tersebut tidak cocok untuk menghitung data, dan data perhitungan yang
panjang terdiri dari oleh-dokumen matriks.
2.9.4 Aplikasi LSI
Beberapa aplikasi LSI yaitu
• Information retrieval
• Relevance Feedback
• Information Filtering
• TREC
• Noisy Input
2.10 Precision dan Recall
Precision dapat dilihat sebagai ukuran ketepatan, sedangkan Recall merupakan
ukuran dari kelengkapan.
Dalam information retrieval, Precision didefinisikan sebagai jumlah dokumen
yang relean diambil oleh pencarian dibagi dengan total jumlah dokumen yang diambil
43
oleh pencarian. Recall didefinisikan sebagai jumlah dokumen yang relevan diambil oleh
pencarian dibagi dengan jumlah dokumen yang relevan yang ada.
Precision dengan nilai sempurna 1.0 berarti bahwa setiap hasil diambil oleh
pencarian relevan, sedangkan Recall dengan nilai sempurna 1.0 berarti semua dokumen
yang relevan diambil oleh pencarian
2.11 Mikroorganisme
2.11.1 Definisi
Mikroorganisme atau mikroba adalah suatu organisme yang mikroskopik
(berukuran terlalu kecil untuk dilihat dengan mata telanjang manusia). Studi
mikroorganisme disebut mikrobiologi.
Mikroorganisme hidup di semua bagian biosfer dimana terdapat cairan air,
termasuk tanah, air panas, di laut lantai, tinggi di atmosfer dan jauh di dalam batu-
batuan di dalam bumi kerak. Mikroorganisme sangat penting untuk daur ulan g
nutrisi dalam ekosistem ketika mereka bertindak sebagai dekomposer.
2.11.2 Klasifikasi dan Struktur
Mikroorganisme hampir dapat ditemukan di mana saja di taksonomi
organisasi hehidupan di planet ini. Bakteri dan archaea hampir selalu mikroskopik,
jumlah eukariota juga mikroskopik, termasuk protista, beberapa jamur, beberapa
hewan dan tumbuhan. Virus umumnya dianggap tidak hidup dan demikian tidak
mikroba, meskipun bidang mikrobiologi juga mencakup studi tentang virus.
44
2.11.3 Bakteri
Bakteri berasal dari kata Latin bacterium (jamak, bacteria), adalah kelompok
raksasa dari organisme hidup. Bakteri sangatlah kecil dan kebanyakan uniselular
(bersel tunggal), dengan struktur sel yang relatif sederhana tanpa nukleus/inti sel,
cytoskeleton, dan organel lain seperti mitokondria dan kloroplas. Kebanyakan dari
mereka kecil, biasanya hanya berukuran 0,5-5 μm, meski ada jenis dapat
menjangkau 0,3 mm dalam diameter. Oleh karenanya, bakteri disebut mikroskopik
karena hanya dapat dilihat melalui mikroskop. Bakteri di dunia diperkirakan
sekitar 5 × 1030.
Bakteri pertama ditemukan oleh Anthony van Leeuwenhoek pada 1674.
Istilah bacterium diperkenalkan di kemudian hari oleh Ehrenberg pada tahun
1828, diambil dari kata Yunani βακτηριον yang memiliki arti "small stick".
Berdasarkan bentuknya, bakteri dibagi menjadi tiga golongan besar, yaitu:
• Kokus (Coccus) dalah bakteri yang berbentuk bulat seperti bola, dan
mempunyai beberapa variasi sebagai berikut:
o Mikrococcus, jika kecil dan tunggal
o Diplococcus, jka bergandanya dua-dua
o Tetracoccus, jika bergandengan empat dan membentuk
bujursangkar
o Sarcina, jika bergerombol membentuk kubus
o Staphylococcus, jika bergerombol
o Streptococcus, jika bergandengan membentuk rantai
45
• Basil (Bacillus) adalah kelompok bakteri yang berbentuk batang atau
silinder, dan mempunyai variasi sebagai berikut:
o Diplobacillus, jika bergandengan dua-dua
o Streptobacillus, jika bergandengan membentuk rantai
• Spiril (Spirilum) adalah bakteri yang berbentuk lengkung dan
mempunyai variasi sebagai berikut:
o Vibrio, (bentuk koma), jika lengkung kurang dari setengah
lingkaran
o Spiral, jika lengkung lebih dari setengah lingkaran
Gambar 2.17 Morfologi bakteri