Pertemuan 9 · 2011. 12. 3. · F α=4 G -5 X -5 D E 0 C β=3 R 0 P 9 Q -6 S 3 T 5 U -7 V -9 H K M...

Pertemuan 9

Mid Term Discussions Alpha Beta Pruning

Logical Agent (intro to proportional logic)

Algoritma Alpha Beta (optimized MinMax)

• Beberapa cabang tidak perlu untuk dibuka jika berhadapan dengan lawan yang cerdas

• Idenya adalah dengan memantau nilai pada cabang setiap kali DFS dilakukan

• Yang dipantau adalah nilai alpha (jika MAX), dan beta (jika MIN)

• Alpha = nilai terbesar sampai saat ini • Beta = nilai terkecil sampai saat ini • Jika Beta Alpha, stop percabangan

– Tidak ada nilai yang lebih menguntungkan MAX – MIN tidak mengijinkan MAX untuk terus maju

Minimax Revisited

- Pruning Example

- Pruning Algorithm

- Pruning The “Heuristic”

More Detailed - Pruning Example

F G -5

K M H 3

minimax(A,0)

max Call

A A α=

F G -5

K M H 3

minimax(B,1)

max Call

B B β=

F G -5

K M H 3

minimax(F,2)

max Call

F F α=

K M H 3

minimax(N,3)

max Call

blue: terminal state

K M H 3

minimax(F,2) is returned to

max Call

alpha = 4, maximum seen so far

F α=4

K M H 3

minimax(O,3)

max Call

min O O β=

F α=4

K M H 3

minimax(W,4)

max Call

blue: terminal state (depth limit)

F α=4

K M H 3

minimax(O,3) is returned to

max Call

beta = -3, minimum seen so far

min O β=-3

O β=-3

F α=4

K M H 3

minimax(O,3) is returned to

max Call

O's beta F's alpha: stop expanding O (alpha cut-off)

O β=-3

F α=4

K M H 3

Why? Smart opponent will choose W or worse, thus O's upper bound is –3. So computer shouldn't choose O:-3 since N:4 is better

max Call

O β=-3

F α=4

K M H 3

A α= max

alpha not changed (maximizing)

minimax(F,2) is returned to

O β=-3

F α=4

K M H 3

minimax(B,1) is returned to

max Call

beta = 4, minimum seen so far

B β=4

O β=-3

B β=4

F α=4

K M H 3

minimax(G,2)

max Call

O β=-3

B β=4

F α=4

K M H 3

minimax(B,1) is returned to

max Call

beta = -5, updated to minimum seen so far

B β=-5

O β=-3

B β=-5

F α=4

K M H 3

minimax(A,0,4) is returned to

max Call

alpha = -5, maximum seen so far

A α=-5

O β=-3

B β=-5

F α=4

K M H 3

minimax(C,1)

max Call

A α=-5

C C β=

O β=-3

B β=-5

F α=4

K M H 3

minimax(H,2)

max Call

A α=-5

O β=-3

B β=-5

F α=4

K M H 3

minimax(C,1) is returned to

max Call

beta = 3, minimum seen so far

A α=-5

C β=3

O β=-3

B β=-5

F α=4

C β=3

K M H 3

minimax(I,2)

max Call

A α=-5

O β=-3

B β=-5

F α=4

C β=3

K M H 3

max Call

beta not changed (minimizing)

A α=-5

O β=-3

B β=-5

F α=4

C β=3

K M H 3

minimax(J,2)

max Call

A α=-5

J J α=

O β=-3

B β=-5

F α=4

C β=3

K M H 3

minimax(P,3)

max Call

A α=-5

O β=-3

B β=-5

F α=4

C β=3

K M H 3

minimax(J,2) is returned to

max Call

alpha = 9

A α=-5

J α=9

O β=-3

B β=-5

F α=4

C β=3

K M H 3

J α=9

minimax(J,2) is returned to

max Call

J's alpha C's beta: stop expanding J (beta cut-off)

A α=-5

J Q -6

O β=-3

B β=-5

F α=4

C β=3

K M H 3

J α=9

A α= max

A α=-5

Why? Computer should choose P or better, thus J's lower bound is 9; so smart opponent won't take J:9 since H:3 is worse

O β=-3

B β=-5

F α=4

C β=3

K M H 3

J α=9

max Call

beta not changed (minimizing)

A α=-5

O β=-3

B β=-5

F α=4

C β=3

K M H 3

J α=9

minimax(A,0) is returned to

max Call

alpha = 3, updated to maximum seen so far

A α=-5 A α=3

O β=-3

B β=-5

F α=4

C β=3

K M H 3

J α=9

A α= max

A α=3

minimax(D,1)

O β=-3

B β=-5

F α=4

C β=3

K M H 3

J α=9

minimax(A,0) is returned to

max Call

alpha not updated (maximizing)

A α=3

O β=-3

B β=-5

F α=4

C β=3

K M H 3

J α=9

How does the algorithm finish the search tree?

max Call

A α=3

O β=-3

B β=-5

F α=4

E β=2

C β=3

K α=5

J α=9

E's beta A's alpha: stop expanding E (alpha cut-off)

max Call

A α=3

O β=-3

B β=-5

F α=4

E β=2

C β=3

K α=5

J α=9

A α= max

A α=3

Why? Smart opponent will choose L or worse, thus E's upper bound is 2; so computer shouldn't choose E:2 since C:3 is better path

O β=-3

B β=-5

F α=4

E β=2

C β=3

K α=5

J α=9

Result: Computer chooses move to C

max Call

A α=3

Properti - Pruning

• Tidak mengubah hasil akhir

• Urutan simpul akan mempengaruhi pemangkasan yang terjadi

– Kasus terbaik = O(bm/2)

– Kasus terburuk = O(bm) = DFS

• Fungsi evaluasi dapat digunakan untuk mengatur susunan simpul

Logical Intelligent Agent

• Problem solving agent hanya bisa menyelesaikan masalah yang lingkungannya accessible

• Kita membutuhkan agen yang dapat menambah pengetahuan dan menyimpulkan keadaan

• Agent seperti ini kita beri nama knowledge based agent

Knowledge based agent

• Representasi Pengetahuan yang bersifat general.

• Kemampuan beradaptasi sesuai temuan fakta.

• Kemampuan menyimpulkan sesuatu dari pengetahuan yang sudah ada.

Knowledge based agent

Inferensi

(Inference

Engine)

percept

Basis Pengetahuan

(Knowledge Base)

pengetahuan

Mula-mula berisi

background

knowledge

Persepsi yang

diterima

Diubah menjadi

pengetahuan

Berdasarkan

pengetahuan

yang dimiliki

Agen memilih

aksi yang tepat

(inferensi)

Hasil dari aksi disimpan kembali

dalam bentuk pengetahuan

Knowledge Based Agent

• Komponen utama dari knowledge based agent adalah knowledge basenya

• Knowledge base (KB) adalah kumpulan representasi fakta tentang lingkungan atau dunia yang berhubungan atau menjadi daerah bekerjanya agen

• Setiap representasi dalam KB disebut sebagai sebuah sentence yang diekspresikan dalam sebuah bahasa yakni knowledge representation language

Robot Sonar

Agent Control Architecture

• Control dipisahkan ke dalam lapisan-lapisan yang merespons tingkah laku

Contoh Control Architecture

Knowledge Based Agent

• Inferensi adalah proses menyimpulkan fakta dari fakta fakta yang sudah ada di KB

• KB agent memiliki pengetahuan dasar yang disebut sebagai background knowledge

Generic KB-Agent

KB agent layer

• Knowledge level / epistemological layer

• Logical level

• Implementation level

Syarat Representasi KB

• Representational Adequacy

kemampuan merepresentasikan semua pengetahuan yang dibutuhkan dalam

domainnya

• Inferential Adequacy

kemampuan memanipulasi struktur pengetahuan untuk membentuk struktur baru

dalam menampung pengetahuan baru hasil inferensi

• Inferential Efficiency

kemampuan untuk manambahkan informasi untuk mempercepat pencarian dalam

inferensi

• Acquisitional Efficiency

kemampuan untuk menambah informasi baru secara mudah

The Wumpus World

Wumpus world

• Environment sederhana, berguna untuk menguji dan menjelaskan logical agent.

• Gua gelap dengan banyak ruangan yang dihubungkan dengan lorong-lorong.

• Agent masuk ke gua untuk mengambil emas yang ada di salah satu ruangan.

• Wumpus (monster) bersembunyi di salah satu ruangan. Jika agent bertemu, ia akan menjadi santapannya.

• Terdapat ruang-ruang yang memiliki lubang jebakan yang dapat membunuh agent.

• Agen hanya punya 1 panah yang bisa membunuh wumpus dari jarak jauh.

• Performance Measure:

ketemu emas: +1000, mati: -1000

-1 untuk setiap langkah, -10 untuk memanah

• Environment:

– Petak yang bersebelahan dengan wumpus berbau busuk (smelly)

– Petak yang bersebelahan dengan pit (lubang) terasa angin (breezy)

– Petak tempat emas berada bercahaya (Glitter)

– Agent dapat memanah mati wumpus jika berhadapan langsung

– Memanah perlu 1 panah

– Agent bisa mengambil emas jika berada di petak emas tersebut ada

• Actuators:

Left turn, Right turn, Forward, Grab, Release, Shoot

• Sensors:

Breeze, Glitter, Smell,

Bump (jika agent menabrak tembok),

Scream (jika wumpus mati)

Background knowledge :

• Jika ada bau maka ada wumpus di petak tetangga

• Jika ada angin maka ada lubang di petak tetangga

• Jika tak ada bau maka tak ada wumpus di petak tetangga

• Jika tak ada angin maka tak ada lubang di petak tetangga

• Jika tak ada lubang dan Wumpus boleh maju

• dst.

1. Tak ada angin dan bau di (1,1) maka tak ada Wumpus dan lubang di (2,1) dan (1,2)

2. Maju ke (2,1)

3. Ada angin di (2,1) maka ada lubang di (2,2) atau (3,1)

4. Tak ada bau di (2,1) maka tak ada Wumpus di (2,2) dan (3,1)

5. Mundur ke (1,1)

6. Maju ke (1,2)

7. Ada bau di (1,2) maka ada Wumpus di (3,1) (karena tidak ada Wumpus di (2,2))

Breeze di (1,2) dan (2,1)

tidak ada aksi yang aman

Jika distribusi peluang lubang seragam, maka kemungkinan lubang ada di (2,2) lebih besar daripada (1,3)/(3,1)

Smell di (1,1)

wumpus ada di (1,2) atau (2,1), agent tidak dapat bergerak.

bisa menggunakan strategi: panah lurus ke depan

ada wumpus wumpus mati aman

tidak ada wumpus aman

Soal Latihan Pruning

F E G H I J K

L M N O P Q R S T U V W X Y

7 6 8 5 2 3 0 -2 6 2 5 8 9 2

Pertemuan 9 · 2011. 12. 3. · F α=4 G -5 X -5 D E 0 C β=3 R 0 P 9 Q -6 S 3 T 5 U -7 V -9 H K M...

Documents

Transcript of Pertemuan 9 · 2011. 12. 3. · F α=4 G -5 X -5 D E 0 C β=3 R 0 P 9 Q -6 S 3 T 5 U -7 V -9 H K M...

Di mana Max?

· Manfaat Pengobatan Internasional & ASEAN (dalam Rupiah) Deluxe Superior 650,000/hari max 650,000/hari max 455,000/hari max 650,000/6 jam max 650,000/6 jam

Bahan prentaibogor pak max

GAMBARAN KADAR ENZIM Serum Glutamic Oxaloacetic … muza_opt.pdf · 2018. 9. 17. · Enzim ini mengkatalisa transfer suatu gugus amino dari aspartat ke α-ketoglutarat menghasilkan

Mastering 3ds Max 2012

Picasa...SMA 39 A CIO OV 50 H z/ (5 0 H z 40 0 Wee—I,' — MAX 1 MAX 1 9 ox 11 ox 150 cm 50K g

Pengukuran Vo2 Max

Discharge Planning Max Doc

Karekok turev max min

BAB III LANDASAN TEORI 3.1 EdrawSoft Max 7.7 Edraw Max

Perhitungan VO2 Max

Balon 3ds Max

PENGARUH JENIS KACANG KEDELAI (Glycine max L. Merrill) DAN … · 2018. 11. 9. · PENGARUH JENIS KACANG KEDELAI (Glycine max L. Merrill) DAN PERBANDINGAN STARTER TERHADAP KARAKTERISTIK

Teknologi wi max

BLACK HIPNOTIS MAX

Modul Swish Max

MODUL 2 max

DAFTAR PUSTAKA - eprints.undip.ac.ideprints.undip.ac.id/46284/9/Faramita_Nur_Izzaty_22010111140194_Lap.KTI_Bab_8.pdfMaqsalmina M. Pengaruh Latihan Aerobik Terhadap Perubahan VO 2 Max

Perancangan Isuzu D-Max

Makalah Fix Max _era