TeknikPengolahan Data& · 2015. 9. 19. · Probabilitas,PeluangKejadian,Risiko & Tahun ke- Debit...
Transcript of TeknikPengolahan Data& · 2015. 9. 19. · Probabilitas,PeluangKejadian,Risiko & Tahun ke- Debit...
Teknik Pengolahan Data Probabilitas
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
1
Universitas Gadjah Mada Jurusan Teknik Sipil dan Lingkungan Prodi Magister Teknik Pengelolaan Bencana Alam
Probabilitas • Probabilitas – Peluang – Kemungkinan • Mengapa probabilitas ? • Orang 7dak dapat memas7kan nilai suatu proses (misal erupsi gunung berapi) berdasarkan data erupsi selama waktu yang lalu sampai saat ini.
• Sifat stokas7k ataupun ke7dak-‐pas7an merupakan sifat yang melekat pada proses (yang melibatkan) alam.
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
2
Probabilitas, Peluang Kejadian
No urut Jumlah hari terjadinya
kemacetan pasokan air per bulan
Frekuensi
1 10 2
2 9 1
3 8 0
4 7 2
5 6 3
6 5 5
7 4 4
8 3 8
9 2 3
10 1 2
Jumlah 30
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
3
Jumlah hari saat terjadi kemacetan pasokan air PDAM selama 30 bulan terakhir.
Dapatkah Saudara memas7kan jumlah hari akan terjadi kemacetan pasokan air PDAM pada bulan depan?
Probabilitas, Peluang Kejadian, Risiko
Tahun ke- Debit (m3/s) Tahun ke- Debit (m3/s) Tahun ke- Debit (m3/s)1 473 23 1110 45 8432 544 24 717 46 4503 872 25 961 47 2844 657 26 925 48 4605 915 27 341 49 8046 535 28 690 50 5507 678 29 734 51 7298 700 30 991 52 7129 669 31 792 53 46810 347 32 626 54 84111 580 33 937 55 61312 470 34 687 56 87113 663 35 801 57 70514 809 36 323 58 77715 800 37 431 59 44216 523 38 770 60 20617 580 39 536 61 85018 672 40 708 62 82919 115 41 894 63 88720 461 42 626 64 60221 524 43 1120 65 40322 943 44 440 66 505
Debit puncak suatu sungai selama 66 tahun
Dapatkah Saudara memas7kan debit maksimum pada tahun ke-‐67?
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
4
Probabilitas • Definisi #1 • Andaikata suatu peris7wa random dapat terjadi dalam n cara yang masing-‐masing memiliki kemungkinan yang sama, dan apabila sejumlah na cara memberikan hasil A, maka probabilitas terjadinya peris7wa dengan hasil A adalah na/n
• Dalam definisi di atas, n adalah himpunan semua yang mungkin terjadi.
• Definisi di atas berasumsi bahwa n diketahui, padahal himpunan semua cara yang mungkin pada kenyataannya 7dak selalu diketahui atau 7dak terjadi atau 7dak diama7 atau 7dak dihitung.
prob A( ) = na n
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
5
Probabilitas • Definisi #2 • Andaikata suatu peris7wa random terjadi berkali-‐kali dalam jumlah yang sangat besar, n kali, dan sejumlah na kali memiliki hasil A, maka probabilitas peris7wa dengan hasil A adalah
• Definisi di atas berbeda dengan definisi #1 dalam hal-‐hal berikut: • Probabilitas suatu kejadian “diperkirakan” (can be es)mated) berdasarkan observasi sejumlah n kali.
• n di sini 7dak/bukan merupakan himpunan semua kejadian yang mungkin; dalam hal ini, 7dak diperlukan untuk mengetahui atau melakukan observasi terhadap semua kemungkinan
• Se7ap cara yang mungkin terjadi (dalam n tersebut) 7dak harus memiliki kemungkinan yang sama untuk terjadi.
prob A( ) =
n→∞lim na n
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
6
Probabilitas • Definisi 2: butuh berapa n? • Contoh
• Pada 2 set pengamatan (sampel) yang 7dak saling terkait/tergantung, perkiraan probabilitas kejadian A dapat ditetapkan berdasarkan masing-‐masing sampel tersebut.
• Kedua nilai probabilitas 7dak selalu sama satu dengan yang lain. • Kedua nilai probabilitas 7dak selalu sama dengan perkiraan probabilitas A yang ditetapkan dengan pengamatan sejumlah tak-‐berhingga kali.
• Problem: berapa jumlah pengamatan n yang diperlukan untuk mendapatkan es7masi probabilitas A yang dapat diterima?
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
7
Probabilitas • Kisaran (range) probabilitas • Dari kedua definisi, kisaran probabilitas adalah 0 s.d. 1. • prob(A) = 0 “hampir” 7dak mungkin terjadi
(nearly impossible) • prob(A) = 1 “hampir” pas7 terjadi
(almost certain)
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
8
Probabilitas • Misal suatu eksperimen (proses) menghasilkan sejumlah output yang berupa variable random • Himpunan semua hasil yang mungkin didapat disebut sample space.
• Se7ap elemen di dalam sample space disebut sample points (element)
• Se7ap elemen di dalam sample space memiliki faktor/bobot/weight (posi7f) sedemikian hingga jumlah weight seluruh elemen bernilai 1.
• Nilai bobot berbanding lurus dengan kemungkinan eksperimen akan memberikan hasil elemen tersebut.
• Bobot 7dak lain adalah probabilitas.
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
9
PROBABILITAS
Sample Space Sample Elements
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
10
Sample Space & Sample Elements
• Contoh #1: • Suatu DAS memiliki 3 stasiun: Sta-‐1, Sta-‐2, Sta-‐3. • Eksperimen: meneli7 se7ap stasiun perlu/7dak kalibrasi • Output: (y,n,y) Sta-‐1 perlu kalibrasi (y = yes) Sta-‐2 tak perlu kalibrasi (n = no) Sta-‐3 perlu kalibrasi (y = yes)
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
11
Sample Space & Sample Elements • Sample space: Alterna7f 1
• S1={(y,y,y),(y,y,n),(y,n,y),(n,y,y), (y,n,n),(n,y,n),(n,n,y),(n,n,n)}
• S1 adalah discrete sample space: jumlah elemen di dalam S1 dapat dihitung.
• Apabila eksperimen dilakukan satu kali saja, maka salah satu elemen S1 pas7 terjadi.
• Sample space: Alterna7f 2 • S2={0,1,2,3} • S2 adalah discrete sample space. • Hanya ingin diketahui jumlah stasiun yang perlu dikalibrasi. • Tidak diperlukan untuk mengetahui stasiun mana yang perlu dikalibrasi.
• Informasi yang diperoleh lebih sedikit daripada S1.
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
12
Sample Space & Sample Elements
• Contoh #2: • Pengukuran angin:
• kecepatan (km/jam) dan • arah (o).
• Output: (x,y) • x = kecepatan (km/jam) • y = arah (o)
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
13
Sample Space & Sample Elements • Sample space: Alterna7f 1
• Sample space: Alterna7f 2
• + = kecepatan > 60 (km/jam) • − = kecepatan < 60 (km/jam)
Ω1 = x, y( ) : x ≥ 0, 0 ≤ y ≤ 360{ }
360
0 x (km/jam)
y (o)
Ω2 = +,−{ }
continuous sample space
discrete sample space
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
14
Events • Event adalah suatu himpunan bagian (subset) dari sample space
• Suatu event terjadi jika dan hanya jika hasil dari eksperimen adalah anggota event tersebut
• Contoh: Kalibrasi Sta-‐1, Sta-‐2, Sta-‐3 • Event A: paling sedikit 2 stasiun perlu dikalibrasi A={(y,y,y),(y,y,n),(y,n,y),(n,y,y)}
• Event B: tak ada stasiun yang perlu dikalibrasi B={(n,n,n)}
• Event C: 2 stasiun perlu dikalibrasi C={(y,y,n),(y,n,y),(n,y,y)}
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
15
Diagram Venn • Notasi: S = sample space Ei = elemen di dalam S A,B = events di dalam S prob(Ei) = probabilitas elemen Ei
0 ≤ prob Ei( ) ≤1
S = ∪ i Ei
prob S( ) = prob Ei( )∑ =1
A B
S o E1 o E2
o E3 o En
AB A B
S o E1 o E2
o E3 o En
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
16
Probabilitas suatu Event • Event A
• Event A dan B
• Apabila A dan B tak bergantung satu dengan yang lainnya (independent), maka
A = Eii=m
n
∪0 ≤ prob A( ) = prob Ei( )
i=m
n
∑ ≤1
prob A∪B( ) = prob A( )+prob B( )−prob A∩B( )
prob A∪B( ) = prob A( )+prob B( )
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
17
Probabilitas suatu Event • Event Ac (= komplemen event A)
A∪Ac = S
prob A∪Ac( ) = prob A( ) +prob Ac( ) =1
prob A( ) =1−prob Ac( )
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
18
Probabilitas Bersyarat (Conditional Probability)
• Probabilitas suatu event (event B) bergantung pada terjadinya event lain (event A).
prob(B|A) = prob(B) dengan syarat event A terjadi » sample space berubah dari S menjadi A,
» event diwakili oleh
prob B A( ) =prob A∩B( )
prob A( ), prob A( ) ≠ 0
prob A∩B( ) = prob A( )prob B A( )
A∩B
A B
S
AB
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
19
Probabilitas Bersyarat (Conditional Probability) • Apabila event B tak bergantung pada event A (keduanya merupakan independent events), maka
prob B|A( ) = prob B( )prob A∩B( ) = prob A( ) ⋅prob B( )
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
20
Probabilitas Bersyarat (Conditional Probability) • Contoh • Data pengamatan hari hujan di suatu wilayah menunjukkan probabilitas hari hujan sbb. hari hujan setelah hari hujan = 0.444 hari tak hujan setelah hari hujan = 0.556 hari tak hujan setelah hari tak hujan = 0.724 hari hujan setelah hari tak hujan = 0.276
• Apabila dijumpai bahwa suatu hari terjadi hujan, berapakah probabilitas bahwa 2 hari berikutnya juga hujan?
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
21
Probabilitas Bersyarat (Conditional Probability) • Penyelesaian • Misal hari hujan (h) terjadi sbb.
hari ke-‐0 hari ke-‐1 hari ke-‐2 h h h
• Event A = hari ke-‐1 hujan setelah hari ke-‐0 hujan Event B = hari ke-‐2 hujan setelah hari ke-‐0 hujan
• Yang dicari adalah 3 hari hujan berturut-‐turut:
• Diketahui prob(A) = 0.444
event A
event B
prob A∩B( ) = prob A( ) ⋅prob B A( )
prob B A( ) = 0.444
prob A∩B( ) = 0.444×0.444 = 0.197
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
22 (hari hujan setelah hari hujan)
Probabilitas Bersyarat (Conditional Probability) • Cara penyelesaian yang lain • Probabilitas hari hujan setelah hari hujan adalah p = 0.444 • Suatu hari (hari ke-‐0) terjadi hujan
p = 0.444
hari ke-‐0 hari ke-‐1 hari ke-‐2 h h
th
p = 0.556
h
th
p = 0.444 × 0.444
p = 0.556 × 0.444
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
23
Probabilitas Total (Total Probability) • Apabila B1, B2,…, Bn adalah serangkaian events yang 7dak saling berkaitan (mutually exclusive events) dan masing-‐masing memiliki probabilitas 7dak sama dengan nol, prob(Bi) ≠ 0, untuk semua i:
B1∪B2∪…∪Bn = S
Bi ∩Bj = 0, ∀i, j i ≠ j( )prob Bi( ) > 0, ∀i
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
24
Probabilitas Total (Total Probability) • Probabilitas suatu event A dapat dituliskan sbb.
prob A( ) = prob A∩B1( )∪ A∩B2( )∪ ...∪ A∩Bn( )#$ %&
= prob A∩B1( )+prob A∩B2( )+ ...+prob A∩Bn( )
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
25
S A B1
B2 B3
Bn
Probabilitas Total (Total Probability)
• Dari condi)onal probability:
prob A( ) = prob B1( ) ⋅prob A B1( )+ ...+prob Bn( ) ⋅prob A Bn( )prob A( ) = prob Bi( ) ⋅prob A Bi( )"
#$%i=1
n
∑
prob A∩B1( ) = prob A( ) ⋅prob B1 A( )prob B1∩A( ) = prob B1( ) ⋅prob A B1( )
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
26
S A B1
B2 B3
Bn
Probabilitas Total (Total Probability) • Contoh • Data genangan di suatu wilayah permukiman menunjukkan bahwa probabilitas terjadinya genangan adalah 0.80 saat hari hujan dan 0.25 saat tak hujan.
• Diketahui bahwa probabilitas hari hujan adalah 0.36. • Berapakah probabilitas terjadinya genangan di wilayah tersebut?
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
27
Probabilitas Total (Total Probability) • Penyelesaian • Jika event A = terjadi genangan
event B1 = hari hujan event B2 = hari tak hujan
prob A( ) = prob B1( ) ⋅prob A B1( )+prob B2( ) ⋅prob A B2( )= 0.36×0.80+ 1−0.36( )×0.25
= 0.448
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
28
Teorema Bayes
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
29
• Dari condi)onal probability
prob A∩B( ) = prob A( ) ⋅prob B A( )prob B∩A( ) = prob B( ) ⋅prob A B( )
prob A( ) ⋅prob B A( ) = prob B( ) ⋅prob A B( )
• Untuk events A dan Bj, persamaan diatas menjadi
prob A( ) ⋅prob Bj A( ) = prob Bj( ) ⋅prob A Bj( )
(1)
(2)
(3)
(4)
Karena prob A∩B( ) = prob B∩A( ) , maka:
Teorema Bayes
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
30
• Dari total probability
prob A( ) = prob Bi( ) ⋅prob A Bi( )"
#$%i=1
n
∑
• Dengan (5) à (4)
prob Bj A( ) =prob Bj( ) ⋅prob A Bj( )
prob Bi( ) ⋅prob A Bi( )i=1
n
∑
(5)
(6)
Teorema Bayes • Pemakaian • Untuk mencari probabilitas event Bj apabila diketahui event A telah terjadi.
• Untuk mencari (memperkirakan) probabilitas suatu event (Bj) dengan mengama7 event kedua (A).
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
31
Teorema Bayes • Contoh • Informasi ramalan cuaca biasa dikirimkan melalui 4 saluran: Ri (i = 1,2,3,4) adalah event dimana informasi tsb dikirimkan melalui saluran i.
• Probabilitas masing-‐masing event Ri adalah: 0.1, 0.2, 0.3, dan 0.4. • Diketahui juga bahwa probabilitas terjadinya kesalahan pengiriman (event E) melalui masing-‐masing saluran adalah: 0.10, 0.15, 0.20, dan 0.25.
• Suatu saat diketahui bahwa suatu kesalahan pengiriman telah terjadi.
• Berapakah probabilitas bahwa kesalahan tersebut terjadi melalui saluran ke-‐2?
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
32
Teorema Bayes • Penyelesaian • Diketahui: prob(R1) = 0.1 prob(E|R1) = 0.10
prob(R2) = 0.2 prob(E|R2) = 0.15 prob(R3) = 0.3 prob(E|R3) = 0.20 prob(R4) = 0.4 prob(E|R4) = 0.25
• Probabilitas bahwa pengiriman dilakukan melalui saluran ke-‐2 dengan melihat kenyataan bahwa telah terjadi kesalahan adalah:
prob R2 E( ) =prob R2( ) ⋅prob E R2( )
prob Ri( ) ⋅prob E Ri( )1
4
∑
=0.2×0.15
0.1×0.10+0.2×0.15+0.3×0.20+0.4×0.25= 0.15
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
33
Teorema Bayes
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
34 prob(E)
i prob(Ri) prob(E|Ri) prob(Ri).prob(E|Ri) prob(Ri|E)
1 0.1 0.10 0.01 0.05
2 0.2 0.15 0.03 0.15
3 0.3 0.20 0.06 0.30
4 0.4 0.25 0.10 0.50
Σ 1.0 0.20 1.00
20-‐Sep
-‐15
h4p://is7
arto.staff.ugm.ac.id
35