Bab 5 Pengujian
description
Transcript of Bab 5 Pengujian
Materi 5Pengujian Hasil Bilangan Random
Ir. Risma A. Simanjuntak, MT
Teknik Industri
Fakultas Teknologi industri
Institut Sains & Teknologi AKPRIND
Yogyakarta
Kompetensi
• Memahami pengertian distribusi probabilitas
• Memahami penggunaan distribusi probabilitas dalam simulasi
• Mengetahui teknik pengujian
• Dapat memvalidasi algoritma simulasi dengan pengujian Goodness of Fit
Pokok Bahasan
• Pengujian pembangkit bilangan random
• Frequency test (Kolmogorof-Smirnov atau Chi
Square)
• Runs test
Pengantar
• Suatu bilangan acak mempunyai dua sifat statistik yang penting, yaitu keseragaman dan ketidaktergantungan (uniformity and independence). Untuk mendapatkan sifat yang diinginkan dari bilangan acak secara pasti, maka sejumlah pengujian harus dilakukan
Hasil bilangan random yang baik :
Bilangan random yang dihasilkan benar-benar tampak dari distribusi U(0,1)
Tidak ada korelasi antar bilangan random (independence)
Beberapa pengujian :
• Frequency test (Kolmogorof-Smirnov atau Chi Square)
• Runs test • Autocorrelation test• Gap test• Poker test
Test untuk uniformHipotesa :
Ho : Ri ~ U(0, 1)H1 : Ri ~ U(0, 1)
IndependenceHipotesa :
Ho : Ri ~ IndependentlyH1 : Ri ~ Independently
1. Frequency Test
• Kolmogorof-Smirnov
digunakan untuk sample kecil
Fn (x) = Number of Xi / N
F (Xi) = i / n
Langkah-langkah
1. Rangking data mulai dari yang terkecil sampai terbesarR1 < R1 < …… < RN
2. Hitung D+ = max { i / N - Ri }
D- = max { Ri - (i – 1) / N }
3. Hitung D = max ( D+ , D- )
Langkah (lanjut) :
4. Tentukan nilai kritis (table) α dari table dengan tingkat kepercayaan α dan sample N
5. Jika nilai hitung lebih besar dari nilai table maka data tersebut berdistribusi uniform atau distribusi tertentu
Test distribusi
• Distribusi uniform :F(x) = 1/(b-a) x a < x < b
a = 0 dan b = 1
• Distribusi eksponensialf(x) = ∫ 1/λ . e-x/λ untuk x > 0
F(x) = 1 – e-x / λ untuk x > 0
Contoh 1. Test Kolmogorof Smirnov Distribusi uniform
• Misalkan hasil bilangan pembangkitan : 0.44 , 0.81 , 0.14 , 0.05 , 0.93
• Test apakah data tersebut berdistribusi uniform
• Dengan tingkat kepercayaan α = 0.05
Penyelesaian :Untuk sample kecil ---- test Kolmogorof Smirnov
R1 0.05 0.14 0.44 0.81 0.93
i/N 0.20 0.40 0.60 0.80 1.00
i / N - Ri 0.15 0.26 0.16 - 0.07
Ri - (i – 1) / N
0.05 - 0.04 0.21 0.13
Dari table α = 0.05 dan N = 5 adalah 0,565Nilai hitung < nilai table : 0.26 < 0.565Berarti berdistribusi uniform
******
Contoh 2. Test Kolmogorof Smirnov Distribusi eksponensial
Berdasarkan pengamatan didapat data interval waktu kedatangan sebagai berikut :
3.10 0.20 12.10 1.40 0.05 7.00 10.90 13.70 5.30 9.10
Tes data tersebut apakah berdistribusi eksponensial
Penyelesaian :
• Sample kecil ---- test Kolmogorof Smirnov
No Xi F(xi) i/n i/n – F(xi) F(xi) – (i-1) / n
1 3.10 0.049 0.1 0.051 0.049
2 3.30 0.052 0.2 0.148 -0.048
3 15.40 0.244 0.3 0.056 0.044
4 16.80 0.267 0.4 0.133 -0.033
5 16.85 0.267 0.5 0.233 -0.133
6 23.85 0.379 0.6 0.221 -0121
7 34.75 0.552 0.7 0.148 -0.048
8 48.45 0.769 0.8 0.031 0.069
9 53.75 0.853 0.9 0.047 0.053
10 62.85 0.998 1.0 0.002 0.098
D+ = 0.233
D- = 0.098
Dari table X2 0.05 , 10 = 0.409 ;
nilai hitung = 0.233
Nilai hitung < nilai table : 0.233 < 0.409
Berarti berdistribusi eksponensial
*****
Contoh 3. Test Chi Square Untuk Distribusi uniform
Misalkan :• Hasil bilangan pembangkitan bilangan sebanyak
100 kali seperti data dibawah ini
• Test apakah data tersebut berditribusi uniform
• Tingkat keyakinan 5%
Data pengamatan
0.34 0.90 0.25 0.89 0.87 0.44 0.12 0.21 0.46 0.67
0.83 0.76 0.79 0.64 0.70 0.74
0.06 0.99 0.02
0.47 0.30 0.05
0.79 0.42
0.99 0.49
0.37 0.49
0.72 0.05
0.06 0.62
0.18 0.26 0.97 0.88 0.64 0.47 0.60 0.11 0.29 0.78
• Pdf dari distribusi uniform :
f(x) = untuk a ≤ x ≤ b
a = 0 dan b 1 maka f(x) = x
• X02 = ∑(Oi – Ei)2 / Ei
Ei = n/m ------ Ei = n.pi
dxab
1
Contoh perhitungan :
pi = ∫ fx (x) dx
Pi =
∫
dxab
1
= x│10
= 0.10 – 0 = 0.10
E = n.p1 = 100 x 0.10 = 10
20
P2 = x│10
Dst
Penyelesaian :
Interval Freg Pengamatan
Oi
Freg Harapan Ei
( Oi - Ei )2 / Ei
0.00-0.10 8 10 0.4
0.10-0.20 8 10 0.4
0.20-0.30 10 10 0.0
0.30-0.40 9 10 0.1
0.40-0.50 12 10 0.4
0.50-0.60 8 10 0.4
0.60-0.70 10 10 0.0
0.70-0.80 14 10 1.6
0.80-0.90 10 10 0.0
0.90-1.00 11 10 0.1
Total 100 100 3.4
Dari table X2 0.05 , 9 = 16,9 ;
nilai hitung = 3.4
Nilai hitung < nilai table : 3.4 < 16.9
Berarti data berdistribusi uniform
******
Contoh 4 Berdistribusi Eksponensial
Berdasarkan data pengamatan kedatangan yang dilakukan
sebanyak 60 kali pengamatan
Test data tersebut apakah benar berdistribusi eksponensial
dengan tingkat kepercayaan 5%
12 07 26 06 18 15 44 28 09 44 16 19 37 29 08
10 09 18 35 17 20 31 08 24 15 18 30 11 28 68
07 19 04 26 25 37 46 09 18 14 07 34 26 09 49
09 16 32 07 04 06 23 08 36 19 05 21 09 03 22
Data pengamatan
Penyelesaian :
• Menentukan banyaknya interval kelas
Range : Xmax - Xmin
K = (1 + log 30)
P = Range / k
a. Tentukan interval kelas dan frekuensi
Kelas Frekuensi Data
00 - 10
19 07 06 09 08 09 .. .. ..
10 – 20 16 12 18 15 16 19 10 .. .. ..
20 – 30 12 26 28 29 24 28 .. .. ..
30 – 40 8 37 35 31 30 37 .. .. ..
40 – 50 4 44 40 46 49
50 – 60 0
60 – 70 1 68
Pdf dari distribusi eksponensial :
f(x) = ∫ 1/λ . e-x/λ untuk x > 0
CDF distribusi eksponensial :
F(x) = 1 – e-x / λ untuk x > 0
Pi = Fx (ai) - Fx (ai-1)
Fx (ai) = Fx (10) = 1 - e-10 / 20.1 = 0.392
Fx (ai-1) = Fx (0) = 1 - e-0 / 20.1 = 0
Pi = P1 = 0.392 – 0 = 0.392
Maka E1 = n.p1 = 60 x 0.392 = 23.52
b. Perhitungan Chi Sguare Test
Kelas Freg Pengamat
an (Oi)
Freg Harapan (Ei
=n.pi)
(Oi – Ei)2 / Ei
00 – 10 19 23.52 0.869
10 – 20 16 14.31 0.200
20 – 30 12 8.69 1.261
30 – 40 8 5.29 1.388
40 – 50 4 3.21 1.236
50 – 70 1 4.97
T o t a l 60 60 4.954
Jika frekuensi lebih kecil dari 5 dapat dikombinasikan dengan frek yang terdekat
Dari table X2 0.05 , 5 = 7.81 ; nilai hitung = 4.954
Nilai hitung < nilai table : 4.954 < 7.81
Berarti berdistribusi eksponensial
*******
2. Uji Run (Runs Test)
• Runs up and Runs down
Uji ini menggunakan metode naik run dan turun run .
• Suatu run didefinisikan sebagai rangkaian dari suatu kejadian (event) yang sama yang didahului dan di ikuti oleh kejadian yang berlainan.
Run test (lanjut)
• Panjang dari run adalah jumlah dari kejadian yang timbul dalam run.
• Analisa uji run dideskripsikan sebagai bilangan yang nilainya di atas rata-rata diberi tanda + dan yang nilainya di bawah rata-rata akan diberi tanda -. Kemudian jumlah panjang (b) dari run untuk setiap tanda dijumlahkan.
Run test (lanjut)
Formula yang digunakan adalah :
N = n1 + n2
Keterangan :n1 = jumlah bilangan di atas rata-ratan2 = jumlah bilangan di bawah rata-rata.N = Jumlah panjang dari run
Run test (lanjut)
• Untuk nilai n1 atau n2 > 20, nilai b cukup beralasan bila didekati oleh distribusi normal, N. Pendekatan ini dapat digunakan untuk menguji ke tidak tergantungan dari sejumlah angka yang dibangkitkan oleh suatu generator. Oleh karena itu, uji statistik normal standar dapat dikembangkan dengan menggunakan mean dari jumlah pengamatan run,b dan membaginya dengan standar deviasi.
2
1
22121
21
1
..2..2
21..2
0
NN
Nnnnn
Nnnb
Z
Uji statistik tersebut adalah :
Kegagalan untuk menolak hipotesis ketidaktergantungan terjadi jika –Zα/2≤ Zo≤ Zα/2 dimana α adalah tingkat kepercayaan. Nilai kritis dan penolakannya dapat dilihat seperti gambar dibawah ini :
Daerah Penerimaan Hipotesis
–Zα/2 Zα/2
Daerah penerimaan
Gambar 1 Daerah Penerimaan Hipotesis
Contoh Run Test
0,63 0,72 0,79 0,81 0,52 0,94 0,83 0,93 0,87 0,67
0,54 0,83 0,89 0,55 0,88 0,77 0,74 0,95 0,82 0,86
0,43 0,32 0,36 0,18 0,08 0,19 0,18 0,27 0,36 0,34
0,31 0,45 0,49 0,43 0,46 0,35 0,25 0,39 0,47 0,41
Urutan runs up dan runs down sebagai berikut :
+ + + - + - + - - -
+ + - + - - + - + -
- + - - + - - + + -
- + + - + - - + + -
Menentukan :
n1 = 18
n2 = 22
N = n1 + n2 = 22+ 18 = 40
b = 17
Untuk menentukan mean digunakan formula :
2
1..2 21 N
nnb
= 20,3
2
1
40
22.18.2
Untuk menentukan variasi digunakan formula :
1
..2..22
21212
NN
Nnnnnb
9,54
14040
4022.18.222.18.22
Untuk uji statistiknya digunakan formula
2
1
22121
21
1
..2..2
21..2
0
NN
Nnnnn
Nnnb
Z
= - 1,07
54,9
3,2017
Test hipotesa
Nilai uji statistik Z0,025 = 1,96 , berada dalam daerah penerimaan , yang menyatakan bahwa bilangan-bilangan acak yang dibangkitkan tersebut tidak bergantung satu dengan yang lainnya
*******
Replikasi
• Replikasi mempunyai pengertian bahwa setiap menjalankan dan menghentikan simulasi dengan cara yang sama dan menggunakan set parameter input yang sama pula (identical part) tetapi menggunakan masukan bilangan random yang terpisah (independent part) untuk membangkitkan hasil-hasil simulasi
• Panjang waktu simulasi yang diinginkan setiap replikasi disebut length of replication.
Jumlah Replikasi
• Pendekatan yang digunakan dalam simulasi adalah dengan membangkitkan data dalam jumlah yang cukup kemudian dilakukan pengulangan (replikasi) untuk dapat menganalisa hasil dari simulasi yang dijalankan.
Metode yang umum untuk menentukan jumlah replikasi adalah dengan melakukan beberapa percobaan menggunakan berbagai bilangan acak berbeda untuk mendapatkan mean dan deviasi standar dari variabel yang diukur.
Menentukan panjang simulasi
N = 2
22
K
SDZ
Keterangan :K = akurasi yang diinginkan dari variabel simulasi
p = tingkat akurasi SD = standart deviasi data observasi N = rata-rata dari jumlah variabel simulasi Z = deviasi normal standar
dengan nilai K = p. x
x
Z = 1,96 (dengan tingkat kepercayaan = 95%)
a. K = p. x
2
22
K
SDZ
2
22
204,1441
93,936196,1
162,10 162
= 5% x 28824,08 = 1441,204
Rangkuman
• Satu cara yang sering digunakan dalam menetapkan distribusi probabilistik dari variabel yang ada adalah dengan menganalisa data-data historis.
Rangkuman (lanjut)
• Lakukan simulasi untuk sejumlah besar pengamatan. Jumlah replikasi yang sesuai dengan cara yang sama dengan jumlah yang tepat dari suatu sampel dalam eksperimen aktual. Uji statistik yang umum mengenai signifikansi yang dapat digunakan. Dengan simulasi komputer, jumlah sampel yang dapat dilakukan sangat
Soal soal
1. Dengan menggunakan KS dan tingkat kepercayaan 0,05 , test data tersebut apakah berdistribusi eksponensial 29,02, 06, 33, 18, 23, 07, 01, 37, 47, 14, 03, 21, 31, 07, 05, 09, 11,15, 24
2. Misalkan 22 batches dari hasil yang sudah dibangkitkan 5.7, 22.8, 17.4, 14.9, 20.1, 24.5, 24.7, 19.5, 16.3, 18.0, 21.3, 23.6, 23.9, 18.2, 18.8, 21.3, 20.6, 17.7, 19.4, 19.9, 16.8, 21.2, dengan confidence level 95%. Hitung , mean, variance dan uji statistik
Kunci Jawaban
1. Berdistribusi eksponensial
2. Mean = 14,33
Variance = 3,59
Z = - 0,93