EKSPEKTASI
Achmad BasukiPoliteknik Elektronika Negeri Surabaya
2004
Gambaran Permasalahan (1)
Hasil pengukuran jumlah bemo yang lewat di depan PENS-ITS setiapsetengah jam yang dilakukan mulai jam 6.00 sampai jam 18.00.
Berapa jumlah bemo yang lewat di depan PENS-ITS
setiap setengah jam ?
Jam Jumlah bemo06.00 - 06.30 506.30 - 07.00 907.00 - 07.30 707.30 - 08.00 708.00 - 08.30 508.30 - 09.00 409.00 - 09.30 209.30 - 10.00 410.00 - 10.30 310.30 - 11.00 211.00 - 11.30 411.30 - 12.00 112.00 - 12.30 312.30 - 13.00 613.00 - 13.30 513.30 - 14.00 414.00 - 14.30 714.30 - 15.00 315.00 - 15.30 315.30 - 16.00 6
Gambaran Permasalahan (2)
Nilai Yudistira dan Abimanyu mahasiswa PENS-ITS semester 3 jurusan TI dalam satu semester adalah sebagai berikut:
YUDISTIRA
Nama Mata Kuliah SKS NilaiBahasa Inggris 3 2 BMatematika 3 2 BPemrograman Berbasis Obyek 2 AMetode Numerik 2 BStatistik dan Probabilitas 2 BCBasis Data 1 2 BModel dan Sistem Informasi 2 ARekayasa Perangkat Lunak 2 APrak. Pemrg. Berbasis Obyek 1 APrak. Metode Numerik 1 BPrak. Basis Data 1 1 B
ABIMANYU
Nama Mata Kuliah SKS NilaiBahasa Inggris 3 2 AMatematika 3 2 BPemrograman Berbasis Obyek 2 BCMetode Numerik 2 BStatistik dan Probabilitas 2 ABasis Data 1 2 BModel dan Sistem Informasi 2 BRekayasa Perangkat Lunak 2 BCPrak. Pemrograman Berbasis O 1 BPrak. Metode Numerik 1 APrak. Basis Data 1 1 A
Bagaimana cara menentukansiapa yang nilainya lebih baik ?
Ekspektasi
• Ekspektasi menyatakan suatu nilaiharapan terhadap distribusi data tertentu.
• Dengan nilai ekspektasi akan diperolahgambaran distribusi data, yang berupabesaran suatu data.
• Nilai ekspektasi dipilih berdasarkanmodel data, apakah data berupa data-data numerik atau katagorikal yang berhubungan dengan model statistikparametrik atau statistik non-parametrik.
Nilai Ekspektasi
• Ekspektasi 1: Pusat data (center of data) yang dinyatakan dengan nilai rata-rata, median dan modus.
• Ekspektasi 2: Sebaran data (dispersion of data) yang dinyatakan dengan nilaistandard deviasi dan varians.
• Ekspektasi 3: Kecenderungan yang dinyatakan dengan nilai skewness.
Ekspektasi 1 dan 2 merupakan titik berat bahasan
Ekspektasi 1
• Rata-Rata (Mean)• Nilai Tengah (Median)• Modus
Center of DataMenyatakan nilai yang merupakan pusat ataunilai pokok dari suatu distribusi data tertentu.
Rata-Rata (Mean)
Model Kontinu: ∫=C
dxxfxx )(.
Dimana X adalah kejadian yang jumlahnya tak berhingga, ataumempunyai nilai numerik.f(x) menyatakan pdf dari x.
Model Diskrit: ∑=
=n
iii xpxx
1)(
p(xi) menyatakan pdf dari X=xi.Model diskrit ini yang banyak dibahas dalam analisa data.
Rata-Rata (Cont…)Diketahui data jumlah bemo yang lewat di depan PENS-ITS setiap30 menit
Jam Jumlah bemo06.00 - 06.30 506.30 - 07.00 907.00 - 07.30 707.30 - 08.00 708.00 - 08.30 508.30 - 09.00 409.00 - 09.30 209.30 - 10.00 410.00 - 10.30 310.30 - 11.00 211.00 - 11.30 411.30 - 12.00 112.00 - 12.30 312.30 - 13.00 613.00 - 13.30 513.30 - 14.00 414.00 - 14.30 714.30 - 15.00 315.00 - 15.30 315.30 - 16.00 6
Rata-rata jumlah bemo yang lewat di depanPENS-ITS dalam setiap 30 menit adalah:
( ) 5.490201
11
==
= ∑=
N
iix
Nx
Teknik perhitungan merupakan teknikperhitungan yang biasa digunakan dalammenghitung rata-rata langsung dari data,
tetapi teknik ini tidak melibatkan pdfsehingga tidak ada informasi lain selain
rata-rata
Rata-Rata (Cont…)Jumlah bemo Histogram PDF
1 1 0.052 2 0.13 4 0.24 4 0.25 3 0.156 2 0.17 3 0.158 0 09 1 0.05
00.05
0.10.15
0.20.25
1 2 3 4 5 6 7 8 9
Jumlah Bemo
Jumlah bemo Histogram PDF J X P1 1 0.05 0.052 2 0.1 0.23 4 0.2 0.64 4 0.2 0.85 3 0.15 0.756 2 0.1 0.67 3 0.15 1.058 0 0 09 1 0.05 0.45
Total 20 4.5
Rata-rata = 4.5
Perhitungan rata-rata menggunakan:
∑=
=n
iii xfxx
1)(
Rata-Rata (Cont…)
Banyak kasus dalam kehidupan yang setiap kejadian mempunyaipeluang yang berbeda, apakah ini bisa diabaikan dan dianggapbahwa semua kejadian mempunyai peluang yang sama seperti
halnya pelemparan coin dan dadu ?
∑
∑
=
=
⎟⎠⎞
⎜⎝⎛=
=
N
ii
N
ii
Nx
xN
x
1
1
1
1
∑=
=n
iii xfxx
1
)(
Ini berarti pada rumus (1) menyatakan bahwa f(x) = 1/N, ataudengan kata lain peluang setiap kejadian X adalah sama
(1)
(2)
Median (Nilai Tengah)
Model kontinu:
Median adalah x dimana: CDF(x) =1/2Median banyak digunakan untuk keperluan mencari pusat data dalam data-data hasil kuantisasi.
21)( =⇒= ∫
∞−
x
duufmedianx
Model diskrit:21)(
0=⇒= ∑
=
x
ixpmedianx
1 1 1 2 3 4 4 4 5 5 6 7 8 9 91 1 1 2 3 4 4 4 5 5 6 7 8 9 9
Median = 4
Median (cont…)Data penjualan PC dalam 7 hari terakhir adalah:
Penjualan5231412
Urut1122345
DIURUTKAN
Median = 2
(1)
Algoritma:(1) Data diurutkan(2) Median diambil pada data di
posisi tengah
(2)
Median (cont…)
• Pengurutan data membuat proses perhitungan menjadi lambatuntuk data-data yang berukuran besar. Untuk data berukuran n, metode Bubble Sort diperlukan waktu n(n-1) kali proses, danquick sort membutuhkan waktu n.ln(n)
• Pengambilan data pada posisi tengah membutuhkanpengecekan apakah jumlah data (n) genap atau ganjil.
Algoritma Menghitung Median:(1) Data diurutkan(2) Median diambil pada data di posisi tengah
Algoritma Menghitung Median:(1) Data diurutkan(2) Median diambil pada data di posisi tengah
Kesimpulan:Algoritma ini lambat, diperlukan algoritmayang lebih cepat, yang tidak melibatkan prosespengurutan data.
Median (cont…)Data penjualan PC dalam 7 hari terakhir adalah:
Penjualan5231412
CDF
Median = 2Algoritma:(1) Hitung CDF(2) Median diambil pada data yang
nilainya mengandung nilai ½.
(1)
(2)
Penjualan Histogram PDF CDF1 2 0.29 0.292 2 0.29 0.573 1 0.14 0.714 1 0.14 0.865 1 0.14 1.00
Median (cont…)
• Perhitungan CDF membutuhkan waktu n untuk n buah data.• Pengambilan data pada posisi tengah tidak membutuhkan
pengecekan apakah jumlah data (n) genap atau ganjil.
Algoritma Menghitung Median Yang Disarankan :(1) Hitung CDF(2) Median diambil pada data yang nilainya mengandung nilai ½.
Algoritma Menghitung Median Yang Disarankan :(1) Hitung CDF(2) Median diambil pada data yang nilainya mengandung nilai ½.
Kesimpulan:Algoritma ini cepat karena tidak melalui prosesperngurutan data
Modus
Modus menyatakan kejadian X yang sering muncul, atau dengan kata lain modus adalah nilai x dimanaf(x) maksimum.
maksimum )( modus xfx ⇒
Modus juga merupakan nilai center of data untuk model data hasil kuantisasi
Modus (cont…)
Diketahui data nilai test pemrograman yang diperoleh 10 orang mahasiswa adalah sebagai berikut:
A B A A B B B C B CNilai Histogram PDF
A 3 0.3B 5 0.5C 2 0.2
F(B) MaksimumNilai=B adalah modus
VariansVarians adalah nilai sebaran data sekitar rata-rata
Model Kontinu: ( )∫ −=X
dxxfxxx )()var( 2
f(x) menyatakan pdf dari x.
Model Diskrit: ( ) ( )∑=
−=N
iii xpxxx
1
2)var(
Varians (cont…)
Rumus varians yang juga banyak digunakan dalamperhitungan analisa data adalah:
( )∑=
−=N
ii xx
Nx
1
21)var( Untuk data yang tidak bias
( )∑=
−−
=N
ii xx
Nx
1
2
11)var( Untuk data yang
bias
Rumus ini digunakan untuk data-data sample.
Varians (cont…)
Nilai sebaran data standard dinyatakan dengannilai standard deviasi, dimana standard deviasiadalah akar dua dari varians.
Nilai standard deviasi ini yang digunakansebagai ukuran standard sebaran data sekitarrata-rata.
)var()( xxstd =
Varians (cont…)
Diketahui data-data penjualan PC dalam 1 minggu terakhir sebagaiberikut:
Hari Penjualan1 42 43 24 55 46 37 3
Berapa penjualanPC dalam mingguini?
Untuk menyatakan nilai secara umum dapatdigunakan nilai rata-rata dan standard deviasisebagai berikutPenjualan Histogram PDF x.p(x) (x-m)2.p(x)
2 1 0.14 0.29 0.353 2 0.29 0.86 0.094 3 0.43 1.71 0.085 1 0.14 0.71 0.29
Total 3.57 0.82
Rata-rata = 3.57 rata-rata = 4Varians = 0.82 std = 0.9
Penjualan berada dalam kisaran:3.57-0.9 sampai dengan 3.57+0.9Atau berada dalam kisaran 2.67 – 4.47Dengan rata-rata penjualan 4
Varians (cont…)Diketahui data jumlah bemo yang lewat di depan PENS-ITS setiap 30 menit
Jam Jumlah bemo06.00 - 06.30 506.30 - 07.00 907.00 - 07.30 707.30 - 08.00 708.00 - 08.30 508.30 - 09.00 409.00 - 09.30 209.30 - 10.00 410.00 - 10.30 310.30 - 11.00 211.00 - 11.30 411.30 - 12.00 112.00 - 12.30 312.30 - 13.00 613.00 - 13.30 513.30 - 14.00 414.00 - 14.30 714.30 - 15.00 315.00 - 15.30 315.30 - 16.00 6
Dengan menggunakan nilai ekspektasidiperoleh:
Rata-rata = 4.5Varians = 4.16
Maka standard deviasi = 2.04
Jumlah bemo yang lewat didepan PENS berada dalam
kisaran (4.5-2.04)=2.46 sampaidengan (4.5+2.04)=6.54 dan
rata-rata = 5
Top Related