Mpcp19 Cluster Sampling 3
-
Upload
nurulwardhani11 -
Category
Documents
-
view
64 -
download
2
description
Transcript of Mpcp19 Cluster Sampling 3
Oleh: Adhi Kurniawan
SEKOLAH TINGGI ILMU STATISTIK
PERTEMUAN 5-MPC 2 PRAKTIK
Unequal Cluster Sampling
› Misalkan satu gugus sampel yang berukuran n cluster yang ditarik dari N cluster
secara simple random sampling wor.
› Notasi yang dipergunakan sama dengan cluster berukuran sama, hanya
mengganti 𝑀 dengan 𝑀𝑖 .
𝑀𝑖 : banyaknya unit dalam cluster ke-i
› Estimasi rata-rata unit untuk cluster ke-i dirumuskan:
𝑦 𝑖. =1
𝑀𝑖 𝑦𝑖𝑗
𝑀𝑖
𝑗=1
› Untuk estimasi rata-rata unit populasi terdapat 3 pendekatan:
1. Rata-rata sederhana dan tidak mempertimbangkan ukuran cluster
2. Rata-rata dengan memperhitungkan ukuran cluster dari sampel
3. Rata-rata dengan menggunakan ukuran cluster dalam populasi
Unequal Cluster Sampling
1. Rata-rata karakteristik per unit dari sebanyak n sampel cluster, yang diperhitungkan
dari rata-rata cluster tanpa ditimbang dengan banyaknya elemen dalam cluster
terpilih 𝑀𝑖 .
𝑦 =1
𝑛 𝑦 𝑖.
𝑛
𝑖=1
𝑣 𝑦 =1 − 𝑓
𝑛𝑠𝑏1
2
Keterangan:
𝑠𝑏12 =
1
(𝑛 − 1) 𝑦 𝑖. − 𝑦 2
𝑛
𝑖=1
--> Estimasi rata-rata menggunakan pendekatan ini menghasilkan nilai estimasi yang bias
Dari estimasi rata-rata di samping, dapat dilakukan estimasi total sbb:
𝑌 = 𝑁𝑀 ′𝑦
𝑣 𝑌 = 𝑁𝑀 ′ 2𝑣 𝑦
Keterangan:
𝑀 ′ =1
𝑛 𝑀𝑖.
𝑛
𝑖=1
Contoh Soal 1
Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari populasi sebanyak 24 perpustakaan yang ada di suatu provinsi. Dari perpustakaan yang terpilih sampel, selanjutnya dilakukan observasi terhadap jam datang dan jam pergi dari tiap pengunjung dalam satu hari. Selisih antara jam datang dan jam pergi ini diasumsikan sebagai lamanya jam baca pengunjung di perpustakaan tsb. Data yang diperoleh:
Perkirakan rata-rata jam baca pengunjung dengan menggunakan estimasi rata-rata tidak tertimbang. Lengkapi dengan standar error, RSE-nya !
Perpustakaan Jam baca pengunjung
1 4.5 5.5 4.2 2.0 5.5 1.0 2.5
2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5
3 6.5 4.0 7.0 3.5 4.5
4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5
5 0.8 4.5 6.5 5.5 6.5 3.2
Contoh Soal 1
1 4.5 5.5 4.2 2.0 5.5 1.0 2.5 7 25.2 3.6
2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5 9 28.8 3.2
3 6.5 4.0 7.0 3.5 4.5 5 25.5 5.1
4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5 8 28 3.5
5 0.8 4.5 6.5 5.5 6.5 3.2 6 27 4.5
Total 35 134.5 19.9
Unequal Cluster Sampling
2. Rata-rata karakteristik per unit dari sebanyak n sampel cluster, yang diperhitungkan dari
karakteristik seluruh unit dalam sampel
𝑦 ′ =1
𝑛
𝑀𝑖𝑦 𝑖.
𝑀 ′
𝑛
𝑖=1
= 𝑀𝑖𝑦 𝑖.
𝑛𝑖=1
𝑀𝑖𝑛𝑖=1
= 𝑦𝑖𝑗
𝑀𝑖𝑗=1
𝑛𝑖=1
𝑀𝑖𝑛𝑖=1
= 𝑦𝑖.
𝑛𝑖=1
𝑀𝑖𝑛𝑖=1
𝑣 𝑦 ′ =1 − 𝑓
𝑛𝑠𝑏1
′2
Keterangan:
𝑠𝑏1′2 =
1
𝑀 ′2(𝑛 − 1) 𝑀𝑖
2 𝑦 𝑖. − 𝑦 ′ 2
𝑛
𝑖=1
𝑀 ′ =1
𝑛 𝑀𝑖.
𝑛
𝑖=1
--> Estimasi rata-rata menggunakan pendekatan ini menghasilkan nilai estimasi yang bias konsisten
Dari estimasi rata-rata di samping, dapat dilakukan estimasi total sbb:
𝑌 ′ = 𝑁𝑀 ′𝑦 ′
𝑣 𝑌 = 𝑁𝑀 ′ 2𝑣 𝑦 ′
Keterangan:
𝑀 ′ =1
𝑛 𝑀𝑖.
𝑛
𝑖=1
Contoh Soal 2
Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari populasi sebanyak 24 perpustakaan yang ada di suatu provinsi. Dari perpustakaan yang terpilih sampel, selanjutnya dilakukan observasi terhadap jam datang dan jam pergi dari tiap pengunjung dalam satu hari. Selisih antara jam datang dan jam pergi ini diasumsikan sebagai lamanya jam baca pengunjung di perpustakaan tsb. Data yang diperoleh:
Perkirakan rata-rata jam baca pengunjung dengan menggunakan estimasi rata-rata tertimbang ukuran cluster dari data sampel. Lengkapi dengan standar error, RSE-nya !
Perpustakaan Jam baca pengunjung
1 4.5 5.5 4.2 2.0 5.5 1.0 2.5
2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5
3 6.5 4.0 7.0 3.5 4.5
4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5
5 0.8 4.5 6.5 5.5 6.5 3.2
Contoh Soal 2
Unequal Cluster Sampling
Contoh Soal 3
Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari populasi sebanyak 24 perpustakaan yang ada di suatu provinsi. Diketahui jumlah pengunjung perpustakaan di provinsi tersebut dalam satu hari adalah 180 orang. Dari perpustakaan yang terpilih sampel, selanjutnya dilakukan observasi terhadap jam datang dan jam pergi dari tiap pengunjung dalam satu hari. Selisih antara jam datang dan jam pergi ini diasumsikan sebagai lamanya jam baca pengunjung di perpustakaan tsb. Data yang diperoleh:
Perkirakan rata-rata jam baca pengunjung dengan menggunakan estimasi rata-rata tertimbang ukuran cluster dari data populasi. Lengkapi dengan standar error, RSE-nya !
Perpustakaan Jam baca pengunjung
1 4.5 5.5 4.2 2.0 5.5 1.0 2.5
2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5
3 6.5 4.0 7.0 3.5 4.5
4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5
5 0.8 4.5 6.5 5.5 6.5 3.2
Contoh Soal 3
1 4.5 5.5 4.2 2.0 5.5 1.0 2.5 7 25.2 3.6 3.3600
2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5 9 28.8 3.2 3.8400
3 6.5 4.0 7.0 3.5 4.5 5 25.5 5.1 3.4000
4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5 8 28 3.5 3.7333
5 0.8 4.5 6.5 5.5 6.5 3.2 6 27 4.5 3.6000
Total 35 134.5 19.9 17.9333
Estimasi Proporsi pada Unequal Cluster Sampling
Estimasi Proporsi pada Unequal Cluster Sampling
No Tipe
estimator
Estimasi proporsi populasi
Variance between cluster mean Sampling variance
1 Tidak tertimbang
2 Tertimbang dg cluster size dari sampel
3 Tertimbang dg cluster size dari populasi
Estimasi Total berdasarkan proporsi pada Unequal Cluster Sampling
No Tipe estimator Estimasi total
populasi Sampling variance
1 Tidak tertimbang 𝐴 = 𝑁𝑀 ′𝑝 𝑣 𝐴 = 𝑁𝑀 ′ 2𝑣 𝑝
2 Tertimbang dengan cluster size dari sampel
𝐴 ′ = 𝑁𝑀 ′𝑝′ 𝑣 𝐴 ′ = 𝑁𝑀 ′ 2𝑣 𝑝′
3 Terimbang dengan cluster size dari populasi
𝐴 ∗ = 𝑁𝑀 𝑝∗ 𝑣 𝐴 ∗ = 𝑁𝑀 2𝑣 𝑝∗
Estimasi Proporsi pada Unequal Cluster Sampling
› Contoh Soal: Suatu survei dilakukan di
suatu desa dengan memilih sampel
secara acak sebanyak 3 cluster dari 25
cluster yang ada di desa tersebut.
Kemudian dilakukan pencacahan
terhadap semua rumah tangga yang
terdapat pada cluster terpilih.
Perkirakan proporsi dan total rumah
tangga pertanian hortikultura di desa
tsb beserta standar error dan RSE-nya
dengan 3 cara ! (untuk cara 3, diketahui
jumlah rumah tangga di desa tsb
sebanyak 105 rumah tangga)
Cluster Rumah tangga
Apakah ada ART yang memelihara/menguasai/
melakukan kegiatan pertanian tanaman hortikultura? (1=Ya,
2=Tidak)
Jika kolom(3) kode 1, apakah
hasilnya dijual/ditukar ? (1=Ya, 2=Tidak)
(1) (2) (3) (4)
1
1 2 -
2 1 1
3 2 -
4 1 2
2
1 2 -
2 1 1
3 2 -
3
1 1 2
2 1 1
3 2 -
4 1 2
5 1 1
Estimasi Proporsi pada Unequal Cluster Sampling
› Konsep dan Definisi:
Kegiatan usaha pertanian adalah kegiatan pemeliharaan, pembudidayaan,
pengembangbiakan, pembesaran/penggemukan dengan tujuan sebagian atau
seluruh hasilnya untuk dijual/ditukar/memperoleh keuntungan. Khusus untuk
budidaya padi dan palawija, pemeliharaan sapi potong, sapi perah, dan kerbau
walaupun untuk konsumsi sendiri tetap dikategorikan sebagai usaha pertanian.
Rumah tangga pertanian adalah rumah tangga yang satu atau lebih anggota rumah
tangganya mengelola usaha pertanian baik usaha milik sendiri maupun milik pihak
lain.
Estimasi Proporsi pada Unequal Cluster Sampling
Cluster
1 4 1 0.1111 0.2381
2 3 1 0.0000 0.2381
3 5 2 0.1111 0.4762
Total 12 4 0.2222 0.9524
Untuk penghitungan estimasi tidak tertimbang
Untuk penghitungan estimasi tertimbang dengan
cluster size dari sampel Untuk penghitungan
estimasi tertimbang dengan cluster size dari populasi
Cara 1: Estimasi Tidak Tertimbang
Cara 2: Estimasi Tertimbang dengan Cluster Size dari Sampel
Cara 3: Estimasi Tertimbang dengan Cluster Size dari Populasi
Penghitungan Sampling Error dengan Stata
Contoh Soal 2:
Suatu wilayah yang terdiri dari 10 cluster diambil sampel secara acak sebanyak 3 cluster, kemudian dilakukan pengukuran terhadap jumlah ART pada semua rumah tangga pada cluster terpilih. Jumlah rumah tangga di wilayah tersebut adalah 42 rumah tangga. Perkirakan rata-rata jumlah ART tiap rumah tangga beserta standar error-nya !
Cluster_id Household_id ART
1 1 4
1 2 5
1 3 3
1 4 6
2 1 5
2 2 4
2 3 7
3 1 3
3 2 6
3 3 5
3 4 6
3 5 2
Penghitungan Sampling Error dengan Stata (Estimasi tidak tertimbang)
use "D:Bahan Ajar MPC\unequal cluster.dta” collapse (count) household_id (sum) art, by(cluster_id) ren household_id ruta gen art_per_ruta= art/ruta gen N=10 Gen weight=10/3*4 svyset cluster_id[pweight=weight], fpc(N) vce(linearized) singleunit(missing) pweight: <none> VCE: linearized Single unit: missing Strata 1: <one> SU 1: cluster_id FPC 1: N svy linearized : mean art_per_ruta (running mean on estimation sample) Survey: Mean estimation Number of strata = 1 Number of obs = 3 Number of PSUs = 3 Population size = 3 Design df = 2 Linearized Mean Std. Err. [95% Conf. Interval] art_per_ruta 4,744445 ,247531 3,679404 5,809485
use "D:Bahan Ajar MPC\unequal cluster.dta”
gen N=10
gen weight=10/3
svyset cluster_id [pweight=weight], fpc(N) vce(linearized)
pweight: weight
VCE: linearized
Single unit: missing
Strata 1: <one>
SU 1: cluster_id
FPC 1: N svy linearized : mean art
(running mean on estimation sample)
Survey: Mean estimation
Number of strata = 1 Number of obs = 12
Number of PSUs = 3 Population size = 40
Design df = 2
Linearized
Mean Std. Err. [95% Conf. Interval]
art 4,666667 ,2130032 3,750188 5,583146
Penghitungan Sampling Error dengan Stata (Estimasi tertimbang dengan ukuran cluster dari data sampel)
Penghitungan Sampling Error dengan Stata (Estimasi tertimbang dengan ukuran cluster dari data populasi)
use "D:Bahan Ajar MPC\unequal cluster.dta” collapse (count) household_id (sum) art, by(cluster_id) ren household_id ruta gen art_per_ruta= art/ruta gen N=10 gen weight=10/3*4.2 gen art_per_ruta2= ruta/4.2* art_per_ruta svyset cluster_id[pweight=weight], fpc(N) vce(linearized) singleunit(missing) pweight: <none> VCE: linearized Single unit: missing Strata 1: <one> SU 1: cluster_id FPC 1: N svy linearized : mean art_per_ruta2 (running mean on estimation sample) Survey: Mean estimation Number of strata = 1 Number of obs = 3 Number of PSUs = 3 Population size = 3 Design df = 2 Linearized Mean Std. Err. [95% Conf. Interval] art_per_ruta2 4,444444 ,3513642 2,932646 5,956243
Soal Latihan
id cluster
id ruta
Pengeluaran perkapita sebulan
(000)
1
1 380
2 440
3 500
4 320
2
1 400
2 330
3 330
4 490
5 310
3
1 350
2 350
3 480
4 310
5 350
6 460
Berikut ini adalah data hasil survei konsumsi rumah tangga di suatu kelurahan. Survei dilakukan secara cluster sampling dengan mengambil sampel sebanyak 3 cluster secara SRS WOR dari 20 cluster di kelurahan tsb. Selanjutnya, dilakukan pencacahan terhadap semua rumah tangga yang ada di cluster terpilih. Dari hasil pemutakhiran (updating) rumah tangga diketahui bahwa jumlah rumah tangga di kelurahan tsb sebanyak 102 rumah tangga. a. Metode estimasi manakah yang sebaiknya anda gunakan ? b. Perkirakan rata-rata pengeluaran perkapita perbulan di desa
tersebut, beserta standar error, RSE, dan 95%-CI nya ! c. Dari jawaban point (b), selanjutnya dilakukan pengkategorian
rumah tangga sebagai berikut: (1) Ekonomi lemah: Pengeluaran perkapita< 𝑦 ∗ − 1,96 × 𝑠𝑒 𝑦 ∗ (2) Ekonomi menengah: 𝑦 ∗ − 1,96 × 𝑠𝑒 𝑦 ∗ ≤Pengeluaran perkapita≤ 𝑦 ∗ + 1,96 × 𝑠𝑒 𝑦 ∗ (3) Ekonomi atas: Pengeluaran perkapita> 𝑦 ∗ +1,96 × 𝑠𝑒 𝑦 ∗ Perkirakan proporsi dari masing-masing kategori di atas, lengkap dengan standar error, RSE, dan 95% CI-nya !
TERIMA KASIH Have A Nice Sampling