Mpcp19 Cluster Sampling 3

26
Oleh: Adhi Kurniawan SEKOLAH TINGGI ILMU STATISTIK PERTEMUAN 5-MPC 2 PRAKTIK

description

Cluster Sampling 3

Transcript of Mpcp19 Cluster Sampling 3

Page 1: Mpcp19 Cluster Sampling 3

Oleh: Adhi Kurniawan

SEKOLAH TINGGI ILMU STATISTIK

PERTEMUAN 5-MPC 2 PRAKTIK

Page 2: Mpcp19 Cluster Sampling 3

Unequal Cluster Sampling

› Misalkan satu gugus sampel yang berukuran n cluster yang ditarik dari N cluster

secara simple random sampling wor.

› Notasi yang dipergunakan sama dengan cluster berukuran sama, hanya

mengganti 𝑀 dengan 𝑀𝑖 .

𝑀𝑖 : banyaknya unit dalam cluster ke-i

› Estimasi rata-rata unit untuk cluster ke-i dirumuskan:

𝑦 𝑖. =1

𝑀𝑖 𝑦𝑖𝑗

𝑀𝑖

𝑗=1

› Untuk estimasi rata-rata unit populasi terdapat 3 pendekatan:

1. Rata-rata sederhana dan tidak mempertimbangkan ukuran cluster

2. Rata-rata dengan memperhitungkan ukuran cluster dari sampel

3. Rata-rata dengan menggunakan ukuran cluster dalam populasi

Page 3: Mpcp19 Cluster Sampling 3

Unequal Cluster Sampling

1. Rata-rata karakteristik per unit dari sebanyak n sampel cluster, yang diperhitungkan

dari rata-rata cluster tanpa ditimbang dengan banyaknya elemen dalam cluster

terpilih 𝑀𝑖 .

𝑦 =1

𝑛 𝑦 𝑖.

𝑛

𝑖=1

𝑣 𝑦 =1 − 𝑓

𝑛𝑠𝑏1

2

Keterangan:

𝑠𝑏12 =

1

(𝑛 − 1) 𝑦 𝑖. − 𝑦 2

𝑛

𝑖=1

--> Estimasi rata-rata menggunakan pendekatan ini menghasilkan nilai estimasi yang bias

Dari estimasi rata-rata di samping, dapat dilakukan estimasi total sbb:

𝑌 = 𝑁𝑀 ′𝑦

𝑣 𝑌 = 𝑁𝑀 ′ 2𝑣 𝑦

Keterangan:

𝑀 ′ =1

𝑛 𝑀𝑖.

𝑛

𝑖=1

Page 4: Mpcp19 Cluster Sampling 3

Contoh Soal 1

Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari populasi sebanyak 24 perpustakaan yang ada di suatu provinsi. Dari perpustakaan yang terpilih sampel, selanjutnya dilakukan observasi terhadap jam datang dan jam pergi dari tiap pengunjung dalam satu hari. Selisih antara jam datang dan jam pergi ini diasumsikan sebagai lamanya jam baca pengunjung di perpustakaan tsb. Data yang diperoleh:

Perkirakan rata-rata jam baca pengunjung dengan menggunakan estimasi rata-rata tidak tertimbang. Lengkapi dengan standar error, RSE-nya !

Perpustakaan Jam baca pengunjung

1 4.5 5.5 4.2 2.0 5.5 1.0 2.5

2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5

3 6.5 4.0 7.0 3.5 4.5

4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5

5 0.8 4.5 6.5 5.5 6.5 3.2

Page 5: Mpcp19 Cluster Sampling 3

Contoh Soal 1

1 4.5 5.5 4.2 2.0 5.5 1.0 2.5 7 25.2 3.6

2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5 9 28.8 3.2

3 6.5 4.0 7.0 3.5 4.5 5 25.5 5.1

4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5 8 28 3.5

5 0.8 4.5 6.5 5.5 6.5 3.2 6 27 4.5

Total 35 134.5 19.9

Page 6: Mpcp19 Cluster Sampling 3

Unequal Cluster Sampling

2. Rata-rata karakteristik per unit dari sebanyak n sampel cluster, yang diperhitungkan dari

karakteristik seluruh unit dalam sampel

𝑦 ′ =1

𝑛

𝑀𝑖𝑦 𝑖.

𝑀 ′

𝑛

𝑖=1

= 𝑀𝑖𝑦 𝑖.

𝑛𝑖=1

𝑀𝑖𝑛𝑖=1

= 𝑦𝑖𝑗

𝑀𝑖𝑗=1

𝑛𝑖=1

𝑀𝑖𝑛𝑖=1

= 𝑦𝑖.

𝑛𝑖=1

𝑀𝑖𝑛𝑖=1

𝑣 𝑦 ′ =1 − 𝑓

𝑛𝑠𝑏1

′2

Keterangan:

𝑠𝑏1′2 =

1

𝑀 ′2(𝑛 − 1) 𝑀𝑖

2 𝑦 𝑖. − 𝑦 ′ 2

𝑛

𝑖=1

𝑀 ′ =1

𝑛 𝑀𝑖.

𝑛

𝑖=1

--> Estimasi rata-rata menggunakan pendekatan ini menghasilkan nilai estimasi yang bias konsisten

Dari estimasi rata-rata di samping, dapat dilakukan estimasi total sbb:

𝑌 ′ = 𝑁𝑀 ′𝑦 ′

𝑣 𝑌 = 𝑁𝑀 ′ 2𝑣 𝑦 ′

Keterangan:

𝑀 ′ =1

𝑛 𝑀𝑖.

𝑛

𝑖=1

Page 7: Mpcp19 Cluster Sampling 3

Contoh Soal 2

Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari populasi sebanyak 24 perpustakaan yang ada di suatu provinsi. Dari perpustakaan yang terpilih sampel, selanjutnya dilakukan observasi terhadap jam datang dan jam pergi dari tiap pengunjung dalam satu hari. Selisih antara jam datang dan jam pergi ini diasumsikan sebagai lamanya jam baca pengunjung di perpustakaan tsb. Data yang diperoleh:

Perkirakan rata-rata jam baca pengunjung dengan menggunakan estimasi rata-rata tertimbang ukuran cluster dari data sampel. Lengkapi dengan standar error, RSE-nya !

Perpustakaan Jam baca pengunjung

1 4.5 5.5 4.2 2.0 5.5 1.0 2.5

2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5

3 6.5 4.0 7.0 3.5 4.5

4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5

5 0.8 4.5 6.5 5.5 6.5 3.2

Page 8: Mpcp19 Cluster Sampling 3

Contoh Soal 2

Page 9: Mpcp19 Cluster Sampling 3

Unequal Cluster Sampling

Page 10: Mpcp19 Cluster Sampling 3

Contoh Soal 3

Untuk mengetahui rata-rata jumlah jam baca pengunjung di perpustakaan, dilakukan survei dengan mengambil sampel secara SRS WOR sebanyak 5 perpustakaan dari populasi sebanyak 24 perpustakaan yang ada di suatu provinsi. Diketahui jumlah pengunjung perpustakaan di provinsi tersebut dalam satu hari adalah 180 orang. Dari perpustakaan yang terpilih sampel, selanjutnya dilakukan observasi terhadap jam datang dan jam pergi dari tiap pengunjung dalam satu hari. Selisih antara jam datang dan jam pergi ini diasumsikan sebagai lamanya jam baca pengunjung di perpustakaan tsb. Data yang diperoleh:

Perkirakan rata-rata jam baca pengunjung dengan menggunakan estimasi rata-rata tertimbang ukuran cluster dari data populasi. Lengkapi dengan standar error, RSE-nya !

Perpustakaan Jam baca pengunjung

1 4.5 5.5 4.2 2.0 5.5 1.0 2.5

2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5

3 6.5 4.0 7.0 3.5 4.5

4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5

5 0.8 4.5 6.5 5.5 6.5 3.2

Page 11: Mpcp19 Cluster Sampling 3

Contoh Soal 3

1 4.5 5.5 4.2 2.0 5.5 1.0 2.5 7 25.2 3.6 3.3600

2 4.0 5.6 5.5 6.5 1.8 2.0 1.4 1.5 0.5 9 28.8 3.2 3.8400

3 6.5 4.0 7.0 3.5 4.5 5 25.5 5.1 3.4000

4 5.0 3.5 7.0 0.5 1.0 2.0 2.5 6.5 8 28 3.5 3.7333

5 0.8 4.5 6.5 5.5 6.5 3.2 6 27 4.5 3.6000

Total 35 134.5 19.9 17.9333

Page 12: Mpcp19 Cluster Sampling 3

Estimasi Proporsi pada Unequal Cluster Sampling

Page 13: Mpcp19 Cluster Sampling 3

Estimasi Proporsi pada Unequal Cluster Sampling

No Tipe

estimator

Estimasi proporsi populasi

Variance between cluster mean Sampling variance

1 Tidak tertimbang

2 Tertimbang dg cluster size dari sampel

3 Tertimbang dg cluster size dari populasi

Page 14: Mpcp19 Cluster Sampling 3

Estimasi Total berdasarkan proporsi pada Unequal Cluster Sampling

No Tipe estimator Estimasi total

populasi Sampling variance

1 Tidak tertimbang 𝐴 = 𝑁𝑀 ′𝑝 𝑣 𝐴 = 𝑁𝑀 ′ 2𝑣 𝑝

2 Tertimbang dengan cluster size dari sampel

𝐴 ′ = 𝑁𝑀 ′𝑝′ 𝑣 𝐴 ′ = 𝑁𝑀 ′ 2𝑣 𝑝′

3 Terimbang dengan cluster size dari populasi

𝐴 ∗ = 𝑁𝑀 𝑝∗ 𝑣 𝐴 ∗ = 𝑁𝑀 2𝑣 𝑝∗

Page 15: Mpcp19 Cluster Sampling 3

Estimasi Proporsi pada Unequal Cluster Sampling

› Contoh Soal: Suatu survei dilakukan di

suatu desa dengan memilih sampel

secara acak sebanyak 3 cluster dari 25

cluster yang ada di desa tersebut.

Kemudian dilakukan pencacahan

terhadap semua rumah tangga yang

terdapat pada cluster terpilih.

Perkirakan proporsi dan total rumah

tangga pertanian hortikultura di desa

tsb beserta standar error dan RSE-nya

dengan 3 cara ! (untuk cara 3, diketahui

jumlah rumah tangga di desa tsb

sebanyak 105 rumah tangga)

Cluster Rumah tangga

Apakah ada ART yang memelihara/menguasai/

melakukan kegiatan pertanian tanaman hortikultura? (1=Ya,

2=Tidak)

Jika kolom(3) kode 1, apakah

hasilnya dijual/ditukar ? (1=Ya, 2=Tidak)

(1) (2) (3) (4)

1

1 2 -

2 1 1

3 2 -

4 1 2

2

1 2 -

2 1 1

3 2 -

3

1 1 2

2 1 1

3 2 -

4 1 2

5 1 1

Page 16: Mpcp19 Cluster Sampling 3

Estimasi Proporsi pada Unequal Cluster Sampling

› Konsep dan Definisi:

Kegiatan usaha pertanian adalah kegiatan pemeliharaan, pembudidayaan,

pengembangbiakan, pembesaran/penggemukan dengan tujuan sebagian atau

seluruh hasilnya untuk dijual/ditukar/memperoleh keuntungan. Khusus untuk

budidaya padi dan palawija, pemeliharaan sapi potong, sapi perah, dan kerbau

walaupun untuk konsumsi sendiri tetap dikategorikan sebagai usaha pertanian.

Rumah tangga pertanian adalah rumah tangga yang satu atau lebih anggota rumah

tangganya mengelola usaha pertanian baik usaha milik sendiri maupun milik pihak

lain.

Page 17: Mpcp19 Cluster Sampling 3

Estimasi Proporsi pada Unequal Cluster Sampling

Cluster

1 4 1 0.1111 0.2381

2 3 1 0.0000 0.2381

3 5 2 0.1111 0.4762

Total 12 4 0.2222 0.9524

Untuk penghitungan estimasi tidak tertimbang

Untuk penghitungan estimasi tertimbang dengan

cluster size dari sampel Untuk penghitungan

estimasi tertimbang dengan cluster size dari populasi

Page 18: Mpcp19 Cluster Sampling 3

Cara 1: Estimasi Tidak Tertimbang

Page 19: Mpcp19 Cluster Sampling 3

Cara 2: Estimasi Tertimbang dengan Cluster Size dari Sampel

Page 20: Mpcp19 Cluster Sampling 3

Cara 3: Estimasi Tertimbang dengan Cluster Size dari Populasi

Page 21: Mpcp19 Cluster Sampling 3

Penghitungan Sampling Error dengan Stata

Contoh Soal 2:

Suatu wilayah yang terdiri dari 10 cluster diambil sampel secara acak sebanyak 3 cluster, kemudian dilakukan pengukuran terhadap jumlah ART pada semua rumah tangga pada cluster terpilih. Jumlah rumah tangga di wilayah tersebut adalah 42 rumah tangga. Perkirakan rata-rata jumlah ART tiap rumah tangga beserta standar error-nya !

Cluster_id Household_id ART

1 1 4

1 2 5

1 3 3

1 4 6

2 1 5

2 2 4

2 3 7

3 1 3

3 2 6

3 3 5

3 4 6

3 5 2

Page 22: Mpcp19 Cluster Sampling 3

Penghitungan Sampling Error dengan Stata (Estimasi tidak tertimbang)

use "D:Bahan Ajar MPC\unequal cluster.dta” collapse (count) household_id (sum) art, by(cluster_id) ren household_id ruta gen art_per_ruta= art/ruta gen N=10 Gen weight=10/3*4 svyset cluster_id[pweight=weight], fpc(N) vce(linearized) singleunit(missing) pweight: <none> VCE: linearized Single unit: missing Strata 1: <one> SU 1: cluster_id FPC 1: N svy linearized : mean art_per_ruta (running mean on estimation sample) Survey: Mean estimation Number of strata = 1 Number of obs = 3 Number of PSUs = 3 Population size = 3 Design df = 2 Linearized Mean Std. Err. [95% Conf. Interval] art_per_ruta 4,744445 ,247531 3,679404 5,809485

Page 23: Mpcp19 Cluster Sampling 3

use "D:Bahan Ajar MPC\unequal cluster.dta”

gen N=10

gen weight=10/3

svyset cluster_id [pweight=weight], fpc(N) vce(linearized)

pweight: weight

VCE: linearized

Single unit: missing

Strata 1: <one>

SU 1: cluster_id

FPC 1: N svy linearized : mean art

(running mean on estimation sample)

Survey: Mean estimation

Number of strata = 1 Number of obs = 12

Number of PSUs = 3 Population size = 40

Design df = 2

Linearized

Mean Std. Err. [95% Conf. Interval]

art 4,666667 ,2130032 3,750188 5,583146

Penghitungan Sampling Error dengan Stata (Estimasi tertimbang dengan ukuran cluster dari data sampel)

Page 24: Mpcp19 Cluster Sampling 3

Penghitungan Sampling Error dengan Stata (Estimasi tertimbang dengan ukuran cluster dari data populasi)

use "D:Bahan Ajar MPC\unequal cluster.dta” collapse (count) household_id (sum) art, by(cluster_id) ren household_id ruta gen art_per_ruta= art/ruta gen N=10 gen weight=10/3*4.2 gen art_per_ruta2= ruta/4.2* art_per_ruta svyset cluster_id[pweight=weight], fpc(N) vce(linearized) singleunit(missing) pweight: <none> VCE: linearized Single unit: missing Strata 1: <one> SU 1: cluster_id FPC 1: N svy linearized : mean art_per_ruta2 (running mean on estimation sample) Survey: Mean estimation Number of strata = 1 Number of obs = 3 Number of PSUs = 3 Population size = 3 Design df = 2 Linearized Mean Std. Err. [95% Conf. Interval] art_per_ruta2 4,444444 ,3513642 2,932646 5,956243

Page 25: Mpcp19 Cluster Sampling 3

Soal Latihan

id cluster

id ruta

Pengeluaran perkapita sebulan

(000)

1

1 380

2 440

3 500

4 320

2

1 400

2 330

3 330

4 490

5 310

3

1 350

2 350

3 480

4 310

5 350

6 460

Berikut ini adalah data hasil survei konsumsi rumah tangga di suatu kelurahan. Survei dilakukan secara cluster sampling dengan mengambil sampel sebanyak 3 cluster secara SRS WOR dari 20 cluster di kelurahan tsb. Selanjutnya, dilakukan pencacahan terhadap semua rumah tangga yang ada di cluster terpilih. Dari hasil pemutakhiran (updating) rumah tangga diketahui bahwa jumlah rumah tangga di kelurahan tsb sebanyak 102 rumah tangga. a. Metode estimasi manakah yang sebaiknya anda gunakan ? b. Perkirakan rata-rata pengeluaran perkapita perbulan di desa

tersebut, beserta standar error, RSE, dan 95%-CI nya ! c. Dari jawaban point (b), selanjutnya dilakukan pengkategorian

rumah tangga sebagai berikut: (1) Ekonomi lemah: Pengeluaran perkapita< 𝑦 ∗ − 1,96 × 𝑠𝑒 𝑦 ∗ (2) Ekonomi menengah: 𝑦 ∗ − 1,96 × 𝑠𝑒 𝑦 ∗ ≤Pengeluaran perkapita≤ 𝑦 ∗ + 1,96 × 𝑠𝑒 𝑦 ∗ (3) Ekonomi atas: Pengeluaran perkapita> 𝑦 ∗ +1,96 × 𝑠𝑒 𝑦 ∗ Perkirakan proporsi dari masing-masing kategori di atas, lengkap dengan standar error, RSE, dan 95% CI-nya !

Page 26: Mpcp19 Cluster Sampling 3

TERIMA KASIH Have A Nice Sampling