Survei percobaan · 2016-11-29 · Pengambilan contoh acak sederhana pada ukuran populasi yang...

71
Pengajar: Dr. Agus M Soleh

Transcript of Survei percobaan · 2016-11-29 · Pengambilan contoh acak sederhana pada ukuran populasi yang...

Pengajar: Dr. Agus M Soleh

Survei

percobaan

himpunan semua objek yang

menjadi minat pengambilan

kesimpulan

himpunan bagian dari populasi

melakukan pengamatan terhadap seluruh populasi seringkali

tidak mungkin dilakukan ketika akan membuat kesimpulan,

mengapa?

population sample

sumber daya

terbatas waktu yang

tersedia terbatas

pengamatan kadang

bersifat merusah

mustahil mengamati

seluruh anggota populasi

1 2

3 4

bagaimana caranya dengan menggunakan data contoh

kita dapat mengambil kesimpulan terhadap populasi?

INI YANG KITA PELAJARI

data populasi parameterolah/analisis

data contoh statistikolah/analisis

Parameter tidak pernah diketahui, yang kita ketahui adalah

statistik. Statistik merupakan penduga bagi parameter.

Penduga bagi suatu parameter , dilambangkan

Sifat yang diinginkan dari suatu penduga parameter adalah:

1. Tak Bias (unbiased)

2. Ragam penduga, , kecil

ˆE

Var

Tak bias, ragam

kecil

Bias, ragam besarTak bias, ragam besar

Bias, ragam kecil

Unsur (element)

Populasi (population)

Satuan penarikan contoh

(sampling units)

Kerangka (frame)

Contoh (sample)

An object on which a

measurement is taken

A collection of elements about which

we wish to make an inference

Nonoverlapping collections of element

from the population that cover entire

population

A list of sampling units

A collection of sampling units

drawn from a frame(s)

1

2

3

4

5

Penarikan Contoh Berpeluang

(Probability Sampling)

Penarikan Contoh Tak-Berpeluang

(Non-Probability Sampling)

• simple random sampling

• cluster random sampling

• systematic random sampling

• stratified random sampling

• quota sampling

• purpossive sampling

• snowball sampling

• voluntary sampling

Sampling Error : kesalahan yang ditimbulkan karena kita hanya

mengamati sebagian saja (contoh), tidak semuanya (populasi).

Dapat dikontrol dengan secara hati-hati mendesain penarikan

contohnya.

Non-Sampling Error : kesalahan yang ditimbulkan karena sebab

lain pada proses survei, dan lebih sulit dikendalikan.

Non-Response

Inaccurate

response

Bias selection

Pergi!!! saya tidak

mau diganggu

Iya, saya tidak ahli

memasak

Anak saya tidak ada

di rumah, saya saja

yang mengisi

kuesioner itu

Dishonest

Interviewer

Human error and

resources quality

Daripada capek cari

responden, aku berburu

saja. Nanti kuesioner

aku isi sendiri

Memperbesar ukuran contoh

(sample size)tapi cara ini dapat meningkatkan non-sampling error

non-sampling error

sampling error

Sample size

Jika sebuah contoh berukuran n diambil dari suatu populasi

sedemikian rupa sehingga setiap contoh berukuran n yang mungkin

memiliki peluang sama untuk terambil, maka prosedur itu

dinamakan penarikan contoh acak sederhana. Contoh tersebut

dinamakan contoh acak sederhana.

Definisi di atas berimplikasi bahwa setiap objek memiliki peluang

yang sama untuk terambil. Namun konsekuensi ini bukan definisi

dari penarikan contoh acak sederhana.

Pengambilan contoh acak sederhana pada ukuran populasi yang

sedikit dapat saja dilakukan seperti pengundian ‘lotere’ atau

‘arisan’. Yaitu menuliskan nomor atau identitas lain dari setiap

anggota populasi di selembar kertas, kemudian mengambil dengan

mata tertutup n buah kertas. objek sebanyak n dengan identitas

sesuai pada kertas terpilih adalah contoh yang diperoleh.

Untuk populasi yang lebih besar, dapat digunakan bantuan bilangan

acak yang bisa diperoleh dari tabel bilangan acak atau komputer.

Beri nomor setiap objek: 1, 2, …, N

Ambil bilangan acak dari tabel atau bangkitkan menggunakan

komputer.

Sekat-sekat bilangan acak sesuai dengan banyaknya digit N, dan

buat aturan sehingga setiap objek diwakili oleh bilangan yang sama

banyak.

Tentukan nomor objek yang terpilih

Misalkan populasi memiliki 4000 anggota, dan ingin diambil contoh

berukuran 10. Bilangan 4 digit digunakan untuk menentukan objek

yang terpilih.

0001 objek nomor 1

0002 objek nomor 2

4000 objek nomor 4000

4001 objek nomor 1

4002 objek nomor 2

8000 objek nomor 4000

8001, 8002, …, 0000 tidak digunakan

Misalkan dari tabel bilangan acak (baris 26 kolom 2, Scheaffer et al)

diperoleh:

72295048399642324878826516656614778767971478013300870747966695

72529676

7229 5048

3996 4232

4878 8265

1665 6614

7787 6797

1478

3229 1048

3996 232

878 -----

1665 2614

3787 2797

1478

Penduga bagi adalah

n

yy

n

ii

1

)(yE

1)(

2

N

nN

nyV

jika N >>> n, maka

n

syV

2

)(ˆ

karena 22

1)(

N

NsE maka

N

nN

n

syV

2

)(ˆ

dengan

1

)(1

2

2

n

yys

n

ii

)(ˆ

2

yVty

bound on the error

estimation

Objek Jumlah Uang

Y1 33.5

Y2 32.0

Y3 52.0

Y4 43.0

Y5 40.0

Y6 41.0

Y7 45.0

Y8 42.5

Y9 39.0

Dugalah μ, rata-ratajumlah uang dan hitungbound of error padapenduga tersebut

89.409

368

9

9

1 i

iy

y

Untuk mencari bound of error dari penduganya, kita terlebih dahulu

harus menghitung s2

67,359

36850,332.15

8

1

8

9

1

2

29

1

9

1

29

1

2

2

i

i

i

i

i

i yy

n

yy

s

94.3484

9484

9

67,3522ˆ2

2

N

nN

n

syV

Dugaan μ

bound of error pada penduga μ

= N

n

yNyN

n

ii

1

N

nN

n

sNyNVV

2

2)()ˆ(ˆ

= N=750(10.31)=7732,5

Jadi total jam kerja yang tidak efektif dalam satu minggu sebanyak 7732.5 jam

jamN

nN

n

sNyNVV 4.307

750

50750

50

25.275022)(2)ˆ(ˆ2

22

2

Kesalahan pendugaan kurang dari 307,4 jam

Tentukan dulu nilai bound on the error estimation,

misalkan sebesar B

ByVz )(ˆ

2

2

2

2

2

)1(

z

BN

Nn

Nilai 2 ditentukan berdasarkan

informasi awal, atau melakukan

survei pendahuluan terlebih dahulu

62525254

1004

22 danrange

Sebelumnya kita harus menduga ragam populasi (σ2) terlebih dahulu

56,217

6252

3)999(

)625(1000

)1(2

22

2

2

2

z

BN

Nn

Jadi kita perlu mengambil contoh sebanyak 218 rekening.

contohukuran

Ya"" menjawab yang banyaknyaˆ p

Jika “Ya” dilambangkan 1, dan “tidak” dengan 0, maka

yp ˆ

N

nN

n

pppV

1

)ˆ1(ˆ)ˆ(ˆ

Mahasiswa y

1 1

2 0

.

.

.

100 1

Total 15

proporsi mahasiswa tingkat akhir yang berencana melanjutkan studi

bound of error

15,0100

15ˆ yp

059.0300

100300

99

)85,0(15,02

1

)ˆ1(ˆ2)ˆ(ˆ2

N

nN

n

pppV

Contoh acak berlapis didapatkan dengan cara membagi populasi

menjadi beberapa kelompok yang tidak saling tumpang tindih,

dan kemudian mengambil secara acak dari setiap kelompok-

kelompok itu. Kelompok tersebut dinamakan LAPISAN atau

STRATA.

Karena tujuan dari penarikan contoh adalah mendapatkan

contoh yang mewakili (representative) populasi, maka sifat

lapisan adalah:

perbedaan objek antar lapisan tinggi, sedangkan dalam lapisan

rendah.

Dengan kata lain, populasi disekat-sekat sehingga di setiap

sekatan, objek memiliki karakteristik yang mirip.

Menggunakan PCAB, akan memastikan bahwa contoh yang kita

dapatkan terdiri atas berbagai kelompok. Jaminan ini tidak

diberikan oleh PCAS. Misalnya saja, jika kita ingin mengambil

contoh dari suatu kelas mahasiswa sebanyak 10 orang.

Andaikan kita pisahkan terlebih dahulu berdasarkan jenis

kelamin, kemudian secara acak kita ambil 5 orang dari

kelompok perempuan dan 5 orang dari yang laki-laki, maka 10

orang yang diperoleh akan mewakili kedua jenis kelamin.

Dengan PCAS, ada kemungkinan yang terambil perempuan saja,

atau laki-laki saja. Implikasinya, pendugaan menggunakan

PCAB akan memberikan bound of error yang lebih kecil. Hal

tersebut benar hanya jika kita mampu membuat strata dengan

tepat.

1

PCAB dapat mengurangi biaya survei, jika dibandingkan PCAS.

Pada lokasi survei yang luas, hasil pengacakan menggunakan

PCAS dapat saja terjadi kita harus pergi menyeberang pulau

hanya untuk mendapatkan data dari satu orang responden.

Menggunakan PCAB hal ini bisa diminimalkan.

2

Dengan PCAB dimungkinkan untuk melakukan pendugaan

parameter di setiap sub-populasi, yaitu di setiap lapisan.3

Lapisan adalah kumpulan objek yang memiliki karakteristik yang

sama pada variabel yang ingin diambil datanya. Variabel yang

menyekat populasi menjadi beberapa lapisan adalah variabel

yang memiliki pengaruh atau berhubungan dengan variabel yang

diambil datanya. Misalnya kita ingin menduga rata-rata waktu

yang disediakan oleh mahasiswa untuk menonton televisi dalam

sehari. Jika ada justifikasi yang kuat bahwa antara laki-laki dan

perempuan terdapat perbedaan dalam hal tersebut, maka jenis

kelamin dapat dipilih untuk dijadikan lapisan. Jika tidak

demikian, harus dicari variabel lain. Penyusunan lapisan dapat

dilakukan menggunakan lebih dari satu variabel.

Lapisan 1

N1

Lapisan 2

N2

Lapisan 3

N3

Contoh acak

Sederhana

n1

Contoh acak

Sederhana

n2

Contoh acak

Sederhana

n3

L

iiiLLst

yNN

yNyNyNN

y1

2211

11

L

ii

i

i

ii

istn

s

N

nNN

NyV

1

2

2

2

1)(ˆ

Selang kepercayaan bagi

)(ˆ

2

ststyVty

KOTA A KOTA B KOTA C

35 28 26 41 27 4 49 10 8 15 21 7

43 29 32 37 15 41 25 30 14 30 20 11

36 25 29 31 12 32 34 24

39 38 40 45

28 27 35 34

Tabel 1. waktu menonton televisi (jam/minggu)Dugalah rata-rata jumlahmenonton televisi untuk semuarumah tangga di ketiga kotatersebut dan hitung bound oferrornya

Kota A Kota B Kota C

n 20 8 12

33.900 25.125 19.000

35.358 232.411 87.636

N1 155 62 93

y2

1s

7.271900093251256233900155310

1sty

8.212

636.87871,093

8

411.232871,062

20

358.35871,0155

310

12

12)(ˆ2

222

2

1

22

2

L

i i

i

i

iiist

n

s

N

nNN

NyVB

L

iiiLLst

yNyNyNyN1

2211ˆ

L

ii

i

i

ii

istn

s

N

nNNV

1

2

2)ˆ(ˆ

Selang kepercayaan bagi

)ˆ(ˆˆ2

ststVt

L

iii

L

iiii

Nz

BN

wNn

1

2

2

2

2

1

22 /

B = bound of error pendugaan rataan populasi

wi = proporsi contoh masing-masing lapisan

L

kkkk

iii

i

cN

cNnn

1

/

/

wi

185,1883800

9/515540

An

236,2283800

9/156240

Bn

178,1683800

16109340

Cn

L

iiiLLst

pNN

pNpNpNN

p1

2211ˆ

1ˆˆˆ

L

ii

ii

i

ii

istn

pp

N

nNN

NyV

1

2

2 1

)ˆ1(ˆ1)(ˆ

Selang kepercayaan bagi p

)ˆ(ˆˆ2

ststpVzp

L

iiii

L

iiiii

ppNz

BN

wppNn

12

2

2

1

2

)1(

/)1(

L

kk

kk

k

i

ii

i

i

c

ppN

c

ppN

w

1

)1(

)1(

Cari informasi besarnya N

Tentukan n, menggunakan formula

contoh acak sederhana

Tentukan k = N/n (bulatkan)

Acak bilangan 1, 2, …, k. Misalkan

diperoleh m (1 m k)

Objek yang terpilih adalah objek ke-m,

ke-(m+k), (m+2k), …, (m+(n-1)k) pada

kerangka penarikan contoh

N dapat diketahui dengan pasti pada kasus tertentu, tapi

pada kasus lain tidak dapat ditentukan sehingga harus

diasumsikan (diduga). Misalnya pada kasus pengunjung

tempat belanja.

n

y

y

n

i

i

sy

1

)1(1)(

2

nn

yV sy

dengan adalah korelasi antar pasangan objek contoh

sistematik dari frame yang sama. Nilai ini tidak dapat

dihitung hanya menggunakan satu contoh sistematik,

sehingga ragam penduga didekati dengan ragam penduga

rataan contoh acak sederhana.

N

nN

n

syV sy

2

)(ˆ

n

y

NyN

n

i

i

sysy

1

)1(1)ˆ(

22 n

nNV sy

dengan adalah korelasi antar pasangan objek contoh

sistematik dari frame yang sama. Nilai ini tidak dapat

dihitung hanya menggunakan satu conth sistematik,

sehingga ragam penduga didekati dengan ragam penduga

rataan contoh acak sederhana.

N

nN

n

sNV sy

22)ˆ(ˆ

Desa Jumlah Wanita (y)

y2

1 82 6724

2 76 5776

3 83 6889

… …

210 84 7056

211 80 6400

212 79 6241

Total 17.066 1.486.800

Dugalah rata-rata jumlah pendudukwanita di propinsi tersebut serta hitungragamnya jika diketahui jumlah populasidesa sebanyak 1484.

5,80212

066.17ˆ 1

n

y

y

n

i

i

sy

16,21484

2121484

212

483,535

)(ˆ2

N

nN

n

syV sy

n

y

yp

n

i

i

sysy

N

nN

n

pppV

sysy

sy1

)ˆ1(ˆ)ˆ(ˆ

Nilai y = 1 untuk Ya, dan y = 0 untuk Tidak

Contoh Gerombol adalah suatu contoh berpeluang yang satuan

contohnya berupa gerombol (kumpulan elemen)

Penarikan Contoh Gerombol (PCG) adalah penarikan contoh acak

sederhana terhadap satuan contoh yang berupa gerombol

Dalam PCG semua elemen dalam gerombol yang terpilih sebagai

contoh diamati semua

Masalah: Tidak tersedia daftar semua rumahtangga

di kota tsb

Gunakan desa/kelurahan sebagai gerombol, ambil

beberapa desa secara acak, semua rumahtangga di

desa yang terpilih sebagai contoh diamati

Tergantung kemiripan karakteristik dalam gerombol

Penduga bagi adalah

n

i

i

n

i

i

m

y

y

1

1

Penduga yang baik

bagi V(y) jika n 20

)(ˆ

2

yVty

Selang Kepercayaan bagi

1)( 1

2

2

n

myy

MNn

nNyV

n

i

ii

15125

1

i

im

Jumlah total pemukiman pada 25 blok tersebut:

000.329.125

1

i

iy

Jumlah total pendapatan pada 25 blok tersebut:

Gunakan data tersebut untuk menduga rata-rata pendapatan per kapita dikota tersebut, dan hitung bound of errornya.

8801151

000.329.1

1

1

n

i

i

n

i

i

m

y

y

161724

247.502.227.15

)04,6)(25(415

254152

12)(2

2

1

2

2

n

myy

MNn

nNyVB

n

i

ii

= M

n

i

i

n

i

i

m

y

MyM

1

1

1)(ˆ)ˆ(ˆ 1

2

2

n

myy

Nn

nNNyMVV

n

i

ii

n

i

it yn

NyN

1

1)(ˆ)ˆ(ˆ 1

2

2

n

yy

Nn

nNNyNVV

n

i

ti

t

Jika M tidak diketahui:

Tentukan dulu nilai bound on the error estimation, misalkan sebesar B

ByVz )(2

2

2

22

2

c

c

z

MBN

Nn

Nilai 2c dan M ditentukan

berdasarkan informasi awal, atau

melakukan survei pendahuluan

terlebih dahulu dengan mengambil

contoh awal berukuran n’

1

1

2

2

n

myy

s

n

i

ii

c

n

i

i

n

i

i

m

a

p

1

1

ˆ

)ˆ(ˆ 1

2

2

n

mpa

MNn

nNpV

n

i

ii

Penduga yang baik bagi V(p) jika n 20

Jika ai = banyaknya yang menjawab Ya dalam gerombol ke-i

mi = banyaknya elemen dalam gerombol ke-i, maka:

dan