Pendahuluan
Pertemuan I
Apa data ?
• Data merupakan hasil pengukuran terhadap suatu objek/individu yang menjadi pusat perhatian.– Pengukuran dapat dilakukan secara kualitatif maupun
kuantitatif– Secara umum, skala pengukuran dibedakan menjadi
nominal, ordinal, interval dan rasio
• Apa beda data dengan informasi ?– Informasi merupakan hasil yang diperoleh dari analisis
data– Misal, data tentang pendapatan kota Bogor tahun 2007
maka rata-rata pendapatan per kapita kota Bogor tahun 2007 merupakan informasi.
Ada berapa jenis data yang Anda kenal?
• Menurut sumbernya data dapat dibedakan menjadi data PRIMER dan SEKUNDER
• Menurut periode pengumpulannya data dibedakan menjadi data TIME SERIES dan data CROSS SECTION
• Menurut skala pengukurannya data dibedakan menjadi data KUALITATIF dan data KUANTITATIF
• Menurut cakupan objeknya data dibedakan menjadi data POPULASI dan data SAMPEL
Bagaimana Teknik Pengumpulan Data ?
observasi
percobaan
survei
Survei didefinisikan sebagai sebuah metode untuk mengumpulkan data
primer yang mendasarkan pada komunikasi dengan perwakilan sampel secara individuo Instrumen: kuesionero Ada aktivitas bertanya melalui wawancara o Ada yang menjawab pertanyaan (individu / klp. individu) responden
Keuntungan survei: proses cepat, tidak mahal, efisien, dan merupakan
sarana yang akurat untuk mengakses informasi yang menyangkut populasi (dengan catatan: survei dilaksanakan dengan tepat dan akurat)
Etika dalam survei: hak pribadi responden, pencegahan penipuan,
penjelasan tujuan survei kepada responden, kerahasiaan, kejujuran dalam pengumpulan data, dan objektivitas dalam melaporkan data
ObservasiObservasi ilmiah merupakan suatu proses pencatatan yang sistematis terhadap pola perilaku orang, objek, dan kejadian-kejadian tanpa bertanya atau berkomunikasi dengan orang, objek atau kejadian tersebut
PENGERTIAN DASAR SURVEI
Wawancara Personal pewawancara bertanya jawab langsung
dengan respondenKeuntungan: responden dapat umpan balik, konfirmasi jawaban, waktu dapat lebih longgar, potensi pengisian kuesioner secara lengkap lebih tinggi, dapat menggunakan alat bantu visual, partisipasi lebih tinggiKerugian: biaya lebih mahal, waktu lebih lama, efek anonimitas responden
Wawancara
Wawancara Telepon pewawancara bertanya jawab dengan
responden melalui teleponKeuntungan: cepat, biaya relatif tidak mahal, mengurangi hal-hal yang bersifat pribadi, ada yang lebih suka diwawancarai via telpon. Kerugian: keterwakilan populasi dapat menjadi masalah karena mungkin tidak semua responden sasaran memiliki telpon, tidak dapat menggunakan media visual, durasi terbatas
Wawancara dapat dilakukan dari rumah kerumah atau di tempat-tempat dimana responden dapat mudah dijumpai misalnya mal, kantor pelayanan pengaduan, dll.
Survei melalui surat/pos
Non Wawancara
Kuesioner tertulis menggunakan jalur distribusi lain Melalui kartu garansi
Melalui majalah dengan pemberian (iming-iming) hadiah tertentu
Survei dengan media internet, dll.
Keuntungan: fleksibilitas geografi, biaya relatif lebih murah, responden lebih nyaman tidak diburu waktu, lebih pas untuk hal yang bersifat pribadi
Kerugian: non respon tinggi, pertanyaan harus standar & terstruktur, sebelum menjawab seringkali responden membaca dulu seluruh pertanyaan kuesioner sehingga dapat menimbulkan bias
Kuesioner Format baku, panjang halaman max 6, bahasa sederhana &
mudah, harus ada pengantar, kadang perlu pemberitahuan awal
ERROR DALAM SURVEI
ilustrasiSebelum kita bicarakan cara pengambilan contohnya, perhatikan ilustrasiberikut (semuanya dikutip dari kuliah STK 211, kelas Prof AHN):
Seorang ibu rumah tangga melewati Jalan Pajajaran di Kota Bogor, dandilihatnya banyak penjual duku Palembang di sepanjang jalan tersebut. Padasaat ingin membeli, penjual menawarkan untuk mencicipi terlebih dahulu. Puasdengan rasanya, ibu tersebut membeli dua kilogram. Sesampai di rumah,ternyata rasa duku yang dia beli tidak manis seperti yang dia rasakan di tempatpenjualan tadi.
BPS mengadakan survei ekonomi dan menyebar beberapa petugas survei keberbagai perumahan di Bogor. Hasil yang diperoleh cukup mengagetkan karenatingkat pendapatan masyarakat di Bogor Baru (salah satu perumahan A diBogor) memiliki rata-rata yang tidak setinggi perkiraan. Setelah diselidikiternyata, petugas di perumahan tersebut adalah petugas yang phobia terhadapanjing. Sehingga rumah yang dia datangi adalah rumah-rumah yang tidakmemelihara anjing, dan rumah yang dilengkapi anjing umumnya lebih kayadaripada yang tidak.
Dua ilustrasi di atas adalah ilustrasi teknik
pengambilan contoh yang salah, hasilnya akan
berbias. Inilah resiko pengambilan kesimpulan
dari data contoh. Jika cara pengambilannya
tidak tepat, maka hanya satu kelompok saja yang
didapatkan dan kesimpulan yang diambil tidak
bisa berlaku umum.
Manajemen Survei: Fieldwork
Seleksi enumerator sehat, memiliki ‘raport’ yg baik, komunikatif, menarik,terdidik, berpengalaman
Pelatihan sangat menentukan kualitas data yang dikumpulkan membekalienumerator tentang: memilih responden, kontak awal, teknikbertanya, probing, menulis jawaban, dan mengakhiri interview
Supervisi meyakinkan bahwa enumerator mengikui prosedur & teknik sesuaidengan yang diterima pada saat pelatihan (termasuk: qualitycontrol, editing, sampling control, control of cheating, progress)
Validasi memverifikasi apakah interview benar-benar dilakukan (ambil 10-25% durasi & kualitas interview, tanggapan thd enumerator,data demografi pokok, dan variabel-variabel kunci)
Evaluasi evaluasi terhadap biaya, waktu, response rates, kualitas interview, &kualitas data
Populasi vs Contoh
himpunan semua objek
yang menjadi minat
pengambilan kesimpulan
himpunan bagian dari
populasi
melakukan pengamatan terhadap seluruh
populasi seringkali tidak mungkin dilakukan
ketika akan membuat kesimpulan, mengapa?
population sample
Mengapa harus dengan contoh?
sumber daya
terbatas waktu yang
tersedia terbatas
pengamatan kadang
bersifat merusah
mustahil mengamati
seluruh anggota populasi
1 2
3 4
bagaimana caranya dengan menggunakan data contoh
kita dapat mengambil kesimpulan terhadap populasi?
INI YANG KITA PELAJARI PADA MATA KULIAH INI
Ilustrasi
Andaikan kita memiliki sepiring sambel buatan ibukita. Berapa banyak yang kita ambil untuk mencicipi rasasambel tersebut ? Sebagian besar orang akanberpendapat bahwa seujung jari sudah cukup untukmengetahui rasa sepiring sambel tersebut. Tidak akanada seorang pun yang menjawab bahwa kita harusmerasakan setengah piring untuk menyatakan rasasambel buatan ibu.
Pengambilan contoh dari sebuah populasi bisadianalogkan dengan mencicipi masakan seperti diatas. Jika data masing-masing objek bermacam-macam,dengan kata lain karakteristik objeknya berbeda-beda,maka perlu diambil contoh yang banyak untuk mewakilisetiap kelompok karakteristik. Namun jika karakteristikobjek pada populasi itu seragam, hampir sama, makacontoh yang sedikit sudah cukup.
Statistika
Populasi
Contoh
Sampling Pendugaan
Tingkat Keyakinan
Ilmu Peluang
Statistika Deskriptif vs
Statistika Inferensia
Deskriptif
Parameter vs Statistik
data populasi parameterolah/analisis
data contoh statistikolah/analisis
Parameter tidak pernah diketahui, yang kita
ketahui adalah statistik. Statistik merupakan
penduga bagi parameter.
Statistika
Populasi : Keseluruhan pengamatan yang menjadi pusat
perhatian kita
Contoh : Himpunan bagian dari populasi (mewakili)
Parameter : Karakteristik numerik dari populasi
Statistik : Karakteristik numerik dari contoh
Peubah / Variabel : Ciri dari objek yang diamati
Skala pengukuran : Nominal, Ordinal, Interval, Rasio
Peubah: Kualitatif vs Kuantitatif, Diskret vs Kontinu
Pengumpulan Data:
Harus dibangkitkan dulu Percobaan
Langsung dikumpulkan Survei/Observasi
Analisis Eksplorasi Data
Eksplorasi Upaya untuk melihat ke dalam data guna mengungkap
informasi yang terkandung dalam data tersebut
manipulasi, penyarian/perangkuman, peragaan
Peragaan : tabel & grafik (histogram, diagram batang, diagram lingkaran/pie
chart, plot, dll.)
Penyarian: ukuran pemusatan (mean, median, modus, quartil), ukuran penyebaran (ragam, standard deviasi, range, jarak antar kuartil)
0
10
20
30
40
50
60
70
80
90
Tw-1 Tw-2 Tw-3 Tw-4
Jabar
Jatim
Lampung79%
21%
Laki-Laki Perempuan
400
500
600
700
800
900
1000
20 40 60 80 100 120
Jarak (1000 Km)E
mis
i H
c (
ppm
)
Teknik Meringkas Dataukuran
pemusatan
ukuran penyebaran
Ukuran Pemusatannilai tempat mengumpulnya sebagian besar data
• Median, membagi data menjadi dua bagian yang sama banyak
Me = data ke-(n+1)/2
• Modus, nilai data yang paling sering muncul
• Rataan/Rata-rata
1
NXi
i 1
N
x1
nXi
i 1
n
mean average
Tentang Rataan
• Rataan bersifat tidak kekar (robust) terhadap adanya data-data bernilai ekstrim.
misal data yang dimiliki:
5, 7, 8, 13, 14, 14, 16, 17, 18, 21
rataan 13.3, median 14
5, 7, 8, 13, 14, 14, 16, 17, 18, 70
rataan 18.2, median 14
• dikenal adanya Truncated Mean (rataan terpangkas) membuang data ekstrim
Ukuran Penyebaransemakin besar nilainya berarti data semakin bervariasi/beragam
• Wilayah (Range), selisih antara nilai data terbesar dengan data terkecil
• Jangkauan antar kuartil (Inter Quartile Range), selisih antara kuartil 1 dengan kuartil 3 kisaran tempat mengumpulnya 50% data bernilai ‘sedang’
• Ragam (variance), rata-rata kuadrat penyimpangan data terhadap rata-ratanya
• Simpangan Baku (standard deviation), akar dari ragam
2 2
1
NXi
i 1
N
( ) s x2 2
1
n - 1Xi
i 1
n
( )
Penyajian dengan: - Diagram Dahan Daun (Stem-and-Leaf Display)
- Diagram Kotak Garis (Box-Plot)
Analisis Eksplorasi Data
Contoh data:25 65 9 26 3 8
65 93 16 29 11 15
82 66 38 23 27 12
37 50 15 17 14 7
54 43 24 10 9 9
41 69 12 17 4 10
48 73 20 53 10 14
76 81 9 13 16 5
54 35 31 8 7 15
39 55 28 12 18 13
24 21 17 12
19 16 11
Contoh1 Contoh2 Contoh3
Analisis Eksplorasi Data
Stem-and-leaf of Contoh3 N =
23
Leaf Unit = 1.0
1 0 3
3 0 45
5 0 77
8 0 899
(4) 1 0011
11 1 223
8 1 4455
4 1 67
2 1 8
1 2
1 2
1 2
1 2 7
Stem-and-Leaf Display
Stem-and-leaf of Contoh1 N =
20
Leaf Unit = 1.0
1 2 5
4 3 579
7 4 138
(4) 5 0445
9 6 5569
5 7 36
3 8 12
1 9 3
Stem-and-leaf of Contoh2 N =
24
Leaf Unit = 1.0
3 0 899
7 1 0223
(6) 1 566779
11 2 01344
6 2 689
3 3 1
2 3 8
1 4
1 4
1 5 3
Analisis Eksplorasi Data
30
20
10
0
Con
toh
3
50
40
30
20
10
Con
toh
2
95
85
75
65
55
45
35
25
Con
toh
1
Boxplot
Langkah Pembuatan Boxp-Plot:
1. Tentukan: nilai terkecil, nilai terbesar, Q1, Median, Q3
2. Lakukan identifikasi pencilan:
dekat: x < Q1 – 3/2 d atau x > Q3 + 3/2 d & jauh: x < Q1 – 3d atau x > Q3 + 3d
3. Gambar !
Sebaran Penarikan Contoh
populasi
ambil contoh
berukuran nambil contoh
berukuran n
ambil contoh
berukuran n
ambil contoh
berukuran n
1x
2x 3
xk
xRata-rata contoh adalah peubah acak yang juga memiliki sebaran
tertentu. Contoh yang berbeda dari populasi yang sama, hampir dapat
dipastikan memiliki rata-rata yang berbeda.
Sebaran Penarikan Contoh
x1, x2, …, xn dari populasi
yang menyebar N(, 2)
x
s
x
menyebar N(, 2/n)
menyebar t-studentdb=n-1
Sifat-sifat Penduga
Penduga bagi suatu parameter , dilambangkan
Sifat yang diinginkan dari suatu penduga parameter adalah:
1. Tak Bias (unbiased)
2. Ragam penduga, , kecil
ˆE
Var
Sifat-sifat Penduga
Tak bias,
ragam kecil
Bias, ragam besarTak bias, ragam
besar
Bias, ragam kecil
Selang Kepercayaan
Menduga nilai parameter menggunakan kisaran nilai antara batas
bawah (LCL=lower confidence limit) dan batas atas (UCL=upper
confidence limit)
x1, x2, …, xn dari populasi
yang menyebar N(, 2)
Selang kepercayaan (1-)x100%
bagi adalah
n
stx
2
Peluang
• Bagaimana membuktikan bahwa sebuah dadu setimbang?
• Empiris Peluang = frekuensi relatif
• Contoh:
• Satu mata uang setimbang dilempar sekali
RC = {M, B}
P({M})=1/2 dan P({B})=1/2
• Satu mata uang setimbang dilempar 3 kali
RC = {BBB,BBM,BMB,MBB,BMM,MBM,MMB,MMM}
P({MMM})=1/8 ; P({BBB})=1/8 ; P({BMB})=1/8
X = Jumlah sisi muka yang muncul (X disebut peubah acak)
Peluang
P(X=0) = P({BBB}) = 1/8
P(X=1) = P({BBM,BMB,MBB}) = 3/8
P(X=2) = P({BMM,MBM,MMB}) = 3/8
P(X=3) = P({MMM}) = 1/8
Sebaran Binom(n,p) sebaran Binom dengan parameter n dan p
(sebaran peluang diskret)
n0,1,2,..., ; )1()(
xpp
x
nxXP xnx
Peubah Acak fungsi yang memetakan anggota
gugus RC ke gugus bilangan nyata
Nilai Harapan & Ragam Peubah Acak X
Nilai Harapan & Ragam : Sebaran Binom(n,p)
,...,nixPxXE i
n
i
ix 0 ; )()(0
222 )()( XEXEx
,...,nixPxXE i
n
i
i 0 ; )()(0
22
X 0 1 2 3
P(X) 0.125 0.375 0.375 0.125
E(X) = 1.5
2 = 0.75
Khusus pada sebaran Binom(n,p) :
E(X) = = np dan 2 = np(1-p)
Contoh: n=3 & p=0.5
Peluang Kontinu
4 0 ; 4
1)( xxf
Sebaran Seragam kontinu
P(X=3) = 0 pada sebaran kontinu, peluang pada satu titik =0
4
3
4
0
4
3|
44
1)()3(
3
0
3
0
3
xdxdxxfXP
4
1
4
2
4
3|
44
1)()32(
3
2
3
2
3
2
x
dxdxxfXP
dxxxfXE x
)()( Nilai harapan
Peluang Normal
- ; 2
1),;(
2
21
2
xexf
x
Sebaran Normal
(fungsi peluang kontinu)
) ,N( ~ X 2
Contoh: Berat ikan di suatu danau mengikuti pola sebaran normal dengan rataan
400g dan standard deviasi 100g. Jika diambil satu ikan secara acak,
berapa peluang mendapatkan ikan yang beratnya lebih dari 500g?
)1 ,0N( ~ Z -X
Z
Tabel-Z
1587.0)1(100
400500)500(
ZPZPXP
Peluang Normal, Z, t, 2, F
Jika X~N(, 2) ~N(, 2/n)
Bagaimana jika sebaran pop tdk normal Dalil Limit Pusat
Apapun sebaran populasinya, ~N(, 2/n) dengan n
Jika 2 tidak diketahui, maka sebaran Normal (Z) sebaran t
Peubah acak Z2 sebaran 2 (Khi-kuadrat)
Rasio dari p.a. sebaran 2 sebaran F
Penggunaan:
Sebaran Z menguji jika 2 diketahui
Sebaran t menguji jika 2 tidak diketahui
Sebaran 2 menguji ragam (2)
Sebaran F Rasio dua ragam
x
x
Pendugaan Parameter
Dugaan Titik
untuk menduga
s2 untuk menduga 2
x
Dugaan Selang
Selang kepercayaan (1-)100% bagi
Jika 2 diketahui:
Jika 2 tdk diketahui:
nzx
nzx
22
n
stx
n
stx
nn )1()1( 22
Dugaan Selang
Selang kepercayaan (1-)100% bagi 1-2
Jika 1 dan 2 tdk diketahui dan diasumsikan sama:
Pendugaan Parameter
2
2
2
1
2
12121
2
2
2
1
2
121
22)()(
nnzxx
nnzxx
21
2
)(2121
21
2
)(21
11)(
11)(
22 nnstxx
nnstxx gabvgabv
2dan 2
)1()1(21
21
2
22
2
112
nnv
nn
snsnsgab
Hipotesis Statistik: Pernyataan/dugaan mengenai parameter
populasi yang ingin dibuktikan kebenarannya
H0 hipotesis nol
H1 atau Ha hipotesis satu atau hipotesis alternatif
Misalnya:
H0: =60 vs H1: ≠60 uji dwi arah
H0: =160 vs H1: >160 uji eka arah
H0: =500 vs H1: <500 uji eka arah
Pengujian Hipotesis
Berdasarkan data yang dikumpulkan, H1 atau H0 yang benar ?
Pengujian Hipotesis
H0 terima H1 terima
Hasil Pengujian
H0 benar Benar Salah Jenis 1
(
Salah Jenis 2
(bH1 benar
Keadaan
SebenarnyaBenar
= Peluang menolak H0 padahal H0 benar
b = Peluang menerima H0 padahal H1 yang benar
Pengujian Hipotesis
Kaidah Keputusan:
Jika p-value < H1 benar
Jika p-value ≥ H0 dianggap benar
taraf nyata pengujian (kesalahan maksimum yang diperbolehkan
jika memutuskan H1 benar)
P-value peluang salah jenis 1 berdasarkan data
Teladan 1:
Pada saat ini diduga terjadi kenaikan rata-rata tinggi badan orang Indonesia dibandingkan
tahun 70-an. Untuk membuktikan dugaan ini diambil contoh acak berukuran 25 dan
diperoleh rataan sebesar 164 cm. Ujilah apakah dugaan tersebut benar. Gunakan =5%.
(Catatan: Tinggi rata-rata tahun 70-an=161 cm, dan 2=81 cm2).
Pengujian Hipotesis
Diketahui: n=25, =164 cm ; 2=81 cm2 ; =5%=0.05.
H0: =161 cm vs H1: >161cm
Z tabel = Z0.05 = 1.65
P-value = P(x>x0 / =161) = P(Z>1.67) = 0.0475
P-value < Tolah H0
(Memang benar sekarang ada kenaikan rata-rata tinggi orang
Indonesia dibandingkan dengan tahun 70-an)
x
67.125/81
161-164
/
-x
nZ
Z > Ztab Tolak H0
Pengujian Hipotesis
Secara Umum:
Satu Nilai Tengah Populasi: H0: = 0 vs H1: 0
H0: 0 vs H1: > 0
H0: 0 vs H1: < 0
Dua Nilai Tengah Populasi:
Saling Bebas Berpasangan
H0: 1= 2 vs H1: 1 2 H0: D = 0 vs H1: D 0
H0: 1 2 vs H1: 1> 2 H0: D 0 vs H1: D > 0
H0: 1 2 vs H1: 1< 2 H0: D 0 vs H1: D < 0
Pengujian HipotesisTeladan-2:
Ada dugaan kuat bahwa latar belakang petambak berpengaruh terhadap keberhasilan
sebagai petambak di CP Bahari. Untuk membuktikan pendapat ini, dipilih 22 petambak
contoh secara acak, dimana 11 orang berlatar belakang petambak dan 11 orang sisanya
berlatar belakang bukan petambak. Jika produksi merupakan ukuran tingkat keberhasilan
petambak, dan produksi terakhir dari ke-22 petambak tersebut seperti tabel di bawah ini,
ujilah apakah dugaan tersebut di atas benar? (Gunakan =5% dan asumsikan ragam
produksi kedua populasi sama).
11.7 9.6 12.2 8.6 9.3 10.1 8.9 9.5 10.4 8.3 9.4
Produksi dari 11 Petambak yang Berlatar Belakang Petambak
7.4 8.5 9.2 8.7 7.8 6.9 10.2 9.4 8.1 8.3 9.0
Produksi dari 11 Petambak yang Berlatar Belakang Bukan Petambak
Bentuk Hipotesis ? Statistik Uji ?
21
2
2121
11
)()(
21
nns
xx
s
xxt
gab
xx
hit
H0: 1 2 vs H1: 1> 2
Top Related