2. Populasi dan Sampel - FMIPA Personal Blogs /...
Transcript of 2. Populasi dan Sampel - FMIPA Personal Blogs /...
1. Statistik dan Statistika2 Populasi dan Sampel2. Populasi dan Sampel3. Jenis-jenis Observasi4. Statistika Deskriptif
•Sari Numerik•Penyajian Data
MA 2081 Statistika Dasar24 Januari 2011
© 2008 by USP & UM ; last edited Jan 11
24 Januari 2011Utriweni Mukhaiyar
Data rata-rata curah hujan (mm) di 15 daerah pada Data rata-rata curah hujan (mm) di 15 daerah pada bulan Oktober 2010.
87 37 59 49 95 69 83 87 39 95 76 83 83 26 46
Berapa rata-rata curah
hujan seluruh
SeberapaSeberapamenyebarnya
ApakahApakah rata-rata curah hujan bulan
Oktober lebih hujan seluruh daerah?
tersebut?
y ycurah hujan daribeberapa daerah
tersebut?bulan lainnya
Oktober lebih besar dibanding bulan lainnya
Adakah daerah Adakah daerah yang perluperhatiankhusus? InferensiStatistika
© 2008 by UM2
khusus?statistikdeskriptif
Statistik : nilai-nilai ukuran data yang mudahdimengerti.gContoh : statistik IP mahasiswa ITB semester I 2010-20112011
Statistika : ilmu yang berkaitan dengan carapengumpulan, pengolahan, analisis dan pernarikanp g p p g pkesimpulan atas data.
3© 2008 by UM
1. Statistika deskriptif: metode yang berkaitan dengan pengumpulan danpenyajian data.p y j
2. Statistika inferensi: metode yang berkaitandengan analisis sampel untuk penarikandengan analisis sampel untuk penarikankesimpulan tentang karakteristik populasi.
4© 2008 by UM
P l iPopulasi
SampelSampel
setiap obyek populasi memilikisetiap obyek populasi memilikikemungkinan/kesempatan yang sama untuk terpilih
Sampel Acakp
hasil pengukuran atau pengamatan Datahasil pengukuran atau pengamatan Data
5© 2008 by UM
Akan dilakukan penelitian apakah tahunpertama di ITB (TPB) memberikan pengaruhpe ta a d ( ) e be a pe ga uterhadap perubahan berat badan mahasiswa. Untuk itu dilakukan pengambilan data padap g phari terakhir ujian TPB.
PopulasipSeluruh
mahasiswa TPB ITB
Kendala: - sangat banyak, -menghabiskanwaktu, -menghabiskan biaya
ITB
?
Kaidah PengambilanSampel (Teknik
Sampling)
Keterwakilan sampelatas populasi ??
Sampel
Sampling)
@ UM 6
pContoh: tiap-tiap kelas TPB diambil secaraacak 10 orang mahasiswa.
OBSERVASI / DATA
KUALITATIF KUANTITATIF
Nominal Ordinal/Rank Diskrit Kontinu
Berhubungan dengan Didasarkan pada suatuTidak mengenalurutan dan operasi
aritmatika
Mengenal urutan danoperasi aritmatika
Berhubungan dengan‘proses menghitung’, dan pengamatan atashimpunan terhitung.
Didasarkan pada suatuselang/interval
sehingga meliputisemua bilangan riilp gp g gg
Warna batuan (abu-abu, hitam, putih,
Tingkat curah hujan (rendah, sedang,
ti i) t t
Banyaknya pekerja yang dibutuhkan dalam suatu
area pertambangan,
Berat batuan, luas area pertambangan, j k t h t k
7
, , p ,coklat, dll), jenis
kelamin , dll
tinggi), strata pendidikan (SD, SMP,
SMA, S1, S2, S3)
area pertambangan, jarak yang dilangkahi
seseorang (bisa mundur, bisa maju) per 0,5 meter
jarak tempuh truk pengangkut, suhu,
dll© 2008 by UM
Metode yang berkaitandengan pengolahan dan penyajian
suatu gugus data sehinggab ik i f i memberikan informasi yang
berguna.
b k d bbentuk distribusi data
8© 2008 by UM
mean, median, modus, 1. PARAMETER DISTRIBUSI
UkuranPemusatan
Ukuran
mean, median, modus, kuartil atas, kuartil
bawah, dllRange simpangan baku
yUkuran
Penyebaran
K g
Range, simpangan baku, variansi, jangkauan antar
kuartil, dll
Kemencengan
Kelancipan
skewness
kurtosis
2. BENTUK DISTRIBUSI Simetris
p kurtosis
mean = median
Menceng/skew Positif mean > median
gMenceng/skew
NegatifggBerpuncak
TunggalBerpuncak
Jamak mean < median
9# modus > 1 # modus = 1
© 2008 by UM
Data rata-rata curah hujan (mm) di 15 daerah pada bulan Oktober 2010. (n = 15)( )
87 37 59 49 95 69 83 87 39 95 76 83 83 26 46
x1 x2 x15x9 x12x1 x2 x15x9 x12
Data yang diurutkan:
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
x(1) x(2) x(15)x(9) x(12)i i maksimum
10
Adakah perbedaan dari penyajian kedua data di atas?minimum maksimum
© 2008 by UM
1. Mean (rata-rata)n
xn
xi
n
1n
i1
Contoh :
1 2 15...x x xx
1587 37 ... 46 67 60 67,60
15
11© 2008 by UM
50% data (50% data (akhirakhir))50 % data (50 % data (awalawal))26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
x(8) 3 x 2 x 2 x
2. MedianNilai tengah yang membagi dua kelompok data Nilai tengah yang membagi dua kelompok data sama banyak.
med = x(8) = 76
3. ModusNilai yang paling sering muncul.mod = 83
12
mod = 83© 2008 by UM
25 %25 % 25 %25 % 25 %25 % 25 %25 %26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
q1 q2 = med q3
Kuartil bawah (q1) : 1 (4)15 14
46q x x
1 14
nq x
4
2 2( 1) 1n nq x x
4
Kuartil tengah (q2) :
( ) 76q x x
( )4 2n n
g (q2)
8
2 (8)15 12
76q x x
K il ( ) 13
3 (12)3(15 1)4
87q x x
3 3( 1)4nq x
Kuartil atas (q3) :© 2008 by UM
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
p25 p50 = med p75p25 p50 med p75
• Persentil ke-i : ( 1)i nx
• Persentil ke-50 : x x
( )100
• Persentil ke-50 :50( 1) 1
100 2n nx x
median
• Persentil ke 25 dan Persentil ke 75?• Persentil ke-25 dan Persentil ke-75?
14
kuartil ataskuartil bawah© 2008 by UM
1 Jangkauan data (Range)1. Jangkauan data (Range)R = datamax – datamin R = 95 – 26 = 69
2n
2. Variansi
12 2 2
1 1
1 1( ) 1 1
in ni
i ii i
xs x x x
n n n
2 529,2571s
1 11 1i in n n
JK3. Simpangan Baku (standard deviation)
√
JKXX
529, 2571 23,01s s = √s2
4. Jangkauan antar kuartil
15
4. Jangkauan antar kuartildq = q3 – q1 dq = q3 – q1 = 87 – 46 = 41© 2008 by UM
Data yang nilainya berbeda jauh dari kelompok data yang lain.y g
Bagaimana mendeteksi data pencilan ??1. Hitung dq
2 Hit BBP k d
dq = 41
BBP 46 (1 5)(41) 15 5Pilih nilai k = 3/2 (tidak mutlak)
2. Hitung BBP = q1 – k.dq BBP = 46 – (1,5)(41) = -15,5
3. Hitung BAP = q3 + k.dq BAP = 87 + (1,5)(41) = 148,5
4. Pencilan bawah < BBP
5 P il t > BAP
tidak ada pencilan bawah
tid k d il t16
5. Pencilan atas > BAP tidak ada pencilan atas© 2008 by UM
SARI NUMERIKSARI NUMERIKCount (banyak data, n) 15Sum (jumlah data) 1014Sum (jumlah data) 1014Average (rata-rata) 67.6Median (kuartil tengah) 76 mean < median
Mode (modus) 83Minimum 26Maximum 95Maximum 95Range 69Standard Deviation 23.01 Menceng kiriStandard Deviation 23.01Variance 529.2571Skewness -0.50*
Menceng kiri
Kurtosis -1.23*25th Percentile (persentil-25) 4650th Percentile (persentil 50) 7650th Percentile (persentil-50) 7675th Percentile (persentil-75) 87Interquartile Range (dk) 41Interquartile Range (dk) 41
* Perhitungan dengan Mic. Excel17© 2008 by UM
1. Tabel Distribusi Frekuensi1. Tabel Distribusi Frekuensi2. Pie Chart3 Dot Plot3. Dot Plot4. Histogram
Di B D ( l f)5. Diagram Batang – Daun (stem - leaf)6. Diagram Kotak – Titik (box plot)7. dll…
Skala penggambaran harus diperhatikan dalam penyajian data
Penyajian data dalam bentuk grafik dapat dilakukan secara l k ft ft t ti tik ti
dalam bentuk grafik.
18
manual maupun menggunakan software-software statistik seperti Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
© 2008 by UM
Data curah hujan bulan Oktober 2011
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Kelas Interval
Titik Tengah Kelas
Frekuensi (f)
Frekuensi Kumulatif
21-35 28 1 1
36-50 43 4 5
51-65 58 1 6
66-80 73 2 8
81-95 88 7 15PRINSIP DASAR
PELUANG
@ UM 19
Bagaimana bentuk histogramnya?
9%
10%
58%23%
Pi h t k fik b b t k li k Pie chart merupakan grafik yang berbentuk lingkaran yang mana setiap potongannya mewakili proporsi atau persentase suatu komponen dari sebuah kelompok data (100%) suatu komponen dari sebuah kelompok data (100%).
Pemakaian pie chart hanya cocok ketika menyatakan data dalam bentuk proporsi dari satu kelompok data
20
dalam bentuk proporsi dari satu kelompok data.© 2008 by UM
3 5
2
2,5
3
3,5
nsi
0 5
1
1,5
2
frek
uen
0
0,5
0 20 40 60 80 100nilai
Cara menggambarkan data dalam bentuk titik dengan memperhatikan frekuensi dari data titik, dengan memperhatikan frekuensi dari data yang bersangkutanTitik dit k di t il i d t di b k Titik ditumpuk diatas nilai data yang digambarkan.
21© 2008 by UM
Histogram adalah gambar berdasarkan distribusi frekuensi
Setiap frekuensi dipresentasikan oleh suatu segi empat (rectangle).
Daerah setiap rectangle sebanding dengan frekuensinya.22
© 2008 by UM
Stem atau batang, mirip dengan grup data pada g p g g p phistogram, sedangkan leaf atau daun, mirip dengan frekuensi.
Stem atau batang adalah digit pertama yang terpenting yang ada dalam bilangan yang membentuk harga data, sedangkan digit di belakangnya akan merupakan leaf atau daun.
Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.23
© 2008 by UM
85
9590
100 maxq385
76
60
70
80 q2
q3
mean
26
47,5
20
30
40
50
min
q1
B Pl t di k t k lidiki di t ib i t 0
10
20
Box Plot digunakan untuk menyelidiki distribusi tanpa menggunakan grup data seperti pada histogram dan di b t ddiagram batang daun.
Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan d di d b k datamax yang disusun secara terurut dengan membentuk kotak.
24© 2008 by UM
* pencilan atas
k d
* pencilan atas
max kedua
q2
q3
mean
q1
mean
min ketiga
**
pencilan bawah
25© 2008 by UM
KELEMAHAN KEUNGGULAN
DOT PLOT Tidak efektif untuk ukuran data yang besar
Cepat
Nil i d t li d t di ki kdata yang besar Nilai data asli dapat diperkirakan
HISTOGRAM
Lama
B k hit g
Histogram peluang dapat memberi gambaran tentang distribusi populasi
HISTOGRAM Banyak perhitungan
Nilai data tidak nampakTidak menuntut ketelitian dalam mencatat setiap nilai data
Cepat
BATANG-DAUN Menuntut ketelitian mencatat daun
Cepat
Tidak memerlukan perhitungan
Nilai data asli dapat dilihatmencatat daun p
Memudahkan perhitungan berbagai parameter
Membutuhkan perhitungan Box plot dapat memberi gambaran
BOX PLOT
Membutuhkan perhitungan yang panjang
Terdiri dari parameter-
Box plot dapat memberi gambarantentang bentuk distribusi populasi
Efektif untuk membandingkan bentukparameter dari data yang sudah diurutkan
distribusi beberapa kelompok data sekaligus
26© 2008 by UM
mean = median
Memiliki bentuk distribusi yang simetris, yaitu :
Skewness = 0
Kurtosis = 3, (dalam software tertentu kurtosis normal = 0
© 2008 by UM27
Suatu jenis polimer digunakan dalam sistem evakuasipesawat terbang. Penting diperhatikan bahwa polimertersebut harus mampu melawan proses penuaan. Diambildua puluh sampel polimer yang kemudian dibagi atas duapercobaan Percobaan pertama (batch 1) yang melibatkanpercobaan. Percobaan pertama (batch 1) yang melibatkan10 sampel dikenakan proses percepatan penuaan dengantemperatur tinggi selama 10 hari. Sedangkan 10 sampellainnya (batch 2) tidak dikenakan proses apa-apa.Kekuatan daya rentang (dalam psi) sampel-sampel tersebutdiukur dan dicatat sebagai berikutdiukur dan dicatat sebagai berikut.
Batch 1 227 222 218 217 225 218 216 229 228 221
Batch 2 219 214 215 211 209 218 203 204 201 205Batch 2 219 214 215 211 209 218 203 204 201 205
Q: Apakah percobaan proses penuaan memberikan d k d k k d l
@ UM 28
Sumber: Walpole (2006), hal.13
dampak pada kekuatan daya rentang polimer?
Apa yang dapat kita lakukan untuk menjawab pertanyaan tersebut???pertanyaan tersebut???
- Keluarkan sari numerik yang mungkinKeluarkan sari numerik yang mungkinUkuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAH-ATAS
Ukuran penyebaran data : RANGE JANGKAUAN KUARTIL Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL, VARIANSI,SIMPANGAN BAKU
Lain-lain : SKEWNESS dan KURTOSIS Apakah diperlukan???
Plot data
p p
- Plot dataPilih plot yang informatif untuk menjawab pertanyaan tersebut
Misal: BOXPLOT
@ UM 29
Misal: BOXPLOT
Batch.1 Batch.IIMean 222,10 209,90
Variansi 23,6556 42,1000Simp Baku 4 86 6 49Simp.Baku 4,86 6,49
Min. 216 201Max. 229 219Q1 218 204,25
Median 221,5 210Q3 226 5 214 75Q3 226,5 214,75
229230 230
216218
226,5
221,5
215
220
225
219
215
220
225
216
205
210
215
204 25
214,75
210
205
210
215
Batch 1195
200 201
204,25
Batch 2195
200
@ UM 30
APA YANG DAPAT DISIMPULKAN?? KESIMPULAN DESKRIPTIF
TUGAS 1
Emisi karbon pada kecepatan stasioner (dalam ppm) pada mobil-mobil keluaran tahun 1980 dan ppm) pada mobil mobil keluaran tahun 1980 dan 1990 dicatat dengan mengambil 20 sampel mobil secara acak untuk setiap model.secara acak untuk setiap model.
141 359 247 940 882 494 306 210 105 880Model 1980
200 223 188 940 241 190 300 435 241 380
Model 1990140 160 20 20 223 60 20 95 360 70
220 400 217 58 235 380 200 175 85 65
Q: Apakah emisi populasi berubah dari tahun 1980 dan 1990?
@ UM 31Sumber: Walpole (2006), hal.29
Dikumpul Senin, 7 Februari 2011
Transformasi dilakukan untuk mendapatkan bentuk Transformasi dilakukan untuk mendapatkan bentukdistribusi yang lebih simetris.
Transformasi Tangga Tukey Transformasi Tangga Tukey
-1/x2 -1/x √x log (x) x x2 x3 10x1/x 1/x √x log (x) x x x 10
data awal untuk bentuk distribusi : untuk bentuk distribusi : data awalskewness negatifskewness positif
Merenggangkan data‐data yang berharga kecil Merapatkan data‐data yang berharga kecil dan
Data contoh kasus : skewness = -0,5 (menceng kiri),
dan merapatkan data‐data yang berharga besar merenggangkan data‐data yang berharga besar
32
maka transformasi yang mungkin adalah x2, x3, dan 10x.© 2008 by UM
2
87
x
7569
y = x2
Lebih mendekati simetris (skew = 0) dibanding sebelum transformasi
375949
136934812401
dibanding sebelum transformasi(skew = -0,5)
496995
240147619025
838739
688975691521
skew = -0,1839958376
152190256889577676
8326
57766889676 ** Ketika data ditransformasi, maka satuan
46
33
2116transformasi
dari data juga akan berubah© 2008 by UM
TUGAS A
M i lk l h li iMencari, mengumpulkan, mengolah, menganalisis dan menarik kesimpulan atas data Anda sendiri.
Sumber data: buku teks, TA, data praktikum, koran, majalah, internet, dll (sebaiknya disesuaikan dengan permasalahan yang mungkin dihadapi di prodi masing‐masing).Ceritakan tentang data tersebut (histori data).
Tugas A diketik pada kertas (A4) dikumpul Senin, 7 Februari 2011
@ UM 34
Berikut adalah nilai UTS 1 dari 55 mahasiswa MA2181 Analisis Data Tahun 2010.
70,5 75,5 68 85,5 84,5 78,5 58,5 82 75,5 84 64,553 69,5 92,5 62 68,5 74,5 59,5 83 79,5 89,5 7953 54 84 66 79 78,5 84 80,5 74,5 74,5 64
74,5 73 75 82 73 67,5 70 68 75 70,5 74,570 5 62 61 5 81 58 5 43 5 74 5 39 77 87 7170,5 62 61,5 81 58,5 43,5 74,5 39 77 87 71
Histori data:
Nilai UTS 1 ini diambil dari kelas 02 tahun 2010 yang mahasiswanya adalah terdiri y g ydari 54 mahasiswa angkatan 2009 dan 1 orang mahasiswa angkatan 2008 prodi Matematika ITB
UTS 1 dilaksanakan pada hari Rabu, 13 Oktober 2010.
Pelaksanaan ujian adalah paralel dengan kelas 01.
Soal ujian terdiri dari dua bagian, dimana Bagian I terdiri dari 4 soal Pilihan Ganda dan 2 soal Pilihan Benar-Salah, dan Bagian II terdiri dari 3 soal ESEI. Nilai maksimum
@ UM 35
gadalah 100 (Soal UTS 1 dilampirkan).
Sumber: Nilai UTS 1 MA 2181 Analisis Data, Kelas: 02, Pengajar: Utriweni Mukhaiyar
@ UM 36
Djauhari, M.A., 2001, Catatan Kuliah Analisis Data.
Walpole, Ronald E., et.al, Statistitic for Scientist and Engineering, 8th Ed., 2007.
37
© 2008 by UM