Pengantar & Statistika Deskriptifpersonal.fmipa.itb.ac.id/utriweni/files/2014/02/1.-Statistik... ·...
Transcript of Pengantar & Statistika Deskriptifpersonal.fmipa.itb.ac.id/utriweni/files/2014/02/1.-Statistik... ·...
Ilustrasi2
Ilustrasi• Berikut adalah data produksi panas bumi di25 titik pengeboran (ton/jam):25 titik pengeboran (ton/jam):
77.71 44.24 60.00 89.54 85.6460.00 24.00 54.12 64.52 27.1487 46 42 13 43 04 45 75 111 2787.46 42.13 43.04 45.75 111.2727.79 41.49 47.70 83.00 14.3270.00 32.35 41.60 77.96 14.37
Informasi apa yang ingin diperoleh dari data ini ?1. Rata-rata produksi panas bumi di 25 lokasi tersebut.2. Penyebaran nilai produksi panas bumi di area STATISTIKA y p pwilayah pengeboran tersebut.3. Lokasi pengeboran dengan nilai produksi yang ekstrim.
4 Signifikansi rata-rata produksi panas bumi di area pengeboran
STATISTIKA DESKRIPTIF
4. Signifikansi rata-rata produksi panas bumi di area pengeboran tersebut. INFERENSI
STATISTIKA
Statistik dan Statistika
3
Statistik dan Statistika
Statistik : nilai-nilai ukuran data yang mudah dimengerti.
Contoh : o statistik (mis. rata-rata) nilai elevasi pasang surut air laut di
selat Makassar (m), o statistik (mis. variansi) hasil pengukuran tinggi gelombang
(cm) menggunakan AWLR (Automatic Water Level Recorder)( ) gg ( )o Statisitik (mis. range) antara nilai tinggi pasang maksimum dan
surut minimum (m)
St ti tik il b k it d l Statistika : ilmu yang berkaitan dengan cara pengumpulan, pengolahan, analisis dan pernarikan kesimpulan atas data.
4
Jenis-jenis Statistikaj
1. Statistika deskriptif: metode yang berkaitandengan pengumpulan dan penyajian data.
k f d b k2. Statistika inferensi: metode yang berkaitandengan analisis sampel untuk penarikankesimpulan tentang karakteristik populasikesimpulan tentang karakteristik populasi.
Populasi dan Sampel5
Populasi
SampelSampel
setiap obyek populasi memilikip y p p m mkemungkinan/kesempatan yang sama untuk terpilih
Sampel Acak
hasil pengukuran atau pengamatan Data
Contoh Populasi dan Sampelp p• Akan dilakukan pengamatan tentang rata-rata
produksi minyak bumi di Indonesiaproduksi minyak bumi di Indonesia.
PopulasiS l h titik
Kendala: - sangat banyak, -menghabiskanSeluruh titik di wilayah Indonesia
?
waktu, -menghabiskan biaya
Kaidah PengambilanSampel (Teknik
Keterwakilan sampelatas populasi ??
Sampel
? p (Sampling)
p p
6
pContoh: setiap propinsi diambil beberapa titik pengamatan
Jenis-jenis Observasi7
OBSERVASI / DATA
KUALITATIF KUANTITATIF
Nominal Ordinal/Rank Diskrit Kontinu
Tidak mengenalurutan dan operasi
aritmatika
Mengenal urutandan operasiaritmatika
Berhubungan dengan‘proses menghitung’, dan pengamatan atas
Didasarkan padasuatu selang/interval
sehingga meliputiaritmatika aritmatika himpunan terhitung. semua bilangan riil
Jenis bencana yang terjadi di suatu daerah
(b ji l
Jenjang pendidikan (SD, SMP, SMA,...),
tingkatan daerah
Banyaknya gempa yang terjadi di suatu daerah
dalam 1 hari, banyaknya
Intensitas gempa yang terjadi setiap hari di
t il h ti k t (banjir, longsor, gempa, dll), jenis
batuan, dll
g(Kelurahan, Kecamatan
Kab./Kota, Provinsi, Negara), dll
, y yhari hujan dalam satu bulan di suatu daerah,
dll
suatu wilayah, tingkat curah hujan harian di
suatu daerah, dll
© 2012 by UM
Statistika Deskriptif
8
Statistika Deskriptif
Metode Tujuan : Metodepengolahan danpenyajian suatu
gugus data
Tujuan : memberikan
informasi yang berguna.
Informasi berupa : bentuk
distribusi data
Karakteristik Distribusi9
1. PARAMETER DISTRIBUSI
UkuranPemusatan
mean, median, modus, kuartil atas, kuartil
bawah dllDISTRIBUSI Pemusatan
yUkuran
Penyebaran
bawah, dllRange, simpangan baku,
variansi, jangkauanantar kuartil, dll
Kemencengan
Kelancipan
skewness
kurtosis
2. BENTUK DISTRIBUSI
Simetris
Menceng/skew
mean = median
Menceng/skew Positif
Menceng/skew Negatif
BerpuncakTunggal
BerpuncakJamak
mean > median
mean < mediangggggg
# modus > 1 # modus = 1
CONTOH 1
10
CONTOH 1
Data rata-rata curah hujan bulanan yang diamati dari Stasiun Padaherang pada tahun 2001 (n = 12)
278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82
x1 x2 x12x7 x10
Data yang diurutkan:
29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49
x(1) x(2) x(12)X(7) x(10)
Adakah perbedaan dari penyajian kedua data di atas?minimum maksimum
11
Ukuran Pemusatan & Penyebaran Data
• Ukuran pemusatan datastatistik yang memberikan informasi dimana data statistik yang memberikan informasi dimana data terkumpul dengan ukuran/jumlah tertentu.Contoh : Mean (rataan), kuartil bawah, kuartil tengah (median) k artil atas mod s persentil tengah (median), kuartil atas, modus, persentil, ...
• Ukuran penyebaran datastatistik yang memberikan informasi bagaimana y g gdata menyebar di sekitar pusat data.Contoh : range (jangkauan data), IQR (jangkauan antar kuartil) variansi standar deviasi (simpangan antar kuartil), variansi, standar deviasi (simpangan baku), ...
Ukuran Pemusatan Data
12
Ukuran Pemusatan Data
1. Mean (rata-rata)( )
1 n
ix xn
1in
Contoh :
1 2 12...12
x x xx
278.59 279.78 ... 267.82 222.1712
13
50% data (50% data (akhirakhir))50 % data (50 % data (awalawal))29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49
X2. Median
Nil i t h b i d k l k d t
X(6.5)
Nilai tengah yang membagi dua kelompok data sama banyak.
3 M d
med = x(6.5) = x(6) + 0.5 (x(7) - x(6) )= 254.58
3. ModusNilai yang paling sering muncul.modus tidak ada
4. Kuartil25 %25 % 25 %25 % 25 %25 % 25 %25 %29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49
q d qKuartil bawah (q1) :
q1 q2 = med q3
1 14
nq x
1 12 1 1 3 4 334 4
1 70.474
q x x x x x4
2 (6 5)12 1 254.58 q x x2 2( 1) 1
4 2n nq x x
Kuartil tengah (q2) :
2 (6.5)12 12
254.58
q x x
3 3( 1)nq x
Kuartil atas (q3) :14
3 3(12 1) 3 9 10 994 4
3 305.214
q x x x x x4
5. Persentil 15
29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49
p25 p50 = med p75
• Persentil ke-i : ( 1)i nx
• Persentil ke-50 :50( 1) 1x x
( 1)100
i n
median
50( 1) 1100 2
n nx x
• Persentil ke-25 dan Persentil ke-75?
kuartil ataskuartil bawah
16
Ukuran Penyebaran Data D
yData : x1, x2, x3, ..., xnRataan : x
Ukuran penyebaran data yang Ukuran penyebaran data yang melihat bagaimana SETIAP (keseluruhan) observasi terpisah dari pusat datadari pusat data.
Tidak memberikan informasi apa- ( )n
ix xpapa, karena : 1
( )ii
( ) 0n n
i ix x x nx nx nx Jumlah Kuadrat (JK)1 1i i
2
1( )
n
ii
x x
Ukuran Penyebaran Data17
y
1. Jangkauan data (Range)
2n
R = datamax – datamin
2. Variansi
R = 508.49 – 29.08 = 479.41
12 2 2
1 1
1 1( ) 1 1
n
in ni
i ii i
xs x x x
n n n
2 20663.8s
?
3 Si B k ( d d d i i )JKXX
20663.8 143.75 s3. Simpangan Baku (standard deviation)
s = √s2
k k l4. Jangkauan antar kuartildq = q3 – q1 dq = q3 – q1 = 234.74
Data Pencilan18
Data Pencilan
Data yang nilainya berbeda jauh dari kelompok data yang lain.
Bagaimana mendeteksi data pencilan ??1. Hitung dq
2 Hitung BBP = q1 – k dq
dq = 234.74
BBP = 70.47–(1.5)(234.74 ) = -281.65
Pilih nilai k = 3/2 (optional)2. Hitung BBP q1 k.dq
3 Hitung BAP = q + k dq
( )( )
BAP = 305 21 + (1 5)(234 74) = 657 323. Hitung BAP = q3 + k.dq
4. Pencilan bawah < BBP
BAP = 305.21 + (1,5)(234.74) = 657.32
tidak ada pencilan bawah
5. Pencilan atas > BAP tidak ada pencilan atas
SARI NUMERIK
19
Count (banyak data, n) 12Sum (jumlah data) 2666.01Average (rata-rata) 222.17
mean < medianMedian (kuartil tengah) 254.58Mode (modus) -Minimum 29.08
mean < median
Maximum 508.49Range 479.41Standard Deviation 143.75 Menceng
kiri/negatif ???Variance 20663.8Skewness 0.303*Kurtosis -0.181*
kiri/negatif ???
25th Percentile (persentil-25) 70.46550th Percentile (persentil-50) 254.5875th Percentile (persentil-75) 305.205Interquartile Range (dk) 234.74* Perhitungan dengan Mic. Excel
20
Penyajian Datay j1. Tabel Distribusi Frekuensi2. Pie Chart
D Pl3. Dot Plot4. Histogram5 Diagram Batang – Daun (stem - leaf)5. Diagram Batang – Daun (stem - leaf)6. Diagram Kotak – Titik (box plot)7. dll…
Penyajian data dalam bentuk grafik dapat dilakukan secara
Skala penggambaran harus diperhatikan dalam penyajian data dalam bentuk grafik.Penyajian data dalam bentuk grafik dapat dilakukan secara manual maupun menggunakan software-software statistik seperti Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
T b l Di t ib i F k i
21
Tabel Distribusi Frekuensi• Data banyaknya pelanggan yang datang ke sebuah
k d h d b l ly y p gg y g g
mini market di 15 hari tertentu pada bulan Juli 2011.26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Kelas Interval
Titik Tengah Kelas
Frekuensi (f)
Frekuensi Kumulatif
Kelas
21-35 28 1 1
36-50 43 4 5
6 8 651-65 58 1 6
66-80 73 2 8
81-95 88 7 15PRINSIP DASAR
Bagaimana bentuk histogramnya?PELUANG
22
Pie Chart10%
9%
58%23%
Pie chart merupakan grafik yang berbentuk lingkaran yang ti t kili i t tmana setiap potongannya mewakili proporsi atau persentase
suatu komponen dari sebuah kelompok data (100%). Pemakaian pie chart hanya cocok ketika menyatakan data y y
dalam bentuk proporsi dari satu kelompok data.
23
Dot Plot
2.5
3
3.5si
0.5
1
1.5
2
frek
uens
• Cara menggambarkan data dalam bentuk titik
00 20 40 60 80 100
nilai
• Cara menggambarkan data dalam bentuk titik, dengan memperhatikan frekuensi dari data yang bersangkutang
• Titik ditumpuk diatas nilai data yang digambarkan.
24
Histogram g
• Histogram adalah gambar berdasarkan distribusi g gfrekuensi
• Setiap frekuensi dipresentasikan oleh suatu segi empat (rectangle)(rectangle).
• Daerah setiap rectangle sebanding dengan frekuensinya.
25
Diagram Batang-Daun (Stem-Leaf)g g ( f)26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
• Stem atau batang, mirip dengan grup data pada histogram, sedangkang p g g p p g gleaf atau daun, mirip dengan frekuensi.
• Stem atau batang adalah digit pertama yang terpenting yang adadalam bilangan yang membentuk harga data, sedangkan digit dig y g g g gbelakangnya akan merupakan leaf atau daun.
• Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
Diagram Kotak-Titik26
g(Box-Plot)
95100
max85
95
76
60
70
80
90max
q2
q3
mean
26
47.5
20
30
40
50
min
q1
• Box Plot digunakan untuk menyelidiki distribusi tanpa k d d h d
0
10
menggunakan grup data seperti pada histogram dan diagram batang daun.
• Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan datamax yang disusun secara terurut dengan membentuk kotak.
Pencilan pada Box Plot27
Pencilan pada Box Plot
* pencilan atasBAP (pagar atas)
upper whisker
q2
q3
mean
maksimum
lower whisker
q1
minimumlower whisker
**
pencilan bawahBBP (pagar bawah)
Kelemahan dan Keunggulan28
Kelemahan dan KeunggulanKELEMAHAN KEUNGGULAN
C DOT PLOT
Tidak efektif untuk ukuran data yang besar
Cepat
Nilai data asli dapat diperkirakan
Lama Histogram peluang dapat memberi gambaran tentang distribusi populasi
HISTOGRAM Banyak perhitungan
Nilai data tidak nampak
gambaran tentang distribusi populasi
Tidak menuntut ketelitian dalam mencatat setiap nilai data
Cepat
BATANG-DAUN
Menuntut ketelitian mencatat daun
p
Tidak memerlukan perhitungan
Nilai data asli dapat dilihat
Memudahkan perhitungan berbagai p g gparameter
BOX PLOT
Membutuhkan perhitungan yang panjang
T di i d i t
Box plot dapat memberi gambarantentang bentuk distribusi populasi
Ef ktif t k b di k b t kBOX PLOT Terdiri dari parameter-parameter dari data yang sudah diurutkan
Efektif untuk membandingkan bentukdistribusi beberapa kelompok data sekaligus
29
Bentuk Distribusi IdealNormalNormal
mean = median
Memiliki bentuk distribusi yang simetris, yaitu :
Skewness = 0
K t i 3 (d l ft t t t k t i l 0 Kurtosis = 3, (dalam software tertentu kurtosis normal = 0
L ih 1
30
Latihan 1• Suatu jenis polimer digunakan dalam sistem evakuasi
pesawat terbang. Penting diperhatikan bahwa polimertersebut harus mampu melawan proses penuaan. Diambildua puluh sampel polimer yang kemudian dibagi atas dua
b b (b h ) lib kpercobaan. Percobaan pertama (batch 1) yang melibatkan10 sampel dikenakan proses percepatan penuaan dengantemperatur tinggi selama 10 hari. Sedangkan 10 sampellainnya (batch 2) tidak dikenakan proses apa apalainnya (batch 2) tidak dikenakan proses apa-apa.Kekuatan daya rentang (dalam psi) sampel-sampeltersebut diukur dan dicatat sebagai berikut.
hBatch 1 227 222 218 217 225 218 216 229 228 221
Batch 2 219 214 215 211 209 218 203 204 201 205
Q: Apakah percobaan proses penuaan memberikan
Sumber: Walpole (2006), hal.13
Q p p p pdampak pada kekuatan daya rentang polimer?
Contoh 2
31
Contoh 2• Apa yang dapat kita lakukan untuk menjawab p y g p j b
pertanyaan tersebut???
Keluarkan sari numerik ang mungkin- Keluarkan sari numerik yang mungkin
ATASUkuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAH-ATASUkuran penyebaran data : RANGE, JANGKAUAN KUARTIL,
VARIANSI,SIMPANGAN BAKU
Lain-lain : SKEWNESS dan KURTOSIS
Apakah diperlukan???
- Plot dataPilih plot yang informatif untuk menjawab pertanyaan tersebut
Misal: BOXPLOT
Batch.1 Batch.IIMean 222,10 209,90
@ UM
32
SARI NUMERIK
, 9,9Variansi 23,6556 42,1000
Simp.Baku 4,86 6,49Min. 216 201Max. 229 219
Q1 218 204,25Median 221,5 210
Q3 226,5 214,75
226.5229230 230
216218
6 5
221.5
215
220
225
214.75
219
215
220
225
Batch 1200
205
210
201
204.25
210
200
205
210
195 Batch 2195
APA YANG DAPAT DISIMPULKAN?? KESIMPULAN DESKRIPTIF
TUGAS 133
TUGAS 1• Berikut adalah data produksi panas bumi di25 titik pengeboran (ton/jam):25 titik pengeboran (ton/jam):
77.71 44.24 60.00 89.54 85.6460.00 24.00 54.12 64.52 27.1487.46 42.13 43.04 45.75 111.2727.79 41.49 47.70 83.00 14.3270 00 32 35 41 60 77 96 14 3770.00 32.35 41.60 77.96 14.37
Q:1. Keluarkan sari numerik data di atas.2. Hitung variansi dengan 2 cara, bandingkan.3. Buat box plot.4 Ceritakan hasil olahan data Anda4. Ceritakan hasil olahan data Anda.
34
Transformasi Data (pengayaan)(p g y )• Transformasi dilakukan untuk mendapatkan
bentuk distribusi yang lebih simetris.• Transformasi Tangga Tukey
-1/x2 -1/x √x log (x) x x2 x3 10x
data awal untuk bentuk distribusi : skewness negatif
untuk bentuk distribusi : skewness positif
Data contoh kasus : skewness = 0 5 (menceng kiri)
Merenggangkan data‐data yang berharga kecildan merapatkan data‐data yang berharga besar
Merapatkan data‐data yang berharga kecil danmerenggangkan data‐data yang berharga besar
Data contoh kasus : skewness = -0,5 (menceng kiri), maka transformasi yang mungkin adalah x2, x3, dan 10x.
Transformasi Data (pengayaan) Contoh Kasus
35
Contoh Kasusx y = x2
Lebih mendekati simetris (skew = 0) 873759
756913693481
Lebih mendekati simetris (skew 0) dibanding sebelum transformasi
(skew = -0,5)
49699583
2401476190256889 k 0 1883
873995
6889756915219025
skew = -0,18
837683
6
6889577668896 626
466762116
transformasi
** Ketika data ditransformasi, maka satuandari data juga akan berubah
36
TUGAS A • Tujuan umum : jMencari, mengumpulkan, mengolah, menganalisis dan menarik kesimpulan atas data Anda sendiri.Tujuan khusus : menerapkan Statistika Deskriptif terhadap• Tujuan khusus : menerapkan Statistika Deskriptif terhadap data sendiri.
• Tipe Tugas : diskusi dalam kelompok, 1 kelompok 3 orang.Sumber data: buku teks, TA, data praktikum, koran, majalah, internet, dll (sebaiknya disesuaikan dengan permasalahan yang mungkin dihadapi di prodi masing‐masing)
Tipe Tugas : diskusi dalam kelompok, kelompok 3 orang.
mungkin dihadapi di prodi masing masing).Ceritakan tentang data tersebut (histori data).
Tugas A diketik (Mic.Word atau Mic.Excel) dengan nama file: “Statdas.II.13‐g ( ) g14.A.Kelompok <nomor kelompok>” dikirim ke [email protected] lambat Rabu, 19 Februari 2014
Contoh Tugas A37
gby Aulia R.M. Fikri (10107096)
• Statistika Deskriptif Data Temperatur O-ring pada Kecelakaan Pesawat Ulang alik Challenger Kecelakaan Pesawat Ulang-alik Challenger Suatu O-ring merupakan suatu gasket mekanik yang berbentuk torus, terbuat darielastomer yang melingkar, didesain untuk ditempatkan di suatu lekukan dandikompres di antara dua bagian selama perakitan sehingga terbentuk segel atauperekat pada permukaan (interface) kedua bagian tersebutperekat pada permukaan (interface) kedua bagian tersebut.Salah satu hal yang patut diperhatikan pada penggunaan O-ring adalah kaitannnyadengan temperaturnya....Berikut adalah data observasi temperature dari O-ring dalam derajat FahrenheitBerikut adalah data observasi temperature dari O ring dalam derajat Fahrenheit ,untuk setiap uji peluncuran mesin roket pesawat ulang alik Challenger tersebut(Sumber: Presedential Commision on the Space Shuttle Challenger Accident, Vol.1, 1986: 129-131).
84 45 68 57 53 7649 66 60 63 67 7961 70 67 70 75 7540 69 72 78 61 7683 80 73 52 70 5867 58 70 67 81 31
Contoh ini lebih lengkap dapat dilihat di: http://personal.fmipa.itb.ac.id/utriweni/files/2012/08/Statdas.I.12-13.A.CONTOH.pdf