Penduga Kekar untuk Ukuran Pemusatan dan Ukuran...

13
STK335 Analisis Eksplorasi Data Pertemuan 07 Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaran Bagus Sartono

Transcript of Penduga Kekar untuk Ukuran Pemusatan dan Ukuran...

Page 1: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

STK335 Analisis Eksplorasi Data Pertemuan 07

Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaran

Bagus Sartono

Page 2: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

Outline

• Pendahuluan

• Ladder Transformation (Tukey, 1977)

• Box-Cox Transformation

Page 3: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

Mengapa Butuh Penduga yang Kekar (Robust)

• Terdapat kemungkinan adanya pencilan (outlier) dalam data yang kita miliki

• Sebaran dari data tidak selalu sama dengan yang kita asumsikan

• Perspektif lain: – Tidak semua orang rajin melakukan screening terhadap data

– Proses screening bisa jadi membuang-buang waktu

– Pada data multivariate, tidak mudah mendeteksi pencilan

– Pada pendugaan ukuran penyebaran, membuang pencilan akan menyebabkan penduganya bersifat under-estimate

Page 4: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

Apa itu statistik yang kekar?

• Statistik yang tidak sensitif jika ada pelanggaran asumsi atau data-data yang menyebabkan sebarannya sedikit berbeda dengan yang diasumsikan

Page 5: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

Ukuran Pemusatan yang Kekar

• Median

• Trimmed Mean (rataan terpangkas, rataan terpancung)

• Winsorized Mean

• M-estimator (penduga M)

Page 6: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

Median

siapa tidak kenal median?

Page 7: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

Trimmed Mean

• Merupakan rata-rata dari 1 - 2 bagian tengah dari data dengan 0 < < 1

• Artinya sebanyak n data paling besar dan n data paling kecil disisihkan dan tidak ikut dalam perhitunganr rataan.

• Jika nilai αn tidak integer, bagian bilangan integer-nya yang digunakan

Page 8: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

M-estimator

• Prinsip dasar: memberikan bobot yang lebih kecil kepada data-data pencilan

Page 9: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

Ukuran Penyebaran yang Robust

• Ragam dan simpangan baku adalah ukuran penyebaran yang banyak digunakan. Namun keduanya sensitif terhadap keberadaan pencilan.

• Beberapa ukuran penyebaran yang kekar: – IQR, interquartile range, jarak/jangkauan antar kuartile

– MAD, median absolute deviation

– Gini’s mean difference

Page 10: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

IQR (inter quartile range)

• IQR didefinisikan sebagai selisih antara kuartil ketiga dengan kuartil pertama

IQR=Q3 – Q1

• Pada data yang menyebar normal, nilai simpangan baku adalah sebesar 1.34898 IQR.

Page 11: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

MAD (median absolute deviation)

• Merupakan ukuran penyebaran kekar yang paling banyak digunakan

• Definisi

MAD = median {|xi – median(x)|}

• Tahapan perhitungan – Hitung median dari data, beri nama median(x)

– Hitung selisih mutlak dari setiap data terhadap median(x)

– Hitung median dari selisih mutlah

• Pada data yang menyebar normal, nilai simpangan baku adalah sebesar 1.4826 MAD

Page 12: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

Gini’s mean difference

• Merupakan rata-rata dari setiap selisih antar amatan

• Pada data yang menyebar normal, simpangan baku dapat didekati sebesar G / 2

Page 13: Penduga Kekar untuk Ukuran Pemusatan dan Ukuran Penyebaranstat.ipb.ac.id/en/uploads/STK335/STK335_05.pdfApa itu statistik yang kekar? • Statistik yang tidak sensitif jika ada pelanggaran

• Prosedur di SAS yang dapat digunakan untuk menghasilkan nilai penduga kekar: – UNIVARIATE – STDIZE

• Ilustrasi proc univariate data=data robustscale trimmed=0.2

winsorized=0.2; var x; run;

proc stdize data=data method=huber pstat; var x; run;