Cara Mengatasi Outlier Fifi
Transcript of Cara Mengatasi Outlier Fifi
Cara mendeteksi outlier :
Metode yang digunakan dalam mendeteksi outlier terbagi menjadi univariate, bivariate, dan
multivariat. Peneliti harus membagi berdasarkan penyimpanan atau pengeluaran dari setiap
outlier, tidak hanya menduga dari karakteristik outlier, tapi juga dari tujuan analisis.
Metode dalam mendeteksi outlier :
Outlier dapat diidentifikasikan menjadi univariat, bivariate, dan multivariat berdasarkan jumlah
variabel (karakteristik) yang ada. Peneliti sebaiknya memanfaatkan banyak kemungkinan dari
pandangan ini.
Mendeteksi univariate :
Mendeteksi outlier univariate dengan cara melihat distribusi dari pengamatan untuk setiap
variabel dalam analisis dan memilih outlier berdasarkan nilai yang keluar dari batas distribusi.
Pendekatan pertama mengkonversi nilai data ke nilai standar, yaitu mean 0 dan standar deviasi 1.
Karena nilai ini adalah sebuah format yang standard, perbandingan antar variabel dapat dibuat
dengan mudah.
Mendeteksi bivariate :
Apabila terdapat pasangan variabel, digunakan scatter plot. Suatu kasus yang terdapat tanda yang
keluar dari range pengamatan yang lain akan terlihat di titik-titik pada scatter plot. Range yang
terdapat pada scatter plot berupa bentuk ellips yang merepresentasikan batas-batas interval
distribusi normal bivariate dengan tingkat kepercayaan 90% atau 95%.
Mendeteksi Multivariat :
Metode dalam mendeteksi outlier multivariate tidak dapat menggunakan metode bivariate karena
terdapat beberapa alasan. Mendeteksi outlier multivariat ini bisa menggunakan ukuran
Mahalanobis D2, sebuah taksiran multivariat dari setiap pengamatan dari sebuah variabel.
Metode ini mengukur jarak setiap pengamatan dalam multidimensi dari pusat rata-rata dari
semua pengamatan, menyediakan nilai tunggal dari setiap pengamatan, bukan merupakan berapa
banyak variabel yang ada. Metode ini cocok untuk memeriksa variate yang lengkap, seperti
variabel independen dalam regresi atau variabel dalam analisis faktor. Nilai ambang batas untuk
ukuran D2 /df harus konservatif (.005 atau .001), sehingga nilai 2,5 (sampel kecil) versus 3 atau 4
dalam sampel yang lebih besar.