Cara Mengatasi Outlier Fifi

2
Cara mendeteksi outlier : Metode yang digunakan dalam mendeteksi outlier terbagi menjadi univariate, bivariate, dan multivariat. Peneliti harus membagi berdasarkan penyimpanan atau pengeluaran dari setiap outlier, tidak hanya menduga dari karakteristik outlier, tapi juga dari tujuan analisis. Metode dalam mendeteksi outlier : Outlier dapat diidentifikasikan menjadi univariat, bivariate, dan multivariat berdasarkan jumlah variabel (karakteristik) yang ada. Peneliti sebaiknya memanfaatkan banyak kemungkinan dari pandangan ini. Mendeteksi univariate : Mendeteksi outlier univariate dengan cara melihat distribusi dari pengamatan untuk setiap variabel dalam analisis dan memilih outlier berdasarkan nilai yang keluar dari batas distribusi. Pendekatan pertama mengkonversi nilai data ke nilai standar, yaitu mean 0 dan standar deviasi 1. Karena nilai ini adalah sebuah format yang standard, perbandingan antar variabel dapat dibuat dengan mudah. Mendeteksi bivariate : Apabila terdapat pasangan variabel, digunakan scatter plot. Suatu kasus yang terdapat tanda yang keluar dari range pengamatan yang lain akan terlihat di titik-titik pada scatter plot. Range yang terdapat pada scatter plot berupa bentuk ellips yang merepresentasikan batas-batas interval distribusi normal bivariate dengan tingkat kepercayaan 90% atau 95%.

Transcript of Cara Mengatasi Outlier Fifi

Page 1: Cara Mengatasi Outlier Fifi

Cara mendeteksi outlier :

Metode yang digunakan dalam mendeteksi outlier terbagi menjadi univariate, bivariate, dan

multivariat. Peneliti harus membagi berdasarkan penyimpanan atau pengeluaran dari setiap

outlier, tidak hanya menduga dari karakteristik outlier, tapi juga dari tujuan analisis.

Metode dalam mendeteksi outlier :

Outlier dapat diidentifikasikan menjadi univariat, bivariate, dan multivariat berdasarkan jumlah

variabel (karakteristik) yang ada. Peneliti sebaiknya memanfaatkan banyak kemungkinan dari

pandangan ini.

Mendeteksi univariate :

Mendeteksi outlier univariate dengan cara melihat distribusi dari pengamatan untuk setiap

variabel dalam analisis dan memilih outlier berdasarkan nilai yang keluar dari batas distribusi.

Pendekatan pertama mengkonversi nilai data ke nilai standar, yaitu mean 0 dan standar deviasi 1.

Karena nilai ini adalah sebuah format yang standard, perbandingan antar variabel dapat dibuat

dengan mudah.

Mendeteksi bivariate :

Apabila terdapat pasangan variabel, digunakan scatter plot. Suatu kasus yang terdapat tanda yang

keluar dari range pengamatan yang lain akan terlihat di titik-titik pada scatter plot. Range yang

terdapat pada scatter plot berupa bentuk ellips yang merepresentasikan batas-batas interval

distribusi normal bivariate dengan tingkat kepercayaan 90% atau 95%.

Mendeteksi Multivariat :

Metode dalam mendeteksi outlier multivariate tidak dapat menggunakan metode bivariate karena

terdapat beberapa alasan. Mendeteksi outlier multivariat ini bisa menggunakan ukuran

Mahalanobis D2, sebuah taksiran multivariat dari setiap pengamatan dari sebuah variabel.

Metode ini mengukur jarak setiap pengamatan dalam multidimensi dari pusat rata-rata dari

semua pengamatan, menyediakan nilai tunggal dari setiap pengamatan, bukan merupakan berapa

banyak variabel yang ada. Metode ini cocok untuk memeriksa variate yang lengkap, seperti

variabel independen dalam regresi atau variabel dalam analisis faktor. Nilai ambang batas untuk

ukuran D2 /df harus konservatif (.005 atau .001), sehingga nilai 2,5 (sampel kecil) versus 3 atau 4

dalam sampel yang lebih besar.