PENGUJIAN DATA

36
LOGO PENGUJIAN DATA 1

description

PENGUJIAN DATA. Uji Data. Uji missing data Untuk melihat apakah data yang tidak lengkap/hilang akan memengaruhi pengolahan data secara keseluruhan Uji data outlier - PowerPoint PPT Presentation

Transcript of PENGUJIAN DATA

Page 1: PENGUJIAN DATA

LOGO

PENGUJIAN DATA

11

Page 2: PENGUJIAN DATA

Uji Data

Uji missing data – Untuk melihat apakah data yang tidak lengkap/hilang

akan memengaruhi pengolahan data secara keseluruhan

Uji data outlier– Untuk mengetahui sejauh mana data outlier akan

mengganggu keseluruhan data, yang dapat mengakibatkan kesalahan dalam menarik kesimpulan

Uji asumsi klasik- Untuk mengetahui apakah data memenuhi beberapa

asumsi pokok seperti: normalitas data, linearitas data, homoskedastisitas data, dsb.

22

Page 3: PENGUJIAN DATA

Analisis Missing Data

Missing data: Sel-sel kosong pada variabel Disebabkan karena informasi/data tidak diberikan, sulit

diperoleh, atau lupa ditanyakan

Contoh:

• Data umur

• Data gaji/penghasilan

Dampaknya? Jika sedikit (sekitar 1%) dihapus tidak masalah Jika banyak perlu pengujian apakah layak diproses

lebih lanjut atau tidak

33

Page 4: PENGUJIAN DATA

Analisis Missing Data

Uji Keacakan : Untuk mengetahui apakah data yang hilang

bersifat random atau tidak Random tidak ada pola tertentu

Contoh: Kasus 1 lihat buku Singgih Santoso hal.16.

44

Page 5: PENGUJIAN DATA

Kasus 1: Uji Keacakan DataLangkah-langkah:1. Buka file : missing value.sav

2. Analyze

3. Missing value analysis

4. Masukkan variabel: usia, berat, tinggi dll. ke bagian QUANTITATIVE VARIABLE.

5. Masukkan variabel minum ke bagian CATEGORICAL VARIABLE.

6. Masukkan variabel nama ke bagian CASE LABELS.

7. Pada bagian ESTIMATION (kanan tengah), klik kotak listwise, pairwise, dan EM

8. Klik ikon PATTERN . Pada bagian DISPLAY klik Tabulated cases.... dan Cases with missing values.....

9. Klik CONTINUE.

10. Klik DESCRIPTIVES

11. Pada bagian INDICATOR VARIABLE STATISTICS, klik Percent missmatch dan klik juga Crosstabulation of ....

12. Klik OK.

Analisis Missing Data

55

Page 6: PENGUJIAN DATA

Analisis Missing Data

Bagaimana mengatasi missing data? Membuang data (kasus) Mengisi sel (data) yang hilang dengan data

tertentu rata-rata keseluruhan

Lihat contoh Kasus 2.

66

Page 7: PENGUJIAN DATA

Kasus 2: Perlakuan terhadap Missing Data

Langkah-langkah:1. Buka file : missing value.sav

2. Pilih menu: Transform Replace Missing Value

3. Masukkan variabel: usia, berat, tinggi, income, jam kerja dan olah raga ke bagian NEW VARIABLE.

4. Bagian NAME AND METHOD

Bagian NAME otomatis menampilkan variabel baru USIA_1, dll.

Bagian METHOD pilih Series Mean

Abaikan bagian yang lain.

5. Klik OK.

Analisis Missing Data

77

Page 8: PENGUJIAN DATA

Outlier : • Data yang secara nyata berbeda dengan data-data

yang lain

Mengapa terjadi outlier? Kesalahan dalam pemasukan data Kesalahan pengambilan sampel Memang ada data ekstrim

Uji Data Outlier

88

Page 9: PENGUJIAN DATA

Deteksi Data Outlier

Deteksi dapat dilakukan dengan 3 cara:

1. Membuat nilai z (standardisasi data)

2. Membuat grafik/diagram Scatter Plot

3. Penyajian Box Plot

99

Page 10: PENGUJIAN DATA

1. Standardisasi Data

Langkah-langkah:1. Buka file outlier.2. Menu Analyse Descriptive Statistics

Descriptive3. Masukkan variabel usia, berat, tinggi, income, jam

kerja dan olah raga ke bagian VARIABLE(S).4. Aktifkan (klik) Save standardized values at

variables.5. Abaikan yang lain lalu klik OK.

Output dapat dilihat pada outlier uji z.sav

Deteksi Data Outlier

1010

Page 11: PENGUJIAN DATA

Deteksi Data Outlier

Rumus standardisasi: _

z = x - X Std. Deviasi

Jika nilai z < - 2,5 atau z > + 2,5 maka data tersebut dikategorikan sebagai data outlier.

Lihat tabel output berikut.

x = nilai dataX = nilai rata-rataZ = Nilai standar

1111

Page 12: PENGUJIAN DATA

Deteksi Data Outlier

1212

Page 13: PENGUJIAN DATA

Deteksi Data Outlier

1313

Page 14: PENGUJIAN DATA

2. Scatter Plot

Langkah-langkah:1. Buka file outlier.2. Menu Graph Legacy Dialogs Scatter/Dot3. Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER

dan tekan tombol DEFINE.4. Masukkan variabel income pada sumbu X dan

variabel usia pada sumbu Y.5. Abaikan bagian yang lain, lalu klik OK

Output dapat dilihat pada outlier scatter plot.sav

Deteksi Data Outlier

1414

Page 15: PENGUJIAN DATA

Deteksi Data Outlier

Scatter Plot Outlier

Outlier

1515

Page 16: PENGUJIAN DATA

3. Box Plot

Langkah-langkah:1. Buka file outlier.2. Menu Analyse Descriptive Statistics Explore ...3. Masukkan variabel usia dan berat pada kotak

DEPENDENT LIST.4. Pada bagian DISPLAY (kiri bawah), klik Plots5. Buka kotak PLOTS, lalu nonaktifkan steam and leaf

pada bagian DESCRIPTIVES.6. Klik Continue.7. Abaikan yang lain lalu klik OK.

Output disimpan pada file outlier box plot

Deteksi Data Outlier

1616

Page 17: PENGUJIAN DATA

Deteksi Data Outlier

Output:

Outlier Max

Min

Median

Ekstrim

1717

Page 18: PENGUJIAN DATA

Ketentuan Box Plot:

Outlier Jika data terletak 1,5 kali panjang box plot,

yang dimulai dari batas atas atau batas bawah

Ekstrim Jika data terletak melebihi 3 kali panjang box plot, yang dimulai dari batas atas atau batas bawah

Deteksi Data Outlier

1818

Page 19: PENGUJIAN DATA

Penanganan Outlier

Ada dua cara penanganan outlier:1. Dihilangkan/dibuang, jika dianggap

mencerminkan data yang sesungguhnya atau karena kesalahan pengambilan data, kesalahan inputing dsb.

2. Dipertahankan, jika data tersebut memang ada atau tidak ada indikasi kesalahan.

Pilihan no.1 atau no.2 tergantung pengguna.

1919

Page 20: PENGUJIAN DATA

Uji Normalitas Data

Tujuan: Untuk mengetahui apakah data terdistribusi

secara normal bentuk lonceng (bell shape)

Data yang baik distribusi normal

2020

Page 21: PENGUJIAN DATA

Contoh :1. Buka file outlier2. Menu Analyze Descriptive Statistics Explore...3. Masukkan variabel usia dan berat pada kotak DEPENDENT LIST4. Pada bagian DISPLAY, klik kotak Plots5. Buka kotak PLOTS6. Aktifkan kotak Normality Plots with tests7. NON AKTIFKAN pilihan steam and leaf pada bagian

DESCRIPTIVES8. Pilih None pada bagian BOXPLOT9. Tekan CONTINUE10.Abaikan yang lain lalu klik OK.

Uji Normalitas Data

2121

Page 22: PENGUJIAN DATA

Uji Normalitas Data

OutputNormalitas Data

Kriteria uji lihat Kolmogorov-Smirnov dan Shapiro-Wilk

• Jika Sig. > 0.05 data terdistribusi normal

• Jika Sig. < 0.05 data tidak terdistribusi normal

2222

Page 23: PENGUJIAN DATA

Uji Normalitas Data

Diagram Plot : Contoh Data yang terdistribusi normal

Data bergerombol disekitar garis uji Data menyebar secara acak, tidak membentuk pola tertentu

2323

Page 24: PENGUJIAN DATA

Uji Normalitas Data

Diagram Plot : Contoh Data yang terdistribusi tidak normal

Data bergerombol disekitar garis uji,namun ada data yg terletak jauh dari sebaran data

Data membentuk pola tertentu, ke kanan bawah kemudian naik ke atas

2424

Page 25: PENGUJIAN DATA

Ada 4 perlakuan:

1.Menambah jumlah data

2.Menghilangkan data penyebab tidak normal

3.Dilakukan transformasi data, misal mengubah data ke bentuk logaritma atau natural atau bentuk lainnya, lalu diuji ulang

4.Terima apa adanya. Pilih alat analisis yang tepat, misalnya gunakan uji nonparametrik

Penanganan Data Tidak Normal

2525

Page 26: PENGUJIAN DATA

Tujuan: Untuk mengetahui apakah sebuah kelompok

data mempunyai varians yang sama (seperti yang seharusnya terjadi).

Jika varians-nya sama homoskedastisitas

Jika varians-nya tdk sama heteroskedastisitas

Alat uji: Levene Test Analisis Residual grafik

Uji Homoskedastisitas Data

2626

Page 27: PENGUJIAN DATA

Uji Homoskedastisitas Data

Contoh :1. Buka file homoskedastisitas2. Menu Analyze Descriptive Statistics Explore...3. Masukkan variabel tinggi dan jam kerja pada kotak

DEPENDENT LIST4. Masukkan variabel minum pada kotak FACTOR LIST5. Pada bagian DISPLAY, tetap pada pilihan both6. Buka kotak PLOTS7. Pilih none pada bagian BOXPLOTS8. NON AKTIFKAN pilihan steam and leaf pada bagian

DESCRIPTIVES9. Pada bagian SPRED VS LEVEL WITH LEVENE TEST, pilih power

estimation.10.Tekan CONTINUE, abaikan yang lain lalu klik OK.

2727

Page 28: PENGUJIAN DATA

Test of Homogeneity of Variance

Levene

Statistic df1 df2 Sig.

tinggi Based on Mean 4,244 1 73 ,043

Based on Median 3,789 1 73 ,055

Based on Median and

with adjusted df

3,789 1 71,641 ,056

Based on trimmed mean 4,143 1 73 ,045

jamkerja Based on Mean 2,822 1 73 ,097

Based on Median 2,062 1 73 ,155

Based on Median and

with adjusted df

2,062 1 68,546 ,156

Based on trimmed mean 2,775 1 73 ,100

Output

Hipotesis:H0 : kedua varians populasi samaH1 : Kedua varians populasi berbeda/tidak identik

Jika:•Sig. > 0.05 H0 diterima , artinya varians-nya sama•Sig. < 0.05 H0 ditolak, artinya varians-nya berbeda

Uji Homoskedastisitas Data

2828

Page 29: PENGUJIAN DATA

Kesimpulan:

Varians data tinggi konsumen yg minum sedikit air mineral berbeda secara nyata dengan varians data tinggi konsumen dengan banyak minum air mineral.Heteroskedastisitas

Varians data jam kerja konsumen yang minum sedikit air sama dengan varians data konsumen dengan banyak minum air mineral homoskedastisitas

Uji Homoskedastisitas Data

2929

Page 30: PENGUJIAN DATA

Dilakukan transformasi data, misal mengubah data ke bentuk logaritma atau natural atau bentuk lainnya, lalu diuji ulang dengan Levene Test.

Penanganan Terhadap Adanya Heteroskedastisitas

3030

Page 31: PENGUJIAN DATA

Uji Linearitas Data

Linearitas adalah keadaan di mana hubungan antara variabel dependen dengan variabel independen bersifat linear (garis lurus) dalam range variabel tertentu.

Pengujian dilakukan dengan scatter plot (diagram pencar)

3131

Page 32: PENGUJIAN DATA

Contoh : Uji asumsi linearitas variabel usia – income

Buka file homoskedastisitas

1. Menu Graph Legacy Dialogs Scatter/dot2. Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER, kemudian

tekan tombol DEFINE.3. Masukkan variabel usia pada sumbu X dan variabel olahraga

pada sumbu Y.4. Abaikan yang lain lalu klik OK.

Cara membuat garis lurus pada grafik yang ada:1. Letakkan pointer pada grafik dan klik ganda untuk masuk ke

CHART EDITOR2. Klik ikon ADD FIT LINE AT TOTAL, sesaat akan muncul garis

regresi3. Tutup chart editor utk kembali ke output grafik.

Uji Linearitas Data

3232

Page 33: PENGUJIAN DATA

Uji Linearitas Data

Output: Variabel Usia - Olahraga

3333

Page 34: PENGUJIAN DATA

Contoh : Uji asumsi linearitas variabel Olahraga - Berat

Buka file homoskedastisitas

1. Menu Graph Legacy Dialogs Scatter/dot2. Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER, kemudian

tekan tombol DEFINE.3. Masukkan variabel berat pada sumbu X dan variabel olahraga

pada sumbu Y.4. Abaikan yang lain lalu klik OK.

Cara membuat garis lurus pada grafik yang ada:1. Letakkan pointer pada grafik dan klik ganda untuk masuk ke

CHART EDITOR2. Klik ikon ADD FIT LINE AT TOTAL, sesaat akan muncul garis

regresi3. Tutup chart editor utk kembali ke output grafik.

Uji Linearitas Data

3434

Page 35: PENGUJIAN DATA

Uji Linearitas Data

Output: Variabel Berat - Olahraga

3535

Page 36: PENGUJIAN DATA

Uji Linearitas Data

Kesimpulan:

1. Untuk variabel usia – olah raga ada hubungan linear (ada linearitas)

2. Untuk variabel berat – olahraga tidak ada hubungan linear (tidak ada linearitas)

3636