PENGUJIAN DATA
description
Transcript of PENGUJIAN DATA
LOGO
PENGUJIAN DATA
11
Uji Data
Uji missing data – Untuk melihat apakah data yang tidak lengkap/hilang
akan memengaruhi pengolahan data secara keseluruhan
Uji data outlier– Untuk mengetahui sejauh mana data outlier akan
mengganggu keseluruhan data, yang dapat mengakibatkan kesalahan dalam menarik kesimpulan
Uji asumsi klasik- Untuk mengetahui apakah data memenuhi beberapa
asumsi pokok seperti: normalitas data, linearitas data, homoskedastisitas data, dsb.
22
Analisis Missing Data
Missing data: Sel-sel kosong pada variabel Disebabkan karena informasi/data tidak diberikan, sulit
diperoleh, atau lupa ditanyakan
Contoh:
• Data umur
• Data gaji/penghasilan
Dampaknya? Jika sedikit (sekitar 1%) dihapus tidak masalah Jika banyak perlu pengujian apakah layak diproses
lebih lanjut atau tidak
33
Analisis Missing Data
Uji Keacakan : Untuk mengetahui apakah data yang hilang
bersifat random atau tidak Random tidak ada pola tertentu
Contoh: Kasus 1 lihat buku Singgih Santoso hal.16.
44
Kasus 1: Uji Keacakan DataLangkah-langkah:1. Buka file : missing value.sav
2. Analyze
3. Missing value analysis
4. Masukkan variabel: usia, berat, tinggi dll. ke bagian QUANTITATIVE VARIABLE.
5. Masukkan variabel minum ke bagian CATEGORICAL VARIABLE.
6. Masukkan variabel nama ke bagian CASE LABELS.
7. Pada bagian ESTIMATION (kanan tengah), klik kotak listwise, pairwise, dan EM
8. Klik ikon PATTERN . Pada bagian DISPLAY klik Tabulated cases.... dan Cases with missing values.....
9. Klik CONTINUE.
10. Klik DESCRIPTIVES
11. Pada bagian INDICATOR VARIABLE STATISTICS, klik Percent missmatch dan klik juga Crosstabulation of ....
12. Klik OK.
Analisis Missing Data
55
Analisis Missing Data
Bagaimana mengatasi missing data? Membuang data (kasus) Mengisi sel (data) yang hilang dengan data
tertentu rata-rata keseluruhan
Lihat contoh Kasus 2.
66
Kasus 2: Perlakuan terhadap Missing Data
Langkah-langkah:1. Buka file : missing value.sav
2. Pilih menu: Transform Replace Missing Value
3. Masukkan variabel: usia, berat, tinggi, income, jam kerja dan olah raga ke bagian NEW VARIABLE.
4. Bagian NAME AND METHOD
Bagian NAME otomatis menampilkan variabel baru USIA_1, dll.
Bagian METHOD pilih Series Mean
Abaikan bagian yang lain.
5. Klik OK.
Analisis Missing Data
77
Outlier : • Data yang secara nyata berbeda dengan data-data
yang lain
Mengapa terjadi outlier? Kesalahan dalam pemasukan data Kesalahan pengambilan sampel Memang ada data ekstrim
Uji Data Outlier
88
Deteksi Data Outlier
Deteksi dapat dilakukan dengan 3 cara:
1. Membuat nilai z (standardisasi data)
2. Membuat grafik/diagram Scatter Plot
3. Penyajian Box Plot
99
1. Standardisasi Data
Langkah-langkah:1. Buka file outlier.2. Menu Analyse Descriptive Statistics
Descriptive3. Masukkan variabel usia, berat, tinggi, income, jam
kerja dan olah raga ke bagian VARIABLE(S).4. Aktifkan (klik) Save standardized values at
variables.5. Abaikan yang lain lalu klik OK.
Output dapat dilihat pada outlier uji z.sav
Deteksi Data Outlier
1010
Deteksi Data Outlier
Rumus standardisasi: _
z = x - X Std. Deviasi
Jika nilai z < - 2,5 atau z > + 2,5 maka data tersebut dikategorikan sebagai data outlier.
Lihat tabel output berikut.
x = nilai dataX = nilai rata-rataZ = Nilai standar
1111
Deteksi Data Outlier
1212
Deteksi Data Outlier
1313
2. Scatter Plot
Langkah-langkah:1. Buka file outlier.2. Menu Graph Legacy Dialogs Scatter/Dot3. Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER
dan tekan tombol DEFINE.4. Masukkan variabel income pada sumbu X dan
variabel usia pada sumbu Y.5. Abaikan bagian yang lain, lalu klik OK
Output dapat dilihat pada outlier scatter plot.sav
Deteksi Data Outlier
1414
Deteksi Data Outlier
Scatter Plot Outlier
Outlier
1515
3. Box Plot
Langkah-langkah:1. Buka file outlier.2. Menu Analyse Descriptive Statistics Explore ...3. Masukkan variabel usia dan berat pada kotak
DEPENDENT LIST.4. Pada bagian DISPLAY (kiri bawah), klik Plots5. Buka kotak PLOTS, lalu nonaktifkan steam and leaf
pada bagian DESCRIPTIVES.6. Klik Continue.7. Abaikan yang lain lalu klik OK.
Output disimpan pada file outlier box plot
Deteksi Data Outlier
1616
Deteksi Data Outlier
Output:
Outlier Max
Min
Median
Ekstrim
1717
Ketentuan Box Plot:
Outlier Jika data terletak 1,5 kali panjang box plot,
yang dimulai dari batas atas atau batas bawah
Ekstrim Jika data terletak melebihi 3 kali panjang box plot, yang dimulai dari batas atas atau batas bawah
Deteksi Data Outlier
1818
Penanganan Outlier
Ada dua cara penanganan outlier:1. Dihilangkan/dibuang, jika dianggap
mencerminkan data yang sesungguhnya atau karena kesalahan pengambilan data, kesalahan inputing dsb.
2. Dipertahankan, jika data tersebut memang ada atau tidak ada indikasi kesalahan.
Pilihan no.1 atau no.2 tergantung pengguna.
1919
Uji Normalitas Data
Tujuan: Untuk mengetahui apakah data terdistribusi
secara normal bentuk lonceng (bell shape)
Data yang baik distribusi normal
2020
Contoh :1. Buka file outlier2. Menu Analyze Descriptive Statistics Explore...3. Masukkan variabel usia dan berat pada kotak DEPENDENT LIST4. Pada bagian DISPLAY, klik kotak Plots5. Buka kotak PLOTS6. Aktifkan kotak Normality Plots with tests7. NON AKTIFKAN pilihan steam and leaf pada bagian
DESCRIPTIVES8. Pilih None pada bagian BOXPLOT9. Tekan CONTINUE10.Abaikan yang lain lalu klik OK.
Uji Normalitas Data
2121
Uji Normalitas Data
OutputNormalitas Data
Kriteria uji lihat Kolmogorov-Smirnov dan Shapiro-Wilk
• Jika Sig. > 0.05 data terdistribusi normal
• Jika Sig. < 0.05 data tidak terdistribusi normal
2222
Uji Normalitas Data
Diagram Plot : Contoh Data yang terdistribusi normal
Data bergerombol disekitar garis uji Data menyebar secara acak, tidak membentuk pola tertentu
2323
Uji Normalitas Data
Diagram Plot : Contoh Data yang terdistribusi tidak normal
Data bergerombol disekitar garis uji,namun ada data yg terletak jauh dari sebaran data
Data membentuk pola tertentu, ke kanan bawah kemudian naik ke atas
2424
Ada 4 perlakuan:
1.Menambah jumlah data
2.Menghilangkan data penyebab tidak normal
3.Dilakukan transformasi data, misal mengubah data ke bentuk logaritma atau natural atau bentuk lainnya, lalu diuji ulang
4.Terima apa adanya. Pilih alat analisis yang tepat, misalnya gunakan uji nonparametrik
Penanganan Data Tidak Normal
2525
Tujuan: Untuk mengetahui apakah sebuah kelompok
data mempunyai varians yang sama (seperti yang seharusnya terjadi).
Jika varians-nya sama homoskedastisitas
Jika varians-nya tdk sama heteroskedastisitas
Alat uji: Levene Test Analisis Residual grafik
Uji Homoskedastisitas Data
2626
Uji Homoskedastisitas Data
Contoh :1. Buka file homoskedastisitas2. Menu Analyze Descriptive Statistics Explore...3. Masukkan variabel tinggi dan jam kerja pada kotak
DEPENDENT LIST4. Masukkan variabel minum pada kotak FACTOR LIST5. Pada bagian DISPLAY, tetap pada pilihan both6. Buka kotak PLOTS7. Pilih none pada bagian BOXPLOTS8. NON AKTIFKAN pilihan steam and leaf pada bagian
DESCRIPTIVES9. Pada bagian SPRED VS LEVEL WITH LEVENE TEST, pilih power
estimation.10.Tekan CONTINUE, abaikan yang lain lalu klik OK.
2727
Test of Homogeneity of Variance
Levene
Statistic df1 df2 Sig.
tinggi Based on Mean 4,244 1 73 ,043
Based on Median 3,789 1 73 ,055
Based on Median and
with adjusted df
3,789 1 71,641 ,056
Based on trimmed mean 4,143 1 73 ,045
jamkerja Based on Mean 2,822 1 73 ,097
Based on Median 2,062 1 73 ,155
Based on Median and
with adjusted df
2,062 1 68,546 ,156
Based on trimmed mean 2,775 1 73 ,100
Output
Hipotesis:H0 : kedua varians populasi samaH1 : Kedua varians populasi berbeda/tidak identik
Jika:•Sig. > 0.05 H0 diterima , artinya varians-nya sama•Sig. < 0.05 H0 ditolak, artinya varians-nya berbeda
Uji Homoskedastisitas Data
2828
Kesimpulan:
Varians data tinggi konsumen yg minum sedikit air mineral berbeda secara nyata dengan varians data tinggi konsumen dengan banyak minum air mineral.Heteroskedastisitas
Varians data jam kerja konsumen yang minum sedikit air sama dengan varians data konsumen dengan banyak minum air mineral homoskedastisitas
Uji Homoskedastisitas Data
2929
Dilakukan transformasi data, misal mengubah data ke bentuk logaritma atau natural atau bentuk lainnya, lalu diuji ulang dengan Levene Test.
Penanganan Terhadap Adanya Heteroskedastisitas
3030
Uji Linearitas Data
Linearitas adalah keadaan di mana hubungan antara variabel dependen dengan variabel independen bersifat linear (garis lurus) dalam range variabel tertentu.
Pengujian dilakukan dengan scatter plot (diagram pencar)
3131
Contoh : Uji asumsi linearitas variabel usia – income
Buka file homoskedastisitas
1. Menu Graph Legacy Dialogs Scatter/dot2. Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER, kemudian
tekan tombol DEFINE.3. Masukkan variabel usia pada sumbu X dan variabel olahraga
pada sumbu Y.4. Abaikan yang lain lalu klik OK.
Cara membuat garis lurus pada grafik yang ada:1. Letakkan pointer pada grafik dan klik ganda untuk masuk ke
CHART EDITOR2. Klik ikon ADD FIT LINE AT TOTAL, sesaat akan muncul garis
regresi3. Tutup chart editor utk kembali ke output grafik.
Uji Linearitas Data
3232
Uji Linearitas Data
Output: Variabel Usia - Olahraga
3333
Contoh : Uji asumsi linearitas variabel Olahraga - Berat
Buka file homoskedastisitas
1. Menu Graph Legacy Dialogs Scatter/dot2. Pada kotak SCATTER/DOT, pilih SIMPLE SCATTER, kemudian
tekan tombol DEFINE.3. Masukkan variabel berat pada sumbu X dan variabel olahraga
pada sumbu Y.4. Abaikan yang lain lalu klik OK.
Cara membuat garis lurus pada grafik yang ada:1. Letakkan pointer pada grafik dan klik ganda untuk masuk ke
CHART EDITOR2. Klik ikon ADD FIT LINE AT TOTAL, sesaat akan muncul garis
regresi3. Tutup chart editor utk kembali ke output grafik.
Uji Linearitas Data
3434
Uji Linearitas Data
Output: Variabel Berat - Olahraga
3535
Uji Linearitas Data
Kesimpulan:
1. Untuk variabel usia – olah raga ada hubungan linear (ada linearitas)
2. Untuk variabel berat – olahraga tidak ada hubungan linear (tidak ada linearitas)
3636