STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z....

24
Hanung N. Prasetyo STATISTICS Hanung N. Prasetyo WEEK 10 TELKOM POLTECH/HANUNG NP

Transcript of STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z....

Page 1: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Hanung N. Prasetyo

STATISTICSHanung N. Prasetyo

WEEK 10

TELKOM POLTECH/HANUNG NP

Page 2: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

A. BEBERAPA CARA UJI NORMALITAS

1. RASIO SKEWNESS DAN RASIO KURTOSISRasio Skewnwss = Nilai Skewnwss / S.E. SkewnessRasio Kurtosis = Nilai Kurtosis / S.E. KurtosisJika Nilai Rasio Diantara - 2 s/d + 2 � Sebarannya Bersifat Normal

2. UJI KOLMOGOROV SMIRNOV = UJI LILLIEFORJika Nilai Prob. / Sig F > 5 % � Sebaran Bersifat NormalJika Nilai Prob. / Sig F < 5 % � Sebaran Bersifat Tidak Normal

3. UJI SHAPIRO WILKJika Nilai Prob. / Sig F > 5 % � Sebaran Bersifat NormalJika Nilai Prob. / Sig F > 5 % � Sebaran Bersifat NormalJika Nilai Prob. / Sig F < 5 % � Sebaran Bersifat Tidak Normal

4. UJI Anderson-Darling5. GAMBAR / PLOT

Histogram dengan Normal CurveQ-Q PlotPembentukan Garis Berdasarkan Nilai Z.

Jika Data Tersebar Di sekeliling Garis � Berdistribusi Normal6. DETRENDED Q-Q PLOT

Pembentukan Garis Untuk Mendeteksi Pola-pola Dari Titik-titik Yang Bukan bagian dari normal.

Jika Data Tersebar Di Sekeliling Garis �Berdistribusi Normal

TELKOM POLTECH/HANUNG NP

Page 3: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Untuk mengetahui apakah sebuah distribusi Normal atau mendekati Normal atau bisa dianggap Normal, bisadilakukan beberapa prosedur:

1. Melakukan metode statistik tertentu, seperti UjiKolmogorv-Smirnov, Uji Shapiro-Wilk dansebagainya.

2. Membuat Grafik dengan prosedur tertentu dan2. Membuat Grafik dengan prosedur tertentu danmengamati pola plot atau grafik tersebut.

Pada kasus berikut dan hanya akan dijelaskan keduametode tersebut.

TELKOM POLTECH/HANUNG NP

Page 4: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

�Uji Normalitas Distribusi

Kolmogorov Smirnov

Metode Kolmogorov-Smirnov, yang merupakan ujikenormalan paling populer, didasarkan pada

nilai D yang didefinisikan sebagai berikut:nilai D yang didefinisikan sebagai berikut:

D = supx[Fn (x) – F0 (x)}

TELKOM POLTECH/HANUNG NP

Page 5: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Pada hakekatnya D adalah nilai deviasi absolut maksimum antara Fn (x) dan F0 (x)

Nilai D ini selanjutnya dibandingkan dengan nilai D kritis untuk ukuran tes α.

Stephens memberikan

nilai kritis tersebut untuk berbagai kondisi pengujian nilai kritis tersebut untuk berbagai kondisi pengujian Untuk α = 1%, nilai D kritis adalah

1.035*(√n – 0.01 + 0.85/√n).

Sedangkan untuk α = 5% dan α = 10%, nilai D kritis berturut-turut sebesar 0.895*(√n – 0.01 + 0.85/√n) dan 0.819*(√n – 0.01 + 0.85/√n).

TELKOM POLTECH/HANUNG NP

Page 6: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

� Terdapat beberapa cara pengujian normalitas distribusiyaitu menggunakan formula/prosedur Kolmogorov-Smirnov, Liliefors, dan Chi Square (X 2 )

� Untuk perhitungan normalitas distribusi, dimisalkanterdapat sekelompok data dengan skala pengukuranterdapat sekelompok data dengan skala pengukuraninterval dengan dua variabel bebas dan satu variabelterikat sebagai berikut :

TELKOM POLTECH/HANUNG NP

Page 7: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

X1 X2 Y

4 1 7

4 2 12

Tabel skor Variabel bebas (X) dan variabel terikat (Y)

9 8 17

12 8 20

12 10 21

TELKOM POLTECH/HANUNG NP

Page 8: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Skor Y f p kp zx zt a1A2

71 0.2 0.2 -1.43 0.08 0.08

0.12

121 0.2 0.4 -0.58 0.28 0.08

0.12

171 0.2 0.6 0.27 0.61 0.21

0.01

Dari tabel tersebut misalkan kita ingin menguji normalitas variabel Y ,

maka untuk memudahkan diperlukan tabel bantu sebagai berikut :

Tabel bantu Perhitungan Normalitas

171 0.2 0.6 0.27 0.61 0.21

0.01

201 0.2 0.8 0.78 0.79 0.19

0.01

211 0.2 1.0 0.96 0.83 0.03

0.17

77 5 1.0 - 0 - --

Mean = 15.4

SD = 5.86

TELKOM POLTECH/HANUNG NP

Page 9: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Langkah-langkah perhitungan :

Setelah data dimasukan dalam kolom pertama dan dihitungfrekuensinya, kemudian dilakukan perhitungan sebagai berikut :

1. Cari prosentasi (p) dengan cara frekuensi (f) dibagi denganjumlah data. Dalam contoh baris pertama di atas adalah 1 : 5 =0.2, demikian seterusnya sampai selesai untuk setiapfrekuensi.

2. Cari Kp (prosesntase kumulatif) dengan cara menjumlahkanprosen tase kumulatif dengan prosentase di bawahnya,khusus untuk baris pertama nilai p langsung dipindahkan,untuk baris ke dua adalah 0,2 + 0.2 = 0.4, baris ke tiga 0.4 + 0.2= 0.6, dan seterusnya.

TELKOM POLTECH/HANUNG NP

Page 10: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

3. Cari nilai Zx dengan cara Skor Y dikurangi dengan Mean/nilai rata-rata dibagi nilai Standar Deviasi, sebagai contoh untuk barispertama adalah (7 – 15.4)/5.86 = - 1.43. untuk baris selanjutnyadihitung dengan cara yang sama.

4. Cari nilai Z tabel (Zt) dengan melihat Tabel Kurva Normal baku(Tabel Z ) berdasarkan nilai Zx –nya, contoh untuk baris pertama.Nilai Z tabel dilihat dalam baris 1,4 dan kolom 3, diperoleh nilai ZNilai Z tabel dilihat dalam baris 1,4 dan kolom 3, diperoleh nilai Zsebesar 0.4236, karena nilai Zx – nya bernilai minus maka nilai Ztabel yang diisikan adalah 0.5 - 0.4236 = 0.0764 (0.08). bila Zx

bernilai positif maka nilai Z tabel yang diisikan adalah ditambah 0.5.

TELKOM POLTECH/HANUNG NP

Page 11: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

5. Nilai a1 diperoleh dengan cara menyelisihkan nilai Kp dengan nilai Zt dibawahnya, sedang untuk baris pertama nilai Zt langsung diisikan, contoh untuk baris kedua nilai 0.08 diperoleh dengan cara 0.2 – 0.28 = -0.08 (yang dipakai nilai mutlaknya).

6. nilai a2 diperoleh dengan menyelisihkan nilai Kp dengan nilai Zt yang sejajar, contoh untuk baris pertama 0.2 – 0.08 = 0.12.

7. setelah selesai cari nilai a maksimum, diperoleh nilai 0.21, kemudianbandingankan dengan nilai tabel pada baris N = 5, pada tingkatsignifikansi 0.05 diperoleh nilai 0.565, karena a maksimum lebih kecildari nilai D maksimum berarti distribusi normal.

TELKOM POLTECH/HANUNG NP

Page 12: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Uji Kenormalan Shapiro-Wilk

� Pengujian Shapiro-Wilk, yang diusulkan 1965, mengkalkulasi suatu W statistik yang menguji apakah suatu sampel acak, x1, x2,..., xn mengikuti distribusi normal atau tidak. Nilai W yang kecil menunjukkan normal atau tidak. Nilai W yang kecil menunjukkan kenormalan dan persentase untuk W statistik, formula ini ditemukanoleh Simulasi Monte Carlo , telah direproduksi oleh Pearson Dan Hartley. Pengujian Shapiro-Wilk lebih baik dibandingkan dengan test yang lain.

TELKOM POLTECH/HANUNG NP

Page 13: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

� W statistik dihitung sebagai berikut:

� di mana x(i) adalah nilai-nilai sampel ( x(1) adalah yang paling kecil) dan ai adalah nilai konstanta tetap yang diturunkan dari nilai rata-rata, perbedaan dan kovarians statistik sampel ukuran n dari suatu

TELKOM POLTECH/HANUNG NP

Page 14: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Algoritma Shapiro Wilk

Procedure

� Order the observations from low to high.

� Compute S² = (n-1)s²

� where s² is the sample variance.

� If n is even, k = n/2. If n is odd, k = (n – 1)/2. Then � If n is even, k = n/2. If n is odd, k = (n – 1)/2. Then

� where a(n+i+1) for i = 1 to k, are found in tables.

� Compute the test statistic. W = b² / S²

� A p-value is generated to evaluate the significance of W.

TELKOM POLTECH/HANUNG NP

Page 15: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

� Dalam ilmu statistika seringkali digunakan asumsi dari bentuk data yang akan di analisis. Aasumsi yang lazim digunakan adalah data berdistribusi normal, dengan mean µ dapat digambarkan sebagai berikut:dengan mean µ dapat digambarkan sebagai berikut:

µ

TELKOM POLTECH/HANUNG NP

Page 16: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Dalam kenyataannya seringkali bentuk data yang diperoleh tidak berbentuk seperti distribusi normal tetapi berbentuk menjulur ke kanan atau menjulur kekiri, seperti gambar berikut:

Curve B :

Skewed Left

Curve A :

Skewed Right

TELKOM POLTECH/HANUNG NP

Page 17: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Transformasi Data� Diperbolehkan untuk koreksi dari ketidak-

normalan yang disebabkan oleh skewness, kurtosis, atau problem lainnya (kurang linearitas)

� Tidak harus dilakukan jika nilai mengandung � Tidak harus dilakukan jika nilai mengandung meaningful scale

� Jenis transformasi :� Square root – moderate violations� LOG – severe, dan � inverse for severe violation

TELKOM POLTECH/HANUNG NP

Page 18: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Agar asumsi bahwa data berdistribusi normal tetapdipenuhi maka perlu dilakukan suatu transformasiterhadap data asli. Transformasi dilakukan untuk satuangkatan data bila data yang akan ditransformasi hanyasatu angkatan data. Untuk memilih fungsi transformasiyang tepat dapat digunakan tangga transformasi Tukeyyang digambarkan sebagai berikut:

xxxxxxLogxx

1011 32

2−−

kekananmenjulurkirikemenjulur

KuatsedanglemahlemahsedangKuat

TELKOM POLTECH/HANUNG NP

Page 19: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Tangga transformasi dapat dijelaskan sebagai berikut:

Transformasi 10x akan membuat bentuk distribusi data menjadi menjulur kekanan secara kuat, sedangkan transformasi akan membuat bentuk distribusi data menjadi menjulur kekiri secara kuat.

Sebagai contoh jika kita memiliki data yang menjulur

2

1

x−

Sebagai contoh jika kita memiliki data yang menjulur kekanan secara lemah maka kita dapat tranformasi

agar data menjadi normal x

TELKOM POLTECH/HANUNG NP

Page 20: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Transformasi� Untuk data yang skewnessnya positif (pelajari apakah

artinya condong ke kiri atau ke kanan) square root dan log akan membuat data tetap pada susunan aslinya tetapi membawanya dalam sebaran, akan tetapi inverse akan membalik susunan datamembalik susunan data

� Untuk data yang skewnessnya negatif (pelajari apakah artinya condong ke kiri atau ke kanan) berlaku kebalikannya; tanpa penyesuaian, square root dan log akan membalik susunan sedangkan inverse membuatnya tetap pada susunan aslinya

TELKOM POLTECH/HANUNG NP

Page 21: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Original Data

60

80

100

1201

4

9

0

20

40

60

1 2 3 4 5 6

10

36

100

TELKOM POLTECH/HANUNG NP

Page 22: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Square Root Transform

8

10

12

1

2

3

0

2

4

6

1 2 3 4 5 6

3

3.16227

8

6

10

TELKOM POLTECH/HANUNG NP

Page 23: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Log Transform

1.5

2

2.5

0

0.60206

0.954243

0

0.5

1

1.5

1 2 3 4 5 6

0.954243

1

1.556303

2

TELKOM POLTECH/HANUNG NP

Page 24: STATISTIKA THEORY WEEK 11 Uji Kenormalan & · PDF filePembentukan Garis Berdasarkan Nilai Z. ... Transformasi 10 xakan membuat bentuk distribusi data ... kekanan secara lemah maka

Inverse Transform

0.8

1

1.2

1

0.25

0.111111

0

0.2

0.4

0.6

1 2 3 4 5 6

0.111111

0.1

0.027778

0.01

TELKOM POLTECH/HANUNG NP