Pemeriksaan Asumsi Sebaran Data

29
Pemeriksaan Asumsi Sebaran Data

description

Pemeriksaan Asumsi Sebaran Data. Do you remember this picture?. PEMERIKSAAN ASUMSI SEBARAN DATA. - PowerPoint PPT Presentation

Transcript of Pemeriksaan Asumsi Sebaran Data

Page 1: Pemeriksaan Asumsi Sebaran  Data

Pemeriksaan Asumsi Sebaran Data

Page 2: Pemeriksaan Asumsi Sebaran  Data

Do you remember this picture?

76543

99

9590

80706050403020

105

1

Y(i)

Perc

ent

Mean 4,924StDev 0,7573N 20AD 0,319P-Value 0,511

Probability Plot of Y(i)Normal

Page 3: Pemeriksaan Asumsi Sebaran  Data

3

PEMERIKSAAN ASUMSI SEBARAN DATA

• Pola sebaran teoritis untuk data (Binom, Normal, Eksponensial, Poisson) memegang peranan penting dalam analisis data terutama menyangkut tahap pendugaan parameter, pengujian hipotesis dan penetapan taraf kepercayaan atau taraf nyata atas kesimpulan yang akan diambil.

• Dari populasi Normal karakteristik utama adalah nilai rata-rata dan ragam.

• Pemilihan jenis penduga mana yang dianggap lebih baik sangat dipengaruhi oleh perilaku data dan kriteria yang dipilih.– Untuk pengujian hipotesis bagi data yang berasal dari pola sebaran

Normal, penduga kuadrat terkecil memiliki keunggulan teoritis dan relatif mudah diterapkan karena teknik analisis telah berkembang lanjut.

Page 4: Pemeriksaan Asumsi Sebaran  Data

4

• Hasil analisis data yang didasarkan pada asumsi sebaran tertentu menjadi tidak sah apabila ternyata asumsi tersebut sampai batas-batas tertentu tidak dapat dipenuhi.

• Memeriksa kebenaran asumsi pola sebaran data Apakah betul-betul mengikuti pola sebaran normal, dapat didekati dengan sebaran normal atau apakah dapat diubah menjadi berpola normal?

• Penyimpangan dari asumsi pola sebaran teoritis tidak selalu mempunyai dampak besar terhadap hasil analisis data, kadang-kadang pengaruhnya kecil saja sehingga dapat diabaikan.

Page 5: Pemeriksaan Asumsi Sebaran  Data

5

PEMERIKSAAN DENGAN DIAGRAM KOTAK GARIS YANG DIPERLUAS

• Pemeriksaan kesesuaian pola sebaran data pada umumnya kita lakukan terhadap data yang telah diurutkan menurut besarnya

• Ringkasan 5 angka dapat diperluas lagi menjadi ringkasan 7 angka (dengan menambahkan dua angka “perdelapan”). Atau menjadi ringkasan 9 angka (dengan menambahkan dua buah angka “perenambelas”)– urutan “perdelapan” = ([urutan Kuartil]+1)/2– urutan “perenambelas” = ([urutan “perdelapan”]+1)/2

Page 6: Pemeriksaan Asumsi Sebaran  Data

6

• RINGKASAN 9-ANGKA

• Contoh Data : (dibangkitkan dari sebaran normal dengan nilai tengah 20 dan ragam 25)

Me

K1D1E1k

K3D7E15

b

Merupakan perluasan dari tabel ringkasan 5 - angka

16.8 25.7 21.4 22.7 28.1 17.5 14.4 20.9

13.1 15.8 21.7 26.2 18.7 20.2 24.6 24.2

14.6 16.9 14.9 26.7 20.2 21.6 15.1 6.9

22.6 12.9 14.1 25.8 17.9 17.7 18.6 20.3

24.4 16.6 20.5 19.7 17.3 18.0 13.7 17.3

Page 7: Pemeriksaan Asumsi Sebaran  Data

7

DAHAN DAUN FK56 9 1789101112 9 213 17 414 1469 815 18 1016 689 1317 33579 1818 067 2119 7 2220 22359 2721 467 3022 67 322324 246 3525 78 3726 27 392728 1 40

RINGKASAN 9-ANGKA YANG DIHASILKAN

18.65

16.2014.2513.106.90

22.1025.1526.2028.10

Dengan menggantikan lambang-lambang angka ringkasan dengan persentase atau fraksi banyaknya data yang lebih kecil daripada lambang-lambang tersebut didapatkan :

0.5000

0.25000.12500.06250.000

0.75000.87500.93751.0000

Page 8: Pemeriksaan Asumsi Sebaran  Data

8

• Sehingga setiap lambang kini akan memiliki sepasang nilai yaitu fraksi dan besarannya disajikan di bawah ini:

• Dengan mengambil nilai fraksi sebagai x dan besarannya sebai y maka kesembilan lambang tersebut dapat digambarkan menjadi 9 buah titik dalam plot x dan y seperti gambar berikut:

k E1 D1 K1 Me K3 D7 E15 b0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x

6.90 13.10 14.25 16.20 18.65 22.10 25.15 26.20 28.10 y

QUANTILE BOX PLOT

KE1 D1 K1

MeK3

D7 E15

b

0

5

10

15

20

25

30

0 0.2 0.4 0.6 0.8 1 1.2

FRAKSI

DATA

Page 9: Pemeriksaan Asumsi Sebaran  Data

9

• “Quantile Box Plot”/plot kotak kuantil merupakan cara sederhana tetapi kasar untuk memeriksa pola sebaran data secara nonparametrik

• Kumpulan data dengan pola simetrik akan memperlihatkan kecenderungan potongan-potongan garis yang membentuk garis lurus

• Adanya potongan garis yang menaik secara tajam di luar kotak E menunjukkan kemungkinan pencilan, sedangkan kenaikan yang tajam di dalam kotak K dapat memberikan petunjuk bahwa data tersebut mungkin berasal dari dua buah populasi yang berbeda.

• Data yang tidak berpola simetrik akan terlihat dari kecenderungan potongan-potongan garis tersebut membentuk kurva melengkung.

Page 10: Pemeriksaan Asumsi Sebaran  Data

10

• SOAL :– DATA A

– DATA B

42.2 4.0 7.4 15.4 0.6 3.6 31.2 67.2 10.6 6.4

7.6 14.6 31.8 10.6 21.4 5.8 4.8 0.6 8.6 4.0

7.0 7.8 8.8 43.0 10.8 10.6 7.0 18.4 7.8 31.8

19.8 1.2 8.8 43.4 14.6 29.8 2.6 3.8 17.8 68.2

0.4 0.1 1.3 2.0 1.5 1.4 2.6 0.1 0.5 2.9

0.8 3.3 2.5 2.5 2.3 0.8 0.9 2.6 2.5 3.1

2.9 0.7 2.6 0.6 2.7 1.5 2.4 2.0 2.8 2.7

2.6 0.2 2.3 2.3 2.2 1.6 2.0 2.2 0.4 0.8

Page 11: Pemeriksaan Asumsi Sebaran  Data

11

DATA A

f DAHAN DAUN

9 0 . 00123344420 * 5677777788820 1 . 00004414 * 578910 2 . 1

9 * 98 3 . 1115 *5 4 . 2332 *2 5 .2 *2 6 .2 * 78

DATA B

f DAHAN DAUN

5 0 . 1124412 0 * 567888914 1 . 3417 1 * 556(9) 2 . 00022333414 2 * 555666677899

2 3 . 13

• A Digit pada daun adalah angka satuan

• B Digit pada daun adalah angka desimal

Page 12: Pemeriksaan Asumsi Sebaran  Data

12

RINGKASAN 9-ANGKA

DATA A

9.50

6.103.701.200.60

20.6037.0043.3068.20

DATA Ak E1 D1 K1 Me K3 D7 E15 b

0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x

0.60 1.20 3.70 6.10 9.50 20.60 37.00 43.30 68.20 y

RINGKASAN 9-ANGKA

DATA B

2.10

0.800.450.200.10

2.602.752.903.30

DATA Bk E1 D1 K1 Me K3 D7 E15 b

0.0000 0.0625 0.1250 0.2500 0.5000 0.7500 0.8750 0.9375 1.0000 x

0.10 0.20 0.45 0.80 2.10 2.60 2.75 2.90 3.30 y

Page 13: Pemeriksaan Asumsi Sebaran  Data

13

QUANTILE BOX PLOT

b

E15D7

K3MeK1D1E1k010

2030

4050

6070

80

0 0.2 0.4 0.6 0.8 1 1.2

FRAKSI

DATA

Plot kotak kuantil untuk masing-masing kumpulan data dapat dilihat pada gambar di samping. Pola sebaran data A yang

miring ke kanan sebenarnya sudah dapat dilihat dari diagram dahan daun tetapi pola yang melengkung ini ikut memperjelas

adanya ketidaksimetrikan

Page 14: Pemeriksaan Asumsi Sebaran  Data

14

QUANTILE BOX PLOT

k E1

D1K1

Me

K3 D7 E15

b

0

0.5

1

1.5

2

2.5

3

3.5

0 0.2 0.4 0.6 0.8 1 1.2

FRAKSI

DATA

Perilaku data B sulit kita deteksi karena berdasarkan gambar di samping orang cenderung menyimpulkan bahwa

data tersebut simetrik tetapi pola dalam dahan daun menunjukkan adanya dua puncak

Page 15: Pemeriksaan Asumsi Sebaran  Data

15

PLOT KUANTIL-KUANTIL• Istilah kuantil = istilah persentil

– Misal : jika ditetapkan nilai kuantil 0.67 untuk suatu kumpulan data, maka hal ini berarti ada 0.67 bagian data yang nilainya lebih kecil dari nilai kuantil dan 0.33 bagian lainnya memiliki nilai yang lebih tinggi. Nilai kuantil ini dilambangkan dengan Q (0.67)

• Penetapan nilai kuantil dapat dilakukan jika data yang kita miliki telah diurutkan dari kecil-besar.

• Untuk suatu kumpulan data yi, i = 1, …, n setelah diurutkan akan menghasilkan kumpulan baru yaitu y(i) dengan penunjuk (i) adalah nomor urut besarnya data tersebut dan setiap y(i) adalah nilai kuantil i/n

• Dalam praktek kita definisikan kuantil sebagai berikut:Q (pi) = y(i) untuk i = 1, …, n

pi = (i-0.5)/n

Page 16: Pemeriksaan Asumsi Sebaran  Data

16

• Alasan pemilihan pi = (i-0.5)/n– Seandainya n = 10 dan digunakan i/n maka Q

(0.25) akan berada di antara urutan ke-2 dan ke-3 yang menyebabkan tidak ada satu nilai pengamatan pun yang dapat membagi data tersebut menjadi dua yaitu 0.25 bagian di bawah dan 0.75 bagian atasnya

– Kalau kita menggunakan (i-0.5)/n maka Q(0.25) = y(3) dianggap setengahnya berada di bagian bawah dan setengahnya lagi di bagian atas sehingga tercapai pembagian 0.25 dan 0.75• ingat bahwa Q (0.25) tidak lain adalah kuartil 1

Page 17: Pemeriksaan Asumsi Sebaran  Data

17

• Plot kuantil adalah plot antara nilai y(i) dengan fraksi pi. Plot ini lebih terperinci dibandingkan dengan plot kotak kuantil karena semua pengamatan ditampilkan dalam plot.

• Tujuan :– Memeriksa kesesuaian pola sebaran data

terhadap pola sebaran teoritik membandingkan antara kuantil yang didasarkan pada data (kuantil empirik) dengan kuantil dari sebaran tertentu (kuantil teoritik) melalui plot kuantil-kuantil atau plot Q-Q.

Page 18: Pemeriksaan Asumsi Sebaran  Data

18

• Pola sebaran teoritik yang banyak melandasi analisis data adalah Sebaran Normal

• Fungsi peluang sebaran normal:2

2( )21( )

2

x

f x e

f

0.2

0.4

0.6

0.8

x-2 -1 4 60 1

-1-

-- 2 --

Bentuk Sebaran Normal dicirikan oleh dua paramater: rata-rata () dan ragam (2)

Page 19: Pemeriksaan Asumsi Sebaran  Data

19

-- --

-3 -2 -1 0 1 2 3

f

x

0.3413

0.1360

0.0213

BENTUK SEBARAN NORMAL BAKU YANG

MEMILIKI = 0 DAN =1

Catatan :• titik -1 dan +1 titik belok• luas daerah antara titik belok = 2 (0.3413) = 0.6826

Page 20: Pemeriksaan Asumsi Sebaran  Data

20

• Fungsi F(z) dikenal sebagai fungsi sebaran Normal Kumulatif. Hubungan dengan Kuantil dapat dilihat di bawah ini :– Q (0.0014) = -3– Q (0.0227) = -2– Q (0.9773) = 2– Q (0.9986) = 3

• Sehingga secara umum dapat dirumuskan bahwa :F {Q (pi) }= pi dan Q (pi) = F-1 (pi)

– di mana F-1 adalah kebalikan fungsi F dan pi = (i-0.5)/n, pi dalam fungsi sebaran kumulatif berarti peluang.

– untuk menghitung luas daerah di bawah kurva normal baku melalui tabel.

Page 21: Pemeriksaan Asumsi Sebaran  Data

21

Prosedur pemeriksaan kenormalan data dengan menggunakan plot Q-Q

• Buat statistik peringkat y(1), …, y(i), …, y(n)

– dengan y(1) statistik peringkat pertama (minimum)y(i) statistik peringkat ke-iy(n) statistik peringkat ke-n (maksimum)

• Untuk setiap y(i) ditetapkan nilai pi = (i-0.5)/n. Plot antara y(i) dengan pi adalah plot kuantil empirik.

• Untuk setiap pi, kita tetapkan F-1(pi) = Q (pi) dengan bantuan tabel sebaran normal baku. Nilai Q (pi) adalah kuantil Normal Baku. Plot antara Q (pi) dan pi adalah plot kuantil teoritik

• Selanjutnya buat plot antara y(i) dengan Q (pi) yang merupakan plot kuantil-kuantil

Page 22: Pemeriksaan Asumsi Sebaran  Data

22

• Contoh data :3.97 4.68 5.08 5.14 4.76 4.12 5.47 5.04 6.02 6.21

4.42 5.44 4.15 5.49 5.67 3.79 5.13 3.80 5.89 4.22

Urutan y(i) pi = (i-0.5)/n Q (pi)1 3.79 0.025 -1.960

2 3.80 0.075 -1.440

3 3.97 0.125 -1.150

4 4.12 0.175 -0.935

5 4.15 0.225 -0.755

6 4.22 0.275 -0.598

7 4.42 0.325 -0.454

8 4.68 0.375 -0.319

9 4.76 0.425 -0.189

10 5.04 0.475 -0.063

11 5.08 0.525 0.063

12 5.13 0.575 0.189

13 5.14 0.625 0.319

14 5.44 0.675 0.454

15 5.47 0.725 0.598

16 5.49 0.775 0.755

17 5.67 0.825 0.935

18 5.89 0.875 1.150

19 6.02 0.925 1.440

20 6.21 0.975 1.960

Page 23: Pemeriksaan Asumsi Sebaran  Data

23

3

3.5

4

4.5

5

5.5

6

6.5

0 5 10 15 20 25

Y (i)

Urutan

PLOT DATA

Pola pencaran titik-titik dalam plot membentuk garis lurus menjadi petunjuk bahwa sebaran data dapat

didekati oleh pola sebaran normal

Page 24: Pemeriksaan Asumsi Sebaran  Data

24

PLOT KUANTIL EMPIRIK

3.5

4.5

5.5

6.5

0 0.2 0.4 0.6 0.8 1 1.2

fraksi, pi

data

, y(i)

Pola pencaran titik-titik dalam plot cenderung tidak membentuk garis lurus karena titik-titik sebelah kiri maupun kanan cenderung menjauh dari pola garis

lurus

Page 25: Pemeriksaan Asumsi Sebaran  Data

25

PLOT KUANTIL TEORITIK

-2.000

-1.000

0.000

1.000

2.000

0 0.2 0.4 0.6 0.8 1 1.2

peluang, pi

Q (p

i)

Pola pencaran titik-titik dalam plot cenderung tidak membentuk garis lurus karena titik-titik sebelah kiri maupun kanan cenderung menjauh dari pola garis

lurus dan membentuk pola sigmoid

Page 26: Pemeriksaan Asumsi Sebaran  Data

26

PLOT KUANTIL- KUANTIL

3.5

4.5

5.5

6.5

-3.000 -2.000 -1.000 0.000 1.000 2.000 3.000

Q (pi) , kuantil normal baku

data

, y(i)

Merupakan plot antara kuantil kuantil empirik dengan teoritik yang merupakan plot antara nilai-nilai pada

sumbu Y kedua kuantil tersebut

Page 27: Pemeriksaan Asumsi Sebaran  Data

27

• Jika sebaran teoritik dapat merupakan pendekatan untuk pola sebaran data yang kita miliki, maka kuantil empirik tersebut akan memiliki kemiripan dengan kuantil yang didasarkan pada sebaran tertentu dan titik-titik dalam plot akan berkisar di seputar garis y = x. Garis ini menjadi patokan dalam memeriksa kesesuaian pola sebaran data apabila data tersebut telah dibakukan sebelumnya.

• Seandainya data belum dibakukan maka garis patokan adalah y = + x atau

y(i) = + Q(pi)

Page 28: Pemeriksaan Asumsi Sebaran  Data

28

• Catatan:– Meskipun sebenarnya sebaran data dapat didekati

oleh pola sebaran teoritik tertentu, namun keragaman yang terkandung dalam data akan menyebabkan adanya penyimpangan dari pola garis lurus.

– Setiap plot kuantil-kuantil hanya memeriksa pola sebaran dari satu peubah saja, sedangkan pola hubungan yang terjadi antara satu peubah dengan peubah lain tidak terdeteksi dalam plot ini.

– Plot Q-Q ini umumnya digunakan dalam memeriksa pola dari sisaan setelah dilakukan analisis data.

Page 29: Pemeriksaan Asumsi Sebaran  Data

29

PLOT KENORMALAN

00.10.20.30.40.50.60.70.80.9

1

3 4 5 6 7

Y (i)

pi