UJI NORMALITAS
Disusun untuk memenuhi Tugas Mata Kuliah Statistika Penelitian Pendidikan Matematika
Dosen Pengampu : Dra. Endang Retno W., M.Pd
Disusun oleh:
Jayanti Putri P. 4101408060
Atik Suryani 4101408080
Tri Diana Wijayanti 4101408145
Ike Dwi Utami 4101408149
Istianingsih 4101408169
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI SEMARANG
2011
UJI NORMALITAS
Data klasifikasi kontinue, data kuantitatif yang termasuk dalam pengukuran data skala
interval atau ratio, untuk dapat dilakukan uji statistik parametrik dipersyaratkan berdistribusi
normal. Pembuktian data berdistribusi normal tersebut perlu dilakukan uji normalitas terhadap
data. Uji normalitas berguna untuk membuktikan data dari sampel yang dimiliki berasal dari
populasi berdistribusi normal atau data populasi yang dimiliki berdistribusi normal. Banyak cara
yang dapat dilakukan untuk membuktikan suatu data berdistribusi normal atau tidak.
Metode klasik dalam pengujian normalitas suatu data tidak begitu rumit. Berdasarkan
pengalaman empiris beberapa pakar statistik, data yang banyaknya lebih dari 30 angka (n > 30),
maka sudah dapat diasumsikan berdistribusi normal. Biasa dikatakan sebagai sampel besar.
Namun untuk memberikan kepastian, data yang dimiliki berdistribusi normal atau tidak,
sebaiknya digunakan uji statistik normalitas. Karena belum tentu data yang lebih dari 30 bisa
dipastikan berdistribusi normal, demikian sebaliknya data yang banyaknya kurang dari 30 belum
tentu tidak berdistribusi normal, untuk itu perlu suatu pembuktian. Pembuktian normalitas dapat
dilakukan dengan manual, yaitu dengan menggunakan kertas peluang normal, atau dengan
menggunakan uji statistik normalitas.
Banyak jenis uji statistik normalitas yang dapat digunakan diantaranya Kolmogorov
Smirnov, Lilliefors, Chi-Square, Shapiro Wilk atau menggunakan soft ware computer. Soft ware
computer dapat digunakan misalnya SPSS, Minitab, Simstat, Microstat, dsb. Pada hakekatnya
soft ware tersebut merupakan hitungan uji statistik Kolmogorov Smirnov, Lilliefors, Chi-
Square, Shapiro Wilk, dsb yang telah diprogram dalam soft ware komputer. Masing- masing
hitungan uji statistik normalitas memiliki kelemahan dan kelebihannya, pengguna dapat memilih
sesuai dengan keuntungannya.
Di bawah disajikan beberapa cara untuk menguji suatu data berdistribusi normal atau
tidak.
1. METODE LILIEFORS
Metode Lilliefors menggunakan data dasar yang belum diolah dalam tabel distribusi
frekuensi. Data ditransformasikan dalam nilai Z untuk dapat dihitung luasan kurva normal
sebagai probabilitas komulatif normal. Probabilitas tersebut dicari bedanya dengan probabilitas
komultaif empiris. Beda terbesar dibanding dengan tabel Lilliefors pada Tabel Nilai Quantil
Statistik Lilliefors Distribusi Normal.
Rumus :
Keterangan :
Xi = Angka pada data
Z = Transformasi dari angka ke notasi pada distribusi normal
F(x)= Probabilitas komulatif normal
S(x)= Probabilitas komulatif empiris
F(x) = komulatif proporsi luasan kurva normal berdasarkan notasi Zi, dihitung dari luasan kurva
normal mulai dari ujung kiri kurva sampai dengan titik Zi.
Persyaratan :
a. Data berskala interval atau ratio (kuantitatif)
b. Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi
c. Dapat untuk n besar maupun n kecil.
Signifikansi :
Signifikansi uji, nilai | F (x) – S (x) | terbesar dibandingkan dengan nilai tabel Lilliefors. Jika
nilai | F (x) – S (x) | terbesar kurang dari nilai tabel Lilliefors, maka Ho diterima ; Ha ditolak.
Jika nilai | F (x) – S (x) | terbesar lebih besar dari nilai tabel Lilliefors, maka Ho ditolak ; H 1
diterima.
Tabel nilai Quantil Statistik Lilliefors.
Tabel Harga Quartil Statistik Lilliefors Distribusi Normal
Ukuran sampelN
P = 0,80α = 0,20
P = 0,85α = 0,15
P = 0,90α = 0,10
P = 0,95α = 0,05
P = 0,99α = 0,01
45678910111213141516171819202530
n > 30
0,3000,2850,2650,2470,2330,2230,2150,2060,1990,1900,1830,1770,1730,1690,1660,1630,1600,1420,131
0,3190,2990,2770,2580,2440,2330,2240,2170,2120,2020,1940,1870,1820,1770,1730,1690,1660,1470,136
0,3520,3150,2940,2760,2610,2490,2390,2300,2230,2140,2070,2010,1950,1890,1840,1790,1740,1580,144
0,3810,3370,3190,3000,2850,2710,2580,2490,2420,2340,2270,2200,2130,2060,2000,1950,1900,1730,161
0,4170,4050,3640,3480,3310,3110,2940,2840,2750,2680,2610,2570,2500,2450,2390,2350,2310,2000,187
0,736
√n0,768
√n0,805
√n0,886
√n1,031
√n
Penerapan :
Berdasarkan penelitian tentang intensitas penerangan alami yang dilakukan terhadap 18 sampel
rumah sederhana, rata-rata pencahayaan alami di beberapa ruangan dalam rumah pada sore hari
sebagai berikut ; 46, 57, 52, 63, 70, 48, 52, 52, 54, 46, 65, 45, 68, 71, 69, 61, 65, 68 lux.
Selidikilah dengan α = 5%, apakah data tersebut di atas diambil dari populasi yang berdistribusi
normal ?
Penyelesaian :
a. Hipotesis
Ho : tidak beda dengan populasi normal
Ha : Ada beda populasi normal
b. Nilaiα
Nilaiα = level signifikansi = 5% = 0,05
c. Rumus Statistik penguji
d. Hitung rumus statistik penguji
NO XiSD
XXZ i
F(x) S(x)
1 45 -1,4577 0,0721 0,0556 0,0556
2 46
3 46 -1,3492 0,0885 0,1667 0,0782
|F ( x )−S( x )|
4 48
5 52
6 52
7 52 -0,6985 0,2420 0,3889 0,1469
8 54 -0,4816 0,3156 0,4444 0,1288
9 57 0,1562 0,4364 0,5000 0,0636
10 61 0,2777 0,6103 0,5556 0,0547
11 63 0,4946 0,6879 0,6111 0,0768
12 65
13 65 0,7115 0,7611 0,7222 0,0389
14 68
15 68 1,0369 0,8508 0,8333 0,0175
16 69 1,1453 0,8749 0,8889 0,0140
17 70 1,2538 0,8944 0,9444 0,0500
18 71 1,3623 0,9131 1,0000 0,0869
X 58,44
SD 9,22
Nilai tertinggi sebagai angka penguji normalitas, yaitu 0,1469
e. Df/db/dk
Df =φ = tidak diperlukan
f. Nilai tabel
Nilai Kuantil Penguji Lilliefors,α = 0,05 ; N = 18 ;≈ 0,2000. Pada Tabel Lilliefors.
g. Daerah penolakan
Menggunakan rumus
|0,1469|<|0,2000|; berarti Ho diterima, Ha ditolak
h. Kesimpulan
Sampel diambil dari populasi normal, padaα = 0,05
|F ( x )−S( x )|
2. METODE KOLMOGOROV-SMIRNOV
Metode Kolmogorov-Smirnov tidak jauh beda dengan metode Lilliefors.
Langkah-langkah penyelesaian dan penggunaan rumus sama, namun pada signifikansi yang
berbeda. Signifikansi metode Kolmogorov-Smirnov menggunakan tabel pembanding
Kolmogorov-Smirnov, sedangkan metode Lilliefors menggunakan tabel pembanding metode
Lilliefors.
Rumus :
Keterangan :
Xi = Angka pada data
Z = Transformasi dari angka ke notasi pada distribusi normal
FT = Probabilitas komulatif normal
FS = Probabilitas komulatif empiris
FT = komulatif proporsi luasan kurva normal berdasarkan notasi Zi, dihitung dari luasan kurva
mulai dari ujung kiri kurva sampai dengan titik Z.
Persyaratan :
a. Data berskala interval atau ratio (kuantitatif)
b. Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi
c. Dapat untuk n besar maupun n kecil.
Siginifikansi :
Signifikansi uji, nilai | FT – FS | terbesar dibandingkan dengan nilai tabel Kolmogorov Smirnov.
Jika nilai | FT – FS | terbesar kurang dari nilai tabel Kolmogorov Smirnov, maka Ho diterima ;
H1 ditolak. Jika nilai | FT – FS | terbesar lebih besar dari nilai tabel Kolmogorov Smirnov, maka
Ho ditolak ; H1 diterima.
Tabel Nilai Quantil Statistik Kolmogorov Distribusi Normal.
Harga Quantil Statistik Kolmogorov Distribusi Normal
N Tingkat Signifikasi untuk tes satu sisi0,100 0,075 0,050 0,025 0,01 0,005
Tingkat Signifikansi untuk tes dua sisi0,200 0,150 0,100 0,050 0,020 0,010
123456789101112131415161718
0,9000,6840,5650,4940,4460,4100,3810,3580,3390,3220,3070,2950,2840,2740,2660,2580,2500,244
0,9250,7260,5970,5250,4740,4360,4050,3810,3600,3420,3260,3130,3020,2920,2830,2740,2660,259
0,9500,7760,6420,5640,5100,4700,4380,4110,3880,3680,3520,3380,3250,3140,3040,2950,2860,278
0,9750,8420,7080,6240,5650,5210,4860,4570,4320,4100,3910,3750,3610,3490,3380,3280,3180,309
0,9900,9000,7850,6890,6270,5770,5380,5070,4800,4570,4370,4190,4040,3900,3770,3660,3550,346
0,9950,9290,8280,7330,6690,6180,5770,5430,5140,4900,4680,4500,4330,4180,4040,3920,3810,371
1920212223242526272829303132333435363738394025303540
>40
0,2370,2310,2260,2210,2160,2120,2080,2040,2000,1970,1930,1900,1870,1840,1820,1790,1710,1740,1720,1700,1680,1650,2080,1900,1770,1651,07
√N
0,2520,246
0,22
0,20
0,19
1,14
√N
0,2720,2640,2590,2530,2470,2420,2380,2330,2290,2250,2210,2180,2140,2110,2080,2050,2020,1990,1960,1940,1910,1890,2380,2180,2020,1891,22
√N
0,3010,2940,2870,2810,2750,2690,2640,2590,2540,2500,2460,2420,2380,2340,2310,2270,2240,2210,2180,2150,2130,2100,2640,2420,2240,2101,36
√N
0,3370,3290,3210,3140,3070,3010,2950,2900,2840,2790,2750,2700,2660,2620,2580,2540,2510,2470,2440,2410,2380,2350,2950,2700,2510,2351,36
√N
0,3630,3560,3440,3370,3300,3230,3170,3110,3050,3000,2950,2900,2850,2810,2770,2130,2690,2650,2620,2580,2550,2520,3170,2900,2690,2521,63
√N
Penerapan :
Suatu penelitian tentang berat badan peserta pelatihan kebugaran fisik/jasmani dengan sampel
sebanyak 27 orang diambil secara random, didapatkan data sebagai berikut ; 78, 78, 95, 90, 78,
80, 82, 77, 72, 84, 68, 67, 87, 78, 77, 88, 97, 89, 97, 98, 70, 72, 70, 69, 67, 90, 97 kg. Selidikilah
denganα = 5%, apakah data tersebut di atas diambil dari populasi yang berdistribusi normal ?
Penyelesaian :
a. Hipotesis
Ho : tidak beda dengan populasi normal
Ha : Ada beda populasi norma
b. Nilaiα
Nilaiα = level signifikansi = 5% = 0,05
c. Rumus Statistik penguji
d. Hitung rumus statistik penguji
NO XiSD
XXZ i
FT FS |FT−FS|
1 67
2 67 -1,3902 0,0823 0,0741 0,0082
3 68 -1,2929 0,0985 0,1111 0,0126
4 69 -1,1957 0,1151 0,1481 0,0330
5 70
6 70 -1,0985 0,1357 0,2222 0,0865
7 72
8 72 -0,9040 0,1841 0,2963 0,1122
9 77
10 77 -0,4178 0,3372 0,3704 0,0332
11 78
12 78
13 78
14 78 -0,3205 0,3745 0,5185 0,1440
15 80 -0,1261 0,4483 0,5556 0,1073
16 82 0,0684 0,5279 0,5926 0,0647
17 84 0,2629 0,6026 0,6296 0,0270
18 87 0,5546 0,7088 0,6667 0,0421
19 88 0,6519 0,7422 0,7037 0,0385
20 89 0,7491 0,7734 0,7407 0,0327
21 90
22 90 0,8464 0,8023 0,8148 0,012
23 95 1,3326 0,9082 0,8519 0,0563
24 97
25 97
26 97 1,5270 0,9370 0,9630 -0,0260
27 98 1,6243 0,9474 1,0000 -0,0526
X 81,2963
SD 10,28372
Nilai |FT−FS| tertinggi sebagai angka penguji normalitas, yaitu 0,1440
e. Df/db/dk
Df =φ = tidak diperlukan
f. Nilai tabel Nilai Kuantil Penguji Kolmogorov,α = 0,05 ; N = 27 ;≈ 0,254. Pada tabel Kolmogorov Smirnov.
g. Daerah penolakan Menggunakan rumus
|0,1440|<|0,2540|; berarti Ho diterima, Ha ditolak.h. Kesimpulan
Sampel diambil dari populasi normal, padaα = 0,05.
3. METODE CHI KUADRAT
Sekarang marilah kita tinjau mengenai uji normalitas. Persamaan distribusi
normal dengan rata-rata μdan simpangan baku σ dengan persamaan
f ( x )= 1σ √2π
e−1/2(x−μ)2
σ
dengan: π = nilai konstan yang bila ditulis hingga 4 desimal π = 3,1416
e = bilangan konstan, bila ditulis hingga 4 desimal e = 2,7183
μ = parameter, ternyata merupakan rata-rata untuk distribusi
σ = parameter, merupakan simpangan baku untuk distribusi
dan nilai x mempunyai batas -∞ < x < ∞, maka dikatakan bahwa variable acak X
berdistribusi normal. Jika sebuah sampel acak berukuran n telah diambil dengan rata-rata
μdan simpangan baku s, maka kurva normal yang cocok atau sesuai dengan data tersebut
(untuk keprluan ini data harus disusun dalam daftar distribusi frekuensi yang terdiri atas k
buah kelas interval) ialah :
y=n
s√2πe−1 /2 ( x−x
s )2
Untuk keperluan pengujian, kita harus menghitung frekuensi teoritik E1 dan mengetahui
frekuensi nyata atau hasil pengamatan O1. Frekuensi O1 jelas didapat dari sampel,
masing-masing menyatakan frekuensi dalam tiap kelas interval. Harga E1, frekuensi
teoritik didapat dari hasil kali antara n dengan peluang atau luas dibawah kurva normal
untuk interval yang bersangkutan. Selanjutnya statistik chi kuadrat dihitung dengan
rumus: x2=∑
i=1
k ( f o−f h )2
f h
dan untuk menentukan kriteria pengujian digunakan distribusi chi kuadrat dengan dk =
(k-3) dan taraf α .
Pengujian normalitas data dengan chi kuadrat dilakukan dengan membandingkan
dengan kurva normal yang terbentuk dari data yang telah terkumpul (B) dengan kurva
normal baku atau standar (A). Bila B tidak berbeda signifikan dengan A maka B
merupakan data yang berdistribusi normal. Langkah-langkah uji normalitas dengan
menggunakan chi kuadrat:
a).Menentukan jumlah kelas interval, ditetapkan menjadi 6 kelas sesuai dengan 6 bidang
yang ada pada kurva normal. Seperti gambar di bawah, bahwa kurve normal baku yang
luasnya hamper 100% dibagi menjadi 6 bidang berdasarkan simpangan bakunya, yaitu
tiga bidang di bawah rata-rata dan tiga bidang di atas rata-rata.
b). Menentukan panjang kelas interval
panjang kelas=dataterbesar−dataterkecil
6( jumlahkelas interval)
c). Menyusun ke dalam tabel distribusi frekuensi
d). Menghitung frekuensi yang diharapkan (fh)
fh= Prosentase luas bidang kurva normal x jumlah data observasi (jumlah individu dalam
sampel)
e).Memasukkan harga-harga fh ke dalam table kolom fh, sekaligus menghitung
harga (f0- fh)2 dan ( f ¿¿0−f h)
2
f h¿ = x2
f). Membandingkan harga chi kuadrat hitung dengan chi kuadrat tabel
xhit2 < x tabel
2 ⇒ databerdistribusinormal
RUMUS CHI-SQUARE
x2=∑i=1
k ( f o−f h )2
f h
Di mana:
χ2 : chi-kuadrat
f o : Frekuensi yang diobservasi
f h : Frekuensi yang diharapkan
Signifikansi
Signifikansi uji, nilai x2
hitung dibandingkan dengan x2
tabel (Chi-Square). Jika nilai x2
hitung kurang dari nilai x2
tabel, maka Ho diterima ; Haditolak. Jika nilai x2
hitung lebih
besar dari nilai x2
tabel, maka Ho ditolak ; Ha diterima.
TABEL CHI KUADRAT
Dk Taraf signifikansi50% 30% 20% 10% 5% 1%
12345
678910
1112131415
1617181920
212223
0,4551,3862,3663,3574,351
5,3486,3467,3448,3439,342
10,34111,34012,34013,33914,339
15,33816,33817,33818,33819,338
20,33721,33722,337
1,0742,4083,6654,8786,064
7,2318,3839,52410,65611,781
12,89914,01115,11916,22217,322
18,41819,51120,60121,68922,775
23,85824,93926,018
1,6423,2194,6425,9897,289
8,5589,80311,03012,24213,442
14,63115,81216,98518,15119,311
20,46521,61522,76023,90025,038
26,17127,30128,429
2,7064,6056,2517,7799,236
10,64512,01713,36214,68415,987
17,27518,54919,81221,06422,307
23,54224,76925,98927,20428,412
29,61530,81332,007
3,8415,9917,8159,48811,070
12,59214,06715,50716,91918,307
19,67521,02622,36223,68524,996
26,29627,58728,86930,14431,410
32,67133,92435,172
6,6359,21011,34113,27715,086
16,81218,47520,09021,66623,209
24,72526,21727,68829,14230,578
32,00033,40934,80536,19137,566
38,93240,28941,638
2425
2627282930
23,33724,337
25,33626,33627,33628,33629,336
27,09628,172
29,24630,31931,39132,46133,530
29,55330,675
31,79532,91234,02735,13936,250
33,19634,382
35,56336,74137,91639,08740,256
35,41537,652
38,88540,11341,33742,55743,773
42,98044,314
45,64246,96348,27849,58850,892
RUMUS CHI-SQUARE
X 2=∑i=1
k ( f o−f h)2
f h
Di mana:
χ2 : chi-kuadrat
f o : Frekuensi yang diobservasi
f h : Frekuensi yang diperoleh/diamati
Penerapan
TABEL BERAT BADAN SISWANomor absen Berat Badan
1 542 453 444 505 526 677 588 709 66
10 4811 7612 8213 8914 7115 7516 5917 3918 9919 5420 8721 7722 4123 5524 4325 5426 7727 9028 7529 3830 85
Panjang kelas = (99-36)/6 = 10,1666667 (diambil panjang kelas = 10)
Tabel distribusi frekuensiinterval fo fh fo - fh (fo - fh)^2 ((fo - fh)^2)/fh38-47 6 2.817 3.183 10.13149 3.59655271648-57 7 4.398 2.602 6.770404 1.53942792258-67 4 5.316 -1.316 1.731856 0.32578179168-77 7 5.316 1.684 2.835856 0.53345673478-87 3 4.398 -1.398 1.954404 0.4443847288-97 3 2.817 0.183 0.033489 0.011888179jumlah 30 25.062 6.451492062
batas kelas(x) z z pembulatan luas
37.5 -1.38873015 -1.39
47.5 -0.9258201 -0.93 0.093957.5 -0.46291005 -0.46 0.146667.5 0 0 0.177277.5 0.46291005 0.46 0.177287.5 0.9258201 0.93 0.146697.5 1.38873015 1.39 0.0939
Kesimpulan:
1. Nilai Chi Kuadrat hitung = 6,45149
2. Nilai Chi Kuadrat berdasarkan tabel dengan dk=3 dan α=0,05 adalah 7,815
Karena Chi Kuadrat hitung < Chi Kuadrat tabel, maka distribusi data berat badan siswa
dinyatakan berdistribusi normal.
Uji Normalitas dengan Program SPSS
Langkah-langkah menguji dengan program SPSS:
1. Masuk program SPSS2. Klik Variable View pada SPSS data editor
3. Pada kolom Name baris pertama ketik nomor dan pada kolom Name baris kedua ketik beratbadan.
4. Pada kolom Type pilih Numeric untuk nomor dan beratbadan. Pada kolom Decimals pilih 0 untuk nomor dan beratbadan.
5. Buka Data View pada SPSS data editor maka didapat kolom variable nomor dan variable beratbadan.
6. Ketikkan data sesuai dengan variabelnya.7. Klik variable Analyze>>Descriptive Statistics>>Explore.
8. Klik variable beratbadan dan masukkan ke kotak Dependent List.9. Klik Plots.
10. Klik Normality Plots With Test kemudian klik Continue.
11. Klik OK maka output keluar.
Output
Case Processing Summary
Cases
Valid Missing Total
N Percent N Percent N Percent
Beratbadan 20 100.0% 0 .0% 20 100.0%
Descriptives
Statistic Std. Error
Beratbadan Mean 64.40 3.268
95% Confidence Interval for
Mean
Lower Bound 57.56
Upper Bound 71.24
5% Trimmed Mean 64.50
Median 63.00
Variance 213.621
Std. Deviation 14.616
Minimum 36
Maximum 91
Range 55
Interquartile Range 16
Skewness .005 .512
Kurtosis -.274 .992
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Beratbadan .106 20 .200* .975 20 .850
a. Lilliefors Significance Correction
*. This is a lower bound of the true significance.
beratbadan
beratbadan Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 3 . 6 3.00 4 . 458 2.00 5 . 79 7.00 6 . 0012478 4.00 7 . 0157 2.00 8 . 67 1.00 9 . 1
Stem width: 10 Each leaf: 1 case(s)
Analisis:
Output Case Processing Summary
Semua data beratbadan (20 orang) valid (100%)
Output Descriptives
memberikan tentang gambaran (deskripsi) tentang suatu data, seperti rata-rata, standar deviasi,
variansi dan sebagainya.
Output Test of Normality
bagian ini akan menguji normal tidaknya sebuah distribusi data.
Pedoman pengambilan keputusan:
Nilai Sig. atau signifikasi atau nilai probabilitas < 0,05 maka distribusi adalah tidak normal.
Nilai Sig. atau signifikasi atau nilai probabilitas > 0,05 maka distribusi adalah normal.
Pada hasil uji Kolmogorov Smirnov dan Shapiro Wilk: distribusi berat badan siswa adalah
normal. Hal ini bisa dilihat pada tingkat pada tingkat signifikansi kedua alat uji, yaitu > 0,05
(0,200)
Output STEM AND LEAF
analisis:
Pada baris pertama, ada 1 siswa yang mempunyai berat badan 30 tahun. Leaf atau cabangnya
bernilai 6 berarti nilai berat badan 1 siswa tersebut adalah 36.
Pada baris kedua, ada 3 siswa yang mempunyai berat badan 40 tahun. Leaf atau cabangnya
bernilai 4, 5 dan 8 berarti berat badan 3 siswa tersebut adalah 44, 45, dan 48.
Dan seterusnya
Output untuk menguji normalitas dengan Plot (Q-Q Plot)
Jika suatu distribusi data normal, maka data akan tersebar di sekeliling garis. Pada output data
beratbadan terlihat bahwa pola data tersebar di sekeliling garis, yang berarti bisa dikatakan
berdistribusi normal.
Output untuk menguji normalitas dengan Plot (detrended Normal Q-Q Plot)
Output ini untuk mendeteksi pola-pola dari titik yang bukan bagian dari kurva normal.
Output BOXPLOT
Boxplot adalah kotak pada gambar berwarna abu-abu (atau mungkin warna yang lain) dengan
garis tebal horizontal di kotak tersebut. Kotak abu-abu tersebut memuat 50% data, atau
hspread
Whisker (nilai 1,5 dari hspread)
Nilai di atas garis ini adalah outlier atau nilai ekstrim
Nilai di bawah garis ini adalah outlier atau nilai ekstrim
Persentile (25)disebut HINGES
Persentile (50) disebut MEDIAN
Persentile (75) disebut HINGES
mempunyai batas persentil ke-25 dan ke-75 (lihat pembahasan interquartile mean). Sedangkan
garis tebal hitam adalah median data.
Berikut ini gambar Boxplot teoritis:
Top Related