Post on 28-Dec-2015
description
1
Kuliah
Oleh Ir. Rahayu Astuti, M.Kes
DISTRIBUSI NORMAL DAN UJI KENORMALAN
Pada distribusi probabilitas yang kontinyu, grafiknya dapat menggambarkan berbagai
tingkat kemiringan atau dalam beberapa kasus simetris sempurna. Diantaranya yang terpenting
adalah distribusi kontinyu yang kurvanya simetris, yaitu distribusi normal. Distribusi normal
merupakan distribusi probabilitas kontinyu yang terpenting dalam seluruh bidang statistika.
Pada distribusi normal :
- kurvanya simetris
- berbentuk lonceng, merentang tak terbatas ke kedua arah
- menggambarkan data yang terjadi pada alam, pada manusia, industri.
- Disebut juga “distribusi Gauss”
Terjadi jika variabel acak x mempunyai fungsi dengan persamaan :
Dimana : : konstanta yaitu 3,1416
e : bilangan logaritma natural yaitu 2,7183 : rata-rata hitung distribusi
: simpangan baku distribusi
maka x berdistribusi normal
Jika nilai mean = median = modus kurvanya akan simetris
x= Me = Mo
Kurva simetris
x- 2
1 -1/2
f (x) = e 2
2
Mo Me x x Me Mo
x > Me > Mo x < Me < Mo
Kurva menceng ke kanan Kurva menceng ke kiri
Kurva positif Kurva negatif
Kurva normal
f (x)
-3 +3 sumbu x
Sifat-sifat penting dari distribusi normal :
1. Grafik selalu diatas sumbu datar x
2. Grafik simetrik terhadap garis vertical melalui x =
3. Modus tercapai pada x =
4. Grafik mendekati sumbu datar x mulai dari +3 kekanan dan -3 kekiri
5. Luas grafik selalu sama dengan 1
6. Tinggi rendahnya kurva tergantung besarnya
Makin besar , kurvanya makin rendah (platikurtis)
Makin kecil , kurvanya makin tinggi (leptokurtis)
3
1 1 < 2 < 3
1 = 2 = 3
2
3
Dengan demikian jika dan diketahui, maka akan diperoleh bentuk distribusi normal, yang
mana dapat dihitung probabilitas nilai-nilai x dengan memakai rumus fungsi distribusi normal.
LUASAN DIBAWAH KURVA NORMAL
Probabilitas dimana nilai x nya mempunyai nilai antara x = x1 dan x = x2 adalah luasan dibawah
kurva diantara titik x1 dan x2
f (x)
x1 x2 sumbu x
DISTRUBUSI NORMAL STANDARD
Distribusi normal standard adalah distribusi normal dengan rata-rata sama dengan nol ( = 0)
dan simpangan baku sama dengan satu ( = 1)
Fungsi distribusi normal standard :
Z dalam daerah - < Z < +
2
1 -1/2 [ Z ]
f (Z) = e 2
4
Untuk mendapatkan probabilitas setiap nilai Z pada kurva normal standard telah disusun sebuah
daftar yang disebut “tabel distribusi normal standar”. Berdasarkan tabel inilah probabilitas setiap
nilai x pada distribusi normal umum dapat dihitung, melalui suatu transformasi.
Dari hubungan distribusi normal umum dan normal standard dapat diperoleh suatu rumus
transformasi dari nilai x (distribusi normal umum) ke nilai Z (distribusi normal standard).
Transformasinya:
Perubahan grafiknya dapat dilihat dalam gambar dibawah ini:
f (x) Rata-rata =
Simpangan baku =
-3 -2 -1 +1 +2 +3 x
f (z) = 0
= 1
-3 -2 -1 0 1 2 3 z
Tabel Distribusi Normal Normal Standard
Untuk mendapatkan probabilitas setiap nilai x pada distribusi normal umum (yang dapat
diperoleh secara empiris) adalah dengan menghitung probabilitas nilai Z yang sesuai dengan
distribusi normal standard dengan suatu transformasi. Dan untuk mendapatkan probabilitas
setiap nilai Z telah disusun “table distribusi normal standard”.
Berdasarkan table distribusi normal standard diperoleh ketentuan-ketentuan sebagai berikut:
x -
Z =
5
1 SD memberikan luas daerah 68,27 %
2 SD memberikan luas daerah 95,45 %
3 SD memberikan luas daerah 99,74 %
UJI KENORMALAN
Apakah data berasal dari populasi yang berdistribusi normal?
Bisa digunakan uji Kolmogorof Smirnov
Ho : F (x) = Fo (x)
F (x) adalah fungsi distribusi populasi yang diwakili oleh sampel
Fo (x) adalah fungsi distribusi suatu populasi berdistribusi normal
Atau
DATA BERASAL DARI POPULASI YANG BERDISTRIBUSI
NORMAL
Ha : F (x) Fo (x) (uji two tail)
DATA BERASAL DARI POPULASI YANG BERDISTRIBUSI
TIDAK NORMAL
Kesimpulan :
Jika p-value > 0,05 Ho diterima/gagal ditolak
Sehingga kesimpulannya data berasal dari populasi
yang berdistribusi normal
Jika p-value < 0,05 Ho ditolak
Sehingga kesimpulannya data berasal dari populasi
yang berdistribusi tidak normal
Contoh:
6
umur ibu
2 10.0 10.0 10.0
3 15.0 15.0 25.0
1 5.0 5.0 30.0
4 20.0 20.0 50.0
1 5.0 5.0 55.0
1 5.0 5.0 60.0
2 10.0 10.0 70.0
1 5.0 5.0 75.0
1 5.0 5.0 80.0
2 10.0 10.0 90.0
1 5.0 5.0 95.0
1 5.0 5.0 100.0
20 100.0 100.0
22
25
27
31
32
33
34
36
39
40
43
47
Total
Valid
Frequency Percent Valid Percent
Cumulative
Percent
Pada output diatas terlihat distribusi frekuensi masing-masing data umur
Ibu yang berumur 22 tahun sebanyak 2 orang atau 2/20 * 100% = 10,0 %
Ibu yang berumur 25 tahun sebanyak 3 orang atau 3/20 * 100% = 15,0 %
Oleh karena itu kumulatif persen menjadi 10,0 % + 15,0 % = 25,0 %
umur ibu
45.040.035.030.025.020.0
umur ibu
Fre
qu
en
cy
6
5
4
3
2
1
0
Std. Dev = 6.96
Mean = 32.4
N = 20.00
Gambar diatas memperlihatkan histogram umur ibu dan garis / kurva normal dari variabel
umur ibu. Terlihat bahwa batang histogram mempunyai kemiripan bentuk dengan kurva
normal (berbentuk seperti lonceng). Hal ini membuktikan bahwa distribusi tersebut sudah
dapat dikatakan normal atau mendekati normal. Namun pengujian normalitas lebih jelas
pada explore data.
Pengujian normalitas dengan explore data.
7
Descriptives
32,40 1,557
29,14
35,66
32,17
31,50
48,463
6,962
22
47
25
12,75
,328 ,512
-,461 ,992
Mean
Lower Bound
Upper Bound
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
umur ibu
Statistic Std. Error
Output ini memberikan informasi ringkasan statistik deskripsi dari data umur ibu
Mean (rata-rata) umur ibu adalah 32,4 tahun
95% CI : 29,11 – 35,66 (artinya pada tingkat kepercayaan 95% rata-rata umur ibu pada
populasi antara 29,11 – 35,66 ).
Median atau tititk tengah data jika semua data diurutkan dan dibagi dua sama besar.
Angka median umur ibu adalah 31.5 tahun menunjukkan bahwa 50% pengetahuan gizi
ibu adalah 31,5 tahun keatas dan 50% nya adalah 31,5 tahun ke bawah.
Variance adalah kuadrat dari standard deviasi yaitu 48,46 tahun .
Standard deviasi atau simpangan baku adalah 6,96 dibulatkan 7 tahun
Penggunaan standar deviasi untuk menilai dispersi rata-rata dari sampel. Untuk itu dengan
standard deviasi tertentu dan pada tingkat kepercayaan 95% (SPSS sebagian besar
menggunakan angka ini sebagai standar), rata-rata umur ibu pada sampel menjadi :
rata-rata 2 standard deviasi
NB: angka 2 digunakan karena tingkat kepercayaan 95%
Maka: 32,4 2 ( 7 )
= 46,4 sampai 18,4 (tahun)
Nilai Minimum adalah 22 tahun dan maximum adalah 47 tahun. Umur ibu terendah
adalah 22 tahun dan umur paling tua adalah 47 tahun.
Range adalah data maksimum – data minimum atau dalam kasus ini :
47 – 22 = 25
Rasio skewness adalah = nilai skewness/ standard error of skewness
= 0,328 / 0,512 = 0,640
8
Rasio kurtosis adalah : nilai kurtosis / standard error of kurtosis
= – 0,461 / 0,922 = – 0,5
Oleh karena kedua hasil terletak antara – 2 sampai dengan + 2, maka dapat dikatakan
distribusi data umur ibu adalah normal atau mendekati normal.
Output uji kenormalan data:
Tests of Normality
,120 20 ,200* ,960 20 ,542umur ibu
Statistic df Sig. Statistic df Sig.
Kolmogorov-Smirnova
Shapiro-Wilk
This is a lower bound of the true significance.*.
Lilliefors Significance Correctiona.
Pada uji kenormalan , pedoman pengambilan keputusan adalah :
Nilai sig (signifikansi) atau nilai probabilitas < 0,05, distribusi adalah tidak normal.
Nilai sig (signifikansi) atau nilai probabilitas > 0,05, distribusi adalah normal.
Pada uji Kolmogorov Smirnov , nilai sig atau p-value = 0,200. Karena > 0,05 maka dapat
dikatakan bahwa distribusi data umur ibu adalah normal.
Pada uji Saphiro-Wilk, nilai sig atau p-value = 0,542. Karena > 0,05 maka dapat dikatakan
bahwa distribusi data umur ibu adalah normal.
Output histogram
umur ibu
45,040,035,030,025,020,0
Histogram
Fre
quen
cy
6
5
4
3
2
1
0
Std. Dev = 6,96
Mean = 32,4
N = 20,00
Histogram dari data umur ibu.
Output stem and leaf
umur ibu Stem-and-Leaf Plot
9
Frequency Stem & Leaf
2,00 2 . 22
4,00 2 . 5557
8,00 3 . 11112344
2,00 3 . 69
3,00 4 . 003
1,00 4 . 7
Stem width: 10
Each leaf: 1 case(s)
Interpretasi :
Pada baris 1 : Ada 2 data umur ibu (frequency = 2) yang mempunyai stem = 2 dan leaf = 22,
yang berarti terdapat 2 orang ibu yang mempunyai umur 22 dan 22 tahun.
Pada baris 2 : Ada 4 data umur ibu (frequency = 4) yang mempunyai stem = 2 dan leaf =
5,5,5,7 yang berarti terdapat 4 orang ibu yang mempunyai umur 25, 25, 25, 27
Dan seterusnya sampai pada baris ke6 , yaitu ada 1 orang ibu yang mempunyai umur 47
tahun.
Output untuk menguji normalitas dengan Plot (Q-Q plot)
Normal Q-Q Plot of umur ibu
Observed Value
50403020
Exp
ecte
d N
orm
al
2,0
1,5
1,0
,5
0,0
-,5
-1,0
-1,5
Pada gambar Q-Q plot untuk variabel umur terlihat ada garis lurus dari kiri ke kanan atas.
Garis itu berasal dari nilai Z skore. Jika suatu distribusi data normal, maka data akan tersebar
di sekeliling garis. Oleh karena itu dapat dikatakan bahwa distribusi data adalah normal.
Output untuk menguji normalitas dengan Plot (Detrended NormalQ-Q plot)
10
Detrended Normal Q-Q Plot of umur ibu
Observed Value
50403020
De
v fr
om
No
rma
l
,5
,4
,3
,2
,1
-,0
-,1
-,2
-,3
Output ini untuk mendeteksi pola-pola dari titik-titik yang bukan bagian dari kurva normal.
Terlihat bahwa sebagian data terpola di sekitar garis. Hal ini membuktikan bahwa
distribusi data adalah normal.
Output boxplot
Boxplot adalah kotak pada gambar berwarna merah atau warna lain dengan garis tebal
horizontal di kotak tersebut. Kotak merah tersebut memuat 50% data. Sedangkan garis
tebal hitam median data. Jika garis hitam terletak persis di tengah boxplot, maka distribusi
data adalah normal. Jika berada di sebelah atas, distribusi menceng ke kiri dan jika di
sebelah bawah, distribusi menceng ke kanan.
20N =
umur ibu
50
40
30
20
Dari output diatas terlihat garis median berada ditengah. Hal ini menunjukkan distribusi data
normal.
LATIHAN SOAL DISTRIBUSI NORMAL
1. Berat bayi lahir (dari 50 sampel bayi) mengikuti sebaran normal dengan µ = 2,9 kg dan =
0,3 kg. Berapa banyaknya bayi yang mempunyai berat :
a). Antara 2,9 kg – 3,1 kg d). 3,0 kg keatas
11
b). Antara 2,5 kg – 2,9 kg e). 2,5 kebawah
c). Antara 2,5 kg – 2,8 kg
2. Hasil pengukuran LILA pada ibu hamil dengan mean µ = 25,0 cm dan simpangan baku =
2,0. Berapa probabilitasnya bahwa nilai LILA :
a). Kurang dari 23,5 cm
b). Lebih dari 23,5 cm
c). Antara 27,0 cm sampai 30,0 cm
3. Diketahui : mean tinggi badan laki-laki µ = 172,5 cm dan standard deviasi = 5 cm.
a). Berapa persentase laki-laki dengan tinggi badan lebih dari 180 cm.
b). Berapa persentase laki-laki yang tinggi badan antara 157,5 cm – 180,0 cm
c). Berapa persentase laki-laki yang tinggi badan diatas 170,0 cm
4. Diketahui mean kadar Hb pada 40 orang wanita pekerja = 11,93 gr/100 ml dan standar deviasi
= 0,83 gr/100 ml.
a). Berapa persentase wanita pekerja dengan kadar Hb kurang dari 13 gr/100 ml?
b). Berapa persentase wanita pekerja dengan kadar Hb lebih dari 10 gr/100 ml?
c). Berapa persentase wanita pekerja dengan kadar Hb antara 10 gr/100 ml – 12 gr/100 ml
TABEL DAERAH KURVA NORMAL
12
0 Z
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
0.0000
0.0398
0.0793
0.1179
0.1554
0.1915
0.2227
0.2580
0.2881
0.3159
0.3413
0.3643
0.3849
0.4032
0.4192
0.4332
0.4452
0.4554
0.4641
0.4713
0.4772
0.4821
0.4861
0.4893
0.4918
0.4938
0.4953
0.4965
0.4974
0.4981
0.4987
0.0040
0.0438
0.0832
0.1217
0.1591
0.1950
0.2291
0.2611
0.2910
0.3816
0.3438
0.3665
0.3869
0.4049
0.4207
0.4345
0.4463
0.4564
0.4649
0.4719
0.4778
0.4826
0.4864
0.4896
0.4920
0.4940
0.4955
0.4966
0.4975
0.4982
0.4987
0.0080
0.0478
0.0871
0.1255
0.1628
0.1985
0.2324
0.2642
0.2939
0.3212
0.3461
0.3686
0.3888
0.4066
0.4222
0.4357
0.4474
0.4573
0.4656
0.4726
0.4783
0.4830
0.4868
0.4898
0.4922
0.4941
0.4956
0.4967
0.4976
0.4982
0.4987
0.0120
0.0517
0.0910
0.1293
0.1664
0.2019
0.2357
0.2673
0.2967
0.3238
0.3485
0.3708
0.3907
0.4082
0.4236
0.4370
0.4484
0.4582
0.4664
0.4732
0.4788
0.4834
0.4871
0.4901
0.4925
0.4943
0.4957
0.4968
0.4977
0.4983
0.4988
0.0160
0.0557
0.0948
0.1331
0.1700
0.2054
0.2389
0.2704
0.2995
0.3264
0.3508
0.3729
0.3925
0.4099
0.4251
0.4382
0.4495
0.4591
0.4671
0.4738
0.4793
0.4838
0.4875
0.4904
0.4927
0.4945
0.4959
0.4969
0.4977
0.4984
0.4988
0.0199
0.0596
0.0987
0.1368
0.1736
0.2088
0.2422
0.2734
0.3023
0.3289
0.3531
0.3749
0.3944
0.4115
0.4265
0.4394
0.4505
0.4599
0.4678
0.4744
0.4798
0.4842
0.4878
0.4906
0.4929
0.4946
0.4960
0.4970
0.4978
0.4984
0.4989
0.0239
0.0636
0.1026
0.1406
0.1772
0.2123
0.2454
0.2764
0.3051
0.3315
0.3554
0.3770
0.3962
0.4131
0.4279
0.4406
0.4515
0.4608
0.4686
0.4750
0.4803
0.4846
0.4881
0.4909
0.4931
0.4948
0.4961
0.4971
0.4979
0.4985
0.4989
0.0279
0.0675
0.1064
0.1443
0.1808
0.2158
0.2486
0.2794
0.3078
0.3340
0.3577
0.3790
0.3980
0.4147
0.4292
0.4418
0.4525
0.4616
0.4693
0.4756
0.4808
0.4850
0.4884
0.4911
0.4932
0.4949
0.4962
0.4972
0.4980
0.4985
0.4989
0.0319
0.0714
0.1103
0.1480
0.1844
0.2190
0.2517
0.2823
0.3106
0.3365
0.3599
0.3810
0.3997
0.4162
0.4306
0.4429
0.4535
0.4625
0.4699
0.4761
0.4812
0.4854
0.4887
0.4913
0.4934
0.4951
0.4963
0.4973
0.4980
0.4986
0.4990
0.0359
0.0753
0.1141
0.1517
0.1879
0.2224
0.2549
0.2852
0.3133
0.3389
0.3621
0.3830
0.4015
0.4177
0.4319
0.4441
0.4545
0.4633
0.4706
0.4767
0.4817
0.4857
0.4890
0.4916
0.4936
0.4952
0.4964
0.4974
0.4981
0.4986
0.4990