Normal Multivariat
-
Upload
herry-sinaga -
Category
Documents
-
view
27 -
download
2
description
Transcript of Normal Multivariat
A. Analisis Multivariat Normal
Analisis multivariat adalah analisis statistika yang dikenakan pada data yang terdiri dari banyak variabel dan antar variabel saling berkorelasi. Data multivariat tidak hanya terdiri atas satu variabel saja melainkan dapat terdiri atas lebih dari satu variabel. Analisis statistika multivariat digunakan dalam menganalisis lebih dari satu variabel dependen untuk mengetahui apakah rata-rata kelompok berbeda secara signifikan. Asumsi yang harus dipenuhi dalam melakukan analisis multivariat adalah
1. X11 , X 12 , …, X1k , (k=1, 2,..,n) adalah sampel acak berukuran n1 dari suatu populasi dengan rata-rata µ1.
2. Data berasal dari populasi yang berdistribusi multivariat normal3. Homogenitas matriks varian kovarians
B. Distribusi Multivariat Normal
Distribusi multivariat normal merupakan suatu distribusi yang diperoleh dari perluasan distribusi normal univariat, dimana perbedaannya dilihat dari dimensinya. Pada univariat, dimensi yang digunakan adalah 1 (p=1), sedangkan untuk bivariat, dimensi yang digunakan adalah 2 (p=2) dan untuk multivariat dimensi yang digunakan lebih dari 2 (p>2). Fungsi kepadatan probabilitasnya adalah
f ( x )= 1
(2π )p /2|Σ|1/2e−( x−μ) ' Σ−1(x−μ )/2
Dimana : −∞<x i<∞ , i=1,2, .. , p
Σ=[σ11 σ 12
σ12 σ 22]
C. Pengujian Asusmi Multivariat Normal
Metode statistika multivariat MANOVA mensyaratkan terpenuhinya asumsi distribusi normalitas dengan hipotesis adalah:H 0 : Data berdistribusi normal multivariatH 1: Data tidak berdistribusi normal multivariat.
Jika X1 , X2 , …., X pberdistribusi normal multivariat maka ( X−μ )t∑❑−1
( X−μ ) berditribusi χ p2 .
Berdasarkan sifat ini maka pemeriksaan distribusi normal multivariat dapat dilakukan pada setiap populasi dengan cara membuat q-q plot atau scatter-plot dari nilai d i
2=( X i−X )t S−1 ( X i−X ) ,i=1 ,2 , …, n.Tahapan dari pembuatan q-q plot ini adalah sebagai berikut (Johnson & Wichern, 2002: 187):
1) Menentukan nilai vektor rata-rata: X2) Menentukan nilai matriks varians-kovarians: S 3) Menentukan nilai jarak mahalanobis atau kuadrat general setiap titik pengamatan dengan vektor rata-
ratanya d i2=( X i−X )t S−1 ( X i−X ) ,i=1 ,2 , …, n .
4) Mengurutkan nilai d⚪
2 dari kecil ke besar: d (1 )2 ≤ d (2)
2 ≤ d(3)2 ≤ …≤ d(n)
2 .
5) Menentukan nilai pi=i−1/2
n, i=1 ,2 ,… ,n .
6) Menentukan nilai q i sedemikian hingga ∫−∞
q i
f ( χ2 ) d χ 2=pi atau q i , p ( pi )= χ p2 ((n−i+
12 )/n).
7) Membuat scatter-plot d ( i)2 dengan q i
8) Jika scatter-plot ini cenderung membentuk garis lurus dan lebih dari 50% nilai d i2 ≤ χ p
2 (0,50 ), maka H 0 diterima artinya data berdistribusi normal multivariate
D. Sumber Data
Data yang digunakan pada penelitian ini adalah data yang didapatkan pada laporan kerja praktek di PT. (Persero) Angkasa Pura I Bandar Udara Juanda Surabaya tentang Analisis Data Jumlah Kedatangan dan Keberangkatan Pesawat, Penumpang, Bagasi, Kargo, dan Pos Tahun 2003-2004. Namun data yang digunakan pada penelitian ini hanya data kedatangan dan keberangkatan penumpang pada bandar udara internasional dan domestik pada tahun 2003-2004.
Jumlah Kedatangan dan Keberangkatan Penumpang di Bandar Udara Juanda Surabaya Tahun 2003-2004
BulanInternasional Domestik
datang berangkat datang berangkatJanuari 27894 44594 175737 173873Februari 41602 26480 186930 186395Maret 40442 20531 170043 169125April 12418 13350 182933 171132Mei 12258 12131 194383 191218Juni 18162 17223 236297 212478Juli 24061 23122 242205 228155
Agustus 22968 22230 206348 199732September 23225 22645 220049 212348Oktober 21732 21081 228135 223573
November 32580 21503 236789 183403Desember 25356 37521 227994 270763
E. Pengujian Asumsi Multivariat Normal dengan MinitabX ( p) ,(0,50)2 =1,39
a. Terminal Internasional
Tabel 1. Nilai Jarak Mahalanobis (d2( j))
bulan x1 x2 d d2
1 27894 44594 2.374693 5.6391682 41602 26480 1.796925 3.228943 40442 20531 1.94155 3.7696174 12418 13350 1.493854 2.2315995 12258 12131 1.568862 2.4613296 18162 17223 0.860154 0.7398647 24061 23122 0.124344 0.0154618 22968 22230 0.245685 0.0603619 23225 22645 0.213747 0.045688
10 21732 21081 0.393555 0.15488611 32580 21503 0.977549 0.95560212 25356 37521 1.642402 2.697484
Berdasarkan tabel 1 di atas, maka dapat dilakukan penghitungan nilai proporsi jarak mahalanobis ((d¿¿2¿¿ ( j))¿¿ yang nilainya kurang dari X ( p) ,(0,50)
2 . Proporsi nilai jarak mahalanobis
(d¿¿2¿¿ ( j))¿¿ yang nilainya kurang dari X ( p) ,(0,50)2 yang berasal dari terminal internasional
adalah 612
=¿0,5, artinya dari 12 titik, hanya 6 titik yang berada di dalam grafik elips.
b. Terminal Domestik
Tabel 2. Nilai Jarak Mahalanobis (d2( j))
bulan x3 x4 d d2
117573
717387
31.27658
31.62966
3
218693
018639
50.85255
70.72685
4
317004
316912
51.49509
62.23531
3
418293
317113
2 1.103811.21839
7
519438
319121
80.56240
70.31630
1
623629
721247
81.17777
31.38714
8
724220
522815
51.27393
61.62291
2
820634
819973
20.10119
60.01024
1
922004
921234
80.43125
80.18598
3
1022813
522357
30.79477
90.63167
4
1123678
918340
32.21982
64.92762
9
1222799
427076
32.66606
27.10788
4Berdasarkan tabel 2 di atas,, maka dapat dilakukan perhitungan nilai proporsi jarak mahalanobis ((d¿¿2¿¿ ( j))¿¿ yang nilainya kurang dari X ( p) ,(0,50)
2 . Proporsi nilai jarak mahalanobis
(d¿¿2¿¿ ( j))¿¿ yang nilainya kurang dari X ( p) ,(0,50)2 yang berasal dari terminal internasional
adalah 612
=¿0,5artinya dari 12 titik, hanya 6 titik yang berada di dalam grafik elips.
F. Pengujian Asumsi Multivariat Normal dengan Minitab
a. Terminal Internasional Data diolah menggunakan minitab, dan diperoleh nilai proporsi sebesar 0,5. Hal tersebut
berarti bahwa terdapat 0,5 dari jumlah data yang masuk kedalam elips. Apabila dibuat plot chi-square dari terminal internasional, maka diperlukan jarak mahalonobis.
bulan x1 x2 d d2 dist2 cu-prob chiquant
1 27894 44594 2.3746935.63916
8 0.015461 0.041667 0.0851192292 41602 26480 1.796925 3.22894 0.045688 0.125 0.267062785
3 40442 20531 1.941553.76961
7 0.060361 0.208333 0.467229702
4 12418 13350 1.4938542.23159
9 0.154886 0.291667 0.689680973
5 12258 12131 1.5688622.46132
9 0.739864 0.375 0.940007258
6 18162 17223 0.8601540.73986
4 0.955602 0.458333 1.226208946
7 24061 23122 0.1243440.01546
1 2.231599 0.541667 1.560317115
8 22968 22230 0.2456850.06036
1 2.461329 0.625 1.961658506
9 23225 22645 0.2137470.04568
8 2.697484 0.708333 2.464287363
10 21732 21081 0.3935550.15488
6 3.22894 0.791667 3.137231834
11 32580 21503 0.9775490.95560
2 3.769617 0.875 4.158883083
12 25356 37521 1.6424022.69748
4 5.639168 0.958333 6.356107659Jarak mahalonobis yang diperoleh tersebut ditransformasi ke dalam plot chi-square sebagai
berikut.
Gambar 1. Plot Chi-square Jarak Mahalanobis Terminal Internasional
Berdasarkan gambar diatas diperoleh informasi bahwa ada 6 dari 12 plot membentuk garis lurus yang menunjukkan data berdistribusi normal.
b. Terminal DomestikData diolah menggunakan minitab, dan diperoleh nilai proporsi sebesar 0,5. Hal tersebut
berarti bahwa terdapat 0,5 dari jumlah data yang masuk kedalam elips. Apabila dibuat plot chi-square dari terminal domestik, maka diperlukan jarak mahalonobis.
bulan x3 x4 d d2 dist^2 cuprob Chiquad
117573
7 173873 1.276583 1.629663 0.010241 0.0416667 0.085119
218693
0 186395 0.852557 0.726854 0.185983 0.125 0.267063
317004
3 169125 1.495096 2.235313 0.316301 0.2083333 0.46723
418293
3 171132 1.10381 1.218397 0.631674 0.2916667 0.689681
519438
3 191218 0.562407 0.316301 0.726854 0.375 0.940007
623629
7 212478 1.177773 1.387148 1.218397 0.4583333 1.226209
724220
5 228155 1.273936 1.622912 1.387148 0.5416667 1.560317
820634
8 199732 0.101196 0.010241 1.622912 0.625 1.961659
922004
9 212348 0.431258 0.185983 1.629663 0.7083333 2.464287
1022813
5 223573 0.794779 0.631674 2.235313 0.7916667 3.137232
1123678
9 183403 2.219826 4.927629 4.927629 0.875 4.158883
1222799
4 270763 2.666062 7.107884 7.107884 0.9583333 6.356108
Jarak mahalonobis yang diperoleh tersebut ditransformasi ke dalam plot chi-square sebagai berikut.
Gambar 2. Plot Chi-square Jarak Mahalanobis Terminal Domestik
Berdasarkan gambar diatas diperoleh informasi bahwa ada 6 dari 12 plot di awal membentuk garis lurus yang menunjukkan data berdistribusi normal.