Normal Multivariat

8
A. Analisis Multivariat Normal Analisis multivariat adalah analisis statistika yang dikenakan pada data yang terdiri dari banyak variabel dan antar variabel saling berkorelasi. Data multivariat tidak hanya terdiri atas satu variabel saja melainkan dapat terdiri atas lebih dari satu variabel. Analisis statistika multivariat digunakan dalam menganalisis lebih dari satu variabel dependen untuk mengetahui apakah rata-rata kelompok berbeda secara signifikan. Asumsi yang harus dipenuhi dalam melakukan analisis multivariat adalah 1. X 11 ,X 12 ,…,X 1 k , (k=1, 2,..,n) adalah sampel acak berukuran n 1 dari suatu populasi dengan rata-rata µ 1 . 2. Data berasal dari populasi yang berdistribusi multivariat normal 3. Homogenitas matriks varian kovarians B. Distribusi Multivariat Normal Distribusi multivariat normal merupakan suatu distribusi yang diperoleh dari perluasan distribusi normal univariat, dimana perbedaannya dilihat dari dimensinya. Pada univariat, dimensi yang digunakan adalah 1 (p=1), sedangkan untuk bivariat, dimensi yang digunakan adalah 2 (p=2) dan untuk multivariat dimensi yang digunakan lebih dari 2 (p>2). Fungsi kepadatan probabilitasnya adalah f ( x )= 1 ( 2 π) p / 2 |Σ | 1 /2 e ( xμ ) ' Σ 1 ( xμ)/ 2 Dimana : < x i < ∞,i=1,2 , ..,p Σ= [ σ 11 σ 12 σ 12 σ 22 ] C. Pengujian Asusmi Multivariat Normal Metode statistika multivariat MANOVA mensyaratkan terpenuhinya asumsi distribusi normalitas dengan hipotesis adalah: H 0 : Data berdistribusi normal multivariat H 1 : Data tidak berdistribusi normal multivariat. Jika X 1 ,X 2 ,….,X p berdistribusi normal multivariat maka ( Xμ) t 1 ( Xμ) berditribusi χ p 2 . Berdasarkan sifat ini maka pemeriksaan distribusi normal multivariat dapat dilakukan pada

description

mebahas multivariat

Transcript of Normal Multivariat

Page 1: Normal Multivariat

A. Analisis Multivariat Normal

Analisis multivariat adalah analisis statistika yang dikenakan pada data yang terdiri dari banyak variabel dan antar variabel saling berkorelasi. Data multivariat tidak hanya terdiri atas satu variabel saja melainkan dapat terdiri atas lebih dari satu variabel. Analisis statistika multivariat digunakan dalam menganalisis lebih dari satu variabel dependen untuk mengetahui apakah rata-rata kelompok berbeda secara signifikan. Asumsi yang harus dipenuhi dalam melakukan analisis multivariat adalah

1. X11 , X 12 , …, X1k , (k=1, 2,..,n) adalah sampel acak berukuran n1 dari suatu populasi dengan rata-rata µ1.

2. Data berasal dari populasi yang berdistribusi multivariat normal3. Homogenitas matriks varian kovarians

B. Distribusi Multivariat Normal

Distribusi multivariat normal merupakan suatu distribusi yang diperoleh dari perluasan distribusi normal univariat, dimana perbedaannya dilihat dari dimensinya. Pada univariat, dimensi yang digunakan adalah 1 (p=1), sedangkan untuk bivariat, dimensi yang digunakan adalah 2 (p=2) dan untuk multivariat dimensi yang digunakan lebih dari 2 (p>2). Fungsi kepadatan probabilitasnya adalah

f ( x )= 1

(2π )p /2|Σ|1/2e−( x−μ) ' Σ−1(x−μ )/2

Dimana : −∞<x i<∞ , i=1,2, .. , p

Σ=[σ11 σ 12

σ12 σ 22]

C. Pengujian Asusmi Multivariat Normal

Metode statistika multivariat MANOVA mensyaratkan terpenuhinya asumsi distribusi normalitas dengan hipotesis adalah:H 0 : Data berdistribusi normal multivariatH 1: Data tidak berdistribusi normal multivariat.

Jika X1 , X2 , …., X pberdistribusi normal multivariat maka ( X−μ )t∑❑−1

( X−μ ) berditribusi χ p2 .

Berdasarkan sifat ini maka pemeriksaan distribusi normal multivariat dapat dilakukan pada setiap populasi dengan cara membuat q-q plot atau scatter-plot dari nilai d i

2=( X i−X )t S−1 ( X i−X ) ,i=1 ,2 , …, n.Tahapan dari pembuatan q-q plot ini adalah sebagai berikut (Johnson & Wichern, 2002: 187):

1) Menentukan nilai vektor rata-rata: X2) Menentukan nilai matriks varians-kovarians: S 3) Menentukan nilai jarak mahalanobis atau kuadrat general setiap titik pengamatan dengan vektor rata-

ratanya d i2=( X i−X )t S−1 ( X i−X ) ,i=1 ,2 , …, n .

4) Mengurutkan nilai d⚪

2 dari kecil ke besar: d (1 )2 ≤ d (2)

2 ≤ d(3)2 ≤ …≤ d(n)

2 .

5) Menentukan nilai pi=i−1/2

n, i=1 ,2 ,… ,n .

6) Menentukan nilai q i sedemikian hingga ∫−∞

q i

f ( χ2 ) d χ 2=pi atau q i , p ( pi )= χ p2 ((n−i+

12 )/n).

Page 2: Normal Multivariat

7) Membuat scatter-plot d ( i)2 dengan q i

8) Jika scatter-plot ini cenderung membentuk garis lurus dan lebih dari 50% nilai d i2 ≤ χ p

2 (0,50 ), maka H 0 diterima artinya data berdistribusi normal multivariate

D. Sumber Data

Data yang digunakan pada penelitian ini adalah data yang didapatkan pada laporan kerja praktek di PT. (Persero) Angkasa Pura I Bandar Udara Juanda Surabaya tentang Analisis Data Jumlah Kedatangan dan Keberangkatan Pesawat, Penumpang, Bagasi, Kargo, dan Pos Tahun 2003-2004. Namun data yang digunakan pada penelitian ini hanya data kedatangan dan keberangkatan penumpang pada bandar udara internasional dan domestik pada tahun 2003-2004.

Jumlah Kedatangan dan Keberangkatan Penumpang di Bandar Udara Juanda Surabaya Tahun 2003-2004

BulanInternasional Domestik

datang berangkat datang berangkatJanuari 27894 44594 175737 173873Februari 41602 26480 186930 186395Maret 40442 20531 170043 169125April 12418 13350 182933 171132Mei 12258 12131 194383 191218Juni 18162 17223 236297 212478Juli 24061 23122 242205 228155

Agustus 22968 22230 206348 199732September 23225 22645 220049 212348Oktober 21732 21081 228135 223573

November 32580 21503 236789 183403Desember 25356 37521 227994 270763

E. Pengujian Asumsi Multivariat Normal dengan MinitabX ( p) ,(0,50)2 =1,39

a. Terminal Internasional

Tabel 1. Nilai Jarak Mahalanobis (d2( j))

bulan x1 x2 d d2

1 27894 44594 2.374693 5.6391682 41602 26480 1.796925 3.228943 40442 20531 1.94155 3.7696174 12418 13350 1.493854 2.2315995 12258 12131 1.568862 2.4613296 18162 17223 0.860154 0.7398647 24061 23122 0.124344 0.0154618 22968 22230 0.245685 0.0603619 23225 22645 0.213747 0.045688

Page 3: Normal Multivariat

10 21732 21081 0.393555 0.15488611 32580 21503 0.977549 0.95560212 25356 37521 1.642402 2.697484

Berdasarkan tabel 1 di atas, maka dapat dilakukan penghitungan nilai proporsi jarak mahalanobis ((d¿¿2¿¿ ( j))¿¿ yang nilainya kurang dari X ( p) ,(0,50)

2 . Proporsi nilai jarak mahalanobis

(d¿¿2¿¿ ( j))¿¿ yang nilainya kurang dari X ( p) ,(0,50)2 yang berasal dari terminal internasional

adalah 612

=¿0,5, artinya dari 12 titik, hanya 6 titik yang berada di dalam grafik elips.

b. Terminal Domestik

Tabel 2. Nilai Jarak Mahalanobis (d2( j))

bulan x3 x4 d d2

117573

717387

31.27658

31.62966

3

218693

018639

50.85255

70.72685

4

317004

316912

51.49509

62.23531

3

418293

317113

2 1.103811.21839

7

519438

319121

80.56240

70.31630

1

623629

721247

81.17777

31.38714

8

724220

522815

51.27393

61.62291

2

820634

819973

20.10119

60.01024

1

922004

921234

80.43125

80.18598

3

1022813

522357

30.79477

90.63167

4

1123678

918340

32.21982

64.92762

9

1222799

427076

32.66606

27.10788

4Berdasarkan tabel 2 di atas,, maka dapat dilakukan perhitungan nilai proporsi jarak mahalanobis ((d¿¿2¿¿ ( j))¿¿ yang nilainya kurang dari X ( p) ,(0,50)

2 . Proporsi nilai jarak mahalanobis

(d¿¿2¿¿ ( j))¿¿ yang nilainya kurang dari X ( p) ,(0,50)2 yang berasal dari terminal internasional

adalah 612

=¿0,5artinya dari 12 titik, hanya 6 titik yang berada di dalam grafik elips.

Page 4: Normal Multivariat

F. Pengujian Asumsi Multivariat Normal dengan Minitab

a. Terminal Internasional Data diolah menggunakan minitab, dan diperoleh nilai proporsi sebesar 0,5. Hal tersebut

berarti bahwa terdapat 0,5 dari jumlah data yang masuk kedalam elips. Apabila dibuat plot chi-square dari terminal internasional, maka diperlukan jarak mahalonobis.

bulan x1 x2 d d2 dist2 cu-prob chiquant

1 27894 44594 2.3746935.63916

8 0.015461 0.041667 0.0851192292 41602 26480 1.796925 3.22894 0.045688 0.125 0.267062785

3 40442 20531 1.941553.76961

7 0.060361 0.208333 0.467229702

4 12418 13350 1.4938542.23159

9 0.154886 0.291667 0.689680973

5 12258 12131 1.5688622.46132

9 0.739864 0.375 0.940007258

6 18162 17223 0.8601540.73986

4 0.955602 0.458333 1.226208946

7 24061 23122 0.1243440.01546

1 2.231599 0.541667 1.560317115

8 22968 22230 0.2456850.06036

1 2.461329 0.625 1.961658506

9 23225 22645 0.2137470.04568

8 2.697484 0.708333 2.464287363

10 21732 21081 0.3935550.15488

6 3.22894 0.791667 3.137231834

11 32580 21503 0.9775490.95560

2 3.769617 0.875 4.158883083

12 25356 37521 1.6424022.69748

4 5.639168 0.958333 6.356107659Jarak mahalonobis yang diperoleh tersebut ditransformasi ke dalam plot chi-square sebagai

berikut.

Gambar 1. Plot Chi-square Jarak Mahalanobis Terminal Internasional

Page 5: Normal Multivariat

Berdasarkan gambar diatas diperoleh informasi bahwa ada 6 dari 12 plot membentuk garis lurus yang menunjukkan data berdistribusi normal.

b. Terminal DomestikData diolah menggunakan minitab, dan diperoleh nilai proporsi sebesar 0,5. Hal tersebut

berarti bahwa terdapat 0,5 dari jumlah data yang masuk kedalam elips. Apabila dibuat plot chi-square dari terminal domestik, maka diperlukan jarak mahalonobis.

bulan x3 x4 d d2 dist^2 cuprob Chiquad

117573

7 173873 1.276583 1.629663 0.010241 0.0416667 0.085119

218693

0 186395 0.852557 0.726854 0.185983 0.125 0.267063

317004

3 169125 1.495096 2.235313 0.316301 0.2083333 0.46723

418293

3 171132 1.10381 1.218397 0.631674 0.2916667 0.689681

519438

3 191218 0.562407 0.316301 0.726854 0.375 0.940007

623629

7 212478 1.177773 1.387148 1.218397 0.4583333 1.226209

724220

5 228155 1.273936 1.622912 1.387148 0.5416667 1.560317

820634

8 199732 0.101196 0.010241 1.622912 0.625 1.961659

922004

9 212348 0.431258 0.185983 1.629663 0.7083333 2.464287

1022813

5 223573 0.794779 0.631674 2.235313 0.7916667 3.137232

1123678

9 183403 2.219826 4.927629 4.927629 0.875 4.158883

1222799

4 270763 2.666062 7.107884 7.107884 0.9583333 6.356108

Jarak mahalonobis yang diperoleh tersebut ditransformasi ke dalam plot chi-square sebagai berikut.

Page 6: Normal Multivariat

Gambar 2. Plot Chi-square Jarak Mahalanobis Terminal Domestik

Berdasarkan gambar diatas diperoleh informasi bahwa ada 6 dari 12 plot di awal membentuk garis lurus yang menunjukkan data berdistribusi normal.