Analisis Komponen Utama

37
ANALISIS KOMPONEN UTAMA Budi Subandrio Ika Nuryani K. Nurika Damayanti Nita Ferdiana

description

presentasi

Transcript of Analisis Komponen Utama

Page 1: Analisis Komponen Utama

ANALISIS KOMPONEN UTAMA Budi Subandrio

Ika NuryaniK. Nurika Damayanti

Nita Ferdiana

Page 2: Analisis Komponen Utama

ANALISIS KOMPONEN UTAMA

Page 3: Analisis Komponen Utama

3

Apa itu Komponen Utama

• Merupakan kombinasi linear dari peubah yang diamati informasi yang terkandung pada KU merupakan gabungan dari semua peubah dengan bobot tertentu

• Kombinasi linear yang dipilih merupakan kombinasi linear dengan ragam (varian) paling besar memuat informasi paling banyak

• Antar KU bersifat ortogonal tidak berkorelasi informasi tidak tumpang tindih

Page 4: Analisis Komponen Utama

4

Analisis Komponen Utama

Gugus peubah asal

{X1, X2, …, Xp}

Gugus KU{KU1, KU2, …,

KUp}Hanya dipilih k < p KU saja, namun mampu memuat sebagian besar

informasi

Page 5: Analisis Komponen Utama

Analisis Komponen Utama

•Tujuan: - diharapkan dapat disusutkan dimensi banyaknya variabel atau dapat disederhanakan struktur hubungan variabel sehingga dengan dimensi yang lebih kecil - diharapkan lebih mudah melakukan interpretasi tanpa kehilangan banyak informasi tentang data, bahkan informasi yang didapat menjadi lebih padat dan bermakna. - data (skor komponen) dapat digunakan sebagai input analisis lanjut (misal: Bi-plot, An. Komponen Regresi, An. Cluster)

Page 6: Analisis Komponen Utama

𝑿𝟏 ,𝑿𝟐 ,…. ,𝑿𝒑 𝐘𝟏 ,𝐘𝟐 ,…. ,𝐘𝐩AKU

Page 7: Analisis Komponen Utama

Catatan:AKU tidak selalu berhasil dalam mereduksi banyaknya peubahAKU tidak bermanfaat bila peubah-peubah yang dianalisis tidak

saling berkorelasi. Dalam hal ini, KU yang dihasilkan akan sama dengan peubah asal, tapi terurut berdasarkan pentingnya peubah tersebut (atau terurut berdasarkan keragamannya)

Hasil terbaik adalah jika terdapat korelasi yang tinggi antar peubah. Pembentukan matriks korelasi merupakan analisis pendahuluan pada AKU

Menurut Koutsoyiannis (1973) serta Draper dan Smith (1981), metode komponen utama cocok untuk dua kasus, pertama bila jumlah variabel yang dimasukkan ke dalam fungsi relatif besar dibandingkan jumlah sampel, kedua sebagai penyelesaian masalah multikolinieritas antar variabel bebas.

Page 8: Analisis Komponen Utama

komponen utama pertama (KU1) merupakan kombinasi linier dari seluruh variabel yang diamati dan memiliki varians terbesar

komponen utama kedua (KU2) merupakan kombinasi linier dari seluruh variabel yang diamati yang bersifat ortogonal terhadap KU1 dan memiliki varians kedua terbesar

komponen utama ketiga (KU3) merupakan kombinasi linier dari seluruh variabel yang diamati yang bersifat ortogonal baik terhadap KU1 maupun KU2, dan memiliki varians ketiga terbesar

komponen utama ke p (KUp) merupakan kombinasi linier dari seluruh variabel yang diamati yang bersifat ortogonal terhadap KU1, KU2, … , KU(p-1) dan memiliki varians yang terkecil.

Komponen utama dibentuk berdasarkan urutan varians dari yang terbesar hingga yang terkecil, dalam arti sbb:

Page 9: Analisis Komponen Utama

9

Permasalahan Umum dalam AKU

• Penentuan KU menggunakan ‘matriks ragam-peragam’ vs ‘matriks korelasi’

• Penentuan banyaknya KU

Page 10: Analisis Komponen Utama

10

Penggunaan Matriks ragam-peragam dalam komponen utama memerlukan persyaratan bahwa peubah yang diamati memiliki ukuran pada skala dengan perbedaan yang tidak besar atau jika satuan ukurannya sama. 

Sehingga bila peubah yang diamati ukurannya pada skala dengan perbedaan yang sangat lebar atau satuannya tidak sama, maka analisis komponen utama tidak menggunakan matriks ragam-peragam, tetapi harus menggunakan matriks korelasi R.

Page 11: Analisis Komponen Utama

Komponen Utama dengan Menggunakan Matriks Ragam-Peragam

Page 12: Analisis Komponen Utama

Komponen Utama dengan Menggunakan Matriks KORELASI

Selain berdasarkan matriks kovariansi, komponen utama juga dapat dibentuk berdasarkan matriks korelasi.

Matriks korelasi R ini dapat diperoleh dengan cara mentransformasi setiap variabel asal xij yang merupakan nilai pengamatan dengan rumus:

𝑍=(𝑉12 )−1 ( 𝑋−𝜇)

Page 13: Analisis Komponen Utama

13

Penentuan Banyaknya KUMetode 1

• didasarkan pada kumulatif proporsi keragaman total yang mampu dijelaskan.

• Metode ini merupakan metode yang paling banyak digunakan, dan bisa diterapkan pada penggunaan matriks korelasi maupun matriks ragam peragam.

• Minimum persentase kergaman yang mampu dijelaskan ditentukan terlebih dahulu, dan selanjutnya banyaknya komponen yang paling kecil hingga batas itu terpenuhi dijadikan sebagai banyaknya komponen utama yang digunakan.

• Tidak ada patokan baku berapa batas minimum tersebut, sebagian buku menyebutkan 70%, 80%, bahkan ada yang 90%.

Page 14: Analisis Komponen Utama

14

Penentuan Banyaknya KUMetode 2

• hanya bisa diterapkan pada penggunaan matriks korelasi. Ketika menggunakan matriks ini, peubah asal ditransformasi menjadi peubah yang memiliki ragam sama yaitu satu.

• Pemilihan komponen utama didasarkan pada ragam komponen utama, yang tidak lain adalah akar ciri. Metode ini disarankan oleh Kaiser (1960) yang berargumen bahwa jika peubah asal saling bebas maka komponen utama tidak lain adalah peubah asal, dan setiap komponen utama akan memiliki ragam satu.

• Dengan cara ini, komponen yang berpadanan dengan akar ciri kurang dari satu tidak digunakan. Jollife (1972) setelah melakukan studi mengatakan bahwa cut off yang lebih baik adalah 0.7.

Page 15: Analisis Komponen Utama

15

Penentuan Banyaknya KUMetode 3

• penggunaan grafik yang disebut plot scree. • Cara ini bisa digunakan ketika titik awalnya matriks korelasi

maupun ragam peragam. • Plot scree merupakan plot antara akar ciri k dengan k. • Dengan menggunakan metode ini, banyaknya komponen

utama yang dipilih, yaitu k, adalah jika pada titik k tersebut plotnya curam ke kiri tapi tidak curam di kanan. Ide yang ada di belakang metode ini adalah bahwa banyaknya komponen utama yang dipilih sedemikian rupa sehingga selisih antara akar ciri yang berurutan sudah tidak besar lagi. Interpretasi terhadap plot ini sangat subjektif.

Page 16: Analisis Komponen Utama

16

Kegunaan Lain KU

• Plot skor KU dua dimensi sebagai alat awal diagnosis pada analisis gerombol

• KU yang saling bebas mengatasi masalah multikolinear dalam analisis regresi

Page 17: Analisis Komponen Utama
Page 18: Analisis Komponen Utama

18

Contoh Penerapan AKU

Page 19: Analisis Komponen Utama

Berdasarkan SDKI 2002-2003 cakupan imunisasi lengkap anak usia 12-23 bulan di Indonesia berdasarkan informasi dari KMS (Kartu Menuju Sehat) atau laporan ibu sebesar 52 persen. Angka ini masih kecil bila dibandingkan dengan 80 persen angka cakupan imunisasi lengkap yang ditargetkan oleh UCI ( Universal Chilhood Imunization). Bila dilihat pada cakupan imunisasi lengkap pada tingkat propinsi hanya ada dua propinsi yang telah memenuhi target UCI yaitu Yogyakarta (84 persen) dan Bali (80 persen).

Page 20: Analisis Komponen Utama

Oleh karena itu, ingin diketahui faktor dominan apakah yang mempengaruhi ketidaklengkapan imunisasi anak usia 12-23 bulan di Indonesia. Faktor dominan yang ingin diketahui pengaruhnya dibatasi pada karakteristik ibu dan ayahSehingga inti dalam kasus ini yaitu ingin melihat Faktor – Faktor yang Mempengaruhi ketidaklengkapan Imunisasi Anak Usia 12 – 23 Bulan di Indonesia Tahun 2003

Page 21: Analisis Komponen Utama

Tampilan data di SPSS

Page 22: Analisis Komponen Utama

• Karena data memiliki variasi yang besar (karena satuan dan rentang data yang berbeda-beda), maka distandardisasi terlebih dahulu dengan mentransformasikan ke dalam bentuk Z-score, yaitu dengan klik Descriptive Statistics→Descriptives →Options. Maka akan muncul tampilan berikut.

Page 23: Analisis Komponen Utama

Maka akan muncul variabel baru seperti gambar berikut :

Page 24: Analisis Komponen Utama
Page 25: Analisis Komponen Utama
Page 26: Analisis Komponen Utama
Page 27: Analisis Komponen Utama
Page 28: Analisis Komponen Utama
Page 29: Analisis Komponen Utama

Tabel Correlation Matrix

Merupakan tabel matriks korelasi yang berisi nilai-nilai korelasi antara variabel-variabel yang akan dianalisis. Pada bagian Correlation dapat dilihat besarnya korelasi antar variabel.Kemudian pada baris sig.(1-tailed) menunjukkan signifikansi korelasi antara variabel-variabel tersebut. P value < 0,05 menandakan adanya hubungan nyata antar variabel

Page 30: Analisis Komponen Utama
Page 31: Analisis Komponen Utama
Page 32: Analisis Komponen Utama

Total Variance Explained

Tabel Total Variance Explained menunjukkan besarnya persentase keragaman total yang mampu diterangkan oleh keragaman faktor - faktor yang terbentuk. Untuk menentukan berapa komponen/faktor yang dipakai agar dapat menjelaskan keragaman total maka dilihat dari besar nilai eigenvaluenya, komponen dengan eigenvalue >1 adalah komponen yang dipakai

Page 33: Analisis Komponen Utama
Page 34: Analisis Komponen Utama
Page 35: Analisis Komponen Utama

Tabel Matrik Komponen

Tabel component matrix menunjukkan koefisien dalam pembentukan komponen utama atau vektor ciri dari matriks korelasi.

Page 36: Analisis Komponen Utama

Berdasarkan tabel tersebut, diperoleh persamaan komponen utama:

Page 37: Analisis Komponen Utama

37

TERIMA KASIH