analisis-faktor

10
ANALISIS FAKTOR (FACTOR ANALYSIS) Teori Singkat Analisis faktor adalah analisis statistika yang bertujuan untuk mereduksi dimensi data dengan cara menyatakan variabel asal sebagai kombinasi linear sejumlah faktor, sedemikian hingga sejumlah faktor tersebut mampu menjelaskan sebesar mungkin keragaman data yang dijelaskan oleh variabel asal. Model analisis faktor adalah : X 1 = c 11 F 1 + c 12 F 2 + c 13 F 3 + ... + c 1m F m + X 2 = c 21 F 1 + c 22 F 2 + c 23 F 3 + ... + c 2m F m + X 3 = c 31 F 1 + c 32 F 2 + c 33 F 3 + ... + c 3m F m + ... X p = c p1 F 1 + c p2 F 2 + c p3 F 3 + ... + c pm F m + p atau (p x 1) (p x m) (m x1) dan X 1 , X 2 ,..., X p adalah variabel asal F 1 , F 2 ,..., F m adalah faktor bersama (common factor) c ij adalah bobot (loading) dari variabel asal ke-i pada faktor ke-j p adalah error Hubungan antara varians variabel asal dengan, varians faktor dan varians error adalah sebagai berikut : var(X i )= varians yang dijelaskan oleh faktor untuk variabel asal ke-i + var(error)

description

analisis faktor

Transcript of analisis-faktor

ANALISIS FAKTOR

ANALISIS FAKTOR

(FACTOR ANALYSIS)Teori SingkatAnalisis faktor adalah analisis statistika yang bertujuan untuk mereduksi dimensi data dengan cara menyatakan variabel asal sebagai kombinasi linear sejumlah faktor, sedemikian hingga sejumlah faktor tersebut mampu menjelaskan sebesar mungkin keragaman data yang dijelaskan oleh variabel asal.

Model analisis faktor adalah :X1 = c11 F1 + c12 F2 + c13 F3 + ... + c1m Fm + X2 = c21 F1 + c22 F2 + c23 F3 + ... + c2m Fm + X3 = c31 F1 + c32 F2 + c33 F3 + ... + c3m Fm + ...

Xp = cp1 F1 + cp2 F2 + cp3 F3 + ... + cpm Fm + patau

(p x 1) (p x m) (m x1)dan

X1, X2,..., Xp adalah variabel asal

F1, F2,..., Fm adalah faktor bersama (common factor)

cij adalah bobot (loading) dari variabel asal ke-i pada faktor ke-jp adalah error

Hubungan antara varians variabel asal dengan, varians faktor dan varians error adalah sebagai berikut :var(Xi)= varians yang dijelaskan oleh faktor untuk variabel asal ke-i + var(error) = communality + specific variance =

=

Besarnya bobot cij dapat diduga dengan menggunakan metode komponen utama ataupun kemungkinan maksimum (maximum likelihood). Metode komponen utama terbagi menjadi dua metode yaitu non-iteratif dan iteratif. Nilai dugaan cij yang diperoleh dengan metode non-iteratif adalah :

atau untuk variabel asal yang dibakukandan

adalah bobot (loading) dari variabel asal ke-i pada faktor ke-j

adalah koefisien variabel asal ke-i untuk komponen utama ke-j

adalah eigen value untuk komponen utama ke-j

adalah simpangan baku (standard of deviation) variabel asal ke-jAlgoritma untuk metode komponen utama iteratif adalah sebagai berikut :1. Mulai2. Tentukan nilai awal communality untuk seluruh variabel asal (, i=1,...,p),

3. Ganti nilai diagonal matriks korelasi dengan nilai ()4. Tentukan nilai eigen-value dan eigen-vector dari matriks korelasi

5. Tentukan nilai bobot (loading)

6. Temtukan nilai communality

7. Jika nilai communality pada dua iterasi terakhir dianggap sama maka pergi ke 9

8. Pergi ke 3

9. Selesai

Untuk kepentingan intepretasi, seringkali diperlukan untuk memberi nama masing-masing faktor sesuai dengan besar harga mutlak bobot . Diharapkan setiap variabel asal hanya dominan di salah satu faktor saja (Nilai harga mutlak bobot variabel asal mendekati 1 di salah satu faktor dan mendekati o untuk faktor lainnya). Harapan ini kadang-kadang tidak dapat dipenuhi, untuk mengatasi hal ini diperlukan rotasi dari matriks bobot C. Beberapa macam teknik rotasi yang tersedia di program paket statistika adalah : varimax, quartimax, equamax, parsimax (MINITAB). Formula untuk masing-masing rotasi i ni adalah :

Rotasi

0Quartimax

1Varimax

m/2Equamax

Parsimax

Matriks bobot hasil rotasi (C*) dapat dinyatakan sebagai C*=CT, T adalah matriks transformasi.

Besarnya skor faktor dapat dinyatakan sebagai :

, j=1,...,n

Kegiatan PraktikumAnalisis komponen utama dari data kependudukan negara-negara di AsiaMTB > pca c2-c8;

SUBC> ncomp 2.

Eigenanalysis of the Correlation Matrix

Eigenvalue 5.3171 1.1709 0.2921 0.1163 0.0813 0.0195

Proportion 0.760 0.167 0.042 0.017 0.012 0.003

Cumulative 0.760 0.927 0.969 0.985 0.997 1.000

Eigenvalue 0.0027

Proportion 0.000

Cumulative 1.000

Variable PC1 PC2

DENSITY 0.257 -0.668

URBAN 0.393 -0.277

LIFEEXPF 0.422 0.198

LIFEEXPM 0.423 0.136

LITERACY 0.354 0.485

BABYMORT -0.412 -0.233

GDP_CAP 0.357 -0.360

Amalisis Faktor dari data kependudukan Negara-negara di Asia

MTB > factor c2-c8;

SUBC> nfactor 2.

Principal Component Factor Analysis of the Correlation Matrix

Unrotated Factor Loadings and Communalities

Variable Factor1 Factor2 Communality

DENSITY 0.593 -0.723 0.874

URBAN 0.905 -0.299 0.909

LIFEEXPF 0.972 0.214 0.991

LIFEEXPM 0.976 0.147 0.974

LITERACY 0.817 0.525 0.943

BABYMORT -0.951 -0.252 0.967

GDP_CAP 0.823 -0.389 0.829

Variance 5.3171 1.1709 6.4880

% Var 0.760 0.167 0.927

Besarnya bobot untuk faktor1 adalah :(koefisien PC1)

Besarnya bobot untuk faktor2 adalah : (koefisien PC2)

VariableFactor1Factor2

DENSITY0.593-0.723

URBAN0.905-0.299

LIFEEXPF0.9720.214

LIFEEXPM0.9760.147

LITERACY0.8170.525

BABYMORT-0.951-0.252

GDP_CAP0.823-0.389

Variabel asal (density, urban, lifeexpf, lifeexpm, literacy, babymort, gdp_cap) dapat dinyatakan dalam kombinasi linear faktor 1 dan faktor 2 sebagai berikut :

Nilai communality untuk density adalah : 0.5932 +(-0.723)2 = 0.874 yang berarti faktor1 dan faktor2 mampu menjelaskan sebesar 87.4 % keragaman data yang dijelaskan oleh variabel density.Dari harga mutlak nilai bobot tiap variable pada tiap faktor, dapat diintepretasikan bahwa faktor 2 adalah faktor kepadatan penduduk dan faktor 1 adalah faktor urbanisasi dan kualitas penduduk. Kualitas penduduk semakin baik dicirikan oleh semakin tingginya lifeexpf, lifeexpm, literacy, gdp_cap dan semakin rendahnya babymort. Dari contoh ini terlihat bahwa analisis faktor dapat digunakan untuk tujuan pengelompokan variabel. Hasil pengelompokan variabel dengan menggunakan analisis faktor ini sesuai dengan hasil pengelompkam variabel dengam menggunakan metode single-linkage.MTB > Cluv 'DENSITY'-'GDP_CAP';

SUBC> Abscorr;

SUBC> Dendrogram.

Nilai bobot setelah dilakukan rotasi varimax adalah :

MTB > factor c2-c8;SUBC> nfactor 2;

SUBC> vmax.VariableFactor1Factor2

DENSITY0.058-0.933

URBAN0.559-0.772

LIFEEXPF0.914-0.395

LIFEEXPM0.878-0.452

LITERACY0.969-0.052

BABYMORT-0.9180.352

GDP_CAP0.44-0.797

Hasil pengelompokan variabel dengan menggunakan analisis faktor rotasi varimax sesuai dengan hasil pengelompokan dengan menggunakan metode complete-linkageMTB > Cluv 'DENSITY'-'GDP_CAP';

SUBC> Complete;

SUBC> Abscorr;

SUBC> Dendrogram.

Nilai skor faktor untuk setiap negara di Asia adalah sebagai berikut :MTB > Factor 'DENSITY'-'GDP_CAP';

SUBC> NFactors 2;

SUBC> Scores c9-c10.

MTB > name c9 'FACT1' C10 'FACT2'

MTB > PRINT C1 C9 C10NomerCOUNTRYFACT1FACT2

1Afghanistan-1.80314-1.21553

2Bangladesh-1.16613-0.83735

3Cambodia-1.34366-0.60378

4China-0.115900.81265

5Hong Kong1.54091-2.13451

6India-0.72722-0.12959

7Indonesia-0.353200.53269

8Japan1.401120.18927

9Malaysia0.176260.70587

10N. Korea0.395561.00416

11Pakistan-0.92428-0.57199

12Philippines-0.019590.74105

13S. Korea0.666250.50490

14Singapore1.52131-1.65357

15Taiwan0.865010.55149

16Thailand0.052241.13501

17Vietnam-0.165540.96922

Nilai skor faktor dengan menggunakan rotasi varimax untuk setiap negara di Asia adalah sebagai berikut :MTB > Factor 'DENSITY'-'GDP_CAP';

SUBC> NFactors 2;

SUBC> VMax;

SUBC> Scores c11-c12.

MTB > name c11 'F1' c12 'F2'

MTB > print c1 c11 c12

NomerCOUNTRYF1F2

1Afghanistan-2.173480.06927

2Bangladesh-1.435620.00324

3Cambodia-1.442930.29653

4China0.381490.72684

5Hong Kong0.00072-2.63258

6India-0.665570.32040

7Indonesia0.025250.63865

8Japan1.24700-0.66630

9Malaysia0.555940.46930

10N. Korea0.908320.58290

11Pakistan-1.084220.07693

12Philippines0.417700.61242

13S. Korea0.835720.01964

14Singapore0.26622-2.23110

15Taiwan1.02417-0.05887

16Thailand0.706460.88988

17Vietnam0.432840.88286

Secara visual, hasil pengelompokan Negara-negara di Asia dengan menggunakan skor komponen ataun skor faktor adalah sama.Hasil pengelompokan negara-negara di Asia dengan menggunakan analisis komponen utama dan analisis faktor ternyata sama dengan hasil dari cluster analysis dengan menggunakan metode complete linkage* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * Dendrogram using Complete Linkage

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25

Label Num +---------+---------+---------+---------+---------+

China 4 Philippines 12 Vietnam 17 Malaysia 9 Indonesia 7 N. Korea 10 Thailand 16 S. Korea 13 Taiwan 15 Japan 8 Hong Kong 5 Singapore 14 Bangladesh 2 Cambodia 3 Pakistan 11 India 6 Afghanistan 1 _1200372519.unknown

_1200375430.unknown

_1200382512.unknown

_1201052541.unknown

_1201053143.unknown

_1200388444.unknown

_1200382962.unknown

_1200375707.unknown

_1200379729.unknown

_1200380070.unknown

_1200375484.unknown

_1200373105.unknown

_1200374291.unknown

_1200374724.unknown

_1200373150.unknown

_1200373574.unknown

_1200373085.unknown

_1200373039.unknown

_1200370959.unknown

_1200371102.unknown

_1200367128.unknown