BAB III METODOLOGI PENELITIAN 3.1 Jenis dan … matriks simpangan baku dengan unsur diagonal utama...
Transcript of BAB III METODOLOGI PENELITIAN 3.1 Jenis dan … matriks simpangan baku dengan unsur diagonal utama...
BAB III
METODOLOGI PENELITIAN
3.1 Jenis dan Sumber Data
Data yang digunakan pada penelitian ini berupa data sekunder yang
bersumber dari publikasi-publikasi BPS, yaitu Data Produk Domestik Regional
Bruto (PDRB) Provinsi Jawa Timur Tahun 2005-2010, Data PDRB
Kabupaten/Kota se-Jawa Timur Tahun 2010, Jawa Timur Dalam Angka 2011,
Statistik Potensi Desa Provinsi Jawa Timur Tahun 2008, Data Makro Ekonomi
dan Sosial Provinsi Jawa Timur Tahun 2005-2010 dan Hasil Survei Sosial
Ekonomi Nasional Provinsi Jawa Timur Tahun 2010.
3.2 Metode Analisis
Metode analisis yang digunakan dalam penelitian ini adalah analisis
data dengan banyak peubah (Multivariate), yaitu Analisis Komponen Utama
yang dirangkai dengan Analisis Faktor. Tujuan kedua analisis ini adalah untuk
mereduksi banyaknya dimensi peubah yang saling berkorelasi menjadi suatu
set kombinasi linier baru yang tidak saling berkorelasi akan tetapi masih
mempertahankan sebagian besar keragaman data asli (original variable).
Selanjutnya, sesuai dengan salah satu tujuan penelitian, kabupaten/kota yang
ada di Provinsi Jawa Timur diklasifikasikan berdasarkan kinerja
pembangunannya. Untuk itu, digunakan Analisis Cluster. Keseluruhan proses
analisis dilakukan dengan bantuan program SPSS 19.
30
3.2.1 Analisis Komponen Utama
Analisis Komponen Utama (AKU) digunakan untuk mengetahui apakah
penelitian ini layak untuk analisis lebih lanjut dalam hal ini Analisis Faktor, di
lihat dari nilai Kaiser Meyer Olkin (KMO) dan uji Bartlett.
Analisis Komponen Utama (AKU) atau Principal Component Analysis
(PCA) adalah suatu teknik menyusutkan (reduksi) data dimana tujuan utamanya
untuk mengurangi banyaknya dimensi peubah yang saling berkorelasi menjadi
peubah-peubah baru {disebut Komponen Utama (KU)} yang tidak berkorelasi
dengan mempertahankan sebanyak mungkin keragaman dalam himpunan data
tersebut. Artinya dengan dimensi yang lebih kecil diharapkan lebih mudah
melakukan penafsiran atau interpretasi tanpa kehilangan banyak informasi tentang
data. Banyaknya KU (peubah baru) yang terbentuk diharapkan seminimal
mungkin, akan tetapi mampu menerangkan keragaman total yang maksimal.
Secara aljabar linier, komponen utama merupakan kombinasi-kombinasi
linier dan p peubah acak X1, X2, X3, X4,…., Xp. Secara geometris kombinasi linier
ini merupakan sistem koordinat baru yang didapat dari rotasi sistem semula
dengan X1, X2, X3, .…., Xp sebagai sumbu koordinat. Sumbu baru tersebut
merupakan arah dengan variabilitas maksimum dan memberikan kovariasi yang
lebih sederhana. Sebagai catatan, dalam Analisis Komponen Utama, asumsi
populasi mengikuti distribusi Normal Multivariate tidak diperlukan.
Komponen utama yang dibentuk merupakan kombinasi linear dari peubah-
peubah asli, dimana koefisiennya adalah vektor ciri (eigen vector). Vektor ciri
dihasilkan dari akar ciri (eigen value) matriks kovarian atau matriks korelasi.
31
Penggunaan matriks kovarian atau matriks korelasi tergantung dari kesamaan
satuan peubah-peubah yang dianalisis. Apabila satuannya sama digunakan matriks
kovarian, sedang bila tidak sama digunakan matriks korelasi.
Bila komponen utama diturunkan dari populasi normal multivariate
dengan random vektor '21 ,...,, PXXXX dan vektor mean '21 ,...,, pμ
dan matriks kovarians Σ dengan akar ciri (eigen value) yaitu
0...21 p didapat kombinasi linier komponen utama adalah:
pp XeXeXe 1221111 ... XeY'
11
pp XeXeXe 2222112 ... XeY'
22
….
ppppp XeXeXe ...2211XeY'
pp (1)
Maka: Varian iii ee'Y (2)
Kovarian kiki ee'Y,Y (3)
i , k = 1, 2, …, p
Syarat untuk membentuk komponen utama yang merupakan kombinasi
linear dari peubah X agar mempunyai varian maksimum adalah dengan memilih
vektor ciri (eigen vector) yaitu '21 ,...,, peeee sedemikian hingga varian
kii ee'Y maksimum dan 1ii ee'
Komponen utama pertama adalah kombinasi linear Xe'1 yang
memaksimumkan var Xe'1 dengan syarat 1' 11 ee
32
Komponen utama kedua adalah kombinasi linier Xe'2 yang
memaksimumkan var )( 2 Xe' dengan syarat 1' 22 ee
Komponen utama ke-i adalah kombinasi linier Xe'i yang memaksimumkan
var )( Xe'i dengan syarat 1' ii ee dan kov 0Xe'X,e' ki untuk k < i.
Antar komponen utama tersebut tidak berkorelasi dan mempunyai variasi
yang sama dengan akar ciri dari Σ. Akar ciri dari matriks ragam peragam Σ
merupakan varian dari komponen utama Y, sehingga matriks ragam peragam dari
Y adalah:
p
...0
.....
.....
0..0
0..0
2
1
Σ
Total keragaman peubah asal akan sama dengan total keragaman yang
diterangkan oleh komponen utama yaitu:
p
j
ip
p
j
Ytr1
21
1
var...var ΣX i (4)
Penyusutan dimensi dari peubah asal dilakukan dengan mengambil
sejumlah kecil komponen yang mampu menerangkan bagian terbesar keragaman
data. Apabila komponen utama yang diambil sebanyak q komponen, di mana
q < p, maka proporsi dari keragaman total yang bisa diterangkan oleh komponen
utama ke-i adalah:
atau (5)
qjp
p
j
q
j
q
,...,3,2,1%,100
%100...
1
21
33
Penurunan komponen utama dari matriks korelasi dilakukan apabila data
sudah terlebih dahulu ditransformasikan kedalam bentuk baku Z. Transformasi ini
dilakukan terhadap data yang satuan pengamatannya tidak sama. Bila peubah
yang diamati ukurannya pada skala dengan perbedaan yang sangat lebar atau
satuan ukurannya tidak sama, maka peubah tersebut perlu dibakukan
(standardized).
Peubah baku (Z) didapat dari transformasi terhadap peubah asal dalam
matriks berikut:
μXVZ11/2
(6)
V1/2
adalah matriks simpangan baku dengan unsur diagonal utama adalah 2/1
ii
sedangkan unsur lainnya adalah nol. Nilai harapan E (Z) = 0 dan keragamannya
adalah ρVV(Z)11/211/2
Cov (7)
Dengan demikian komponen utama dari Z dapat ditentukan dari vektor ciri
yang didapat melalui matriks korelasi peubah asal ρ. Untuk mencari akar ciri dan
menentukan vektor pembobotnya sama seperti pada matriks Σ. Sementara teras
matriks korelasi ρ akan sama dengan jumlah p peubah yang dipakai.
Penetapan banyaknya KU untuk dapat ditafsirkan dengan baik dapat
dilihat dari:
1. Proporsi keragaman kumulatif dari KU
Menurut Morrison (1990), banyaknya KU yang dipilih sudah cukup
memadai apabila KU tersebut mempunyai persentase keragaman kumulatif tidak
kurang dari 75% dari total keragaman data. Sedangkan Johnson dan Wichern
(2002) mengisyaratkan bahwa KU dengan kondisi persentase keragaman
34
kumulatif sebesar 80-90%, dapat menggambarkan data asalnya.
Keragaman total KU:
p
i 1
Var (Yi) = 1+2+…+p
= p
i 1
i (8)
2. Nilai dari akar ciri
Pemilihan komponen utama yang digunakan, didasarkan pada nilai akar
cirinya. Menurut Kaiser (dalam Ekaria, 2004), pemilihan KU berdasarkan
pendekatan akar ciri yang nilainya 1.
AKU seringkali disajikan dalam tahap pertengahan dalam penelitian yang
lebih besar. KU bisa merupakan masukan pada Analisis Faktor atau Analisis
Cluster.
KU terpilih selanjutnya digunakan sebagai pembentuk peubah dalam
Analisis Faktor. Langkah selanjutnya adalah melakukan pengujian terhadap
matriks korelasi dari data yang menjadi objek pengamatan. Matriks korelasi
digunakan untuk melihat keeratan hubungan antara peubah yang satu dengan
peubah yang lain. Ada dua macam pengujian yang dapat dilakukan terhadap
matriks korelasi, yaitu:
o Uji Bartlett
Pengujian ini dilakukan untuk melihat apakah matrik korelasinya bukan
merupakan suatu matrik identitas, jika matrik korelasinya merupakan matrik
identitas, maka tidak ada korelasi antarpeubah yang digunakan. Uji ini dipakai
bila sebagian besar dari koefisien korelasi kurang dari 0,5. Langkah-langkahnya
adalah:
35
1. Hipotesis
Ho : Matriks korelasi merupakan matriks identitas
H1 : Matriks korelasi bukan merupakan matriks identitas
2. Statistik uji
Rln
6
5212
pN
(9)
N = Jumlah observasi p = Jumlah peubah
R = Determinan dari matriks korelasi
3. Keputusan
Uji Bartlett akan menolak H0 jika nilai
2 2
1 2obs p p , / (10)
o Uji Kaiser Meyer Olkin (KMO)
Uji KMO digunakan untuk mengetahui apakah metode penarikan sampel
yang digunakan memenuhi syarat atau tidak. Disamping itu, uji KMO dalam
Analisis Faktor berguna untuk mengetahui apakah data yang digunakan dapat
dianalisis lebih lanjut atau tidak dengan Analisis Faktor. Rumusan uji KMO adalah
i i ji
ij
ji
ij
i ji
ij
ar
r
KMO22
2
; i = 1,2,…,p ; j = 1,2,…,p (11)
di mana: rij = Koefisisen korelasi sederhana antara peubah i dan j
aij = Koefisien korelasi parsial antara peubah i dan j
Adapun penilaian uji KMO dari matrik antarpeubah adalah sebagai berikut:
0,90<KMO<1,00 ; data sangat baik untuk analisis faktor.
36
0,80<KMO<0,90 ; data baik untuk analisis faktor.
0,70<KMO<0,80 ; data agak baik untuk analisis faktor.
0,60<KMO<0,70 ; data lebih dari cukup untuk analisis faktor.
0,50<KMO<0,60 ; data cukup untuk analisis faktor.
KMO<0,50 ; data tidak layak untuk uji lebih lanjut dengan analisis fak-
tor.
3.2.2 Analisis Faktor
Analisis faktor adalah suatu analisis data untuk mengetahui faktor-faktor
yang dominan dalam menjelaskan suatu masalah. Menurut Johnson dan Wichern
(2002) yang dimaksud dengan analisis faktor adalah:
1. Pengembangan dari AKU yang lebih terperinci dan teliti.
2. Mengecek konsistensi data terhadap struktur peubah.
Sedangkan kegunaan dari Analisis Faktor (Supranto, 2004) adalah:
1. Untuk mengidentifikasi dimensi yang mendasari (underlying dimensions) atau
faktor, yang menjelaskan korelasi antara suatu set variabel.
2. Untuk mengidentifikasi suatu set variabel baru yang tidak berkorelasi (inde-
pendent) yang lebih sedikit untuk menggantikan suatu set variabel asli yang
saling berkorelasi.
3. Untuk mengidentifikasi suatu set variabel yang penting dari suatu set variabel
yang banyak.
Analisis Faktor pada dasarnya bertujuan untuk mendapatkan sejumlah
kecil faktor/komponen utama yang memiliki sifat berikut (Ekaria, 2004):
1. Mampu menerangkan semaksimum mungkin keragaman data.
37
2. Terdapatnya kebebasan antarfaktor.
3. Tiap faktor dapat diinterpretasikan sejelas-jelasnya.
Perbedaan antara Analisis Faktor dan Analisis Komponen Utama adalah:
1. Pada Analisis Komponen Utama, tujuannya adalah untuk memilih sejumlah
peubah baru (yang disebut sebagai komponen utama) yang menjelaskan total
variasi dalam set data sebesar – besarnya,
2. Pada Analisis Faktor, tujuan utamanya adalah memilih faktor-faktor yang
dapat menjelaskan keterkaitan (Interrelationship) antar peubah asli. Dengan
perkataan lain, Analisis Faktor bertujuan untuk menjelaskan arti peubah-
peubah dalam set data.
Pada Analisis Faktor diperlukan nilai estimasi dari faktor-faktor bersama
yang disebut dengan skor faktor. Berdasarkan skor faktor pada setiap observasi,
kita dapat menyatakan untuk masing – masing observasi tinggi rendahnya nilai
skor faktornya. Skor faktor tertentu menunjukkan penting tidaknya peranan
faktor-faktor tersebut bagi observasi itu. Skor faktor benilai negatif, nol dan
positif, dimana jika nilainya semakin besar maka semakin besarlah peranan faktor
tersebut terhadap suatu permasalahan pada observasi yang kita teliti.
Secara umum, model Analisis Faktor adalah sebagai berikut :
X1 - 1 = 11F1 + 12F2 + 13F3 +…………..+ 1mFm + 1
X2 - 2 = 21F1 + 22F2 + 23F3 +…………..+ 2mFm +
X3 - 3 = 31F1 + 32F2 + 33F3 +…………..+ 3mFm +
38
Xp - p = p1F1 + p2F2 + p3F3 +…………..+ pmFm + p (12)
Atau dalam notasi matriks, dituliskan
Xpx1 - px1 = LpxmFmx1 + px1 (13)
di mana :
Fj = Faktor Umum ; j = 1,2,……m; m<p
i = Faktor Spesifik ; i = 1,2,….p
i = rata–rata peubah ke i
ij = loading untuk peubah ke –i pada faktor ke –j
L = Matriks faktor loading
dengan asumsi:
1. E(F) =0
2. Var (F) = E (FF') = Imxm
3. E () = 0
4. Var () = E(') =
Cov (F') = E (F') =0, sehingga F dan independent
Adapun struktur kovarian untuk model adalah:
1. Cov (X) = LL' + ψ (14)
Var (Xi) = iijii lll 22
2
2
1 ...
222
2
2
2
2
1
2
11 ..., jmimjijij llllllYXCov
2. Cov (X,F) = L (15)
Cov (X1,Fj) = lij
39
Model (X-μ) = LF + ε adalah linier dalam faktor bersama. Bagian dari Var
(Xi) yang dapat diterangkan oleh faktor bersama disebut communality ke-i.
Sedangkan bagian dari Var (Xi) karena faktor spesifik disebut varian spesifik ke-i.
iiiimiiii hlll 222
2
2
1 ... (16)
di mana:
hi2 = communality
ψi = varian spesifik ke-i
Dalam praktek, matriks ragam peragam di taksir dengan matriks ragam
peragam sampel S dan matrik korelasi ρ peubah ditaksir dengan matriks korelasi
R. Dalam hal ini, paket progarm SPSS/PC+ langsung menggunakan matriks
korelasi R sebagai matriks ragam peragam dalam menghitung akar ciri dan vektor
ciri maupun analisis faktornya.
Faktor-faktor yang diperoleh melalui metode komponen utama pada
umumnya masih sulit diinterpretasikan secara langsung. Untuk itu dilakukan
manipulasi dengan cara merotasi loading L dengan menggunakan metode Rotasi
Tegak Lurus Varimax (Varimax Orthogonal Rotation) sesuai dengan saran
beberapa ahli, karena rotasi tegak lurus varimax lebih mendekati kenyataan
dibanding yang lain. Rotasi varimax adalah rotasi yang memaksimalkan faktor
pembobot, dan mengakibatkan korelasi variabel-variabel dengan suatu faktor
mendekati satu, serta korelasi dengan faktor lainnya mendekati nol, sehingga
mudah diinterpretasikan. Dari rotasi tersebut menghasilkan matriks loading baru
L*, yaitu:
L*
(pxq) = L(pxq) . T(qxq) (17)
40
di mana T adalah matriks transformasi yang dipilih sehingga,
T'T = TT' = I (18)
Matriks transformasi T ditentukan sedemikian serupa hingga total
keragaman kuadrat loading L, yaitu:
q
j
p
i
p
i i
ij
i
ijp
hhp 1 1
2
1
24
/1
V (19)
menjadi maksimum, di mana:
q
1i
V (keragaman dari kuadrat loading untuk faktor ke-j)
22
2
2
1
2 ... iqiiih (komunalitas, yaitu jumlah varians dari suatu variable ke-i
yang dapat dijelaskan oleh sejumlah m common factors).
Dari perumusan diatas, rotasi merupakan suatu upaya untuk menghasilkan
faktor penimbang baru yang lebih mudah diinterpretasikan yaitu dengan
mengalikan faktor penimbang awal dengan matriks transformasi yang bersifat
orthogonal, sehingga matriks korelasinya tidak akan berubah. Dari merotasi
matriks loading tadi menyebabkan setiap variabel asal mempunyai korelasi yang
tinggi dan faktor tertentu saja, sedangkan dengan faktor lain mempunyai korelasi
relatif rendah sehingga pada akhirnya setiap faktor akan lebih mudah
diinterpretasikan.
3.2.3 Analisis Cluster
Analisis Cluster bertujuan untuk memisahkan obyek ke dalam beberapa
kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang
lain. Dalam analisis ini tiap-tiap kelompok bersifat homogen antar anggota dalam
41
kelompok atau variasi obyek dalam satu kelompok yang terbentuk sekecil
mungkin. Analisis ini digunakan untuk mengelompokan n individu (unit
observasi) dengan p peubah ke dalam k kelompok. Bila yang akan dikelompokan
berupa obyek maka pendekatan ukuran kemiripan biasanya ditunjukkan oleh
ukuran jarak. Salah satu ukuran kemiripan yang digunakan adalah jarak euclidean.
Jarak euclidean antar dua obyek Xi = [X1, X2, ..., XP] dan Yj = [Y1, Y2, ..., YP]
yang berdimensi p adalah:
22
22
2
11, ... PPYX YXYXYXD
= YXYX'
(20)
Sehingga akan diperoleh matrik jarak sebagai berikut:
0...
.0..
...0
...0
21
221
112
nn
n
n
dd
dd
dd
D
Semakin kecil nilai D, maka semakin besar kemiripan antara kedua
pengamatan tersebut. Sebaliknya bila D besar, semakin besar ketidakmiripan dari
pengamatan tersebut.
Asumsi yang harus dipenuhi dalam penerapan Analisis Cluster adalah:
1. Sampel yang diambil harus dapat mewakili populasi yang ada.
Dalam penelitian ini, digunakan data populasi, sehingga asumsi ini tidak perlu
diuji lagi.
2. Multikolinieritas
Multikolinieritas adalah kemungkinan adanya korelasi antar peubah bebas.
42
Sebaiknya tidak ada atau seandainya ada, besar multikolinieraitas tersebut
tidaklah tinggi yaitu kurang dari 0,8 (Gujarati, 2004). Bila data yang
digunakan dalam Analisis Cluster adalah data skor komponen dari hasil AKU,
maka tidak akan ditemukan lagi adanya Multikolinieritas.
Tahap selanjutnya dalam Analisis Cluster adalah menentukan metode
pengelompokan/klasifikasi. Terdapat dua metode yaitu:
1. Metode Kelompok Hierarki (Hierarchical Clustering Methods)
Metode ini digunakan bila banyaknya kelompok yang diinginkan belum
diketahui. Metode ini paling banyak digunakan karena pembentukan
kelompoknya bersifat alamiah. Pengelompokannya disajikan secara visual
berbentuk dendogram yaitu suatu bagan yang menyajikan banyaknya kelompok
terbesar hingga terkecil. Cara menentukan banyaknya kelompok yang tepat
didasarkan pada jumlah anggota kelompok yang relatif merata.
Proses pengelompokan diawali dengan memandang setiap obyek (n)
sebagai sebuah kelompok, sehingga jumlah kelompok sebanyak jumlah obyeknya.
Dua obyek/kelompok yang paling mirip (dalam hal ini dilihat dari jarak) adalah
obyek yang pertama kali digabungkan menjadi satu kelompok, sehingga jumlah
kelompok menjadi n-1. jarak kelompok baru dengan kelompok sebelumnya di
hitung kembali. Prosedur ini diulang sampai akhirnya kemiripan berkurang,
sehingga semua kelompok tergabung dalam suatu kelompok tunggal.
Pada pengelompokan Hirarki terdapat tiga jenis metode, yaitu:
43
(1) Metode Pautan Tunggal (Single Linkage)
Metode ini di lakukan dengan meminimumkan jarak antara kelompok
yang di gabungkan. Jarak antar kelompok di bentuk dari individu-individu dalam
dua kelompok yang mempunyai jarak terkecil atau kemiripan terbesar. Proses
dimulai dengan menentukan jarak terkecil dalam D = {dih} dan gabungkan obyek-
obyek, misal U dan V, untuk memperoleh kelompok I atau {UV}, maka jarak
antara {UV} dan kelompok W yang lain adalah:
D(UV)W = min {dUW , dVW} (21)
di mana:
dUW adalah jarak terdekat dari kelompok U dan W
dVW adalah jarak terdekat dari kelompok V dan W
(2) Metode Pautan Lengkap (Complete Linkage)
Dalam metode ini, jarak antar kelompok dibentuk dari individu-individu
dalam dua kelompok yang mempunyai jarak yang paling jauh. Jadi pautan
lengkap memastikan bahwa semua individu dalam suatu kelompok berada dalam
jarak maksimum pada masing-masing kelompok yang lain.
Pengelompokan dimulai dengan mencari jarak pada D = {dih} dan
penggabungan antara U dan V untuk mendapatkan kelompok I (UV). Selanjutnya
jarak antara (UV) dan setiap kelompok W dihitung dengan:
D(UV)W = max {dUW , dVW} (22)
di mana:
dUW adalah jarak kelompok yang paling jauh U dan W
dVW adalah jarak kelompok yang paling jauh V dan W
44
(3) Metode Rataan Grup (Group Average)
Metode ini dilakukan dengan meminimumkan rata-rata jarak antara semua
pasangan individu dari kelompok yang digabungkan. Proses pengelompokan
dimulai dengan mencari jarak D = {dih} untuk mendapatkan obyek yang terdekat.
Kelompok ini dihubungkan untuk membentuk kelompok I atau (UV). Selanjutnya
jarak antara (UV) dengan kelompok W lainnya ditentukan dengan:
WV
VU
V
WU
VU
U
WUV dnn
nd
nn
nd
(23)
(4) Metode Sentroid (Centroid)
Ukuran ketidakmiripannya adalah:
UV
VU
VUWV
VU
VWU
VU
UWUV d
nn
nnd
nn
nd
nn
nd
2
(24)
(5) Median
Pada metode ini jarak antara dua gerombol yang terbentuk adalah:
UVWVWUWUV dddd4
1
2
1
2
1 (25)
(6) Ragam Minimum (Minimum Variance)
Ukuran ketidakmiripan yang digunakan ialah:
WVU
UVWWVWVWUVU
WUVnnn
dndnndnnd
(27)
di mana:
Un = banyaknya obyek dalam gerombol U
Vn = banyaknya obyek dalam gerombol V
Wn = banyaknya obyek dalam gerombol W
45
2. Metode Non Hierarki
Metode ini digunakan bila banyaknya kelompok yang akan dibentuk telah
diketahui lebih dahulu. Sifat pengelompokannya tidak alamiah karena telah di
kondisikan untuk jumlah kelompok tertentu. Proses pengelompokan dimulai
dengan menentukan nilai k yang merupakan pusat kelompok, dengan cara random
dari data.
Metode non hierarki yang sering digunakan adalah metode K_Means,
yaitu metode yang bertujuan mengelompokan data sedemikian hingga jarak tiap-
tiap data ke pusat kelompok dalam satu kelompok minimum.
Analisis Cluster yang digunakan dalam penelitian ini adalah metode tidak
berhierarki (K-means Clustering). Banyaknya gerombol (cluster) yang ingin
dibentuk terlebih dahulu ditentukan. Didalam metode ini diasumsikan bahwa
analisis terdiri dari n individu dan p pengukuran. X (i,j) adalah nilai dari individu
ke-i dalam variabel ke-j; i = 1,2,…,n dan j = 1,2,…,p. Misal P (n,K) adalah
pengelompokan yang merupakan hasil dari masing-masing individu yang
dialokasikan ke dalam sebuah gerombol (cluster) 1,2,…,K. Rata-rata variabel ke-j
dalam gerombol (cluster) ke-l akan dinotasikan dengan X (l,j), dan jumlah
individu-individu yang termasuk dalam gerombol (cluster) ke-l dinyatakan dengan
n(l). Dalam notasi ini kita dapat menampilkan jarak antara individu ke-i dan
gerombol ke-l sebagai berikut:
p
j
jlXjiXliD1
212)),(),((),( (28)
46
dengan komponen kesalahan tiap-tiap kelompok dapat didefinisikan sebagai
berikut:
2
1
)(,),(
n
i
iliDKnPE (29)
di mana l(i) adalah gerombol (cluster) yang terdiri individu ke-i, dan D[i,l(i)]
adalah jarak Euclidean antara individu i dan rata-rata klaster yang terdiri dari
individu. Prosedur untuk pengelompokan adalah mengikuti langkah-langkah:
mencari pengelompokan dengan komponen kesalahan E yang kecil dengan
menempatkan individu-individu dari satu kelompok ke kelompok lainnya sampai
tidak terjadi perpindahan hasil individu dalam pereduksian E.
Dalam melakukan Analisis Cluster, sebaiknya pola nilai matriks korelasi
data asal diamati terlebih dahulu. Selanjutnya dihitung persentase korelasi sedang
(0,31-0,75) dan besar (0,76-1,00). Jika persentase korelasi sedang dan besar
berkisar antara 10 hingga 80 persen, maka data skor faktor dapat memberikan
hasil yang lebih baik daripada data asal untuk proses penggerombolan (Handayani
dalam Naibaho, 2003).
Kemudian dari hasil Analisis Cluster tersebut, dapat diketahui rata-rata
maupun standar deviasi masing-masing indikator pada tiap kelompok. Dalam
penelitian ini, indikator-indikator dari masing-masing kelompok dikategorikan
menjadi lima tingkatan yaitu sangat rendah, rendah, sedang, tinggi ataupun sangat
tinggi untuk mendapatkan informasi yang lebih cermat. Penentuan tingkatan
kategori tersebut mengacu pada penelitian Abdullah (2008) dengan batasan
pengkategorian sebagaimana terlihat pada Tabel 3.1. Untuk mempermudah
penilaian, masing-masing kategori dikonversikan dalam bentuk angka.
47
Tabel 3.1 Kategori, Nilai Konversi dan Nilai Selang Skor Faktor
Kategori Nilai Konversi Nilai Selang
(1) (2) (3)
Sangat Tinggi 5 ( j + 1,5Sj) < SF
Tinggi 4 ( j + 0,5Sj) < SF ≤ ( j + 1,5Sj)
Sedang 3 ( j - 0,5Sj) < SF ≤ ( j + 0,5Sj)
Rendah 2 ( j - 1,5Sj) < SF ≤ ( j - 0,5Sj)
Sangat Rendah 1 SF ≤ ( j - 1,5Sj)
Sumber: Abdullah, 2008, diolah.
di mana:
j = 1,2,3…n, n = banyaknya kelompok
j = rata-rata total peubah j
Sj
= standar deviasi peubah j
SF = skor faktor