BAB III METODOLOGI PENELITIAN 3.1 Jenis dan … matriks simpangan baku dengan unsur diagonal utama...

BAB III

METODOLOGI PENELITIAN

3.1 Jenis dan Sumber Data

Data yang digunakan pada penelitian ini berupa data sekunder yang

bersumber dari publikasi-publikasi BPS, yaitu Data Produk Domestik Regional

Bruto (PDRB) Provinsi Jawa Timur Tahun 2005-2010, Data PDRB

Kabupaten/Kota se-Jawa Timur Tahun 2010, Jawa Timur Dalam Angka 2011,

Statistik Potensi Desa Provinsi Jawa Timur Tahun 2008, Data Makro Ekonomi

dan Sosial Provinsi Jawa Timur Tahun 2005-2010 dan Hasil Survei Sosial

Ekonomi Nasional Provinsi Jawa Timur Tahun 2010.

3.2 Metode Analisis

Metode analisis yang digunakan dalam penelitian ini adalah analisis

data dengan banyak peubah (Multivariate), yaitu Analisis Komponen Utama

yang dirangkai dengan Analisis Faktor. Tujuan kedua analisis ini adalah untuk

mereduksi banyaknya dimensi peubah yang saling berkorelasi menjadi suatu

set kombinasi linier baru yang tidak saling berkorelasi akan tetapi masih

mempertahankan sebagian besar keragaman data asli (original variable).

Selanjutnya, sesuai dengan salah satu tujuan penelitian, kabupaten/kota yang

ada di Provinsi Jawa Timur diklasifikasikan berdasarkan kinerja

pembangunannya. Untuk itu, digunakan Analisis Cluster. Keseluruhan proses

analisis dilakukan dengan bantuan program SPSS 19.

30

3.2.1 Analisis Komponen Utama

Analisis Komponen Utama (AKU) digunakan untuk mengetahui apakah

penelitian ini layak untuk analisis lebih lanjut dalam hal ini Analisis Faktor, di

lihat dari nilai Kaiser Meyer Olkin (KMO) dan uji Bartlett.

Analisis Komponen Utama (AKU) atau Principal Component Analysis

(PCA) adalah suatu teknik menyusutkan (reduksi) data dimana tujuan utamanya

untuk mengurangi banyaknya dimensi peubah yang saling berkorelasi menjadi

peubah-peubah baru {disebut Komponen Utama (KU)} yang tidak berkorelasi

dengan mempertahankan sebanyak mungkin keragaman dalam himpunan data

tersebut. Artinya dengan dimensi yang lebih kecil diharapkan lebih mudah

melakukan penafsiran atau interpretasi tanpa kehilangan banyak informasi tentang

data. Banyaknya KU (peubah baru) yang terbentuk diharapkan seminimal

mungkin, akan tetapi mampu menerangkan keragaman total yang maksimal.

Secara aljabar linier, komponen utama merupakan kombinasi-kombinasi

linier dan p peubah acak X1, X2, X3, X4,…., Xp. Secara geometris kombinasi linier

ini merupakan sistem koordinat baru yang didapat dari rotasi sistem semula

dengan X1, X2, X3, .…., Xp sebagai sumbu koordinat. Sumbu baru tersebut

merupakan arah dengan variabilitas maksimum dan memberikan kovariasi yang

lebih sederhana. Sebagai catatan, dalam Analisis Komponen Utama, asumsi

populasi mengikuti distribusi Normal Multivariate tidak diperlukan.

Komponen utama yang dibentuk merupakan kombinasi linear dari peubah-

peubah asli, dimana koefisiennya adalah vektor ciri (eigen vector). Vektor ciri

dihasilkan dari akar ciri (eigen value) matriks kovarian atau matriks korelasi.

31

Penggunaan matriks kovarian atau matriks korelasi tergantung dari kesamaan

satuan peubah-peubah yang dianalisis. Apabila satuannya sama digunakan matriks

kovarian, sedang bila tidak sama digunakan matriks korelasi.

Bila komponen utama diturunkan dari populasi normal multivariate

dengan random vektor '21 ,...,, PXXXX dan vektor mean '21 ,...,, pμ

dan matriks kovarians Σ dengan akar ciri (eigen value) yaitu

0...21 p didapat kombinasi linier komponen utama adalah:

pp XeXeXe 1221111 ... XeY'

11

pp XeXeXe 2222112 ... XeY'

22

….

ppppp XeXeXe ...2211XeY'

pp (1)

Maka: Varian iii ee'Y (2)

Kovarian kiki ee'Y,Y (3)

i , k = 1, 2, …, p

Syarat untuk membentuk komponen utama yang merupakan kombinasi

linear dari peubah X agar mempunyai varian maksimum adalah dengan memilih

vektor ciri (eigen vector) yaitu '21 ,...,, peeee sedemikian hingga varian

kii ee'Y maksimum dan 1ii ee'

Komponen utama pertama adalah kombinasi linear Xe'1 yang

memaksimumkan var Xe'1 dengan syarat 1' 11 ee

32

Komponen utama kedua adalah kombinasi linier Xe'2 yang

memaksimumkan var )( 2 Xe' dengan syarat 1' 22 ee

Komponen utama ke-i adalah kombinasi linier Xe'i yang memaksimumkan

var )( Xe'i dengan syarat 1' ii ee dan kov 0Xe'X,e' ki untuk k < i.

Antar komponen utama tersebut tidak berkorelasi dan mempunyai variasi

yang sama dengan akar ciri dari Σ. Akar ciri dari matriks ragam peragam Σ

merupakan varian dari komponen utama Y, sehingga matriks ragam peragam dari

Y adalah:

p

...0

.....

.....

0..0

0..0

2

1

Σ

Total keragaman peubah asal akan sama dengan total keragaman yang

diterangkan oleh komponen utama yaitu:

p

j

ip

p

j

Ytr1

21

1

var...var ΣX i (4)

Penyusutan dimensi dari peubah asal dilakukan dengan mengambil

sejumlah kecil komponen yang mampu menerangkan bagian terbesar keragaman

data. Apabila komponen utama yang diambil sebanyak q komponen, di mana

q < p, maka proporsi dari keragaman total yang bisa diterangkan oleh komponen

utama ke-i adalah:

atau (5)

qjp

p

j

q

j

q

,...,3,2,1%,100

%100...

1

21

33

Penurunan komponen utama dari matriks korelasi dilakukan apabila data

sudah terlebih dahulu ditransformasikan kedalam bentuk baku Z. Transformasi ini

dilakukan terhadap data yang satuan pengamatannya tidak sama. Bila peubah

yang diamati ukurannya pada skala dengan perbedaan yang sangat lebar atau

satuan ukurannya tidak sama, maka peubah tersebut perlu dibakukan

(standardized).

Peubah baku (Z) didapat dari transformasi terhadap peubah asal dalam

matriks berikut:

μXVZ11/2

(6)

V1/2

adalah matriks simpangan baku dengan unsur diagonal utama adalah 2/1

ii

sedangkan unsur lainnya adalah nol. Nilai harapan E (Z) = 0 dan keragamannya

adalah ρVV(Z)11/211/2

Cov (7)

Dengan demikian komponen utama dari Z dapat ditentukan dari vektor ciri

yang didapat melalui matriks korelasi peubah asal ρ. Untuk mencari akar ciri dan

menentukan vektor pembobotnya sama seperti pada matriks Σ. Sementara teras

matriks korelasi ρ akan sama dengan jumlah p peubah yang dipakai.

Penetapan banyaknya KU untuk dapat ditafsirkan dengan baik dapat

dilihat dari:

1. Proporsi keragaman kumulatif dari KU

Menurut Morrison (1990), banyaknya KU yang dipilih sudah cukup

memadai apabila KU tersebut mempunyai persentase keragaman kumulatif tidak

kurang dari 75% dari total keragaman data. Sedangkan Johnson dan Wichern

(2002) mengisyaratkan bahwa KU dengan kondisi persentase keragaman

34

kumulatif sebesar 80-90%, dapat menggambarkan data asalnya.

Keragaman total KU:

p

i 1

Var (Yi) = 1+2+…+p

= p

i 1

i (8)

2. Nilai dari akar ciri

Pemilihan komponen utama yang digunakan, didasarkan pada nilai akar

cirinya. Menurut Kaiser (dalam Ekaria, 2004), pemilihan KU berdasarkan

pendekatan akar ciri yang nilainya 1.

AKU seringkali disajikan dalam tahap pertengahan dalam penelitian yang

lebih besar. KU bisa merupakan masukan pada Analisis Faktor atau Analisis

Cluster.

KU terpilih selanjutnya digunakan sebagai pembentuk peubah dalam

Analisis Faktor. Langkah selanjutnya adalah melakukan pengujian terhadap

matriks korelasi dari data yang menjadi objek pengamatan. Matriks korelasi

digunakan untuk melihat keeratan hubungan antara peubah yang satu dengan

peubah yang lain. Ada dua macam pengujian yang dapat dilakukan terhadap

matriks korelasi, yaitu:

o Uji Bartlett

Pengujian ini dilakukan untuk melihat apakah matrik korelasinya bukan

merupakan suatu matrik identitas, jika matrik korelasinya merupakan matrik

identitas, maka tidak ada korelasi antarpeubah yang digunakan. Uji ini dipakai

bila sebagian besar dari koefisien korelasi kurang dari 0,5. Langkah-langkahnya

adalah:

35

1. Hipotesis

Ho : Matriks korelasi merupakan matriks identitas

H1 : Matriks korelasi bukan merupakan matriks identitas

2. Statistik uji

Rln

6

5212

pN

(9)

N = Jumlah observasi p = Jumlah peubah

R = Determinan dari matriks korelasi

3. Keputusan

Uji Bartlett akan menolak H0 jika nilai

2 2

1 2obs p p , / (10)

o Uji Kaiser Meyer Olkin (KMO)

Uji KMO digunakan untuk mengetahui apakah metode penarikan sampel

yang digunakan memenuhi syarat atau tidak. Disamping itu, uji KMO dalam

Analisis Faktor berguna untuk mengetahui apakah data yang digunakan dapat

dianalisis lebih lanjut atau tidak dengan Analisis Faktor. Rumusan uji KMO adalah

i i ji

ij

ji

ij

i ji

ij

ar

r

KMO22

2

; i = 1,2,…,p ; j = 1,2,…,p (11)

di mana: rij = Koefisisen korelasi sederhana antara peubah i dan j

aij = Koefisien korelasi parsial antara peubah i dan j

Adapun penilaian uji KMO dari matrik antarpeubah adalah sebagai berikut:

0,90<KMO<1,00 ; data sangat baik untuk analisis faktor.

36

0,80<KMO<0,90 ; data baik untuk analisis faktor.

0,70<KMO<0,80 ; data agak baik untuk analisis faktor.

0,60<KMO<0,70 ; data lebih dari cukup untuk analisis faktor.

0,50<KMO<0,60 ; data cukup untuk analisis faktor.

KMO<0,50 ; data tidak layak untuk uji lebih lanjut dengan analisis fak-

tor.

3.2.2 Analisis Faktor

Analisis faktor adalah suatu analisis data untuk mengetahui faktor-faktor

yang dominan dalam menjelaskan suatu masalah. Menurut Johnson dan Wichern

(2002) yang dimaksud dengan analisis faktor adalah:

1. Pengembangan dari AKU yang lebih terperinci dan teliti.

2. Mengecek konsistensi data terhadap struktur peubah.

Sedangkan kegunaan dari Analisis Faktor (Supranto, 2004) adalah:

1. Untuk mengidentifikasi dimensi yang mendasari (underlying dimensions) atau

faktor, yang menjelaskan korelasi antara suatu set variabel.

2. Untuk mengidentifikasi suatu set variabel baru yang tidak berkorelasi (inde-

pendent) yang lebih sedikit untuk menggantikan suatu set variabel asli yang

saling berkorelasi.

3. Untuk mengidentifikasi suatu set variabel yang penting dari suatu set variabel

yang banyak.

Analisis Faktor pada dasarnya bertujuan untuk mendapatkan sejumlah

kecil faktor/komponen utama yang memiliki sifat berikut (Ekaria, 2004):

1. Mampu menerangkan semaksimum mungkin keragaman data.

37

2. Terdapatnya kebebasan antarfaktor.

3. Tiap faktor dapat diinterpretasikan sejelas-jelasnya.

Perbedaan antara Analisis Faktor dan Analisis Komponen Utama adalah:

1. Pada Analisis Komponen Utama, tujuannya adalah untuk memilih sejumlah

peubah baru (yang disebut sebagai komponen utama) yang menjelaskan total

variasi dalam set data sebesar – besarnya,

2. Pada Analisis Faktor, tujuan utamanya adalah memilih faktor-faktor yang

dapat menjelaskan keterkaitan (Interrelationship) antar peubah asli. Dengan

perkataan lain, Analisis Faktor bertujuan untuk menjelaskan arti peubah-

peubah dalam set data.

Pada Analisis Faktor diperlukan nilai estimasi dari faktor-faktor bersama

yang disebut dengan skor faktor. Berdasarkan skor faktor pada setiap observasi,

kita dapat menyatakan untuk masing – masing observasi tinggi rendahnya nilai

skor faktornya. Skor faktor tertentu menunjukkan penting tidaknya peranan

faktor-faktor tersebut bagi observasi itu. Skor faktor benilai negatif, nol dan

positif, dimana jika nilainya semakin besar maka semakin besarlah peranan faktor

tersebut terhadap suatu permasalahan pada observasi yang kita teliti.

Secara umum, model Analisis Faktor adalah sebagai berikut :

X1 - 1 = 11F1 + 12F2 + 13F3 +…………..+ 1mFm + 1

X2 - 2 = 21F1 + 22F2 + 23F3 +…………..+ 2mFm +

X3 - 3 = 31F1 + 32F2 + 33F3 +…………..+ 3mFm +

38

Xp - p = p1F1 + p2F2 + p3F3 +…………..+ pmFm + p (12)

Atau dalam notasi matriks, dituliskan

Xpx1 - px1 = LpxmFmx1 + px1 (13)

di mana :

Fj = Faktor Umum ; j = 1,2,……m; m<p

i = Faktor Spesifik ; i = 1,2,….p

i = rata–rata peubah ke i

ij = loading untuk peubah ke –i pada faktor ke –j

L = Matriks faktor loading

dengan asumsi:

1. E(F) =0

2. Var (F) = E (FF') = Imxm

3. E () = 0

4. Var () = E(') =

Cov (F') = E (F') =0, sehingga F dan independent

Adapun struktur kovarian untuk model adalah:

1. Cov (X) = LL' + ψ (14)

Var (Xi) = iijii lll 22

2

2

1 ...

222

2

2

2

2

1

2

11 ..., jmimjijij llllllYXCov

2. Cov (X,F) = L (15)

Cov (X1,Fj) = lij

39

Model (X-μ) = LF + ε adalah linier dalam faktor bersama. Bagian dari Var

(Xi) yang dapat diterangkan oleh faktor bersama disebut communality ke-i.

Sedangkan bagian dari Var (Xi) karena faktor spesifik disebut varian spesifik ke-i.

iiiimiiii hlll 222

2

2

1 ... (16)

di mana:

hi2 = communality

ψi = varian spesifik ke-i

Dalam praktek, matriks ragam peragam di taksir dengan matriks ragam

peragam sampel S dan matrik korelasi ρ peubah ditaksir dengan matriks korelasi

R. Dalam hal ini, paket progarm SPSS/PC+ langsung menggunakan matriks

korelasi R sebagai matriks ragam peragam dalam menghitung akar ciri dan vektor

ciri maupun analisis faktornya.

Faktor-faktor yang diperoleh melalui metode komponen utama pada

umumnya masih sulit diinterpretasikan secara langsung. Untuk itu dilakukan

manipulasi dengan cara merotasi loading L dengan menggunakan metode Rotasi

Tegak Lurus Varimax (Varimax Orthogonal Rotation) sesuai dengan saran

beberapa ahli, karena rotasi tegak lurus varimax lebih mendekati kenyataan

dibanding yang lain. Rotasi varimax adalah rotasi yang memaksimalkan faktor

pembobot, dan mengakibatkan korelasi variabel-variabel dengan suatu faktor

mendekati satu, serta korelasi dengan faktor lainnya mendekati nol, sehingga

mudah diinterpretasikan. Dari rotasi tersebut menghasilkan matriks loading baru

L*, yaitu:

L*

(pxq) = L(pxq) . T(qxq) (17)

40

di mana T adalah matriks transformasi yang dipilih sehingga,

T'T = TT' = I (18)

Matriks transformasi T ditentukan sedemikian serupa hingga total

keragaman kuadrat loading L, yaitu:

q

j

p

i

p

i i

ij

i

ijp

hhp 1 1

2

1

24

/1

V (19)

menjadi maksimum, di mana:

q

1i

V (keragaman dari kuadrat loading untuk faktor ke-j)

22

2

2

1

2 ... iqiiih (komunalitas, yaitu jumlah varians dari suatu variable ke-i

yang dapat dijelaskan oleh sejumlah m common factors).

Dari perumusan diatas, rotasi merupakan suatu upaya untuk menghasilkan

faktor penimbang baru yang lebih mudah diinterpretasikan yaitu dengan

mengalikan faktor penimbang awal dengan matriks transformasi yang bersifat

orthogonal, sehingga matriks korelasinya tidak akan berubah. Dari merotasi

matriks loading tadi menyebabkan setiap variabel asal mempunyai korelasi yang

tinggi dan faktor tertentu saja, sedangkan dengan faktor lain mempunyai korelasi

relatif rendah sehingga pada akhirnya setiap faktor akan lebih mudah

diinterpretasikan.

3.2.3 Analisis Cluster

Analisis Cluster bertujuan untuk memisahkan obyek ke dalam beberapa

kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang

lain. Dalam analisis ini tiap-tiap kelompok bersifat homogen antar anggota dalam

41

kelompok atau variasi obyek dalam satu kelompok yang terbentuk sekecil

mungkin. Analisis ini digunakan untuk mengelompokan n individu (unit

observasi) dengan p peubah ke dalam k kelompok. Bila yang akan dikelompokan

berupa obyek maka pendekatan ukuran kemiripan biasanya ditunjukkan oleh

ukuran jarak. Salah satu ukuran kemiripan yang digunakan adalah jarak euclidean.

Jarak euclidean antar dua obyek Xi = [X1, X2, ..., XP] dan Yj = [Y1, Y2, ..., YP]

yang berdimensi p adalah:

22

22

2

11, ... PPYX YXYXYXD

= YXYX'

(20)

Sehingga akan diperoleh matrik jarak sebagai berikut:

0...

.0..

...0

...0

21

221

112

nn

n

n

dd

dd

dd

D

Semakin kecil nilai D, maka semakin besar kemiripan antara kedua

pengamatan tersebut. Sebaliknya bila D besar, semakin besar ketidakmiripan dari

pengamatan tersebut.

Asumsi yang harus dipenuhi dalam penerapan Analisis Cluster adalah:

1. Sampel yang diambil harus dapat mewakili populasi yang ada.

Dalam penelitian ini, digunakan data populasi, sehingga asumsi ini tidak perlu

diuji lagi.

2. Multikolinieritas

Multikolinieritas adalah kemungkinan adanya korelasi antar peubah bebas.

42

Sebaiknya tidak ada atau seandainya ada, besar multikolinieraitas tersebut

tidaklah tinggi yaitu kurang dari 0,8 (Gujarati, 2004). Bila data yang

digunakan dalam Analisis Cluster adalah data skor komponen dari hasil AKU,

maka tidak akan ditemukan lagi adanya Multikolinieritas.

Tahap selanjutnya dalam Analisis Cluster adalah menentukan metode

pengelompokan/klasifikasi. Terdapat dua metode yaitu:

1. Metode Kelompok Hierarki (Hierarchical Clustering Methods)

Metode ini digunakan bila banyaknya kelompok yang diinginkan belum

diketahui. Metode ini paling banyak digunakan karena pembentukan

kelompoknya bersifat alamiah. Pengelompokannya disajikan secara visual

berbentuk dendogram yaitu suatu bagan yang menyajikan banyaknya kelompok

terbesar hingga terkecil. Cara menentukan banyaknya kelompok yang tepat

didasarkan pada jumlah anggota kelompok yang relatif merata.

Proses pengelompokan diawali dengan memandang setiap obyek (n)

sebagai sebuah kelompok, sehingga jumlah kelompok sebanyak jumlah obyeknya.

Dua obyek/kelompok yang paling mirip (dalam hal ini dilihat dari jarak) adalah

obyek yang pertama kali digabungkan menjadi satu kelompok, sehingga jumlah

kelompok menjadi n-1. jarak kelompok baru dengan kelompok sebelumnya di

hitung kembali. Prosedur ini diulang sampai akhirnya kemiripan berkurang,

sehingga semua kelompok tergabung dalam suatu kelompok tunggal.

Pada pengelompokan Hirarki terdapat tiga jenis metode, yaitu:

43

(1) Metode Pautan Tunggal (Single Linkage)

Metode ini di lakukan dengan meminimumkan jarak antara kelompok

yang di gabungkan. Jarak antar kelompok di bentuk dari individu-individu dalam

dua kelompok yang mempunyai jarak terkecil atau kemiripan terbesar. Proses

dimulai dengan menentukan jarak terkecil dalam D = {dih} dan gabungkan obyek-

obyek, misal U dan V, untuk memperoleh kelompok I atau {UV}, maka jarak

antara {UV} dan kelompok W yang lain adalah:

D(UV)W = min {dUW , dVW} (21)

di mana:

dUW adalah jarak terdekat dari kelompok U dan W

dVW adalah jarak terdekat dari kelompok V dan W

(2) Metode Pautan Lengkap (Complete Linkage)

Dalam metode ini, jarak antar kelompok dibentuk dari individu-individu

dalam dua kelompok yang mempunyai jarak yang paling jauh. Jadi pautan

lengkap memastikan bahwa semua individu dalam suatu kelompok berada dalam

jarak maksimum pada masing-masing kelompok yang lain.

Pengelompokan dimulai dengan mencari jarak pada D = {dih} dan

penggabungan antara U dan V untuk mendapatkan kelompok I (UV). Selanjutnya

jarak antara (UV) dan setiap kelompok W dihitung dengan:

D(UV)W = max {dUW , dVW} (22)

di mana:

dUW adalah jarak kelompok yang paling jauh U dan W

dVW adalah jarak kelompok yang paling jauh V dan W

44

(3) Metode Rataan Grup (Group Average)

Metode ini dilakukan dengan meminimumkan rata-rata jarak antara semua

pasangan individu dari kelompok yang digabungkan. Proses pengelompokan

dimulai dengan mencari jarak D = {dih} untuk mendapatkan obyek yang terdekat.

Kelompok ini dihubungkan untuk membentuk kelompok I atau (UV). Selanjutnya

jarak antara (UV) dengan kelompok W lainnya ditentukan dengan:

WV

VU

V

WU

VU

U

WUV dnn

nd

nn

nd

(23)

(4) Metode Sentroid (Centroid)

Ukuran ketidakmiripannya adalah:

UV

VU

VUWV

VU

VWU

VU

UWUV d

nn

nnd

nn

nd

nn

nd

2

(24)

(5) Median

Pada metode ini jarak antara dua gerombol yang terbentuk adalah:

UVWVWUWUV dddd4

1

2

1

2

1 (25)

(6) Ragam Minimum (Minimum Variance)

Ukuran ketidakmiripan yang digunakan ialah:

WVU

UVWWVWVWUVU

WUVnnn

dndnndnnd

(27)

di mana:

Un = banyaknya obyek dalam gerombol U

Vn = banyaknya obyek dalam gerombol V

Wn = banyaknya obyek dalam gerombol W

45

2. Metode Non Hierarki

Metode ini digunakan bila banyaknya kelompok yang akan dibentuk telah

diketahui lebih dahulu. Sifat pengelompokannya tidak alamiah karena telah di

kondisikan untuk jumlah kelompok tertentu. Proses pengelompokan dimulai

dengan menentukan nilai k yang merupakan pusat kelompok, dengan cara random

dari data.

Metode non hierarki yang sering digunakan adalah metode K_Means,

yaitu metode yang bertujuan mengelompokan data sedemikian hingga jarak tiap-

tiap data ke pusat kelompok dalam satu kelompok minimum.

Analisis Cluster yang digunakan dalam penelitian ini adalah metode tidak

berhierarki (K-means Clustering). Banyaknya gerombol (cluster) yang ingin

dibentuk terlebih dahulu ditentukan. Didalam metode ini diasumsikan bahwa

analisis terdiri dari n individu dan p pengukuran. X (i,j) adalah nilai dari individu

ke-i dalam variabel ke-j; i = 1,2,…,n dan j = 1,2,…,p. Misal P (n,K) adalah

pengelompokan yang merupakan hasil dari masing-masing individu yang

dialokasikan ke dalam sebuah gerombol (cluster) 1,2,…,K. Rata-rata variabel ke-j

dalam gerombol (cluster) ke-l akan dinotasikan dengan X (l,j), dan jumlah

individu-individu yang termasuk dalam gerombol (cluster) ke-l dinyatakan dengan

n(l). Dalam notasi ini kita dapat menampilkan jarak antara individu ke-i dan

gerombol ke-l sebagai berikut:

p

j

jlXjiXliD1

212)),(),((),( (28)

46

dengan komponen kesalahan tiap-tiap kelompok dapat didefinisikan sebagai

berikut:

2

1

)(,),(

n

i

iliDKnPE (29)

di mana l(i) adalah gerombol (cluster) yang terdiri individu ke-i, dan D[i,l(i)]

adalah jarak Euclidean antara individu i dan rata-rata klaster yang terdiri dari

individu. Prosedur untuk pengelompokan adalah mengikuti langkah-langkah:

mencari pengelompokan dengan komponen kesalahan E yang kecil dengan

menempatkan individu-individu dari satu kelompok ke kelompok lainnya sampai

tidak terjadi perpindahan hasil individu dalam pereduksian E.

Dalam melakukan Analisis Cluster, sebaiknya pola nilai matriks korelasi

data asal diamati terlebih dahulu. Selanjutnya dihitung persentase korelasi sedang

(0,31-0,75) dan besar (0,76-1,00). Jika persentase korelasi sedang dan besar

berkisar antara 10 hingga 80 persen, maka data skor faktor dapat memberikan

hasil yang lebih baik daripada data asal untuk proses penggerombolan (Handayani

dalam Naibaho, 2003).

Kemudian dari hasil Analisis Cluster tersebut, dapat diketahui rata-rata

maupun standar deviasi masing-masing indikator pada tiap kelompok. Dalam

penelitian ini, indikator-indikator dari masing-masing kelompok dikategorikan

menjadi lima tingkatan yaitu sangat rendah, rendah, sedang, tinggi ataupun sangat

tinggi untuk mendapatkan informasi yang lebih cermat. Penentuan tingkatan

kategori tersebut mengacu pada penelitian Abdullah (2008) dengan batasan

pengkategorian sebagaimana terlihat pada Tabel 3.1. Untuk mempermudah

penilaian, masing-masing kategori dikonversikan dalam bentuk angka.

47

Tabel 3.1 Kategori, Nilai Konversi dan Nilai Selang Skor Faktor

Kategori Nilai Konversi Nilai Selang

(1) (2) (3)

Sangat Tinggi 5 ( j + 1,5Sj) < SF

Tinggi 4 ( j + 0,5Sj) < SF ≤ ( j + 1,5Sj)

Sedang 3 ( j - 0,5Sj) < SF ≤ ( j + 0,5Sj)

Rendah 2 ( j - 1,5Sj) < SF ≤ ( j - 0,5Sj)

Sangat Rendah 1 SF ≤ ( j - 1,5Sj)

Sumber: Abdullah, 2008, diolah.

di mana:

j = 1,2,3…n, n = banyaknya kelompok

j = rata-rata total peubah j

Sj

= standar deviasi peubah j

SF = skor faktor

BAB III METODOLOGI PENELITIAN 3.1 Jenis dan … matriks simpangan baku dengan unsur diagonal utama...

Documents

Transcript of BAB III METODOLOGI PENELITIAN 3.1 Jenis dan … matriks simpangan baku dengan unsur diagonal utama...