Fuzzy

9

Click here to load reader

Transcript of Fuzzy

Page 1: Fuzzy

1

Pengelompokkan Zona Musim (ZOM) dengan Fuzzy K-Means Clustering (Studi Kasus :Pengelompokkan ZOM di Kabupaten Ngawi)

1Febrina Dinar Palupi Utami,

2Sutikno

1 Mahasiswa Jurusan Statistika FMIPA-ITS (1306 100 037) 2Dosen Jurusan Statistika FMIPA-ITS

1 [email protected], [email protected]

Abstrak

Banyak penelitian klimatologi yang bertujuan membuat kelompok stasiun/ wilayah perkiraan iklim. Badan Meteorologi Klimatologi dan Geofisika (BMKG) telah melakukan pengelompokkan iklim (pola curah hujan) dengan membuat Zona Musim (ZOM) pada tahun 2009. Metode yang sering digunakan dalam pembentukan ZOM adalah analisis kelompok (cluster analysis). Penelitian ini bertujuan mengkaji prosedur pengelompokkan ZOM dan membangun ZOM serta membandingkan kinerja ZOM di kabupaten Ngawi dengan metode Fuzzy K-Means Clustering. Metode ini merupakan pengembangan dari metode partisi yang dikenal dengan K-means. Kelebihan dari metode Fuzzy K-means adalah meminimalkan masalah kegagalan konvergen yang terjadi pada metode K-means. Variabel yang digunakan adalah tinggi curah hujan tiap stasiun di Kabupaten Ngawi. Hasil pengelompokkan terbaik dianalisis dengan menggunakan MANOVA untuk mengetahui apakah ada perbedaan vektor rata-rata pada kelompok yang terbentuk. Dari hasil analisis dapat disimpulkan bahwa jumlah kelompok ZOM yang terbentuk dengan metode Fuzzy K-Means sebanyak lima ZOM dan ZOM yang tersebut lebih baik dibandingkan dengan ZOM BMKG berdasarkan kriteria SW dan SB.

.

Kata kunci: Zona Musim (ZOM), Analisis Faktor, Fuzzy K-means Clustering, MANOVA

1. Pendahuluan

Banyak penelitian klimatologi yang bertujuan membuat kelompok stasiun atau wilayah prakiraan iklim. Penggunaan data kelompok stasiun lebih menguntungkan dari-ada data masing-masing individu stasiun. Salah satu keuntungan data kelompok stasiun adalah data lebih homogen. Badan Meteorologi Klimatologi dan Geofisika (BMKG) telah melakukan pengelompokkan iklim (pola curah hujan) dengan membuat Zona Musim (ZOM) pada tahun 2009. Pembagian zona tidak dibatasi oleh wilayah administrasi kabupaten atau kota, sehingga dalam satu zona tertentu bisa mencakup beberapa kabupaten/ kota. Untuk Propinsi Jawa Timur terbagi atas 37 ZOM dan khusus Kabupaten Ngawi terbagi atas 2 ZOM (www. staklimkarangploso.net).

Metode yang seringkali digunakan dalam pembentukan ZOM adalah analisis kelompok (cluster analysis). Analisis kelompok adalah proses pengelompokan objek-objek yang didasarkan pada ukuran kesamaan atau ketidaksamaan (Johnson dan

Wichern, 2002). Analisis kelompok merupakan salah satu analisis data eksplanatori yang bertujuan untuk menentukan kelompok dari sekelompok objek.

Metode analisis kelompok yang popular terdiri atas metode hierarkhi dan metode partisi. Analisis kelompok hierarkhi yang membentuk diagram dendogram dengan mendiskripsikan pengelompokkan berdasarkan jarak. Metode hierarkhi tidak dapat mengelom-pokkan lebih dari dua objek secara langsung, sehingga objek dengan ukuran yang sama terhadap dua atau lebih objek lainnya dikelom-pokkan secara acak (Johnson dan Wichern, 2002). Masalah lain pada metode hierarkhi adalah tidak mudah diterapkan pada kasus dengan jumlah objek yang sangat besar. Jumlah objek yang sangat besar sangat sulit untuk digambarkan dalam bentuk diagram dendogram. Di samping variabel yang digunakan untuk pengelompokkan tidak boleh saling dependen.

Metode lain yang digunakan untuk dapat mengatasi permasalahan pada metode

Page 2: Fuzzy

2

hierarkhi yaitu metode partisi atau biasa disebut juga dengan metode non-hierarkhi. Salah satu metode partisi yang biasa digunakan adalah metode K-means clustering. Metode K-means clustering dapat diterapkan pada kasus dengan jumlah objek yang sangat besar (Johnson dan Wichern, 2002). Kekurangan dari metode K-means clustering adalah penentuan jumlah cluster yang paling tepat dan kemungkinan terjadinya kegagalan untuk konvergen, sehingga proses iterasi akan berlangsung secara terus-menerus (Agusta, 2007).

Pengelompokan dengan mempertim-angkan tingkat keanggotaan yang mencakup himpunan fuzzy sebagai dasar pembobotan bagi pengelompokan disebut dengan fuzzy clustering (Jang et al, 1997). Metode fuzzy K-means clustering merupakan pengembangan dari metode K-means clustering untuk meminimalkan masalah kegagalan konvergen (Jang et al, 1997). Dengan menggunakan metode fuzzy K-means clustering diperkirakan akan mendapatkan ZOM yang lebih homogen.

Variabel yang digunakan dalam pengelompokkan zona musim (ZOM) adalah tinggi curah hujan bulanan dan menggunakan pos-pos hujan di Kabupaten Ngawi sebagai studi kasus. Untuk mendapatkan pengelompokkan terbaik dianalisis dengan menggunakan Multivariate Analysis of Varians (MANOVA). MANOVA digunakan untuk mengetahui apakah ada perbedaan vektor rata-rata pada kelompok yang terbentuk.

Oleh karena itu, penelitian ini bertujuan untuk mengkaji prosedur pengelompokkan dan membangun ZOM di Kabupaten Ngawi dengan fuzzy K-means clustering. Hasil pengelompokkan ZOM akan dibandingkan dengan ZOM hasil BMKG.

2. Tinjauan Pustaka Analisis Faktor

Analisis faktor mengasumsikan suatu struktur spesifik tertentu dalam sebuah model untuk variabel-varabel random. Johnson & Wichern (2002) mengatakan bahwa tujuan dari analisis faktor adalah untuk menggambarkan

hubungan kovarian antara beberapa variabel yang mendasari tetapi tidak teramati, kuantitas random yang disebut faktor. Secara khusus analisis faktor dapat ditulis sebagai berikut :

1121211111 ... εµ ++++=− mmFlFlFlX

2222212122 ... εµ ++++=− mmFlFlFlX : : :

pmpmpppp FlFlFlX εµ ++++=− ...2211

Dengan : =jF Common factor ke-j

ijl = Loading factor ke-j dan variabel ke-i

iε = Spesific factor ke-i

dimana : i = 1, 2, ..., p dan j = 1, 2, ..., m

Dalam notasi matriks persamaan dapat ditulis sebagai :

( ) ( ) ( ) ( ) ( )1111 ××××× +=− pmmppp FLX εµ

Secara garis besar tahapan-tahapan dalam melakukan analisis faktor adalah

1. Membentuk matrik korelasi dari ma-triks X yang berukuran pn×

2. Menghitung nilai eigenvalue dan eigenvector dari matrik korelasi

3. Mengambil nilai eigenvalue yang lebih besar dari 1

4. Membentuk matriks yang berupa matriks loading factor , dengan

rumus ppeeL λλ ...11= , =λ eigen-

value dan =e eigen vector.

5. Setelah nilai loading factor diketahui maka selanjutnya dapat dihitung nilai communality factor:

222

21

2 ... imiii lllh +++=

Himpunan Fuzzy

Konsep tentang himpunan fuzzy (fuzzy set = himpunan kabur) diperkenalkan pertama kali pada bulan July 1964 oleh Prof. Lotfi A. Zadeh yang menyatakan bahwa ketidakpastian dapat didekati dengan metode lain selain pendekatan probabilitas, yaitu konsep himpunan fuzzy. Himpunan tegas atau himpunan klasik merupakan himpunan dengan batas yang jelas.

Jika X adalah kumpulan objek-objek yang dinyatakan secara umum oleh x, maka

himpunan fuzzy A~

di X didefinisikan sebagai

Page 3: Fuzzy

3

himpunan pasangan terurut sebagai

( )( ){ }XxxxAA

∈= |;~

dimana )(~ xA

µ : fungsi keanggotaan

(membership function) untuk himpunan fuzzy

A~

(Jang et al, 1997). Peranan himpunan fuzzy dalam

kelompok adalah dalam pembentukan fungsi dan tingkat keanggotaan dari setiap objek atau data dalam kelompok (Pravitasari, 2008). Tingkat ke-fuzzy-an tidak berasal dari keacakan anggota himpunan, tetapi berasal dari ketidakpastian dan ketidaktepatan pikiran serta konsep yang abstrak (Jang et al, 1997).

Fuzzy K-Means Clustering

Fuzzy K-means clustering atau fuzzy isodata dikembangkan oleh Bezdek pada tahun 1981 untuk menyelesaikan masalah optimasi (Agusta, 2007).

Metode K-means clustering memiliki matriks keanggotaan biner yaitu 0 dan 1, sedangkan fuzzy K-means clustering memiliki matriks keanggotaan kontinu antara 0 dan 1.

Pada fuzzy K-means clustering, fungsi keanggotaan memiliki nilai antara 0 sampai 1 dengan fungsi pembatas berikut

∑=

=∀=q

ljl nj

1

,...,1;1µ

Derajat keanggotaan terbesar dari setiap objek menunjukkan kecenderungan objek tersebut menjadi anggota dari kelompok tertentu. Prinsip utama dari fuzzy K-means clustering adalah meminimumkan fungsi objektif, yaitu jarak antara objek dengan setiap pusat kelompok.

2

1 1 1 1

2. lj

n

j

q

l

n

j

q

l

wjljl

wjl vxdB −==∑∑ ∑∑

= = = =

µµ

dengan : vl = pusat kelompok ke-l µjl = derajat keanggotaan pada objek ke-j

dan kelompok ke-l w = bobot (w > 1) xj = objek ke-j B = fungsi objektif

Tidak ada nilai w yang optimum, tetapi nilai w yang sering digunakan adalah 2 (Agusta, 2007).

Fungsi objektif dapat diminimumkan dengan fungsi pembatas dengan menggunakan pengganda lagrange

∑∑ ∑∑= = ==

−−=

n

j

q

l

q

ljl

n

jjjl

wjl dG

1 1 11

2 1. µλµ

Untuk mendapatkan derajat keanggotaan tiap-tiap objek, turunan fungsi Lagrange terhadap µjl sama dengan nol dan diperoleh

∑=

=q

h

w

hl

jl

jl

d

d

1

1

1

2

2

dengan nj ,...,1= dan ql ,...,2,1= Sedangkan pusat kelompok dapat

diperoleh dari turunan fungsi Lagrange terhadap vl sama dengan nol. Jadi nilai vl diperoleh

=

==n

j

wjl

n

jj

wjl

l

x

v

1

1

µ

µ;∀ ql ,...,1=

Indeks XB (Xie dan Beni)

Untuk menentukan banyak kelompok dapat dilakukan dengan menghitung Indeks XB (Xie dan Beni). Indeks ini ditemukan oleh Xie dan Beni dan pertama kali dikemukakan pada tahun 1991 (Pravitasari, 2008). Indeks XB dituliskan sebagai berikut

)min(

)(

2

1 1

2

khkh

n

j

q

llj

wjl

vvn

vx

XB−

−=

= =∑∑ µ

dimana q = banyak kelompok,jlµ = derajat

keanggotaan, 2jld = jarak pengamatan dengan

pusat kelompok lv = pusat kelompok dan n =

banyak objek yang akan dikelompokkan, serta 2

min khkh

vv −≠

= jarak minimum antara pusat

kelompok hv dan kv .

Kriteria banyak kelompok yang optimum ditunjukkan dengan nilai indeks XB yang minimum pada lembah pertama. Penggunaan indeks XB untuk menentukan jumlah kelompok yang optimum pada metode fuzzy K-means clustering (CHEN Duo, LI Xue dan CUI Du-Wu 2007) menyatakan bahwa indeks XB memiliki ketepatan dan keandalan yang tinggi untuk memberikan jumlah

Page 4: Fuzzy

4

kelompok yang optimum pada metode fuzzy K-means clustering.

Multivariate Analysis of Varian (MANOVA)

Multivariate Analysis of Variance (MANOVA) merupakan teknik analisis yang digunakan untuk menguji tentang perbedaan beberapa vektor rata-rata populasi (Johnson dan Wichern, 2002). Model MANOVA dinyatakan sebagai berikut

ijiij ex ++= τµ

dimana

gi ,...,2,1= , inj ,...,2,1=

ije merupakan residual Np (0,Σ).

Tabel MANOVA untuk perbandingan vektor rata-rata populasi disajikan pada Tabel 1 berikut

Tabel 1 Matriks Jumlah Kuadrat MANOVA

Sumber variasi

Matriks Jumlah Kuadrat dan hasil kali silang

Derajat bebas

Perla-kuan ∑

=

−−=g

iiii xxxxnB

1

)')(( g-1

Residual ∑∑= =

−−=g

i

n

jiijiij

i

xxxxW1 1

)')(( ∑=

−g

ii gn

1

Total

(Terko-reksi)

∑∑= =

−−=+g

i

n

jijij

i

xxxxWB1 1

)')((

∑=

−g

iin

1

1

(Sumber : Johnson dan Wichern, 2002)

Statistik uji yang digunakan adalah Wilk’s Lambda dengan rumus sebagai berikut :

∑∑

∑∑

= =

= =

−−

−−=

+=Λ

g

i

n

jijij

g

i

n

jiijiij

i

i

xxxx

xxxx

WB

W

1 1

1 1*

)')((

)')((

Tolak H0 jika Λ* > ∑

=

−−g

ii pnp

F

1

1,

(α)

dimana W = Jumlah Kuadrat Dalam Perlakuan dan hasil kali silang, B = Jumlah Kuadrat Antara Perlakuan dan hasil kali silang dan

B+W = Jumlah Kuadrat Total Terkoreksi dan hasil kali silang.

Pemeriksaan Asumsi Normal Multivariat dan Matrik Varian Kovarian

Pemeriksaan asumsi normal multivariat dilakukan untuk mengetahui distribusi data dari variabel independen. Untuk mempermudah pemeriksaan dilakukan pemeriksaan distribusi normal multivariat

dengan menggunakan plot 2χ dengan

menghitung jarak )x(x)'Sx(xd jjj −−= −12 ,

nj ,...,2,1= dengan xj = objek pengamatan ke-j dan n = banyak pengamatan S-1 = invers matriks varian kovarian berukuran p x p.

Apabila terdapat paling sedikit 50%

dari nilai 2)5,0;(

2pjd χ≤ maka sebaran data

dapat dikatakan mengikuti sebaran distribusi normal multivariat atau dapat dilihat dari plot

2χ .

Selanjutnya pemeriksaan dapat dilanjutkan dengan melakukan pemeriksaan matrik varian kovarian dari suatu data, variabel independen dalam hal ini tingkat curah hujan tiap stasiun hujan setiap bulannya harus memenuhi asumsi yaitu memiliki matriks varian kovarian yang sama. Untuk menguji kehomogenan matriks varian kovarian antar kelompok atau grup digunakan statistik uji Box’s M (Karson, 1982).

H0 : Σ1 = Σ2 = ... = Σk

H1 : minimal ada satu Σi yang berbeda

Misalkan Si adalah suatu estimasi tak bias dari Σi dengan derajat bebas ni pengamatan dari populasi ke-i.

∑∑ =

=

−−

=k

iiik

ii

Snn

S1

1

)1()1(

1

dengan ( )( )Tiii xxxxS −−=

merupakan estimasi dari matriks varian kovarian umum dan statistik ujinya adalah

∑ ∑= =

−−−=k

i

k

iiii SnSnM

1 1

ln)1(ln)1(

Page 5: Fuzzy

5

−−

−−+−+−= ∑

∑=

=

−k

ik

ii

i nnkp

ppC

1

1

21

)1(

1

1

1

)1)(1(6

1321

dan tolak H0 jika MC-1 > 2))(1()1(2/1( αχ +− ppk

3. Metodologi Penelitian

Data yang digunakan pada penelitian ini adalah data sekunder yang diperoleh dari Badan Meteorologi Klimatologi dan Geofisika (BMKG). Data ini mencakup data zona curah hujan bulan Januari sampai Desember di Kabupaten Ngawi.

Letak pos hujan sesuai lintang dan bujur dan pembagian zona musim (ZOM) di Kabupaten Ngawi digambarkan sebagai berikut

Gambar 1 Zona Musim di Kabupaten Ngawi

Dalam penelitian ini variabel yang digunakan adalah tinggi curah hujan tiap stasiun di Kabupaten Ngawi.

Tiga tahapan analisis data, yaitu :

1. Pengelompokan ZOM di Kabupaten Ngawi. a. Mendeskripsikan data curah hujan

yang merupakan hasil rataan dari masing-masing stasiun di Kabupaten Ngawi.

b. Mereduksi data curah hujan dengan Analisis Faktor.

c. Membentuk kelompok dengan metode fuzzy K-means clustering.

2. Mendapatkan ZOM baru. a. Uji asumsi multivariat normal dan

uji kehomogenan matrik varian kovarian.

b. Uji kesamaan vektor rata-rata antar kelompok yang terbentuk dengan MANOVA

c. Mendapatkan ZOM baru de-ngan mengidentifikasi anggota ZOM dengan MANOVA.

3. Membandingkan kinerja ZOM antara ZOM BMKG dan ZOM terbaik. a. Membandingkan ZOM baru yang

didapat dengan ZOM milik BMKG.

b. Didapat ZOM terbaik dengan kriteria nilai minimum Wilk’s Lambda.

4. Analisis dan Pembahasan

Deskripsi Umum Curah Hujan di Tiap Stasiun

Deskripsi curah hujan digunakan untuk mengetahui gambaran tinggi curah hujan bulanan di Kabupaten Ngawi. Tabel 2 menyajikan ringkasan dari curah hujan meliputi ukuran pemusatan, nilai maksimum, nilai minimum dan ukuran penyebaran tinggi curah hujan di Kabupaten Ngawi.

Tabel 2 Deskripsi Tinggi Curah Hujan Bulanan di Kabupaten Ngawi

Bulan Min Maks Rata-rata

StDev

Januari 219,62 387,89 289,91 45,20

Februari 243,23 417,37 303,92 47,04

Maret 220,16 368,95 288,94 49,05

April 154,72 311,65 221,27 41,46

Mei 54,08 124,95 87,24 21,61

Juni 29,69 99,30 59,54 15,19

Juli 18,00 46,05 30,23 7,73

Agustus 8,12 49,46 17,83 9,81

September 7,75 34,00 19,69 8,21

Oktober 81,85 155,05 121,88 16,90

November 160,93 296,38 227,37 38,75

Desember 203,29 336,95 263,91 36,49

Tabel 2 menunjukkan bahwa rata-rata curah hujan pada Bulan Februari adalah tertinggi di Kabupaten Ngawi, yaitu sebesar 303,92 mm. Hal ini menunjukkan Februari merupakan puncak dari musim penghujan. Rata-rata curah hujan terendah terjadi Bulan Agustus, yaitu sebesar 17,83 mm. Ini berarti pada bulan ini merupakan puncak dari musim kemarau di Kabupaten Ngawi. Jika dilihat nilai

Page 6: Fuzzy

6

simpangan baku, pada Bulan Maret memiliki simpangan baku tertinggi, artinya pada bulan tersebut terdapat variasi curah hujan diantara pos hujan di Kabupaten Ngawi. Menurut nilai range, yaitu selisih nilai minimum dan maksimum yang besar, dapat diartikan tingkat curah hujan setiap pos hujan di Kabupaten Ngawi rendah.

Gambar 2 menjelaskan bahwa tipe curah hujan di Kabupaten Ngawi yaitu tipe monsunal yang berarti bersifat monsun karena dari gambar tersebut pola curah hujannya membentuk huruf U. Selanjutnya dari Gambar 2 dapat diidentifikasi bahwa musim penghujan di Kabupaten Ngawi mulai Bulan November – April, sedangkan musim kemarau terjadi pada Bulan Mei – Oktober.

Gambar 2 Rata-rata tinggi curah hujan menurut bulan.

Sebaran curah hujan di pos hujan Mantingan sebagai contoh disajikan dalam boxplot. Gambar 3 mengindikasikan bahwa terdapat data curah hujan yang outlier di Stasiun Mantingan. Amatan outlier yang terbanyak yaitu terjadi pada Bulan Juni - September. Hal ini menunjukkan bahwa meskipun pada bulan-bulan tersebut merupaka periode musim kemarau, namun masih terjadi hujan.

Data

Desem

ber

Novem

ber

Oktob

er

Septem

ber

Agus

tus

Juli

Juni

Mei

April

Mar

et

Febr

uari

Janu

ari

400

300

200

100

0

Gambar 3 Deskripsi tinggi curah hujan tiap bulan

di stasiun Mantingan

Pada musim penghujan masih terdapat amatan yang outlier, namun jumlahnya tidak sebanyak pada musim kemarau. Selain itu,

dapat dilihat pula bahwa pola sebaran data tinggi curah hujan stasiun Mantingan tiap bulan tidak mengikuti pola sebaran distribusi normal.

Analisis Faktor

Pereduksian variabel dilakukan dengan menggunakan input matriks faktor korelasi dan matriks ekstrasi komponen utama (principal component). Untuk memperjelas dalam menggambarkan karakteristik curah hujan bulanan di Kabupaten Ngawi dilakukan rotasi Varimax. Hasil loading faktor selengkapnya disajikan pada Tabel 3.

Tabel 3 Nilai Loading faktor dengan Rotasi Varimax

Variabel/ Bulan

F 1 F 2 F 3 F 4

Januari 0,903 0,125 -0,141 0,174

Februari 0,890 0,102 0,169 -0,010

Maret 0,637 -0,025 0,534 -0,358

April 0,552 -0,130 0,679 0,223

Mei 0,331 0,791 0,461 -0,026

Juni 0,575 -0,016 -0,056 0,572

Juli 0,056 0,065 0,623 -0,111

Agustus 0,020 0,101 -0,140 -0,839

September 0,015 0,899 0,036 -0,084

Oktober 0,071 0,599 -0,137 0,579

November -0,122 0,290 0,786 0,314

Desember 0,708 0,516 0,296 -0,098

Keterangan: Yang diarsir dan bold mempunyai nilai loading tinggi masing-masing faktor. Tabel 3 menunjukkan bahwa faktor 1

(F1) lebih menggambarkan musim penghujan, yaitu meliputi curah hujan bulan Desember, Januari, Februari, Maret. Faktor 2 dan faktor 3 lebih menggambarkan musim transisi, baik transisi musim kemarau (April, Mei, dan Juli) maupun musim penghujan (September, Oktober, dan November). Sementara faktor 4 lebih mengambarkan musim kemarau. Total keragaman yang dapat dijelaskan dengan empat komponen utama tersebut sebesar 78%.

Fuzzy K-Means Clustering

Algorithma pengelompokkan dengan metode fuzzy K-means clustering sebagai berikut :

Page 7: Fuzzy

7

1. Menentukan jumlah kelompok dengan menggunakan indeks XB.

2. Mengalokasikan data sesuai dengan jumlah kelompok yang ditentukan sesuai dengan kriteria indeks XB.

3. Menghitung pusat dari masing-masing kelompok.

4. Menghitung nilai fungsi keanggotaan masing-masing data ke masing-masing kelompok.

5. Bandingkan nilai keanggotaan matriks partisi atau matriks fungsi keanggotaan

(U), apabila nilai ε<−+ )()1( jj UU

maka telah konvergen dan proses iterasi dihentikan. Apabila ε≥−+ )()1( kk UU

maka kembali ke langkah 3.

Langkah awal proses pengelompokkan yaitu menentukan jumlah kelompok, yaitu dengan menggunakan bantuan indeks XB. Dilakukan simulasi dengan jumlah kelompok sebanyak 2 sampai dengan 6 kelompok. Berdasarkan nilai XB yang minimum diperoleh jumlah kelompok sebanyak 5 kelompok, yaitu sebesar 1,0937. Plot antara nilai indeks XB dan banyaknya kelompok ditunjukkan pada Gambar 4.

Kelompok

Indeks XB

65432

2,6

2,4

2,2

2,0

1,8

1,6

1,4

1,2

1,0

Scatterplot of Indeks XB vs Kelompok

Gambar 4 Plot antara Nilai Indeks XB dan

Banyaknya Jumlah Kelompok.

Anggota kelompok masing-masing zona musim (ZOM) adalah sebagai berikut:

� ZOM 1 : Bekoh, Guyung, Sambiroto, Padas dan Begal.

� ZOM 2 : Mardiasri, Paron, Ngawi dan Mantingan.

� ZOM 3 : Ngrambe, Tretes dan Walikukun.

� ZOM 4 : Kedunggalar, Ngadirejo/ Sooko dan Ngale.

� ZOM 5 : Karangjati, Jogorogo dan Kedung urung-urung.

Persebaran stasiun menurut kelompok ZOM hasil pengelom-pokkan dengan fuzzy K-means clustering disajikan Gambar 4.4 berikut.

Gambar 5 Persebaran stasiun menurut Zona

Musim hasil fuzzy K-means clustering

Gambar 5 diatas menjelaskan penge-lompokkan zona musim (ZOM) Kabupaten Ngawi hasil metode fuzzy K-means clustering. ZOM dengan kode 1, 3 dan 4 telah membentuk pola kelompok yang jelas, sedangkan ZOM kode 2 dan 5 lebih menyebar. ZOM 3 diidentifikasi berada pada daerah pegunungan dan ZOM 1 dan 4 diidentifikasi berada pada daerah dataran rendah (flat).

Pada ZOM 2 dan 5 masing-masing terdapat satu stasiun yang berada jauh dari kelompoknya yaitu Mantingan pada ZOM 2 dan Karangjati pada ZOM 5. Beberapa kemungkinan yang timbul sebagai akibat dari terpisahnya stasiun Mantingan dan stasiun Karangjati dari zona musimnya yaitu adanya amatan ekstrim tinggi curah hujan. Berdasarkan identifikasi melalui sebaran curah hujan (boxplot) Karangjati dan Kedung Urung-urung pada bulan Juli dan Agustus memiliki pola yang sama. Sementara pada Stasiun Mantingan dan Tretes terletak berdekatan yaitu berada di daerah pegunungan yang memiliki kemiripan secara geografis namun belum tentu dengan tinggi curah hujannya.

Multivariate Analysis of Varian (MANOVA)

Pengujian perbedaan rata-rata digunakan untuk melihat apakah pengelompokkan yang dilakukan telah menghasilkan kelompok yang mempunyai perbedaan yang nyata. Analisis ini didasari oleh beberapa asumsi yaitu data yang dianalisis

Page 8: Fuzzy

8

harus berdistribusi normal multivariat dan matriks varian kovarian kelompok yang homogen.

Hasil pemeriksaan distribusi normal

multivariat, diperoleh 2)05,0;4(

2 χ≤jd dimana 2

)05,0;4(χ = 9,488 adalah sebesar 66,7%. Hasil

ini menunjukkan bahwa data mengikuti distribusi normal multivariate. Untuk pemeriksaan asumsi kehomogenan matrik varian kovarian ZOM yang terbentuk dengan metode fuzzy K-means clustering dengan uji Box’s M tidak dapat dilakukan, karena terdapat sedikitnya dua cell matrik kovarian nonsingular (ada indikasi matriks Σ tidak homogen). Hasil identifikasi secara parsial menunjukkan bahwa untuk variabel skor faktor 4 tidak homogen antar ZOM.

Seharusnya, jika tidak dapat dilakukan uji Box’s M, maka dilakukan transformasi. Namun, pengelompokkan yang dilakukan yaitu dengan menggunakan score factor, sehingga tidak dapat ditransformasi. Untuk memeriksa hal ini maka dilakukan uji kesamaan varian dengan Bartlett. Tabel 4 dibawah ini menyajikan nilai statistik uji dan p-value hasil uji Bartlett.

Tabel 4 Uji kesamaan varian dengan Bartlett

Score Factor 1 2 3 4

Nilai 4,85 3,71 2,62 10,39

p-value 0,303 0,446 0,623 0,034

Score factor 1, 2 dan 3 menunjukkan p-value yang lebih besar dari nilai α, maka gagal tolak H0 berarti bahwa varian untuk score factor 1, 2 dan 3 homogen. Namun untuk score factor 4 tidak signifikan karena p-value < α = 0,05 berarti score factor 4 memiliki varian yang berbeda dengan score factor yang lain. Maka untuk analisis selanjutnya dengan MANOVA hanya menggunakan score factor yang memiliki varian sama yaitu score factor 1, 2 dan 3.

Setelah asumsi normal multivariat dan kehomogenan matriks varian kovarian terpenuhi, langkah selanjutnya yang dilakukan adalah menguji perbedaan rata-rata dari kelima kelompok dengan MANOVA. Hipotesis yang digunakan adalah sebagai berikut

H0 : τ1 = τ2 = ...= τg = 0

H1 : minimal ada satu τi ≠ 0

Berdasarkan pengujian yang telah dilakukan, diperoleh nilai wilk’s lambda (Λ*) sebesar 0,04. P-value yang diperoleh cukup kecil yaitu sebesar 0,000 atau p-value < 0,05 untuk semua statistik uji diputuskan untuk menolak H0, sehingga bisa dikatakan bahwa terdapat perbedaan rata-rata antar kelompok zona musim (ZOM) yang terbentuk.

Perbandingan ZOM BMKG dengan ZOM Baru

Pengelompokkan zona musim (ZOM) dengan metode fuzzy K-means clustering diperoleh 5 kelompok, sedangkan ZOM milik Badan Meteorologi Klimatologi dan Geofisika (BMKG) mengelompokkan ZOM sebanyak 2 kelompok. Oleh karena itu ingin diketahui perbandingan ZOM milik BMKG dengan ZOM yang diperoleh dengan metode baru yaitu dengan kriteria Wilk’s Lambda pada MANOVA. Untuk MANOVA ini digunakan score factor 1, 2 dan 3 sesuai dengan hasil uji homogenitas. Penggunaan score factor ini juga dilakukan pada MANOVA kelompok milik BMKG.

Untuk menunjukkan uji homogenitas kelompok fuzzy dan kelompok BMKG dengan tiga score factor, maka hasil uji Box’s M ditampilkan sebagai berikut

Tabel 5 Hasil Uji Homogenitas Kelompok Fuzzy dan BMKG

Kelompok Box's M F Sig

Fuzzy 19,448 1,627 0,139

BMKG 7,518 0,864 0,552

Tabel 5 mentunjukkan bahwa hasil uji Box’s M dengan nilai signifikan untuk kelompok hasil fuzzy K-means clustering sebesar 0,139 dan untuk kelompok BMKG sebesar 0,552. Kedua nilai signifikan tersebut lebih besar dari nilai α = 0,05 yang berarti gagal tolak H0 maka dapat disimpulkan bahwa matriks varian kovarian dari keempat kelompok yang terbentuk adalah sama (homogen).

Semakin kecil nilai signifikan menunjukkan bahwa kelompok yang terbentuk semakin homogen yang berarti keragaman dalam kelompok semakin kecil dan keragaman antar kelompok semakin besar. Oleh karena itu, hasil pengelompokkan dengan fuzzy K-means clustering lebih baik digunakan untuk

Page 9: Fuzzy

9

mengelompokkan ZOM Kabupaten Ngawi dengan nilai signifikan terkecil.

5. Kesimpulan

Berdasarkan hasil analisis dan pembahasan, maka diperoleh kesimpulan sebagai berikut :

1. Hal-hal yang perlu diperhatikan dalam algorithma Fuzzy K-Means Clustering adalah penentuan jumlah kelompok. Oleh karena itu digunakan indeks XB untuk membantu menentukan jumlah kelompok yang optimum.

2. Pengelompokkan zona musim (ZOM) Kabupaten Ngawi menggunakan metode fuzzy K-means clustering. Menentukan jumlah kelompok yang akan digunakan pada prosedur fuzzy K-means Clustering dengan menggunakan kriteria indeks Xie dan Beni (indeks XB) dan diperoleh jumlah kelompok yang optimum sebanyak 5 kelompok. Penentuan anggota kelompok menggunakan metode fuzzy K-means clustering dan diperoleh kelompok ZOM sebagai berikut

• ZOM 1 : Bekoh, Guyung, Sambiroto, Padas dan Begal.

• ZOM 2 : Mardiasri, Paron, Ngawi dan Mantingan.

• ZOM 3 : Ngrambe, Tretes dan Walikukun.

• ZOM 4 : Kedunggalar, Ngadirejo/ Sooko dan Ngale.

• ZOM 5 : Karangjati, Jogorogo dan Kedung urung-urung.

3. Berdasarkan nilai Wilk’s Lambda menunjukkan bahwa ZOM fuzzy K-means clustering mempunyai kinerja yang lebih baik daripada ZOM BMKG. Hal ini ditunjukkan dengan nilai Wilk’s Lambda ZOM hasil fuzzy K-means clustering lebih kecil daripada ZOM BMKG.

Daftar Pustaka Agusta, Y. (2007), “K-means-Penerapan,

Permasalahan dan Metode Terkait”, Jurnal Sistem dan Informatika, Vol. 3, hal. 47-60.

Anonim_a. (2009).Cuaca dan Iklim. [http:// www.petualangan.com ] (On-line: July, 4th 2009).

Anonim_b. (2009). Zona Musim Wilayah Jawa Timur. [http:// www.staklimkarangploso.net ] (On-line: Oktober, 12th 2009).

Bunkers WJ, Miller JR, De Gaetano AT.(1996).Definition of Climate Regions in the Northern Plains Using an Objective Cluster Modification Technique. J.Climate 9:130-146.

Duo, C., Xue, L., Du-Wu, C., (2007). An Adaptive Cluster Validity Index for the Fuzzy C-means, International Journal of Computer Science and Network Security 7 No. 2, 146-156.

Jang, J. S, Sun, C. T., dan Mizutani, E. (1997). Neuro-Fuzzy and Soft Computing, Prentice Hall, New York.

Johnson, R. A, dan Wichern, D. W. (2002), Applied Multivariate Statistical Analysis, Prentice Hall, New York.

Karson, M. J. (1982), Multivariate Statistical Methods, First Edition, The Iowa State University Press, Ames-Iowa.

Klawonn, F. dan Keller, A., (1997). Fuzzy Clustering and Fuzzy Rules. Science Journal.

Noury, M., Khatami, H. R., Moeti, M. T., dan Barani, G., (2008). “Rainfall-Runoff Modeling Using Fuzzy Methodology”,Journal of Applied Sciences, Vol.8, No.16, hal. 2851-2858.

Ping, K. S and Salim, N. 2006. Optimized Subtractive Clustering for Cluster-Based Compound Selection. Putrajaya. Malaysia.

Regariana, Cut Meurah. (2005). Modul Cuaca dan Iklim Geografi kelas X (sepuluh).

Sarjani. (2009). Cuaca dan Iklim Geografi kelas 1.

Zong-yi, X., Yong, Z., Li-min, J., dan Wei-li, H. (2005), “Construct Interpretable Fuzzy Classification System based on Fuzzy Clustering Inilization”, Iinternational Journal of Information Technology, Vol.11, No. 6, hal. 91-107.