penerapan analisis cluster dengan software

20
PERMASALAHAN Berdasarkan data BPS pada laporan Sosial Indonesia dari Supas dan Sakemas 1995 didapatkan data seperti table 1. Mengingat penduduk lansia semakin lama semakin banyak, didasarkan perkiraan BPS pada tahun 2005 penduduk lansia cenderung bertambah atau ada perubahan struktur dari struktur penduduk muda ke struktur penduduk tua. Maka dari itu perlu adanya perhatian ekstra dari pihak pemerintah untuk permasalahan ini. Pembentukan wilayah pembinaan untuk permasalahan lansia dapat dilakukan dengan membentuk wilayah konsentrasi berdasarkan data pada tabel 1. Model analisis cluster sangat mendukung pembentukan wilayah tersebut. Table 1. Enam Kriteria Keterlantaran Lansia Menurut Propinsi propinsi tidak perna h sekol ah / tamat SD makan makanan pokok < 21kali dalam semingg u makan lauk pauk berprotei n tinggi<4k ali dalam seminggu memili ki pakaia n < 4 stel tidak mempuny ai tempat tetap untuk tidur bila sakit tidak diobat i sumatera utara 63.13 38.67 35.7 16.79 2.48 3.3 sumatera barat 57.48 48.23 17.48 20.6 0.9 4.0 Riau 67.72 50.59 18.43 9.95 1.58 3.3 Jambi 75.99 44.1 29.77 27.94 1.76 2.5 sumatera selatan 65.69 58.39 27.9 24.67 5.57 5.1 Dinda Rinai V.S-FMIPA Univ.Brawijaya,Malang 2012

description

jauh dari sempurna. mohon kritik dan saran, terimakasih

Transcript of penerapan analisis cluster dengan software

Page 1: penerapan analisis cluster dengan software

PERMASALAHAN

Berdasarkan data BPS pada laporan Sosial Indonesia dari Supas dan Sakemas 1995 didapatkan data seperti table 1.Mengingat penduduk lansia semakin lama semakin banyak, didasarkan perkiraan BPS pada tahun 2005 penduduk lansia cenderung bertambah atau ada perubahan struktur dari struktur penduduk muda ke struktur penduduk tua. Maka dari itu perlu adanya perhatian ekstra dari pihak pemerintah untuk permasalahan ini.

Pembentukan wilayah pembinaan untuk permasalahan lansia dapat dilakukan dengan membentuk wilayah konsentrasi berdasarkan data pada tabel 1. Model analisis cluster sangat mendukung pembentukan wilayah tersebut.

Table 1.Enam Kriteria Keterlantaran Lansia Menurut Propinsi

propinsi

tidak pernah sekolah / tamat SD

makan makanan pokok < 21kali dalam seminggu

makan lauk pauk berprotein tinggi<4kali dalam seminggu

memiliki pakaian < 4 stel

tidak mempunyai tempat tetap untuk tidur

bila sakit tidak diobati

sumatera utara 63.13 38.67 35.7 16.79 2.48 3.33

sumatera barat 57.48 48.23 17.48 20.6 0.9 4.05

Riau 67.72 50.59 18.43 9.95 1.58 3.34

Jambi 75.99 44.1 29.77 27.94 1.76 2.55

sumatera selatan 65.69 58.39 27.9 24.67 5.57 5.18

bengkulu 71.37 52.02 35.6 30.64 2.17 4.29

lampung 80.64 35.59 41.56 34.15 1.48 2.78

DKI jakarta 37.8 56.38 12.28 87.24 1.45 6.78

jawa barat 70.84 70.48 31.37 17.17 1.82 5.32

jawa tengah 79.3 35.99 16.25 19.36 1.89 3.97

DI Yogyakarta 76.05 46.27 11.35 17.45 1.17 4.72

jawa timur 82.76 30.86 15.13 30.77 2.01 3.55

Bali 77.96 42.28 6.28 25.74 0.34 4.87

NTB 86.92 33.09 23.48 48.28 3.2 4.64

NTT 87.36 56.75 58.67 49.77 1.42 9.31

kalimantan barat 83.48 54.34 38.6 29.46 3.87 7.51

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 2: penerapan analisis cluster dengan software

kalimantan timur 60.37 50.29 18.78 28.13 6.69 2.68kalimantan selatan 76.93 38.72 16.65 29.37 2.77 7.07

kalimantan tengah 73.43 52.45 18.18 12.72 1.11 1.01

sulawesi utara 51.3 58.14 25.58 11.08 1.84 2.89

sulawesitengah 66.01 54.47 16.29 32.81 2.47 8.66

sulawesi selatan 77.62 58.74 10.93 24.03 3.7 6.89

sulawesi tenggara 74.65 72.91 3.19 17.78 1.07 8.78

irian jaya 52.32 70.04 30.37 16.84 6.58 18.62

Sumber :www.scribd.com/doc/51082541/Analisis-Cluster

METODOLOGI

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 3: penerapan analisis cluster dengan software

Adapun langkah – langkah melakukan analisis cluster dengan software adalah sebagai berikut :

1. Melakukan standarisasi data, yaitu dengan cara :a) Membuka software SPSS 17.0b) Memasukkan data ke dalam DataSet

c) Klik analyze > descriptive statistics > descriptive, kemudian akan muncul kotak dialog descriptives.Variables : semua variable predictorCentang save standardized values as variables.Klik OK

2. Uji korelasi, yaitu dengan cara :a) Klik analyze > correlate > bivariate pada software SPSS 17.0.

Kemudian akan muncul kotak dialog Bivariate Correlation.Variables :semua variable prediktor

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 4: penerapan analisis cluster dengan software

b) Klik OK untuk mendapatkan output

3. Menghilangkan multikoliniertas dengan analisis komponen utama yaitu dengan cara :a) Buka software Minitabb) Copy data yang telah distandarisasi di software SPSS ke dalam

worksheet Minitab

c) Klik stat > multivariate > principal component. Kemudian akan muncul kotak dialog Principal Component Analysis.Variables : semua variable predictor yang telah distandarisasiNumber of components to compute : 6 (banyaknya variable predictor yang telah distandarisasi)Type of matrix : covariance (karena menggunakan data yang telah distandarisasi)

Klik storage, kemudian akan muncul kotak dialog Principal components analysis – storage.Coefficients : kolom baru dalam worksheet minitab yang akan memuat koefisien

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 5: penerapan analisis cluster dengan software

Scores : kolom baru dalam worksheet minitab yang akan memuat skor

Klik OKd) Klik OK untuk mendapatkan output.

4. Mencari banyak klaster.a) Mengcopy skor PC yang terbentuk di Minitab ke dalam dataset

SPSS

b) Klik analyze > classify > hierarchical cluster. Memilih hierarchical cluster karena belum diketahui banyak klaster yang akan terbentuk. Kemudian akan muncul kotak dialog Hierarchical Cluster Analysis.Variable(s) : variable skor PCLabel Cases by : propinsi

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 6: penerapan analisis cluster dengan software

Klik statistics pada kotak dialog Hierarchical Cluster Analysis, kemudian akan muncul kotak dialog Hierarchical Cluster Analysis : Statistics. Centang : agglomeration scheduleCentang : Proximity matrixCluster Membership : NoneKlik continue.

Klik plots pada kotak dialog Hierarchical Cluster Analysis, kemudian akan muncul kotak dialog Hierarchical Cluster Analysis : Plots.Centang dendogram.Icicle : None.Klik continue.

Klik method pada kotak dialog Hierarchical Cluster Analysis, kemudian akan muncul kotak dialog Hierarchical Cluster Analysis : Method.Cluster Method : Between – groups linkageMeasure : interval : Euclidean distanceKlik continue.

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 7: penerapan analisis cluster dengan software

Klik save pada kotak dialog Hierarchical Cluster Analysis, kemudian akan muncul kotak dialog Hierarchical Cluster Analysis : Save.

Cluster membership : None.Klik continue.

c) Klik OK pada kotak dialog Hierarchical Cluster Analysis.5. Keanggotaan klaster.

a) Klik analyze > classify > Hierarchical Cluster Analysis. kemudian akan muncul kotak dialog Hierarchical Cluster Analysis Klik statistics pada kotak dialog Hierarchical Cluster

Analysis. kemudian akan muncul kotak dialog Hierarchical Cluster Analysis: Statistics. Pilih single solution :Number of clusters : 3 (banyaknya klaster yang terbentuk)Klik continue.Klik OK pada kotak dialog Hierarchical Cluster Analysis.

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 8: penerapan analisis cluster dengan software

Klik save pada kotak dialog Hierarchical Cluster Analysis. Kemudian akan muncul kotak dialog Hierarchical Cluster Analysis: Save.Single solutionNumber of clusters : 3 ( banyak klaster yang terbentuk )Klik continue

b) Klik OK pada kotak dialog Hierarchical Cluster Analysis.6. Mencari karakteristik masing – masing variable.

a) Klik data > select case. Kemudian akan muncul kotak dialog Select Cases. Pilih if condition as satisfied.Klik If

Karakteristik masing – masing variable untuk klaster 1.

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 9: penerapan analisis cluster dengan software

Klik continue.Klik OK pada kotak dialog Select Cases.

karakteristik masing – masing variable untuk klaster 2.

Klik continue.Klik OK pada kotak dialog Select Cases.

karakteristik masing – masing variable untuk klaster 3.

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 10: penerapan analisis cluster dengan software

Klik continue.Klik OK pada kotak dialog Select Cases.

b) Klik analyze > descriptive statistics > descriptive.Centang : save standardized values as variables

c) Klik OK untuk mendapatkan karakteristik masing – masing variable

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 11: penerapan analisis cluster dengan software

PEMBAHASAN

Adapun output dan interpretasi dari analisis cluster yang telah dilakukan dengan software adalah sebagai berikut :

1. Data setelah dilakukan standarisasi adalah sebagai berikut :

Data distandarisasi ke dalam Z apabila keragaman data besar dan satuan data tidak sama. Data dalam permasalahan ini memiliki keragaman yang besar sehingga dilakukan standarisasi terlebih dahulu.

2. Uji korelasi.

Ada beberapa vaiabel predictor yang saling berhubungan yaitu antara variable makanpokok dengan sakit dan variable tempattetap dengan sakit. Sehingga, memungkinkan adanya multikolinieritas. Oleh karena itu, agar tidak terjadi multikoinieritas dilakukan analisis komponen utama terlebih dahulu.

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 12: penerapan analisis cluster dengan software

3. Output analisis komponen utama

Banyaknya komponen utama yang terbentuk dilihat dari prosentase keragaman ≥ 75%. Komponen utama pertama memiliki prosentase keragaman < 75% yaitu sebesar 33.4%. Komponen utama kedua memiliki prosentase keragaman < 75% yaitu sebesar 53.7%. Sedangkan pada komponen utama ketiga memiliki prosentase keragaman < 75% yaitu sebesar 71.8%. Komponen utama keempat memiliki prosentase keragaman > 75% yaitu sebesar 84.3%. Sehingga, Penentuan banyaknya komponen utama yang tepat hingga Komponen utama keempat.

4. Banyak klaster yang terbentuk.Ada 2 output SPSS yang dapat digunakan u ntuk mengetahui banyak klaster yang terbentuk yaitu :a) Agglomeration schedule

Agglomeration Schedule

Stage

Cluster Combined

Coefficients

Stage Cluster First

Appears

Next StageCluster 1 Cluster 2 Cluster 1 Cluster 2

1 11 19 .364 0 0 3

2 1 18 .413 0 0 5

3 3 11 .575 0 1 7

4 10 12 .805 0 0 12

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 13: penerapan analisis cluster dengan software

5 1 4 .873 2 0 8

6 20 22 .902 0 0 11

7 3 13 .976 3 0 9

8 1 6 1.084 5 0 12

9 2 3 1.111 0 7 16

10 7 14 1.129 0 0 15

11 20 21 1.136 6 0 16

12 1 10 1.327 8 4 15

13 5 17 1.459 0 0 20

14 9 23 1.569 0 0 19

15 1 7 1.664 12 10 17

16 2 20 1.717 9 11 17

17 1 2 2.110 15 16 19

18 15 16 2.506 0 0 21

19 1 9 2.693 17 14 20

20 1 5 2.915 19 13 21

21 1 15 3.391 20 18 22

22 1 8 5.235 21 0 23

23 1 24 5.361 22 0 0

Dilihat dari kolom corfficients.Banyak klaster = banyak data – stage yang lebih kecil dibandingkan stage lainnya dengan selisih coefficiebts besar diantara keduanya.Selisih koefisien terbesar adalah = 5.235 – 3.391 atau stage 22 – stage 21Jadi, banyak klaster = 24 – 21 = 3

b) Dendogram

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 14: penerapan analisis cluster dengan software

Dilihat dari garis terujung hingga pangkal. Paling dekat dengan ujung dipotong, sehingga terbentuk 3 klaster.

5. Keanggotaan klaster.Output SPSS :

Cluster Membership

Case 3 Clusters

1:sumatera utara 1

2:sumatera barat 1

3:riau 1

4:jambi 1

5:sumatera selatan 1

6:bengkulu 1

7:lampung 1

8:DKI jakarta 2

9:jawa barat 1

10:jawa tengah 1

11:DI Yogyakarta 1

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 15: penerapan analisis cluster dengan software

12:jawa timur 1

13:bali 1

14:NTB 1

15:NTT 1

16:kalimantan barat 1

17:kalimantan timur 1

18:kalimantan selatan 1

19:kalimantan tengah 1

20:sulawesi utara 1

21:sulawesitengah 1

22:sulawesi selatan 1

23:sulawesi tenggara 1

24:irian jaya 3

Interpretasi :Jumlah 3 kelompok terdiri kelompok pertama meliputi propinsi sumatera utara, sumatera barat, riau, jambi, sumatera selatan, Bengkulu, lampung, jawa barat, jawa tengah, DI Yogyakarta, Jatim, Bali, NTB, NTT, Kalimantan Barat, Kalimantan Timur, Kalimantan Selatan, Kalimantan Tengah, Sulawesi Utara, Sulawesi tengah, Sulawesi Selatan, Sulawesi tenggara, dan kelompok kedua meliputi DKI Jakarta. Untuk kelompok ketiga adalah propinsi Irian Jaya.

6. Karakteristik masing – masing variable.

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012

Page 16: penerapan analisis cluster dengan software

Descriptive Statistics

N Minimum Maximum Mean Std. Deviation

TidakSekolah 1 52.32 52.32 52.3200 .

MakanPokok 1 70.04 70.04 70.0400 .

MakanLauk 1 30.37 30.37 30.3700 .

Pakaian 1 16.84 16.84 16.8400 .

TempatTetap 1 6.58 6.58 6.5800 .

Sakit 1 18.62 18.62 18.6200 .

Valid N (listwise) 1

Interpretasi :Kriteria Keterlantaran Lansia yang terbesar menurut propinsi berdasarkan data BPS pada laporan Sosial Indonesia dari Supas dan Sakemas 1995 adalah kriteria makan makanan pokok < 21kali dalam seminggu. Kriteria ini adalah criteria yang paling menunjukkan keterlantaran lansia menurut propinsi.

Jadi, dari permasalahan di atas dapat disimpulkan :- Pembentukan wilayah pembinaan untuk permasalahan lansia dapat

dilakukan dengan membentuk wilayah konsentrasi berdasarkan data, dan didapatkan 3 pembentukan wilayah, yaitu terdiri dari kelompok pertama meliputi propinsi sumatera utara, sumatera barat, riau, jambi, sumatera selatan, Bengkulu, lampung, jawa barat, jawa tengah, DI Yogyakarta, Jatim, Bali, NTB, NTT, Kalimantan Barat, Kalimantan Timur, Kalimantan Selatan, Kalimantan Tengah, Sulawesi Utara, Sulawesi tengah, Sulawesi Selatan, Sulawesi tenggara, dan kelompok kedua meliputi DKI Jakarta. Untuk kelompok ketiga adalah propinsi Irian Jaya.

- Kriteria Keterlantaran Lansia yang terbesar menurut propinsi berdasarkan data BPS pada laporan Sosial Indonesia dari Supas dan Sakemas 1995 adalah kriteria makan makanan pokok < 21kali dalam seminggu. Kriteria ini adalah criteria yang paling menunjukkan keterlantaran lansia menurut propinsi.

Dinda Rinai V.S-FMIPAUniv.Brawijaya,Malang

2012