JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU...

41
i ANALISIS KLASTER MENGGUNAKAN METODE SINGLE LINKAGE, COMPLETE LINKAGE, AVERAGE LINKAGE, DAN K-MEANS UNTUK MENGELOMPOKKAN KABUPATEN DI JAWA TENGAH BERDASARKAN PRODUKSI PALAWIJA TAHUN 2015 tugas akhir disusun sebagai salah satu syarat untuk memperoleh gelar Ahli Madya Program Studi Statistika Terapan dan Komputasi oleh Ninuk Dian Rahmawati 4112313014 JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI SEMARANG 2017

Transcript of JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU...

Page 1: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

i

ANALISIS KLASTER MENGGUNAKAN METODE SINGLE

LINKAGE, COMPLETE LINKAGE, AVERAGE LINKAGE, DAN

K-MEANS UNTUK MENGELOMPOKKAN KABUPATEN DI

JAWA TENGAH BERDASARKAN PRODUKSI PALAWIJA

TAHUN 2015

tugas akhir

disusun sebagai salah satu syarat

untuk memperoleh gelar Ahli Madya

Program Studi Statistika Terapan dan Komputasi

oleh

Ninuk Dian Rahmawati

4112313014

JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS NEGERI SEMARANG

2017

Page 2: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

ii

PERNYATAAN

Saya menyatakan bahwa tugas akhir ini bebas plagiat, dan apabila dikemudian

hari terbukti terdapat plagiat dalam tugas akhir ini, maka saya bersedia menerima

sanksi sesuai peraturan perundang-undangan.

Semarang, 26 Januari 2017

Ninuk Dian Rahmawati

4112313014

Page 3: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

iii

PERSETUJUAN PEMBIMBING

Tugas akhir ini telah disetujui oleh pembimbing untuk diajukan ke Sidang Panitia

Tugas Akhir Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan

Alam Universitas Negeri Semarang.

Semarang, 26 Januari 2017

Pembimbing Utama

Putriaji Hendikawati, S.Si., M.Pd., M.Sc.

198208182006042001

Page 4: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

iv

PENGESAHAN

Tugas akhir yang berjudul

Analisis Klaster Menggunakan Metode Single Linkage, Complete Linkage,

Average Linkage, Dan K-Means Untuk Mengelompokkan Kabupaten Di Jawa

Tengah Berdasarkan Produksi Palawija Tahun 2015

disusun oleh

Nama : Ninuk Dian Rahmawati

Nim : 4112313014

Telah dipertahankan di hadapan sidang Panitia Ujian Tugas Akhir FMIPA Unnes

pada tanggal

Panitia:

Ketua Sekretaris

Prof. Dr.Zaenuri SE, M.Si, Akt Drs. Arief Agoestanto, M.Si

196412231988031001 196807221993031005

Penguji I Penguji II

Drs. Supriyono, M.Si Putriaji Hendikawati, S.Si., M.Pd., M.Sc.

195210291980031002 198208182006042001

Page 5: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

v

MOTTO DAN PERSEMBAHAN

MOTTO

Berdoa tanpa berusaha itu bohong, berusaha tanpa berdoa itu sombong.

PERSEMBAHAN

Tugas akhir ini penulis persembahkan kepada:

1. Untuk keluarga dirumah Ayah, Ibu, Mas Yanosa, Mba Mua, Mba Devi, dan

si kecil Ali Mustofa.

2. Untuk Murobbi dan saudari lingkar ukhuwah.

3. Untuk seluruh fungsionaris KAMMI Fatahillah Unnes periode 1437 H.

4. Untuk Keluarga Rumah Tilawah Ikhwah Rasul.

5. Untuk teman-teman Staterkom angkatan 2013.

6. Untuk teman-teman Aktivis Dakwah Mipa 2013.

7. Untuk semua teman seperjuangan dalam dakwah.

Page 6: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

vi

KATA PENGANTAR

Puji syukur kehadirat Allah SWT yang telah melimpahkan rahmat dan

hidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis

menyadari sepenuhnya, tanpa bimbingan dan bantuan dari pihak lain, penulisan

tugas akhir ini tidak dapat terselesaikan dengan baik. Oleh karena itu, pada

kesempatan ini penulis ingin mengucapkan terim kasih kepada

1. Bapak Prof. Dr. Fathur Rokhman, M.Hum , Rektor Universitas Negeri

Semarang.

2. Bapak Dr. Zaenuri, S.E, M.Si, Akt , Dekan FMIPA Universitas Negeri

Semarang.

3. Bapak Drs. Arief Agoestanto, M.Si , Ketua Jurusan Matematika FMIPA

Universitas Negeri Semarang.

4. Bapak Dr. Wardono, M.Si , Kaprodi Statistika Terapan dan Komputasi

FMIPA Universitas Negeri Semarang.

5. Ibu Putriaji Hendikawati, S.Si., M.Pd., M.Sc., dosen pembimbing utama,

terima kasih atas ilmu yang bermanfaat, kesabaran, motivasi, bimbingan

dan dukungan dalam penyelesaian tugas akhir ini.

6. Bapak Drs. Supriyono, M.Si, dosen pembimbing pendamping, terima

kasih atas ilmu yang bermanfaat, kesabaran, motivasi, bimbingan dan

dukungan dalam penyelesaian tugas akhir ini.

7. Bapak dan Ibu seluruh jajaran dosen dan staff administrasi di Jurusan

Matematika yang telah memberikan wawasan dan pengetahuan selama

belajar di Jurusan Matematika.

8. Seluruh pihak yang tidak dapat penulis sebutkan satu persatu yang telah

memberikan bantuan dan dorongan sehingga penyusunan tugas akhir dapat

terselesaikan.

Page 7: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

vii

Penulis menyadari bahwa tugas akhir ini masih banyak kekurangan dan jauh

dari kata sempurna. Oleh karena itu, kritik dan saran sangat diharapkan sebagai

bahan perbaikan. Akhir kata, semoga isi dalam tugas akhir ini bermanfaat bagi

pembaca.

Semarang , Februari 2017

Penulis

Page 8: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

viii

ABSTRAK

Rahmawati, N.D. 2017. Analisis Klaster Menggunakan Metode Single Linkage, Complete Linkage, Average Linkage, Dan K-Means Untuk Mengelompokkan Kabupaten Di Jawa Tengah Berdasarkan Produksi Palawija Tahun 2015. Tugas

Akhir, Jurusan Matematika Fakultas Matematika dan Pengetahuan Alam

Universitas Negeri Semarang. Pembimbing Utama Putriaji Hendikawati, M.Pd.,

M.Sc dan Pembimbing Pendamping Drs. Supriyono, M.Si

Kata kunci: Palawija, Analisis klaster, Single Linkage, Complete Linkage,

Average Linkage, K-Means

Tanaman palawija merupakan tanaman yang potensial untuk

dikembangkan karena hasilnya dapat digunakan sebagai sumber karbohidrat,

sumber protein nabati, dan bahan berbagai industri. Tanaman palawija meliputi

jagung, kedelai, kacang tanah, kacang hijau, ubi kayu dan ubi jalar. Salah satu

upaya yang dapat dilakukan dalam rangka meningkatkan dan memelihara

produktivitas di sektor pertanian khusunya hasil palawija yakni dengan

mengelompokkan wilayah ke dalam kelompok-kelompok berdasarkan kesamaan

karakteristik yang dimiliki.

Analisis klaster merupakan salah satu metode dalam analisis statistik

multivariat yang digunakan untuk mengelompokkan obyek-obyek ke dalam suatu

kelompok berdasarkan karakteristik yang dimiliki, sehingga obyek-obyek dalam

suatu kelompok memiliki ciri-ciri yang lebih homogen dibandingkan dengan

obyek dalam kelompok lain. Dalam analisis klaster tedapat dua metode yaitu

metode hierarki dan metode non-hierarki, contoh dari metode hierarki adalah

metode Single Likage, metode Complete Linkage, dan metode Average Linkage, dan contoh dari metode non-hierarki adalah metode K-Means.

Tujuan penelitian ini untuk mengetahui hasil analisis klaster dengan

menggunakan metode hierarki, yakni metode Single Linkage, metode Complete Linkage, metode Average Linkage dan metode non-hierarki, yakni K-Means

dalam pengelompokan kabupaten berdasarkan variabel hasil produksi palawija di

Provinsi Jawa Tengah tahun 2015.

Hasil pengelompokan dengan menggunakan metode hierarki, diperoleh

tiga buah klaster dengan anggota dari tiap-tiap klaster, yakni klaster pertama

mempunyai anggota 27 kabupaten, klaster kedua mempunyai anggota 1 kabupaten

dan klaster ketiga mempunyai anggota 1 kabupaten. Sedangakan pada proses

pengelompokan dengan menggunakan metode non-hierarki diperoleh tiga buah

klaster dengan anggota tiap-tiap klaster, yakni klaster pertama mempunyai

anggota 26 kabupaten, klaster kedua mempunyai anggota 1 kabupaten, dan klaster

ketiga mempunyai anggota 2 kabupaten.

Page 9: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

ix

DAFTAR ISI

Halaman

HALAMAN JUDUL ................................................................................................ i

PERNYATAAN ...................................................................................................... ii

PERSETUJUAN PEMBIMBING .......................................................................... iii

PENGESAHAN ..................................................................................................... iv

MOTTO DAN PERSEMBAHAN ........................................................................... v

KATA PENGANTAR ........................................................................................... vi

ABSTRAK ........................................................................................................... viii

DAFTAR ISI .......................................................................................................... ix

DAFTAR TABEL ................................................................................................. xii

DAFTAR GAMBAR ........................................................................................... xiv

DAFTAR LAMPIRAN .......................................................................................... xv

BAB

1. PENDAHULUAN

1.1. Latar Belakang ........................................................................................... 1

1.2. Rumusan Masalah ...................................................................................... 3

1.3. Tujuan Penelitian ....................................................................................... 4

Page 10: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

x

1.4. Manfaat Penelitian ............................................................................ 4

1.5. Batasan Masalah ............................................................................... 5

1.6. Sistematika Penulisan ....................................................................... 5

2. TINJAUAN PUSTAKA

2.1. Palawija ............................................................................................ 7

2.2. Analisis Klaster ................................................................................ 9

2.2.1. Ciri-ciri Analisis Klaster .................................................. 9

2.2.2. Istilah Dalam Analisis Klaster ....................................... 10

2.2.3. Tujuan Analisis Klaster .................................................. 11

2.2.4. Konsep Dasar Dalam Analisis Klaster ........................... 11

2.2.5. Proses Analisis Klaster .................................................. 12

2.3. Kerangka Berpikir .......................................................................... 22

3. METODE PENELITIAN

3.1. Ruang Lingkup ............................................................................... 24

3.2. Variabel ......................................................................................... 25

3.3. Metode Pengumpulan Data ............................................................ 25

3.4. Metode Analisis Data ..................................................................... 26

3.4.1. Langkah-langkah Analisis Data Menggunakan SPSS

Untuk Metode Hierarki .................................................. 27

3.4.2. Langkah-langkah Analisis Data Menggunakan SPSS

Untuk Metode Non-Hierarki .......................................... 33

3.5. Penarikan Kesimpulan .................................................................... 36

Page 11: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

xi

4. HASIL DAN PEMBAHASAN

4.1. Hasil Penelitian ....................................................................... 37

4.1.1. Pembentukan Klaster ..................................................... 37

4.1.2. Analisis Pembentukan Klaster ....................................... 39

4.2. Pembahasan ............................................................................. 68

5. PENUTUP

5.1. Kesimpulan ............................................................................. 70

5.2. Saran ........................................................................................ 71

DAFTAR PUSTAKA ............................................................................................ 72

LAMPIRAN ........................................................................................................... 73

Page 12: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

xii

DAFTAR TABEL

Tabel Halaman

1.1. Data Hasil Produksi Palawija. ......................................................................... 74

2.1. Tabel Proximity Matrix Single Linkage Dan Complete Linkage .................... 75

2.2. Tabel Agglomeration Schedule Dengan Metode Single Linkage .................... 79

2.3. Tabel Cluster Membership Single Linkage ..................................................... 81

2.4. Tabel Matriks Dengan Metode Single Linkage ............................................... 82

2.5. Tabel Perbaikan Matriks Single Linkage ........................................................ 83

3.1. Tabel Agglomeraiom Schedule Dengan Metode Complete Linkage............... 84

3.2. Tabel Matriks Dengan Menggunakan Metode Complete Linkage ................. 86

3.3. Tabel Perbaika Matriks Complete Linkage ..................................................... 87

3.4. Tebel ClusterMembership Complete Linkage ................................................. 87

4.1. Tabel Proximty Matrix Dengan Metode Average Linkage ............................. 88

4.2. Tabel Agglomeration Dengan Metode Average Linkage ................................ 92

4.3. Tabel Matriks Dengan Metode Average Linkage ........................................... 94

4.4. Tabel Perbaikan Matriks ................................................................................. 95

4.5. Tabel Cluster Membership Average Linkage .................................................. 95

Page 13: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

xiii

5.1. Data Hasil Pengelompokan Denga Menggunakan Metode Hierarki ............. 96

6.1. Tabel Initial Cluster Center Dengan Metode K-Means .................................. 97

6.2. Tabel Final Cluster Center Dengan Metode K-Means ................................... 97

6.3. Tabel Jarak Setiap Obyek Dengan Setiap Centroid ........................................ 98

6.4. Tabel Jarak Setiap Obyek Dengan Setiap Centroid baru ................................ 99

6.5. Tabel Cluster Membership K-Means .............................................................. 99

6.6. Tabel Pengelompokan Dengan Metode K-Means......................................... 100

6.7. Data hasil pengelompokan Dengan Metode K-Means .................................. 101

Page 14: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

xiv

DAFTAR GAMBAR

Gambar Halaman

1. Step to Hierarchical Cluster Analysis .......................................................... 27

2. Hierarchical Cluster Analysis ...................................................................... 28

3. Hierarchical Cluster Analysis : Statistics ..................................................... 29

4. Hierarchical Cluster Analysis : Plots ........................................................... 30

5. Hierarchical Cluster Analysis : Method Single Linkage .............................. 31

6. Hierarchical Cluster Analysis : Method Complete Linkage ......................... 32

7. Hierarchical Cluster Analysis : Method Average Linkage ........................... 33

8. Step to Non-Hierarchical Cluster Analysis .................................................. 34

9. K-Means Cluster Analysis ............................................................................ 35

10. K-Means Cluster Analysis : Options ............................................................ 36

11. Dendogram Metode Single Linkage ............................................................ 79

12. Dendogram Metode Complete Linkage ........................................................ 84

13. Dendogram Metode Average Linkage .......................................................... 92

Page 15: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

xv

DAFTAR LAMPIRAN

Lampiran Halaman

1. Data Hasil Palawija Kabupaten Provinsi Jawa Tengah 2015 ....................... 74

2. Proximity Matriks Single Linkage dan Average Linkage ............................. 75

3. Agglomeration Schedule Metode Single Linkage ......................................... 79

4. Dendogram Metode Single Linkage ............................................................. 80

5. Cluster Membership Metode Single Linkage ............................................... 81

6. Tabel Matriks Metode Single Linkage .......................................................... 82

7. Agglomeration Schedule Metode Complete Linkage .................................. 84

8. Dendogram Metode Complete Linkage ........................................................ 85

9. Tabel Matriks Metode Complete Linkage .................................................... 86

10. Cluster Membership Metode Complete Linkage ......................................... 87

11. Proximity Matriks dengan Average Linkage ................................................ 88

12. Agglomeration Schedule Metode Average Linkage ..................................... 92

13. Dendogram Metode Average Linkage .......................................................... 93

14. Tabel Matriks Metode Average Linkage ...................................................... 94

15. Cluster Membership Metode Average Linkage ............................................ 95

16. Data Hasil Pengelompokan Dengan Metode Hierarki.................................. 96

17. Final Cluster Center ..................................................................................... 97

18. Jarak Setiap Obyek Dengan Centroid........................................................... 98

19. Jarak Setiap Obyek Dengan Centroid Baru .................................................. 99

20. Cluster Membership Metode K-Means ....................................................... 100

21. Data Hasil Penglompokan Dengan Metode K-Means ................................ 101

Page 16: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

1

BAB I

PENDAHULUAN

1.1. Latar Belakang

Jawa Tengah sabagai salah satu provinsi di Jawa, diapit oleh dua provinsi

besar, yakni Jawa Barat dan Jawa Timur. Letaknya antara 5°40´ dan 8°30´

Lintang Selatan dan antara 108°30´ dan 111°30´ Bujur Timur (termasuk Pulau

Karimunjawa). Jarak terjauh dari Barat ke Timur adalah 263 km dan dari Utara ke

Selatan adalah 226 km (tidak termasuk Pulau Karimunjawa).

Provinsi Jawa Tengah terdiri dari 29 kabupaten dan 6 kota. Luas wilayah

Jawa Tengah pada tahun 2010 tercatat sebesar 3,25 juta hektar atau sekitar 25,04

persen dari luas Pulau Jawa (1,70 persen dari luas Indonesia). Luas yang ada

terdiri dari 992 ribu hektar (30,47 persen) lahan sawah dan 2,26 juta hektar (69,53

persen) bukan lahan sawah.

Secara umum, luas panen tanaman palawija di Jawa Tengah pada tahun

2014 beberapa komoditas mengalami penurunan dibandingkan tahun sebelumnya.

Menurut data Badan Pusat Statistik Provinsi Jawa Tengah tahun 2015 tanaman

palawija meliputi jagung, kedelai, kacang tanah, kacang hijau, ubi kayu dan ubi

jalar. Komoditas yang mengalami penurunan antara lain ubi kayu turun sebesar

5,3 persen, kacang tanah 0,64 persen, ubi jalar 9,57 persen. Sedangkan beberapa

komoditas yang mengalami peningkatan antara lain jagung naik sebesar 1,14

persen, kedelai 10,66 persen, kacang hijau 38,45 persen.

Page 17: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

2

Hal itu menunjukan bahwa tanaman palawija merupakan tanaman yang

potensial untuk dikembangkan. Oleh karena itu, sebagai pelaku dan penentu

kebijakan, petani dan pemerintah harus berupaya bersama dalam rangka

meningkatkan dan memelihara produktivitas di sektor pertanian khususnya

produksi palawija. Salah satu upaya yang dapat dilakukan dalam rangka

meningkatkan dan memelihara produktivitas di sektor pertanian khusunya hasil

palawija yakni dengan mengelompokkan wilayah ke dalam kelompok-kelompok

berdasarkan kesamaan karakteristik yang dimiliki. Pengelompokan itu bertujuan

agar informasi terkait hasil produksi palawija yang tersebar di tiap-tiap wilayah

yang ada menjadi lebih efisien dan spesifik. Sehingga dalam melakukan

pembinaan di setiap kelompok daerah di bidang pertanian palawija akan lebih

fokus, terarah dan tepat. Salah satu cara untuk pengelompokan ini dapat

diidentifikasi menggunakan analisis klaster.

Analisis klaster merupakan salah satu metode dalam analisis statistik

multivariat yang digunakan untuk mengelompokkan obyek-obyek ke dalam suatu

kelompok berdasarkan karakteristik yang dimiliki, sehingga obyek-obyek dalam

suatu kelompok memiliki ciri-ciri yang lebih homogen dibandingkan dengan

obyek dalam kelompok lain. Setiap unit pengamatan dalam satu kelompok akan

memiliki ciri yang relatif sama sedangkan antar kelompok unit pengamatan

memiliki sifat yang berbeda.

Secara umum analisis klaster dibagi menjadi dua metode yakni metode

hierarki dan metode non-hierarki. Di dalam metode hierarki sendiri terdapat

beberapa metode, metode-metode yang termasuk dalam metode hierarki

Page 18: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

3

diantaranya metode Pautan Tunggal (Single Linkage), metode Pautan Lengkap

(Complete Linkage), dan Pautan Rata–Rata (Average Linkage), sedangkan metode

yang termasuk dalam metode non-hierarki yakni metode K-Means.

Oleh karena banyaknya metode dan prosedur dalam analisis klaster, penulis

tertarik untuk melakukan penelitian dengan judul ”Analisis Klaster Menggunakan

Metode Single Linkage, Complete Linkage, Average Linkage, Dan K-Means

Untuk Mengelompokkan Kabupaten Di Jawa Tengah Berdasarkan Produksi

Palawija Tahun 2015”. Penelitian ini bertujuan untuk mengetahui hasil

pengelompokan atau pengklasteran metode Single Linkage, metode Complete

Linkage, metode Average Linkage dan metode K-Means. Selain itu, diharapkan

dari penelitian ini bermanfaat bagi pemerintah untuk mengetahui potensi-potensi

produksi palawija di masing-masing kabupaten di Provinsi Jawa Tengah.

1.2. Rumusan Masalah

Berdasarkan latar belakang di atas, dapat dirumuskan masalah sebagai

berikut

1. Bagaimana hasil klaster yang terbentuk dengan menggunakan metode

hierarki yakni metode Single Linkage, metode Complete Linkage, dan

metode Average Linkage untuk mengelompokkan kabupaten di Jawa

Tengah berdasarkan variabel produksi palawija tahun 2015?

2. Bagaimana hasil klaster yang terbentuk dengan menggunakan metode non-

hierarki yakni metode K-Means untuk mengelompokkan kabupaten di Jawa

Tengah berdasarkan variabel produksi palawija tahun 2015?

Page 19: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

4

1.3. Tujuan Penelitian

Tujuan yang ingin dicapai melalui penelitian ini adalah sebagai berikut

1. Untuk mengetahui hasil klaster yang terbentuk dengan menggunakan

metode hierarki yakni metode Single Linkage, Complete Linkage, dan

Average Linkage dalam mengelompokkan kabupaten di Jawa Tengah

berdasarkan variabel hasil produksi palawija tahun 2015.

2. Untuk mengetahui hasil klaster yang terbentuk dengan menggunakan

metode non-hierarki yakni metode K-Means untuk mengelompokkan

kabupaten di Jawa Tengah berdasarkan variabel hasil produksi palawija

tahun 2015.

1.4. Manfaat Penelitian

Hasil penelitian ini diharapkan mempunyai manfaat sebagai berikut

1. Bagi Penulis

Penulis dapat memperdalam dan mengembangkan ilmu tentang analisis

klaster yang diperoleh saat kuliah.

2. Bagi Jurusan

Sebagai bahan referensi tambahan untuk mata kuliah analisis multivariat.

Page 20: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

5

Sebagai bahan informasi terkait pengelompokan kabupaten berdasarkan

hasil produksi palawija yang tersebar di tiap-tiap wilayah, sehingga dalam

melakukan pembinaan di setiap kelompok kabupaten di bidang tanaman

palawija akan lebih fokus, terarah dan tepat.

1.5. Batasan Masalah

Pada penulisan ini, penulis membatasi penelitian menggunakan empat

metode yaitu metode Single Linkage, metode Complete Linkage, Average

Linkage, dan metode K-Means dengan jarak euclidean yang digunakan dalam

pengelompokan kabupaten berdasarkan data hasil produksi palawija di Jawa

Tengah tahun 2015 dan masing-masing metode membentuk 3 klaster yakni klaster

dengan produksi palawija tinggi, klaster dengan produksi palawija sedang dan

klaster dengan produksi palawija rendah. Pengelompokan kabupaten menjadi 3

buah klaster bertujuan untuk mengoptimalkan upaya dalam meningkatkan

produktivitas produksi palawija di kabupaten Provinsi Jawa Tengah sesuai dengan

potensi-potensi yang dimiliki oleh masing-masing kabupaten.

1.6. Sistematika Penulisan

Penulisan tugas akhir ini terdiri dari tiga bagian sebagai berikut

1. Bagian Awal

Bagian ini terdiri atas halaman judul, pernyataan keaslian tulisan, halaman

pengesahan, persembahan, motto, prakata, abstrak, daftar isi, daftar tabel,

daftar gambar, dan daftar lampiran.

Page 21: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

6

2. Bagian Isi

Bagian isi merupakan bagian penelitian yang terdiri atas bagian

pendahuluan, tinjauan pustaka, metode penelitian, hasil dan pembahasan,

dan penutup yang disusun menjadi 5 bab dengan rincian sebagai berikut

BAB I : Pendahuluan berisi latar belakang, rumusan masalah, tujuan

penelitian, manfaat penelitian, batasan masalah, dan

sistematika penulisan tugas akhir.

BAB II : Tinjauan pustaka berisi landasan teori dan kerangka berpikir

BAB III : Metode penelitian berisi ruang linkgup data, variabel

penelitian, metode pengumpulan data, metode analisis data

dan penarikan kesimpulan.

BAB IV : Hasil penelitian dan pembahasan sebagai jawaban dari

permasalahan.

BAB 5 : Penutup berisi simpulan hasil penelitian dan saran yang

berkaitan dengan hasil penelitian yang diperoleh.

3. Bagian Akhir

Bagian ini terdiri dari daftar pustaka dan lampiran.

Page 22: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

7

BAB II

TINJAUAN PUSTAKA

2.1. Palawija

Tanaman palawija merupakan tanaman yang potensial untuk dikembangkan

karena hasilnya dapat digunakan sebagai sumber karbohidrat, sumber protein

nabati, dan bahan berbagai industri. Tanaman palawija meliputi jagung, kedelai,

kacang tanah, kacang hijau, ubi kayu dan ubi jalar. Jagung sebagai bahan

makanan bergizi tidak kalah jika dibandingkan dengan beras, selain untuk bahan

makanan manusia, jagung dapat digunakan untuk makanan ternak, bahan industri,

minuman, sirup, kopi, kertas, minyak dan cat. Kedelai dapat diolah menjadi bahan

makanan (tahu, tempe), minuman, dan penyedap cita rasa makanan, daun dan

batangnya yang sudah kering dapat digunakan sebagai makanan ternak dan pupuk

hijau. Kacang tanah kaya lemak, mengandung protein yang tinggi, zat besi,

vitamin E dan kalsium, vitamin B kompleks dan fosforus, vitamin A dan K,

lesitin, kolin dan kalsium. Kacang tanah juga dikatakan mengandung bahan yang

dapat meningkatkan ketahanan tubuh dalam mencegah beberapa penyakit. Kacang

hijau digunakan sebagai bahan makanan dan juga sebagai pakan ternak. Kelebihan

kacang hijau dibanding tanaman pangan lain adalah berumur pendek, tidak sulit

dibudidayakan, dapat menyuburkan tanah, tidak terlalu banyak terserang hama

dan penyakit dan tidak sulit dalam pemasaran. Sedangkan ubi kayu dapat

Page 23: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

8

dimanfaatkan secara luas dan mempunyai prospek cerah sebagai bahan baku

industri. Produk olahan ubi kayu seperti misalnya sawut kering dan tepung ubi

kayu, selanjutnya dapat diolah menjadi produk-produk olahan lain yang memiliki

nilai ekonomi dan nilai gizi yang lebih baik. Ubi jalar memiliki peranan yang

besar dalam pembangunan pertanian sehingga prospeknya sangat cerah apabila

dikelola dan dikembangkan dengan pola agribisnis. Di negara-negara yang sudah

maju ubi jalar dipergunakan sebagai bahan baku dalam kegiatan aneka industri

seperti industri fermentasi, industri tekstil, industri kosmetika, industri farmasi,

industri makanan dan pembuatan sirup. Ubi jalar dapat diolah menjadi berbagai

macam produk seperti dibuat tepung, permen, kripik, chips, makanan ringan, dan

gula fruktosa. Ubi jalar dapat pula dipergunakan sebagai bahan baku makanan

olahan seperti mie dan roti. Ubi jalar juga dapat dikemas dalam bentuk pasta yang

dipergunakan sebagai bahan baku industri makanan dan minuman. Ubi jalar

memiliki limbah yang berupa batang dan daun dapat dimanfaatkan sebagai

makanan ternak. Limbah daun ubi jalar juga dapat dipergunakan sebagai makanan

kelinci. Pucuk-pucuk daun ubi jalar muda yang masih segar dapat juga

dimanfaatkan untuk keperluan sayur (Siswandi, 2006).

Page 24: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

9

2.2. Analisis Klaster

Analisis klaster merupakan teknik multivariat yang mempunyai tujuan

utama untuk mengelompokkan obyek-obyek berdasarkan kesamaan karakteristik

diantara obyek-obyek tersebut. Obyek bisa berupa produk (barang dan jasa),

benda (tumbuhan atau lainnya) serta orang (responden, konsumen atau yang

lain). Obyek tersebut akan diklasifikasikan ke dalam satu atau lebih klaster

(kelompok) sehingga obyek–obyek yang berada dalam satu klaster akan

mempunyai kemiripan satu dengan yang lain.

Data dalam analisis klaster dapat diskala atau dikategorikan ke dalam dua

tipe, yakni skala data non-metrik dan skala data metrik. Skala data non-metrik

digunakan untuk penelitian kualitatif sedangkan skala data metrik digunakan

untuk penelitian kuantitatif. Menurut Sukestiyarno (2008 : 3-4), tipe data yang

termasuk dalam skala non-metrik adalah data nominal dan data ordinal.

Sedangkan tipe data yang termasuk dalam skala metrik adalah data cardinal, data

interval dan data rasio.

2.2.1 Ciri–ciri Analisis Klaster

Menurut Santoso (2002 : 47), ciri-ciri klaster adalah

1. Homogenitas (kesamaan) yang tinggi antara anggota dalam satu klaster

(Within-Clutster).

2. Heterogenitas (perbedaan) yang tinggi antar klaster satu dengan klaster yang

lainnya (Between-Claster).

Page 25: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

10

2.2.2 Istilah Dalam Analisis Klaster

Beberapa istilah penting yang digunakan dalam analisis klaster, antara lain

1. Skedul Aglomerasi (Aglomeration Schedule), ialah judul yang memberikan

informasi tentang obyek atau kasus yang akan dikelompokan pada setiap

tahap pada suatu proses analisis klaster dengan metode hierarki.

2. Rata-rata klaster (Cluster Centrod), ialah nilai rata-rata variabel dari semua

obyek atau observasi dalam klaster tertentu.

3. Pusat klaster (Cluster Centers), ialah titik awal dimulainya pengelompokan

di dalam klaster non-hierarki.

4. Keanggotaan klaster (Claster Memberships), ialah keanggotaan yang

menunjukan klaster untuk setiap obyek yang menjadi anggotanya.

5. Dendogram, dapat disebut juga dengan grafik pohon, yakni output SPSS

yang menggambarkan hasil analisis klaster yang dilakukan peneliti. Garis

vertikal atau tegak menunjukan klaster yang digabung bersama. Posisi garis

pada skala menunjukan jarak untuk mana klaster digabung. Dendogram

harus dibaca dari kiri ke kanan.

6. Distances between cluster centers, ialah jarak yang menunjukan bagaimana

terpisahnya pasangan individu klaster (Supranto, 2004 :146).

Page 26: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

11

2.2.3 Tujuan Analisis Klaster

Analisis klaster dilakukan untuk tujuan sebagai berikut

1. Menggali data atau eksplorasi data.

2. Mereduksi data menjadi kelompok data baru dengan jumlah lebih kecil atau

dinyatakan dengan pengkelasan (klasifikasi) data.

3. Menggeneralisasi suatu populasi untuk memperoleh suatu hipotesis.

4. Menduga karakteristik data-data.

Tujuan utama analisis klaster adalah mengelompokkan obyek-obyek

berdasarkan kesamaan karakteristik diantara obyek-obyek tersebut (Santoso,

2002 : 47). Setelah mengelompokkan n buah obyek pengamatan ke dalam m

kelompok berdasarkan p variat dapat diketahui bahwa tujuan utama dari

pengelompokan obyek adalah untuk mendapatkan kelompok obyek yang

memiliki nilai relatif sama. Sehingga nanti dalam interpretasi obyek-obyek yang

berada pada satu klaster memiliki peluang yang cukup tinggi akan muncul

bersamaan pada satu individu.

2.2.4 Konsep Dasar Dalam Analisis Klaster

Analisis klaster merupakan suatu teknik yang dipergunakan untuk

mengklasifikasikan obyek atau kasus ke dalam kelompok yang relatif homogen,

yang disebut klaster. Obyek dalam setiap kelompok cenderung mirip satu sama

lain dan berbeda jauh (tidak sama) dengan obyek dari klaster lainnya (Supranto,

2004 : 142).

Page 27: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

12

Pengelompokan dilakukan berdasarkan kemiripan (Similiarity) antar obyek.

Kemiripan diperoleh dengan meminimalkan jarak antar obyek dalam kelompok

(Within-Claster) dan memaksimalkan jarak antar kelompok (Between-Claster).

2.2.5 Proses Analisis Klaster

Untuk melakukan analisis klaster ada beberapa proses yang harus

dilakukan. Proses analisis klaster tersebut meliputi

1. Standarisasi data

Standarisasi data dilakukan apabila terdapat perbedaan satuan yang

signifikan diantara variabel-variabel yang diteliti. Seperti jika variabel

penghasilan mempunyai satuan dalam juta, sedangkan variabel usia hanya

mempunyai satuan dalam puluhan, maka diantara dua variabel tersebut terdapat

perbedaan yang mencolok, akibatnya akan membuat perhitungan pada analisis

klaster menjadi tidak valid. Untuk itu, perlu dilakukan proses standarisasi dengan

mengenolkan rata-rata dan varian menjadi 1 (satu) atau dengan kata lain

mengubah data Zscore yakni transformasi data dalam bentuk normal baku

N(0,1), yang dapat dicari dengan rumus sebagai berikut

keterangan

: data k-i,

: rata-rata data,

: simpangan baku.

Page 28: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

13

2. Menentukan ukuran kemiripan antar obyek

Sesuai prinsip daftar klaster yakni mengelompokkan obyek yang

mempunyai kemiripan, maka proses pertama adalah mengukur seberapa jauh ada

kesamaan antar obyek. Dengan memiliki sebuah ukuran kuantitatif untuk

mengatakan bahwa dua obyek tertentu lebih mirip dibandingkan dengan obyek

lain, akan menghilangkan kebingungan dan mempermudah proses formal dalam

pengklasteran. Ukuran kesamaan atau kemiripan antar obyek dalam analisis

merupakan ukuran korespondensi diantara dua obyek. Ada tiga metode yang

dapat diterapkan dalam mengukur kemiripan antar obyek, yakni ukuran korelasi,

ukuran asosiasi dan ukuran jarak.

a. Ukuran asosiasi

Dalam analisis data berskala non-metrik, ukuran kesamaan atau kemiripan

digunakan ukuran asosiasi karena pada data berskala non-metrik bentuk data

lebih menggerombol. Ukuran kesamaan ini adalah dengan mengambil bentuk-

bentuk dari koefisien korelasi tiap sampel/obyeknya, dan korelasi-korelasi yang

bernilai negatif diganti dengan memutlakan nilainya.

b. Ukuran korelasi

Hampir sama dengan ukuran asosiasi, kesamaan antar obyek pada metode

ini dilihat dari koefisien korelasi antar pasangan obyek yang diukur dengan

beberapa variabel. Namun berbeda dengan ukuran asosiasi, ukuran korelasi

diterapkan pada data skala metrik.

Ukuran kesamaan ini jarang digunakan karena titik beratnya pada nilai

suatu pola tertentu (korelasi), padahal titik berat analisis klaster adalah pada

Page 29: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

14

besarnya obyek. Artinya ukuran kesamaan ini hanya meninjau seberapa besar

hubungan korelasinya, sehingga proses analisis klaster akan terkendala jika

terdapat data yang tumpang tindih. Yang termasuk jenis dari ukuran kesamaan ini

adalah

(i) Ukuran mutlak korelasi

Ukuran kesamaan ini tidak mempertimbangkan nilai yang positif ataupun

negatif dari obyek yang dianalisis. Ukuran ini menggunakan nilai mutlak dari

korelasinya, sehingga ukuran kemiripan obyek ke i terhadap obyek ke j atau

dinotasikan dij dapt dirumuskan sebagai berikut

dengan rij adalah koefisien korelasi antara obyek ke-i dan obyek ke-j dan

merupakan nilai mutlaknya.

(ii) Ukuran jarak korelasi

Ukuran kesamaan ini nilai korelasi yang positif ataupun negatif dari obyek

dianalisis mempengaruhi pengukuran kesamaannya. Ukuran kemiripan obyek ke-

i dengan obyek ke-j dapat dirumuskan sebagai berikut

dengan rij adalah koefisien korelasi antara obyek ke-i dan obyek ke-j.

c. Ukuran jarak

Metode ini diterapkan pada data berskala metrik. Konsep kemiripan pada

metode ini berdasarkan pada ukuran jarak antar obyek, dimana jarak yang besar

menunjukan sedikit kesamaan dan jarak yang pendek atau kecil menunjukan

bahwa suatu obyek semakin mirip dengan obyek yang lainnya. Berbeda dengan

Page 30: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

15

ukuran korelasi, ukuran jarak berfokus pada besarnya nilai. Klaster berdasarkan

ukuran korelasi bisa saja tidak memiliki kesamaan nilai tapi hanya memiliki

kesamaan pola, sedangkan klaster berdasarkan ukuran jarak lebih memiliki

kesamaan nilai meskipun polanya berbeda. Fungsi jarak obyek i dengan obyek j

dapat dinotasikan dengan dij. Ada beberapa macam ukuran jarak yang bisa

dipakai dalam analisis klaster diantaranya sebagai berikut

(i) Jarak euclidean

Jarak euclidean adalah panjangnya jarak suatu garis lurus yang

menghubungkan antar obyek. Misalkan ada dua obyek yakni A (x1, y1) dan B (x2,

y2) maka jarak antar kedua obyek tersebut dapat diukur dengan rumus

ukuran jarak atau obyek ke-i dengan obyek ke-j,

disimbolkan dengan dij dan k=1,...p. Nilai dij diperoleh melalui perhitungan jarak

kuadrat euclidean sebagai berikut

keterangan

Dij = Jumlah kuadrat Euclidean antar obyek ke-i dengan obyek ke-j,

P = Jumlah variabel klaster,

xik = Nilai atau data dari obyek ke-i pada variabel ke-k,

xjk = Nilai atau data dari obyek ke-j pada variabel ke-k (Everitt,1993).

Page 31: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

16

(ii) Jarak manhattan

Jarak manhattan adalah panjangnya jarak dari dua obyek ditinjau dari nilai

selisih kedua obyek tersebut. Misalkan ada dua obyek yakni A (x1,y1) dan B

(x2,y2) maka jarak manhattan dari obyek tersebut dapat diukur dengan rumus

. Maka jarak manhattan dari obyek i ke obyek j,

disimbolkan dij dengan k=1,2....,p variabel obyek dapat dihitung dengan

(iii) Jarak pearson

Jarak pearson merupakan perluasan dari jarak euclidean. Ukuran kesamaan

dalam jarak ini meninjau varian dari kedua obyeknya juga. Ukuran pearson

merupakan ukuran jarak euclidean yang dalam tiap variabelnya dibagi dengan

varian seluruh variabel yang ada. Maka jarak pearson dari obyek i ke obyek j,

disimbolkan dij dengan k=1,2,...,p variabel obyek dapat dihitung dengan

namun pada umumnya, ukuran jarak yang sering dipakai oleh peneliti adalah

jarak euclidean. Karena jarak ini cukup fleksibel untuk dilakukan modifikasi

dalam mengatasi kelemahan data. Misalnya kelemahan karena unit pengukuran

dan atau skala pengukuran yang berbeda bisa diperbaiki dengan melakukan

transformasi baku (Z) dari rumus jaraknya.

Konsep jarak euclidean ini memperlakukan semua variabel adalah bebas

(tidak berkorelasi). Transformasi baku yang dilakukan berarti menghilangkan

Page 32: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

17

pengaruh keragaman data atau dengan kata lain semua variabel akan memberikan

kontribusi yang sama untuk jarak.

3. Membentuk klaster

Proses klaster atau pengelompokan data bisa dilakukan dengan dua metode

yakni metode hierarki dan metode non-hierarki.

a. Metode hierarki

Tipe dasar dalam metode ini adalah aglomerasi dan pemecahan. Dalam

metode aglomerasi tiap observasi pada mulanya dianggap sebagai klaster

tersendiri sehingga terdapat klaster sebanyak jumlah observasi. Kemudian dua

klaster yang terdekat kesamaannya digabung menjadi suatu klaster baru,

sehingga jumlah klaster berkurang satu pada tiap tahap. Sebaliknya pada metode

pemecahan dimulai dari satu klaster besar yang mengandung seluruh observasi,

selanjutnya observasi-observasi yang paling tidak sama dipisah dan dibentuk

klaster-klaster yang lebih kecil. Proses ini dilakukan hingga tiap observasi

menjadi klaster sendiri-sendiri. Hal penting dalam metode hierarki adalah

bahwa hasil pada tahap sebelumnya selalu bersarang di dalam hasil pada tahap

berikutnya, membentuk sebuah pohon (Johnson, 1998 : 680).

Page 33: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

18

Langkah-langkah dalam algoritma klaster menggunakan metode hierarki

aglomerasi untuk mengelompokkan N obyek (Entin, 2004 : 2).

1. Mulai dengan N klaster, setiap klaster mengandung entiti tunggal dan

sebuah matrikss simetrik dari jarak (Similiarities) dengan tipe

2. Cari matrikss jarak untuk pasangan klaster yang terdekat. Misalkan jarak

antara klaster U dan V yang paling dekat adalah .

3. Gabungkan klaster U dan V. Label klaster yang baru dibentuk dengan

(UV). Perbarui entries pada matriks jarak dengan cara menghapus baris dan

kolom yang bersesuaian dengan klaster U dan V dan tambahkan baris dan

kolom yang memberikan jarak-jarak antara klaster (UV) dan klaster-klaster

yang tersisa.

4. Ulangi langkah (2) dan (3) sebanyak (N-1) kali (semua obyek akan berada

dalam klaster tunggal setelah algoritma berakhir). Catat identitas dari

klaster yang digabungkan dan tingkat-tingkat (jarak) dimana penggabungan

terjadi.

Ada beberapa metode aglomerasi dalam pembentukan klaster, diantaranya

adalah sebagai berikut

(i) Pautan tunggal (Single Linkage)

Metode ini didasarkan pada jarak minimum. Dimulai dengan dua obyek

yang dipisahkan dengan jarak paling pendek maka keduanya akan ditempatkan

pada klaster pertama, dan seterusnya. Metode ini dikenal pula dengan nama

pendekatan tetangga terdekat. Pada awalnya, harus menemukan jarak terpendek

Page 34: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

19

dalam dan menggabungkan obyek-obyek yang bersesuaian misalnya,

U dan V, untuk mendapat klaster (UV). Untuk tahapan penggabungan dua buah

klaster dari algoritma di atas jarak-jarak antara (UV) dan klaster W yang lain

dihitung dengan cara

besaran-besaran dan berturut-turut adalah jarak terpendek antara

klaster-klaster U dan W dan juga klaster-klaster V dan W.

(ii) Pautan lengkap (Complete Linkage)

Disebut juga pendekatan tetangga terjauh. Dasarnya adalah jarak

maksimum. Dalam metode ini seluruh obyek dalam suatu klaster dikaitkan satu

sama lain pada suatu jarak maksimum atau dengan kesamaan minimum. Pada

awalnya harus ditemukan jarak terpendek dalam dan menggabungkan

obyek-obyek yang bersesuaian misalnya, U dan V, untuk mendapat klaster

(UV). Untuk tahapan penggabungan dua buah klaster dari algoritma di atas jarak-

jarak antara (UV) dan klaster W yang lain dihitung dengan cara

besaran-besaran dan berturut-turut adalah jarak terjauh antara klaster-

klaster U dan W dan juga klaster-klaster V dan W.

(iii) Pautan rata-rata (Average Linkage)

Dasarnya adalah jarak rata-rata antar observasi. Pengelompokan dimulai

dari tengah atau pasangan observasi dengan jarak paling mendekati jarak rata-

rata. Pada awalnya harus ditemukan jarak terpendek dalam dan

Page 35: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

20

menggabungkan obyek-obyek yang bersesuaian misalnya, U dan V, untuk

mendapat klaster (UV). Untuk tahapan penggabungan dua buah klaster dari

algoritma di atas jarak-jarak antara (UV) dan klaster W yang lain dihitung

dengan cara

dimana adalah jarak antara obyek i dalam klaster (UV) dan obyek k dalam

klaster W, dan dan berturut-turut adalah banyaknya item-item dalam

klaster (UV) dan W.

b. Metode non-hierarki

Dalam metode ini diasumsikan terlebih dahulu jumlah kelompok yang

diinginkan pada akhir pengelompokan, yang termasuk dalam metode ini adalah

metode K-Means. Berbeda dengan metode hierarki, pusat klaster yang dipilih

pada metode ini merupakan pusat klaster sementara (Interim Centers) dengan

terus memperbaruhi pusat klaster untuk tiap iterasi sampai kriteria pemberhentian

tercapai, sehingga dimungkinkan bahwa obyek yang telah berada pada suatu

kelompok (klaster) tertentu dapat pindah ke klaster lain.

(i) Metode K-Means

Metode K-Means merupakan salah satu metode analisis klaster non-

hierarki yang digolongkan sebagai metode pengelompokan yang bersifat

unsupervised (tanpa arahan) karena data yang dianalisis tidak mempunyai label

kelas, yang berarti dalam proses pengelompokannya tidak mempunyai anggota

klaster yang pasti. Melainkan obyek yang sudah masuk ke dalam klaster tertentu

Page 36: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

21

masih bisa berpindah ke klaster yang lain. Akan tetapi, karena para peneliti

sering menentukan sendiri jumlah klaster awal, baik itu dengan menggunakan

metode tertentu atau berdasarkan pengalaman, maka metode K-Means ini disebut

juga sebagai metode semi-supervised classification.

Dalam metode ini diasumsikan terlebih dahulu jumlah kelompok atau

klaster yang diinginkan pada akhir suatu pengelompokan. Istilah K-Means sendiri

ditemukan untuk mendeskripsikan bahwa algoritma ini menandai setiap obyek

masuk ke dalam kelompok (klaster) yang mempunyai rataan (pusat klaster)

terdekat.

Langkah-langkah dalam analisis klaster K-Means dapat disusun dengan tahapan

sebagai berikut

1) Menentukan k sebagai jumlah klaster yang ingin dibentuk.

2) Menentukan centroid (titik pusat),

3) Menghitung jarak setiap data/obyek ke setiap centroid.

4) Menentukan centroid baru.

5) Menghitung jarak setiap data/obyek ke setiap centroid baru.

6) Mengulangi langkah ke 4 - 5 hingga nilai pusat klaster tidak berubah

lagi.

7) Melakukan interpretasi klaster.

Page 37: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

22

4. Interpretasi klaster

Interpretasi klaster dilakukan untuk mengetahui profil setiap kelompok

dengan menggunakan rata-rata pada setiap variabel. Pernyataan yang digunakan

untuk menginterpretasikan profil klaster adalah sebagai berikut

1. Klaster dengan rata-rata paling rendah maka dikategorikan sebagai

kelompok kabupaten dengan produksi palawija rendah.

2. Klaster dengan rata-rata lebih tinggi dari rata-rata klaster terendah maka

dikategorikan sebagai kelompok kabupaten dengan produksi palawija

sedang.

3. Klaster dengan rata-rata paling tinggi maka dikategorikan sebagai

kelompok kabupaten dengan produksi palawija tinggi.

2.3. Kerangka Berpikir

Terdapat dua metode dalam analisis klaster yakni metode hierarki dan

metode non-hierarki. Dalam proses pengelompokannya, masing-masing metode

memiliki algoritma yang berbeda. Masing-masing memiliki kelebihan dan

kekurangannya seperti metode hierarki yang jika jumlah obyeknya sangat besar

maka sulit untuk digambarkan dalam bentuk dendogram. Namun proses

pengelompokannya terjadi secara alami. Sedangkan metode non-hierarki dalam

hal ini metode K-Means dapat diterapkan pada obyek yang jumlahnya besar,

tetapi sulit untuk menentukan jumlah kelompok yang tepat. Dengan melihat

kelebihan dan kekurangan antara kedua metode tersebut peneliti ingin

mengetahui hasil pengelompokan dari masing-masing metode. Penelitian ini

dilakukan dengan menggunakan bantuan SPSS 16.0 agar lebih cepat dan akurat.

Page 38: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

23

Kemudian dilakukan perbaikan matriks dari jarak euclidean dari hasil output

SPSS, setelah dilakukan perbaiakan matriks selanjutnya membentuk klaster

(kelompok) dengan metode Single Linkage, Complete Linkage, Average

Linkage, dan metode K-Means. Setelah pengelompokan maka tahap selanjutnya

adalah melakukan interpretasi pada setiap klaster yang terbentuk.

Page 39: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

70

BAB V

PENUTUP

5.1 Kesimpulan

Berdasarkan hasil pembahasan mengenai analisis klaster menggunakan

metode Single Linkage, Complete Linkage, Average Linkage dan K-Means untuk

pengelompokan kabupaten berdasarkan variabel hasil produksi palawija di

provinsi Jawa Tengah diperoleh sebagai berikut

1. Hasil klaster yang terbentuk dengan metode hierarki yakni metode Single

Linkage, metode Complete Linkage, dan metode Average Linkage diperoleh

tiga buah klaster dengan anggota dari tiap-tiap klaster, yakni klaster pertama

mempunyai anggota 27 kabupaten, klaster kedua mempunyai anggota 1

kabupaten dan klaster ketiga mempunyai anggota 1 kabupaten. Kelompok

kabupaten dengan tingkat penghasil palawija yang tinggi hingga penghasil

palawija rendah berturut-turut adalah klaster kedua, klaster ketiga, dan

klaster pertama.

2. Hasil klaster yang terbentuk dengan metode non-hierarki yakni metode K-

Means diperoleh tiga buah klaster dengan anggota tiap-tiap klaster, yakni

klaster pertama mempunyai anggota 26 kabupaten, klaster kedua

mempunyai anggota 1 kabupaten, dan klaster ketiga mempunyai anggota 2

kabupaten. Kelompok kabupaten dengan tingkat penghasil palawija yang

Page 40: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

71

tinggi hingga penghasil palawija rendah berturut-turut adalah klaster ketiga,

klaster kedua, dan klaster pertama.

5.2 Saran

Pada tugas akhir ini penulis hanya mengkaji tentang 4 metode yakni metode

Single Linkage, Metode Complete Linkage, Metode Average Linkage dan metode

K-Means. Penelitian selanjutnya dapat dilakukan dengan menggunakan metode-

metode analisis klaster yang lain, mengingat cakupan metode analisis klaster yang

cukup banyak serta dapat dilakukan untuk membandingan setiap metode yang

digunakan dan mengaplikasikan pada bidang ilmu yang lain.

Page 41: JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU ...lib.unnes.ac.id/32219/1/4112313014.pdfhidayat-Nya, sehingga penulis dapat menyelesaikan tugas akhir ini. Penulis menyadari sepenuhnya,

72

DAFTAR PUSTAKA

Badan Pusat Statistik. 2015. Jawa Tengah Dalam Angka 2015. Semarang: Badan

Pusat Statistik Provinsi Jawa Tengah

Entin, H. 2004. Metode Klastering Hirarki. Risalah Komputasi Sains dan

Teknologi Nuklir (XVI)

Goejantoro, R. 2009. Algoritma Pengklsateran Pautan Tunggal, Jurnal Informatika Mulawarman, No.3, Vol.4, 2009. Universitas Mulawarman

Samarinda

Johnson, R.A. Dan Dean W Wichern. 1998. Applied Multivariate Statistical Analysis Sixth Edition. New York: Prentice-Hall International, inc.

Laraswati, T.F. 2014. Perbandingan Kinerja Metode Complete Linkage, Metode Average Linkage Dan Metode K-Means Dalam Menentukan Hasil Analisis Klaster. Skripsi. Yogyakarta: FMIPA Universitas Negeri

Yogyakarta

Santoso, S. 2002. Buku Latihan SPSS Statistika Multivariat. Jakarta: PT. Elex

Media Komputindo

Siswandi. 2006. Budidaya Tanaman Palawija.Yogyakarta: PT Citra Aji Parama

Soraya, Y. 2011. Perbandingan Kinerja Metode Single Linkage, Metode Complete Linkage, Dan Metode K-Means Dalam Analisis Klaster. Skripsi. Semarang: FMIPA Universitas Negeri Semarang

Sukestiyarno.YL. 2008. Workshop Olah Data Penelitian Dengan SPSS. Semarang. UNNES

Supranto, J. 2004. Analisis Multivariat Arti dan Interpretasi. Jakarta: PT Rineka

Cipta