TP Modul 5

2
Tugas Pendahuluan Modul 5 Yunisa Arini Anwar -14411014 1. Analisis cluster tidak menggunakan asumsi tentang jumlah kelompok yang terbentuk. Pada analisis cluster, pengelompokan dilakukan dengan dasar persamaan jarak yang memiliki tujuan yaitu pengelompokan berdasarkan persamaan karakteristik. Analisis ini menghasilkan kelompok dengan homogenitas yang tinggi di dalamnya, serta heterogenitas yang tinggi antar kelompok. Apabila pengelompokan dilakukan dengan benar, maka ketika plot dilakukan, individu dalam kelompok akan saling berkumpul di satu tempat. Selain itu, jarak antar kelompok akan terpisah jauh. Asumsi yang terdapat dalam analisis cluster adalah tidak ada korelasi antar variabel dan terdapat minimal skala berupa skala interval untuk seluruh variabel. 2. Dalam pengukuran, pengukuran similiaritas dengan distance lebih sering digunakan karena perbedaan jarak antar data dapat dilihat dengan jelas. Perbedaan mendasar dari ukuran korelasi dan ukuran jarak adalah pada ukuran korelasi pengelompokan dilakukan berdasarkan kemiripan pola data, sementara itu pada ukuran jarak, pengelompokan dilakukan berdasarkan kedekatan. 3. Perbedaan 4 jenis pengukuran jarak adalah sebagai berikut: Euclidean Distance Jarak Euclidean antara dua titik adalah panjang sisi miring dari sebuah segitiga siku-siku. Squared Euclidean Distance Pengukuran jarak Squared Euclidean menggunakan persamaan yang hampir sama dengan pengukuran jarak Euclidean, namun tidak menggunakan akar kuadrat. City Block (Manhattan) Distance: Meliputi penggantian perbedaan kuadrat dengan menjumlahkan perbedaan absolut dari variabel-variabel. Mahalanobis Distance Penghitungan jarak Mahalanobis ini didasarkan pada korelasi antara variabel. Pada mahalanobis distance, pola yang berbeda dapat diidentifikasi dan dianalisa berdasarkan titik referensinya.

Transcript of TP Modul 5

Page 1: TP Modul 5

Tugas Pendahuluan

Modul 5

Yunisa Arini Anwar -14411014

1. Analisis cluster tidak menggunakan asumsi tentang jumlah kelompok yang terbentuk. Pada analisis cluster, pengelompokan dilakukan dengan dasar persamaan jarak yang memiliki tujuan yaitu pengelompokan berdasarkan persamaan karakteristik. Analisis ini menghasilkan kelompok dengan homogenitas yang tinggi di dalamnya, serta heterogenitas yang tinggi antar kelompok. Apabila pengelompokan dilakukan dengan benar, maka ketika plot dilakukan, individu dalam kelompok akan saling berkumpul di satu tempat. Selain itu, jarak antar kelompok akan terpisah jauh. Asumsi yang terdapat dalam analisis cluster adalah tidak ada korelasi antar variabel dan terdapat minimal skala berupa skala interval untuk seluruh variabel.

2. Dalam pengukuran, pengukuran similiaritas dengan distance lebih sering digunakan karena perbedaan jarak antar data dapat dilihat dengan jelas. Perbedaan mendasar dari ukuran korelasi dan ukuran jarak adalah pada ukuran korelasi pengelompokan dilakukan berdasarkan kemiripan pola data, sementara itu pada ukuran jarak, pengelompokan dilakukan berdasarkan kedekatan.

3. Perbedaan 4 jenis pengukuran jarak adalah sebagai berikut: Euclidean Distance

Jarak Euclidean antara dua titik adalah panjang sisi miring dari sebuah segitiga siku-siku.

Squared Euclidean DistancePengukuran jarak Squared Euclidean menggunakan persamaan yang hampir sama dengan pengukuran jarak Euclidean, namun tidak menggunakan akar kuadrat.

City Block (Manhattan) Distance:Meliputi penggantian perbedaan kuadrat dengan menjumlahkan perbedaan absolut dari variabel-variabel.

Mahalanobis DistancePenghitungan jarak Mahalanobis ini didasarkan pada korelasi antara variabel. Pada mahalanobis distance, pola yang berbeda dapat diidentifikasi dan dianalisa berdasarkan titik referensinya.

Pengukuran jarak yang terbaik adalah pengukuran jarak dengan menggunakan Squared Euclidean Distance karena metode ini cenderung lebih efektif.

4. Metode Ward dapat membentuk cluster berdasarkan jumlah total kuadrat deviasi tiap pengamatan dari rata-rata cluster yang menjadi anggotanya. Metode Ward berbeda dengan metode hierarchical method lainnya karena menggunakan pendekatan analisis varians untuk menghitung jarak antar cluster. Metode Ward berusaha memperkecil jumlah kuadrat dari setiap dua cluster yang dapat dibentuk. Disini, kelebihan Metode Ward dibanding metode lainnya adalah lebih efisien dan cenderung menciptakan cluster berukuran kecil.

Referensi:http://jurnal.untan.ac.id/index.php/jbmstr/article/download/3026/2992http://statistikaterapan.files.wordpress.com/2008/10/analisis-cluster.dochttp://digilib.its.ac.id/public/ITS-Undergraduate-15451-2208100616-Paper.pdfhttp://www.ncbi.nlm.nih.gov/pubmed/18500774http://statistikaku.16mb.com/2012/03/cluster/