UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
PRAKTIKUM 3
ANALISA CLUSTER
Tujuan Praktikum
1. Mahasiswa mempunyai pengetahuan dasar mengenai Knowledge Discovery of Database
(KDD).
2. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam melakukan dan
menerapkan analisis Cluster.
3. Mahasiswa dapat mengetahui dan memahami arti dan garis besar dari analisis Cluster
dalam data mining, mulai dari pengambilan data, pengolahan data sampai dengan tahap
pengelompokan, serta mengaplikasikannya dalam kasus yang dihadapi.
Knowledge Discovery in Database (KDD) dan Data Mining
Data mining merupakan sebuah proses untuk menggali, mengidentifikasi serta menganalisis
sejumlah data yang besar kuantitasnya untuk menemukan pola, pengetahuan serta aturan yang
bermanfaat (Berry & Linoff, 2004). Knowledge Discovery in Database (KDD) adalah
keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data,
dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti (Gilchrist
& Mooers, 2012). Istilah data mining dan Knowledge Discovery in Database (KDD) sering kali
digunakan secara bergantian untuk menjelaskan proses penggalian informasi tersembunyi dalam
suatu basis data yang besar. Sebenarnya kedua istilah tersebut memiliki konsep yang berbeda,
tetapi berkaitan satu sama lain. Dan salah satu tahapan dalam keseluruhan proses KDD adalah
data mining. Proses KDD secara garis besar dapat dijelaskan sebagai berikut (Rikhi, 2015):
1. Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap
penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk
proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
2. Pre-processing/Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada
data yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang
duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data,
seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses
“memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan
diperlukan untuk KDD, seperti data atau informasi eksternal.
3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut
sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif
dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.
4. Data Mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih
dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam
data mining sangat bervariasi. Pemilihan metode dan algoritma yang tepat sangat
bergantung pada tujuan dan proses KDD secara keseluruhan. Dalam modul ini kita
menggunakan salah satu teknik data mining yaitu cluster.
5. Interpretation/Evaluation
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk
yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian
dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah
pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada
sebelumnya.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Konsep Cluster
Cluster merupakan sebuah proses pembagian atau pengelompokan sebuah populasi ke dalam
subgrup atau gugus yang lebih kecil dan lebih homogen (Berry & Linoff, 2004). Menurut Everitt
(Everitt, et al., 2011), teknik analisis cluster berkaitan dengan eksplorasi dan menilai kumpulan
data untuk dapat diringkas secara bermakna ke dalam sejumlah kelompok yang relatif sedikit
dengan ketentuan bahwa kumpulan objek atau induvidual yang mirip satu sama lain berada
dalam kelompok yang sama dan individu yang berbeda dimasukkan dalam kelompok lain.
Dalam konteks memahami data, cluster mampu mengelompokan data dan analisis cluster
merupakan ilmu yang secara teknis dapat mengelompokan data secara otomatis. Sebagai contoh,
anak-anak dapat dengan cepat mengelompokan jenis gambar seperti gambar bangunan,
tumbuhan, hewan, dan lainnya. (Michael et al, 2006).
Ada beberapa tahapan dalam melakukan analisis Cluster, diantaranya yaitu:
1. Tujuan Analisis Cluster
2. Desain Penelitian dalam Analisis Cluster
3. Asumsi-asumsi dalam Analisis Cluster
4. Proses Mendapatkan Cluster dan Menilai kelayakan secara keseluruhan (overall fit)
5. Interpretasi terhadap Cluster
6. Proses Validasi dan Pembuatan Profil (profiling) Cluster
Penerapan analisis cluster di dalam pemasaran adalah sebagai berikut :
1. Identifikasi obyek (Recognition) :
Dalam bidang Image Processing, Computer Vision atau Robot Vision
2. Decission Support System dan Data Mining
Membuat segmen pasar (segmenting the market)
Memahami perilaku pembeli
Mengenali peluang produk baru
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Tahap-tahap dalam Analisis Cluster
Ada beberapa tahapan dalam malekukan Analisis Cluster, diantaranya yaitu:
Tahap Pertama : Tujuan Analisis Cluster
Tujuan utama analisis cluster adalah memisahkan suatu himpunan objek menjadi dua kelompok
atau lebih berdasarkan kesamaan karakteristik khusus yang dimilikinya.
Sedangkan tujuan analisis cluster secara khusus, antara lain:
Penyederhanaan Data
Penyederhanaan data merupakan bagian dari suatu taksonomi. Dengan struktur yang terbatas
observasi/objek dapat dikelompokkan untuk analisis selanjutnya.
Identifikasi Hubungan (Relationship Identification)
Hubungan antar objek diidentifikasi secara empiris. Struktur analisis cluster yang sederhana
dapat menggambarkan adanya hubungan atau kesamaan dan perbedaan yang tidak
dinyatakan sebelumnya.
Pemilihan pada Pengelompokan Variabel
Tujuan analisis cluster tidak dapat dipisahkan dengan pemilihan variabel yang digunakan
untuk menggolongkan objek ke dalam clucter-cluster. Cluster yang terbentuk merefleksikan
struktur yang melekat pada data seperti yang didefinisikan oleh variabel-variabel. Pemilihan
variabel harus sesuai dengan teori dan konsep yang umum digunakan dan harus rasional.
Rasionalitas ini didasarkan pada teori-teori eksplisit atau penelitian sebelumnya. Variabel-
variabel yang dipilih hanyalah variabel yang dapat mencirikan objek yang akan
dikelompokkan dan secara spesifik harus sesuai dengan tujuan analisis cluster.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Tahap Kedua : Desain Penelitian dalam Analisis Cluster
2 hal penting dalam tahap ini adalah pendeteksian outlier dan mengukur kesamaan.
Pendeteksian Outliers
Outlier adalah suatu objek yang sangat berbeda dengan objek lainnya. Outliers dapat terjadi
karena:
a. Observasi ‘menyimpang’ yang tidak mewakili populasi
b. Suatu undersampling kelompok-kelompok dalam populasi yang menyebabkan
underrepresentation kelompok-kelompok dalam sampel
Dalam kedua kasus tersebut, outliers dapat mengubah struktur sebenarnya dalam populasi
sehingga kita akan memperoleh cluster-cluster yang tidak sesuai dengan struktur sebenarnya
dari populasi tersebut dan tidak representatif.
Mengukur Kesamaan antar Objek
Konsep kesamaan adalah hal yang sangat penting dalam analisis cluster. Kesamaan antar
objek merupakan ukuran kedekatan antar objek. Kesamaan dapat diketahui dengan
melakukan pengukuran jarak antar setiap individu. Ukuran jarak merupakan ukuran
ketidakmiripan, dimana jarak yang besar menunjukkan sedikit kesamaan sebaliknya jarak
yang pendek/kecil menunjukkan bahwa suatu objek makin mirip dengan objek lain.
Gambar 1. Ilustrasi Pengukuran jarak
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Metode untuk mengukur kesamaan obyek antara lain :
1). Euclidean Distance
Jarak euclidean antara dua titik i dan j merupakan sisi miring (sisi terpanjang) dari segitiga
ABC.
𝐷(𝑖, 𝑗) = √𝐴2 + 𝐵2 = √∑(𝑋𝑖 − 𝑌𝑖)2 = √(𝑋1𝑖 − 𝑋1𝑗)2+(𝑋2𝑖 − 𝑋2𝑗)2
2). Squared Euclidean Distance
Merupakan pengukuran kuadrat jarak euclidean antara dua titik i dan j.
𝐷(𝑖, 𝑗) = 𝐴2 + 𝐵2 = ∑(𝑋𝑖 − 𝑌𝑖)2 = (𝑋1𝑖 − 𝑋1𝑗)2+(𝑋2𝑖 − 𝑋2𝑗)2
3). Chebychev
D(X,Y)= 𝑚𝑎𝑥𝑖|𝑋𝑖 − 𝑌𝑖|
4). City Block Distance
D(X,Y)= ∑|𝑋𝑖 − 𝑌𝑖|
D(I,j) = |𝐴| + |𝐵| = ∑|𝑋𝑖 − 𝑌𝑖| = |𝑋1𝑖 − 𝑋1𝑗| + |𝑋2𝑖 − 𝑋2𝑗|
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Tahap Ketiga : Asumsi-asumsi dalam Analisis Cluster
Seperti hal teknik analisis lain, analisis cluster juga menetapkan adanya suatu asumsi. Ada
dua asumsi dalam analisis cluster, yaitu :
a. Kecukupan sampel untuk merepresentasikan/mewakili populasi
Biasanya suatu penelitian dilakukan terhadap populasi diwakili oleh sekelompok sampel.
Sampel yang digunakan dalam analisis cluster harus dapat mewakili populasi yang ingin
dijelaskan, karena analisis ini baik jika sampel representatif. Jumlah sampel yang diambil
tergantung penelitinya, seorang peneliti harus yakin bahwa sampel yang diambil representatif
terhadap populasi.
b. Pengaruh Multikolinieritas
Ada atau tidaknya multikolinieritas antar variabel sangat diperhatikan dalam analisis
cluster karena hal itu berpengaruh, sehingga variabel-variabel yang bersifat multikolinieritas
secara eksplisit dieprtimbangkan dengan lebih seksama.
Tahap Keempat : Proses Mendapatkan Cluster dan Menilai kelayakan secara keseluruhan
(overall fit)
Ada dua proses penting yaitu algoritma cluster dalam pembentukan cluster dan
menentukan jumlah cluster yang akan dibentuk. Keduanya mempunyai implikasi substansial
tidak hanya pada hasil yang diperoleh tetapi juga pada interpretasi yang akan dilakukan terhadap
hasil tersebut.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Clustering
Procedures
Non-
HierarchicalHierarchical
DivisiveAgglomerativeOptimizing
Partitioning
Parallel
Threshold
Sequential
Threshold
Linkage
Methods
Centroid
Methods
Variance
Methods
Ward�s
Method
Average
Linkage
Complete
LinkageSingle Linkage
Gambar 2. Algoritma Analisa Kluster
Adapun metode pengelompokan dalam analisis cluster meliputi :
1. Metode Non-Hirarkis.
Dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan (dua, tiga, atau
yang lain). Setelah jumlah cluster ditentukan, maka proses cluster dilakukan dengan tanpa
mengikuti proses hirarki. Metode ini biasa disebut “K-Means Cluster”.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Berbeda dengan metode hirarkikal, prosedur non hirarkikal (K-means Clustering) dimulai
dengan memilih sejumlah nilai cluster awal sesuai dengan jumlah yang diinginkan dan
kemudian obyek digabungkan ke dalam cluster-cluster tersebut.
a. Sequential Threshold Procedure
Metode ini melakukan pengelompokan dengan terlebih dahulu memilih satu obyek
dasar yang akan dijadikan nilai awal cluster, kemudian semua obyek yang ada didalam
jarak terdekat dengan cluster ini akan bergabung lalu dipilih cluster kedua dan semua
obyek yang mempunyai kemiripan dimasukkan dalam cluster ini. Demikian seterusnya
hingga terbentuk beberapa cluster dengan keseluruhan obyek didalamnya.
b. Parallel Threshold Prosedure
Secara prinsip sama dengan prosedur sequential threshold, hanya saja dilakukan
pemilihan terhadap beberapa obyek awal cluster sekaligus dan kemudian melakukan
penggabungan obyek ke dalamnya secara bersamaan.
c. Optimizing
Merupakan pengembangan dari kedua metode diatas dengan melakukan optimasi pada
penempatan obyek yang ditukar untuk cluster lainnya dengan pertimbangan krteria
optimasi.
2. Metode Hirarkis.
Memulai pengelompokan dengan dua atau lebih obyek yang mempunyai kesamaan
paling dekat. Kemudian dilanjutkan pada obyek yang lain dan seterusnya hingga cluster
akan membentuk semacam ‘pohon’ dimana terdapat tingkatan (hirarki) yang jelas antar
obyek, dari yang paling mirip hingga yang paling tidak mirip. Teknik hirarki (hierarchical
methods) adalah teknik clustering membentuk kontruksi hirarki atau berdasarkan tingkatan
tertentu seperti struktur pohon (struktur pertandingan). Alat yang membantu
untukmemperjelas proses hirarki ini disebut “dendogram”.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Teknik hirarki (hierarchical methods) adalah teknik clustering membentuk kontruksi
hirarki atau berdasarkan tingkatan tertentu seperti struktur pohon (struktur pertandingan).
Dengan demikian proses pengelompokkannya dilakukan secara bertingkat atau bertahap.
Hasil dari pengelompokan ini dapat disajikan dalam bentuk dendogram. Metode-metode
yang digunakan dalam teknik hirarki:
a. Agglomerative Methods
Metode ini dimulai dengan kenyatan bahwa setiap obyek membentuk Clusternya
masing-masing. Kemudian dua obyek dengan jarak terdekat bergabung. Selanjutnya
obyek ketiga akan bergabung dengan cluster yang ada atau bersama obyek lain dan
membentuk cluster baru. Hal ini tetap memperhitungkan jarak kedekatan antar obyek.
Proses akan berlanjut hingga akhirnya terbentuk satu cluster yang terdiri dari
keseluruhan obyek. Ada beberapa teknik dalam agglomerative methods yaitu:
Single Linkage (Nearest Neighbor Methods)
Metode ini menggunakan prinsip jarak minimum yang diawali dengan mencari dua
obyek terdekat dan keduanya membentuk cluster yang pertama. Pada langkah
selanjutnya terdapat dua kemungkinan, yaitu :
a. Obyek ketiga akan bergabung dengan cluster yang telah terbentuk, atau
b. Dua obyek lainnya akan membentu cluster baru.
Proses ini akan berlanjut sampai akhirnya terbentuk cluster tunggal. Pada metode
ini jarak antar cluster didefinisikan sebagai jarak terdekat antar anggotanya.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Contoh : Terdapat matriks jarak antara 5 buah obyek, yaitu :
Gambar 3. Matriks Antara 5 Buah Objek.
Langkah penyelesaiannya :
a). Mencari obyek dengan jarak minimum
Menghitung jarak antara cluster AB dengan obyek lainnya.
D(AB)C = min {dAC, dBC}= dBC = 3.0
D(AB)D = min {dAD, dBD}= dAD = 6.0
D(AB)E = min {dAE, dBE}= dBE = 7.0
Dengan demikian terbentuk matriks jarak yang baru
Gambar 4. Matriks 5 Buah Objek Dengan Jarak Baru
b). Mencari obyek dengan jarak terdekat.
D dan E mempunyai jarak terdekat, yaitu 2,0 maka obyek D dan E bergabung
menjadi satu cluster.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
c). Menghitung jarak antara cluster dengan obyek lainnya.
D(AB)C = 3.0
D(AB)(DE) = min {dAD, dAE, dBD, dBE} = dAD = 6.0
D(DE)C = min {dCD, dCE} = dCD = 4.0
d). Mencari jarak terdekat antara cluster dengan obyek dan diperoleh obyek C
bergabung dengan cluster AB
e). Pada langkah yang terakhir, cluster ABC bergabung dengan DE sehingga
terbentuk cluster tunggal.
Complete Linkage (Furthest Neighbor Methods)
Metode ini merupakan kebalikan dari pendekatan yang digunakan pada single
linkage. Prinsip jarak yang digunakan adalah jarak terjauh antar obyek.
Contoh : Terdapat matriks jarak antara lima buah obyek yaitu :
Gambar 5. Matriks Antara 5 Buah Objek.
Langkah penyelesaiannya :
a) Mencari obyek dengan jarak minimum
A dan B mempunyai jarak terdekat yaitu 1.0 maka obyek A dan B bergabung
menjadi satu cluster.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
b) Menghitung jarak antara cluster AB dengan obyek lainnya
d(AB)C = max {dAC, dBC} = dAC = 5,0
d(AB)D = max {dAD, dBD} = dBD = 8,0
d(AB)E = max {dAE, dBE} = dAE = 8,0
Dengan demikian terbentuk matriks jarak yang baru :
Gambar 4. Matriks 5 Buah Objek Dengan Jarak Baru
c) Mencari obyek dengan jarak terdekat.
D dan E mempunyai jarak terdekat yaitu 2.0 maka obyek D dan E bergabung
menjadi satu cluster.
d) Menghitung jarak antara cluster dengan obyek lainnya.
d(AB)C = 4,0
d(AB)(DE) = 1/2{dAD, dAE, dBD, dBE} = 7,25
d(DE)C = 1/2{dCD, dCE,} = dCE = 5,00
Maka terbentuklah matrik jarak yang baru, yaitu :
Gambar 5. Matriks Akhir
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
e) Mencari jarak terdekat antara cluster dengan obyek dan diperoleh obyek C
bergabung dengan cluster AB.
f) Pada langkah yang terakhir, cluster ABC bergabung dengan DE sehingga
terbentuk cluster tunggal.
Ward’s error sum of squares methods
Ward mengajukan suatu metode pembentukan cluster yang didasari oleh hilangnya
informasi akibat penggabungan obyek menjadi cluster. Hal ini diukur dengan jumlah
total dari deviasi kuadrat pada mean cluster untuk tiap observasi.
Error sum of squares (ESS) digunakan sebagai fungsi obyektif. Dua obyek akan
digabungkan apabila mempunyai fungsi obyektif terkecil diantara kemungkinan yang
ada.
ESS= ∑∑ 𝑋𝑖𝑗
2 −1
𝑛𝑗(∑ 𝑋𝑖𝑗)2
Dengan Xij adalah nilai untuk obyek ke-i pada cluster ke-j.
b. Divisive Methods
Metode divisive berlawanan dengan metode agglomerative. Metode ini pertama-tama
diawali dengan satu cluster besar yang mencakup semua observasi (obyek). Selanjutnya
obyek yang mempunyai ketidakmiripan yang cukup besar akan dipisahkan sehingga
membentuk cluster yang lebih kecil. Pemisahan ini dilanjutkan sehingga mencapai
sejumlah cluster yang diinginkan.
Splinter average distance methods
Metode ini didasarkan pada perhitungan jarak rata-rata masing-masing obyek dengan
obyek pada grup splinter dan jarak rata-rata obyek tersebut dengan obyek lain pada
grupnya. Proses tersebut dimulai dengan memisahkan obyek dengan jarak terjauh
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
sehingga terbentuklan dua grup. Kemudian dibandingkan dengan jarak rata-rata
masing-masing obyek dengan grup splinter dengan grupnya sendiri. Apabila suatu
obyek mempunyai jarak yang lebih dekat ke grup splinter daripada ke grupnya
sendiri, maka obyek tersebut haruslah dikeluarkan dari grupnya dan dipisahkan ke
grup splinter. Apabila komposisinya sudah stabil, yaitu jarak suatu obyek ke grupnya
selalu lebih kecil daripada jarak obyek itu ke grup splinter, maka proses berhenti dan
dilanjutkan dengan tahap pemisahan dalam grup.
Contoh : Terdapat matriks jarak antara 5 buah obyek, yaitu :
Gambar 6. Matriks Perbandingan 5 buah Objek
Perhitungan :
a) Menghitung jarak rata-rata antar obyek
A = ¼ (12+9+32+31) = 21 D = ¼ (32+25+23+9) = 22.25
B = ¼ (12+9+25+27) = 18.25 E = ¼ (31+27+24+9) = 22.75
C = ¼ (9+9+23+24) = 16.25
Terlihat bahwa E mempunyai nilai jarak terjauh, yaitu 22.75, maka E dipisahkan
dari grup utama dan membentuk grup splinter.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
b) Menghitung jarak rata-rata obyek dengan grup utama dengan grup splinter
Gambar 7. Perhitungan Rata-Rata Grup Utama Dengan Grup Splinter
Pada D, jarak rata-rata dengan grup splinter lebih dekat daripada dengan grup
utama. Dengan demikian D harus dikeluarkan dari grup utama dan masuk ke
grup splinter.
c) Perhitungan jarak rata-rata
Gambar 7. Perhitungan Rata-Rata Grup Utama Dengan Grup Splinter
Karena jarak semua obyek ke grup utama sudah lebih besar daripada jaraknya ke
grup splinter, maka komposisinya sudah stabil.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Tahap Kelima : Interpretasi terhadap Cluster
Tahap interpretasi meliputi pengujian tiap cluster dalam term untuk menamai dan menandai
dengan suatu label yang secara akurat dapat menjelaskan kealamian cluster.
Membuat profil dan interpretasi cluster tidak hanya untuk memperoleh suatu gambaran saja
melainkan pertama, menyediakan suatu rata-rata untuk menilai korespondensi pada cluster yang
terbentuk, kedua, profil cluster memberikan arahan bagi penilainan terhadap signifikansi praktis.
Namun demikian yang perlu diperhatikan pada tahapan interpretasi adalah karakteristik yang
membedakan masing-masing cluster sehingga kita dapat memberikan label pada masing-masing
cluster tersebut.
Tahap Keenam: Proses Validasi dan Pembuatan Profil (profiling) Cluster
1. Proses validasi solusi cluster
Proses validasi bertujuan menjamin bahwa solusi yang dihasilkan dari analisis cluster
dapat mewakili populasi dan dapat digeneralisasi untuk objek lain. Pendekatan ini
membandingkan solusi cluster dan menilai korespondensi hasil. Terkadang tidak dapat
dipraktekkan karena adanya kendala waktu dan biaya atau ketidaktersediaan objek untuk
analisis cluster ganda.
2. Pembuatan Profil (profiling) solusi cluster
Tahap ini menggambarkan karakteristik tiap cluster untuk menjelaskan cluster-cluster
tersebut dapat dapat berbeda pada dimensi yang relevan. Titik beratnya pada karakteristik
yang secara signifikan berbeda antar cluster dan memprediksi anggota dalam suatu cluster
khusus.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Studi Kasus
Perusahaan ABC merupakan perusahaan yang bergerak di bidang produksi pendingin
ruangan. Perusahaan berencana ingin mengembangkan produk pendingin ruangan dengan
spesifikasi baru. Salah satu strategi perusahaan dalam merealisasikan rencana tersebut adalah
dengan melakukan segmentasi kota target pemasaran. Penentuan pengelompokan kota target
pemasaran berdasarkan beberapa faktor diantaranya kadar SO2, temperatur, banyaknya jumlah
industri manufaktur, banyaknya populasi, kecepatan angin, tingkat presipitasi, dan jumlah hari
turun hujan dalam setahun. Dalam studi kasus ini, perusahaan menggunakan analisis clustering
untuk mengelompokkan kota target pemasaran, menentukan profil kota target pemasaran serta
menentukan strategi pemasaran yang dapat diterapkan berdasarkan profil tersebut.
Berikut adalah data historis yang telah diperoleh dari 41 kota :
No Kota SO2
(mg/m3)
Temperatur
(0F)
Jumlah
Industri
Populasi
(ribuan)
Kecepatan
Angin (m/h)
Presipitasi
(inci) Hari
1 Phoenix 10 70,3 213 582 6 7,05 36
2 Little Rock 13 61 91 132 8,2 48,52 100
3 San
Fransisco 12 56,7 453 716 8,7 20,66 67
4 Denver 17 51,9 454 515 9 12,95 86
5 Hartford 56 49,1 412 158 9 43,37 127
6 Wilmington 36 54 80 80 9 40,25 114
7 Washington 29 57,3 434 757 9,3 38,89 111
8 Jacksonville 14 68,4 136 529 8,8 54,47 116
9 Miami 10 75,5 207 335 9 59,8 128
10 Atlanta 24 61,5 368 497 9,1 48,34 115
11 Chicago 110 50,6 3344 3369 10,4 34,44 122
12 Indianapolis 28 52,3 361 746 9,7 38,74 121
13 Des Moines 17 49 104 201 11,2 30,85 103
14 Wichita 8 56,6 125 277 12,7 30,58 82
15 Loiusville 30 55,6 291 593 8,3 43,11 123
16 New Orleans 9 68,3 204 361 8,4 56,77 113
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
No Kota SO2
(mg/m3)
Temperatur
(0F)
Jumlah
Industri
Populasi
(ribuan)
Kecepatan
Angin (m/h)
Presipitasi
(inci) Hari
17 Baltimore 47 55 625 905 9,6 41,31 111
18 Detroit 35 49,9 1064 1513 10,1 30,96 129
19 Minneapolis 29 43,5 699 744 10,6 25,94 137
20 Kansas 14 54,5 381 507 10 37 99
21 St Louis 56 55,9 775 622 9,5 35,89 105
22 Omaha 14 51,5 181 347 10,9 30,18 98
23 Albuquerque 11 56,8 46 244 8,9 7,77 58
24 Albany 46 47,6 44 116 8,8 33,36 135
25 Buffalo 11 47,1 391 463 12,4 36,11 166
26 Cincinnati 23 54 462 453 7,1 39,04 132
27 Cleveland 65 49,7 1007 751 10,9 34,99 155
28 Columbus 26 51,5 266 540 8,6 37,01 134
29 Philadelphia 69 54,6 1692 1950 9,6 39,93 115
30 Pitssburgh 61 50,4 347 520 9,4 36,22 147
31 Providence 94 50 343 179 10,6 42,75 125
32 Memphis 10 61,6 337 624 9,2 49,1 105
33 Nashville 18 59,4 275 448 7,9 46 119
34 Dallas 9 66,2 641 844 10,9 35,94 78
35 Houston 10 68,9 721 1233 10,8 48,19 103
36 Salt Lake
City 28 51 137 176 8,7 15,17 89
37 Norfolk 31 59,3 96 308 10,6 44,68 116
38 Richmond 26 57,8 197 299 7,6 42,59 115
39 Seattle 29 51,1 379 531 9,4 38,79 164
40 Charleston 31 55,2 35 71 6,5 40,75 148
41 Milwaukee 16 45,7 569 717 11,8 29,07 123
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Metode Hirarki
Langkah Penyelesaian :
1. Tahap Standarisasi Data
- Input Data pada Variable View
Mengisi data view seperti gambar dibawah ini
- Mengganti type dari variabel nama menjadi “String”
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
- Pada Data View Pilih descriptive statistics , kemudian pilih descriptives
- Pindahkan semua variabel ke kolom variable (S)
- Centang pada save standardized values as variables
- Kemudian klik OK
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
- Output normalisasi data
Dari hasil Output diatas merupakan tampilan pertama hasil proses nomalisasi data. Dari
tabel menunjukkan hasil nilai N, Minimum, Maximum, Mean, dan Standar Deviation
dari masing-masing kriteria. Jika sudah tampil output seperti gambar diatas, maka anda
memastikan tampilan Data View anda sebelumnya sudah seperti gambar dibawah ini.
Terdapat tambahan variabel “Z” hasil dari normalisasi data kuesioner dari masing-
masing kriteria. Data "Z score” inilah yang kemudian akan diolah untuk tahap
pengelompokkan (clustering) berikutnya.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
2. Tahap Pengelompokkan (clustering)
- Pilih Analyze >> Classify >> Hierarchical Cluster
- Memindahkan semua variabel Z Score pada kotak variable (s)
- Memindahkan variabel nama pada label cases by
- Pilih Statistics
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
- Pada kotak dialog statistics centang Agglomerative Schedule dan Proxy Matrix
- Pilih range of solution , kemudian isi minimum number menjadi 2, dan maximum
number menjadi 5. Kemudian klik continue
- Pada kotak dialog Plots mencentang Dendogram, All Cluster, dan Vertical
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
- Pada kotak dialog Method gantilah cluster Method menjadi Nearest Neighboor, dan
centang Interval kemudian mengganti pilihannya menjadi Squared Euqlidean Distance
- Klik continue
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
- Maka akan tampillah output spss sepeti beberapa tabel dibawah ini
OUTPUT 1 Agglomeration Schedule
Agglomeration Schedule
Stage Cluster Combined
Coefficients
Stage Cluster First
Appears Next
Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2
1 8 16 ,274 0 0 21
2 13 22 ,301 0 0 14
3 33 38 ,401 0 0 7
4 10 32 ,558 0 0 9
5 7 12 ,718 0 0 10
6 17 21 ,740 0 0 10
7 15 33 ,740 0 3 8
8 15 28 ,846 7 0 9
9 10 15 ,952 4 8 12
10 7 17 ,956 5 6 12
11 4 36 ,987 0 0 23
12 7 10 1,025 10 9 13
13 2 7 1,102 0 12 15
14 13 20 1,109 2 0 16
15 2 26 1,209 13 0 16
16 2 13 1,224 15 14 17
17 2 6 1,454 16 0 21
18 5 24 1,490 0 0 19
19 5 30 1,498 18 0 27
20 19 41 1,510 0 0 28
21 2 8 1,527 17 1 22
22 2 9 1,552 21 0 24
23 3 4 1,594 0 11 29
24 2 39 1,677 22 0 25
25 2 40 1,715 24 0 26
26 2 37 1,722 25 0 27
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Agglomeration Schedule
Stage Cluster Combined
Coefficients
Stage Cluster First
Appears Next
Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2
27 2 5 1,826 26 19 28
28 2 19 2,454 27 20 30
29 3 23 2,522 23 0 37
30 2 14 2,541 28 0 32
31 34 35 2,590 0 0 35
32 2 27 2,774 30 0 33
33 2 18 3,428 32 0 34
34 2 25 3,541 33 0 35
35 2 34 3,856 34 31 36
36 2 31 3,915 35 0 37
37 2 3 4,454 36 29 38
38 2 29 5,315 37 0 39
39 1 2 8,732 0 38 40
40 1 11 18,558 39 0 0
Hasil output tabel pertama memberikan penjelasan mengenai penggabungan antara setiap
anggota 1 dengan anggota lainnya. Seperti contoh pembacaan tabel agglomeration
schedule :
a) Pada stage 1 kota 8 bergabung dengan kota 16 pada jarak yang terdekat pertama
yaitu (lihat pada kolom coefficients) 0,274. Dimana kota 8 dan kota 16 belum
pernah bergabung sebelumnya (nilai 0) dengan anggota manapun (lihat pada
kolom stage cluster first appears. Untuk melihat penggabungan anggota yang
terlibat pada stage 1 berikutnya lihat pada kolom next stage 21.
b) Pada stage 2 kota 13 bergabung dengan kota 22 pada jarak yaitu (lihat pada
kolom coefficients) 0,301. Dimana kota 13 dan kota 22 belum pernah bergabung
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
sebelumnya (nilai 0) dengan anggota manapun (lihat pada kolom stage cluster
first appears. Untuk melihat penggabungan anggota yang terlibat pada stage
berikutnya lihat pada kolom next stage 14.
c) Dan seterusnya.
OUTPUT 2 Cluster Membership
Cluster Membership
Case 5 Clusters 4 Clusters 3 Clusters 2 Clusters
1:Phoenix 1 1 1 1
2:Little R 2 2 2 1
3:San Fran 3 2 2 1
4:Denver 3 2 2 1
5:Hartford 2 2 2 1
6:Wilmingt 2 2 2 1
7:Washingt 2 2 2 1
8:Jacksonv 2 2 2 1
9:Miami 2 2 2 1
10:Atlanta 2 2 2 1
11:Chicago 4 3 3 2
12:Indianap 2 2 2 1
13:Des Moin 2 2 2 1
14:Wichita 2 2 2 1
15:Loiusvil 2 2 2 1
16:New Orle 2 2 2 1
17:Baltimor 2 2 2 1
18:Detroit 2 2 2 1
19:Minneapo 2 2 2 1
20:Kansas 2 2 2 1
21:St Louis 2 2 2 1
22:Omaha 2 2 2 1
23:Albuquer 3 2 2 1
24:Albany 2 2 2 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Cluster Membership
Case 5 Clusters 4 Clusters 3 Clusters 2 Clusters
25:Buffalo 2 2 2 1
26:Cincinna 2 2 2 1
27:Clevelan 2 2 2 1
28:Columbus 2 2 2 1
29:Philadel 5 4 2 1
30:Pitssbur 2 2 2 1
31:Providen 2 2 2 1
32:Memphis 2 2 2 1
33:Nashvill 2 2 2 1
34:Dallas 2 2 2 1
35:Houston 2 2 2 1
36:Salt Lak 3 2 2 1
37:Norfolk 2 2 2 1
38:Richmond 2 2 2 1
39:Seattle 2 2 2 1
40:Charlest 2 2 2 1
41:Milwauke 2 2 2 1
Output diatas menunjukkan bahwa setiap terbentuknya n kelompok, maka terdaftarlah anggota-
anggota setiap kelompoknya seperti yang sudah tertera pada tabel diatas. Ketika menentukan
banyaknya kelompok (cluster) tidak semua anggota berada pada cluster yang sama ketika
peneliti ingin membuat kelompok menjadi 2, 3, 4, atau 5. Contohnya :
Anggota ke 29 menjadi anggota cluster 5 ketika kelompok yang dibentuk sebanyak 5 kelompok,
dan menjadi anggota cluster 4 ketika kelompok yang dibentuk sebanyak 4 kelompok , dan
menjadi anggota cluster 2 ketika kelompok yang dibentuk sebanyak 3 kelompok, dan menjadi
anggota cluster 1 ketika kelompok yang dibentuk sebanyak 2 kelompok. Hasil ini membantu
anda dalam menentukan cluster berdasarkan metode cut off pada hasil dendogram.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
OUTPUT 3 Dendogram
Hasil dendogram menunjukkan bahwa penggabungan setip anggota berdasarkan jarak
yang paling dekat, sehingga membentuk satu cluster yang sangat besar. Hasil dendogram
ini akan mudah dibaca jika pembacaannya dibantu oleh hasil Agglomerative Schedule
Pembentukkan jumlah cluster dapat dibentuk dengan metode cut off pada hasil
dendogram. Sebagai contoh:
a) Melakukan cut off pada angka 6.
b) Akan terlihat cluster yang terbentuk sebanyak 5 cluster dengan 3 Outlier ,
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
c) Untuk melihat anggota masing-masing cluster dapat dilihat dari gambar berikut
ini:
Cluster 3, 4 dan 5 merupakan outlier.
Cluster yang terbentuk jika menggunakan metode Cut Off, sebagai berikut:
Jarak Cut Off Cluster yang terbentuk Outlier yang terbentuk
5 9 6
6 5 3
8 3 2
Cut-off line pada 6
1 2
3 4 5
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
3. Tahap pengujian crosstab
- Pada Data View menambah variabel baru yaitu variabel Cluster.
- Kemudian pada variabel cluster, mengganti measure- nya menjadi nominal
- Mengganti label value variabel cluster seperti gambar dibawah ini:
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
- Pada Data View mengisi data untuk variabel cluster berdasarkan masing-anggota pada
setiap kelompok seperti gambar dibawah.
- Pilih Analyze >> Descriptive Statistics >> Crosstab
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
- Memindahkan seluruh variabel Z score pada kotak dialog Row(s)
- Memindahkan variabel cluster pada kotak dialog Coloumn (s).
- Pada menu Statistics beri tanda centang pada Correlations
- Klik Continue
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
- Pada menu cell display beri centang pada Observed dan Total
- Klik Continue
- Klik OK, maka Output SPSS akan muncul.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
a) Output Crosstab pertama (Kadar SO2)
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
Zscore(SO2) -,93935 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,89675 Count 0 2 0 0 0 2
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
-,85415 Count 1 3 0 0 0 4
% of Total 2,4% 7,3% 0,0% 0,0% 0,0% 9,8%
-,81154 Count 0 1 1 0 0 2
% of Total 0,0% 2,4% 2,4% 0,0% 0,0% 4,9%
-,76894 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,72634 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,68373 Count 0 3 0 0 0 3
% of Total 0,0% 7,3% 0,0% 0,0% 0,0% 7,3%
-,59853 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,55592 Count 0 1 1 0 0 2
% of Total 0,0% 2,4% 2,4% 0,0% 0,0% 4,9%
-,51332 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,30030 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,25770 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,17249 Count 0 2 0 0 0 2
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
-,08729 Count 0 1 1 0 0 2
% of Total 0,0% 2,4% 2,4% 0,0% 0,0% 4,9%
-,04468 Count 0 3 0 0 0 3
% of Total 0,0% 7,3% 0,0% 0,0% 0,0% 7,3%
-,00208 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,04053 Count 0 2 0 0 0 2
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
,21094 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,25354 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,67958 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,72218 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,10561 Count 0 2 0 0 0 2
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
1,31863 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,48904 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,65946 Count 0 0 0 0 1 1
% of Total 0,0% 0,0% 0,0% 0,0% 2,4% 2,4%
2,72454 Count 0 1 0 0 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
3,40620 Count 0 0 0 1 0 1
% of Total 0,0% 0,0% 0,0% 2,4% 0,0% 2,4%
Total Count 1 34 4 1 1 41
% of Total 2,4% 82,9% 9,8% 2,4% 2,4% 100,0%
b) Output Crosstab yang ke 2 (Temperatur)
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
Zscore(Temperatur) -1,69672 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-1,39234 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-1,19864 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-1,12946 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,93576 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,92193 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,83891 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,81124 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
-,79740 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,74206 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,71439 Count 0 0 0 1 0 1
% of Total 0,0% 0,0% 0,0% 2,4% 0,0% 2,4%
-,65905 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,64521 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,58987 Count 0 2 0 0 0 2
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
-,53453 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,47919 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,24398 Count 0 2 0 0 0 2
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
-,17480 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,16097 Count 0 0 0 0 1 1
% of Total 0,0% 0,0% 0,0% 0,0% 2,4% 2,4%
-,10562 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,07795 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
-,02261 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,01890 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,11575 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,12958 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
,14342 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
,21260 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,28177 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,48931 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,50314 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,72451 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,79369 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,80753 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,44397 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
1,73452 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,74835 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,81753 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
2,01123 Count 1 0 0 0 0 1
% of Total 2,4% 0,0% 0,0% 0,0% 0,0% 2,4%
2,73068 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
Total Count 1 34 4 1 1 41
% of Total 2,4% 82,9% 9,8% 2,4% 2,4% 100,0%
c) Output Crosstab yang ke 3 (Jumlah Industri)
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
Zscore(Industri) -,75975 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,74377 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,74023 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,67989 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,66036 Count 0 1 0 0 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,65149 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,63729 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,60002 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,58050 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,57873 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,50064 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,47224 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,45982 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,45450 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,44385 Count 1 0 0 0 0 1
% of Total 2,4% 0,0% 0,0% 0,0% 0,0% 2,4%
-,34979 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,33382 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,30542 Count 0 1 0 0 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,22379 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,21314 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,20604 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,18119 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,16877 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,14925 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,14570 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,12795 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,09068 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,05164 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,01792 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,01615 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,00195 Count 0 1 0 0 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,18795 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,28733 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,31572 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,41866 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,45770 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,55353 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,96527 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,06642 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
2,18094 Count 0 0 0 0 1 1
% of Total 0,0% 0,0% 0,0% 0,0% 2,4% 2,4%
5,11275 Count 0 0 0 1 0 1
% of Total 0,0% 0,0% 0,0% 2,4% 0,0% 2,4%
Total Count 1 34 4 1 1 41
% of Total 2,4% 82,9% 9,8% 2,4% 2,4% 100,0%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
d) Output Crosstab yang ke 4 (Populasi)
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
Zscore(Populasi) -,92833 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,91279 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,85063 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,82300 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,77810 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,74702 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,74184 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,70385 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,62960 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,57262 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,53463 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,51909 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,47246 Count 0 1 0 0 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,45174 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,42757 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,27734 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,26870 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,25144 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,19273 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,17546 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,16164 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,15301 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,13747 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,13401 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,11847 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,04595 Count 1 0 0 0 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 2,4% 0,0% 0,0% 0,0% 0,0% 2,4%
-,02695 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,02312 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,02658 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,18544 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
,18717 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,23379 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,23724 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,24588 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,25624 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,40647 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,51180 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,07818 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,56168 Count 0 1 0 0 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
2,31628 Count 0 0 0 0 1 1
% of Total 0,0% 0,0% 0,0% 0,0% 2,4% 2,4%
4,76658 Count 0 0 0 1 0 1
% of Total 0,0% 0,0% 0,0% 2,4% 0,0% 2,4%
Total Count 1 34 4 1 1 41
% of Total 2,4% 82,9% 9,8% 2,4% 2,4% 100,0%
e) Output Crosstab yang ke 5 (Kecepatan Angin)
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
Zscore(Kecepatan_angin) -2,41061 Count 1 0 0 0 0 1
% of Total 2,4% 0,0% 0,0% 0,0% 0,0% 2,4%
-2,06063 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-1,64065 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-1,29067 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-1,08068 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,87069 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,80069 Count 0 1 0 0 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,73069 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,59070 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,52071 Count 0 0 2 0 0 2
% of Total 0,0% 0,0% 4,9% 0,0% 0,0% 4,9%
-,45071 Count 0 2 0 0 0 2
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
-,38071 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,31072 Count 0 3 1 0 0 4
% of Total 0,0% 7,3% 2,4% 0,0% 0,0% 9,8%
-,24072 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,17072 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,10073 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,03073 Count 0 2 0 0 0 2
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
,03927 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,10926 Count 0 1 0 0 1 2
% of Total 0,0% 2,4% 0,0% 0,0% 2,4% 4,9%
,17926 Count 0 1 0 0 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,38925 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,45924 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,66923 Count 0 0 0 1 0 1
% of Total 0,0% 0,0% 0,0% 2,4% 0,0% 2,4%
,80923 Count 0 3 0 0 0 3
% of Total 0,0% 7,3% 0,0% 0,0% 0,0% 7,3%
,94922 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,01922 Count 0 3 0 0 0 3
% of Total 0,0% 7,3% 0,0% 0,0% 0,0% 7,3%
1,22921 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,64918 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
2,06916 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
2,27915 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
Total Count 1 34 4 1 1 41
% of Total 2,4% 82,9% 9,8% 2,4% 2,4% 100,0%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
f) Output Crosstab yang ke 6 (Presipitasi)
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
Zscore(Presipitasi) -2,52465 Count 1 0 0 0 0 1
% of Total 2,4% 0,0% 0,0% 0,0% 0,0% 2,4%
-2,46348 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-2,02344 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-1,83485 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-1,36847 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,91993 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,65404 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,55974 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,52576 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,50282 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,49348 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,28960 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,19785 Count 0 0 0 1 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 0,0% 0,0% 0,0% 2,4% 0,0% 2,4%
-,15113 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,07467 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,07043 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,05598 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,04664 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,01962 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,02047 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,16744 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,17168 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,18018 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,19292 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,26853 Count 0 0 0 0 1 1
% of Total 0,0% 0,0% 0,0% 0,0% 2,4% 2,4%
,29571 Count 0 1 0 0 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,33819 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,38576 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,49450 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,50809 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,53867 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,56076 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,67204 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,78418 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,97022 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,98296 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,99825 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,04752 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,50371 Count 0 1 0 0 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,69909 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,95649 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
Total Count 1 34 4 1 1 41
% of Total 2,4% 82,9% 9,8% 2,4% 2,4% 100,0%
g) Output Crosstab yang ke 7 (Jumlah Hari)
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
Zscore(Hari) -2,93900 Count 1 0 0 0 0 1
% of Total 2,4% 0,0% 0,0% 0,0% 0,0% 2,4%
-2,10902 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-1,76947 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-1,35448 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-1,20357 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-1,05267 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
-,93949 Count 0 0 1 0 0 1
% of Total 0,0% 0,0% 2,4% 0,0% 0,0% 2,4%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
-,59995 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,56222 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,52449 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
-,41131 Count 0 2 0 0 0 2
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
-,33586 Count 0 2 0 0 0 2
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
-,10950 Count 0 2 0 0 0 2
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
-,03405 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,00368 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,04141 Count 0 2 0 0 1 3
% of Total 0,0% 4,9% 0,0% 0,0% 2,4% 7,3%
,07913 Count 0 2 0 0 0 2
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
,19231 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,26777 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,30549 Count 0 0 0 1 0 1
% of Total 0,0% 0,0% 0,0% 2,4% 0,0% 2,4%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
,34322 Count 0 2 0 0 0 2
% of Total 0,0% 4,9% 0,0% 0,0% 0,0% 4,9%
,41867 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,49413 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,53185 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,56958 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,68276 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,75821 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,79594 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
,87140 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,24866 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,28639 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,55048 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
1,89002 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Crosstab
Cluster
Total Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
1,96547 Count 0 1 0 0 0 1
% of Total 0,0% 2,4% 0,0% 0,0% 0,0% 2,4%
Total Count 1 34 4 1 1 41
% of Total 2,4% 82,9% 9,8% 2,4% 2,4% 100,0%
Berikut ini merupakan pedoman ketentuan untuk menafsirkan tabel hasil analisis pada
hasil crosstab:
1. Jika terdapat kriteria yang angkanya menunjukkan angka negatif, berarti cluster yang
bersangkutan ada di bawah rata-rata total.
2. Jika terdapat kriteria yang angkanya menunjukkan angka positif, berarti cluster yang
bersangkutan ada di atas rata-rata total.
Dari seluruh hasil crosstab diatas, dapat diketahui karakteristik masing-masing cluster
berdasarkan karakteristik anggota cluster yang dominan, dapat dilihat dari tabel berikut ini:
Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
Kadar SO2
- 0,85415
(2,4%)
Untuk kriteria
kadar SO2 pada
cluster 2
dominan
dibawah rata-
rata total.
Untuk kriteria
kadar SO2 pada
cluster 2
dominan
dibawah rata-rata
total
3,40620
(2,4%)
1,65946
(2,4%)
Temperatur 2,01123
(2,4%)
-0,24398
(4,9%)
Untuk kriteria
temperatur pada
cluster 3
dominan
dibawah dan
diatas rata-rata
total
-0,71439
(2,4%)
-0,16097
(2,4%)
Jumlah -0,44385 Untuk kriteria Untuk kriteria 5,11275 2,18094
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018 Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5
Industri (2,4%) jumlah industri
pada cluster 2
dominan
dibawah dan
diatas rata-rata
total
jumlah industri
pada cluster 3
dominan
dibawah rata-rata
total
(2,4%) (2,4%)
Populasi - 0,04595
(2,4%)
Untuk kriteria
populasi pada
cluster 2
dominan
dibawah dan
diatas rata-rata
total
Untuk kriteria
populasi pada
cluster 3
dominan
dibawah dan
diatas rata-rata
total
4,76658
(2,4%)
2,31628
(2,4%)
Kecepatan
angin
-2,41061
(2,4%)
Untuk kriteria
kecepatan angin
pada cluster 2
dominan
dibawah dan
diatas rata-rata
total
-0,52071
(4,9%)
0,66923
(2,4%)
0,10926
(2,4%)
Presipitasi -2,52465
(2,4%)
Untuk kriteria
presipitasi pada
cluster 2
dominan
dibawah dan
diatas rata-rata
total
Untuk kriteria
presipitasi pada
cluster 3
dominan
dibawah rata-rata
total
-0,19785
(2,4%)
0,26853
(2,4%)
Jumlah Hari -2,93900
(2,4%)
Untuk kriteria
jumlah hari pada
cluster 2
dominan
dibawah dan
diatas rata-rata
total
Untuk kriteria
jumlah hari pada
cluster 3
dominan
dibawah rata-rata
total
0,30549
(2,4%)
0,04141
(2,4%)
Dari tabel rekapitulasi diatas, maka dapatlah dilihat masing-masing cluster sebagai berikut:
1. Dalam cluster-1 terdiri dari kota dengan karakteristik kadar SO2 dominan dibawah rata-rata
total, temperature dominan dibawah rata-rata total, jumlah industri manufaktur dominan
dibawah rata-rata total, populasi dominan dibawah rata-rata total, kecepatan angin dominan
dibawah rata-rata total, presipitasi dominan dibawah rata-rata total dan jumlah hari hujan
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
dalam setahun dominan dibawah rata-rata total.
Sehingga, cluster-1 termasuk kelompok kota target pemasaran yang paling potensial dan
diberikan strategi pemasaran berupa potongan harga setiap transaksi dan notifikasi
penawaran produk setiap bulannya.
2. Dalam cluster-2 terdiri dari kota dengan karakteristik kadar SO2 dominan dibawah rata-rata
total, temperature dominan dibawah rata-rata total, jumlah industri manufaktur dominan
dibawah dan diatas rata-rata total, populasi dominan dibawah dan diatas rata-rata total,
kecepatan angin dominan dibawah dan diatas rata-rata total, presipitasi dominan dibawah
dan diatas rata-rata total dan jumlah hari hujan dalam setahun dominan dibawah dan diatas
rata-rata total.
Sehingga, cluster-2 termasuk kelompok kota target pemasaran yang kurang potensial
dan diberikan strategi pemasaran berupa promosi produk dengan mengirimkan katalog
dengan desain menarik melalui email.
Sedangkan cluster 3,4, dan 5 merupakan outlier, dikarenakan pada studi kasus ini perusahaan
ingin mengelompokkan kota target pemasaran serta memberikan strategi pemasaran yang
tepat. Sehingga 3 outlier dapat dimasukan pada kelompok kota target pemasaran dan strategi
pemasaran yang tepat berdasarkan pada karakteristik outlier tersebut, seperti penjelasan
berikut:
3. Cluster-3 merupakan outlier, yaitu kota dengan karakteristik kadar SO2 dominan dibawah
rata-rata total, temperature dominan dibawah dan diatas rata-rata total, jumlah industri
manufaktur dominan dibawah rata-rata total, populasi dominan dibawah dan diatas rata-rata
total, kecepatan angin dominan dibawah rata-rata total, presipitasi dominan dibawah rata-
rata total dan jumlah hari hujan dalam setahun dominan dibawah rata-rata total.
Sehingga, cluster-3 termasuk kelompok kota target pemasaran yang paling potensial dan
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
diberikan strategi pemasaran berupa potongan harga setiap transaksi dan notifikasi
penawaran produk setiap bulannya.
4. Cluster-4 merupakan outlier, yaitu kota dengan karakteristik kadar SO2 dominan diatas rata-
rata total, temperature dominan dibawah rata-rata total, jumlah industri manufaktur dominan
diatas rata-rata total, populasi dominan diatas rata-rata total, kecepatan angin dominan diatas
rata-rata total, presipitasi dominan dibawah rata-rata total dan jumlah hari hujan dalam
setahun dominan diatas rata-rata total.
Sehingga, cluster-4 termasuk kelompok kota target pemasaran yang cukup potensial dan
diberikan strategi pemasaran berupa potongan harga produk pada periode tertentu.
5. Cluster-5 merupakan outlier, yaitu kota dengan karakteristik kadar SO2 dominan diatas rata-
rata total, temperature dominan dibawah rata-rata total, jumlah industri manufaktur dominan
diatas rata-rata total, populasi dominan diatas rata-rata total, kecepatan angin dominan diatas
rata-rata total, presipitasi dominan diatas rata-rata total dan jumlah hari hujan dalam setahun
dominan diatas rata-rata total.
Sehingga, cluster-5 termasuk kelompok kota target pemasaran yang cukup potensial dan
diberikan strategi pemasaran berupa potongan harga produk pada periode tertentu.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Metode Non Hierarki (K-Means Cluster)
Langkah Penyelesaian 1. Standarisasi Data
Karena data yang dikumpulkan berada dalam satuan yang berbeda maka terlebih dahulu
dilakukan proses standarisasi (normalisasi) data. Jika data sudah berada dalam satuan yg sama
atau tidak memiliki satuan maka langkah ini dapat diabaikan.
Masukkan seluruh data ke dalam spss :
a. Klik Analyze > Descriptive Statistics > Descriptives
b. Pindahkan variabel dikolom kiri ke kolom Variable (s). Aktifkan Save Standardized as
Variables Klik OK
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
c. Hasil SPSS
Setelah tahap tersebut dilakukan, maka akan muncul tabel Descriptive Statistics yang
akan digunakan untuk membantu menganalisis pengelompokan cluster nantinya.
Pastikan tampilan pada data view telah berubah seperti gambar berikut ini:
Perhatikan pada variabel data asli akan muncul 5 kriteria dengan awalan “Z”
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
2. Analisis Cluster Metode K-Means Cluster
a. Pada Analyze Classify K-Means Cluster
b. Pindahkan Variabel yang berawalan “Z” ke kolom Variable (s). Selanjutnya tentukan
jumlah Cluster dengan mengisikan angka 3 pada Number of Cluster
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
c. Pilih Save dan aktifkan Cluster Membership dan Distance from Cluster center, kemudian
Continue
d. Pilih Option, aktifkan Initial Cluster center dan Anova Table
e. Klik OK. Langkah tersebut akan menghasilkan tabel Initial Cluster.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Tabel Initial Cluster Centers menunjukkan hasil proses sementara pengelompokan
data yang di lakukan.
Initial Cluster Centers
Cluster
1 2 3
Zscore(SO2) -,85415 -,81154 3,40620
Zscore(Temperatur) 2,01123 -1,19864 -,71439
Zscore(Industri) -,44385 -,12795 5,11275
Zscore(Populasi) -,04595 -,25144 4,76658
Zscore(Kecepatan_angin) -2,41061 2,06916 ,66923
Zscore(Presipitasi) -2,52465 -,05598 -,19785
Zscore(Hari) -2,93900 1,96547 ,30549
Tabel diatas merupakan tampilan pertama proses clustering data sebelum dilakukan iterasi.
Untuk mendeteksi berapa kali proses iterasi dilakukan dalam proses clustering
menggunakan 41 data objek dapat dilihat tampilan output berikut:
Iteration Historya
Iteration
Change in Cluster Centers
1 2 3
1 2,730 2,992 2,154
2 ,000 ,000 ,000
a. Convergence achieved due to no or
small change in cluster centers. The
maximum absolute coordinate change
for any center is ,000. The current
iteration is 2. The minimum distance
between initial centers is 7,789.
Ternyata proses clustering dilakukan melalui 2 iterasi untuk menentukan cluster yang
tepat. Dari tabel diatas disebutkan bahwa jarak minimum antar pusat cluster yang terjadi
dari hasil iterasi adalah 7,789.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Cluster Membership
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Cluster Membership
Kota QCL_1 QCL_2
Phoenix 1 2,73018
Little Rock 2 1,92021
San Fransisco 1 0,95615
Denver 1 1,21389
Hartford 2 1,69366
Wilmington 2 1,09831
Washington 2 0,64947
Jacksonville 2 2,33024
Miami 2 3,36164
Atlanta 2 1,14349
Chicago 3 2,15393
Indianapolis 2 0,64211
Des Moines 2 1,99518
Wichita 2 2,94779
Loiusville 2 0,95906
New Orleans 2 2,57302
Baltimore 2 1,19083
Detroit 2 2,46521
Minneapolis 2 2,39402
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Kota QCL_1 QCL_2
Kansas 2 1,11335
St Louis 2 1,54535
Omaha 2 1,79752
Albuquerque 1 0,89967
Albany 2 1,88657
Buffalo 2 2,99178
Cincinnati 2 1,8375
Cleveland 2 2,69658
Columbus 2 1,09706
Philadelphia 3 2,15393
Pitssburgh 2 1,89082
Terlihat dari tabel diatas menunjukkan tiap kota masuk ke dalam masing-masing cluster yang
dibentuk. Seperti kota Phoenix masuk dalam cluster 1, nilai distance sebesar 2,73018.
Final Cluster Centers
Cluster
1 2 3
Zscore(SO2) -,61557 -,05847 2,53283
Zscore(Temperatur) ,21813 -,00633 -,43768
Zscore(Industri) -,35937 -,16167 3,64685
Zscore(Populasi) -,27975 -,16718 3,54143
Zscore(Kecepatan_angin) -,82869 ,09897 ,38925
Zscore(Presipitasi) -2,04298 ,29836 ,03534
Zscore(Hari) -1,76193 ,24890 ,17345
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Tabel Final Cluster Centers menunjukkan hasil analisisnya untuk masing-masing krieria dan
cluster yang dibentuk.
Berikut ini merupakan pedoman ketentuan untuk menafsirkan tabel hasil analisis pada
Final Cluster Centers:
1. Jika hasil perhitungan ditemukan negatif, berarti cluster yang bersangkutan ada di bawah
rata-rata total.
2. Jika hasil perhitungan ditemukan positif, berarti cluster yang bersangkutan ada di atas
rata-rata total.
Number of Cases in each
Cluster
Cluster 1 5,000
2 34,000
3 2,000
Valid 41,000
Missing ,000
Tabel Number of cases in each cluster menunjukkan jumlah mahasiswa yang masuk ke
dalam tiap cluster. Cluster 1 (5 kota), cluster 2 (34 kota) dan cluster 3 (2 kota).
Dari tabel output Final Cluster Centers, dengan ketentuan yang telah dijabarkan diatas
pula, dapat didefinisikan sebagai berikut :
1. Cluster 1
Dalam cluster-1 terdiri dari kota dengan karakteristik kadar SO2 dominan dibawah rata-
rata total, temperature dominan diatas rata-rata total, jumlah industri manufaktur
dominan dibawah rata-rata total, populasi dominan dibawah rata-rata total, kecepatan
angin dominan dibawah rata-rata total, presipitasi dominan dibawah rata-rata total dan
jumlah hari hujan dalam setahun dominan dibawah rata-rata total. Sehingga, cluster-1
termasuk kelompok kota target pemasaran yang paling potensial dan diberikan strategi
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
pemasaran berupa potongan harga setiap transaksi dan notifikasi penawaran produk
setiap bulannya.
2. Cluster 2
Dalam cluster-2 terdiri dari kota dengan karakteristik kadar SO2 dominan dibawah rata-
rata total, temperature dominan dibawah rata-rata total, jumlah industri manufaktur
dominan dibawah rata-rata total, populasi dominan dibawah rata-rata total, kecepatan
angin dominan diatas rata-rata total, presipitasi dominan diatas rata-rata total dan jumlah
hari hujan dalam setahun dominan diatas rata-rata total. Sehingga, cluster-2 termasuk
kelompok kota target pemasaran yang kurang potensial dan diberikan strategi
pemasaran berupa promosi produk dengan mengirimkan katalog dengan desain menarik
melalui email.
3. Cluster 3
Dalam cluster-3 terdiri dari kota dengan karakteristik kadar SO2 dominan diatas rata-
rata total, temperature dominan dibawah rata-rata total, jumlah industri manufaktur
dominan diatas rata-rata total, populasi dominan diatas rata-rata total, kecepatan angin
dominan diatas rata-rata total, presipitasi dominan diatas rata-rata total dan jumlah hari
hujan dalam setahun dominan diatas rata-rata total.
Sehingga, cluster-5 termasuk kelompok kota target pemasaran yang cukup potensial
dan diberikan strategi pemasaran berupa potongan harga produk pada periode tertentu.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Dalam menghitung nilai rata-rata setiap faktor pada masing-masing cluster, rumus umum
yang digunakan yaitu :
𝑥 = µ + 𝑧. 𝜎
Dimana :
x : rata-rata sampel (variabel dalam cluster)
µ : rata-rata populasi
z : nilai standardisasi
𝜎 : standar deviasi
Sebagai contoh, apabila ingin mengetahui rata-rata kadar SO2 pada cluster 1 yaitu :
𝑥 = µ + 𝑧. 𝜎
𝑥 = 30,0488 + (−0,61557). (23,47227)
𝑥 = 15,6
Jadi rata-rata kadar SO2 pada cluster 1 adalah 15,6 mg/m3.
Rata-rata setiap kriteria cluster dapat diketahui berdasarkan hasil spss seperti pada tabel
berikut:
Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
SO2 41 8,00 110,00 30,0488 23,47227
Temperatur 41 43,50 75,50 55,7634 7,22772
Industri 41 35,00 3344,00 463,0976 563,47395
Populasi 41 71,00 3369,00 608,6098 579,11302
Kecepatan_angin 41 6,00 12,70 9,4439 1,42864
Presipitasi 41 7,05 59,80 36,7690 11,77155
Hari 41 36,00 166,00 113,9024 26,50642
Valid N (listwise) 41
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
Informasi nilai rata-rata setiap cluster dapat dilihat pada tabel berikut:
Cluster
1 2 3
Kadar SO2 15,600 28,676 89,500
Temperature 57,340 55,718 52,600
Jumlah Industri Manufaktur 260,600 372,000 2518,000
Populasi 446,600 511,794 2659,500
Kecepatan Angin 8,260 9,585 10,000
Presipitasi 12,720 40,281 37,185
Jumlah Hari Hujan dalam Setahun 67,200 120,500 118,500
Nilai tersebut menunjukan nilai rata-rata pada setiap cluster berdasarkan masing-masing
faktor. Misalnya:
Cluster-1 terdiri dari kota dengan karakteristik kadar SO2 sebesar 15,6 mg/m3 dimana
dibawah rata-rata total, temperature sebesar 57,340F dimana diatas rata-rata total,
jumlah industri manufaktur sebanyak 260,6 buah dimana dibawah rata-rata total,
populasi sebanyak 446.600 orang dimana dibawah rata-rata total, kecepatan angin
sebesar 8,26 m/h dimana dibawah rata-rata total, presipitasi sebesar 12,720 inch dimana
dibawah rata-rata total dan jumlah hari hujan dalam setahun sebanyak 62,7 hari dimana
dibawah rata-rata total. Sehingga, cluster-1 termasuk kelompok kota target pemasaran
yang paling potensial dan diberikan strategi pemasaran berupa potongan harga setiap
transaksi dan notifikasi penawaran produk setiap bulannya.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2018
DAFTAR PUSTAKA
Bertalya. 2009. Konsep Data Mining. Universitas Gunadarma.
Fayyad, Usama. 1996. Advances in Knowledge Discovery and Data Mining. MIT Press.
Susanto, Hery Tri. 2009. Cluster Analysis. Seminar Nasional Matematika dan
Pendidikan Matematika. Yogyakarta: Universitas Negeri Yogyakarta.
Turban, Efraim et al. 2005. Decision Support Systems and Intelligent Systems.
Yogyakarta: Andi Offset
Walpole, Ronald E. dan Myers, Raymond H. 1986. Ilmu Peluang dan Statistik Untuk
Insinyur Dan Ilmuwan. Bandung: ITB Press.
Top Related