Tugas Analisa SOM (SELF ORGANIZING MAPS)
Mata Kuliah Sistem Kendali Modren
Disusun Oleh :
Ryan Hary Sufrianto (1221001)
Dosen Pembimbing :
Wahyu Setyo Pambudi, ST., MT
PROGRAM STUDI TEKNIK ELEKTRO
FAKULTAS TEKNOLOGI INDUSTRI
UNIVERSITAS INTERNASIONAL BATAM
2014
BAB 1
LANDASAN TEORI
1.1 Clustering
Clustering merupakan teknik pengelompokan sejumlah data atau objek ke dalam cluster
(group) sehingga setiap dalam cluster tersebut akan berisi data yang semirip mungkin dan
berbeda dengan objek dalam cluster yang lainnya (Santosa B., 2007). Terdapat beberapa
metode clustering diantaranya hierarchical, K-means, self organizing maps (SOM) clustering
(Alfina, 2012). K-means merupakan metode clustering yang paling sederhana dan umum. K-
means mempunyai kemampuan mengelompokkan data dalam jumlah yang cukup besar
dengan waktu komputasi yang relatif cepat dan efisien. Metode hierarki dapat dibedakan
menjadi dua bagian, yaitu metode penggabungan (agglomerative) dan metode pemecahan
(devisive). Pembentukan kelompok dalam metode hierarki, menggunakan beberapa cara,
antara lain pautan tunggal (single linkage), pautan lengkap (complete linkage), dan pautan
rata-rata (average linkage). Self Organizing Maps (SOM) merupakan suatu tipe Artificial
Neural Networks yang di-training secara unsupervised. SOM menghasilkan map yang terdiri
dari output dalam dimensi yang rendah (2 atau 3 dimensi). Map ini berusaha mencari property
dari input data.
1.2 Self-Organizing Map (SOM)
A. Kohonen
Self-Organizing Map (SOM), umumnya juga dikenal sebagai jaringan Kohonen (Kohonen
1982, Kohonen 2001) adalah metode komputasi untuk visualisasi dan analisis data dimensi
tinggi, terutama informasi yang diperoleh secara eksperimental.
Self-Organizing Map mendefinisikan pemetaan memerintahkan, semacam proyeksi dari
satu set item data yang diberikan ke biasa, biasanya dua dimensi jaringan. Sebuah model mi
dikaitkan dengan setiap node jaringan
Model ini dihitung dengan algoritma SOM. Item data akan dipetakan ke node yang Model
yang paling mirip dengan item data, misalnya, memiliki jarak terkecil dari item data dalam
beberapa metrik.
Seperti vektor codebook dalam vektor kuantisasi, model ini maka biasanya rata-rata
tertimbang lokal tertentu dari item data yang diberikan dalam ruang data. Tapi selain itu,
ketika model dihitung dengan algoritma SOM, mereka lebih mirip dengan node terdekat dari
antara node yang terletak lebih jauh dari satu sama lain di grid. Dengan cara ini set model
dapat dianggap untuk membentuk grafik kesamaan, dan terstruktur 'kerangka' distribusi item
data yang diberikan.
SOM ini awalnya dikembangkan untuk visualisasi distribusi vektor metrik, seperti set
memerintahkan nilai-nilai pengukuran atau atribut statistik, tetapi dapat menunjukkan bahwa
pemetaan SOM-jenis dapat didefinisikan untuk setiap item data, jarak berpasangan saling yang
dapat didefinisikan. Contoh data non-vectorial yang layak untuk metode ini adalah string
simbol dan urutan segmen di molekul organik (Kohonen dan Somervuo 2002).
Algoritma SOM tumbuh dari model jaringan syaraf awal, terutama model memori asosiatif
dan pembelajaran adaptif (Kohonen, 1984). Sebuah insentif baru adalah untuk menjelaskan
organisasi spasial fungsi otak.
Penemuan penting dari Kohonen adalah untuk memperkenalkan model sistem yang terdiri
dari setidaknya dua subsistem berinteraksi alam yang berbeda. Salah satu subsistem tersebut
adalah jaringan saraf kompetitif yang mengimplementasikan pemenang mengambil semua
fungsi, tetapi ada juga subsistem lain yang dikendalikan oleh jaringan saraf dan yang
memodifikasi plastisitas sinaptik lokal neuron dalam belajar.
The Self-Organizing Map merupakan salah satu model jaringan syaraf yang paling populer.
Ini termasuk dalam kategori jaringan pembelajaran kompetitif. Self-Organizing Map
didasarkan pada pembelajaran tanpa pengawasan, yang berarti bahwa tidak ada campur tangan
manusia yang diperlukan selama pembelajaran dan kebutuhan sedikit yang diketahui tentang
karakteristik data masukan. Kita bisa, misalnya, menggunakan SOM untuk data
pengelompokan tanpa mengetahui keanggotaan kelas input data. SOM dapat digunakan untuk
mendeteksi fitur yang melekat untuk masalah ini dan dengan demikian juga telah disebut
SOFM, Self-Organizing Feature Map.
Algoritma SOM didasarkan pada tanpa pengawasan, belajar kompetitif. Ini memberikan
topologi melestarikan pemetaan dari ruang dimensi tinggi untuk memetakan unit. Peta unit,
atau neuron, biasanya membentuk kisi dua dimensi. Properti topologi melestarikan berarti
bahwa pemetaan mempertahankan jarak relatif antara titik-titik. Poin yang dekat satu sama
lain di ruang input dipetakan ke unit peta terdekat di SOM. Sehingga SOM dapat berfungsi
sebagai alat analisis klaster data dimensi tinggi. Juga, SOM memiliki kemampuan untuk
menggeneralisasi. Kemampuan Generalisasi berarti bahwa jaringan dapat mengenali atau ciri
input tidak pernah ditemukan sebelumnya.
1.3 Struktur SOM
Pada SOM, jaringan terdiri dari 2 layer, layer input dan layer output. Setiap node dari input
terhubung dengan seluruh node pada output layer. Namun node pada ouput layer tidak terhubung
satu sama lain. Node dalam output layer ini disebut juga map node.
Output layer dapat berdimensi 1 atau 2. Layer ini juga dapat disebut sebagai computational
layer atau competitive layer karena node-node pada layer ini berkompetisi dan selalu di-update
bobotnya. Baik input mauput output node merupakan array yang menyinmapan informasi
karakteristik, atribut maupun ciri. Botot (weight) ini merepresentasikan hal-hal tersebut.
1.4 Algoritma Mathematical definition of the SOM
Self-Organizing Map algoritma dapat dipecah menjadi beberapa langkah :
1). Bobot masing-masing node diinisialisasi.
2). Vektor A dipilih secara acak dari set data pelatihan dan disajikan
ke jaringan.
3). Setiap simpul dalam jaringan diperiksa untuk menghitung mana bobot yang 'yang
paling suka vektor input. Simpul menang umumnya dikenal sebagai
Best Matching Unit (BMU). (Persamaan 1).
4). Jari-jari lingkungan dari BMU dihitung. Nilai ini dimulai
besar. Biasanya sudah diatur untuk menjadi radius jaringan, mengurangi setiap
waktu-langkah. (Persamaan 2, 3).
5). Setiap node ditemukan dalam radius BMU, dihitung dalam 4), yang
disesuaikan untuk membuat mereka lebih seperti vektor input (Persamaan 3, 4). itu
dekat simpul adalah dengan BMU, semakin nya 'bobot yang diubah (Persamaan 5).
6). Ulangi 2) untuk N iterasi.
Persamaan algoritma yang digunakan adalah sebagai berikut
Equation 1 β Calculate the BMU (Bagian Kompetitif)
DisFromInputΒ²=β (πΌπ=ππ=0 α΅’ β πα΅’)Β² β¦(1)
I= vektor input saat ini
mα΅’ = Bobot Vektor Node
n = jumlah bobot
Ada beberapa hal yang perlu diketahui tentang formula ini. Persamaan 1 hanya
rumus jarak Euclidean dan kuadrat. Hal ini di kuadrat kan karena kita tidak berhubungan
dengan jarak numerik yang sebenarnya dari input. Kita hanya perlu beberapa
semacam skala seragam untuk membandingkan setiap node dengan vektor input.
persamaan menyatakan bahwa, menghilangkan kebutuhan untuk komputasi
operasi akar kuadrat untuk setiap node dalam jaringan.
Equation 2 β Radius of the neighborhood (Kooperatif)
Ο(t) = Οβ π(βπ‘/π) β¦(2)
t = iterasi saat ini
Ξ» = konstanta waktu (Persamaan 2)
Οβ = jari-jari peta
Equation 3 β New weight of a node(Adiptif)
mα΅’(t+1) = mα΅’(t) + Ξ±(t)L(t)-mα΅’(t)) ...(3)
Equation 4 β Learning rate
L(t) = Lβ π(βπ‘/π) β¦(4)
Equation 5 β Distance from BMU
Ξ± (t) = π(βπππ π‘πΉππππ΅ππ2/(2π2(π‘))) β¦(5)
Persamaan 2 dan 4 memanfaatkan peluruhan eksponensial. Pada t = 0 mereka di max
mereka.Seperti t (nomor iterasi saat ini) meningkat, mereka mendekati nol. Ini adalah persis
apa yang kita inginkan. Dalam persamaan 3, radius harus mulai keluar sebagai radius kisi, dan
Pendekatan nol, pada saat jari-jari hanya node BMU (lihat Gambar 4)
Gambar 4
Persamaan 4 hampir mendekati. Setiap nilai konstan dapat dipilih akan memberikan nilai
yang baik meskipun, karena tergantung langsung pada ukuran peta dan jumlah iterasi untuk
melakukan
Persamaan 3 adalah fungsi pembelajaran utama. mα΅’ (t + 1) adalah nilai bobot dari node
yang diberikan. Seiring waktu, persamaan ini pada dasarnya membuat diberikan simpul berat
lebih seperti vektor input yang dipilih saat ini. I adalah sebuah simpul yang sangat berbeda
dari vektor input saat ini yang akan belajar lebih dari simpul yang sangat mirip dengan vektor
input saat ini.
Persamaan 3, digunakan untuk membuat node lebih dekat ke BMU belajar lebih dari
node di pinggiran radius lingkungan saat ini. Node di luar radius kawasan yang dilewati
sepenuhnya. distFromBMU adalah jumlah aktual.
1.5 Applications of SOMs
Aplikasi sederhana dari SOM
Dari peta di atas di dapat sebuah data tentang kesejahtraan, atau perkembangan dan bisa
juga kategori untuk Negara-negara yang kaya hingga yang termiskin untuk semua Negara
yang ada di dunia ini. Dengan pengunaan SOM kita bisa mengklasifikasi kan sebuah bagian-
bagian Negara mana saja kah yang termasuk Negara kaya hingga Negara termiskin.
Dari data warna di atas kita mendapat masalah bahwa kita tidak dapat mendeteksi Negara-
negara yang kaya atau pun yang miskin.
Dan ini lah hasil jika kita mengunakan SOM
Dan dari data SOM di atas kita bisa mengetahui secara jelas dan tepat bahkan mudah untuk
membedakkan antara Negara-negara kaya dan miskin dan SOM juga bisa mendeteksi Negara
dengan kekayaan menengah antara menengah ke kaya ataupun menengah ke miskin. Dan bisa
juga mendiskripsikan Negara yang sedang berkembang hingga ke Negara yang menuju ke
kemajuan.
BAB II
ANALISA PROGRAM DAN PEMBAHASAN
1. Analisa Coding
Dari koding di atas ada contoh 7 pola inputan yang dimana pola ini ada 21 pola yang bisa
di jadi kan sebagai data inputan.
Jadi dari program koding di atas ada 7 contoh pola dimana ada A1,B1,C1,D1,E1,J1,K1 dan
dan 14 pola lagi dengan kode A1-K2 dan A3-K3. Dimana pola ini sudah bisa terlihat bentuk
nya dengan melihat angka 1.
Dari coding di atas ada inisialisai yang harus di lakukan setelah array, dimana terdapat
jumlah dari cluster maxsimal atau jumlah kategori dari keluaran, vector dari array masukkan,
radius dan learning rate(alpha).
Dari koding di atas juga di dapat data bahwa di program memiliki 25 cluster dan di dalam 1
cluster terdapat 63 pola ditunjukkan pada nomer 1. Dan pada nomer 2 adalah 100 kali
iteration.Dengan petterns berjumlah 21 seperti yang sudah saya bahas di atas di tunjukan pada
nomer 4, sedangkan nomer 3 itu adalah coding dari max cluster yaitu 25 cluster x 63 pola.
Coding di atas pergunakan untuk mencari sebuah jarak dan mengunakan persamaan 1 yang di
tunjukkan pada nomer 2 yang dimana coding atau persamaan ini dimasukan agar tidak terjadi
akar kuadrat, karna sesungguh nya bukan jarak sebenar nya yang di ingin kan tetapi hanya
skala jarak yang sama di peruntukkan untuk perbandingan nya.
Dari coding di atas adalah coding untuk Petterns yang di gunakan di program dan di mana
coding yang di pakai adalah persamaan 3 yang terdapat di dasar teori.
Coding diatas di gunakan untuk hasil dari inputan yang sudah di inisal dengan 0 dan 1 dan di
ubah dalam bentuk β[ ]β, dan bisa juga di bentuk apa pun yang kita ingin kan agar kita bisa
melihat langsung ayang terjadi di tampilan program apabila di running. Dalah hal ini yaitu
mengklasifikaskan bentuk hurup sayng mendekati.
Jadi pada program memiliki 3 ruang pattern yang berjumlah 21 tadi di bagi menjadi 3
kelompok untuk menunjukan bagaimana kerja SOM dalam mengklasifikasi kan hurup yang
mirip.
Pada coding di atas adalah coding untuk mencari sebuah nilai minimum di dalam sebuah array
yang dimana cara nya adalah membandingkan node satu ke node yang lain dan node dengan nilai
terkecil akan menjadi Best Matching Unit(BMU).
Pada coding di atas, dimana coding tersebut untuk menghilang kan atau mengnol kan nilai dari
vector array.
Coding di atas coding untuk menjalan kan UpdateWeight dimana di gunkan untuk memperbaharui
bobot. Dan di gunakan persamaan yang ke 4 dari dasar teori. Di gunakan array 3X3 dengan radius
1 sebagai lingkungan dan hanya vector yang berada di dalam nya yang akan berubah.
Dan ketika learning rute masih sangat jauh dari radius point nya maka update nya akan di mulai
dari array baris pertama.
Dan dari hasil beberapa iterasi atau nilai alpha lebih kecil dari radius point nya maka hanya BMU
yang akan terupdate.
Coding diatas adalah lanjutan daari koding sebelum nya Dimana coding di atas di pergunakan
untuk menghitung masukkan dan memanggil coding computeInput dengan menggunakan pattern.
Di dalam nya juga terdapat untuk mencari nilai minimum, memperbaharui bobot, melakukan
pengurangan learning rate dan menampilkan keluaran berupa pengelompokan kategori pada
listbox seperto yang tertera di coding di bawah ini.
Dari program yang telah di running bisa di amati bahwa jaringan SOM menjadi input layer
yang bervisual kan huruf seperti E, J dan K. dimana huruf-huruf di atas memiliki 63 pola yang
nilai nya 0 pada area kosong dan 1 pada area bergaris yang di dapat dari arry 7x9.
Weight akan diupdate untuk BMU dan node di radius neighborhoodnya per pola dan
berubah mendekati pola input. Tiap pola memiliki BMU masing-masing. Pada program dilakukan
100 kali iterasi berdasarkan learning ratenya hingga didapatkan weight ter-update setelah 100 kali
iterasi. Weight ini dipergunakan untuk menentukan cluster pola-pola diatas, berdasarkan jarak
minimum antara input dengan node. Dapat kita amati bahwa terdapat iterasi terjadi 101 dan pada
80 iterasi radius neighborhood berkurang dan hanya weight BMU yang terupdate.
Dan dapat dilihat juga C1, C2, dan C3 sudah berada di dalam kategori. A1 dan A3 juga
sama akan tetapi A2 sebenar nya sama dengan A3 dalam kategori nya hanya beda di pattern nya
hal ini di karna kan bahwa ada kemiripan yang terjadi. Dan untuk J1, J2 dan J3 juga sudah berada
pada kategori.
Contoh Pengujian dari Program
Jadi pada hasil dari beberapa percobaan dari program bisa di amati di nilai persenan(%)
pekerjaan dari som yang mengklasrifikasi kan pola yang berbentuk Huruf. Dari semua percobaan
hanya berbeda pada row saja akan tetapi untuk persenan(%) dari uji 1 sampai 5 hanya ada sedikit
perbedaan yaitu uji 1 sama dengan uji 5 dan pada uji 2,3 dan 4 terjadi kesamaan persenan(%).
Pada percobaan bisa di amati juga terjadi perbedaaan di setiap kali pengujian yaitu
perbedaan angka pengklasifikasian hal ini terjadikarna inputan nya bersifat random.
Dari data di atas pola C dan J adalah pola tebaik dengan 100% tingkat kemiripan. Dan pola
A adalah pola yang belum sempurna tingkat kemiripan nya dengan 2 kali mengalami 0%
kemiripan.
Dan pada pola B, E, K adalah pola yang paling stabil untuk tingkat kemiringan nya dengan
50% tingkat kemiripan nya. Pada Pola d terjadi sedikit perubahan yaitu pada uji ke 4 yang pada 3
uji coba sebelum nya stabil dengan 50% berubahh menjadi 0% pada uji 4 dan kembali 50% pada
uji 5.
Dan jika iterasi di tambah maka pengklarifikasi pola huruf akan lebih baik dan akan lebih
menuju ke 100%.
BAB III
KESIMPULAN
1. Clustering merupakan teknik pengelompokan sejumlah data atau objek ke dalam
cluster (group) sehingga setiap dalam cluster tersebut akan berisi data yang semirip
mungkin dan berbeda dengan objek dalam cluster yang lainnya (Santosa B., 2007).
Terdapat beberapa metode clustering diantaranya hierarchical, K-means, self
organizing maps (SOM).
2. Self-Organizing Map (SOM), umumnya juga dikenal sebagai jaringan Kohonen
(Kohonen 1982, Kohonen 2001) adalah metode komputasi untuk visualisasi dan analisis
data dimensi tinggi, terutama informasi yang diperoleh secara eksperimental.
3. Self-Organizing Map mendefinisikan pemetaan memerintahkan, semacam proyeksi dari
satu set item data yang diberikan ke biasa, biasanya dua dimensi jaringan. Sebuah
model mi dikaitkan dengan setiap node jaringan
4. Pada aplikasi SOM, dapat memetakan Negara di seluruh dunia untuk mengkategori kan
secara mudah apakah Negara itu kaya , maju, sedang berkembang dan Negara miskin.
5. SOM merupakan salah satu bentuk Artificial Neural Network dengan menggunakan
konsep Brain Mapping sebagai inspirasinya
6. SOM merupakan bentuk ANN Unsuprevised Learning dengan memiliki 2 layer, Layer
input dan compeptitive layer sebagai output
7. SOM mampu mempelajari input sebagai training data sehingga terbentuk output yang
yang nodenya memiliki nilai mendekati input
8. SOM mempu mengklasifikasikan input berdasarkan jarak input dengan mencari jarak
minimum, karena jarak minimum menunjukkan node trersebut dan input memiliiki
kemiripan.
9. Pada SOM input yang memiliki cluster yang sama atsau letak clusternya berdekatan
memiliki kemiripan .
10. Pada percobaan program pola dari C dan J adalah pola yang paling stabil untuk tingkat
pengelompokkan nya yaitu dengan 100% tinggak kebehasilan.
11. Dan pada pola B, E dan K adalah pola kestabilan 50% tingkat keberhasilan nya.
Top Related