Proposal Judul

17
1. LATAR BELAKANG Clustering merupakan proses pengelompokan data ke dalam cluster berdasarkan parameter yang telah ditentukan, sehingga oby obyek dalam sebuah cluster memiliki tingkat kemiripan yang tinggi satu sama lain dan sangat tidak mirip dengan obyek yang lain pada cluster yang berbeda. Pembentukan cluster data merupakan salah satu teknik yang digunakan dalam mengetahui pola kecenderungan suatu data. Analisis cluster merupakan proses membagi data dalam suatu himpunan ke dalam beberapa kelompok yang kesamaan karakteristik datanya dalam suatu kelompok lebih besar daripada kesamaan karakteristik data tersebut dengan data dalam kelompok lain. Penggalian informasi pada sebuah data yang berukuran besar (mempunyai jumlah record dan jumlah field yang cukup banyak) tidak dapat dilakukan dengan mudah. Algoritma K-eans merupakan algoritma teknikklustering yang berulang-ulang. Algoritma ini dimulaidengan pemilihan secara acak K, yang merupakan banyaknya kluster yang ingin dibentuk. Kemudian tetapkan nilai-nilai K secara random, untuk sementara nilai tersebut menjadi pusat dari kluster atau biasa disebutdengan centroid ! mean. "itung jarak setiap data yang ada terhadap masing- masing centroid menggunakan rumus yang sudah disediakan hingga diketemukan jarak yang paling dekat dari setiap data dengan centroid. Klasifikasi setiap data berdasarkan kedekatannya dengan centroid. #akukan langkah tersebut sampai nilai centroid tidak berubah (stabil).

description

ini contoh proposal judul skripsi

Transcript of Proposal Judul

1. LATAR BELAKANGClustering merupakan proses pengelompokan data ke dalam cluster berdasarkan parameter yang telah ditentukan, sehingga obyek-obyek dalam sebuah cluster memiliki tingkat kemiripan yang tinggi satu sama lain dan sangat tidak mirip dengan obyek yang lain pada cluster yang berbeda. Pembentukan cluster data merupakan salah satu teknik yang digunakan dalam mengetahui pola kecenderungan suatu data. Analisis cluster merupakan proses membagi data dalam suatu himpunan ke dalam beberapa kelompok yang kesamaan karakteristik datanya dalam suatu kelompok lebih besar daripada kesamaan karakteristik data tersebut dengan data dalam kelompok lain.Penggalian informasi pada sebuah data yang berukuran besar (mempunyai jumlah record dan jumlah field yang cukup banyak) tidak dapat dilakukan dengan mudah. Algoritma K-Means merupakan algoritma teknik klustering yang berulang-ulang. Algoritma ini dimulai dengan pemilihan secara acak K, yang merupakan banyaknya kluster yang ingin dibentuk. Kemudian tetapkan nilai-nilai K secara random, untuk sementara nilai tersebut menjadi pusat dari kluster atau biasa disebut dengan centroid / mean. Hitung jarak setiap data yang ada terhadap masing-masing centroid menggunakan rumus yang sudah disediakan hingga diketemukan jarak yang paling dekat dari setiap data dengan centroid. Klasifikasi setiap data berdasarkan kedekatannya dengan centroid. Lakukan langkah tersebut sampai nilai centroid tidak berubah (stabil).Data akademik merupakan hasil evaluasi belajar mahasiswa berupa indeks kompulatif (IPK) dan data atribut identitas diri mahasiswa seperti nim, nama, asal kota, asal SMA, jurusan SMA, dan tahun lulus SMA. Dengan menggunakan data pencapaian indeks komulatif tersebut maka dapat diketahui minat belajar mahasiswa dan dapat melakukan pengelompokkan berdasarkan pola data yang ada.

2. RUMUSAN MASALAHBagaimana membuat aplikasi sistem pendukung keputusan pengelompokan mahasiswa berdasarkan pola data dengan menggunakan metode k-means clustering.

3. BATASAN MASALAHa. Data mahasiswa yang digunakan hanya jurusan teknik informatika dan teknik informatika - desain grafis angkatan 2011.b. Data IPK yang digunakan dari semester 1-6.c. Kriteria yang digunakan adalah jenis kota, jenis SMA, jurusan SMA, tahun lulus SMA, dan IPK rata-rata.d. Sistem ini dibangun berbasis desktop.

4. TUJUAN DAN MANFAAT PENULISANTujuanTujuan dari dibuatnya sistem ini agar dapat membantu dalam pengambilan keputusan untuk menentukan pengelompokan mahasiswa berdasarkan pola data di STMIK ASIA Malang dengan menggunakan metode k-means.Manfaat Bagi PenulisDapat menambah ilmu pengetahuan terutama ilmu sistem pendukung keputusan dengan metode k-means.Manfaat Bagi InstansiDapat mempermudah dalam melakukan pengelompokan mahasiswa berdasarkan pola data sehingga diperoleh sebuah informasi yang berguna bagi instansi.

5. METODOLOGI PENELITIANAdapun metode penelitian yang digunakan yaitu :1. WawancaraTeknik pengumpulan data dengan cara mengadakan wawancara langsung dengan BAA (Bagian Administrasi Akademik).2. ObservasiTeknik pengumpulan data dengan mengadakan pengamatan langsung terhadap objek yang dijadikan sumber data yaitu kampus STMIK ASIA Malang pada bagian BAA (Bagian Administrasi Akademik).3. Studi PustakaTeknik pengumpulan data dengan cara pengumpulan bahan-bahan refrensi baik dari buku, paper jurnal maupun laporan tugas khusus yang tersedia di perpustakaan STMIK ASIA Malang.

6. LANDASAN TEORIa. Pengertian Sistem Pendukung KeputusanSistem pendukung keputusan merupakan sistem informasi interaktif yang menyediakan informasi, pemodelan dan pemanipulasian data. Sistem ini digunakan untuk membantu mengambil keputusan dalam situasi yang semi terstruktur dan situasi yang tidak terstruktur, dimana tak seorangpun tahu secara pasti bagaimana keputusan seharusnya dibuat (Alter, 2002).b. Algoritma K-MeansK-means merupakan salah satu algoritma clustering. Tujuan algoritma ini yaitu untukmembagi data menjadi beberapa kelompok. Algoritma ini menerima masukan berupa data tanpa label kelas. Hal ini berbeda dengan supervised learning yang menerima masukanberupa vektor (x1 , y1) , (x2 , y2) , , (xi , yi), di mana xi merupakan data dari suatu data pelatihan dan yi merupakan label kelas untuk xi. Pada algoritma pembelajaran ini, komputer mengelompokkan sendiri data-data yang menjadi masukannya tanpa mengetahui terlebih dulu target kelasnya. Pembelajaran initermasuk dalam unsupervised learning. Masukan yang diterima adalah data atau objek dan k buah kelompok (cluster) yang diinginkan. Algoritma ini akan mengelompokkan data atau objek ke dalam k buah kelompok tersebut. Pada setiap cluster terdapat titik pusat (centroid) yang merepresentasikan cluster tersebut. K-means ditemukan oleh beberapa orang yaitu Lloyd (1957, 1982), Forgey (1965), Friedman and Rubin (1967) , and McQueen (1967). Ide dari clustering pertama kali ditemukan oleh Lloyd pada tahun 1957, namun hal tersebut baru dipublikasi pada tahun 1982. Pada tahun 1965, Forgey juga mempublikasi teknik yang sama sehingga terkadang dikenal sebagai Lloyd-Forgy pada beberapa sumber.

7. ANALISA DATADalam penerapan algoritma k-means pada sistem pendukung keputusan pengelompokan mahasiswa berdasarkan pola data dapat dimodelkan sebagai berikut :1.Tentukan jumlah kluster (k), tetapkan pusat kluster sembarang.2.Hitung jarak setiap data ke pusat kluster.3.Kelompokkan data ke dalam kluster yang dengan jarak yang paling pendek.4. Hitung pusat kluster yang baru.Ulangi langkah 2 sampai dengan 4 hingga sudah tidak ada lagi data yang berpindah ke kluster yang lain.8. PEMBAHASANDiagram alir k-means:

1. Tentukan K sebagai jumlah cluster yang ingin dibentuk.2. Pilih K centroid (titik pusat cluster) awal secara random dalam menentukan n buah pusat cluster awal dilakukan pemilihan bilangan random yang merepresentasikan urutan data input. Pusat awal cluster didapatkan dari data sendiri bukan dengan menentukan titik baru, yaitu dengan merandom pusat awal dari data.3. Hitung jarak setiap data ke masing-masing centroids. Untuk mengukur jarak antaradata dengan pusat cluster digunakan Euclidian distance. Algoritma perhitungan jarak data dengan pusat cluster. Langkah-langkahnya, yaitu:a. Ambil nilai data dan nilai pusat cluster.b. Hitung Euclidian distance data dengan tiap pusat cluster. Euclidian Distancemerupakan jarak yang didapat dari perhitungan antara semua N data dengan K centroid dimana akan memperoleh tingkat kedekatan dengan kelas yang terdekat dengan populasi data tersebut. Contoh kasus: DatasetNoNamaABC

1Aminulloh Khumaini807575

2Arif Kurniawan908580

3Probo Auristandi777885

4Andri Setyawan758070

5Andik Setyawan898575

6Andika Pratamada957075

7Lusia Devitasari758880

8Sugianto Ardiansyah807585

9Ari Dwi Anggara808085

10Dani Sanjaya788080

Langkah langkah:1. Tentukan banyaknya cluster , misalnya cluster (K) = 2.2. Tentukan centroid setiap clusterUntuk menentukan centroid awal (initial centroid) banyak metode yang digunakan. Disini metode yang digunakan adalah mengambil dari data sumber secara acak atau random.c1 dari data No.1 sedangkan c2 data No.7, tabel diatas yang bertanda warna kuning.Tabel centroid perulangan ke-0.ABC

c1807575

c2758880

3. Hitung jarak data denga centroid.

d = jarakj = banyaknya datac = centroidx = data Perulangan ke-0Jarak data dengan cluster 1 adalah:

Jarak data dengan cluster 2 adalah:

Kelompokkan data sesuai dengan clusternya, yaitu data yang memiliki jarak terpendek.NoNamaABCdc1dc2k1k2

1Aminulloh Khumaini807575014,79865*

2Arif Kurniawan9085801515,29706*

3Probo Auristandi77788510,8627811,35782*

4Andri Setyawan7580708,66025412,80625*

5Andik Setyawan89857513,4536215,16575*

6Andika Pratamanda95707515,8113927,36786*

7Lusia Devitasari75888014,798650*

8Sugianto Ardiansyah8075851014,79865*

9Ari Dwi Anggara80808511,1803410,67708*

10Dani Sanjaya7880807,3484698,544004*

4. Tentukan centroid baru dengan cara menghitung rata-rata dari data yang terletak pada centroid yang sama. Pusat cluster yang baru akan digukan untuk iterasi selanjutnya, jika hasil yang didapat belum konvergen. Proses iterasi akan berhenti jika hasil yang dicapai sudah konvergen (pusat cluster baru sama dengan pusat cluster lama).

c = centroid pada cluster

= objek ke-jn = jumlah objek yang menjadi anggota clusterc1 = (80+90+77+75+89+95+80+78)/8 = 83(75+85+78+80+85+70+75+80)/8 = 78,5(75+80+85+70+75+75+85+80)/8 = 78,125c2 = (75+80)/2 = 77,5(88+80)/2 = 84(80+85)/2 = 82,5Tabel centroid perulangan ke-1ABC

c18378,578,125

c277,58482,5

Perulangan ke-1Jarak data dengan cluster 1 adalah:

Jarak data dengan cluster 2 adalah:

NoNamaABCdc1dc2k1k2

1Aminulloh Khumaini8075755,56916711,97915*

2Arif Kurniawan9085809,73476412,78671*

3Probo Auristandi7778859,1386886,519202*

4Andri Setyawan75807011,5006813,36039*

5Andik Setyawan8985759,38166413,7659*

6Andika Pratamanda95707515,0338223,6326*

7Lusia Devitasari75888012,560485,338539*

8Sugianto Ardiansyah8075858,2774179,66954*

9Ari Dwi Anggara8080857,6495515,338539*

10Dani Sanjaya7880805,5466774,743416*

Hitung rata-rata:c1 = (80+90+75+89+95+80)/6 = 84,83333(75+85+80+85+70+75)/6 = 78,33333(75+80+70+75+75+85)/6 = 76,66667c2 = (77+75+80+78)/4 = 77,5(78+88+80+80)/4 = 81,5(85+80+85+80)/4 = 82,5

ABC

c184,8333378,3333376,66667

c277,581,582,5

Tabel centroid perulangan ke-2 Perulangan ke-2Jarak data dengan cluster 1 adalah:

Jarak data dengan cluster 2 adalah:

NoNamaABCdc1dc2k1k2

1Aminulloh Khumaini8075756,10327410,23474*

2Arif Kurniawan9085809,06918213,2193*

3Probo Auristandi77788511,441884,330127*

4Andri Setyawan75807011,9965312,8355*

5Andik Setyawan8985758,03638114,16863*

6Andika Pratamanda95707513,2507922,24298*

7Lusia Devitasari75888014,186267,399324 *

8Sugianto Ardiansyah80758510,193957,399324 *

9Ari Dwi Anggara8080859,7766693,840573 *

10Dani Sanjaya7880807,7835262,95804 *

Hitung rata-rata:c1 = (80+90+75+89+95)/5 = 85,8(75+85+80+85+70)/5 = 79(75+80+70+75+75)/5 = 75c2 = (77+75+80+80+78)/5 = 78(78+88+75+80+80)/5 = 80,2(85+80+85+85+80)/5 = 83ABC

c185,87975

c27880,283

Tabel centroid perulangan ke-3 Perulangan ke-3Jarak data dengan cluster 1 adalah:

Jarak data dengan cluster 2 adalah:

NoNamaABCdc1dc2k1k2

1Aminulloh Khumaini8075757,0455669,748846*

2Arif Kurniawan9085808,8679213,26801*

3Probo Auristandi77788513,358143,136877*

4Andri Setyawan75807011,943213,34316*

5Andik Setyawan8985756,814,42359*

6Andika Pratamanda95707512,8701221,37849*

7Lusia Devitasari75888014,921138,879189*

8Sugianto Ardiansyah80758512,232745,919459 *

9Ari Dwi Anggara80808511,603452,835489*

10Dani Sanjaya7880809,3187983,006659*

Hitung rata-rata:c1 = (80+90+75+89+95)/5 = 85,8(75+85+80+85+70)/5 = 79(75+80+70+75+75)/5 = 75c2 = (77+75+80+80+78)/5 = 78(78+88+75+80+80)/5 = 80,2(85+80+85+85+80)/5 = 83ABC

c185,87975

c27880,283

Tabel centroid perulangan ke-4

Perulangan ke-4Karena hasil centroid sama dengan centroid sebelumnya, maka iterasi berhenti.

9. DAFTAR PUSTAKAKusrini, M.Kom, Konsep dan Apikasi Sistem Pendukung Keputusan. Yogyakarta. Andi. 2007Muliadinata, Saban, 2013. Algoritma K-Means, (Online), (http://sharewy.blogspot.com/2013/04/algoritma-k-means- clustering.html). diakses 21 Februari 2015.Dita, Fadlika Nurjanto, 2013, Tahap-tahap K-Means, (Online),(https://fadlikadn.wordpress.com/2013/06/14/tahap-tahap-k-means-clustering/) . diakses 21 Februari 2015.Rahmawan, Ardian, 2015, Pembahasan K-Means Clustering, (Online),(http://ardianrahmawan.com/pembahasan-k-mean-clustering-data-mining-beserta-source-program/). diakses 21 Februari 2015.Adawiyah, Sariatul, 2014, Metode K-Means, (Online), (http://sariberbagiilmu.blogspot.com/2011/05/metode-k-means.html). diakses 21 Februari 2015.

Mulai

Menentukan banyaknya kluster (K)

Menentukan centroid (c)

Centroid berubah?

Menghitung jarak dari centroid

Ya

Mengelompokkan data berdasarkan jarak terdekat

End

Tidak