CLUSTERING DATA MAHASISWA BERDASARKAN ASAL ...eprints.umm.ac.id/65784/2/PENDAHULUAN.pdfyang tiada...
Transcript of CLUSTERING DATA MAHASISWA BERDASARKAN ASAL ...eprints.umm.ac.id/65784/2/PENDAHULUAN.pdfyang tiada...
CLUSTERING DATA MAHASISWA BERDASARKAN ASAL
DAERAH DAN ASAL SEKOLAH MENGGUNAKAN SELF
ORGANIZING MAP (SOM)
(Studi Kasus Teknik Informatika Universitas Muhammadiyah
Malang)
Skripsi
Diajukan Untuk Memenuhi
Persyaratan Guna Meraih Gelar Sarjana
Informatika Universitas Muhammadiyah Malang
ADITYA RIDHO PANGESTU
(201310370311026)
Bidang Minat
REKAYASA PERANGKAT LUNAK
PROGRAM STUDI INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2020
i
LEMBAR PERSETUJUAN
CLUSTERING DATA MAHASISWA BERDASARKAN ASAL
DAERAH DAN ASAL SEKOLAH MENGGUNAKAN SELF
ORGANIZING MAP (SOM)
(Studi Kasus Teknik Informatika Universitas Muhammadiyah
Malang)
Aditya Ridho Pangestu
201310370311026
Telah Direkomendasikan Untuk Diajukan Sebagai
Judul Tugas Akhir Di
Program Studi Informatika Universitas Muhammadiyah Malang
Menyetujui,
Dosen Pembimbing I Dosen Pembimbing II
Gita Indah Marthasari, S.Kom., M.Kom.
NIDN. 0720038101
Zamah Sari, S.T., M.T.
NIDN. 0708087701
ii
LEMBAR PENGESAHAN
CLUSTERING DATA MAHASISWA BERDASARKAN ASAL
DAERAH DAN ASAL SEKOLAH MENGGUNAKAN SELF
ORGANIZING MAP (SOM)
(Studi Kasus Teknik Informatika Universitas Muhammadiyah
Malang)
Tugas Akhir
Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1
Teknik Informatika Universitas Muhammadiyah Malang
Disusun Oleh :
Aditya Ridho Pangestu
201310370311026
Tugas Akhir ini telah diuji dan dinyatakan lulus melalui sidang majelis penguji
Pada tanggal 18 Juli 2020
Menyetujui,
Penguji I
Yufis Azhar, S.Kom., M.Kom
NIDN. 0728088701
Penguji II
Nur Hayatin, S.Kom., M.Kom
NIDN. 0726038402
Mengetahui,
Ketua Jurusan Teknik Informatika
Gita Indah Marthasari, S.T., M.Kom.
NIDN. 0720038101
iii
LEMBAR PERNYATAAN
Yang bertanda tangan di bawah ini:
Nama : Aditya Ridho Pangestu
Tempat/Tanggal Lahir : Sampit, 07 Mei 1996
NIM : 201310370311026
Fakultas/Jurusan : Teknik / Informatika
Dengan ini saya menyatakan bahwa Tugas Akhir dengan judul “CLUSTERING
DATA MAHASISWA BERDASARKAN ASAL DAERAH DAN ASAL
SEKOLAH MENGGUNAKAN SELF ORGANIZING MAP (SOM)” beserta
seluruh isinya adalah karya saya sendiri dan bukan merupakan karya tulis orang
lain, baik sebagaian maupun keseluruhan, kecuali dalam bentuk kutipan yang telah
disebutkan sumbernya.
Demikian surat pernyataan ini saya buat dengan sebenar-benarnya. Apabila
kemudian ditemukan adanya pelanggaran terhadap etika keilmuan dalam karya
saya ini atau ada klaim dari pihak lain terhadap keaslian karya saya ini, maka saya
siap menanggung segala bentuk resiko/sanksi yang berlaku.
Mengetahui
Dosen Pembimbing
Gita Indah Marthasari, S.T., M.T.
NIDN. 0720038101
Malang, 23 Juli 2020
Yang Membuat Pernyataan
(Aditya Ridho Pangestu)
iv
ABSTRAK
CLUSTERING DATA MAHASISWA BERDASARKAN ASAL
DAERAH DAN ASAL SEKOLAH MENGGUNAKAN SELF
ORGANIZING MAP (SOM)
Oleh :
Aditya Ridho Pangestu
201310370311026
Kelulusan tepat waktu mahasiswa merupakan salah satu permasalahan yang sulit
untuk diatasi oleh setiap pihak perguruan tinggi, begitu pula pada jurusan Teknik
Informatika Universitas Muhammadiyah Malang. Permasalahan ini harus segera
diatasi mengingat kualitas mahasiswa akan mempengaruhi sebuah akreditasi
perguruan tinggi maupun jurusan. Oleh karena itu, perlu dilakukan analisis daerah
mana saja yang memiliki potensi kelulusan tepat waktu mahasiswa Teknik
Informatika UMM. Penelitian ini menggunakan algoritma Self Organizing Map
(SOM) untuk melakukan clustering agar dapat menemukan daerah dan sekolah
mana saja yang memiliki estimasi peluang kelulusan tepat waktu mahasiswa.
Variabel bebas yang digunakan adalah asal daerah, asal sekolah, IPK dan masa
studi. Parameter terbaik untuk diimplementasikan pada data kelulusan pada tahun
2015 – 2018 adalah learning rate = 0.2,dan epoch = 500 dengan nilai Mean Square
Error (MSE) dari hasil kluster adalah = 0.0015480163214798585
Kata kunci: Self Organizing Map (SOM), kelulusan tepat waktu, data
mahasiswa, python
v
ABSTRACT
CLUSTERING DATA MAHASISWA BERDASARKAN ASAL
DAERAH DAN ASAL SEKOLAH MENGGUNAKAN SELF
ORGANIZING MAP (SOM)
Oleh :
Aditya Ridho Pangestu
201310370311026
Timely graduation of students is one of the problems that is difficult for every
university to overcome, as well as in the Department of Informatics, University of
Muhammadiyah Malang. This problem must be addressed immediately considering
the quality of students will affect an accreditation of higher education and majors.
Therefore, it is necessary to analyze which regions have the potential for timely
graduation of UMM Informatics Engineering students. This study uses the Self
Organizing Map (SOM) algorithm for clustering in order to find areas and schools
that have an estimated student graduation opportunity on time. The independent
variables used are regional origin, school origin, GPA and study period. The best
parameters to be implemented on graduation data in 2015-2018 are learning rate
= 0.2, and epoch = 500 with the Mean Square Error (MSE) value from the cluster
= 0.0015480163214798585
Keywords: Self Organizing Map (SOM), Timely graduation, student data, python
vi
LEMBAR PERSEMBAHAN
Penulis menyadari bahwa penyusunan dan pembuatan karya sederhana ini tidak
lepas dari bantuan berbagai pihak, oleh karena itu penulisan tugas akhir ini penulis
mengucapkan terima kasih kepada :
1. Allah Subhanahu Wa Ta’ala yang tiada henti memberikan rahmat dan hidayah-
Nya serta menerangi setiap langkah saya.
2. Orang Tua saya papah Rusdianto dan mamah Dewi serta keluarga besar saya
yang tiada kata-kata yang bisa menggambarkan rasa terima kasih atas do’a dan
pengorbanan yang telah diberikan serta dukungan moril dan materil.
3. Ibu Gita Indah Marthasari, S.T., M.Kom., selaku dosen pembimbing I dan
Bapak Zamah Sari, S.T., M.T., selaku dosen pembimbing II yang senantiasa
telah banyak memberikan pengarahan dan bimbingannya selama dalam
penyelesaian penulisan Tugas Akhir ini.
4. Seluruh Dosen yang terlah memberikan banyak ilmu dan pengalaman, beserta
Staff TU Jurusan Teknik Informatika
5. Seluruh teman-teman Teknik Informatika angkatan 2013 tercinta yang selalu
memberikan bantuan, doa, dan dukungan moril yang tak terhingga.
6. Kepada Pasukan di Basecamp D04 terutama Yoga Teleng dan seluruh teman-
temang yang saling mengingatkan untuk menyelesaikan skripsi ini.
7. Untuk sahabat yang tidak mempunyai akhlak cacul, kopet, agung di tinggal
nikah, ncus, lucky, teleng, osun, fikar, dimas GG, nadya tan, Iqbal, fiqry, reza,
nisa, budi. Yang telah menjadi seseorang yang selalu membantu melakukan
segala hal dan menjadi seseorang yang paling sering direpotkan dalam
perkuliahan maupun penyusunan skripsi ini.
8. Untuk Maharsy Tita Suryadewi yang sudah merepotkan saya selama ini,
terimakasih sudah memberikan dukungan secara moril. Semoga harapan yang
baik selalu menghampiri dan menyertai.
9. Untuk warung kopi yang membiarkan kami para pejuang skripsi yang telah
membiarkan kami mengerjakan skripsi walau warung kupi sudah tutup.
10. Teman-teman teknik informatika Angkatan 2013 tercinta yang tidak bisa
disebutkan satu persatu, kalian telah memberikan kenang-kenangan indah dan
menyenangkan selama perkuliahan.
vii
Semoga segala bantuan dan kebaikan tersebut mendapat balasan dari Allah
SWT. Penulis menyadari bahwa skripsi ini jauh dari sempurna dan masih banyak
kekurangan, oleh karena itu apabila ada kesalahan dalam penulisan skripsi ini
mohon dimaafkan. Penulis berharap semoga skripsi ini dapat bermanfaat bagi
pembaca.
“Percayalah, Allah Menggenggam Semua Do’a, Lalu
dilepaskannya Satu Persatu disaat yang Paling Tepat”
viii
KATA PENGANTAR
Assalamu’alaikum Warahmatullahi Wabarakatuh.
Dengan memanjatkan puji syukur kehadirat Allah SWT yang telah memberikan
rahmat dan hidayah-Nya kepada penulis sehingga dapat menyelesaikan skripsi
sebagai tugas akhir. Berkat limpahan nikmat dan karunia yang telah Allah SWT
berikan sehingga skripsi berjudul “CLUSTERING DATA MAHASISWA
BERDASARKAN ASAL DAERAH DAN ASAL SEKOLAH
MENGGUNAKAN SELF ORGANIZING MAP (SOM)” ini dapat
terselesaikan. Skripsi ini dimaksudkan untuk memenuhi persyaratan guna
memperoleh gelar sarjana S1 Universitas Muhammadiyah Malang.
Penulis menyadari bahwa sepenuhnya penulisan Tugas Akhir ini masih banyak
kekurangan, oleh karena itu penulis mengharapkan saran dan kritik agar tulisan
ini bermanfaat bagi pembaca maupun peneliti lainnya. Akhir kata penulis
mengucapkan terima kasih kepada semua pihak yang telah membantu sehingga
terselesaikannya tugas akhir ini.
Wassalamu’alaikum Warahmatullahi Wabarakatuh.
Malang, 23 Juli 2020
Aditya Ridho Pangestu
ix
DAFTAR ISI
LEMBAR PERSETUJUAN .................................................................................... i
LEMBAR PENGESAHAN .................................................................................... ii
LEMBAR PERNYATAAN ................................................................................... iii
ABSTRAK ............................................................................................................. iv
ABSTRACT .............................................................................................................. v
LEMBAR PERSEMBAHAN ................................................................................... vi
KATA PENGANTAR ......................................................................................... viii
DAFTAR ISI .......................................................................................................... ix
DAFTAR GAMBAR ............................................................................................ xii
DAFTAR TABEL ................................................................................................ xiii
DAFTAR SOURCE CODE ................................................................................. xiv
BAB I PENDAHULUAN ....................................................................................... 1
1.1. Latar Belakang ........................................................................... 1
1.2. Rumusan Masalah ...................................................................... 2
1.3. Tujuan Penelitian ....................................................................... 2
1.4. Cakupan Masalah....................................................................... 3
BAB II TINJAUAN PUSTAKA ............................................................................ 4
2.1. Penelitian Terdahulu .................................................................. 4
2.2. Self Organizing Map (SOM) ..................................................... 5
2.3. Data Mining ............................................................................... 6
2.4. Clustering ................................................................................... 6
2.5. Python ........................................................................................ 6
2.6. Kelulusan Mahasiswa ................................................................ 7
BAB III METODE PENELITIAN ......................................................................... 8
3.1. Studi Literatur ............................................................................ 8
x
3.2. Algoritma Self Organizing Map (SOM) .................................... 8
3.3. Parameter yang Digunakan SOM ............................................ 10
3.4. Analisa kebutuhan ................................................................... 12
3.2.1 Sumber data ........................................................................... 12
3.2.2 Kebutuhan perangkat (Hardware dan Software) ................... 12
3.5. Pengumpulan Data ................................................................... 13
3.6. Preprocessing data ................................................................... 14
3.7. Parameter pengujian SOM ....................................................... 14
3.8. Skenario pengujian .................................................................. 15
3.9. Pengujian ................................................................................. 15
BAB IV IMPLEMENTASI DAN PEMBAHASAN ............................................ 17
4.1. Preprocessing Data .................................................................. 17
4.2. Import Library ......................................................................... 18
4.3. Implementasi Algoritma SOM ................................................ 18
4.4.1 Mengimport dataset menjadi data frame kedalam spyder ..... 18
4.4.2 Proses Feature Scaling .......................................................... 19
4.4.3 Menentukan ukuran Grid SOM ............................................. 19
4.4.4 Pembentukan model SOM .................................................... 20
4.4.5 Visualisasi Peta SOM ............................................................ 20
4.4.6 Membuat Index SOM ............................................................ 22
4.4.7 Ekstrasi Data SOM ................................................................ 24
4.4. Pengujian ................................................................................. 25
4.5. Hasil Evaluasi .......................................................................... 28
4.6. Analisis dan interpretasi hasil .................................................. 29
BAB V Hasil dan Saran ........................................................................................ 30
5.1. Hasil ......................................................................................... 30
xi
5.2. Saran ........................................................................................ 30
DAFTAR PUSTAKA ........................................................................................... 31
LAMPIRAN .......................................................................................................... 34
xii
DAFTAR GAMBAR
Gambar 2. 1 Arsitektur SOM [7] ............................................................................. 5
Gambar 3. 1 Struktur SOM dengan input dan output layer[21]........................... 10
Gambar 3. 2 Flowchart Self Organizing Map (SOM) ........................................... 11
Gambar 4. 4 Dataset Mahasiswa ........................................................................... 19
Gambar 4. 5 Dataset yang sudah di Scaling.......................................................... 19
Gambar 4. 6 Hasil Visualisasi Peta SOM ............................................................. 21
Gambar 4. 7 Hasil Visualisasi Peta SOM dengan Marker .................................... 22
Gambar 4. 8 Isi variabel indeks_som .................................................................... 23
Gambar 4. 9 Isi variabel idx .................................................................................. 24
Gambar 4. 10 Isi variabel result_map ................................................................... 24
Gambar 4. 11 isi variabel frauds ........................................................................... 25
Gambar 4. 1 Grafik pengujian 1 ........................................................................... 27
Gambar 4. 2 Grafik pengujian 2 ........................................................................... 27
Gambar 4. 3 Grafik pengujian 3 ........................................................................... 28
xiii
DAFTAR TABEL
Tabel 2. 1 Penelitian Terdahulu .................................................................. 4
Tabel 3. 1 Contoh Parameter Input (𝒙) ...................................................... 10
Tabel 3. 2 Gambaran Data Penelitian ........................................................ 13
Tabel 3. 3 Kategori Masa Studi ................................................................. 13
Tabel 3. 4 keterangan Index Prestasi Komulatif ....................................... 14
Tabel 3. 5 Skenario pengujian ................................................................... 15
Tabel 4. 1 Data mahasiwa yang lulus pada tahun 2015-2018 ................... 17
Tabel 4. 2 Dataset yang sudah di cleaning ................................................ 17
Tabel 4. 3 Dataset yang sudah di labeling ................................................. 18
Tabel 4. 4 Setelah diproses Labeling ......................................................... 25
Tabel 4. 5 Hasil nilai MSE untuk setiap pengujian ................................... 26
xiv
DAFTAR SOURCE CODE
Source Code 4. 1 Import Library .............................................................. 35
Source Code 4. 2 Import Dataset .............................................................. 35
Source Code 4. 3 Proses Feature Scaling .................................................. 35
Source Code 4. 4 Ukuran Grid SOM ........................................................ 35
Source Code 4. 5 Pembetukan Model SOM ............................................. 35
Source Code 4. 6 Pemilihan warna peta som ............................................ 35
Source Code 4. 7 Visualisasi Peta SOM ................................................... 36
Source Code 4. 8 Membuat indeks_som ................................................... 36
Source Code 4. 9 Menentukan berapa banyak cell sebagai outlier ........... 36
Source Code 4. 10 Ekstrasi Data ............................................................... 37
Source Code 4. 11 Proses Invers Transform ............................................. 37
Source Code 4. 12 Pengujian .................................................................... 37
31
DAFTAR PUSTAKA
[1] R. Puspita, S. Putri, I. Waspada, D. Ilmu, K. Informatika, and F. Sains,
“khazanah informatika Penerapan Algoritma C4 . 5 pada Aplikasi Prediksi
Kelulusan Mahasiswa Prodi Informatika,” pp. 1–7.
[2] Risnawati, “Analisis Kelulusan Mahasiswa Menggunakan Algoritma C.45,”
J. Mantik Penusa, vol. 2, no. 1, pp. 71–76, 2018.
[3] I. K. P. Suniantara and M. Rusli, “KLASIFIKASI WAKTU KELULUSAN
MAHASISWA STIKOM BALI MENGGUNAKAN CHAID
REGRESSION – TREES DAN REGRESI LOGISTIK BINER,” vol. 5, no.
1, 2017.
[4] I. K. P. Suniantara, “Analisis Clasification and Regression Trees ( CART )
pada Lama Studi Mahasiswa STIKOM BALI,” in SENAPATI 2016, 2016,
pp. 30–34.
[5] G. Q. O. P. Khoirul Umam, Fidi Wincoko Putro, “Segmentasi pada Citra
Panoramik Gigi dengan Metode Two-Stage SOM dan T-CLUSTER,” vol.
VI, no. 1, pp. 7–13, 2014.
[6] S. H. Isnaeni, “ANALISIS KELOMPOK FAKTOR-FAKTOR
KEMISKINAN DAN KESENJANGAN PEREKONOMIAN
MENGGUNAKAN ALGORITMA SELF ORGANIZING MAPS,” vol. 3,
no. 1, pp. 40–48, 2018.
[7] A. Primawati, “PENENTUAN CEPAT STATUS KELULUSAN
MATAKULIAH MENGGUNAKAN JARINGAN SYARAF TIRUAN
SELF ORGANIZING MAPS ( SOM ) KOHONEN,” vol. 4, no. 1, pp. 11–
18, 2017.
[8] R. Nastiti, “Perbandingan Hasil Algoritma Self Organizing Map ( SOM ) dan
Fuzzy C-Means Clustering Untuk Kualifikasi Data Kinerja Dosen,” vol. 3,
no. 2, pp. 15–21, 2018.
[9] A. Self and O. Maps, “1 , 2 , 3 1,” vol. 4, no. 1994, pp. 53–60, 2015.
[10] G. Munawar and K. Kunci, “Implementasi Algoritma Self Organizing Map
( SOM ) untuk Clustering Mahasiswa pada Matakuliah Proyek ( Studi
Kasus : JTK POLBAN ),” 2015.
[11] V. Suryaningsih and S. W. Sihwi, “CLUSTERING DOKUMEN
32
MENGGUNAKAN ALGORITMA SELF- ORGANIZING MAP ( SOM ) (
STUDI KASUS : DOKUMEN SKRIPSI DI FAKULTAS PERTANIAN
UNS ),” pp. 1–11.
[12] J. Apostolakis, An introduction to data mining, vol. 134. 2010.
[13] W. Lestari, “Kecerdasan majemuk mahasiswa menggunakan algoritma,”
vol. 1, pp. 53–58, 2014.
[14] M. I. Ghozali, R. Z. Ehwan, and W. H. Sugiharto, “Analisa Pola Belanja
Menggunakan Algoritma Fp Growth, Self Organizing Map (Som) Dan K
Medoids,” Simetris J. Tek. Mesin, Elektro dan Ilmu Komput., vol. 8, no. 1,
pp. 317–326, 2017, doi: 10.24176/simet.v8i1.995.
[15] C. N. Dengen and E. T. Luthfi, “Penentuan Association Rule Pada Kelulusan
Mahasiswa Menggunakan Algoritma Apriori,” vol. 3, no. 1, pp. 20–29, 2019.
[16] N. N. Halim and E. Widodo, “Clustering Dampak Gempa Bumi di Indonesia
Menggunakan Kohonen Self Organizing Maps,” Semin. Nas. Integr. Mat.
dan Nilai Islam., vol. 1, no. 1, pp. 188–194, 2017.
[17] H. Silalahan, “Implementasi Metode Clustering Partitional Menentukan Item
Slow Moving dan Fast Moving Pada Persediaan Barang ( Studi Kasus PT .
SAT ),” vol. 6, no. 2, pp. 171–177, 2019.
[18] N. M. D. K. P. Komang Setia Buana, “DETEKSI GERAKAN KEPALA
DAN KEDIPAN MATA DENGAN HAAR CASCADE CLASSIFIER
CONTOUR DAN MORFOLOGI DALAM PENGOPERASIAN
KOMPUTER UNTUK KAUM DIFABLE,” vol. IV, no. 1, 2018.
[19] J. S. Informasi, “Aplikasi untuk pengoprasian komputer dengan mendeteksi
gerakan menggunakan opencv python,” pp. 189–194, 2018.
[20] Tim Penusun Panduan Akademik UMM, Panduan Akademik Universitas
Muhammadiyah Malang, 2018/2019. Malang: UMM.
[21] M. Edy Susanto, “CLUSTERING DATA MAHASISWA
MENGGUNAKAN METODE SELF ORGANIZING MAPS UNTUK
MENENTUKAN STRATEGI PROMOSI UNIVERSITAS
KANJURUHAN MALANG,” J. Chem. Inf. Model., vol. 53, no. 9, pp. 1689–
1699, 2019.
[22] D. Winalda, “PENGUJIAN DAN IMPLEMENTASI SELF-ORGANIZING
33
MAP PADA STUDI KASUS PARIWISATA TESTING AND
IMPLEMENTATION OF SELF- ORGANIZING MAP ON TOURISM
CASE STUDY,” vol. 4, no. 2, pp. 3235–3242, 2017.
34