ANALISA NILAI UJIAN MASUK STT WASTUKANCANA BERDASARKAN NILAI UJIAN NASIONAL MENGGUNAKAN METODE...
Click here to load reader
-
Upload
teknik-informatika-politeknik-tedc-bandung -
Category
Data & Analytics
-
view
198 -
download
0
Transcript of ANALISA NILAI UJIAN MASUK STT WASTUKANCANA BERDASARKAN NILAI UJIAN NASIONAL MENGGUNAKAN METODE...
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016
189
ISSN : 2503-2844
Muhammad Rafi Muttaqin
Seminar Nasional Telekomunikasi dan Informatika 2016
ANALISA NILAI UJIAN MASUK STT WASTUKANCANA
BERDASARKAN NILAI UJIAN NASIONAL MENGGUNAKAN
METODE BACKPROPAGATION
Muhammad Rafi Muttaqin
Program Studi Teknik Informatika
STT Wastukancana
Jl. Raya Cikopak No.53, Sadang, Purwakarta
Abstrak
Sekolah Tinggi Teknologi (STT) Wastukancana
melaksanakan proses seleksi masuk pada calon
mahasiswanya. Proses seleksi ini berdasarkan hasil
ujian saringan masuk yang selalu diadakan setiap
tahun. Salah satu syarat dokumen yang harus
dilampirkan dalam pendaftaran adalah dokumen nilai
Ujian Nasional (UN) yang terdiri dari nilai mata
pelajaran Bahasa Indonesia, Bahasa Inggris, dan
Matematika. Dari latar belakang tersebut, maka
dibuat penelitian untuk mengetahui apakah nilai hasil
ujian saringan masuk mempunyai korelasi atau
hubungan dengan nilai UN yang didapatkan calon
mahasiswa tesebut. Jika korelasi yang dihasilkan
memiliki nilai yang tinggi, maka dapat diperkiran
berapa nilai ujian saringan masuk berdaarkan nilai
UN calon mahasiswa. Algoritma yang digunakan
untuk penelitian ini adalah algoritma
Backpropagation. Algoritma ini merupakan salah
satu dari algoritma Jaringan Syaraf Tiruan (JST).
Pembagian data latih dan data uji menggunakan
metode k-fold cross validation. Hasil yang diperoleh
dalam penelitian ini adalah nilai Root Mean Square
Error (RMSE) yang terendah dan nilai akurasi yang
tertinggi dihasilkan oleh kombinasi hidden layer 9
dan epoch 500 dengan rataan nilai RMSE sebesar
8,8 dan nilai akurasi sebesar 91,2.
Kata kunci : Backpropagation, K-fold Cross
Validation, Epoch
Abstract
Sekolah Tinggi Teknologi (STT) Wastukancana
implement the admission process to potential
students. The selection process is based on the results
of the entrance examination which is always held
every year. One of the requirements document that
must be attached to the application is a document of
the National Examination (UN), which consists of the
value of Indonesian Language, English, and
Mathematics. From this background, it made a study
to determine whether the value of the results of the
entrance examination has a correlation or
relationship with UN values obtained prospective
student proficiency level. If the correlation is
produced has a high value, it can been anticipated
how much the value of the entrance examination
based on the examination prospective students. The
algorithm used for this study is the Backpropagation
algorithm. This algorithm is one of the algorithms
Artificial Neural Network (ANN). Sharing of training
data and test data using methods k-fold cross
validation. The results obtained in this study is the
value Root Mean Square Error (RMSE) of the lowest
and highest accuracy value generated by a
combination of hidden layers 9 and epoch 500 with
the average value of RMSE is 8.8 and accuracy value
is 91.2.
Keywords : Backpropagation, K-fold Cross
Validation, Epoch
I. PENDAHULUAN
Proses ujian masuk setiap tahun ajaran baru
menjadi agenda rutin pada Sekolah Tinggi Teknik
Wastukanacana. Ujian masuk ini bertujuan untuk
menyaring calon mahasiswa terbaik yang akan
menempuh studi di STT Wastukancana. Setiap calon
mahasiswa diwajibkan melampirkan nilai ujian
nasional (UN) yang mereka tempuh untuk lulus
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016
190
ISSN : 2503-2844
Muhammad Rafi Muttaqin
Seminar Nasional Telekomunikasi dan Informatika 2016
sekolah menengah atas. Dengan demikian, data nilai
UN dan hasil nilai ujian masuk STT tersedia setiap
tahunnya.
Dengan tersedianya data nilai UN dan hasil
ujian masuk STT, maka dapat dibuat pemodelan
untuk memprediksi nilai hasil ujian masuk
berdasarkan nilai UN calon mahasiswa. Apakah nilai
UN memiliki pengaruh yang cukup besar dalam
menentukan hasil nilai ujian masuk STT.
Metode yang digunakan untuk memprediksi
nilai ujian dengan metode Jaringan Saraf Tiruan
Propagasi Balik (Backpropagation). Data yang
digunakan sebanyak 100 mahasiswa pada tahun
masuk 2013 program studi Teknik Informatika.
Pembagian data latih dan data uji menggunakan
metode K-fold Cross Validation. Penelitian yang
sejenis dilaksananakan oleh Yunanti (2010) untuk
memprediksi prestasi siswa SMU dengan Metode
Backpropagation. Yunanti (2010) memakai 50 data
untuk dilatih menggunakan algoritma
backpropagation dan untuk penelitian ini memakai
100 data calon mahasiswa untuk dilatih
menggunakan algoritma tersebut. Hidden layer yang
digunakan dalam penelitian terdahulu (Yunanti,
2010) menggunakan 1 buah hidden layer sedangkan
dalam penelitian ini menggunakan kombinasi jumlah
hidden layer sebanyak 3, 6, dan 9 buah.
Ruang lingkup penelitian ini adalah sebagai
berikut :
1. Proses pelatihan untuk jaringan syaraf tiruan
menggunakan metode backpropagation,
2. Data yang digunakan sebanyak 100 calon
mahasiswa pada tahun masuk 2013,
3. Data yang dilatih dan diuji adalah data nilai
UN sebagai masukan dan data hasil nilai
ujian masuk sebagai hasil keluaran,
4. Pembagian data yang dilakukan
menggunakan metode 5-fold cross
validation.
Hasil yang diperoleh merupakan Root Mean Square
Error (RMSE) dan nilai akurasinya.
Tujuan dari penelitian ini yaitu mendapatkan
model terbaik yang dapat digunakan untuk
memprediksi hasil nilai ujian masuk berdasarkan
nilai UN. Sedangkan manfaat dari penelitian ini
adalah dapat memprediksi nilai hasil ujian masuk
berdasarkan nilai UN.
II. KAJIAN LITERATUR
II.1 Jaringan Saraf Tiruam (JST)
Backpropagation
JST Propagasi balik merupakan JST yang
mempunyai topologi multilayer (multi-lapis) dengan
lapis input (lapis X) , satu atau lebih lapisan hidden
(lapis Z) dan satu lapis output (lapis Y) (Siang, 2005).
Setiap lapis memiliki neuron-neuron yang
dimodelkan dengan lingkaran (lihat gambar 1). Di
antara neuron pada satu lapis dengan neuron pada
lapis berikutnya dihubungkan dengan koneksi yang
memiliki bobot-bobot (weights), w dan v. Lapis
tersembunyi dapat memiliki bias, yang memiliki
bobot sama dengan satu.
II.2 Algoritma Pelatihan JST Backpropagation
Algoritma pelatihan JST propagasi balik
(backpropagation) pada dasarnya dapat dibagi
menjadi dua langkah, yaitu: langkah maju
(feedforward) dan propagasi balik (back
propagation) (Siang, 2005). Pada langkah maju,
perhitungan bobot-bobot neuron hanya didasarkan
pada vektor masukan, sedangkan pada propagasi
balik, bobot-bobot diperhalus dengan cara
memperhitungkan nilai dari target atau keluaran.
Algoritma ini dapat dilihat pada gambar 2.
Gambar 1. Jaringan saraf tiruan Backpropagation
dengan satu hidden layer (Mei-Ling, 2012)
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016
191
ISSN : 2503-2844
Muhammad Rafi Muttaqin
Seminar Nasional Telekomunikasi dan Informatika 2016
Gambar 2. Algoritma pelatihan backpropagation
II.3 K-fold Cross Validation
K-fold cross validation dilakukan untuk membagi
training set dan test set. K-fold cross validation
mengulang k-kali untuk membagi sebuah himpunan
contoh secara acak menjadi k subset yang saling
bebas, setiap ulangan disisakan satu subset untuk
pengujian dan subset lainnya untuk pelatihan
(Refaeilzadeh, Tang, & Liu, 2007).
II.4 Root Mean Square Error (RMSE)
Root Mean Square Error (RMSE) adalah
bertujuan untuk mempresentasikan rata-rata kuadrat
simpangan (selisih) antara nilai keluaran model
terhadap nilai pengukuran atau target.Untuk menilai
ketepatan peramalan tersebut maka perlu
diperbandingkan RMSE dengan peramalan lain yang
memakai rata-rata berjalan dengan periode-periode
berbeda (Shcherbakov et al, 2013). Rumus RMSE
dapat dilihat pada rumus 1.
𝐑𝐌𝐒𝐄 = √∑(𝐀𝐭 − 𝐅𝐭)𝟐
𝐧
Keterangan :
RMSE : Root Mean Square Error
At : aktual
Ft : hasil prediksi / forecast
III. METODOLOGI PENELITIAN
Metodologi yang digunakan dalam penelitian
ini dapat dilihat pada Gambar 3.
Gambar 3. Metodologi Penelitian
… [1]
Narasi:Melatih JST dengan data pelatihan(berupa
vektor atau record tabel) yang diberikan
sampai bobot-bobot tidak berubah lagi
(atau dicapai kondisi konvergen).
Input : Set data pelatihan, jumlah lapis, jumlah
neuron, learning rate, epsilon
Output : Model JST yang siap untuk
mengklasifikasi data (vektor) baru.
Algoritma :
(1) Menginisialisasi bobot awal dengan nilai acak
yang sangat kecil, hitung MSE dan ∆MSE
inisialisasi.
(2) Selama ∆MSE > epsilon lakukan:
(3) Untuk setiap tupple pada set data pelatihan
lakukan
Feedforward:
(4) Setiap unit masukan (Xi, i=1…n) menerima
vektor masukan Xi dan mengirimkan vektor ini
ke seluruh unit pada lapis diatasnya (hidden
layer).
(5) Setiap unit hidden (zj, j=1…p)
menjumlahkan bobot dari vektor masukan
:z_inj = 𝑣0𝑗 + ∑ 𝑥𝑖𝑣𝑖𝑗𝑛𝑖=1
Hitung keluaran fungsi aktivasi : zj =
f(z_inj).
Kirimkan vektor ini ke unit-unit pada lapis
diatasnya (lapis keluaran)
(6) Setiap unit keluaran (Yk, k=1…m)
menjumlahkan vektor masukan
Y_ink = 𝑤0𝑘 + ∑ 𝑧𝑖𝑤𝑗𝑘𝑝𝑗=1
Hitung keluaran dari fungsi aktivasi :
yk = f(y_ink)
Propagasi balik dari error:
(7) Setiap unit keluaran (Yk, k=1…m)
menerima vektor hasil yang diinginkan (tk)
untuk data masukan tersebut, hitung error-
nya (𝑡𝑘 − 𝑦𝑘): 𝛿𝑘 = (𝑡𝑘 − 𝑦𝑘)𝑓′(y_ink)
Hitung nilai koreksi bobotnya dengan α
sebagai learning ratenya: ∆𝑤𝑗𝑘 = 𝛼𝛿𝑘𝑧𝑗
Hitung nilai koreksi biasnya: ∆𝑤0𝑘 = 𝛼𝛿𝑘
Kirimkan 𝛿𝑘 ke unit pada lapis dibawahnya.
(8) Setiap unit hidden (Zj, j=1…p)
menjumlahkan delta masukannya (dari unit-
unit pada lapis diatasnya): 𝛿_𝑖𝑛𝑗 = ∑ 𝛿𝑘𝑤𝑗𝑘𝑚𝑘=1
Kalikan dengan turunan dari fungsi
aktivasinya untuk menghitung errornya: 𝛿𝑗 =
𝛿_𝑖𝑛𝑗𝑓′(𝑧_𝑖𝑛𝑗) Hitung nilai koreksi bobotnya:
∆𝑣𝑖𝑗 = 𝛼𝛿𝑗𝑥𝑖 Hitung nilai koreksi biasnya:
∆𝑣0𝑗 = 𝛼𝛿𝑗
Perbaharui bobot dan bias:
(9) Setiap unit keluaran (Yk, k=1…m)
memperbaharui bias dan bobotnya (j=0…p).
𝑤𝑗𝑘(𝑛𝑒𝑤) = 𝑤𝑗𝑘(𝑜𝑙𝑑) + ∆𝑤𝑗𝑘
Setiap unit tersembunyi (Zj, j=1…p)
memperbaharui bias dan bobotnya (i=0…n).
𝑣𝑖𝑗(𝑛𝑒𝑤) = 𝑣𝑖𝑗(𝑜𝑙𝑑) + ∆𝑣𝑖𝑗
MSEold = MSE. Hitung MSE, ∆MSE = MSE –
MSEold
(10) Uji kondisi berhentinya
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016
192
ISSN : 2503-2844
Muhammad Rafi Muttaqin
Seminar Nasional Telekomunikasi dan Informatika 2016
Pengumpulan Data
Data yang dikumpulkan didapatkan dari bagian
Tata Laksana STT Wastukancana Purwakarta yaitu
berupa arsip data nilai UN dan nilai hasil ujian masuk
STT Wastukancana pada tahun 2013. Diambil 100
data yang memiliki nilai yang lengkap, yaitu data
yang terdapat nilai UN dan nilai hasil ujian masuk.
Setelah data terkumpul, maka data dilakukan
pembagian untuk menjadi data latih dan data uji
menggunakan 5-fold cross validation. Pembagian
data menggunakan 5-fold cross validation dapat
dilihat pada Tabel 1. Untuk daftar pembagian data
latih dan data uji dapat dilihat pada Tabel 2.
Tabel 1. Pembagian Kelompok 5-fold cross validation.
No Kel
1 – 20 I
21 – 40 II
41 – 60 III
61 – 80 IV
81 – 100 V
Tabel 2. Pembagian Data Latih dan Data Uji
Data Latih Data Uji
I, II, III, IV V
I,II,III,V IV
I,II,IV,V III
I,III,IV,V II
II,III,IV,V I
IV. HASIL DAN PEMBAHASAN
Dalam pelatihan algoritman backpropagation
ini akan ditentukan dua buah parameter yang terdapat
peluang akan menghasilkan model yang berbeda
antar satu dengan yang lainnya. Dua buah parameter
tersebut adalah hidden layer dan epoch. Hidden layer
yang digunakan adalah sebanyak 3, 6, dan 9 buah
hidden layer, sedangkan epoch yang digunakan
adalah sebanyak 100, 500, dan 1000 kali epoch.
Untuk proses pelatihan, dilakukan dengan
mengkombinasikan kedua parameter tesebut untuk
setiap fold. Dengan demikian pelatihan JST yang
akan dilakukan sebanyak 45 kali uji coba. Karena
jika setiap menjalankan pelatihan JST akan
menghasilkan model yang berbeda, maka untuk
setiap kombinasi dilakukan 5 kali percobaan,
sehingga hasil yang akan diambil nanti merupakan
rataan dari 5 kali percobaan tersebut. Jadi total
pelatihan yang dilakukan sebanyak 225 kali
percobaan.
Pengujian
Setelah proses pelatihan dilakukan maka,
dihasilkan sebuah model JST. Dengan model tersebut
akan dilakukan proses pengujian menggunakan data
uji yang telah dibagi sesuai dengan proses pembagian
5- fold cross validation. Sebagai contoh untuk
pelatihan model JST dengan menggunakan fold ke-1
maka yang menjadi data latih adalah kelompok
I,II,III dan IV, sedangkan kelompok V menjadi data
uji untuk model yang telah dihasilkan oleh fold ke-1
tersebut. Begitu seterusnya sehingga semua
percobaan dilakukan.
Hasil yang diperoleh dari proses pengujian adalah
berupa nilai prediksi berdasarkan model yang
dihasilkan tersebut. Hasil prediksi tersebut akan
dibandingkan dengan hasil real yang diperoleh dari
data awal. Sehingga dapat dihitung berapa nilai
errornya dan nilai akurasinya. Nilai error dihitung
dengan rumus (1). Nilai akurasi dihitung dengan
rumus 100- RMSE.
Dari setiap kombinasi percobaan akan diulang
sebanyak 5 kali, dikarenakan setiap pengujian yang
dilakukan akan memperoleh hasil yang berbeda. Hal
ini disebabkan ada beberapa parameter yang
ditentukan program secara acak, dari 5 kali
percobaan tersebut akan diambil nilai rataan untuk
akurasi dan RMSE seperti pada Tabel 3. Untuk setiap
kombinasi percobaan yang telah dilakukan dapat
dilihat pada Tabel 4.
Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016
193
ISSN : 2503-2844
Muhammad Rafi Muttaqin
Seminar Nasional Telekomunikasi dan Informatika 2016
Tabel 3. Percobaan hidden layer 3 dan epoch 100
No RMSE Akurasi
1 8,9 91,1
2 9,1 90,9
3 8,9 91,1
4 8,9 91,1
5 8,7 91,3
Rataan 8,9 91,1
Tabel 4. Hasil rataan dari setiap kombinasi
No Hidden
Layer Epoch
rata-rata
Rmse
Rata-rata
Akurasi
1 3 100 8.9 91.1
2 3 500 8.9 91.1
3 3 1000 9.1 90.9
4 6 100 9.1 90.9
5 6 500 9.0 91.0
6 6 1000 8.9 91.1
7 9 100 9.1 90.9
8 9 500 8.8 91.2
9 9 1000 9.1 90.9
V. KESIMPULAN DAN SARAN
Kesimpulan
Dari seluruh percobaan yang telah dilakukan,
maka dapat disimpulkan bahwa nilai RMSE paling
rendah dan nilai akurasi tertinggi dihasilkan oleh
kombinasi hidden layer 9 dan epoch 500 dengan
rataan nilai RMSE sebesar 8,8 dan nilai akurasi
sebesar 91,2. Dengan demikian jika ingin
memprediksi suatu nilai ujian masuk berdasarkan
nilai NEM, dapat digunakan modal pelatihan JST
dengan menggunakan parameter hidden layer
sebanyak 9 buah dan nilai epoch sebanyak 500.
Saran
Untuk perolehan nilai akurasi yang lebih baik
diperlukan data latih yang lebih banyak dari pada
yang digunakan dalam penelitian ini. Hal ini
dikarenakan pada pemodelan JST itu dilakukan
proses pelatihan sehingga dengan banyaknya data
latih maka model yang dihasilkan akan lebih baik.
Pemodelan JST juga dapat digunakan untuk
memprediksi masalah lain selama ada data untuk
input dan outputnya.
REFERENSI
Yunanti, F. (2010). Aplikasi Jaringan Saraf Tiruan
Untuk Memprediksi Prestasi Siswa SMU
Dengan Metode Backpropagation. Digital
Library UIN Sunan Kalijaga.
Siang Jong Jek. (2005). Jaringan Syaraf Tiruan &
Pemrograman Mengunakan MATLAB. Andi
: Yogyakarta.
Mei-Ling Huang & Yung-Yang Hsu. (2012). Fetal
Distress Prediction Using Discriminant
Analysis, Decision Tree, and Artificial
Neural Network. Journal of Biomedical
Science and Engineering, Vol 5, No.9.
Refaeilzadeh, P., Lei Tang, Huan Liu. (2007). On
Comparison of Feature Selection Algorithm.
Association for the Advancement of
Artificial Intellgence.
Shcherbakov, M. V., Brebels, A., Shcherbakova, N.
L., Tyukov, A. P., Janovsky, T. A., &
Kamaev, V. A. (2013). A Survey of Forecast
Error Measures. World Applied Sciences
Journal 24.