ANALISA NILAI UJIAN MASUK STT WASTUKANCANA BERDASARKAN NILAI UJIAN NASIONAL MENGGUNAKAN METODE...

5

Click here to load reader

Transcript of ANALISA NILAI UJIAN MASUK STT WASTUKANCANA BERDASARKAN NILAI UJIAN NASIONAL MENGGUNAKAN METODE...

Page 1: ANALISA NILAI UJIAN MASUK STT WASTUKANCANA BERDASARKAN NILAI UJIAN NASIONAL MENGGUNAKAN METODE BACKPROPAGATION

Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016

189

ISSN : 2503-2844

Muhammad Rafi Muttaqin

Seminar Nasional Telekomunikasi dan Informatika 2016

ANALISA NILAI UJIAN MASUK STT WASTUKANCANA

BERDASARKAN NILAI UJIAN NASIONAL MENGGUNAKAN

METODE BACKPROPAGATION

Muhammad Rafi Muttaqin

Program Studi Teknik Informatika

STT Wastukancana

Jl. Raya Cikopak No.53, Sadang, Purwakarta

[email protected]

Abstrak

Sekolah Tinggi Teknologi (STT) Wastukancana

melaksanakan proses seleksi masuk pada calon

mahasiswanya. Proses seleksi ini berdasarkan hasil

ujian saringan masuk yang selalu diadakan setiap

tahun. Salah satu syarat dokumen yang harus

dilampirkan dalam pendaftaran adalah dokumen nilai

Ujian Nasional (UN) yang terdiri dari nilai mata

pelajaran Bahasa Indonesia, Bahasa Inggris, dan

Matematika. Dari latar belakang tersebut, maka

dibuat penelitian untuk mengetahui apakah nilai hasil

ujian saringan masuk mempunyai korelasi atau

hubungan dengan nilai UN yang didapatkan calon

mahasiswa tesebut. Jika korelasi yang dihasilkan

memiliki nilai yang tinggi, maka dapat diperkiran

berapa nilai ujian saringan masuk berdaarkan nilai

UN calon mahasiswa. Algoritma yang digunakan

untuk penelitian ini adalah algoritma

Backpropagation. Algoritma ini merupakan salah

satu dari algoritma Jaringan Syaraf Tiruan (JST).

Pembagian data latih dan data uji menggunakan

metode k-fold cross validation. Hasil yang diperoleh

dalam penelitian ini adalah nilai Root Mean Square

Error (RMSE) yang terendah dan nilai akurasi yang

tertinggi dihasilkan oleh kombinasi hidden layer 9

dan epoch 500 dengan rataan nilai RMSE sebesar

8,8 dan nilai akurasi sebesar 91,2.

Kata kunci : Backpropagation, K-fold Cross

Validation, Epoch

Abstract

Sekolah Tinggi Teknologi (STT) Wastukancana

implement the admission process to potential

students. The selection process is based on the results

of the entrance examination which is always held

every year. One of the requirements document that

must be attached to the application is a document of

the National Examination (UN), which consists of the

value of Indonesian Language, English, and

Mathematics. From this background, it made a study

to determine whether the value of the results of the

entrance examination has a correlation or

relationship with UN values obtained prospective

student proficiency level. If the correlation is

produced has a high value, it can been anticipated

how much the value of the entrance examination

based on the examination prospective students. The

algorithm used for this study is the Backpropagation

algorithm. This algorithm is one of the algorithms

Artificial Neural Network (ANN). Sharing of training

data and test data using methods k-fold cross

validation. The results obtained in this study is the

value Root Mean Square Error (RMSE) of the lowest

and highest accuracy value generated by a

combination of hidden layers 9 and epoch 500 with

the average value of RMSE is 8.8 and accuracy value

is 91.2.

Keywords : Backpropagation, K-fold Cross

Validation, Epoch

I. PENDAHULUAN

Proses ujian masuk setiap tahun ajaran baru

menjadi agenda rutin pada Sekolah Tinggi Teknik

Wastukanacana. Ujian masuk ini bertujuan untuk

menyaring calon mahasiswa terbaik yang akan

menempuh studi di STT Wastukancana. Setiap calon

mahasiswa diwajibkan melampirkan nilai ujian

nasional (UN) yang mereka tempuh untuk lulus

Page 2: ANALISA NILAI UJIAN MASUK STT WASTUKANCANA BERDASARKAN NILAI UJIAN NASIONAL MENGGUNAKAN METODE BACKPROPAGATION

Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016

190

ISSN : 2503-2844

Muhammad Rafi Muttaqin

Seminar Nasional Telekomunikasi dan Informatika 2016

sekolah menengah atas. Dengan demikian, data nilai

UN dan hasil nilai ujian masuk STT tersedia setiap

tahunnya.

Dengan tersedianya data nilai UN dan hasil

ujian masuk STT, maka dapat dibuat pemodelan

untuk memprediksi nilai hasil ujian masuk

berdasarkan nilai UN calon mahasiswa. Apakah nilai

UN memiliki pengaruh yang cukup besar dalam

menentukan hasil nilai ujian masuk STT.

Metode yang digunakan untuk memprediksi

nilai ujian dengan metode Jaringan Saraf Tiruan

Propagasi Balik (Backpropagation). Data yang

digunakan sebanyak 100 mahasiswa pada tahun

masuk 2013 program studi Teknik Informatika.

Pembagian data latih dan data uji menggunakan

metode K-fold Cross Validation. Penelitian yang

sejenis dilaksananakan oleh Yunanti (2010) untuk

memprediksi prestasi siswa SMU dengan Metode

Backpropagation. Yunanti (2010) memakai 50 data

untuk dilatih menggunakan algoritma

backpropagation dan untuk penelitian ini memakai

100 data calon mahasiswa untuk dilatih

menggunakan algoritma tersebut. Hidden layer yang

digunakan dalam penelitian terdahulu (Yunanti,

2010) menggunakan 1 buah hidden layer sedangkan

dalam penelitian ini menggunakan kombinasi jumlah

hidden layer sebanyak 3, 6, dan 9 buah.

Ruang lingkup penelitian ini adalah sebagai

berikut :

1. Proses pelatihan untuk jaringan syaraf tiruan

menggunakan metode backpropagation,

2. Data yang digunakan sebanyak 100 calon

mahasiswa pada tahun masuk 2013,

3. Data yang dilatih dan diuji adalah data nilai

UN sebagai masukan dan data hasil nilai

ujian masuk sebagai hasil keluaran,

4. Pembagian data yang dilakukan

menggunakan metode 5-fold cross

validation.

Hasil yang diperoleh merupakan Root Mean Square

Error (RMSE) dan nilai akurasinya.

Tujuan dari penelitian ini yaitu mendapatkan

model terbaik yang dapat digunakan untuk

memprediksi hasil nilai ujian masuk berdasarkan

nilai UN. Sedangkan manfaat dari penelitian ini

adalah dapat memprediksi nilai hasil ujian masuk

berdasarkan nilai UN.

II. KAJIAN LITERATUR

II.1 Jaringan Saraf Tiruam (JST)

Backpropagation

JST Propagasi balik merupakan JST yang

mempunyai topologi multilayer (multi-lapis) dengan

lapis input (lapis X) , satu atau lebih lapisan hidden

(lapis Z) dan satu lapis output (lapis Y) (Siang, 2005).

Setiap lapis memiliki neuron-neuron yang

dimodelkan dengan lingkaran (lihat gambar 1). Di

antara neuron pada satu lapis dengan neuron pada

lapis berikutnya dihubungkan dengan koneksi yang

memiliki bobot-bobot (weights), w dan v. Lapis

tersembunyi dapat memiliki bias, yang memiliki

bobot sama dengan satu.

II.2 Algoritma Pelatihan JST Backpropagation

Algoritma pelatihan JST propagasi balik

(backpropagation) pada dasarnya dapat dibagi

menjadi dua langkah, yaitu: langkah maju

(feedforward) dan propagasi balik (back

propagation) (Siang, 2005). Pada langkah maju,

perhitungan bobot-bobot neuron hanya didasarkan

pada vektor masukan, sedangkan pada propagasi

balik, bobot-bobot diperhalus dengan cara

memperhitungkan nilai dari target atau keluaran.

Algoritma ini dapat dilihat pada gambar 2.

Gambar 1. Jaringan saraf tiruan Backpropagation

dengan satu hidden layer (Mei-Ling, 2012)

Page 3: ANALISA NILAI UJIAN MASUK STT WASTUKANCANA BERDASARKAN NILAI UJIAN NASIONAL MENGGUNAKAN METODE BACKPROPAGATION

Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016

191

ISSN : 2503-2844

Muhammad Rafi Muttaqin

Seminar Nasional Telekomunikasi dan Informatika 2016

Gambar 2. Algoritma pelatihan backpropagation

II.3 K-fold Cross Validation

K-fold cross validation dilakukan untuk membagi

training set dan test set. K-fold cross validation

mengulang k-kali untuk membagi sebuah himpunan

contoh secara acak menjadi k subset yang saling

bebas, setiap ulangan disisakan satu subset untuk

pengujian dan subset lainnya untuk pelatihan

(Refaeilzadeh, Tang, & Liu, 2007).

II.4 Root Mean Square Error (RMSE)

Root Mean Square Error (RMSE) adalah

bertujuan untuk mempresentasikan rata-rata kuadrat

simpangan (selisih) antara nilai keluaran model

terhadap nilai pengukuran atau target.Untuk menilai

ketepatan peramalan tersebut maka perlu

diperbandingkan RMSE dengan peramalan lain yang

memakai rata-rata berjalan dengan periode-periode

berbeda (Shcherbakov et al, 2013). Rumus RMSE

dapat dilihat pada rumus 1.

𝐑𝐌𝐒𝐄 = √∑(𝐀𝐭 − 𝐅𝐭)𝟐

𝐧

Keterangan :

RMSE : Root Mean Square Error

At : aktual

Ft : hasil prediksi / forecast

III. METODOLOGI PENELITIAN

Metodologi yang digunakan dalam penelitian

ini dapat dilihat pada Gambar 3.

Gambar 3. Metodologi Penelitian

… [1]

Narasi:Melatih JST dengan data pelatihan(berupa

vektor atau record tabel) yang diberikan

sampai bobot-bobot tidak berubah lagi

(atau dicapai kondisi konvergen).

Input : Set data pelatihan, jumlah lapis, jumlah

neuron, learning rate, epsilon

Output : Model JST yang siap untuk

mengklasifikasi data (vektor) baru.

Algoritma :

(1) Menginisialisasi bobot awal dengan nilai acak

yang sangat kecil, hitung MSE dan ∆MSE

inisialisasi.

(2) Selama ∆MSE > epsilon lakukan:

(3) Untuk setiap tupple pada set data pelatihan

lakukan

Feedforward:

(4) Setiap unit masukan (Xi, i=1…n) menerima

vektor masukan Xi dan mengirimkan vektor ini

ke seluruh unit pada lapis diatasnya (hidden

layer).

(5) Setiap unit hidden (zj, j=1…p)

menjumlahkan bobot dari vektor masukan

:z_inj = 𝑣0𝑗 + ∑ 𝑥𝑖𝑣𝑖𝑗𝑛𝑖=1

Hitung keluaran fungsi aktivasi : zj =

f(z_inj).

Kirimkan vektor ini ke unit-unit pada lapis

diatasnya (lapis keluaran)

(6) Setiap unit keluaran (Yk, k=1…m)

menjumlahkan vektor masukan

Y_ink = 𝑤0𝑘 + ∑ 𝑧𝑖𝑤𝑗𝑘𝑝𝑗=1

Hitung keluaran dari fungsi aktivasi :

yk = f(y_ink)

Propagasi balik dari error:

(7) Setiap unit keluaran (Yk, k=1…m)

menerima vektor hasil yang diinginkan (tk)

untuk data masukan tersebut, hitung error-

nya (𝑡𝑘 − 𝑦𝑘): 𝛿𝑘 = (𝑡𝑘 − 𝑦𝑘)𝑓′(y_ink)

Hitung nilai koreksi bobotnya dengan α

sebagai learning ratenya: ∆𝑤𝑗𝑘 = 𝛼𝛿𝑘𝑧𝑗

Hitung nilai koreksi biasnya: ∆𝑤0𝑘 = 𝛼𝛿𝑘

Kirimkan 𝛿𝑘 ke unit pada lapis dibawahnya.

(8) Setiap unit hidden (Zj, j=1…p)

menjumlahkan delta masukannya (dari unit-

unit pada lapis diatasnya): 𝛿_𝑖𝑛𝑗 = ∑ 𝛿𝑘𝑤𝑗𝑘𝑚𝑘=1

Kalikan dengan turunan dari fungsi

aktivasinya untuk menghitung errornya: 𝛿𝑗 =

𝛿_𝑖𝑛𝑗𝑓′(𝑧_𝑖𝑛𝑗) Hitung nilai koreksi bobotnya:

∆𝑣𝑖𝑗 = 𝛼𝛿𝑗𝑥𝑖 Hitung nilai koreksi biasnya:

∆𝑣0𝑗 = 𝛼𝛿𝑗

Perbaharui bobot dan bias:

(9) Setiap unit keluaran (Yk, k=1…m)

memperbaharui bias dan bobotnya (j=0…p).

𝑤𝑗𝑘(𝑛𝑒𝑤) = 𝑤𝑗𝑘(𝑜𝑙𝑑) + ∆𝑤𝑗𝑘

Setiap unit tersembunyi (Zj, j=1…p)

memperbaharui bias dan bobotnya (i=0…n).

𝑣𝑖𝑗(𝑛𝑒𝑤) = 𝑣𝑖𝑗(𝑜𝑙𝑑) + ∆𝑣𝑖𝑗

MSEold = MSE. Hitung MSE, ∆MSE = MSE –

MSEold

(10) Uji kondisi berhentinya

Page 4: ANALISA NILAI UJIAN MASUK STT WASTUKANCANA BERDASARKAN NILAI UJIAN NASIONAL MENGGUNAKAN METODE BACKPROPAGATION

Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016

192

ISSN : 2503-2844

Muhammad Rafi Muttaqin

Seminar Nasional Telekomunikasi dan Informatika 2016

Pengumpulan Data

Data yang dikumpulkan didapatkan dari bagian

Tata Laksana STT Wastukancana Purwakarta yaitu

berupa arsip data nilai UN dan nilai hasil ujian masuk

STT Wastukancana pada tahun 2013. Diambil 100

data yang memiliki nilai yang lengkap, yaitu data

yang terdapat nilai UN dan nilai hasil ujian masuk.

Setelah data terkumpul, maka data dilakukan

pembagian untuk menjadi data latih dan data uji

menggunakan 5-fold cross validation. Pembagian

data menggunakan 5-fold cross validation dapat

dilihat pada Tabel 1. Untuk daftar pembagian data

latih dan data uji dapat dilihat pada Tabel 2.

Tabel 1. Pembagian Kelompok 5-fold cross validation.

No Kel

1 – 20 I

21 – 40 II

41 – 60 III

61 – 80 IV

81 – 100 V

Tabel 2. Pembagian Data Latih dan Data Uji

Data Latih Data Uji

I, II, III, IV V

I,II,III,V IV

I,II,IV,V III

I,III,IV,V II

II,III,IV,V I

IV. HASIL DAN PEMBAHASAN

Dalam pelatihan algoritman backpropagation

ini akan ditentukan dua buah parameter yang terdapat

peluang akan menghasilkan model yang berbeda

antar satu dengan yang lainnya. Dua buah parameter

tersebut adalah hidden layer dan epoch. Hidden layer

yang digunakan adalah sebanyak 3, 6, dan 9 buah

hidden layer, sedangkan epoch yang digunakan

adalah sebanyak 100, 500, dan 1000 kali epoch.

Untuk proses pelatihan, dilakukan dengan

mengkombinasikan kedua parameter tesebut untuk

setiap fold. Dengan demikian pelatihan JST yang

akan dilakukan sebanyak 45 kali uji coba. Karena

jika setiap menjalankan pelatihan JST akan

menghasilkan model yang berbeda, maka untuk

setiap kombinasi dilakukan 5 kali percobaan,

sehingga hasil yang akan diambil nanti merupakan

rataan dari 5 kali percobaan tersebut. Jadi total

pelatihan yang dilakukan sebanyak 225 kali

percobaan.

Pengujian

Setelah proses pelatihan dilakukan maka,

dihasilkan sebuah model JST. Dengan model tersebut

akan dilakukan proses pengujian menggunakan data

uji yang telah dibagi sesuai dengan proses pembagian

5- fold cross validation. Sebagai contoh untuk

pelatihan model JST dengan menggunakan fold ke-1

maka yang menjadi data latih adalah kelompok

I,II,III dan IV, sedangkan kelompok V menjadi data

uji untuk model yang telah dihasilkan oleh fold ke-1

tersebut. Begitu seterusnya sehingga semua

percobaan dilakukan.

Hasil yang diperoleh dari proses pengujian adalah

berupa nilai prediksi berdasarkan model yang

dihasilkan tersebut. Hasil prediksi tersebut akan

dibandingkan dengan hasil real yang diperoleh dari

data awal. Sehingga dapat dihitung berapa nilai

errornya dan nilai akurasinya. Nilai error dihitung

dengan rumus (1). Nilai akurasi dihitung dengan

rumus 100- RMSE.

Dari setiap kombinasi percobaan akan diulang

sebanyak 5 kali, dikarenakan setiap pengujian yang

dilakukan akan memperoleh hasil yang berbeda. Hal

ini disebabkan ada beberapa parameter yang

ditentukan program secara acak, dari 5 kali

percobaan tersebut akan diambil nilai rataan untuk

akurasi dan RMSE seperti pada Tabel 3. Untuk setiap

kombinasi percobaan yang telah dilakukan dapat

dilihat pada Tabel 4.

Page 5: ANALISA NILAI UJIAN MASUK STT WASTUKANCANA BERDASARKAN NILAI UJIAN NASIONAL MENGGUNAKAN METODE BACKPROPAGATION

Seminar Nasional Telekomunikasi dan Informatika (SELISIK 2016) Bandung, 28 Mei 2016

193

ISSN : 2503-2844

Muhammad Rafi Muttaqin

Seminar Nasional Telekomunikasi dan Informatika 2016

Tabel 3. Percobaan hidden layer 3 dan epoch 100

No RMSE Akurasi

1 8,9 91,1

2 9,1 90,9

3 8,9 91,1

4 8,9 91,1

5 8,7 91,3

Rataan 8,9 91,1

Tabel 4. Hasil rataan dari setiap kombinasi

No Hidden

Layer Epoch

rata-rata

Rmse

Rata-rata

Akurasi

1 3 100 8.9 91.1

2 3 500 8.9 91.1

3 3 1000 9.1 90.9

4 6 100 9.1 90.9

5 6 500 9.0 91.0

6 6 1000 8.9 91.1

7 9 100 9.1 90.9

8 9 500 8.8 91.2

9 9 1000 9.1 90.9

V. KESIMPULAN DAN SARAN

Kesimpulan

Dari seluruh percobaan yang telah dilakukan,

maka dapat disimpulkan bahwa nilai RMSE paling

rendah dan nilai akurasi tertinggi dihasilkan oleh

kombinasi hidden layer 9 dan epoch 500 dengan

rataan nilai RMSE sebesar 8,8 dan nilai akurasi

sebesar 91,2. Dengan demikian jika ingin

memprediksi suatu nilai ujian masuk berdasarkan

nilai NEM, dapat digunakan modal pelatihan JST

dengan menggunakan parameter hidden layer

sebanyak 9 buah dan nilai epoch sebanyak 500.

Saran

Untuk perolehan nilai akurasi yang lebih baik

diperlukan data latih yang lebih banyak dari pada

yang digunakan dalam penelitian ini. Hal ini

dikarenakan pada pemodelan JST itu dilakukan

proses pelatihan sehingga dengan banyaknya data

latih maka model yang dihasilkan akan lebih baik.

Pemodelan JST juga dapat digunakan untuk

memprediksi masalah lain selama ada data untuk

input dan outputnya.

REFERENSI

Yunanti, F. (2010). Aplikasi Jaringan Saraf Tiruan

Untuk Memprediksi Prestasi Siswa SMU

Dengan Metode Backpropagation. Digital

Library UIN Sunan Kalijaga.

Siang Jong Jek. (2005). Jaringan Syaraf Tiruan &

Pemrograman Mengunakan MATLAB. Andi

: Yogyakarta.

Mei-Ling Huang & Yung-Yang Hsu. (2012). Fetal

Distress Prediction Using Discriminant

Analysis, Decision Tree, and Artificial

Neural Network. Journal of Biomedical

Science and Engineering, Vol 5, No.9.

Refaeilzadeh, P., Lei Tang, Huan Liu. (2007). On

Comparison of Feature Selection Algorithm.

Association for the Advancement of

Artificial Intellgence.

Shcherbakov, M. V., Brebels, A., Shcherbakova, N.

L., Tyukov, A. P., Janovsky, T. A., &

Kamaev, V. A. (2013). A Survey of Forecast

Error Measures. World Applied Sciences

Journal 24.