IMPLEMENTASI DECISION TREE UNTUK … dari Sistem Informasi Akademik jurusan Teknik Informatika ITS...

40
Romauli Manullang - 5108100501 IMPLEMENTASI DECISION TREE UNTUK MEMPREDIKSI JUMLAH MAHASISWA PENGAMBIL MATAKULIAH DENGAN MENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORMATIKA ITS

Transcript of IMPLEMENTASI DECISION TREE UNTUK … dari Sistem Informasi Akademik jurusan Teknik Informatika ITS...

Romauli Manullang - 5108100501

IMPLEMENTASI DECISION TREE UNTUK MEMPREDIKSI JUMLAH MAHASISWA PENGAMBIL MATAKULIAH

DENGAN MENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORMATIKA ITS

Latar Belakang

• Pembuatan jadwal pada Jurusan Teknik lnformatika ITS harus

dilakukan pada setiap pergantian semester.

• Pembuatan jadwal ini membutuhkan waktu, tenaga dan ketelitian.

• Adanya kesulitan untuk menentukan jumlah mahasiswa yang

mengambil matakuliah tertentu pada tiap semester.

2/18/2011

3

Perumusan Masalah

– Bagaimana melakukan prediksi jumlah mahasiswa, yang mengambil matakuliah

tertentu menggunakan pendekatan metode klasifikasi dalam decision tree?

– Bagaimana menentukan metode decision tree yang tepat berdasarkan karakteristik

data?

– Bagaimana membangun rule pengklasifikasian prediksi jumlah mahasiswa

pengambil matakuliah?

– Bagaimana mngimplementasikan metode klasifikasi decision tree?

– Bagaimana melakukan uji coba decision tree tersebut ke dalam Matlab.

2/18/2011

4

Tujuan

Membuat implementasi decision tree untuk memprediksijumlah mahasiswa pengambil matakuliah denganmenggunakan studi kasus di Jurusan Teknik Informatika ITS.

2/18/2011

5

Batasan Masalah

Data yang diambil dari Sistem Informasi Akademik ITS telah benar.

Studi kasus yang digunakan adalah Jurusan TeknikInformatika ITS Surabaya.

Membatasi nilai mahasiswa yang mengulang matakuliahyang memiliki nilai sebelumnya BC dan C.

Metode decision tree yang digunakan adalah C4.5 Implementasi dibuat dengan menggunakan Matlab 7.1.

2/18/2011

6

Algoritma C4.5Secara umum Algoritma C4.5 membangun pohon

keputusan:a. Pilih atribut sebagai root. b. Buat cabang untuk masing-masing nilai. c. Bagi kasus dalam cabang. d. Ulangi proses untuk masing-masing cabang sampai

semua kasus pada cabang memiliki kelas yang sama.

2/18/2011

9

Information Gain Atribut A (Gain(a))

Untuk memilih atribut sebagai akar, didasarkanpada nilai gain tertinggi dari atribut-atributyang ada.

Dengan:S : Himpunan KasusA : Atributn : Jumlah partisi atribut A| Si | : Jumlah Kasus pada partisi ke i| S| : Jumlah kasus dalam S

2/18/2011

10

Entropy (Teori Informasi)

Kebutuhan bit untuk menyatakan suatu kelas. Semakinkecil nilai Entropy maka semakin baik untuk digunakandalam mengekstraksi suatu kelas.

Dengan:S : Himpunan Kasusn : Jumlah partisi Sp : Proporsi dari Si terhadap S

2/18/2011

11

Algoritma Alpha Beta

Alpha-beta pruning adalah algoritma pencarian yangmengurangi secara drastis jumlah simpul yangdibangkitkan untuk dievaluasi pada pohon pencarianyang dieksplorasi dalam algoritma Minimax.

Simpul MIN akan dianggap sebagai simpul denganurutan nilai dari rendah ke tinggi, dan simpul MAX daritinggi ke rendah.

2/18/2011

12

Perancangan2/18/2011

13

Blok Diagram Sistem Informasi Akademik Pengambil Matakuliah

Diagram Alir Desain Sistem Secara Umum

Mulai

Data Analisa Pengambil Matakuliah

Decision Tree dengan Prioritas pengambil Matakuliah

Decision Tree dengan Pengambil Matakuliah

Decision Tree dengan Pengambil Matakuliah

Solusi Prediksi Pengambil Matakuliah

Selesai

TY

2/18/2011

14

Data Rule Decision Tree2/18/2011

16

No. Nama Data Keterangan1. Id ID untuk tiap kondisi.2. Parent ID ID yang mewarisi kondisi.3. Level Level tiap kondisi dalam tree.4. Atribut Atribut yang ditunjuk oleh level.5. Kondisi Nilai atribut yang ditunjuk oleh atribut.

Implementasi

Membaca file xls (read file xls). Inisialisasi kolom file xls. Filter, digunakan untuk mengklasifikasi data maka sesuai

dengan atribut. Get data entropy, menghitung nilai entropy dari data xls pada

setiap kategori. Get total entropy, menghitung nilai entropy total setiap atribut. Calculate max gain, menghitung nilai gain dari setiap atribut

berdasarkan nilai entropy dari kategori dan mencari nilaimaksimal dari nilai gain.

Get child node, sama tapi memanggil eliminate_categoryyang berfungsi membuang kategori parent (parent sebelumnyatidak anggap).

2/18/2011

18

Pruning

1. Memeriksa node tiap level, dimulai level terdalam.2. Pada tiap level mengelompokkan node sesuai parent

nodenya.3. Pada setiap kelompok, diperiksa apakah memiliki value

yg sama (mengulang/tidak mengulang)4. Bila sama maka parent kelompok tersebut diubah node

nya menjadi value, lalu node kelompok tersebutdipotong (pruning)

5. Bila berbeda maka dilanjut ke kelompok selanjutnya.

2/18/2011

19

Uji Coba dan Evaluasi

Data Uji CobaData hasil analisa dari faktor-faktor yang mendukungmahasiswa pengambil matakuliah setiap semester yangdiperoleh dari Sistem Informasi Akademik jurusanTeknik Informatika ITS Surabaya.

2/18/2011

20

UJI COBA SKENARIO 1

Berdasarkan pemilihan atribut Nilai, Jenis Kelamin, Angkatan, Tahun Lahir, Semester dan Umur dari

mahasiswa pengambil matakuliah

2/18/2011

23

ALJABAR LINEAR TAHUN 2007 Berdasarkan pemilihan atribut Nilai, Jenis Kelamin, Tahun Lahir,

Angkatan, IPK, dan Semester .

2/18/2011

24

Node Parent Label Level Type Atribut1 NULL 'NILAI' 0 1 'NULL'2 1 'TDK MENGULANG' 1 0 'A-B'3 1 'KELAMIN' 1 1 'BC-C'4 3 'IPK' 2 1 'L'5 4 'LAHIR' 3 1 '2-2.9'6 5 'MENGULANG' 4 0 '1984-1985'7 5 'MENGULANG' 4 0 '1986-1987'8 5 'ANGKATAN' 4 1 '1988-1989'9 8 'SEMESTER' 5 1 '2007'

10 9 'TDK MENGULANG' 6 0 'Ganjil'11 9 'MENGULANG' 6 0 'Genap'12 9 'MENGULANG' 5 0 '2008'13 9 'MENGULANG' 5 0 '2009'14 4 'TDK MENGULANG' 3 0 '3-4'15 3 'LAHIR' 2 1 'P'16 15 'MENGULANG' 3 0 '1984-1985'17 15 'MENGULANG' 3 0 '1986-1987'18 15 'ANGKATAN' 3 1 '1988-1989'19 18 'SEMESTER' 4 1 '2007'20 19 'IPK' 5 1 'Ganjil'21 20 'MENGULANG' 6 0 '2-2.9'22 20 'TDK MENGULANG' 6 0 '3-4'23 20 'MENGULANG' 5 0 'Genap'24 18 'MENGULANG' 4 0 '2008'25 18 'MENGULANG' 4 0 '2009'26 1 'MENGULANG' 1 0 'D-E'

Bentuk Tree Uji Aljabar Linear 20072/18/2011

25

PENGENALAN POLA TAHUN 2007Node Parent Label Level Type Atribut1 NULL 'ANGKATAN' 0 1 'NULL'2 1 'NILAI' 1 1 '2007'3 2 'MENGULANG' 2 0 'A-B'4 2 'IPK' 2 1 'BC-C'5 4 'KELAMIN' 3 1 '2-2.9'6 5 'LAHIR' 4 1 'L'7 6 'MENGULANG' 5 0 '1984-1985'8 6 'MENGULANG' 5 0 '1986-1987'9 6 'SEMESTER' 5 1 '1988-1989'

10 9 'MENGULANG' 6 0 'Ganjil'11 9 'TDK MENGULANG' 6 0 'Genap'12 5 'MENGULANG' 4 0 'P'13 4 'TDK MENGULANG' 3 0 '3-4'14 2 'MENGULANG' 2 0 'D-E'15 1 'LAHIR' 1 1 '2008'16 15 'MENGULANG' 2 0 '1984-1985'17 15 'MENGULANG' 2 0 '1986-1987'18 15 'IPK' 2 1 '1988-1989'19 18 'MENGULANG' 3 0 '2-2.9'20 18 'KELAMIN' 3 1 '3-4'21 20 'SEMESTER' 4 1 'L'22 21 'MENGULANG' 5 0 'Ganjil'23 21 'NILAI' 5 1 'Genap'24 23 'TDK MENGULANG' 6 0 'A-B'25 23 'TDK MENGULANG' 6 0 'BC-C'26 23 'MENGULANG' 6 0 'D-E'27 20 'MENGULANG' 4 0 'P'28 1 'MENGULANG' 1 0 '2009'

2/18/2011

26

Bentuk Tree Uji Pengenalan Pola 20072/18/2011

27

A n g k a t a n

N i la i M

2 0 0 72 0 0 8

2 0 0 9

S e m es t e r

N i l a i

G a n j i l G e n a p

L a h i r

M M

1 9 8 4 - 1 9 8 51 9 8 6 - 1 9 8 7

1 9 8 8 - 1 9 8 9

I P K

M K e la m in

2 - 2 . 9 3 - 4

L a h i r

MM

1 9 8 4 - 1 9 8 51 9 8 6 - 1 9 8 7

1 9 8 8 - 1 9 8 9

M

T M

2 - 2 . 93 - 4

MM I P K

A - B B C - C D - E

K e la m in T M

T M

LP

S e m es t e r

M T M

G a n j i l G e n a p

A n g k at a n

LP

T M M

A - B D - EB C - C

UJI COBA SKENARIO 2

Berdasarkan pemilihan atribut Nilai, Angkatan, Selisih tahun Prediksi, Penghasilan orangtua, IPS dan Umur darimahasiswa pengambil matakuliah

2/18/2011

28

ALJABAR LINEAR TAHUN 2007Node Parent Label Level Type Atribut

1 'NULL' 'NILAI' 0 1 'NULL'

2 1 'UMUR' 1 1 'BC'

3 2 'TDK MENGULANG' 2 0 '18-19'

4 2 'IPS' 2 1 '20-21'

5 4 'TDK MENGULANG' 3 0 '0-2.00'

6 4 'PENGHASILAN' 3 1 '2.01-3.0'

7 6 'MENGULANG' 4 0 '>= 5.000.000'

8 6 'ANGKATAN' 4 1 '1.000.000-5.000.000'

9 8 'TDK MENGULANG' 5 0 '2004'

10 8 'SELISIH' 5 1 '2005'

11 10 'MENGULANG' 6 0 '2007-2005'

12 10 'TDK MENGULANG' 6 0 '2007-2006'

13 8 'MENGULANG' 5 0 '2006'

14 8 'MENGULANG' 5 0 '2007'

15 6 'TDK MENGULANG' 4 0 '<= 1.000.000'

16 4 'SELISIH' 3 1 '3.01-4.0'

17 16 'PENGHASILAN' 4 1 '2007-2005'

18 17 'MENGULANG' 5 0 '>= 5.000.000'

19 17 'TDK MENGULANG' 5 0 '1.000.000-5.000.000'

20 17 'ANGKATAN' 5 1 '<= 1.000.000'

21 20 'TDK MENGULANG' 6 0 '2004'

22 20 'MENGULANG' 6 0 '2005'

23 20 'MENGULANG' 6 0 '2006'

24 20 'MENGULANG' 6 0 '2007'

25 16 'TDK MENGULANG' 4 0 '2007-2006'

26 2 'TDK MENGULANG' 2 0 '22-23'

27 1 'PENGHASILAN' 1 1 'C'

28 27 'UMUR' 2 1 '>= 5.000.000'

29 28 'MENGULANG' 3 0 '18-19'

30 28 'MENGULANG' 3 0 '20-21'

31 28 'TDK MENGULANG' 3 0 '22-23'

32 27 'UMUR' 2 1 '1.000.000-5.000.000'

33 32 'TDK MENGULANG' 3 0 '18-19'

34 32 'IPS' 3 1 '20-21'

35 34 'MENGULANG' 4 0 '0-2.00'

36 34 'TDK MENGULANG' 4 0 '2.01-3.0'

37 34 'ANGKATAN' 4 1 '3.01-4.0'

38 37 'TDK MENGULANG' 5 0 '2004'

39 37 'SELISIH' 5 1 '2005'

40 39 'MENGULANG' 6 0 '2007-2005'

41 39 'TDK MENGULANG' 6 0 '2007-2006'

42 37 'MENGULANG' 5 0 '2006'

43 37 'MENGULANG' 5 0 '2007'

44 32 'SELISIH' 3 1 '22-23'

45 44 'ANGKATAN' 4 1 '2007-2005'

46 45 'IPS' 5 1 '2004'

47 46 'MENGULANG' 6 0 '0-2.00'

48 46 'TDK MENGULANG' 6 0 '2.01-3.0'

49 46 'MENGULANG' 6 0 '3.01-4.0'

50 45 'MENGULANG' 5 0 '2005'

51 45 'MENGULANG' 5 0 '2006'

52 45 'MENGULANG' 5 0 '2007'

53 44 'TDK MENGULANG' 4 0 '2007-2006'

54 27 'TDK MENGULANG' 2 0 '<= 1.000.000'

2/18/2011

29

Bentuk Tree Aljabar linier tahun 20072/18/2011

30

NILAI

Umur

TMTM

Selisih

IPS

HasilTM

BC

Hasil

C

18-19 20-21 22-23

0-2 2-3 3-4

M TMAngkatan

>=5jt <=1jt1jt-5jt

SelisihTM M M

2004 2005 2006 2007

MTM

1 2

HasilTM

1 2

TMM Angkatan

>=5jt 1jt-5jt >=1jt

MMTM M

2004 2005 2006 2007

Umur

>=5jt

Umur

M

TM SelisihIPS

AngkatanTM

18-19 20-21 22-23

0-23-4

2-3

TM

<=1jt 1jt-5jt

MTMM

18-19 20-2122-23

MSelisih MTM

M M

2004 2005 2006 2007

2 1

TM Angkatan

M

M

MIPS

TMM M

200420052006

2007

0-2 2-3 3-4

Tree Sebelum Dipruning

Pengenalan Pola tahun 2007

2/18/2011

31

Node

Parent

Label LevelType

Atribut

1 'NULL' 'PENGHASILAN' 0 1 'NULL'

2 1 'UMUR' 1 1 '>= 5.000.000'

3 2 'MENGULANG' 2 0 '18-19'

4 2 'MENGULANG' 2 0 '20-21'

5 2 'MENGULANG' 2 0 '22-23'

6 2'TDK MENGULANG' 2 0 '24-25'

7 1'TDK MENGULANG' 1 0

'1.000.000-5.000.000'

8 1'TDK MENGULANG' 1 0 '<= 1.000.000'

Tree Setelah Dipruning

Node Parent Label Level Type Atribut

1 'NULL' 'PENGHASILAN' 0 1 'NULL'

2 1 'MENGULANG' 1 0 '>= 5.000.000'

7 1'TDK MENGULANG'

1 0'1.000.000-5.000.000'

8 1'TDK MENGULANG'

1 0 '<= 1.000.000'

2/18/2011

32

Bentuk Tree Pada Uji Coba Skenario 3 Uji coba yang dilakukan pada skenario 3 ini adalah

berdasarkan pemilihan atribut Nilai, Selisih tahunPrediksi, Angkatan, IPS dan Umur dari mahasiswapengambil matakuliah.

2/18/2011

33

ALJABAR LINEAR TAHUN 2007Node Parent Label Level Type Atribut

1 'NULL' 'NILAI' 0 1 'NULL'

2 1 'UMUR' 1 1 'BC'

3 2 'TDK MENGULANG' 2 0 '18-19'

4 2 'IPS' 2 1 '20-21'

5 4 'TDK MENGULANG' 3 0 '0-2.00'

6 4 'ANGKATAN' 3 1 '2.01-3.0'

7 6 'TDK MENGULANG' 4 0 '2004'

8 6 'SELISIH' 4 1 '2005'

9 6 'MENGULANG' 4 0 '2006'

10 6 'MENGULANG' 4 0 '2007'

11 4 'SELISIH' 3 1 '3.01-4.0'

12 11 'ANGKATAN' 4 1 '2007-2005'

13 11 'TDK MENGULANG' 4 0 '2007-2006'

14 2 'TDK MENGULANG' 2 0 '22-23'

15 2 'MENGULANG' 2 0 '24-25'

16 1 'SELISIH' 1 1 'C'

17 16 'IPS' 2 1 '2007-2005'

18 17 'MENGULANG' 3 0 '0-2.00'

19 17 'UMUR' 3 1 '2.01-3.0'

20 19 'MENGULANG' 4 0 '18-19'

21 19 'ANGKATAN' 4 1 '20-21'

22 19 'ANGKATAN' 4 1 '22-23'

23 19 'MENGULANG' 4 0 '24-25'

24 17 'ANGKATAN' 3 1 '3.01-4.0'

25 24 'UMUR' 4 1 '2004'

26 24 'MENGULANG' 4 0 '2005'

27 24 'MENGULANG' 4 0 '2006'

28 24 'MENGULANG' 4 0 '2007'

29 16 'IPS' 2 1 '2007-2006'

30 29 'TDK MENGULANG' 3 0 '0-2.00'

31 29 'TDK MENGULANG' 3 0 '2.01-3.0'

32 29 'ANGKATAN' 3 1 '3.01-4.0'

33 32 'TDK MENGULANG' 4 0 '2004'

34 32 'UMUR' 4 1 '2005'

35 32 'MENGULANG' 4 0 '2006'

36 32 'MENGULANG' 4 0 '2007'

2/18/2011

34

Bentuk Tree Aljabar linier tahun 20072/18/2011

35

PENGENALAN POLA TAHUN 2007Node Parent Label Level Type Atribut

1 'NULL' 'IPS' 0 1 'NULL'

2 1 'TDK MENGULANG' 1 0 '0-2.00'

3 1 'TDK MENGULANG' 1 0 '2.01-3.0'

4 1 'NILAI' 1 1 '3.01-4.0'

5 4 'TDK MENGULANG' 2 0 'BC'

6 4 'UMUR' 2 1 'C'

7 6 'MENGULANG' 3 0 '18-19'

8 6 'MENGULANG' 3 0 '20-21'

9 6 'ANGKATAN' 3 1 '22-23'

10 9 'MENGULANG' 4 0 '2004'

11 9 'MENGULANG' 4 0 '2005'

12 9 'SELISIH' 4 1 '2006'

13 9 'MENGULANG' 4 0 '2007'

14 6 'TDK MENGULANG' 3 0 '24-25'

2/18/2011

36

Bentuk Tree Pengenalan Pola tahun2007

2/18/2011

37

Uji Coba Skenario 1

Ringkasan untuk uji coba sebelum dan setelah tree dipruning berdasarkan pemilihan atribut. Beberapaatribut yang dipilih untuk uji coba yaitu Nilai, JenisKelamin, Lahir, IPK, Angkatan dan Semester.

2/18/2011

38

Matakuliah Jumlah Data

Mengulang Sebenarnya

Prediksi Mengulang

Selisih Error (e)

Aljabar Linear 2007 68 8 4 4 50%

Aljabar Linear 2008 68 9 21 12 133,3%

Pengenalan Pola 2007 26 2 2 0 0%

Pengenalan Pola 2008 26 2 1 1 50%

Rata-rata 58,33%

Uji Coba Skenario 2 Ringkasan untuk uji coba sebelum tree dipruning

berdasarkan pemilihan atribut. Beberapa atribut yang dipilih untuk uji coba yaitu Nilai, Selisih, Hasil, IPS, Angkatan dan Umur sebelum tree dipruning.

2/18/2011

39

Matakuliah JumlahData

MengulangSebenarnya

PrediksiMengulang

Selisih Error (e)

Aljabar Linear 2007 68 8 7 1 12,5%

Aljabar Linear 2008 30 6 1 5 83,3%

Pengenalan Pola 2007 26 2 1 1 50%

Pengenalan Pola 2008 30 1 2 1 100%

Rata-rata 61,45%

Setelah tree dipruning

2/18/2011

40

Matakuliah Jumlah Data

Mengulang Sebenarnya

Prediksi Mengulang

Selisih Error (e)

Aljabar Linear 2007 68 8 19 11 137,5%

Aljabar Linear 2008 30 6 2 4 66,6%

Pengenalan Pola 2007 26 2 1 1 50%

Pengenalan Pola 2008 30 2 2 0 0%

Rata-rata 63,5%

Uji Coba Skenario 3

Ringkasan untuk uji coba berdasarkan pemilihan atributsebelum dan setelah tree dipruning. Beberapa atribut yang dipilih untuk uji coba yaitu Nilai, Selisih, Angkatan, IPS danUmur. Hasil tree sebelum dipruning.

2/18/2011

41

Matakuliah Jumlah Data

Mengulang Sebenarnya

Prediksi Mengulang

Selisih Error (e)

Aljabar Linear 2007 68 8 16 8 100%

Aljabar Linear 2008 30 4 10 6 150%

Pengenalan Pola 2007

26 2 2 0 0%

Pengenalan Pola 2008

30 1 3 2 200%

Rata-rata 112,5%

Kesimpulan

Implementasi ini dapat digunakan untuk membangunDecision tree sesuai data training.

Implementasi ini dapat digunakan untuk mengetahuijumlah mahasiswa pengambil matakuliah.

Decision tree yang digunakan menggunakan metodeC4.5, namun dalam implementasinya, pembuatandecision tree dilakukan semi-manual karena terdapatmissing value.

2/18/2011

42

Uji coba berdasarkan pemilihan atribut nilai, jenis kelamin,lahir, IPK, angkatan dan semester diperoleh nilai errorsebelum dan setelah tree di pruning untuk matakuliah AljabarLinear 2007 adalah 50%, Aljabar Linear 2008 adalah 133,3%,Pengenalan Pola 2007 adalah 0% dan Pengenalan Pola 2008adalah 50%.

Nilai rata-rata error sebelum dan setelah pruning untukmemprediksi jumlah mahasiswa pengambil matakuliahdengan pemilihan atribut Nilai, Jenis Kelamin, Lahir, IPK,Angkatan dan Semester sebelum dan setelah tree di pruningadalah 58,33% untuk 4 data uji coba yaitu matakuliah AljabarLinear 2007, Aljabar Linear 2008, Pengenalan Pola 2007 danPengenalan Pola 2008.

2/18/2011

43

Uji coba berdasarkan pemilihan atribut nilai, umur, penghaslan orangtua,selisih tahun prediksi dengan pengambilan, ips, dan angkatan diperolehnilai error sebelum tree di pruning untuk matakuliah Aljabar Linear 2007adalah 12,5%, Aljabar Linear 2008 adalah 83,3%, Pengenalan Pola 2007adalah 50% dan Pengenalan Pola 2008 adalah 100% dan setelah tree dipruning untuk matakuliah Aljabar Linear 2007 adalah 137,5%, AljabarLinear 2008 adalah 66,6%, Pengenalan Pola 2007 adalah 50% danPengenalan Pola 2008 adalah 0%.

Nilai rata-rata error untuk memprediksi jumlah mahasiswa pengambilmatakuliah dengan pemilihan atribut nilai, umur, selisih tahun prediksidengan pengambilan, penghasilan orangtua, ips, dan angkatan sebelumproses tree dipruning sebelum adalah 61,45% dan setelah tree dipruningadalah 63,5% untuk 4 data uji coba yaitu pada matakuliah Aljabar Linear2007, Aljabar Linear 2008, Pengenalan Pola 2007 dan Pengenalan Pola2008.

2/18/2011

44

Uji coba berdasarkan pemilihan atribut nilai, umur, selisihtahun prediksi dengan pengambilan, ips, dan angkatandiperoleh nilai error sebelum dan setelah tree di pruning untukmatakuliah Aljabar Linear 2007 adalah 100%, Aljabar Linear2008 adalah 150%, Pengenalan Pola 2007 adalah 0% danPengenalan Pola 2008 adalah 200%.

Nilai rata-rata error untuk memprediksi jumlah mahasiswapengambil matakuliah dengan pemilihan atribut nilai, umur,selisih tahun prediksi dengan pengambilan, ips, dan angkatansebelum dan setelah proses tree di pruning adalah 112,5%untuk 4 data uji coba yaitu pada matakuliah Aljabar Linear2007, Aljabar Linear 2008, Pengenalan Pola 2007 danPengenalan Pola 2008.

2/18/2011

45

Saran

Hendaknya untuk pengembangan lebih lanjut, harapmemperhatikan kelengkapan data faktor-faktor yang lainyang lebih baik agar hasil yang didapat semakin baik.

Metode decision tree yang digunakan sebaiknya mampumengatasi keberadaan missing value.

Melakukan uji coba terbatas pada enam matakuliah sajadengan rentang tahun antara 2007 sampai 2008. Untukpengembangan lebih lanjut diharapkan dapat melakukanuji coba pada semua matakuliah yang ada, sehinggahasilnya dapat digunakan untuk menentukan prediksisemua matakuliah yang ada

2/18/2011

46

Terima kasih

2/18/2011

47