TESIS IMPLEMENTASI DATA MINING UNTUK KLASIFIKASI DAN ...

65
TESIS IMPLEMENTASI DATA MINING UNTUK KLASIFIKASI DAN PEMERATAAN GURU PADA SEKOLAH DI DAERAH SITTI SUHADA P2700211411 PROGRAM PASCASARJANA TEKNIK ELEKTRO KONSENTRASI TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS HASANUDDIN MAKASSAR 2013

Transcript of TESIS IMPLEMENTASI DATA MINING UNTUK KLASIFIKASI DAN ...

TESIS

IMPLEMENTASI DATA MINING UNTUK KLASIFIKASI DAN PEMERATAAN GURU PADA SEKOLAH DI DAERAH

SITTI SUHADA P2700211411

PROGRAM PASCASARJANA TEKNIK ELEKTRO KONSENTRASI TEKNIK INFORMATIKA

FAKULTAS TEKNIK UNIVERSITAS HASANUDDIN MAKASSAR

2013

IMPLEMENTASI DATA MINING UNTUK KLASIFIKASI DAN PEMERATAAN GURU PADA SEKOLAH DI DAERAH

Tesis

Sebagai Salah Satu Syarat untuk Mencapai Gelar Magister

Program Studi

Teknik Elektro

Disusun dan Diajukan Oleh

SITTI SUHADA

Kepada

PROGRAM PASCASARJANA

UNIVERSITAS HASANUDDIN

MAKASSAR

2013

PERNYATAAN KEASLIAN TESIS

Yang bertanda tangan di bawah ini :

Nama : Sitti Suhada

Nomor Pokok : P2700211411

Program Studi : Teknik Elektro

Konsentrasi : Teknik Informatika

Menyatakan dengan sebenarnya bahwa tesis yang saya tulis ini benar-benar

merupakan hasil karya sendiri, bukan merupakan pengambilalihan tulisan atau

pemikiran orang lain. Apabila dikemudian hari terbukti atau dapat dibuktikan bahwa

sebagian atau keseluruhan tesis ini hasil karya orang lain, saya bersedia menerima

sanksi atas perbuatan tersebut.

Makassar, Juli 2013

Yang menyatakan,

Sitti Suhada

PRAKATA

Puji dan syukur penulis panjatkan kehadirat Allah SWT atas segala

rahmat dan hidayah-Nya, sehingga penyusunan tesis ini dapat penulis

selesaikan untuk memenuhi sebagian syarat memperoleh gelar magister

pada program studi teknik elektro konsentrasi teknik informatika universitas

Hasanuddin Makassar.

Banyak kendala yang dihadapi oleh penulis dalam penyusunan tesis

ini, namun berkat bantuan berbagai pihak, maka tesis ini dapat terselesaikan.

Pada kesempatan ini penulis dengan tulus menyampaikan terima kasih dan

penghargaan kepada semua pihak yang telah banyak membantu dan

mendukung demi rampungnya tesis ini, terutama kepada :

1. Suamiku Resmi Nur yang senantiasa sabar memberikan perhatian,

dorongan dan motivasi kepada penulis, Anakku Muh. Fakhri Nur Pratama,

orang tuaku sebagai motivator bagi penulis dalam menyelesaikan tesis ini,

atas semua doa kebaikan dan kasih sayang yang selalu menyertai penulis.

2. Bapak Prof. Dr. Ir. H. Salama Manjang, MT selaku Ketua Program Studi

Teknik Elektro Program Pascasarjana yang telah memberikan segala

motivasi sejak awal perkuliahan hingga terselesaikannya penelitian ini.

3. Bapak Prof. Dr. Ir. H. Muhammad Tola, M.Eng selaku Ketua Komisi

Penasihat atas bantuan, kesabaran dan kebaikan hati dalam mendampingi

penulis selama proses pembimbingan.

4. Bapak Muhammad Niswar, ST., MIT., Ph.D selaku Anggota Komisi

Penasihat atas bantuan, kesabaran dan kebaikan hati dalam

mendampingi penulis selama proses pembimbingan.

5. Bapak Prof. Dr. Ir. H. Muhammad Arief, Dipl. Ing, Bapak Dr. Armin Lawi,

M.Eng dan Bapak Dr. Eng. Wardi, ST., M.Eng selaku tim penguji atas

saran-saran yang diberikan untuk perbaikan tesis ini ke arah yang lebih

baik.

6. Bapak Drs. H. Mahmud. BM. M.Pd selaku Kepala Dinas Pendidikan Kota

Makassar yang telah memberikan izin kepada penulis untuk mengadakan

penelitian di dinas pendidikan kota Makassar.

7. Bapak Supriadi, SE., MM selaku Kasubag Program Dinas Pendidikan

kabupaten Maros yang telah memberikan izin kepada penulis dan

membantu dalam penelitian di dinas pendidikan kabupaten Maros.

8. Teman-teman mahasiswa pascasarjana Program Studi Teknik Elektro

Konsentrasi Teknik Informatika Angkatan 2011.

Akhirnya penulis menyadari bahwa isi tulisan ini masih jauh dari

kesempurnaan, oleh karena itu penulis mengharapkan kritik dan saran yang

sifatnya membangun. Semoga tulisan ini dapat memberikan manfaat bagi

semua pihak yang membutuhkan dan terutama bagi penulis.

Makassar, Juli 2013

Sitti Suhada

vii

ABSTRAK

Sitti Suhada, Implementasi data mining untuk klasifikasi dan pemerataan guru pada sekolah di daerah (dibimbing oleh Muhammad Tola dan Muhammad Niswar)

Permasalahan dalam dunia pendidikan yaitu kurangnya tenaga guru, guru yang mengajar tidak sesuai dengan latar belakang pendidikan (mismatch), kualifikasi rendah, disparitas kompetensi, dan penyaluran guru tidak merata.

Penelitian ini bertujuan untuk (1) merancang model algoritma klasifikasi pemerataan kebutuhan guru dengan menggunakan algoritma nearest neighbor (2) Untuk merancang model algoritma klasifikasi pemerataan kebutuhan guru dengan menggunakan algoritma C4.5 (3) membandingkan akurasi model algoritma nearest neighbor dan algoritma C4.5 untuk pemerataan kebutuhan guru.

Penelitian ini merupakan penelitian historis dengan menggunakan metode eksperimental yaitu dengan melakukan perancangan dan pembuatan model sistem. Pengumpulan data dilakukan dengan metode studi pustaka (library research) dan metode pengumpulan data lapangan (field research) dan pembuatan aplikasi berdasarkan analisis hasil dari metode data mining yakni algoritma nearest neighbor dan algoritma C4.5.

Adapun hasil dari penelitian ini adalah informasi klasifikasi keadaan kebutuhan guru mata pelajaran apakah lebih, cukup atau kurang pada tiap sekolah. Tingkat akurasi algoritma nearest neighbor mencapai 72% dan tingkat akurasi algoritma C4.5 mencapai 83%.

Kata kunci : data mining, algoritma nearest neighbor, algoritma C4.5

viii

ABSTRACT

Sitti Suhada, Implementation of data mining for the classification and distribution of teachers in rural schools (led by Muhammad Tola and Muhammad Niswar) Problems in education is the lack of teachers, the teachers are not in accordance with the educational background (mismatch), low qualifications, competence disparities and uneven distribution of teachers. This study aims to (1) design a model of classification algorithms equity needs of teachers by using nearest neighbor algorithm (2) To design a classification algorithm model distribution needs of teachers by using algorithm C4.5 (3) compare the accuracy of the model and algorithm nearest neighbor algorithm C4.5 equity requirement for teachers. This study aims to (1) design a model of classification algorithms of equity needs of teachers by using nearest neighbor algorithm (2) To design a classification algorithm models the distribution needs of teachers by using algorithm C4.5 (3) compare the accuracy of the models and nearest neighbor algorithm C4.5 algorithm equity requirement for teachers. The results of this study is the information in the form of pattern classification state whether teachers need more, or less enough of nearest neighbor algorithm and C4.5 algorithms. Nearest neighbor algorithm accuracy rate reaches 72% and the accuracy rate reaches 83% C4.5 algorithms. Keywords: data mining, nearest neighbor algorithm, the algorithm C4.5

ix

DAFTAR ISI

Halaman

HALAMAN JUDUL ............................................................................ i

HALAMAN PENGAJUAN TESIS ...................................................... ii

HALAMAN PENGESAHAN............................................................... iii

PERNYATAAN KEASLIAN TESIS ................................................... iv

PRAKATA ......................................................................................... v

ABSTRAK ......................................................................................... vii

ABSTRACT ....................................................................................... viii

DAFTAR ISI ....................................................................................... ix

DAFTAR GAMBAR ........................................................................... xii

DAFTAR TABEL ............................................................................... xiv

Bab I PENDAHULUAN

A. Latar Belakang Masalah ......................................................... 1

B. Rumusan Masalah ................................................................. 3

C. Tujuan Penelitian .................................................................... 3

D. Manfaat Penelitian ................................................................... 4

E. Ruang Lingkup Penelitian ........................................................ 4

BAB II. TINJAUAN PUSTAKA

A. Landasan Teori dan Konsep ................................................... 5

1. Konsep Dasar Data Mining ............................................... 5

x

1.1 Data Mining ................................................................ 5

1.2. Algoritma Nearest Neighbor ....................................... 6

1.3 Algoritma C4.5 ........................................................... 7

2. Konsep Guru .................................................................... 8

2.1 Defenisi Guru .............................................................. 8

2.2 Guru Mata Pelajaran ................................................... 8

2.3 Penataan Guru Pegawai Negeri Sipil .......................... 9

2.4 Komposisi Guru ........................................................... 9

2.5 Defenisi Rombongan Belajar ...................................... 9

2.6 Rumus Perhitungan Kebutuhan Guru SMA ................ 10

3. Unified Modelling Language (UML) ................................... 10

B. Tinjauan Hasil Penelitian Terkait ............................................ 11

C. Kerangka Konseptual .............................................................. 15

BAB III. METODE PENELITIAN

A. . Tahapan Rancangan Penelitian .............................................. 16

B. . Jenis Penelitian ....................................................................... 23

C. . Arsitektur Sistem ..................................................................... 24

D. . Alat dan Bahan ........................................................................ 24

E. . Lokasi dan Waktu Penelitian ................................................... 25

BAB IV. HASIL PENELITIAN DAN PEMBAHASAN

A. Gambaran Umum Sistem ........................................................ 26

B. Hasil Analisis dan Pembahasan .............................................. 28

xi

C. User Interface .......................................................................... 36

D. Pengujian Sistem .................................................................... 40

BAB V. PENUTUP

A. Kesimpulan .............................................................................. 48

B. Saran ....................................................................................... 49

Daftar Pustaka

Lampiran

xii

DAFTAR GAMBAR

1. Gambar 2.1 Ilustrasi kedekatan kasus ...………..……………..…….. 6

2. Gambar 2.2 Bagan Kerangka Konseptual…………………………… 15

3. Gambar 3.1 Tahapan Rancangan Penelitian ………..……...……… 16

4. Gambar 3.2 Use Case Diagram……...……………….……............... 17

5. Gambar 3.3 Activity Diagram ………..……………………………….. 18

6. Gambar 3.4 Class Diagram …….…..………………………………… 19

7. Gambar 3.5 Flowchart klasifikasi metode Nearest Neighbor……… 20

8. Gambar 3.6 Flowchart klasifikasi algoritma C4.5……………………. 22

9. Gambar 3.7 Arsitektur sistem………………………………………….. 24

10. Gambar 4.1 Gambaran Umum Sistem ………..……………………… 25

11. Gambar 4.2 Proses klasifikasi data…………….……….…..………… 26

12. Gambar 4.3 Pohon Keputusan Level 0 ……..………………………. 33

13. Gambar 4.4 Pohon Keputusan Level 1……………………………. 34

14. Gambar 4.5 Form Input Data Sekolah ….……................……………. 35

15. Gambar 4.6 Form Input Data Mata Pelajaran…...........……………... 36

16. Gambar 4.7 Form Input Pilihan Algoritma……………………………. 36

Halaman

xiii

17. Gambar 4.8 Form Proses Algoritma C4.5…………………………. 37

18. Gambar 4.9 Output Sistem Algoritma C4.5 ................……………. 37

19. Gambar 4.10 Form Proses Algoritma Nearest Neighbor……………. 38

20. Gambar 4.11 Output Sistem Algoritma Nearest Neighbor ............. … 38

xiv

DAFTAR TABEL

Halaman

1. Tabel 4.1. Kasus…………….......……………………………… .......... 27

2. Tabel 4.2. Hasil Perhitungan Alokasi Waktu dan Output.. ............... 29

3. Tabel 4.3. Kasus Kebutuhan Guru ….……….…………………… ..... 31

4. Tabel 4.4. Perhitungan Level 0 ….…………… ................................ 32

5. Tabel 4.5. Perhitungan Node 1.1………….............. ......................... 33

6. Tabel 4.6. Pengujian Black Box…………………………………. ....... 39

7. Tabel 4.7 Pengujian Akurasi Algoritma Nearest Neighbor………… 43

8. Tabel 4.6. Pengujian Akurasi Algoritma C4.5 …… ............................ 44

1

BAB I

PENDAHULUAN

A. Latar Belakang Masalah

Pembangunan pendidikan saat ini telah menunjukkan hasil yang

cukup signifikan bagi pembangunan nasional. Pendidikan dipandang

sebagai salah satu dari berbagai investasi yang dianggap sangat

menentukan dalam upaya peningkatan kualitas sumber daya manusia.

Dalam dunia pendidikan, peran dan fungsi guru merupakan salah

satu faktor yang sangat signifikan. Guru merupakan bagian terpenting

dalam proses pembelajaran, sesuai dengan Undang-undang Republik

Indonesia Nomor 14 Tahun 2005 tentang Guru dan Dosen. Oleh sebab

itu, dalam setiap upaya peningkatan kualitas pendidikan di tanah air tidak

dapat dilepaskan dari berbagai hal yang berkaitan dengan eksistensi guru

itu sendiri[1].

Guru mata pelajaran merupakan salah satu faktor penting dalam

implementasi kurikulum. Bagaimanapun idealnya suatu kurikulum tanpa

ditunjang oleh kemampuan guru untuk mengimplementasikannya, maka

kurikulum itu tidak akan bermakna sebagai suatu alat pendidikan, dan

sebaliknya pembelajaran tanpa kurikulum sebagai pedoman tidak akan

efektif[2].

Di lain pihak, kondisi dunia pendidikan sekarang ini dihadapkan

pada masalah yang kompleks diantaranya persoalan klasik, yakni

2

kurangnya tenaga guru, guru yang mengajar tidak sesuai dengan latar

belakang pendidikan (mismatch), kualifikasi rendah, disparitas

kompetensi, dan pendistribusian guru yang tidak efektif. Hal ini dapat

dibuktikan oleh kondisi Indonesia saat ini yang masih kekurangan 200.000

tenaga guru (Ditjen PMPTK, 2010).

Pemerataan kebutuhan guru yang tidak merata dapat dibuktikan

pada SMA Negeri 1 Makassar untuk guru matematika terdapat 8 (delapan)

jumlah guru, sedangkan guru yang diperlukan untuk mata pelajaran

matematika hanya 7 (tujuh) guru, jadi jumlah guru lebih dari kebutuhan

guru. Di sisi lain pada SMA Negeri 3 Lau Maros terdapat 5 (lima) jumlah

guru sedangkan guru yang diperlukan untuk mata pelajaran matematika

harusnya 6 (enam) guru, jadi jumlah guru kurang dari kebutuhan guru.

Berkaitan dengan kondisi tersebut maka diperlukan ilmu data

mining untuk mengklasifikasi kebutuhan guru. Model klasifikasi yang

digunakan adalah dengan menggunakan metode algoritma Nearest

Neighbor (NN) dan Algoritma C4.5 untuk memperoleh akurasi yang tepat.

Dengan demikian diharapkan hasil penelitian ini nantinya dapat

menjadi salah satu bahan acuan pemerintah daerah dalam pengambilan

keputusan untuk memberikan kebijakan dalam penyaluran tenaga guru

sesuai dengan kebutuhan guru di masing-masing sekolah sehingga dapat

meningkatkan kualitas pendidikan.

3

B. Rumusan Masalah

Berdasarkan latar belakang yang telah dipaparkan pada bagian

sebelumnya, maka dapat dirumuskan rumusan masalah yaitu:

1. Bagaimana model klasifikasi pemerataan kebutuhan guru dengan

menggunakan algoritma nearest neighbor.

2. Bagaimana model klasifikasi pemerataan kebutuhan guru dengan

menggunakan algoritma C4.5.

3. Bagaimana akurasi algoritma nearest neighbor dan algoritma C4.5

untuk pemerataan kebutuhan guru.

C. Tujuan Penelitian

Memperhatikan latar belakang dan rumusan masalah yang telah

diuraikan, maka tujuan dari penelitian ini adalah:

1. Untuk merancang model algoritma klasifikasi pemerataan kebutuhan

guru dengan menggunakan algoritma nearest neighbor

2. Untuk merancang model algoritma klasifikasi pemerataan kebutuhan

guru dengan menggunakan algoritma C4.5

3. Membandingkan akurasi algoritma nearest neighbor dan algoritma

C4.5 untuk pemerataan kebutuhan guru

4

D. Manfaat Penelitian

Adapun manfaat dari penelitian ini adalah:

1. Dapat mengetahui keadaan kebutuhan guru pada sekolah-sekolah.

2. Dapat membantu pemerintah daerah untuk mendapatkan informasi

dalam penyaluran tenaga guru ke sekolah-sekolah.

3. Sebagai referensi bagi peneliti lain untuk pengembangan sistem

selanjutnya.

E. Ruang Lingkup Penelitian

Memperhatikan semua pemaparan sebelumnya dan untuk memberi

batasan jelas dalam penelitian ini, maka ruang lingkup penelitian ini

hanya meliputi:

1. Pengambilan data dilakukan pada Dinas Pendididikan Nasional Kota

Makassar dan Dinas Pendidikan Nasional pada Kabupaten Maros.

2. Data guru yang akan dijadikan input adalah guru dengan status

Pegawai Negeri Sipil.

3. Klasifikasi data guru menggunakan algoritma nearest neighbor dan

algoritma C4.5.

4. Aplikasi dibuat menggunakan bahasa pemrograman berbasis web

menggunakan PHP.

5

BAB II

TINJAUAN PUSTAKA

A. Landasan Teori dan Konsep

1. Konsep Dasar Data Mining

1.1 Data Mining

Data mining adalah suatu istilah yang digunakan untuk menguraikan

penemuan pengetahuan di dalam database. Data mining adalah proses

yang menggunakan teknik statistik, matematika, kecerdasan buatan dan

machine learning untuk mengekstraksi dan mengindentifikasi informasi

yang bermanfaat dan pengetahuan yang terkait dari berbagai database

besar [3].

Data mining merupakan analisis dari peninjauan kumpulan data

untuk menemukan hubungan yang tidak terduga dan meringkas data

dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan

bermanfaat bagi pemilik data [3].

Secara umum pengukuran model data mining mengacu kepada tiga

kriteria: Akurasi (Accuracy), Kehandalan (Reliability) dan Kegunaan

(Usefulness). Keseimbangan diantaranya ketiganya diperlukan karena

belum tentu model yang akurat adalah handal, dan yang handal atau

akurat belum tentu berguna [3].

Metode yang digunakan dalam data mining berupa metode

pembelajaran (supervised learning) dan metode tanpa pembelajaran

6

(UnSupervised learning). Metode pembelajaran meliputi peran estimasi,

prediksi, klasifikasi dan asosiasi sedangkan metode tanpa pembelajaran

meliputi klasterisasi [4].

1.2 Algoritma Nearest Neighbor

Algoritma nearest neighbor adalah pendekatan untuk mencari kasus

dengan menghitung kedekatan antara kasus baru dengan kasus lama,

yaitu berdasarkan pada pencocokan bobot dari sejumlah fitur yang ada

[3].

Gambar 2.1 Ilustrasi Kedekatan Kasus (Kusrini, 2009)

Rumus yang digunakan untuk menghitung kedekatan antara dua

kasus yaitu

….……………...(2.1)

Keterangan:

T : Kasus Baru S : Kasus yang ada dalam penyimpanan n : Jumlah atribut dalam setiap kasus

7

i : Atribut individu antara 1 sampai dengan n f : Fungsi similarity atribut i antara kasus T dan kasus S w : Bobot yang diberikan pada atribut ke-i

1.3 Algoritma C4.5

Algoritma C4.5 merupakan algoritma yang digunakan untuk

membentuk pohon keputusan. Algoritma ini merupakan metode klasifikasi

dan prediksi yang sangat kuat dan terkenal. Pohon keputusan berguna

untuk mengeksplorasi data, menemukan hubungan tersembunyi antara

sejumlah calon variabel input dengan variabel target. Ada 2 variabel yang

dipakai dalam menentukan akar dari pohon keputusan yaitu nilai entropy

dan nilai gain [3].

Secara umum algoritma C4.5 untuk membangun pohon keputusan

adalah sebagai berikut[3]:

a. Pilih atribut sebagai akar

b. Buat cabang untuk tiap-tiap nilai

c. Bagi kasus dalam cabang

d. Ulangi proses untuk setiap cabang sampai semua kasus pada

cabang memiliki kelas yang sama

Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi

dari atribut-atribut yang ada.

Nilai Entropy diperoleh dari rumus :

……………………(2.2)

8

Nilai Gain diperoleh dari rumus :

………….(2.3)

2. Konsep Guru

2.1 Defenisi Guru

Guru adalah pendidik profesional dengan tugas utama mendidik,

mengajar, membimbing, mengarahkan, melatih, menilai, dan

mengevaluasi peserta didik pada pendidikan anak usia dini jalur

pendidikan formal, pendidikan dasar, dan pendidikan menengah

(Peraturan Pemerintah Nomor 74, Tahun 2008, tentang Guru, Pasal 1,

ayat 1) [1].

2.2 Guru Mata Pelajaran

Guru mata pelajaran adalah guru yang mempunyai tugas, tanggung

jawab, wewenang, dan hak secara penuh dalam proses pembelajaran

Keterangan : S = Himpunan Kasus n = Jumlah partisi S pi = Proporsi dari Si terhadap S

Keterangan : S = Himpunan Kasus A = Atribut n = Jumlah partisi atribut A |Si| = Jumlah kasus pada partisi ke-i |S| = Jumlah kasus dalam S

9

pada 1 (satu) mata pelajaran tertentu pada satuan pendidikan formal pada

jenjang pendidikan dasar (SD/SDLB, SMP/SMPLB) termasuk guru mata

pelajaran pendidikan jasmani dan kesehatan, dan guru pendidikan agama

serta pendidikan menengah (SMA/SMALB/SMK)[1].

Peraturan Pemerintah Nomor 74 Tahun 2008 tentang Guru

menyebutkan bahwa guru memiliki beban kerja paling sedikit 24 (dua

puluh empat) jam tatap muka dan sebanyak-banyaknya 40 (empat puluh)

jam tatap muka perminggu[1].

2.3 Penataan Guru Pegawai Negeri Sipil

Penataan guru PNS adalah proses menata ulang agar rasio,

kualifikasi akademik, distribusi, dan komposisi guru PNS sesuai dengan

kebutuhan riil masing-masing satuan pendidikan [1].

2.4 Komposisi Guru

Komposisi guru adalah perbandingan jumlah guru dalam satuan

pendidikan sesuai dengan rombongan belajar atau mata pelajaran yang

diampu sesuai dengan kebutuhan riil masing-masing satuan pendidikan.

Suatu satuan pendidikan harus memiliki guru kelas, guru mata pelajaran,

guru bimbingan dan konseling atau konselor sesuai dengan kurikulum

tingkat satuan pendidikan [1].

2.5 Defenisi Rombongan Belajar

Rombongan belajar adalah kelompok peserta didik yang terdaftar

pada satu satuan kelas (Peraturan Menteri Pendidikan Nasional Nomor 24

Tahun 2007).

10

2.6 Rumus Perhitungan Kebutuhan Guru SMA

Adapun formula perhitungan kebutuhan guru SMA berdasarkan

petunjuk teknis surat keputusan bersama lima menteri, yaitu:

…………………(2.4)

Keterangan :

KG = Kebutuhan Guru

JTM = Jumlah tatap muka per jenis guru per minggu

MP = Alokasi jam mata pelajaran per minggu pada mata

pelajaran tertentu di satu tingkat

∑K = Jumlah kelas pada suatu tingkat yang mengikuti mata

pelajaran tertentu

24 = Wajib mengajar per minggu, digunakan angka 24

1,2,3 = Tingkat/kelas 1, 2 dan 3

3. Unified Modelling Language (UML)

Pemodelan (modelling) adalah suatu tahapan dalam proses

perancangan sebuah perangkat lunak sebelum melakukan proses

pengkodean (coding). Model bisa dianalogikan dengan pembuatan

blueprint pada pembangunan sebuah gedung. Dengan menggunakan

model, diharapkan pengembangan perangkat lunak dapat memenuhi

semua kebutuhan pengguna dengan lengkap dan tepat.

Unified Modelling Language (UML) adalah sebuah “bahasa” yang

telah menjadi standard untuk visualisasi, merancang dan

11

mendokumentasikan sistem piranti lunak. Dengan UML dapat dibuat

model untuk semua jenis aplikasi perangkat lunak yang nantinya aplikasi

tersebut mampu berjalan pada perangkat keras, sistem operasi dan

jaringan apapun (multi platform) serta dapat ditulis dalam bahasa program

apapun.

B. Tinjauan Hasil Penelitian Terkait

Ada beberapa penelitian terdahulu yang meneliti tentang guru

menggunakan data mining antara lain :

1. Klasterisasi kompetensi guru menggunakan hasil penilaian portofolio

sertifikasi guru dengan metode data mining. Ari Kurniawan,

Mochamad Hariadi [5], S2 Teknik Elektro (Telematika) , Institut

Teknologi Sepuluh Nopember Surabaya. Penelitian ini menerapkan

proses data mining untuk pengolahan nilai portofolio guru dengan

metode K-mean clustering untuk mengelompokan kompetensi guru

yang relatif homogeny.

2. Pemetaan Pendidikan (Education Mapping) Sebagai Dasar

Meningkatkan Layanan Pendidikan. Oleh Priadi Surya [6] Universitas

Negeri Yogyakarta dimuat dalam Makalah ICEMAL (International

Conference Educational Management, Administration and

Leadership), 4-5 Juli 2012 di Malang. Jawa Timur. Indonesia.

Penelitian ini difokuskan pada Penulis mengembangkan konsep

pemetaan pendidikan dari konsep pemetaan sekolah. Berbagai aspek

pendidikan dalam ruang lingkup sekolah dibawa ke ranah yang lebih

12

luas. Baik dalam hal ruang lingkup kajian maupun luasan wilayah yang

dibahas. Pemetaan pendidikan ini mengadopsi dan mengadaptasi

konsep pemetaan dari ilmu geografi.

3. Pemetaan mutu pendidik dan tenaga kependidikan berbasis spasial.

Oleh Hukmiah Arif [7], S2 Teknik Elektro (Teknik Informatika)

Penelitian ini bertujuan mengetahui peta kondisi pendidik dan tenaga

kependidikan berbasis spasial berdasarkan kualitas dan kuantitas.

Penelitian ini dilaksanakan di satu kecamatan Rappocini Kota

Makassar, dengan mengambil sekolah tingkat TK, SD, SMP dan SMA.

Adapun hasil penelitian menunjukkan bahwa dengan sistem database

geografis dapat memuat lokasi sekolah di dalam peta, identitas

sekolah, identitas pendidik dan tenaga kependidikan secara detail.

4. Sistem pendukung keputusan berbasis sms untuk menentukan status

gizi dengan metode k-nearest neighbor oleh Ninki Hermaduanti, Sri

Kusumadewi [8]. Jurusan Teknik Informatika, Fakultas Teknologi

Industri Universitas Islam Indonesia. Metode K-nearest neighbor

merupakan metode klasifikasi yang dapat digunakan untuk

menentukan status gizi seseorang berdasarkan data-data yang telah

diperoleh sebelumnya. Teknologi sms dapat dimanfaatkan untuk

mengembangkan sistem sesuai yang dibutuhkan dengan

memperhatikan aspek kecepatan dan biaya dengan kinerja sistem

mencapai 90,41%.

13

5. Perbandingan metode nearest neighbor dan algoritma C45 untuk

menganalisis kemungkinan pengunduran diri calon mahasiswa di

STMIK AMIKOM Yogyakarta, oleh Kusrini, Sri Hartati, Retantyo

Wardoyo, Agus Harjoko [9] dari STMIK AMIKOM Yogyakarta,

dipublikasikan pada Jurnal DASI Vol. 10 No. 1 Maret 2009, ISSN:

1411-3201. Penelitian ini menitikberatkan perbandingan klasifikasi dan

tingkat akurasi dari algoritma Nearest Neighbor dan algoritma C4.5

untuk pengambilan keputusan dalam proses kemungkinan calon

mahasiswa mengundurkan diri pada STMIK AMIKOM Yogyakarta.

6. Klasifikasi Data Nasabah sebuah Asuransi menggunakan Algoritma

C4.5, oleh Sunjana [10], Universitas Widyatama, dipublikasikan pada

Seminar Nasional Aplikasi Teknologi Informasi 2010 (SNATI 2010),

Yogyakarta, 19 Juni 2010. Penelitian ini difokuskan pada

pengelompokan nasabah ke kelas lancer dan kelas tidak lancer

menggunakan algoritma C4.5. Hasilnya digunakan oleh asuransi

untuk memprediksi nasabah baru yang mau bergabung.

7. Data Mining untuk klasifikasi pelanggan dengan Ant Colony

Optmization oleh Maulani Kapiudin [11] Jurusan Teknik Informatika

Fakultas Teknologi Industri Universitas Kristen Petra, yang dimuat

pada paper informatika Petra. Penelitian difokuskan pada sistem

klasifikasi potensial customer di desain dengan melakukan ekstrak

rule berdasarkan klasifikasi dari data mentah dengan criteria tertentu.

14

Proses pencarian menggunakan database pelanggan dari suatu Bank

dengan teknik data mining dengan ant colony optimization. Dilakukan

percobaan dengan min_case_per_rule variety dan phenomone

updating pada periode waktu tertentu. Hasilnya adalah sekelompok

class pelanggan yang didasarkan dari rules yang dibangun dengan

ant dan di modifikasi dengan phenomone updating, area

permasalahan menjadi melebar. Memberikan informasi mengenai

potensi pelanggan dari Bank sehingga dapat diklasifikasikan dengan

protoptype dari software.

Penelitian-penelitian diatas memang belum mencakup keseluruhan

penelitian yang mungkin pernah dilakukan sebelumnya dikarenakan

keterbatasan penulis dalam mencari literatur.

15

C. Kerangka Konseptual

Untuk lebih memperjelas kerangka pikir yang akan disajikan, maka

digambarkan dalam bentuk diagram sebagai berikut:

Gambar 2.2 Bagan Kerangka Konseptual

Permasalahan dalam dunia pendidikan yaitu kurangnya tenaga guru, guru yang mengajar tidak sesuai dengan latar belakang pendidikan (mismatch), kualifikasi rendah, disparitas kompetensi, dan penyaluran guru tidak merata

Solusi yang ditawarkan yaitu membangun aplikasi sistem data mining yang dapat menganalisa kebutuhan guru pada suatu sekolah sehingga dapat diketahui apakah kebutuhan guru lebih, cukup atau kurang pada suatu sekolah

Cara untuk mendapatkan solusi yaitu mengolah data set guru menggunakan model klasifikasi dengan menggunakan algoritma metode nearest neighbor dan algoritma C4.5. Adapun untuk pengujian menggunakan pengujian black box dan pengujian akurasi

Dengan demikian diharapkan hasil penelitian ini nantinya dapat menjadi salah satu bahan acuan pemerintah daerah dalam pengambilan keputusan untuk memberikan kebijakan dalam penyaluran tenaga guru sesuai dengan kebutuhan guru di masing-masing sekolah sehingga dapat meningkatkan kualitas pendidikan.

16

16

BAB III

METODE PENELITIAN

A. Tahapan Rancangan Penelitian

Gambar 3.1 Tahapan Rancangan Penelitian

Adapun gambar 3.1 merupakan tahapan rancangan penelitian yang

dilakukan dimulai dari tahapan analisis kebutuhan, perancangan,

implementasi sistem dan pengujian sistem.

1. Tahap Analisis Kebutuhan

Pada tahap ini akan dilakukan analisis kebutuhan dan spesifikasi

(Requirement Analysis and Spesification) atas masalah yang akan

diselesaikan. Dimulai dengan mengindentifikasi data set guru yang

meliputi data sekolah, data guru, data mata pelajaran, data rombongan

belajar pada masing-masing sekolah.

Data set guru Analisis data set guru dan

perancangan menggunakan algoritma nearest neighbor

& C4.5

Pengujian sistem

Implementasi sistem

Kebutuhan guru

17

2. Tahap perancangan sistem

2.1 Pada tahap ini dilakukan perancangan perangkat lunak umumnya

dalam melakukan perancangan sistem digunakan diagram Unified

Modelling Language (UML) untuk menggambarkan desain sistem

yang akan dirancang. Berikut ini beberapa diagram yang akan

menjelaskan tentang sistem yang akan dirancang. Pada penelitian

ini, Unified Modelling Language (UML) terdiri dari diagram use

case, activity diagram dan class diagram.

A. Use case diagram

Use case diagram menggambarkan fungsionalitas yang diharapkan

dari sebuah sistem. Sebuah use case mempresentasikan sebuah

interaksi antara aktor dengan sistem. Diagram use case dari sistem

terdapat pada gambar 3.2 di bawah ini :

Admin

Input data training

Proses Nearest Neighbor

Input data testing

Proses C4.5

Informasi data testing

User

Gambar 3.2 Use case diagram

18

Pada gambar 3.2 diagram use case ada dua aktor utama yaitu admin

dan user. Kedua actor dapat melakukan Input data training, yaitu

menginput, menambah, merubah dan menghapus data training yang

selanjutnya akan di training. Input data testing, yaitu proses menginput

data testing yang akan di proses dengan algoritma nearest neighbor dan

algoritma c4.5.

B. Activity diagram

Activity diagram menggambarkan berbagai alur aktivitas dalam sistem

yang sedang dirancang, bagaimana masing-masing alur berawal, decision

yang mungkin terjadi dan bagimana mereka berakhir. Diagram Activity dari

sistem terdapat pada gambar 3.3 dibawah ini :

Tampil Halaman Utama

Pilih Menu Data Training

Tampil From Input Data Training

Masukkan Data

Gambar 3.3 Activity diagram

19

C. Class diagram

Class diagram menggambarkan keadaan (atribut/properti) suatu sistem

sekaligus menawarkan layanan untuk memanipulasi keadaan

metode/fungsi. Class diagram menggambarkan struktur dan deskripsi

class, package dan objek beserta hubungan satu sama lain. Diagram

Activity dari sistem terdapat pada gambar 3.4 dibawah ini :

survei

+id+kode sekolah+tipe sekolah+kode mata pelajaran+jumlah guru+kebutuhan guru

+setID()+inputdatasurvei()

matapelajaran

+id+kode mata pelajaran+nama mata pelajaran

+setID()+inputdata()

sekolah

+id+kode sekolah+nama sekolah+alamat

+get sekolah()

guru

+id+nip+nama+alamat

+setID()+inputdataguru()

nearest neighbor

+kode sekolah+tipe sekolah+kebutuhan guru

+get kode sekolah()+hitung nilai kedekatan()+function_nn()

algoritma c4.5

+kode sekolah+tipe sekolah+kebutuhan guru

+get kode sekolah()+hitung entropi()+hitung gain()+function_c45()

Gambar 3.4 Class Diagram

20

2.2 Perancangan flowchart Algoritma

a. Proses klasifikasi algoritma nearest neighbor

Langkah-langkah dalam proses klasifikasi metode nearest neighbor

1. Dimulai dengan menginput data set guru

2. Melakukan proses perhitungan similarity atau nilai kedekatan kedua

kasus sesuai pada persamaan 2.1

3. Menampilkan output kebutuhan guru

4. Proses selesai

Untuk lebih jelasnya dapat dilihat pada gambar 3.5 Flowchart klasifikasi

metode nearest neighbor

Gambar 3.5 Flowchart klasifikasi metode nearest neighbor

Mulai

Dataset set guru

Hitung similarity

Output kebutuhan guru

Selesai

21

b. Proses Klasifikasi Algoritma C4.5

Adapun langkah-langkah proses pembentukan pohon keputusan

dengan Algoritmma C4.5 antara lain, yaitu :

1. Dimulai menginput data training

2. Menentukan Entropy seusai dengan persamaan 2.2, dari semua

kasus

3. Setelah itu, lakukan perhitungan Gain sesuai persamaan 2.3 untuk

setiap atribut.

4. Dari hasil perhitungan dapat diketahui bahwa atribut dengan Gain

tertinggi yang kemudian akan menjadi node akar yang akan

membentuk pohon.

5. Atribut yang sudah mengklasifikasikan kasus menjadi 1 kelas yaitu

dilakukan perhitungan lebih lanjut, tetapi untuk nilai atribut yang

terklasifikasi 2 kelas maka masih perlu dilakukan perhitungan lagi.

6. Dari hasil tersebut dapat digambarkann pohon keputusan sementara.

7. Kemudian dilakukan perhitungan lagi seperti pada langkah 1 sampai

dengan 5, hingga diketahui bahwa semua kasus sudah masuk dalam

satu salah satu kelas dan akan terbentuk pohon keputusan yang

terakhir. Untuk lebih jelasnya dapat dilihat pada gambar 3.6 Flowchart

klasifikasi algoritma C4.5.

22

Gambar 3.6 Flowchart Klasifikasi Algoritma C4.5.

Mulai

Input Data Training

Hitung Entropy dan Gain dari tiap atribut

Buat simpul Akar Pohon berdasarkan Informasi Gain

terbesar

Hitung Entropy dan information Gain dari tiap Atribut dengan

menghilangkan Atribut yang telah dipilih sebelumnya

Buat simpul Internal Pohon Berdasarkan Information Gain

Semua Atribut sudah Masuk pada Pohon ?

Generate aturan keputusan

Selesai

Lakukan pemangkasan pohon

Y

T

23

3. Tahap Implementasi Sistem

Tahap implementasi sistem atau proses coding merupakan proses

penerjemahan dari perancangan sistem.

4. Tahap Pengujian Sistem

Tahap pengujian sistem atau evaluasi menggunakan metode

pengujian yang digunakan pada penelitian ini terdiri dari pengujian black

box dan pengujian akurasi. Pada pengujian fungsional akan

menggunakan metode pengujian black box, metode pengujian black box

memfokuskan pada keperluan fungsional dari perangkat lunak. Oleh

karena itu, pengujian dengan metode black box memungkinkan untuk

membuat himpunan kondisi input yang akan melatih seluruh syarat-syarat

fungsional suatu program.

B. Jenis Penelitian

Penelitian ini merupakan penelitian historis dengan menggunakan

metode eksperimental yaitu dengan melakukan perancangan dan

pembuatan model sistem. Pengumpulan data dilakukan dengan metode

studi pustaka (library research) dan metode pengumpulan data lapangan

(field research) dan pembuatan aplikasi berdasarkan analisis hasil dari

metode data mining yakni algoritma nearest neighbor dan algoritma C4.5.

24

C. Arsitektur Sistem

Client

Gambar 3.7 Arsitektur Sistem

Arsitektur perangkat lunak terdiri dari Data base yang berfungsi

untuk menampung data berupa file data set guru dengan menggunakan

MySQL. Selanjutnya terdapat Aplikasi Web dimana aplikasi web yang

digunakan disini yaitu bahasa pemrograman PHP, Javascript, HTML,

jquery dan CSS serta Macromedia Dreamweaver sebagai editor untuk

membangun listing. Serta terdapat Server Web yang merupakan sebuah

program yang dijalankan pada Komputer server, yang bertugas

menjalankan jasa layanan web kepada komputer-komputer client yang

terhubung kepadanya. Penelitian ini menggunakan Appserv sebagai web

server.

D. Alat dan Bahan

Spesifikasi kebutuhan yang digunakan dalam mengimplementasikan

sistem ini adalah sebagai berikut :

1. Spesifikasi Hardware

a. PC / Notebook : Processor Core i3, RAM 4 Gb, Harddisk 500 GB.

b. Mouse

c. Keyboard

Response

Request

25

2. Spesifikasi Software

a. Microsoft Windows 7

b. PHP

c. Macromedia dreaweaver

d. Microsoft SQL Server

e. Web browser

f. Star UML

E. Lokasi dan Waktu Penelitian

Penelitian ini dilakukan di laboratorium Teknik Informatika Universitas

Hasanuddin dengan mengambil data guru di kantor Pendidikan Nasional

Kota Makassar dan kantor Pendidikan Nasional Kabupaten Maros

Propinsi Sulawesi Selatan. Penelitian dilakukan selama 4 bulan, dimulai

sejak di setujui proposal penelitian.

26

BAB IV

HASIL PENELITIAN DAN PEMBAHASAN

A. Gambaran Umum Sistem

Gambaran umum sistem yang akan dikembangkan pada penelitian ini

dapat dilihat pada gambar 4.1 di bawah ini :

Gambar 4.1 Gambaran umum sistem

Data set guru ini nantinya akan diinput ke dalam suatu sistem

perangkat lunak database. Data guru yang sudah diinput akan menjadi data

training dan disimpan dalam database. Selanjutnya data tersebut diolah

menggunakan sistem perangkat lunak pendukung keputusan dengan

teknologi data mining menggunakan algoritma nearest neighbor yaitu

menentukan kedekatan kasus atau tetangga terdekat dan algoritma C4.5

dengan pohon keputusan.

Data set Guru

Sistem

perangkat lunak

database

Sistem perangkat

lunak pendukung keputusan

dengan teknologi

data mining

Kebutuhan guru

Input Output

Proses

27

Dari hasil pengolahan tersebut didapatkan informasi kebutuhan guru

pada setiap sekolah seperti pada gambar 4.2 di bawah ini :

Gambar 4.2 Proses Klasifikasi Data

Pada gambar 4.2 proses klasifikasi data terlihat bahwa data training

diproses menggunakan dua algoritma yang berbeda, yaitu algoritma Nearest

Neighbor dengan menentukan kedekatan kasus atau tetangga terdekat dan

algoritma C4.5 menggunakan pohon keputusan. Dari kedua metode ini akan

menghasilkan kaidah kebutuhan guru pada tiap sekolah. Melakukan

perbandingan metode nearest neighbor dan c4.5 dengan membandingkan

hasil prediksi algoritma nearest neighbor dan algoritma C4.5 untuk

pemerataan kebutuhan guru dengan data asli yang bersumber pada dinas

pendidikan nasional.

Kebutuhan Guru

Data Training (Data set

guru)

Metode Nearest Neigbor

Algoritma C4.5 Kebutuhan Guru

28

B. Hasil Analisis dan Pembahasan

1. Penerapan algoritma nearest neighbor

Algoritma nearest neighbor adalah pendekatan untuk mencari kasus

dengan menghitung kedekatan antara kasus baru dengan kasus lama.

Tabel 4.1 Kasus

Keterangan :

a : Alokasi Jam b : Guru Mapel c1 : Jumlah Rombel 1 c2 : Jumlah Rombel 2 c3 : Jumlah Rombel 3

NO SEKOLAH MAPEL ALOKASI JAM (a)

GURU MAPEL

(b)

JUMLAH ROMBEL

1 (c1)

2 (c2)

3 (c3)

1 SMA NEG 1 AGAMA ISLAM 2 2 6 6 6

PPKN 2 3 6 6 6

BAHASA INDONESIA 4 2 6 6 6

BAHASA INGGRIS 4 5 6 6 6

MATEMATIKA 4 3 6 6 6 2 SMA NEG 2 AGAMA ISLAM 2 2 6 6 6

PPKN 2 3 6 6 6

BAHASA INDONESIA 4 2 6 6 6

BAHASA INGGRIS 4 2 6 6 6

MATEMATIKA 4 4 6 6 6

29

Untuk memprediksi apakah alokasi waktu cukup, kurang atau lebih

untuk setiap sekolah dan masing-masing mata pelajaran pada tabel kasus,

tabel 3.1 maka dilakukan langkah-langkah berikut :

Untuk mata pelajaran agama Gunakan rumus similarity pada

similarity =

=

= 1.5

Dari Perhitungan similarity didapatkan nilai alokasi waktu untuk mata

pelajaran agama adalah 1.5, untuk nilai alokasi waktu 1.5 perhatikan nilai

atribut untuk guru mata pelajaran agama pada tabel 4.1, nilai atribut tersebut

adalah 2.

Lakukan perhitungan similarity selanjutnya untuk mata pelajaran

PPKN, Bahasa Indonesia, Bahasa Inggris dan Matematika pada masing-

masing sekolah sesuai dengan kasus pada tabel 4.1. Hasil perhitungan

tersebut dapat ditunjukkan pada tabel 4.2.

30

Tabel 4.2 Hasil perhitungan Similarity dan Output

NO SEKOLAH MAPEL ALOKASI JAM

GURU MAPEL

JUMLAH ROMBEL SIMI

LARITY OUTPUT 1 2 3

1 SMA NEG 1 AGAMA ISLAM 2 2 6 6 6 1.5 Lebih

PPKN 2 3 6 6 6 1.5 Lebih

BAHASA INDONESIA 4 2 6 6 6 3 Kurang

BAHASA INGGRIS 4 5 6 6 6 3 Lebih

MATEMATIKA 4 3 6 6 6 3 Cukup 2 SMA NEG 2 AGAMA ISLAM 2 2 6 6 6 1.5 Lebih

PPKN 2 3 6 6 6 1.5 Lebih

BAHASA INDONESIA 4 2 6 6 6 3 Kurang

BAHASA INGGRIS 4 2 6 6 6 3 Kurang

MATEMATIKA 4 4 6 6 6 3 Lebih

Hasil output pada tabel 4.2 dihasilkan menggunakan aturan sebagai berikut :

a. Jika Nilai atribut pada guru mata pelajaran lebih besar daripada hasil

perhitungan alokasi waktu maka nilai output adalah Lebih

b. Jika Nilai atribut pada guru mata pelajaran lebih kecil daripada hasil

perhitungan alokasi waktu maka nilai output adalah kurang.

c. Jika nilai atribut guru mata pelajaran sama dengan hasil perhitungan

alokasi waktu maka nilai output adalah cukup.

Pada tabel 4.2 juga merupakan tabel informasi mengenai alokasi

waktu untuk sekolah pada tiap mata pelajaran sehingga memperoleh input

apakah alokasi lebih, kurang atau cukup berdasarkan perhitungan Nilai

31

similarity atau jarak terdekat, kemudian membandingkan nilai similarity

dengan guru mata pelajaran. Jika nilai similarity besar dibandingkan nilai guru

mata pelajaran maka kurang, dan jika nilai similarity kecil dibandingkan nilai

guru mata pelajaran maka lebih dan jika nilai similarity sama dengan nilai

guru mata pelajaran maka cukup.

Jadi untuk contoh kasus SMU Negeri 3 dengan inputannya :

Sekolah : SMU Negeri 3

Mapel : Agama Islam

Alokasi Jam : 2

Guru Mapel : 4

Jumlah Rombel 1, 2 dan 3 masing-masing : 3, 4, 3

Setelah dilakukan perhitungan similarity maka diperoleh nilai alokasi waktu

adalah 2.5 dengan output lebih.

2. Penerapan Algoritma C4.5

Secara umum algoritma C4.5 untuk membangun pohon keputusan

memilih atribut sebagai akar dan membuat cabang-cabang untuk tiap-tiap

nilai. Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi

dari atribut-atribut yang ada. Untuk menghitung gain digunakan rumus seperti

tertera dalam persamaan 1 dan perhitungan nilai entropy. Berikut contoh

kasus pada tabel 4.3. untuk menentukan output kebutuhan guru.

32

Tabel. 4.3 Kasus Kebutuhan Guru (sumber: Dinas Pendidikan

Nasional Kota Makassar)

Sekolah No Mata Pelajaran Kebutuhan Guru

Jumlah Guru Output

SMU Negeri 2 1 Agama Islam Lebih lebih kurang

2 Bahasa Indonesia Cukup Kurang Kurang

3 PPKN Cukup kurang cukup

4 Bahasa Inggris Lebih kurang kurang

5 Matematika cukup lebih lebih

6 Biologi cukup lebih lebih

Dalam kasus yang tertera pada Tabel 4.3. akan dibuat pohon keputusan

untuk menentukan apakah kebutuhan guru bernilai lebih, cukup atau kurang

dengan langkah-langkahnya adalah sebagai berikut :

Langkah 1. Memilih atribut sebagai akar

Untuk memilih atribut sebagai akar, didasarkan pada gain tertinggi dari

tertinggi dari atribut-atribut yang ada. Untuk menghitung gain digunakan

rumus seperti tertera pada persamaan 2.3 sebelumnya dan perhitungan nilai

entropy seperti tertera dalam persamaan 2.2.

33

Langkah 2. Perhitungan level 0

Menghitung Jumlah kasus untuk kebutuhan guru yang kurang, cukup

dan lebih dan entropy untuk semua kasus dan kasus yang dibagi

berdasarkan atribut kebutuhan guru dan jumlah guru. Setelah itu lakukan

perhitungan Gain untuk setiap atribut. Hasil Perhitungan ditunjukkan pada

tabel 4.4 perhitungan level 0.

Tabel 4.4. Perhitungan level 0

Atribut Nilai atribut

Jumlah kasus

Jumlah lebih

Jumlah cukup

Jumlah kurang Entropy Gain

6 2 1 3 0.187635764

Kebutuhan Guru 0.520969097

lebih 2 0 0 2 0

cukup 4 2 1 1 0.5

kurang 0 0 0 0 0

Jumlah Guru 0.187635764

kurang 3 0 1 2 0

lebih 3 2 0 1 0

Dari tabel 4.4. dapat diketahui bahwa atribut dengan gain tertinggi

adalah Kebutuhan Guru dengan demikian maka kebutuhan guru dapat

menjad level akar. Ada tiga nilai atribut dari kebutuhan guru yaitu lebih,

kurang dan cukup. Nilai atribut dari kurang tidak terdapat pada kasus dan

bernilai 0. Jadi hanya dilakukan perhitungan lebih lanjut untuk nilai atrbut

lebih dan cukup, nilai atribut lebih sudah mengklasifikasikan menjadi 1 kelas

sehingga tidak dilakukan peritungan lebih lanjut dan atribut cukup akan

34

dilakukan perhitungan. Dari hasil tersebut digambarkan pohon keputusan

sementara seperti pada gambar 4.3.

Gambar 4.3. Pohon keputusan Level 0

Menghitung jumlah kasus untuk menetukan kebutuhan guru kurang, lebih

dan cukup dan entropy dari semua kasus dan kasus yang dibagi

berdasarkan atribut jumlah guru yang dapat menjadi nilai akar dari nilai

atribut cukup. Hasil perhitungan terdapat pada tabel 4.5

Tabel 4.5. Perhitungan Level 1.1

Atribut Nilai atribut

Jumlah kasus

Jumlah lebih

Jumlah cukup

Jumlah kurang Entropy Gain

Kebutuhan Guru –cukup 4 2 1 1 0.125

Jumlah Guru

kurang 2 0 1 1 0

lebih 2 2 0 0 0

Kebutuhan Guru

Lebih Cukup

1.2 ?

kurang

35

Dari hasil tabel 4.5 perhitungan level 1.1 dapat dibuatkan gambar

pohon keputusannya. Adapun gambar pohon keputusan dapat dilihat pada

gambar 4.4 pohon keputusan level 1.

Gambar 4.4 Pohon keputusan level 1

Gambar 4.4 merupakan pohon keputusan yang terakhir karena masing

masing nilai atribut sudah mengklasifikasikan kelasnya dan kasus menjadi

satu. Aturan yang dibentuk dari algoritma C4.5 adalah :

1. Jika kebutuhan guru ebih maka output adalah kurang.

2. Jika kebutuhan guru cukup dan jumlah guru lebih maka output adalah

lebih.

3. Jika kebutuhan guru cukup dan jumlah guru kurang maka output adalah

cukup.

Lebih Cukup

Kebutuhan Guru

Jumlah Guru

kurang

Lebih Kurang

lebih Cukup

36

C. User Interface

Sistem yang dirancang terdiri dari beberapa interface yang digunakan

untuk melakukan proses penginputan data yang dibutuhkan dalam proses

sistem pendukung keputusan sehingga menghasilkan informasi yang optimal.

Adapun user interface dari sistem yang dirancang adalah :

1. Form input data

a. Input Data Sekolah

Gambar 4.5 Form input data sekolah

Form input data sekolah untuk menginput kode, nama sekolah, alamat dan

nomor telepon sekolah. Data sekolah yang telah di input kemudian akan di

simpan pada database.

37

b. Input Data Mata Pelajaran

Gambar 4.6 Form Input Data Mata Pelajaran

Form input data mata pelajaran untuk menginput kode mata pelajaran, nama

mata pelajaran, alokasi waktu belajar, semester dan tahun. Data mata

pelajaran yang telah di input kemudian akan di simpan pada database.

c. Input pilihan algoritma

Gambar 4.7 Form Input Pilihan Algoritma

38

Form input pilihan algoritma untuk memilih algoritma nearest neighbor

atau algoritma c4.5. Jika dipilih algoritma C4.5, maka akan muncul pilihan

nama sekolah yang akan dihitung kebutuhan gurunya tiap mata pelajaran

seperti pada gambar 4.9 dan akan menghasilkan output sistem seperti pada

gambar 4.10 :

Gambar 4.8 Form Proses Algoritma C4.5

Gambar 4.9 Output Sistem Algoritma C4.5

39

Form input pilihan algoritma untuk memilih algoritma nearest neighbor atau

algoritma c4.5. Jika dipilih algoritma nearest neighbor, maka akan muncul

pilihan nama sekolah yang akan dihitung kebutuhan gurunya tiap mata

pelajaran seperti pada gambar 4.11 dan akan menghasilkan output sistem

seperti pada gambar 4.10 :

Gambar 4.10 Form Proses Algoritma Nearest Neighbor

Gambar 4.11 Output Sistem Nearest Neighbor

40

D. Pengujian Sistem

Metode pengujian sistem yang digunakan adalah pengujian black box

dan pengujian akurasi. Pengujian black box digunakan untuk pengujian

fungsional sedangkan pengujian akurasi menguji keakuratan dari sistem dan

hasil prediksi dan hasil prediksi yang dihasilkan dengan data yang

sesungguhnya.

1. Pengujian Black Box

Metode pengujian black box memfokuskan pada keperluan

fungsional dari perangkat lunak. Uji coba black box memungkinkan

pengembangan perangkat lunak untuk membuat himpunan kondisi input

yang akan melatih seluruh syarat-syarat fungsional program. Adapun hasil

dari pengujian digambarkan seperti tabel 4.6 dibawah ini

Tabel 4.6. Pengujian Penginputan Mata Pelajaran

No Nama Form

yang diuji Skenario Pengujian

Hasil yang diharapkan

Hasil pengujian

1. Form Mata

Pelajaran

Tombol simpan

Ketika memasukkan data kode mata pelajaran, dan

nama pada textbox kemudian menekan

tombol simpan, maka data tersebut

akan tersimpan dalam database.

[ ] Diterima [ ] Ditolak

41

Screen Shoot

Setelah menekan tombol simpan

2. Form Mata

Pelajaran Tombol edit

Ketika tombol edit diklik maka akan ditampilkan form

mata pelajaran yang akan diedit,

sehingga data yang sudah ada

seelumnya atau sudah tersimpan

sebelumnya dapat diedit, atau diubah kemudian diproses dan simpan kembali kedalam database.

[ ] Diterima [ ] Ditolak

42

Screen Shoot

Setelah menekan tombol edit

Setelah menekan tombol simpan

3. Form Mata

Pelajaran

Tombol hapus

Ketika menekan tombol hapus, maka

akan muncul pernyataan bahwa data akan dihapus. Ketika menekan OK

yang tersimpan dalam database

langsung terhapus

[ ] Diterima [ ] Ditolak

43

Screen Shoot

Sebelum menekan tombol hapus

Sebelum menekan tombol hapus

Setelah menekan Ya untuk di hapus

2. Pengujian akurasi

Pengujian akurasi merupakan pengujian keakuratan dari sistem dan hasil

prediksi yang dihasilkan dengan data yang sesungguhnya. Pengujian

44

akurasi dilakukan pada enam sekolah dengan dengan tiga mata pelajaran,

seperti yang tertera dalam tabel 4.7 pengujian akurasi.

Tabel 4.7 Pengujian Akurasi Algoritma Nearest Neighbor

No Nama Sekolah Mata Pelajaran Data Prediksi

Data Asli Prediksi Benar

1. SMA Negeri 1 Makassar

Agama Islam Lebih Lebih Benar Bahasa Indonesia Lebih Lebih Benar PPKn Lebih Lebih Benar

2. SMA Negeri 6 Makassar

Agama Islam Cukup Cukup Benar Bahasa Indonesia Cukup Lebih Salah PPKn Cukup Cukup Benar

3. SMA Negeri 20 Makassar

Agama Islam Lebih Lebih Benar Bahasa Indonesia Cukup Cukup Benar PPKn Kurang Cukup Salah

4. SMA Negeri 1 Maros

Agama Islam Kurang Cukup Salah Bahasa Indonesia Cukup Cukup Benar PPKn Cukup Cukup Benar

5. SMA Negeri 4 Bantimurung

Agama Islam Cukup Cukup Benar Bahasa Indonesia Lebih Lebih Benar PPKn Lebih Kurang Salah

6. SMA Negeri 7 Mallawa

Agama Islam Cukup Cukup Benar Bahasa Indonesia Kurang Kurang Benar PPKn Kurang Cukup Salah

Dari tabel 4.7 pengujian akurasi menggunakan algoritma nearest

neighbor yang terdiri inputan nama sekolah dan mata pelajaran, data

prediksi, data asli dan prediksi benar. Dari tabel 4.7 dapat dilihat bahwa

jumlah prediksi benar adalah 13 dari 18 data testing yang di uji dengan

inputan mata pelajaran. Jika data prediksi sesuai dengan data asli maka

bernilai benar, tetapi jika data prediksi tidak sesuai dengan data asli maka

bernilai salah. Dapat dihitung tingkat akurasi dari algoritma nearest neighbor

45

sehingga dapat digunakan sebagai acuan untuk memprediksi kebutuhan guru

pada setiap sekolah. Adapun hasil perhitungan akurasi :

Keakuratan = …………………..…..(4.1)

= 0.72 x 100%

= 72 %

Jumlah data yang akan di uji adalah 18 dengan jumlah kesalahan

adalah 5, maka hasil akurasi yang diperoleh adalah 72% sehingga dapat di

prediksi bahwa algoritma nearest neighbor yang digunakan untuk

memprediksi kebutuhan guru adalah akurat.

Tabel 4.8 Pengujian Akurasi Algoritma C4.5

No Nama Sekolah Mata Pelajaran Output/ Prediksi

Data Sebenarnya

Prediksi Benar

1. SMA Negeri 1 Makassar

Agama Islam Lebih Lebih Benar Bahasa Indonesia Lebih Lebih Benar PPKn Lebih Lebih Benar

2. SMA Negeri 6 Makassar

Agama Islam Cukup Cukup Benar Bahasa Indonesia Lebih Lebih Benar PPKn Cukup Cukup Benar

3. SMA Negeri 20 Makassar

Agama Islam Cukup Lebih Salah Bahasa Indonesia Cukup Cukup Benar PPKn Cukup Cukup Benar

4. SMA Negeri 1 Maros

Agama Islam Cukup Cukup Benar Bahasa Indonesia Kurang Cukup Salah PPKn Cukup Cukup Benar

5. SMA Negeri 4 Bantimurung

Agama Islam Cukup Cukup Benar Bahasa Indonesia Kurang Lebih Salah PPKn Kurang Kurang Benar

46

6. SMA Negeri 7 Mallawa

Agama Islam Cukup Cukup Benar Bahasa Indonesia Kurang Kurang Benar PPKn Cukup Cukup Benar

Dari tabel 4.8 pengujian akurasi menggunakan algoritma nearest neighbor

yang terdiri inputan nama sekolah dan mata pelajaran, data prediksi, data asli

dan prediksi benar. Dari tabel 4.8 dapat dilihat bahwa jumlah prediksi benar

adalah 15 dari 18 data testing yang di uji dengan inputan mata pelajaran.

Jika data prediksi sesuai dengan data asli maka bernilai benar, tetapi jika

data prediksi tidak sesuai dengan data asli maka bernilai salah. Dapat

dihitung tingkat akurasi dari algoritma C4.5 sehingga dapat digunakan

sebagai acuan untuk memprediksi kebutuhan guru pada setiap sekolah.

Adapun hasil perhitungan akurasi :

Keakuratan = …………………..…..(4.1)

= 0.83 x 100%

= 83 %

Jumlah data yang akan di uji adalah 18 dengan jumlah kesalahan adalah 3,

maka hasil akurasi yang diperoleh adalah 83% sehingga dapat di prediksi

bahwa algoritma C4.5 yang digunakan untuk memprediksi kebutuhan guru

adalah akurat.

47

Dari hasil perbandingan algoritma nearest neighbor dan algoritma

C4.5, dengan masing-masing nilai keakuratan 72% dan 83%, maka nilai

keakuratan C4.5 lebih besar sehingga hasil prediksi dari algoritma C4.5 lebih

akurat dibandingkan dengan algoritma nearest neighbor.

48

BAB V

PENUTUP

A. KESIMPULAN

Berdasarkan hasil penelitian yang telah dilakukan, maka dapat ditarik

beberapa kesimpulan sebagai berikut :

1. Model klasifikasi dari aloritma nearest neighbor dan C4.5 diperoleh

bahwa kebutuhan guru pada kota Makassar dan kabupaten Maros tidak

merata penyebarannya.

2. Dari hasil perbandingan algoritma nearest neighbor dan algoritma C4.5,

dengan masing-masing nilai keakuratan 72% dan 83%, maka nilai

keakuratan algoritma C4.5 lebih besar sehingga hasil prediksi dari

algoritma C4.5 lebih akurat dibandingkan dengan algoritma nearest

neighbor.

B. SARAN

Berdasarkan hasil penelitian yang telah dilakukan, maka dapat

disarankan beberapa hal sebagai berikut:

1. Pada penelitian ini peneliti menggunakan dua algoritma klasifikasi yaitu

metode nearest neighbor dan algoritma C4.5, untuk selanjutnya bisa

49

dilanjutkan dengan menggunakan jenis algoritma data mining yang

berbeda agar lebih bervariasi.

2. Dalam penelitian ini dibatasi data hanya untuk SMA Negeri, untuk

penelitian selanjutnya bisa dikembangkan penelitian ke SMA Swasta dan

SMK baik Negeri maupun Swasta.

3. Perlu dilakukan penelitian lebih lanjut tentang keadaan sekolah secara

keseluruhan meliputi keadaan siswa, sarana dan prasarana

menggunakan data mining.

DAFTAR PUSTAKA

[1] Petunjuk Teknis (Juknis) Pelaksanaan Peraturan Bersama Lima Menteri

tentang penataan dan Pemerataan Guru PNS, November 2011.

[2] Sanjaya, Wina. DR.M.Pd.2006. Pembelajaran Dalam Implementasi

Kurikulum Berbasis Kompetensi. Jakarta: Kencana.

[3] Kusrini, Emha T. Luthfi. “Algoritma Data Mining”. Penerbit ANDI, 2009

[4] Budi Santosa, “Data Mining Teknik Pemanfaatan Data untuk Keperluan

Bisnis”. Penerbit 2007.

[5] Ari Kurniawan, Mochamad Hariadi. “Klasterisasi kompetensi guru

menggunakan hasil penilaian portofolio sertifikasi guru dengan metode

data mining”. Jurnal Teknik Elektro (Telematika) , Institut Teknologi

Sepuluh Nopember Surabaya. [6] Priadi Surya. “Pemetaan Pendidikan (Education Mapping) Sebagai

Dasar Meningkatkan Layanan Pendidikan”. Universitas Negeri

Yogyakarta dimuat dalam Makalah ICEMAL (International Conference

Educational Management, Administration and Leadership), 4-5 Juli

2012.

[7] Hukmiah Arif. “Pemetaan Mutu Pendidik dan Tenaga Kependidikan

Berbasis Spasial”. Tesis Program Pasca Sarjana Universitas

Hasanuddin Makassar. 2011.

[8] Ninki Hermaduanti, Sri Kusumadewi. “Sistem Pendukung Keputusan

berbasis SMS untuk menentukan status gizi dengan metode k-nearest

neighbor”. Fakultas Teknologi Industri Universitas Islam Indonesia.

[9] Kusrini, Sri Hartati, Retantyo Wardoyo, Agus Harjoko “Perbandingan

metode Nearest Neighbor dan algoritma C45 untuk menganalisis

kemungkinan pengunduran diri calon mahasiswa di STMIK AMIKOM

Yogyakarta”, Yogyakarta, Jurnal DASI Vol. 10 No. 1 Maret 2009, ISSN:

1411-3201.

[10] Sunjana. “Klasifikasi Data Nasabah sebuah Asuransi menggunakan

Algoritma C4.5”. SNATI 2010 Yogyakarta, 19 Juni 2010.

[11] Maulani Kapiudin. “Data mining untuk klasifikasi pelanggan dengan Ant

Colony Optimization”. Jurusan Teknik Informatika Fakultas Teknologi

Industri Universitas Kristen Petra, yang dimuat pada paper informatika

Petra.

[12] Roger S. Pressman. “Rekayasa Perangkat Lunak Pendekatan Praktisi

(buku satu)”. Penerbit Andi Yogyakarta. 2002.

[13] Yuni Sugiarti. “Analisis dan Perancangan UML (Unified Modelling

Language) Generated VB.6”. Penerbit Graha Ilmu Yogyakarta. 2013.