Download - PENERAPAN ALGORITMA FP-GROWTH UNTUK ANALISIS POLA …repository.usd.ac.id/6271/2/125314016_full.pdf · vii ABSTRAK Ujian nasional(UN) merupakan salah satu contoh sistem evaluasi standar

i

PENERAPAN ALGORITMA FP-GROWTH UNTUK ANALISIS POLA ASOSIASI

DAYA SERAP HASIL JIAN NASIONAL MATA PELAJARAN BAHASA

INDONESIA SMA DI YOGYAKARTA

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Teknik Informatika

Disusun Oleh:

Brigita Cynthia Dewi

125314016

PROGRAM STUDI TEKNIK INFORMATIKA

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2016

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

ii

FP GROWTH ALGORITHM IMPLEMENTATION FOR ABSORTIVE

CAPACITY ASSOCIATION RULE ANALYSIS ON INDONESIAN LANGUAGE

SUBJECT AT SENIOR HIGH SCHOOL NATIONAL EXAMINATION IN

YOGYAKARTA

A THESIS

Presented as Partial Fulfillment of The Requirement

To Obtain The Sarjana Komputer Degree

In Informatics Engineering Study Program

By:

Brigita Cynthia Dewi

125314016

INFORMATICS ENGINEERING STUDY PROGRAM

DEPARTMENT OF INFORMATICS ENGINEERING

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2016


iii


iv


v

ah.


vi


vii

ABSTRAK

Ujian nasional(UN) merupakan salah satu contoh sistem evaluasi standar

pendidikan yang ada di Indonesia. UN ini dilaksanakan dengan tujuan untuk

memetakan mutu pendidikan di Indonesia. Kegiatan evaluasi memang penting untuk

dilakukan demi meningkatnya mutu pendidikan karena kegiatan ini evaluasi dapat

memperlihatkan sampai sejauh mana siswa memahami materi yang diberikan. Setiap

tahunnya Kementrian Pendidikan dan Kebudayaan (kemendikbud) selalu

mengeluarkan nilai hasil UN dengan harapan dari data tesebut dapat ditemukan

sebuah informasi yang bermanfaat untuk peningkatan mutu pendidikan di Indonesia.

Salah satu bidang ilmu yang dapat digunakan untuk mendapatkan informasi dari

kumpulan data tersebut adalah dengan data mining.

Salah satu penerapan data mining pada tugas akhir ini menggunakan teknik

association rule dengan algoritma FP-Growth. Teknik ini dapat digunakan untuk

mencari frequent itemset dalam kumpulan data. Penelitian ini bertujuan untuk

menerapkan algoritma FP-Growth pada data nilai daya serap UN SMA di Yogyakarta

untuk mata pelajaran Bahasa Indonesia.

Metodologi penelitian yang digunakan dalam penelitian ini adalah penelitian

pustaka, KDD (Knowledge Discovery in Database) dan pembuatan laporan. Pada

tahap awal KDD akan dilakukan pembersihan data dan integrasi data secara manual

melalui Ms.Excel. Selanjutnya dilakukan seleksi data dan transformasi data di dalam

perangkat lunak yang dibuat. Setelah itu dilakukanlah proses data mining dan

terakhir adalah proses pattern evaluation dan knowledge presentation yang

dikenakan pada hasil aturan asosiasi yang terbentuk. Pengujian terhadap sistem ini terdiri dari pengujian black box, pengujian validitas dan pengujian running time.

Berdasarkan semua pengujian, disimpulkan bahwa algoritma FP-Growth dapat

diterapkan dan dapat menemukan aturan asosiasi yang menarik dari data nilai daya

serap. Sistem yang dibuat dengan melakukan penerapan metode FP-Growth ini

menghasilkan 5 aturan asosiasi yang menarik berdasarkan nilai lift ratio tertinggi untuk

tahun akademik 2012/2013-2013/2014 ada 3 aturan asosiasi dan untuk tahun

2014/2015 ada 2 aturan asosiasi. Secara subyektif kompetensi-kompetensi dalam

aturan-aturan asosiasi tersebut memang saling berkaitan.

Kata Kunci : Association Rule, FP-Growth, data mining, nilai daya serap


viii

ABSTRACT

The national examination (UN) is one example of a standard evaluation system

of education in Indonesia. UN carried out in order to map the quality of education in

Indonesia. Evaluation is the important things to do for improving the quality of

education. this activity can reveal the extent to which students understand the material

provided. Each year, Kementrian Pendidikan dan Kebudayaan (Kemendikbud) always

display the results of the UN with the propose can be founded a useful information for

improving the quality of education in Indonesia. One area of science that can be used

to obtain information from the dataset is with data mining.

This thesis using one technic of data mining association rule with FP-Growth

algorithm. This technique can be used to find frequent itemset in the data set. This

research aims to implement the algorithm FP-Growth in the value data absorption UN

High School in Yogyakarta's for Indonesian subjects.

The methodology for this research used in this study is a research library, KDD

(Knowledge Discovery in Databases) and make a report. In the early stages of KDD

will do data cleansing and data integration manually at Ms.Excel. Furthermore, the data

selection and transformation of data will be do at the software that was created. After

that perform the data mining process and the last is a process of pattern evaluation, and

knowledge presentation imposed on the results of the association rules formed. Testing

of the system consists of a black box testing, testing the validity and running time

testing.

Based on all the tests, it was concluded that FP-Growth algorithm can be

applied and can find an interesting association rules from the data value of absorption.

The system that was created with FP-Growth method produces 5 interesting association

rules based on the value of the highest lift ratio for the academic year 2012 / 2013-2013

/ 2014 there are three rules of the association and for the year 2014/2015 there are two

rules of association. Subjectively competencies in the rules of the association are

correlated.

Keyword : Association Rule, FP-Growth, data mining, nilai daya serap, absorptive

capacity


ix

KATA PENGANTAR

Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa karena atas

rahmat dan karunia-Nya, penulis dapat menyelesaikan Tugas Akhir yang berjudul

“PENERAPAN ALGORITMA FP-GROWTH UNTUK ANALISIS POLA ASOSIASI

DAYA SERAP HASIL UJIAN NASIONAL MATA PELAJARAN BAHASA

INDONESIA SMA DI YOGYAKARTA” ini dengan baik.

Dalam proses penulisan tugas akhir ini penulis menyadari bahwa ada begitu

banyak pihak yang turut membantu memberikan motivasi semangat dan juga bantuan

dalam menyelesaikan tugas akhir ini. Oleh karena itu saya ingin mengucapkan terima

kasih antara lain kepada :

1. Bapak Sudi Mungkasi, S.Si., M.Math.Sc.,Ph.D. selaku Dekan Fakultas Sains

dan Teknologi.

2. Ibu Dr. Anastasia Rita Widiarti, selaku Kepla Prodi Teknik Informatika.

3. Bapak Puspaningtyas Sanjoyo Adi, S.T., M.T sebagai dosen pembimbing

akademik, yang telah memberikan bimbingan dan saran selama penulis menempuh

studi.

4. Ibu P.H Prima Rosa, S.Si., M.Sc selaku dosem pembimbing skripsi yang telah

memberikan kesabaran, waktu dan saran sehingga dapat diselesaikannya tugas akhir

ini.

5. Seluruh dosen yang telah mendidik dan memberikan pengetahuan dan

pengalaman berharga selama penulis belajar di Universitas Sanata Dharma

Yogyakarta.

6. Orang tua dan adik yang telah memberikan kasih sayang, perhatian, doa dan

dukungan sehingga penulis dapat menyelesaik tugas akhir.

7. Teman-teman bimbingan bu Rosa yang selalu dapat memberikan motivasi dan

semangat.


x


xi

DAFTAR ISI

A THESIS.............................................................................................................................ii

HALAMAN PERSETUJUAN ................................................. Error! Bookmark not defined.

HALAMAN PENGESEHAN ............................................................................................... iv

PERNYATAAN KEASLIAN KARYA .................................................................................v

LEMBAR PERNYATAAN PERSETUJUAN ...................................................................... vi

ABSTRAK ......................................................................................................................... vii

ABSTRACT ...................................................................................................................... viii

KATA PENGANTAR.......................................................................................................... ix

DAFTAR ISI ....................................................................................................................... xi

DAFTAR GAMBAR ......................................................................................................... xiii

DAFTAR TABEL .............................................................................................................. xiv

DAFTAR LAMPIRAN ....................................................................................................... xv

BAB I .................................................................................................................................. 1

PENDAHULUAN ............................................................................................................... 1

1.1. Latar Belakang...................................................................................................... 1

1.2. Rumusan Masalah ................................................................................................. 3

1.3. Batasan Masalah ................................................................................................... 4

1.4. Tujuan Penelitian .................................................................................................. 4

1.5. Manfaat Penelitian ................................................................................................ 4

1.6 Metodologi Penelitian ........................................................................................... 5

1.7 Sistematika Penulisan ........................................................................................... 6

BAB II ................................................................................................................................. 7

LANDASAN TEORI ........................................................................................................... 7

2.1 Pengertian Penambangan Data .............................................................................. 7

2.2 Tujuan Penambangan Data .................................................................................... 7

2.3 Teknik Data Mining .............................................................................................. 8

2.4 Knowledge Discovery in Database (KDD) ............................................................ 9

2.5 Association Rules ................................................................................................ 12


xii

BAB III .............................................................................................................................. 20

METODE PENELITIAN ................................................................................................... 20

3.1 Sumber Data ....................................................................................................... 20

3.2 Spesifikasi Alat ................................................................................................... 24

3.3 Tahap – Tahap Penelitian .................................................................................... 24

BAB IV ............................................................................................................................. 28

PEMROSESAN AWAL DAN PERANCANGAN PERANGKAT LUNAK

PENAMBANGAN DATA ................................................................................................. 28

4.1 Perancangan Awal Sumber Data ......................................................................... 28

4.2 Pengembangan Perangkat Lunak Penambangan Data .......................................... 29

BAB V ............................................................................................................................... 49

IMPLEMENTASI PENAMBANGAN DATA.................................................................... 49

DAN EVALUASI HASIL .................................................................................................. 49

5.1 Implementasi Rancangan Perangkat Lunak Penambangan Data ........................... 49

5.2.1 Implementasi Kelas Model ...................................................................... 49

5.2.2 Implementasi Kelas View ........................................................................ 49

5.2.3 Implementasi Kelas Controller................................................................. 50

5.2 Evaluasi Hasil ..................................................................................................... 50

5.2.1 Uji Coba Perangkat Lunak (Black Box Testing)........................................ 50

5.2.2 Uji Validitas ............................................................................................ 58

5.2.3 Uji Coba Data Set .................................................................................... 61

BAB VI ............................................................................................................................. 78

PENUTUP ......................................................................................................................... 78

6.1 Kesimpulan......................................................................................................... 78

6.2 Saran .................................................................................................................. 79

DAFTAR PUSTAKA ........................................................................................................ 80

LAMPIRAN …………………………………………………………………………………………………………………….82


xiii

DAFTAR GAMBAR

Gambar 2. 1 Diagram Model Klasifikasi ................................................................... 8

Gambar 2. 2 Penambangan data sebagai tahapan dalam proses KDD ....................... 10

Gambar 2. 3 Tabel data transaksi ............................................................................ 13

Gambar 2. 4 Tabel daftar support count tiap item .................................................... 13

Gambar 2. 5 Pembuatan FP Tree ............................................................................. 14

Gambar 2. 6 Sub-database node I3 .......................................................................... 15

Gambar 4. 1 Diagram Konteks ................................................................................ 30

Gambar 4. 2 Diagram Usecase ................................................................................ 31

Gambar 4. 3 Ilustrasi FPTree .................................................................................. 34

Gambar 4. 4 Susunan arraylist untuk kode sekolah 01-010 ..................................... 35

Gambar 4. 5 Susunan arraylist untuk kode sekolah 01-019 ..................................... 35

Gambar 4. 6 Data arraylist dalam arraylist ............................................................. 35

Gambar 4. 7 Diagram Kelas Desain ....................................................................... 36

Gambar 4. 8 Halaman Awal .................................................................................... 43

Gambar 4. 9 Halaman About ................................................................................... 44

Gambar 4. 10 Halaman Help ................................................................................... 45

Gambar 4. 11 Halaman Preprocessing .................................................................... 46

Gambar 4. 12 Halaman Asosiasi ............................................................................. 47

Gambar 4. 13 Halaman Database ............................................................................ 48

Gambar 4. 14 Diagram Kelas Analisis .................................................................... 85

Gambar 5. 1 (a)Kotak Dialog “Pilih File” (b)Tabel Dataset .................................... 51

Gambar 5. 2 Kotak Dialog Salah Pilih File .............................................................. 51

Gambar 5. 3 Tampilan Setelah Menekan Tombol “Tandai Semua” ......................... 52

Gambar 5. 4 Tampilan Setelah Menekan Tombol “Hapus Atribut” ......................... 52

Gambar 5. 5 Tampilan Setelah Menekan Tombol “Batal” ....................................... 52

Gambar 5. 6 Hasil Pencarian Aturan asosiasi .......................................................... 55

Gambar 5. 7 Tampilan Ketika Min Support dan Minimum confidence Tidak Diisi .. 55

Gambar 5. 8 Kotak Dialog Simpan Hasil................................................................. 56

Gambar 5. 9 Kotak Dialog Jika Berhasil Menyimpan Data ...................................... 56

Gambar 5. 10 Dataset Supermarket.arff ................................................................... 59

Gambar 5. 11 Dataset Setelah di Preprocessing ...................................................... 60

Gambar 5. 12 Uji Running Time Min Confidence=60% .......................................... 67





xiv

DAFTAR TABEL

Tabel 2. 1 Interval Daya Serap Siswa ...................................................................... 18

Tabel 3. 1 Tabel Atribut Data Mata Pelajaran Bahasa Indonesia 2012/2013 &

2013/2014 ............................................................................................................... 20

Tabel 3. 2 Tabel Atribut Data Mata Pelajaran Bahasa Indonesia 2014/2015 ............ 22

Tabel 4. 1 Daftar Kelas Untuk Tiap Usecase ........................................................... 32

Tabel 5. 1 Tabel Implementasi Kelas Model ........................................................... 49

Tabel 5. 2Tabel Implementasi Kelas View .............................................................. 49

Tabel 5. 3 Tabel Implementasi Kelas Controller ...................................................... 50

Tabel 5. 4 Tabel Hasil Uji Pada Halaman Preprocessing ......................................... 52

Tabel 5. 5 Tabel Pengujian Halaman Preprocessing ................................................ 54

Tabel 5. 6 Tabel Pengujian dengan Hitungan Manual .............................................. 57

Tabel 5. 7 Tabel Hasil Pengujian dengan WEKA .................................................... 60

Tabel 5. 8 Tabel Hasil Pengujian Tahun 2012/2013 & 2013/2014, Min Conf=60% . 63

Tabel 5. 9 Tabel Hasil Pengujian Tahun 2012/2013 & 2013/2014, Min Conf = 90% 63

Tabel 5. 10 Tabel Hasil Pengujian Tahun 2014/2015, Min Conf = 60% .................. 65

Tabel 5. 11 Tabel Hasil Pengujian Tahun 2014/2015, Min Conf = 90% .................. 66

Tabel 5. 12 Daftar aturan asosiasi data tahun 2012/2013-2013/2014........................ 71

Tabel 5. 13 Daftar aturan asosiasi data tahun 2014/2015 ......................................... 74


xv

DAFTAR LAMPIRAN

Lampiran 1 : Diagram Aktivitas .............................................................................. 82

Lampiran 2 : Diagram Kelas Analisis ...................................................................... 85

Lampiran 3 : Diagram Sequence ............................................................................. 86

Lampiran 4 : Diagram Kelas Desain ........................................................................ 89

Lampiran 5 : Penghitungan Manual......................................................................... 95

Lampiran 6 : Data…………………………………………………………………..106


1

BAB I

PENDAHULUAN

1.1. Latar Belakang

Setiap orang pasti memiliki kemampuan yang berbeda antara yang satu

dengan yang lainnya termasuk kemampuan seorang siswa dalam memahami suatu

mata pelajaran. Setiap siswa memiliki tingkat pemahaman yang berbeda-beda dalam

memahami setiap pelajaran yang diajarkan. Hal ini merupakan masalah yang sering

dihadapi oleh para guru dalam upaya meningkatkan kualitas belajar siswa.

Kemampuan seorang siswa dalam memahami materi bergantung juga pada

kemampuan daya serapnya. Daya serap merupakan kemampuan siswa dalam

menerima materi pembelajaran sesuai dengan batas yang ditentukan. Biasanya nilai

ini didapatkan setelah seorang guru selesai melaksanakan evaluasi pembelajaran

yang dilakukan setelah mengadakan tes. Dari hasil inilah seorang guru dapat

memetakan perolehan nilai yang dicapai oleh siswa. Ujian nasional adalah salah satu

sistem evaluasi standar pendidikan yang ada di Indonesia.Ujian Nasional merupakan

salah satu upaya pemerintah dalam rangka memacu peningkatan mutu pendidikan.

Ujian Nasional selain berfungsi untuk mengukur dan menilai pencapaian

kompetensi lulusan dalam mata pelajaran tertentu, serta pemetaan mutu pendidikan

pada tingkat pendidikan dasar dan menengah, juga berfungsi sebagai motivator bagi

pihak-pihak terkait untuk bekerja lebih baik guna mencapai hasil ujian yang baik.

Berbagai hasil penelitian menunjukkan bahwa dengan adanya Ujian Nasional, siswa

terdorong untuk belajar lebih baik dan guru terdorong untuk mengajar lebih baik

pula (Kemdikbud,2015). Salah satu cara yang dapat dilakukan untuk memajukan

mutu pendidikan di Indonesia adalah dengan cara mengkaji secara mendalam hasil

Ujian Nasional. Informasi hasil Ujian Nasional ini disediakan oleh Puspendik

Balitbang Kemdikbud kedalam beberapa bentuk seperti bentuk statistik, grafik,


2

daftar dan juga daya serap. Dalam penelitian ini, bentuk informasi yang akan

digunakan adalah informasi daya serap. Informasi daya serap ini berisi informasi

laporan daya serap Ujian Nasional siswa SMA dari program IPA dengan mata

pelajaran Bahasa Indonesia yang memiliki 21 kompetensi. Dari data tersebut

diharapkan dapat digali informasi keterkaitan antara kompetensi yang satu dengan

kompetensi lainnya dari sekolah-sekolah yang memiliki nilai daya serap yang

memenuhi standar yang ditentukan. Informasi tersebut dapat dimanfaatkan oleh

dinas pendidikan untuk membantu dinas pendidikan memberikan langkah-langkah

perbaikan mengenai metode pembelajaran ada saat ini guna meningkatkan mutu

pendidikan di Yogyakarta. Penelitian ini juga dapat dimanfaatkan oleh para peneliti

di bidang pendidikan sebagai rekomendasi analisa agar dapat dikaji lebih mendalam

lagi. Salah satu teknik yang dapat dipergunakan untuk menggali informasi tersebut

adalah data mining.

Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan

pengetahuan didalam database. Data mining adalah proses yang menggunakan teknik

statistik, matematika, kecerdasan buatan dan machine learning untuk mengekstraksi

dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari

berbagai database besar (Turban, dkk.2005). Data mining sendiri memiliki berbagai

macam teknik, salah satunya adalah teknik asosiasi. Analisis asosiasi atau association

rule mining adalah teknik data mining untuk menemukan aturan asosiatif antara suatu

kombinasi item. Dalam kasus ini peneliti melakukan penelitian dari data nilai daya

serap siswa SMA Yogyakarta untuk mencari tahu pola keterkaitan antara kompetensi

yang satu dengan yang lainnya yang mempengaruhi keberhasilan siswa menggunakan

algoritma FP-Growth.

Algoritma FP-Growth merupakan salah satu alternatif algoritma yang dapat

digunakan untuk menentukan himpunan data yang paling sering muncul (frequent

itemset) dalam sebuah kumpulan data. Menurut Octaviani, (2010) algoritma FP-

Growth memiliki waktu kerja yang lebih cepat dalam menemukan frequent itemset,


3

algoritma ini juga dapat menghasilkan aturan yang sama baiknya dengan algoritma

Apriori setelah diujikan pada data transaksi penjulan untuk melakukan market base

analysis. Pada penelitian tugas akhir ini nantinya akan dibuat sebuah sistem yang

menerapkan algoritma FP-Growth pada data nilai daya serap siswa yang diharapkan

dapat menemukan pola asosiasi antar kompetensi. Pada penelitian ini, peneliti hanya

akan berfokus pada mata pelajaran Bahasa Indonesia. Mata pelajaran ini dipilih karena

peneliti berpendapat bahwa Bahasa Indonesia itu merupakan salah satu identitas

Bangsa Indonesia. Bahasa Indonesia mempunyai kedudukan yang sangat penting

dalam kehidupan berbangsa dan bernegara maka Bahasa Indonesia juga merupakan

salah satu mata pelajaran yang selalu diberikan semenjak siswa masih berada di tingkat

Taman Kanak-Kanak. Tujuan pembelajaran dari mata pelajaran ini bukan hanya untuk

sekedar siswa lulus dalam ujian melainkan mereka dapat menggunakan Bahasa

Indonesia yang baik dan benar di kehidupan sehari-harinya. Karena kebutuhan itulah,

penting bagi tenaga pendidik untuk mengetahui sejauh mana kemampuan berbahasa

Indonesia anak didiknya. Hasil keluaran dari sistem diharapkan dapat digunakan untuk

mengetahui kompetensi apa saja yang ternyata memiliki keterkaitan berdasarkan nilai

lift ratio sebagai analisa secara obyektif dan juga berdasarkan pendapat dari seorang

praktisi pendidikan di bidang Bahasa Indonesia sebagai analisa secara subyektif.

Aturan asosiasi yang didapatkan tersebut dapat digunakan oleh dinas pendidikan untuk

mengambil langkah-langkah perbaikan kepada sekolah-sekolah yang memiliki nilai

daya serap kurang dari standar yang ditentukan pada kompetensi-kompetensi yang ada

di dalam aturan asosiasi tersebut. Salah satu perbaikan yang dilakukan adalah dengan

memperbaiki metode pembelajaran di masa yang akan datang yang berfokus pada

kompetensi-kompetensi di dalam aturan asosiasi yang didapatkan.

1.2. Rumusan Masalah

Berdasarkan latar belakang yang telah dijelaskan sebelumnya, masalah yang

akan diselesaikan dalam penelitian ini adalah:


4

1. Bagaimana menerapkan algoritma FP-Growth untuk menemukan aturan

asosiasi antar kompetensi dari nilai daya serap Ujian Nasional?

2. Apakah algoritma FP-Growth dapat menemukan aturan asosiasi yang

menarik berdasarkan ukuran lift ratio aturan asosiasi yang dihasilkan dari

data nilai daya serap ujian nasional SMA di Yogyakarta?

1.3. Batasan Masalah

Batasan masalah yang dibahas dalam penulisan tugas akhir ini adalah sebagai

berikut:

b. Sistem menggunakan data nilai daya serap UN SMA di Yogyakarta jurusan

IPA dengan mata pelajaran Bahasa Indonesia tahun ajaran 2012/2013,

2013/2014, 2014/2015.

c. Data yang digunakan merupakan data yang diambil dari situs

www.litbang.kemendikbud.go.id.

1.4. Tujuan Penelitian

Tujuan dari penelitian ini adalah menerapkan algoritma FP-Growth pada data

nilai daya serap untuk menenemukan pola asosiasi antara kompetensi yang satu dengan

yang lainnya pada suatu mata pelajaran.

1.5. Manfaat Penelitian

Hasil dari penelitian yang dilakukan, diharapkan dapat digunakan untuk

mengetahui apakah algoritma FP-Growth dapat digunakan untuk mengetahui adanya

keterkaitan antar kompetensi dari data nilai daya serap ujian nasional khususnya mata

pelajaran Bahasa Indonesia. Sedangkan untuk peneliti lain di bidang pendidikan,

penelitian ini juga dapat digunakan sebagai referensi maupun rekomendasi contoh

menganalisis data nilai daya serap Ujian Nasional.


5

1.6 Metodologi Penelitian

1.6.1 Penelitian Pustaka

Pada tahap ini, dilakukan penelitian pustaka untuk memperoleh informasi dan

menggali teori-teori tentang teknik data mining. Dalam penelitian ini penulis

mempelajari literatur yang berkaitan dengan teknik data mining asosiasi

khususnya algoritma FP-Growth dan literatur lainnya yang berguna bagi sistem

yang akan dibangun.

1.6.2 Knowledge Discovery in Database (KDD)

KDD ini merupakan tahap-tahap yang perlu dilakukan dalam penelitian di

bidang penambangan data (data mining). Proses KDD ini pula terdiri dari data

cleaning, data integration, data selection, data transformation, data mining,

pattern evaluation dan knowledge presentation. Tujuan dari proses ini adalah

untuk mendapatkan informasi dari data nilai daya serap SMA di Yogyakarta.

Pada salah satu tahap yang akan dilalui pada proses KDD ini adalah pembuatan

perangkat lunak sebagai alat uji yang menggunakan metodologi waterfall.

Metodologi tersebut terdiri dari analisa terhadap kebutuhan sistem, desain

perangkat lunak dan yang terakhir adalah pengujian. Hasil yang didapatkan,

kemudian akan dianalisa apakah hasil tersebut menghasilkan sebuah informasi

yang bermanfaat.

1.6.3 Pembuatan Laporan

Analisis yang akan dilakukan adalah analisis kinerja dari alat uji yang dibuat

berdasarkan metode FP-Growth. Hasil dari analisis tersebut akan disusun

kedalam sebuah laporan tugas akhir.


6

1.7 Sistematika Penulisan

BAB I. Pendahuluan

Bab ini berisi latar belakang, rumusan masalah, tujuan, manfaat, batasan

masalah, metodologi penelitian, dan sistematika penulisan.

BAB II. Landasan Teori

Bab ini akan menjelaskan mengenai teori yang berkaitan dengan judul/masalah

di tugas akhir.

BAB III. Metode Penelitian

Bab ini akan menjelaskan tentang penelitian pustaka yang berisikan data dan

sumber data yang digunakan dan juga ada proses KDD yang menjelaskan

tentang langkah-langkah yang digunakan dalam penelitian ini. Dan yang

terakhir dijelaskan pula tentang pembuatan laporan.

BAB IV Pemrosesan Awal dan Perancangan Perangkat Lunak Penambangan

Data

Bab ini berisikan langkah awal perancangan penelitian dan perancangan

pembuatan perangkat lunak.

BAB V Implementasi Penambangan Data dan Evaluasi Hasil

Bab ini akan menjelaskan mengenai proses pengujian sistem dan juga beserta

analisis dari hasil pengujian tersebut.

BAB VI Penutup

Bab ini akan menjelaskan mengenai kesimpulan beserta kelebihan dan

kelemahan sistem yang dibuat.

LAMPIRAN


7

BAB II

LANDASAN TEORI

2.1 Pengertian Penambangan Data

Penambangan data adalah proses yang menggunakan teknik statistik,

matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan

mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terakit dari

berbagai database besar (Turban et al, 2005). Sedangkan menurut Pramudiono

(2006) data mining adalah serangkaian proses untuk menggali nilai tambah dari

suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara

manual. Terkadang penambangan data biasa juga dikenal dengan KDD

(Knowledge Discovery in Database), padahal sebenarnya penambangan data

merupakan salah satu tahapan pada proses KDD. Pemanfaatan penambangan data

ini juga sudah banyak diterapkan dalam banyak bidang. Salah satu contoh

pemanfaatan penambangan data yaitu untuk menganalisa pasar sehingga sebuah

pelaku bisnis bisa lebih mengetahui pola pembelian para konsumennya.

2.2 Tujuan Penambangan Data

Tujuan dari penambangan data (Hoffer et al, 2005) adalah:

1. Explanatory

Untuk menjelaskan beberapa kondisi penelitian, seperti mengapa penjualan

truk pick-up meningkat di Colorado.

2. Confirmatory

Untuk mempertegas hipotesis, seperti halnya dua kali pendapatan keluarga

lebih suka dipakai untuk membeli peralatan keluarga dibandingkan dengan

satu kali pendapatan keluarga.


8

Input

Himpunan

atribut

(x)

Output

Label kelas

(y)

3. Exploratory

Untuk menganalisa data yang memiliki hubungan yang baru. Misalnya,

pola apa yang cocok untuk kasus penggelapan kartu kredit.

2.3 Teknik Data Mining

2.3.1 Classification

Klasifikasi merupakan proses pembelajaran suatu fungsi tujuan (target) yang

memetakan tiap himpunan atribut x sebagai input ke satu dari label kelas y yang

didefinisikan sebelumnya sebagai output. Fungsi target disebut juga model

klasifikasi (Hermawati, 2013).

Beberapa algoritma klasifikasi antara lain pohon keputusan, nearest neighbor,

naïve bayes, neural networks dan support vector machines.

2.3.2 Clustering

Analisa cluster yaitu menemukan kumpulan objek hingga objek-objek

dalam satu kelompok sama (atau punya hubungan) dengan yang lain dan berbeda

(atau tidak berhubungan) dengan objek – objek dalam kelompok lain. Tujuan dari

analisa cluster adalah meminimalkan jarak di dalam cluster dan memaksimalkan

jarak antar cluster (Hermawati, 2013).

Classification

model

Gambar 2. 1 Diagram Model Klasifikasi


9

2.3.3 Association Rules

Association juga disebut sebagai Market Basket Analysis. Sebuah problem

bisnis yang khas adalah menganalisa tabel transaksi penjualan dan

mengidentifikasi produk-produk yang seringkali dibeli bersamaan oleh customer,

misalnya apabila orang membeli sambal, biasanya juga dia membeli kecap.

Kesamaan yang ada dari data pembelian digunakan untuk mengidentifikasi

kelompok kesamaan dari produk dan kebiasaan apa yang terjadi guna kepentingan

cross-selling.

2.3.4 Regresi

Regresi ini biasanya digunakan untuk memprediksi nilai dari suatu variabel

kontinyu yang diberikan berdasarkan nilai dari variabel yang lain, dengan

mengasumsikan sebuah model ketergantungan linier atau nonlinier. Teknik ini

banyak dipelajari dalam statistika, bidang jaringan syaraf tiruan (neural network).

Contoh aplikasi untuk teknik regresi adalah (Hermawati, 2013).

a. Memprediksi jumlah penjualan produk baru berdasarkan pada belanja

promosi/iklan

b. Memprediksi kecepatan angina sebagai suatu fungsi suhu, kelembaban, tekanan

udara, dsb.

c. Time series prediction dari indeks stock market.

2.4 Knowledge Discovery in Database (KDD)

Istilah data mining dan knowledge discovery in database (KDD) seringkali

digunakan secara bergantian untuk menjelaskan proses penggalian informasi

tersembunyi dalam suatu basis data yang besar. Sebenarnya kedua istilah tersebut

memiliki konsep yang berbeda, tetapi berkaitan satu sama lain. Salah satu tahapan

dalam keseluruhan proses KDD adalah data mining. Proses KDD secara garis besar

dapat dijelaskan sebagai berikut (Fayyad, 1996).


10

Gambar 2. 2 Penambangan data sebagai tahapan dalam proses KDD

(Sumber : Fayyad, 1996)

a. Data Cleaning

Sebelum proses penambangan data dapat dilaksanakan, perlu dilakukan

proses cleaning pada data yang menjadi fokus KDD. Proses cleaning

mencakup antara lain membuang duplikasi data, memeriksa data yang

inkonsisten dan memperbaiki kesalahan pada data, seperti kesalahan

cetak (tipografi). Lalu dilakukan juga proses enrichment, yaitu proses

“memperkaya” data yang sudah ada dengan data atau informasi lain

yang relevan dan diperlukan untuk KDD, seperti data atau informasi

eksternal.

b. Data Integration

Tahap ini berisikan penggabungan dari bermacam- macam data dari

berbagai sumber.


11

c. Data Selection

Pemilihan (seleksi) data dari sekumpulan data operasional perlu

dilakukan sebelum tahap penggalian informasi dalam KDD dimulai.

Data hasil seleksi yang akan digunakan untuk proses penambangan

data, disimpan dalam suatu berkas, terpisah dari basis data operasional.

d. Data Transformation

Coding adalah proses transformasi pada data yang telah dipilih,

sehingga data tersebut sesuai untuk proses penambangan data. Proses

coding dalam KDD merupakan proses kreatif dan sangat tergantung

pada jenis atau pola informasi yang akan dicari dalam basis data.

e. Penambangan Data

Penambangan data adalah proses mencari pola atau informasi menarik

dalam data terpilih dengan menggunakan teknik atau metode tertentu.

Teknik, metode atau algoritma dalam penambangan data sangat

bervariasi. Pemilihan metode atau algoritma yang tepat sangat

bergantung pada tujuan dan proses KDD secara keseluruhan.

f. Pattern Evaluation

Pola informasi yang dihasilkan dari proses penambangan data perlu

ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang

berkepentingan. Tahap ini merupakan bagian dari proses KDD yang

disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola

atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis

yang ada sebelumnya.

g. Knowledge Presentation

Tahap ini merupakan proses teknik visualisasi dan representasi

pengetahuan digunakan untuk menyajikan pengetahuan hasil

penambangan kepada pengguna.


12

…………………………(2.1)

…………………………(2.2)

2.5 Association Rules

2.5.1 Pengertian Association Rules

Association rules merupakan sebuah ekspresi implikasi yang berbentuk X Y,

dimana X dan Y merupakan disjoint itemset (X∩Y) = ø. Contoh: {Pena,Tinta}

{Jus}. Dalam association rule, kita dapat menghitung support dan confidence.

Confidence menyatakan seberapa sering item-item dalam Y muncul dalam transaksi

yang berisi X. Sedangkan support menyatakan seberapa sering item-item dalam X dan

Y muncul dalam transaksi secara bersamaan. Secara formal dapat dinyatakan dengan

persamaan berikut ini:

s(XY) =∑(𝑋𝜐𝑌)

𝑁

c(XY) =∑(𝑋𝜐𝑌)

∑(𝑋)

Dimana s adalah support dan c adalah confidence (Hermawati, 2013).

2.5.2 Frequent Pattern

Frequent Patterns adalah pola yang sering terjadi di dalam data. Ada banyak jenis dari

frequent patterns, termasuk di dalamnya pola, sekelompok item set, sub-sequence, dan

sub-struktur. Sebuah frequent patterns biasanya mengacu pada satu set item yang

sering muncul bersama-sama dalam suatu kumpulan data transaksional, misalnya

seperti susu dan roti.

2.6 Frequent Pattern Growth (FP-Growth)

Frequent Pattern Growth (FP-Growth) adalah salah satu alternatif algoritma yang

dapat digunakan untuk menentukan himpunan data yang paling sering muncul

(frequent itemset) dalam sebuah kumpulan data (Samuel, 2008).Penggalian itemset

yang frequent dengan menggunakan algoritma FP-Growth akan dilakukan dengan

cara membangkitkan struktur data tree atau disebut dengan FPTree. Pembuatan tree ini

dilakukan dengan melakukan scanning data dari tabel transaksi seperti pada Gambar


13

2.3 hanya saja item-item dari tiap transaksi tersebut harus diurutkan kembali

berdasarkan jumlah count-nya (Gambar 2.4).

Gambar 2. 3 Tabel data transaksi

(Sumber : Han et al. 2006 )

Gambar 2. 4 Tabel daftar support count tiap item


Pada TID T100 daftar item-nya akan berubah menjadi {I2,I1,I5}, T200 menjadi

{I2,I4}, T300 {I2,I3}, T400 {I2,I1,I4}, T500 {I1,I3}, T600 {I2,I3}, T700 {I1,I3},

T800 {I2,I1,I3,I5}, T900 {I2,I1,I3}. Setelah data list item tersebut diurutkan, dibuatlah

data transaksi tersebut ke dalam bentuk tree seperti Gambar 2.5.


14

Gambar 2. 5 Pembuatan FP Tree


Cara pembuatan FPTree dilakukan dengan cara membaca satu persatu dari

transaksi pertama. Misalnya untuk TID T100 daftar item-nya adalah {I2,I1,I5}, maka

untuk dibuat kedalam FP Tree buatlah 3 node untuk I2, I1 dan I5 beserta path sehinga

menjadi null I2 I1 I5 dengan count untuk I2, I1 dan I5 adalah 1. Selanjutnya

untuk TID T200 dengan daftar item {I2,I4}, maka dibuat 2 node untuk I2 dan I4 beserta

path-nya null I2 I4. TID T100 dan T200 memiliki prefix yang sama yaitu I2.

Maka count I2 bertambah menjadi 2.

Metode FPGrowth dapat dibagi menjadi 3 tahapan utama (Han et al. 2006). Ketiga

tahapan ini akan dilakukan secara berulang-ulang untuk setiap item di header table

yang diurutkan berdasarkan frekuensinya:

a. Tahap pembangkitan conditional pattern base

Conditional Pattern base merupakan subdatabase yang berisi prefix path

(lintasan prefix) dan suffix pattern (pola akhiran). Pembangkitan conditional

pattern base didapatkan melalui FPtree yang telah dibangun sebelumnya.

Contoh berikut adalah proses pencarian conditional pattern base untuk item

I3. Keberadaan node I3 didalam tree dapat dengan mudah ditelusuri dari link

yang menghubungkan tree dan headertable sudah dibuat sebelumnya.


15

Setelah menemukan node tersebut, maka dapat ditelusuri node-node apa saja

yang dilalui dari I3 sampai ke root. Node-node yang dilewati tersebut akan

menjadi sebuah lintasan. Lintasan-lintasan yang terbentuk untuk node I3

adalah {I2,I1: 2},{I2:2} dan {I1:2}. Lintasan-lintasan tersebutlah yang akan

menjadi conditional pattern base.

Gambar 2. 6 Sub-database node I3

b. Tahap pembangkitan conditional FPTree

Pada tahap ini, support count dari setiap item pada setiap conditional pattern

base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih

besar sama dengan minimum support count yang akan dibangkitkan dengan

conditional FPtree. Berdasarkan hasil conditional pattern base untuk node

I3 yang telah dijelaskan pada tahap sebelumnya, dapat dihitung support

count dari setiap itemnya adalah {I2:4, I1:2} dan {I1:2}

c. Tahap pencarian frequent itemset

Pada tahap ini, apabila conditional FPtree merupakan single path, maka

akan didapatkan frequent itemsets dengan melakukan kombinasi item untuk

setiap conditional FPtree. Jika bukan single path maka, akan dilakukan

pembangkitan FPGrowth secara rekursif. Untuk pencarian frequent itemset

pada node I3 akan dilakukan rekursif karena conditional FPtree-nya bukan


16

…(2.4)

..…(2.5)

…(2.3)

merupakan single path melainkan bercabang. Untuk setiap single path akan

dikombinasikan dan hasil frequent pattern-nya adalah {{I2, I3: 4},{I1, I3:

4},{I2, I1, I3: 2}}.

2.7 Lift ratio

Salah satu cara yang lebih baik untuk melihat kuat tidaknya aturan asosiasi adalah

dengan menghitung lift ratio. Cara kerja metode ini adalah membagi confidence

dengan expected confidence. Confidence dapat dihitung dengan rumus 2.3.

Anteseden merupakan sebab yang menjadikan item konsekuen. Sedangkan

konsekuen adalah sebuah akibat atau juga item yang akan dibeli setelah membeli

anteseden. Jika didapatkan aturan asosiasi A B maka A sebagai anteseden dan

B sebagai konsekuen. Nilai dari expected confidence dapat dihitung dengan rumus

2.4.

𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒 = jumlah transaksi yang mengandung anteseden dan konsekuen

jumlah transaksi yang mengandung anteseden

𝐸𝑥𝑝𝑒𝑐𝑡𝑒𝑑 𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒 = jumlah transaksi yang mengandung konsekuen

jumlah transaksi dalam database

Lift ratio dapat dihitung dengan cara membandingkan antara confidence untuk

suatu aturan dibagi dengan expected confidence. Berikut rumus dari lift ratio:

𝐿𝑖𝑓𝑡 𝑅𝑎𝑡𝑖𝑜 = 𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒

expected 𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒

Nilai lift ratio lebih besar dari 1 menunjukkan adanya manfaat dari aturan tersebut.

Lebih tinggi nilai lift ratio, lebih besar kekuatan asosiasinya (Santosa, 2007). Jika


17

nilai lift ratio < 1 maka kemunculan A berkorelasi negative dengan kemunculan B,

artinya kemunculan salah satu item mempengaruhi hal yang sebaliknya pada

kemunculan item lainnya. Contoh dari korelasi negative adalah jika penjualan item

A naik maka mempengaruhi jumlah penjualan B menjadi menurun. Jika didapatkan

lift ratio > 1 maka kemunculan A berkorelasi positive dengan kemunculan B,

artinya kemunculan A ini berhubungan dengan kemunculan B. Contoh dari korelasi

positive adalah jika item A dibeli maka item B juga akan dibeli. Sedangkan jika lift

ratio = 1 maka kemuncul item A dan B independent dan tidak ada korelasi diantara

kedua item tersebut (Han et al. 2006).

2.8 Evaluasi Pengajaran

2.8.1 Pengertian Evaluasi

Dalam dunia pendidikan kita sering mendengar kata evaluasi. Tidak banyak

orang yang mengetahui bahwa hakikat dari dari evaluasi dan bahkan apa itu itu evaluasi

terkadang disalah artikan oleh seorang guru. Padahal seorang guru memiliki salah satu

kewajiban yakni melakukan evaluasi kepada program pembelajaran yang telah

dilakukan. Evaluasi sering disalah artikan oleh seorang guru dengan kata ujian, padahal

ujian hanya salah satu bentuk evaluasi. Jika ujian tidak dilaksanakan dengan baik dari

segi penyusunan Intsrumennya, bahkan ujian pun yang dibuat asal-asal tidak dapat

dikategorikan sebagai bentuk evaluasi.

Bloom (1971) mendefinisikan evaluasi, sebagaimana kita lihat, adalah

pengumpulan kenyataan secara sistematis untuk menetapkan apakah dalam

kenyataannya terjadi perubahan dalam diri siswa dan menetapkan sejauh mana tingkat

perubahan dalam pribadi siswa. Sejalan dengan itu, Stufflebeam (1985), mengatakan

bahwa evaluasi merupakan proses menggambarkan, memperoleh, dan menyajikan

informasi yang berguna untuk menilai alternatif keputusan.

Tujuan evaluasi bisa berbeda dengan tujuan dari ujian. Secara sederhana evalusi

digunakan untuk memeperbaiki sistem dengan cara memberi penilaian berdasarkan


18

data yang diambil dari suatu atau sekelompok objek. Sedangkan ujian dapat dilakukan

tanpa ada tujuan untuk memeperbaiki nilai. Ujian juga dapat dilakukan hanya untuk

menyaring dan menentukan kelas dari kumpulan objek.

Salah satu cara untuk melihat pemetaan hasil evaluasi adalah dengan melihat

nilai daya serap. Untuk mengetahui daya serap siswa dari hasil belajarnya digunakan

analisis dengan menggunakan interval daya serap siswa pada tabel 2.1.

Tabel 2. 1 Interval Daya Serap Siswa

No. Interval Kategori

1 0% - 39% Sangat Rendah

2 40% - 59% Rendah

3 60% - 74% Sedang

4 75% - 84% Tinggi

5 85% - 100% Sangat Tinggi

2.8.2 Manfaat Pelaksanaan Evaluasi

Manfaat pelaksanaan evaluasi dalam dunia pendidikan, khususnya dunia persekolahan,

evaluasi mempunyai makna ditinjau dari berbagi segi (Dahlan,2014):

a. Makna bagi siswa

Dengan diadakannya evaluasi, maka siswa dapat mengetahui sejauh mana telah

berhasil mengikuti pelajaran yang diberikan oleh guru. Hasil yang diperoleh siswa dari

pekerjaan menilai ini ada kemungkinan:

Memuaskan- Jika siswa memperoleh hasil yang memuaskan dan hal itu

menyenangkan, tentu kepuasan itu ingin diperolehnya lagi pada kesempatan yang lain.

Tidak memuaskan- Jika siswa tidak puas dengan hasil yang diperoleh, ia akan berusaha

agar lain kali keadaan itu tidak terulang lagi.


19

b. Makna bagi guru

Dengan hasil penilaian yang diperoleh guru akan dapat mengetahui siswa-siswa mana

yang sudah berhasil menguasai bahan, maupun mengetahui siswa-siswa yang belum

berhasil menguasai bahan. Guru akan mengetahui apakah materi yang diajarkan sudah

tepat bagi siswa sehingga untuk memberikan pengajaran di waktu yang akan datang

tidak perlu diakan perubahan.

c. Makna bagi sekolah

Apabila guru-guru mengadakan penilaian dan diketahui bagaimana hasil belajar siswa-

siswanya, dapat diketahui pula apakah kondisi belajar yang diciptakan oleh sekolah

sudah sesuai dengan harapan atau belum. Hasil belajar merupakan cermin kualitas

sesuatu sekolah. Informasi dari guru tentang tidak tepatnya kurikulum untuk sekolah

itu dapat merupakan bahan pertimbangan bagi perencanaan sekolah untuk masa-masa

yang akan datang. Informasi hasil penilin yang diperoleh dari tahun ke tahun, dapat

digunakan sebagai pedomana bagi sekolah, yang dilakukan oleh sekolah sudah

memenuhi standar atau belum. Pemenuhan standar akan terlihat dari bagusnya angka-

angka yang diperoleh siswa.


20

BAB III

METODE PENELITIAN

3.1 Sumber Data

3.1.1 Sumber Data

Data yang digunakan pada penelitian ini didapat dari situs

www.litbang.kemdikbud.go.id. Data yang didapat tersebut berekstensi .xls dan

berisikan nilai daya serap siswa SMA pada saat ujian nasional pada tahun akademik

2012/2013, 2013/2014 dan 2014/2015 yang terbagi ke dalam tiap-tiap kompetensi.

Data yang dipakai merupakan data siswa program IPA dengan mata pelajaran

Bahasa Indonesia yang memiliki 21 kompetensi. Untuk masukan sistem, pengguna

akan memilih 1 dari beberapa mata pelajaran yang ada. Mata pelajaran Bahasa

Indonesia memiliki 21 kompetensi yang diujikan pada Ujian Nasional SMA tahun

akademik 2012/2013 & 2013/2014. Kompetensi-kompetensi yang diujikan

tersebut adalah:

Tabel 3. 1 Tabel Atribut Data Mata Pelajaran Bahasa Indonesia 2012/2013 &

2013/2014

Kode Atribut Keterangan

KODE_SEKOLAH Kode Sekolah

NAMA_SEKOLAH Nama Sekolah

JNS_SEK Jenis Sekolah (SMA/NA)

STS_SEK Status Sekolah (Negeri/Swasta)

BIND1 Melengkapi berbagai bentuk dan jenis paragraf dengan

kalimat yang padu

BIND2 Melengkapi dialog drama


http://www.litbang.kemdikbud.go.id/

21

BIND3 Melengkapi larik puisi lama/baru (dengan kata

kias/berlambang/ berima/bermajas

BIND4 Melengkapi paragraf dengan kata baku, kata serapan, kata

berimbuhan, kata ulang, ungkapan, peribahasa

BIND5 Melengkapi teks pidato

BIND6 Menentukan isi dan simpulan grafik, diagram atau tabel

BIND7 Menentukan isi paragraf: fakta, opini, pernyataan/ jawaban

pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi

biografi

BIND8 Menentukan isi puisi lama, pantun, gurindam

BIND9 Menentukan kalimat resensi

BIND10 Menentukan kalimat kritik

BIND11 Menentukan opini penulis dan pihak yang dituju dalam tajuk

rencana/editorial

BIND12 Menentukan unsur-unsur intrinsik dan ekstrinsik sastra

Melayu klasik/hikayat

BIND13 Menentukan unsur-unsur intrinsik puisi


BIND15 Menentukan unsur-unsur intrinsik/ ekstrinsik

novel/cerpen/drama

BIND16 Menentukan unsur-unsur paragraf, ide pokok, kalimat

utama, kalimat penjelas

BIND17 Menulis judul sesuai EYD

BIND18 Menulis karya ilmiah (latar belakang dan rumusan masalah)

BIND19 Menulis surat resmi


22

BIND20 Menyunting kalimat dalam surat resmi

BIND21 Menyunting penggunaan kalimat/frasa/kata

penghubung/istilah dalam paragraf

Sedangkan pada tahun 2014/2015 ada sedikit perubahan pada kompetensi yang

diujikan. Ada satu kompetensi yang dibedakan dengan tahun-tahun sebelumnya.

Perbedaan tersebut terletak pada munculnya kompetensi baru yaitu BIND18

“Menulis paragraf padu”. Daftar kompetensi yang diujikan adalah sebagai berikut:

Tabel 3. 2 Tabel Atribut Data Mata Pelajaran Bahasa Indonesia 2014/2015

Kode Atribut Keterangan

KODE_SEKOLAH Kode Sekolah

NAMA_SEKOLAH Nama Sekolah

JNS_SEK Jenis Sekolah (SMA/NA)

STS_SEK Status Sekolah (Negeri/Swasta)

BIND1 Melengkapi berbagai bentuk dan jenis paragraf dengan

kalimat yang padu

BIND2 Melengkapi dialog drama

BIND3 Melengkapi larik puisi lama/baru (dengan kata

kias/berlambang/ berima/bermajas

BIND4 Melengkapi paragraf dg kata baku, kata serapan, kata

berimbuhan, kata ulang, ungkapan, peribahasa

BIND5 Melengkapi teks pidato

BIND6 Menentukan isi dan simpulan grafik, diagram atau tabel

BIND7 Menentukan isi paragraf: fakta, opini, pernyataan/jawaban

pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi

biografi


23

BIND8 Menentukan isi puisi lama, pantun, gurindam

BIND9 Menentukan kalimar resensi

BIND10 Menentukan kalimat kritik

BIND11 Menentukan opini penulis dan pihak yang dituju dalam tajuk

rencana/editorial

BIND12 Menentukan unsur-unsur intrinsik dan ekstrinsik sastra

Melayu klasik/hikayat


BIND14 Menentukan unsur-unsur intrinsik/ ekstrinsik

novel/cerpen/drama

BIND15 Menentukan unsur-unsur paragraf, ide pokok, kalimat

utama, kalimat penjelas

BIND16 Menulis judul sesuai EYD

BIND17 Menulis karya ilmiah (latar belakang dan rumusan masalah)

BIND18 Menulis paragraf padu

BIND19 Menulis surat resmi

BIND20 Menyunting kalimat dalam surat resmi

BIND21 Menyunting penggunaan kalimat/frasa/kata

penghubung/istilah dalam paragraf

Teknik pengumpulan data yang digunakan oleh peneliti adalah dengan teknik

wawancara. Teknik wawancara yaitu kegiatan melakukan tanya jawab dengan

narasumber yang terkait. Dalam penelitian ini, penulis melakukan wawancara

dengan seorang dosen yang memiliki research di bidang pendidikan yang

digunakan untuk memberikan gambaran umum penelitian.


24

3.2 Spesifikasi Alat

Sistem dibuat dengan menggunakan hardware dan software sebagai berikut :

a. Spesifikasi hardware

a. Proses Intel Pentium Core i3 2.30GHz

b. RAM 2 GB

c. Harddisk 500 GB

b. Spesifikasi Software

a. Sistem Operasi Microsoft Windows 10

b. Compiler IDE NetBeans 8.0

Software ini akan digunakan untuk membuat tampilan interface dan

sekaligus membuat source code.

3.3 Tahap – Tahap Penelitian

a. Studi Kasus

Ujian nasional adalah salah satu sistem evaluasi standar pendidikan yang ada

di Indonesia. Ujian ini diadakan dengan tujuan untuk pengendalian mutu

pendidikan secara nasional. Demi meningkatnya mutu pendidikan nasional,

maka ada baiknya jika para pengajar dapat selalu mengevaluasi hasil dari ujian

nasional sekolahnya masing-masing. Untuk mendapatkan evaluasi yang lebih

mendalam, maka digunakanlah nilai daya serap yang terdiri dari beberapa

kompetensi dari setiap mata pelajaran. Penelitian ini diharapkan dapat

menemukan pola keterkaitan antara satu kompetensi dengan kompetensi

lainnya yang mempengaruhi sebuah sekolah mendapatkan nilai lebih dari

standar nilai daya serap yang ditentukan pada kompetensi-kompetensi tertentu.

b. Penelitian Pustaka

Pada tahap ini, dilakukan penelitian pustaka untuk memperoleh informasi dan

menggali teori-teori tentang teknik penambangan data. Dalam penelitian ini


25

penulis mempelajari literatur yang berkaitan dengan teknik penambangan data

asosiasi khususnya algoritma FP-Growth dan literatur lainnya yang berguna

bagi sistem yang akan dibangun.

c. Knowledge Discovery in Database (KDD)

Setelah tahap-tahap sebelumnya dilakukan, maka tahap ini sangat diperlukan

karena penelitian ini berada di bidang penambangan data. Proses KDD pula

terdiri dari data cleaning, data integration, data selection, data transformation,

data mining, pattern evaluation dan knowledge presentation. Pada tahap awal

akan dilakukan data cleaning dan data integration pada data nilai daya serap

sehingga data tersebut dapat digunakan untuk mencari pola asosiasinya. Proses

awal ini dilakukan secara manual menggunakan tool Microsoft Excel. Lalu

untuk proses selanjutnya seperti data selection, data transformation dan data

mining akan dilakukan di dalam perangkat lunak yang akan dibuat. Sedangkan

proses pattern evaluation dan knowledge presentation baru dapat dilakukan

setelah perangkat lunak selesai dibangun karena proses ini membutuhkan hasil

dari alat uji tersebut.

d. Pengembangan Perangkat Lunak

1. Metode Pengembangan Sistem

Metode yang digunakan oleh penulis dalam pengembangan sistem adalah

metode waterfall. Metode ini merupakan salah satu metode yang paling sering

dipakai oleh para pengembang perangkat lunak. Inti dari metode ini adalah

pengerjaan dari sistem dilakukan secara linier. Jadi jika tahap pertama belum

dilakukan, maka tahap kedua dan selanjutnya otomatis tidak bisa dikerjakan.

Secara garis besar metode waterfall mempunyai langkah – langkah sebagai

berikut:


26

a. Analisa

Langkah ini merupakan analisa terhadap kebutuhan sistem.

Pengumpulan data dalam tahap ini bisa melakukan sebuah penelitian,

wawancara atau studi literatur. Seorang sistem analis bertugas dalam

mencari informasi sebanyak mungkin dari pengguna sehingga sistem

yang dibuat dapat sesuai dengan keinginan pengguna. Tahapan ini

biasanya akan menghasilkan dokumen user requirement yang dapat

digunakan sistem analis untuk menerjemahkan ke dalam bahasa

pemrograman.

b. Design

Proses desain akan menerjemahkan syarat kebutuhan ke sebuah

perancangan perangkat lunak yang dapat diperkirakan sebelum di ubah

ke dalam bahasa pemrograman. Proses ini berfokus pada struktur data,

arsitektur perangkat lunak, representasi interface, dan detail algoritma.

Tahapan ini akan menghasilkan dokumen yang disebut software

requirement. Dokumen ini yang digunakan seorang programmer untuk

membangun sistemnya.

c. Code dan Testing

Coding merupakan penerjemahan design ke dalam bahasa

pemrograman. Pada tahap ini programmer akan mengubah proses

transaksi yang diinginkan pengguna ke dalam sistem yang dibuatnya.

Setelah pengkodean selesai maka akan dilakukan testing terhadap

sistem yang telah dibuat tadi. Tujuan testing adalah menemukan

kesalahan – kesalahan terhadap sistem tersebut dan kemudian dapat

diperbaiki.


27

2. Pengujian

Pengujian dilakukan dengan alat uji yang sudah dibuat pada tahap

sebelumnya. Metode untuk pengujian sistem ini adalah metode pengujian

black box, pengujian dataset dan uji validasi. Pengujian black box ini berisi

pengujian dengan pengisian data secara benar dan tidak benar. Untuk

pengujian dataset, pengujian dilakukan dengan mencoba

mengkombinasikan nilai min support dan min confidence untuk melihat

nilai lift ratio yang dihasilkan. Selain itu, dari hasil kombinasi tersebut juga

dapat dilihat nilai running time. Kemudian untuk pengujian validasi, hasil

dari perangkat lunak yang dibuat akan dibandingkan dengan hasil dari

aplikasi WEKA yang telah terpercaya hasilnya.

e. Analisis dan Pembuatan Laporan

Analisis yang akan dilakukan adalah analisis hasil dari perangkat lunak yang

dibuat berdasarkan penerapan algoritma FP-Growth. Analisis yang dimaksud

adalah melakukan analisis dari pola yang terbentuk. Pola yang dipilih untuk

dianalisis adalah pola yang memiliki nilai lift ratio dan confidence tertinggi.

Cara untuk menganalisis pola yang dihasilkan tersebut digunakan 2 metode,

yang pertama yaitu secara obyektif dan yang kedua adalah secara subyektif.

Analisis secara obyektif ini dilihat dari nilai lift ratio. Sedangkan analisis secara

subyektif ini dilakukan dengan menanyakan pendapat kepada seorang praktisi

pendidikan mengenai pola yang terbentuk tersebut. Hasil dari semua pengujian

tersebut akan disusun kedalam sebuah laporan tugas akhir.


28

BAB IV

PEMROSESAN AWAL DAN PERANCANGAN PERANGKAT

LUNAK PENAMBANGAN DATA

4.1 Perancangan Awal Sumber Data

4.1.1 Pembersihan Data

Proses pembersihan data yang dilakukan dalam penelitian ini adalah dengan

membuang data yang tidak lengkap. Pada penelitian ini ada 2 sekolah yang harus

dihapus karena tidak memiliki nilai. Dua sekolah tersebut adalah SMA Piri 2

Yogyakarta dengan id 01-032 dan SMA Proklamasi’45 dengan id 04-071.

4.1.2 Integrasi Data

Tahap ini berisikan penggabungan dari bermacam- macam data dari berbagai

sumber. Dalam penelitian ini peneliti menggunakan 3 data yaitu data tahun akademik

2012/2013 dan 2013/2014 dan 2014/2015. Data pada tiap tahun tersebut memiliki 21

kompetensi. Data pada tahun 2012/2013 & 2013/2014 memiliki kompetensi-

kompetensi yang sama. Sedangkan pada tahun 2014/2015 ada satu kompetensi yang

berbeda. Data tahun 2012/2013 & 2013/2014 tersebut akhirnya digabungkan menjadi

satu karena memiliki kompetensi yan g sama. Penggabungan ini bertujuan untuk

memperbanyak data yang akan digunakan sebagai dataset karena walaupun nama

sekolah sama tetapi tetap berbeda siswanya. Sedangkan data tahun 2014/2015 tetap

menjadi satu dataset tanpa digabung dengan data lainnya.

4.1.3 Seleksi Data

Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan

sebelum tahap penggalian informasi dalam KDD dimulai. Pada data nilai daya serap

terdapat 4 atribut tetap yaitu KODE SEKOLAH, NAMA SEKOLAH, JNS SEK, STS

SEK dan sisanya merupakan atribut nama kompetensi yang berjumlah 21 untuk mata


29

pelajaran Bahasa Indonesia. Dari semua atribut tersebut yang dipakai hanya atribut

nama kompetensi tiap mata pelajaran. Daftar atribut yang digunakan dapat dilihat pada

tabel 3.1 dan tabel 3.2 di bab 3. Sedangkan contoh data yang akan digunakan dapat

dilihat pada Lampiran 6.

4.1.4 Transformasi Data

Proses transformasi dilakukan pada data yang telah dipilih, sehingga data

tersebut sesuai untuk proses penambangan data. Pada tahap ini dilakukan proses

preprocessing dengan cara hanya mengambil nilai yang memenuhi standar nilai yang

dimasukkan oleh pengguna. Dari Gambar 3.1 dapat dilihat nilai yang block warna

berarti memenuhi nilai standar yakni lebih dari 75. Nilai 75 itu adalah nilai yang

diisikan oleh pengguna. Berdasarkan tabel 2.1 di bab 2, nilai 75 masuk kedalam

kategori tinggi. Nilai-nilai kompetensi yang di block tersebut kemudian diambil

dimasukkan kedalam array. Misalnya untuk kode sekolah 01-001 maka kompetensi

yang digunakan adalah BIND1, BIND2, BIND3, BIND4, BIND5, BIND6, BIND7,

BIND8, BIND9, BIND10, BIND11, BIND14, BIND15, BIND17, BIND18, BIND19,

BIND20, BIND21.

Gambar 3. 1 Data Nilai Daya Serap

Setelah itu kompetensi juga diurutkan berdasarkan kompetensi yang memiliki

jumlah frekuensi dari yang tertinggi ke terendah. Setelah itu data siap digunakan untuk

masuk ke proses penambangan data.

4.2 Pengembangan Perangkat Lunak Penambangan Data

4.2.1 Perancangan Umum

4.2.1.1 Input

Inputan dari sistem ini adalah data yang berasal dari file yang berekstensi .xls

yang dapat dipilih langsung oleh pengguna. Pengguna juga berperan dalam


30

memasukkan nilai minimum support, minimum confidence dan nilai standar

daya serap terlebih dahulu. Data yang dipakai adalah data nilai daya serap siswa

SMA yang terdiri dari beberapa kolom kompetensi.

Pengguna

Pencarian Aturan

Asosiasi dengan FP

Growth

min support, min

confidence, data daya serap

aturan asosiasi

Gambar 4. 1 Diagram Konteks

4.2.1.2 Proses

Proses sistem terdiri dari beberapa langkah untuk dapat menemukan aturan

asosiasi yang berfungsi untuk menemukan pola keterkaitan antar kompetensi

yaitu:

1 Pengambilan data yang sudah melalui tahap preprocessing untuk digunakan

saat proses penambangan data.

2 Penentuan minimum support dan minimum confidence yang berfungsi

dalam menentukan aturan asosiasi.

3 Proses asosiasi untuk mencari pola keterkaitan kompetensi dijalankan.

4 Analisis hasil asosiasi terhadap proses penambangan data yang telah

dijalankan.

4.2.1.3 Output

Sistem yang akan dibangun ini nantinya akan memberikan keluaran berupa

aturan asosiasi yang memenuhi nilai minimum support dan minimum

confidence beserta nilai lift ratio dan nilai confidence.


31

4.2.2 Diagram Use Case

Diagram usecase merupakan sebuah gambaran sistem yang dilihat dari sudut pandang

pengguna sistem (user). Pengguna sistem dalam diagram usecase dapat juga disebut

actor. Actor pada sistem ini hanya akan ada satu actor saja dan dapat melakukan 3

aktivitas seperti memilih data, mencari aturan dan menyimpan hasil. Ketiga aktivitas

tersebut merupakan aktivitas yang saling berhubungan, sehingga tiap aktivitas harus

dijalankan berurutan.

Pengguna

Memilih Data

Mencari aturan asosiasi

Menyimpan Hasil

<<include>>

<<include>>

Gambar 4. 2 Diagram Usecase


32

4.2.3 Diagram Aktivitas

Diagram aktivitas sistem yang akan dibuat terlampir pada Lampiran 1. Diagram

aktivitas yang dipakai sebanyak 3 buah menyesuaikan dengan jumlah aktivitas dari

usecase yang ada. Diagram aktivitas tersebut terdiri dari:

1. Memilih data

2. Mencari aturan

3. Menyimpan hasil

4. Mencari aturan

4.2.4 Diagram Kelas Analisis

Fungsi dari pembuatan diagram kelas tahap analisis ini berguna untuk mempermudah

dalam penyusunan sequence diagram. Diagram kelas analisis dapat dilihat pada

Lampiran 2.

Tabel 4. 1 Daftar Kelas Untuk Tiap Usecase

Usecase Boundary Control Class Model Class (Entity)

Memilih

data

view_home

view_preprocessing

Control_atributSelection Model_atribuSelection

Mencari

aturan

asosiasi

view_asosiasi Control_algorithm comparitorHeaderTable

TreeNode

Model_combination

Menyimpan

hasil

view_asosiasi

4.2.5 Diagram Sequence

Diagram sequence adalah diagram yang memperlihatkan atau menampilkan interaksi-

interaksi antar objek di dalam sistem. Interaksi objek-objek tersebut termasuk


33

pengguna, boundary, controller dan model berupa pesan/message. Diagram sequence

pada sistem ini terdiri dari 3 diagram sesuai dengan usecase. Diagram dapat dilihat

pada Lampiran 3.

4.2.6 Struktur Data

Sistem pencarian aturan asosiasi ini membutuhkan suatu tempat penyimpanan data

yang tidak membutuhkan memori yang terlalu banyak dan tidak menghabiskan waktu

yang cukup banyak ketika sistem dijalankan karena dapat mengolah data dengan

efisien. Berdasarkan kebutuhan diatas maka penelitian ini akan menggunakan konsep

penyimpanan data menggunakan struktur data karena penyimpanan dengan struktur

data tidak membutuhkan memori yang besar dan lebih efisien dalam mengolah data.

Struktur data yang digunakan pada sistem ini adalah Tree dan Arraylist. Tree pada

sistem ini dapat memiliki jumlah anak yang tidak sama jumlahnya untuk setiap node

dan juga tidak bisa ditetapkan di awal. Maka struktur data Tree ini ditambahkan

struktur data yang dinamis seperti List untuk menyimpan jumlah anaknya.

a. Tree

Dalam ilmu komputer, tree adalah sebuah struktur data yang secara bentuk

menyerupai sebuah pohon, yang terdiri dari serangkaian node (simpul) yang saling

berhubungan. Node-node tersebut dihubungkan oleh sebuah pointer parent dan child.

Setiap node dapat memiliki 0 atau lebih node anak (child). Pada penelitian ini, pohon

yang dibuat mempunyai anak yang bertipe List<TreeNode>. List ini dipilih karena ada

beberapa node yang memiliki jumlah anak yang tidak bisa ditentukan dan tidak sama

untuk tiap node-nya. Dalam perangkat lunak yang dibuat pembuatan node ini dilakukan

di kelas TreeNode. Node yang dibuat akan berisikan informasi name, counts, next,

parent dan child.


34

Gambar 4. 3 Ilustrasi FPTree

b. Arraylist

Arraylist memiliki sifat seperti array, tetapi perbedaan utamanya adalah Arraylist

bersifat dinamis dalam arti dapat memperbesar kapasitasnya secara otomatis apabila

diperlukan (Rickyanto,2003).

Pada penelitian ini penulis menggunakan arraylist dalam arraylist

(ArrayList<ArrayList<String>>) untuk membuat matriks. Penulis memilih

menggunakan arraylist karena dapat digunakan untuk membuat matrik dengan panjang

data baris yang berbeda. Cara kerja arraylist pada sistem ini adalah yang pertama

membuat objek arraylist yang pertama untuk menampung nama-nama kompetensi

yang memenuhi syarat untuk satu sekolah. Contohnya seperti gambar di bawah ini.

Berikut daftar kompetensi yang memenuhi standar nilai ketuntasan 75 yang

dimasukkan kedalam array:


35

BIND6 BIND12 BIND16

Gambar 4. 4 Susunan arraylist untuk kode sekolah 01-010

BIND3 BIND4

Gambar 4. 5 Susunan arraylist untuk kode sekolah 01-019

Objek arraylist baru akan selalu dibuat untuk setiap kode sekolah yang berbeda.

Setelah membuat objek arraylist untuk tiap sekolah maka akan dibuat objek arraylist

untuk menjadikan satu semua objek arraylist sebelumnya. Gambaran datanya akan

berubah menjadi seperti di gambar 4.6.

BIND6 BIND12 BIND16

BIND3 BIND4

BIND6 BIND4 BIND15 BIND17

Gambar 4. 6 Data arraylist dalam arraylist

c. TreeNode

4.2.7 Diagram Kelas Desain

Diagram kelas dapat memperlihatkan hubungan antar kelas. Diagram ini dapat

membantu memvisualisasikan struktur kelas-kelas dari suatu sistem. Untuk detail kelas

dapat dilihat pada Lampiran 5.


36

<<view>>view_preprocessing

<<view>>view_home

<<view>>view_about

<<view>>view_help

<<view>>view_asosiasi

<<control>>control_algorithm

<<model>>model_combination

<<model>>TreeNode

<<model>>comparatorHeaderTable

<<model>>model_atributSelection

<<control>>control_atributSelection

Gambar 4. 7 Diagram Kelas Desain

4.2.8 Rincian Algoritma untuk Setiap Metode

4.2.8.1 Metode-metode di dalam kelas control_algorithm

Nama Metode FPTree(ArrayList<LinkedList<String>> array1,

ArrayList<TreeNode> newArray)


37

Fungsi Metode Mengubah data yang sudah dikenai preprocessing menjadi

bentuk Tree

Algoritma :

1 Method ini memiliki masukkan berupa arraylist yang berisi data nilai daya serap.

2 Satu persatu persatu nilai dalam array akan dibuat pohon dengan memanggil

method insertNode().

3 Setelah pohon FPTree selesai dibuat maka headerTable yang sudah terisi akan

diurutkan dari yang terkecil ke terbesar count-nya.

Nama Metode insertNode(LinkedList<String> array1, TreeNode treenode,

ArrayList<TreeNode> headerTable)

Fungsi Metode Menambah node pada pohon

Algoritma:

1. Pertama kali yang dilakukan adalah mengecek apakah array yang sebagai

inputan kosong atau tidak. Jika kosong maka akan langsung me-return.

2. Jika array tidak kosong, maka akan dicek apakah root pada treenode sudah ada

isinya atau belum.

3. Jika root belum memiliki anak, maka akan dibuat node baru yang lalu akan

dibuat menjadi anak dari root. Node tersebut juga akan di link-an dengan

headerTable.

4. Sedangkan jika root memiliki anak maka akan dicek apakah item pertama pada

array tersebut sudah ada pada pohon atau belum. Jika sudah maka akan

ditambahkan countnya.

5. Setelah itu, item petama pada array tersebut dihapus.

6. Array tadi lalu dimasukkan kembali menjadi parameter saat memanggil method

dirinya sendiri.


38

Nama Metode FPGrowth(ArrayList<LinkedList<String>> array1, double

batas, int totalTransaction, double minConfidence)

Fungsi Metode Memanggil method FPGrowth dan menghitung nilai

confidence dan lift ratio

Algoritma:

1 Method ini pertama tama akan memanggil method FPgowth() untuk membuat

conditional pattern base, conditional fp tree dan frequent itemset.

2 Setelah mendapatkan frequent-k itemset, lalu frequent-k itemset tersebut dicari

yang k-nya paling tinggi.

3 Frequent itemset yang paling tinggi tersebut akan digunakan untuk membuat

kombinasi aturan asosiasi dengan memanggil method CountConfAndLift yang

ada di kelas model_combination

Nama Metode FPgrowth(TreeNode treeNode, String base, double

threshold, ArrayList<TreeNode> headerTable,

Map<String, Integer> frequentPatterns)

Fungsi Metode Mencari conditional pattern base, conditional fp tree dan

frequent itemset

Algoritma:

1. Lakukan perulangan dari data pada headerTable yang memiliki nilai count paling

kecil.

2. Lalu akan dilakukan perulangan juga untuk mencari letak item tadi pada pohon.

Setelah diketahui letaknya maka akan diruntut ke parentnya hingga sampai ke

root. Proses tersebut dicatat sebagai conditional pattern base.

3. Jika item pada headerTable memiliki conditional pattern base yang count-nya

lebih dari minimum support maka item tersebut akan disimpan di hashmap

frequentPattern.


39

4. Setelah itu maka akan dipanggil method conditional_fp_tree_constructor untuk

mencari conditional fp tree

5. Selama conditional fptree memiliki anak maka proses selanjutnya adalah

memanggil method dirinya sendiri sampai conditional fptree tidak memiliki anak.

Nama Metode conditional_fptree_constructor(Map<String, Integer>

conditionalPatternBase, Map<String, Integer>

conditionalItemsMaptoFrequencies, double threshold,

ArrayList<TreeNode> conditional_headerTable)

Fungsi Metode Membuat pohon yang akan digunakan untuk mencari

conditional fp tree

Algoritma:

1. Masukan dari method ini adalah conditional pattern base yang sudah didapatkan

sebelumnya.

2. Setelah itu conditional pattern base tersebut dicek apakah countnya lebih besar

atau sama dengan minimum support.

3. Jika iya maka pattern base tersebut akan disimpan pada array baru.

4. Setelah pattern base dicek maka akan dibuat pohonnya dari pattern base yang

memenuhi minimum support

5. Method akan mengembalikan nilai berupa TreeNode

Nama Metode insert(LinkedList<String> pattern_vector, int

count_of_pattern, TreeNode conditional_fptree,

ArrayList<TreeNode> conditional_headerTable)

Fungsi Metode Membuat pohon untuk mencari conditional fp tree

Algoritma:

1. Pertama kali yang dilakukan adalah mengecek apakah array yang sebagai inputan

kosong atau tidak. Jika kosong maka akan langsung me-return.


40

2. Jika array tidak kosong, maka akan dicek apakah root pada treenode sudah ada

isinya atau belum.

3. Jika root belum memiliki anak, maka akan dibuat node baru yang lalu akan dibuat

menjadi anak dari root. Node tersebut juga akan di link-an dengan headerTable.

4. Sedangkan jika root memiliki anak maka akan dicek apakah item pertama pada

array tersebut sudah ada pada pohon atau belum. Jika sudah maka akan

ditambahkan countnya.

5. Setelah itu, item petama pada array tersebut dihapus.

6. Array tadi lalu dimasukkan kembali menjadi parameter saat memanggil method

dirinya sendiri.

4.2.8.2 Algoritma Kelas model_combination

Nama Metode Combine(int start, HashMap temp, Map freqmap)

Fungsi Metode Membuat kombinasi dari string yang menjadi inputan

Algoritma:

1. Lakukan perulangan dari iterasi=1 sampai jumlah karakter dari string yang

diinputkan

2. Satu persatu karakter diambil di gabungkan

3. Gabungan karakter tersebut lalu dicek, selama jumlahnya masih kurang dari

jumlah string maka akan disimpan didalam arraylist antecendent

4. Langkah selanjutnya adalah memanggil dirinya sendiri untuk rekursif

Nama Metode CountConfAndLift(Map freqmap, HashMap map, int max,

int total, double minCon)

Fungsi Metode Menghitung nilai confidence dan lift ratio dari aturan yang

dihasilkan


41

Algoritma:

1. Lakukan nested-loop untuk membuat kombinasi dari anteseden dan konsekuen

2. Setelah ditemukan kombinasinya, tiap kombinasi dihitung nilai confidence dan

lift rationya

3. Jika nilai confidence memenuhi nilai minimum confidence yang ditentukan maka

kombinasi tersebut akan dijadikan aturan asosiasi dan disimpan didalam arraylist

4.2.8.3 Algoritma Kelas View_Asosiasi

Nama Metode BubbleSortODesc(LinkedList<String> data, HashMap

map)

Fungsi Metode Mengurutkan data bertipe LinkedList dari besar ke kecil

Algoritma:

1. Lakukan perulangan dari iterasi=1 sampai data.size()-1

2. Lakukan perulangan kembali dari elemen=0 sampai data.size()-1-elemen

3. Lalu bandingkan count dari data sekarang dengan yang data setelahnya. Jumlah

count dapat diambil dari hashmap.

4. Jika count data sekarang lebih kecil maka indeks data akan ditukar dengan indeks

data setelahnya.

Nama Metode BubbleSortODescArrayList(ArrayList

<TreeNode> data)

Fungsi Metode Mengurutkan data bertipe ArrayList<TreeNode> dari besar

ke kecil

Algoritma:

d. Lakukan perulangan dari iterasi=1 sampai data.size()-1

e. Lakukan perulangan kembali dari elemen=0 sampai data.size()-1-

elemen


42

f. Lalu bandingkan count dari data sekarang dengan yang data setelahnya.

Jumlah count dapat diambil dari object TreeNode.

g. Jika count data sekarang lebih kecil maka indeks data akan ditukar

dengan indeks data setelahnya.

Nama Metode RemoveNoFequentItem()

Fungsi Metode Menghapus data yang memiliki count lebih kecil dari

minimum support

Algoritma:

1. Lakukan nested-loop untuk mengambil data ArrayList

2. Cek count dari tiap data

3. Jika count lebih besar atau sama dengan minimum support maka data akan

dimasukkan ke dalam array baru.


43

4.2.9 Antarmuka

1. Halaman Awal

Gambar 4. 8 Halaman Awal

Halaman ini merupakan halaman utama yang akan ditampilkan pertama kali

saat sistem dijalankan. Halaman ini berisi 4 tombol yaitu BERANDA, BANTUAN,

TENTANG dan MASUK SISTEM. Tombol BERANDA akan menghubungkan

dengan halaman view_home. Sedangkan tombol BANTUAN ia akan menghubungkan

dengan view_help, tombol TENTANG akan menghubungkan dengan view_about. Dan

yang terakhir yaitu tombol MASUK SISTEM yang akan menghubungkan dengan

halaman view_preprocessing untuk memulai memilih data yang akan digunakan.

MASUK SISTEM


44

2. Halaman About

Gambar 4. 9 Halaman About

Halaman ini digunakan untuk memberikan informasi tentang sistem seperti

tujuan sistem ini dibuat dan kegunaanya. Pada halaman ini jg masih dapat digunakan

tombol-tombol seperti halaman utama (Gambar 4.15).


45

3. Halaman Help

Gambar 4. 10 Halaman Help

Halaman bantuan ini berisikan panduan penggunaan sistem yang bertujuan untuk

memudahkan pengguna dalam menggunakan aplikasi ini. Pada halaman ini jg masih

dapat digunakan tombol-tombol seperti halaman utama (Gambar 4.15).


46

4. Halaman Preprocessing

Gambar 4. 11 Halaman Preprocessing

Halaman preprocessing ini digunakan untuk melakukan pemilihan data yang akan

digunakan dengan cara menekan tombol PILIH FILE untuk mencari file bertipe .xls

atau .csv. Setelah data muncul pada tabel dapat dilakukan juga penyeleksian atribut.

Pada halaman ini kita dapat menghapus atribut-atribut yang tidak diperlukan. Setelah

melakukan seleksi atribut, kita dapat menekan tombol KONVERSI untuk mengambil

data yang memenuhi standar nilai keberhasilan yang sudah dimasukkan sebelumnya.

Setelah itu tombol SUBMIT akan muncul dan dapat digunakan untuk melanjutkan

proses selanjutnya.


47

5. Halaman Asosisasi

Gambar 4. 12 Halaman Asosiasi

Halaman ini akan berisikan tabel dengan data yang sudah melalui proses

preprocessing. Setelah itu pengguna dapat memasukkan nilai minimal support dan

minimal confidence yang dapat digunakan untuk proses pencarian aturan asosiasi

dengan algoritma FPGrowth dengan menekan tombol PROSES.

PROSES


48

6. Halaman Database

Gambar 4. 13 Halaman Database

Halaman ini digunakan untuk menyambungkan dengan database. Dari database yang

ada nanti dapat dipakai datanya untuk proses pencarian aturan asosiasi selanjutnya.


49

BAB V

IMPLEMENTASI PENAMBANGAN DATA

DAN EVALUASI HASIL

5.1 Implementasi Rancangan Perangkat Lunak Penambangan Data

Sistem pencarian aturan asosiasi ini menggunakan beberapa kelas yang mendukung

jalannya sistem. Kelas yang digunakan totalnya berjumlah 11 yang dibagi menjadi 3

package. Package – package tersebut bernama model, view dan controller. Berikut

adalah daftar kelas-kelas yang digunakan:

5.2.1 Implementasi Kelas Model

Berikut ini adalah tabel yang berisikan daftar kelas yang ada di package model.

Pada tabel tersebut disertakan juga nama file fisik dan nama file executable.

Tabel 5. 1 Tabel Implementasi Kelas Model

No Nama Kelas Nama File Fisik Nama File Executable

1 TreeNode TreeNode.java TreeNode.class

2 model_atributSelection model_atributSelection.java model_atributSelection.class

3 model_combination model_combination.java model_combination.class

4 comparatorHeaderTable comparatorHeaderTable.java comparatorHeaderTable.class

5.2.2 Implementasi Kelas View

Berikut ini adalah tabel yang berisikan daftar kelas yang ada di package view.

Pada tabel tersebut disertakan juga nama file fisik dan nama file executable.

Tabel 5. 2Tabel Implementasi Kelas View


1 view_about view_about.java view_about.class

2 view_asosiasi view_asosiasi.java view_asosiasi.class


50

3 view_help view_help.java view_help.class

4 view_home view_home.java view_home.class

5 view_preprocessing view_preprocessing.java view_preprocessing.class

5.2.3 Implementasi Kelas Controller

Berikut ini adalah tabel yang berisikan daftar kelas yang ada di package

controller. Pada tabel tersebut disertakan juga nama file fisik dan nama file

executable.

Tabel 5. 3 Tabel Implementasi Kelas Controller


1 Control_algorithm Control_algorithm.java Control_algorithm.class

2 Control_atributSelection Control_atributSelection

.java

Control_atribut

Selection.class

5.2 Evaluasi Hasil

5.2.1 Uji Coba Perangkat Lunak (Black Box Testing)

a. Pengujian Pada Halaman Preprocessing

Pada halaman ini, yang dapat dilakukan oleh pengguna adalah memilih file

yang isinya akan digunakan sebagai data yang akan diolah pada sistem. Pada

pengujian ini, peneliti mencoba memilih file dengan format yang benar yaitu

.xls atau .csv dan hasil keluarannya dapat dilihat pada Gambar 5.1(a) dan

Gambar 5.1(b). Sedangkan jika memilih format yang salah maka akan tampil

message dialog jika format yang dipilih salah (Gambar 5.2).


51

Gambar 5. 1 (a)Kotak Dialog “Pilih File” (b)Tabel Dataset

Gambar 5. 2 Kotak Dialog Salah Pilih File

Selanjutnya ketika pengguna melakukan seleksi atribut, pengguna diberikan 3

fasilitas tombol. Tombol pertama yaitu tombol “Tandai Semua” untuk

menandai semua checkbox pada tabel sekaligus (Gambar 5.3). Tombol kedua

yaitu tombol “Hapus Atribut” untuk menghapus atribut-atribut yang sudah

dipilih (Gambar 5.4). Tombol terakhir yaitu “Batal” yang dapat digunakan

untuk menghapus tanda centang pada semua checkbox (Gambar 5.5).


52

Gambar 5. 3 Tampilan Setelah Menekan Tombol “Tandai Semua”

Gambar 5. 4 Tampilan Setelah Menekan Tombol “Hapus Atribut”

Gambar 5. 5 Tampilan Setelah Menekan Tombol “Batal”

Berikut ini adalah tabel yang mencatat hasil dari pengujian blackbox pada

aktivitas-aktivitas yang dapat dilakukan pada Halaman Preprocessing

Tabel 5. 4 Tabel Hasil Uji Pada Halaman Preprocessing

Kasus dan Hasil Uji Pada Halaman Preprocessing

Require Skenario Uji Hasil yang diharapkan Hasil

Pengujian

Gambar


53

Pilih File

Pilih file

(jika benar)

Data tampil pada tabel

preprocessing Sesuai Gambar 5.1

Pilih file

(jika salah)

Tampil konfirmasi

salah memilih file Sesuai Gambar 5.2

Seleksi

Atribut

Seleksi

Atribut: tandai

semua

Semua checkbox pada

tabel seleksi atribut

terisi sekaligus Sesuai Gambar 5.3

Seleksi

Atribut:

Hapus atribut

Atribut yang ditandai

checkboxnya terhapus Sesuai Gambar 5.4

Seleksi

Atribut:

Batal

Semua tanda centang

pada checkbox atribut

yang dipilih pada tabel

seleksi atribut akan

langsung hilang

Sesuai Gambar 5.5

b. Pengujian Pada Halaman Asosiasi

Pada halaman asosiasi yang dapat dilakukan oleh pengguna adalah melihat

aturan asosiasi yang dihasilkan oleh sistem. Ada beberapa aktivitas yang harus

dilakukan oleh pengguna untuk mendapatkan aturan asosiasi tersebut. Aktivitas

pertama adalah mengisikan nilai minimum support dan minimum confidence.

Setelah itu pengguna akan menekan tombol “Proses” dan menampilkan hasil

aturan yang memenuhi minimum support dan minimum confidence dan

ditampilkan pada tabel (Gambar 5.6). Jika minimum confidence dan minimum

support tidak diisi maka akan menampilkan pesan berupa message dialog


54

(Gambar 5.7). Setelah hasil didapatkan, pengguna dapat menyimpan hasil

aturan asosiasi menjadi file dengan format .xls, .pdf, .doc dan .txt (Gambar 5.8).

Tabel 5. 5 Tabel Pengujian Halaman Preprocessing

Kasus dan Hasil Uji Pada Halaman Preprocessing

Require Skenario Uji Hasil yang diharapkan Hasil Pengujian Gambar

Mencari

Aturan

Memasukkan nilai

minimum support

dan minimum

confidence

(jika benar)

Menampilkan hasil

aturan pada tabel

Sesuai Gambar 5.6

Memasukkan nilai

minimum support

dan minimum

confidence

(jika benar)

Menampilkan message

dialog agar pengguna

mengisikan minimum

support dan minimum

confidence

Sesuai Gambar 5.7

Simpan

Hasil

Menekan tombol

“Simpan Hasil”

Menampilkan message

dialog jika data

tersimpan

Sesuai Gambar 5.8


55

Gambar 5. 6 Hasil Pencarian Aturan asosiasi

Gambar 5. 7 Tampilan Ketika Min Support dan Minimum confidence Tidak

Diisi


56

Gambar 5. 8 Kotak Dialog Simpan Hasil

Gambar 5. 9 Kotak Dialog Jika Berhasil Menyimpan Data

c. Uji Dengan Perhitungan Manual

Salah satu pengujian lainnya selain mencoba membandingkan hasil yang

didapat dari alat uji dengan aplikasi WEKA, cara lainnya adalah

membandingkan hasil dengan perhitungan manual. Untuk perhitungan manual

ini, peneliti menggunakan contoh 10 data saja. Data yang digunakan adalah

data nilai daya serap mata pelajaran Bahasa Indonesia.


57

Tabel 5. 6 Tabel Pengujian dengan Hitungan Manual

Hasil Pengujian

Min

Support 70

Min

Confidence 70

Frequent

Itemset

Alat Uji Hitung Manual

BIND3 7 BIND3 7

BIND4 8 BIND4 8

BIND16 7 BIND16 7

BIND2 8 BIND2 8

BIND17 7 BIND17 7

BIND6 9 BIND6 9

BIND17 BIND6 7 BIND6 BIND17 7







BIND4 BIND2

BIND6

7 BIND4 BIND2

BIND6

7

BIND17 BIND2

BIND6

7 BIND17 BIND2

BIND6

7


58

d. Kesimpulan Black Box Testing

Berdasarkan semua pengujian yang sudah dilakukan untuk halaman

preprocessing dan halaman asosiasi dapat disimpulkan bahwa sistem sudah

dapat dijalankan dengan baik karena sistem dapat dijalankan sesuai tabel

pengujian black box. Untuk output yang dihasilkan oleh sistem, peneliti juga

mencoba untuk membandingkannya dengan hasil dari perhitungan manual.

Hasil yang didapatkan dari perhitungan, hasil frequent itemset yang dihasilkan

antara perangkat lunak yang dibuat dan perhitungan manual memiliki hasil

yang sama.

5.2.2 Uji Validitas

a. Uji Validitas Dengan Aplikasi WEKA

Salah satu metode yang dilakukan peneliti untuk mengetahui valid atau

tidaknya hasil dari alat uji yang dibuat, maka peneliti melakukan perbandingan

hasil antara alat uji dengan aplikasi yang hasilnya sudah pasti dapat dipercaya

kebenarannya. Aplikasi yang dipilih oleh peneliti adalah aplikasi Weka versi

3.6. Weka adalah salah satu aplikasi penambangan data open source berbasis

Java. Aplikasi ini dibuat oleh Universitas Waikato, New Zealand dengan tujuan

untuk penelitian dan pendidikan. WEKA sendiri merupakan singkatan dari

Waikato Environment for Knowledge Analysis.

Pengujian ini menggunakan dataset yang diambil dari WEKA yang

berjudul supermarket.arff. Dataset ini memiliki 217 atribut dengan jumlah data

sebanyak 4627 buah. Untuk pengujian ini peneliti melakukan preprocessing

terlebih dahulu terhadap dataset ini. Data asli dari dataset ini dapat dilihat pada

Gambar 5.10.


59

Gambar 5. 10 Dataset Supermarket.arff

Dari data asli tersebut, peneliti memilih menggunakan 5 atribut saja

yaitu ‘grocery misc’, ‘baby needs’, ‘bread and cake’, ‘baking needs’ dan ‘juice-

sat-cord-ms’. Dataset ini berisikan nilai ‘?’ dan ‘t’. Agar dataset ini dapat

digunakan pada alat uji yang dibuat peneliti maka peneliti mengubah nilai ‘?’

menjadi ‘0’ dan ‘t’ menjadi ‘1’. Atribut pada dataset ini juga diubah menjadi

‘A’,’B’,’C’,’D’,’E’. Sehingga data setelah diubah menjadi seperti Gambar

5.11.


60

Gambar 5. 11 Dataset Setelah di Preprocessing

Setelah proses preprocessing, data langsung dicobakan terhadap alat

uji dan juga aplikasi WEKA. Dari hasil yang didapat, dapat dibuktikan bahwa

alat uji telah berhasil menghasilkan aturan asosiasi yang sama dengan aturan

asosiasi yang dihasilkan oleh aplikasi WEKA. Hasil dari keduanya dapat

dilihat pada tabel dibawah ini (Tabel 5.7). Item C adalah ‘bread and cake’,

item D adalah ‘baking needs’ dan item E merupakan ‘juice-sat-cord-ms’.

Tabel 5. 7 Tabel Hasil Pengujian dengan WEKA

Hasil Pengujian

Min

Support 40

Min

Confidence 60

Jumlah

Aturan 3

Alat Uji WEKA


61

Aturan Confidence Lift

ratio

Aturan Confidence Lift

ratio

E C 78.39% 1.09 E C 0.78 1.09

C D 65.8% 1.09 C D 0.66 1.05

D C 75.88% 1.05 D C 0.76 1.09

b. Kesimpulan Uji Validitas Dengan Aplikasi WEKA

Setelah menggunakan dataset yang sama, dataset tersebut dicobakan kepada 2

aplikasi berbeda. Aplikasi pertama yaitu aplikasi WEKA dan yang kedua

aplikasi yang sudah peneliti buat. Dari hasil yang didapatkan (Tabel 5.6) dapat

dilihat bahwa hasil antara kedua aplikasi tersebut sama, sehingga aplikasi yang

dibuat ini sudah baik dan dapat digunakan untuk pengujian.

5.2.3 Uji Coba Data Set

a. Ujicoba Dataset Tahun 2012/2013-2013/2014

Pengujian ini dilakukan dengan menggunakan dataset nilai daya serap

Ujian Nasional SMA mata pelajaran Bahasa Indonesia jurusan IPA pada tahun

ajaran 2012/2013-2013/2014. Data ini memiliki 280 baris data. Pengujian

dilakukan sebanyak 30 kali dengan kombinasi nilai minimal support dan

minimum confidence yang berbeda. Nilai confidence yang dipilih adalah nilai

60% dan 90% karena besar kecilnya confidence hanya akan mempengaruhi

jumlah aturan yang terbentuk tanpa mempengaruhi nilai lift ratio dan

confidencenya. Pada pengujian dengan nilai standar nilai daya serap 80% dan

minimum support 90% sudah tidak ditemukan lagi aturan yang muncul.


62

Berikut ini adalah contoh cara membaca tabel kombinasi antara

minimum support dan minimum confidence yang digunakan dengan nilai

standar nilai daya serap sebesar 75%:

1. Ketika minimum support 50% dan minimum confidence 60% maka akan

ditemukan sebanyak 1442 aturan dengan running time mencapai 0.86

second dan didapatkan lift ratio tertingginya sebesar 1.57.








ditemukan sebanyak 42 aturan dengan running time mencapai 0.015 second

dan didapatkan lift ratio tertingginya sebesar 1.09.








63

Tabel 5. 8 Tabel Hasil Pengujian Tahun 2012/2013 & 2013/2014, Min Conf=60%

Tahun

Standar

Daya

Serap

(%)

Min Support

(%)

Min

Confidence

(%)

Jumlah

Aturan

Asosiasi

Runing

Time(s)

Lift ratio

Terbesar

1213

&

1314

75

50

60

1442 0.86 1.57

55 481 0.156 1.39

60 300 0.031 1.21

70 42 0.015 1.09

80 6 0.0019 1.04

90 2 0.0014 1.01

80

50

60

87 0.0043 1.44

55 42 0.002 1.25

60 30 0.0021 1.17

70 6 0.0011 1.11

80 2 0.0011 1.06

90 0 0.0009 0

Tabel 5. 9 Tabel Hasil Pengujian Tahun 2012/2013 & 2013/2014, Min Conf = 90%

Tahun

Standar

Daya

Serap

(%)

Min Support

(%)

Min

Confidence

(%)

Jumlah

Aturan

Asosiasi

Runing

Time(s)

Lift ratio

Terbesar

1213

&

1314

75

50

90

415 0.229 1.57

55 155 0.0256 1.39

60 82 0.0091 1.20

70 21 0.0026 1.09


64

80 4 0.0016 1.04

90 2 0.0014 1.01

80

50

90

22 0.0035 1.37

55 16 0.0021 1.25

60 13 0.0018 1.17

70 2 0.0012 1.11

80 1 0.0011 1.06

90 0 0.0010 0

90

50

90

1 0.00088 1.09

55 1 0.00085 1.09

60 1 0.00083 1.09

70 0 0.00075 -

80 0 0.00070 -

90 - - -

b. Ujicoba Dataset Tahun 2014/2015

Pengujian ini dilakukan dengan menggunakan dataset berupa nilai daya

serap Ujian Nasional SMA mata pelajaran Bahasa Indonesia jurusan IPA pada

tahun ajaran 2014/2015. Data ini terdiri dari 140 sekolah yang ada di Provinsi

DI Yogyakarta. Pengujian dilakukan sebanyak 30 kali dengan kombinasi nilai

minimal support dan minimum confidence yang berbeda. Nilai confidence yang

dipilih adalah 60% dan 90% karena besar kecilnya confidence hanya akan

mempengaruhi jumlah aturan yang terbentuk tanpa mempengaruhi nilai lift

ratio dan confidencenya.

Berikut ini adalah contoh cara membaca tabel kombinasi antara minimum

support dan minimum confidence yang digunakan dengan nilai standart nilai

daya serap sebesar 75%:


65

















ditemukan sebanyak 12 aturan dengan running time mencapai 0 second dan

didapatkan lift ratio tertingginya sebesar 1.04.

Tabel 5. 10 Tabel Hasil Pengujian Tahun 2014/2015, Min Conf = 60%

Tahun

Standar

Daya

Serap

(%)

Min Support

(%)

Min

Confidence

(%)

Jumlah

Aturan

Asosiasi

Runing

Time(s)

Lift ratio

Terbesar

1415

75

50

60

8186 84.957 1.37

55 8186 84.007 1.37

60 4094 19.904 1.34


66

70 1530 1.235 1.28

80 186 0.016 1.1

90 12 0 1.04

80

50

60

994 0.766 1.46

55 506 0.125 1.37

60 504 0.062 1.38

70 62 0.016 1.18

80 42 0 1.11

90 2 0.015 1.03

Tabel 5. 11 Tabel Hasil Pengujian Tahun 2014/2015, Min Conf = 90%

Tahun

Standar

Daya

Serap

(%)

Min Support

(%)

Min

Confidence

(%)

Jumlah

Aturan

Asosiasi

Runing

Time(s)

Lift ratio

Terbesar

1415

75

50

90

2263 82.34 1.37

55 2263 78.26 1.37

60 1665 18.01 1.34

70 913 0.645 1.28

80 143 0.010 1.1

90 12 0.001 1.04

80

50

90

260 0.448 1.46

55 158 0.106 1.37

60 218 0.049 1.38

70 32 0.004 1.18

80 33 0.0018 1.11

90 2 0.0009 1.03


67

90

50

90

1 0.00083 1.09

55 1 0.00080 1.09

60 1 0.00081 1.09

70 0 0.00071 -

80 0 0.00071 -

90 - - -

c. Uji Running Time

Untuk pengujan running time akan digunakan percobaan dengan nilai

minimum confidence yang berbeda karena minimum confidence mempengaruhi

jumlah aturan asosiasi yang terbentuk. Nilai confidence yang digunakan adalah

60% dan 90%.

1. Data Tahun 2012/2013 & 2013/2014

Gambar 5. 12 Uji Running Time Min Confidence=60%

50 55 60 70 80 90

Standar 75 0.86 0.156 0.031 0.015 0.0019 0.0014

Standar 80 0.0043 0.002 0.0021 0.0011 0.0011 0.0009

00.10.20.30.40.50.60.70.80.9

11.11.21.3

Ru

nn

ing

Tim

e(s

)

Minimum support (%)

Running Time Data Tahun 2012/2013 & 2013/2014


68


2. Data Tahun 2014/2015


50 55 60 70 80 90

Standar 75 0.229 0.0256 0.0091 0.0026 0.0016 0.0014

Standar 80 0.0035 0.0021 0.0018 0.0012 0.0011 0.001

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

1.3

Ru

nn

ing

Tim

e(s

)

Minimum support(%)

Running Time Data Tahun 2012/2013 & 2013/2014

50 55 60 70 80 90

Standar 75 84.957 84.007 19.904 1.235 0.016 0

Standar 80 0.766 0.125 0.062 0.016 0 0.015

0

10

20

30

40

50

60

70

80

90

Ru

nn

ing

Tim

e(s

)

Minimum support(%)

Data Tahun 2014/2015


69


d. Kesimpulan Uji Dataset

Hasil yang didapatkan dengan melakukan pengujian dataset 2012/2013-

2013/2014 dan 2014/2015 menghasilkan jumlah aturan asosiasi yang berbeda.

Pada tahun 2014/2015 jika diamati baik-baik atau dihitung nilai rata-ratanya,

nilai daya serap pada tahun tersebut memang lebih baik karena banyak nilai

yang lebih dari nilai standar daya serap yang ditetapkan saat pengujian

dibandingkan nilai daya serap tahun 2012/2013-2013/2014. Nilai pada tahun

2014/1015 tersebut lebih baik karena bisa juga disebabkan karena adanya

peralihan kurikulum dari KTSP menjadi kurikulum 2013 yang lebih

menekankan kepada keaktifan murid dalam memahami materi. Nilai lift ratio

yang didapatkan pada pengujian dataset mencapai nilai lebih dari 1 yang berarti

dapat diartikan aturan tersebut dapat dikatakan aturan asosiasi tersebut menarik

dan memiliki korelasi antar anteseden dan konsekuen. Sedangkan jika ada

aturan asosiasi yang memiliki nilai lift ratio sama dengan 1 maka dapat

1 2 3 4 5 6

Standar 75 82.34 78.26 18.01 0.645 0.01 0.001

Standar 80 0.448 0.106 0.049 0.004 0.0018 0.0009

0

10

20

30

40

50

60

70

80

90

Ru

nn

ing

Tim

e(s

)

Minimum support(%)

Data Tahun 2014/2015


70

diartikan kompetensi-kompetensi tersebut saling independen. Lalu jika nilai lift

ratio kurang dari 1 maka kompetensi-kompetensi tersebut tidak menunjukkan

adanya saling keterkaitan antara anteseden dan konsekuen. Jika dilihat pula dari

pengujian yang dilakukan dengan menggunakan kombinasi antara minimum

support dan minimum confidence maka didapat hasil seperti pada grafik di

gambar 5.12 sampai 5.15. Dari semua pengujian dengan dataset yang berbeda,

hasil running time yang didapatkan selalu menurun ketika minimum support-

nya semakin besar. Nilai running time akan bernilai besar jika minum support-

nya kecil.

e. Evaluasi Pola Asosiasi

Berdasarkan pengujian yang sudah dilakukan pada 2 dataset dapat

diketahui bahwa pada saat minimum support-nya 50% maka dapat dihasilkan

nilai lift ratio yang tinggi. Untuk setiap percobaan ditemukan ada beberapa

aturan asosiasi yang memiliki nilai ratio yang tinggi, jadi bukan hanya ada 1

aturan asosiasi saja. Pada sub bab ini, akan dianalisis kembali aturan-aturan

asosiasi yang memiliki nilai lift ratio tertinggi. Analisis tersebut bertujuan

untuk melihat apakah aturan tersebut menarik jika dianalisa secara obyektif

maupun subyektif. Analisa yang bersifat obyektif dapat dilihat dari nilai lift

ratio, sendangkan analisa yang bersifat subyektif didapatkan dari menanyakan

pendapat kepada seorang praktisi pendidikan yang merupakan guru SMA mata

pelajaran Bahasa Indonesia. Pertanyaan yang diberikan kepada guru SMA

tersebut adalah mengenai apakah aturan asosiasi yang dihasilkan relevan dan

apakah benar jika memahami kompetensi yang menjadi anteseden maka akan

memahami kompetensi yang menjadi konsekuen. Berikut ini adalah aturan

asosiasi yang dipilih berdasarkan nilai lift ratio tertinggi beserta hasil analisa

secara subyektifnya.


71

1. Data Tahun 2012/2013-2013/2014

Berikut ini adalah aturan asosiasi yang didapatkan ketika nilai minimum

support 50%, minimum confidence 60% dan standar nilai daya serap sebesar

75%. Dari banyaknya aturan asosiasi yang dihasilkan, ditemukan 6 aturan

asosiasi yang memiliki nilai lift ratio tertinggi sebesar 1.57. Keenam aturan

asosiasi tersebut memiliki nilai confidence yang berbeda. Perbedaan nilai

confidence disebabkan oleh nilai support untuk setiap kompetensi yang

menjadi anteseden dan konsekuen pada setiap aturan asosiasinya tidak sama.

Tabel 5. 12 Daftar aturan asosiasi data tahun 2012/2013-2013/2014

Rule

Aturan Confidence

Lift

ratio

Analisa

Subyektif

1 BIND9 BIND17 BIND2 BIND7

BIND16 BIND4 BIND6 90.91% 1.57

Belum

Tentu


BIND9 BIND17 BIND6 90.91% 1.57 Ya

3 BIND7 BIND16 BIND2 BIND4 BIND6

BIND9 BIND17 90.91% 1.57

Belum

Tentu


BIND2 BIND4 BIND6 86.42% 1.57

Belum

Tentu





[Rule 1] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai

standar yang ditentukan pada kompetensi “Menentukan kalimat resensi”,

“Menulis judul sesuai EYD” dan “Melengkapi dialog drama” MAKA sekolah


72

tersebut juga memiliki nilai daya serap yang memenuhi standar di kompetensi

“Menentukan isi paragraf: fakta, opini, pernyataan/ jawaban pertanyaan sesuai

isi, tujuan penulis, arti kata/istilah, isi biografi”, “Menentukan unsur-unsur

paragraf, ide pokok, kalimat utama, kalimat penjelas”, “Melengkapi paragraf

dengan kata baku, kata serapan, kata berimbuhan, kata ulang, ungkapan,

peribahasa” dan “Menentukan isi dan simpulan grafik, diagram atau tabel”.


standar yang ditentukan pada kompetensi “Menentukan isi paragraf: fakta,

opini, pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti

kata/istilah, isi biografi”, “Menentukan unsur-unsur paragraf, ide pokok,

kalimat utama, kalimat penjelas”, “Melengkapi dialog drama” dan

“Melengkapi paragraf dengan kata baku,kata serapan, kata berimbuhan, kata

ulang, ungkapan, peribahasa” MAKA sekolah tersebut juga memiliki nilai daya

serap yang memenuhi standar di kompetensi “Menentukan kalimat resensi”,

“Menulis judul sesuai EYD” dan “Menentukan isi dan simpulan grafik,

diagram atau tabel”.





kalimat utama, kalimat penjelas”, “Melengkapi dialog drama”, “Melengkapi

paragraph dengan kata baku,kata serapan, kata berimbuhan, kata ulang,

ungkapan, peribahasa” dan “Menentukan isi dan simpulan grafik, diagram atau

tabel” MAKA sekolah tersebut juga memiliki nilai daya serap yang memenuhi

standar di kompetensi “Menentukan kalimat resensi” dan “Menulis judul sesuai

EYD".


73



“Menulis judul sesuai EYD” MAKA sekolah tersebut juga memiliki nilai daya

serap yang memenuhi standar di kompetensi “Menentukan isi paragraf: fakta,



kalimat utama, kalimat penjelas”, “Melengkapi dialog drama”, “Melengkapi

paragraph dengan kata baku,kata serapan, kata berimbuhan, kata ulang,

ungkapan, peribahasa” dan “Menentukan isi dan simpulan grafik, diagram atau

tabel”.



“Menulis judul sesuai EYD” dan “Menentukan isi dan simpulan grafik,

diagram atau tabel” MAKA sekolah tersebut juga memiliki nilai daya serap

yang memenuhi standar di kompetensi “Menentukan isi paragraf: fakta, opini,

pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi

biografi”, “Menentukan unsur-unsur paragraf, ide pokok, kalimat utama,

kalimat penjelas”, “Melengkapi dialog drama” dan “Melengkapi paragraf

dengan kata baku,kata serapan, kata berimbuhan, kata ulang, ungkapan,

peribahasa”.





kalimat utama, kalimat penjelas”, “Melengkapi paragraph dengan kata


74

baku,kata serapan, kata berimbuhan, kata ulang, ungkapan, peribahasa” dan

“Menentukan isi dan simpulan grafik, diagram atau tabel” MAKA sekolah

tersebut juga memiliki nilai daya serap yang memenuhi standar di kompetensi

“Menentukan kalimat resensi”, “Menulis judul sesuai EYD” dan “Melengkapi

dialog drama”.

2. Data Tahun 2014/2015

Berikut ini adalah aturan asosiasi yang didapatkan ketika nilai minimum

support 50%, minimum confidence 60% dan standar nilai daya serap sebesar

80%. Dari banyaknya aturan asosiasi yang dihasilkan, ditemukan 8 aturan

asosiasi yang memiliki nilai lift ratio tertinggi sebesar 1.46. Kedelapan aturan

asosiasi tersebut memiliki nilai confidence yang berbeda. Perbedaan nilai

confidence disebabkan oleh nilai support untuk setiap kompetensi yang

menjadi anteseden dan konsekuen pada setiap aturan asosiasinya tidak sama.

Berikut ini adalah tabel yang berisikan 2 aturan asosiasi yang memiliki nilai

confidence tertinggi dari 8 aturan asosiasi yang memiliki nilai lift ratio 1.46:

Tabel 5. 13 Daftar aturan asosiasi data tahun 2014/2015

Rule

Aturan Confidence

Lift

ratio

Analisa

Subyektif

7



BIND6

91.03% 1.46 Ya


75

8



BIND2

91.03% 1.46 Ya



opini, pernyataan/jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah,

isi biografi”, “Menentukan unsur-unsur intrinsik/ ekstrinsik

novel/cerpen/drama” dan “Melengkapi paragraf dg kata baku, kata serapan,

kata berimbuhan, kata ulang, ungkapan, peribahasa” MAKA sekolah tersebut

juga memiliki nilai daya serap yang memenuhi standar di kompetensi “Menulis

karya ilmiah (latar belakang dan rumusan masalah)”, “Melengkapi berbagai

bentuk dan jenis paragraf dengan kalimat yang padu”, “Menulis judul sesuai

EYD”, “Menyunting kalimat dalam surat resmi”, “Melengkapi dialog drama”

dan “Menentukan isi dan simpulan grafik, diagram atau tabel”.



opini, pernyataan/jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah,

isi biografi”, “Menentukan unsur-unsur intrinsik/ ekstrinsik

novel/cerpen/drama”, “Melengkapi paragraf dg kata baku, kata serapan, kata

berimbuhan, kata ulang, ungkapan, peribahasa” dan “Menulis judul sesuai

EYD” MAKA sekolah tersebut juga memiliki nilai daya serap yang memenuhi

standar di kompetensi “Menulis karya ilmiah (latar belakang dan rumusan

masalah)”, “Melengkapi berbagai bentuk dan jenis paragraf dengan kalimat

yang padu”, “Menulis judul sesuai EYD”, “Menyunting kalimat dalam surat

resmi” dan “Melengkapi dialog drama”.


76

Dari percobaan yang dilakukan dengan dataset tahun 2012/2013-2013/2014

dan 2014/2015 dihasilkan banyak sekali aturan asosiasi. Dari kumpulan aturan

asosiasi tersebut tidak semua aturan dapat dimbil sebagai dasar membuat suatu

keputusan. Aturan yang dapat digunakan adalah aturan-aturan yang memiliki

nilai lift ratio dan confidence tinggi (analisa secara obyektif) dan aturan yang

memiliki relevansi dengan kebutuhan (analisa secara subyektif). Analisa secara

subyektif ini dilakukan dengan cara menanyakan pendapat kepada salah

seorang praktisi pendidikan di bidang Bahasa Indonesia. Hasil analisa secara

subyektif ini adalah dapat mengetahui aturan-aturan yang antar kompetensinya

memang benar berkorelasi dan yang belum tentu berkorelasi. Berikut ini adalah

aturan asosiasi yang dinyatakan berkorelasi untuk dataset tahun 2012/2013-

2013/2014:

1. [Rule 2] {BIND7 BIND16 BIND2 BIND4} {BIND9 BIND17 BIND6}

(support = 50%, confidence 90.91%)

3. [Rule 3] {BIND7 BIND16 BIND2 BIND4 BIND6} {BIND9 BIND17}


4. [Rule 6] {BIND7 BIND16 BIND4 BIND6} {BIND9 BIND17 BIND2}


Ketiga aturan asosiasi diatas, jika dilihat dari nilai standar daya serap, support

dan nilai confidence-nya dapat diartikan bahwa ada 50% sekolah yang

mendapatkan nilai daya serap lebih dari 75% untuk kompetensi-kompetensi

yang menjadi aturan asosiasi. Sebesar 90.91% sekolah yang mendapatkan nilai

daya serap lebih dari 75% di kompetensi-kompetensi yang menjadi anteseden

juga mendapatkan nilai daya serap lebih dari 75% di kompetensi-kompetensi

yang menjadi konsekuen pada rule 2 dan 3. Sedangkan rule 6, sebesar 86.42%

sekolah yang mendapatkan nilai daya serap lebih dari 75% di kompetensi-

kompetensi yang menjadi anteseden juga mendapatkan nilai daya serap lebih

dari 75% di kompetensi-kompetensi yang menjadi konsekuen Di bawah ini


77

adalah aturan asosiasi yang dinyatakan berkorelasi untuk dataset tahun

2014/2015:

1. [Rule 7] BIND7 BIND14 BIND4 BIND17 BIND1 BIND16 BIND20

BIND2 BIND6 (support = 57.85%, confidence 91.03%)

2. [Rule 8] BIND7 BIND14 BIND4 BIND6 BIND17 BIND1 BIND16

BIND20 BIND2 (support = 57.85%, confidence 91.03%)

Kedua aturan asosiasi diatas, jika dilihat dari nilai standar daya serap, support

dan nilai confidence-nya dapat diartikan bahwa ada 57.85% sekolah yang

mendapatkan nilai daya serap lebih dari 75% untuk kompetensi-kompetensi

yang menjadi aturan asosiasi. Sebesar 91.03% sekolah yang mendapatkan nilai

daya serap lebih dari 75% di kompetensi-kompetensi yang menjadi anteseden

juga mendapatkan nilai daya serap lebih dari 75% di kompetensi-kompetensi

yang menjadi konsekuen.


78

BAB VI

PENUTUP 6.1 Kesimpulan

Dari pengujian-pengujian yang dilakukan pada sistem pencarian pola asosiasi

menggunakan algoritma Frequent Pattern Growth (FP-Growth) terhadap data

nilai daya serap Ujian Nasional jurusan IPA dengan mata pelajaran Bahasa

Indonesia ini dapat ditarik kesimpulan sebagai berikut:

1. Algoritma FP-Growth untuk menemukan aturan asosiasi yang menarik dari

data nilai daya serap Ujian Nasional SMA mata pelajaran Bahasa Indonesia

ini telah berhasil diterapkan dengan cara melakukan proses awal

pembersihan data, integrasi data dan seleksi data. Setelah itu dilakukan

transformasi data dengan memasukkan nilai standar daya serap. Proses

selanjutnya adalah melakukan proses data mining dengan menerapkan

algritma FP Growth yang diawali dengan pembangkitan FPTree.

Selanjutnya metode FP Growth diimplementasikan dengan 3 tahap utama

yaitu pembangunan conditional pattern base, conditional fp tree dan

pencarian frequent itemset. Hasil frequent itemset yang dihasilkan

kemudian dikombinasikan untuk dijadikan aturan asosiasi dan dihitung

confidence beserta lift ratio-nya.

2. Sistem yang dibuat dengan melakukan penerapan metode FP-Growth ini

menghasilkan 5 aturan asosiasi yang menarik berdasarkan nilai lift ratio

tertinggi untuk tahun akademik 2012/2013-2013/2014 adalah {BIND7

BIND16 BIND2 BIND4} {BIND9 BIND17 BIND6}, {BIND7 BIND16

BIND2 BIND4 BIND6} {BIND9 BIND17}, {BIND7 BIND16 BIND4

BIND6} {BIND9 BIND17 BIND2}. Sedangkan untuk tahun 2014/2015

aturan asosiasi yang menarik adalah {BIND7 BIND14 BIND4}

{BIND17 BIND1 BIND16 BIND20 BIND2} dan {BIND7 BIND14 BIND4

BIND6} {BIND17 BIND1 BIND16 BIND20 BIND2}. Secara subyektif


79

kompetensi-kompetensi dalam aturan-aturan asosiasi tersebut memang

saling berkaitan.

3. Nilai standar minimal daya serap mempengaruhi perhitungan algoritma FP-

Growth karena semakin besar nilai standar ketuntasan yang dimasukkan

maka jumlah aturan asosiasi yang dihasilkan semakin banyak.

6.2 Saran

1. Sistem dapat mengubah hasil aturan asosiasi ke dalam bentuk yang lebih

komunikatif agar semua pengguna dapat mengerti maksud dari aturan

asosiasi yang dihasilkan.

2. Sistem dapat dikembangkan kedalam bentuk sistem berbasis web.

3. Sistem dapat dikembangkan dengan data inputan dari database.

4. Sistem dapat melakukan proses preprocessing.

5. Sistem dapat membaca hasil yang dulu pernah disimpan, sehingga

pengguna langsung dapat melihat hasilnya di dalam sistem.


80

DAFTAR PUSTAKA

Bloom, Benjamin S. 1971. Taxonomy of Objective : The Clasification Of Educational

Goals. Hanbook 1. Cognitive Domain New York : David McKay Company.Inc

Dahlan, Ahmad. 2014. Pengertian dan Peranan Evaluasi Pembelajaran.

http://www.eurekapendidikan.com diakses taggal 2 Juni 2016

Fayyad,Usama. 1996. Advances in Knowledge Discovery and Data Mining . MIT Press

Han Jiawei, and M. Kamber. 2006. Data Mining: Concepts and Techniques, Morgan

Kaufmann, USA.

Hermawati, Fajar Astuti.2013. Pengolahan Citra Digital Konsep dan Teori, Andi,

Yogyakarta.

Hoffer,J.A., M.B. Prescott, dan F.R McFadden. 2005. Modern Database Management.

New Jersey :Pearson, Prentice Hall.

Kemendikbud, 2015. Kemendikbud Umumkan Tujuh Provinsi Dengan Indeks

Integritas Tertinggi Dalam UN 2015. http://litbang.kemdikbud.go.id diakses

tanggal 12 Desember 2015.

Kemendikbud, Puspendik Balibang. 2015. Buku Panduan Pemanfaatan PAMER UN-

2015. Jakarta.

Octaviani, Anmetatika Angelia.2010. ”Analisis Perbandingan Algoritma FP-Growth

Dan Algoritma Apriori pada Market Basket Analysis”. Universitas Telkom,

Bandung

Pramudiono, Ika. 2006. Model Pencarian pada Mesin Pencari. Bandung

Rickyanto, Isak. 2003. Membuat Aplikasi Windows dengan Visual Basic.NET, Elek

Media Komputindo, Jakarta.


http://www.eurekapendidikan.com/

http://litbang.kemdikbud.go.id/

81

Samuel, David. 2008. Penerapan Stuktur FPTree dan Algoritma FPGrowth dalam

Optimasi Penentuan Frequent Itemset”. Institut Teknologi Bandung, Bandung

Santosa, Budi. 2007. “Data Mining Teknik Pemanfaatan Data untuk Keperluan

Bisnis”, Graha Ilmu, Yogyakarta

Stufflebeam, L.D. & Shrinkfiel,J. (1985). Systematic evaluation : A self-instructional

guide to theory and practice. New York : Kluwer Nijhoff Pulishing.

Turban,Efraim., Ramesh Sharda, Dursun Delen. 2005. Decision Support System and

Intelligent System (Sistem Pendukung Keputusan dan Sistem Cerdas), Andi,

Yogyakarta


82

LAMPIRAN

Lampiran 1: Diagram Aktivitas

Diagram Aktivitas 001

Memilih Data

Ph

ase

USER SISTEM

Menekan tombol "Pilih File"

Memilih file yang akan digunakan

Menampilkan kotak dialog file chooser

Apakah file bertipe .csv atau .xls?

Menampilkan kotak dialog bertulis" Maaf, Sistem Hanya Menerima File

Bertipe .xls dan .csv"

Menampilkan data pada table

Gambar 1 Diagram Aktivitas 001


83


Mencari Aturan Asosiasi

Ph

ase

USER SISTEM

Mengisikan nilai minimum support dan minimum confidence

Menekan tombol "Proses"Menjalankan algoritma FP Growth

dan menampilkan hasil rules dihasilkan



84


Menyimpan Hasil

Ph

ase

USER SISTEM

Menekan tombol "Simpan Hasil"

Memilih lokasi dan tipe file untuk meyimpan hasil

Menampilkan kotak save dialog

File berhasil disimpan di direktori komputer



85

Lampiran 2 : Diagram Kelas Analisis

view_home view_preprocessing

view_asosiasi

control_algorithm

model_combination

TreeNode

comparatorHeaderTable

control_atributSelection model_atributSelection

view_about

view_help

Gambar 4 Diagram Kelas Analisis


86

Lampiran 3:Diagram Sequence

1. Memilih Data

USER

<<Interface>>view_home.java

2. Menampilkan view_preprocessing.java

1. Klik "Masuk Sistem"

<<Interface>>view_preprocessing.java

3. Klik tombol Pilih File

4. Menampilkankotak dialog file chooser

5. Memilih file bertipe .xls atau .csv

6. bt_chFileActionPerformed

(java.awt.event.ActionEvent evt)

<<control>>control_atributSelection.java

7. new control_atributSelection()

<<model>>model_atributSelection.java

8. setAtribut(dft.getColumnName(i)) , setPilih(false)

9. addRow(i, asModel)

11. Menampilkan data

di table tb_fileInput

Gambar 5 Diagram Sequence Memilih Data


87

2. Mencari Aturan Asosiasi

USER

<<Interface>>view_asosiasi.java

1. Isikan minimum support dan minimum

confidence

<<control>>control_algorithm.java

<<model>>comparitorHeaderTable.

java

2. Tekan tombol "Proses"

6. bt_processActionPerformed


7. FPTree()

10. new comparitorHeaderTable()

8. InsertNode()

<<model>>TreeNode.

java

9. new TreeNode()

11. FPgrowth(ArrayList<LinkedList

<String>>, double,int, double)

12. FPgrowth(TreeNode, String, double, ArrayList<TreeNode>,

Map<String, Integer>),

conditional_fptree_constructor()

13. new comparitorHeaderTable()

14. new model_combination(itemChange)

<<model>>model_combination.java

15.Menampilkan rule yang dihasilkan

Gambar 6 Diagram Sequence Mencari Aturan Asosiasi


88

3. Menyimpan Hasil

USER

<<Interface>>view_asosiasi.java

1. Menekan tombol "Simpan Hasil"

2.Menampilkan save dialog

3. Memilih lokasi penyimpanan,

tipe file dan mengisikan nama file

4. Menekan tombol Save

5. bt_saveActionPerformed


6. File berhasil disimpan di direktori

komputer

Gambar 7 Diagram Sequence Menyimpan Hasil


89

Lampiran 4: Diagram Kelas Desain

Berikut ini adalah detail kelas yang berisi atribut dan method-method yang dipakai dalam

pembuatan perangkat lunak :

1. Kelas control_algorithm

control_algorithm

-frequentPatterns : Map<String,Integer>-headerTable : ArrayList<TreeNode>-treeNode : TreeNode-treenode : TreeNode

-FPGrowth() : ArrayList<ArayList<String>>-FPTree() : void-FPgrowth() : void-conditional_fptree_constructor() : TreeNode-insert() : void-insertNode() : void

2. Kelas control_atributSelection

control_atributSelection

-atribut : List<model_atributSelection>-atributSelection : model_atributSelection-column : String[]

+control_atributSelection<<constructor>>+Delete_Atribut() : void+addRow(int,model_atributSelection) : void+getColumnClass(int) : Class+getColumnCount() : int+getColumnName() : String+getRowCount() : int+getValueAt() : Object+isCellEditable() : boolean+setValueAt() : void

3. Kelas Koneksi


90

Koneksi

-connect : Connection-database : String-driverName : String-host : String-jdbc : String-password : String-port : String-url : String-username : String

+getConnect() : Connection+getKoneksi() : Connection+setConnect() : void

4. Kelas TreeNode

TreeNode

-child : List<TreeNode>-counts : int-name : String-next : TreeNode-parent : TreeNode-root : boolean

+TreeNode() <<constructor>>+TreeNode(int,String,TreeNode) <<constructor>>+TreeNode(int, String) <<constructor>>+TreeNode(String) <<constructor>>+addCount() : void+getChild() : List<TreeNode>+getCounts() : int+getName() : String+getNext() : TreeNode+getParent() : TreeNode+isRoot() : boolean+setChild() : void+setCounts() : void+setName() : void+setNext() : void+setParent() : void+setRoot() : void

5. Kelas comparitorHeaderTable


91

comparitorHeaderTable

+comparitorHeaderTable <<constructor>>+compare() : int

6. Kelas model_atributSelection

model_atributSelection

-atribut : String-pilih : boolean

+model_atributSelection(String,boolean) <<constructor>>+model_atributSelection()<<constructor>>+getAtribut() : String+getPilih() : boolean+setAtribut() : void+setPilih() : void

7. Kelas model_combination

model_combination

-antecedent : ArrayList-consequent : ArrayList-inputString : String-output : StringBuilder

+model_combination()<<constructor>>+Combine() : void+CountConfAndLift() : ArrayList<String>

8. Kelas model_competence


92

model_competence

+model_competence(String, String) <<constructor>>+model_competence(String) <<constructor>>+model_competence(Connection) <<constructor>>+model_competence()+addCompetence() : void+getCompetenceName() : String+getCon() : Connection+getIdCompetence : String+getKoneksiBaru() : model_competence+getSubject() : String+setCompetenceName() : void+setCon() : void+setIdCompetence() : void+setSubject() : void

9. Kelas view_preprocessing

view_preprocessing

-array1 : Arraylist<LinkedList<String>>-array2: LinkedList <String>-asControl : control_atributSelection-asModel : model_atributSelection-map: HashMap<String,Integer>

+view_preprocessing() <<constructor>>-bt_aboutActionPerfomed()-bt_cancelActionPerfomed()-bt_chFileActionPerfomed()-bt_convertActionPerfomed()-bt_delAtributActionPerfomed()-bt_helpActionPerfomed()-bt_homeActionPerfomed()-bt_markAllActionPerfomed()-bt_submitActionPerfomed()+initComponents()

10. Kelas view_home


93

view_home

+view_home() <<constructo>>-bt_aboutActionPerfomed()-bt_helpActionPerfomed()-bt_systemActionPerfomed()+initComponents()

20.Kelas view_help

view_help

-memberName

+view_help()<<constructor>>-bt_aboutActionPerfomed()-bt_homeActionPerfomed()+initComponents(

11. Kelas view_asosiasi


94

view_asosiasi

-arrayBaru : ArraList<LinkList<String>>-arayData : ArrayList<Linklist<String>>-con : control_algorithm -mapdata : HashMap<String,Integer>-minConfidence : double-minSupport : double-newArray : ArrayList<TrreNode>-sortedItemsbyFrequencies: ArrayList<TreeNode>-totalData : String-totalItem : int-totalTransaction :int-transactionFile : String

+view_asosiasi()<<constructor>>+BubbleSortODesc() : void+BubleSortODescArayList() : void+RemovbleNoFequentItem() : void-bt_aboutActionPerfomed() : void-bt_helpActionPerfomed() : void-bt_homeActionPerfomed() : void-bt_processActionPerfomed() : void-bt_saveActionPerfomed() : void+initComponents() : void+setTableAsosiasi() : void

12. Kelas view_about

view_about

+view_about()-bt_helpActionPerfomed()-bt_homeActionPerfomed()+initComponents()


95

Lampiran 5: Penghitungan Manual

Berikut adalah proses perhitungan manual yang akan dilakukan.

1. Hal pertama yang dilakukan pada tahap ini adalah menentukan standart nilai daya

serap yang dianggap baik. Untuk contoh, penulis menggunakan standar nilai 76

dengan data 10 sekolah saja.

Gambar 8 Tabel Data Setelah Preprocessing

1. Setelah didapatkan tabel data seperti diatas maka langkah selanjutnya adalah

menghitung frequent itemset tiap sekolah.

Tabel 1 Daftar Jumlah Tiap Item Pada Transaksi

Kompetensi Frequent

BIND1 5

BIND2 8

BIND3 7

BIND4 8

BIND5 0

BIND6 9

BIND7 6

BIND8 2

BIND9 5

BIND10 4

BIND11 0

BIND12 5

BIND13 3

BIND14 3

BIND15 4

BIND16 7

BIND17 7

BIND18 5

BIND19 0


96

2. Setelah itu tetapkan nilai minimum support dan minimum confidence terlebih dulu.

Penulis menggunakan nilai minimum support 70% atau sama dengan 7 dan

minimum confidence 80%.

Tabel 2 frequent itemset

Kompetensi Frequent

BIND17 7

BIND16 7

BIND3 7

BIND4 8

BIND2 8

BIND6 9

3. Setelah ditemukan kompetensi-kompetensi yang sering muncul dan jumlahnya

sesuai dengan minimum support, selanjutnya akan diurutkan berdasarkan

kompetensi yang paling sering muncul karena akan digunakan untuk menentukan

prioritas. Tabel Prioritas ini selanjutkan akan digunakan untuk tahap-tahap

selanjutnya dan digunakan sebagai header table.

Tabel 3 Prioritas

Kompetensi Frequent Prioritas

BIND17 7 6

BIND16 7 5

BIND3 7 4

BIND4 8 3

BIND2 8 2

BIND6 9 1

4. Berdasarkan prioritas yang sudah ada maka data yang ada diurutkan kembali

berdasarkan prioritas yang sudah ditetapkan.

Tabel 4 Data Setelah Item-nya Diurutkan

Id Sekolah Kompetensi

01-010 BIND6,BIND16

01-011 BIND6,BIND2,BIND4


97

01-012 BIND6,BIND2,BIND4,BIND3,BIND16,BIND17




01-019 BIND4,BIND3

01-020 BIND6,BIND2,BIND17



5. Setelah data sudah diurutkan berdasarkan prioritas dan memenuhi minimum

support yang ditentukan, langkah selanjutnya adalah membuat struktur pohon fp

tree untuk setiap baris data. Berikut adalah struktur pohon dari semua data yang

ada.

Gambar 9 Struktur FP Tree

6. Setelah pohon fp tree terbentuk, langkah selanjutnya adalah menghitung

conditional pattern base dan conditional fp tree. Pencarian conditional pattern base

dan conditional fp tree didapat dari sub tree berdasarkan item yang memiliki count

paling kecil.


98

7. Item pertama yang memiliki count paling kecil berdasarkan urutan prioritas adalah

BIND17 dengan nilai count 7. Setelah itu maka akan dibuat subtree yang

berakhiran node BIND17. Dari subtree tersebut dapat ditemukan conditional

pattern base, conditional fp-tree dan frequent itemsetnya. Item BIND17 ini

memiliki 2 pattern base yakni {BIND6, BIND2:1} dan {BIND6, BIND2, BIND4,

BIND3, BIND16:6}. Dari pattern base tersebut dapat ditemukan conditional fp-

tree-nya yaitu BIND6:7 dan BIND2:7. Selanjutnya untuk mendapatkan frequent

itemset maka dilakukanlah pengkombinasian dari item yang akan dibuat

conditional fp tree nya selama count dari item tersebut memenuhi minimum

support.

Gambar 10 Sub-Database BIND17

Tabel 5 Daftar Frequent Itemset BIND17

Conditional Pattern Base Conditional

FP Tree Frequent Itemset

{BIND6, BIND2:1}

{BIND6, BIND2, BIND4,

BIND3, BIND16:6}

{BIND6:7

,BIND2:7}

BIND17: 7

BIND6 BIND17: 7

BIND2 BIND17:7

BIND17 BIND2 BIND6:7


99

8. Item kedua yang memiliki count paling kecil berdasarkan urutan prioritas adalah

BIND16 dengan nilai count 7. Setelah itu maka akan dibuat subtree yang

berakhiran node BIND16. Dari subtree tersebut dapat ditemukan conditional

pattern base, conditional fp-tree dan frequent itemsetnya. Item BIND16 ini

memiliki 2 pattern base yakni {BIND6:1} dan {BIND6, BIND2, BIND4, BIND3,

BIND16 :6}. Dari pattern base tersebut dapat ditemukan conditional fp-treenya

yaitu BIND6 dengan count 7.





{BIND6:1}

{BIND6, BIND2, BIND4,

BIND3, BIND16 :6}

{BIND6:7} BIND16:7

BIND6 BIND16: 7

9. Item ketiga yang memiliki count paling kecil berdasarkan urutan prioritas adalah

BIND3 dengan nilai count 7. Setelah itu maka akan dibuat subtree yang berakhiran

node BIND3. Dari subtree tersebut dapat ditemukan conditional pattern base,

conditional fp-tree dan frequent itemsetnya. Item BIND3 ini memiliki 2 pattern


100

base yakni {BIND6:1, BIND2:6, BIND4:6} dan{BIND4:1}. Dari pattern base

tersebut dapat ditemukan conditional fp-treenya yaitu BIND4 dengan count 7.





{BIND6:1, BIND2:6,

BIND4:6}

{BIND4:1}

{BIND4:7} BIND3:7,

BIND3 BIND4 : 7

10. Item keempat yang memiliki count paling kecil berdasarkan urutan prioritas adalah





101

base yakni {BIND6:7, BIND2:7}. Dari pattern base tersebut dapat ditemukan

conditional fp-treenya yaitu BIND6 dengan count 7 dan BIND2 dengan count 7.



Conditional Pattern

Base

Conditional FP

Tree Frequent Itemset

{BIND6:7,

BIND2:7}

{BIND6:7,

BIND2:7}

BIND4:8

BIND4 BIND2 :7

BIND4 BIND2

BIND6:7

BIND4 BIND6 :7

11. Item kelima yang memiliki count paling kecil berdasarkan urutan prioritas adalah




base yakni {BIND6:8}. Dari pattern base tersebut dapat ditemukan conditional fp-

treenya yaitu BIND6 dengan count.


102



Conditional Pattern

Base

Conditional FP

Tree Frequent Itemset

{BIND6:8} {BIND6:8} BIND2:8

BIND2,BIND6 :8

12. Item terakhir berdasarkan urutan prioritas adalah BIND6 dengan nilai count 9.

Setelah itu maka akan dibuat subtree yang berakhiran node BIND9. Dari subtree

tersebut dapat ditemukan conditional pattern base, conditional fp-tree dan frequent

itemsetnya. Item BIND6 ini tidak memiliki pattern base dan conditional fp-tree.

Gambar 15 -Database BIND6


Conditional Pattern

Base Conditional FP Tree Frequent Itemset

- - BIND6:9

13. Berikut ini adalah daftar frequent itemset yang didapatkan. Untuk pembuatan

aturan asosiasi yang dipakai adalah frequent itemset dengan jumlah item terbanyak.

Item Frequent Itemset

BIND17 BIND17: 7, BIND6 BIND17: 7, BIND2 BIND17:7,

BIND17 BIND2 BIND6:7


103

BIND16 BIND16:7, BIND6 BIND16: 7

BIND3 BIND3:7, BIND3 BIND4: 7

BIND4 BIND4:8, BIND4 BIND2 :7, BIND4 BIND2 BIND6:7,

BIND4 BIND6 :7

BIND2 BIND2:8, BIND2 BIND6 :8

BIND6 BIND6:9

14. Berikut ini adalah frequent itemset yang digunakan untuk dikombinasikan

{BIND17 BIND2 BIND6:7}, {BIND4 BIND2 BIND6:7}. Dua frequent itemset ini

tetap harus dalam urutan yang benar berdasarkan jumlah count pada tiap item.

Urutannya akan menjadi seperti berikut {BIND6 BIND2 BIND17 : 7} dan {BIND6

BIND2 BIND4 : 7}. Salah satu contoh menghitung confidence dan lift ratio untuk

aturan asosiasi yang pertama adalah sebagai berikut. Confidence dapat dihitung

dari support {BIND 6 BIND2 BIND17}=7 dibagi dengan support dari {BIND6}=9

yang menjadi antecedent adalah 0.77. Ketika nilai confidence tersebut dikalikan

dengan 100% maka akan menjadi 77%. Sedangkan nilai lift ratio dapat dihitung

dari nilai confidence dibagi nilai expected confidence yang didapat dari support

{BIND2 BIND17}=7 sebagai item konsekuen dibagi jumlah transaksi sebanyak

10, maka nilai expected confidence-nya sebesar 0.7. Setelah itu nilai lift ratio dapat

dihitung dari 0.77/0.7, sehingga didapat nilai 1.1

Tabel 2 Tabel Aturan Asosiasi

Aturan Asosiasi Confidence Lift Ratio

BIND6 BIND2 BIND17 77% 1.1












104


Setelah didapatkan aturan asosiasi beserta confidence dan lift ratio nya, aturan

asosiasi yang digunakan adalah yang memiliki nilai lift ratio tertinggi. Aturan

asosiasi tersebut adalah BIND6 BIND17 BIND2, BIND17 BIND6 BIND2 dan

BIND6 BIND4 BIND2 dengan nilai lift ratio 1.25


105

Lampiran 6 : Data

Berikut ini adalah contoh data nilai daya serap tahun akademik 2014/2015.