i
PENERAPAN ALGORITMA FP-GROWTH UNTUK ANALISIS POLA ASOSIASI
DAYA SERAP HASIL JIAN NASIONAL MATA PELAJARAN BAHASA
INDONESIA SMA DI YOGYAKARTA
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Disusun Oleh:
Brigita Cynthia Dewi
125314016
PROGRAM STUDI TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2016
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
FP GROWTH ALGORITHM IMPLEMENTATION FOR ABSORTIVE
CAPACITY ASSOCIATION RULE ANALYSIS ON INDONESIAN LANGUAGE
SUBJECT AT SENIOR HIGH SCHOOL NATIONAL EXAMINATION IN
YOGYAKARTA
A THESIS
Presented as Partial Fulfillment of The Requirement
To Obtain The Sarjana Komputer Degree
In Informatics Engineering Study Program
By:
Brigita Cynthia Dewi
125314016
INFORMATICS ENGINEERING STUDY PROGRAM
DEPARTMENT OF INFORMATICS ENGINEERING
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2016
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
ah.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
ABSTRAK
Ujian nasional(UN) merupakan salah satu contoh sistem evaluasi standar
pendidikan yang ada di Indonesia. UN ini dilaksanakan dengan tujuan untuk
memetakan mutu pendidikan di Indonesia. Kegiatan evaluasi memang penting untuk
dilakukan demi meningkatnya mutu pendidikan karena kegiatan ini evaluasi dapat
memperlihatkan sampai sejauh mana siswa memahami materi yang diberikan. Setiap
tahunnya Kementrian Pendidikan dan Kebudayaan (kemendikbud) selalu
mengeluarkan nilai hasil UN dengan harapan dari data tesebut dapat ditemukan
sebuah informasi yang bermanfaat untuk peningkatan mutu pendidikan di Indonesia.
Salah satu bidang ilmu yang dapat digunakan untuk mendapatkan informasi dari
kumpulan data tersebut adalah dengan data mining.
Salah satu penerapan data mining pada tugas akhir ini menggunakan teknik
association rule dengan algoritma FP-Growth. Teknik ini dapat digunakan untuk
mencari frequent itemset dalam kumpulan data. Penelitian ini bertujuan untuk
menerapkan algoritma FP-Growth pada data nilai daya serap UN SMA di Yogyakarta
untuk mata pelajaran Bahasa Indonesia.
Metodologi penelitian yang digunakan dalam penelitian ini adalah penelitian
pustaka, KDD (Knowledge Discovery in Database) dan pembuatan laporan. Pada
tahap awal KDD akan dilakukan pembersihan data dan integrasi data secara manual
melalui Ms.Excel. Selanjutnya dilakukan seleksi data dan transformasi data di dalam
perangkat lunak yang dibuat. Setelah itu dilakukanlah proses data mining dan
terakhir adalah proses pattern evaluation dan knowledge presentation yang
dikenakan pada hasil aturan asosiasi yang terbentuk. Pengujian terhadap sistem ini terdiri dari pengujian black box, pengujian validitas dan pengujian running time.
Berdasarkan semua pengujian, disimpulkan bahwa algoritma FP-Growth dapat
diterapkan dan dapat menemukan aturan asosiasi yang menarik dari data nilai daya
serap. Sistem yang dibuat dengan melakukan penerapan metode FP-Growth ini
menghasilkan 5 aturan asosiasi yang menarik berdasarkan nilai lift ratio tertinggi untuk
tahun akademik 2012/2013-2013/2014 ada 3 aturan asosiasi dan untuk tahun
2014/2015 ada 2 aturan asosiasi. Secara subyektif kompetensi-kompetensi dalam
aturan-aturan asosiasi tersebut memang saling berkaitan.
Kata Kunci : Association Rule, FP-Growth, data mining, nilai daya serap
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
ABSTRACT
The national examination (UN) is one example of a standard evaluation system
of education in Indonesia. UN carried out in order to map the quality of education in
Indonesia. Evaluation is the important things to do for improving the quality of
education. this activity can reveal the extent to which students understand the material
provided. Each year, Kementrian Pendidikan dan Kebudayaan (Kemendikbud) always
display the results of the UN with the propose can be founded a useful information for
improving the quality of education in Indonesia. One area of science that can be used
to obtain information from the dataset is with data mining.
This thesis using one technic of data mining association rule with FP-Growth
algorithm. This technique can be used to find frequent itemset in the data set. This
research aims to implement the algorithm FP-Growth in the value data absorption UN
High School in Yogyakarta's for Indonesian subjects.
The methodology for this research used in this study is a research library, KDD
(Knowledge Discovery in Databases) and make a report. In the early stages of KDD
will do data cleansing and data integration manually at Ms.Excel. Furthermore, the data
selection and transformation of data will be do at the software that was created. After
that perform the data mining process and the last is a process of pattern evaluation, and
knowledge presentation imposed on the results of the association rules formed. Testing
of the system consists of a black box testing, testing the validity and running time
testing.
Based on all the tests, it was concluded that FP-Growth algorithm can be
applied and can find an interesting association rules from the data value of absorption.
The system that was created with FP-Growth method produces 5 interesting association
rules based on the value of the highest lift ratio for the academic year 2012 / 2013-2013
/ 2014 there are three rules of the association and for the year 2014/2015 there are two
rules of association. Subjectively competencies in the rules of the association are
correlated.
Keyword : Association Rule, FP-Growth, data mining, nilai daya serap, absorptive
capacity
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ix
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa karena atas
rahmat dan karunia-Nya, penulis dapat menyelesaikan Tugas Akhir yang berjudul
“PENERAPAN ALGORITMA FP-GROWTH UNTUK ANALISIS POLA ASOSIASI
DAYA SERAP HASIL UJIAN NASIONAL MATA PELAJARAN BAHASA
INDONESIA SMA DI YOGYAKARTA” ini dengan baik.
Dalam proses penulisan tugas akhir ini penulis menyadari bahwa ada begitu
banyak pihak yang turut membantu memberikan motivasi semangat dan juga bantuan
dalam menyelesaikan tugas akhir ini. Oleh karena itu saya ingin mengucapkan terima
kasih antara lain kepada :
1. Bapak Sudi Mungkasi, S.Si., M.Math.Sc.,Ph.D. selaku Dekan Fakultas Sains
dan Teknologi.
2. Ibu Dr. Anastasia Rita Widiarti, selaku Kepla Prodi Teknik Informatika.
3. Bapak Puspaningtyas Sanjoyo Adi, S.T., M.T sebagai dosen pembimbing
akademik, yang telah memberikan bimbingan dan saran selama penulis menempuh
studi.
4. Ibu P.H Prima Rosa, S.Si., M.Sc selaku dosem pembimbing skripsi yang telah
memberikan kesabaran, waktu dan saran sehingga dapat diselesaikannya tugas akhir
ini.
5. Seluruh dosen yang telah mendidik dan memberikan pengetahuan dan
pengalaman berharga selama penulis belajar di Universitas Sanata Dharma
Yogyakarta.
6. Orang tua dan adik yang telah memberikan kasih sayang, perhatian, doa dan
dukungan sehingga penulis dapat menyelesaik tugas akhir.
7. Teman-teman bimbingan bu Rosa yang selalu dapat memberikan motivasi dan
semangat.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xi
DAFTAR ISI
A THESIS.............................................................................................................................ii
HALAMAN PERSETUJUAN ................................................. Error! Bookmark not defined.
HALAMAN PENGESEHAN ............................................................................................... iv
PERNYATAAN KEASLIAN KARYA .................................................................................v
LEMBAR PERNYATAAN PERSETUJUAN ...................................................................... vi
ABSTRAK ......................................................................................................................... vii
ABSTRACT ...................................................................................................................... viii
KATA PENGANTAR.......................................................................................................... ix
DAFTAR ISI ....................................................................................................................... xi
DAFTAR GAMBAR ......................................................................................................... xiii
DAFTAR TABEL .............................................................................................................. xiv
DAFTAR LAMPIRAN ....................................................................................................... xv
BAB I .................................................................................................................................. 1
PENDAHULUAN ............................................................................................................... 1
1.1. Latar Belakang...................................................................................................... 1
1.2. Rumusan Masalah ................................................................................................. 3
1.3. Batasan Masalah ................................................................................................... 4
1.4. Tujuan Penelitian .................................................................................................. 4
1.5. Manfaat Penelitian ................................................................................................ 4
1.6 Metodologi Penelitian ........................................................................................... 5
1.7 Sistematika Penulisan ........................................................................................... 6
BAB II ................................................................................................................................. 7
LANDASAN TEORI ........................................................................................................... 7
2.1 Pengertian Penambangan Data .............................................................................. 7
2.2 Tujuan Penambangan Data .................................................................................... 7
2.3 Teknik Data Mining .............................................................................................. 8
2.4 Knowledge Discovery in Database (KDD) ............................................................ 9
2.5 Association Rules ................................................................................................ 12
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xii
BAB III .............................................................................................................................. 20
METODE PENELITIAN ................................................................................................... 20
3.1 Sumber Data ....................................................................................................... 20
3.2 Spesifikasi Alat ................................................................................................... 24
3.3 Tahap – Tahap Penelitian .................................................................................... 24
BAB IV ............................................................................................................................. 28
PEMROSESAN AWAL DAN PERANCANGAN PERANGKAT LUNAK
PENAMBANGAN DATA ................................................................................................. 28
4.1 Perancangan Awal Sumber Data ......................................................................... 28
4.2 Pengembangan Perangkat Lunak Penambangan Data .......................................... 29
BAB V ............................................................................................................................... 49
IMPLEMENTASI PENAMBANGAN DATA.................................................................... 49
DAN EVALUASI HASIL .................................................................................................. 49
5.1 Implementasi Rancangan Perangkat Lunak Penambangan Data ........................... 49
5.2.1 Implementasi Kelas Model ...................................................................... 49
5.2.2 Implementasi Kelas View ........................................................................ 49
5.2.3 Implementasi Kelas Controller................................................................. 50
5.2 Evaluasi Hasil ..................................................................................................... 50
5.2.1 Uji Coba Perangkat Lunak (Black Box Testing)........................................ 50
5.2.2 Uji Validitas ............................................................................................ 58
5.2.3 Uji Coba Data Set .................................................................................... 61
BAB VI ............................................................................................................................. 78
PENUTUP ......................................................................................................................... 78
6.1 Kesimpulan......................................................................................................... 78
6.2 Saran .................................................................................................................. 79
DAFTAR PUSTAKA ........................................................................................................ 80
LAMPIRAN …………………………………………………………………………………………………………………….82
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiii
DAFTAR GAMBAR
Gambar 2. 1 Diagram Model Klasifikasi ................................................................... 8
Gambar 2. 2 Penambangan data sebagai tahapan dalam proses KDD ....................... 10
Gambar 2. 3 Tabel data transaksi ............................................................................ 13
Gambar 2. 4 Tabel daftar support count tiap item .................................................... 13
Gambar 2. 5 Pembuatan FP Tree ............................................................................. 14
Gambar 2. 6 Sub-database node I3 .......................................................................... 15
Gambar 4. 1 Diagram Konteks ................................................................................ 30
Gambar 4. 2 Diagram Usecase ................................................................................ 31
Gambar 4. 3 Ilustrasi FPTree .................................................................................. 34
Gambar 4. 4 Susunan arraylist untuk kode sekolah 01-010 ..................................... 35
Gambar 4. 5 Susunan arraylist untuk kode sekolah 01-019 ..................................... 35
Gambar 4. 6 Data arraylist dalam arraylist ............................................................. 35
Gambar 4. 7 Diagram Kelas Desain ....................................................................... 36
Gambar 4. 8 Halaman Awal .................................................................................... 43
Gambar 4. 9 Halaman About ................................................................................... 44
Gambar 4. 10 Halaman Help ................................................................................... 45
Gambar 4. 11 Halaman Preprocessing .................................................................... 46
Gambar 4. 12 Halaman Asosiasi ............................................................................. 47
Gambar 4. 13 Halaman Database ............................................................................ 48
Gambar 4. 14 Diagram Kelas Analisis .................................................................... 85
Gambar 5. 1 (a)Kotak Dialog “Pilih File” (b)Tabel Dataset .................................... 51
Gambar 5. 2 Kotak Dialog Salah Pilih File .............................................................. 51
Gambar 5. 3 Tampilan Setelah Menekan Tombol “Tandai Semua” ......................... 52
Gambar 5. 4 Tampilan Setelah Menekan Tombol “Hapus Atribut” ......................... 52
Gambar 5. 5 Tampilan Setelah Menekan Tombol “Batal” ....................................... 52
Gambar 5. 6 Hasil Pencarian Aturan asosiasi .......................................................... 55
Gambar 5. 7 Tampilan Ketika Min Support dan Minimum confidence Tidak Diisi .. 55
Gambar 5. 8 Kotak Dialog Simpan Hasil................................................................. 56
Gambar 5. 9 Kotak Dialog Jika Berhasil Menyimpan Data ...................................... 56
Gambar 5. 10 Dataset Supermarket.arff ................................................................... 59
Gambar 5. 11 Dataset Setelah di Preprocessing ...................................................... 60
Gambar 5. 12 Uji Running Time Min Confidence=60% .......................................... 67
Gambar 5. 13 Uji Running Time Min Confidence=90% .......................................... 68
Gambar 5. 14 Uji Running Time Min Confidence=60% .......................................... 68
Gambar 5. 15 Uji Running Time Min Confidence=90% .......................................... 69
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
DAFTAR TABEL
Tabel 2. 1 Interval Daya Serap Siswa ...................................................................... 18
Tabel 3. 1 Tabel Atribut Data Mata Pelajaran Bahasa Indonesia 2012/2013 &
2013/2014 ............................................................................................................... 20
Tabel 3. 2 Tabel Atribut Data Mata Pelajaran Bahasa Indonesia 2014/2015 ............ 22
Tabel 4. 1 Daftar Kelas Untuk Tiap Usecase ........................................................... 32
Tabel 5. 1 Tabel Implementasi Kelas Model ........................................................... 49
Tabel 5. 2Tabel Implementasi Kelas View .............................................................. 49
Tabel 5. 3 Tabel Implementasi Kelas Controller ...................................................... 50
Tabel 5. 4 Tabel Hasil Uji Pada Halaman Preprocessing ......................................... 52
Tabel 5. 5 Tabel Pengujian Halaman Preprocessing ................................................ 54
Tabel 5. 6 Tabel Pengujian dengan Hitungan Manual .............................................. 57
Tabel 5. 7 Tabel Hasil Pengujian dengan WEKA .................................................... 60
Tabel 5. 8 Tabel Hasil Pengujian Tahun 2012/2013 & 2013/2014, Min Conf=60% . 63
Tabel 5. 9 Tabel Hasil Pengujian Tahun 2012/2013 & 2013/2014, Min Conf = 90% 63
Tabel 5. 10 Tabel Hasil Pengujian Tahun 2014/2015, Min Conf = 60% .................. 65
Tabel 5. 11 Tabel Hasil Pengujian Tahun 2014/2015, Min Conf = 90% .................. 66
Tabel 5. 12 Daftar aturan asosiasi data tahun 2012/2013-2013/2014........................ 71
Tabel 5. 13 Daftar aturan asosiasi data tahun 2014/2015 ......................................... 74
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xv
DAFTAR LAMPIRAN
Lampiran 1 : Diagram Aktivitas .............................................................................. 82
Lampiran 2 : Diagram Kelas Analisis ...................................................................... 85
Lampiran 3 : Diagram Sequence ............................................................................. 86
Lampiran 4 : Diagram Kelas Desain ........................................................................ 89
Lampiran 5 : Penghitungan Manual......................................................................... 95
Lampiran 6 : Data…………………………………………………………………..106
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1
BAB I
PENDAHULUAN
1.1. Latar Belakang
Setiap orang pasti memiliki kemampuan yang berbeda antara yang satu
dengan yang lainnya termasuk kemampuan seorang siswa dalam memahami suatu
mata pelajaran. Setiap siswa memiliki tingkat pemahaman yang berbeda-beda dalam
memahami setiap pelajaran yang diajarkan. Hal ini merupakan masalah yang sering
dihadapi oleh para guru dalam upaya meningkatkan kualitas belajar siswa.
Kemampuan seorang siswa dalam memahami materi bergantung juga pada
kemampuan daya serapnya. Daya serap merupakan kemampuan siswa dalam
menerima materi pembelajaran sesuai dengan batas yang ditentukan. Biasanya nilai
ini didapatkan setelah seorang guru selesai melaksanakan evaluasi pembelajaran
yang dilakukan setelah mengadakan tes. Dari hasil inilah seorang guru dapat
memetakan perolehan nilai yang dicapai oleh siswa. Ujian nasional adalah salah satu
sistem evaluasi standar pendidikan yang ada di Indonesia.Ujian Nasional merupakan
salah satu upaya pemerintah dalam rangka memacu peningkatan mutu pendidikan.
Ujian Nasional selain berfungsi untuk mengukur dan menilai pencapaian
kompetensi lulusan dalam mata pelajaran tertentu, serta pemetaan mutu pendidikan
pada tingkat pendidikan dasar dan menengah, juga berfungsi sebagai motivator bagi
pihak-pihak terkait untuk bekerja lebih baik guna mencapai hasil ujian yang baik.
Berbagai hasil penelitian menunjukkan bahwa dengan adanya Ujian Nasional, siswa
terdorong untuk belajar lebih baik dan guru terdorong untuk mengajar lebih baik
pula (Kemdikbud,2015). Salah satu cara yang dapat dilakukan untuk memajukan
mutu pendidikan di Indonesia adalah dengan cara mengkaji secara mendalam hasil
Ujian Nasional. Informasi hasil Ujian Nasional ini disediakan oleh Puspendik
Balitbang Kemdikbud kedalam beberapa bentuk seperti bentuk statistik, grafik,
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2
daftar dan juga daya serap. Dalam penelitian ini, bentuk informasi yang akan
digunakan adalah informasi daya serap. Informasi daya serap ini berisi informasi
laporan daya serap Ujian Nasional siswa SMA dari program IPA dengan mata
pelajaran Bahasa Indonesia yang memiliki 21 kompetensi. Dari data tersebut
diharapkan dapat digali informasi keterkaitan antara kompetensi yang satu dengan
kompetensi lainnya dari sekolah-sekolah yang memiliki nilai daya serap yang
memenuhi standar yang ditentukan. Informasi tersebut dapat dimanfaatkan oleh
dinas pendidikan untuk membantu dinas pendidikan memberikan langkah-langkah
perbaikan mengenai metode pembelajaran ada saat ini guna meningkatkan mutu
pendidikan di Yogyakarta. Penelitian ini juga dapat dimanfaatkan oleh para peneliti
di bidang pendidikan sebagai rekomendasi analisa agar dapat dikaji lebih mendalam
lagi. Salah satu teknik yang dapat dipergunakan untuk menggali informasi tersebut
adalah data mining.
Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan
pengetahuan didalam database. Data mining adalah proses yang menggunakan teknik
statistik, matematika, kecerdasan buatan dan machine learning untuk mengekstraksi
dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari
berbagai database besar (Turban, dkk.2005). Data mining sendiri memiliki berbagai
macam teknik, salah satunya adalah teknik asosiasi. Analisis asosiasi atau association
rule mining adalah teknik data mining untuk menemukan aturan asosiatif antara suatu
kombinasi item. Dalam kasus ini peneliti melakukan penelitian dari data nilai daya
serap siswa SMA Yogyakarta untuk mencari tahu pola keterkaitan antara kompetensi
yang satu dengan yang lainnya yang mempengaruhi keberhasilan siswa menggunakan
algoritma FP-Growth.
Algoritma FP-Growth merupakan salah satu alternatif algoritma yang dapat
digunakan untuk menentukan himpunan data yang paling sering muncul (frequent
itemset) dalam sebuah kumpulan data. Menurut Octaviani, (2010) algoritma FP-
Growth memiliki waktu kerja yang lebih cepat dalam menemukan frequent itemset,
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
algoritma ini juga dapat menghasilkan aturan yang sama baiknya dengan algoritma
Apriori setelah diujikan pada data transaksi penjulan untuk melakukan market base
analysis. Pada penelitian tugas akhir ini nantinya akan dibuat sebuah sistem yang
menerapkan algoritma FP-Growth pada data nilai daya serap siswa yang diharapkan
dapat menemukan pola asosiasi antar kompetensi. Pada penelitian ini, peneliti hanya
akan berfokus pada mata pelajaran Bahasa Indonesia. Mata pelajaran ini dipilih karena
peneliti berpendapat bahwa Bahasa Indonesia itu merupakan salah satu identitas
Bangsa Indonesia. Bahasa Indonesia mempunyai kedudukan yang sangat penting
dalam kehidupan berbangsa dan bernegara maka Bahasa Indonesia juga merupakan
salah satu mata pelajaran yang selalu diberikan semenjak siswa masih berada di tingkat
Taman Kanak-Kanak. Tujuan pembelajaran dari mata pelajaran ini bukan hanya untuk
sekedar siswa lulus dalam ujian melainkan mereka dapat menggunakan Bahasa
Indonesia yang baik dan benar di kehidupan sehari-harinya. Karena kebutuhan itulah,
penting bagi tenaga pendidik untuk mengetahui sejauh mana kemampuan berbahasa
Indonesia anak didiknya. Hasil keluaran dari sistem diharapkan dapat digunakan untuk
mengetahui kompetensi apa saja yang ternyata memiliki keterkaitan berdasarkan nilai
lift ratio sebagai analisa secara obyektif dan juga berdasarkan pendapat dari seorang
praktisi pendidikan di bidang Bahasa Indonesia sebagai analisa secara subyektif.
Aturan asosiasi yang didapatkan tersebut dapat digunakan oleh dinas pendidikan untuk
mengambil langkah-langkah perbaikan kepada sekolah-sekolah yang memiliki nilai
daya serap kurang dari standar yang ditentukan pada kompetensi-kompetensi yang ada
di dalam aturan asosiasi tersebut. Salah satu perbaikan yang dilakukan adalah dengan
memperbaiki metode pembelajaran di masa yang akan datang yang berfokus pada
kompetensi-kompetensi di dalam aturan asosiasi yang didapatkan.
1.2. Rumusan Masalah
Berdasarkan latar belakang yang telah dijelaskan sebelumnya, masalah yang
akan diselesaikan dalam penelitian ini adalah:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4
1. Bagaimana menerapkan algoritma FP-Growth untuk menemukan aturan
asosiasi antar kompetensi dari nilai daya serap Ujian Nasional?
2. Apakah algoritma FP-Growth dapat menemukan aturan asosiasi yang
menarik berdasarkan ukuran lift ratio aturan asosiasi yang dihasilkan dari
data nilai daya serap ujian nasional SMA di Yogyakarta?
1.3. Batasan Masalah
Batasan masalah yang dibahas dalam penulisan tugas akhir ini adalah sebagai
berikut:
b. Sistem menggunakan data nilai daya serap UN SMA di Yogyakarta jurusan
IPA dengan mata pelajaran Bahasa Indonesia tahun ajaran 2012/2013,
2013/2014, 2014/2015.
c. Data yang digunakan merupakan data yang diambil dari situs
www.litbang.kemendikbud.go.id.
1.4. Tujuan Penelitian
Tujuan dari penelitian ini adalah menerapkan algoritma FP-Growth pada data
nilai daya serap untuk menenemukan pola asosiasi antara kompetensi yang satu dengan
yang lainnya pada suatu mata pelajaran.
1.5. Manfaat Penelitian
Hasil dari penelitian yang dilakukan, diharapkan dapat digunakan untuk
mengetahui apakah algoritma FP-Growth dapat digunakan untuk mengetahui adanya
keterkaitan antar kompetensi dari data nilai daya serap ujian nasional khususnya mata
pelajaran Bahasa Indonesia. Sedangkan untuk peneliti lain di bidang pendidikan,
penelitian ini juga dapat digunakan sebagai referensi maupun rekomendasi contoh
menganalisis data nilai daya serap Ujian Nasional.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5
1.6 Metodologi Penelitian
1.6.1 Penelitian Pustaka
Pada tahap ini, dilakukan penelitian pustaka untuk memperoleh informasi dan
menggali teori-teori tentang teknik data mining. Dalam penelitian ini penulis
mempelajari literatur yang berkaitan dengan teknik data mining asosiasi
khususnya algoritma FP-Growth dan literatur lainnya yang berguna bagi sistem
yang akan dibangun.
1.6.2 Knowledge Discovery in Database (KDD)
KDD ini merupakan tahap-tahap yang perlu dilakukan dalam penelitian di
bidang penambangan data (data mining). Proses KDD ini pula terdiri dari data
cleaning, data integration, data selection, data transformation, data mining,
pattern evaluation dan knowledge presentation. Tujuan dari proses ini adalah
untuk mendapatkan informasi dari data nilai daya serap SMA di Yogyakarta.
Pada salah satu tahap yang akan dilalui pada proses KDD ini adalah pembuatan
perangkat lunak sebagai alat uji yang menggunakan metodologi waterfall.
Metodologi tersebut terdiri dari analisa terhadap kebutuhan sistem, desain
perangkat lunak dan yang terakhir adalah pengujian. Hasil yang didapatkan,
kemudian akan dianalisa apakah hasil tersebut menghasilkan sebuah informasi
yang bermanfaat.
1.6.3 Pembuatan Laporan
Analisis yang akan dilakukan adalah analisis kinerja dari alat uji yang dibuat
berdasarkan metode FP-Growth. Hasil dari analisis tersebut akan disusun
kedalam sebuah laporan tugas akhir.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6
1.7 Sistematika Penulisan
BAB I. Pendahuluan
Bab ini berisi latar belakang, rumusan masalah, tujuan, manfaat, batasan
masalah, metodologi penelitian, dan sistematika penulisan.
BAB II. Landasan Teori
Bab ini akan menjelaskan mengenai teori yang berkaitan dengan judul/masalah
di tugas akhir.
BAB III. Metode Penelitian
Bab ini akan menjelaskan tentang penelitian pustaka yang berisikan data dan
sumber data yang digunakan dan juga ada proses KDD yang menjelaskan
tentang langkah-langkah yang digunakan dalam penelitian ini. Dan yang
terakhir dijelaskan pula tentang pembuatan laporan.
BAB IV Pemrosesan Awal dan Perancangan Perangkat Lunak Penambangan
Data
Bab ini berisikan langkah awal perancangan penelitian dan perancangan
pembuatan perangkat lunak.
BAB V Implementasi Penambangan Data dan Evaluasi Hasil
Bab ini akan menjelaskan mengenai proses pengujian sistem dan juga beserta
analisis dari hasil pengujian tersebut.
BAB VI Penutup
Bab ini akan menjelaskan mengenai kesimpulan beserta kelebihan dan
kelemahan sistem yang dibuat.
LAMPIRAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
BAB II
LANDASAN TEORI
2.1 Pengertian Penambangan Data
Penambangan data adalah proses yang menggunakan teknik statistik,
matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan
mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terakit dari
berbagai database besar (Turban et al, 2005). Sedangkan menurut Pramudiono
(2006) data mining adalah serangkaian proses untuk menggali nilai tambah dari
suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara
manual. Terkadang penambangan data biasa juga dikenal dengan KDD
(Knowledge Discovery in Database), padahal sebenarnya penambangan data
merupakan salah satu tahapan pada proses KDD. Pemanfaatan penambangan data
ini juga sudah banyak diterapkan dalam banyak bidang. Salah satu contoh
pemanfaatan penambangan data yaitu untuk menganalisa pasar sehingga sebuah
pelaku bisnis bisa lebih mengetahui pola pembelian para konsumennya.
2.2 Tujuan Penambangan Data
Tujuan dari penambangan data (Hoffer et al, 2005) adalah:
1. Explanatory
Untuk menjelaskan beberapa kondisi penelitian, seperti mengapa penjualan
truk pick-up meningkat di Colorado.
2. Confirmatory
Untuk mempertegas hipotesis, seperti halnya dua kali pendapatan keluarga
lebih suka dipakai untuk membeli peralatan keluarga dibandingkan dengan
satu kali pendapatan keluarga.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
Input
Himpunan
atribut
(x)
Output
Label kelas
(y)
3. Exploratory
Untuk menganalisa data yang memiliki hubungan yang baru. Misalnya,
pola apa yang cocok untuk kasus penggelapan kartu kredit.
2.3 Teknik Data Mining
2.3.1 Classification
Klasifikasi merupakan proses pembelajaran suatu fungsi tujuan (target) yang
memetakan tiap himpunan atribut x sebagai input ke satu dari label kelas y yang
didefinisikan sebelumnya sebagai output. Fungsi target disebut juga model
klasifikasi (Hermawati, 2013).
Beberapa algoritma klasifikasi antara lain pohon keputusan, nearest neighbor,
naïve bayes, neural networks dan support vector machines.
2.3.2 Clustering
Analisa cluster yaitu menemukan kumpulan objek hingga objek-objek
dalam satu kelompok sama (atau punya hubungan) dengan yang lain dan berbeda
(atau tidak berhubungan) dengan objek – objek dalam kelompok lain. Tujuan dari
analisa cluster adalah meminimalkan jarak di dalam cluster dan memaksimalkan
jarak antar cluster (Hermawati, 2013).
Classification
model
Gambar 2. 1 Diagram Model Klasifikasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
2.3.3 Association Rules
Association juga disebut sebagai Market Basket Analysis. Sebuah problem
bisnis yang khas adalah menganalisa tabel transaksi penjualan dan
mengidentifikasi produk-produk yang seringkali dibeli bersamaan oleh customer,
misalnya apabila orang membeli sambal, biasanya juga dia membeli kecap.
Kesamaan yang ada dari data pembelian digunakan untuk mengidentifikasi
kelompok kesamaan dari produk dan kebiasaan apa yang terjadi guna kepentingan
cross-selling.
2.3.4 Regresi
Regresi ini biasanya digunakan untuk memprediksi nilai dari suatu variabel
kontinyu yang diberikan berdasarkan nilai dari variabel yang lain, dengan
mengasumsikan sebuah model ketergantungan linier atau nonlinier. Teknik ini
banyak dipelajari dalam statistika, bidang jaringan syaraf tiruan (neural network).
Contoh aplikasi untuk teknik regresi adalah (Hermawati, 2013).
a. Memprediksi jumlah penjualan produk baru berdasarkan pada belanja
promosi/iklan
b. Memprediksi kecepatan angina sebagai suatu fungsi suhu, kelembaban, tekanan
udara, dsb.
c. Time series prediction dari indeks stock market.
2.4 Knowledge Discovery in Database (KDD)
Istilah data mining dan knowledge discovery in database (KDD) seringkali
digunakan secara bergantian untuk menjelaskan proses penggalian informasi
tersembunyi dalam suatu basis data yang besar. Sebenarnya kedua istilah tersebut
memiliki konsep yang berbeda, tetapi berkaitan satu sama lain. Salah satu tahapan
dalam keseluruhan proses KDD adalah data mining. Proses KDD secara garis besar
dapat dijelaskan sebagai berikut (Fayyad, 1996).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
Gambar 2. 2 Penambangan data sebagai tahapan dalam proses KDD
(Sumber : Fayyad, 1996)
a. Data Cleaning
Sebelum proses penambangan data dapat dilaksanakan, perlu dilakukan
proses cleaning pada data yang menjadi fokus KDD. Proses cleaning
mencakup antara lain membuang duplikasi data, memeriksa data yang
inkonsisten dan memperbaiki kesalahan pada data, seperti kesalahan
cetak (tipografi). Lalu dilakukan juga proses enrichment, yaitu proses
“memperkaya” data yang sudah ada dengan data atau informasi lain
yang relevan dan diperlukan untuk KDD, seperti data atau informasi
eksternal.
b. Data Integration
Tahap ini berisikan penggabungan dari bermacam- macam data dari
berbagai sumber.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
c. Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu
dilakukan sebelum tahap penggalian informasi dalam KDD dimulai.
Data hasil seleksi yang akan digunakan untuk proses penambangan
data, disimpan dalam suatu berkas, terpisah dari basis data operasional.
d. Data Transformation
Coding adalah proses transformasi pada data yang telah dipilih,
sehingga data tersebut sesuai untuk proses penambangan data. Proses
coding dalam KDD merupakan proses kreatif dan sangat tergantung
pada jenis atau pola informasi yang akan dicari dalam basis data.
e. Penambangan Data
Penambangan data adalah proses mencari pola atau informasi menarik
dalam data terpilih dengan menggunakan teknik atau metode tertentu.
Teknik, metode atau algoritma dalam penambangan data sangat
bervariasi. Pemilihan metode atau algoritma yang tepat sangat
bergantung pada tujuan dan proses KDD secara keseluruhan.
f. Pattern Evaluation
Pola informasi yang dihasilkan dari proses penambangan data perlu
ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang
berkepentingan. Tahap ini merupakan bagian dari proses KDD yang
disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola
atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis
yang ada sebelumnya.
g. Knowledge Presentation
Tahap ini merupakan proses teknik visualisasi dan representasi
pengetahuan digunakan untuk menyajikan pengetahuan hasil
penambangan kepada pengguna.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
…………………………(2.1)
…………………………(2.2)
2.5 Association Rules
2.5.1 Pengertian Association Rules
Association rules merupakan sebuah ekspresi implikasi yang berbentuk X Y,
dimana X dan Y merupakan disjoint itemset (X∩Y) = ø. Contoh: {Pena,Tinta}
{Jus}. Dalam association rule, kita dapat menghitung support dan confidence.
Confidence menyatakan seberapa sering item-item dalam Y muncul dalam transaksi
yang berisi X. Sedangkan support menyatakan seberapa sering item-item dalam X dan
Y muncul dalam transaksi secara bersamaan. Secara formal dapat dinyatakan dengan
persamaan berikut ini:
s(XY) =∑(𝑋𝜐𝑌)
𝑁
c(XY) =∑(𝑋𝜐𝑌)
∑(𝑋)
Dimana s adalah support dan c adalah confidence (Hermawati, 2013).
2.5.2 Frequent Pattern
Frequent Patterns adalah pola yang sering terjadi di dalam data. Ada banyak jenis dari
frequent patterns, termasuk di dalamnya pola, sekelompok item set, sub-sequence, dan
sub-struktur. Sebuah frequent patterns biasanya mengacu pada satu set item yang
sering muncul bersama-sama dalam suatu kumpulan data transaksional, misalnya
seperti susu dan roti.
2.6 Frequent Pattern Growth (FP-Growth)
Frequent Pattern Growth (FP-Growth) adalah salah satu alternatif algoritma yang
dapat digunakan untuk menentukan himpunan data yang paling sering muncul
(frequent itemset) dalam sebuah kumpulan data (Samuel, 2008).Penggalian itemset
yang frequent dengan menggunakan algoritma FP-Growth akan dilakukan dengan
cara membangkitkan struktur data tree atau disebut dengan FPTree. Pembuatan tree ini
dilakukan dengan melakukan scanning data dari tabel transaksi seperti pada Gambar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
2.3 hanya saja item-item dari tiap transaksi tersebut harus diurutkan kembali
berdasarkan jumlah count-nya (Gambar 2.4).
Gambar 2. 3 Tabel data transaksi
(Sumber : Han et al. 2006 )
Gambar 2. 4 Tabel daftar support count tiap item
(Sumber : Han et al. 2006 )
Pada TID T100 daftar item-nya akan berubah menjadi {I2,I1,I5}, T200 menjadi
{I2,I4}, T300 {I2,I3}, T400 {I2,I1,I4}, T500 {I1,I3}, T600 {I2,I3}, T700 {I1,I3},
T800 {I2,I1,I3,I5}, T900 {I2,I1,I3}. Setelah data list item tersebut diurutkan, dibuatlah
data transaksi tersebut ke dalam bentuk tree seperti Gambar 2.5.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
Gambar 2. 5 Pembuatan FP Tree
(Sumber : Han et al. 2006 )
Cara pembuatan FPTree dilakukan dengan cara membaca satu persatu dari
transaksi pertama. Misalnya untuk TID T100 daftar item-nya adalah {I2,I1,I5}, maka
untuk dibuat kedalam FP Tree buatlah 3 node untuk I2, I1 dan I5 beserta path sehinga
menjadi null I2 I1 I5 dengan count untuk I2, I1 dan I5 adalah 1. Selanjutnya
untuk TID T200 dengan daftar item {I2,I4}, maka dibuat 2 node untuk I2 dan I4 beserta
path-nya null I2 I4. TID T100 dan T200 memiliki prefix yang sama yaitu I2.
Maka count I2 bertambah menjadi 2.
Metode FPGrowth dapat dibagi menjadi 3 tahapan utama (Han et al. 2006). Ketiga
tahapan ini akan dilakukan secara berulang-ulang untuk setiap item di header table
yang diurutkan berdasarkan frekuensinya:
a. Tahap pembangkitan conditional pattern base
Conditional Pattern base merupakan subdatabase yang berisi prefix path
(lintasan prefix) dan suffix pattern (pola akhiran). Pembangkitan conditional
pattern base didapatkan melalui FPtree yang telah dibangun sebelumnya.
Contoh berikut adalah proses pencarian conditional pattern base untuk item
I3. Keberadaan node I3 didalam tree dapat dengan mudah ditelusuri dari link
yang menghubungkan tree dan headertable sudah dibuat sebelumnya.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
Setelah menemukan node tersebut, maka dapat ditelusuri node-node apa saja
yang dilalui dari I3 sampai ke root. Node-node yang dilewati tersebut akan
menjadi sebuah lintasan. Lintasan-lintasan yang terbentuk untuk node I3
adalah {I2,I1: 2},{I2:2} dan {I1:2}. Lintasan-lintasan tersebutlah yang akan
menjadi conditional pattern base.
Gambar 2. 6 Sub-database node I3
b. Tahap pembangkitan conditional FPTree
Pada tahap ini, support count dari setiap item pada setiap conditional pattern
base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih
besar sama dengan minimum support count yang akan dibangkitkan dengan
conditional FPtree. Berdasarkan hasil conditional pattern base untuk node
I3 yang telah dijelaskan pada tahap sebelumnya, dapat dihitung support
count dari setiap itemnya adalah {I2:4, I1:2} dan {I1:2}
c. Tahap pencarian frequent itemset
Pada tahap ini, apabila conditional FPtree merupakan single path, maka
akan didapatkan frequent itemsets dengan melakukan kombinasi item untuk
setiap conditional FPtree. Jika bukan single path maka, akan dilakukan
pembangkitan FPGrowth secara rekursif. Untuk pencarian frequent itemset
pada node I3 akan dilakukan rekursif karena conditional FPtree-nya bukan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
…(2.4)
..…(2.5)
…(2.3)
merupakan single path melainkan bercabang. Untuk setiap single path akan
dikombinasikan dan hasil frequent pattern-nya adalah {{I2, I3: 4},{I1, I3:
4},{I2, I1, I3: 2}}.
2.7 Lift ratio
Salah satu cara yang lebih baik untuk melihat kuat tidaknya aturan asosiasi adalah
dengan menghitung lift ratio. Cara kerja metode ini adalah membagi confidence
dengan expected confidence. Confidence dapat dihitung dengan rumus 2.3.
Anteseden merupakan sebab yang menjadikan item konsekuen. Sedangkan
konsekuen adalah sebuah akibat atau juga item yang akan dibeli setelah membeli
anteseden. Jika didapatkan aturan asosiasi A B maka A sebagai anteseden dan
B sebagai konsekuen. Nilai dari expected confidence dapat dihitung dengan rumus
2.4.
𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒 = jumlah transaksi yang mengandung anteseden dan konsekuen
jumlah transaksi yang mengandung anteseden
𝐸𝑥𝑝𝑒𝑐𝑡𝑒𝑑 𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒 = jumlah transaksi yang mengandung konsekuen
jumlah transaksi dalam database
Lift ratio dapat dihitung dengan cara membandingkan antara confidence untuk
suatu aturan dibagi dengan expected confidence. Berikut rumus dari lift ratio:
𝐿𝑖𝑓𝑡 𝑅𝑎𝑡𝑖𝑜 = 𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒
expected 𝑐𝑜𝑛𝑓𝑖𝑑𝑒𝑛𝑐𝑒
Nilai lift ratio lebih besar dari 1 menunjukkan adanya manfaat dari aturan tersebut.
Lebih tinggi nilai lift ratio, lebih besar kekuatan asosiasinya (Santosa, 2007). Jika
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
nilai lift ratio < 1 maka kemunculan A berkorelasi negative dengan kemunculan B,
artinya kemunculan salah satu item mempengaruhi hal yang sebaliknya pada
kemunculan item lainnya. Contoh dari korelasi negative adalah jika penjualan item
A naik maka mempengaruhi jumlah penjualan B menjadi menurun. Jika didapatkan
lift ratio > 1 maka kemunculan A berkorelasi positive dengan kemunculan B,
artinya kemunculan A ini berhubungan dengan kemunculan B. Contoh dari korelasi
positive adalah jika item A dibeli maka item B juga akan dibeli. Sedangkan jika lift
ratio = 1 maka kemuncul item A dan B independent dan tidak ada korelasi diantara
kedua item tersebut (Han et al. 2006).
2.8 Evaluasi Pengajaran
2.8.1 Pengertian Evaluasi
Dalam dunia pendidikan kita sering mendengar kata evaluasi. Tidak banyak
orang yang mengetahui bahwa hakikat dari dari evaluasi dan bahkan apa itu itu evaluasi
terkadang disalah artikan oleh seorang guru. Padahal seorang guru memiliki salah satu
kewajiban yakni melakukan evaluasi kepada program pembelajaran yang telah
dilakukan. Evaluasi sering disalah artikan oleh seorang guru dengan kata ujian, padahal
ujian hanya salah satu bentuk evaluasi. Jika ujian tidak dilaksanakan dengan baik dari
segi penyusunan Intsrumennya, bahkan ujian pun yang dibuat asal-asal tidak dapat
dikategorikan sebagai bentuk evaluasi.
Bloom (1971) mendefinisikan evaluasi, sebagaimana kita lihat, adalah
pengumpulan kenyataan secara sistematis untuk menetapkan apakah dalam
kenyataannya terjadi perubahan dalam diri siswa dan menetapkan sejauh mana tingkat
perubahan dalam pribadi siswa. Sejalan dengan itu, Stufflebeam (1985), mengatakan
bahwa evaluasi merupakan proses menggambarkan, memperoleh, dan menyajikan
informasi yang berguna untuk menilai alternatif keputusan.
Tujuan evaluasi bisa berbeda dengan tujuan dari ujian. Secara sederhana evalusi
digunakan untuk memeperbaiki sistem dengan cara memberi penilaian berdasarkan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
data yang diambil dari suatu atau sekelompok objek. Sedangkan ujian dapat dilakukan
tanpa ada tujuan untuk memeperbaiki nilai. Ujian juga dapat dilakukan hanya untuk
menyaring dan menentukan kelas dari kumpulan objek.
Salah satu cara untuk melihat pemetaan hasil evaluasi adalah dengan melihat
nilai daya serap. Untuk mengetahui daya serap siswa dari hasil belajarnya digunakan
analisis dengan menggunakan interval daya serap siswa pada tabel 2.1.
Tabel 2. 1 Interval Daya Serap Siswa
No. Interval Kategori
1 0% - 39% Sangat Rendah
2 40% - 59% Rendah
3 60% - 74% Sedang
4 75% - 84% Tinggi
5 85% - 100% Sangat Tinggi
2.8.2 Manfaat Pelaksanaan Evaluasi
Manfaat pelaksanaan evaluasi dalam dunia pendidikan, khususnya dunia persekolahan,
evaluasi mempunyai makna ditinjau dari berbagi segi (Dahlan,2014):
a. Makna bagi siswa
Dengan diadakannya evaluasi, maka siswa dapat mengetahui sejauh mana telah
berhasil mengikuti pelajaran yang diberikan oleh guru. Hasil yang diperoleh siswa dari
pekerjaan menilai ini ada kemungkinan:
Memuaskan- Jika siswa memperoleh hasil yang memuaskan dan hal itu
menyenangkan, tentu kepuasan itu ingin diperolehnya lagi pada kesempatan yang lain.
Tidak memuaskan- Jika siswa tidak puas dengan hasil yang diperoleh, ia akan berusaha
agar lain kali keadaan itu tidak terulang lagi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
b. Makna bagi guru
Dengan hasil penilaian yang diperoleh guru akan dapat mengetahui siswa-siswa mana
yang sudah berhasil menguasai bahan, maupun mengetahui siswa-siswa yang belum
berhasil menguasai bahan. Guru akan mengetahui apakah materi yang diajarkan sudah
tepat bagi siswa sehingga untuk memberikan pengajaran di waktu yang akan datang
tidak perlu diakan perubahan.
c. Makna bagi sekolah
Apabila guru-guru mengadakan penilaian dan diketahui bagaimana hasil belajar siswa-
siswanya, dapat diketahui pula apakah kondisi belajar yang diciptakan oleh sekolah
sudah sesuai dengan harapan atau belum. Hasil belajar merupakan cermin kualitas
sesuatu sekolah. Informasi dari guru tentang tidak tepatnya kurikulum untuk sekolah
itu dapat merupakan bahan pertimbangan bagi perencanaan sekolah untuk masa-masa
yang akan datang. Informasi hasil penilin yang diperoleh dari tahun ke tahun, dapat
digunakan sebagai pedomana bagi sekolah, yang dilakukan oleh sekolah sudah
memenuhi standar atau belum. Pemenuhan standar akan terlihat dari bagusnya angka-
angka yang diperoleh siswa.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
BAB III
METODE PENELITIAN
3.1 Sumber Data
3.1.1 Sumber Data
Data yang digunakan pada penelitian ini didapat dari situs
www.litbang.kemdikbud.go.id. Data yang didapat tersebut berekstensi .xls dan
berisikan nilai daya serap siswa SMA pada saat ujian nasional pada tahun akademik
2012/2013, 2013/2014 dan 2014/2015 yang terbagi ke dalam tiap-tiap kompetensi.
Data yang dipakai merupakan data siswa program IPA dengan mata pelajaran
Bahasa Indonesia yang memiliki 21 kompetensi. Untuk masukan sistem, pengguna
akan memilih 1 dari beberapa mata pelajaran yang ada. Mata pelajaran Bahasa
Indonesia memiliki 21 kompetensi yang diujikan pada Ujian Nasional SMA tahun
akademik 2012/2013 & 2013/2014. Kompetensi-kompetensi yang diujikan
tersebut adalah:
Tabel 3. 1 Tabel Atribut Data Mata Pelajaran Bahasa Indonesia 2012/2013 &
2013/2014
Kode Atribut Keterangan
KODE_SEKOLAH Kode Sekolah
NAMA_SEKOLAH Nama Sekolah
JNS_SEK Jenis Sekolah (SMA/NA)
STS_SEK Status Sekolah (Negeri/Swasta)
BIND1 Melengkapi berbagai bentuk dan jenis paragraf dengan
kalimat yang padu
BIND2 Melengkapi dialog drama
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
BIND3 Melengkapi larik puisi lama/baru (dengan kata
kias/berlambang/ berima/bermajas
BIND4 Melengkapi paragraf dengan kata baku, kata serapan, kata
berimbuhan, kata ulang, ungkapan, peribahasa
BIND5 Melengkapi teks pidato
BIND6 Menentukan isi dan simpulan grafik, diagram atau tabel
BIND7 Menentukan isi paragraf: fakta, opini, pernyataan/ jawaban
pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi
biografi
BIND8 Menentukan isi puisi lama, pantun, gurindam
BIND9 Menentukan kalimat resensi
BIND10 Menentukan kalimat kritik
BIND11 Menentukan opini penulis dan pihak yang dituju dalam tajuk
rencana/editorial
BIND12 Menentukan unsur-unsur intrinsik dan ekstrinsik sastra
Melayu klasik/hikayat
BIND13 Menentukan unsur-unsur intrinsik puisi
BIND14 Menentukan unsur-unsur intrinsik puisi
BIND15 Menentukan unsur-unsur intrinsik/ ekstrinsik
novel/cerpen/drama
BIND16 Menentukan unsur-unsur paragraf, ide pokok, kalimat
utama, kalimat penjelas
BIND17 Menulis judul sesuai EYD
BIND18 Menulis karya ilmiah (latar belakang dan rumusan masalah)
BIND19 Menulis surat resmi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
BIND20 Menyunting kalimat dalam surat resmi
BIND21 Menyunting penggunaan kalimat/frasa/kata
penghubung/istilah dalam paragraf
Sedangkan pada tahun 2014/2015 ada sedikit perubahan pada kompetensi yang
diujikan. Ada satu kompetensi yang dibedakan dengan tahun-tahun sebelumnya.
Perbedaan tersebut terletak pada munculnya kompetensi baru yaitu BIND18
“Menulis paragraf padu”. Daftar kompetensi yang diujikan adalah sebagai berikut:
Tabel 3. 2 Tabel Atribut Data Mata Pelajaran Bahasa Indonesia 2014/2015
Kode Atribut Keterangan
KODE_SEKOLAH Kode Sekolah
NAMA_SEKOLAH Nama Sekolah
JNS_SEK Jenis Sekolah (SMA/NA)
STS_SEK Status Sekolah (Negeri/Swasta)
BIND1 Melengkapi berbagai bentuk dan jenis paragraf dengan
kalimat yang padu
BIND2 Melengkapi dialog drama
BIND3 Melengkapi larik puisi lama/baru (dengan kata
kias/berlambang/ berima/bermajas
BIND4 Melengkapi paragraf dg kata baku, kata serapan, kata
berimbuhan, kata ulang, ungkapan, peribahasa
BIND5 Melengkapi teks pidato
BIND6 Menentukan isi dan simpulan grafik, diagram atau tabel
BIND7 Menentukan isi paragraf: fakta, opini, pernyataan/jawaban
pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi
biografi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
BIND8 Menentukan isi puisi lama, pantun, gurindam
BIND9 Menentukan kalimar resensi
BIND10 Menentukan kalimat kritik
BIND11 Menentukan opini penulis dan pihak yang dituju dalam tajuk
rencana/editorial
BIND12 Menentukan unsur-unsur intrinsik dan ekstrinsik sastra
Melayu klasik/hikayat
BIND13 Menentukan unsur-unsur intrinsik puisi
BIND14 Menentukan unsur-unsur intrinsik/ ekstrinsik
novel/cerpen/drama
BIND15 Menentukan unsur-unsur paragraf, ide pokok, kalimat
utama, kalimat penjelas
BIND16 Menulis judul sesuai EYD
BIND17 Menulis karya ilmiah (latar belakang dan rumusan masalah)
BIND18 Menulis paragraf padu
BIND19 Menulis surat resmi
BIND20 Menyunting kalimat dalam surat resmi
BIND21 Menyunting penggunaan kalimat/frasa/kata
penghubung/istilah dalam paragraf
Teknik pengumpulan data yang digunakan oleh peneliti adalah dengan teknik
wawancara. Teknik wawancara yaitu kegiatan melakukan tanya jawab dengan
narasumber yang terkait. Dalam penelitian ini, penulis melakukan wawancara
dengan seorang dosen yang memiliki research di bidang pendidikan yang
digunakan untuk memberikan gambaran umum penelitian.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
3.2 Spesifikasi Alat
Sistem dibuat dengan menggunakan hardware dan software sebagai berikut :
a. Spesifikasi hardware
a. Proses Intel Pentium Core i3 2.30GHz
b. RAM 2 GB
c. Harddisk 500 GB
b. Spesifikasi Software
a. Sistem Operasi Microsoft Windows 10
b. Compiler IDE NetBeans 8.0
Software ini akan digunakan untuk membuat tampilan interface dan
sekaligus membuat source code.
3.3 Tahap – Tahap Penelitian
a. Studi Kasus
Ujian nasional adalah salah satu sistem evaluasi standar pendidikan yang ada
di Indonesia. Ujian ini diadakan dengan tujuan untuk pengendalian mutu
pendidikan secara nasional. Demi meningkatnya mutu pendidikan nasional,
maka ada baiknya jika para pengajar dapat selalu mengevaluasi hasil dari ujian
nasional sekolahnya masing-masing. Untuk mendapatkan evaluasi yang lebih
mendalam, maka digunakanlah nilai daya serap yang terdiri dari beberapa
kompetensi dari setiap mata pelajaran. Penelitian ini diharapkan dapat
menemukan pola keterkaitan antara satu kompetensi dengan kompetensi
lainnya yang mempengaruhi sebuah sekolah mendapatkan nilai lebih dari
standar nilai daya serap yang ditentukan pada kompetensi-kompetensi tertentu.
b. Penelitian Pustaka
Pada tahap ini, dilakukan penelitian pustaka untuk memperoleh informasi dan
menggali teori-teori tentang teknik penambangan data. Dalam penelitian ini
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
penulis mempelajari literatur yang berkaitan dengan teknik penambangan data
asosiasi khususnya algoritma FP-Growth dan literatur lainnya yang berguna
bagi sistem yang akan dibangun.
c. Knowledge Discovery in Database (KDD)
Setelah tahap-tahap sebelumnya dilakukan, maka tahap ini sangat diperlukan
karena penelitian ini berada di bidang penambangan data. Proses KDD pula
terdiri dari data cleaning, data integration, data selection, data transformation,
data mining, pattern evaluation dan knowledge presentation. Pada tahap awal
akan dilakukan data cleaning dan data integration pada data nilai daya serap
sehingga data tersebut dapat digunakan untuk mencari pola asosiasinya. Proses
awal ini dilakukan secara manual menggunakan tool Microsoft Excel. Lalu
untuk proses selanjutnya seperti data selection, data transformation dan data
mining akan dilakukan di dalam perangkat lunak yang akan dibuat. Sedangkan
proses pattern evaluation dan knowledge presentation baru dapat dilakukan
setelah perangkat lunak selesai dibangun karena proses ini membutuhkan hasil
dari alat uji tersebut.
d. Pengembangan Perangkat Lunak
1. Metode Pengembangan Sistem
Metode yang digunakan oleh penulis dalam pengembangan sistem adalah
metode waterfall. Metode ini merupakan salah satu metode yang paling sering
dipakai oleh para pengembang perangkat lunak. Inti dari metode ini adalah
pengerjaan dari sistem dilakukan secara linier. Jadi jika tahap pertama belum
dilakukan, maka tahap kedua dan selanjutnya otomatis tidak bisa dikerjakan.
Secara garis besar metode waterfall mempunyai langkah – langkah sebagai
berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
a. Analisa
Langkah ini merupakan analisa terhadap kebutuhan sistem.
Pengumpulan data dalam tahap ini bisa melakukan sebuah penelitian,
wawancara atau studi literatur. Seorang sistem analis bertugas dalam
mencari informasi sebanyak mungkin dari pengguna sehingga sistem
yang dibuat dapat sesuai dengan keinginan pengguna. Tahapan ini
biasanya akan menghasilkan dokumen user requirement yang dapat
digunakan sistem analis untuk menerjemahkan ke dalam bahasa
pemrograman.
b. Design
Proses desain akan menerjemahkan syarat kebutuhan ke sebuah
perancangan perangkat lunak yang dapat diperkirakan sebelum di ubah
ke dalam bahasa pemrograman. Proses ini berfokus pada struktur data,
arsitektur perangkat lunak, representasi interface, dan detail algoritma.
Tahapan ini akan menghasilkan dokumen yang disebut software
requirement. Dokumen ini yang digunakan seorang programmer untuk
membangun sistemnya.
c. Code dan Testing
Coding merupakan penerjemahan design ke dalam bahasa
pemrograman. Pada tahap ini programmer akan mengubah proses
transaksi yang diinginkan pengguna ke dalam sistem yang dibuatnya.
Setelah pengkodean selesai maka akan dilakukan testing terhadap
sistem yang telah dibuat tadi. Tujuan testing adalah menemukan
kesalahan – kesalahan terhadap sistem tersebut dan kemudian dapat
diperbaiki.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
2. Pengujian
Pengujian dilakukan dengan alat uji yang sudah dibuat pada tahap
sebelumnya. Metode untuk pengujian sistem ini adalah metode pengujian
black box, pengujian dataset dan uji validasi. Pengujian black box ini berisi
pengujian dengan pengisian data secara benar dan tidak benar. Untuk
pengujian dataset, pengujian dilakukan dengan mencoba
mengkombinasikan nilai min support dan min confidence untuk melihat
nilai lift ratio yang dihasilkan. Selain itu, dari hasil kombinasi tersebut juga
dapat dilihat nilai running time. Kemudian untuk pengujian validasi, hasil
dari perangkat lunak yang dibuat akan dibandingkan dengan hasil dari
aplikasi WEKA yang telah terpercaya hasilnya.
e. Analisis dan Pembuatan Laporan
Analisis yang akan dilakukan adalah analisis hasil dari perangkat lunak yang
dibuat berdasarkan penerapan algoritma FP-Growth. Analisis yang dimaksud
adalah melakukan analisis dari pola yang terbentuk. Pola yang dipilih untuk
dianalisis adalah pola yang memiliki nilai lift ratio dan confidence tertinggi.
Cara untuk menganalisis pola yang dihasilkan tersebut digunakan 2 metode,
yang pertama yaitu secara obyektif dan yang kedua adalah secara subyektif.
Analisis secara obyektif ini dilihat dari nilai lift ratio. Sedangkan analisis secara
subyektif ini dilakukan dengan menanyakan pendapat kepada seorang praktisi
pendidikan mengenai pola yang terbentuk tersebut. Hasil dari semua pengujian
tersebut akan disusun kedalam sebuah laporan tugas akhir.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
BAB IV
PEMROSESAN AWAL DAN PERANCANGAN PERANGKAT
LUNAK PENAMBANGAN DATA
4.1 Perancangan Awal Sumber Data
4.1.1 Pembersihan Data
Proses pembersihan data yang dilakukan dalam penelitian ini adalah dengan
membuang data yang tidak lengkap. Pada penelitian ini ada 2 sekolah yang harus
dihapus karena tidak memiliki nilai. Dua sekolah tersebut adalah SMA Piri 2
Yogyakarta dengan id 01-032 dan SMA Proklamasi’45 dengan id 04-071.
4.1.2 Integrasi Data
Tahap ini berisikan penggabungan dari bermacam- macam data dari berbagai
sumber. Dalam penelitian ini peneliti menggunakan 3 data yaitu data tahun akademik
2012/2013 dan 2013/2014 dan 2014/2015. Data pada tiap tahun tersebut memiliki 21
kompetensi. Data pada tahun 2012/2013 & 2013/2014 memiliki kompetensi-
kompetensi yang sama. Sedangkan pada tahun 2014/2015 ada satu kompetensi yang
berbeda. Data tahun 2012/2013 & 2013/2014 tersebut akhirnya digabungkan menjadi
satu karena memiliki kompetensi yan g sama. Penggabungan ini bertujuan untuk
memperbanyak data yang akan digunakan sebagai dataset karena walaupun nama
sekolah sama tetapi tetap berbeda siswanya. Sedangkan data tahun 2014/2015 tetap
menjadi satu dataset tanpa digabung dengan data lainnya.
4.1.3 Seleksi Data
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan
sebelum tahap penggalian informasi dalam KDD dimulai. Pada data nilai daya serap
terdapat 4 atribut tetap yaitu KODE SEKOLAH, NAMA SEKOLAH, JNS SEK, STS
SEK dan sisanya merupakan atribut nama kompetensi yang berjumlah 21 untuk mata
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
pelajaran Bahasa Indonesia. Dari semua atribut tersebut yang dipakai hanya atribut
nama kompetensi tiap mata pelajaran. Daftar atribut yang digunakan dapat dilihat pada
tabel 3.1 dan tabel 3.2 di bab 3. Sedangkan contoh data yang akan digunakan dapat
dilihat pada Lampiran 6.
4.1.4 Transformasi Data
Proses transformasi dilakukan pada data yang telah dipilih, sehingga data
tersebut sesuai untuk proses penambangan data. Pada tahap ini dilakukan proses
preprocessing dengan cara hanya mengambil nilai yang memenuhi standar nilai yang
dimasukkan oleh pengguna. Dari Gambar 3.1 dapat dilihat nilai yang block warna
berarti memenuhi nilai standar yakni lebih dari 75. Nilai 75 itu adalah nilai yang
diisikan oleh pengguna. Berdasarkan tabel 2.1 di bab 2, nilai 75 masuk kedalam
kategori tinggi. Nilai-nilai kompetensi yang di block tersebut kemudian diambil
dimasukkan kedalam array. Misalnya untuk kode sekolah 01-001 maka kompetensi
yang digunakan adalah BIND1, BIND2, BIND3, BIND4, BIND5, BIND6, BIND7,
BIND8, BIND9, BIND10, BIND11, BIND14, BIND15, BIND17, BIND18, BIND19,
BIND20, BIND21.
Gambar 3. 1 Data Nilai Daya Serap
Setelah itu kompetensi juga diurutkan berdasarkan kompetensi yang memiliki
jumlah frekuensi dari yang tertinggi ke terendah. Setelah itu data siap digunakan untuk
masuk ke proses penambangan data.
4.2 Pengembangan Perangkat Lunak Penambangan Data
4.2.1 Perancangan Umum
4.2.1.1 Input
Inputan dari sistem ini adalah data yang berasal dari file yang berekstensi .xls
yang dapat dipilih langsung oleh pengguna. Pengguna juga berperan dalam
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
30
memasukkan nilai minimum support, minimum confidence dan nilai standar
daya serap terlebih dahulu. Data yang dipakai adalah data nilai daya serap siswa
SMA yang terdiri dari beberapa kolom kompetensi.
Pengguna
Pencarian Aturan
Asosiasi dengan FP
Growth
min support, min
confidence, data daya serap
aturan asosiasi
Gambar 4. 1 Diagram Konteks
4.2.1.2 Proses
Proses sistem terdiri dari beberapa langkah untuk dapat menemukan aturan
asosiasi yang berfungsi untuk menemukan pola keterkaitan antar kompetensi
yaitu:
1 Pengambilan data yang sudah melalui tahap preprocessing untuk digunakan
saat proses penambangan data.
2 Penentuan minimum support dan minimum confidence yang berfungsi
dalam menentukan aturan asosiasi.
3 Proses asosiasi untuk mencari pola keterkaitan kompetensi dijalankan.
4 Analisis hasil asosiasi terhadap proses penambangan data yang telah
dijalankan.
4.2.1.3 Output
Sistem yang akan dibangun ini nantinya akan memberikan keluaran berupa
aturan asosiasi yang memenuhi nilai minimum support dan minimum
confidence beserta nilai lift ratio dan nilai confidence.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
31
4.2.2 Diagram Use Case
Diagram usecase merupakan sebuah gambaran sistem yang dilihat dari sudut pandang
pengguna sistem (user). Pengguna sistem dalam diagram usecase dapat juga disebut
actor. Actor pada sistem ini hanya akan ada satu actor saja dan dapat melakukan 3
aktivitas seperti memilih data, mencari aturan dan menyimpan hasil. Ketiga aktivitas
tersebut merupakan aktivitas yang saling berhubungan, sehingga tiap aktivitas harus
dijalankan berurutan.
Pengguna
Memilih Data
Mencari aturan asosiasi
Menyimpan Hasil
<<include>>
<<include>>
Gambar 4. 2 Diagram Usecase
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
32
4.2.3 Diagram Aktivitas
Diagram aktivitas sistem yang akan dibuat terlampir pada Lampiran 1. Diagram
aktivitas yang dipakai sebanyak 3 buah menyesuaikan dengan jumlah aktivitas dari
usecase yang ada. Diagram aktivitas tersebut terdiri dari:
1. Memilih data
2. Mencari aturan
3. Menyimpan hasil
4. Mencari aturan
4.2.4 Diagram Kelas Analisis
Fungsi dari pembuatan diagram kelas tahap analisis ini berguna untuk mempermudah
dalam penyusunan sequence diagram. Diagram kelas analisis dapat dilihat pada
Lampiran 2.
Tabel 4. 1 Daftar Kelas Untuk Tiap Usecase
Usecase Boundary Control Class Model Class (Entity)
Memilih
data
view_home
view_preprocessing
Control_atributSelection Model_atribuSelection
Mencari
aturan
asosiasi
view_asosiasi Control_algorithm comparitorHeaderTable
TreeNode
Model_combination
Menyimpan
hasil
view_asosiasi
4.2.5 Diagram Sequence
Diagram sequence adalah diagram yang memperlihatkan atau menampilkan interaksi-
interaksi antar objek di dalam sistem. Interaksi objek-objek tersebut termasuk
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
33
pengguna, boundary, controller dan model berupa pesan/message. Diagram sequence
pada sistem ini terdiri dari 3 diagram sesuai dengan usecase. Diagram dapat dilihat
pada Lampiran 3.
4.2.6 Struktur Data
Sistem pencarian aturan asosiasi ini membutuhkan suatu tempat penyimpanan data
yang tidak membutuhkan memori yang terlalu banyak dan tidak menghabiskan waktu
yang cukup banyak ketika sistem dijalankan karena dapat mengolah data dengan
efisien. Berdasarkan kebutuhan diatas maka penelitian ini akan menggunakan konsep
penyimpanan data menggunakan struktur data karena penyimpanan dengan struktur
data tidak membutuhkan memori yang besar dan lebih efisien dalam mengolah data.
Struktur data yang digunakan pada sistem ini adalah Tree dan Arraylist. Tree pada
sistem ini dapat memiliki jumlah anak yang tidak sama jumlahnya untuk setiap node
dan juga tidak bisa ditetapkan di awal. Maka struktur data Tree ini ditambahkan
struktur data yang dinamis seperti List untuk menyimpan jumlah anaknya.
a. Tree
Dalam ilmu komputer, tree adalah sebuah struktur data yang secara bentuk
menyerupai sebuah pohon, yang terdiri dari serangkaian node (simpul) yang saling
berhubungan. Node-node tersebut dihubungkan oleh sebuah pointer parent dan child.
Setiap node dapat memiliki 0 atau lebih node anak (child). Pada penelitian ini, pohon
yang dibuat mempunyai anak yang bertipe List<TreeNode>. List ini dipilih karena ada
beberapa node yang memiliki jumlah anak yang tidak bisa ditentukan dan tidak sama
untuk tiap node-nya. Dalam perangkat lunak yang dibuat pembuatan node ini dilakukan
di kelas TreeNode. Node yang dibuat akan berisikan informasi name, counts, next,
parent dan child.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
34
Gambar 4. 3 Ilustrasi FPTree
b. Arraylist
Arraylist memiliki sifat seperti array, tetapi perbedaan utamanya adalah Arraylist
bersifat dinamis dalam arti dapat memperbesar kapasitasnya secara otomatis apabila
diperlukan (Rickyanto,2003).
Pada penelitian ini penulis menggunakan arraylist dalam arraylist
(ArrayList<ArrayList<String>>) untuk membuat matriks. Penulis memilih
menggunakan arraylist karena dapat digunakan untuk membuat matrik dengan panjang
data baris yang berbeda. Cara kerja arraylist pada sistem ini adalah yang pertama
membuat objek arraylist yang pertama untuk menampung nama-nama kompetensi
yang memenuhi syarat untuk satu sekolah. Contohnya seperti gambar di bawah ini.
Berikut daftar kompetensi yang memenuhi standar nilai ketuntasan 75 yang
dimasukkan kedalam array:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
35
BIND6 BIND12 BIND16
Gambar 4. 4 Susunan arraylist untuk kode sekolah 01-010
BIND3 BIND4
Gambar 4. 5 Susunan arraylist untuk kode sekolah 01-019
Objek arraylist baru akan selalu dibuat untuk setiap kode sekolah yang berbeda.
Setelah membuat objek arraylist untuk tiap sekolah maka akan dibuat objek arraylist
untuk menjadikan satu semua objek arraylist sebelumnya. Gambaran datanya akan
berubah menjadi seperti di gambar 4.6.
BIND6 BIND12 BIND16
BIND3 BIND4
BIND6 BIND4 BIND15 BIND17
Gambar 4. 6 Data arraylist dalam arraylist
c. TreeNode
4.2.7 Diagram Kelas Desain
Diagram kelas dapat memperlihatkan hubungan antar kelas. Diagram ini dapat
membantu memvisualisasikan struktur kelas-kelas dari suatu sistem. Untuk detail kelas
dapat dilihat pada Lampiran 5.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
<<view>>view_preprocessing
<<view>>view_home
<<view>>view_about
<<view>>view_help
<<view>>view_asosiasi
<<control>>control_algorithm
<<model>>model_combination
<<model>>TreeNode
<<model>>comparatorHeaderTable
<<model>>model_atributSelection
<<control>>control_atributSelection
Gambar 4. 7 Diagram Kelas Desain
4.2.8 Rincian Algoritma untuk Setiap Metode
4.2.8.1 Metode-metode di dalam kelas control_algorithm
Nama Metode FPTree(ArrayList<LinkedList<String>> array1,
ArrayList<TreeNode> newArray)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
Fungsi Metode Mengubah data yang sudah dikenai preprocessing menjadi
bentuk Tree
Algoritma :
1 Method ini memiliki masukkan berupa arraylist yang berisi data nilai daya serap.
2 Satu persatu persatu nilai dalam array akan dibuat pohon dengan memanggil
method insertNode().
3 Setelah pohon FPTree selesai dibuat maka headerTable yang sudah terisi akan
diurutkan dari yang terkecil ke terbesar count-nya.
Nama Metode insertNode(LinkedList<String> array1, TreeNode treenode,
ArrayList<TreeNode> headerTable)
Fungsi Metode Menambah node pada pohon
Algoritma:
1. Pertama kali yang dilakukan adalah mengecek apakah array yang sebagai
inputan kosong atau tidak. Jika kosong maka akan langsung me-return.
2. Jika array tidak kosong, maka akan dicek apakah root pada treenode sudah ada
isinya atau belum.
3. Jika root belum memiliki anak, maka akan dibuat node baru yang lalu akan
dibuat menjadi anak dari root. Node tersebut juga akan di link-an dengan
headerTable.
4. Sedangkan jika root memiliki anak maka akan dicek apakah item pertama pada
array tersebut sudah ada pada pohon atau belum. Jika sudah maka akan
ditambahkan countnya.
5. Setelah itu, item petama pada array tersebut dihapus.
6. Array tadi lalu dimasukkan kembali menjadi parameter saat memanggil method
dirinya sendiri.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
Nama Metode FPGrowth(ArrayList<LinkedList<String>> array1, double
batas, int totalTransaction, double minConfidence)
Fungsi Metode Memanggil method FPGrowth dan menghitung nilai
confidence dan lift ratio
Algoritma:
1 Method ini pertama tama akan memanggil method FPgowth() untuk membuat
conditional pattern base, conditional fp tree dan frequent itemset.
2 Setelah mendapatkan frequent-k itemset, lalu frequent-k itemset tersebut dicari
yang k-nya paling tinggi.
3 Frequent itemset yang paling tinggi tersebut akan digunakan untuk membuat
kombinasi aturan asosiasi dengan memanggil method CountConfAndLift yang
ada di kelas model_combination
Nama Metode FPgrowth(TreeNode treeNode, String base, double
threshold, ArrayList<TreeNode> headerTable,
Map<String, Integer> frequentPatterns)
Fungsi Metode Mencari conditional pattern base, conditional fp tree dan
frequent itemset
Algoritma:
1. Lakukan perulangan dari data pada headerTable yang memiliki nilai count paling
kecil.
2. Lalu akan dilakukan perulangan juga untuk mencari letak item tadi pada pohon.
Setelah diketahui letaknya maka akan diruntut ke parentnya hingga sampai ke
root. Proses tersebut dicatat sebagai conditional pattern base.
3. Jika item pada headerTable memiliki conditional pattern base yang count-nya
lebih dari minimum support maka item tersebut akan disimpan di hashmap
frequentPattern.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
4. Setelah itu maka akan dipanggil method conditional_fp_tree_constructor untuk
mencari conditional fp tree
5. Selama conditional fptree memiliki anak maka proses selanjutnya adalah
memanggil method dirinya sendiri sampai conditional fptree tidak memiliki anak.
Nama Metode conditional_fptree_constructor(Map<String, Integer>
conditionalPatternBase, Map<String, Integer>
conditionalItemsMaptoFrequencies, double threshold,
ArrayList<TreeNode> conditional_headerTable)
Fungsi Metode Membuat pohon yang akan digunakan untuk mencari
conditional fp tree
Algoritma:
1. Masukan dari method ini adalah conditional pattern base yang sudah didapatkan
sebelumnya.
2. Setelah itu conditional pattern base tersebut dicek apakah countnya lebih besar
atau sama dengan minimum support.
3. Jika iya maka pattern base tersebut akan disimpan pada array baru.
4. Setelah pattern base dicek maka akan dibuat pohonnya dari pattern base yang
memenuhi minimum support
5. Method akan mengembalikan nilai berupa TreeNode
Nama Metode insert(LinkedList<String> pattern_vector, int
count_of_pattern, TreeNode conditional_fptree,
ArrayList<TreeNode> conditional_headerTable)
Fungsi Metode Membuat pohon untuk mencari conditional fp tree
Algoritma:
1. Pertama kali yang dilakukan adalah mengecek apakah array yang sebagai inputan
kosong atau tidak. Jika kosong maka akan langsung me-return.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
2. Jika array tidak kosong, maka akan dicek apakah root pada treenode sudah ada
isinya atau belum.
3. Jika root belum memiliki anak, maka akan dibuat node baru yang lalu akan dibuat
menjadi anak dari root. Node tersebut juga akan di link-an dengan headerTable.
4. Sedangkan jika root memiliki anak maka akan dicek apakah item pertama pada
array tersebut sudah ada pada pohon atau belum. Jika sudah maka akan
ditambahkan countnya.
5. Setelah itu, item petama pada array tersebut dihapus.
6. Array tadi lalu dimasukkan kembali menjadi parameter saat memanggil method
dirinya sendiri.
4.2.8.2 Algoritma Kelas model_combination
Nama Metode Combine(int start, HashMap temp, Map freqmap)
Fungsi Metode Membuat kombinasi dari string yang menjadi inputan
Algoritma:
1. Lakukan perulangan dari iterasi=1 sampai jumlah karakter dari string yang
diinputkan
2. Satu persatu karakter diambil di gabungkan
3. Gabungan karakter tersebut lalu dicek, selama jumlahnya masih kurang dari
jumlah string maka akan disimpan didalam arraylist antecendent
4. Langkah selanjutnya adalah memanggil dirinya sendiri untuk rekursif
Nama Metode CountConfAndLift(Map freqmap, HashMap map, int max,
int total, double minCon)
Fungsi Metode Menghitung nilai confidence dan lift ratio dari aturan yang
dihasilkan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
41
Algoritma:
1. Lakukan nested-loop untuk membuat kombinasi dari anteseden dan konsekuen
2. Setelah ditemukan kombinasinya, tiap kombinasi dihitung nilai confidence dan
lift rationya
3. Jika nilai confidence memenuhi nilai minimum confidence yang ditentukan maka
kombinasi tersebut akan dijadikan aturan asosiasi dan disimpan didalam arraylist
4.2.8.3 Algoritma Kelas View_Asosiasi
Nama Metode BubbleSortODesc(LinkedList<String> data, HashMap
map)
Fungsi Metode Mengurutkan data bertipe LinkedList dari besar ke kecil
Algoritma:
1. Lakukan perulangan dari iterasi=1 sampai data.size()-1
2. Lakukan perulangan kembali dari elemen=0 sampai data.size()-1-elemen
3. Lalu bandingkan count dari data sekarang dengan yang data setelahnya. Jumlah
count dapat diambil dari hashmap.
4. Jika count data sekarang lebih kecil maka indeks data akan ditukar dengan indeks
data setelahnya.
Nama Metode BubbleSortODescArrayList(ArrayList
<TreeNode> data)
Fungsi Metode Mengurutkan data bertipe ArrayList<TreeNode> dari besar
ke kecil
Algoritma:
d. Lakukan perulangan dari iterasi=1 sampai data.size()-1
e. Lakukan perulangan kembali dari elemen=0 sampai data.size()-1-
elemen
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
f. Lalu bandingkan count dari data sekarang dengan yang data setelahnya.
Jumlah count dapat diambil dari object TreeNode.
g. Jika count data sekarang lebih kecil maka indeks data akan ditukar
dengan indeks data setelahnya.
Nama Metode RemoveNoFequentItem()
Fungsi Metode Menghapus data yang memiliki count lebih kecil dari
minimum support
Algoritma:
1. Lakukan nested-loop untuk mengambil data ArrayList
2. Cek count dari tiap data
3. Jika count lebih besar atau sama dengan minimum support maka data akan
dimasukkan ke dalam array baru.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
43
4.2.9 Antarmuka
1. Halaman Awal
Gambar 4. 8 Halaman Awal
Halaman ini merupakan halaman utama yang akan ditampilkan pertama kali
saat sistem dijalankan. Halaman ini berisi 4 tombol yaitu BERANDA, BANTUAN,
TENTANG dan MASUK SISTEM. Tombol BERANDA akan menghubungkan
dengan halaman view_home. Sedangkan tombol BANTUAN ia akan menghubungkan
dengan view_help, tombol TENTANG akan menghubungkan dengan view_about. Dan
yang terakhir yaitu tombol MASUK SISTEM yang akan menghubungkan dengan
halaman view_preprocessing untuk memulai memilih data yang akan digunakan.
MASUK SISTEM
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
44
2. Halaman About
Gambar 4. 9 Halaman About
Halaman ini digunakan untuk memberikan informasi tentang sistem seperti
tujuan sistem ini dibuat dan kegunaanya. Pada halaman ini jg masih dapat digunakan
tombol-tombol seperti halaman utama (Gambar 4.15).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
45
3. Halaman Help
Gambar 4. 10 Halaman Help
Halaman bantuan ini berisikan panduan penggunaan sistem yang bertujuan untuk
memudahkan pengguna dalam menggunakan aplikasi ini. Pada halaman ini jg masih
dapat digunakan tombol-tombol seperti halaman utama (Gambar 4.15).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
46
4. Halaman Preprocessing
Gambar 4. 11 Halaman Preprocessing
Halaman preprocessing ini digunakan untuk melakukan pemilihan data yang akan
digunakan dengan cara menekan tombol PILIH FILE untuk mencari file bertipe .xls
atau .csv. Setelah data muncul pada tabel dapat dilakukan juga penyeleksian atribut.
Pada halaman ini kita dapat menghapus atribut-atribut yang tidak diperlukan. Setelah
melakukan seleksi atribut, kita dapat menekan tombol KONVERSI untuk mengambil
data yang memenuhi standar nilai keberhasilan yang sudah dimasukkan sebelumnya.
Setelah itu tombol SUBMIT akan muncul dan dapat digunakan untuk melanjutkan
proses selanjutnya.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
47
5. Halaman Asosisasi
Gambar 4. 12 Halaman Asosiasi
Halaman ini akan berisikan tabel dengan data yang sudah melalui proses
preprocessing. Setelah itu pengguna dapat memasukkan nilai minimal support dan
minimal confidence yang dapat digunakan untuk proses pencarian aturan asosiasi
dengan algoritma FPGrowth dengan menekan tombol PROSES.
PROSES
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
48
6. Halaman Database
Gambar 4. 13 Halaman Database
Halaman ini digunakan untuk menyambungkan dengan database. Dari database yang
ada nanti dapat dipakai datanya untuk proses pencarian aturan asosiasi selanjutnya.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
49
BAB V
IMPLEMENTASI PENAMBANGAN DATA
DAN EVALUASI HASIL
5.1 Implementasi Rancangan Perangkat Lunak Penambangan Data
Sistem pencarian aturan asosiasi ini menggunakan beberapa kelas yang mendukung
jalannya sistem. Kelas yang digunakan totalnya berjumlah 11 yang dibagi menjadi 3
package. Package – package tersebut bernama model, view dan controller. Berikut
adalah daftar kelas-kelas yang digunakan:
5.2.1 Implementasi Kelas Model
Berikut ini adalah tabel yang berisikan daftar kelas yang ada di package model.
Pada tabel tersebut disertakan juga nama file fisik dan nama file executable.
Tabel 5. 1 Tabel Implementasi Kelas Model
No Nama Kelas Nama File Fisik Nama File Executable
1 TreeNode TreeNode.java TreeNode.class
2 model_atributSelection model_atributSelection.java model_atributSelection.class
3 model_combination model_combination.java model_combination.class
4 comparatorHeaderTable comparatorHeaderTable.java comparatorHeaderTable.class
5.2.2 Implementasi Kelas View
Berikut ini adalah tabel yang berisikan daftar kelas yang ada di package view.
Pada tabel tersebut disertakan juga nama file fisik dan nama file executable.
Tabel 5. 2Tabel Implementasi Kelas View
No Nama Kelas Nama File Fisik Nama File Executable
1 view_about view_about.java view_about.class
2 view_asosiasi view_asosiasi.java view_asosiasi.class
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
50
3 view_help view_help.java view_help.class
4 view_home view_home.java view_home.class
5 view_preprocessing view_preprocessing.java view_preprocessing.class
5.2.3 Implementasi Kelas Controller
Berikut ini adalah tabel yang berisikan daftar kelas yang ada di package
controller. Pada tabel tersebut disertakan juga nama file fisik dan nama file
executable.
Tabel 5. 3 Tabel Implementasi Kelas Controller
No Nama Kelas Nama File Fisik Nama File Executable
1 Control_algorithm Control_algorithm.java Control_algorithm.class
2 Control_atributSelection Control_atributSelection
.java
Control_atribut
Selection.class
5.2 Evaluasi Hasil
5.2.1 Uji Coba Perangkat Lunak (Black Box Testing)
a. Pengujian Pada Halaman Preprocessing
Pada halaman ini, yang dapat dilakukan oleh pengguna adalah memilih file
yang isinya akan digunakan sebagai data yang akan diolah pada sistem. Pada
pengujian ini, peneliti mencoba memilih file dengan format yang benar yaitu
.xls atau .csv dan hasil keluarannya dapat dilihat pada Gambar 5.1(a) dan
Gambar 5.1(b). Sedangkan jika memilih format yang salah maka akan tampil
message dialog jika format yang dipilih salah (Gambar 5.2).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
51
Gambar 5. 1 (a)Kotak Dialog “Pilih File” (b)Tabel Dataset
Gambar 5. 2 Kotak Dialog Salah Pilih File
Selanjutnya ketika pengguna melakukan seleksi atribut, pengguna diberikan 3
fasilitas tombol. Tombol pertama yaitu tombol “Tandai Semua” untuk
menandai semua checkbox pada tabel sekaligus (Gambar 5.3). Tombol kedua
yaitu tombol “Hapus Atribut” untuk menghapus atribut-atribut yang sudah
dipilih (Gambar 5.4). Tombol terakhir yaitu “Batal” yang dapat digunakan
untuk menghapus tanda centang pada semua checkbox (Gambar 5.5).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
52
Gambar 5. 3 Tampilan Setelah Menekan Tombol “Tandai Semua”
Gambar 5. 4 Tampilan Setelah Menekan Tombol “Hapus Atribut”
Gambar 5. 5 Tampilan Setelah Menekan Tombol “Batal”
Berikut ini adalah tabel yang mencatat hasil dari pengujian blackbox pada
aktivitas-aktivitas yang dapat dilakukan pada Halaman Preprocessing
Tabel 5. 4 Tabel Hasil Uji Pada Halaman Preprocessing
Kasus dan Hasil Uji Pada Halaman Preprocessing
Require Skenario Uji Hasil yang diharapkan Hasil
Pengujian
Gambar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
53
Pilih File
Pilih file
(jika benar)
Data tampil pada tabel
preprocessing Sesuai Gambar 5.1
Pilih file
(jika salah)
Tampil konfirmasi
salah memilih file Sesuai Gambar 5.2
Seleksi
Atribut
Seleksi
Atribut: tandai
semua
Semua checkbox pada
tabel seleksi atribut
terisi sekaligus Sesuai Gambar 5.3
Seleksi
Atribut:
Hapus atribut
Atribut yang ditandai
checkboxnya terhapus Sesuai Gambar 5.4
Seleksi
Atribut:
Batal
Semua tanda centang
pada checkbox atribut
yang dipilih pada tabel
seleksi atribut akan
langsung hilang
Sesuai Gambar 5.5
b. Pengujian Pada Halaman Asosiasi
Pada halaman asosiasi yang dapat dilakukan oleh pengguna adalah melihat
aturan asosiasi yang dihasilkan oleh sistem. Ada beberapa aktivitas yang harus
dilakukan oleh pengguna untuk mendapatkan aturan asosiasi tersebut. Aktivitas
pertama adalah mengisikan nilai minimum support dan minimum confidence.
Setelah itu pengguna akan menekan tombol “Proses” dan menampilkan hasil
aturan yang memenuhi minimum support dan minimum confidence dan
ditampilkan pada tabel (Gambar 5.6). Jika minimum confidence dan minimum
support tidak diisi maka akan menampilkan pesan berupa message dialog
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
54
(Gambar 5.7). Setelah hasil didapatkan, pengguna dapat menyimpan hasil
aturan asosiasi menjadi file dengan format .xls, .pdf, .doc dan .txt (Gambar 5.8).
Tabel 5. 5 Tabel Pengujian Halaman Preprocessing
Kasus dan Hasil Uji Pada Halaman Preprocessing
Require Skenario Uji Hasil yang diharapkan Hasil Pengujian Gambar
Mencari
Aturan
Memasukkan nilai
minimum support
dan minimum
confidence
(jika benar)
Menampilkan hasil
aturan pada tabel
Sesuai Gambar 5.6
Memasukkan nilai
minimum support
dan minimum
confidence
(jika benar)
Menampilkan message
dialog agar pengguna
mengisikan minimum
support dan minimum
confidence
Sesuai Gambar 5.7
Simpan
Hasil
Menekan tombol
“Simpan Hasil”
Menampilkan message
dialog jika data
tersimpan
Sesuai Gambar 5.8
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
55
Gambar 5. 6 Hasil Pencarian Aturan asosiasi
Gambar 5. 7 Tampilan Ketika Min Support dan Minimum confidence Tidak
Diisi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
56
Gambar 5. 8 Kotak Dialog Simpan Hasil
Gambar 5. 9 Kotak Dialog Jika Berhasil Menyimpan Data
c. Uji Dengan Perhitungan Manual
Salah satu pengujian lainnya selain mencoba membandingkan hasil yang
didapat dari alat uji dengan aplikasi WEKA, cara lainnya adalah
membandingkan hasil dengan perhitungan manual. Untuk perhitungan manual
ini, peneliti menggunakan contoh 10 data saja. Data yang digunakan adalah
data nilai daya serap mata pelajaran Bahasa Indonesia.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
57
Tabel 5. 6 Tabel Pengujian dengan Hitungan Manual
Hasil Pengujian
Min
Support 70
Min
Confidence 70
Frequent
Itemset
Alat Uji Hitung Manual
BIND3 7 BIND3 7
BIND4 8 BIND4 8
BIND16 7 BIND16 7
BIND2 8 BIND2 8
BIND17 7 BIND17 7
BIND6 9 BIND6 9
BIND17 BIND6 7 BIND6 BIND17 7
BIND17 BIND2 7 BIND2 BIND17 7
BIND16 BIND6 7 BIND6 BIND16 7
BIND3 BIND4 7 BIND3 BIND4 7
BIND4 BIND6 7 BIND4 BIND6 7
BIND4 BIND2 7 BIND4 BIND2 7
BIND2 BIND6 8 BIND2 BIND6 8
BIND4 BIND2
BIND6
7 BIND4 BIND2
BIND6
7
BIND17 BIND2
BIND6
7 BIND17 BIND2
BIND6
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
58
d. Kesimpulan Black Box Testing
Berdasarkan semua pengujian yang sudah dilakukan untuk halaman
preprocessing dan halaman asosiasi dapat disimpulkan bahwa sistem sudah
dapat dijalankan dengan baik karena sistem dapat dijalankan sesuai tabel
pengujian black box. Untuk output yang dihasilkan oleh sistem, peneliti juga
mencoba untuk membandingkannya dengan hasil dari perhitungan manual.
Hasil yang didapatkan dari perhitungan, hasil frequent itemset yang dihasilkan
antara perangkat lunak yang dibuat dan perhitungan manual memiliki hasil
yang sama.
5.2.2 Uji Validitas
a. Uji Validitas Dengan Aplikasi WEKA
Salah satu metode yang dilakukan peneliti untuk mengetahui valid atau
tidaknya hasil dari alat uji yang dibuat, maka peneliti melakukan perbandingan
hasil antara alat uji dengan aplikasi yang hasilnya sudah pasti dapat dipercaya
kebenarannya. Aplikasi yang dipilih oleh peneliti adalah aplikasi Weka versi
3.6. Weka adalah salah satu aplikasi penambangan data open source berbasis
Java. Aplikasi ini dibuat oleh Universitas Waikato, New Zealand dengan tujuan
untuk penelitian dan pendidikan. WEKA sendiri merupakan singkatan dari
Waikato Environment for Knowledge Analysis.
Pengujian ini menggunakan dataset yang diambil dari WEKA yang
berjudul supermarket.arff. Dataset ini memiliki 217 atribut dengan jumlah data
sebanyak 4627 buah. Untuk pengujian ini peneliti melakukan preprocessing
terlebih dahulu terhadap dataset ini. Data asli dari dataset ini dapat dilihat pada
Gambar 5.10.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
59
Gambar 5. 10 Dataset Supermarket.arff
Dari data asli tersebut, peneliti memilih menggunakan 5 atribut saja
yaitu ‘grocery misc’, ‘baby needs’, ‘bread and cake’, ‘baking needs’ dan ‘juice-
sat-cord-ms’. Dataset ini berisikan nilai ‘?’ dan ‘t’. Agar dataset ini dapat
digunakan pada alat uji yang dibuat peneliti maka peneliti mengubah nilai ‘?’
menjadi ‘0’ dan ‘t’ menjadi ‘1’. Atribut pada dataset ini juga diubah menjadi
‘A’,’B’,’C’,’D’,’E’. Sehingga data setelah diubah menjadi seperti Gambar
5.11.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
60
Gambar 5. 11 Dataset Setelah di Preprocessing
Setelah proses preprocessing, data langsung dicobakan terhadap alat
uji dan juga aplikasi WEKA. Dari hasil yang didapat, dapat dibuktikan bahwa
alat uji telah berhasil menghasilkan aturan asosiasi yang sama dengan aturan
asosiasi yang dihasilkan oleh aplikasi WEKA. Hasil dari keduanya dapat
dilihat pada tabel dibawah ini (Tabel 5.7). Item C adalah ‘bread and cake’,
item D adalah ‘baking needs’ dan item E merupakan ‘juice-sat-cord-ms’.
Tabel 5. 7 Tabel Hasil Pengujian dengan WEKA
Hasil Pengujian
Min
Support 40
Min
Confidence 60
Jumlah
Aturan 3
Alat Uji WEKA
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
61
Aturan Confidence Lift
ratio
Aturan Confidence Lift
ratio
E C 78.39% 1.09 E C 0.78 1.09
C D 65.8% 1.09 C D 0.66 1.05
D C 75.88% 1.05 D C 0.76 1.09
b. Kesimpulan Uji Validitas Dengan Aplikasi WEKA
Setelah menggunakan dataset yang sama, dataset tersebut dicobakan kepada 2
aplikasi berbeda. Aplikasi pertama yaitu aplikasi WEKA dan yang kedua
aplikasi yang sudah peneliti buat. Dari hasil yang didapatkan (Tabel 5.6) dapat
dilihat bahwa hasil antara kedua aplikasi tersebut sama, sehingga aplikasi yang
dibuat ini sudah baik dan dapat digunakan untuk pengujian.
5.2.3 Uji Coba Data Set
a. Ujicoba Dataset Tahun 2012/2013-2013/2014
Pengujian ini dilakukan dengan menggunakan dataset nilai daya serap
Ujian Nasional SMA mata pelajaran Bahasa Indonesia jurusan IPA pada tahun
ajaran 2012/2013-2013/2014. Data ini memiliki 280 baris data. Pengujian
dilakukan sebanyak 30 kali dengan kombinasi nilai minimal support dan
minimum confidence yang berbeda. Nilai confidence yang dipilih adalah nilai
60% dan 90% karena besar kecilnya confidence hanya akan mempengaruhi
jumlah aturan yang terbentuk tanpa mempengaruhi nilai lift ratio dan
confidencenya. Pada pengujian dengan nilai standar nilai daya serap 80% dan
minimum support 90% sudah tidak ditemukan lagi aturan yang muncul.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
62
Berikut ini adalah contoh cara membaca tabel kombinasi antara
minimum support dan minimum confidence yang digunakan dengan nilai
standar nilai daya serap sebesar 75%:
1. Ketika minimum support 50% dan minimum confidence 60% maka akan
ditemukan sebanyak 1442 aturan dengan running time mencapai 0.86
second dan didapatkan lift ratio tertingginya sebesar 1.57.
2. Ketika minimum support 55% dan minimum confidence 60% maka akan
ditemukan sebanyak 481 aturan dengan running time mencapai 0.156
second dan didapatkan lift ratio tertingginya sebesar 1.39.
3. Ketika minimum support 60% dan minimum confidence 60% maka akan
ditemukan sebanyak 300 aturan dengan running time mencapai 0.031
second dan didapatkan lift ratio tertingginya sebesar 1.21.
4. Ketika minimum support 70% dan minimum confidence 60% maka akan
ditemukan sebanyak 42 aturan dengan running time mencapai 0.015 second
dan didapatkan lift ratio tertingginya sebesar 1.09.
5. Ketika minimum support 80% dan minimum confidence 60% maka akan
ditemukan sebanyak 6 aturan dengan running time mencapai 0.0019 second
dan didapatkan lift ratio tertingginya sebesar 1.04.
6. Ketika minimum support 90% dan minimum confidence 60% maka akan
ditemukan sebanyak 2 aturan dengan running time mencapai 0.0014 second
dan didapatkan lift ratio tertingginya sebesar 1.01.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
63
Tabel 5. 8 Tabel Hasil Pengujian Tahun 2012/2013 & 2013/2014, Min Conf=60%
Tahun
Standar
Daya
Serap
(%)
Min Support
(%)
Min
Confidence
(%)
Jumlah
Aturan
Asosiasi
Runing
Time(s)
Lift ratio
Terbesar
1213
&
1314
75
50
60
1442 0.86 1.57
55 481 0.156 1.39
60 300 0.031 1.21
70 42 0.015 1.09
80 6 0.0019 1.04
90 2 0.0014 1.01
80
50
60
87 0.0043 1.44
55 42 0.002 1.25
60 30 0.0021 1.17
70 6 0.0011 1.11
80 2 0.0011 1.06
90 0 0.0009 0
Tabel 5. 9 Tabel Hasil Pengujian Tahun 2012/2013 & 2013/2014, Min Conf = 90%
Tahun
Standar
Daya
Serap
(%)
Min Support
(%)
Min
Confidence
(%)
Jumlah
Aturan
Asosiasi
Runing
Time(s)
Lift ratio
Terbesar
1213
&
1314
75
50
90
415 0.229 1.57
55 155 0.0256 1.39
60 82 0.0091 1.20
70 21 0.0026 1.09
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
64
80 4 0.0016 1.04
90 2 0.0014 1.01
80
50
90
22 0.0035 1.37
55 16 0.0021 1.25
60 13 0.0018 1.17
70 2 0.0012 1.11
80 1 0.0011 1.06
90 0 0.0010 0
90
50
90
1 0.00088 1.09
55 1 0.00085 1.09
60 1 0.00083 1.09
70 0 0.00075 -
80 0 0.00070 -
90 - - -
b. Ujicoba Dataset Tahun 2014/2015
Pengujian ini dilakukan dengan menggunakan dataset berupa nilai daya
serap Ujian Nasional SMA mata pelajaran Bahasa Indonesia jurusan IPA pada
tahun ajaran 2014/2015. Data ini terdiri dari 140 sekolah yang ada di Provinsi
DI Yogyakarta. Pengujian dilakukan sebanyak 30 kali dengan kombinasi nilai
minimal support dan minimum confidence yang berbeda. Nilai confidence yang
dipilih adalah 60% dan 90% karena besar kecilnya confidence hanya akan
mempengaruhi jumlah aturan yang terbentuk tanpa mempengaruhi nilai lift
ratio dan confidencenya.
Berikut ini adalah contoh cara membaca tabel kombinasi antara minimum
support dan minimum confidence yang digunakan dengan nilai standart nilai
daya serap sebesar 75%:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
65
1. Ketika minimum support 50% dan minimum confidence 60% maka akan
ditemukan sebanyak 8186 aturan dengan running time mencapai 84.957
second dan didapatkan lift ratio tertingginya sebesar 1.37.
2. Ketika minimum support 55% dan minimum confidence 60% maka akan
ditemukan sebanyak 8186 aturan dengan running time mencapai 84.007
second dan didapatkan lift ratio tertingginya sebesar 1.37.
3. Ketika minimum support 60% dan minimum confidence 60% maka akan
ditemukan sebanyak 4094 aturan dengan running time mencapai 19.904
second dan didapatkan lift ratio tertingginya sebesar 1.34.
4. Ketika minimum support 70% dan minimum confidence 60% maka akan
ditemukan sebanyak 1530 aturan dengan running time mencapai 1.235
second dan didapatkan lift ratio tertingginya sebesar 1.28.
5. Ketika minimum support 80% dan minimum confidence 60% maka akan
ditemukan sebanyak 186 aturan dengan running time mencapai 0.016
second dan didapatkan lift ratio tertingginya sebesar 1.1.
6. Ketika minimum support 90% dan minimum confidence 60% maka akan
ditemukan sebanyak 12 aturan dengan running time mencapai 0 second dan
didapatkan lift ratio tertingginya sebesar 1.04.
Tabel 5. 10 Tabel Hasil Pengujian Tahun 2014/2015, Min Conf = 60%
Tahun
Standar
Daya
Serap
(%)
Min Support
(%)
Min
Confidence
(%)
Jumlah
Aturan
Asosiasi
Runing
Time(s)
Lift ratio
Terbesar
1415
75
50
60
8186 84.957 1.37
55 8186 84.007 1.37
60 4094 19.904 1.34
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
66
70 1530 1.235 1.28
80 186 0.016 1.1
90 12 0 1.04
80
50
60
994 0.766 1.46
55 506 0.125 1.37
60 504 0.062 1.38
70 62 0.016 1.18
80 42 0 1.11
90 2 0.015 1.03
Tabel 5. 11 Tabel Hasil Pengujian Tahun 2014/2015, Min Conf = 90%
Tahun
Standar
Daya
Serap
(%)
Min Support
(%)
Min
Confidence
(%)
Jumlah
Aturan
Asosiasi
Runing
Time(s)
Lift ratio
Terbesar
1415
75
50
90
2263 82.34 1.37
55 2263 78.26 1.37
60 1665 18.01 1.34
70 913 0.645 1.28
80 143 0.010 1.1
90 12 0.001 1.04
80
50
90
260 0.448 1.46
55 158 0.106 1.37
60 218 0.049 1.38
70 32 0.004 1.18
80 33 0.0018 1.11
90 2 0.0009 1.03
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
67
90
50
90
1 0.00083 1.09
55 1 0.00080 1.09
60 1 0.00081 1.09
70 0 0.00071 -
80 0 0.00071 -
90 - - -
c. Uji Running Time
Untuk pengujan running time akan digunakan percobaan dengan nilai
minimum confidence yang berbeda karena minimum confidence mempengaruhi
jumlah aturan asosiasi yang terbentuk. Nilai confidence yang digunakan adalah
60% dan 90%.
1. Data Tahun 2012/2013 & 2013/2014
Gambar 5. 12 Uji Running Time Min Confidence=60%
50 55 60 70 80 90
Standar 75 0.86 0.156 0.031 0.015 0.0019 0.0014
Standar 80 0.0043 0.002 0.0021 0.0011 0.0011 0.0009
00.10.20.30.40.50.60.70.80.9
11.11.21.3
Ru
nn
ing
Tim
e(s
)
Minimum support (%)
Running Time Data Tahun 2012/2013 & 2013/2014
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
68
Gambar 5. 13 Uji Running Time Min Confidence=90%
2. Data Tahun 2014/2015
Gambar 5. 14 Uji Running Time Min Confidence=60%
50 55 60 70 80 90
Standar 75 0.229 0.0256 0.0091 0.0026 0.0016 0.0014
Standar 80 0.0035 0.0021 0.0018 0.0012 0.0011 0.001
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1.1
1.2
1.3
Ru
nn
ing
Tim
e(s
)
Minimum support(%)
Running Time Data Tahun 2012/2013 & 2013/2014
50 55 60 70 80 90
Standar 75 84.957 84.007 19.904 1.235 0.016 0
Standar 80 0.766 0.125 0.062 0.016 0 0.015
0
10
20
30
40
50
60
70
80
90
Ru
nn
ing
Tim
e(s
)
Minimum support(%)
Data Tahun 2014/2015
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
69
Gambar 5. 15 Uji Running Time Min Confidence=90%
d. Kesimpulan Uji Dataset
Hasil yang didapatkan dengan melakukan pengujian dataset 2012/2013-
2013/2014 dan 2014/2015 menghasilkan jumlah aturan asosiasi yang berbeda.
Pada tahun 2014/2015 jika diamati baik-baik atau dihitung nilai rata-ratanya,
nilai daya serap pada tahun tersebut memang lebih baik karena banyak nilai
yang lebih dari nilai standar daya serap yang ditetapkan saat pengujian
dibandingkan nilai daya serap tahun 2012/2013-2013/2014. Nilai pada tahun
2014/1015 tersebut lebih baik karena bisa juga disebabkan karena adanya
peralihan kurikulum dari KTSP menjadi kurikulum 2013 yang lebih
menekankan kepada keaktifan murid dalam memahami materi. Nilai lift ratio
yang didapatkan pada pengujian dataset mencapai nilai lebih dari 1 yang berarti
dapat diartikan aturan tersebut dapat dikatakan aturan asosiasi tersebut menarik
dan memiliki korelasi antar anteseden dan konsekuen. Sedangkan jika ada
aturan asosiasi yang memiliki nilai lift ratio sama dengan 1 maka dapat
1 2 3 4 5 6
Standar 75 82.34 78.26 18.01 0.645 0.01 0.001
Standar 80 0.448 0.106 0.049 0.004 0.0018 0.0009
0
10
20
30
40
50
60
70
80
90
Ru
nn
ing
Tim
e(s
)
Minimum support(%)
Data Tahun 2014/2015
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
70
diartikan kompetensi-kompetensi tersebut saling independen. Lalu jika nilai lift
ratio kurang dari 1 maka kompetensi-kompetensi tersebut tidak menunjukkan
adanya saling keterkaitan antara anteseden dan konsekuen. Jika dilihat pula dari
pengujian yang dilakukan dengan menggunakan kombinasi antara minimum
support dan minimum confidence maka didapat hasil seperti pada grafik di
gambar 5.12 sampai 5.15. Dari semua pengujian dengan dataset yang berbeda,
hasil running time yang didapatkan selalu menurun ketika minimum support-
nya semakin besar. Nilai running time akan bernilai besar jika minum support-
nya kecil.
e. Evaluasi Pola Asosiasi
Berdasarkan pengujian yang sudah dilakukan pada 2 dataset dapat
diketahui bahwa pada saat minimum support-nya 50% maka dapat dihasilkan
nilai lift ratio yang tinggi. Untuk setiap percobaan ditemukan ada beberapa
aturan asosiasi yang memiliki nilai ratio yang tinggi, jadi bukan hanya ada 1
aturan asosiasi saja. Pada sub bab ini, akan dianalisis kembali aturan-aturan
asosiasi yang memiliki nilai lift ratio tertinggi. Analisis tersebut bertujuan
untuk melihat apakah aturan tersebut menarik jika dianalisa secara obyektif
maupun subyektif. Analisa yang bersifat obyektif dapat dilihat dari nilai lift
ratio, sendangkan analisa yang bersifat subyektif didapatkan dari menanyakan
pendapat kepada seorang praktisi pendidikan yang merupakan guru SMA mata
pelajaran Bahasa Indonesia. Pertanyaan yang diberikan kepada guru SMA
tersebut adalah mengenai apakah aturan asosiasi yang dihasilkan relevan dan
apakah benar jika memahami kompetensi yang menjadi anteseden maka akan
memahami kompetensi yang menjadi konsekuen. Berikut ini adalah aturan
asosiasi yang dipilih berdasarkan nilai lift ratio tertinggi beserta hasil analisa
secara subyektifnya.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
71
1. Data Tahun 2012/2013-2013/2014
Berikut ini adalah aturan asosiasi yang didapatkan ketika nilai minimum
support 50%, minimum confidence 60% dan standar nilai daya serap sebesar
75%. Dari banyaknya aturan asosiasi yang dihasilkan, ditemukan 6 aturan
asosiasi yang memiliki nilai lift ratio tertinggi sebesar 1.57. Keenam aturan
asosiasi tersebut memiliki nilai confidence yang berbeda. Perbedaan nilai
confidence disebabkan oleh nilai support untuk setiap kompetensi yang
menjadi anteseden dan konsekuen pada setiap aturan asosiasinya tidak sama.
Tabel 5. 12 Daftar aturan asosiasi data tahun 2012/2013-2013/2014
Rule
Aturan Confidence
Lift
ratio
Analisa
Subyektif
1 BIND9 BIND17 BIND2 BIND7
BIND16 BIND4 BIND6 90.91% 1.57
Belum
Tentu
2 BIND7 BIND16 BIND2 BIND4
BIND9 BIND17 BIND6 90.91% 1.57 Ya
3 BIND7 BIND16 BIND2 BIND4 BIND6
BIND9 BIND17 90.91% 1.57
Belum
Tentu
4 BIND9 BIND17 BIND7 BIND16
BIND2 BIND4 BIND6 86.42% 1.57
Belum
Tentu
5 BIND9 BIND17 BIND6 BIND7
BIND16 BIND2 BIND4 86.42% 1.57 Ya
6 BIND7 BIND16 BIND4 BIND6
BIND9 BIND17 BIND2 86.42% 1.57 Ya
[Rule 1] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai
standar yang ditentukan pada kompetensi “Menentukan kalimat resensi”,
“Menulis judul sesuai EYD” dan “Melengkapi dialog drama” MAKA sekolah
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
72
tersebut juga memiliki nilai daya serap yang memenuhi standar di kompetensi
“Menentukan isi paragraf: fakta, opini, pernyataan/ jawaban pertanyaan sesuai
isi, tujuan penulis, arti kata/istilah, isi biografi”, “Menentukan unsur-unsur
paragraf, ide pokok, kalimat utama, kalimat penjelas”, “Melengkapi paragraf
dengan kata baku, kata serapan, kata berimbuhan, kata ulang, ungkapan,
peribahasa” dan “Menentukan isi dan simpulan grafik, diagram atau tabel”.
[Rule 2] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai
standar yang ditentukan pada kompetensi “Menentukan isi paragraf: fakta,
opini, pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti
kata/istilah, isi biografi”, “Menentukan unsur-unsur paragraf, ide pokok,
kalimat utama, kalimat penjelas”, “Melengkapi dialog drama” dan
“Melengkapi paragraf dengan kata baku,kata serapan, kata berimbuhan, kata
ulang, ungkapan, peribahasa” MAKA sekolah tersebut juga memiliki nilai daya
serap yang memenuhi standar di kompetensi “Menentukan kalimat resensi”,
“Menulis judul sesuai EYD” dan “Menentukan isi dan simpulan grafik,
diagram atau tabel”.
[Rule 3] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai
standar yang ditentukan pada kompetensi “Menentukan isi paragraf: fakta,
opini, pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti
kata/istilah, isi biografi”, “Menentukan unsur-unsur paragraf, ide pokok,
kalimat utama, kalimat penjelas”, “Melengkapi dialog drama”, “Melengkapi
paragraph dengan kata baku,kata serapan, kata berimbuhan, kata ulang,
ungkapan, peribahasa” dan “Menentukan isi dan simpulan grafik, diagram atau
tabel” MAKA sekolah tersebut juga memiliki nilai daya serap yang memenuhi
standar di kompetensi “Menentukan kalimat resensi” dan “Menulis judul sesuai
EYD".
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
73
[Rule 4] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai
standar yang ditentukan pada kompetensi “Menentukan kalimat resensi”,
“Menulis judul sesuai EYD” MAKA sekolah tersebut juga memiliki nilai daya
serap yang memenuhi standar di kompetensi “Menentukan isi paragraf: fakta,
opini, pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti
kata/istilah, isi biografi”, “Menentukan unsur-unsur paragraf, ide pokok,
kalimat utama, kalimat penjelas”, “Melengkapi dialog drama”, “Melengkapi
paragraph dengan kata baku,kata serapan, kata berimbuhan, kata ulang,
ungkapan, peribahasa” dan “Menentukan isi dan simpulan grafik, diagram atau
tabel”.
[Rule 5] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai
standar yang ditentukan pada kompetensi “Menentukan kalimat resensi”,
“Menulis judul sesuai EYD” dan “Menentukan isi dan simpulan grafik,
diagram atau tabel” MAKA sekolah tersebut juga memiliki nilai daya serap
yang memenuhi standar di kompetensi “Menentukan isi paragraf: fakta, opini,
pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah, isi
biografi”, “Menentukan unsur-unsur paragraf, ide pokok, kalimat utama,
kalimat penjelas”, “Melengkapi dialog drama” dan “Melengkapi paragraf
dengan kata baku,kata serapan, kata berimbuhan, kata ulang, ungkapan,
peribahasa”.
[Rule 6] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai
standar yang ditentukan pada kompetensi “Menentukan isi paragraf: fakta,
opini, pernyataan/ jawaban pertanyaan sesuai isi, tujuan penulis, arti
kata/istilah, isi biografi”, “Menentukan unsur-unsur paragraf, ide pokok,
kalimat utama, kalimat penjelas”, “Melengkapi paragraph dengan kata
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
74
baku,kata serapan, kata berimbuhan, kata ulang, ungkapan, peribahasa” dan
“Menentukan isi dan simpulan grafik, diagram atau tabel” MAKA sekolah
tersebut juga memiliki nilai daya serap yang memenuhi standar di kompetensi
“Menentukan kalimat resensi”, “Menulis judul sesuai EYD” dan “Melengkapi
dialog drama”.
2. Data Tahun 2014/2015
Berikut ini adalah aturan asosiasi yang didapatkan ketika nilai minimum
support 50%, minimum confidence 60% dan standar nilai daya serap sebesar
80%. Dari banyaknya aturan asosiasi yang dihasilkan, ditemukan 8 aturan
asosiasi yang memiliki nilai lift ratio tertinggi sebesar 1.46. Kedelapan aturan
asosiasi tersebut memiliki nilai confidence yang berbeda. Perbedaan nilai
confidence disebabkan oleh nilai support untuk setiap kompetensi yang
menjadi anteseden dan konsekuen pada setiap aturan asosiasinya tidak sama.
Berikut ini adalah tabel yang berisikan 2 aturan asosiasi yang memiliki nilai
confidence tertinggi dari 8 aturan asosiasi yang memiliki nilai lift ratio 1.46:
Tabel 5. 13 Daftar aturan asosiasi data tahun 2014/2015
Rule
Aturan Confidence
Lift
ratio
Analisa
Subyektif
7
BIND7 BIND14 BIND4 BIND17
BIND1 BIND16 BIND20 BIND2
BIND6
91.03% 1.46 Ya
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
75
8
BIND7 BIND14 BIND4 BIND6
BIND17 BIND1 BIND16 BIND20
BIND2
91.03% 1.46 Ya
[Rule 7] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai
standar yang ditentukan pada kompetensi “Menentukan isi paragraf: fakta,
opini, pernyataan/jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah,
isi biografi”, “Menentukan unsur-unsur intrinsik/ ekstrinsik
novel/cerpen/drama” dan “Melengkapi paragraf dg kata baku, kata serapan,
kata berimbuhan, kata ulang, ungkapan, peribahasa” MAKA sekolah tersebut
juga memiliki nilai daya serap yang memenuhi standar di kompetensi “Menulis
karya ilmiah (latar belakang dan rumusan masalah)”, “Melengkapi berbagai
bentuk dan jenis paragraf dengan kalimat yang padu”, “Menulis judul sesuai
EYD”, “Menyunting kalimat dalam surat resmi”, “Melengkapi dialog drama”
dan “Menentukan isi dan simpulan grafik, diagram atau tabel”.
[Rule 8] JIKA suatu sekolah memiliki nilai daya serap yang memenuhi nilai
standar yang ditentukan pada kompetensi “Menentukan isi paragraf: fakta,
opini, pernyataan/jawaban pertanyaan sesuai isi, tujuan penulis, arti kata/istilah,
isi biografi”, “Menentukan unsur-unsur intrinsik/ ekstrinsik
novel/cerpen/drama”, “Melengkapi paragraf dg kata baku, kata serapan, kata
berimbuhan, kata ulang, ungkapan, peribahasa” dan “Menulis judul sesuai
EYD” MAKA sekolah tersebut juga memiliki nilai daya serap yang memenuhi
standar di kompetensi “Menulis karya ilmiah (latar belakang dan rumusan
masalah)”, “Melengkapi berbagai bentuk dan jenis paragraf dengan kalimat
yang padu”, “Menulis judul sesuai EYD”, “Menyunting kalimat dalam surat
resmi” dan “Melengkapi dialog drama”.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
76
Dari percobaan yang dilakukan dengan dataset tahun 2012/2013-2013/2014
dan 2014/2015 dihasilkan banyak sekali aturan asosiasi. Dari kumpulan aturan
asosiasi tersebut tidak semua aturan dapat dimbil sebagai dasar membuat suatu
keputusan. Aturan yang dapat digunakan adalah aturan-aturan yang memiliki
nilai lift ratio dan confidence tinggi (analisa secara obyektif) dan aturan yang
memiliki relevansi dengan kebutuhan (analisa secara subyektif). Analisa secara
subyektif ini dilakukan dengan cara menanyakan pendapat kepada salah
seorang praktisi pendidikan di bidang Bahasa Indonesia. Hasil analisa secara
subyektif ini adalah dapat mengetahui aturan-aturan yang antar kompetensinya
memang benar berkorelasi dan yang belum tentu berkorelasi. Berikut ini adalah
aturan asosiasi yang dinyatakan berkorelasi untuk dataset tahun 2012/2013-
2013/2014:
1. [Rule 2] {BIND7 BIND16 BIND2 BIND4} {BIND9 BIND17 BIND6}
(support = 50%, confidence 90.91%)
3. [Rule 3] {BIND7 BIND16 BIND2 BIND4 BIND6} {BIND9 BIND17}
(support = 50%, confidence 90.91%)
4. [Rule 6] {BIND7 BIND16 BIND4 BIND6} {BIND9 BIND17 BIND2}
(support = 50%, confidence 86.42%)
Ketiga aturan asosiasi diatas, jika dilihat dari nilai standar daya serap, support
dan nilai confidence-nya dapat diartikan bahwa ada 50% sekolah yang
mendapatkan nilai daya serap lebih dari 75% untuk kompetensi-kompetensi
yang menjadi aturan asosiasi. Sebesar 90.91% sekolah yang mendapatkan nilai
daya serap lebih dari 75% di kompetensi-kompetensi yang menjadi anteseden
juga mendapatkan nilai daya serap lebih dari 75% di kompetensi-kompetensi
yang menjadi konsekuen pada rule 2 dan 3. Sedangkan rule 6, sebesar 86.42%
sekolah yang mendapatkan nilai daya serap lebih dari 75% di kompetensi-
kompetensi yang menjadi anteseden juga mendapatkan nilai daya serap lebih
dari 75% di kompetensi-kompetensi yang menjadi konsekuen Di bawah ini
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
77
adalah aturan asosiasi yang dinyatakan berkorelasi untuk dataset tahun
2014/2015:
1. [Rule 7] BIND7 BIND14 BIND4 BIND17 BIND1 BIND16 BIND20
BIND2 BIND6 (support = 57.85%, confidence 91.03%)
2. [Rule 8] BIND7 BIND14 BIND4 BIND6 BIND17 BIND1 BIND16
BIND20 BIND2 (support = 57.85%, confidence 91.03%)
Kedua aturan asosiasi diatas, jika dilihat dari nilai standar daya serap, support
dan nilai confidence-nya dapat diartikan bahwa ada 57.85% sekolah yang
mendapatkan nilai daya serap lebih dari 75% untuk kompetensi-kompetensi
yang menjadi aturan asosiasi. Sebesar 91.03% sekolah yang mendapatkan nilai
daya serap lebih dari 75% di kompetensi-kompetensi yang menjadi anteseden
juga mendapatkan nilai daya serap lebih dari 75% di kompetensi-kompetensi
yang menjadi konsekuen.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
78
BAB VI
PENUTUP 6.1 Kesimpulan
Dari pengujian-pengujian yang dilakukan pada sistem pencarian pola asosiasi
menggunakan algoritma Frequent Pattern Growth (FP-Growth) terhadap data
nilai daya serap Ujian Nasional jurusan IPA dengan mata pelajaran Bahasa
Indonesia ini dapat ditarik kesimpulan sebagai berikut:
1. Algoritma FP-Growth untuk menemukan aturan asosiasi yang menarik dari
data nilai daya serap Ujian Nasional SMA mata pelajaran Bahasa Indonesia
ini telah berhasil diterapkan dengan cara melakukan proses awal
pembersihan data, integrasi data dan seleksi data. Setelah itu dilakukan
transformasi data dengan memasukkan nilai standar daya serap. Proses
selanjutnya adalah melakukan proses data mining dengan menerapkan
algritma FP Growth yang diawali dengan pembangkitan FPTree.
Selanjutnya metode FP Growth diimplementasikan dengan 3 tahap utama
yaitu pembangunan conditional pattern base, conditional fp tree dan
pencarian frequent itemset. Hasil frequent itemset yang dihasilkan
kemudian dikombinasikan untuk dijadikan aturan asosiasi dan dihitung
confidence beserta lift ratio-nya.
2. Sistem yang dibuat dengan melakukan penerapan metode FP-Growth ini
menghasilkan 5 aturan asosiasi yang menarik berdasarkan nilai lift ratio
tertinggi untuk tahun akademik 2012/2013-2013/2014 adalah {BIND7
BIND16 BIND2 BIND4} {BIND9 BIND17 BIND6}, {BIND7 BIND16
BIND2 BIND4 BIND6} {BIND9 BIND17}, {BIND7 BIND16 BIND4
BIND6} {BIND9 BIND17 BIND2}. Sedangkan untuk tahun 2014/2015
aturan asosiasi yang menarik adalah {BIND7 BIND14 BIND4}
{BIND17 BIND1 BIND16 BIND20 BIND2} dan {BIND7 BIND14 BIND4
BIND6} {BIND17 BIND1 BIND16 BIND20 BIND2}. Secara subyektif
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
79
kompetensi-kompetensi dalam aturan-aturan asosiasi tersebut memang
saling berkaitan.
3. Nilai standar minimal daya serap mempengaruhi perhitungan algoritma FP-
Growth karena semakin besar nilai standar ketuntasan yang dimasukkan
maka jumlah aturan asosiasi yang dihasilkan semakin banyak.
6.2 Saran
1. Sistem dapat mengubah hasil aturan asosiasi ke dalam bentuk yang lebih
komunikatif agar semua pengguna dapat mengerti maksud dari aturan
asosiasi yang dihasilkan.
2. Sistem dapat dikembangkan kedalam bentuk sistem berbasis web.
3. Sistem dapat dikembangkan dengan data inputan dari database.
4. Sistem dapat melakukan proses preprocessing.
5. Sistem dapat membaca hasil yang dulu pernah disimpan, sehingga
pengguna langsung dapat melihat hasilnya di dalam sistem.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
80
DAFTAR PUSTAKA
Bloom, Benjamin S. 1971. Taxonomy of Objective : The Clasification Of Educational
Goals. Hanbook 1. Cognitive Domain New York : David McKay Company.Inc
Dahlan, Ahmad. 2014. Pengertian dan Peranan Evaluasi Pembelajaran.
http://www.eurekapendidikan.com diakses taggal 2 Juni 2016
Fayyad,Usama. 1996. Advances in Knowledge Discovery and Data Mining . MIT Press
Han Jiawei, and M. Kamber. 2006. Data Mining: Concepts and Techniques, Morgan
Kaufmann, USA.
Hermawati, Fajar Astuti.2013. Pengolahan Citra Digital Konsep dan Teori, Andi,
Yogyakarta.
Hoffer,J.A., M.B. Prescott, dan F.R McFadden. 2005. Modern Database Management.
New Jersey :Pearson, Prentice Hall.
Kemendikbud, 2015. Kemendikbud Umumkan Tujuh Provinsi Dengan Indeks
Integritas Tertinggi Dalam UN 2015. http://litbang.kemdikbud.go.id diakses
tanggal 12 Desember 2015.
Kemendikbud, Puspendik Balibang. 2015. Buku Panduan Pemanfaatan PAMER UN-
2015. Jakarta.
Octaviani, Anmetatika Angelia.2010. ”Analisis Perbandingan Algoritma FP-Growth
Dan Algoritma Apriori pada Market Basket Analysis”. Universitas Telkom,
Bandung
Pramudiono, Ika. 2006. Model Pencarian pada Mesin Pencari. Bandung
Rickyanto, Isak. 2003. Membuat Aplikasi Windows dengan Visual Basic.NET, Elek
Media Komputindo, Jakarta.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
81
Samuel, David. 2008. Penerapan Stuktur FPTree dan Algoritma FPGrowth dalam
Optimasi Penentuan Frequent Itemset”. Institut Teknologi Bandung, Bandung
Santosa, Budi. 2007. “Data Mining Teknik Pemanfaatan Data untuk Keperluan
Bisnis”, Graha Ilmu, Yogyakarta
Stufflebeam, L.D. & Shrinkfiel,J. (1985). Systematic evaluation : A self-instructional
guide to theory and practice. New York : Kluwer Nijhoff Pulishing.
Turban,Efraim., Ramesh Sharda, Dursun Delen. 2005. Decision Support System and
Intelligent System (Sistem Pendukung Keputusan dan Sistem Cerdas), Andi,
Yogyakarta
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
82
LAMPIRAN
Lampiran 1: Diagram Aktivitas
Diagram Aktivitas 001
Memilih Data
Ph
ase
USER SISTEM
Menekan tombol "Pilih File"
Memilih file yang akan digunakan
Menampilkan kotak dialog file chooser
Apakah file bertipe .csv atau .xls?
Menampilkan kotak dialog bertulis" Maaf, Sistem Hanya Menerima File
Bertipe .xls dan .csv"
Menampilkan data pada table
Gambar 1 Diagram Aktivitas 001
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
83
Diagram Aktivitas 002
Mencari Aturan Asosiasi
Ph
ase
USER SISTEM
Mengisikan nilai minimum support dan minimum confidence
Menekan tombol "Proses"Menjalankan algoritma FP Growth
dan menampilkan hasil rules dihasilkan
Gambar 2 Diagram Aktivitas 002
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
84
Diagram Aktivitas 003
Menyimpan Hasil
Ph
ase
USER SISTEM
Menekan tombol "Simpan Hasil"
Memilih lokasi dan tipe file untuk meyimpan hasil
Menampilkan kotak save dialog
File berhasil disimpan di direktori komputer
Gambar 3 Diagram Aktivitas 003
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
85
Lampiran 2 : Diagram Kelas Analisis
view_home view_preprocessing
view_asosiasi
control_algorithm
model_combination
TreeNode
comparatorHeaderTable
control_atributSelection model_atributSelection
view_about
view_help
Gambar 4 Diagram Kelas Analisis
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
86
Lampiran 3:Diagram Sequence
1. Memilih Data
USER
<<Interface>>view_home.java
2. Menampilkan view_preprocessing.java
1. Klik "Masuk Sistem"
<<Interface>>view_preprocessing.java
3. Klik tombol Pilih File
4. Menampilkankotak dialog file chooser
5. Memilih file bertipe .xls atau .csv
6. bt_chFileActionPerformed
(java.awt.event.ActionEvent evt)
<<control>>control_atributSelection.java
7. new control_atributSelection()
<<model>>model_atributSelection.java
8. setAtribut(dft.getColumnName(i)) , setPilih(false)
9. addRow(i, asModel)
11. Menampilkan data
di table tb_fileInput
Gambar 5 Diagram Sequence Memilih Data
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
87
2. Mencari Aturan Asosiasi
USER
<<Interface>>view_asosiasi.java
1. Isikan minimum support dan minimum
confidence
<<control>>control_algorithm.java
<<model>>comparitorHeaderTable.
java
2. Tekan tombol "Proses"
6. bt_processActionPerformed
(java.awt.event.ActionEvent evt)
7. FPTree()
10. new comparitorHeaderTable()
8. InsertNode()
<<model>>TreeNode.
java
9. new TreeNode()
11. FPgrowth(ArrayList<LinkedList
<String>>, double,int, double)
12. FPgrowth(TreeNode, String, double, ArrayList<TreeNode>,
Map<String, Integer>),
conditional_fptree_constructor()
13. new comparitorHeaderTable()
14. new model_combination(itemChange)
<<model>>model_combination.java
15.Menampilkan rule yang dihasilkan
Gambar 6 Diagram Sequence Mencari Aturan Asosiasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
88
3. Menyimpan Hasil
USER
<<Interface>>view_asosiasi.java
1. Menekan tombol "Simpan Hasil"
2.Menampilkan save dialog
3. Memilih lokasi penyimpanan,
tipe file dan mengisikan nama file
4. Menekan tombol Save
5. bt_saveActionPerformed
(java.awt.event.ActionEvent evt)
6. File berhasil disimpan di direktori
komputer
Gambar 7 Diagram Sequence Menyimpan Hasil
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
89
Lampiran 4: Diagram Kelas Desain
Berikut ini adalah detail kelas yang berisi atribut dan method-method yang dipakai dalam
pembuatan perangkat lunak :
1. Kelas control_algorithm
control_algorithm
-frequentPatterns : Map<String,Integer>-headerTable : ArrayList<TreeNode>-treeNode : TreeNode-treenode : TreeNode
-FPGrowth() : ArrayList<ArayList<String>>-FPTree() : void-FPgrowth() : void-conditional_fptree_constructor() : TreeNode-insert() : void-insertNode() : void
2. Kelas control_atributSelection
control_atributSelection
-atribut : List<model_atributSelection>-atributSelection : model_atributSelection-column : String[]
+control_atributSelection<<constructor>>+Delete_Atribut() : void+addRow(int,model_atributSelection) : void+getColumnClass(int) : Class+getColumnCount() : int+getColumnName() : String+getRowCount() : int+getValueAt() : Object+isCellEditable() : boolean+setValueAt() : void
3. Kelas Koneksi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
90
Koneksi
-connect : Connection-database : String-driverName : String-host : String-jdbc : String-password : String-port : String-url : String-username : String
+getConnect() : Connection+getKoneksi() : Connection+setConnect() : void
4. Kelas TreeNode
TreeNode
-child : List<TreeNode>-counts : int-name : String-next : TreeNode-parent : TreeNode-root : boolean
+TreeNode() <<constructor>>+TreeNode(int,String,TreeNode) <<constructor>>+TreeNode(int, String) <<constructor>>+TreeNode(String) <<constructor>>+addCount() : void+getChild() : List<TreeNode>+getCounts() : int+getName() : String+getNext() : TreeNode+getParent() : TreeNode+isRoot() : boolean+setChild() : void+setCounts() : void+setName() : void+setNext() : void+setParent() : void+setRoot() : void
5. Kelas comparitorHeaderTable
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
91
comparitorHeaderTable
+comparitorHeaderTable <<constructor>>+compare() : int
6. Kelas model_atributSelection
model_atributSelection
-atribut : String-pilih : boolean
+model_atributSelection(String,boolean) <<constructor>>+model_atributSelection()<<constructor>>+getAtribut() : String+getPilih() : boolean+setAtribut() : void+setPilih() : void
7. Kelas model_combination
model_combination
-antecedent : ArrayList-consequent : ArrayList-inputString : String-output : StringBuilder
+model_combination()<<constructor>>+Combine() : void+CountConfAndLift() : ArrayList<String>
8. Kelas model_competence
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
92
model_competence
+model_competence(String, String) <<constructor>>+model_competence(String) <<constructor>>+model_competence(Connection) <<constructor>>+model_competence()+addCompetence() : void+getCompetenceName() : String+getCon() : Connection+getIdCompetence : String+getKoneksiBaru() : model_competence+getSubject() : String+setCompetenceName() : void+setCon() : void+setIdCompetence() : void+setSubject() : void
9. Kelas view_preprocessing
view_preprocessing
-array1 : Arraylist<LinkedList<String>>-array2: LinkedList <String>-asControl : control_atributSelection-asModel : model_atributSelection-map: HashMap<String,Integer>
+view_preprocessing() <<constructor>>-bt_aboutActionPerfomed()-bt_cancelActionPerfomed()-bt_chFileActionPerfomed()-bt_convertActionPerfomed()-bt_delAtributActionPerfomed()-bt_helpActionPerfomed()-bt_homeActionPerfomed()-bt_markAllActionPerfomed()-bt_submitActionPerfomed()+initComponents()
10. Kelas view_home
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
93
view_home
+view_home() <<constructo>>-bt_aboutActionPerfomed()-bt_helpActionPerfomed()-bt_systemActionPerfomed()+initComponents()
20.Kelas view_help
view_help
-memberName
+view_help()<<constructor>>-bt_aboutActionPerfomed()-bt_homeActionPerfomed()+initComponents(
11. Kelas view_asosiasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
94
view_asosiasi
-arrayBaru : ArraList<LinkList<String>>-arayData : ArrayList<Linklist<String>>-con : control_algorithm -mapdata : HashMap<String,Integer>-minConfidence : double-minSupport : double-newArray : ArrayList<TrreNode>-sortedItemsbyFrequencies: ArrayList<TreeNode>-totalData : String-totalItem : int-totalTransaction :int-transactionFile : String
+view_asosiasi()<<constructor>>+BubbleSortODesc() : void+BubleSortODescArayList() : void+RemovbleNoFequentItem() : void-bt_aboutActionPerfomed() : void-bt_helpActionPerfomed() : void-bt_homeActionPerfomed() : void-bt_processActionPerfomed() : void-bt_saveActionPerfomed() : void+initComponents() : void+setTableAsosiasi() : void
12. Kelas view_about
view_about
+view_about()-bt_helpActionPerfomed()-bt_homeActionPerfomed()+initComponents()
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
95
Lampiran 5: Penghitungan Manual
Berikut adalah proses perhitungan manual yang akan dilakukan.
1. Hal pertama yang dilakukan pada tahap ini adalah menentukan standart nilai daya
serap yang dianggap baik. Untuk contoh, penulis menggunakan standar nilai 76
dengan data 10 sekolah saja.
Gambar 8 Tabel Data Setelah Preprocessing
1. Setelah didapatkan tabel data seperti diatas maka langkah selanjutnya adalah
menghitung frequent itemset tiap sekolah.
Tabel 1 Daftar Jumlah Tiap Item Pada Transaksi
Kompetensi Frequent
BIND1 5
BIND2 8
BIND3 7
BIND4 8
BIND5 0
BIND6 9
BIND7 6
BIND8 2
BIND9 5
BIND10 4
BIND11 0
BIND12 5
BIND13 3
BIND14 3
BIND15 4
BIND16 7
BIND17 7
BIND18 5
BIND19 0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
96
2. Setelah itu tetapkan nilai minimum support dan minimum confidence terlebih dulu.
Penulis menggunakan nilai minimum support 70% atau sama dengan 7 dan
minimum confidence 80%.
Tabel 2 frequent itemset
Kompetensi Frequent
BIND17 7
BIND16 7
BIND3 7
BIND4 8
BIND2 8
BIND6 9
3. Setelah ditemukan kompetensi-kompetensi yang sering muncul dan jumlahnya
sesuai dengan minimum support, selanjutnya akan diurutkan berdasarkan
kompetensi yang paling sering muncul karena akan digunakan untuk menentukan
prioritas. Tabel Prioritas ini selanjutkan akan digunakan untuk tahap-tahap
selanjutnya dan digunakan sebagai header table.
Tabel 3 Prioritas
Kompetensi Frequent Prioritas
BIND17 7 6
BIND16 7 5
BIND3 7 4
BIND4 8 3
BIND2 8 2
BIND6 9 1
4. Berdasarkan prioritas yang sudah ada maka data yang ada diurutkan kembali
berdasarkan prioritas yang sudah ditetapkan.
Tabel 4 Data Setelah Item-nya Diurutkan
Id Sekolah Kompetensi
01-010 BIND6,BIND16
01-011 BIND6,BIND2,BIND4
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
97
01-012 BIND6,BIND2,BIND4,BIND3,BIND16,BIND17
01-015 BIND6,BIND2,BIND4,BIND3,BIND16,BIND17
01-017 BIND6,BIND2,BIND4,BIND3,BIND16,BIND17
01-018 BIND6,BIND2,BIND4,BIND3,BIND16,BIND17
01-019 BIND4,BIND3
01-020 BIND6,BIND2,BIND17
01-021 BIND6,BIND2,BIND4,BIND3,BIND16,BIND17
01-022 BIND6,BIND2,BIND4,BIND3,BIND16,BIND17
5. Setelah data sudah diurutkan berdasarkan prioritas dan memenuhi minimum
support yang ditentukan, langkah selanjutnya adalah membuat struktur pohon fp
tree untuk setiap baris data. Berikut adalah struktur pohon dari semua data yang
ada.
Gambar 9 Struktur FP Tree
6. Setelah pohon fp tree terbentuk, langkah selanjutnya adalah menghitung
conditional pattern base dan conditional fp tree. Pencarian conditional pattern base
dan conditional fp tree didapat dari sub tree berdasarkan item yang memiliki count
paling kecil.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
98
7. Item pertama yang memiliki count paling kecil berdasarkan urutan prioritas adalah
BIND17 dengan nilai count 7. Setelah itu maka akan dibuat subtree yang
berakhiran node BIND17. Dari subtree tersebut dapat ditemukan conditional
pattern base, conditional fp-tree dan frequent itemsetnya. Item BIND17 ini
memiliki 2 pattern base yakni {BIND6, BIND2:1} dan {BIND6, BIND2, BIND4,
BIND3, BIND16:6}. Dari pattern base tersebut dapat ditemukan conditional fp-
tree-nya yaitu BIND6:7 dan BIND2:7. Selanjutnya untuk mendapatkan frequent
itemset maka dilakukanlah pengkombinasian dari item yang akan dibuat
conditional fp tree nya selama count dari item tersebut memenuhi minimum
support.
Gambar 10 Sub-Database BIND17
Tabel 5 Daftar Frequent Itemset BIND17
Conditional Pattern Base Conditional
FP Tree Frequent Itemset
{BIND6, BIND2:1}
{BIND6, BIND2, BIND4,
BIND3, BIND16:6}
{BIND6:7
,BIND2:7}
BIND17: 7
BIND6 BIND17: 7
BIND2 BIND17:7
BIND17 BIND2 BIND6:7
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
99
8. Item kedua yang memiliki count paling kecil berdasarkan urutan prioritas adalah
BIND16 dengan nilai count 7. Setelah itu maka akan dibuat subtree yang
berakhiran node BIND16. Dari subtree tersebut dapat ditemukan conditional
pattern base, conditional fp-tree dan frequent itemsetnya. Item BIND16 ini
memiliki 2 pattern base yakni {BIND6:1} dan {BIND6, BIND2, BIND4, BIND3,
BIND16 :6}. Dari pattern base tersebut dapat ditemukan conditional fp-treenya
yaitu BIND6 dengan count 7.
Gambar 11 Sub-Database BIND16
Tabel 6 Daftar Frequent Itemset BIND16
Conditional Pattern Base Conditional
FP Tree Frequent Itemset
{BIND6:1}
{BIND6, BIND2, BIND4,
BIND3, BIND16 :6}
{BIND6:7} BIND16:7
BIND6 BIND16: 7
9. Item ketiga yang memiliki count paling kecil berdasarkan urutan prioritas adalah
BIND3 dengan nilai count 7. Setelah itu maka akan dibuat subtree yang berakhiran
node BIND3. Dari subtree tersebut dapat ditemukan conditional pattern base,
conditional fp-tree dan frequent itemsetnya. Item BIND3 ini memiliki 2 pattern
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
100
base yakni {BIND6:1, BIND2:6, BIND4:6} dan{BIND4:1}. Dari pattern base
tersebut dapat ditemukan conditional fp-treenya yaitu BIND4 dengan count 7.
Gambar 12 Sub-Database BIND3
Tabel 7 Daftar Frequent Itemset BIND3
Conditional Pattern Base Conditional
FP Tree Frequent Itemset
{BIND6:1, BIND2:6,
BIND4:6}
{BIND4:1}
{BIND4:7} BIND3:7,
BIND3 BIND4 : 7
10. Item keempat yang memiliki count paling kecil berdasarkan urutan prioritas adalah
BIND4 dengan nilai count 8. Setelah itu maka akan dibuat subtree yang berakhiran
node BIND4. Dari subtree tersebut dapat ditemukan conditional pattern base,
conditional fp-tree dan frequent itemsetnya. Item BIND4 ini memiliki 1 pattern
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
101
base yakni {BIND6:7, BIND2:7}. Dari pattern base tersebut dapat ditemukan
conditional fp-treenya yaitu BIND6 dengan count 7 dan BIND2 dengan count 7.
Gambar 13 Sub-Database BIND4
Tabel 8 Daftar Frequent Itemset BIND4
Conditional Pattern
Base
Conditional FP
Tree Frequent Itemset
{BIND6:7,
BIND2:7}
{BIND6:7,
BIND2:7}
BIND4:8
BIND4 BIND2 :7
BIND4 BIND2
BIND6:7
BIND4 BIND6 :7
11. Item kelima yang memiliki count paling kecil berdasarkan urutan prioritas adalah
BIND2 dengan nilai count 8. Setelah itu maka akan dibuat subtree yang berakhiran
node BIND2. Dari subtree tersebut dapat ditemukan conditional pattern base,
conditional fp-tree dan frequent itemsetnya. Item BIND2 ini memiliki 1 pattern
base yakni {BIND6:8}. Dari pattern base tersebut dapat ditemukan conditional fp-
treenya yaitu BIND6 dengan count.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
102
Gambar 14 Sub-Database BIND2
Tabel 9 Daftar Frequent Itemset BIND2
Conditional Pattern
Base
Conditional FP
Tree Frequent Itemset
{BIND6:8} {BIND6:8} BIND2:8
BIND2,BIND6 :8
12. Item terakhir berdasarkan urutan prioritas adalah BIND6 dengan nilai count 9.
Setelah itu maka akan dibuat subtree yang berakhiran node BIND9. Dari subtree
tersebut dapat ditemukan conditional pattern base, conditional fp-tree dan frequent
itemsetnya. Item BIND6 ini tidak memiliki pattern base dan conditional fp-tree.
Gambar 15 -Database BIND6
Tabel 10 Daftar Frequent Itemset BIND6
Conditional Pattern
Base Conditional FP Tree Frequent Itemset
- - BIND6:9
13. Berikut ini adalah daftar frequent itemset yang didapatkan. Untuk pembuatan
aturan asosiasi yang dipakai adalah frequent itemset dengan jumlah item terbanyak.
Item Frequent Itemset
BIND17 BIND17: 7, BIND6 BIND17: 7, BIND2 BIND17:7,
BIND17 BIND2 BIND6:7
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
103
BIND16 BIND16:7, BIND6 BIND16: 7
BIND3 BIND3:7, BIND3 BIND4: 7
BIND4 BIND4:8, BIND4 BIND2 :7, BIND4 BIND2 BIND6:7,
BIND4 BIND6 :7
BIND2 BIND2:8, BIND2 BIND6 :8
BIND6 BIND6:9
14. Berikut ini adalah frequent itemset yang digunakan untuk dikombinasikan
{BIND17 BIND2 BIND6:7}, {BIND4 BIND2 BIND6:7}. Dua frequent itemset ini
tetap harus dalam urutan yang benar berdasarkan jumlah count pada tiap item.
Urutannya akan menjadi seperti berikut {BIND6 BIND2 BIND17 : 7} dan {BIND6
BIND2 BIND4 : 7}. Salah satu contoh menghitung confidence dan lift ratio untuk
aturan asosiasi yang pertama adalah sebagai berikut. Confidence dapat dihitung
dari support {BIND 6 BIND2 BIND17}=7 dibagi dengan support dari {BIND6}=9
yang menjadi antecedent adalah 0.77. Ketika nilai confidence tersebut dikalikan
dengan 100% maka akan menjadi 77%. Sedangkan nilai lift ratio dapat dihitung
dari nilai confidence dibagi nilai expected confidence yang didapat dari support
{BIND2 BIND17}=7 sebagai item konsekuen dibagi jumlah transaksi sebanyak
10, maka nilai expected confidence-nya sebesar 0.7. Setelah itu nilai lift ratio dapat
dihitung dari 0.77/0.7, sehingga didapat nilai 1.1
Tabel 2 Tabel Aturan Asosiasi
Aturan Asosiasi Confidence Lift Ratio
BIND6 BIND2 BIND17 77% 1.1
BIND6 BIND2 BIND17 87% 1.24
BIND6 BIND17 BIND2 100% 1.25
BIND2 BIND6 BIND17 87% 1.24
BIND2 BIND17 BIND6 100% 1.11
BIND17 BIND6 BIND2 100% 1.25
BIND6 BIND2 BIND4 77% 1.1
BIND6 BIND2 BIND4 87% 1.08
BIND6 BIND4 BIND2 100% 1.25
BIND2 BIND6 BIND4 87% 1.24
BIND2 BIND4 BIND6 100% 1.11
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
104
BIND4 BIND6 BIND2 87% 1.08
Setelah didapatkan aturan asosiasi beserta confidence dan lift ratio nya, aturan
asosiasi yang digunakan adalah yang memiliki nilai lift ratio tertinggi. Aturan
asosiasi tersebut adalah BIND6 BIND17 BIND2, BIND17 BIND6 BIND2 dan
BIND6 BIND4 BIND2 dengan nilai lift ratio 1.25
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
105
Lampiran 6 : Data
Berikut ini adalah contoh data nilai daya serap tahun akademik 2014/2015.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Top Related