ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER...

194
ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER DENGAN SELEKSI FITUR CHI-SQUARE DAN CONFIX STRIPPING STEMMER PADA SISTEM KLASIFIKASI TERJEMAHAN HADITS SKRIPSI Oleh: Nichyta Dian Ramadhani 11150910000009 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 2019 M / 1441 H

Transcript of ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER...

Page 1: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

ANALISIS KINERJA ALGORITMA NAÏVE BAYES

CLASSIFIER DENGAN SELEKSI FITUR CHI-SQUARE DAN

CONFIX STRIPPING STEMMER PADA SISTEM

KLASIFIKASI TERJEMAHAN HADITS

SKRIPSI

Oleh:

Nichyta Dian Ramadhani

11150910000009

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

JAKARTA

2019 M / 1441 H

Page 2: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

ANALISIS KINERJA ALGORITMA NAÏVE BAYES

CLASSIFIER DENGAN SELEKSI FITUR CHI-SQUARE DAN

CONFIX STRIPPING STEMMER PADA SISTEM

KLASIFIKASI TERJEMAHAN HADITS

Skripsi

Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar Sarjana Komputer

(S.Kom)

Oleh:

Nichyta Dian Ramadhani

11150910000009

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

JAKARTA

2019 M / 1441 H

Page 3: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith
Page 4: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith
Page 5: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith
Page 6: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith
Page 7: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

v

KATA PENGANTAR

Segala puji bagi Allah, Rabb semesta alam. Shalawat dan salam kepada

Nabi kita Muhammad, keluarga, sahabatnya, serta orang-orang yang mengikuti

mereka hingga akhir zaman.

Penyusunan skripsi ini adalah salah satu syarat untuk memperoleh gelar

Sarjana Komputer (S.Kom) pada program studi Teknik Informatika, Fakultas Sains

dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah Jakarta. Adapun

bahan penulisan skripsi ini adalah berdasarkan hasil penelitian, pengembangan

aplikasi, dan beberapa sumber literatur.

Dalam penyusunan skripsi ini, telah banyak bimbingan dan bantuan yang

didapatkan dari berbagai pihak sehingga skripsi ini dapat berjalan dengan lancar.

Oleh karena itu, penulis ingin mengucapkan banyak terima kasih kepada :

1. Ibu Prof Dr. Lily Surayya Eka Putri M.Env.Stud, selaku Dekan Fakultas

Sains dan Teknologi, Universitas Islam Negeri Syarif Hidayatullah Jakarta.

2. Bapak Imam Marzuki Shofi, M.T. selaku Ketua Program Studi Teknik

Informatika.

3. Ibu Siti Ummi Masruroh, M.Sc. dan Ibu Luh Kesuma Wardhani, S.T., M.T.

selaku Dosen Pembimbing I dan II yang senantiasa meluangkan waktu dan

memberikan bimbingan, bantuan, semangat dan motivasi dalam

menyelesaikan skripsi ini.

4. Seluruh Dosen dan Staff UIN Jakarta, khususnya Fakultas Sains dan

Teknologi yang telah memberikan ilmu dan pengalaman yang berharga.

5. Kedua Orang Tua tercinta, yaitu Bapak Paimin, dan Ibu Jeny Herawati yang

selalu menyayangi, mendidik, mendo’akan, serta memberikan dukungan

baik moril dan materil kepada penulis, terima kasih ibu dan ayah, semoga

Allah selalu melindungi dan menyayangi

Page 8: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith
Page 9: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

vii

Nama : Nichyta Dian Ramadhani (11150910000009)

Program Studi : Teknik Informatika

Judul : Analisis Kinerja Algoritma Naïve Bayes Classifier Dengan Seleksi

Fitur Chi-Square Dan Confix Stripping Stemmer Pada Sistem

Klasifikasi Terjemahan Hadits

ABSTRAK

Salah satu pemanfaatan teknologi untuk mengolah data berupa teks adalah metode

text mining dan klasifikasi merupakan salah satu teknik dalam text mining. Salah

satu algoritma klasifikasi text mining adalah Naïve Bayes Classifier. Pada penelitian

ini, peneliti melakukan simulasi kombinasi algoritma Naïve Bayes Classifier

dengan Confix Stripping Stemmer untuk stemming, dan Chi-Square sebagai

algoritma seleksi fitur untuk mengklasifikasi terjemahan hadits Shahih Bukhari

kedalam tiga kelas yaitu anjuran, larangan, dan informasi dengan jumlah data 300

data training, dan 30 data testing. Pengujian kinerja sistem menggunakan confusion

matrix dengan menghitung nilai akurasi, presisi, recall, dan f-measure. Hasil

pengujian menunjukkan bahwa skenario yang memiliki performa terbaik adalah

kombinasi Algoritma Naïve Bayes Classifier dan Confix Stripping Stemmer dengan

nilai akurasi, presisi, recall, dan f-measure berturut-turut sebesar 84,44%, 80,19%,

76,67% dan 76,21%.

Kata Kunci : Klasifikasi, Text Mining, Naïve Bayes Classifier,

Confix Stripping Stemmer, Chi-Square

Daftar Pustaka : 5 Buku, 27 Jurnal

Jumlah Halaman : VI Bab + xv halaman + 179 halaman

Page 10: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

viii

Name : Nichyta Dian Ramadhani (11150910000009)

Study Program : Informatics Engineering

Title : Implementation of Naïve Bayes Classifier Algorithm with

Chi-Square Feature Selection and Confix Stripping

Stemmer in Hadith Translation Classification System

ABSTRACT

One of the use of technology to process data text is the method of text mining and

classification is one of the techniques in text mining. One of the text mining

classification algorithms is Naïve Bayes Classifier. In this research, Naïve Bayes

Classifier algorithms was combined with Confix Stripping Stemmer for stemmed,

and Chi-Square as a feature selection algorithm to classified the translation of Sahih

Bukhari's hadith into three classes, namely suggestions, prohibitions, and

information with a total data of 300 trained data, and 30 tested data. System

performance tested used confusion matrix by calculated the value of accuracy,

precision, recall, and f-measure. The test results showed that the scenarios that had

the best performance was a combination of Naïve Bayes Classifier and Confix

Stripping Stemmer Algorithm with accuracy, precision, recall, and f-measure

respectively 84.44%, 80.19%, 76.67% and 76.21%.

Keyword : Classification, Text Mining, Naïve Bayes

Classifier, Confix Stripping Stemmer, Chi-Square

Bibliography : 5 Books, 27 Journals

Number of Pages : VI Chapters + xv pages + 179 pages

Page 11: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

ix

ix

DAFTAR ISI

LEMBAR PERSETUJUAN .................................................................................... i

HALAMAN PENGESAHAN UJIAN .................................................................... ii

HALAMAN PERNYATAAN ORISINALITAS ................................................... iii

KATA PENGANTAR ............................................................................................. v

ABSTRAK ............................................................................................................ vii

ABSTRACT ......................................................................................................... viii

DAFTAR ISI .......................................................................................................... ix

DAFTAR GAMBAR ........................................................................................... xiii

DAFTAR TABEL .................................................................................................. xv

BAB I PENDAHULUAN ....................................................................................... 1

1.1 Latar Belakang .................................................................................................. 1

1.2 Tujuan Penelitian .............................................................................................. 4

1.3 Manfaat Penelitian ............................................................................................ 5

1.3.1 Bagi Pengguna ...................................................................................... 5

1.3.2 Bagi Mahasiswa .................................................................................... 5

1.3.3 Bagi Universitas .................................................................................... 5

1.4 Rumusan Masalah ............................................................................................. 5

1.5 Batasan Masalah ............................................................................................... 6

1.6 Metodologi Penelitian ....................................................................................... 7

1.6.1. Metode Pengumpulan Data ................................................................... 7

1.6.2. Metodologi Pengembangan Sistem ....................................................... 7

1.7 Sistematika Penulisan ....................................................................................... 7

BAB II LANDASAN TEORI ................................................................................. 9

2.1 Klasifikasi ......................................................................................................... 9

Page 12: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

x

x

2.1.1 Algoritma Klasifikasi .................................................................................... 10

2.2 Text Mining ..................................................................................................... 11

2.2.1 Text Preprocessing ........................................................................................ 13

2.2.2 Text Transformation ...................................................................................... 13

2.2.3 Pattern Discovery.......................................................................................... 13

2.3 Naïve Bayes Classifier (NBC) ........................................................................ 14

2.4 Confix Stripping Stemmer ............................................................................... 15

2.5 Seleksi Fitur (Feature Selection) .................................................................... 19

2.6.1 Chi-Square (x2) ...................................................................................... 19

2.6 Studi Pustaka .................................................................................................. 20

2.7 Metode Simulasi ............................................................................................. 20

2.8 Confusion Matrix ............................................................................................ 22

2.9 PHP ................................................................................................................. 24

2.10 XAMPP .......................................................................................................... 24

2.11 MySQL ........................................................................................................... 25

2.14 Studi Literatur Sejenis .................................................................................... 26

BAB III METODOLOGI PENELITIAN ............................................................. 30

3.1 Metode Pengumpulan Data ........................................................................... 30

3.1.1. Studi Pustaka ....................................................................................... 30

3.1.2. Pengumpulan Data .............................................................................. 30

3.2 Metode Simulasi ........................................................................................... 31

3.2.1 Formulasi Masalah (Problem Formulation) .......................................... 31

3.2.2 Model Pengkonsepan (Conseptual Model) ............................................ 31

3.2.3 Data Masukan/Keluaran (Input/Output Data)..................................... 32

3.2.4 Pemodelan (Modelling) .......................................................................... 32

3.2.5 Simulasi (Simulation) ............................................................................. 32

3.2.6 Verifikasi dan Validasi (Verification and Validation) ........................... 33

Page 13: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

xi

xi

3.2.7 Eksperimentasi (Experimentation) ......................................................... 33

3.2.8 Analisis keluaran (Output Analysis) ....................................................... 33

3.3 Metode Pengujian ......................................................................................... 33

3.4 Kerangka Berpikir ......................................................................................... 35

BAB IV IMPLEMENTASI SIMULASI DAN EKSPERIMEN ........................... 36

4.1 Formulasi Masalah (Problem Formulation) ................................................... 36

4.2 Model Pengkonsepan (Conceptual Model) .................................................... 36

4.2.1 Model pengkonsepan text mining ........................................................ 37

4.2.2 Model pengkonsepan tahap training dan testing ................................ 39

4.2.3 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier (NBC)

tanpa stemming dan tanpa seleksi fitur ................................................ 44

4.2.4 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier (NBC)

dengan Chi-Square dan tanpa stemming ............................................. 46

4.2.5 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier (NBC)

dengan Confix Stripping Stemmer dan tanpa seleksi fitur .................. 48

4.2.6 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier (NBC)

dengan Confix Stripping Stemmer dan Chi-Square ............................ 50

4.3 Data Masukan/Keluaran (Input/Output Data) ................................................ 51

4.3.1 Data Masukan (Input) ......................................................................... 51

4.3.2 Data Keluaran (Output) ....................................................................... 52

4.4 Pemodelan (Modelling) .................................................................................. 52

4.4.1 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) tanpa

stemming dan tanpa seleksi fitur) ........................................................ 52

4.4.2 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) dengan

Chi-Square dan tanpa stemming .......................................................... 62

4.4.3 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) dengan

Confix Stripping Stemmer dan tanpa seleksi fitur ............................... 74

4.4.4 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) dengan

Confix Stripping Stemmer dan Chi-Square ........................................ 86

4.5 Simulasi (Simulation) ................................................................................... 100

4.5.1 Pembangunan Server ......................................................................... 101

4.5.2 Flowchart Simulasi ............................................................................ 101

Page 14: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

xii

xii

4.6 Verifikasi dan Validasi (Verification and Validation ) ................................ 107

4.7 Eksperimentasi (Experimentation) ............................................................... 107

4.8 Analisis Keluaran (Output Analysis) ............................................................ 107

BAB V HASIL DAN PEMBAHASAN .............................................................. 108

5.1 Verifikasi dan Validasi (Verification and Validation) ................................. 108

5.2 Eksperimentasi (Experimentation) ............................................................... 109

5.3 Analisis Keluaran (Output Analysis) ............................................................ 109

5.3.1 Skenario 1 ............................................................................................. 110

5.3.2 Skenario 2 ............................................................................................. 116

5.3.3 Skenario 3 ............................................................................................. 139

5.3.4 Skenario 4 ............................................................................................. 145

5.3.5 Analisis Perbandingan Hasil Seluruh Pengujian .................................. 169

BAB VI PENUTUP ............................................................................................ 173

6.1 Kesimpulan ................................................................................................... 173

6.2 Saran ............................................................................................................. 173

DAFTAR PUSTAKA .......................................................................................... 174

Page 15: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

xiii

DAFTAR GAMBAR

Gambar 3.1 Kerangka Berpikir ............................................................................. 35

Gambar 4.1 Flowchart Preprocessing .................................................................. 37

Gambar 4.2 Flowchart Transforming ................................................................... 38

Gambar 4.4 Flowchart Training ........................................................................... 40

Gambar 4.5 Flowchart Testing ............................................................................. 42

Gambar 4.6 Flowchart Skenario 1 ........................................................................ 44

Gambar 4.7 Flowchart Naïve Bayes Classifier ..................................................... 45

Gambar 4.8 Flowchart Skenario 2 ........................................................................ 46

Gambar 4.9 Flowchart Chi-Square ....................................................................... 47

Gambar 4.10 Flowchart Skenario 3 ...................................................................... 48

Gambar 4.11 Flowchart Skenario 4 ...................................................................... 50

Gambar 4.0.12 Flowchart Simulasi .................................................................... 101

Gambar 5.1 Hasil Confusion Matrix Skenario 1 ................................................. 115

Gambar 5.2 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,05 ..................... 121

Gambar 5.3 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,005 ................... 127

Gambar 5.4 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,01 ..................... 133

Gambar 5.5 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,001 ................... 139

Gambar 5.6 Hasil Confusion Matrix Skenario 3 ................................................. 145

Gambar 5.7 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,05 ..................... 151

Gambar 5.8 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,005 ................... 157

Page 16: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

xiv

Gambar 5.9 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,01 ..................... 163

Gambar 5.10 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,001 ................. 169

Gambar 5.11 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,05), 3

dan 4 (taraf nyata 0,05) ................................................................. 170

Gambar 5.12 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,005),

3 dan 4 (taraf nyata 0,005) ............................................................ 170

Gambar 5.13 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,01), 3

dan 4 (taraf nyata 0,01) ................................................................. 170

Gambar 5.14 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,001),

3 dan 4 (taraf nyata 0,001) ............................................................ 171

Page 17: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

xv

DAFTAR TABEL

Tabel 2.1 Perbandingan Algoritma Klasifikasi Teks ........................................... 10

Tabel 2.2 Kombinasi Prefiks Dan Sufiks Yang Tidak Diperbolehkan ................ 17

Tabel 2.3 Aturan Peluruhan Kata Dasar .............................................................. 17

Tabel 2.4 Confusion Matrix Dari Classifier ......................................................... 22

Tabel 2.5 Studi Literatur Sejenis .......................................................................... 26

Tabel 5.1 Hasil Pengujian Skenario 1 …………………………………………..110

Tabel 5.2 Hasil Pengujian Skenario 2 Taraf Nyata 0,05 ..................................... 116

Tabel 5.3 Hasil Pengujian Skenario 2 Taraf Nyata 0,005 ................................... 122

Tabel 5.4 Hasil Pengujian Skenario 2 Taraf Nyata 0,01 ..................................... 128

Tabel 5.5 Hasil Pengujian Skenario 2 Taraf Nyata 0,001 ................................... 134

Tabel 5.6 Hasil Pengujian Skenario 3 ................................................................. 140

Tabel 5.7 Hasil Pengujian Skenario 4 Taraf Nyata 0,05 ..................................... 146

Tabel 5.8 Hasil Pengujian Skenario 4 Taraf Nyata 0,005 ................................... 152

Tabel 5.9 Hasil Pengujian Skenario 4 Taraf Nyata 0,01 ..................................... 158

Tabel 5.10 Hasil Pengujian Skenario 4 Taraf Nyata 0,001 ................................. 164

Page 18: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Kemajuan teknologi informasi yang terus berkembang semakin

mempermudah masyarakat dalam mendapatkan berbagai informasi khususnya

di media online. Sebagian besar dari informasi yang didapatkan di internet

adalah berupa data teks. Pertumbuhan data teks yang semakin pesat mendorong

para peneliti membangun sebuah sistem untuk melakukan pengolahan terhadap

kumpulan data teks tersebut (Kusumaningrum, Al-faraby, & Adiwijaya, 2017).

Text mining secara umum adalah teori tentang pengolahan koleksi

dokumen dalam jumlah besar yang ada dari waktu ke waktu dengan

menggunakan beberapa analisis, tujuan pengolahan data teks tersebut adalah

mengetahui dan mengekstrak informasi yang berguna dari sumber data dengan

identifikasi dan eksplorasi pola menarik. Dalam kasus text mining, sumber data

yang dipergunakan adalah kumpulan atau koleksi dokumen tidak terstuktur dan

memerlukan adanya pengelompokan (klasifikasi) untuk diketahui informasi

sejenis (Somantri, Wiyono, & Dairoh, 2017).

Klasifikasi merupakan salah satu teknik dalam text mining dan data

mining yang digunakan dalam proses mencari model atau fungsi yang

menjelaskan atau membedakan kelas-kelas pada data dan konsep yang

bertujuan untuk menggunakan model tersebut dalam melakukan prediksi

terhadap data testing (Fauzan, Al-faraby, & Adiwijaya, 2018). Teknik ini sudah

banyak digunakan pada banyak penelitian dengan berbagai domain, namun

masih sedikit yang melakukan penelitian dengan mengangkat domain teks kitab

agama, salah satunya adalah terjemahan Hadits (Kusumaningrum et al., 2017).

Pada dewasa ini metode klasifikasi telah banyak dikembangkan, antara

lain Support Vector Machine (SVM), Naïve Bayessian Classifier (NBC),

Decision Tree (DT), K-Nearest Neighbour (KNN) dan metode klasifikasi

lainnya (Fauzan et al., 2018).

Page 19: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

2

UIN Syarif Hidayatullah Jakarta

Algoritma Naive Bayes Classifier merupakan salah satu algoritma

yang terdapat pada teknik klasifikasi. Naïve Bayes Classifier (NBC) merupakan

pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan

oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan

berdasarkan pengalaman dimasa sebelumnya sehingga dikenal sebagai

Teorema Bayes. Teorema tersebut dikombinasikan dengan Naive dimana

diasumsikan kondisi antar atribut saling bebas (Nofriansyah, Erwansyah, &

Ramadhan, 2016). Selain itu, NBC memiliki komputasi yang mudah, serta

memiliki tingkat akurasi tinggi dan error rate yang minimum. Algoritma NBC

juga mampu menggenerasikan token dengan pengenalan karakter sehingga

mampu diimplementasikan pada token dengan bahasa Indonesia (Widodo &

Pratiwi, 2017). Sehingga cocok pada kasus klasifikasi dokumen hadits yang

menggunakan terjemahan Bahasa Indonesia sebagai data penelitian.

Sebelumnya terdapat beberapa penelitian yang menerapkan

algoritma Naïve Bayes Classifier dalam proses klasifikasi. Pertama penelitian

yang dilakukan oleh (Septiani, 2017) yang melakukan perbandingan metode

klasifikasi data mining Algoritma C4.5 dengan Algoritma Naïve Bayes

Classifier dalam memprediksi penyakit hepatitis dan mendapati hasil Naïve

Bayes Classifier lebih unggul berdasarkan akurasi yaitu mencapai 83,71%.

Penelitian kedua yaitu penelitian yang menerapkan Algoritma Naïve Bayes

Classifier untuk klasifikasi bakteri gram-negatif yang dilakukan oleh (Priyanti,

2017). Penelitian tersebut mendapatkan nilai akurasi 80,93%. Penelitian lainnya

yang menerapkan Algoritma Naïve Bayes Classifier dalam proses klasifikasi

dilakukan oleh (Saputra, 2018) untuk pemetaan mahasiswa yang membutuhkan

bimbingan dan konseling dengan hasil akurasi 81%.

Penelitian berikutnya mengklasifikasikan data teks berupa surat

menggunakan Algoritma Multinomial Naïve Bayes dan mengimplementasikan

Algotima Confix Stripping Stemmer pada tahapan stemming. Penelitian yang

dilakukan oleh (Kalokasari, Setianingrum, & Shofi, 2018) tersebut

mendapatkan hasil Accuracy, Precission, Recall, dan F-measure secara

Page 20: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

3

UIN Syarif Hidayatullah Jakarta

berurutan sebesar 89,58%, 79,17%, 78,72%, dan 77,05%. Stemming merupakan

salah satu tahapan preprocessing pada text mining setelah tokenizing, case

folding, stopwords. Diantara keempat langkah tersebut yang paling penting

adalah proses stemming yang merupakan proses menghilangkan imbuhan pada

suatu kata untuk mendapatkan kata dasar dari kata tersebut. Confix-stripping

stemmer merupakan penyempurnaan oleh Jelita Asian yang berawal dari nazief

stemmer yang dibuat oleh Nazief dan Adriani (Ariadi & Fithriasari, 2015).

Menurut Chen dkk. (dalam Ernawati, 2016) masalah utama dalam

klasifikasi teks adalah dimensi tinggi dari ruang fitur, hal ini sering terjadi pada

teks yang memiliki puluhan ribu fitur. Sebagian besar fitur ini tidak relevan dan

tidak bermanfaat bagi klasifikasi teks bahkan dapat mengurangi tingkat akurasi,

maka dari itu pemilihan fitur yang sesuai sangat diperlukan. Seleksi fitur

merupakan langkah penting dalam klasifikasi teks dan mempengaruhi secara

langsung terhadap performa klasifikasi (Ernawati, 2016).

Sun dkk. (dalam Rahmad & Pribadi, 2015) menyebutkan sebelumnya

telah didapatkan beberapa teknik yang digunakan untuk melakukan pemilihan

fitur dokumen antara lain Document Frequency Thresholding (DF),

Information Gain, Mutual Information (MI), Term Strength (TS) dan Chi-

Square testing (X2). Dan dalam pengklasifikasian sebuah dokumen, Chi-Square

adalah salah satu supervised feature selection yang mampu menghilangkan

banyak fitur tanpa mengurangi tingkat akurasi.

Penelitian sejenis lainnya yang menerapkan feature selection Chi-

Square dilakukan oleh (Sacra, Faraby, & Triantoro, 2017) membuktikan bahwa

penerapan feature selection memberi pengaruh terhadap hasil klasifikasi.

Performansi terbaik dari penelitian tersebut didapatkan pada pengujian data

dengan kelas imbang dan menerapkan feature selection Chi-Square yaitu

mendapatkan nilai F-Measure sebesar 94,62%.

Berdasarkan beberapa penelitian diatas, Confix Stripping Stemmer

merupakan penyempurnaan dari agloritma stemming sebelumnya, maka pada

penelitian ini peneliti mencoba melakukan simulasi dengan mengkombinasikan

Page 21: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

4

UIN Syarif Hidayatullah Jakarta

algoritma tersebut dengan algoritma Naïve Bayes Classifier dan Chi-Square.

Maka berdasarkan latar belakang yang telah penulis paparkan, penulis

melakukan penelitian mengenai implementasi Algoritma Naïve Bayes

Classifier untuk mengklasifikasi terjemahan hadits kedalam tiga kelas yaitu

anjuran, larangan dan informasi dengan feature selection Chi-Square dan

menerapkan Algoritma Confix Stripping Stemmer pada tahapan stemming.

Data yang digunakan sebanyak 300 hadits sebagai data training yang

sudah diklasifikasi secara manual kedalam tiga kelas yaitu anjuran, larangan,

dan informasi, dan 30 hadits sebagai data testing . Kitab hadits yang digunakan

adalah Shahih Bukhari yang diambil dari Aplikasi LIDWA “Kitab 9 Imam”

Penentuan kelas manual data hadits tersebut dilakukan berdasarkan hasil saran

dari narasumber yang expert di bidangnya yaitu Bapak Danial,Lc.M.Th.I, yang

merupakan Dosen Prodi Ilmu Alquran dan Tafsir IAIN Kendari dengan

berdasarkan melihat kombinasi kata dari kalimat hadits tersebut, seperti hadits

kelas anjuran pada umumnya terdapat kata hendaklah/hendaknya maupun kata

kerja+lah, kemudian janganlah/jangan/dilarang/melarang/larang untuk kalimat

pada kelas hadits larangan, serta sisanya dianggap masuk ke kelas informasi.

Berdasarkan latar belakang, maka penulis memberi judul penelitian ini

“ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER DENGAN

SELEKSI FITUR CHI-SQUARE DAN CONFIX STRIPPING STEMMER

PADA SISTEM KLASIFIKASI TERJEMAHAN HADITS”

1.2 Tujuan Penelitian

Tujuan dari penelitian ini adalah untuk mengetahui bagaimana kinerja

Algoritma Naïve Bayes Classifier dengan seleksi fitur Chi-Square dan Confix

Stripping Stemmer dapat diterapkan pada pengklasifikasian terjemahan hadits

berdasarkan tiga kelas yaitu anjuran, larangan, dan informasi.

Page 22: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

5

UIN Syarif Hidayatullah Jakarta

1.3 Manfaat Penelitian

1.3.1 Bagi Pengguna

Dengan penelitian ini diharapkan dapat memudahkan pengguna

untuk mempelajari hadits-hadits Nabi, dan dapat memandu kita dengan

mudah dalam mencari tahu sebuah hadits berdasarkan klasifikasi,

khususnya Shahih Bukhari.

1.3.2 Bagi Mahasiswa

1. Sebagai media pembelajaran dalam mengetahui hadits-hadits Nabi

berdasarkan klasifikasi khususnya Shahih Bukhari.

2. Memberikan pengetahuan kepada penulis dalam membangun

sebuah sistem dengan menggunakan metode Naïve Bayes Classifier,

Seleksi fitur Chi-Square, dan Confix Stripping Stemmer.

3. Dapat menerapkan ilmu dan pengetahuan yang diperoleh selama

masa perkuliahan.

4. Untuk memenuhi salah satu syarat dalam meraih gelar sarjana dalam

Fakultas Sains dan Teknologi jurusan Teknik Informatika

Universitas Islam Negeri Syarif Hidayatullah Jakarta.

1.3.3 Bagi Universitas

1. Mengetahui kemampuan mahasiswa dalam menerapkan ilmu yang

diperoleh selama perkuliahan.

2. Menjadikan penelitian ini sebagai referensi untuk penelitian

selanjutnya.

1.4 Rumusan Masalah

Berdasarkan uraian latar belakang diatas, maka rumusan masalah

yang ada pada penelitian ini adalah bagaimana kinerja Algoritma Naïve Bayes

Classifier dengan seleksi fitur Chi-Square dan Confix Stripping Stemmer

dalam mengklasifikasikan terjemahan hadits Shahih Bukhari?

Page 23: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

6

UIN Syarif Hidayatullah Jakarta

1.5 Batasan Masalah

Di dalam melakukan suatu penelitian diperlukan adanya pembatasan

suatu masalah agar penelitian tersebut lebih terarah dan memudahkan dalam

pembahasan sehingga tujuan penelitian akan tercapai. Beberapa Batasan

masalah dalam penelitian ini adalah sebagai berikut:

1. Metode pengumpulan data yang digunakan dalam penelitian ini adalah

metode studi pustaka.

2. Metode pengembangan sistem yang digunakan adalah metode Simulasi

yang terdiri dari tahapan problem formulation, conceptual model, input

and output data, modelling, simulation, verification and validation,

experimentation dan output analysis.

3. Penelitian ini menggunakan kombinasi Algoritma Naïve Bayes Classifier

untuk mengklasifikasikan hadits, seleksi fitur dengan Chi-Square, dan

stemming dengan Confix Stripping Stemmer yang dibagi menjadi 4

skenario.

4. Kitab hadits yang digunakan adalah Shahih Bukhari yang diambil dari

Aplikasi LIDWA “Kitab 9 Imam”.

5. Klasifikasi hadits dibagi menjadi tiga kelas yaitu anjuran/perintah,

larangan, dan informasi.

6. Penentuan kelas data hadits tersebut dilakukan berdasarkan hasil saran

dari narasumber yang expert di bidangnya yaitu Bapak

Danial,Lc.M.Th.I, yang merupakan Dosen Prodi Ilmu Alquran dan Tafsir

IAIN Kendari.

7. Aplikasi ini menggunakan bahasa pemrograman PHP sebagai interface

dan MySQL sebagai database.

8. Jumlah data set pada penelitian ini adalah 300 data training dan 30 data

testing.

9. Pengujian dilakukan dengan jumlah data set seimbang pada setiap kelas.

Page 24: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

7

UIN Syarif Hidayatullah Jakarta

1.6 Metodologi Penelitian

1.6.1. Metode Pengumpulan Data

Adapun metode pengumpulan data-data informasi yang dilakukan

adalah melakukan studi pustaka untuk mengumpulkan data dengan mencari

informasi lewat buku, jurnal, e-book, dan sumber-sumber tertulis lainnya baik

tercetak maupun elektronik yang bertujuan untuk mendukung sebuah

penelitan.

1.6.2. Metodologi Pengembangan Sistem

Dalam pembuatan aplikasi ini menggunakan metode Simulasi.

1.7 Sistematika Penulisan

Dalam penyusunan tugas akhir ini penulis menggunakan sistematika

penulisan sebagai berikut:

BAB I PENDAHULUAN

Pada bab ini berisi latar belakang masalah, rumusan masalah,

batasan masalah, tujuan penulisan, manfaat penulisan,

metodologi penulisan dan sistematika penulisan.

BAB II LANDASAN TEORI

Pada bab ini berisi tentang landasan teori dari studi literatur yang

digunakan penulis dalam penelitian.

BAB III METODOLOGI PENELITIAN

Pada bab ini membahas tentang metodologi yang digunakan yaitu

metodologi pengumpulan data dan metodologi pengembangan

sistem.

BAB IV ANALISA DAN PERANCANGAN SISTEM

Pada bab ini membahas perancangan dan pengujian sesuai

dengan metode yang digunakan pada sistem yang dibuat

BAB V HASIL DAN PEMBAHASAN

Pada bab ini dijelaskan mengenai hasil dari penelitian beserta

penjelasan dari aplikasi yang dibuat

Page 25: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

8

UIN Syarif Hidayatullah Jakarta

BAB VI PENUTUP

Pada bab ini dijelaskan mengenai kesimpulan dari hasil penelitian

dan saran yang dapat digunakan untuk pengembangan sistem

masa yang akan datang agar lebih baik

Page 26: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

9

BAB II

LANDASAN TEORI

2.1 Klasifikasi

Menurut KBBI klasifikasi merupakan penyusunan bersistem dalam

kelompok atau golongan menurut kaidah atau standar yang berasal dari kata serapan

bahasa Belanda, classificatie, yang sendirinya berasal dari bahasa Prancis

classification. Istilah ini menunjuk kepada sebuah metode untuk menyusun data

secara sistematis atau menurut beberapa aturan atau kaidah yang telah ditetapkan.

Secara harafiah bisa pula dikatakan bahwa klasifikasi adalah pembagian sesuatu

menurut kelas-kelas. Sedangkan menurut Ilmu pengetahuan, klasifikasi adalah

proses pengelompokkan benda berdasarkan ciri-ciri persamaan dan perbedaan

(Sacra et al., 2017).

Menurut (Faisal & Nugrahadi, 2019) klasifikasi adalah salah satu teknik

machine learning. Istilah klasifikasi didapat dari tujuan utama teknik ini untuk

memprediksi suatu kelas dari input data. Sebelum melakukan proses prediksi,

terlebih dahulu dilakukan proses pembelajaran. Proses pembelajaran memerlukan

data. Data yang digunakan pada proses pembelajaran disebut data latih atau data

training, sedangkan data yang digunakan pada proses predeksi disebut data uji atau

data testing.

Kasus klasifikasi dapat dibedakan berdasarkan tipe masalah yang umumnya

ditemui, yaitu (Faisal & Nugrahadi, 2019):

1. Klasifikasi 1 class.

2. Klasifikasi 2 class (binary).

3. Klasifikasi multiclass, berada lebih dari 2 class

Dalam text mining, klasifikasi mengacu kepada aktifitas menganalisis atau

mempelajari himpunan dokumen teks pre-classified untuk memperoleh suatu

model atau fungsi yang dapat digunakan untuk mengelompokkan dokumen teks lain

yang belum diketahui kelasnya ke dalam satu atau lebih kelas kelas predefined

tersebut (Darujati et al., 2012).

Page 27: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

10

UIN Syarif Hidayatullah Jakarta

2.1.1 Algoritma Klasifikasi

Algoritma klasifikasi yang banyak digunakan secara luas, yaitu

Decision / Classification Trees, Bayesian Classifiers / Naive Bayes

Classifiers, Neural Networks, Analisa Statistik, Algoritma Genetika, Rough

Sets, K-Nearest Neighbor, Metode Rule Based, Memory Based Reasoning

dan Support Vector Machines (SVM) (Susandi & Sholahudin, 2016) .

Klasifikasi terdapat beberapa implementasi algoritma yang

merupakan kajian di bidang statistika dan machine learning yang dapat

diterapkan pada fase ini, di antaranya adalah Naive Bayesian, Decision Tree,

k-Nearest Neighbor, Neural Network, dan Support Vector Machines

(Darujati et al., 2012).

Tabel 2.1 Perbandingan Algoritma Klasifikasi Teks

(Sumber : Darujati et al., 2012)

No Classifier Metode

1. Naive Bayes Classifier Menghitung probabilitas dari suatu

dokumen untuk ikut ke suatu kelas

berdasarkan pada kehadiran dari kata

yang sama didalam dokumen lain

yang telah ada di dalam kelas

tersebut.

2. K-Nearest Neighbor Mencari sebanyak k dokumen paling

mirip dan menempatkan dokumen ke

kelas dimana k dokumen tersebut

ditempatkan sebelumnya. Namun

memiliki kinerja lambat karena setiap

dokumen harus dibandingkan ke

semua dokumen lain

Page 28: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

11

UIN Syarif Hidayatullah Jakarta

3. Decision Tree Memisahkan dokumen - dokumen

secara hirarki di dalam struktur

pohon, dimana setiap node merupakan

term yang relevan dan ujung setiap

cabang adalah kelas. Decision tree

memerlukan optimisasi untuk

menyelesaikan overfitting.

4. Support Vector Machine Menggambar antara term yang

berkontribusi dan tidak terhadap suatu

dokumen yang akan ditempatkan ke

suatu kelas tertentu. Kelas didasarkan

pada kehadiran dari term yang

berkontribusi.

SVM mudah terjadi error dalam data

training.

Menurut Diandra, Naïve Bayes Classifier seringkali bekerja jauh

lebih baik dan memiliki tingkat kesalahan yang minimum dibandingkan

dengan metode klasifikasi yang lain meskipun dengan menggunakan

rancangan yang “naive” dan dengan asumsi yang disederhanakan. Naïve

Bayes Classifier bekerja dengan mengestimasi peluang kelas bersyarat

dengan mengasumsikan bahwa setiap atribut saling bebas antara atribut lain

terhadap kelas yang diberikan (Darujati et al., 2012).

2.2 Text Mining

Text mining adalah bidang interdisipliner yang mengacu pada information

retrival, data mining, machine learning, statistik, dan komputasi linguistik.

Sebagian besar informasi disimpan sebagai teks seperti artikel berita, makalah

teknik, buku, perpustakaan digital, pesan email, blog, dan halaman web. Oleh

karena itu, penelitian mengenai text mining telah banyak dilakukan. Tujuan

utamanya adalah memperoleh informasi berkualitas tinggi dari teks. Ini biasanya

Page 29: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

12

UIN Syarif Hidayatullah Jakarta

dilakukan melalui penemuan pola dan tren dengan cara seperti pembelajaran pola

statistik, pemodelan topik, dan pemodelan bahasa statistik (Jiawei Han, Micheline

Kamber, 2011).

Tipe tugas text mining yang umum biasanya seperti kelassasi teks,

pengelompokan teks, ekstraksi konsep / entitas, produksi taksonomi granular,

analisis sentimen, peringkasan dokumen, dan pemodelan entitas-hubungan (mis.,

hubungan pembelajaran antara entitas yang disebutkan). Contoh lain termasuk data

mining multibahasa, analisis teks multidimensi, kontekstual text mining, dan

analisis kepercayaan dan evolusi dalam data teks, serta text mining aplikasi

keamanan, analisis literatur biomedis, analisis media online, dan analitik

pengelolaan hubungan pelanggan. Berbagai macam text mining dan analisis

perangkat lunak dan alat tersedia di lembaga akademik, forum open-source, dan

industri. Text mining sering juga menggunakan WordNet, Web Sematic, Wikipedia,

dan lainnya sumber informasi untuk meningkatkan pemahaman dan mining pada

data teks (Jiawei Han, Micheline Kamber, 2011).

Menurut Sihombing (Aprilianti P, 2015) secara umum teks mining

bertujuan untuk menggali informasi dari sekumpulan dokumen teks dalam ukuran

besar dan dalam format yang tidak terstruktur. Secara khusus, tujuan dari text

mining dapat dibagi menjadi dua:

1. Pengkelassasian data teks (text categorization)

Dalam pengkelassasian, text mining dipergunakan sebagai alat untuk

menemukankelas yang sesuai dengan kelas yang telah ditentukan (supervised

learning).

2. Pengelompokan data teks (text clustering)

Pada pengelompokan, text mining berfungsi sebagai alat untuk

mengelompokkan data teks berdasarkan kesamaan karakteristik, dan clustering

dapat digunakan untuk memberikan label pada kelas yang belum diketahui

(unsupervised learning).

Menurut (Andini, 2013), Proses Text Mining dibagi menjadi 3 tahap utama

yaitu text preprocessing, text transforming, dan pattern discovery.

Page 30: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

13

UIN Syarif Hidayatullah Jakarta

2.2.1 Text Preprocessing

Pada tahap ini dilakukan proses tokenizing yaitu tahap pemotongan

string input berdasarkan tiap kata yang menyusunnya dan menghilangkan

delimiter-delimiter seperti tanda titik(.), koma(,), spasi, dan karakter angka

yang ada pada kata tersebut. Selain itu pada tahapan ini biasanya juga

dilakukan case folding, yaitu pengubahan karakter huruf besar menjadi huruf

kecil (Andini, 2013).

2.2.2 Text Transformation

Text transformation disebut juga proses filtering. Pada tahap ini

tindakan yang dilakukan adalah menghilangkan stopword (stopword

removal) dan stemming terhadap kata yang berimbuhan (Andini, 2013).

Stopword removal merupakan proses untuk menghilangkan

stopwords (kata-kata yang tidak deskriptif yang dapat dibuang dalam

pendekatan bag-of-words). Proses ini bertujuan untuk mengurangi jumlah

kata (Rahman, Wiranto, & Doewes, 2017).

Stemming adalah tahap mencari root kata atau kata dasar dari tiap kata

hasil filtering. Stemming merupakan suatu proses yang terdapat dalam sistem

IR yang mentransformasikan kata-kata yang terdapat dalam suatu dokumen

ke kata-kata akar atau dasarnya (root word) dengan menggunakan aturan-

aturan tertentu (Widodo & Pratiwi, 2017).

2.2.3 Pattern Discovery

Tahap ini berusaha menemukan pola atau pengetahuan dari

keseluruhan teks. Dalam text mining terdapat dua teknik pembelajaran pada

tahap pattern discovery ini, yaitu unsupervised dan supervised learning.

Adapun perbedaan antara keduanya adalah pada supervised learning terdapat

label atau nama kelas pada data latih (supervisi) dan data baru

diklasifikasikan berdasarkan data latih. Sedangkan pada unsupervised

learning tidak terdapat label atau nama kelas pada data latih, data latih

Page 31: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

14

UIN Syarif Hidayatullah Jakarta

dikelompokkan berdasarkan ukuran kemiripan pada suatu kelas (Andini,

2013).

2.3 Naïve Bayes Classifier (NBC)

Naïve Bayes Classifier merupakan metode probabilistik yang

mengasumsikan bahwa keberadaan atribut sebuah kelas tertentu tidak memiliki

keterkaitan dengan atribut-atribut lain. Asumsi tersebut dikenal dengan class

conditional independence yang dibuat untuk memudahkan perhitungan-

perhitungan, sehingga perhitungan tersebut dianggap “naive”, dalam

implementasinya maksud naïve tersebut adalah bahwa kemunculan suatu term kata

dalam suatu kalimat tidak dipengaruhi kemungkinan kata – kata yang lain dalam

kalimat padahal dalam kenyataanya bahwa kemungkinan kata dalam kalimat sangat

dipengaruhi kemungkinan keberadaan kata-kata yang dalam kalimat (Sacra et al.,

2017).

Salah satu kelebihan penggunaan Naive Bayes adalah metode ini hanya

membutuhkan jumlah data latih yang sedikit untuk menentukan estimasi parameter

yang diperlukan dalam proses klasifikasi serta menghasilkan akurasi yang tinggi.

Sehingga membuat klasifikasi ini prosesnya menjadi cepat dan sederhana (Pattekari

& Parveen, 2012).

Naïve Bayes menggunakan konsep dasar teorema Bayes, yaitu melakukan

klasifikasi dengan melakukan nilai probabilitas, berikut adalah persamaan dari

naïve bayes (Sacra et al., 2017):

p(wkj | ci) = 𝑓(𝑤𝑘𝑗,𝐶𝑖)+1

𝑓(𝑐𝑖)+|𝑤| (2.1)

Dimana :

𝑓(w𝑘𝑗, 𝑐𝑖) adalah nilai kemunculan kata W𝑘𝑗 pada kelas 𝑐𝑖

𝑓(𝑐𝑖) adalah jumlah keseluruhan kata pada kelas 𝑐𝑖

|𝑤| adalah jumlah keseluruhan fitur/kata yang digunakan

Page 32: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

15

UIN Syarif Hidayatullah Jakarta

Dan persamaan berikut untuk penentuan hasil klasifikasi dengan menghitung

perkalian nilai probabilitas setiap kata pada setiap kelas dan menentukan nilai

tertinggi dari semua kelas :

𝑐∗ = 𝑎𝑟𝑔𝑚𝑎𝑥

𝑐 ∈𝐶𝑃 ∏ 𝑃(𝑊𝑘|𝑐) × 𝑃(𝑐)𝑘 (2.2)

dengan 𝑃(𝑐) = 𝑁𝑐

𝑁 (2.3)

P(c) adalah nilai probabilitas setiap kelas c

Nc adalah jumlah kelas c

N adalah jumlah seluruh kelas.

2.4 Confix Stripping Stemmer

Pada tahun 2007 algoritma nazief stemmer kemudian dikembangkan lagi

oleh Jelita Asian, dengan menambahkan beberapa perbaikan yang bertujuan untuk

meningkatkan hasil stemming yang diperoleh. Algoritma ini kemudian dikenal

sebagai confix-stripping stemmer (Ariadi & Fithriasari, 2015). Algoritma confix-

stripping stemmer adalah algoritma yang digunakan untuk melakukan proses

stemming terhadap kata-kata berimbuhan (Adriani, Asian, Nazief, Williams, &

Tahaghoghi, 2007).

Algoritma Confix-stripping stemmer mempunyai aturan imbuhan sendiri

dengan model sebagai berikut :

(2.4)

Keterangan :

AW : Awalan

AK : Akhiran

KK : Kata ganti kepunyaan

P : Partikel

[[[AW + ]AW +]AW +] Kata-Dasar [[+AK][+KK][+P]

Page 33: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

16

UIN Syarif Hidayatullah Jakarta

Langkah-langkah algoritma confix-stripping stemmer adalah sebagai berikut

(Kurniawan, Effendi, & Sitompul, 2012) :

1) Kata yang belum di-stemming dibandingkan ke dalam database kamus kata

dasar. Jika ketemu, maka kata tersebut diasumsikan sebagai kata dasar dan

algoritma berhenti. Jika kata tidak sesuai dengan kata dalam kamus, lanjut

ke langkah 2.

2) Jika kata di-input memiliki pasangan awalan-akhiran “be-lah”,”be-

an”,”me-i”,”di-i”,”pe-i”, atau “te-i” maka langkah stemming selanjutnya

adalah 5, 3, 4, 5, 6, tetapi jika kata yang di-input tidak memiliki pasangan

awalan-akhiran tersebut, langkah stemming berjalan normal yaitu 3, 4, 5, 6.

3) Hilangkan partikel dan kata ganti kepunyaan. Pertama hilangkan partikel

(“-lah”, “-kah”, “-tah”, “-pun”). Setelah itu hilangkan juga kata ganti

kepunyaan (“-ku”, “-mu”, atau “-nya”). Contoh : kata “bajumulah”, proses

stemming pertama menjadi “bajumu” dan proses stemming kedua menjadi

“baju”. Jika kata “baju” ada di dalam kamus maka algoritma berhenti.

Sesuai dengan model imbuhan, menjadi :

[[[AW+]AW+]AW+] Kata Dasar [+AK]

4) Hilangkan juga Akhiran (“-i”,”-an”, dan “-kan”), sesuai dengan model

imbuhan, maka menjadi :

[[[AW+]AW+]AW+] Kata Dasar

Contoh : kata “membelikan” di-stemming menjadi ”membeli”, jika tidak

ada dalam database kata dasar maka dilakukan proses penghilangan awalan.

5) Penghilangan awalan (“be-“, ”di-“, ”ke-“, ”me-”, ”pe-”, ”se-”,

dan “te-“) mengikuti langkah-langkah berikut :

a. Algoritma akan berhenti jika :

i. Awalan diidentifikasi bentuk sepasang imbuhan yang tidak

diperbolehkan dengan akhiran (berdasarkan tabel 1) yang

dihapus pada langkah 4.

ii. Diidentifikasi awalan yang sekarang identik dengan awalan

yang telah dihapus sebelumnya atau,

Page 34: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

17

UIN Syarif Hidayatullah Jakarta

iii. Kata tersebut sudah tidak memiliki awalan.

b. Identifikasi jenis awalan dan peluruhannya bila diperlukan.jenis

awalan ditentukan dengan aturan dibawah ini.

i. Jika awalan dari kata adalah “di-”, “ke-”, atau “se-” maka

awalan dapat langsung dihilangkan.

ii. Hapus awalan “te-”, “be-”, “me-”, atau “pe-” yang

menggunakan aturan peluruhan yang dijelaskan pada tabel 2.4.

Sebagai contoh kata “menangkap”, setelah menghilangkan awalan “me-“

maka kata yang didapat adalah “nangkap”. Karena kata “nangkap” tidak

ditemukan dalam database kata dasar maka karakter “n” diganti dengan

karakter “t” sehingga dihasilkan kata “tangkap” dan kata “tangkap”

merupakan kata yang sesuai dengan kata yang ada di database kata dasar,

maka algoritma berhenti.

6) Jika semua langkah gagal, maka kata yang diuji pada algoritma ini dianggap

sebagai kata dasar.

Tabel 2.2 Kombinasi Prefiks Dan Sufiks Yang Tidak Diperbolehkan

(Sumber : Adriani et al., 2007)

Awalan ( Prefiks) Akhiran (Suffiks)

be- -i

di- -an

ke- -i –kan

me- -an

se- -i –kan

te- -an

Berikut merupakan tabel aturan peluruhan imbuhan pada algoritma confix-

stripping stemmer.

Tabel 2.3 Aturan Peluruhan Kata Dasar

(Sumber : Adriani et al., 2007)

Page 35: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

18

UIN Syarif Hidayatullah Jakarta

Aturan Bentuk Awalan Peluruhan

1 berV… ber-V… | be-rV…

2 belajar… bel-ajar

3 beC1erC2… be-C1erC2…dimana C1!={'r'|'l'}

4 terV… ter-V…|te-rV…

5 terCer… ter-Cer…dimana C!='r'

6 teC1erC2 te-C1erC2…dimana C1!='r'

7 me{l|r|w|y}V… me-{l|r|w|y}V…

8 mem{b|f|v}… mem-{b|f|v}…

9 mempe… Me m-pe…

10 mem{rV|V}… me-m{rV|V}…|me-p{rV|V}…

11 men{c|d|j|z}… men-{c|d|j|z}…

12 menV… me-nV…|me-tV…

13 meng{g|h|q|k}… meng-{g|h|q|k}…

14 mengV… meng-V…|meng-kV…

15 mengeC menge-C

16 menyV… me-ny…| meny-sV…

17 mempV… mem-pV…

18 pe{w|y}V… pe-{w|y}V…

19 perV… per-V…|pe-rV…

20 pem{b|f|v}… pem-{b|f|v}…

21 pem{rV|V}… pe-m{rV|V}…|pe-p{rV|V}

22 pen{c|d|j|z}… pen-{c|d|j|z}…

23 penV… pe-nV…|pe-tV…

24 peng{g|h|q} peng-{g|h|q}

25 pengV peng-V|peng-kV

26 penyV… pe-nya|peny-sV

27 pelV.. pe-lV…; kecuali untuk kata "pelajar"

Page 36: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

19

UIN Syarif Hidayatullah Jakarta

menjadi "ajar"

28 peCP pe-CP…dimana C!={r|w|y|l|m|n} dan

P!='er'

29 perCerV Per-CerV… dimana C!={r|w|y|l|m|n}

2.5 Seleksi Fitur (Feature Selection)

Seleksi fitur (kata) merupakan tahap lanjut dari pengurangan dimensi

pada proses transformasi teks. Walaupun tahap sebelumnya sudah melakukan

penghapusan kata-kata yang tidak deskriptif (stopwords), namun tidak semua kata-

kata di dalam dokumen memiliki arti penting. Oleh karena itu, untuk mengurangi

dimensi, seleksi dilakukan terhadap kata-kata yang relevan atau kata-kata yang

benar-benar merepresentasikan isi dari suatu dokumen (Sanjaya & Absar, 2015).

2.6.1 Chi-Square (x2)

Chi-square (𝑥2) merupakan suatu perhitungan distribusi dalam statistika

yang mengukur nilai ketergantungan antara term dan kelas. Manning et al

menyatakan bahwa Chi-square (𝑥2) digunakan untuk menguji independensi antara

dua kejadian yaitu kejadian kemunculan kata unuk dan kejadian kemunculan kelas.

Hal ini disesuaikan dengan persamaan dibawah ini (Sacra et al., 2017) :

x2(wk , ci)=𝑁(𝑡𝑟)(𝐴𝐷−𝐶𝐵)2

(𝐴+𝐶)(𝐵+𝐷)(𝐴+𝐵)(𝐶+𝐷) (2.5)

Dimana:

N (𝑡𝑟) : jumlah dokumen dalam training set

A : jumlah dokumen dalam 𝑐𝑖 yang mengandung 𝑤𝑘

B : jumlah dokumen yang bukan kelas 𝑐𝑖, tapi mengandung 𝑤𝑘

C : jumlah dokumen dalam 𝑐𝑖 yang tidak mengandung 𝑤𝑘

D : jumlah dokumen yang tidak dalam 𝑐𝑖 dan tidak mengandung 𝑤𝑘

Page 37: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

20

UIN Syarif Hidayatullah Jakarta

Kemudian diambil kata-kata yang memiliki nilai chi square lebih besar dari

nilai kritis pada taraf nyata α 0.05, 0.01, 0.005, dan 0.001 yaitu 3.84, 6.63, 7.83, dan

10.83. Semakin kecil taraf nyata α dan semakin besar nilai kritis, maka jumlah

feature yang dihasilkan akan semakin sedikit dan akan mengurangi beban database.

Sehingga menghasilkan kata-kata yang merupakan ciri dari suatu kategori tertentu

yang selanjutnya akan digunakan dalam proses klasifikasi (Rahmad & Pribadi,

2015).

2.6 Studi Pustaka

Menurut Sugiyono, studi kepustakaan merupakan studi terhadap kajian

teoritis dan referensi lain yang berkaitan dengan nilai, budaya dan norma yang

berkembang pada situasi sosial yang diteliti, selain itu studi kepustakaan sangat

penting dalam melakukan penelitian, hal ini dikarenakan penelitian tidak akan lepas

dari literatur-literatur ilmiah. Penulis menggunakan metode studi pustaka dalam

pengumpulan data karena metode ini sangat cocok dilakukan untuk mengumpulkan

data dan informasi sebagai bahan dasar peneliti dan acuan dalam penelitian

(Sugiyono, 2012).

2.7 Metode Simulasi

Metode Simulasi adalah suatu metode untuk melakukan simulasi dan

pemodelan yang diadaptasi dari sebuah penelitian berjudul “Wireless Sensor

Networks: Modeling and Simulation” yang dilakukan oleh Sajjad A. Madani, Jawad

Kazmi, dan Stefan Mahlknecht pada tahun 2010. Pada penelitian tersebut metode

simulasi digunakan untuk melakukan pemodelan dan simulasi terhadap penelitian

Wireless Sensor Network (WSN).

Metode Simulasi merupakan metode pelatihan yang meragakan sesuatu

dalam bentuk tiruan yang mirip dengan keadaan yang sesungguhnya dengan

penggambaran suatu sistem atau proses dengan peragaan berupa model statistik

atau pemeranan. Metode simulasi terdiri dari atas beberapa tahapan, yaitu (Madani,

Kazmi, & Mahlknecht, 2010):

a. Problem Formulation

Page 38: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

21

UIN Syarif Hidayatullah Jakarta

Proses simulasi dimulai dengan merumuskan masalah yang memerlukan

pemecahan dan pemahaman. Pada tahap ini, Anda harus memahami perilaku

sistem (sistem natural atau pun sistem buatan), mengatur operasi sistem sebagai

objek yang akan diteliti dengan menganalisis berbagai solusi alternatif dan

menyelidiki hasil yang sudah ada sebelumnya dengan permasalahan yang sama.

b. Conceptual Model

Langkah ini dimulai dengan mendeskripsikan struktur dan perilaku sistem serta

mengidentifikasi semua objek dengan atribut. Anda juga harus menentukan

variabel dan hubungan sistem dengan penelitian.

c. Input & Output Data

Pada tahap ini, Anda harus mempelajari sistem untuk mendapatkan data input

dan output. Anda harus mengamati dan mengumpulkan atribut yang dipilih

dalam tahap sebelumnya. Pemilihan ukuran sampel yang valid secara statistik

dan format data yang dapat diproses dengan komputer sangat penting.

d. Modeling

Pada tahap pemodelan, Anda harus membangun representasi dari sistem

berdasarkan model konseptual dan input & output data yang dikumpulkan

secara rinci. Model ini dibangun dengan mendefinisikan objek, atribut, dan

metode menggunakan paradigma yang dipilih.

e. Simulation

Selama tahap simulasi, Anda harus memilih mekanisme untuk menerapkan

model simulasi yang akan dibangun. Mungkin perlu untuk mendefinisikan

flowchart simulasi dan menerjemahkannya ke dalam model simulasi.

f. Verification and Validation

Verifikasi terkait dengan konsistensi, sedangkan validasi difokuskan pada

korespondensi antara model dan realitas. Berdasarkan hasil yang diperoleh

selama tahap ini, model dan implementasinya mungkin perlu disempurnakan.

Proses verifikasi dan validasi bukan merupakan fase yang menentukan berhasil

atau tidaknya simulasi dilakukan, tetapi merupakan fase yang tak terpisahkan

dengan fase yang lain.

g. Experimentation

Page 39: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

22

UIN Syarif Hidayatullah Jakarta

Anda harus mengevaluasi output dari simulasi, menggunakan korelasi statistik

untuk menentukan tingkat presisi yang mewakilkan kinerja dari simulasi

tersebut. Fase ini dimulai dengan membuat desain eksperimen, menggunakan

teknik yang berbeda. Beberapa teknik tersebut meliputi, analisis sensitivitas,

optimasi, pengurangan varian (untuk mengoptimalkan hasil dari sudut pandang

statistik), dan ranking serta penyeleksian.

h. Output Analysis

Output simulasi dianalisis untuk memahami perilaku sistem. Output ini

digunakan untuk mendapatkan respon tentang perilaku sistem yang asli. Pada

tahap ini, alat visualisasi dapat digunakan untuk membantu proses tersebut.

Tujuan dari visualisasi adalah untuk memberikan pemahaman yang lebih dalam

mengenai sistem yang sedang diteliti serta membantu dalam mengeksplorasi

data numerik yang dihasilkan oleh simulasi.

2.8 Confusion Matrix

Pada data mining untuk mengukur atau ada beberapa cara untuk mengukur

kinerja dari model yang dihasilkan salah satunya menggunakan confusion matriks

(akurasi). Confusion matrix adalah suatu metode yang digunakan untuk melakukan

perhitungan akurasi pada konsep data mining (Rosandy, 2016).

Tabel 2.4 Confusion Matrix Dari Classifier

(Sumber : Liu, 2011)

Actual Positive Actual Negative

Classified Positive TP FP

Classified Negative FN TN

Dimana :

1. True Positive (TP) : Nilai yang akan didapat ketika hasil prediksi true(bernilai 1)

dan nilai sebenarnya true(bernilai 1).

Page 40: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

23

UIN Syarif Hidayatullah Jakarta

2. True Negative (TN) : Nilai yang akan didapat ketika hasil prediksi false(bernilai

0) dan nilai sebenarnya false(bernilai 0).

3. False Positive (FP) : Nilai yang akan didapat ketika hasil prediksi true(bernilai

1) dan nilai sebenarnya false(bernilai 0).

4. False Negative (FN) : Nilai yang akan didapat ketika hasil prediksi false(bernilai

0) dan nilai sebenarnya true(bernilai 1).

Selanjutnya dari Tabel 2.4 tersebut dapat ditarik beberapa kesimpulan

performansi dari hasil klasifikasi berupa (Liu, 2011) :

• Precision

Precision adalah perhitungan yang digunakan untuk mengetahui seberapa

banyak persentase prediksi klasifikasi yang di prediksi true dan terbukti true

(TP) dibandingkan dengan jumlah keseluruhan prediksi bernilai true.

Persamaan (2.6) merupakan persamaan untuk menghitung precision:

Precision = 𝑇𝑃

𝑇𝑃+𝐹𝑃 ( 2.6 )

• Recall

Recall adalah perhitungan yang digunakan untuk mengetahui seberapa banyak

persentase prediksi klasifikasi yang di prediksi true dan terbukti true (TP)

dibandingkan dengan keseluruhan jumlah data aktual bernilai true. Persamaan

(2.7) merupakan persamaan untuk menghitung recall :

Recall = 𝑇𝑃

𝑇𝑃+𝐹𝑁 ( 2.7 )

• F-Measure (F1)

F-Measure adalah perhitungan terhadap penggabungan nilai precision dan

recall. Nilai yang dihasilkan pada perhitungan F-Measure ini merupakan nilai

yang mewakili keseluruhan kinerja sistem. Semakin besar nilai F-Measure

yang dihasilkan maka semakin baik performansinya. Persamaan (2.8)

merupakan persamaan untuk menghitung nilai F-Measure :

F-Measure = 2 𝑥𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 𝑥 𝑅𝑒𝑐𝑎𝑙𝑙

𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛+𝑅𝑒𝑐𝑎𝑙𝑙 ( 2.8 )

• Accuracy

Accuracy adalah jumlah dokumen yang diklasifikasikan dengan benar, baik

Page 41: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

24

UIN Syarif Hidayatullah Jakarta

itu true positive maupun true negative. Persamaan (2.9) merupakan

deskripsi dari perhitungan Accuracy.

Accuracy = 𝑇𝑃+𝑇𝑁

𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁 ( 2.9 )

2.9 PHP

Menurut Wahana Komputer (2015), Bahasa pemrograman PHP merupakan

bahasa pemrograman untuk membuat website yang bersifat server side scripting.

PHP memungkinkan anda untuk membuat halaman website yan bersifat dinamis.

PHP dapat dijalankan pada berbagai macam sistem operasi (OS) seperti Windows,

Linux, dan Mac OS. Selain Apache, PHP juga mendukung beberapa web server

lain, seperti Microsoft IIS, Caudium, PWS, dan lain sebagainya.

PHP dapat memanfaatkan database untuk menghasilkan halaman web yang

dinamis. Sistem manajemen database yang sering digunakan bersama PHP adalah

MySQL. Namun, PHP juga mendukung Database Oracle, Microsoft Acces,

Interbase, d-Base, PostgreSQL, dan sebagainya.

Hingga kini PHP telah berkembang hingga versi ke 5.4.16. PHP 5xxx

mendukung penuh Object Oriented Programming (OOP), integrasi ML,

mendukung semua ekstensi terbaru MySQL, pengembangan web services dengan

SOAP dan REST, serta ratusan peningkatan kemampuan lainnya dibandingkan

versi sebelumnya. Sama dengan web server lainnya, PHP juga bersifat open source

sehingga setiap orang dapat menggunakannya dengan gratis (Komputer, 2015).

2.10 XAMPP

Menurut Wahana Komputer (2015), XAMPP merupakan singkatan dari X

(empat sistem operasi apapun), Apache, MySQL, PHP, Perl. XAMPP adalah tool

yang menyediakan paket perangkat lunak dalam satu buah paket.

Pada paket XAMPP telah terdapat Apache (web server), MySQL

(database), PHP (server side scripting), Pearl, FTP server, PHPMyAdmin, dan

berbagai pustaka bantu lainnya. Jika anda memiliki XAMPP, maka Anda tidak

Page 42: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

25

UIN Syarif Hidayatullah Jakarta

perlu lagi melakukan instalasi dan melakukan konfigurasi web server Apache, PHP,

dan MySQL secara manual. XAMPP akan otomatis menginstalasi dan konfigurasi

untuk anda (Komputer, 2015).

2.11 MySQL

Menurut Wahana Komputer (2015), MySQL disebut SQL yng merupakan

kepanjangan dari Structured Query Language, SQL merupakan bahasa terstuktur

yang khusus digunakan untuk mengolah database . SQL pertama kali didefinisikan

oleh American National Standards Institute (ANSI) pada tahun 1986. MySQL

adalah sebuah sistem manajemen database yang bersifat open source.

MySQL merupakan pasangan serasi dengan PHP. MySQL disebut dan

dikembangkan oleh MySQL AB yang berada di Swedia. MySQL dapat digunakan

untuk membuat dan mengolah database beserta isinya. Anda dapat memanfaatkan

MySQL untuk menambahkan , mengubah dan menghapus data yang berada dalam

database.

My SQL merupakan sistem manajemen database yang bersifat relational.

Hal ini berarti semua data yang dikelola dalam database akan diletakkan pada

beberapa tabel yang terpisah, sehingga manipulasi data akan menjadi jauh lebih

cepat. MySQL dapat digunakan untuk mengelola database mulai dari yang kecil

sampai dengan yang sangat besar.

MySQL juga dapat menjalankan perintah-perintah Structured Query

Language (SQL) untuk mengelola semua database yang ada didalamnya. Hingga

kini MySQL telah berkembang hingga versi 7. MySQL 7 sudah mendukung trigger

untuk memudahkan pengelolaan tabel dalam database (Komputer, 2015).

Page 43: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

26

UIN Syarif Hidayatullah Jakarta

2.14 Studi Literatur Sejenis

Tabel 2.5 Studi Literatur Sejenis dan Peneliti

No. Judul Text Mining Stemming Seleksi

Fitur

Klasifikasi Pengujian

Hasil

Objek

1. Klasifikasi Dokumen Karya Akhir Mahasiswa

menggunakan NBC Berdasarkan Abstrak

karya akhir di jurusan elektro UNJ (2017)

• case folding

• tokenizing,

• filtering,

• stemming

• remove

duplicate

Tidak

dijelaskan

- Naïve Bayes

Classifier

(NBC)

K-Fold Cross

Validation

Abstrak Karya

Akhir Mhs

2. Analisis Data Mining Untuk Pemetaan

Mahasiswa Yang Membutuhkan Bimbingan

Dan Konseling Menggunakan Algoritma

Naïve Bayes Classifier (2018)

Tidak

dijelaskan

Tidak

dijelaskan

-

Naïve Bayes

Classifier

(NBC)

K-Fold Cross

Validation

dengan F1-

Score

• Precision

• Recall

Data Akademik

Mahasiswa

Page 44: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

27

UIN Syarif Hidayatullah Jakarta

• F1 score

3. 4 Komparasi Metode Klasifikasi Data Mining

Algoritma C4.5 Dan Naive Bayes Untuk

Prediksi Penyakit Hepatitis (2017)

Tidak

dijelaskan

- - Naïve Bayes

Classifier

(NBC) dan

C4.5

Confusion

Matrix Dan

Kurva ROC

Data penyakit

hepatitis dari

Machine

Learning

Repository UCI

(Universitas

California

Invene)

4. Klasifikasi Anjuran, Larangan, Dan Informasi

Pada Hadits Shahih

Bukhari Menggunakan Naïve Bayes

Classifier (2017)

• case folding

• filtering

• stopword

removal

• stemming

• tokenization

Tidak

dijelaskan

Chi-

Square

Naïve Bayes

Classifier

(NBC)

-

• Precision

• Recall

• F-measure

Hadits Bukhari

Page 45: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

28

UIN Syarif Hidayatullah Jakarta

5. Implementasi Algoritma Multinomial Naïve

Bayes Pada Sistem Klasifikasi Surat Keluar

(2017)

• Tolowercas

e

• Tokenizing

• Stopword

removal

• stemming

Confix

Stripping

Stemmer

- Multinomial

NBC

Confusion

Matrix

• Accuracy

• Precission

• Recall

• F-Measure

Surat Keluar

6. Analisis Kinerja Algoritma Naïve Bayes

Classifier dengan Seleksi Fitur Chi Square

dan Confix Stripping Stemmer Pada Sistem

Klasifikasi Teks (2019)

• case

folding/toL

owerCase

• filtering

• stopword

removal

• stemming

tokenization

Confix

Stripping

Stemmer

Chi-

Square

Naïve Bayes

Classifier

Confusion

Matrix

• Accuracy

• Precission

• Recall

• F-Measure

Hadits Shahih

Bukhari

Berdasarkan beberapa penelitian diatas, belum ada yang melakukan penelitian mengenai klasifikasi teks dengan objek

terjemahan hadits menggunakan kombinasi Algoritma Naïve Bayes Classifier (NBC) sebagai algoritma klasifikasi, seleksi fitur dengan

Page 46: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

29

UIN Syarif Hidayatullah Jakarta

Chi-Square, dan stemming dengan Confix Stripping Stemmer. Maka berdasarkan studi literatur yang telah dipaparkan di atas, penulis

melakukan penelitian mengenai implementasi Algoritma Naïve Bayes Classifier (NBC) pada tahapan klasifikasi dengan menambahkan

tahapan seleksi fitur sebelum proses klasifikasi menggunakan Algoritma Chi-Square dan menerapkan Algoritma Confix Stripping

Stemmer pada tahapan stemming dan data teks yang akan diklasifikasi menjadi tiga kelas yaitu Anjuran, Larangan dan Informasi adalah

terjemahan Hadits Shahih Bukhari.

Page 47: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

30

BAB III

METODOLOGI PENELITIAN

Bab ini akan membahas tentang metode penelitian yang penulis gunakan

dalam menyusun skripsi ini. Metode penelitian yang digunakan terbagi menjadi dua

yaitu metode pengumpulan data dan metode pengembangan sistem. Penjelasan

lebih lanjutnya adalah sebagai berikut :

3.1 Metode Pengumpulan Data

Dalam penyusunan penelitian ini, dibutuhkan beberapa data dan informasi

yang relevan terkait penelitian yang dilakukan sebagai bahan pendukung kebenaran

materi uraian pembahasan. Metode pengumpulan data yang diterapkan pada

penelitian ini yaitu studi pustaka dan pengumpulan data.

3.1.1. Studi Pustaka

Pada tahapan pengumpulan data dengan cara studi pustaka, penulis

mencari referensi – referensi yang relevan dengan objek yang akan diteliti.

Pencarian referensi dilakukan di perpustakaan, toko buku, maupun secara

online melalui internet. Setelah mendapatkan referensi – referensi yang

relevan, kemudian penulis mencari berbagai informasi yang dibutuhkan

dalam penelitian ini. Adapun informasi yang didapat digunakan dalam

penyusunan landasan teori, metodologi penelitian serta pengembangan

aplikasi secara langsung. Pustaka-pustaka yang dijadikan acuan dapat dilihat

di daftar pustaka sebanyak 32 studi pustaka yang terdiri 5 buku dan 27 jurnal.

3.1.2. Pengumpulan Data

Data yang digunakan dalam penelitian ini adalah kumpulan hadits

shahih Bukhari yang bersumber dari Aplikasi LIDWA “Kitab Hadits 9 Imam”

yang kemudian akan diklasifikasi menjadi tiga kelas yaitu perintah/anjuran,

larangan, dan informasi. Dalam melakukan klasifikasi dokumen hadits,

penulis membutuhkan beberapa dokumen training (hadits yang telah

dikelaskan) dan dokumen testing (hadits yang belum memiliki kelas). Pada

Page 48: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

31

UIN Syarif Hidayatullah Jakarta

penelitian ini digunakan 300 dokumen terjemahan hadits sebagai data

training dan 30 dokumen hadits sebagai data testing.

3.2 Metode Simulasi

Dalam penelitian ini, penulis menggunakan metode simulasi untuk melihat

hasil klasifikasi data teks terjemahan hadits menggunakan algoritma Naïve Bayes

Classifier (NBC) dengan seleksi fitur Chi-Square dan Confix Stripping Stemmer.

Metode simulasi ini dibagi menjadi delapan tahapan yang terdiri dari Problem

Formulation, Conseptual Model, Input/Output Data, Modelling, Simulation,

Verification and Validation, Experimentation, dan Output Analysis.

3.2.1 Formulasi Masalah (Problem Formulation)

Pada tahap ini dilakukan pemilihan suatu permasalahan yang penting

untuk dianalisis dan diselesaikan. Setelah melakukan studi literatur penulis

dapat memformulasikan sebuah masalah mengenai implementasi algoritma

Naïve Bayes Classifier (NBC) untuk mengklasifikasikan terjemahan hadits

Shahih Bukhari kedalam tiga kelas yaitu anjuran, larangan dan informasi

dengan seleksi fitur Chi-Square dan menerapkan algoritma Confix Stripping

Stemmer pada tahapan stemming.

3.2.2 Model Pengkonsepan (Conseptual Model)

Pada tahap ini penulis membuat model konsep yang akan dilakukan

yaitu membahas keseluruhan penelitian ini. Konsep pertama yaitu membuat

konsep pada proses text mining yang digunakan. Kedua, membuat konsep pada

data training dan data testing. Ketiga, membuat konsep untuk yaitu dengan

melihat hasil klasifikasi dan nilai presisi, recall, f-measure dan akurasi dengan

tahap uji pada skenario 1 yaitu menggunakan algoritma Naïve Bayes Classifier

(NBC) tanpa stemming dan tanpa seleksi fitur. Keempat tahap uji pada skenario

2 yaitu menggunakan algoritma Naïve Bayes Classifier (NBC) dengan seleksi

fitur Chi-Square dan tanpa stemming. Kelima tahap uji pada skenario 3 yaitu

menggunakan algoritma Naïve Bayes Classifier (NBC) dengan stemming

menggunakan Confix Stripping Stemmer dan tanpa seleksi fitur. Keenam tahap

uji pada scenario 4 yaitu menggunakan algoritma Naïve Bayes Classifier (NBC)

Page 49: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

32

UIN Syarif Hidayatullah Jakarta

dengan stemming menggunakan Confix Stripping Stemmer dan seleksi fitur Chi-

Square.

3.2.3 Data Masukan/Keluaran (Input/Output Data)

Data masukan seperti kamus kata dasar KBBI, kamus stopword dan data

teks terjemahan hadits menjadi input pada penelitian ini. Data yang digunakan

sebanyak 300 hadits sebagai data training yang sudah diklasifikasi secara

manual kedalam tiga kelas yaitu anjuran, larangan, dan informasi, dan 30 hadits

sebagai data testing . Kitab hadits yang digunakan adalah Shahih Bukhari yang

diambil dari Aplikasi LIDWA “Kitab 9 Imam”. Data pada aplikasi ini diolah

menggunakan algoritma Naïve Bayes Classifier (NBC) dengan seleksi fitur Chi-

Square dan Confix Stripping Stemmer untuk menghasilkan output berupa hasil

klasifikasi dan nilai presisi, recall, f-measure dan akurasi dari skenario 1 yaitu

hanya menggunakan Algoritma Naïve Bayes Classifier (NBC), skenario 2 yaitu

kombinasi Naïve Bayes Classifier (NBC) dan Chi-Square, skenario 3 yaitu

kombinasi Naïve Bayes Classifier (NBC) dan Confix Stripping Stemmer, dan

skenario 4 yaitu kombinasi Naïve Bayes Classifier (NBC), Chi-Square dan

Confix Stripping Stemmer.

3.2.4 Pemodelan (Modelling)

Pada tahap ini penulis melakukan pemodelan dalam membuat

rancangan sistem yang akan dibuat secara manual. Pemodelan atau skenario

yang dibuat yaitu skenario menggunakan algoritma Naïve Bayes Classifier

(NBC) tanpa stemming dan tanpa seleksi fitur, skenario kombinasi antara

algoritma Naïve Bayes Classifier (NBC) dengan seleksi fitur Chi-Square dan

tanpa stemming, skenario kombinasi antara algoritma Naïve Bayes Classifier

(NBC) dengan Confix Stripping Stemmer dan tanpa seleksi fitur, dan skenario

terakhir yaitu kombinasi ketiga algoritma tersebut.

3.2.5 Simulasi (Simulation)

Pada tahapan ini, sisem akan dijalankan untuk mensimulasikan kinerja

masing-masing algoritma sesuai dengan konsep dan skenario yang telah

ditentukan sebelumnya. Simulasi yang akan dilakukan adalah dengan

Page 50: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

33

UIN Syarif Hidayatullah Jakarta

melakukan input dataset latih dan uji, melakukan pelabelan terhadap data latih

secara manual untuk diklasifikasi kelasnya, melakukan pelatihan terhadap data

latih dan melakukan klasifikasi data uji. Hasil simulasi berupa perbandingan

akurasi dari algoritma yang dijadikan penelitian, kemudian akan dicatat dan

kemudian dilakukan tahap verifikasi.

3.2.6 Verifikasi dan Validasi (Verification and Validation)

Pada tahapan ini penulis melakukan verifikasi dan validasi dari tahapan

sebelumnya. Verifikasi dilakukan untuk memastikan adanya kesalahan atau

tidak yang terjadi ketika perhitungan nilai presisi, recall, f-measure dan akurasi

pada algoritma Naïve Bayes Classifier (NBC) dengan seleksi fitur Chi-Square

dan Confix Stripping Stemmer. Validasi dilakukan untuk memastikan

kesesuaian proses simulasi yang dibuat berdasarkaan model pengkonsepan

dengan formulasi masalah yang dibuat. Jika validasi tidak terpenuhi, maka

peneliti kembali ketahap conceptual model untuk membuat model

pengkonsepan yang baru.

3.2.7 Eksperimentasi (Experimentation)

Pada tahapan ini, penulis melakukan eksperimentasi sesuai dengan

model yang dibuat pada saat tahapan pemodelan. Eksperimen disini bertujuan

untuk mengevaluasi hasil simulasi aplikasi.

3.2.8 Analisis keluaran (Output Analysis)

Pada tahap terakhir ini, penulis menganalisis output simulasi yang

dilakukan pada saat eksperimentasi. Output tersebut direpresentasikan dalam

bentuk tabel dan grafik yang menyatakan nilai presisi, recall, f-measure dan

akurasi dari masing-masing skenario.

3.3 Metode Pengujian

Metode pengujian yang digunakan pada penelitian ini adalah confusion

matrix yang bertujuan untuk mengukur kinerja dari model simulasi pada sistem.

Nilai yang di hitung pada pengujian confusion matrix ini adalah nilai akurasi,

presisi, recall, dan f-measure.

Page 51: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

34

UIN Syarif Hidayatullah Jakarta

Setelah simulasi dari setiap skenario sudah dilakukan, maka hasil

klasifikasi yang dilakukan sistem akan dibandingkan dengan klasifikasi yang

dilakukan secara manual seperti pada tabel 2.4. Kemudian hitung nilai-nilai

berikut :

1. Akurasi, bertujuan untuk mengetahui tingkat kedekatan antara nilai

prediksi dengan nilai aktual. Perhitungan nilai akurasi menggunakan

persamaan 2.9.

2. Presisi, bertujuan untuk mengetahui tingkat ketepatan antara informasi

yang diminta oleh user dengan jawaban yang diberikan oleh sistem.

Perhitungan nilai presisi menggunakan persamaan 2.6.

3. Recall, bertujuan untuk mengetahui tingkat keberhasilan sistem dalam

menemukan kembali sebuah informasi. Perhitungan nilai recall

menggunakan persamaan 2.7.

4. F-Measure, merupakan nilai yang mewakili keseluruhan kinerja sistem.

Perhitungan nilai f-measurel menggunakan persamaan 2.8.

Page 52: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

35

UIN Syarif Hidayatullah Jakarta

3.4 Kerangka Berpikir

Gambar 3.1 Kerangka Berpikir

Page 53: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

36

BAB IV

IMPLEMENTASI SIMULASI DAN EKSPERIMEN

4.1 Formulasi Masalah (Problem Formulation)

Pada tahap awal di metode simulasi ini yaitu formulasi masalah, penulis

melakukan identifikasi masalah berdasarkan studi literatur sejenis. Setelah

melakukan studi literatur, terdapat beberapa algoritma yang dapat digunakan dalam

pembuatan sistem klasifikasi teks salah satunya Naïve Bayes Classifier. Sebelum

proses pengklasifikasian, terdapat tahapan stemming. Salah satu metode stemming

yaitu Confix Stripping Stemmer. Tetapi, dengan banyaknya fitur dalam klasifikasi

teks dapat mengurangi performa klasifikasi, maka dari itu pemilihan fitur yang tepat

sangat diperlukan. Salah satu teknik pemilihan fitur adalah dengan teknik Chi-

Square. Implementasi dari kombinasi ketiga Algoritma/metode tersebut akan diuji

performansinya berdasarkan akurasi, presisi, recall, dan f-measure pada sistem

yang dibangun.

Dokumen teks yang akan diklasifikasi berupa terjemahan matan (isi) hadits.

Klasifikasi dibuat menjadi tiga kelas, hadits berisi perintah/anjuran, hadits larangan,

dan hadits yang hanya berisi informasi. Dokumen hadits yang digunakan adalah

terjemahan hadits shahih Imam Bukhari yang diambil dari aplikasi LIDWA “Kitab

Hadits 9 Imam”. Data training yang digunakan berjumlah 300 dengan masing-

masing 100 dokumen hadits per kelas yang telah dikelaskan sebelumnya. Dan 30

dokumen hadits sebagai data testing yang akan diimplementasi pada sistem.

4.2 Model Pengkonsepan (Conceptual Model)

Pada tahap conceptual model ini dilakukan pengkonsepan sistem yang akan

dibangun dan membahas alur keseluruhan dari penelitian ini yang berkaitan dengan

input, proses dan output. Berikut ini merupakan konsep alur keseluruhan dari sistem

yang dibangun oleh peneliti.

Page 54: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

37

UIN Syarif Hidayatullah Jakarta

4.2.1 Model pengkonsepan text mining

Pada penelitian ini proses text mining yang digunakan yaitu

preprocessing dan transforming data. Preprocessing dan transforming data

dilakukan dengan menggunakan Bahasa pemrograman PHP. Tahap

preprocessing meliputi Case folding dan tokenizing. Sedangkan tahap

transforming meliputi stopword removal dan stemming. Tahapan stemming

hanya digunakan pada skenario 3 dan 4, dan algoritma yang digunakan untuk

stemming yaitu Confix Stripping Stemmer.

Tahap preprocessing dapat dilihat pada diagram alur gambar 4.1

berikut:

Gambar 4.1 Flowchart Preprocessing

Berikut ini penjelesan dari tahapan preprocessing :

1. Tahap pertama yaitu case folding, merupakan tahap penyeragaman dari

huruf besar menjadi huruf kecil serta menghilangkan seluruh tanda baca

pada kalimat. Berikut contoh hasil case folding :

Page 55: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

38

UIN Syarif Hidayatullah Jakarta

Teks Case folding

Janganlah kalian berdusta

terhadapku (atas namaku), karena

barangsiapa berdusta terhadapku

dia akan masuk neraka.

janganlah kalian berdusta

terhadapku atas namaku karena

barangsiapa berdusta terhadapku

dia akan masuk neraka

2. Tahap kedua tokenizing yaitu proses pemecahan kalimat menjadi beberapa

kata (token). Berikut contoh hasil tokenizing :

Teks Tokenizing

janganlah kalian berdusta

terhadapku atas namaku karena

barangsiapa berdusta terhadapku

dia akan masuk neraka

[janganlah], [kalian], [berdusta],

[terhadapku], [atas], [namaku],

[karena], [barangsiapa], [berdusta],

[terhadapku], [dia], [akan],

[masuk], [neraka]

Tahap transforming dapat dilihat pada diagram alur gambar 4.2 berikut :

Gambar 4.2 Flowchart Transforming

Page 56: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

39

UIN Syarif Hidayatullah Jakarta

Berikut ini penjelesan dari tahapan transforming :

1. Tahap pertama yaitu stopword removal, merupakan proses menghapus

token yang tidak memiliki makna atau tidak relevan pada suatu dataset

berdasarkan database kamus stopword yang dibentuk. Berikut contoh hasil

stopword removal :

Teks Stoword Removal

[janganlah], [kalian], [berdusta],

[terhadapku], [atas], [namaku],

[karena], [barangsiapa], [berdusta],

[terhadapku], [dia], [akan],

[masuk], [neraka]

[janganlah], [kalian], [berdusta],

[terhadapku], [namaku],

[barangsiapa], [berdusta],

[terhadapku], [neraka]

2. Tahap kedua stemming yaitu tahap pengubahan kata berimbuhan menjadi

kata dasar. tahapan ini dapat mengurangi jumlah kandungan kata. Pada

penelitian ini, metode yang digunakan untuk proses stemming adalah Confix

Stripping Stemmer. Proses peluruhan konfiks beserta penggambarannya

dijelaskan sebagai berikut :

A. Menghapus prefix I (“me-”, ”pe-”, “di-”, “te-”, “ke-”)

B. Menghapus prefix II (“be-”, “pe-”, “se-”, “ke-”)

C. menghapus suffix (“-i”, “-an”, “-kan”)

D. menghapus possessive pronoun (“-ku”, “-mu”, “-nya”)

E. menghapus partikel (“-kah”, “-lah”, “-pun”)

4.2.2 Model pengkonsepan tahap training dan testing

Pada penelitian ini data yang telah dikelaskan sebelumnya akan melalui

tahap training, sedangkan data yang belum dikelaskan akan melalui tahapan

testing.

Page 57: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

40

UIN Syarif Hidayatullah Jakarta

Terdapat beberapa proses yang akan dilalui pada tahap training, antara

lain pengumpulan dokumen training, text preprocessing, text transforming,

seleksi fitur dan pattern discovery. Tetapi tahapan tersebut menyesuaikan pada

skenario yang digunakan. Alur proses training secara umum dapat dilihat pada

gambar 4.4 berikut :

Gambar 4.3 Flowchart Training

Page 58: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

41

UIN Syarif Hidayatullah Jakarta

Penjelasan setiap proses yang dilakukan pada tahap training adalah

sebagai berikut :

1. Masukkan dokumen training sesuai klasifikasi yang sudah

diidentifikasi sebelumnya dan simpan dalam database.

2. Sistem menjalankan tahap text preprocessing terhadap dokumen

training.

3. Hasil tahapan text preprocessing kemudian di proses di tahap text

transforming. Pada tahap transforming

4. Kemudian sistem melakukan feature selection menggunakan Chi-

Square.

5. Setelah melewati tahap feature selection, selanjutnya sistem

melakukan proses penemuan pola (pattern discovery)

menggunakan Algoritma Naïve Bayes Classifier.

6. Sistem mendapatkan hasil probabilitas setiap kelas.

Page 59: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

42

UIN Syarif Hidayatullah Jakarta

Secara garis besar, proses pada tahapan training dan testing sama, yaitu

pengumpulan dokumen testing, text preprocessing, text transforming, dan

pattern discovery. Tetapi pada tahap testing tidak ada proses seleksi fitur, dan

penggunaan stemming menyesuaikan pada skenario yang digunakan. Alur

proses testing secara umum dapat dilihat pada gambar 4.5 berikut :

Gambar 4.4 Flowchart Testing

Page 60: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

43

UIN Syarif Hidayatullah Jakarta

Penjelasan setiap proses yang dilakukan pada tahap training adalah

sebagai berikut :

1. Masukkan dokumen testing yang akan diklasifikasi dan simpan

dalam database.

2. Sistem menjalankan tahap text preprocessing terhadap dokumen

training.

3. Hasil tahapan text preprocessing kemudian di proses di tahap text

transforming.

4. Setelah melewati tahap text transforming, selanjutnya sistem

melakukan proses penemuan pola (pattern discovery) menggunakan

Algoritma Naïve Bayes Classifier.

5. Sistem mendapatkan hasil klasifikasi terpilih terhadap data testing.

Page 61: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

44

UIN Syarif Hidayatullah Jakarta

4.2.3 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier

(NBC) tanpa stemming dan tanpa seleksi fitur

Skenario pertama pada penelitian ini adalah klasifikasi menggunakan

Algoritma Naïve Bayes Classifier (NBC) tanpa melalui stemming pada tahap

text transforming dan tanpa melalui proses seleksi fitur. Alur skenario pertama

ini dapat dilihat pada gambar 4.6 berikut :

Gambar 4.5 Flowchart Skenario 1

Page 62: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

45

UIN Syarif Hidayatullah Jakarta

Berikut penjelasan dari setiap tahapan pada proses klasifikasi

menggunakan skenario 1 :

1. Masukkan dataset (berupa dokumen training atau testing) yang akan

di proses di sistem dan simpan dalam database.

2. Sistem menjalankan tahap text preprocessing (case folding dan

tokenizing) terhadap dataset.

3. Hasil tahapan text preprocessing kemudian di proses di tahap text

transforming (stopword removal, tanpa stemming).

4. Setelah melewati tahap text transforming , selanjutnya sistem

melakukan proses penemuan pola (pattern discovery) menggunakan

Algoritma Naïve Bayes Classifier. Data yang digunakan adalah data

token hasil dari tahap transforming yaitu stopword removal. Alur

proses dengan menggunakan Naïve Bayes Classifier dapat dilihat

pada gambar 4.7 berikut:

Gambar 4.6 Flowchart Naïve Bayes Classifier

Page 63: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

46

UIN Syarif Hidayatullah Jakarta

5. Sistem mendapatkan hasil klasifikasi.

6. Sistem menghitung nilai akurasi, presisi, recall, dan f-measure.

7. Sistem mendapatkan hasil nilai akurasi, presisi, recall, dan f-

measure untuk skenario 1.

4.2.4 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier

(NBC) dengan Chi-Square dan tanpa stemming

Skenario kedua pada penelitian ini adalah klasifikasi menggunakan

Algoritma Naïve Bayes Classifier (NBC) dengan seleksi fitur Chi-Square dan

tanpa melalui stemming pada tahap text transforming. Alur skenario kedua ini

dapat dilihat pada gambar 4.8 berikut :

Gambar 4.7 Flowchart Skenario 2

Page 64: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

47

UIN Syarif Hidayatullah Jakarta

Berikut penjelasan dari setiap tahapan pada proses klasifikasi

menggunakan skenario 2 :

1. Masukkan dataset (berupa dokumen training atau testing) yang akan

di proses di sistem dan simpan dalam database.

2. Sistem menjalankan tahap text preprocessing (case folding dan

tokenizing) terhadap dataset.

3. Hasil tahapan text preprocessing kemudian di proses di tahap text

transforming (stopword removal, tanpa stemming).

4. Setelah melewati tahap text transforming , selanjutnya sistem

melakukan proses seleksi fitur dengan Chi-Square sesuai taraf nyata

(0.05, 0.01, 0.005, 0.001) yang sudah dipilih sebelumnya. Data

testing tidak melalui proses seleksi fitur. Alur proses seleksi fitur

dapat dilihat pada gambar 4.9 berikut :

Gambar 4.8 Flowchart Chi-Square

Page 65: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

48

UIN Syarif Hidayatullah Jakarta

5. Setelah melewati tahap seleksi fitur , selanjutnya sistem melakukan

proses penemuan pola (pattern discovery) menggunakan Algoritma

Naïve Bayes Classifier. Proses penemuan pola mengambil data

token hasil dari Chi-Square.

6. Sistem mendapatkan hasil klasifikasi.

7. Sistem menghitung nilai akurasi, presisi, recall, dan f-measure.

8. Sistem mendapatkan hasil nilai akurasi, presisi, recall, dan f-

measure untuk skenario 2.

4.2.5 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier

(NBC) dengan Confix Stripping Stemmer dan tanpa seleksi fitur

Skenario ketiga pada penelitian ini adalah klasifikasi menggunakan

Algoritma Naïve Bayes Classifier (NBC) dengan Algoritma Confix Stripping

Stemmer untuk proses stemming dan tanpa melalui proses seleksi fitur. Alur

skenario ketiga ini dapat dilihat pada gambar 4.10 berikut :

Gambar 4.9 Flowchart Skenario 3

Page 66: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

49

UIN Syarif Hidayatullah Jakarta

Berikut penjelasan dari setiap tahapan pada proses klasifikasi

menggunakan skenario 3 :

1. Masukkan dataset (berupa dokumen training atau testing) yang akan

di proses di sistem dan simpan dalam database.

2. Sistem menjalankan tahap text preprocessing (case folding dan

tokenizing) terhadap dataset.

3. Hasil tahapan text preprocessing kemudian di proses di tahap text

transforming (stopword removal dan stemming dengan Confix

Stripping Stemmer).

4. Setelah melewati tahap text transforming, selanjutnya sistem

melakukan proses penemuan pola (pattern discovery) menggunakan

Algoritma Naïve Bayes Classifier. Data yang digunakan adalah data

token hasil Confix Stripping Stemmer.

5. Sistem mendapatkan hasil klasifikasi.

6. Sistem menghitung nilai akurasi, presisi, recall, dan f-measure.

7. Sistem mendapatkan hasil nilai akurasi, presisi, recall, dan f-

measure untuk skenario 3.

Page 67: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

50

UIN Syarif Hidayatullah Jakarta

4.2.6 Model pengkonsepan klasifikasi dengan Naïve Bayes Classifier

(NBC) dengan Confix Stripping Stemmer dan Chi-Square

Skenario keempat pada penelitian ini adalah klasifikasi menggunakan

Algoritma Naïve Bayes Classifier (NBC) dengan Algoritma Confix Stripping

Stemmer untuk proses stemming dan menggunakan seleksi fitur Chi-Square.

Alur skenario keempat ini dapat dilihat pada gambar 4.11 berikut :

Gambar 4.10 Flowchart Skenario 4

Page 68: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

51

UIN Syarif Hidayatullah Jakarta

Berikut penjelasan dari setiap tahapan pada proses klasifikasi

menggunakan skenario 4 :

1. Masukkan dataset (berupa dokumen training atau testing) yang akan

di proses di sistem dan simpan dalam database.

2. Sistem menjalankan tahap text preprocessing (case folding dan

tokenizing) terhadap dataset.

3. Hasil tahapan text preprocessing kemudian di proses di tahap text

transforming (stopword removal, dan stemming dengan Confix

Stripping Stemmer).

4. Setelah melewati tahap text transforming , selanjutnya sistem

melakukan proses seleksi fitur dengan Chi-Square sesuai taraf nyata

(0.05, 0.01, 0.005, 0.001) yang sudah dipilih sebelumnya. Data

testing tidak melalui proses seleksi fitur.

5. Setelah melewati tahap seleksi fitur , selanjutnya sistem melakukan

proses penemuan pola (pattern discovery) menggunakan Algoritma

Naïve Bayes Classifier.

6. Sistem mendapatkan hasil klasifikasi.

7. Sistem menghitung nilai akurasi, presisi, recall, dan f-measure.

8. Sistem mendapatkan hasil nilai akurasi, presisi, recall, dan f-

measure untuk skenario 4.

4.3 Data Masukan/Keluaran (Input/Output Data)

4.3.1 Data Masukan (Input)

Data masukan seperti kamus kata dasar KBBI, kamus stopword dan

data teks terjemahan hadits menjadi input pada penelitian ini. Kitab hadits yang

digunakan adalah Shahih Bukhari yang diambil dari Aplikasi LIDWA “Kitab

9 Imam”. Data yang digunakan sebanyak 300 hadits sebagai data training dan

30 hadits sebagai data testing . Data training sebelumnya sudah diklasifikasi

secara manual kedalam tiga kelas yaitu anjuran, larangan, dan informasi,

dengan jumlah 100 hadits tiap kelas.

.

Page 69: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

52

UIN Syarif Hidayatullah Jakarta

4.3.2 Data Keluaran (Output)

Data keluaran (output) dari simulasi ini adalah hasil klasifikasi dari 30

data testing dan nilai akurasi, presisi, recall, dan f-measure dari skenario 1,

skenario 2, skenario 3, dan skenario 4.

4.4 Pemodelan (Modelling)

4.4.1 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) tanpa

stemming dan tanpa seleksi fitur)

Skenario pertama pada penelitian ini yaitu konstruksi klasifikasi text

terjemahan hadits kedalam tiga kelas yaitu anjuran, larangan, dan informasi

dengan menggunakan algoritma Naïve Bayes Classifier (NBC). Pada skenario

ini, tidak digunakan proses stemming pada tahap transforming. Proses training

dan testing pada skenario ini melalui tahapan-tahapan yang sama. Berikut

penjelasan keseluruhan konstruksi klasifikasi terjemahan hadits pada skenario

1 :

1. Mengumpulkan data training dan data testing kemudian siapkan

masing-masing dalam file dengan format .csv. Data training terlebih

dahulu dikelaskan secara manual ke dalam tiga kelas yaitu anjuran,

larangan, dan informasi.

2. Melakukan proses text mining untuk data training sesuai dengan

tahapan 4.2.1. Sebagai contoh diambil 9 terjemahan hadits dengan

masing-masing kelas berjumlah 3 terjemahan hadits.

Contoh data training terjemahan hadits

No. Teks Kelas

1. "Jika anjing menjilat bejana seorang

dari kalian, maka hendaklah ia cuci

hingga tujuh kali."

anjuran

2. "Hendaklah kalian mulai dari yang

sebelah kanan dan anggota wudhunya."

anjuran

Page 70: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

53

UIN Syarif Hidayatullah Jakarta

3. "Barangsiapa berwudhu hendaklah

mengeluarkan (air dari hidung), dan

barangsiapa beristinja' dengan batu

hendaklah dengan bilangan ganjil."

anjuran

4. "Janganlah kalian kembali menjadi

kafir, sehingga kalian saling

membunuh satu sama lain."

larangan

5. "Janganlah salah seorang dari kalian

sengaja shalat ketika matahari sedang

terbit dan atau ketika saat terbenam."

larangan

6. “Janganlah kalian larang para wanita

mendatangi masjid-masjid Allah."

larangan

7. "Iman memiliki lebih dari enam puluh

cabang, dan malu adalah bagian dari

iman".

informasi

8. "Sesungguhnya ada orang-orang yang

mendistribusikan harta Allah dengan

jalan yang tidak benar, maka bagi

mereka neraka pada hari qiyamat"

informasi

9. "Sungguh celaka aku bila tidak berbuat

adil"

informasi

a. Tahap preprocessing data training

1) Case folding

No. Case folding

1. jika anjing menjilat bejana seorang dari kalian maka

hendaklah ia cuci hingga tujuh kali

2. hendaklah kalian mulai dari yang sebelah kanan dan

anggota wudhunya

Page 71: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

54

UIN Syarif Hidayatullah Jakarta

3. barangsiapa berwudhu hendaklah mengeluarkan air

dari hidung dan barangsiapa beristinja dengan batu

hendaklah dengan bilangan ganjil

4. janganlah kalian kembali menjadi kafir sehingga

kalian saling membunuh satu sama lain

5. janganlah salah seorang dari kalian sengaja shalat

ketika matahari sedang terbit dan atau ketika saat

terbenam

6. janganlah kalian larang para wanita mendatangi

masjid-masjid allah

7. iman memiliki lebih dari enam puluh cabang dan malu

adalah bagian dari iman

8. sesungguhnya ada orang-orang yang

mendistribusikan harta allah dengan jalan yang tidak

benar maka bagi mereka neraka pada hari qiyamat

9. sungguh celaka aku bila tidak berbuat adil

2) Tokenizing

No. Tokenizing

1. [jika] [anjing] [menjilat] [bejana] [seorang] [dari]

[kalian] [maka] [hendaklah] [ia] [cuci] [hingga]

[tujuh] [kali]

Page 72: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

55

UIN Syarif Hidayatullah Jakarta

2. [hendaklah] [kalian] [mulai] [dari] [yang] [sebelah]

[kanan] [dan] [anggota] [wudhunya]

3. [barangsiapa] [berwudhu] [hendaklah]

[mengeluarkan] [air] [dari] [hidung] [dan]

[barangsiapa] [beristinja] [dengan] [batu] [hendaklah]

[dengan] [bilangan] [ganjil]

4. [janganlah] [kalian] [kembali] [menjadi] [kafir]

[sehingga] [kalian] [saling] [membunuh] [satu]

[sama] [lain]

5. [janganlah] [salah] [seorang] [dari] [kalian] [sengaja]

[shalat] [ketika] [matahari] [sedang] [terbit] [dan]

[atau] [ketika] [saat] [terbenam]

6. [janganlah] [kalian] [larang] [para] [wanita]

[mendatangi] [masjid] [masjid] [allah]

7. [iman] [memiliki] [lebih] [dari] [enam] [puluh]

[cabang] [dan] [malu] [adalah] [bagian] [dari] [iman]

8. [sesungguhnya] [ada] [orang] [orang] [yang]

[mendistribusikan] [harta] [allah] [dengan] [jalan]

[yang] [tidak] [benar] [maka] [bagi] [mereka] [neraka]

[pada] [hari] [qiyamat]

9. [sungguh] [celaka] [aku] [bila] [tidak] [berbuat] [adil]

b. Tahap transforming data training

1) Stopword removal

No. Stopword removal

1. [anjing] [menjilat] [bejana] [hendaklah] [cuci] [tujuh]

Page 73: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

56

UIN Syarif Hidayatullah Jakarta

2. [hendaklah] [sebelah] [kanan] [anggota] [wudhunya]

3. [barangsiapa] [berwudhu] [hendaklah]

[mengeluarkan] [air] [hidung] [barangsiapa]

[beristinja] [batu] [hendaklah] [bilangan] [ganjil]

4. [janganlah] [kafir] [saling] [membunuh]

5. [janganlah] [sengaja] [shalat] [matahari] [terbit]

[terbenam]

6. [janganlah] [larang] [wanita] [mendatangi] [masjid]

[masjid] [allah]

7. [iman] [enam] [puluh] [cabang] [malu] [iman]

8. [sesungguhnya] [mendistribusikan] [harta] [allah]

[neraka] [qiyamat]

9. [sungguh] [celaka] [berbuat] [adil]

3. Token-token hasil stopword removal selanjutnya diproses ke tahap

pattern discovery. Berikut proses perhitungan pada tahapan pattern

discovery dengan menggunakan algoritma Naïve Bayes Classifier :

Hitung probabilitas kemunculan tiap kata dengan menggunakan

persamaan 2.1.

Sebagai contoh, hitung probabilitas kata “janganlah” pada setiap kelas.

P(janganlah|anjuran) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛𝑙𝑎ℎ|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

21+54

= 1

75

= 0.013333333

P(janganlah|larangan) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛𝑙𝑎ℎ|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

Page 74: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

57

UIN Syarif Hidayatullah Jakarta

= 3+1

17+54

= 4

71

= 0.056338028

P(janganlah|informasi) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛𝑙𝑎ℎ|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

16+54

= 1

70

= 0.014285714

Hasil probabilitas semua kata pada data training:

No. Kata Anjuran Larangan Informasi

1 anjing 0.026666667

0.014084507 0.014285714

2 menjilat 0.026666667

0.014084507 0.014285714

3 bejana 0.026666667

0.014084507 0.014285714

4 hendaklah 0.066666667

0.014084507 0.014285714

5 cuci 0.026666667

0.014084507 0.014285714

6 tujuh 0.026666667

0.014084507 0.014285714

7 sebelah 0.026666667

0.014084507 0.014285714

8 kanan 0.026666667

0.014084507 0.014285714

9 anggota 0.026666667

0.014084507 0.014285714

10 wudhunya 0.026666667

0.014084507 0.014285714

11 berwudhu 0.026666667

0.014084507 0.014285714

12 mengeluarkan 0.026666667

0.014084507 0.014285714

13 air 0.026666667

0.014084507 0.014285714

Page 75: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

58

UIN Syarif Hidayatullah Jakarta

14 hidung 0.026666667

0.014084507 0.014285714

15 beristinja 0.026666667

0.014084507 0.014285714

16 batu 0.026666667

0.014084507 0.014285714

17 bilangan 0.026666667

0.014084507 0.014285714

18 ganjil 0.026666667

0.014084507 0.014285714

19 janganlah 0.013333333

0.056338028 0.014285714

20 kafir 0.013333333

0.028169014 0.014285714

21 saling 0.013333333

0.028169014 0.014285714

22 membunuh 0.013333333

0.028169014 0.014285714

23 sengaja 0.013333333

0.028169014 0.014285714

24 shalat 0.013333333

0.028169014 0.014285714

25 matahari 0.013333333

0.028169014 0.014285714

26 terbit 0.013333333

0.028169014 0.014285714

27 terbenam 0.013333333

0.028169014 0.014285714

28 larang 0.013333333

0.028169014 0.014285714

29 wanita 0.013333333

0.028169014 0.014285714

30 mendatangi 0.013333333

0.028169014 0.014285714

31 masjid 0.013333333

0.042253521 0.014285714

32 allah 0.013333333

0.028169014 0.028571429

33 iman 0.013333333 0.014084507 0.042857143

34 enam 0.013333333 0.014084507 0.028571429

35 puluh 0.013333333 0.014084507 0.028571429

36 cabang 0.013333333 0.014084507 0.028571429

Page 76: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

59

UIN Syarif Hidayatullah Jakarta

37 malu 0.013333333 0.014084507 0.028571429

38 sesungguhnya 0.013333333 0.014084507 0.028571429

39 mendistribusikan 0.013333333 0.014084507 0.028571429

40 harta 0.013333333 0.014084507 0.028571429

41 neraka 0.013333333 0.014084507 0.028571429

42 qiyamat 0.013333333 0.014084507 0.028571429

43 sungguh 0.013333333 0.014084507 0.028571429

44 celaka 0.013333333 0.014084507 0.028571429

45 berbuat 0.013333333 0.014084507 0.028571429

46 adil 0.013333333 0.014084507 0.042857143

4. Setelah semua kata pada data training mendapatkan nilai

probabilitasnya, maka selanjutnya data testing yang diproses mulai dari

preprocessing, transforming, dan pattern discovery.

Contoh data testing terjemahan hadits :

“Janganlah kalian mengangkat kepala kalian hingga para laki - laki

telah duduk.”

a. Tahap preprocessing data testing

1) Case folding

Teks Hasil Case folding

“Janganlah kalian mengangkat

kepala kalian hingga para laki

- laki telah duduk.”

janganlah kalian

mengangkat kepala kalian

hingga para laki laki telah

duduk

2) Tokenizing

Teks Hasil Tokenizing

Page 77: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

60

UIN Syarif Hidayatullah Jakarta

janganlah kalian mengangkat

kepala kalian hingga para laki

laki telah duduk

[janganlah] [kalian]

[mengangkat] [kepala]

[kalian] [hingga] [para]

[laki] [laki] [telah] [duduk]

b. Tahap transforming data testing

1) Stopword removal

Teks Hasil Stopword removal

[janganlah] [kalian]

[mengangkat] [kepala]

[kalian] [hingga] [para] [lak]I

[laki] [telah] [duduk]

[janganlah] [mengangkat]

[kepala] [lak]I [laki] [duduk]

5. Pada tahap pattern discovery data testing, proses yang pertama yaitu

pengecekan apakah kata yang di proses sesuai atau sama dengan daftar

kata pada data training yang sudah memiliki nilai probabilitas

sebelumnya. Jika sesusai maka nilai probabilitas yang sudah ada

tersebut diambil sebagai nilai probabilitas kata yang di proses. Jika

tidak ada yang sesuai dengan daftar kata pada data training maka

hitung nilai probabilitas kata tersebut dengan menggunakan persamaan

2.1.

Contoh kata “duduk” Tidak ada yang sama pada daftar kata data

training maka dihitung nilai probabilitasnya :

P(duduk|anjuran) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

21+54

= 1

75

= 0.013333333

P(duduk|larangan) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

Page 78: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

61

UIN Syarif Hidayatullah Jakarta

= 0+1

17+54

= 1

71

= 0.014084507

P(duduk|informasi) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

16+54

= 1

70

= 0.014285714

Hasil probabilitas data testing:

No. Kata anjuran larangan informasi

1. janganlah 0.013333333 0.056338028 0.014285714

2. mengangkat 0.013333333 0.014084507 0.014285714

3. kepala 0.013333333 0.014084507 0.014285714

4. laki 0.013333333 0.014084507 0.014285714

5. duduk 0.013333333 0.014084507 0.014285714

6. Jika semua kata pada data testing sudah mendapatkan nilai

probabilitasnya maka selanjutnya masuk ke proses terakhir yaitu

penentuan hasil klasifikasi dengan cara berikut :

Pertama hitung nilai probabilitas tiap kelas dengan persamaan 2.3,

contoh hitung nilai probabilitas kelas “anjuran” :

P(anjuran) = 1

3

= 0.333333333

Hasil nilai probabilitas tiap kelas :

Kelas P (c)

Page 79: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

62

UIN Syarif Hidayatullah Jakarta

Anjuran 0.333333333

Larangan 0.333333333

Informasi 0.333333333

Kemudian untuk menentukan hasil klasifikasi dari data testing maka

dihitung perkalian dari nilai probabilitas semua kata pada data testing

dengan nilai probabilitas tiap kelas sesuai dengan persamaan 2.2 .

Perhitungan tersebut dilakukan terhadap semua kelas. Contoh :

Anjuran = 0.013333333 x 0.013333333 x 0.013333333 x 0.013333333

x 0.013333333 x 0.333333333

=0.00000000014047

Hasil nilai akhir probabilitias semua kata terhadap setiap kelas :

Anjuran Larangan Informasi

0.00000000014047 0.00000000073900 0.0000000001983

Setelah nilai akhir dihitung, maka cari nilai maksimal atau yang

tertinggi dari semua kelas. Hasil klasifikasi adalah kelas dengan nilai

paling tinggi. Pada contoh pemodelan skenario 1 ini hasil

klasifikasinya adalah “Larangan” dengan nilai 0.00000000073900.

4.4.2 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) dengan

Chi-Square dan tanpa stemming

Skenario kedua pada penelitian ini yaitu konstruksi klasifikasi teks

terjemahan hadits kedalam tiga kelas yaitu anjuran, larangan, dan informasi

dengan menggunakan algoritma Naïve Bayes Classifier (NBC) dan

menggunakan seleksi fitur Chi-Square. Pada skenario ini, tidak digunakan

proses stemming pada tahap transforming. Proses training dan testing pada

skenario ini melalui tahapan-tahapan yang sama pada preprocessing dan

transforming seperti pada skenario 1. Tetapi pada skenario ini, data training

akan melalui tahapan seleksi fitur, sedangkan data testing tidak melalui tahap

seleksi fitur karena jumlah fitur yang sedikit dan belum adanya pengkelasan.

Page 80: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

63

UIN Syarif Hidayatullah Jakarta

Berikut penjelasan keseluruhan konstruksi klasifikasi terjemahan hadits pada

skenario 2 :

1. Mengumpulkan data training dan data testing kemudian siapkan

masing-masing dalam file dengan format .csv. Data training terlebih

dahulu dikelaskan secara manual ke dalam tiga kelas yaitu anjuran,

larangan, dan informasi.

2. Melakukan proses text mining untuk data training sesuai dengan

tahapan 4.2.1. Sebagai contoh diambil 9 terjemahan hadits dengan

masing-masing kelas berjumlah 3 terjemahan hadits.

Contoh data training terjemahan hadits

No. Teks Kelas

1. "Jika anjing menjilat bejana seorang

dari kalian, maka hendaklah ia cuci

hingga tujuh kali."

anjuran

2. "Hendaklah kalian mulai dari yang

sebelah kanan dan anggota wudhunya."

anjuran

3. "Barangsiapa berwudhu hendaklah

mengeluarkan (air dari hidung), dan

barangsiapa beristinja' dengan batu

hendaklah dengan bilangan ganjil."

anjuran

4. "Janganlah kalian kembali menjadi

kafir, sehingga kalian saling

membunuh satu sama lain."

larangan

5. "Janganlah salah seorang dari kalian

sengaja shalat ketika matahari sedang

terbit dan atau ketika saat terbenam."

larangan

6. 'Janganlah kalian larang para wanita

mendatangi masjid-masjid Allah."

larangan

Page 81: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

64

UIN Syarif Hidayatullah Jakarta

7. "Iman memiliki lebih dari enam puluh

cabang, dan malu adalah bagian dari

iman".

informasi

8. "Sesungguhnya ada orang-orang yang

mendistribusikan harta Allah dengan

jalan yang tidak benar, maka bagi

mereka neraka pada hari qiyamat"

informasi

9. "Sungguh celaka aku bila tidak berbuat

adil"

informasi

a. Tahap preprocessing data training

1) Case folding

No. Case folding

1. jika anjing menjilat bejana seorang dari kalian maka

hendaklah ia cuci hingga tujuh kali

2. hendaklah kalian mulai dari yang sebelah kanan dan

anggota wudhunya

3. barangsiapa berwudhu hendaklah mengeluarkan air

dari hidung dan barangsiapa beristinja dengan batu

hendaklah dengan bilangan ganjil

4. janganlah kalian kembali menjadi kafir sehingga

kalian saling membunuh satu sama lain

5. janganlah salah seorang dari kalian sengaja shalat

ketika matahari sedang terbit dan atau ketika saat

terbenam

6. janganlah kalian larang para wanita mendatangi

masjid-masjid allah

Page 82: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

65

UIN Syarif Hidayatullah Jakarta

7. iman memiliki lebih dari enam puluh cabang dan malu

adalah bagian dari iman

8. sesungguhnya ada orang-orang yang

mendistribusikan harta allah dengan jalan yang tidak

benar maka bagi mereka neraka pada hari qiyamat

9. sungguh celaka aku bila tidak berbuat adil

2) Tokenizing

No. Tokenizing

1. [jika] [anjing] [menjilat] [bejana] [seorang] [dari]

[kalian] [maka] [hendaklah] [ia] [cuci] [hingga]

[tujuh] [kali]

2. [hendaklah] [kalian] [mulai] [dari] [yang] [sebelah]

[kanan] [dan] [anggota] [wudhunya]

3. [barangsiapa] [berwudhu] [hendaklah]

[mengeluarkan] [air] [dari] [hidung] [dan]

[barangsiapa] [beristinja] [dengan] [batu] [hendaklah]

[dengan] [bilangan] [ganjil]

4. [janganlah] [kalian] [kembali] [menjadi] [kafir]

[sehingga] [kalian] [saling] [membunuh] [satu]

[sama] [lain]

5. [janganlah] [salah] [seorang] [dari] [kalian] [sengaja]

[shalat] [ketika] [matahari] [sedang] [terbit] [dan]

[atau] [ketika] [saat] [terbenam]

6. [janganlah] [kalian] [larang] [para] [wanita]

[mendatangi] [masjid] [masjid] [allah]

Page 83: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

66

UIN Syarif Hidayatullah Jakarta

7. [iman] [memiliki] [lebih] [dari] [enam] [puluh]

[cabang] [dan] [malu] [adalah] [bagian] [dari] [iman]

8. [sesungguhnya] [ada] [orang] [orang] [yang]

[mendistribusikan] [harta] [allah] [dengan] [jalan]

[yang] [tidak] [benar] [maka] [bagi] [mereka] [neraka]

[pada] [hari] [qiyamat]

9. [sungguh] [celaka] [aku] [bila] [tidak] [berbuat] [adil]

b. Tahap transforming data training

1) Stopword removal

No. Stopword removal

1. [anjing] [menjilat] [bejana] [hendaklah] [cuci] [tujuh]

2. [hendaklah] [sebelah] [kanan] [anggota] [wudhunya]

3. [barangsiapa] [berwudhu] [hendaklah]

[mengeluarkan] [air] [hidung] [barangsiapa]

[beristinja] [batu] [hendaklah] [bilangan] [ganjil]

4. [janganlah] [kafir] [saling] [membunuh]

5. [janganlah] [sengaja] [shalat] [matahari] [terbit]

[terbenam]

6. [janganlah] [larang] [wanita] [mendatangi] [masjid]

[masjid] [allah]

7. [iman] [enam] [puluh] [cabang] [malu] [iman]

8. [sesungguhnya] [mendistribusikan] [harta] [allah]

[neraka] [qiyamat]

9. [sungguh] [celaka] [berbuat] [adil]

Page 84: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

67

UIN Syarif Hidayatullah Jakarta

3. Token atau kata-kata hasil transforming selanjutnya di proses kedalam

seleksi fitur untuk mengurangi dimensi dengan menyeleksi kata-kata

yang memiliki nilai chi-square (x2) lebih besar atau sama dengan nilai

kritis pada taraf nyata α 0.05, 0.01, 0.005, dan 0.001 yaitu 3.84, 6.63,

7.83, dan 10.83, maka kata yang tidak memenuhi syarat tersebut tidak

digunakan lagi untuk proses selanjutnya. Berikut proses seleksi fitur

dengan algoritma Chi-square :

Pilih taraf nyata. Contoh memilih taraf nyata 0.05 dengan nilai kritis

3.84.

Setelah itu hitung nilai chi-square (x2) untuk setiap kata dengan

menggunakan persamaan 2.5. Contoh hitung nilai x2 dari kata

“hendaklah” pada tiap kelas:

x2 (“hendaklah”,anjuran) = 9(3.6−0.0)2

(3+0)(0+6)(3+0)(0+6)

= 9 . 324

324

= 9

x2 (“hendaklah”,larangan) = 9(0.3−3.3)2

(0+3)(3+3)(0+3)(3+3)

= 9 . 81

324

= 2,25

x2 (“hendaklah”,informasi) = 9(0.3−3.3)2

(0+3)(3+3)(0+3)(3+3)

= 9 . 81

324

= 2,25

Hasil beberapa nilai chi-square (x2) :

No. Kata kelas A B C D Ntr

x2

1 anjing 1

1 0 2 6 9 2.25

Page 85: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

68

UIN Syarif Hidayatullah Jakarta

2 menjilat 1

1 0 2 6 9 2.25

3 bejana 1

1 0 2 6 9 2.25

4 hendaklah 1

3 0 0 6 9 9

5 cuci 1

1 0 2 6 9 2.25

6 tujuh 1

1 0 2 6 9 2.25

7 sebelah 1

1 0 2 6 9 2.25

8 kanan 1

1 0 2 6 9 2.25

9 anggota 1

1 0 2 6 9 2.25

10 wudhunya 1

1 0 2 6 9 2.25

11 Berwudhu 2

0 1 3 5 9 0.5625

12 Mengeluarkan 2

0 1 3 5 9 0.5625

13 Air 2

0 1 3 5 9 0.5625

14 Hidung 2

0 1 3 5 9 0.5625

15 Beristinja 2

0 1 3 5 9 0.5625

16 Batu 2

0 1 3 5 9 0.5625

17 Bilangan 2

0 1 3 5 9 0.5625

18 Ganjil 2

0 1 3 5 9 0.5625

19 Janganlah 2

3 0 0 6 9 9

20 kafir 2

1 0 2 6 9 2.25

21 saling 3 0 1 3 5 9 0.5625

22 membunuh 3 0 1 3 5 9 0.5625

23 sengaja 3 0 1 3 5 9 0.5625

24 shalat 3 0 1 3 5 9 0.5625

Page 86: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

69

UIN Syarif Hidayatullah Jakarta

25 matahari 3 0 1 3 5 9 0.5625

26 terbit 3 0 1 3 5 9 0.5625

27 terbenam 3 0 1 3 5 9 0.5625

28 larang 3 0 1 3 5 9 0.5625

29 wanita 3 0 1 3 5 9 0.5625

30 mendatangi 3 0 1 3 5 9 0.5625

Setelah mendapatkan nilai chi-square (x2) dari semua kata maka

dilakukan penyeleksian, yaitu mengambil kata-kata yang memiliki

nilai x2 lebih besar atau sama dengan nilai yang sudah dipilih.

Kata-kata yang terpilih :

taraf nyata nilai kritis kata x2

0.05 3.84 hendaklah

9

janganlah

9

sungguh

5.14

0.01 6.63 hendaklah

9

janganlah

9

0.005 7.83 hendaklah

9

janganlah

9

0.001 10.83 NULL

NULL

Karena di awal taraf nyata yg di pilih 0.05 maka kata yang di ambil

adalah kata yang memiliki nilai x2 lebih besar atau sama dengan nilai

kritis yaitu 3.84. Kata yang di ambil yaitu “hendaklah”, “janganlah”,

dan “sungguh’ Dari hasil proses seleksi fitur dengan chi-square,

jumlah kata yang tadinya berjumlah 54 menjadi berjumlah 8

(hendaklah = 4, janganlah = 3, sungguh = 1) dan akan diproses ke

tahapan pattern discovery.

Page 87: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

70

UIN Syarif Hidayatullah Jakarta

4. Kata yang telah diseleksi dari hasil seleksi fitur kemudian di proses

pada tahapan pattern discovery menggunakan algoritma Naïve Bayes

Classifier (NBC). Berikut proses pattern discovery :

Hitung probabilitas kemunculan tiap kata dengan menggunakan

persamaan 2.1.

Sebagai contoh, hitung probabilitas kata “janganlah” pada setiap kelas.

P(janganlah|anjuran) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛𝑙𝑎ℎ|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

4+8

= 1

12

= 0.083333333

P(janganlah|larangan) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛𝑙𝑎ℎ|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 3+1

3+8

= 4

11

= 0.363636364

P(janganlah|informasi) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛𝑙𝑎ℎ|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

1+8

= 1

9

= 0.111111111

Hasil probabilitas semua kata pada data training:

Kata P(Wkj=Anjuran P(Wkj=Larangan P(Wkj=informasi

hendaklah 0.416666667 0.090909091 0.111111111

Page 88: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

71

UIN Syarif Hidayatullah Jakarta

janganlah 0.083333333 0.363636364 0.111111111

sungguh 0.083333333 0.090909091 0.222222222

5. Setelah semua kata pada data training mendapatkan nilai

probabilitasnya, maka selanjutnya data testing yang diproses mulai dari

preprocessing, transforming, dan pattern discovery.

Contoh data testing terjemahan hadits :

“Janganlah kalian mengangkat kepala kalian hingga para laki - laki

telah duduk.”

a. Tahap preprocessing data testing

1) Case folding

Teks Hasil Case folding

“Janganlah kalian mengangkat

kepala kalian hingga para laki

- laki telah duduk.”

janganlah kalian

mengangkat kepala kalian

hingga para laki laki telah

duduk

2) Tokenizing

Teks Hasil Tokenizing

janganlah kalian mengangkat

kepala kalian hingga para laki

laki telah duduk

[janganlah] [kalian]

[mengangkat] [kepala]

[kalian] [hingga] [para]

[laki] [laki] [telah] [duduk]

b. Tahap transforming data testing

1) Stopword removal

Teks Hasil Stopword removal

Page 89: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

72

UIN Syarif Hidayatullah Jakarta

[janganlah] [kalian]

[mengangkat] [kepala]

[kalian] [hingga] [para] [lak]I

[laki] [telah] [duduk]

[janganlah] [mengangkat]

[kepala] [lak]I [laki] [duduk]

6. Pada tahap pattern discovery data testing, proses yang pertama yaitu

pengecekan apakah kata yang di proses sesuai atau sama dengan daftar

kata pada data training yang sudah memiliki nilai probabilitas

sebelumnya. Jika sesusai maka nilai probabilitas yang sudah ada

tersebut diambil sebagai nilai probabilitas kata yang di proses. Jika

tidak ada yang sesuai dengan daftar kata pada data training maka

hitung nilai probabilitas kata tersebut dengan menggunakan persamaan

2.1.

Contoh kata “duduk” Tidak ada yang sama pada daftar kata data

training maka dihitung nilai probabilitasnya :

P(duduk|anjuran) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

4+8

= 1

12

= 0.083333333

P(duduk|larangan) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

3+8

= 1

11

= 0.090909091

P(duduk|informasi) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

1+8

= 1

9

Page 90: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

73

UIN Syarif Hidayatullah Jakarta

= 0.111111111

Hasil probabilitas data testing:

No. Kata anjuran larangan informasi

1. janganlah 0.08333333 0.363636364 0.11111111111

2. mengangkat 0.083333333 0.090909091 0.111111111

3. kepala 0.083333333 0.090909091 0.111111111

4. laki 0.083333333 0.090909091 0.111111111

5. duduk 0.083333333 0.090909091 0.111111111

7. Jika semua kata pada data testing sudah mendapatkan nilai

probabilitasnya maka selanjutnya masuk ke proses terakhir yaitu

penentuan hasil klasifikasi dengan cara berikut :

Pertama hitung nilai probabilitas tiap kelas dengan persamaan 2.3.

Contoh hitung nilai probabilitas kelas “anjuran” :

P(anjuran) = 1

3

= 0.333333333

Hasil nilai probabilitas tiap kelas :

Kelas P (c)

Anjuran 0.333333333

Larangan 0.333333333

Informasi 0.333333333

Kemudian untuk menentukan hasil klasifikasi dari data testing maka

dihitung perkalian dari nilai probabilitas semua kata pada data testing

dengan nilai probabilitas tiap kelas sesuai dengan persamaan 2.2.

Perhitungan tersebut dilakukan terhadap semua kelas. Contoh :

Anjuran = 2.25 x 0.083333333 x 0.083333333 x 0.083333333

Page 91: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

74

UIN Syarif Hidayatullah Jakarta

x 0.083333333 x 0.333333333

= 0.00003616898148

Hasil nilai akhir probabilitias semua kata terhadap setiap kelas :

Anjuran Larangan Informasi

0.00000133959191 0.00000827895097 0.0000056450293

Setelah nilai akhir dihitung, maka cari nilai maksimal atau yang

tertinggi dari semua kelas. Hasil klasifikasi adalah kelas dengan nilai

paling tinggi. Pada contoh pemodelan skenario 2 ini hasil

klasifikasinya adalah “Larangan” dengan nilai 0.00000827895097.

4.4.3 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) dengan

Confix Stripping Stemmer dan tanpa seleksi fitur

Skenario ketiga pada penelitian ini yaitu konstruksi klasifikasi teks

terjemahan hadits kedalam tiga kelas yaitu anjuran, larangan, dan informasi

dengan menggunakan algoritma Naïve Bayes Classifier (NBC) dan

menggunakan Confix Stripping Stemmer pada tahap stemming saat

transforming data. Proses training dan testing pada skenario ini melalui

tahapan-tahapan yang sama. Berikut penjelasan keseluruhan konstruksi

klasifikasi terjemahan hadits pada skenario 3 :

1. Mengumpulkan data training dan data testing kemudian siapkan

masing-masing dalam file dengan format .csv. Data training terlebih

dahulu dikelaskan secara manual ke dalam tiga kelas yaitu anjuran,

larangan, dan informasi.

2. Melakukan proses text mining untuk data training sesuai dengan

tahapan 4.2.1. Sebagai contoh diambil 9 terjemahan hadits dengan

masing-masing kelas berjumlah 3 terjemahan hadits.

Contoh data training terjemahan hadits

No. Teks Kelas

Page 92: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

75

UIN Syarif Hidayatullah Jakarta

1. "Jika anjing menjilat bejana seorang

dari kalian, maka hendaklah ia cuci

hingga tujuh kali."

anjuran

2. "Hendaklah kalian mulai dari yang

sebelah kanan dan anggota wudhunya."

anjuran

3. "Barangsiapa berwudhu hendaklah

mengeluarkan (air dari hidung), dan

barangsiapa beristinja' dengan batu

hendaklah dengan bilangan ganjil."

anjuran

4. "Janganlah kalian kembali menjadi

kafir, sehingga kalian saling

membunuh satu sama lain."

larangan

5. "Janganlah salah seorang dari kalian

sengaja shalat ketika matahari sedang

terbit dan atau ketika saat terbenam."

larangan

6. 'Janganlah kalian larang para wanita

mendatangi masjid-masjid Allah."

larangan

7. "Iman memiliki lebih dari enam puluh

cabang, dan malu adalah bagian dari

iman".

informasi

8. "Sesungguhnya ada orang-orang yang

mendistribusikan harta Allah dengan

jalan yang tidak benar, maka bagi

mereka neraka pada hari qiyamat"

informasi

9. "Sungguh celaka aku bila tidak berbuat

adil"

informasi

a. Tahap preprocessing data training

1) Case folding

No. Case folding

Page 93: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

76

UIN Syarif Hidayatullah Jakarta

1. jika anjing menjilat bejana seorang dari kalian maka

hendaklah ia cuci hingga tujuh kali

2. hendaklah kalian mulai dari yang sebelah kanan dan

anggota wudhunya

3. barangsiapa berwudhu hendaklah mengeluarkan air

dari hidung dan barangsiapa beristinja dengan batu

hendaklah dengan bilangan ganjil

4. janganlah kalian kembali menjadi kafir sehingga

kalian saling membunuh satu sama lain

5. janganlah salah seorang dari kalian sengaja shalat

ketika matahari sedang terbit dan atau ketika saat

terbenam

6. janganlah kalian larang para wanita mendatangi

masjid-masjid allah

7. iman memiliki lebih dari enam puluh cabang dan malu

adalah bagian dari iman

8. sesungguhnya ada orang-orang yang

mendistribusikan harta allah dengan jalan yang tidak

benar maka bagi mereka neraka pada hari qiyamat

9. sungguh celaka aku bila tidak berbuat adil

2) Tokenizing

No. Tokenizing

1. [jika] [anjing] [menjilat] [bejana] [seorang] [dari]

[kalian] [maka] [hendaklah] [ia] [cuci] [hingga]

[tujuh] [kali]

Page 94: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

77

UIN Syarif Hidayatullah Jakarta

2. [hendaklah] [kalian] [mulai] [dari] [yang] [sebelah]

[kanan] [dan] [anggota] [wudhunya]

3. [barangsiapa] [berwudhu] [hendaklah]

[mengeluarkan] [air] [dari] [hidung] [dan]

[barangsiapa] [beristinja] [dengan] [batu] [hendaklah]

[dengan] [bilangan] [ganjil]

4. [janganlah] [kalian] [kembali] [menjadi] [kafir]

[sehingga] [kalian] [saling] [membunuh] [satu]

[sama] [lain]

5. [janganlah] [salah] [seorang] [dari] [kalian] [sengaja]

[shalat] [ketika] [matahari] [sedang] [terbit] [dan]

[atau] [ketika] [saat] [terbenam]

6. [janganlah] [kalian] [larang] [para] [wanita]

[mendatangi] [masjid] [masjid] [allah]

7. [iman] [memiliki] [lebih] [dari] [enam] [puluh]

[cabang] [dan] [malu] [adalah] [bagian] [dari] [iman]

8. [sesungguhnya] [ada] [orang] [orang] [yang]

[mendistribusikan] [harta] [allah] [dengan] [jalan]

[yang] [tidak] [benar] [maka] [bagi] [mereka] [neraka]

[pada] [hari] [qiyamat]

9. [sungguh] [celaka] [aku] [bila] [tidak] [berbuat] [adil]

b. Tahap transforming data training

1) Stopword removal

No. Stopword removal

1. [anjing] [menjilat] [bejana] [hendaklah] [cuci] [tujuh]

Page 95: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

78

UIN Syarif Hidayatullah Jakarta

2. [hendaklah] [sebelah] [kanan] [anggota] [wudhunya]

3. [barangsiapa] [berwudhu] [hendaklah]

[mengeluarkan] [air] [hidung] [barangsiapa]

[beristinja] [batu] [hendaklah] [bilangan] [ganjil]

4. [janganlah] [kafir] [saling] [membunuh]

5. [janganlah] [sengaja] [shalat] [matahari] [terbit]

[terbenam]

6. [janganlah] [larang] [wanita] [mendatangi] [masjid]

[masjid] [allah]

7. [iman] [enam] [puluh] [cabang] [malu] [iman]

8. [sesungguhnya] [mendistribusikan] [harta] [allah]

[neraka] [qiyamat]

9. [sungguh] [celaka] [berbuat] [adil]

2) Stemming

Proses stemming dilakukan dengan menggunakan algoritma

Confix Stripping Stemmer. Tahapan proses ini sudah dijelaskan

pada poin 2.5.

Sebagai contoh kata “mendistribusikan” akan di stemming

dengan algoritma Confix Stripping Stemmer. Tahapannya adalah

sebagai berikut :

1. Bandingkan dengan kamus kata dasar. Kata

“mendistribusikan” tidak ada pada kamus kata dasar, maka

lanjut ke langkah 2.

2. Hilangkan akhiran “-kan”, maka menjadi “mendistribusi”.

3. Hilangkan awalan “me-“ dengan menggunakan aturan

peluruhan pada tabel 2.3 nomor 11 yaitu :

men{c|d|j|z}… luruh menjadi men-{c|d|j|z}…

maka kata “men-distribusi” berubah menjadi “distribusi”.

Page 96: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

79

UIN Syarif Hidayatullah Jakarta

Kata “distribusi” merupakan kata yang ada di database kata

dasar, maka algoritma berhenti.

Hasil stemming :

No. Hasil stemming

1. [anjing] [jilat] [bejana] [hendak] [cuci] [tujuh]

2. [hendak] [sebelah] [kanan] [anggota] [wudhu]

3. [wudhu] [hendak] [keluar] [air] [hidung] [istinja]

[batu] [hendak] [bilang] [ganjil]

4. [jangan] [kafir] [saling] [bunuh]

5. [jangan] [sengaja] [shalat] [matahari] [terbit]

[benam]

6. [jangan] [larang] [wanita] [datang] [masjid] [masjid]

[allah]

7. [iman] [enam] [puluh] [cabang] [malu] [iman]

8. [sungguh] [distribusi] [harta] [allah] [neraka]

[qiyamat]

9. [sungguh] [celaka] [berbuat] [adil]

3. Token-token hasil stemming selanjutnya diproses ke tahap pattern

discovery. Berikut proses perhitungan pada tahapan pattern discovery

dengan menggunakan algoritma Naïve Bayes Classifier :

Hitung probabilitas kemunculan tiap kata dengan menggunakan

persamaan 2.1. Contoh hitung probabilitas kata “jangan” pada tiap

kelas:

P(jangan|anjuran) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

21+54

Page 97: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

80

UIN Syarif Hidayatullah Jakarta

= 1

75

= 0.013333333

P(jangan|larangan) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 3+1

17+54

= 4

71

= 0.056338028

P(jangan|informasi) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

16+54

= 1

70

= 0.014285714

Hasil probabilitas semua kata pada data training:

No. Kata Anjuran Larangan Informasi

1 anjing 0.026666667

0.014084507 0.014285714

2 jilat 0.026666667

0.014084507 0.014285714

3 bejana 0.026666667

0.014084507 0.014285714

4 hendak 0.066666667

0.014084507 0.014285714

5 cuci 0.026666667

0.014084507 0.014285714

6 tujuh 0.026666667

0.014084507 0.014285714

7 sebelah 0.026666667

0.014084507 0.014285714

8 kanan 0.026666667

0.014084507 0.014285714

9 anggota 0.026666667

0.014084507 0.014285714

Page 98: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

81

UIN Syarif Hidayatullah Jakarta

10 wudhu 0.04

0.014084507 0.014285714

11 keluar 0.026666667

0.014084507 0.014285714

12 air 0.026666667

0.014084507 0.014285714

13 hidung 0.026666667

0.014084507 0.014285714

14 istinja 0.026666667

0.014084507 0.014285714

15 batu 0.026666667

0.014084507 0.014285714

16 bilang 0.026666667

0.014084507 0.014285714

17 ganjil 0.026666667

0.014084507 0.014285714

18 jangan 0.013333333

0.056338028 0.014285714

19 kafir 0.013333333

0.028169014 0.014285714

20 saling 0.013333333

0.028169014 0.014285714

21 bunuh 0.013333333

0.028169014 0.014285714

22 sengaja 0.013333333

0.028169014 0.014285714

23 shalat 0.013333333

0.028169014 0.014285714

24 matahari 0.013333333

0.028169014 0.014285714

25 terbit 0.013333333

0.028169014 0.014285714

26 benam 0.013333333

0.028169014 0.014285714

27 larang 0.013333333

0.028169014 0.014285714

28 wanita 0.013333333

0.028169014 0.014285714

29 datang 0.013333333

0.028169014 0.014285714

30 masjid 0.013333333

0.042253521 0.014285714

31 allah 0.013333333

0.028169014 0.028571429

Page 99: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

82

UIN Syarif Hidayatullah Jakarta

32 iman 0.013333333 0.014084507 0.042857143

33 enam 0.013333333 0.014084507 0.028571429

34 puluh 0.013333333 0.014084507 0.028571429

35 cabang 0.013333333 0.014084507 0.028571429

36 malu 0.013333333 0.014084507 0.028571429

37 sungguh 0.013333333 0.014084507 0.042857143

38 distribusi 0.013333333 0.014084507 0.028571429

39 harta 0.013333333 0.014084507 0.028571429

40 neraka 0.013333333 0.014084507 0.028571429

41 qiyamat 0.013333333 0.014084507 0.028571429

42 celaka 0.013333333 0.014084507 0.028571429

43 buat 0.013333333 0.014084507 0.028571429

44 adil 0.013333333 0.014084507 0.028571429

4. Setelah semua kata pada data training mendapatkan nilai

probabilitasnya, maka selanjutnya data testing yang diproses mulai dari

preprocessing, transforming, dan pattern discovery.

Contoh data testing terjemahan hadits :

“Janganlah kalian mengangkat kepala kalian hingga para laki - laki

telah duduk.”

a. Tahap preprocessing data testing

1) Case folding

Teks Hasil Case folding

Page 100: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

83

UIN Syarif Hidayatullah Jakarta

“Janganlah kalian mengangkat

kepala kalian hingga para laki

- laki telah duduk.”

janganlah kalian

mengangkat kepala kalian

hingga para laki laki telah

duduk

2) Tokenizing

Teks Hasil Tokenizing

janganlah kalian mengangkat

kepala kalian hingga para laki

laki telah duduk

[janganlah] [kalian]

[mengangkat] [kepala]

[kalian] [hingga] [para]

[laki] [laki] [telah] [duduk]

b. Tahap transforming data testing

1) Stopword removal

Teks Hasil Stopword removal

[janganlah] [kalian]

[mengangkat] [kepala]

[kalian] [hingga] [para] [lak]I

[laki] [telah] [duduk]

[janganlah] [mengangkat]

[kepala] [laki] [laki] [duduk]

2) Stemming

Proses stemming dilakukan dengan menggunakan algoritma

Confix Stripping Stemmer. Tahapan proses ini sudah dijelaskan

pada poin 2.5.

Sebagai contoh kata “mendistribusikan” akan di stemming

dengan algoritma Confix Stripping Stemmer. Tahapannya

adalah sebagai berikut :

1. Bandingkan dengan kamus kata dasar. Kata

“mendistribusikan” tidak ada pada kamus kata dasar, maka

lanjut ke langkah 2.

Page 101: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

84

UIN Syarif Hidayatullah Jakarta

2. Hilangkan akhiran “-kan”, maka menjadi “mendistribusi”.

3. Hilangkan awalan “me-“ dengan menggunakan aturan

peluruhan pada tabel 2.3 nomor 11 yaitu :

men{c|d|j|z}… luruh menjadi men-{c|d|j|z}…

maka kata “men-distribusi” berubah menjadi “distribusi”.

Kata “distribusi” merupakan kata yang ada di database kata

dasar, maka algoritma berhenti.

Hasil stemming :

Teks Hasil stemming

[janganlah] [mengangkat]

[kepala] [laki] [laki] [duduk]

[jangan] [angkat] [kepala]

[laki] [laki] [duduk]

7. Pada tahap pattern discovery data testing, proses yang pertama yaitu

pengecekan apakah kata yang di proses sesuai atau sama dengan daftar

kata pada data training yang sudah memiliki nilai probabilitas

sebelumnya. Jika sesusai maka nilai probabilitas yang sudah ada

tersebut diambil sebagai nilai probabilitas kata yang di proses. Jika

tidak ada yang sesuai dengan daftar kata pada data training maka

hitung nilai probabilitas kata tersebut dengan menggunakan persamaan

2.1.

Contoh kata “duduk” Tidak ada yang sama pada daftar kata data

training maka dihitung nilai probabilitasnya :

P(duduk|anjuran) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

21+54

Page 102: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

85

UIN Syarif Hidayatullah Jakarta

= 1

75

= 0.013333333

P(duduk|larangan) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

17+54

= 1

71

= 0.014084507

P(duduk|informasi) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

16+54

= 1

70

= 0.014285714

Hasil probabilitas data testing:

No. Kata anjuran larangan informasi

1. jangan 0.013333333 0.056338028 0.014285714

2. angkat 0.013333333 0.014084507 0.014285714

3. kepala 0.013333333 0.014084507 0.014285714

4. laki 0.013333333 0.014084507 0.014285714

5. duduk 0.013333333 0.014084507 0.014285714

8. Jika semua kata pada data testing sudah mendapatkan nilai

probabilitasnya maka selanjutnya masuk ke proses terakhir yaitu

penentuan hasil klasifikasi dengan cara berikut :

Pertama hitung nilai probabilitas tiap kelas dengan persamaan 2.3.

Contoh hitung nilai probabilitas kelas “anjuran” :

P(anjuran) = 1

3

Page 103: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

86

UIN Syarif Hidayatullah Jakarta

= 0.333333333

Hasil nilai probabilitas tiap kelas :

Kelas P (c)

Anjuran 0.333333333

Larangan 0.333333333

Informasi 0.333333333

Kemudian untuk menentukan hasil klasifikasi dari data testing maka

dihitung perkalian dari nilai probabilitas semua kata pada data testing

dengan nilai probabilitas tiap kelas sesuai dengan persamaan 2.2.

Perhitungan tersebut dilakukan terhadap semua kelas. Contoh :

Anjuran = 0.013333333 x 0.013333333 x 0.013333333 x 0.013333333

x 0.013333333 x 0.333333333

=0.00000000014047

Hasil nilai akhir probabilitias semua kata terhadap setiap kelas :

Anjuran Larangan Informasi

0.00000000014047 0.00000000073900 0.0000000001983

Setelah nilai akhir dihitung, maka cari nilai maksimal atau yang

tertinggi dari semua kelas. Hasil klasifikasi adalah kelas dengan nilai

paling tinggi. Pada contoh pemodelan skenario 3 ini hasil

klasifikasinya adalah “Larangan” dengan nilai 0.00000000073900.

4.4.4 Konstruksi klasifikasi dengan Naïve Bayes Classifier (NBC) dengan

Confix Stripping Stemmer dan Chi-Square

Skenario keempat pada penelitian ini yaitu konstruksi klasifikasi teks

terjemahan hadits kedalam tiga kelas yaitu anjuran, larangan, dan informasi

dengan menggunakan algoritma Naïve Bayes Classifier (NBC), algoritma

Confix Stripping Stemmer pada proses stemming dan menggunakan seleksi

Page 104: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

87

UIN Syarif Hidayatullah Jakarta

fitur Chi-Square. Proses training dan testing pada skenario ini melalui tahapan-

tahapan yang sama pada preprocessing dan transforming. Tetapi pada skenario

ini, data training akan melalui tahapan seleksi fitur, sedangkan data testing

tidak melalui tahap seleksi fitur karena jumlah fitur yang sedikit dan belum

adanya pengkelasan. Berikut penjelasan keseluruhan konstruksi klasifikasi

terjemahan hadits pada skenario 4 :

1. Mengumpulkan data training dan data testing kemudian siapkan

masing-masing dalam file dengan format .csv. Data training terlebih

dahulu dikelaskan secara manual ke dalam tiga kelas yaitu anjuran,

larangan, dan informasi.

2. Melakukan proses text mining untuk data training sesuai dengan

tahapan 4.2.1. Sebagai contoh diambil 9 terjemahan hadits dengan

masing-masing kelas berjumlah 3 terjemahan hadits.

Contoh data training terjemahan hadits

No. Teks Kelas

1. "Jika anjing menjilat bejana seorang

dari kalian, maka hendaklah ia cuci

hingga tujuh kali."

anjuran

2. "Hendaklah kalian mulai dari yang

sebelah kanan dan anggota wudhunya."

anjuran

3. "Barangsiapa berwudhu hendaklah

mengeluarkan (air dari hidung), dan

barangsiapa beristinja' dengan batu

hendaklah dengan bilangan ganjil."

anjuran

4. "Janganlah kalian kembali menjadi

kafir, sehingga kalian saling

membunuh satu sama lain."

larangan

5. "Janganlah salah seorang dari kalian

sengaja shalat ketika matahari sedang

terbit dan atau ketika saat terbenam."

larangan

Page 105: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

88

UIN Syarif Hidayatullah Jakarta

6. 'Janganlah kalian larang para wanita

mendatangi masjid-masjid Allah."

larangan

7. "Iman memiliki lebih dari enam puluh

cabang, dan malu adalah bagian dari

iman".

informasi

8. "Sesungguhnya ada orang-orang yang

mendistribusikan harta Allah dengan

jalan yang tidak benar, maka bagi

mereka neraka pada hari qiyamat"

informasi

9. "Sungguh celaka aku bila tidak berbuat

adil"

informasi

a. Tahap preprocessing data training

1) Case folding

No. Case folding

1. jika anjing menjilat bejana seorang dari kalian maka

hendaklah ia cuci hingga tujuh kali

2. hendaklah kalian mulai dari yang sebelah kanan dan

anggota wudhunya

3. barangsiapa berwudhu hendaklah mengeluarkan air

dari hidung dan barangsiapa beristinja dengan batu

hendaklah dengan bilangan ganjil

4. janganlah kalian kembali menjadi kafir sehingga

kalian saling membunuh satu sama lain

5. janganlah salah seorang dari kalian sengaja shalat

ketika matahari sedang terbit dan atau ketika saat

terbenam

Page 106: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

89

UIN Syarif Hidayatullah Jakarta

6. janganlah kalian larang para wanita mendatangi

masjid-masjid allah

7. iman memiliki lebih dari enam puluh cabang dan malu

adalah bagian dari iman

8. sesungguhnya ada orang-orang yang

mendistribusikan harta allah dengan jalan yang tidak

benar maka bagi mereka neraka pada hari qiyamat

9. sungguh celaka aku bila tidak berbuat adil

2) Tokenizing

No. Tokenizing

1. [jika] [anjing] [menjilat] [bejana] [seorang] [dari]

[kalian] [maka] [hendaklah] [ia] [cuci] [hingga]

[tujuh] [kali]

2. [hendaklah] [kalian] [mulai] [dari] [yang] [sebelah]

[kanan] [dan] [anggota] [wudhunya]

3. [barangsiapa] [berwudhu] [hendaklah]

[mengeluarkan] [air] [dari] [hidung] [dan]

[barangsiapa] [beristinja] [dengan] [batu] [hendaklah]

[dengan] [bilangan] [ganjil]

4. [janganlah] [kalian] [kembali] [menjadi] [kafir]

[sehingga] [kalian] [saling] [membunuh] [satu]

[sama] [lain]

5. [janganlah] [salah] [seorang] [dari] [kalian] [sengaja]

[shalat] [ketika] [matahari] [sedang] [terbit] [dan]

[atau] [ketika] [saat] [terbenam]

Page 107: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

90

UIN Syarif Hidayatullah Jakarta

6. [janganlah] [kalian] [larang] [para] [wanita]

[mendatangi] [masjid] [masjid] [allah]

7. [iman] [memiliki] [lebih] [dari] [enam] [puluh]

[cabang] [dan] [malu] [adalah] [bagian] [dari] [iman]

8. [sesungguhnya] [ada] [orang] [orang] [yang]

[mendistribusikan] [harta] [allah] [dengan] [jalan]

[yang] [tidak] [benar] [maka] [bagi] [mereka] [neraka]

[pada] [hari] [qiyamat]

9. [sungguh] [celaka] [aku] [bila] [tidak] [berbuat] [adil]

b. Tahap transforming data training

1) Stopword removal

No. Stopword removal

1. [anjing] [menjilat] [bejana] [hendaklah] [cuci] [tujuh]

2. [hendaklah] [sebelah] [kanan] [anggota] [wudhunya]

3. [barangsiapa] [berwudhu] [hendaklah]

[mengeluarkan] [air] [hidung] [barangsiapa]

[beristinja] [batu] [hendaklah] [bilangan] [ganjil]

4. [janganlah] [kafir] [saling] [membunuh]

5. [janganlah] [sengaja] [shalat] [matahari] [terbit]

[terbenam]

6. [janganlah] [larang] [wanita] [mendatangi] [masjid]

[masjid] [allah]

7. [iman] [enam] [puluh] [cabang] [malu] [iman]

Page 108: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

91

UIN Syarif Hidayatullah Jakarta

8. [sesungguhnya] [mendistribusikan] [harta] [allah]

[neraka] [qiyamat]

9. [sungguh] [celaka] [berbuat] [adil]

2) Stemming

Proses stemming dilakukan dengan menggunakan algoritma

Confix Stripping Stemmer. Tahapan proses ini sudah dijelaskan

pada poin 2.5.

Sebagai contoh kata “mendistribusikan” akan di stemming

dengan algoritma Confix Stripping Stemmer. Tahapannya

adalah sebagai berikut :

1. Bandingkan dengan kamus kata dasar. Kata

“mendistribusikan” tidak ada pada kamus kata dasar, maka

lanjut ke langkah 2.

2. Hilangkan akhiran “-kan”, maka menjadi “mendistribusi”.

3. Hilangkan awalan “me-“ dengan menggunakan aturan

peluruhan pada tabel 2.3 nomor 11 yaitu :

men{c|d|j|z}… luruh menjadi men-{c|d|j|z}…

maka kata “men-distribusi” berubah menjadi “distribusi”.

Kata “distribusi” merupakan kata yang ada di database kata

dasar, maka algoritma berhenti.

Hasil stemming :

No. Hasil stemming

1. [anjing] [jilat] [bejana] [hendak] [cuci] [tujuh]

2. [hendak] [sebelah] [kanan] [anggota] [wudhu]

Page 109: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

92

UIN Syarif Hidayatullah Jakarta

3. [wudhu] [hendak] [keluar] [air] [hidung] [istinja]

[batu] [hendak] [bilang] [ganjil]

4. [jangan] [kafir] [saling] [bunuh]

5. [jangan] [sengaja] [shalat] [matahari] [terbit]

[benam]

6. [jangan] [larang] [wanita] [datang] [masjid] [masjid]

[allah]

7. [iman] [enam] [puluh] [cabang] [malu] [iman]

8. [sungguh] [distribusi] [harta] [allah] [neraka]

[qiyamat]

9. [sungguh] [celaka] [berbuat] [adil]

3. Token atau kata-kata hasil transforming selanjutnya di proses kedalam

seleksi fitur untuk mengurangi dimensi dengan menyeleksi kata-kata

yang memiliki nilai chi-square (x2) lebih besar atau sama dengan nilai

kritis pada taraf nyata α 0.05, 0.01, 0.005, dan 0.001 yaitu 3.84, 6.63,

7.83, dan 10.83, maka kata yang tidak memenuhi syarat tersebut tidak

digunakan lagi untuk proses selanjutnya. Berikut proses seleksi fitur

dengan algoritma Chi-square :

Pilih taraf nyata. Contoh memilih taraf nyata 0.05 dengan nilai kritis

3.84.

Setelah itu hitung nilai chi-square (x2) untuk setiap kata dengan

menggunakan persamaan 2.5. Contoh hitung nilai x2 dari kata

“hendaklah” pada tiap kelas:

x2 (“hendaklah”,anjuran) = 9(3.6−0.0)2

(3+0)(0+6)(3+0)(0+6)

= 9 . 324

324

Page 110: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

93

UIN Syarif Hidayatullah Jakarta

= 9

x2 (“hendaklah”,larangan) = 9(0.3−3.3)2

(0+3)(3+3)(0+3)(3+3)

= 9 . 81

324

= 2,25

x2 (“hendaklah”,informasi) = 9(0.3−3.3)2

(0+3)(3+3)(0+3)(3+3)

= 9 . 81

324

= 2,25

Hasil beberapa nilai chi-square (x2) :

No. Kata kelas A B C D Ntr

x2

1 anjing 1

1 0 2 6 9 2.25

2 jilat 1

1 0 2 6 9 2.25

3 bejana 1

1 0 2 6 9 2.25

4 hendak 1

3 0 0 6 9 9

5 cuci 1

1 0 2 6 9 2.25

6 tujuh 1

1 0 2 6 9 2.25

7 sebelah 1

1 0 2 6 9 2.25

8 kanan 1

1 0 2 6 9 2.25

9 anggota 1

1 0 2 6 9 2.25

10 wudhu 1

2 0 1 6 9 5.142

11 keluar 2

0 1 3 5 9 0.5625

12 air 2

0 1 3 5 9 0.5625

13 hidung 2

0 1 3 5 9 0.5625

Page 111: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

94

UIN Syarif Hidayatullah Jakarta

14 istinja 2

0 1 3 5 9 0.5625

15 batu 2

0 1 3 5 9 0.5625

16 bilang 2

0 1 3 5 9 0.5625

17 ganjil 2

0 1 3 5 9 0.5625

18 jangan 2

3 0 0 6 9 9

19 kafir 2

1 0 2 6 9 2.25

20 saling 3 0 1 3 5 9 0.5625

21 bunuh 3 0 1 3 5 9 0.5625

22 sengaja 3 0 1 3 5 9 0.5625

23 shalat 3 0 1 3 5 9 0.5625

24 matahari 3 0 1 3 5 9 0.5625

25 sungguh 3 2 0 1 6 9 5.1428

Setelah mendapatkan nilai chi-square (x2) dari semua kata maka

dilakukan penyeleksian, yaitu mengambil kata-kata yang memiliki

nilai x2 lebih besar atau sama dengan nilai yang sudah dipilih.

Kata-kata yang terpilih :

taraf nyata nilai kritis kata x2

0.05 3.84 hendak

9

wudhu 5.1428

Page 112: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

95

UIN Syarif Hidayatullah Jakarta

jangan

9

sungguh

5.1428

0.01 6.63 hendak

9

jangan

9

0.005 7.83 hendak

9

jangan

9

0.001 10.83 NULL

NULL

Karena di awal taraf nyata yg di pilih 0.05 maka kata yang di ambil

adalah kata yang memiliki nilai x2 lebih besar atau sama dengan nilai

kritis yaitu 3.84. Kata yang di ambil yaitu “hendak”, “jangan”,

“wudhu” dan “sungguh’ Dari hasil proses seleksi fitur dengan chi-

square, jumlah kata yang tadinya berjumlah 54 menjadi berjumlah 11

(hendak = 4, wudhu = 2, jangan = 3, sungguh = 2) dan akan diproses

ke tahapan pattern discovery.

4. Kata yang telah diseleksi dari hasil seleksi fitur kemudian di proses

pada tahapan pattern discovery menggunakan algoritma Naïve Bayes

Classifier (NBC). Berikut proses pattern discovery :

Hitung probabilitas kemunculan tiap kata dengan menggunakan

persamaan 2.1.

Sebagai contoh, hitung probabilitas kata “jangan” pada tiap kelas:

P(jangan|anjuran) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

6+11

= 1

17

= 0.058823529

Page 113: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

96

UIN Syarif Hidayatullah Jakarta

P(jangan|larangan) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 3+1

3+11

= 4

14

= 0.285714286

P(jangan|informasi) = 𝑓(𝑗𝑎𝑛𝑔𝑎𝑛|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

2+11

= 1

13

= 0.07692307692

Hasil probabilitas semua kata pada data training:

No. Kata Anjuran Larangan Informasi

1. Hendak 0.294117647 0.071428571 0.07692307692

2. Wudhu 0.176470588 0.071428571 0.07692307692

3. Jangan 0.058823529 0.142857143 0.07692307692

4. sungguh 0.058823529 0.071428571 0.230769231

5. Setelah semua kata pada data training mendapatkan nilai

probabilitasnya, maka selanjutnya data testing yang diproses mulai dari

preprocessing, transforming, dan pattern discovery.

Contoh data testing terjemahan hadits :

“Janganlah kalian mengangkat kepala kalian hingga para laki - laki

telah duduk.”

a. Tahap preprocessing data testing

1) Case folding

Teks Hasil Case folding

Page 114: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

97

UIN Syarif Hidayatullah Jakarta

“Janganlah kalian mengangkat

kepala kalian hingga para laki

- laki telah duduk.”

janganlah kalian

mengangkat kepala kalian

hingga para laki laki telah

duduk

2) Tokenizing

Teks Hasil Tokenizing

janganlah kalian mengangkat

kepala kalian hingga para laki

laki telah duduk

[janganlah] [kalian]

[mengangkat] [kepala]

[kalian] [hingga] [para]

[laki] [laki] [telah] [duduk]

b. Tahap transforming data testing

1) Stopword removal

Teks Hasil Stopword removal

[janganlah] [kalian]

[mengangkat] [kepala]

[kalian] [hingga] [para] [lak]I

[laki] [telah] [duduk]

[janganlah] [mengangkat]

[kepala] [laki] [laki] [duduk]

2) Stemming

Proses stemming dilakukan dengan menggunakan algoritma

Confix Stripping Stemmer. Tahapan proses ini sudah dijelaskan

pada poin 2.5.

Sebagai contoh kata “mendistribusikan” akan di stemming

dengan algoritma Confix Stripping Stemmer. Tahapannya

adalah sebagai berikut :

1. Bandingkan dengan kamus kata dasar. Kata

“mendistribusikan” tidak ada pada kamus kata dasar, maka

lanjut ke langkah 2.

Page 115: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

98

UIN Syarif Hidayatullah Jakarta

2. Hilangkan akhiran “-kan”, maka menjadi “mendistribusi”.

3. Hilangkan awalan “me-“ dengan menggunakan aturan

peluruhan pada tabel 2.3 nomor 11 yaitu :

men{c|d|j|z}… luruh menjadi men-{c|d|j|z}…

maka kata “men-distribusi” berubah menjadi “distribusi”.

Kata “distribusi” merupakan kata yang ada di database kata

dasar, maka algoritma berhenti.

Hasil stemming :

Teks Hasil stemming

[janganlah] [mengangkat]

[kepala] [laki] [laki] [duduk]

[jangan] [angkat] [kepala]

[laki] [laki] [duduk]

6. Pada tahap pattern discovery data testing, proses yang pertama yaitu

pengecekan apakah kata yang di proses sesuai atau sama dengan daftar

kata pada data training yang sudah memiliki nilai probabilitas

sebelumnya. Jika sesusai maka nilai probabilitas yang sudah ada

tersebut diambil sebagai nilai probabilitas kata yang di proses. Jika

tidak ada yang sesuai dengan daftar kata pada data training maka

hitung nilai probabilitas kata tersebut dengan menggunakan persamaan

2.1.

Contoh kata “duduk” Tidak ada yang sama pada daftar kata data

training maka dihitung nilai probabilitasnya :

P(duduk|anjuran) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑎𝑛𝑗𝑢𝑟𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

6+11

Page 116: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

99

UIN Syarif Hidayatullah Jakarta

= 1

17

= 0.058823529

P(duduk|larangan) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑙𝑎𝑟𝑎𝑛𝑔𝑎𝑛)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

3+11

= 1

14

= 0.071428571

P(duduk|informasi) = 𝑓(𝑑𝑢𝑑𝑢𝑘|𝑖𝑛𝑓𝑜𝑟𝑚𝑎𝑠𝑖)+1

𝑓(𝐶𝑖)+|𝑤|

= 0+1

2+11

= 1

13

=0.076923077

Hasil probabilitas data testing:

No. Kata anjuran larangan informasi

1. jangan 0.058823529 0.285714286 0.076923077

2. angkat 0.058823529 0.071428571 0.076923077

3. kepala 0.058823529 0.071428571 0.076923077

4. laki 0.058823529 0.071428571 0.076923077

5. duduk 0.058823529 0.071428571 0.076923077

7. Jika semua kata pada data testing sudah mendapatkan nilai

probabilitasnya maka selanjutnya masuk ke proses terakhir yaitu

penentuan hasil klasifikasi dengan cara berikut :

Pertama hitung nilai probabilitas tiap kelas dengan persamaan 2.3,

contoh hitung nilai probabilitas kelas “anjuran” :

P(anjuran) = 1

3

Page 117: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

100

UIN Syarif Hidayatullah Jakarta

= 0.333333333

Hasil nilai probabilitas tiap kelas :

Kelas P (c)

Anjuran 0.333333333

Larangan 0.333333333

Informasi 0.333333333

Kemudian untuk menentukan hasil klasifikasi dari data testing maka

dihitung perkalian dari nilai probabilitas semua kata pada data testing

dengan nilai probabilitas tiap kelas sesuai dengan persamaan 2.2.

perhitungan tersebut dilakukan terhadap semua kelas. Contoh :

Anjuran = 0.058823529 x 0.058823529 x 0.058823529 x 0.058823529

x 0.058823529 x 0.333333333

= 0.00000023476543

Hasil nilai akhir probabilitias semua kata terhadap setiap kelas :

Anjuran Larangan Informasi

0.00000023476543 0.00000247912576 0.0000008977636

Setelah nilai akhir dihitung, maka cari nilai maksimal atau yang

tertinggi dari semua kelas. Hasil klasifikasi adalah kelas dengan nilai

paling tinggi. Pada contoh pemodelan skenario 3 ini hasil

klasifikasinya adalah “Larangan” dengan nilai 0.00000247912576.

4.5 Simulasi (Simulation)

Penulis memakai windows 8.1 Pro sebagai sistem operasi yang digunakan

untuk seluruh proses simulasi. Dan menggunakan notepad++ dalam proses coding.

Berikut tahapan-tahapan yang penulis lakukan untuk mempersiapkan proses

simulasi yaitu pembangunan server dan flowchart simulasi.

Page 118: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

101

UIN Syarif Hidayatullah Jakarta

4.5.1 Pembangunan Server

Dalam tahap simulasi penulis menggunakan windows 8.1 Pro sebagai

sistem operasi. Secara garis besar, berikut langkah-langkah yang penulis

lakukan :

1. Melakukan instalasi appserver, dalam hal ini penulis menggunakan

XAMPP

2. Melakukan instalasi editor yang digunakan untuk membuat kode

script, dalam hal ini penulis menggunakan notepad++

4.5.2 Flowchart Simulasi

Flowchart simulasi perbandingan kinerja keempat skenario yang

diimplementasikan pada klasifikasi terjemahan hadits Bukhari yaitu pada

gambar 4.12 berikut :

Gambar 4.11 Flowchart Simulasi

Berikut contoh simulasi yang dilakukan oleh penulis dengan

menggunakan keempat skenario :

• Skenario 1

Page 119: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

102

UIN Syarif Hidayatullah Jakarta

• Skenario 2

Page 120: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

103

UIN Syarif Hidayatullah Jakarta

Page 121: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

104

UIN Syarif Hidayatullah Jakarta

• Skenario 3

Page 122: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

105

UIN Syarif Hidayatullah Jakarta

• Skenario 4

Page 123: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

106

UIN Syarif Hidayatullah Jakarta

Page 124: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

107

UIN Syarif Hidayatullah Jakarta

4.6 Verifikasi dan Validasi (Verification and Validation )

Penjelasan dan pemaparan mengenai verifikasi dan validasi akan dijelaskan

pada BAB V skripsi ini, yaitu bab yang membahas hasil pembahasan.

4.7 Eksperimentasi (Experimentation)

Penjelasan dan pemaparan mengenai eksperimentasi akan dijelaskan pada

BAB V skripsi ini, yaitu bab yang membahas hasil pembahasan.

4.8 Analisis Keluaran (Output Analysis)

Penjelasan dan pemaparan mengenai analisis keluaran akan dijelaskan pada

BAB V skripsi ini, yaitu bab yang membahas hasil pembahasan.

Page 125: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

108

BAB V

HASIL DAN PEMBAHASAN

5.1 Verifikasi dan Validasi (Verification and Validation)

Verifikasi dilakukan untuk memastikan bahwa setiap tahapan pada bab-bab

sebelumnya saling memiliki hubungan, dalam hal ini setiap tahapan pada bab 4

diulas kembali untuk memastikan tiap tahap tersebut saling terkait. Verifikasi juga

memastikan bahwa input dan output sesuai dengan yang diharapkan dimulai dari

tahap problem formulation (formulasi masalah) hingga simulation (simulasi).

Dari tahapan problem formulation (formulasi masalah) dilakukan

pembahasan mengenai masalah terpenting dengan cara identifikasi masalah untuk

dirumusakan dalam penulisan skripsi ini, sehingga dari permasalahan tersebut dapat

dikembangkan suatu pemodelan konsep sebagai solusi. Selanjutnya pada tahapan

conceptual model (model pengkonsepan), dilakukan pembahasan konsep secara

keseluruhan pada sistem klasifikasi terjemahan hadits meliputi input, proses,

eksperimen dan output yang diharapkan. Pada tahapan collection input/output data,

membahasa input dan output data dengan menyebutkan atribut-atribut data yang

akan disimpan kedalam database Mysql. Berlanjut ke tahapan Modelling

(pemodelan) yaitu berkaitan dengan mengolah data input dan output yang telah

dibuat pada tahapan sebelumnya. Pada tahapan ini dilakukan konstruksi klasifikasi

terjemahan hadits menggunakan Naïve Bayes Classifier, konstruksi klasifikasi

terjemahan hadits menggunakan kombinasi algoritma Naïve Bayes Classifier, Chi-

Square dan Confix Stripping Stemmer yang dilakukan secara manual untuk dapat

dijadikan acuan dalam pembuatan aplikasi pada skripsi ini. Berikutnya pada

tahapan terkahir adalah simulation (simulasi), yaitu dengan melakukan simulasi

pada sistem klasifikasi terjemahan hadits yang fungsinya mengimplementasikan

pemodelan-pemodelan manual sebelumnya. Oleh karena itu, setiap tahapan dapat

dipastikan memiliki keterkaitan, karena setiap tahapan yang dibuat akan

berpengaruh untuk membuat tahapan selanjutnya.

Page 126: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

109

UIN Syarif Hidayatullah Jakarta

Dalam proses validasi dilakukan pengujian kebenaran sistem yaitu dengan

melakukan perbandingan hasil klasifikasi dengan kombinasi Naïve Bayes

Classifier, Chi-Square dan Confix Stripping Stemmer yang dihitung secara manual

dengan hasil pada sistem klasifikasi terjemahan hadits sehingga menghasilkan

keakuratan sistem.

5.2 Eksperimentasi (Experimentation)

Proses eksperimentasi adalah proses membandingkan hasil skenario yaitu

hasil klasifikasi terjemahan hadits menggunakan algoritma Naive Bayes Classifier,

kombinasi Naïve Bayes Classifier dan seleksi fitur Chi-Square dengan empat nilai

taraf nyata yaitu 0.05, 0.01, 0.005, dan 0.001, kombinasi Naïve Bayes Classifier dan

Confix Stripping Stemmer, dan kombinasi Naïve Bayes Classifier, Chi-Square dan

Confix Stripping Stemmer dengan empat nilai taraf nyata yaitu 0.05, 0.01, 0.005,

dan 0.001.

Dari eksperimen tersebut dilakukan analisis outputnya yang akan dibahas

pada tahapan analisis keluaran (Outpu Analysis).

5.3 Analisis Keluaran (Output Analysis)

Dalam melakukan analisis keluaran, dilakukan analisis terhadap hasil

klasifikasi terjemahan hadits Bukhari dengan menggunakan kombinasi algoritma

Naïve Bayes Classifier, Chi-Square dan Confix Stripping Stemmer dengan empat

nilai taraf nyata yaitu 0.05, 0.01, 0.005, dan 0.001 dan hasil tingkat akurasi dari

algoritma tersebut.

Page 127: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

110

UIN Syarif Hidayatullah Jakarta

5.3.1 Skenario 1

Hasil pengujian dari skenario 1 yaitu klasifikasi teks terjemahan hadits

dengan menggunakan algoritma Naïve Bayes Classifier tanpa stemming dan

tanpa seleksi fitur dengan jumlah data training sebanyak 300 hadits dan data

testing sebanyak 30 hadits adalah pada tabel 5.1 berikut :

Tabel 5.1 Hasil Pengujian Skenario 1

No. Terjemahan Hadits Kelas

Aktual

Kelas

Prediksi

1. Sesungguhnya darah kalian, harta kalian dan

kehormatan kalian sesama kalian haram (suci)

sebagaimana sucinya hari kalian ini, bulan kalian

ini dan tanah kalian ini. (Maka) hendaklah yang

hadir menyampaikan kepada yang tidak hadir,

karena orang yang hadir semoga dapat

menyampaikan kepada orang yang lebih paham

darinya.

Anjuran Anjuran

2. Jika datang haid maka tinggalkanlah shalat, dan

bila telah berakhir maka bersihkanlah darah darimu

lalu shalatlah.

Anjuran Anjuran

3. Sesungguhnya dijadikannya imam itu untuk diikuti.

Jika imam bertakbir maka takbirlah kalian, jika

rukuk maka rukuklah kalian, jika sujud maka

sujudlah kalian, dan jika ia shalat dengan berdiri

maka shalatlah kalian dengan berdiri.

Anjuran Larangan

4. Shalatlah di tempat tinggal kalian. Ia melanjutkan

perkataannya, "Jika malam sangat dingin dan hujan

Rasulullah shallallahu 'alaihi wasallam

memerintahkan seorang mu'adzin untuk

mengucapkan: "Hendaklah kalian shalat di tempat

tinggal kalian."

Anjuran Anjuran

Page 128: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

111

UIN Syarif Hidayatullah Jakarta

5. Jika salah seorang dari kalian masuk masjid, maka

hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan

6. Barangsiapa lewat dengan membawa panah di

masjid atau pasar kita, maka hendaklah dipegang

ujung panahnya dengan tangannya agar tidak

melukai seorang muslim.

Anjuran Anjuran

7. Kembalilah kalian kepada mereka, bergabunglah

bersama mereka, ajari mereka dan shalat bersama

mereka. Jika waktu shalat telah tiba, maka

hendaklah salah seorang dari kalian

mengumandangkan adzan dan hendaklah yang

mengimami shalat kalian adalah yang paling tua di

antara kalian.

Anjuran Larangan

8. Jika kalian berdua sudah keluar, maka (bila hendak

shalat) adzan dan iqamatlah. Dan yang menjadi

Imam hendaklah yang paling tua di antara kalian.

Anjuran Anjuran

9. Jika salah seorangii kalian mendatangi shalat jum'at

hendaklah ia mandi. Anjuran Larangan

10. 'Arafah: "Barangsiapa yang tidak memiliki

sepasang sandal hendaklah dia memakai sepatunya.

Dan barangsiapa yang tidak memiliki kain sarung

hendaklah dia memakai celana untuk ihram".

Anjuran Anjuran

11. Sungguh kalian telah mengerjakan suatu shalat

(yang dilarang). Kami telah mendampingi

Rasulullah shallallahu 'alaihi wasallam, dan kami

tidak pernah melihat beliau melaksanakannya.

Beliau telah melarang keduanya, yaitu dua rakaat

setelah shalat 'Ashar.

Larangan Larangan

12. Kami dilarang mengantar jenazah namun Beliau

tidak menekankan hal tersebut kepada kami. Larangan Larangan

Page 129: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

112

UIN Syarif Hidayatullah Jakarta

13. Telah dilarang berpuasa dan berjual beli pada hari

Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang

jual beli tanpa mengetahui barang yang dijual dan

juga jual beli tanpa memeriksa barang yang dijual.

Larangan Larangan

14. Setelah tahun ini tidak boleh seorang musyrikpun

ang melaksanakan haji dan tidak boleh thawaf di

Ka'bah dengan telanjang.

Larangan Larangan

15. "Jika kalian mendengar wabah berada di suatu

kawasan, janganlah kalian datang kesana, dan jika

terjadi di suatu kawasan yang kalian diami, jangan

kalian meninggalkannya."

Larangan Larangan

16. Janganlah kalian sepeninggalku menjadi kafir,

sebagian kalian memenggal leher sebagian yang

lainnya.

Larangan Larangan

17. Seorang hakim dilarang memutuskan antara dua

orang ketika marah. Larangan Informasi

18. Jangan kalian mengharapkan bertemu musuh, dan

mintalah keselamatan kepada Allah. Larangan Larangan

19. Jangan kalian benarkan ahli kitab, dan jangan pula

kalian mendustakannya, dan katakan saja '(Kami

beriman kepada Allah, dan apa yang diturunkan

kepada kami dan yang diturunkan kepadamu) '.

Larangan Larangan

20. Jangan kalian bersumpah dengan nama bapak-

bapak kalian, dan barangsiapa bersumpah,

hendaklah bersumpah dengan nama Allah.

Larangan Informasi

21. Kami melindungi seseorang yang kau lindungi

wahai Ummu Hani'". Ummu Hani' berkata: "Saat

itu adalah waktu dhuha

Informasi Informasi

22. Empat hal bila ada pada seseorang maka dia adalah

seorang munafiq tulen yaitu orang yang jika Informasi Informasi

Page 130: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

113

UIN Syarif Hidayatullah Jakarta

berbicara dusta, jika berjanji mengingkari, jika

diberi amanat dia khiyanat dan jika berseteru dia

curang dan barangsiapa yang ada padanya salah

satu sifat itu, dia punya sifat nifaq hingga dia

meninggalkannya

23. Bagi setiap pengkhiyanat akan diberikan bendera

pada hari qiyamat yang ditegakkan sesuai kadar

pengkhiyanatannya

Informasi Informasi

24. Ketika Allah menetapkan penciptaan makhluq, Dia

menulis di dalam Kitab-Nya, yang berada di sisi-

Nya di atas ai-'Arsy (yang isinya): "Sesungguhnya

rahmat-Ku mengalahkan kemurkaan-Ku

Informasi Informasi

25. Sesungguhnya setiap orang dari kalian

dikumpulkan dalam penciptaannya ketika berada di

dalam perut ibunya selama empat puluh hari,

kemudian menjadi 'alaqah (zigot) selama itu pula

kemudian menjadi mudlghah (segumpal daging),

selama itu pula kemudian Allah mengirim malaikat

yang diperintahkan empat ketetapan dan dikatakan

kepadanya, tulislah amalnya, rezekinya, ajalnya

dan sengsara dan bahagianya lalu ditiupkan ruh

kepadanya. Dan sungguh seseorang dari kalian

akan ada yang beramal hingga dirinya berada dekat

dengan surga kecuali sejengkal saja lalu dia

didahului oleh catatan (ketetapan taqdir) hingga dia

beramal dengan amalan penghuni neraka dan ada

juga seseorang yang beramal hingga dirinya berada

dekat dengan neraka kecuali sejengkal saja lalu dia

didahului oleh catatan (ketetapan taqdir) hingga dia

beramal dengan amalan penghuni surga

Informasi Anjuran

Page 131: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

114

UIN Syarif Hidayatullah Jakarta

26. Tidak akan terjadi hari qiyamat hingga muncul

seorang laki-laki dari suku Qahthan menggiring

manusia dengan tongkatnya

Informasi Informasi

27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib

adalah kedudukannya sama (satu) . Informasi Informasi

28. Sesungguhnya urusan (khilafah/pemerintahan) ini

berada pada suku Quraisy dan tidak ada seorangpun

yang menentang mereka melainkan Allah Ta'ala

pasti akan menelungkupkan wajahnya ke tanah

selama mereka (Quraisy) menegakkan ad-din

(agama)

Informasi Informasi

29. Dan Kami jadikan kalian berbangsa-bangsa dan

bersuku-suku Informasi Informasi

30. Sesungguhnya diantara apa yang didapatkan

manusia dari perkataan (yang disepakati) para Nabi

adalah; "Jika kamu tidak malu, berbuatlah

sesukamu

Informasi Anjuran

Tabel di atas menunjukkan hasil pengujian data testing yaitu 22 data

yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,

dan 8 data yang tidak sesuai.

Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan

perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil

perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.1

berikut :

Page 132: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

115

UIN Syarif Hidayatullah Jakarta

Gambar 5.1 Hasil Confusion Matrix Skenario 1

Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,

dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.

Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai

akurasi, presisi, dan f-measure paling tinggi yaitu 86,67%, 80%, dan 80%. Dan

nilai rata-rata keseluruhan kelas pada skenario 1 ini adalah akurasi 82,22%,

presisi 73,89%, recall 73,33%, dan f-measure 73,13%.

Page 133: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

116

UIN Syarif Hidayatullah Jakarta

5.3.2 Skenario 2

Hasil pengujian dari skenario 2 yaitu klasifikasi teks terjemahan hadits

dengan menggunakan algoritma Naïve Bayes Classifier dan seleksi fitur Chi-

Square dengan jumlah data training sebanyak 300 hadits dan data testing

sebanyak 30 hadits adalah sebagai berikut :

a. Pengujian pada taraf nyata 0,05

Tabel 5.2 Hasil Pengujian Skenario 2 Taraf Nyata 0,05

No. Terjemahan Hadits Kelas

Aktual

Kelas

Prediksi

1. Sesungguhnya darah kalian, harta kalian dan

kehormatan kalian sesama kalian haram (suci)

sebagaimana sucinya hari kalian ini, bulan kalian ini

dan tanah kalian ini. (Maka) hendaklah yang hadir

menyampaikan kepada yang tidak hadir, karena

orang yang hadir semoga dapat menyampaikan

kepada orang yang lebih paham darinya.

Anjuran Anjuran

2. Jika datang haid maka tinggalkanlah shalat, dan bila

telah berakhir maka bersihkanlah darah darimu lalu

shalatlah.

Anjuran Anjuran

3. Sesungguhnya dijadikannya imam itu untuk diikuti.

Jika imam bertakbir maka takbirlah kalian, jika rukuk

maka rukuklah kalian, jika sujud maka sujudlah

kalian, dan jika ia shalat dengan berdiri maka

shalatlah kalian dengan berdiri.

Anjuran Anjuran

4. Shalatlah di tempat tinggal kalian. Ia melanjutkan

perkataannya, "Jika malam sangat dingin dan hujan

Rasulullah shallallahu 'alaihi wasallam

memerintahkan seorang mu'adzin untuk

Anjuran Anjuran

Page 134: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

117

UIN Syarif Hidayatullah Jakarta

mengucapkan: "Hendaklah kalian shalat di tempat

tinggal kalian."

5. Jika salah seorang dari kalian masuk masjid, maka

hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan

6. Barangsiapa lewat dengan membawa panah di masjid

atau pasar kita, maka hendaklah dipegang ujung

panahnya dengan tangannya agar tidak melukai

seorang muslim.

Anjuran Anjuran

7. Kembalilah kalian kepada mereka, bergabunglah

bersama mereka, ajari mereka dan shalat bersama

mereka. Jika waktu shalat telah tiba, maka hendaklah

salah seorang dari kalian mengumandangkan adzan

dan hendaklah yang mengimami shalat kalian adalah

yang paling tua di antara kalian.

Anjuran Larangan

8. Jika kalian berdua sudah keluar, maka (bila hendak

shalat) adzan dan iqamatlah. Dan yang menjadi

Imam hendaklah yang paling tua di antara kalian.

Anjuran Anjuran

9. Jika salah seorangii kalian mendatangi shalat jum'at

hendaklah ia mandi. Anjuran Larangan

10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang

sandal hendaklah dia memakai sepatunya. Dan

barangsiapa yang tidak memiliki kain sarung

hendaklah dia memakai celana untuk ihram".

Anjuran Larangan

11. Sungguh kalian telah mengerjakan suatu shalat (yang

dilarang). Kami telah mendampingi Rasulullah

shallallahu 'alaihi wasallam, dan kami tidak pernah

melihat beliau melaksanakannya. Beliau telah

melarang keduanya, yaitu dua rakaat setelah shalat

'Ashar.

Larangan Larangan

Page 135: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

118

UIN Syarif Hidayatullah Jakarta

12. Kami dilarang mengantar jenazah namun Beliau

tidak menekankan hal tersebut kepada kami. Larangan Larangan

13. Telah dilarang berpuasa dan berjual beli pada hari

Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang

jual beli tanpa mengetahui barang yang dijual dan

juga jual beli tanpa memeriksa barang yang dijual.

Larangan Larangan

14. Setelah tahun ini tidak boleh seorang musyrikpun ang

melaksanakan haji dan tidak boleh thawaf di Ka'bah

dengan telanjang.

Larangan Larangan

15. "Jika kalian mendengar wabah berada di suatu

kawasan, janganlah kalian datang kesana, dan jika

terjadi di suatu kawasan yang kalian diami, jangan

kalian meninggalkannya."

Larangan Larangan

16. Janganlah kalian sepeninggalku menjadi kafir,

sebagian kalian memenggal leher sebagian yang

lainnya.

Larangan Larangan

17. Seorang hakim dilarang memutuskan antara dua

orang ketika marah. Larangan Larangan

18. Jangan kalian mengharapkan bertemu musuh, dan

mintalah keselamatan kepada Allah. Larangan Larangan

19. Jangan kalian benarkan ahli kitab, dan jangan pula

kalian mendustakannya, dan katakan saja '(Kami

beriman kepada Allah, dan apa yang diturunkan

kepada kami dan yang diturunkan kepadamu) '.

Larangan Larangan

20. Jangan kalian bersumpah dengan nama bapak-bapak

kalian, dan barangsiapa bersumpah, hendaklah

bersumpah dengan nama Allah.

Larangan Informasi

21. Kami melindungi seseorang yang kau lindungi wahai

Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah

waktu dhuha

Informasi Informasi

Page 136: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

119

UIN Syarif Hidayatullah Jakarta

22. Empat hal bila ada pada seseorang maka dia adalah

seorang munafiq tulen yaitu orang yang jika

berbicara dusta, jika berjanji mengingkari, jika diberi

amanat dia khiyanat dan jika berseteru dia curang dan

barangsiapa yang ada padanya salah satu sifat itu, dia

punya sifat nifaq hingga dia meninggalkannya

Informasi Informasi

23. Bagi setiap pengkhiyanat akan diberikan bendera

pada hari qiyamat yang ditegakkan sesuai kadar

pengkhiyanatannya

Informasi Informasi

24. Ketika Allah menetapkan penciptaan makhluq, Dia

menulis di dalam Kitab-Nya, yang berada di sisi-Nya

di atas ai-'Arsy (yang isinya): "Sesungguhnya

rahmat-Ku mengalahkan kemurkaan-Ku

Informasi Informasi

25. Sesungguhnya setiap orang dari kalian dikumpulkan

dalam penciptaannya ketika berada di dalam perut

ibunya selama empat puluh hari, kemudian menjadi

'alaqah (zigot) selama itu pula kemudian menjadi

mudlghah (segumpal daging), selama itu pula

kemudian Allah mengirim malaikat yang

diperintahkan empat ketetapan dan dikatakan

kepadanya, tulislah amalnya, rezekinya, ajalnya dan

sengsara dan bahagianya lalu ditiupkan ruh

kepadanya. Dan sungguh seseorang dari kalian akan

ada yang beramal hingga dirinya berada dekat

dengan surga kecuali sejengkal saja lalu dia didahului

oleh catatan (ketetapan taqdir) hingga dia beramal

dengan amalan penghuni neraka dan ada juga

seseorang yang beramal hingga dirinya berada dekat

dengan neraka kecuali sejengkal saja lalu dia

Informasi Anjuran

Page 137: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

120

UIN Syarif Hidayatullah Jakarta

didahului oleh catatan (ketetapan taqdir) hingga dia

beramal dengan amalan penghuni surga

26. Tidak akan terjadi hari qiyamat hingga muncul

seorang laki-laki dari suku Qahthan menggiring

manusia dengan tongkatnya

Informasi Informasi

27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib

adalah kedudukannya sama (satu) . Informasi Informasi

28. Sesungguhnya urusan (khilafah/pemerintahan) ini

berada pada suku Quraisy dan tidak ada seorangpun

yang menentang mereka melainkan Allah Ta'ala pasti

akan menelungkupkan wajahnya ke tanah selama

mereka (Quraisy) menegakkan ad-din (agama)

Informasi Informasi

29. Dan Kami jadikan kalian berbangsa-bangsa dan

bersuku-suku Informasi Informasi

30. Sesungguhnya diantara apa yang didapatkan manusia

dari perkataan (yang disepakati) para Nabi adalah;

"Jika kamu tidak malu, berbuatlah sesukamu

Informasi Anjuran

Tabel di atas menunjukkan hasil pengujian data testing yaitu 23 data

yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,

dan 7 data yang tidak sesuai.

Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan

perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil

perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.2

berikut :

Page 138: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

121

UIN Syarif Hidayatullah Jakarta

Gambar 5.2 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,05

Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,

dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.

Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai

akurasi, presisi, dan f-measure paling tinggi yaitu 90%, 88,89%, dan 84,21%.

Dan nilai rata-rata keseluruhan kelas pada skenario 2 dengan taraf nyata 0,05

ini adalah akurasi 84,44%, presisi 77,71%, recall 76,67%, dan f-measure

76,38%.

Page 139: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

122

UIN Syarif Hidayatullah Jakarta

b. Pengujian pada taraf nyata 0,005

Tabel 5.3 Hasil Pengujian Skenario 2 Taraf Nyata 0,005

No. Terjemahan Hadits Kelas

Aktual

Kelas

Prediksi

1. Sesungguhnya darah kalian, harta kalian dan

kehormatan kalian sesama kalian haram (suci)

sebagaimana sucinya hari kalian ini, bulan kalian ini

dan tanah kalian ini. (Maka) hendaklah yang hadir

menyampaikan kepada yang tidak hadir, karena

orang yang hadir semoga dapat menyampaikan

kepada orang yang lebih paham darinya.

Anjuran Anjuran

2. Jika datang haid maka tinggalkanlah shalat, dan bila

telah berakhir maka bersihkanlah darah darimu lalu

shalatlah.

Anjuran Anjuran

3. Sesungguhnya dijadikannya imam itu untuk diikuti.

Jika imam bertakbir maka takbirlah kalian, jika rukuk

maka rukuklah kalian, jika sujud maka sujudlah

kalian, dan jika ia shalat dengan berdiri maka

shalatlah kalian dengan berdiri.

Anjuran Anjuran

4. Shalatlah di tempat tinggal kalian. Ia melanjutkan

perkataannya, "Jika malam sangat dingin dan hujan

Rasulullah shallallahu 'alaihi wasallam

memerintahkan seorang mu'adzin untuk

mengucapkan: "Hendaklah kalian shalat di tempat

tinggal kalian."

Anjuran Anjuran

5. Jika salah seorang dari kalian masuk masjid, maka

hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan

6. Barangsiapa lewat dengan membawa panah di masjid

atau pasar kita, maka hendaklah dipegang ujung Anjuran Anjuran

Page 140: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

123

UIN Syarif Hidayatullah Jakarta

panahnya dengan tangannya agar tidak melukai

seorang muslim.

7. Kembalilah kalian kepada mereka, bergabunglah

bersama mereka, ajari mereka dan shalat bersama

mereka. Jika waktu shalat telah tiba, maka hendaklah

salah seorang dari kalian mengumandangkan adzan

dan hendaklah yang mengimami shalat kalian adalah

yang paling tua di antara kalian.

Anjuran Larangan

8. Jika kalian berdua sudah keluar, maka (bila hendak

shalat) adzan dan iqamatlah. Dan yang menjadi

Imam hendaklah yang paling tua di antara kalian.

Anjuran Anjuran

9. Jika salah seorangii kalian mendatangi shalat jum'at

hendaklah ia mandi. Anjuran Larangan

10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang

sandal hendaklah dia memakai sepatunya. Dan

barangsiapa yang tidak memiliki kain sarung

hendaklah dia memakai celana untuk ihram".

Anjuran Anjuran

11. Sungguh kalian telah mengerjakan suatu shalat (yang

dilarang). Kami telah mendampingi Rasulullah

shallallahu 'alaihi wasallam, dan kami tidak pernah

melihat beliau melaksanakannya. Beliau telah

melarang keduanya, yaitu dua rakaat setelah shalat

'Ashar.

Larangan Larangan

12. Kami dilarang mengantar jenazah namun Beliau

tidak menekankan hal tersebut kepada kami. Larangan Larangan

13. Telah dilarang berpuasa dan berjual beli pada hari

Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang

jual beli tanpa mengetahui barang yang dijual dan

juga jual beli tanpa memeriksa barang yang dijual.

Larangan Larangan

Page 141: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

124

UIN Syarif Hidayatullah Jakarta

14. Setelah tahun ini tidak boleh seorang musyrikpun ang

melaksanakan haji dan tidak boleh thawaf di Ka'bah

dengan telanjang.

Larangan Larangan

15. "Jika kalian mendengar wabah berada di suatu

kawasan, janganlah kalian datang kesana, dan jika

terjadi di suatu kawasan yang kalian diami, jangan

kalian meninggalkannya."

Larangan Larangan

16. Janganlah kalian sepeninggalku menjadi kafir,

sebagian kalian memenggal leher sebagian yang

lainnya.

Larangan Larangan

17. Seorang hakim dilarang memutuskan antara dua

orang ketika marah. Larangan Larangan

18. Jangan kalian mengharapkan bertemu musuh, dan

mintalah keselamatan kepada Allah. Larangan Larangan

19. Jangan kalian benarkan ahli kitab, dan jangan pula

kalian mendustakannya, dan katakan saja '(Kami

beriman kepada Allah, dan apa yang diturunkan

kepada kami dan yang diturunkan kepadamu) '.

Larangan Larangan

20. Jangan kalian bersumpah dengan nama bapak-bapak

kalian, dan barangsiapa bersumpah, hendaklah

bersumpah dengan nama Allah.

Larangan Anjuran

21. Kami melindungi seseorang yang kau lindungi wahai

Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah

waktu dhuha

Informasi Larangan

22. Empat hal bila ada pada seseorang maka dia adalah

seorang munafiq tulen yaitu orang yang jika

berbicara dusta, jika berjanji mengingkari, jika diberi

amanat dia khiyanat dan jika berseteru dia curang dan

barangsiapa yang ada padanya salah satu sifat itu, dia

punya sifat nifaq hingga dia meninggalkannya

Informasi Larangan

Page 142: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

125

UIN Syarif Hidayatullah Jakarta

23. Bagi setiap pengkhiyanat akan diberikan bendera

pada hari qiyamat yang ditegakkan sesuai kadar

pengkhiyanatannya

Informasi Informasi

24. Ketika Allah menetapkan penciptaan makhluq, Dia

menulis di dalam Kitab-Nya, yang berada di sisi-Nya

di atas ai-'Arsy (yang isinya): "Sesungguhnya

rahmat-Ku mengalahkan kemurkaan-Ku

Informasi Larangan

25. Sesungguhnya setiap orang dari kalian dikumpulkan

dalam penciptaannya ketika berada di dalam perut

ibunya selama empat puluh hari, kemudian menjadi

'alaqah (zigot) selama itu pula kemudian menjadi

mudlghah (segumpal daging), selama itu pula

kemudian Allah mengirim malaikat yang

diperintahkan empat ketetapan dan dikatakan

kepadanya, tulislah amalnya, rezekinya, ajalnya dan

sengsara dan bahagianya lalu ditiupkan ruh

kepadanya. Dan sungguh seseorang dari kalian akan

ada yang beramal hingga dirinya berada dekat

dengan surga kecuali sejengkal saja lalu dia didahului

oleh catatan (ketetapan taqdir) hingga dia beramal

dengan amalan penghuni neraka dan ada juga

seseorang yang beramal hingga dirinya berada dekat

dengan neraka kecuali sejengkal saja lalu dia

didahului oleh catatan (ketetapan taqdir) hingga dia

beramal dengan amalan penghuni surga

Informasi Larangan

26. Tidak akan terjadi hari qiyamat hingga muncul

seorang laki-laki dari suku Qahthan menggiring

manusia dengan tongkatnya

Informasi Informasi

27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib

adalah kedudukannya sama (satu) . Informasi Informasi

Page 143: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

126

UIN Syarif Hidayatullah Jakarta

28. Sesungguhnya urusan (khilafah/pemerintahan) ini

berada pada suku Quraisy dan tidak ada seorangpun

yang menentang mereka melainkan Allah Ta'ala pasti

akan menelungkupkan wajahnya ke tanah selama

mereka (Quraisy) menegakkan ad-din (agama)

Informasi Informasi

29. Dan Kami jadikan kalian berbangsa-bangsa dan

bersuku-suku Informasi Informasi

30. Sesungguhnya diantara apa yang didapatkan manusia

dari perkataan (yang disepakati) para Nabi adalah;

"Jika kamu tidak malu, berbuatlah sesukamu

Informasi Anjuran

Tabel di atas menunjukkan hasil pengujian data testing yaitu 21 data

yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,

dan 9 data yang tidak sesuai.

Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan

perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil

perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.3

berikut :

Page 144: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

127

UIN Syarif Hidayatullah Jakarta

Gambar 5.3 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,005

Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,

dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.

Hasil perhitungan tersebut menunjukkan bahwa kelas Anjuran memiliki nilai

akurasi, recall, dan f-measure paling tinggi yaitu 83,33%, 70%, dan 73,68%.

Dan nilai rata-rata keseluruhan kelas pada skenario 2 dengan taraf nyata 0,005

ini adalah akurasi 80%, presisi 78,01%, recall 70%, dan f-measure 69,86%.

Page 145: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

128

UIN Syarif Hidayatullah Jakarta

c. Pengujian pada taraf nyata 0,01

Tabel 5.4 Hasil Pengujian Skenario 2 Taraf Nyata 0,01

No. Terjemahan Hadits Kelas

Aktual

Kelas

Prediksi

1. Sesungguhnya darah kalian, harta kalian dan

kehormatan kalian sesama kalian haram (suci)

sebagaimana sucinya hari kalian ini, bulan kalian ini

dan tanah kalian ini. (Maka) hendaklah yang hadir

menyampaikan kepada yang tidak hadir, karena

orang yang hadir semoga dapat menyampaikan

kepada orang yang lebih paham darinya.

Anjuran Anjuran

2. Jika datang haid maka tinggalkanlah shalat, dan bila

telah berakhir maka bersihkanlah darah darimu lalu

shalatlah.

Anjuran Larangan

3. Sesungguhnya dijadikannya imam itu untuk diikuti.

Jika imam bertakbir maka takbirlah kalian, jika rukuk

maka rukuklah kalian, jika sujud maka sujudlah

kalian, dan jika ia shalat dengan berdiri maka

shalatlah kalian dengan berdiri.

Anjuran Larangan

4. Shalatlah di tempat tinggal kalian. Ia melanjutkan

perkataannya, "Jika malam sangat dingin dan hujan

Rasulullah shallallahu 'alaihi wasallam

memerintahkan seorang mu'adzin untuk

mengucapkan: "Hendaklah kalian shalat di tempat

tinggal kalian."

Anjuran Larangan

5. Jika salah seorang dari kalian masuk masjid, maka

hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan

6. Barangsiapa lewat dengan membawa panah di masjid

atau pasar kita, maka hendaklah dipegang ujung Anjuran Larangan

Page 146: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

129

UIN Syarif Hidayatullah Jakarta

panahnya dengan tangannya agar tidak melukai

seorang muslim.

7. Kembalilah kalian kepada mereka, bergabunglah

bersama mereka, ajari mereka dan shalat bersama

mereka. Jika waktu shalat telah tiba, maka hendaklah

salah seorang dari kalian mengumandangkan adzan

dan hendaklah yang mengimami shalat kalian adalah

yang paling tua di antara kalian.

Anjuran Larangan

8. Jika kalian berdua sudah keluar, maka (bila hendak

shalat) adzan dan iqamatlah. Dan yang menjadi

Imam hendaklah yang paling tua di antara kalian.

Anjuran Anjuran

9. Jika salah seorangii kalian mendatangi shalat jum'at

hendaklah ia mandi. Anjuran Larangan

10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang

sandal hendaklah dia memakai sepatunya. Dan

barangsiapa yang tidak memiliki kain sarung

hendaklah dia memakai celana untuk ihram".

Anjuran Larangan

11. Sungguh kalian telah mengerjakan suatu shalat (yang

dilarang). Kami telah mendampingi Rasulullah

shallallahu 'alaihi wasallam, dan kami tidak pernah

melihat beliau melaksanakannya. Beliau telah

melarang keduanya, yaitu dua rakaat setelah shalat

'Ashar.

Larangan Larangan

12. Kami dilarang mengantar jenazah namun Beliau

tidak menekankan hal tersebut kepada kami. Larangan Larangan

13. Telah dilarang berpuasa dan berjual beli pada hari

Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang

jual beli tanpa mengetahui barang yang dijual dan

juga jual beli tanpa memeriksa barang yang dijual.

Larangan Larangan

Page 147: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

130

UIN Syarif Hidayatullah Jakarta

14. Setelah tahun ini tidak boleh seorang musyrikpun ang

melaksanakan haji dan tidak boleh thawaf di Ka'bah

dengan telanjang.

Larangan Larangan

15. "Jika kalian mendengar wabah berada di suatu

kawasan, janganlah kalian datang kesana, dan jika

terjadi di suatu kawasan yang kalian diami, jangan

kalian meninggalkannya."

Larangan Larangan

16. Janganlah kalian sepeninggalku menjadi kafir,

sebagian kalian memenggal leher sebagian yang

lainnya.

Larangan Anjuran

17. Seorang hakim dilarang memutuskan antara dua

orang ketika marah. Larangan Informasi

18. Jangan kalian mengharapkan bertemu musuh, dan

mintalah keselamatan kepada Allah. Larangan Larangan

19. Jangan kalian benarkan ahli kitab, dan jangan pula

kalian mendustakannya, dan katakan saja '(Kami

beriman kepada Allah, dan apa yang diturunkan

kepada kami dan yang diturunkan kepadamu) '.

Larangan Larangan

20. Jangan kalian bersumpah dengan nama bapak-bapak

kalian, dan barangsiapa bersumpah, hendaklah

bersumpah dengan nama Allah.

Larangan Larangan

21. Kami melindungi seseorang yang kau lindungi wahai

Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah

waktu dhuha

Informasi Informasi

22. Empat hal bila ada pada seseorang maka dia adalah

seorang munafiq tulen yaitu orang yang jika

berbicara dusta, jika berjanji mengingkari, jika diberi

amanat dia khiyanat dan jika berseteru dia curang dan

barangsiapa yang ada padanya salah satu sifat itu, dia

punya sifat nifaq hingga dia meninggalkannya

Informasi Informasi

Page 148: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

131

UIN Syarif Hidayatullah Jakarta

23. Bagi setiap pengkhiyanat akan diberikan bendera

pada hari qiyamat yang ditegakkan sesuai kadar

pengkhiyanatannya

Informasi Informasi

24. Ketika Allah menetapkan penciptaan makhluq, Dia

menulis di dalam Kitab-Nya, yang berada di sisi-Nya

di atas ai-'Arsy (yang isinya): "Sesungguhnya

rahmat-Ku mengalahkan kemurkaan-Ku

Informasi Larangan

25. Sesungguhnya setiap orang dari kalian dikumpulkan

dalam penciptaannya ketika berada di dalam perut

ibunya selama empat puluh hari, kemudian menjadi

'alaqah (zigot) selama itu pula kemudian menjadi

mudlghah (segumpal daging), selama itu pula

kemudian Allah mengirim malaikat yang

diperintahkan empat ketetapan dan dikatakan

kepadanya, tulislah amalnya, rezekinya, ajalnya dan

sengsara dan bahagianya lalu ditiupkan ruh

kepadanya. Dan sungguh seseorang dari kalian akan

ada yang beramal hingga dirinya berada dekat

dengan surga kecuali sejengkal saja lalu dia didahului

oleh catatan (ketetapan taqdir) hingga dia beramal

dengan amalan penghuni neraka dan ada juga

seseorang yang beramal hingga dirinya berada dekat

dengan neraka kecuali sejengkal saja lalu dia

didahului oleh catatan (ketetapan taqdir) hingga dia

beramal dengan amalan penghuni surga

Informasi Larangan

26. Tidak akan terjadi hari qiyamat hingga muncul

seorang laki-laki dari suku Qahthan menggiring

manusia dengan tongkatnya

Informasi Informasi

27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib

adalah kedudukannya sama (satu) . Informasi Larangan

Page 149: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

132

UIN Syarif Hidayatullah Jakarta

28. Sesungguhnya urusan (khilafah/pemerintahan) ini

berada pada suku Quraisy dan tidak ada seorangpun

yang menentang mereka melainkan Allah Ta'ala pasti

akan menelungkupkan wajahnya ke tanah selama

mereka (Quraisy) menegakkan ad-din (agama)

Informasi Informasi

29. Dan Kami jadikan kalian berbangsa-bangsa dan

bersuku-suku Informasi Larangan

30. Sesungguhnya diantara apa yang didapatkan manusia

dari perkataan (yang disepakati) para Nabi adalah;

"Jika kamu tidak malu, berbuatlah sesukamu

Informasi Informasi

Tabel di atas menunjukkan hasil pengujian data testing yaitu 16 data

yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,

dan 14 data yang tidak sesuai.

Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan

perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil

perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.4

berikut :

Page 150: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

133

UIN Syarif Hidayatullah Jakarta

Gambar 5.4 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,01

Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,

dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.

Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai

akurasi, presisi, dan f-measure paling tinggi yaitu 83,33%, 85,71%, dan

70,59%. Dan nilai rata-rata keseluruhan kelas pada skenario 2 dengan taraf

nyata 0,01 ini adalah akurasi 68,89%, presisi 64,13%, recall 53,33%, dan f-

measure 51,56%.

Page 151: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

134

UIN Syarif Hidayatullah Jakarta

d. Pengujian pada taraf nyata 0,001

Tabel 5.5 Hasil Pengujian Skenario 2 Taraf Nyata 0,001

No. Terjemahan Hadits Kelas

Aktual

Kelas

Prediksi

1. Sesungguhnya darah kalian, harta kalian dan

kehormatan kalian sesama kalian haram (suci)

sebagaimana sucinya hari kalian ini, bulan kalian ini

dan tanah kalian ini. (Maka) hendaklah yang hadir

menyampaikan kepada yang tidak hadir, karena

orang yang hadir semoga dapat menyampaikan

kepada orang yang lebih paham darinya.

Anjuran Anjuran

2. Jika datang haid maka tinggalkanlah shalat, dan bila

telah berakhir maka bersihkanlah darah darimu lalu

shalatlah.

Anjuran Larangan

3. Sesungguhnya dijadikannya imam itu untuk diikuti.

Jika imam bertakbir maka takbirlah kalian, jika rukuk

maka rukuklah kalian, jika sujud maka sujudlah

kalian, dan jika ia shalat dengan berdiri maka

shalatlah kalian dengan berdiri.

Anjuran Larangan

4. Shalatlah di tempat tinggal kalian. Ia melanjutkan

perkataannya, "Jika malam sangat dingin dan hujan

Rasulullah shallallahu 'alaihi wasallam

memerintahkan seorang mu'adzin untuk

mengucapkan: "Hendaklah kalian shalat di tempat

tinggal kalian."

Anjuran Anjuran

5. Jika salah seorang dari kalian masuk masjid, maka

hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan

6. Barangsiapa lewat dengan membawa panah di masjid

atau pasar kita, maka hendaklah dipegang ujung Anjuran Anjuran

Page 152: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

135

UIN Syarif Hidayatullah Jakarta

panahnya dengan tangannya agar tidak melukai

seorang muslim.

7. Kembalilah kalian kepada mereka, bergabunglah

bersama mereka, ajari mereka dan shalat bersama

mereka. Jika waktu shalat telah tiba, maka hendaklah

salah seorang dari kalian mengumandangkan adzan

dan hendaklah yang mengimami shalat kalian adalah

yang paling tua di antara kalian.

Anjuran Larangan

8. Jika kalian berdua sudah keluar, maka (bila hendak

shalat) adzan dan iqamatlah. Dan yang menjadi

Imam hendaklah yang paling tua di antara kalian.

Anjuran Larangan

9. Jika salah seorangii kalian mendatangi shalat jum'at

hendaklah ia mandi. Anjuran Larangan

10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang

sandal hendaklah dia memakai sepatunya. Dan

barangsiapa yang tidak memiliki kain sarung

hendaklah dia memakai celana untuk ihram".

Anjuran Anjuran

11. Sungguh kalian telah mengerjakan suatu shalat (yang

dilarang). Kami telah mendampingi Rasulullah

shallallahu 'alaihi wasallam, dan kami tidak pernah

melihat beliau melaksanakannya. Beliau telah

melarang keduanya, yaitu dua rakaat setelah shalat

'Ashar.

Larangan Larangan

12. Kami dilarang mengantar jenazah namun Beliau

tidak menekankan hal tersebut kepada kami. Larangan Larangan

13. Telah dilarang berpuasa dan berjual beli pada hari

Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang

jual beli tanpa mengetahui barang yang dijual dan

juga jual beli tanpa memeriksa barang yang dijual.

Larangan Larangan

Page 153: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

136

UIN Syarif Hidayatullah Jakarta

14. Setelah tahun ini tidak boleh seorang musyrikpun ang

melaksanakan haji dan tidak boleh thawaf di Ka'bah

dengan telanjang.

Larangan Larangan

15. "Jika kalian mendengar wabah berada di suatu

kawasan, janganlah kalian datang kesana, dan jika

terjadi di suatu kawasan yang kalian diami, jangan

kalian meninggalkannya."

Larangan Larangan

16. Janganlah kalian sepeninggalku menjadi kafir,

sebagian kalian memenggal leher sebagian yang

lainnya.

Larangan Larangan

17. Seorang hakim dilarang memutuskan antara dua

orang ketika marah. Larangan Larangan

18. Jangan kalian mengharapkan bertemu musuh, dan

mintalah keselamatan kepada Allah. Larangan Larangan

19. Jangan kalian benarkan ahli kitab, dan jangan pula

kalian mendustakannya, dan katakan saja '(Kami

beriman kepada Allah, dan apa yang diturunkan

kepada kami dan yang diturunkan kepadamu) '.

Larangan Larangan

20. Jangan kalian bersumpah dengan nama bapak-bapak

kalian, dan barangsiapa bersumpah, hendaklah

bersumpah dengan nama Allah.

Larangan Anjuran

21. Kami melindungi seseorang yang kau lindungi wahai

Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah

waktu dhuha

Informasi Informasi

22. Empat hal bila ada pada seseorang maka dia adalah

seorang munafiq tulen yaitu orang yang jika

berbicara dusta, jika berjanji mengingkari, jika diberi

amanat dia khiyanat dan jika berseteru dia curang dan

barangsiapa yang ada padanya salah satu sifat itu, dia

punya sifat nifaq hingga dia meninggalkannya

Informasi Anjuran

Page 154: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

137

UIN Syarif Hidayatullah Jakarta

23. Bagi setiap pengkhiyanat akan diberikan bendera

pada hari qiyamat yang ditegakkan sesuai kadar

pengkhiyanatannya

Informasi Anjuran

24. Ketika Allah menetapkan penciptaan makhluq, Dia

menulis di dalam Kitab-Nya, yang berada di sisi-Nya

di atas ai-'Arsy (yang isinya): "Sesungguhnya

rahmat-Ku mengalahkan kemurkaan-Ku

Informasi Anjuran

25. Sesungguhnya setiap orang dari kalian dikumpulkan

dalam penciptaannya ketika berada di dalam perut

ibunya selama empat puluh hari, kemudian menjadi

'alaqah (zigot) selama itu pula kemudian menjadi

mudlghah (segumpal daging), selama itu pula

kemudian Allah mengirim malaikat yang

diperintahkan empat ketetapan dan dikatakan

kepadanya, tulislah amalnya, rezekinya, ajalnya dan

sengsara dan bahagianya lalu ditiupkan ruh

kepadanya. Dan sungguh seseorang dari kalian akan

ada yang beramal hingga dirinya berada dekat

dengan surga kecuali sejengkal saja lalu dia didahului

oleh catatan (ketetapan taqdir) hingga dia beramal

dengan amalan penghuni neraka dan ada juga

seseorang yang beramal hingga dirinya berada dekat

dengan neraka kecuali sejengkal saja lalu dia

didahului oleh catatan (ketetapan taqdir) hingga dia

beramal dengan amalan penghuni surga

Informasi Anjuran

26. Tidak akan terjadi hari qiyamat hingga muncul

seorang laki-laki dari suku Qahthan menggiring

manusia dengan tongkatnya

Informasi Anjuran

27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib

adalah kedudukannya sama (satu) . Informasi Informasi

Page 155: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

138

UIN Syarif Hidayatullah Jakarta

28. Sesungguhnya urusan (khilafah/pemerintahan) ini

berada pada suku Quraisy dan tidak ada seorangpun

yang menentang mereka melainkan Allah Ta'ala pasti

akan menelungkupkan wajahnya ke tanah selama

mereka (Quraisy) menegakkan ad-din (agama)

Informasi Informasi

29. Dan Kami jadikan kalian berbangsa-bangsa dan

bersuku-suku Informasi Informasi

30. Sesungguhnya diantara apa yang didapatkan manusia

dari perkataan (yang disepakati) para Nabi adalah;

"Jika kamu tidak malu, berbuatlah sesukamu

Informasi Larangan

Tabel di atas menunjukkan hasil pengujian data testing yaitu 17 data

yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,

dan 13 data yang tidak sesuai.

Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan

perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil

perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.5

berikut :

Page 156: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

139

UIN Syarif Hidayatullah Jakarta

Gambar 5.5 Hasil Confusion Matrix Skenario 2 Taraf Nyata 0,001

Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,

dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.

Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai

akurasi, dan presisi paling tinggi yaitu 80%, dan 100%. Dan nilai rata-rata

keseluruhan kelas pada skenario 2 dengan taraf nyata 0,001 ini adalah akurasi

71,11%, presisi 65,42%, recall 56,67%, dan f-measure 55,46%.

5.3.3 Skenario 3

Hasil pengujian dari skenario 3 yaitu klasifikasi teks terjemahan hadits

dengan menggunakan algoritma Naïve Bayes Classifier dan Confix Stripping

Stemmer dengan jumlah data training sebanyak 300 hadits dan data testing

sebanyak 30 hadits adalah pada tabel 5.6 berikut :

Page 157: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

140

UIN Syarif Hidayatullah Jakarta

Tabel 5.6 Hasil Pengujian Skenario 3

No. Terjemahan Hadits Kelas

Aktual

Kelas

Prediksi

1. Sesungguhnya darah kalian, harta kalian dan

kehormatan kalian sesama kalian haram (suci)

sebagaimana sucinya hari kalian ini, bulan kalian

ini dan tanah kalian ini. (Maka) hendaklah yang

hadir menyampaikan kepada yang tidak hadir,

karena orang yang hadir semoga dapat

menyampaikan kepada orang yang lebih paham

darinya.

Anjuran Anjuran

2. Jika datang haid maka tinggalkanlah shalat, dan

bila telah berakhir maka bersihkanlah darah darimu

lalu shalatlah.

Anjuran Anjuran

3. Sesungguhnya dijadikannya imam itu untuk diikuti.

Jika imam bertakbir maka takbirlah kalian, jika

rukuk maka rukuklah kalian, jika sujud maka

sujudlah kalian, dan jika ia shalat dengan berdiri

maka shalatlah kalian dengan berdiri.

Anjuran Larangan

4. Shalatlah di tempat tinggal kalian. Ia melanjutkan

perkataannya, "Jika malam sangat dingin dan hujan

Rasulullah shallallahu 'alaihi wasallam

memerintahkan seorang mu'adzin untuk

mengucapkan: "Hendaklah kalian shalat di tempat

tinggal kalian."

Anjuran Anjuran

5. Jika salah seorang dari kalian masuk masjid, maka

hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan

6. Barangsiapa lewat dengan membawa panah di

masjid atau pasar kita, maka hendaklah dipegang Anjuran Anjuran

Page 158: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

141

UIN Syarif Hidayatullah Jakarta

ujung panahnya dengan tangannya agar tidak

melukai seorang muslim.

7. Kembalilah kalian kepada mereka, bergabunglah

bersama mereka, ajari mereka dan shalat bersama

mereka. Jika waktu shalat telah tiba, maka

hendaklah salah seorang dari kalian

mengumandangkan adzan dan hendaklah yang

mengimami shalat kalian adalah yang paling tua di

antara kalian.

Anjuran Larangan

8. Jika kalian berdua sudah keluar, maka (bila hendak

shalat) adzan dan iqamatlah. Dan yang menjadi

Imam hendaklah yang paling tua di antara kalian.

Anjuran Anjuran

9. Jika salah seorangii kalian mendatangi shalat jum'at

hendaklah ia mandi. Anjuran Larangan

10. 'Arafah: "Barangsiapa yang tidak memiliki

sepasang sandal hendaklah dia memakai sepatunya.

Dan barangsiapa yang tidak memiliki kain sarung

hendaklah dia memakai celana untuk ihram".

Anjuran Anjuran

11. Sungguh kalian telah mengerjakan suatu shalat

(yang dilarang). Kami telah mendampingi

Rasulullah shallallahu 'alaihi wasallam, dan kami

tidak pernah melihat beliau melaksanakannya.

Beliau telah melarang keduanya, yaitu dua rakaat

setelah shalat 'Ashar.

Larangan Larangan

12. Kami dilarang mengantar jenazah namun Beliau

tidak menekankan hal tersebut kepada kami. Larangan Larangan

13. Telah dilarang berpuasa dan berjual beli pada hari

Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang

jual beli tanpa mengetahui barang yang dijual dan

juga jual beli tanpa memeriksa barang yang dijual.

Larangan Larangan

Page 159: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

142

UIN Syarif Hidayatullah Jakarta

14. Setelah tahun ini tidak boleh seorang musyrikpun

ang melaksanakan haji dan tidak boleh thawaf di

Ka'bah dengan telanjang.

Larangan Larangan

15. "Jika kalian mendengar wabah berada di suatu

kawasan, janganlah kalian datang kesana, dan jika

terjadi di suatu kawasan yang kalian diami, jangan

kalian meninggalkannya."

Larangan Larangan

16. Janganlah kalian sepeninggalku menjadi kafir,

sebagian kalian memenggal leher sebagian yang

lainnya.

Larangan Informasi

17. Seorang hakim dilarang memutuskan antara dua

orang ketika marah. Larangan Informasi

18. Jangan kalian mengharapkan bertemu musuh, dan

mintalah keselamatan kepada Allah. Larangan Larangan

19. Jangan kalian benarkan ahli kitab, dan jangan pula

kalian mendustakannya, dan katakan saja '(Kami

beriman kepada Allah, dan apa yang diturunkan

kepada kami dan yang diturunkan kepadamu) '.

Larangan Larangan

20. Jangan kalian bersumpah dengan nama bapak-

bapak kalian, dan barangsiapa bersumpah,

hendaklah bersumpah dengan nama Allah.

Larangan Informasi

21. Kami melindungi seseorang yang kau lindungi

wahai Ummu Hani'". Ummu Hani' berkata: "Saat

itu adalah waktu dhuha

Informasi Informasi

22. Empat hal bila ada pada seseorang maka dia adalah

seorang munafiq tulen yaitu orang yang jika

berbicara dusta, jika berjanji mengingkari, jika

diberi amanat dia khiyanat dan jika berseteru dia

curang dan barangsiapa yang ada padanya salah

Informasi Informasi

Page 160: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

143

UIN Syarif Hidayatullah Jakarta

satu sifat itu, dia punya sifat nifaq hingga dia

meninggalkannya

23. Bagi setiap pengkhiyanat akan diberikan bendera

pada hari qiyamat yang ditegakkan sesuai kadar

pengkhiyanatannya

Informasi Informasi

24. Ketika Allah menetapkan penciptaan makhluq, Dia

menulis di dalam Kitab-Nya, yang berada di sisi-

Nya di atas ai-'Arsy (yang isinya): "Sesungguhnya

rahmat-Ku mengalahkan kemurkaan-Ku

Informasi Informasi

25. Sesungguhnya setiap orang dari kalian

dikumpulkan dalam penciptaannya ketika berada di

dalam perut ibunya selama empat puluh hari,

kemudian menjadi 'alaqah (zigot) selama itu pula

kemudian menjadi mudlghah (segumpal daging),

selama itu pula kemudian Allah mengirim malaikat

yang diperintahkan empat ketetapan dan dikatakan

kepadanya, tulislah amalnya, rezekinya, ajalnya

dan sengsara dan bahagianya lalu ditiupkan ruh

kepadanya. Dan sungguh seseorang dari kalian

akan ada yang beramal hingga dirinya berada dekat

dengan surga kecuali sejengkal saja lalu dia

didahului oleh catatan (ketetapan taqdir) hingga dia

beramal dengan amalan penghuni neraka dan ada

juga seseorang yang beramal hingga dirinya berada

dekat dengan neraka kecuali sejengkal saja lalu dia

didahului oleh catatan (ketetapan taqdir) hingga dia

beramal dengan amalan penghuni surga

Informasi Informasi

26. Tidak akan terjadi hari qiyamat hingga muncul

seorang laki-laki dari suku Qahthan menggiring

manusia dengan tongkatnya

Informasi Informasi

Page 161: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

144

UIN Syarif Hidayatullah Jakarta

27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib

adalah kedudukannya sama (satu) . Informasi Informasi

28. Sesungguhnya urusan (khilafah/pemerintahan) ini

berada pada suku Quraisy dan tidak ada seorangpun

yang menentang mereka melainkan Allah Ta'ala

pasti akan menelungkupkan wajahnya ke tanah

selama mereka (Quraisy) menegakkan ad-din

(agama)

Informasi Informasi

29. Dan Kami jadikan kalian berbangsa-bangsa dan

bersuku-suku Informasi Informasi

30. Sesungguhnya diantara apa yang didapatkan

manusia dari perkataan (yang disepakati) para Nabi

adalah; "Jika kamu tidak malu, berbuatlah

sesukamu

Informasi Informasi

Tabel di atas menunjukkan hasil pengujian data testing yaitu 23 data

yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,

dan 7 data yang tidak sesuai.

Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan

perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil

perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.6

berikut :

Page 162: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

145

UIN Syarif Hidayatullah Jakarta

Gambar 5.6 Hasil Confusion Matrix Skenario 3

Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,

dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.

Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai

akurasi, recall, dan f-measure paling tinggi yaitu 90%, 100%, dan 86,96%. Dan

nilai rata-rata keseluruhan kelas pada skenario 3 ini adalah akurasi 84,44%,

presisi 80,19%, recall 76,67%, dan f-measure 76,21%.

5.3.4 Skenario 4

Hasil pengujian dari skenario 4 yaitu klasifikasi teks terjemahan hadits

dengan menggunakan algoritma Naïve Bayes Classifier, Confix Stripping

Stemmer dan seleksi fitur Chi-Square dengan jumlah data training sebanyak

300 hadits dan data testing sebanyak 30 hadits adalah sebagai berikut :

Page 163: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

146

UIN Syarif Hidayatullah Jakarta

a. Pengujian pada taraf nyata 0,05

Tabel 5.7 Hasil Pengujian Skenario 4 Taraf Nyata 0,05

No. Terjemahan Hadits Kelas

Aktual

Kelas

Prediksi

1. Sesungguhnya darah kalian, harta kalian dan

kehormatan kalian sesama kalian haram (suci)

sebagaimana sucinya hari kalian ini, bulan kalian ini

dan tanah kalian ini. (Maka) hendaklah yang hadir

menyampaikan kepada yang tidak hadir, karena

orang yang hadir semoga dapat menyampaikan

kepada orang yang lebih paham darinya.

Anjuran Anjuran

2. Jika datang haid maka tinggalkanlah shalat, dan bila

telah berakhir maka bersihkanlah darah darimu lalu

shalatlah.

Anjuran Larangan

3. Sesungguhnya dijadikannya imam itu untuk diikuti.

Jika imam bertakbir maka takbirlah kalian, jika rukuk

maka rukuklah kalian, jika sujud maka sujudlah

kalian, dan jika ia shalat dengan berdiri maka

shalatlah kalian dengan berdiri.

Anjuran Larangan

4. Shalatlah di tempat tinggal kalian. Ia melanjutkan

perkataannya, "Jika malam sangat dingin dan hujan

Rasulullah shallallahu 'alaihi wasallam

memerintahkan seorang mu'adzin untuk

mengucapkan: "Hendaklah kalian shalat di tempat

tinggal kalian."

Anjuran Anjuran

5. Jika salah seorang dari kalian masuk masjid, maka

hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan

6. Barangsiapa lewat dengan membawa panah di masjid

atau pasar kita, maka hendaklah dipegang ujung Anjuran Anjuran

Page 164: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

147

UIN Syarif Hidayatullah Jakarta

panahnya dengan tangannya agar tidak melukai

seorang muslim.

7. Kembalilah kalian kepada mereka, bergabunglah

bersama mereka, ajari mereka dan shalat bersama

mereka. Jika waktu shalat telah tiba, maka hendaklah

salah seorang dari kalian mengumandangkan adzan

dan hendaklah yang mengimami shalat kalian adalah

yang paling tua di antara kalian.

Anjuran Larangan

8. Jika kalian berdua sudah keluar, maka (bila hendak

shalat) adzan dan iqamatlah. Dan yang menjadi

Imam hendaklah yang paling tua di antara kalian.

Anjuran Anjuran

9. Jika salah seorangii kalian mendatangi shalat jum'at

hendaklah ia mandi. Anjuran Larangan

10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang

sandal hendaklah dia memakai sepatunya. Dan

barangsiapa yang tidak memiliki kain sarung

hendaklah dia memakai celana untuk ihram".

Anjuran Larangan

11. Sungguh kalian telah mengerjakan suatu shalat (yang

dilarang). Kami telah mendampingi Rasulullah

shallallahu 'alaihi wasallam, dan kami tidak pernah

melihat beliau melaksanakannya. Beliau telah

melarang keduanya, yaitu dua rakaat setelah shalat

'Ashar.

Larangan Larangan

12. Kami dilarang mengantar jenazah namun Beliau

tidak menekankan hal tersebut kepada kami. Larangan Larangan

13. Telah dilarang berpuasa dan berjual beli pada hari

Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang

jual beli tanpa mengetahui barang yang dijual dan

juga jual beli tanpa memeriksa barang yang dijual.

Larangan Larangan

Page 165: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

148

UIN Syarif Hidayatullah Jakarta

14. Setelah tahun ini tidak boleh seorang musyrikpun ang

melaksanakan haji dan tidak boleh thawaf di Ka'bah

dengan telanjang.

Larangan Larangan

15. "Jika kalian mendengar wabah berada di suatu

kawasan, janganlah kalian datang kesana, dan jika

terjadi di suatu kawasan yang kalian diami, jangan

kalian meninggalkannya."

Larangan Larangan

16. Janganlah kalian sepeninggalku menjadi kafir,

sebagian kalian memenggal leher sebagian yang

lainnya.

Larangan Informasi

17. Seorang hakim dilarang memutuskan antara dua

orang ketika marah. Larangan Larangan

18. Jangan kalian mengharapkan bertemu musuh, dan

mintalah keselamatan kepada Allah. Larangan Larangan

19. Jangan kalian benarkan ahli kitab, dan jangan pula

kalian mendustakannya, dan katakan saja '(Kami

beriman kepada Allah, dan apa yang diturunkan

kepada kami dan yang diturunkan kepadamu) '.

Larangan Larangan

20. Jangan kalian bersumpah dengan nama bapak-bapak

kalian, dan barangsiapa bersumpah, hendaklah

bersumpah dengan nama Allah.

Larangan Informasi

21. Kami melindungi seseorang yang kau lindungi wahai

Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah

waktu dhuha

Informasi Informasi

22. Empat hal bila ada pada seseorang maka dia adalah

seorang munafiq tulen yaitu orang yang jika

berbicara dusta, jika berjanji mengingkari, jika diberi

amanat dia khiyanat dan jika berseteru dia curang dan

barangsiapa yang ada padanya salah satu sifat itu, dia

punya sifat nifaq hingga dia meninggalkannya

Informasi Informasi

Page 166: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

149

UIN Syarif Hidayatullah Jakarta

23. Bagi setiap pengkhiyanat akan diberikan bendera

pada hari qiyamat yang ditegakkan sesuai kadar

pengkhiyanatannya

Informasi Informasi

24. Ketika Allah menetapkan penciptaan makhluq, Dia

menulis di dalam Kitab-Nya, yang berada di sisi-Nya

di atas ai-'Arsy (yang isinya): "Sesungguhnya

rahmat-Ku mengalahkan kemurkaan-Ku

Informasi Informasi

25. Sesungguhnya setiap orang dari kalian dikumpulkan

dalam penciptaannya ketika berada di dalam perut

ibunya selama empat puluh hari, kemudian menjadi

'alaqah (zigot) selama itu pula kemudian menjadi

mudlghah (segumpal daging), selama itu pula

kemudian Allah mengirim malaikat yang

diperintahkan empat ketetapan dan dikatakan

kepadanya, tulislah amalnya, rezekinya, ajalnya dan

sengsara dan bahagianya lalu ditiupkan ruh

kepadanya. Dan sungguh seseorang dari kalian akan

ada yang beramal hingga dirinya berada dekat

dengan surga kecuali sejengkal saja lalu dia didahului

oleh catatan (ketetapan taqdir) hingga dia beramal

dengan amalan penghuni neraka dan ada juga

seseorang yang beramal hingga dirinya berada dekat

dengan neraka kecuali sejengkal saja lalu dia

didahului oleh catatan (ketetapan taqdir) hingga dia

beramal dengan amalan penghuni surga

Informasi Larangan

26. Tidak akan terjadi hari qiyamat hingga muncul

seorang laki-laki dari suku Qahthan menggiring

manusia dengan tongkatnya

Informasi Informasi

27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib

adalah kedudukannya sama (satu) . Informasi Informasi

Page 167: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

150

UIN Syarif Hidayatullah Jakarta

28. Sesungguhnya urusan (khilafah/pemerintahan) ini

berada pada suku Quraisy dan tidak ada seorangpun

yang menentang mereka melainkan Allah Ta'ala pasti

akan menelungkupkan wajahnya ke tanah selama

mereka (Quraisy) menegakkan ad-din (agama)

Informasi Informasi

29. Dan Kami jadikan kalian berbangsa-bangsa dan

bersuku-suku Informasi Informasi

30. Sesungguhnya diantara apa yang didapatkan manusia

dari perkataan (yang disepakati) para Nabi adalah;

"Jika kamu tidak malu, berbuatlah sesukamu

Informasi Informasi

Tabel di atas menunjukkan hasil pengujian data testing yaitu 21 data

yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,

dan 9 data yang tidak sesuai.

Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan

perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil

perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.7

berikut :

Page 168: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

151

UIN Syarif Hidayatullah Jakarta

Gambar 5.7 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,05

Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,

dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.

Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai

akurasi, recall, dan f-measure paling tinggi yaitu 90%, 90%, dan 85,71%. Dan

nilai rata-rata keseluruhan kelas pada skenario 4 dengan taraf nyata 0,05 ini

adalah akurasi 80%, presisi 78,38%, recall 70%, dan f-measure 68,95%.

Page 169: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

152

UIN Syarif Hidayatullah Jakarta

b. Pengujian pada taraf nyata 0,005

Tabel 5.8 Hasil Pengujian Skenario 4 Taraf Nyata 0,005

No. Terjemahan Hadits Kelas

Aktual

Kelas

Prediksi

1. Sesungguhnya darah kalian, harta kalian dan

kehormatan kalian sesama kalian haram (suci)

sebagaimana sucinya hari kalian ini, bulan kalian ini

dan tanah kalian ini. (Maka) hendaklah yang hadir

menyampaikan kepada yang tidak hadir, karena

orang yang hadir semoga dapat menyampaikan

kepada orang yang lebih paham darinya.

Anjuran Anjuran

2. Jika datang haid maka tinggalkanlah shalat, dan bila

telah berakhir maka bersihkanlah darah darimu lalu

shalatlah.

Anjuran Larangan

3. Sesungguhnya dijadikannya imam itu untuk diikuti.

Jika imam bertakbir maka takbirlah kalian, jika rukuk

maka rukuklah kalian, jika sujud maka sujudlah

kalian, dan jika ia shalat dengan berdiri maka

shalatlah kalian dengan berdiri.

Anjuran Larangan

4. Shalatlah di tempat tinggal kalian. Ia melanjutkan

perkataannya, "Jika malam sangat dingin dan hujan

Rasulullah shallallahu 'alaihi wasallam

memerintahkan seorang mu'adzin untuk

mengucapkan: "Hendaklah kalian shalat di tempat

tinggal kalian."

Anjuran Informasi

5. Jika salah seorang dari kalian masuk masjid, maka

hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan

6. Barangsiapa lewat dengan membawa panah di masjid

atau pasar kita, maka hendaklah dipegang ujung Anjuran Anjuran

Page 170: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

153

UIN Syarif Hidayatullah Jakarta

panahnya dengan tangannya agar tidak melukai

seorang muslim.

7. Kembalilah kalian kepada mereka, bergabunglah

bersama mereka, ajari mereka dan shalat bersama

mereka. Jika waktu shalat telah tiba, maka hendaklah

salah seorang dari kalian mengumandangkan adzan

dan hendaklah yang mengimami shalat kalian adalah

yang paling tua di antara kalian.

Anjuran Larangan

8. Jika kalian berdua sudah keluar, maka (bila hendak

shalat) adzan dan iqamatlah. Dan yang menjadi

Imam hendaklah yang paling tua di antara kalian.

Anjuran Larangan

9. Jika salah seorangii kalian mendatangi shalat jum'at

hendaklah ia mandi. Anjuran Larangan

10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang

sandal hendaklah dia memakai sepatunya. Dan

barangsiapa yang tidak memiliki kain sarung

hendaklah dia memakai celana untuk ihram".

Anjuran Anjuran

11. Sungguh kalian telah mengerjakan suatu shalat (yang

dilarang). Kami telah mendampingi Rasulullah

shallallahu 'alaihi wasallam, dan kami tidak pernah

melihat beliau melaksanakannya. Beliau telah

melarang keduanya, yaitu dua rakaat setelah shalat

'Ashar.

Larangan Larangan

12. Kami dilarang mengantar jenazah namun Beliau

tidak menekankan hal tersebut kepada kami. Larangan Larangan

13. Telah dilarang berpuasa dan berjual beli pada hari

Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang

jual beli tanpa mengetahui barang yang dijual dan

juga jual beli tanpa memeriksa barang yang dijual.

Larangan Larangan

Page 171: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

154

UIN Syarif Hidayatullah Jakarta

14. Setelah tahun ini tidak boleh seorang musyrikpun ang

melaksanakan haji dan tidak boleh thawaf di Ka'bah

dengan telanjang.

Larangan Larangan

15. "Jika kalian mendengar wabah berada di suatu

kawasan, janganlah kalian datang kesana, dan jika

terjadi di suatu kawasan yang kalian diami, jangan

kalian meninggalkannya."

Larangan Larangan

16. Janganlah kalian sepeninggalku menjadi kafir,

sebagian kalian memenggal leher sebagian yang

lainnya.

Larangan Larangan

17. Seorang hakim dilarang memutuskan antara dua

orang ketika marah. Larangan Larangan

18. Jangan kalian mengharapkan bertemu musuh, dan

mintalah keselamatan kepada Allah. Larangan Larangan

19. Jangan kalian benarkan ahli kitab, dan jangan pula

kalian mendustakannya, dan katakan saja '(Kami

beriman kepada Allah, dan apa yang diturunkan

kepada kami dan yang diturunkan kepadamu) '.

Larangan Larangan

20. Jangan kalian bersumpah dengan nama bapak-bapak

kalian, dan barangsiapa bersumpah, hendaklah

bersumpah dengan nama Allah.

Larangan Larangan

21. Kami melindungi seseorang yang kau lindungi wahai

Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah

waktu dhuha

Informasi Informasi

22. Empat hal bila ada pada seseorang maka dia adalah

seorang munafiq tulen yaitu orang yang jika

berbicara dusta, jika berjanji mengingkari, jika diberi

amanat dia khiyanat dan jika berseteru dia curang dan

barangsiapa yang ada padanya salah satu sifat itu, dia

punya sifat nifaq hingga dia meninggalkannya

Informasi Anjuran

Page 172: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

155

UIN Syarif Hidayatullah Jakarta

23. Bagi setiap pengkhiyanat akan diberikan bendera

pada hari qiyamat yang ditegakkan sesuai kadar

pengkhiyanatannya

Informasi Informasi

24. Ketika Allah menetapkan penciptaan makhluq, Dia

menulis di dalam Kitab-Nya, yang berada di sisi-Nya

di atas ai-'Arsy (yang isinya): "Sesungguhnya

rahmat-Ku mengalahkan kemurkaan-Ku

Informasi Informasi

25. Sesungguhnya setiap orang dari kalian dikumpulkan

dalam penciptaannya ketika berada di dalam perut

ibunya selama empat puluh hari, kemudian menjadi

'alaqah (zigot) selama itu pula kemudian menjadi

mudlghah (segumpal daging), selama itu pula

kemudian Allah mengirim malaikat yang

diperintahkan empat ketetapan dan dikatakan

kepadanya, tulislah amalnya, rezekinya, ajalnya dan

sengsara dan bahagianya lalu ditiupkan ruh

kepadanya. Dan sungguh seseorang dari kalian akan

ada yang beramal hingga dirinya berada dekat

dengan surga kecuali sejengkal saja lalu dia didahului

oleh catatan (ketetapan taqdir) hingga dia beramal

dengan amalan penghuni neraka dan ada juga

seseorang yang beramal hingga dirinya berada dekat

dengan neraka kecuali sejengkal saja lalu dia

didahului oleh catatan (ketetapan taqdir) hingga dia

beramal dengan amalan penghuni surga

Informasi Larangan

26. Tidak akan terjadi hari qiyamat hingga muncul

seorang laki-laki dari suku Qahthan menggiring

manusia dengan tongkatnya

Informasi Informasi

27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib

adalah kedudukannya sama (satu) . Informasi Informasi

Page 173: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

156

UIN Syarif Hidayatullah Jakarta

28. Sesungguhnya urusan (khilafah/pemerintahan) ini

berada pada suku Quraisy dan tidak ada seorangpun

yang menentang mereka melainkan Allah Ta'ala pasti

akan menelungkupkan wajahnya ke tanah selama

mereka (Quraisy) menegakkan ad-din (agama)

Informasi Informasi

29. Dan Kami jadikan kalian berbangsa-bangsa dan

bersuku-suku Informasi Informasi

30. Sesungguhnya diantara apa yang didapatkan manusia

dari perkataan (yang disepakati) para Nabi adalah;

"Jika kamu tidak malu, berbuatlah sesukamu

Informasi Informasi

Tabel di atas menunjukkan hasil pengujian data testing yaitu 21 data

yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,

dan 9 data yang tidak sesuai.

Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan

perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil

perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.8

berikut :

Page 174: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

157

UIN Syarif Hidayatullah Jakarta

Gambar 5.8 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,005

Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,

dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.

Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai

akurasi, presisi, dan f-measure paling tinggi yaitu 90%, 88,89%, dan 84,21%.

Dan nilai rata-rata keseluruhan kelas pada skenario 4 dengan taraf nyata 0,005

ini adalah akurasi 80%, presisi 74,24%, recall 70%, dan f-measure 67,05%.

Page 175: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

158

UIN Syarif Hidayatullah Jakarta

c. Pengujian pada taraf nyata 0,01

Tabel 5.9 Hasil Pengujian Skenario 4 Taraf Nyata 0,01

No. Terjemahan Hadits Kelas

Aktual

Kelas

Prediksi

1. Sesungguhnya darah kalian, harta kalian dan

kehormatan kalian sesama kalian haram (suci)

sebagaimana sucinya hari kalian ini, bulan kalian ini

dan tanah kalian ini. (Maka) hendaklah yang hadir

menyampaikan kepada yang tidak hadir, karena

orang yang hadir semoga dapat menyampaikan

kepada orang yang lebih paham darinya.

Anjuran Larangan

2. Jika datang haid maka tinggalkanlah shalat, dan bila

telah berakhir maka bersihkanlah darah darimu lalu

shalatlah.

Anjuran Larangan

3. Sesungguhnya dijadikannya imam itu untuk diikuti.

Jika imam bertakbir maka takbirlah kalian, jika rukuk

maka rukuklah kalian, jika sujud maka sujudlah

kalian, dan jika ia shalat dengan berdiri maka

shalatlah kalian dengan berdiri.

Anjuran Informasi

4. Shalatlah di tempat tinggal kalian. Ia melanjutkan

perkataannya, "Jika malam sangat dingin dan hujan

Rasulullah shallallahu 'alaihi wasallam

memerintahkan seorang mu'adzin untuk

mengucapkan: "Hendaklah kalian shalat di tempat

tinggal kalian."

Anjuran Anjuran

5. Jika salah seorang dari kalian masuk masjid, maka

hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan

6. Barangsiapa lewat dengan membawa panah di masjid

atau pasar kita, maka hendaklah dipegang ujung Anjuran Anjuran

Page 176: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

159

UIN Syarif Hidayatullah Jakarta

panahnya dengan tangannya agar tidak melukai

seorang muslim.

7. Kembalilah kalian kepada mereka, bergabunglah

bersama mereka, ajari mereka dan shalat bersama

mereka. Jika waktu shalat telah tiba, maka hendaklah

salah seorang dari kalian mengumandangkan adzan

dan hendaklah yang mengimami shalat kalian adalah

yang paling tua di antara kalian.

Anjuran Larangan

8. Jika kalian berdua sudah keluar, maka (bila hendak

shalat) adzan dan iqamatlah. Dan yang menjadi

Imam hendaklah yang paling tua di antara kalian.

Anjuran Larangan

9. Jika salah seorangii kalian mendatangi shalat jum'at

hendaklah ia mandi. Anjuran Larangan

10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang

sandal hendaklah dia memakai sepatunya. Dan

barangsiapa yang tidak memiliki kain sarung

hendaklah dia memakai celana untuk ihram".

Anjuran Anjuran

11. Sungguh kalian telah mengerjakan suatu shalat (yang

dilarang). Kami telah mendampingi Rasulullah

shallallahu 'alaihi wasallam, dan kami tidak pernah

melihat beliau melaksanakannya. Beliau telah

melarang keduanya, yaitu dua rakaat setelah shalat

'Ashar.

Larangan Larangan

12. Kami dilarang mengantar jenazah namun Beliau

tidak menekankan hal tersebut kepada kami. Larangan Larangan

13. Telah dilarang berpuasa dan berjual beli pada hari

Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang

jual beli tanpa mengetahui barang yang dijual dan

juga jual beli tanpa memeriksa barang yang dijual.

Larangan Larangan

Page 177: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

160

UIN Syarif Hidayatullah Jakarta

14. Setelah tahun ini tidak boleh seorang musyrikpun ang

melaksanakan haji dan tidak boleh thawaf di Ka'bah

dengan telanjang.

Larangan Larangan

15. "Jika kalian mendengar wabah berada di suatu

kawasan, janganlah kalian datang kesana, dan jika

terjadi di suatu kawasan yang kalian diami, jangan

kalian meninggalkannya."

Larangan Larangan

16. Janganlah kalian sepeninggalku menjadi kafir,

sebagian kalian memenggal leher sebagian yang

lainnya.

Larangan Larangan

17. Seorang hakim dilarang memutuskan antara dua

orang ketika marah. Larangan Larangan

18. Jangan kalian mengharapkan bertemu musuh, dan

mintalah keselamatan kepada Allah. Larangan Larangan

19. Jangan kalian benarkan ahli kitab, dan jangan pula

kalian mendustakannya, dan katakan saja '(Kami

beriman kepada Allah, dan apa yang diturunkan

kepada kami dan yang diturunkan kepadamu) '.

Larangan Larangan

20. Jangan kalian bersumpah dengan nama bapak-bapak

kalian, dan barangsiapa bersumpah, hendaklah

bersumpah dengan nama Allah.

Larangan Larangan

21. Kami melindungi seseorang yang kau lindungi wahai

Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah

waktu dhuha

Informasi Larangan

22. Empat hal bila ada pada seseorang maka dia adalah

seorang munafiq tulen yaitu orang yang jika

berbicara dusta, jika berjanji mengingkari, jika diberi

amanat dia khiyanat dan jika berseteru dia curang dan

barangsiapa yang ada padanya salah satu sifat itu, dia

punya sifat nifaq hingga dia meninggalkannya

Informasi Larangan

Page 178: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

161

UIN Syarif Hidayatullah Jakarta

23. Bagi setiap pengkhiyanat akan diberikan bendera

pada hari qiyamat yang ditegakkan sesuai kadar

pengkhiyanatannya

Informasi Informasi

24. Ketika Allah menetapkan penciptaan makhluq, Dia

menulis di dalam Kitab-Nya, yang berada di sisi-Nya

di atas ai-'Arsy (yang isinya): "Sesungguhnya

rahmat-Ku mengalahkan kemurkaan-Ku

Informasi Informasi

25. Sesungguhnya setiap orang dari kalian dikumpulkan

dalam penciptaannya ketika berada di dalam perut

ibunya selama empat puluh hari, kemudian menjadi

'alaqah (zigot) selama itu pula kemudian menjadi

mudlghah (segumpal daging), selama itu pula

kemudian Allah mengirim malaikat yang

diperintahkan empat ketetapan dan dikatakan

kepadanya, tulislah amalnya, rezekinya, ajalnya dan

sengsara dan bahagianya lalu ditiupkan ruh

kepadanya. Dan sungguh seseorang dari kalian akan

ada yang beramal hingga dirinya berada dekat

dengan surga kecuali sejengkal saja lalu dia didahului

oleh catatan (ketetapan taqdir) hingga dia beramal

dengan amalan penghuni neraka dan ada juga

seseorang yang beramal hingga dirinya berada dekat

dengan neraka kecuali sejengkal saja lalu dia

didahului oleh catatan (ketetapan taqdir) hingga dia

beramal dengan amalan penghuni surga

Informasi Larangan

26. Tidak akan terjadi hari qiyamat hingga muncul

seorang laki-laki dari suku Qahthan menggiring

manusia dengan tongkatnya

Informasi Informasi

27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib

adalah kedudukannya sama (satu) . Informasi Informasi

Page 179: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

162

UIN Syarif Hidayatullah Jakarta

28. Sesungguhnya urusan (khilafah/pemerintahan) ini

berada pada suku Quraisy dan tidak ada seorangpun

yang menentang mereka melainkan Allah Ta'ala pasti

akan menelungkupkan wajahnya ke tanah selama

mereka (Quraisy) menegakkan ad-din (agama)

Informasi Informasi

29. Dan Kami jadikan kalian berbangsa-bangsa dan

bersuku-suku Informasi Informasi

30. Sesungguhnya diantara apa yang didapatkan manusia

dari perkataan (yang disepakati) para Nabi adalah;

"Jika kamu tidak malu, berbuatlah sesukamu

Informasi Informasi

Tabel di atas menunjukkan hasil pengujian data testing yaitu 20 data

yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,

dan 10 data yang tidak sesuai.

Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan

perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil

perhitungan tersebut juga ditampilkan di sistem seperti pada gambar 5.9

berikut :

Page 180: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

163

UIN Syarif Hidayatullah Jakarta

Gambar 5.9 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,01

Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,

dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.

Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai

akurasi, dan f-measure paling tinggi yaitu 86,67% dan 77,78%. Dan nilai rata-

rata keseluruhan kelas pada skenario 4 dengan taraf nyata 0,01 ini adalah

akurasi 77,78%, presisi 80,04%, recall 66,67%, dan f-measure 64,30%.

Page 181: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

164

UIN Syarif Hidayatullah Jakarta

d. Pengujian pada taraf nyata 0,001

Tabel 5.10 Hasil Pengujian Skenario 4 Taraf Nyata 0,001

No. Terjemahan Hadits Kelas

Aktual

Kelas

Prediksi

1. Sesungguhnya darah kalian, harta kalian dan

kehormatan kalian sesama kalian haram (suci)

sebagaimana sucinya hari kalian ini, bulan kalian ini

dan tanah kalian ini. (Maka) hendaklah yang hadir

menyampaikan kepada yang tidak hadir, karena

orang yang hadir semoga dapat menyampaikan

kepada orang yang lebih paham darinya.

Anjuran Anjuran

2. Jika datang haid maka tinggalkanlah shalat, dan bila

telah berakhir maka bersihkanlah darah darimu lalu

shalatlah.

Anjuran Larangan

3. Sesungguhnya dijadikannya imam itu untuk diikuti.

Jika imam bertakbir maka takbirlah kalian, jika rukuk

maka rukuklah kalian, jika sujud maka sujudlah

kalian, dan jika ia shalat dengan berdiri maka

shalatlah kalian dengan berdiri.

Anjuran Larangan

4. Shalatlah di tempat tinggal kalian. Ia melanjutkan

perkataannya, "Jika malam sangat dingin dan hujan

Rasulullah shallallahu 'alaihi wasallam

memerintahkan seorang mu'adzin untuk

mengucapkan: "Hendaklah kalian shalat di tempat

tinggal kalian."

Anjuran Anjuran

5. Jika salah seorang dari kalian masuk masjid, maka

hendaklah ia shalat dua rakaat sebelum ia duduk. Anjuran Larangan

6. Barangsiapa lewat dengan membawa panah di masjid

atau pasar kita, maka hendaklah dipegang ujung Anjuran Anjuran

Page 182: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

165

UIN Syarif Hidayatullah Jakarta

panahnya dengan tangannya agar tidak melukai

seorang muslim.

7. Kembalilah kalian kepada mereka, bergabunglah

bersama mereka, ajari mereka dan shalat bersama

mereka. Jika waktu shalat telah tiba, maka hendaklah

salah seorang dari kalian mengumandangkan adzan

dan hendaklah yang mengimami shalat kalian adalah

yang paling tua di antara kalian.

Anjuran Larangan

8. Jika kalian berdua sudah keluar, maka (bila hendak

shalat) adzan dan iqamatlah. Dan yang menjadi

Imam hendaklah yang paling tua di antara kalian.

Anjuran Larangan

9. Jika salah seorangii kalian mendatangi shalat jum'at

hendaklah ia mandi. Anjuran Larangan

10. 'Arafah: "Barangsiapa yang tidak memiliki sepasang

sandal hendaklah dia memakai sepatunya. Dan

barangsiapa yang tidak memiliki kain sarung

hendaklah dia memakai celana untuk ihram".

Anjuran Anjuran

11. Sungguh kalian telah mengerjakan suatu shalat (yang

dilarang). Kami telah mendampingi Rasulullah

shallallahu 'alaihi wasallam, dan kami tidak pernah

melihat beliau melaksanakannya. Beliau telah

melarang keduanya, yaitu dua rakaat setelah shalat

'Ashar.

Larangan Larangan

12. Kami dilarang mengantar jenazah namun Beliau

tidak menekankan hal tersebut kepada kami. Larangan Larangan

13. Telah dilarang berpuasa dan berjual beli pada hari

Raya 'Iedul Fitri dan 'Iedul 'Adha, dan juga dilarang

jual beli tanpa mengetahui barang yang dijual dan

juga jual beli tanpa memeriksa barang yang dijual.

Larangan Larangan

Page 183: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

166

UIN Syarif Hidayatullah Jakarta

14. Setelah tahun ini tidak boleh seorang musyrikpun ang

melaksanakan haji dan tidak boleh thawaf di Ka'bah

dengan telanjang.

Larangan Larangan

15. "Jika kalian mendengar wabah berada di suatu

kawasan, janganlah kalian datang kesana, dan jika

terjadi di suatu kawasan yang kalian diami, jangan

kalian meninggalkannya."

Larangan Larangan

16. Janganlah kalian sepeninggalku menjadi kafir,

sebagian kalian memenggal leher sebagian yang

lainnya.

Larangan Larangan

17. Seorang hakim dilarang memutuskan antara dua

orang ketika marah. Larangan Larangan

18. Jangan kalian mengharapkan bertemu musuh, dan

mintalah keselamatan kepada Allah. Larangan Larangan

19. Jangan kalian benarkan ahli kitab, dan jangan pula

kalian mendustakannya, dan katakan saja '(Kami

beriman kepada Allah, dan apa yang diturunkan

kepada kami dan yang diturunkan kepadamu) '.

Larangan Larangan

20. Jangan kalian bersumpah dengan nama bapak-bapak

kalian, dan barangsiapa bersumpah, hendaklah

bersumpah dengan nama Allah.

Larangan Anjuran

21. Kami melindungi seseorang yang kau lindungi wahai

Ummu Hani'". Ummu Hani' berkata: "Saat itu adalah

waktu dhuha

Informasi Informasi

22. Empat hal bila ada pada seseorang maka dia adalah

seorang munafiq tulen yaitu orang yang jika

berbicara dusta, jika berjanji mengingkari, jika diberi

amanat dia khiyanat dan jika berseteru dia curang dan

barangsiapa yang ada padanya salah satu sifat itu, dia

punya sifat nifaq hingga dia meninggalkannya

Informasi Anjuran

Page 184: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

167

UIN Syarif Hidayatullah Jakarta

23. Bagi setiap pengkhiyanat akan diberikan bendera

pada hari qiyamat yang ditegakkan sesuai kadar

pengkhiyanatannya

Informasi Anjuran

24. Ketika Allah menetapkan penciptaan makhluq, Dia

menulis di dalam Kitab-Nya, yang berada di sisi-Nya

di atas ai-'Arsy (yang isinya): "Sesungguhnya

rahmat-Ku mengalahkan kemurkaan-Ku

Informasi Anjuran

25. Sesungguhnya setiap orang dari kalian dikumpulkan

dalam penciptaannya ketika berada di dalam perut

ibunya selama empat puluh hari, kemudian menjadi

'alaqah (zigot) selama itu pula kemudian menjadi

mudlghah (segumpal daging), selama itu pula

kemudian Allah mengirim malaikat yang

diperintahkan empat ketetapan dan dikatakan

kepadanya, tulislah amalnya, rezekinya, ajalnya dan

sengsara dan bahagianya lalu ditiupkan ruh

kepadanya. Dan sungguh seseorang dari kalian akan

ada yang beramal hingga dirinya berada dekat

dengan surga kecuali sejengkal saja lalu dia didahului

oleh catatan (ketetapan taqdir) hingga dia beramal

dengan amalan penghuni neraka dan ada juga

seseorang yang beramal hingga dirinya berada dekat

dengan neraka kecuali sejengkal saja lalu dia

didahului oleh catatan (ketetapan taqdir) hingga dia

beramal dengan amalan penghuni surga

Informasi Anjuran

26. Tidak akan terjadi hari qiyamat hingga muncul

seorang laki-laki dari suku Qahthan menggiring

manusia dengan tongkatnya

Informasi Anjuran

27. Sesungguhnya Bani Hasyim dan Bani Al Muthallib

adalah kedudukannya sama (satu) . Informasi Informasi

Page 185: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

168

UIN Syarif Hidayatullah Jakarta

28. Sesungguhnya urusan (khilafah/pemerintahan) ini

berada pada suku Quraisy dan tidak ada seorangpun

yang menentang mereka melainkan Allah Ta'ala pasti

akan menelungkupkan wajahnya ke tanah selama

mereka (Quraisy) menegakkan ad-din (agama)

Informasi Informasi

29. Dan Kami jadikan kalian berbangsa-bangsa dan

bersuku-suku Informasi Informasi

30. Sesungguhnya diantara apa yang didapatkan manusia

dari perkataan (yang disepakati) para Nabi adalah;

"Jika kamu tidak malu, berbuatlah sesukamu

Informasi Larangan

Tabel di atas menunjukkan hasil pengujian data testing yaitu 17 data

yang sesuai antara klasifikasi secara manual dengan klasifikasi oleh sistem,

dan 13 data yang tidak sesuai.

Setelah sistem menghasilkan hasil pengujian, kemudian dilakukan

perhitungan akurasi, presisi, recall, dan f-measure pada setiap klasifikasi. Hasil

perhitungan tersebut juga ditampilkan di sistem seperti padagambar 5.10

berikut :

Page 186: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

169

UIN Syarif Hidayatullah Jakarta

Gambar 5.10 Hasil Confusion Matrix Skenario 4 Taraf Nyata 0,001

Gambar di atas menunjukkan hasil perhitungan akurasi, presisi, recall,

dan f-measure dari masing-masing kelas dan juga rata-rata keseluruhan kelas.

Hasil perhitungan tersebut menunjukkan bahwa kelas Informasi memiliki nilai

akurasi, dan presisi paling tinggi yaitu 80% dan 83,33%. Dan nilai rata-rata

keseluruhan kelas pada skenario 4 dengan taraf nyata 0,001 ini adalah akurasi

71,11%, presisi 58,89% recall 56,67%, dan f-measure 55,36%.

5.3.5 Analisis Perbandingan Hasil Seluruh Pengujian

Setelah keempat skenario mendapatkan nilai akurasi, presisi, recall,

dan f-measure, selanjutnya dilakukan perbandingan hasil untuk mengetahui

skenario yang paling baik dalam mengklasifikasikan terjemahan hadits.

Berikut adalah nilai rata-rata akurasi, presisi, recall dan f-measure dari tiap

skenario :

Page 187: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

170

UIN Syarif Hidayatullah Jakarta

Gambar 5.11 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,05), 3

dan 4 (taraf nyata 0,05)

Gambar 5.12 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,005),

3 dan 4 (taraf nyata 0,005)

Gambar 5.13 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,01), 3

dan 4 (taraf nyata 0,01)

Page 188: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

171

UIN Syarif Hidayatullah Jakarta

Gambar 5.14 Hasil Rata-Rata Confusion Matrix Skenario 1, 2 (taraf nyata 0,001),

3 dan 4 (taraf nyata 0,001)

Dari keempat gambar diatas dapat dilihat bahwa skenario yang

memiliki nilai rata-rata akurasi tertinggi adalah skenario 2 (taraf nyata 0,05)

dan skenario 3 yaitu 84,44%, nilai rata-rata presisi tertinggi adalah skenario 3

yaitu 80,19%, nilai rata-rata recall tertinggi adalah skenario 2 (taraf nyata 0,05)

dan skenario 3 yaitu 76,67%, dan nilai rata-rata f-measure tertinggi adalah

skenario 3 yaitu 76,21%. Dari perbandingan keseluruhan nilai rata-rata dari

semua skenario dapat ditarik kesimpulan bahwa skenario yang paling baik

dalam mengklasifikasikan terjemahan hadits adalah skenario 3 yaitu

kombinasi Algoritma Naïve Bayes Classifier dan Confix Stripping Stemmer

dengan nilai rata-rata akurasi, presisi, recall, dan f-measure berturut-turut yaitu

84,44%, 80,19%, 76,67% dan 76,21%.

Skenario 2 (taraf nyata 0,05) dan 3 memiliki nilai akurasi dan recall

yang sama karena jumlah klasifikasi data testing yang dihasilkan oleh sistem

dan sesuai dengan aktual sama-sama berjumlah 23, dan yang tidak sesuai

berjumlah 7. Hal itu dikarenakan penggunaan taraf nyata 0,05 dengan nilai

kritis yang kecil yaitu 3,84 sehingga tidak banyak mengurangi fitur/kata yang

membuat kecil kemungkinan kata yang merupakan ciri khas suatu kelas ikut

terhapus. Seperti pada penelitian (Rahmad & Pribadi, 2015) bahwa semakin

kecil taraf nyata α dan semakin besar nilai kritis, maka jumlah feature yang

dihasilkan akan semakin sedikit begitupun sebaliknya.

Skenario 3 merupakan skenario terbaik dalam penelitian ini karena

memiliki nilai rata-rata akurasi, presisi, recall, dan f-measure tertinggi diantara

Page 189: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

172

UIN Syarif Hidayatullah Jakarta

skenario lainnya. Skenario terbaik ini yaitu kombinasi Naïve Bayes Classifier

dan Confix Stripping Stemmer, sejalan dengan penelitian yang dilakukan oleh

(Ariadi & Fithriasari, 2015) mengenai klasifikasi berita Indonesia

menggunakan metode Naive Bayesian Classification dan Support Vector

Machine dengan algoritma stemming yaitu Confix Stripping Stemmer yang

merupakan perkembangan dari algoritma nazief stemmer yang dilakukan oleh

Jelita Asian, dengan menambahkan beberapa perbaikan yang bertujuan untuk

meningkatkan hasil stemming yang diperoleh. Penelitian tersebut

menghasilkan nilai akurasi, presisi, recall, dan f-measure diatas 80% pada

kedua algoritma yang dikombinasi dengan Confix Stripping Stemmer. Begitu

juga penelitian yang dilakukan (Kurniawan et al., 2012) yaitu membangun

sistem klasifikasi konten berita dalam bentuk web menggunakan algoritma

Naïve Bayes Classifier yang dikombinasi dengan Confix Stripping Stemmer.

Penelitian tersebut menunjukkan bahwa berita testing berhasil terklasifikasi

secara otomatis seluruhnya.

Page 190: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

173

BAB VI

PENUTUP

6.1 Kesimpulan

Hasil analisis kinerja Algoritma Naïve Bayes Classifier dengan seleksi

fitur Chi-Square dan Confix Stripping Stemmer dalam mengklasifikasikan

hadits Shahih Bukhari dengan menggunakan metode simulasi yang terdiri

dari tahapan problem formulation, conceptual model, input and output data,

modelling, simulation, verification and validation, experimentation dan

output analysis dan setelah melakukan perhitungan Confusion Matrix yaitu

accuracy, precision, recall dan f-measure menunjukkan bahwa kinerja yang

memiliki nilai terbaik adalah kinerja Algoritma Naïve Bayes Classifier dan

Confix Stripping Stemmer.

6.2 Saran

Setelah melakukan penelitian ini, ada beberapa hal yang kedepannya

dapat dikembangkan guna proses pengembangan selanjutnya. Adapun saran

dari penulis antara lain :

1. Dapat menggunakan algoritma seleksi fitur yang lain untuk dikombinasi

dengan algoritma Naïve Bayes Classifier seperti Mutual Information

(MI), Information Gain (IG), atau Term Strength (TS).

2. Dapat melakukan klasifikasi multi-class karena dalam satu hadits bisa

mengandung dua atau lebih makna (anjuran, larangan, dan informasi).

3. Dapat menggunakan variasi jumlah data misal jumlah data tidak

seimbang pada setiap kelas.

4. Untuk mengetahui hasil pembanding yang lebih luas dapat menggunakan

Bahasa pemrograman berbeda dengan implementasi ke objek lainnya

dari yang penulis gunakan.

Page 191: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

174

UIN Syarif Hidayatullah Jakarta

DAFTAR PUSTAKA

Adriani, M., Asian, J., Nazief, B., Williams, H. E., & Tahaghoghi, S. M. M. (2007).

Stemming Indonesian: A confix-stripping approach. Conferences in Research

and Practice in Information Technology Series, 38(September 2018), 307–

314. https://doi.org/10.1145/1316457.1316459.

Andini, S. (2013). Klasifikasi Dokumen Teks Menggunakan Algoritma Naive

Bayes dengan Bahasa Pemrograman Java. Jurnal Teknologi Informasi &

Pendidikan ISSN: 2086-4981, 6 No. 2(September), 140–147. Retrieved from

http://www.jurnal-tip.net/jurnal-resource/file/13-Vol6No2Sep2013-Silfia

Andini.pdf

Aprilianti P, A. (2015). Sentiment Analysis Dengan Naive Bayes Untuk Melihat

Persepsi Masyarakat Terhadap Batik Pada Jejaring Sosial Twitter. Seminar

Nasional Matematika Dan Pendidikan Matematika UMS Tahun 2015, 1, 833–

839. https://doi.org/10.1007/978-1-4614-1557-2_10

Ariadi, D., & Fithriasari, K. (2015). Klasifikasi Berita Indonesia Menggunakan

Metode Naive Bayesian Classification dan Support Vector Machine dengan

Confix Stripping Stemmer. JURNAL SAINS DAN SENI ITS Vol. 4, No.2, 4(2),

248–253.

Baqi, M. F. A. (2012). Al-lu’lu’ wal Marjan Mutiara Hadits Shahih Bukhari dan

Muslim. Jakarta Timur: Ummul Quro.

Darujati, C., Gumelar, A. B., Informasi, S., Komputer, F. I., Surabaya, U. N., Bayes,

N., … Learning, S. (2012). Pemanfaatan Teknik Supervised Untuk Klasifikasi

Teks Bahasa Indonesia. Jurnal LINK, 16(1), 1–8.

Ernawati, S. (2016). Penerapan Particle Swarm Optimization Untuk Seleksi Fitur

Pada Analisis Sentimen Review Perusahaan Penjualan Online Menggunakan

Naïve Bayes. IOSR Journal of Economics and Finance, 3(1), 56.

Faisal, R., & Nugrahadi, D. T. (2019). Belajar Data Science: Klasifikasi dengan

Page 192: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

175

UIN Syarif Hidayatullah Jakarta

Bahasa Pemrograman R. Banjarbaru: Scripta Cendekia.

Fauzan, H., Al-faraby, S., & Adiwijaya. (2018). Pengklasifikasian Topik Hadits

Terjemahan Bahasa Indonesia Menggunakan Latent Semantic Indexing dan

Support Vector Machine. Media Informatika Budidarma (MIB), 2(4), 131–

139.

Jiawei Han, Micheline Kamber, J. P. (2011). Data Mining – Concepts &

Techniques. https://doi.org/10.1016/B978-0-12-381479-1.00001-0

Kalokasari, D. H., Setianingrum, A. H., & Shofi, I. M. (2018). Implementasi

Algoritma Multinomial Naive Bayes Classifier Pada Sistem Klasifikasi Surat

Keluar (Studi Kasus : DISKOMINFO Kabupaten Tangerang). Jurnal Teknik

Informatika, 10(2). https://doi.org/10.15408/jti.v10i2.6822

Komputer, W. (2015). Membangun Sistem Informasi dengan Java Netbeans dan

MySQL. Yogyakarta: ANDI.

Kurniawan, B., Effendi, S., & Sitompul, O. S. (2012). Klasifikasi Konten Berita

Dengan Metode Text Mining. Jurnal Dunia Teknologi Informasi, 1(2), 14–19.

Kusumaningrum, A., Al-faraby, S., & Adiwijaya. (2017). Klasifikasi Informasi ,

Anjuran dan Larangan pada Hadits Shahih Bukhari menggunakan Metode

Support Vector Machine . E-Proceeding of Engineering :, 4(3), 5014–5023.

Liu, B. (2011). Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data

Second Edition. In Computer Knowledge and Technology (Academic …

(second). https://doi.org/10.1007/978-3-642-19460-3

Madani, S. A., Kazmi, J., & Mahlknecht, S. (2010). Wireless sensor networks:

modeling and simulation. (January), 1–16.

Nofriansyah, D., Erwansyah, K., & Ramadhan, M. (2016). Penerapan Data Mining

dengan Algoritma Naive Bayes Clasifier untuk Mengetahui Minat Beli

Pelanggan terhadap Kartu Internet XL ( Studi Kasus di. Saintikom, 15(1978–

6603), 81–92.

Page 193: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

176

UIN Syarif Hidayatullah Jakarta

Pattekari, S. A., & Parveen, A. (2012). Prediction system for heart disease using

Naive Bayes. International Journal of Advanced Computer and Mathematical

Sciences, 3(3), 2230–9624. Retrieved from http://bipublication.com

Priyanti, E. (2017). Penerapan algoritma naïve bayes untuk deteksi bakteri e-coli.

8(1), 17–23. https://doi.org/10.1016/j.joen.2010.01.012

Rahmad, A. N., & Pribadi, F. S. (2015). PEMILIHAN FEATURE DENGAN CHI

SQUARE DALAM ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI

BERITA. 5(1), 33–43.

Rahman, A., Wiranto, & Doewes, A. (2017). Online News Classification Using

Multinomial Naive Bayes. Itsmart, 6(1), 32–38.

https://doi.org/10.1177/1096348015584441

Riviera, E., Jasin, R., & Al-faraby, S. (2017). Klasifikasi Anjuran , Larangan dan

Informasi pada Hadis Sahih Al-Bukhari berdasarkan Model Unigram

menggunakan Artificial Neural Network ( ANN ). 4(3), 4683–4694.

Rosandy, T. (2016). PERBANDINGAN METODE NAIVE BAYES CLASSIFIER

DENGAN METODE DECISION TREE (C4.5) UNTUK MENGANALISA

KELANCARAN PEMBIAYAAN (Study Kasus : KSPPS / BMT AL-

FADHILA). Jurnal Teknologi Informasi Magister, 2(01), 52–62.

Sacra, S. A. L., Faraby, S. Al, & Triantoro, D. (2017). KLASIFIKASI ANJURAN,

LARANGAN, DAN INFORMASI PADA HADITS SHAHIH BUKHARI

MENGGUNAKAN NAÏVE BAYES CLASSIFIER. 4(3), 4794–4802.

Sanjaya, S., & Absar, E. A. (2015). Pengelompokan Dokumen Menggunakan

Winnowing Fingerprint dengan Metode K - Nearest Neighbour. Jurnal

CoreIT, 1(2), 50–56.

Saputra, H. K. (2018). Analisis Data Mining Untuk Pemetaan Mahasiswa Yang

Membutuhkan Bimbingan dan Konseling Menggunakan Algoritma Naive

Bayes Classifier. Jurnal Teknologi Informasi & Pendidikan, 11(1), 14–26.

Page 194: ANALISIS KINERJA ALGORITMA NAÏVE BAYES CLASSIFIER …repository.uinjkt.ac.id/dspace/bitstream/123456789... · Chi-Square Feature Selection and Confix Stripping Stemmer in Hadith

177

UIN Syarif Hidayatullah Jakarta

Septiani, W. D. (2017). Komparasi metode klasifikasi data mining algoritma c4.5

Dan Naive Bayes Untuk Prediksi Penyakit Hepatitis. Jurnal Pilar Nusa

Mandiri, 13(1), 76–84.

Somantri, O., Wiyono, S., & Dairoh. (2017). Metode K-Means untuk Optimasi

Klasifikasi Tema Tugas Akhir Mahasiswa Menggunakan Support Vector

Machine (SVM). Scientific Journal of Informatics, 3(1), 34–45.

https://doi.org/10.15294/sji.v3i1.5845

Sugiyono. (2012). Statistika untuk Penelitian. Bandung: Alfabeta.

Susandi, D., & Sholahudin, U. (2016). Pemanfaatan Vector Space Model pada

Penerapan Algoritma Nazief Adriani , KNN dan Fungsi Similarity Cosine

untuk Pembobotan IDF dan WIDF pada Prototipe Sistem Klasifikasi Teks

Bahasa Indonesia. Jurnal ProTekInfo, 3(1), 22–29.

Widodo, & Pratiwi, N. I. (2017). Klasifikasi Dokumen Karya Akhir Mahasiswa

Menggunakan Naive Bayes Classifier (NBC) Berdasarkan Abstrak Karya

Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta. (September).

https://doi.org/10.21009/pinter.1.1.5

Zuhri, M. (2011). Hadis Nabi Telaah Historis dan Metodologis. Yogyakarta: Tiara

Wacana Yogya.