IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel...

146
i IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL BERBAHASA INDONESIA DENGAN ALGORITMA K-MEANS CLUSTERING SKRIPSI Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika Oleh : Anjar Nugraha Jati 125314062 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2017 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Transcript of IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel...

Page 1: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

i

IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL

BERBAHASA INDONESIA DENGAN ALGORITMA K-MEANS

CLUSTERING

SKRIPSI

Diajukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Teknik Informatika

Oleh :

Anjar Nugraha Jati

125314062

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2017

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 2: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

ii

THE MEANING OF THE “SABAR” (PATIENCE) WORDS

IDENTIFICATION IN INDONESIA TEXT ARTICLE USING K-MEANS

CLUSTERING ALGORITHM

A Thesis Presented as Partial Fulfillment of the Requirements

To Obtain the Sarjana Komputer Degree

in Informatics Engineering Study Program

By :

Anjar Nugraha Jati

125314062

INFORMATICS ENGINEERING STUDY PROGRAM

DEPARTMENT OF INFORMATICS ENGINEERING

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2017

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 3: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

iii

HALAMAN PERSETUJUAN

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 4: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

iv

HALAMAN PENGESAHAN SKRIPSI

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 5: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

v

PERNYATAAN KEASLIAN KARYA

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 6: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

vi

HALAMAN PERSEMBAHAN

Karya ini penulis persembahkan kepada :

Tuhan Yesus dan Bunda Maria,

Keluarga,

Sahabat,

Teman-teman Teknik Informatika,

Dan orang-orang yang telah mendukung perkuliahan penulis.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 7: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

vii

ABSTRAK

Kesabaran merupakan nilai hidup yang dijunjung tinggi bangsa

Indonesia.Menurut Subandi (2001), kesabaran merupakan ajaran yang dijunjung

oleh kelima agama yang besar di Indonesia (Islam, Kristen, Katholik, Hindu, dan

Budha). Lebih lanjut disebutkan oleh Subandi bahwa dalam Al Qur‟an terdapat 44

ayat yang mengunakan kata sabar dan 14 ayat yang menggunakan kata

kesabaran. Penelusuran dalam Alkitab (Bible) Bahasa Indonesia menunjukan 70

ayat yang menggunakan kata sabar, kesabaran, dan kata lain dengan tema sabar.

Subandi (2001) juga menyebutkan bahwa kesabaran merupakan bentuk

pengendalian diri yang sangat penting dalam agama Bidha dan agama Hindu.

Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh

Dr. Benedictus Bherman Dwijatmoko, M.A. yang menghasilkan klasifikasi atau

pengelompokan makna kata sabar kedalam 6 kategori atau kelompok, yaitu

giliran, kondisi, komunikasi, sifat, pekerjaan, dan urutan tindakan.

Dalam skripsi ini identifikasi makna kata sabar dilakukan dengan

menggunkan algoritma K-Means Clustering, yang hasilnya dibandingkan dengan

hasil penelitian terdahulu oleh ahli untuk mendapatkan akurasi dari algoritma K-

Means Clustering dalam mengkelompokan makna kata sabar. Dalam pengujian

sistem menggunakan K-Means mendapat hasil paling tinggi yaitu 98.14814815%,

dengan data yang digunakan sebanyak 108.

.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 8: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

viii

ABSTRACT

Patience is a „value of life‟ which is upheld by Indonesian. According to

Subandi (2011), patience is a teachings upheld by five major religions in

Indonesia (Moeslem, Christianity, Catholic, Hinduism, and Buddhism).

Furthermore, Subandi said there is 44 verses in Al-Quran using the word patience

and 14 verses using the word patirnce. In the holy bible, there is 70 verses using

the word patience, patient, etc. Subandi also said that patience is an important

„self-control‟ in hinduism and buddhism.

A research tu find the true meaning of patience has been done by Dr.

Benedictus Bherman Dwijatmoko, M.A resulting in patience classification in 6

categories, they are turn (giliran), situation (keadaan), communication

(komunikasi), character (sifat), working (pekerjaan), and action sequence (urutan

tindakan).

In this thesis, identification of true meaning of patience is done by K-

Means Clustering algorithm, the results are compared to the old results done by

expert to find an accurate result of K-Means Clustering algorithm. In testing the

system using the K-Means gets highest result that 98.14814815%, with data being

used as much as 108.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 9: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

ix

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH

UNTUK KEPENTINGAN AKADEMIS

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 10: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

x

KATA PENGANTAR

Puji syukur kepada Tuhan Yesus Kristus, atas segala berkat, bimbingan

dan karunia sehingga penulis dapat menyelesaikan Tugas Akhir sebagai salah satu

syarat akademik jurusan teknik informatika Universitas Sanata Dharma

Yogyakarta.

Penelitian ini dapat berjalan baik dari awal hingga akhir karena adanya

bimbingan, doa, ukungan semangat dan motivasi yang diberikan oleh banyak

pihak. Untuk itu, penulis ingin mengucapkan terimakasih kepada :

1. Tuhan Yesus Kristus yang telah memberkati, membimbing dan

memberikan kekuatan di kehidupan ini setiap hari dalam suka maupun

duka.

2. Bunda Maria yang selalu mendengarkan keluh kesah penulis dalam

menjalani kehidupan.

3. Keluarga, Bapak Heri Santosa Francisco, Ibu Bibiana Titis Budi Asri,

Agustina Ratna Utami, dan Tulus Sigit Nugraha yang telah mendoakan,

mendukung dan memberi semangat kepada penulis selama proses

perkuliahan dan penyelesaian skripsi.

4. Sri Hartati Wijono, S.Si., M.Kom. selaku dosen pembimbing tugas akhir,

atas bimbingan, waktu, dan saran yang telah diberikan kepada penulis.

5. Dr.Benedictus Bherman Dwijatmoko, M.A. selaku dosen pembimbing

tugas akhir, atas bimbingan, waktu, dan saran yang telah diberikan kepada

penulis.

6. Dr.C.Kuntoro Adi, S.J., M.A., M.Sc. selaku dosen pembimbing akademik,

atas bimbingan, motivasi, kritik, dan saran yang telah diberikan kepada

penulis.

7. Puspaningtyas Sanjoyo Adi, S.T., M.T. selaku dosen penguji, atas

bimbingan, kritik, dan saran yang telah diberikan kepada penulis.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 11: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

xi

8. Albertus Agung Hadhiatma, S.T., M.T. selaku dosen penguji, atas

bimbingan, kritik, dan saran yang telah diberikan kepada penulis.

9. Dr. Anastasia Rita Widiarti selaku ketua program studi Teknik

Informatika, atas bimbingan, kritik, dan saran yang telah diberikan kepada

penulis.

10. Sudi Mungkasi, Ph.D. selaku dekan Fakultas Sains dan Teknologi, atas

bimbingan, kritik dan saran yang telah diberikan kepada penulis.

11. Teman-teman “Ikatan Teknik Informatika Liberal” yang selalu memberi

semangat dan hiburan selama proses kuliah di Universitas Sanata Dharma.

12. Teman-teman UKF “FST Basketball” yang selalu memberi semangat dan

hiburan selama proses kuliah di Universitas Sanata Dharma.

13. Cindya, Eric, Giri, Jona, Wiga, Gala, Tito, Dona, Cici, Jono, Dingo,

Loona, Choco, Misti atas doa, dukungan, bantuan dan hiburan selama

penulis berproses dalam penyelesaian tugas akhir.

14. OMK St Alloysius Gonzaga Ngijoreja, yang telah menjadi sahabat dan

memberikan pelajaran berharga dalam memahami hidup dan memuji

memuliakan Tuhan Yesus Kristus.

15. Semua pihak yang tidak dapat disebutkan satu per satu yang telah

membantu penulis dalam pengerjaan tugas akhir ini.

Penulis menyadari masih banyak kekurangan yang terdapat dalam laporan

tugas akhir ini. Saran dan kritik sangat diharapkan untuk hasil yang lebih baik

dimasa mendatang. Semoga penulisan skripsi ini berguna untuk semua pihak

terutama mahasiswa teknik informatika.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 12: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

xii

DAFTAR ISI

HALAMAN PERSETUJUAN ........................................................................................... iii

HALAMAN PENGESAHAN SKRIPSI ............................................................................ iv

PERNYATAAN KEASLIAN KARYA ............................................................................. v

HALAMAN PERSEMBAHAN ........................................................................................ vi

ABSTRAK ........................................................................................................................ vii

ABSTRACT ......................................................................................................................viii

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK

KEPENTINGAN AKADEMIS ......................................................................................... ix

KATA PENGANTAR ........................................................................................................ x

DAFTAR ISI ......................................................................................................................xii

1.1 LATAR BELAKANG ........................................................................................ 1

1.2 RUMUSAN MASALAH .................................................................................... 2

1.3 TUJUAN ............................................................................................................. 2

1.4 BATASAN MASALAH ..................................................................................... 3

1.5 METODOLOGI PENELITIAN .......................................................................... 3

1.6 SISTEMATIKA PENULISAN ........................................................................... 3

BAB II ................................................................................................................................. 5

2.1. Ideologi Kesabaran Dalam Karya Sastra ............................................................ 5

2.2.Text Mining ............................................................................................................. 10

2.3.Text Preprocessing .................................................................................................. 11

2.3.1.Tokenizing ........................................................................................................ 11

2.3.2.Stopword Removal/Filtering ............................................................................ 12

2.3.3.Stemming .......................................................................................................... 12

2.3.4.Pembobotan tf-idf ............................................................................................ 16

2.4.Clustering ................................................................................................................ 17

2.5.K-Means .................................................................................................................. 18

2.6.Variance Initialitation ............................................................................................. 21

2.7.Euclidian Distance .................................................................................................. 22

BAB III ............................................................................................................................. 23

3.1.Data ......................................................................................................................... 23

3.2.Deskripsi Sistem ..................................................................................................... 26

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 13: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

xiii

3.3.Preprocessing ......................................................................................................... 29

3.3.1.Tokenizing ....................................................................................................... 29

3.3.2.Stopword .......................................................................................................... 33

3.3.3.Stemming .......................................................................................................... 36

3.3.4.Pembobotan ...................................................................................................... 39

3.5.K-means .............................................................................................................. 48

3.4.Spesifikasi Perangkat Keras dan Perangkat Lunak ................................................. 49

BAB IV ............................................................................................................................. 50

4.1.Implemenasi ............................................................................................................ 50

4.1.1.Pengolahan Data .............................................................................................. 50

4.1.2.Preprocessing .................................................................................................. 54

BAB V .............................................................................................................................. 63

5.1.Kesimpulan ............................................................................................................. 63

5.2.Saran ....................................................................................................................... 63

DAFTAR PUSTAKA ....................................................................................................... 65

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 14: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

xiv

DAFTAR GAMBAR

Gambar 2. 1 Gambar Flowchart Arus Proses K-Means Clustering ..................... 20

Gambar 3. 1 Gambar proses sistem ..................................................................... 26

Gambar 4. 1 Gambar Folder Kelompok Dokumen ............................................. 50

Gambar 4. 2 Gambar Data Dokumen Bermakna Keadaan .................................. 51

Gambar 4. 3 Gambar Data Dokumen Bermakna Komunikasi ............................. 52

Gambar 4. 4 Gambar Data Dokumen Bermakna Pekerjaan ................................ 52

Gambar 4. 5 Gambar Data Dokumen Bermakna Sifat ......................................... 52

Gambar 4. 6 Gambar Data Dokumen Bermakna Urutan Tindakan ..................... 53

Gambar 4. 7 Gambar Data Dokumen Bermakna Urutan Giliran ......................... 54

Gambar 4. 8 Gambar Hasil Cluster Sistem 1 ........................................................ 59

Gambar 4. 9 Gambar Hasil Cluster Sistem 2………..…………………………60

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 15: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

xv

DAFTAR TABEL

Tabel 2. 1 Tabel Imbuhan Awalan dan Akhiran ................................................... 15

Tabel 2. 2 Tabel Cara menentukan tipe awalan untuk kata yang diawali dengan

"te" ......................................................................................................................... 15

Tabel 2. 3 Tabel Jenis awalan berdasarkan tipe awalanya ................................... 16

Tabel 3. 1 Tabel Data Paragraf Mengandung Kata Sabar Dengan Makna Keadaan

............................................................................................................................... 23

Tabel 3. 2 Tabel Data Paragraf Mengandung Kata Sabar Dengan Makna

Komunikasi ........................................................................................................... 24

Tabel 3. 3 Tabel Data Paragraf Mengandung Kata Sabar Dengan Makna

Pekerjaan ............................................................................................................... 24

Tabel 3. 4 Tabel Data Paragraf Mengandung Kata Sabar Dengan Makna Sifat ... 25

Tabel 3. 5 Tabel Data Paragraf Mengandung Kata Sabar Dengan Makna Urutan

Tindakan ................................................................................................................ 25

Tabel 3. 6 Tabel Data Paragraf Mengandung Kata Sabar Dengan Makna Urutan

Giliran ................................................................................................................... 26

Tabel 3. 7 Tabel Tokenizing data dengan paragraph yang mengandung kata sabar

dengan makna keadaan ......................................................................................... 30

Tabel 3. 8 Tabel Tokenizing data dengan paragraph yang mengandung kata sabar

dengan makna komunikasi .................................................................................... 30

Tabel 3. 9 Tabel Tokenizing data dengan paragraph yang mengandung kata sabar

dengan makna pekerjaan ....................................................................................... 31

Tabel 3. 10 Tabel Tokenizing data dengan paragraph yang mengandung kata sabar

dengan makna sifat ................................................................................................ 31

Tabel 3. 11 Tabel Tokenizing data dengan paragraph yang mengandung kata sabar

dengan makna urutan tindakan.............................................................................. 32

Tabel 3. 12 Tabel Tokenizing data dengan paragraph yang mengandung kata sabar

dengan makna urutan giliran ................................................................................. 32

Tabel 3. 13 Tabel Document Frequency ............................................................... 43

Tabel 3. 14 Tabel idf ............................................................................................. 44

Tabel 3. 15 Tabel W dengan makna Keasaan ....................................................... 45

Tabel 3. 16 Tabel W dengan makna Komunikasi ................................................. 45

Tabel 3. 17 Tabel W dengan makna pekerjaan ..................................................... 46

Tabel 3. 18 Tabel W dengan Makna Sifat............................................................. 46

Tabel 3. 19 Tabel W dengan makna urutan tindakan ............................................ 47

Tabel 3. 20 Tabel W dengan makna urutan giliran ............................................... 48

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 16: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

1

BAB I

PENDAHULUAN

1.1 LATAR BELAKANG

Informasi merupakan hal yang penting bagi setiap orang.Informasi

dibutuhkan sebagai penunjang untuk pengetahuan sampai pengambilan

keputusan. Kemajuan teknologi, sangat berpengaruh dengan pertambahan

informasi yang tersedia dan kecepatan pemerolehan informasi.Salah satu bentuk

informasi adalah informasi yang berbentuk teks. Dalam skripsi ini akan dibahas

bagaimana mengolah suatu dokumen, untuk memperoleh informasi termasuk

kedalam kategori apakah dokumen tersebut. Dokumen yang digunakan adalah

dokumen suatu karya sastra.

Karya sastra merupakan suatu tulisan atau karya tulis yang mengandung

nilai-nilai tertentu.Karya sastra yang berupa tulisan tentunya terdiri dari

sekumpulan kata-kata. Dan dalam sebuah karya satra ada banyak kata yang selalu

diulang. Dalam suatu kalimat dalam karya sastra terdapat kata yang memiliki

makna yang berbeda-beda meskipun kata tersebut sama. Untuk itu kata-kata

tersebut biasanya dikelompokan berdasarkan maknanya.Kata dalam suatu karya

perlu dikelompokan sesuai dengan makna masing-masing kata yang terdapat

dalam kalimat.

Saat ini pengelompokan kata masih dikelompokan secara manual dengan

membaca suatu tulisan per kalimat satu per satu kata yang kemudian akan

dikelompokan sesuai maknanya. Penghitungan dan pengelompokan secara

manual tersebut memerlukan waktu yang sangat lama dan butuh ketelitian.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 17: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

2

Dari masalah tersebut akan dibangun suatu sistem yang mampu menghitung

dan mengelompokan kata sesuai maknanya. Data kata tertentu dalam sebuah

artikel atau sejenisnya diolah terlebih dahulu. Pengolahan kata atau pengolahan

teks disebut juga text mining. Setelah proses pengolahan kata selanjutnya data

kata tersebut dikelompokan atau clustering menggunakan algoritma k-means.

Maka masalah yang pokok yang ingin dijawab pada penelitian ini adalah

seberpa tepat pengelompokan kata berdasarkan makna dengan menggunakan

metode K-Means Clustering. Metode K-Means Clustering ini memiliki kelebihan

yaitu tepat dalam mengelompokkan kata dibandingkan dengan pengelompokan

secara manual. Pemilihan metode K-means Clustering diharapkan tepat dalam

mengelompokan kata sesuai maknanya, karena sesuai dari keunggulan yang

dimiliki k-means dibandingkan dengan metode lain (Baswade, 2013) yaitu:

1. Relatif efisien dengan O (knt) dimana k-jumlah cluster, n-jumlah objek, t-

jumlah iterasi.

2. Mudah untuk dijalankan.

3. Waktu yang dibutuhkan untuk menjalakan pembelajaran ini relatif cepat.

4. Mudah untuk diadaptasi.

1.2 RUMUSAN MASALAH

Berdasarkan latar belakang yang ada dapat dirumuskan masalah yaitu :

Sejauh mana ketepatan metode K-Means Clustering dalam

pengelompokan paragraf yang mengandung kata sabar dalam suatu karya

sastra sesuai dengan maknanya.

1.3 TUJUAN

1. Mengimplementasikan metode K-Means Clustering dalam

mengidentifikasi makna kata sabar pada karya sastra.

2. Mengetahui sejauh mana metode K-Means Clustering dapat

mengelompokan kata pada karya sastra.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 18: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

3

1.4 BATASAN MASALAH

1. Pengelompokan menggunakan informasi teks dengan ekstensi .txt

2. Memanfaatkan metode K-Means Clustering sebagai acuan kinerja sistem.

3. Pengelompokan ini dibagi menjadi 6 yaitu: sifat, komunikasi, keadaan,

urutan tindakan, pekerjaan, urutan giliran.

1.5 METODOLOGI PENELITIAN

Metodologi yang digunakan dalam penelitian ini adalah studi kasus

dengan langkah-langkah sebagai berikut:

1. Studi Pustaka

Memberikan pengetahuan tentang hal-hal berkaitan dengan

pengelompokan dokumen.Mempelajari dan memahami buku referensi

yang berkaitan tentang konsep algoritma K-Means.Clustering

2. Pengambilan data

Data yang digunakan dari kutipan paragraph dalam karya sastra

yang mengandung kata sabar.

3. Perancangan Sistem

Pada tahap ini dilakukan perancangan sistem yang akan dibuat.

4. Implementasi

Pada tahap ini dilakukan pembuatan aplikasi yang digunakan untuk

mempermudah pengelompokan kata berdasarkan maknanyanya.

5. Pengujian dan Analisa Hasil

Tujuan pada tahap ini adalah untuk mengetahui tingkat keakuratan

algoritma K-Means dalam mengelompokan kata sabar sesaui maknanya

dan menganalisa hasil.

1.6 SISTEMATIKA PENULISAN

Sistem penulisan yang dipergunakan dalam penyusunan tugas

akhir ini tersusun dari beberapa bab sehingga mempermudah dan

memperjelas penulisan dan pembahasan.Sistematis dibagi menjadi 5 bab,

adapun ringkasannya sebagai berikut:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 19: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

4

BAB I PENDAHULUAN

Menjelaskan tentang latar belakang penulisan, perumusan masalah,

tujuan penelitian, pembatasan masalah, metode penulisan, dan sistematika

penulisan.

BAB II LANDASAN TEORI

Membahas tentang landasan teori yang dipergunakan dalam

penulisan tugas akhir ini.

BAB IIIMETODOLOGI PENELITIAN

Menguraikan dan membahas gambaran dan perancangan tentang

sistem yang dibuat, yang meliputi analisa sistem dan perancangan sistem.

BAB IV IMPLEMENTASI DAN ANALISA HASIL

Bab ini berisi implementasi dari perancangan yang telah dibuat

sebelumnya serta analisa dari hasil program yang telah dibuat.

BAB V PENUTUP

Bab ini berisi kesimpulan dari penelitian dan saran-saran untuk

pengembangan penelitian lebih lanjut.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 20: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

5

BAB II

LANDASAN TEORI

Bab ini membahas tentang teori-teori dan uraian yang berkaitan

dengan identifikasi karya sastra menggunakan K-Means Clustering.

Berikut adalah teori-teori yang akan dibahas:

2.1. Ideologi Kesabaran Dalam Karya Sastra

Kesabaran merupakan ideologi yang penting dalam budaya

Indonesia.Dalam karya sastra Indonesia, ideologi kesabaran dapat muncul

secara tersurat dengan penggunaan adjektiva sabar, nomina kesabaran dan

penyabar, dan verba bersabar serta menyabarkan. Dari penelitian korpus

yang dilakukan dengan memakai data yang tersedia dalam www.corci.org,

ditemukan 6 (enam) konsep kesabaran, yaitu penerimaan kondisi yang

harus dihadapi, penantian giliran, penerimaan urutan kegiatan, kesedian

menunggu dalam pembicaraan, sifat sabar, dan ketekunan dalam

melakukan pekerjaan. Keenam konsep kesabaran itu diperlukan untuk

menjaga keseimbangan diri, menjaga hubungan yang harmonis, dan

mencapai hasil yang ingin dicapai.

Kalimat dengan tema sabar menunjukan 6 (enam) makna.Keenam

makna itu adalah penerimaan keadaan, penantian giliran, penerimaan

urutan tindakan, kesediaan menunggu dalam pembicaraan, sifat, dan

ketekunan dalam pekerjaan.

Masing-masing makna kesabaran muncul pada konteks yang berbeda-

beda, yaitu:

a. Penerimaan Keadaan

Arti penerimaan keadaan muncul atas kesadaran pelaku atau

pembicara pada keadaan lawan bicara atau orang lain yang tidak baik atau

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 21: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

6

jelek. Pelaku atau pembicara karena keadaan itu tidak dapat diubah lagi dan

harus diterima saja atau ditolak.

Contoh:

1. Pun ketika ingin membentuk sebuah kalimat, bingung aku

menentukan tense-nya. Bahasa Inggrisku tak maju-maju” “Begini,”

kata Lintang sabar menghadapi ketololanku.ketika itu ia sedang

memaku sandal cunghai-nya yang menganga seperti buaya lapar. (SJ-

6015).

2. “… Kamu harus mau menuntun gua, Roy!” Dengan sabar dan telaten,

Roy menuntun sobatnya. Kadangkala kalau Toni kecapekan dan

merasa sakit pada lututnya akibat bergesekan dengan kaki palsunya.

Roy tidak bosan-bosan memompa semangatnya. (SJ-6057).

Pada contoh data diatas penerimaan keadaan dilakukan oleh Lintang

dan Roy mempunyai latar belakang yang sama. Pembicara dan Lintang

pada data (1) Toni dan Roy merupakan sahabat.Sebagai sahabat mereka

menerima keadaan sahabat mereka, dan sabar menghadapi keadaan yang

tidak mungkin diubah pada sahabat mereka.

b. Penantian Giliran

Kesabaran juga muncul pada penantian dari tindakan orang lain.

Pelaku atau pembicara perlu sabar untuk menunggu orang lain selesai

melakukan tindakannya atau menunggu gilirannya.

Contoh:

1. Penumpang berebut turun. Wajah gadis itu Nampak sabar sekali

menunggu luangnya jalan, Joki memberinya kesempatan untuk lewat.

(SJ-5997).

2. Rupanya laki-laki itu sudah menggenggam satu-satunya payung di

tangannya. Ia tak sabar menunggu istrinya bepikir.”Jangan, Pak. Aku

saja.” (SJ-6023).

Alasan munculnya perilaku kesabaran pada data (1) dan (2)

berbeda. Pada data (1) wanita itu sabar akan keadaan yang ramai. Ia tidak

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 22: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

7

mungkin langsung berebut turun. Pada data (2) suami itu sudah tidak

sabar menunggu istrinya berpikir. Ia langsung mengambil payung, dan

siap pergi.Dengan ketidak-sabaran itu.Ia menunjukan kekuasaannya atas

istrinya. Kekuasaan itu juga diakui oleh istrinya,”Jangan Pak. Aku saja

(yang pergi).”

c. Penerimaan Urutan Tindakan

Penerimaan urutan tindakan juga merupakan kesabaran.Pelaku atau

pembicara perlu melakukan tindakan sesuai dengan urutannya.Bila

seseorang melakukan tindakan yang tidak sesuai dengan urut-urutannya

menunjukan ketidak-sabaran orang itu.

Contoh :

1. Kami, delapan ekor sapi, yang akan tampil pada plot kedua,

gemetar menunggu aba-aba dari Mahar untuk menerjang arena.

Kami tak sabar dan rasanya kaki sudah gatal ingin

mendemonstrasikan kehebatan mamalia menari. Kami adalah

remaja-remaja kelenihan energy dan lapar akan perhatian. (SJ-

6011)

2. Tak satu baju pun yang tertinggal di almari. Seolah-olah Haji

Sudung akan kembali lagi ke rumah itu. Malam itu, sambil

mendekap buntalan tasnya. Haji Sudung tak sabar untuk segera

tertidur. Ia ingin berlari memburu pagi. (SJ-6040)

Karapan atau pacuan kuda mempunyai urut-urutan sendiri.Peserta

karapan harus mengikuti urut-urutan yang ditentukan sebelum mereka

akhirnya dapat berpacu di arena.Sapi-sapi pada data (1) menunjukkan

ketidak-sabarannya untuk mengikuti urutan itu.Demikian juga Haji

Sulung. Ia harus mengemasi barang-barangnya sebelum ia tidur dan

kemudian pergi pada keesokan harinya. Ia ingin segera tidur dan pergi

keesokan harinya.

Sapi-sapi pada data (1) dan Haji Sulung pada data (2) mempunyai

persamaan sifat.Sapi-sapi dan Haji Sulung menunjukkan kekuatan fisik

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 23: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

8

yang besar. Sapi-sapi itu merupakan "remaja yang kelebihan energi," dan

Haji Sulung "ingin berlari memburu pagi." Kiranya kekuatan fisik dapat

merupakan sebab ketidak-sabaran.

d. Kesediaan Menunggu dalam Pembicaraan

Kata sabar juga mempunyai arti kesediaan menunggu dalam

pembicaraan. Peserta pembicaraan perlu menunggu sampai orang yang

berbicara selesai berbicara sebelum ia memulai bicara. Menyela

pembicaraan merupakan perilaku tidak sabar.

Contoh:

1. Cun An tercenung sebentar, kelihatannya menyerap omongan

penyamun ini untuk disari-sarikan, tapi setelah itu dengan tak

sabar berkata,"Sudah saya bilang jangan bertele-tele. Katakan

saja tawaranmu itu." (SJ-6066)

2. Mamak berhenti sejenak. Kalan semakin tidak sabar. Sebatang

rokok keretek yang ia selai tak cukup mampu untuk

menghilangkan gundahnya. ”Maksud Mamak?

Cun An menunjukkan ketidak-sabarannya dengan memotong pembicaraan

penyamun itu, dan Kalan dengan memotong pembicaraan Mamak.Latar belakang

ketidak-sabaran Cun An dan Kalan berbeda. Kalimat “Sudah saya bilang jangan

bertele-tele. Katakan saja tawaran itu” menunjukkan bahwa Cun An mempunyai

kekuatan yang lebih besar daripada penyamun itu. Cun An tidak takut pada

penyamun itu. Berbeda dengan Cun An, Kalan merasa tidak nyaman untuk

melakukan tindakan yang dapat diartikan tidak sabar.Ia merasa terpaksa harus

memotong pembicaraan mamaknya, orang yang harus dihormatinya.Sebatang

rokok keretek yang ia selai tak cukup mampu untuk menghilangkan gundahnya.

e. Sifat Sabar

Sifat sabar merupakan sifat baik yang dipunyai oleh orang yang

diidamkan. Sifat itu sejajar dengan sifat-sifat baik yang lain seperti

bijaksana, baik, tabah, dan setia.

Contoh:

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 24: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

9

1. Perempuan memang bukan persoalan baginya. Hanya masalahnya

sampai sekarang dia baru bisa memahami seorang perempuan saja,

mamanya, wanita yang sabar, setia, bijaksana, dan penuh kasih

sayang.

2. ”Kata orangtua saya, sebagai istri saya mesti menghormati suami,

saya tidak boleh membantah kata suami. Hanya orang yang baik

dan sabar yang akan bisa masuk surga.”

Data (1) membicarakan mama pelaku yang mempunyai sifat sabar,

dan data (2) menunjukkan pembicara sendiri yang mempunyai sifat

sabar.Sifat sabar pada data (1) disertai dengan sifat yang baik lainnya yaitu

setia, bijaksana, dan penuh kasih sayang, dan pada data (2) sifat itu disertai

dengan sifat baik.

Pengakuan pelaku bahwa ibu pelaku itu mempunyai sifat sabar yang

belum ia jumpai pada wanita lain pada data (1) dan pengakuan pembicara

bahwa sifat sabarnya ia kembangkan karena kata orangtuanya

menunjukkan peran orang tua dalam penanaman sifat sabar. Mereka

melihat sosok orang tua sebagai orang yang dapat mereka tauladani dalam

kesabaran.

Akan tetapi perilaku sabar pada data (2) menunjukkan jalan

pemikiran yang berbeda.Kesabaran pada wanita itu merupakan kesabaran

yang dipaksakan.Seorang istri tidak boleh membantah kata suaminya

apapun yang dikatakan suaminya. Bila ia melanggar aturan itu, ia diancam

untuk tidak dapat masuk surga.

f. Ketekunan dalam Pekerjaan

Arti kesabaran yang terakhir adalah ketekunan dalam pekerjaan.Orang

yang sabar adalah orang yang dapat menghadapi situasi yang sulit untuk

dihadapi atau melakukan pekerjaannya dengan tekun.Ia tidak mudah

menyerah menghadapi keadaan yang sulit dan terus tekun untuk mencapai

tujuannya.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 25: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

10

Contoh:

1. "Bagaimana aku bisa sabar, kalau harus membuang tenaga, waktu,

dan pikiran cuma untuk beberapa ratus Indian rupee!"

2. Uang itu ditolak Emak. Tetapi, setelah dibujuk berulang-ulang oleh

Si Pelukis dengan sabar dan manis, akhirnya uang yang cukup

banyak itu diterima Emak.

Pembicara pada data (1) tidak sabar atau tabah menghadapi keadaan

yang sulit.Ia tidak mau membuang tenaga, waktu, dan pikirannya karena

uang yang diterimanya sangat sedikitnya.Sebaliknya, Si Pelukis dengan

gigih atau tekun terus membujuk ibu pembicara sehingga wanita itu mau

menerima uang yang ingin diberikannya.

Latar belakangnya munculnya kesabaran atau ketidak-sabaran pada

(1) dan (2) berbeda. Pembicara pada (1) tidak sabar atas perilaku pemilik

pekerjaan atau orang yang memberinya pekerjaan. Ia merasa diperlakukan

tidak sebanding antara tenaga, waktu, dan pikiran yang dikeluarkannya

dengan uang yang diterimanya.Pemilik uang, modal, atau pekerjaan dapat

memperlakukan orang yang dipekerjakannya dengan tidak sepantasnya.

Pada data (2) faktor kedudukan dan usia Emak menuntut pelukis itu untuk

bertindak gigih untuk meyakinkan wanita itu agar mau menerima uang.

(B.B.Dwijatmoko,2016)

2.2.Text Mining

Text mining didefinisikan sebagai proses pengetahuan intensif yang

melibatkan interaksi pengguna dengan sekumpulan dokumen dari waktu

ke waktu menggunakan berbagai macam analisis. Sejalan dengan data

mining, text mining berusaha mengekstrak informasi yang berguna dari

sumber data melalui identifikasi dan eksplorasi pattern (Putri, 2013).

Text mining mencoba untuk mengekstrak informasi yang berguna dari

sumber data melalui identifikasi dan eksplorasi dari satu pola

menarik.Sumber data berupa sekumpulan dokumen dan pola menarik yang

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 26: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

11

tidak ditemukan dalam bentuk database record, tetapi dalam data teks

yang tidak terstruktur (Sujana, 2013).

2.3.Text Preprocessing

Tahap text preprocessing merupakan tahap awal dari text mining.Text

preprocessing merupakan proses menggali, mengolah dan mengatur

informasi dengan cara menganalisis hubungannya dengan aturan-aturan

yang ada di data tekstual semi terstruktur atau tidak terstruktur (Luhulima,

Marji, dan Muflikhah, 2013).

Untuk lebih efektif dalam proses text preprocessing, dilakukan

langkah transformasi data ke dalam suatu format yang memudahkan untuk

kebutuhan pemakai. Proses ini disebut text preprocessing. Setelah dalam

bentuk yang lebih terstruktur dengan adanya proses diatas, data dijadikan

sumber data yang dapat diolah lebih lanjut. Tahapan text preprocessing,

diantaranya: Tokenizing, Stopword removal, Stemming dan pembobotan.

2.3.1.Tokenizing

Tahap Tokenizing merupakan tahap permotongan atau pemenggalan

kata dalam suatu dokumen menjadi potongan-potongan kata yang berdiri

sendiri. Pada tahap ini juga akan menhilangkan karakter selain huruf

seperti angka, tanda baca atau karakter yang melekat pada kata tersebut

dan mengubah huruf ke huruf kecil (Manning, 2008).

Contoh proses Tokenizing:

Kalimat asal:

Kunanti dengan penuh Kesabaran.

Hasil dari Text Preprocessing:

kunanti penuh

dengan kesabaran

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 27: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

12

2.3.2.Stopword Removal/Filtering

Tahap filtering adalah tahap mengambil kata-kata penting dari

hasil tokenizing.Menggunakan algoritma stoplist yaitu menghilangkan

kata yang kurang penting atau wordlist yaitu menyimpan kata penting.

Contoh stopword yaitu: yang, juga, dari, dia, kami, kamu, aku, saya, ini,

itu, atau, dan, tersebut, pada, dengan, adalah, yaitu, ke, tak, tidak, di,

pada, jika, maka, ada, pun, lain, saja, hanya, namun, seperti, kemudian,

dan lain-lain.

Contoh proses stopword:

Hasil dari text tokenizing:

kunanti penuh

dengan kesabaran

Hasil dari stopword:

nanti penuh

dengan kesabaran

2.3.3.Stemming

Stemming merupakan suatu proses yang terdapat dalam sistem IR

yang mentransformasi kata-kata yang terdapat dalam suatu dokumen ke

kata-kata akarnya (root word) dengan menggunakan aturan-aturan

tertentu. Sebagai contoh, kata bersama, kebersamaan, menyamai, akan

distem ke root word-nya yaitu “sama”. Proses stemming pada teks ber-

Bahasa Indonesia berbeda dengan stemming pada teks berbahasa Inggris.

Pada teks berbahasa Inggris, proses yang diperlukan hanya proses

menghilangkan sufiks. Sedangkan pada teks berbahasa Indonesia, selain

sufiks, prefiks, dan konfiks juga dihilangkan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 28: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

13

Algoritma stemming yang digunakan dalam penelitian ini adalah

Stemming Sastrawi. Sastrawi stemmer merupakan sebuah library

stemmer sederhana yang didesain untuk dapat digunakan secara mudah.

Sastrawi stemmer menerapkan algoritma yang berbasis Nazief dan

Adriani, kemudian ditingkatkan oleh algoritma CS (Confix Stripping),

kemudian ditingkatkan lagi oleh algoritma ECS (Enhanced Confix

Strippin), lalu ditingkatkan lagi oleh Modified ECS.

Dengan menggunakan algoritma-algoritma tersebut, banyak

persoalan stemming berhasil diatasi:

1. Mencegah overstemming dengan kamus kata dasar.

2. Mencegah understemming dengan aturan-aturan tambahan

3. Kata bentuk jamak berhasil distem. Contoh : buku-buku

menjadi buku. (Sastrawi)

Algoritma yang dibuat oleh Bobby Nazief dan Mirna Adriani ini

memiliki tahap-tahap sebagai berikut:

1.Cari kata yang akan distem dalam kamus. Jika ditemukan maka

diasumsikan bahwa kata tesebut adalah root word. Maka algoritma

berhenti.

2. Inflection Suffixes (“-lah”, “-kah”, “-ku”, “-mu”, atau “-nya”) dibuang.

Jika berupa particles (“-lah”, “-kah”, “-tah” atau “-pun”) maka langkah

ini diulangi lagi untuk menghapus Possesive Pronouns (“-ku”, “-mu”,

atau “-nya”), jika ada.

3.Hapus Derivation Suffixes (“-i”, “-an” atau “-kan”). Jika kata ditemukan

di kamus, maka algoritma berhenti. Jika tidak maka ke langkah 3a

a. Jika “-an” telah dihapus dan huruf terakhir dari kata tersebut

adalah “-k”, maka “-k” juga ikut dihapus. Jika kata tersebut

ditemukan dalam kamus maka algoritma berhenti.Jika tidak

ditemukan maka lakukan langkah 3b.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 29: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

14

b. Akhiran yang dihapus (“-i”, “-an” atau “-kan”) dikembalikan,

lanjut ke langkah 4.

4.Hapus Derivation Prefix. Jika pada langkah 3 ada sufiks yang dihapus

maka pergi ke langkah 4a, jika tidak pergi ke langkah 4b.

a. Periksa tabel kombinasi awalan-akhiran yang tidak

diijinkan. Jika ditemukan maka algoritma berhenti, jika

tidak pergi ke langkah 4b.

b. For i = 1 to 3, tentukan tipe awalan kemudian hapus

awalan. Jika root word belum juga ditemukan lakukan

langkah 5, jika sudah maka algoritma berhenti. Catatan:

jika awalan kedua sama dengan awalan pertama algoritma

berhenti.

5.Melakukan Recoding.

6.Jika semua langkah telah selesai tetapi tidak juga berhasil maka kata

awal diasumsikan sebagai root word. Proses selesai.

Tipe awalan ditentukan melalui langkah-langkah berikut:

1. Jika awalannya adalah: “di-”, “ke-”, atau “se-” maka tipe awalannya

secara berturut-turut adalah “di-”, “ke-”, atau “se-”.

2. Jika awalannya adalah “te-”, “me-”, “be-”, atau “pe-” maka

dibutuhkan sebuah proses tambahan untuk menentukan tipe

awalannya.

3. Jika dua karakter pertama bukan “di-”, “ke-”, “se-”, “te-”, “be-”,

“me-”, atau “pe-” maka berhenti.

4. Jika tipe awalan adalah “none” maka berhenti. Jika tipe awalan

adalah bukan “none” maka awalan dapat dilihat pada Tabel 2.

Hapus awalan jika ditemukan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 30: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

15

Tabel 2. 1 Tabel Imbuhan Awalan dan Akhiran

Awalan Akhiran yang tidak diijinkan

be- -i

di- -an

ke- -i, -kan

me- -an

se- -i, -kan

Tabel 2. 2 Tabel Cara menentukan tipe awalan untuk kata yang diawali dengan "te"

Following Characters Tipe

Awalan Set 1 Set 2 Set 3 Set 4

“-r-“ “-r-“ - - none

“-r-“ Vowel - - Ter-luluh

“-r-“ Not(vowel

or “-r-“)

“-er-“ vowel Ter

“-r-“ Not(vowel

or “-r-“)

“-er-“ Not vowel ter-

“-r-“ Not(vowel

or “-r-“)

not “-er-“ - Ter

Not(vowel

or “-r-“)

“-er-“ Vowel - none

Not(vowel “-er-“ Not vowel - Te

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 31: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

16

or “-r-“)

Tabel 2. 3 Tabel Jenis awalan berdasarkan tipe awalanya

Tipe Awalan Awalan yang harus dihapus

di- di-

ke- ke-

se- se-

te- te-

ter- ter-

ter-luluh Ter

2.3.4.Pembobotan tf-idf

Pembobotan dilakukan untuk mendapatkan nilai dari kata (term)

yang telah diekstrak.Metode pembobotan yang digunakan yaitu

pembobotan tf-idf. Pada tahap ini, setiap dokumen diwujudkan sebagai

sebuah vector dengan elemen sebanyak kata (term) yang didapat dari tahap

ekstraksi dokumen. Vector tersebut beranggotakan bobot dari setiap term

yang didapat dengan perhitungan bobot tf-idf.

Formula yang digunakan untuk menghitung bobot (w) masing-

masing dokumen terhadap kata kunci adalah:

Dimana:

d = dokumen ke-d

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 32: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

17

t = kata ke-t dari kata kunci

W = bobot dokumen ke-d terhadap kata ke-t

Setelah bobot (w) masing-masing dokumen diketahui, maka

dilakukan proses sorting/pengurutan dimana semakin besar nilai w,

semakin besar tingkat similaritas dokumen tersebut terhadap kata yang

dicari, demikian sebaliknya.

Idf =

Dimana:

N = jumlah dokumen

dfj = jumlah dokumen j yang mengandung kata

Metode ini berguna untuk mencari representasi nilai dari tiap-tiap

dokumen dari kumpulan data training. Representasi nilai akan dibentuk

menjadi vector antara dokumen dengan kata (document with terms).

Kesamaan antara dokumen dengan cluster ditentukan oleh sebuah

prototype cluster yang disebut juga dengan cluster centroid (Putri, 2013).

2.4.Clustering

Clustering adalah pekerjaan yang memisahkan data/vector ke

dalam sejumlah kelompok (cluster) menurut karakteristiknya masing-

masing. Data-data yang mempunyai kemiripan karakteristik akan

berkumpul dalam cluster yang sama, dan data-data dengan karakteristik

berbeda akan terpisah dalam cluster yang berbeda. Tidak diperlukan label

kelas untuk setiap data yang diproses dalam clustering karena nantinya

label baru bisa diberikan ketika cluster sudah terbentuk. Karena tidak

adanya target label kelas untuk setiap data, maka clustering sering disebut

juga pembelajaran tidak terbimbing (unsupervised learning)(Eko Prasetyo,

2014).

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 33: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

18

Tujuan dari clustering adalah menemukan cluster berkualitas dalam

waktu yang tepat.Cluster dalam data mining berguna untuk menemukan

pola distribusi di dalam sebuah data set yang berguna untuk proses analisa

data. Kesamaan obyek biasanya diperoleh dari kedekatan nilai-nilai atribut

yang menjelaskan obyek-obyek data, sedangkan obyek-obyek data

biasanya direpresentasikan sebagai sebuah titik dalam ruang multidimensi.

Dengan menggunakan clustering, dapat diidentifikasikan daerah yang

padat, antara pola-pola distribusi secara keseluruhan dan keterkaitan yang

menarik antara atribut-atribut data. Dalam data mining usaha difokuskan

pada metode-metode penemuan cluster pada basis data berukuran besar

secara efektif dan efisien.

2.5.K-Means

K-means merupakan algoritma pengelompokan iterative yang

melakukan partisi set data ke dalam sejumlah K cluster yang sudah

diterapkan. Algoritma K-Means sedehana untuk diimplementasikan dan

dijalankan, relative cepat, mudah beradaptasi dan umum penggunaannya

dalam praktek. Secara historis, K-Means menjadi salah satu algoritma

yang paling dalam bidang data mining (Eko Prasetyo, 2014).

Algoritma K-means mencapai kondisi konvergen ketika pengalokasian

kembali titik data tidak lagi berubah.Proses dari iterasi ke iterasi hingga

dicapai kondisi konvergen juga dapat diamati dari nilai fungsi objektif

yang didapatkan. Pada kondisi yang semakin konvergen dapat diamati

bahwa nilai fungsi objektif akan semakin menurun. Pemilihan K titik data

sebagai centroid awal juga mempengaruhi hasil clustering. Sifat ini

menjadi karakteristik alami K-Means yang dapat mengakibatkan hasil

clusteryang didapat pada percobaan berbeda mendapatkan hasil yang

berbeda. Kondisi seperti ini dikenal dengan solusi yang local optima, yang

artinya algoritma K-Means sangat sensitive terhadap lokasi awal centroid.

Dengan kata lain, inisialisasi set representasi cluster C yang berbeda dapat

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 34: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

19

mengakibatkan hasil cluster yang berbeda, bahkan pada set data X yang

sama. Innisialisai yang tidak baik akan mendapatkan hasil cluster yang

tidak baik juga. Penyelesaian masalah local optima dapat diselesaikan

dengan menjalankan algoritma beberapa kali dengan inisial centroid yang

berbeda kemudian memilih hasil yang terbaik.

Langkah -langkah dari Algoritma K-means (Handoyo, Rumani, dan

Nasution, 2014):

1. Menentukan nilai k sebagai jumlah cluster yang ingin dibentuk

2. Menentukan centroid (titik pusat cluster) awal menggunakan

variance initialitation.

3. Hitung jarak setiap data ke masing-masing centroid

menggunakan rumus korelasi antar dua objek (Euclidean

Distance).

4. Mengelompokan berdasarkan jarak minimum antara data

dengan centroidnya.

5. Menentukan centroid yang baru dengan cara menghitung nilai

rata-rata dari data yang ada pada centroid yang sama.

6. kemudian kembali ke langkah 3, jika posisi centroid baru

dengan centroid lama, tidak sama.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 35: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

20

Gambar 2. 1 Gambar Flowchart Arus Proses K-Means Clustering

Gambar 2.1 merupakan algoritma k-means clustering dengan

menggunakan flowchart. Langkah pertama adalah menentukan banyaknya

jumlah cluster K, selanjutnya menentukan titik centroid awal, menentukan

titik centroid dilakukan menggunakan variance initialitation. Tahap

selanjutnya menghitung jarak obyek ke pusat salah satu perhitungannya

menggunakan kedekatan euclidean distance, lalu kelompokan obyek

berdasarkan jarak terdekat (minimum). Pada tahap terakhir apabila posisi

centroid baru dengan centroid lama tidak sama, maka terjadi pengulangan

pada tahap titik pusat. Dan ketika posisi centroid baru dengan centroid

lama sama, maka selesai.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 36: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

21

2.6.Variance Initialitation

Variance initialitation adalah salah satu algoritma yang digunakan

Untuk menentukan centroid awal pada proses clustering. Berikut langkah-

langkah variance initialitation( Al-Daoud, 2007):

1. Hitung nilai variance data setiap dimensi (kolom data).

2. Temukan kolom dengan nilai variance terbesar, kemudian sort data.

3. Bagi keseluruhan data menjadi K bagian, K adalah jumalh cluster.

4. Temukan median (nilai tengah) pada setiap bagian.

5. Gunakan vector data median setiap bagian sebagai centroid awal

cluster.

Variance Initialitation merupakan salah satu teknik analisis

multivariate yang berfungsi untuk membedakan rerata lebih dari dua

kelompok data dengan cara membandingkan variansinya. Analisis varian

termasuk dalam kategori statistic parametric( Ghozali, 2009). Berikut

rumus yang digunakan untuk menghitung variansi.

Pada persamaan

= varian

= nilai x ke-i

= rata-rata

n = ukuran sampel

Untuk menghitung standar deviasi (simpangan baku) maka

digunakan rumus standar deviasi seperti yang terdapat pada persamaan

berikut.

s =

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 37: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

22

Pada persamaan

s = Standar deviasi (simpangan baku)

= varian

2.7.Euclidian Distance

Untuk menghitung jarak antara objekdengan centroid penulis

menggunakan Euclidian Distance.

; i = 1,2,3,…,

= objek x ke-i

= daya y ke-i

n = banyaknya objek

Kemudian untuk menghitung centroid cluster ke-i berikutnya

digunakan rumus sebagai berikut:

= jumlah dokumen dalam cluster k

= dokumen dalam cluster k

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 38: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

23

BAB III

METODOLOGI PENELITIAN

3.1.Data

Data yang akan digunakan diambil dari web corci.org yang berjumlah

108 karya satra.Dalam setiap dokumen mengandung kata sabar yang akan

dikelompokan sesaui dengan maknanya. Data kemudian diubah ke dokumen

berbentuk dokumen berektensi .txt. Data yang dipilih berasal dari enam kelompok

yaitu keadaan, komunikasi, pekerjaan, sifat, urutan tindakan,urutan giliran.

Berikut adalah contoh paragraph dalam suatu karya sastra yang

mengandung kata sabar dengan makna keadaan.

Meski ia tahu ibunya sayang kepadanya, tetapi kalau marah tetap saja

mengerikan. Biasanya, ia suka pura-pura tertidur kalau sedang dimarahi, menutupi

telinganya dengan bantal agar tak mendengar suara ibunya yang terus-menerus

berbicara, dan biasanya pula sang ibu akan menunggu, sampai kapan Manisha

bisa sabar untuk pura-pura tertidur, terkadang ia bisa benar-benar tertidur pada

akhirnya, terkadang pula tetap tak bisa tidur, hanya bisa menunggu emosi ibunya

reda, dan akhirnya, mereka akan saling menunggu, siapa yang paling sabar di

antara keduanya. Sudah ratusan kali Manisha dimarahi ibunya, entah karena

kesalahan fatal semacam menumpahkan gula dari stoples, atau membiarkan air

keran kamar mandi terbuka yang menyebabkan airnya meluber, sampai beragam

alasan yang menurutnya mengada-ada. Lama kelamaan, Manisha bisa

dikriminalisasi oleh ibunya sendiri.

Tabel 3. 1 Tabel Data Paragraf Mengandung Kata Sabar Dengan Makna Keadaan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 39: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

24

Selanjutnya adalah contoh paragraph dalam suatu karya sastra yang

mengandung kata sabar dengan makna komunikasi.

Ibu seperti menghindar, memalingkan muka menyembunyikan wajahnya, sambil

jawabnya: “Nanti juga kalau saatnya pulang, pasti pulang.” “Apa nggak kena

penyakit karena candik ala, Bu?” tanyaku tak sabar.Ibu diam saja.Memang,

kadang-kadang setengahnya aku kurang percaya dengan hal-hal aneh demikian,

tapi kadang kala pula hati dibuat ciut dengan kejadian seperti yang pernah kami

alami tahun lalu.

Kemudian contoh paragraph karya sastra yang mengandung kata sabar

dengan makna pekerjaan.

" begitu Iwin menulis. Tampaknya dia sudah tidak sabar, karena selama ini

perutnya cuma diisi cairan infus dan baru-baru ini sudah diperbolehkan menyedot

susu murni. "Seminggu lagi." Si suster tersenyum kecil sambil menyodorkan

segelas susu murni. Iwin menyedotnya hati-hati.Roy memperhatikannya dengan

teliti.Tampaknya Iwin sudah mendingan, batinnya.

Tabel 3. 2 Tabel Data Paragraf Mengandung Kata Sabar Dengan Makna Komunikasi

Tabel 3. 3 Tabel Data Paragraf Mengandung Kata Sabar Dengan Makna Pekerjaan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 40: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

25

Contoh paragraph karya sastra yang mengandung kata sabar dengan makna sifat.

Suatu malam, Ibnu Zaidun menghadiri undangan Wilada yang cukup meriah,

penuh hiburan dan nyanyian. Bertambahlah perasaan cinta dalam dirinya sehingga

ia ungkapkan dalam sebuah syair yang mendalam: Engkau di antara makhluk

yang besok menjadi pujaanku Engkau adalah waktu yang menjadi curahanku Aku

tidak mengajukan suatu keinginan diri Kecuali dengan menyebutku dengan

menenteram-kanku Janjimu akan kesabaran atasmu adalah kesabaranku di

tengah dahagaku pada air yang jernih Aku memiliki cita-cita, seandainya

pemfitnah itu merintangi Akan kubuktikan hasil dengan buah keberhasilan Benar,

hidup bagi kedua matanya adalah firdaus yang menerangi kegelapan. Bagi kedua

telinganya hidup juga ibarat langgam merdu, bagaikan burung-burung yang

beterbangan dengan riang gembira dari dahan ke dahan, dan dari pohon ke pohon.

Contoh paragraph karya sastra yang mengandung kata sabar dengan makna urutan

tindakan.

Dalam terpaan cahaya kuning, wajah-wajah kurus semakin mempertegas

cekungan mata bagai mayat hidup. Dadaku berdebar-debar, tak sabar untuk bisa

cepat-cepat bertemu ayah, yang mungkin ada di sana. Beberapa meter sebelum

mencapai tempat mereka, seorang petugas mengusirku, dan menyuruhku mancing

agak jauh dari situ. Kutaruh sepeda di pinggir jalan, kemudian duduk

mencangkung di atas batu padas di pinggir rawa.

Tabel 3. 4 Tabel Data Paragraf Mengandung Kata Sabar Dengan Makna Sifat

Tabel 3. 5 Tabel Data Paragraf Mengandung Kata Sabar Dengan Makna Urutan Tindakan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 41: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

26

Contoh paragraph karya sastra yang mengandung kata sabar dengan makna urutan

giliran.

Anak-anak kecil itu tertawa-tawa senang jika mengetahui kata-kata Indonesia

yang mirip dengan bahasa daerah mereka.Semakin anak-anak kecil itu gembira,

semakin tak sabar Murtini menunggu di dapur.Jangan-jangan dia tidak mencuci

hari ini, keluhnya dalam hati.Bayang-bayang pohon di tanah tinggal sepanjang

sepertiga panjang benda aslinya.Akhirnya anak-anak kecil itu bubar setelah Tody

menyuruhnya bubaran.

3.2.Deskripsi Sistem

Secara umum, sistem yang akan dibangun dalam penelitian ini adalah

sebuah sistem dengan fungsi utama untuk melakukan pengelompokan dokumen

kalimat yang mengandung kata Sabar yang diambil dari website corci.org.

Proses pengelompokan yang digunakan pada sistem ini adalah metode k-means

clustering. Praktiknya dokumen-dokumen yang akan dikelompokan dijadikan

sebagai arsip digital dengan ekstensi .txt. File text inilah yang nantinya akan

diproses oleh sistem melalui proses tokenizing, stopword, stemming, indexing,

pembobotan, clustering, dan evaluasi.

Gambar 3. 1 Gambar proses sistem

Tabel 3. 6 Tabel Data Paragraf Mengandung Kata Sabar Dengan Makna Urutan Giliran

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 42: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

27

Pada gambar 3.1.proses clustering dimulai dari input data yang

berupa kalimat-kalimat karya sastra, kemudian dilanjutkan dengan text

operation, pada tahap awal dilakukan tokenizing, yaitu proses pemisahan

data dan menghilangkan karakter yang bukan huruf seperti tanda baca atau

angka, langkah selanjutnya adalah stopword, stopword digunakan untuk

mengambil kata-kata yang dianggap penting dari tahap tokenizing,

membuang kata yang kurang penting. Tahap selanjutnya adalah stemming,

stemming digunakan untuk menghilangkan kata-kata yang berimbuhan, dan

pembobotan untuk proses member index atau frekuensi yang terdapat pada

kata hasil dari proses dari stemming.

Tahapan k-means, menentukan nilai awal centroid, setelah itu

dicari kedekatan antara centroid yang telah didapat dengan data

menggunakan kedekatan euclidean distance. Selanjutnya untuk output

terdiri dari hasil cluster, dimana terdapat pembagian data dalam empat

cluster berdasrkan centroid terdekat.

Tahap Preprocessing

Pada tahap preprocessing, sistem melakukan tahap tokenizing,

stopword, dan stemming.

Langkah-langkah tokenizing:

1. Baca tiap file txt sebagai satu data dokumen.

2. Ambil tiap token pada kalimat tweet dengan menggunakan spasi

sebagai pemisah antara satu token dengan token lain.

3. Simpan setiap data dokumen yang telah di token.

Langkah-langkah stemming:

1. Baca tiap token dan cocokan dengan kata pada daftar kamus

stemming/kata dasar.

2. Jika token cocok dengan kata pada daftar kamus kata dasar, berarti

token adalah root word.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 43: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

28

3. Jika token tidak cocok dengan kata pada daftar kamus kata dasar,

hapus akhiran dan awalan pada token.

4. Cocokan hasil langkah 3 dengan kata pada daftar kamus kata dasar,

jika cocok, anggap token sebelum dikenakan langkah 3 sebagai root

word.

Tahap Pembobotan

Pada tahap pembobotan ini, sistem yang akan dibangun

merepresentasikan data text sebagai vector dengan nilai bobot masing-

masing term. Perhitungan bobot term menggunakan metode pembobotan tf-

idf.

Langkah-langkah pembobotan tf-idf:

1. hitung nilai tf pada masing-masing kata

2. hitung nilai idf pada masing-masing kata

3. hitung bobot kata dengan mengalikan nilai tf dan idf

Tahap Clustering

Tahap clustering sistem akan mengelompokan data berupa paragraf yang

mengandung kata sabar ke dalam 6 cluster, yaitu keadaan, komunikasi, sifat,

urutan giliran, urutan tindakan, pekerjaan. Setiap data akan dikelompokan

berdasarkan kedekatan dengan centroid. Kedekatan antara data dengan

centroid dihitung menggunakan metode euclidian distance.

Untuk menentukan titik pusat centroid awal digunakan metode variance

initialization. Penggunaan metode tersebut diharapkan mendapatkan titik

centroid awal yang baik sehingga pengelompokan data-nya pun

mendapatkan hasil yang baik.

Langkah-langkah variance initialitation( Al-Daoud, 2007):

1. Hitung nilai variance data setiap dimensi (kolom data).

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 44: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

29

2. Temukan kolom dengan nilai variance terbesar, kemudian sort

data.

3. Bagi keseluruhan data menjadi K bagian, K adalah jumalh cluster.

4. Temukan median (nilai tengah) pada setiap bagian.

5. Gunakan vector data median setiap bagian sebagai centroid awal

cluster.

Langkah-langkah K-means Clustering:

1. Menentukan nilai k sebagai jumlah cluster yang ingin dibentuk

2. Menentukan centroid (titik pusat cluster) awal menggunakan

variance initialitation.

3. Hitung jarak setiap data ke masing-masing centroid

menggunakan rumus korelasi antar dua objek (euclidean

distance).

4. Mengelompokan berdasarkan jarak minimum antara data

dengan centroidnya.

5. Menentukan centroid yang baru dengan cara menghitung nilai

rata-rata dari data yang ada pada centroid yang sama.

6. kemudian kembali ke langkah 3, jika posisi centroid baru

dengan centroid lama, tidak sama.

3.3.Preprocessing

Sebelum masuk pada tahap clutering data terlebih dahulu masuk ke

dalam tahap preprocessing. Tahap ini meliputi tahap tokenizing, stopword,

dan stemming:

3.3.1.Tokenizing

Tahap tokenizing adalah tahap permotongan string input berdasarkan tiap

kata yang menyusunnya. Pada tahap ini menhilangkan karakter selain huruf dan

mengubah huruf ke huruf kecil.Berikut contoh memproses data ke tokenizing.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 45: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

30

Tokenizing data dengan paragraph yang mengandung kata sabar dengan

makna keadaan:

Tokenizing data dengan paragraph yang mengandung kata sabar dengan

makna komunikasi:

Manisha bisa sabar untuk pura-pura tertidur, terkadang ia bisa benar-benar

tertidur pada akhirnya, terkadang pula tetap tak bisa tidur

Manisha pura-pura bisa akhirnya tak

Bisa tertidur benar-benar terkadang bisa

Sabar terkadang tertidur pula tidur

untuk ia pada tetap

Ayah akan mencoba mencari cara terbaik untuk menyelesaikan masalah ini.”

”Kenapa tidak menyuruh para pre itu melepaskan ayahku?” tanya Artika tak sabar.

Matanya sudah bengkak dan ia masih terus menangis. ”Tenang, Nak.

Ayah cara masalah menyuruh melepaskan tak bengkak

akan terbaik ini para ayahku sabar

mencoba untuk Kenapa pre Tanya Matanya

mencari menyelesaikan tidak itu Artika sudah

Tabel 3. 7 Tabel Tokenizing data dengan paragraph yang mengandung kata sabar dengan makna keadaan

Tabel 3. 8 Tabel Tokenizing data dengan paragraph yang mengandung kata sabar dengan makna

komunikasi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 46: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

31

Tokenizing data dengan paragraph yang mengandung kata sabar dengan makna

pekerjaan:

Tokenizing data dengan paragraph yang mengandung kata sabar dengan

makna sifat:

Sabar Roy!" "Bagaimana aku bisa sabar, kalau harus membuang tenaga, waktu, dan

pikiran cuma untuk beberapa ratus Indian rupee!" makinya. Chi Wan memang cuma

menukar dua ratus dolar saja.

Sabar sabar waktu beberapa Chi Wan ratus

Roy kalau dan ratus memang dolar

Bagaimana harus pikiran Indian Cuma saja

aku membuang Cuma rupee menukar

bisa tenaga untuk makinya dua

” ”Kata orangtua saya, sebagai istri saya mesti menghormati suami, saya tidak

boleh membantah kata suami. Hanya orang yang baik dan sabar yang akan bisa

masuk surga.” ”Kalau orangtua kamu masih hidup, dia tidak akan rela kamu disiksa

begini?!

Kata menghormati suami yang

Orangtua suami Hanya akan

Saya saya orang bisa

Sebagai tidak yang masuk

Istri boleh baik surga

Saya membantah dan

Mesti kata sabar

Tabel 3. 9 Tabel Tokenizing data dengan paragraph yang mengandung kata sabar dengan makna pekerjaan

Tabel 3. 10 Tabel Tokenizing data dengan paragraph yang mengandung kata sabar dengan makna sifat

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 47: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

32

Tokenizing data dengan paragraph yang mengandung kata sabar dengan

makna urutan tindakan:

Tokenizing data dengan paragraph yang mengandung kata sabar dengan

makna urutan giliran:

Tak lama lagi. Aku akan kembali menulis.” ”Aku tak sabar untuk membacanya.

”Bisikku, saat dua pasang kaki menyusuri koridor yang sunyi.

Tak kembali untuk pasang sunyi

Lama menulis membacanya kaki

Lagi Aku Bisikku menyusuri

Aku tak saat koridor

Akan sabar dua yang

Penumpang berebut turun.Wajah gadis itu nampak sabar sekali menunggu

luangnya jalan.Joki memberinya kesempatan untuk lewat.

Penumpang gadis Nampak menunggu Joki untuk

Berebut Wajah sabar luangnya memberinya lewat.

Turun itu sekali jalan kesempatan

Tabel 3. 11 Tabel Tokenizing data dengan paragraph yang mengandung kata sabar dengan makna urutan

tindakan

Tabel 3. 12 Tabel Tokenizing data dengan paragraph yang mengandung kata sabar dengan makna urutan

giliran

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 48: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

33

3.3.2.Stopword

Tahap stopword adalah tahap mengambil kata-kata penting dari hasil

tokenizing.Menggunakan algoritma stoplist yaitu menghilangkan kata yang

kurang penting atau wordlist yaitu menyimpan kata penting. Contoh

stopword yaitu “ada”,”kita”, dan lain-lain.

Stopword data dengan paragraph yang mengandung kata sabar dengan

makna keadaan:

Stopword data dengan paragraph yang mengandung kata sabar dengan makna

komunikasi:

Manisha pura-purabisaakhirnyatak

bisatertidurbenar-benarterkadangbisa

sabarterkadangtertidurpulatidur

untuk iapadatetap

Sabar benar-benar terkadang

Pura-pura tertidur

Tertidur

Terkadang akhirnya tidur

Ayah cara masalah menyuruh melepaskan tak bengkak

akan terbaik ini para ayahku sabar

mencoba untuk Kenapa pre Tanya Matanya

mencari menyelesaikan tidak itu Artika sudah

Akan cara menyuruh matanya

Mencoba menyelesaikan melepaskan bengkak

Mencari masalah sabar

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 49: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

34

Stopword data dengan paragraph yang mengandung kata sabar dengan

makna pekerjaan:

Stopword data dengan paragraph yang mengandung kata sabar dengan makna

sifat:

Sabar sabar waktu beberapa Chi Wan ratus

Roy kalau dan ratus memang dolar

Bagaimana harus pikiran Indian Cuma saja

aku membuang Cuma rupee menukar

bisa tenaga untuk makinya dua

Sabar waktu makinya

Sabar pikiran menukar

Membuang ratus ratus

Tenaga rupee dolar

Kata menghormati suami yang

Orangtua suami Hanya akan

Saya saya orang bisa

Sebagai tidak yang masuk

Istri boleh baik surga

Saya membantah dan

Mesti kata sabar

Istri sabar

Suami surga

Membantah

suami

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 50: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

35

Stopword data dengan paragraph yang mengandung kata sabar

dengan makna urutan tindakan:

Stopword data dengan paragraph yang mengandung kata sabar

dengan makna urutan giliran:

Penumpang gadis Nampak menunggu Joki untuk

Berebut Wajah sabar luangnya memberinya lewat.

Turun itu sekali jalan kesempatan

Penumpang wajah menunggu memberinya

Berebut Nampak luangnya kesempatan

Turun sabar jalan lewat

Tak kembali untuk pasang sunyi

Lama menulis membacanya kaki

Lagi Aku Bisikku menyusuri

Aku tak saat koridor

Akan sabar dua yang

Menulis bisikku menyusuri

Sabar pasang koridor

Membacanya kaki sunyi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 51: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

36

3.3.3.Stemming

Pada tahap ini hasil kata yang sudah tereduksi dari proses stopword

dilakukan penghapusan kata menjadi kata dasar yang kemudian akan

dicocokan ke kamus untuk menghasilkan kata unik.

Stemming data dengan paragraph yang mengandung kata sabar

dengan makna keadaan:

Stemming data dengan paragraph yang mengandung kata sabar

dengan makna komunikasi:

Sabar benar-benar terkadang

Pura-pura tertidur

Tertidur

Terkadang akhirnya tidur

Sabar benar tidur

Pura tidur

Tidur akhir

Kadang kadang

cara menyuruh matanya

Mencoba menyelesaikan melepaskan bengkak

Mencari masalah sabar

Coba masalah mata

Cari suruh bengkak

Cara lepas

Selesai sabar

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 52: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

37

Stemming data dengan paragraph yang mengandung kata sabar

dengan makna pekerjaan:

Stemming data dengan paragraph yang mengandung kata sabar

dengan makna sifat:

Sabar waktu makinya

Sabar pikiran menukar

Membuang ratus ratus

Tenaga rupee dolar

Sabar waktu maki

Sabar piker tukar

Buang ratus ratus

Tenaga rupee dolar

Istri sabar

Suami surga

Membantah

suami

Istri sabar

Suami surga

Bantah

suami

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 53: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

38

Stemming data dengan paragraph yang mengandung kata sabar

dengan makna urutan tindakan:

Stemming data dengan paragraph yang mengandung kata sabar

dengan makna urutan giliran:

Menulis bisikku menyusuri

Sabar pasang koridor

Membacanya kaki sunyi

Tulis bisik susur

Sabar pasang koridor

Baca kaki sunyi

Penumpang wajah menunggu memberinya

Berebut Nampak luangnya kesempatan

Turun sabar jalan lewat

Tumpang wajah tunggu beri

Rebut Nampak luang kesempatan

Turun sabar jalan lewat

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 54: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

39

3.3.4.Pembobotan

Pada tahap ini setiap kata unik diberi bobot kata dengan

menggunakan rumus weighing (tf.idf).

Term frequency (tf) data dengan paragraph yang mengandung kata

sabar dengan makna keadaan:

Term frequency (tf) data dengan paragraph yang mengandung kata

sabar dengan makna komunikasi:

Sabar benar tidur

Pura tidur

Tidur akhir

Kadang kadang

tf

sabar=1

pura=1

tidur=3

kadang=2

akhir=1

Coba masalah mata

Cari suruh bengkak

Cara lepas

Selesai sabar

tf

coba=1

cari=1

cara=1

selesai=1

masalah=1

suruh=1

lepas=1

sabar=1

mata=1

bengkak=1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 55: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

40

Term frequency (tf) data dengan paragraph yang mengandung kata

sabar dengan makna pekerjaan:

Term frequency (tf) data dengan paragraph yang mengandung kata

sabar dengan makna sifat:

Sabar waktu maki

Sabar pikir tukar

Buang ratus ratus

Tenaga rupee dolar

tf

sabar=2

buang=1

tenaga=1

waktu=1

piker=1

ratus=2

rupee=1

maki=1

tukar=1

dolar=1

Istri sabar

Suami surga

Bantah

suami

tf

istri=1

suami=2

bantah=1

sabar=1

surga=1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 56: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

41

Term frequency (tf) data dengan paragraph yang mengandung kata

sabar dengan makna urutan tindakan:

Tulis bisik susur

Sabar pasang koridor

Baca kaki sunyi

tf

tulis=1

sabar=1

baca=1

bisik=1

pasang=1

kaki=1

susur=1

koridor=1

sunyi=1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 57: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

42

Term frequency (tf) data dengan paragraph yang mengandung kata

sabar dengan makna urutan giliran:

Tumpang wajah tunggu beri

Rebut Nampak luang kesempatan

Turun sabar jalan lewat

tf

tumpang=1

rebut=1

turun=1

wajah=1

Nampak=1

Sabar=1

Tunggu=1

Luang=1

Jalan=1

Beri=1

Kesempatan=1

Lewat=1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 58: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

43

Hitung document frequency(df)

Tabel 3. 13 Tabel Document Frequency

Id Kata df

25 Nampak 1

26 pasang 1

27 Piker 1

28 Pura 1

29 ratus 2

30 Rebut 1

31 rupee 1

32 Sabar 7

33 Selesai 1

34 Suami 2

35 sunyi 1

36 surga 1

37 suruh 1

38 susur 1

39 Tenaga 1

40 Tidur 3

41 tukar 1

42 Tulis 1

43 Tumpang 1

44 tunggu 1

45 Turun 1

46 wajah 1

47 waktu 1

Id Kata Df

1 Akhir 1

2 Baca 1

3 Bantah 1

4 Benar 1

5 Bengkak 1

6 Beri 1

7 Bisik 1

8 Buang 1

9 Cara 1

10 Cari 1

11 Coba 1

12 Dolar 1

13 Istri 1

14 Jalan 1

15 Kadang 2

16 Kaki 1

17 kesempatan 1

18 Koridor 1

19 Lepas 1

20 Lewat 1

21 Luang 1

22 Maki 1

23 Masalah 1

24 Mata 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 59: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

44

Hitung inverse document frequency (idf)

Tabel 3. 14 Tabel idf

Id Kata Df Idf

1 Akhir 1 0.778151

2 Baca 1 0.778151

3 Bantah 1 0.778151

4 Benar 1 0.778151

5 Bengkak 1 0.778151

6 Beri 1 0.778151

7 Bisik 1 0.778151

8 Buang 1 0.778151

9 Cara 1 0.778151

10 Cari 1 0.778151

11 Coba 1 0.778151

12 Dolar 1 0.778151

13 Istri 1 0.778151

14 Jalan 1 0.778151

15 Kadang 2 0.477121

16 Kaki 1 0.778151

17 Kesempatan 1 0.778151

18 Koridor 1 0.778151

19 Lepas 1 0.778151

20 Lewat 1 0.778151

21 Luang 1 0.778151

22 Maki 1 0.778151

23 Masalah 1 0.778151

24 Mata 1 0.778151

Id Kata Df idf

25 Nampak 1 0.778151

26 pasang 1 0.778151

27 pikir 1 0.778151

28 Pura 1 0.778151

29 ratus 2 0.477121

30 Rebut 1 0.778151

31 rupee 1 0.778151

32 Sabar 7 -0.06695

33 Selesai 1 0.778151

34 Suami 2 0.477121

35 sunyi 1 0.778151

36 surga 1 0.778151

37 suruh 1 0.778151

38 susur 1 0.778151

39 Tenaga 1 0.778151

40 Tidur 3 0.30103

41 tukar 1 0.778151

42 Tulis 1 0.778151

43 Tumpang 1 0.778151

44 tunggu 1 0.778151

45 Turun 1 0.778151

46 wajah 1 0.778151

47 waktu 1 0.778151

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 60: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

45

Idf = log(6/1)=0.778151 Idf = log(6/3)= 0.30103

Idf = log(6/2)=0.477121 Idf = log(6/7)= -0.06695

Hitung weight (w)

Weight (w) data dengan paragraph yang mengandung kata sabar dengan

makna keadaan:

Tabel 3. 15 Tabel W dengan makna Keasaan

Weight (w) data dengan paragraph yang mengandung kata sabar dengan

makna komunikasi:

Tabel 3. 16 Tabel W dengan makna Komunikasi

Id Kata Tf Idf W

1 Coba 1 0.778151 0.778151

2 Cari 1 0.778151 0.778151

3 Cara 1 0.778151 0.778151

4 Selesai 1 0.778151 0.778151

5 Masalah 1 0.778151 0.778151

6 Suruh 1 0.778151 0.778151

7 Lepas 1 0.778151 0.778151

8 Sabar 1 -0.06695 -0.06695

9 Mata 1 0.778151 0.778151

10 Bengkak 1 0.778151 0.778151

Id Kata Tf Idf W

1 Sabar 1 -0.06695 -0.06695

2 pura 1 0.778151 0.778151

3 tidur 3 0.30103 0.90309

4 kadang 2 0.477121 0.954242

5 akhir 1 0.778151 0.778151

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 61: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

46

Weight (w) data dengan paragraph yang mengandung kata sabar dengan

makna pekerjaan:

Tabel 3. 17 Tabel W dengan makna pekerjaan

Id Kata Tf Idf W

1 Sabar 2 -0.06695 -0.1339

2 Buang 1 0.778151 0.778151

3 Tenaga 1 0.778151 0.778151

4 Waktu 1 0.778151 0.778151

5 Piker 1 0.778151 0.778151

6 Ratus 2 0.477121 0.954242

7 Rupee 1 0.778151 0.778151

8 Maki 1 0.778151 0.778151

9 Tukar 1 0.778151 0.778151

10 Dolar 1 0.778151 0.778151

Weight (w) data dengan paragraph yang mengandung kata sabar dengan

makna sifat:

Tabel 3. 18 Tabel W dengan Makna Sifat

Id Kata Tf Idf W

1 Istri 1 0.778151 0.778151

2 Suami 2 0.477121 0.954242

3 Bantah 1 0.778151 0.778151

4 Sabar 1 -0.06695 -0.06695

5 Surge 1 0.778151 0.778151

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 62: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

47

Weight (w) data dengan paragraph yang mengandung kata sabar dengan

makna urutan tindakan:

Tabel 3. 19 Tabel W dengan makna urutan tindakan

Weight (w) data dengan paragraph yang mengandung kata sabar dengan

makna urutan giliran:

Id Kata Tf Idf W

1 Tulis 1 0.778151 0.778151

2 Sabar 1 -0.06695 -0.06695

3 Baca 1 0.778151 0.778151

4 Bisik 1 0.778151 0.778151

5 Pasang 1 0.778151 0.778151

6 Kaki 1 0.778151 0.778151

7 Susur 1 0.778151 0.778151

8 Koridor 1 0.778151 0.778151

9 Sunyi 1 0.778151 0.778151

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 63: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

48

Tabel 3. 20 Tabel W dengan makna urutan giliran

Id Kata Tf Idf W

1 Tumpang 1 0.778151 0.778151

2 Rebut 1 0.778151 0.778151

3 Turun 1 0.778151 0.778151

4 Wajah 1 0.778151 0.778151

5 Nampak 1 0.778151 0.778151

6 Sabar 1 -0.06695 -0.06695

7 Tunggu 1 0.778151 0.778151

8 Luang 1 0.778151 0.778151

9 Jalan 1 0.778151 0.778151

10 Beri 1 0.778151 0.778151

11 Kesempatan 1 0.778151 0.778151

12 Lewat 1 0.778151 0.778151

3.5.K-means

Langkah setelah dilakukan pembobotan adalah pengelompokan

menggunakan k-means untuk mendpatkan himpunan centroid. Hal ini

diawalai dengan memilih centroid awal = 6 dipilih 6 centroid karena sudah

dibatasi dengan pengelompokan topic yang diasumsikan menjadi enam

kelompok cluster, yaitu keadaan, komunikasi, pekerjaan, sifat, urutan

tindakan, urutan giliran. K-means ini dilakukan sebanyak jumalh

computation/jumlah dilakukannya metode k-means (c=6). Setelah

mendapatkan centroid kemudian dilakukan perhitungan euclidean distance

untuk menghitung jarak masing-masing centroid ke setiap dokumen.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 64: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

49

3.4.Spesifikasi Perangkat Keras dan Perangkat Lunak

Perangkat keras yang digunakan untuk membangun sistem adalah

sebagai berikut:

Processor : Intel(R) Celeron(R) CPU 1005 @ 1.90GHz 1.90 GHz

Memory : 4 GB

Hardisk : 500 GB

Perangkat lunak yang digunakan untuk membangun sistem adalah

sebagai berikut:

Sistem Operasi : Windows 10 Pro

Aplikasi : Netbeans IDE 7.2.1

Bahasa Pemrogrman : Java (jdk 1.7.0_13)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 65: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

50

BAB IV

IMPLEMENTASI SISTEM DAN ANALISA HASIL

Berdasarkan metodologi yang dijelaskan pada bab sebelumnya,

maka penelitian ini dapat diimplementasikan dengan langkah-langkah

sebagai berikut.

4.1.Implemenasi

Implementasi yang diterapkan pada bab ini merupakan penerapan

metodologi yang telah dipaparkan pada bab sebelumnya. Implementasi

mencakup proses information retrieval, kemudian data dikelompokan

menggunakan k-means clustering.

4.1.1.Pengolahan Data

Data yang digunakan adalah artikel yang bersumber dari website

www.corci.org yang terlebih dahulu diubah menjadi teks berekstensi .txt.

Data yang digunakan berjumlah 108 dokumen.Data yang diambil dibagi

mejadi enam kelompok yaitu keadaan, komunikasi, pekerjaan, sifat, urutan

tindakan, urutan giliran.

Gambar 4. 1 Gambar Folder Kelompok Dokumen

Data paragraph yang didapat dari website corci.org sudah

dikelompokan berdasarkan maknanya secara manual. Pada penelitian ini

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 66: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

51

penulis akan membandingkan antara pengelompokan yang dilakukan secara

manual dengan data yang dikelompokan menggunakan metode K-means

clustering. Berikut data yang telah dikelompokan secara manual dari

website corci.org.

Data paragraph dengan kata sabar yang bermakna sebagai keadaan

berjumlah 33 dokumen, berikut data yang termasuk dalam kelas keadaan.

Gambar 4. 2 Gambar Data Dokumen Bermakna Keadaan

Data paragraph dengan kata sabar yang bermakna sebagai

komunikasi berjumlah 15 dokumen, berikut data yang termasuk dalam

kelaskomunikasi.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 67: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

52

Gambar 4. 3 Gambar Data Dokumen Bermakna Komunikasi

Data paragraph dengan kata sabar yang bermakna sebagai pekerjaan

berjumlah 6 dokumen, berikut data yang termasuk dalam kelas pekerjaan.

Gambar 4. 4 Gambar Data Dokumen Bermakna Pekerjaan

Data paragraph dengan kata sabar yang bermakna sebagai sifat

berjumlah 12 dokumen, berikut data yang termasuk dalam kelas sifat.

Gambar 4. 5 Gambar Data Dokumen Bermakna Sifat

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 68: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

53

Data paragraph dengan kata sabar yang bermakna sebagai urutan

tindakan berjumlah 20 dokumen, berikut data yang termasuk dalam kelas

urutan tindakan.

Gambar 4. 6 Gambar Data Dokumen Bermakna Urutan Tindakan

Data paragraph dengan kata sabar yang bermakna sebagai urutan

giliran berjumlah 22 dokumen, berikut data yang termasuk dalam kelas

urutan giliran

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 69: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

54

Gambar 4. 7 Gambar Data Dokumen Bermakna Urutan Giliran

4.1.2.Preprocessing

Tahap ini merupakan tahap awal yang dilakukan sebelum masuk

ke dalam proses K-Means Clustering.

4.1.2.1.Tokenizing

Proses tokenizing memecah kalimat menjadi token dengan

memanfaatkan karakter spasi sebagai pemisah antar token. Kemudian

penulisan token diubah menjadi huruf kecil. Proses ini juga akan

menghilangkan tanda baca, angka, dan karakter selain huruf.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 70: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

55

public void Tokenize() {

if (tokenized) {

return;

}

try {

FileInputStream fis = new FileInputStream(filename);

Scanner s = new Scanner(fis);

if (daftarKata == null) {

daftarKata = new ArrayList<>();

} else {

daftarKata.clear();

}

while (s.hasNext()) {

String text = s.next();

// StringTokenizer token = new

StringTokenizer(text.toLowerCase(),

// " .,()?!-_+:;/*&^%$#@!~[]{}=()");

String kata = text.replaceAll("[^a-zA-Z&&[^\\-]]", "");

//token.nextToken();

daftarKata.add(kata);

}

tokenized = true;

} catch (FileNotFoundException ex) {

tokenized = false;

Logger.getLogger(Dokumen.class.getName()).log(Level.SEVERE, null,

ex);}}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 71: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

56

4.1.2.2.Stopword

Proses stopwordmenghilangkan kata-kata umum yang sring

muncul.

4.1.2.3.Stemming

Stemming merupakan suatu proses yang terdapat dalam

sistem IR yang mentransformasi kata-kata yang terdapat dalam

suatu dokumen ke kata-kata akarnya (root word) dengan

menggunakan aturan-aturan tertentu. Sebagai contoh, kata

public void hapusstopword() {

if (removedStopWords) {

return;

}

if (kamusStopWord == null) {

throw new IllegalStateException("Kamus stopword belum ada");

}

if (!tokenized) {

throw new IllegalStateException("Dokumen belum di-tokenize");

}

Iterator<String> i = daftarKata.iterator();

while (i.hasNext()) {

String token = i.next();

if (kamusStopWord.contains(token)) {

i.remove();

}

}

removedStopWords = true;

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 72: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

57

bersama, kebersamaan, menyamai, akan distem ke root wordnya

yaitu “sama”. Proses stemming pada teks berbahasa Indonesia

berbeda dengan stemming pada teks berbahasa Inggris. Pada teks

berbahasa Inggris, proses yang diperlukan hanya proses

menghilangkan sufiks. Sedangkan pada teks berbahasa Indonesia,

selain sufiks, prefiks, dan konfiks juga dihilangkan.

public void stem() {

if (stemmed) {

return;

}

if (kamusKataDasar == null || kamusKataDasar.isEmpty()) {

throw new IllegalStateException("Kamus kata dasar belum ada");

}

if (!removedStopWords) {

throw new IllegalStateException("Stopwords belum dibuang");

}

Lemmatizer stemmer = new DefaultLemmatizer(kamusKataDasar);

for (int i = 0; i < daftarKata.size(); i++) {

String kata = daftarKata.get(i);

daftarKata.set(i, stemmer.lemmatize(kata));

}

stemmed = true;

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 73: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

58

Setelah data di stemming kemudian data akan dihitung

bobotnya. Pembobotan menggunakan metode tf-idf.Tiap dokumen

direpresentasikan sebagai vector numeric dengan nilai bobot kata

(term).Setelah pembobotan maka angkah selanjutnya adalah

menentukan centroid awal cluster. Pada penelitian ini digunakan 2

percobaan penentuan centroid awal yang pertama centroid awal

diperoleh dengan cara menghitung nilai variance initialization

sedangkan penentuan centroid awal yang kedua digunakan

perhitungan rata-rata dari bobot weight (tf x idf) data yang telah

dikelompokan berdasarkan pengelompokan oleh ahli. Untuk

menentukan centroid awal digunakan metode variance

initialization. Digunakan metode variance dengan harapan

mendapatkan centroid awal yang baik. Karena apabila centroid

ditentukan secara random, ketika data telah dilakukan cluter

hasilnya berubah-ubah pada setiap testing. Hasil centroid awal

pengujian pertama dengan kedua ditunjukan pada lampiran.

Setelah menentukan centroid awal langkah selanjutnya

adalah pengelompokan menggunakan k-means clustering gambar

dibawah ini merupakan hasil dari pengelompokan dengan centroid

awal menggunakan variance initialization.

Pengujian pertama yaitu penggunaan centroid awal yang

ditentukan menggunakan variance initialization. Dengan kata unik

sebanyak 1320 kata unik. Setelah kata unik dan bobot diperoleh

Hasil centroid awal pada pengujian ini di tunjukan pada lampiran.

Setelah mendapatkan centroid awal maka langkah

selanjutnya pengelompokan menggunakan K-means clustering oleh

sistem.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 74: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

59

Gambar 4.8 Gambar Hasil Cluster Sistem 1

Cluster 1

39.txt, 40.txt, 41.txt, 42.txt, 43.txt, 44.txt, 45.txt, 46.txt, 47.txt, 48.txt, 49.txt,

50.txt, 51.txt, 52.txt, 53.txt, 54.txt, 55.txt, 56.txt, 57.txt, 58.txt, 59.txt, 60.txt,

61.txt, 62.txt, 63.txt, 64.txt, 65.txt, 66.txt, 68.txt, 69.txt, 70.txt, 71.txt, 72.txt,

73.txt, 74.txt, 75.txt, 76.txt, 77.txt, 79.txt, 80.txt, 81.txt, 82.txt, 83.txt, 84.txt,

86.txt, 87.txt, 88.txt, 89.txt, 90.txt, 91.txt, 92.txt, 93.txt, 94.txt, 95.txt, 96.txt,

97.txt, 98.txt, 99.txt, 100.txt, 101.txt, 102.txt, 104.txt, 105.txt, 106.txt, 107.txt,

108.txt, 1.txt, 2.txt, 3.txt, 4.txt, 5.txt, 6.txt, 7.txt, 8.txt, 9.txt, 10.txt, 11.txt, 12.txt,

14.txt, 15.txt, 16.txt, 17.txt, 18.txt, 19.txt, 20.txt, 21.txt, 22.txt, 23.txt, 24.txt,

25.txt, 26.txt, 27.txt, 28.txt, 29.txt, 30.txt, 32.txt, 33.txt, 34.txt, 35.txt, 36.txt,

37.txt, 38.txt

Cluster 2

67.txt

Cluster 3

85.txt

Cluster 4

103.txt

Cluster 5

13.txt

Cluster 6

78.txt, 31.txt

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 75: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

60

Hasil akurasi penggunaan centroid awal variance initialization dari

pengujian yang dilakukan oleh sistem adalah sebagai berikut:

Akurasi =

Hasil dari pengujian sistem dari 108 terdapat 36 data yang tepat dengan dokumen

yang telah di kelompokan oleh ahli

Akurasi = x 100 %

= 33.33333333 %

Hasil yang diperoleh dari pengujian sistem kurang baik 36 data sesuai dengan

data yang telah dikelompokan ahli sedangkan 72 data tidak sesuai.

Kemudian dilakukan pengujian kedua yaitu penggunaan centroid awal

yang ditentukan menggunakan hasil rata-rata bobot tiap kata unik dari tiap kelas

ketika data telah dikelompokan sesuai dengan pengelompokan ahli. Kata unik

yang diperoleh mendapatkan 1320 kata unik. Setelah kata unik dan bobot

diperoleh selanjutnya data dikelompokan sesuai pengelompokan oleh ahli.

Kemudian bobot pada masing-masing data dihitung rata-ratanya, hasil dari rata-

rata tiap kelompok tersebut akan menjadi centroid awal untuk pengujian ini. Hasil

centroid awal pada pengujian ini di tunjukan pada lampiran.

Setelah mendapatkan centroid awal maka langkah selanjutnya

pengelompokan menggunakan K-means clustering oleh sistem.

Gambar 4.9 Gambar hasil cluster sistem 2

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 76: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

61

Cluster 1

1.txt 2.txt 3.txt 4.txt 5.txt 6.txt 7.txt 9.txt 10.txt 12.txt

Cluster 2

13.txt 14.txt 15.txt 16.txt 17.txt 18.txt 19.txt 20.txt 21.txt 22.txt 23.txt

24.txt 25.txt 26.txt 27.txt

Cluster 3

39.txt 40.txt 41.txt 42.txt 43.txt 44.txt 45.txt 46.txt 47.txt 48.txt 49.txt

50.txt 51.txt 52.txt 53.txt 54.txt 55.txt 56.txt 57.txt 58.txt 59.txt 60.txt

8.txt 11.txt 28.txt 29.txt 30.txt 31.txt 32.txt 33.txt 34.txt 35.txt 36.txt

37.txt 38.txt

Cluster 4

61.txt 62.txt 63.txt 64.txt 65.txt 66.txt 67.txt 68.txt 69.txt 70.txt 71.txt

72.txt 73.txt 74.txt 75.txt 76.txt 77.txt 78.txt 79.txt 80.txt

Cluster 5

81.txt 82.txt 83.txt 84.txt 85.txt 86.txt

Cluster 6

87.txt 88.txt 89.txt 90.txt 91.txt 92.txt 93.txt 94.txt 95.txt 96.txt 97.txt

98.txt 99.txt 100.txt 101.txt 102.txt 103.txt 104.txt 105.txt 106.txt 107.txt 108.txt

Setelah data dikelompokan selanjutnya hitung akurasi dari hasil pengujian

yang kedua. Sebelumnya data hasil cluster yang dilakukan oleh sistem

dibandingkan dengan data yang dicluster oleh ahli. Dari 108 data didapat hasil

106 data yang sesuai dengan pengelompokan ahli dan 2 data yang tidak sesuai.

Hasil perbandingkan di tunjukan pada lampiran dengan bentuk tabel.

Kemudian hitung akurasi pengujian kedua dengan centroid awal rata-rata

bobot tiap kelompok

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 77: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

62

Akurasi =

Hasil dari pengujian sistem dari 108 terdapat 106 data yang tepat dengan

dokumen yang telah di kelompokan oleh ahli dan 2 data yang tidak sesuai.

Akurasi = x 100 %

= 98.14814815 %

Dari kedua pengujian menggunakan centroid awal variance initialization

dan pengujian dengan centroid awal rata-rata tiap kelompok sesuai dengan ahli.

Hasil yang diperoleh yang sangat berbeda yaitu pengujian pertama 33.33333333 %

dan pengujian kedua 98.14814815 %.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 78: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

63

BAB V

KESIMPULAN DAN SARAN

5.1.Kesimpulan

Berdasarkan hasil yang diperoleh dari kedua proses pengujian yang

telah dilakukan menggunakan algoritma K-Means Clustering dalam

indentifikasi makna kata dalam artikel berbahasa Indonesia, maka dapat

diambil kesimpulan sebagai berikut:

Hasil dari mengidentifikasi makna kata sabar dalam suatu karya

sastra dengan menggunakan metode k-means pada pengujian pertama

yaitu menggunakan centroid awal dengan algoritma variance initialization

kurang baik, karena hasil yang diperoleh dari pengujian sistem berbeda

jauh ketika dibandingkan dengan label aktual yang telah ditentukan dari

sumber data (www.corci.org). Dari 108 artikel karya sastra yang

mengandung kata sabar hanya 36 artikel yang sesuai dengan label aktual

yang telah ditentukan dalam pengujian pertama dan 106 artikel yang

sesuai dalam pengujian yang kedua. Dan mendapatkan hasil akurasi

sebesar 33.33333333 % sedangkan pada pengujian kedua yaitu

menggunakan centroid awal dari rata-rata bobot pada setiap kelompok

sesuai ahli mendapat hasil akurasi yang tinggi yaitu sebesar 98.14814815

%. Maka dari kedua hasil yang diperoleh dari pengujian sistem dapat

diambil kesimpulan bahwa penentuan centroid awal pada clustering

sangat mempengaruhi hasil cluster. Semakin baik menentukan centroid

awal semakin baik hasil cluster yang diperoleh.

5.2.Saran

Berikut ini adalah saran yang dapat membantu penelitian ini agar

leih baik dan berkembang :

1. Kamus kata stopword dan stemming dilengkapi dan disesuaikan

dengan bahasa/kata yang digunakan dalam data yang digunakan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 79: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

64

2. Pembuatan user interfaceuntuk memudahkan pengguna menggunakan

sistem ini.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 80: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

65

DAFTAR PUSTAKA

Agusta Y., 2007, K-Means-Penerapan, Permaslahan dan Metode Terkait.

Denpasar, Bali: Jurnal Sistem dan Informatika, Vol. 3,pp.47-60.

Al-Daoud, M. B. (2007).A New Algorithm for Cluster

Initialization.International Journal of Computer, Electrical,

Automation, Control and Information Enginnering, I(4).

Baswede, Anand, Nalwade, Prakash (2013). Selection of Initial Centroid for

k-Means Algoritm.International Journal of Computer Science and

Mobile Computing.

Dwijatmoko, B.B (2016). Ideologi Kesabaran Dalam Karya Sastra

Indonesia. Buku Kumpulan Makalah Kongres International Masyarakat

Linguistik, pp. 103-106.

Eko Prasetyo, Data Mining-Konsep dan Aplikasi menggunakan Matlab.

Yogyakarta, Indonesia: C.V Andi Offset, 2012.

Handoyo, R., Mangkudjaja, R.R., Nasution, S.M., 2014, Perbandingan

Metode Clustering Menggunakan Metode Single Linkage dan K-Means

Pada Pengelompokan Dokumen, JSM STMIK Mikroskil, 15(2), 73-82.

Harlian, Milkha, 2006, Text Mining,

http://iwanarif.lecturer.pens.ac.id/kuliah/dm/6Text%20Mining.pdf,diak

ses 6 januari 2016.

Manning, C. D., Ragvana, P., Schitze, H., 2008, Introducing to Information

Retrieval, Cambridge University Press.

Putri, P.A. (2013). Implementasi Metode Improved K-Nearest Neighbor Pada

Analisis Sentimen Twitter Berbahasa Indonesia. Jurnal Mahasiswa

PTIIK UB, 2(2), 1-8.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 81: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

66

Subandi. 2011. Sabar: Sebuah Konsep Psikologi. Jurnal Psikologi. Vol.

38(2), hal. 215 – 227.

Sujana, A. P.(20013). Emanfaatkan Big Data Untuk Mendeteksi Emosi.

Jurnal Teknik Komputer Unikom-Komputika, 2(2), 1-4.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 82: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

67

LAMPIRAN

Tabel centroid awal menggunakan variance initialization

Kata Unik C1 C2 C3 C4 C5 C6

0.441806 0 0 0 0 0.804719

siap 0.045903 0 0 0 0 0

tampil 0.045903 0 0 0 0 0

ketegar 0.045903 0 0 0 0 0

toko 0.091806 0 0 0 0 0

seraya 0.045903 0 0 0 0 0

cerewet 0.045903 0 0 0 0 0

kalah 0.045903 0 0 0 0 0

cepat 0.170022 0 0 0 0 0

rawa 0.045903 0 0 0 0 0

kaya 0.045903 0 0 0 0 0

lapar 0.078215 0 0 0 0 0

bisa 0.045903 0 0 0 0 0

sabarterhadap 0.045903 0 0 0 0 0

efendy 0.045903 0 0 0 0 0

lintas 0.078215 0 0 0 0 0

sambut 0.045903 0 0 0 0 0

bisu 0.045903 0 0 0 0 0

seberang 0.045903 0 0 0 0 0

joki 0.045903 0 0 0 0 0

patin 0.045903 0 0 0 0 0

raung 0.045903 0 0 0 0 0

maria 0.045903 0 0 0 0 0

benang 0.091806 0 0 0 0 0

senang 0.070265 0 0 3.583519 0 0

mesti 0.129249 0 0 0 0 0

sudut 0 0 0 0 0 2.341066

pintu 0.149241 0 0 0 0 0

- 0.091806 0 0 0 0 0

kenapa 0.045903 0 0 0 0 0

temu 0.185847 0 0 0 0 0

pejam 0.045903 0 0 0 0 0

magrib 0.045903 0 0 0 0 0

surga 0.105398 0 0 0 0 0

pejal 0.045903 0 0 0 0 0

bengkak 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 83: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

68

kayu 0.045903 0 0 0 0 0

sedang 0.045903 0 0 0 0 0

bantal 0.045903 0 0 0 0 0

sayang 0.149241 0 0 0 0 0

pinta 0.045903 0 0 0 0 0

jahat 0.045903 0 0 0 0 0

lumur 0 0 4.682131 0 0 0

kutu 0.045903 0 0 0 0 0

tele 0.045903 0 0 0 0 0

tahu 0.045903 0 0 0 0 0

kasar 0.078215 0 0 0 0 0

naik 0.045903 0 0 0 0 0

ongki 0.045903 0 0 0 0 0

moral 0.045903 0 0 0 0 0

syahdu 0.045903 0 0 0 0 0

rindu 0.078215 0 0 0 0 0

queen 0.045903 0 0 0 0 0

kota 0.096936 3.295837 0 0 0 0

sembilan 0.105398 0 0 0 0 0

tumpang 0.045903 0 0 0 0 0

ujung 0.105398 0 0 0 0 0

kisah 0 0 0 0 0 2.341066

eling 0.045903 0 0 0 0 0

muka 0.096936 0 0 0 3.295837 0

paham 0.105398 0 0 0 0 0

ambil 0.078215 0 0 0 0 0

tebal 0.078215 0 0 0 0 0

tekun 0.045903 0 0 0 0 0

reaksi 0.045903 0 0 0 0 0

raya 0 4.682131 0 0 0 0

serta-merta 0.045903 0 0 0 0 0

tombak 0.045903 0 0 0 0 0

hajar 0.045903 0 0 0 0 0

b 0.045903 0 0 0 0 0

bayang 0.045903 0 0 0 0 0

a 0.251466 0 0 0 0 0

mulut 0.078215 0 0 0 0 0

daya 0.045903 0 0 0 0 0

antre 0.078215 0 0 0 0 0

tambah 0.078215 0 0 0 0 0

basa-basi 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 84: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

69

baru 0.105398 0 0 0 0 0

penuh 0.194895 0 0 0 0 1.242453

sabarakan 0.078215 0 0 0 0 0

sebut 0.105398 0 0 0 0 0

i 0.091806 0 0 0 0 0

embus 0.045903 0 0 0 0 0

siram 0.045903 0 0 0 0 0

peluk 0.078215 0 0 0 0 0

s 0.045903 0 0 0 0 0

r 0.070265 0 0 3.583519 0 0

bass 0.045903 0 0 0 0 0

rem 0 0 4.682131 0 0 0

gelincir 0.045903 0 0 0 0 0

riang 0.105398 0 0 0 0 0

muda 0.045903 0 0 0 0 0

burung 0.078215 0 0 0 0 0

hal 0 0 0 0 4.682131 0

kuning 0.045903 0 0 0 0 0

pekarang 0.045903 0 0 0 0 0

kuping 0.045903 0 0 0 0 0

keretek 0.045903 0 0 0 0 0

rokok 0.045903 0 0 0 0 0

puluh 0.105398 0 0 0 0 0

hanya 0.105398 0 0 0 0 0

kata 0.201172 0 0 2.564949 0 0

keri 0.045903 0 0 0 0 0

maju 0.078215 0 0 0 0 0

bicara 0.198359 0 0 0 0 0

band 0.078215 0 0 0 0 0

jemput 0.045903 0 0 0 0 0

elus 0.045903 0 0 0 0 0

lewat 0.045903 0 0 0 0 0

bank 0.045903 0 0 0 0 0

jam 0.13771 0 0 0 0 0

bang 0.078215 0 0 0 0 0

tani 0.045903 0 0 0 0 0

wanita 0.149241 0 0 0 0 0

bagaimana 0.045903 0 0 0 0 0

maki 0.045903 0 0 0 0 0

tamu 0.078215 0 0 0 0 0

lambat 0.078215 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 85: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

70

rebut 0.045903 0 0 0 0 0

anjing 0.105398 0 0 0 0 0

ajak 0.078215 0 0 0 0 0

gembira 0.208938 0 0 0 0 0

georgia 0.045903 0 0 0 0 0

rayu 0.045903 0 0 0 0 0

taruh 0.045903 0 0 0 0 0

lucu 0.045903 0 0 0 0 0

meja 0.045903 0 0 0 0 0

lekas 0.045903 0 0 0 0 0

bisik 0.070265 0 0 0 0 1.791759

ajar 0.30158 0 0 0 0 1.098612

sandang 0.045903 0 0 0 0 0

seminar 0.091806 0 0 0 0 0

putri 0.045903 0 0 0 0 0

kaget 0.078215 0 0 0 0 0

eksekusi 0.045903 0 0 0 0 0

dan 0.129249 0 0 0 0 0

cengang 0.045903 0 0 0 0 0

hadap 0.096936 0 0 3.295837 0 0

maka 0 4.682131 0 0 0 0

alir 0.078215 0 0 0 0 0

sebentar 0.14053 0 0 0 0 0

mandi 0.045903 0 0 0 0 0

jarang 0.045903 0 0 0 0 0

panjang 0.045903 0 0 0 0 0

kapur 0.14053 0 0 0 0 0

cakrawala 0.045903 0 0 0 0 0

kebun 0.117323 0 0 0 0 0

skenario 0.045903 0 0 0 0 0

nak 0.045903 0 0 0 0 0

selera 0.045903 0 0 0 0 0

ketu 0.039108 0 3.988984 0 0 0

vak 0.045903 0 0 0 0 0

asih 0.045903 0 0 0 0 0

kilat 0.045903 0 0 0 0 0

vas 0.045903 0 0 0 0 0

mujis 0.045903 0 0 0 0 0

bahkan 0.045903 0 0 0 0 0

insiden 0.045903 0 0 0 0 0

lemah 0.078215 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 86: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

71

jahit 0.091806 0 0 0 0 0

kopi 0.045903 0 0 0 0 0

marah 0.175663 0 0 0 0 0

pas 0.045903 0 0 0 0 0

sepatu 0.078215 0 0 0 0 0

bersabarmenunggu 0.045903 0 0 0 0 0

momen 0.045903 0 0 0 0 0

samun 0.045903 0 0 0 0 0

kepada 0.045903 0 0 0 0 0

tali 0.105398 0 0 0 0 0

kumpul 0.078215 0 0 0 0 0

utuh 0.045903 0 0 0 0 0

nama 0.129249 0 0 0 0 0

pijak 0.045903 0 0 0 0 0

tiga 0.045903 0 0 0 0 0

putus 0.149241 0 0 0 0 0

kita 0.039108 3.988984 0 0 0 0

akrab 0.045903 0 0 0 0 0

kuyup 0.045903 0 0 0 0 0

esok 0 0 0 0 0 2.341066

musik 0.045903 0 0 0 0 0

pak 0.117323 0 0 0 0 0

coba 0.078215 0 0 0 0 0

kuasa 0.078215 0 0 0 0 0

musim 0.045903 0 0 0 0 0

telinga 0.105398 0 0 0 0 0

main 0.078215 0 0 0 0 0

kipas 0.045903 0 0 0 0 0

kotak 0.105398 0 0 0 0 0

buaya 0.078215 0 0 0 0 0

kalau 0.078215 0 0 0 0 0

kalap 0.045903 0 0 0 0 0

romi 0.045903 0 0 0 0 0

lebaran 0.078215 0 0 0 0 0

energi 0.045903 0 0 0 0 0

sesat 0.078215 0 0 0 0 0

cun 0.045903 0 0 0 0 0

hei 0.045903 0 0 0 0 0

boleh 0.045903 0 0 0 0 0

isyarat 0.045903 0 0 0 0 0

belum 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 87: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

72

drumer 0.045903 0 0 0 0 0

heh 0.078215 0 0 0 0 0

bimbing 0.045903 0 0 0 0 0

lelaki 0.089545 0 0 0 0 3.044522

ufuk 0.045903 0 0 0 0 0

tari 0.045903 0 0 0 0 0

kena 0.039108 0 0 0 3.988984 0

hijau 0 0 0 0 0 2.341066

nasi 0.045903 0 0 0 0 0

terang 0.078215 0 0 0 0 0

kuku 0.117323 0 0 0 0 0

halus 0.045903 0 0 0 0 0

sibuk 0.078215 0 0 0 0 0

ganti 0.045903 0 0 0 0 0

rang 0.045903 0 0 0 0 0

sengaja 0.078215 0 0 0 0 0

tampak 0.091806 0 0 0 0 0

akhir 0.045903 0 0 0 0 0

asli 0.045903 0 0 0 0 0

kasih 0.105398 0 0 0 0 0

mobil 0.045903 0 0 0 0 0

nilai 0.078215 0 0 0 0 0

alami 0.039108 0 0 0 3.988984 0

roy 0.26798 0 0 0 0 0

penganan 0.045903 0 0 0 0 0

meni 0.078215 0 0 0 0 0

kondisi 0.078215 0 0 0 0 0

bab 0.045903 0 0 0 0 0

bayi 0.091806 0 0 0 0 0

kolektif 0.045903 0 0 0 0 0

stoples 0.045903 0 0 0 0 0

tanggung 0.045903 0 0 0 0 0

terjang 0.045903 0 0 0 0 0

menang 0.045903 0 0 0 0 0

bau 0.045903 0 0 0 0 0

rupee 0.045903 0 0 0 0 0

bas 0 0 0 0 0 2.341066

acung 0.045903 0 0 0 0 0

daftar 0.105398 0 0 0 0 0

ibrahim 0.045903 0 0 0 0 0

laskar 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 88: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

73

mahar 0.17909 0 0 0 0 0

hangat 0.045903 0 0 0 0 0

lanjut 0.078215 0 0 0 0 0

gudang 0 0 0 0 0 2.341066

lawan 0.078215 0 0 0 0 0

putih 0.096936 0 0 0 0 1.647918

segar 0.045903 0 0 0 0 0

buta 0.045903 0 0 0 0 0

kuil 0.045903 0 0 0 0 0

julur 0.045903 0 0 0 0 0

hindar 0.070265 0 0 0 3.583519 0

tapi 0.243618 0 0 0 0 0

gelang 0 0 4.682131 0 0 0

tody 0.045903 0 0 0 0 0

coreng-moreng 0.045903 0 0 0 0 0

alang 0.045903 0 0 0 0 0

marni 0.045903 0 0 0 0 0

kelapa 0.045903 0 0 0 0 0

bukti 0.045903 0 0 0 0 0

pajak 0.045903 0 0 0 0 0

kue 0.045903 0 0 0 0 0

pengaruh 0.045903 0 0 0 0 0

xiong 0 0 0 4.682131 0 0

kawin 0.070265 3.583519 0 0 0 0

diri 0.045903 0 0 0 0 0

gairah 0.045903 0 0 0 0 0

layak 0.045903 0 0 0 0 0

kampus 0.045903 0 0 0 0 0

jenaka 0.045903 0 0 0 0 0

desak 0.045903 0 0 0 0 0

besok 0.045903 0 0 0 0 0

dunia 0.045903 0 0 0 0 0

layar 0.045903 0 0 0 0 0

sekal 0.045903 0 0 0 0 0

adzan 0.045903 0 0 0 0 0

jongkok 0 0 0 0 0 2.341066

istimewa 0.045903 0 0 0 0 0

orangtuaku 0.045903 0 0 0 0 0

gugur 0.045903 0 0 0 0 0

surat 0.117323 0 0 0 0 0

rintang 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 89: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

74

jin 0.183613 0 0 0 0 0

lirik 0.045903 0 0 0 0 0

ingkar 0.045903 0 0 0 0 0

supernova 0.045903 0 0 0 0 0

gemerlap 0.045903 0 0 0 0 0

cahaya 0.078215 0 0 0 0 0

mintal 0.045903 0 0 0 0 0

fatal 0.045903 0 0 0 0 0

gamang 0.045903 0 0 0 0 0

ben 0.045903 0 0 0 0 0

ulang 0.070265 10.75056 0 0 0 0

musibah 0.045903 0 0 0 0 0

buang 0.105398 0 0 0 0 0

omong 0.045903 0 0 0 0 0

batu 0.105398 0 0 0 0 0

perosok 0.045903 0 0 0 0 0

pengantin 0.045903 0 0 0 0 0

muara 0.045903 0 0 0 0 0

gerak 0.045903 0 0 0 0 0

piring 0.045903 0 0 0 0 0

tiru 0.045903 0 0 0 0 0

noor 0.045903 0 0 0 0 0

kepala 0.105398 0 0 0 0 0

nunung 0.045903 0 0 0 0 0

tidur 0.210795 0 0 0 0 0

lalai 0.045903 0 0 0 0 0

dengan 0.105398 0 0 0 0 0

dengar 0.212396 0 0 0 0 0

dipuja-puji 0.045903 0 0 0 0 0

bandel 0.045903 0 0 0 0 0

pribadi 0.045903 0 0 0 0 0

tahun 0.039108 3.988984 0 0 0 0

celah 0.045903 0 0 0 0 0

langit 0.078215 0 0 0 0 0

selokan 0.045903 0 0 0 0 0

tukar 0.045903 0 0 0 0 0

kaset 0.13771 0 0 0 0 0

drum 0.156431 0 0 0 0 0

meski 0.078215 0 0 0 0 0

dekap 0.045903 0 0 0 0 0

sabarmenghadapi 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 90: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

75

dekat 0.045903 0 0 0 0 0

kuno 0.045903 0 0 0 0 0

anggun 0.045903 0 0 0 0 0

cerah 0.045903 0 0 0 0 0

rajin 0.045903 0 0 0 0 0

tukang 0.091806 0 0 0 0 0

pucat 0.078215 0 0 0 0 0

dinding 0.045903 0 0 0 0 0

minta 0.045903 0 0 0 0 0

indian 0.045903 0 0 0 0 0

lembut 0.078215 0 0 0 0 0

injak 0.078215 0 0 0 0 0

tualang 0.045903 0 0 0 0 0

telepon 0.045903 0 0 0 0 0

telah 0.078215 0 0 0 0 0

tata 0.045903 0 0 0 0 0

sendiri 0.078215 0 0 0 0 0

bawa 0.255033 0 0 0 0 0

pelik 0.091806 0 0 0 0 0

sejarah 0.045903 0 0 0 0 0

sungguh 0.078215 0 0 0 0 0

ruang 0.105398 0 0 0 0 0

maaf 0.045903 0 0 0 0 0

kelompok 0.045903 0 0 0 0 0

dongak 0.045903 0 0 0 0 0

semayam 0.045903 0 0 0 0 0

gondrong 0.091806 0 0 0 0 0

daripada 0.045903 0 0 0 0 0

beri 0.078215 0 0 0 0 0

tutup 0.129249 0 0 0 0 0

panglima 0.045903 0 0 0 0 0

uun 0.045903 0 0 0 0 0

sisa 0.105398 0 0 0 0 0

masakan 0.045903 0 0 0 0 0

itu 0.078215 0 0 0 0 0

perut 0.045903 0 0 0 0 0

sisi 0.045903 0 0 0 0 0

hujan 0.484682 0 0 0 0 0

pos 0.045903 0 0 0 0 0

meter 0.045903 0 0 0 0 0

timbul 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 91: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

76

tenor 0.045903 0 0 0 0 0

kiong 0.161561 0 0 0 0 0

arena 0.117323 0 0 0 0 0

tombol 0.091806 0 0 0 0 0

detik 0.078215 0 0 0 0 0

siang 0.039108 0 0 0 0 1.994492

selatan 0.045903 0 0 0 0 0

irama 0.045903 0 0 0 0 0

belanja 0.045903 0 0 0 0 0

jika 0.129249 0 0 0 0 0

konyol 0.045903 0 0 0 0 0

rendah 0.045903 0 0 0 0 0

tenang 0.170022 0 0 0 0 0

nasib 0.045903 0 0 0 0 0

chaos 0.045903 0 0 0 0 0

rendam 0.045903 0 0 0 0 0

janji 0.129249 0 0 0 0 0

perempuan 0.14053 0 0 0 0 0

bukit 0.045903 0 0 0 0 0

jalan 0.201172 0 0 0 0 0

luber 0.045903 0 0 0 0 0

sentuh 0.045903 0 0 0 0 0

perlahan-lahan 0.045903 0 0 0 0 0

dapat 0.078215 0 0 0 0 0

selaras 0.045903 0 0 0 0 0

bhumisparsa 0.045903 0 0 0 0 0

beberapa 0.045903 0 0 0 0 0

badan 0.045903 0 0 0 0 0

beliau 0.078215 3.988984 0 0 0 0

antar 0.045903 0 0 0 0 0

telapak 0.091806 0 0 0 0 0

langsung 0.070265 0 0 0 0 1.791759

anarki 0.091806 0 0 0 0 0

paduka 0.091806 0 0 0 0 0

moncong 0.045903 0 0 0 0 0

baca 0.105398 0 0 0 0 0

kerah 0.045903 0 0 0 0 0

sore 0.045903 0 0 0 0 0

cepuk 0.045903 0 0 0 0 0

masuk 0.096936 0 0 3.295837 0 0

kesabaranjika 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 92: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

77

gopoh 0.045903 0 0 0 0 0

kering 0.045903 0 0 0 0 0

bapak 0.078215 0 0 0 0 0

lacak 0.078215 0 0 0 0 0

alkohol 0.045903 0 0 0 0 0

kenal 0.045903 0 0 0 0 0

bulu 0.045903 0 0 0 0 0

untung 0.078215 0 0 0 0 0

suatu 0.045903 0 0 0 0 0

hidung 0.045903 0 0 0 0 0

remaja 0.045903 0 0 0 0 0

besi 0.045903 0 0 0 0 0

jahwar 0.078215 0 0 0 0 0

bahan 0.045903 0 0 0 0 0

pemuda 0.14053 0 0 0 0 0

tidak 0.078215 0 0 0 0 0

bijaksana 0.078215 0 0 0 0 0

situ 0.045903 0 0 0 0 0

mati 0.096936 3.295837 0 0 0 0

minyak 0.039108 0 3.988984 0 0 0

gelisah 0.045903 0 0 0 0 0

nyanyi 0.045903 0 0 0 0 0

kafe 0.045903 0 0 0 0 0

panas 0.045903 0 0 0 0 0

ilmu 0.045903 0 0 0 0 0

tembus 0 4.682131 0 0 0 0

mata 0.170533 0 0 0 0 13.66699

gatal 0.045903 0 0 0 0 0

ibnu 0.14053 0 0 0 0 0

takjub 0.045903 0 0 0 0 0

suasana 0.045903 0 0 0 0 0

gumam 0.045903 0 0 0 0 0

cara 0.045903 0 0 0 0 0

nampak 0.045903 0 0 0 0 0

pandai 0 0 0 0 0 2.341066

merah 0.045903 0 0 0 0 0

hasrat 0.045903 0 0 0 0 0

sambil 0.045903 0 0 0 0 0

pria 0.117323 0 0 0 0 0

henti 0.105398 0 0 0 0 0

kabut 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 93: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

78

alasan 0.045903 0 0 0 0 0

sosok 0.078215 0 0 0 0 0

labrak 0.045903 0 0 0 0 0

lintang 0.078215 0 0 0 0 0

sambar 0.045903 0 0 0 0 0

hasil 0.175663 0 0 3.583519 0 0

cari 0.105398 0 0 0 0 0

ananda 0.045903 0 0 0 0 0

teliti 0.045903 0 0 0 0 0

welas 0.045903 0 0 0 0 0

buru 0.149241 0 0 0 0 0

keran 0.045903 0 0 0 0 0

kerap 0 0 0 0 0 2.341066

siswa 0.045903 0 0 0 0 0

jaga 0.14053 0 0 0 0 0

keras 0.201172 0 0 0 0 0

tulis 0.078215 0 0 0 0 0

hampir 0.129249 0 0 0 0 0

sketsa 0.045903 0 0 0 0 0

tangga 0.045903 0 0 0 0 0

cantik 0.045903 0 0 0 0 0

obat 0.175663 0 0 0 0 0

kutuk 0.045903 0 0 0 0 0

barangkali 0.045903 0 0 0 0 0

umayyah 0.045903 0 0 0 0 0

sedih 0.078215 0 0 0 0 0

kejar 0.045903 0 0 0 0 0

siksa 0.078215 0 0 0 0 0

iri 0.045903 0 0 0 0 0

kubur 0.045903 0 0 0 0 0

isi 0.045903 0 0 0 0 0

sikeras 0.045903 0 0 0 0 0

sabardirinya 0.045903 0 0 0 0 0

pecat 0.045903 0 0 0 0 0

pelangi 0.13771 0 0 0 0 0

sabarlagi 0.045903 0 0 0 0 0

sebab 0.078215 0 0 0 0 0

kelap 0.045903 0 0 0 0 0

payung 0.045903 0 0 0 0 0

sedia 0.045903 0 0 0 0 0

kewalahan 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 94: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

79

hinayana 0.045903 0 0 0 0 0

imajinasi 0 0 0 0 0 2.341066

usaha 0.105398 0 0 0 0 0

merdu 0.045903 0 0 0 0 0

jelang 0.078215 0 0 0 0 0

terima 0.129249 0 0 0 0 0

murtini 0.045903 0 0 0 0 0

gadis 0.210795 0 0 0 0 0

persis 0.045903 0 0 0 0 0

mamalia 0.045903 0 0 0 0 0

nurani 0.045903 0 0 0 0 0

najis 0.045903 0 0 0 0 0

derap 0.045903 0 0 0 0 0

pre 0.045903 0 0 0 0 0

deras 0.105398 0 0 0 0 0

sementara 0.078215 0 0 0 0 0

telaten 0.078215 0 0 0 0 0

pernalt 0.045903 0 0 0 0 0

madhyamika 0.045903 0 0 0 0 0

doors 0.045903 0 0 0 0 0

merpati 0.045903 0 0 0 0 0

keringat 0.045903 0 0 0 0 0

tertawa-tawa 0.045903 0 0 0 0 0

sad 0.045903 0 0 0 0 0

sakit 0.039108 0 0 0 3.988984 0

danau 0.045903 0 0 0 0 0

ingin 0.078215 0 0 3.988984 0 0

borobudur 0.045903 0 0 0 0 0

percaya 0.039108 0 0 0 3.988984 0

nada 0.105398 0 0 0 0 0

fitnah 0.045903 0 0 0 0 0

lampu 0.045903 0 0 0 0 0

sekolah 0.129249 0 0 0 0 0

susul 0.091806 0 0 0 0 0

gua 0.117323 0 0 0 0 0

nestapa 0.045903 0 0 0 0 0

susur 0.045903 0 0 0 0 0

berani 0.078215 0 0 0 0 0

zhua 0 0 0 4.682131 0 0

hitam 0.129249 0 0 0 0 0

jasa 0 4.682131 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 95: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

80

gemetar 0.045903 0 0 0 0 0

kontur 0.045903 0 0 0 0 0

kaktus 0 4.682131 0 0 0 0

seka 0.045903 0 0 0 0 0

libur 0.045903 0 0 0 0 0

bagus 0.045903 0 0 0 0 0

carut-marut 0.045903 0 0 0 0 0

jernih 0.078215 0 0 0 0 0

murtadha 0.045903 0 0 0 0 0

tanya 0.096936 0 0 0 3.295837 0

san 0 0 0 9.364262 0 0

miauw 0.078215 0 0 0 0 0

sat 0.045903 0 0 0 0 0

tulus 0.045903 0 0 0 0 0

gengsi 0.045903 0 0 0 0 0

baik 0.17909 0 0 0 0 0

saw 0.045903 0 0 0 0 0

bukan 0.078215 0 0 0 0 0

izin 0.045903 0 0 0 0 0

ronda 0.045903 0 0 0 0 0

mama 0.14053 0 0 0 0 0

cape 0.045903 0 0 0 0 0

pun 0.045903 0 0 0 0 0

pohon 0.117323 0 0 0 0 0

ling 0.245928 0 0 0 0 0

firman 0.045903 0 0 0 0 0

papan 0.045903 0 0 0 0 0

sembunyi 0 0 0 0 4.682131 0

lepas 0.170022 0 0 0 0 0

pose 0.045903 0 0 0 0 0

gunung 0.078215 0 0 0 0 0

baju 0.045903 0 0 0 0 0

balik 0.045903 0 0 0 0 0

mind 0.045903 0 0 0 0 0

lembah 0.091806 0 0 0 0 0

tonton 0.078215 0 0 0 0 0

parkir 0.045903 0 0 0 0 0

ibunda 0.045903 0 0 0 0 0

teplok 0.045903 0 0 0 0 0

suami 0.091806 0 0 0 0 0

rumah 0.248318 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 96: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

81

sabar 0 0 0 0 0 0

pegang 0.045903 0 0 0 0 0

serius 0.045903 0 0 0 0 0

lambung 0 0 0 0 0 2.341066

pukul 0.045903 0 0 0 0 0

bilang 0.045903 0 0 0 0 0

jangan 0.119393 0 0 0 0 1.522261

garap 0.045903 0 0 0 0 0

manfaat 0.045903 0 0 0 0 0

batin 0.045903 0 0 0 0 0

harfan 0.045903 0 0 0 0 0

sila 0.045903 0 0 0 0 0

wilada 0.078215 0 0 0 0 0

atap 0.045903 0 0 0 0 0

nanti 0.039108 0 0 0 3.988984 0

makan 0.078215 0 0 0 0 0

bus 0.045903 0 0 0 0 0

berkatasudah 0.045903 0 0 0 0 0

kamu 0.078215 0 0 0 0 0

jabat 0.045903 0 0 0 0 0

seni 0.045903 0 0 0 0 0

menteri 0.045903 0 0 0 0 0

atas 0.045903 0 0 0 0 0

masa 0.045903 0 0 0 0 0

batas 0.105398 0 0 0 0 0

kami 0.268634 0 0 0 0 0

buka 0.129249 0 0 0 0 0

cenung 0.045903 0 0 0 0 0

logawa 0.045903 0 0 0 0 0

alam 0.045903 0 0 0 0 0

cekung 0.045903 0 0 0 0 0

tuhan 0.105398 0 0 0 0 0

tentu 0.105398 0 0 0 0 0

rintik 0.045903 0 0 0 0 0

teriak 0.078215 0 0 0 0 0

angkuh 0.045903 0 0 0 0 0

sedot 0.091806 0 0 0 0 0

cunghai-nya 0.045903 0 0 0 0 0

tiba 0.045903 0 0 0 0 0

sempat 0.045903 0 0 0 0 0

cair 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 97: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

82

kendali 0 0 4.682131 0 0 0

mamak 0.234646 0 0 0 0 0

betapa 0.045903 0 0 0 0 0

buku 0.129249 0 0 0 0 0

beda 0.078215 0 0 0 0 0

puisi 0.078215 0 0 0 0 0

jilbab 0.045903 0 0 0 0 0

kali 0.129249 0 0 0 0 0

manisha 0.234646 0 0 0 0 0

pilih 0.078215 0 0 0 0 0

candik 0 0 0 0 4.682131 0

tetapi 0.129249 0 0 0 0 0

stasiun 0.045903 0 0 0 0 0

selesai 0.129249 0 0 0 0 0

chi 0.045903 0 0 0 0 0

lantar 0.045903 0 0 0 0 0

lantai 0.045903 0 0 0 0 0

sudung 0.091806 0 0 0 0 0

senyum 0.226696 0 0 0 0 0

cerita 0.129249 0 3.295837 0 0 0

kerja 0.078215 0 0 0 0 0

kasihan 0.078215 0 0 0 0 0

pasrah 0.078215 0 0 0 0 0

jadwal 0.045903 0 0 0 0 0

sepeda 0.039108 3.988984 0 0 0 0

intensitas 0.045903 0 0 0 0 0

pekat 0.045903 0 0 0 0 0

kaki 0.198359 0 0 0 0 0

susu 0.091806 0 0 0 0 0

huruf 0.045903 0 0 0 0 0

suara 0.212396 0 0 0 0 0

dasar 0.039108 0 3.988984 0 0 0

kapela 0.045903 0 0 0 0 0

lebih 0.105398 0 0 0 0 0

orang 0.30158 0 0 0 0 0

bencana 0.045903 0 0 0 0 0

bubar 0.117323 0 0 0 0 0

rantang 0.045903 0 0 0 0 0

jodoh 0.045903 0 0 0 0 0

sejati 0.078215 0 0 0 0 0

dalam 0.105398 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 98: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

83

jajah 0.045903 0 0 0 0 0

lutut 0.045903 0 0 0 0 0

gara-gara 0.045903 0 0 0 0 0

perahu 0.183613 0 0 0 0 0

inspiratif 0.045903 0 0 0 0 0

bekas 0.045903 0 0 0 0 0

barang 0.045903 0 0 0 0 0

sejuk 0.045903 0 0 0 0 0

gandeng 0.045903 0 0 0 0 0

emak 0.091806 0 0 0 0 0

lonceng 0.045903 0 0 0 0 0

sukacita 0 4.682131 0 0 0 0

bagi 0.129249 0 0 0 0 0

besar 0.078215 0 0 0 0 0

kecewa 0.045903 0 0 0 0 0

sempurna 0.045903 0 0 0 0 0

fibri 0.117323 0 0 0 0 0

hithat 0.045903 0 0 0 0 0

pandang 0.149241 0 0 0 0 0

semut 0.045903 0 0 0 0 0

abang 0.091806 0 0 0 0 0

usir 0.078215 0 0 0 0 0

anda 0.105398 0 0 0 0 0

ladang 0.045903 0 0 0 0 0

tubuh 0.078215 0 0 0 0 0

hilang 0.129249 0 0 0 0 0

simak 0.045903 0 0 0 0 0

makin 0.045903 0 0 0 0 0

duduk 0.119393 0 0 3.044522 0 0

apalagi 0.045903 0 0 0 0 0

pikir 0.226319 0 0 0 0 0

indonesia 0.078215 0 0 0 0 0

tegas 0.045903 0 0 0 0 0

perlahan 0.045903 0 0 0 0 0

simba 0.045903 0 0 0 0 0

bunyi 0.078215 0 0 0 0 0

arca 0.045903 0 0 0 0 0

semua 0.078215 0 0 0 0 0

aju 0.045903 0 0 0 0 0

ukir 0.045903 0 0 0 0 0

pasuk 0.078215 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 99: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

84

keluarga 0.117323 0 0 0 0 0

sapi 0.045903 0 0 0 0 0

sayap 0.045903 0 0 0 0 0

masih 0.045903 0 0 0 0 0

terkadang 0.091806 0 0 0 0 0

pasta 0 0 0 0 0 2.341066

ibu 0.414151 0 0 0 4.969813 0

gigi 0 0 0 0 0 2.341066

pasti 0.045903 0 0 0 0 0

sapu 0.078215 0 0 0 0 0

celaka 0.045903 0 0 0 0 0

gio 0.045903 0 0 0 0 0

sabarmasuk 0.045903 0 0 0 0 0

air 0.251466 0 0 0 0 0

menggeliricir 0.045903 0 0 0 0 0

diktum 0.045903 0 0 0 0 0

juang 0.045903 0 0 0 0 0

tumbuh 0.045903 0 0 0 0 0

bintang 0.045903 0 0 0 0 0

sabaruntuk 0.078215 0 0 0 0 0

erti 0.105398 0 0 0 0 0

paulo 0.045903 0 0 0 0 0

tekan 0.045903 0 0 0 0 0

nggak 0 0 0 0 4.682131 0

lelah 0 0 0 0 0 2.341066

mak 0.045903 0 0 0 0 0

kejut 0.045903 0 0 0 0 0

di 0.132748 0 0 2.70805 0 1.354025

laksana 0.117323 0 0 0 0 0

sederhana 0.045903 0 0 0 0 0

gadang 0.045903 0 0 0 0 0

ekor 0.078215 0 0 0 0 0

mas 0.045903 0 0 0 0 0

tingkat 0.045903 0 0 0 0 0

sang 0.161561 0 0 0 0 0

sana 0.045903 0 0 0 0 0

mau 0.045903 0 0 0 0 0

ingat 0.045903 0 0 0 0 0

dewasa 0.045903 0 0 0 0 0

bocor 0.045903 0 0 0 0 0

cocok 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 100: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

85

fire 0.045903 0 0 0 0 0

usia 0.045903 0 0 0 0 0

anak 0.226319 0 0 0 0 1.282475

yogyakarta 0.045903 0 0 0 0 0

sahabat 0.078215 0 0 0 0 0

el 0.045903 0 0 0 0 0

capai 0.045903 0 0 0 0 0

bobi 0.045903 0 0 0 0 0

em 0.045903 0 0 0 0 0

longsor 0.045903 0 0 0 0 0

tinggal 0.226319 0 0 0 0 0

sih 0.156431 0 0 0 0 0

dada 0.078215 0 0 0 0 0

ke-campin-anmu 0.045903 0 0 0 0 0

pawang 0.045903 0 0 0 0 0

sisik 0.045903 0 0 0 0 0

pendek 0.039108 0 0 0 0 1.994492

sisih 0.045903 0 0 0 0 0

ibumengingat 0 4.682131 0 0 0 0

hebat 0.105398 0 0 0 0 0

mantel 0.091806 0 0 0 0 0

semangat 0.141685 0 0 0 0 1.445186

adik 0.045903 0 0 0 0 0

hingga 0.045903 0 0 0 0 0

abar 0 4.682131 0 0 0 0

sama 0.045903 0 0 0 0 0

dalem 0.045903 0 0 0 0 0

istirahat 0.105398 0 0 0 0 0

baris 0.045903 0 0 0 0 0

harap 0.096936 3.295837 0 0 0 1.647918

lurus 0 0 4.682131 0 0 0

bu 0.096936 0 0 0 3.295837 0

mancing 0.045903 0 0 0 0 0

manusia 0.078215 0 0 0 0 0

tentara 0.045903 0 0 0 0 0

light 0.045903 0 0 0 0 0

juga 0.045903 0 0 0 0 0

daerah 0.045903 0 0 0 0 0

kalimat 0.045903 0 0 0 0 0

yahkata 0.045903 0 0 0 0 0

rozali 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 101: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

86

intimidasi 0.045903 0 0 0 0 0

bujuk 0.045903 0 0 0 0 0

seperti 0.045903 0 0 0 0 0

begini 0.045903 0 0 0 0 0

pergi 0.045903 0 0 0 0 0

sunyi 0.045903 0 0 0 0 0

datang 0.045903 0 0 0 0 0

umum 0.045903 0 0 0 0 0

kacang 0.045903 0 0 0 0 0

dusta 0.045903 0 0 0 0 0

akibat 0.045903 0 0 0 0 0

nekad 0.045903 0 0 0 0 0

dapur 0.078215 0 0 0 0 0

geleng 0.045903 0 0 0 0 0

takut 0.117323 0 0 0 0 1.994492

lumpur 0.045903 0 0 0 0 0

menenteram-kanku 0.045903 0 0 0 0 0

jeli 0.045903 0 0 0 0 0

ikat 0.078215 0 0 0 0 0

suka 0.045903 0 0 0 0 0

buntal 0.045903 0 0 0 0 0

tolak 0.045903 0 0 0 0 0

ikan 0.045903 0 0 0 0 0

saku 0.091806 0 0 0 0 0

buruk 0.091806 0 0 0 0 0

guru 0.386458 0 0 0 0 0

wangi 0.045903 0 0 0 0 0

suster 0.045903 0 0 0 0 0

masempo 0.045903 0 0 0 0 0

mending 0.045903 0 0 0 0 0

saat 0.105398 0 0 0 0 0

misteri 0.045903 0 0 0 0 0

ala 0 0 0 0 4.682131 0

buddha 0.091806 0 0 0 0 0

komunitas 0.045903 0 0 0 0 0

gerhana 0.045903 0 0 0 0 0

al 0.045903 0 0 0 0 0

dingin 0.045903 0 0 0 0 0

butuh 0 0 4.682131 0 0 0

macem 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 102: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

87

timbang 0.045903 0 0 0 0 0

aku 0.362912 0 0 0 0 0.804719

an 0.045903 0 0 0 0 0

suit 0.045903 0 0 0 0 0

kadim 0.045903 0 0 0 0 0

lubuk 0.045903 0 0 0 0 0

jendela 0.045903 0 0 0 0 0

aneh 0.070265 0 0 0 3.583519 0

selip 0.045903 0 0 0 0 0

sisip 0.045903 0 0 0 0 0

ah 0.045903 0 0 0 0 0

mantik 0.078215 0 0 0 0 0

agak 0.045903 0 0 0 0 0

aba 0.045903 0 0 0 0 0

lengan 0.045903 0 0 0 0 0

letak 0.078215 0 0 0 0 0

curi 0.045903 0 0 0 0 0

puja 0.045903 0 0 0 0 0

keramik 0.045903 0 0 0 0 0

tumpah 0.045903 0 0 0 0 0

minggu 0.129249 0 3.295837 0 0 0

suhu 0 0 4.682131 0 0 0

keluar 0.045903 0 0 0 0 0

rapat 0.078215 0 0 0 0 0

pedih 0.045903 0 0 0 0 0

bangun 0.045903 0 0 0 0 0

syukur 0.091806 0 0 0 0 0

of 0.045903 0 0 0 0 0

buah 0.078215 0 0 0 0 0

cinta 0.212396 0 0 0 0 0

chen 0.091806 0 0 0 0 0

mudra 0.045903 0 0 0 0 0

mayat 0.045903 0 0 0 0 0

tungku 0 0 4.682131 0 0 0

on 0.045903 0 0 0 0 0

sayu 0 0 0 0 0 2.341066

pinggir 0.091806 0 0 0 0 0

untai 0.045903 0 0 0 0 0

heran 0.078215 0 0 0 0 0

saya 0.045903 0 0 0 0 0

manggara 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 103: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

88

allah 0.045903 0 0 0 0 0

memilliki 0.045903 0 0 0 0 0

pompa 0.045903 0 0 0 0 0

hantam 0.045903 0 0 0 0 0

istana 0.045903 0 0 0 0 0

harga 0.045903 0 0 0 0 0

sampai 0.078215 0 0 0 0 0

sampah 0.045903 0 0 0 0 0

ikhtiar 0.091806 0 0 0 0 0

magai 0.045903 0 0 0 0 0

keong 0.045903 0 0 0 0 0

yogachara 0.045903 0 0 0 0 0

nima 0.045903 0 0 0 0 0

bentangkan 0.045903 0 0 0 0 0

pn 0.045903 0 0 0 0 0

demi 0.045903 0 0 0 0 0

novel 0.045903 0 0 0 0 0

filosofi 0.045903 0 0 0 0 0

emosi 0.078215 0 0 0 0 0

almari 0.045903 0 0 0 0 0

genang 0.045903 0 0 0 0 0

kurus 0.045903 0 0 0 0 0

syair 0.117323 0 0 0 0 0

terus 0.078215 0 0 0 0 0

larantuka 0.045903 0 0 0 0 0

bungkam 0.045903 0 0 0 0 0

jual 0.045903 0 0 0 0 0

sekian 0.045903 0 0 0 0 0

tepuk 0.078215 0 0 0 0 0

kebaliagiaan 0.045903 0 0 0 0 0

klakson 0.045903 0 0 0 0 0

padahal 0.078215 0 0 0 0 0

receh 0.045903 0 0 0 0 0

buat 0.119393 0 0 0 0 1.522261

maksud 0.078215 0 0 0 0 0

keping 0.045903 0 0 0 0 0

oleh 0.070265 0 0 3.583519 0 0

sabarrasanya 0.045903 0 0 0 0 0

gelap 0.161561 0 0 0 0 0

my 0.078215 0 0 0 0 0

lari 0.105398 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 104: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

89

sabarmenghampiri 0.045903 0 0 0 0 0

segera 0.045903 0 0 0 0 0

na 0.045903 0 0 0 0 0

gemar 0.045903 0 0 0 0 0

tertawa 0.045903 0 0 0 0 0

samanasanta 0.045903 0 0 0 0 0

nyala 0.045903 0 0 0 0 0

teman 0.14053 0 0 0 0 0

tipis 0.078215 0 0 0 0 0

halaman 0.045903 0 0 0 0 0

tengik 0.045903 0 0 0 0 0

setia 0.149241 0 0 0 0 0

kawasan 0.045903 0 0 0 0 0

cekat 0.045903 0 0 0 0 0

setan 0.045903 0 0 0 0 0

satpam 0.045903 0 0 0 0 0

orangtua 0.091806 0 0 0 0 0

untuk 0.045903 0 0 0 0 0

celana 0 0 0 0 0 2.341066

cekal 0.045903 0 0 0 0 0

jatuh 0.105398 0 0 0 0 0

tenteram 0.045903 0 0 0 0 0

cangkung 0.045903 0 0 0 0 0

konsep 0.105398 0 0 0 0 0

hambur 0.045903 0 0 0 0 0

binar 0.045903 0 0 0 0 0

murni 0.091806 0 0 0 0 0

ka 0.045903 0 0 0 0 0

politik 0.045903 0 0 0 0 0

gula 0.045903 0 0 0 0 0

tunggu 0.351325 0 0 0 0 0.89588

serap 0.045903 0 0 0 0 0

sifat 0.045903 0 0 0 0 0

curah 0.045903 0 0 0 0 0

muncul 0.091806 0 0 0 0 0

kencang 0 0 4.682131 0 0 0

penghulu 0.045903 0 0 0 0 0

ratus 0.14053 0 0 0 0 0

politis 0.045903 0 0 0 0 0

curam 0.045903 0 0 0 0 0

gampang 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 105: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

90

gesek 0.045903 0 0 0 0 0

anjur 0.045903 0 0 0 0 0

kereta 0.091806 0 0 0 0 0

ini 0.045903 0 0 0 0 0

malaikat 0.045903 0 0 0 0 0

tui 0.078215 0 0 0 0 0

gera 0.045903 0 0 0 0 0

artika 0.045903 0 0 0 0 0

koridor 0.045903 0 0 0 0 0

takluk 0 0 4.682131 0 0 0

satu 0.078215 0 0 0 0 0

kartika 0.091806 0 0 0 0 0

reda 0.045903 0 0 0 0 0

tua 0.045903 0 0 0 0 0

tangkap 0.045903 0 0 0 0 0

debar 0.078215 0 0 0 0 0

ajaib 0.078215 0 0 0 0 0

milik 0.170022 0 0 0 0 1.445186

kamar 0.045903 0 0 0 0 0

langkah 0.045903 0 0 0 0 0

wan 0.039108 0 0 7.977968 0 0

laut 0 0 4.682131 0 0 0

ho 0.045903 0 0 0 0 0

cemas 0.045903 0 0 0 0 0

memang 0 0 0 0 4.682131 0

ia 0.351325 0 0 0 0 0

pakat 0.045903 0 0 0 0 0

angkat 0.045903 0 0 0 0 0

pulang 0.251466 0 0 0 5.129899 0

infus 0.045903 0 0 0 0 0

pamit 0.045903 0 0 0 0 0

seru 0.045903 0 0 0 0 0

uang 0.193873 0 0 0 0 0

ayah 0.402345 0 0 0 0 0

pakai 0.105398 0 0 0 0 0

lauk 0.045903 0 0 0 0 0

bentur 0.045903 0 0 0 0 0

dokter 0.091806 0 0 0 0 0

adu 0.045903 0 0 0 0 0

arni 0.091806 0 0 0 0 0

dolar 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 106: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

91

jadi 0.129249 0 0 0 3.295837 0

concordia 0.045903 0 0 0 0 0

kiplik 0.367226 0 0 0 0 0

wasit 0.045903 0 0 0 0 0

bentuk 0.096936 0 3.295837 0 0 0

sensasi 0.045903 0 0 0 0 0

vila 0.045903 0 0 0 0 0

turut 0.105398 0 0 0 0 0

selai 0.045903 0 0 0 0 0

mbah 0.045903 0 0 0 0 0

konon 0.045903 0 0 0 0 0

tenaga 0.045903 0 0 0 0 0

ada 0.170022 0 0 0 0 0

turun 0.210795 0 0 0 0 0

bosan 0.045903 0 0 0 0 0

lafal 0.045903 0 0 0 0 0

cewek 0.045903 0 0 0 0 0

tunda 0.045903 0 0 0 0 0

matahari 0.045903 0 0 0 0 0

utara 0.078215 0 0 0 0 0

benar 0.149241 0 0 0 0 0

sepupu 0.045903 0 0 0 0 0

sudah 0.170022 0 0 0 0 0

ketika 0.045903 0 0 0 0 0

gerutu 0.078215 0 0 0 0 0

disari-sarikan 0.045903 0 0 0 0 0

zaidun 0.045903 0 0 0 0 0

begitu 0 0 0 4.682131 0 0

sekarang 0.045903 0 0 0 0 0

awak 0.091806 0 0 0 0 0

gilir 0.105398 0 0 0 0 0

jawab 0.078215 0 0 0 0 0

benci 0.045903 0 0 0 0 0

ragam 0.045903 0 0 0 0 0

bulan 0.078215 0 0 0 0 0

kriiiiiiiiiiiiinnnggggg 0.045903 0 0 0 0 0

dahaga 0.045903 0 0 0 0 0

padas 0.045903 0 0 0 0 0

lagu 0.117323 0 0 0 0 0

gantung 0.045903 0 0 0 0 0

padat 0 4.682131 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 107: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

92

seolah-olah 0.045903 0 0 0 0 0

duga 0.045903 0 0 0 0 0

cela 0.091806 0 0 0 0 0

arti 0.045903 0 0 0 0 0

tanah 0.105398 0 0 0 0 0

ragu 0.078215 0 0 0 0 0

biar 0.078215 0 0 0 0 0

tuan 0.045903 0 0 0 0 0

terbit 0.078215 0 0 0 0 0

dahulu 0.045903 0 0 0 0 0

tatap 0.045903 0 0 0 0 0

hirau 0.045903 0 0 0 0 0

yang 0.091806 0 0 0 0 0

sabarmenunggu 0.180595 0 0 2.302585 0 1.151293

hutan 0.045903 0 0 0 0 0

pesona 0 0 0 0 0 2.341066

papa 0.078215 0 0 0 0 0

iring 0.078215 0 0 0 0 0

selamat 0.078215 0 0 0 0 0

pedal 0.045903 0 0 0 0 0

makhluk 0.045903 0 0 0 0 0

namun 0.185847 0 0 0 0 0

asing 0.078215 0 0 0 0 0

gemintang 0.045903 0 0 0 0 0

pura 0.091806 0 0 0 0 0

sepoi 0.045903 0 0 0 0 0

rupa 0.078215 0 0 0 0 0

haji 0.091806 0 0 0 0 0

tanda 0.141685 0 0 0 0 1.445186

hari 0.105398 0 0 0 0 0

enam 0.091806 0 0 0 0 0

teori 0.045903 0 0 0 0 0

tense-nya 0.045903 0 0 0 0 0

haru 0.045903 0 0 0 0 0

miskin 0.045903 0 0 0 0 0

punk 0.045903 0 0 0 0 0

plot 0.045903 0 0 0 0 0

sodor 0.078215 0 0 0 0 0

habis 0.045903 0 0 0 0 0

tiang 0.045903 0 0 0 0 0

tsu 0.091806 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 108: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

93

lukis 0.091806 0 0 0 0 0

motor 0.039108 3.988984 0 0 0 0

tengah 0 0 0 0 4.682131 0

lihat 0 0 0 4.682131 0 0

wajah 0.159297 0 0 0 2.70805 0

bunga 0.078215 0 0 0 0 0

ayo 0.078215 0 0 0 0 0

tampung 0.045903 0 0 0 0 0

tabuhan 0.045903 0 0 0 0 0

hobi 0.045903 0 0 0 0 0

wujud 0.091806 0 0 0 0 0

para 0.045903 0 0 0 0 0

familiar 0.045903 0 0 0 0 0

doa 0.413129 0 0 0 0 0

pelan 0.078215 0 0 0 0 0

bingung 0.045903 0 0 0 0 0

wahai 0.091806 0 0 0 0 0

benda 0.078215 0 0 0 0 0

tabah 0.078215 0 0 0 0 0

hormat 0.045903 0 0 0 0 0

engkau 0.175663 0 0 0 0 0

salah 0.268634 0 0 0 0 0

batang 0.117323 0 0 0 0 0

gelas 0.105398 0 0 0 0 0

salak 0.078215 0 0 0 0 0

hua 0 0 0 4.682131 0 0

masalah 0.045903 0 0 0 0 0

bersih 0.039108 0 0 0 0 1.994492

koper 0.045903 0 0 0 0 0

rela 0.078215 0 0 0 0 0

rantig-ranting 0.045903 0 0 0 0 0

rayap 0.045903 0 0 0 0 0

nikah 0.045903 0 0 0 0 0

dari 0.078215 0 0 0 0 0

paku 0.045903 0 0 0 0 0

kecuali 0.045903 0 0 0 0 0

demonstrasi 0.045903 0 0 0 0 0

nepal 0.045903 0 0 0 0 0

iwin 0.13771 0 0 0 0 0

maling 0 0 0 0 4.682131 0

kanak-kanak 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 109: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

94

gegas 0.078215 0 0 0 0 0

kapal 0.078215 0 0 0 0 0

kadang 0 0 0 0 9.364262 0

jaket 0.045903 0 0 0 0 0

si 0.212396 0 0 0 0 0

kesal 0.045903 0 0 0 0 0

muak 0.045903 0 0 0 0 0

kuat 0.105398 0 0 0 0 0

pagelaran 0.045903 0 0 0 0 0

unggul 0.045903 0 0 0 0 0

laki 0.105398 0 0 0 0 0

kuap 0.045903 0 0 0 0 0

bahasa 0.078215 0 0 0 0 0

sulit 0.039108 0 0 0 0 1.994492

sahara 0.078215 0 0 0 0 0

kuak 0.045903 0 0 0 0 0

laku 0.105398 0 0 0 0 0

nganga 0.078215 0 0 0 0 0

dua 0.105398 0 0 0 0 0

mulia 0.045903 0 0 0 0 0

mahayana 0.045903 0 0 0 0 0

dengki 0.045903 0 0 0 0 0

teror 0 0 4.682131 0 0 0

kadangkala 0.045903 0 0 0 0 0

raih 0.105398 0 0 0 0 0

obrol 0.045903 0 0 0 0 0

samping 0.045903 0 0 0 0 0

kiak 0.045903 0 0 0 0 0

aspal 0.045903 0 0 0 0 0

angin 0.078215 0 0 0 0 0

kotor 0.078215 0 0 0 0 0

apakah 0.129249 0 0 0 0 0

kian 0.045903 0 0 0 0 0

napas 0.045903 0 0 0 0 0

ceng 0.045903 0 0 0 0 0

karena 0.045903 0 0 0 0 0

anatolia 0.091806 0 0 0 0 0

abadi 0.045903 0 0 0 0 0

harun 0.226185 0 0 0 0 0

bayar 0.045903 0 0 0 0 0

harum 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 110: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

95

terpa 0.078215 0 0 0 0 0

ton 0.045903 0 0 0 0 0

empat 0.045903 0 0 0 0 0

timur 0.045903 0 0 0 0 0

cina 0.045903 0 0 0 0 0

mus 0.105398 0 0 0 0 0

lama 0.078215 0 0 0 0 0

tangan 0.170022 0 0 0 0 0

peranjat 0.045903 0 0 0 0 0

paman 0.045903 0 0 0 0 0

raja 0.091806 0 0 0 0 0

garcia 0.045903 0 0 0 0 0

latar 0.045903 0 0 0 0 0

atur 0.045903 0 0 0 0 0

potong 0.117323 0 0 0 0 0

iklan 0 0 0 0 0 2.341066

gerimis 0.045903 0 0 0 0 0

yaitu 0.045903 0 0 0 0 0

lempuyangan 0.045903 0 0 0 0 0

amat 0 0 0 0 0 2.341066

kecil 0.045903 0 0 0 0 0

tempe 0.045903 0 0 0 0 0

tak 0.170022 2.890372 0 0 0 0

sentak 0.045903 0 0 0 0 0

dang 0 0 0 4.682131 0 0

marching 0.045903 0 0 0 0 0

palsu 0.045903 0 0 0 0 0

diam 0.039108 0 0 0 3.988984 0

pagi 0.14053 0 0 0 0 0

tempo 0.105398 0 0 0 0 0

titip 0.078215 0 0 0 0 0

rencana 0.13771 0 0 0 0 0

damba 0.045903 0 0 0 0 0

tuhu 0.045903 0 0 0 0 0

akan 0.045903 0 0 0 0 0

tepat 0.045903 0 0 0 0 0

linna 0.045903 0 0 0 0 0

surut 0.045903 0 0 0 0 0

gambar 0.045903 0 0 0 0 0

semena-mena 0.045903 0 0 0 0 0

bungkus 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 111: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

96

ancam 0.045903 0 0 0 0 0

malam 0.236956 2.197225 0 0 0 0

akar 0.039108 0 7.977968 0 0 0

suruh 0.105398 0 0 0 0 0

istri 0.129249 0 0 0 0 0

gundah 0.045903 0 0 0 0 0

me-leluri 0.045903 0 0 0 0 0

kau 0.17909 0 0 0 0 0

hawa 0.045903 0 0 0 0 0

keluh 0.045903 0 0 0 0 0

perhati 0.078215 0 0 0 0 0

bantu 0.045903 0 0 0 0 0

kal 0.195538 0 0 0 0 0

dia 0.248318 0 0 0 0 0

asa 0.185847 0 0 0 0 0

kak 0.045903 0 0 0 0 0

minat 0.045903 0 0 0 0 0

tabla 0.045903 0 0 0 0 0

kingayah 0.091806 0 0 0 0 0

tay 0.045903 0 0 0 0 0

cita 0.045903 0 0 0 0 0

tas 0.17909 0 0 0 0 0

mudah 0.078215 0 0 0 0 0

tarik 0.17909 0 0 0 0 0

mereka 0.117323 0 0 0 0 0

tolol 0.045903 0 0 0 0 0

tan 0.045903 0 0 0 0 0

firdaus 0.045903 0 0 0 0 0

negara 0.045903 0 0 0 0 0

lestari 0.045903 0 0 0 0 0

panggil 0.045903 0 0 0 0 0

cemerlang 0.045903 0 0 0 0 0

tirai 0.045903 0 0 0 0 0

rena 0.091806 0 0 0 0 0

helat 0.045903 0 0 0 0 0

king 0.045903 0 0 0 0 0

tuntun 0.129249 0 0 0 0 1.647918

cuci 0.078215 0 0 0 0 0

apa 0 0 0 0 4.682131 0

dengansabar 0 0 0 0 0 2.341066

pokok 0.045903 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 112: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

97

bakar 0.078215 0 0 0 0 0

dadak 0.105398 0 0 0 0 0

mundur 0.045903 0 0 0 0 0

ordil 0.091806 0 0 0 0 0

hitung 0.045903 0 0 0 0 0

sabarbersua 0.045903 0 0 0 0 0

hadir 0.105398 0 0 0 0 0

api 0.045903 0 0 0 0 0

ikut 0.045903 0 0 0 0 0

betas 0.045903 0 0 0 0 0

belakang 0.078215 0 0 0 0 0

lapis 0.045903 0 0 0 0 0

pernah 0 0 4.682131 0 0 0

urai 0.045903 0 0 0 0 0

dahan 0.091806 0 0 0 0 0

masak 0.045903 0 0 0 0 0

coklat 0 0 0 0 0 2.341066

lingkar 0.039108 0 3.988984 0 0 0

timpa 0.045903 0 0 0 0 0

positif 0.045903 0 0 0 0 0

gimana 0.045903 0 0 0 0 0

amen 0.045903 0 0 0 0 0

sobat 0.045903 0 0 0 0 0

menit 0.105398 0 0 0 0 0

hati 0.219256 0 0 0 2.484907 0

manja 0.078215 0 0 0 0 0

saleha 0.045903 0 0 0 0 0

tugas 0.045903 0 0 0 0 0

andung 0.045903 0 0 0 0 0

kantor 0.045903 0 0 0 0 0

kumal 0.045903 0 0 0 0 0

asap 0 0 4.682131 0 0 0

waktu 0.045903 0 0 0 0 0

ungkap 0.045903 0 0 0 0 0

bahagia 0.045903 0 0 0 0 0

bangan 0.045903 0 0 0 0 0

perintah 0.045903 0 0 0 0 0

manis 0.045903 0 0 0 0 0

teduh 0.045903 0 0 0 0 0

halau 0.045903 0 0 0 0 0

undang 0.078215 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 113: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

98

riah 0.045903 0 0 0 0 0

hibur 0.045903 0 0 0 0 0

jerit 0.045903 0 0 0 0 0

gebu 0.045903 0 0 0 0 0

sandal 0.045903 0 0 0 0 0

persetan 0.045903 0 0 0 0 0

jumpa 0 0 0 0 0 2.341066

luang 0.045903 0 0 0 0 0

pintal 0.045903 0 0 0 0 0

hidup 0.226319 0 0 0 0 0

pacu 0 4.682131 0 0 0 0

tepi 0.045903 0 0 0 0 0

kampung 0.045903 0 0 0 0 0

delapan 0.045903 0 0 0 0 0

properti 0.045903 0 0 0 0 0

anggap 0.078215 0 0 0 0 0

campur 0.045903 0 0 0 0 0

tadi 0.045903 0 0 0 0 0

pada 0.119393 0 3.044522 0 0 0

muhammadiyah 0.045903 0 0 0 0 0

berantung 0.045903 0 0 0 0 0

ubah 0.045903 0 0 0 0 0

murai 0.045903 0 0 0 0 0

kuat-kan 0.045903 0 0 0 0 0

datar 0.045903 0 0 0 0 0

bong 0.045903 0 0 0 0 0

andalusia 0.045903 0 0 0 0 0

tebar 0.045903 0 0 0 0 0

kriminalisasi 0.045903 0 0 0 0 0

langgam 0.045903 0 0 0 0 0

dewi 0.045903 0 0 0 0 0

genggam 0.078215 0 0 0 0 0

tuju 0.045903 0 0 0 0 0

pasang 0.105398 0 0 0 0 0

inggris 0.045903 0 0 0 0 0

santai 0.045903 0 0 0 0 0

marini 0.045903 0 0 0 0 0

ya 0.045903 0 0 0 0 0

the 0.078215 0 0 0 0 0

puti 0.091806 0 0 0 0 0

ciut 0 0 0 0 4.682131 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 114: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

99

harkat 0.045903 0 0 0 0 0

kepalang 0.045903 0 0 0 0 0

belah 0 0 0 0 0 2.341066

tawan 0.045903 0 0 0 0 0

luka 0.117323 0 0 0 0 0

biasa 0.045903 0 0 0 0 0

mental 0.045903 0 0 0 0 0

sabaringin 0.045903 0 0 0 0 0

tawar 0.078215 0 0 0 0 0

belas 0.045903 0 0 0 0 0

ambruk 0.045903 0 0 0 0 0

podium 0.091806 0 0 0 0 0

serta 0.078215 0 0 0 0 0

basah 0.117323 0 0 0 0 0

Tabel centroid awal rata-rata bobot data setiap kelompok sesuai ahli

Kata Unik Centroid Awal

C1 C2 C3 C4 C5 C6

0.536666667 0.751333333 0.439090909 0.0805 1.341666667 0.219545455

siap 0 0.312 0 0 0 0

tampil 0 0 0 0.234 0 0

ketegar 0 0 0.141818182 0 0 0

toko 0 0 0.283636364 0 0 0

seraya 0 0 0.141818182 0 0 0

cerewet 0 0 0 0.234 0 0

kalah 0 0 0.141818182 0 0 0

cepat 0.240833333 0 0.087575758 0.4335 0 0.131363636

rawa 0 0 0 0.234 0 0

kaya 0.39 0 0 0 0 0

lapar 0 0 0.120909091 0.1995 0 0

bisa 0 0 0.141818182 0 0 0

sabarterhadap 0 0 0 0 0 0.212727273

efendy 0.39 0 0 0 0 0

lintas 0 0 0 0 0.665 0.181363636

sambut 0.39 0 0 0 0 0

bisu 0.39 0 0 0 0 0

seberang 0 0.312 0 0 0 0

joki 0 0 0 0 0 0.212727273

patin 0 0 0 0 0 0.212727273

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 115: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

100

raung 0.39 0 0 0 0 0

maria 0 0 0 0 0 0.212727273

benang 0 0 0.283636364 0 0 0

senang 0 0 0 0 0 0.488181818

mesti 0.275 0 0.2 0 0 0.15

sudut 0 0 0.141818182 0 0 0

pintu 0.506666667 0.202666667 0 0.304 0 0

- 0 0 0 0.468 0 0

kenapa 0 0.312 0 0 0 0

temu 0.225833333 0.180666667 0 0.271 0.451666667 0.246363636

pejam 0 0 0.141818182 0 0 0

magrib 0 0.312 0 0 0 0

surga 0.895 0 0 0 0 0

pejal 0 0 0.141818182 0 0 0

bengkak 0 0.312 0 0 0 0

kayu 0 0 0 0 0 0.212727273

sedang 0.39 0 0 0 0 0

bantal 0 0 0.141818182 0 0 0

sayang 0.506666667 0.405333333 0.092121212 0 0 0

pinta 0 0.312 0 0 0 0

jahat 0 0.312 0 0 0 0

lumur 0 0 0 0 0.78 0

kutu 0 0 0.141818182 0 0 0

tele 0 0.312 0 0 0 0

tahu 0 0.312 0 0 0 0

kasar 0.3325 0 0.120909091 0 0 0

naik 0 0 0.141818182 0 0 0

ongki 0 0 0 0.234 0 0

moral 0.39 0 0 0 0 0

syahdu 0 0 0 0.234 0 0

rindu 0 0 0 0.1995 0.665 0

queen 0 0 0 0 0 0.212727273

kota 0.275 0 0 0.33 0 0.15

sembilan 0 0 0.216969697 0 0 0.162727273

tumpang 0 0 0 0 0 0.212727273

ujung 0.596666667 0 0 0.179 0 0

kisah 0 0 0 0.234 0 0

eling 0.39 0 0 0 0 0

muka 0.275 0.22 0.2 0 0 0

paham 0.298333333 0.238666667 0.108484848 0 0 0

ambil 0 0 0.241818182 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 116: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

101

tebal 0.3325 0 0.120909091 0 0 0

tekun 0.39 0 0 0 0 0

reaksi 0 0 0.141818182 0 0 0

raya 0 0 0 0.234 0 0

serta-merta 0 0 0 0.234 0 0

tombak 0.39 0 0 0 0 0

hajar 0 0 0.141818182 0 0 0

b 0.39 0 0 0 0 0

bayang 0 0 0 0 0 0.212727273

a 0 0.854 0 0.2565 0 0.349090909

mulut 0.3325 0 0 0.1995 0 0

daya 0 0 0 0 0 0.212727273

antre 0 0 0 0 0 0.362727273

tambah 0.3325 0.266 0 0 0 0

basa-basi 0 0 0.141818182 0 0 0

baru 0 0 0.108484848 0.179 0.596666667 0

penuh 1.033333333 0.165333333 0.15030303 0 0 0.112727273

sabarakan 0 0 0 0.399 0 0

sebut 0.298333333 0.238666667 0 0 0 0.162727273

i 0 0.624 0 0 0 0

embus 0.39 0 0 0 0 0

siram 0 0 0.141818182 0 0 0

peluk 0 0 0 0.1995 0.665 0

s 0 0 0 0 0.78 0

r 0.298333333 0 0.108484848 0 0 0.162727273

bass 0 0 0.141818182 0 0 0

rem 0 0 0 0 0.78 0

gelincir 0 0 0 0 0 0.212727273

riang 0.298333333 0 0.108484848 0.179 0 0

muda 0.39 0 0 0 0 0

burung 0.3325 0 0 0 0 0.181363636

hal 0 0.312 0 0 0 0

kuning 0 0 0 0.234 0 0

pekarang 0 0 0 0.234 0 0

kuping 0 0.312 0 0 0 0

keretek 0 0.312 0 0 0 0

rokok 0 0.312 0 0 0 0

puluh 0 0.238666667 0.108484848 0.179 0 0

hanya 0.895 0 0 0 0 0

kata 0.213333333 0.341333333 0.155454545 0 0 0.465454545

keri 0 0 0.141818182 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 117: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

102

maju 0 0 0.120909091 0.1995 0 0

bicara 0.240833333 0.192666667 0.087575758 0.1445 0 0.394090909

band 0 0 0.120909091 0.1995 0 0

jemput 0 0 0 0 0 0.212727273

elus 0 0 0.141818182 0 0 0

lewat 0 0 0 0 0.78 0

bank 0 0.312 0 0 0 0

jam 0 0 0 0 0 0.638636364

bang 0 0.266 0.120909091 0 0 0

tani 0 0 0.141818182 0 0 0

wanita 1.266666667 0 0 0 0 0

bagaimana 0 0 0 0 0.78 0

maki 0 0 0 0 0.78 0

tamu 0.3325 0 0.120909091 0 0 0

lambat 0 0 0.120909091 0 0 0.181363636

rebut 0 0 0 0 0 0.212727273

anjing 0 0 0.108484848 0.358 0 0

ajak 0 0 0.120909091 0 0.665 0

gembira 1.014166667 0.202666667 0 0.152 0 0.138181818

georgia 0 0 0 0.234 0 0

rayu 0 0 0 0 0 0.212727273

taruh 0 0 0 0.234 0 0

lucu 0 0 0.141818182 0 0 0

meja 0 0.312 0 0 0 0

lekas 0 0 0 0 0 0.212727273

bisik 0.298333333 0 0.108484848 0.179 0 0

ajar 0.183333333 0.439333333 0.266363636 0.3295 0.731666667 0.2

sandang 0 0 0 0 0 0.212727273

seminar 0 0 0.283636364 0 0 0

putri 0 0 0 0 0 0.212727273

kaget 0.3325 0 0.120909091 0 0 0

eksekusi 0 0.312 0 0 0 0

dan 0 0.22 0.3 0 0 0

cengang 0 0 0 0 0 0.212727273

hadap 0.275 0 0.1 0 0 0.3

maka 0 0 0 0.234 0 0

alir 0 0 0 0 0 0.362727273

sebentar 0 0.955333333 0 0 0 0

mandi 0 0 0.141818182 0 0 0

jarang 0 0.312 0 0 0 0

panjang 0 0 0 0 0 0.212727273

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 118: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

103

kapur 0 0 0.217272727 0.179 0 0.162727273

cakrawala 0 0 0.141818182 0 0 0

kebun 0 0 0.241818182 0.1995 0 0

skenario 0 0 0 0.234 0 0

nak 0 0.312 0 0 0 0

selera 0 0 0.141818182 0 0 0

ketu 0 0 0.120909091 0 0.665 0

vak 0 0 0.141818182 0 0 0

asih 0.39 0 0 0 0 0

kilat 0.39 0 0 0 0 0

vas 0 0 0 0.234 0 0

mujis 0 0.312 0 0 0 0

bahkan 0 0 0 0 0 0.212727273

insiden 0 0 0.141818182 0 0 0

lemah 0.3325 0 0.120909091 0 0 0

jahit 0 0 0 0 0 0.425454545

kopi 0.39 0 0 0 0 0

marah 0 0 0.434242424 0 0 0.162727273

pas 0 0.312 0 0 0 0

sepatu 0 0.266 0 0 0 0.181363636

bersabarmenunggu 0 0 0 0 0 0.212727273

momen 0 0 0 0.234 0 0

samun 0 0.312 0 0 0 0

kepada 0 0.312 0 0 0 0

tali 0 0 0 0.179 0 0.325454545

kumpul 0 0.266 0 0.1995 0 0

utuh 0 0 0 0 0 0.212727273

nama 0.275 0.22 0 0 0 0.3

pijak 0 0 0 0 0 0.212727273

tiga 0 0 0 0 0 0.212727273

putus 0 0.202666667 0.368484848 0 0 0

kita 0 0 0.120909091 0.1995 0 0

akrab 0 0 0 0 0 0.212727273

kuyup 0 0 0 0 0 0.212727273

esok 0 0 0 0.234 0 0

musik 0 0 0.141818182 0 0 0

pak 0 0 0.241818182 0 0 0.181363636

coba 0 0.532 0 0 0 0

kuasa 0 0.266 0 0.1995 0 0

musim 0 0 0 0 0 0.212727273

telinga 0.596666667 0 0.108484848 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 119: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

104

main 0 0 0 0.399 0 0

kipas 0 0 0 0 0 0.212727273

kotak 0 0 0.108484848 0.179 0 0.162727273

buaya 0 0 0.241818182 0 0 0

kalau 0.3325 0 0.120909091 0 0 0

kalap 0 0 0.141818182 0 0 0

romi 0.39 0 0 0 0 0

lebaran 0 0.266 0 0 0 0.181363636

energi 0 0 0 0.234 0 0

sesat 0.3325 0 0.120909091 0 0 0

cun 0 0.312 0 0 0 0

hei 0 0 0.141818182 0 0 0

boleh 0 0 0 0 0.78 0

isyarat 0 0 0 0 0.78 0

belum 0 0 0.141818182 0 0 0

drumer 0 0 0.141818182 0 0 0

heh 0 0 0.241818182 0 0 0

bimbing 0 0.312 0 0 0 0

lelaki 0.506666667 0 0.184242424 0.152 0 0

ufuk 0.39 0 0 0 0 0

tari 0 0 0 0.234 0 0

kena 0 0.266 0 0.1995 0 0

hijau 0 0 0.141818182 0 0 0

nasi 0 0.312 0 0 0 0

terang 0 0 0.120909091 0 0 0.181363636

kuku 0.3325 0 0.241818182 0 0 0

halus 0 0 0.141818182 0 0 0

sibuk 0 0 0 0.1995 0 0.181363636

ganti 0 0 0 0.234 0 0

rang 0.39 0 0 0 0 0

sengaja 0 0 0.120909091 0 0 0.181363636

tampak 0 0 0 0 1.56 0

akhir 0 0 0 0 0 0.212727273

asli 0 0 0 0 0 0.212727273

kasih 0.596666667 0.238666667 0 0 0 0

mobil 0 0 0 0 0 0.212727273

nilai 0.665 0 0 0 0 0

alami 0 0.266 0.120909091 0 0 0

roy 0.206666667 0 0.526363636 0.124 0.826666667 0

penganan 0 0 0 0 0 0.212727273

meni 0 0 0 0 0 0.362727273

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 120: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

105

kondisi 0 0 0.120909091 0 0 0.181363636

bab 0 0 0.141818182 0 0 0

bayi 0 0 0.283636364 0 0 0

kolektif 0 0 0 0 0 0.212727273

stoples 0 0 0.141818182 0 0 0

tanggung 0.39 0 0 0 0 0

terjang 0 0 0 0.234 0 0

menang 0 0.312 0 0 0 0

bau 0 0 0 0 0 0.212727273

rupee 0 0 0 0 0.78 0

bas 0 0 0.141818182 0 0 0

acung 0 0.312 0 0 0 0

daftar 0 0 0.108484848 0 0 0.325454545

ibrahim 0.39 0 0 0 0 0

laskar 0 0 0 0 0 0.212727273

mahar 0.253333333 0 0.276666667 0.304 0 0

hangat 0 0.312 0 0 0 0

lanjut 0 0.266 0.120909091 0 0 0

gudang 0 0 0.141818182 0 0 0

lawan 0 0 0.120909091 0 0 0.181363636

putih 0 0 0.1 0.165 0 0.3

segar 0 0 0 0.234 0 0

buta 0 0 0.141818182 0 0 0

kuil 0 0 0 0.234 0 0

julur 0 0 0 0 0 0.212727273

hindar 0 0.238666667 0.216969697 0 0 0

tapi 0 0.165333333 0.375757576 0.248 0 0.225909091

gelang 0 0 0 0 0.78 0

tody 0 0 0 0 0 0.212727273

coreng-moreng 0 0 0 0.234 0 0

alang 0.39 0 0 0 0 0

marni 0 0 0.141818182 0 0 0

kelapa 0.39 0 0 0 0 0

bukti 0.39 0 0 0 0 0

pajak 0 0.312 0 0 0 0

kue 0 0 0 0 0 0.212727273

pengaruh 0.39 0 0 0 0 0

xiong 0 0 0 0 0 0.212727273

kawin 0 0 0 0.179 0 0.325454545

diri 0 0 0.141818182 0 0 0

gairah 0 0 0.141818182 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 121: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

106

layak 0.39 0 0 0 0 0

kampus 0.39 0 0 0 0 0

jenaka 0 0 0 0.234 0 0

desak 0 0.312 0 0 0 0

besok 0.39 0 0 0 0 0

dunia 0 0 0 0.234 0 0

layar 0 0 0.141818182 0 0 0

sekal 0 0 0 0.234 0 0

adzan 0 0 0.141818182 0 0 0

jongkok 0 0 0.141818182 0 0 0

istimewa 0.39 0 0 0 0 0

orangtuaku 0 0 0 0 0 0.212727273

gugur 0 0 0 0 0 0.212727273

surat 0.665 0.266 0 0 0 0

rintang 0.39 0 0 0 0 0

jin 0 0 0 0 0 0.851363636

lirik 0 0.312 0 0 0 0

ingkar 0 0.312 0 0 0 0

supernova 0 0 0 0 0.78 0

gemerlap 0 0 0 0.234 0 0

cahaya 0 0 0 0.1995 0 0.181363636

mintal 0 0 0.141818182 0 0 0

fatal 0 0 0.141818182 0 0 0

gamang 0 0 0 0.234 0 0

ben 0 0 0.141818182 0 0 0

ulang 0 0.238666667 0 0.5375 0.596666667 0

musibah 0.39 0 0 0 0 0

buang 0 0 0.108484848 0.179 0.596666667 0

omong 0 0.312 0 0 0 0

batu 0 0 0 0.179 0 0.325454545

perosok 0 0 0.141818182 0 0 0

pengantin 0 0 0 0.234 0 0

muara 0 0 0 0 0 0.212727273

gerak 0 0.312 0 0 0 0

piring 0 0 0.141818182 0 0 0

tiru 0 0 0.141818182 0 0 0

noor 0.39 0 0 0 0 0

kepala 0.596666667 0 0.108484848 0 0 0

nunung 0 0 0 0.234 0 0

tidur 0 0 0.542727273 0.179 0 0

lalai 0 0 0.141818182 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 122: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

107

dengan 0 0 0.216969697 0.179 0 0

dengar 0 0.542 0.328484848 0.1355 0 0

dipuja-puji 0 0 0 0.234 0 0

bandel 0 0 0.141818182 0 0 0

pribadi 0 0 0 0 0 0.212727273

tahun 0 0 0 0.1995 0.665 0

celah 0 0 0 0.234 0 0

langit 0 0 0 0 0 0.362727273

selokan 0 0 0 0 0 0.212727273

tukar 0 0 0 0 0.78 0

kaset 0 0 0.425757576 0 0 0

drum 0 0 0.483636364 0 0 0

meski 0 0 0.120909091 0 0 0.181363636

dekap 0 0 0 0.234 0 0

sabarmenghadapi 0 0 0.141818182 0 0 0

dekat 0 0.312 0 0 0 0

kuno 0 0.312 0 0 0 0

anggun 0.39 0 0 0 0 0

cerah 0 0 0 0.234 0 0

rajin 0 0 0 0 0 0.212727273

tukang 0 0 0 0 0 0.425454545

pucat 0 0 0.120909091 0 0 0.181363636

dinding 0.39 0 0 0 0 0

minta 0 0 0 0.234 0 0

indian 0 0 0 0 0.78 0

lembut 0.665 0 0 0 0 0

injak 0 0 0.120909091 0.1995 0 0

tualang 0 0.312 0 0 0 0

telepon 0 0 0 0 0 0.212727273

telah 0 0 0.120909091 0 0.665 0

tata 0 0 0.141818182 0 0 0

sendiri 0 0 0.120909091 0 0.665 0

bawa 0 0 0.262727273 0.578 0 0.262727273

pelik 0 0 0.283636364 0 0 0

sejarah 0 0 0 0.234 0 0

sungguh 0 0 0.120909091 0 0 0.181363636

ruang 0.298333333 0.238666667 0.108484848 0 0 0

maaf 0.39 0 0 0 0 0

kelompok 0 0 0 0 0 0.212727273

dongak 0 0 0 0.234 0 0

semayam 0.39 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 123: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

108

gondrong 0 0 0.283636364 0 0 0

daripada 0 0 0.141818182 0 0 0

beri 0 0 0 0.1995 0 0.181363636

tutup 0 0 0.2 0.165 0 0.15

panglima 0 0.312 0 0 0 0

uun 0 0.312 0 0 0 0

sisa 0.298333333 0 0.108484848 0.179 0 0

masakan 0 0 0 0 0 0.212727273

itu 0.3325 0 0.120909091 0 0 0

perut 0 0 0 0 0.78 0

sisi 0 0 0.141818182 0 0 0

hujan 0 0.878666667 0 0 0 1.648181818

pos 0 0 0 0 0 0.212727273

meter 0 0 0 0.234 0 0

timbul 0 0 0 0 0.78 0

tenor 0 0 0.141818182 0 0 0

kiong 0 0.879333333 0 0 0 0.15

arena 0 0 0 0.5985 0 0

tombol 0.78 0 0 0 0 0

detik 0 0 0.120909091 0 0 0.181363636

siang 0 0.266 0.120909091 0 0 0

selatan 0.39 0 0 0 0 0

irama 0 0 0.141818182 0 0 0

belanja 0 0 0 0 0 0.212727273

jika 0.275 0.22 0 0 0.55 0.15

konyol 0 0.312 0 0 0 0

rendah 0.39 0 0 0 0 0

tenang 0.481666667 0.192666667 0.087575758 0 0 0.262727273

nasib 0.39 0 0 0 0 0

chaos 0 0 0.141818182 0 0 0

rendam 0 0 0 0.234 0 0

janji 0.275 0 0.1 0.33 0 0

perempuan 0.5975 0 0.108484848 0 0 0.162727273

bukit 0 0 0 0 0 0.212727273

jalan 0 0 0.155151515 0.256 0.853333333 0.232727273

luber 0 0 0.141818182 0 0 0

sentuh 0 0 0.141818182 0 0 0

perlahan-lahan 0 0 0 0.234 0 0

dapat 0.3325 0.266 0 0 0 0

selaras 0 0 0.141818182 0 0 0

bhumisparsa 0 0 0 0.234 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 124: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

109

beberapa 0 0 0 0.234 0 0

badan 0 0 0 0 0 0.212727273

beliau 0.665 0 0 0.1995 0 0

antar 0 0.312 0 0 0 0

telapak 0.78 0 0 0 0 0

langsung 0.298333333 0 0.216969697 0 0 0

anarki 0 0 0.283636364 0 0 0

paduka 0 0.624 0 0 0 0

moncong 0 0 0 0.234 0 0

baca 0 0.238666667 0 0.358 0 0

kerah 0 0 0.141818182 0 0 0

sore 0 0.312 0 0 0 0

cepuk 0 0 0 0.234 0 0

masuk 0.275 0.22 0.1 0 0 0.15

kesabaranjika 0 0 0.141818182 0 0 0

gopoh 0 0.312 0 0 0 0

kering 0 0 0 0 0 0.212727273

bapak 0.3325 0.266 0 0 0 0

lacak 0 0 0 0.399 0 0

alkohol 0 0 0.141818182 0 0 0

kenal 0 0 0 0 0 0.212727273

bulu 0 0 0.141818182 0 0 0

untung 0 0 0.120909091 0 0 0.181363636

suatu 0.39 0 0 0 0 0

hidung 0 0 0 0 0 0.212727273

remaja 0 0 0 0.234 0 0

besi 0 0 0.141818182 0 0 0

jahwar 0.3325 0 0.120909091 0 0 0

bahan 0 0 0.141818182 0 0 0

pemuda 0 0 0.108484848 0 0 0.488636364

tidak 0 0 0.120909091 0 0 0.181363636

bijaksana 0.665 0 0 0 0 0

situ 0 0 0 0.234 0 0

mati 0 0.22 0.2 0.165 0 0

minyak 0 0 0 0 0.665 0.181363636

gelisah 0 0 0 0.234 0 0

nyanyi 0.39 0 0 0 0 0

kafe 0 0 0 0.234 0 0

panas 0.39 0 0 0 0 0

ilmu 0 0 0 0 0.78 0

tembus 0 0 0 0.234 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 125: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

110

mata 0.206666667 0.330666667 0.300909091 1.242 0.413333333 0

gatal 0 0 0 0.234 0 0

ibnu 0.596666667 0 0.217272727 0 0 0

takjub 0 0 0 0 0 0.212727273

suasana 0 0 0.141818182 0 0 0

gumam 0 0.312 0 0 0 0

cara 0 0 0.141818182 0 0 0

nampak 0 0 0 0 0 0.212727273

pandai 0 0 0 0.234 0 0

merah 0.39 0 0 0 0 0

hasrat 0 0 0 0 0 0.212727273

sambil 0 0 0.141818182 0 0 0

pria 0 0 0 0.399 0 0.181363636

henti 0 0.238666667 0 0.179 0 0.162727273

kabut 0 0 0 0.234 0 0

alasan 0 0 0.141818182 0 0 0

sosok 0.3325 0 0 0 0.665 0

labrak 0.39 0 0 0 0 0

lintang 0.3325 0 0.120909091 0 0 0

sambar 0.39 0 0 0 0 0

hasil 0.5975 0 0.325757576 0 0 0.162727273

cari 0.298333333 0.238666667 0 0 0 0.162727273

ananda 0 0.312 0 0 0 0

teliti 0 0 0 0 0.78 0

welas 0.39 0 0 0 0 0

buru 0 0.202666667 0 0.304 0 0.276363636

keran 0 0 0.141818182 0 0 0

kerap 0 0 0 0.234 0 0

siswa 0 0 0.141818182 0 0 0

jaga 0 0.238666667 0.325757576 0 0 0

keras 0.213333333 0.170666667 0.31030303 0.128 0.426666667 0

tulis 0 0 0 0.1995 0.665 0

hampir 0 0.22 0.1 0.165 0 0.15

sketsa 0 0 0 0 0 0.212727273

tangga 0 0.312 0 0 0 0

cantik 0 0 0.141818182 0 0 0

obat 0.5975 0 0.217272727 0 0 0.162727273

kutuk 0 0 0.141818182 0 0 0

barangkali 0 0 0.141818182 0 0 0

umayyah 0 0 0.141818182 0 0 0

sedih 0.3325 0 0 0 0.665 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 126: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

111

kejar 0 0 0 0.234 0 0

siksa 0.665 0 0 0 0 0

iri 0 0 0 0 0.78 0

kubur 0 0 0.141818182 0 0 0

isi 0 0 0 0 0.78 0

sikeras 0 0 0.141818182 0 0 0

sabardirinya 0 0 0 0.234 0 0

pecat 0 0 0.141818182 0 0 0

pelangi 0 0 0 0 0 0.638636364

sabarlagi 0 0 0 0.234 0 0

sebab 0 0 0.120909091 0 0 0.181363636

kelap 0 0 0 0 0 0.212727273

payung 0 0 0 0 0 0.212727273

sedia 0 0.312 0 0 0 0

kewalahan 0 0 0 0.234 0 0

hinayana 0 0 0 0.234 0 0

imajinasi 0 0 0 0.234 0 0

usaha 0 0 0.108484848 0 0.596666667 0.162727273

merdu 0.39 0 0 0 0 0

jelang 0 0.532 0 0 0 0

terima 0 0.22 0.2 0 0.55 0

murtini 0 0 0 0 0 0.212727273

gadis 0 0 0.108484848 0 0 0.814090909

persis 0.39 0 0 0 0 0

mamalia 0 0 0 0.234 0 0

nurani 0.39 0 0 0 0 0

najis 0 0 0.141818182 0 0 0

derap 0 0 0 0.234 0 0

pre 0 0.312 0 0 0 0

deras 0 0.238666667 0 0 0 0.325454545

sementara 0 0.266 0 0 0 0.181363636

telaten 0 0.266 0.120909091 0 0 0

pernalt 0.39 0 0 0 0 0

madhyamika 0 0 0 0.234 0 0

doors 0 0 0.141818182 0 0 0

merpati 0 0 0 0 0 0.212727273

keringat 0 0 0 0 0 0.212727273

tertawa-tawa 0 0 0 0 0 0.212727273

sad 0 0.312 0 0 0 0

sakit 0 0.266 0.120909091 0 0 0

danau 0 0 0 0.234 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 127: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

112

ingin 0.665 0 0 0 0 0.181363636

borobudur 0.39 0 0 0 0 0

percaya 0.3325 0.266 0 0 0 0

nada 0.298333333 0.238666667 0.108484848 0 0 0

fitnah 0.39 0 0 0 0 0

lampu 0 0 0 0.234 0 0

sekolah 0.275 0 0 0 0 0.45

susul 0 0 0 0 0 0.425454545

gua 0 0.532 0.120909091 0 0 0

nestapa 0.39 0 0 0 0 0

susur 0 0 0 0.234 0 0

berani 0.3325 0.266 0 0 0 0

zhua 0 0 0 0 0 0.212727273

hitam 0.275 0 0 0.33 0.55 0

jasa 0 0 0 0.234 0 0

gemetar 0 0 0 0.234 0 0

kontur 0 0.312 0 0 0 0

kaktus 0 0 0 0.234 0 0

seka 0 0 0 0 0 0.212727273

libur 0 0.312 0 0 0 0

bagus 0 0 0 0.234 0 0

carut-marut 0 0 0.141818182 0 0 0

jernih 0.3325 0 0 0 0 0.181363636

murtadha 0 0 0.141818182 0 0 0

tanya 0.275 0.44 0.1 0 0 0

san 0 0 0 0 0 0.425454545

miauw 0 0.266 0 0 0 0.181363636

sat 0 0 0 0.234 0 0

tulus 0.39 0 0 0 0 0

gengsi 0.39 0 0 0 0 0

baik 0 0.811333333 0.092121212 0 0.506666667 0

saw 0 0 0 0.234 0 0

bukan 0.3325 0 0.120909091 0 0 0

izin 0 0 0 0.234 0 0

ronda 0 0 0 0 0 0.212727273

mama 1.194166667 0 0 0 0 0

cape 0 0 0.141818182 0 0 0

pun 0 0 0.141818182 0 0 0

pohon 0.665 0 0 0 0 0.181363636

ling 1.194166667 0.238666667 0 0.3585 0 0

firman 0.39 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 128: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

113

papan 0 0 0.141818182 0 0 0

sembunyi 0 0.312 0 0 0 0

lepas 0 0.192666667 0.262727273 0 0.481666667 0.131363636

pose 0 0 0 0.234 0 0

gunung 0.3325 0.266 0 0 0 0

baju 0 0 0 0.234 0 0

balik 0 0 0.141818182 0 0 0

mind 0 0 0 0.234 0 0

lembah 0 0.624 0 0 0 0

tonton 0 0 0.120909091 0.1995 0 0

parkir 0 0 0 0 0 0.212727273

ibunda 0 0.312 0 0 0 0

teplok 0 0 0 0.234 0 0

suami 0.78 0 0 0 0 0

rumah 0 0.460666667 0.06969697 0.23 0 0.522727273

sabar 0 0 0 0 0 0

pegang 0 0 0.141818182 0 0 0

serius 0 0 0 0 0 0.212727273

lambung 0 0 0 0.234 0 0

pukul 0 0 0 0 0 0.212727273

bilang 0 0.312 0 0 0 0

jangan 0.253333333 0 0.184242424 0 0 0.276363636

garap 0 0 0.141818182 0 0 0

manfaat 0 0 0 0 0 0.212727273

batin 0 0 0 0 0.78 0

harfan 0.39 0 0 0 0 0

sila 0 0.312 0 0 0 0

wilada 0.665 0 0 0 0 0

atap 0.39 0 0 0 0 0

nanti 0 0.266 0 0 0 0.181363636

makan 0 0 0.120909091 0 0 0.181363636

bus 0 0 0.141818182 0 0 0

berkatasudah 0 0.312 0 0 0 0

kamu 0 0 0.120909091 0 0 0.181363636

jabat 0 0.312 0 0 0 0

seni 0 0 0.141818182 0 0 0

menteri 0.39 0 0 0 0 0

atas 0.39 0 0 0 0 0

masa 0 0 0 0 0.78 0

batas 0 0 0.325454545 0 0 0

kami 0.253333333 0.608666667 0.092121212 0.6085 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 129: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

114

buka 0 0 0.1 0.495 0 0

cenung 0 0.312 0 0 0 0

logawa 0 0 0 0 0 0.212727273

alam 0 0 0 0 0 0.212727273

cekung 0 0 0 0.234 0 0

tuhan 0.596666667 0 0 0 0 0.162727273

tentu 0 0 0.108484848 0.179 0 0.162727273

rintik 0 0 0 0 0 0.212727273

teriak 0 0 0.120909091 0 0 0.181363636

angkuh 0 0 0 0 0.78 0

sedot 0 0 0 0 1.56 0

cunghai-nya 0 0 0.141818182 0 0 0

tiba 0 0 0 0 0 0.212727273

sempat 0 0 0 0 0 0.212727273

cair 0 0 0 0 0.78 0

kendali 0 0 0 0 0.78 0

mamak 0 0.532 0 0 0 0.725454545

betapa 0 0 0 0.234 0 0

buku 0.275 0.22 0.1 0 0 0.15

beda 0 0.266 0 0.1995 0 0

puisi 0 0.266 0 0.1995 0 0

jilbab 0.39 0 0 0 0 0

kali 0 0.22 0.2 0 0 0.15

manisha 0 0.798 0.362727273 0 0 0

pilih 0 0 0.120909091 0 0 0.181363636

candik 0 0.312 0 0 0 0

tetapi 0 0 0.1 0.165 0.55 0.15

stasiun 0 0 0 0 0 0.212727273

selesai 0 0.44 0.2 0 0 0

chi 0 0 0 0 0.78 0

lantar 0 0 0.141818182 0 0 0

lantai 0.39 0 0 0 0 0

sudung 0 0 0 0.468 0 0

senyum 0 0.963333333 0.087575758 0.1445 0.481666667 0

cerita 0 0.659333333 0 0.165 0.55 0

kerja 0.3325 0 0.120909091 0 0 0

kasihan 0.3325 0 0.120909091 0 0 0

pasrah 0.3325 0 0 0.1995 0 0

jadwal 0 0 0 0 0 0.212727273

sepeda 0 0 0 0.399 0 0

intensitas 0.39 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 130: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

115

pekat 0 0 0 0 0.78 0

kaki 0.481666667 0 0.175151515 0.4335 0 0

susu 0 0 0 0 1.56 0

huruf 0 0.312 0 0 0 0

suara 0.225833333 0 0.410606061 0.271 0 0

dasar 0 0.266 0 0 0.665 0

kapela 0 0 0 0 0 0.212727273

lebih 0 0.238666667 0.108484848 0.179 0 0

orang 0.7325 0.146666667 0.39969697 0.11 0 0.2

bencana 0.39 0 0 0 0 0

bubar 0 0 0.120909091 0 0 0.362727273

rantang 0 0 0 0 0 0.212727273

jodoh 0 0 0.141818182 0 0 0

sejati 0.3325 0.266 0 0 0 0

dalam 0.298333333 0 0 0.179 0 0.162727273

jajah 0.39 0 0 0 0 0

lutut 0 0 0.141818182 0 0 0

gara-gara 0 0 0.141818182 0 0 0

perahu 0 0 0.567575758 0 0 0

inspiratif 0 0 0.141818182 0 0 0

bekas 0.39 0 0 0 0 0

barang 0 0 0 0.234 0 0

sejuk 0.39 0 0 0 0 0

gandeng 0 0 0 0.234 0 0

emak 0 0 0 0 1.56 0

lonceng 0 0 0.141818182 0 0 0

sukacita 0 0 0 0.234 0 0

bagi 0.55 0 0.1 0 0 0.15

besar 0.3325 0 0 0 0.665 0

kecewa 0 0 0 0.234 0 0

sempurna 0 0 0 0.234 0 0

fibri 0 0 0 0 0 0.544090909

hithat 0 0 0.141818182 0 0 0

pandang 0.253333333 0.202666667 0 0.152 0.506666667 0.138181818

semut 0.39 0 0 0 0 0

abang 0 0 0.283636364 0 0 0

usir 0 0 0.120909091 0.1995 0 0

anda 0.596666667 0 0.108484848 0 0 0

ladang 0.39 0 0 0 0 0

tubuh 0 0 0 0.1995 0 0.181363636

hilang 0 0.22 0.1 0.33 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 131: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

116

simak 0 0 0 0 0 0.212727273

makin 0 0 0 0 0 0.212727273

duduk 0 0.405333333 0 0.152 0 0.276363636

apalagi 0 0 0.141818182 0 0 0

pikir 0.213333333 0.170666667 0.233030303 0.128 0.426666667 0.232727273

indonesia 0 0 0 0 0 0.362727273

tegas 0 0 0 0.234 0 0

perlahan 0 0 0.141818182 0 0 0

simba 0 0 0.141818182 0 0 0

bunyi 0 0 0.120909091 0 0 0.181363636

arca 0 0 0 0.234 0 0

semua 0.3325 0 0.120909091 0 0 0

aju 0.39 0 0 0 0 0

ukir 0.39 0 0 0 0 0

pasuk 0 0 0 0.1995 0 0.181363636

keluarga 0.665 0 0 0.1995 0 0

sapi 0 0 0 0.234 0 0

sayap 0 0 0.141818182 0 0 0

masih 0 0 0 0.234 0 0

terkadang 0 0 0.283636364 0 0 0

pasta 0 0 0.141818182 0 0 0

ibu 0.413333333 0.662666667 0.376363636 0.3725 0 0.564545455

gigi 0 0 0.141818182 0 0 0

pasti 0 0 0 0 0 0.212727273

sapu 0 0 0.120909091 0 0 0.181363636

celaka 0 0 0 0 0.78 0

gio 0 0.312 0 0 0 0

sabarmasuk 0 0 0 0.234 0 0

air 0.64 0 0.233030303 0 0 0.465909091

menggeliricir 0 0 0.141818182 0 0 0

diktum 0 0 0.141818182 0 0 0

juang 0.39 0 0 0 0 0

tumbuh 0 0 0 0.234 0 0

bintang 0.39 0 0 0 0 0

sabaruntuk 0 0 0 0.399 0 0

erti 0.298333333 0 0 0 0 0.325454545

paulo 0 0.312 0 0 0 0

tekan 0 0 0.141818182 0 0 0

nggak 0 0.312 0 0 0 0

lelah 0 0 0 0.234 0 0

mak 0 0 0 0 0 0.212727273

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 132: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

117

kejut 0 0 0.141818182 0 0 0

di 0.451666667 0 0.246363636 0.1355 0 0.123181818

laksana 0 0.532 0 0.1995 0 0

sederhana 0 0 0.141818182 0 0 0

gadang 0 0 0 0 0 0.212727273

ekor 0 0 0.120909091 0.1995 0 0

mas 0 0 0.141818182 0 0 0

tingkat 0 0 0.141818182 0 0 0

sang 0.824166667 0.22 0.1 0 0 0

sana 0 0 0 0 0 0.212727273

mau 0 0.312 0 0 0 0

ingat 0 0 0 0.234 0 0

dewasa 0 0 0.141818182 0 0 0

bocor 0 0 0.141818182 0 0 0

cocok 0 0 0.141818182 0 0 0

fire 0 0 0.141818182 0 0 0

usia 0 0 0 0.234 0 0

anak 0 0.341333333 0.155151515 0.256 0 0.465909091

yogyakarta 0 0 0 0 0 0.212727273

sahabat 0 0 0.120909091 0.1995 0 0

el 0 0 0 0.234 0 0

capai 0 0 0 0.234 0 0

bobi 0 0 0.141818182 0 0 0

em 0.39 0 0 0 0 0

longsor 0 0 0 0 0 0.212727273

tinggal 0.213333333 0.170666667 0.233030303 0.256 0 0.232727273

sih 0 0 0.120909091 0 0 0.544090909

dada 0 0 0.120909091 0.1995 0 0

ke-campin-anmu 0 0 0.141818182 0 0 0

pawang 0 0 0 0.234 0 0

sisik 0 0 0.141818182 0 0 0

pendek 0 0.266 0.120909091 0 0 0

sisih 0 0 0.141818182 0 0 0

ibumengingat 0 0 0 0.234 0 0

hebat 0 0.238666667 0 0.179 0.596666667 0

mantel 0 0 0 0.468 0 0

semangat 0 0.192666667 0.087575758 0.578 0 0

adik 0 0 0 0 0.78 0

hingga 0 0 0.141818182 0 0 0

abar 0 0 0 0.234 0 0

sama 0 0 0 0.234 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 133: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

118

dalem 0 0 0 0.234 0 0

istirahat 0 0.238666667 0.216969697 0 0 0

baris 0 0 0 0.234 0 0

harap 0.549166667 0 0.1 0.33 0 0

lurus 0 0 0 0 0.78 0

bu 0 0.66 0 0 0 0.15

mancing 0 0 0 0.234 0 0

manusia 0.3325 0 0.120909091 0 0 0

tentara 0 0 0 0 0 0.212727273

light 0 0 0.141818182 0 0 0

juga 0 0 0.141818182 0 0 0

daerah 0 0 0 0 0 0.212727273

kalimat 0 0 0.141818182 0 0 0

yahkata 0 0 0 0 0 0.212727273

rozali 0 0 0.141818182 0 0 0

intimidasi 0 0 0.141818182 0 0 0

bujuk 0 0 0 0 0.78 0

seperti 0 0.312 0 0 0 0

begini 0 0 0.141818182 0 0 0

pergi 0.39 0 0 0 0 0

sunyi 0 0 0 0.234 0 0

datang 0 0 0 0 0 0.212727273

umum 0 0.312 0 0 0 0

kacang 0.39 0 0 0 0 0

dusta 0 0 0 0 0 0.212727273

akibat 0 0 0.141818182 0 0 0

nekad 0 0 0.141818182 0 0 0

dapur 0 0 0 0.1995 0 0.181363636

geleng 0 0 0 0.234 0 0

takut 0 0 0.120909091 0 0 0.544090909

lumpur 0 0 0 0 0 0.212727273

menenteram-kanku 0.39 0 0 0 0 0

jeli 0 0 0 0.234 0 0

ikat 0 0 0 0 0 0.362727273

suka 0 0 0.141818182 0 0 0

buntal 0 0 0 0.234 0 0

tolak 0 0 0 0 0.78 0

ikan 0 0 0 0.234 0 0

saku 0 0.624 0 0 0 0

buruk 0 0 0 0 0 0.425454545

guru 0.298333333 0.238666667 0.977272727 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 134: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

119

wangi 0.39 0 0 0 0 0

suster 0 0 0 0 0.78 0

masempo 0 0.312 0 0 0 0

mending 0 0 0 0 0.78 0

saat 0.298333333 0 0.108484848 0 0 0.162727273

misteri 0 0 0 0 0 0.212727273

ala 0 0.312 0 0 0 0

buddha 0 0 0 0.468 0 0

komunitas 0 0.312 0 0 0 0

gerhana 0.39 0 0 0 0 0

al 0 0 0.141818182 0 0 0

dingin 0.39 0 0 0 0 0

butuh 0 0 0 0 0.78 0

macem 0 0 0.141818182 0 0 0

timbang 0 0 0.141818182 0 0 0

aku 0.670833333 0.322 0.341515152 0.322 0 0.365909091

an 0 0.312 0 0 0 0

suit 0 0 0 0.234 0 0

kadim 0 0 0.141818182 0 0 0

lubuk 0.39 0 0 0 0 0

jendela 0.39 0 0 0 0 0

aneh 0 0.238666667 0.108484848 0 0 0.162727273

selip 0 0 0 0.234 0 0

sisip 0 0 0 0 0 0.212727273

ah 0 0 0 0.234 0 0

mantik 0 0 0.120909091 0 0 0.181363636

agak 0.39 0 0 0 0 0

aba 0 0 0 0.234 0 0

lengan 0.39 0 0 0 0 0

letak 0 0.266 0 0.1995 0 0

curi 0 0 0 0.234 0 0

puja 0.39 0 0 0 0 0

keramik 0 0 0 0.234 0 0

tumpah 0 0 0.141818182 0 0 0

minggu 0 0.22 0.19969697 0 1.1 0

suhu 0 0 0 0 0.78 0

keluar 0 0.312 0 0 0 0

rapat 0 0.266 0 0 0.665 0

pedih 0.39 0 0 0 0 0

bangun 0 0 0.141818182 0 0 0

syukur 0 0 0.283636364 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 135: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

120

of 0 0 0 0 0 0.212727273

buah 0.3325 0 0 0.1995 0 0

cinta 0.903333333 0.180666667 0.082121212 0.271 0 0

chen 0 0.624 0 0 0 0

mudra 0 0 0 0.234 0 0

mayat 0 0 0 0.234 0 0

tungku 0 0 0 0 0.78 0

on 0 0 0 0.234 0 0

sayu 0 0 0 0.234 0 0

pinggir 0 0 0 0.468 0 0

untai 0 0 0 0 0 0.212727273

heran 0 0 0 0.1995 0 0.181363636

saya 0 0 0 0 0 0.212727273

manggara 0 0.312 0 0 0 0

allah 0.39 0 0 0 0 0

memilliki 0 0 0.141818182 0 0 0

pompa 0 0 0.141818182 0 0 0

hantam 0 0 0.141818182 0 0 0

istana 0 0 0 0 0 0.212727273

harga 0.39 0 0 0 0 0

sampai 0 0 0.241818182 0 0 0

sampah 0 0 0 0 0 0.212727273

ikhtiar 0 0 0 0 0 0.425454545

magai 0 0.312 0 0 0 0

keong 0 0 0 0 0 0.212727273

yogachara 0 0 0 0.234 0 0

nima 0 0 0 0.234 0 0

bentangkan 0 0.312 0 0 0 0

pn 0 0 0 0.234 0 0

demi 0.39 0 0 0 0 0

novel 0 0 0 0.234 0 0

filosofi 0 0 0 0.234 0 0

emosi 0.3325 0 0.120909091 0 0 0

almari 0 0 0 0.234 0 0

genang 0 0 0 0 0 0.212727273

kurus 0 0 0 0.234 0 0

syair 0.9975 0 0 0 0 0

terus 0 0 0.120909091 0 0 0.181363636

larantuka 0 0 0 0 0 0.212727273

bungkam 0 0 0.141818182 0 0 0

jual 0 0 0 0 0 0.212727273

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 136: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

121

sekian 0 0 0 0 0 0.212727273

tepuk 0 0.266 0 0.1995 0 0

kebaliagiaan 0.39 0 0 0 0 0

klakson 0 0 0.141818182 0 0 0

padahal 0 0 0 0 0 0.362727273

receh 0 0 0.141818182 0 0 0

buat 0.253333333 0 0.092121212 0.152 0 0.276363636

maksud 0 0.266 0.120909091 0 0 0

keping 0 0 0 0 0.78 0

oleh 0.298333333 0.238666667 0 0 0 0.162727273

sabarrasanya 0 0 0 0.234 0 0

gelap 0.824166667 0 0.1 0 0.55 0

my 0 0 0.120909091 0.1995 0 0

lari 0 0 0 0.358 0 0.162727273

sabarmenghampiri 0 0 0 0.234 0 0

segera 0 0 0 0.234 0 0

na 0.39 0 0 0 0 0

gemar 0 0 0 0 0 0.212727273

tertawa 0 0 0.141818182 0 0 0

samanasanta 0 0 0 0 0 0.212727273

nyala 0.39 0 0 0 0 0

teman 0.298333333 0 0.108484848 0 0 0.325909091

tipis 0 0.266 0 0 0.665 0

halaman 0 0 0 0.234 0 0

tengik 0 0 0 0 0 0.212727273

setia 0.506666667 0.202666667 0.092121212 0 0 0.138181818

kawasan 0 0 0 0.234 0 0

cekat 0 0 0 0.234 0 0

setan 0 0 0.141818182 0 0 0

satpam 0 0.312 0 0 0 0

orangtua 0.78 0 0 0 0 0

untuk 0 0 0 0 0 0.212727273

celana 0 0 0.141818182 0 0 0

cekal 0 0 0.141818182 0 0 0

jatuh 0 0 0 0 0 0.488181818

tenteram 0.39 0 0 0 0 0

cangkung 0 0 0 0.234 0 0

konsep 0 0.238666667 0.216969697 0 0 0

hambur 0 0 0 0.234 0 0

binar 0 0 0 0.234 0 0

murni 0 0 0 0 1.56 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 137: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

122

ka 0.39 0 0 0 0 0

politik 0 0 0.141818182 0 0 0

gula 0 0 0.141818182 0 0 0

tunggu 0 0 0.217272727 0.2685 0 1.139545455

serap 0 0.312 0 0 0 0

sifat 0 0 0 0 0.78 0

curah 0.39 0 0 0 0 0

muncul 0 0 0 0 0 0.425454545

kencang 0 0 0 0 0.78 0

penghulu 0 0 0 0.234 0 0

ratus 0 0 0.108484848 0 1.195 0.162727273

politis 0 0 0.141818182 0 0 0

curam 0 0.312 0 0 0 0

gampang 0 0 0.141818182 0 0 0

gesek 0 0 0.141818182 0 0 0

anjur 0.39 0 0 0 0 0

kereta 0 0 0 0 0 0.425454545

ini 0 0 0.141818182 0 0 0

malaikat 0 0 0.141818182 0 0 0

tui 0 0.266 0 0 0 0.181363636

gera 0 0 0.141818182 0 0 0

artika 0 0.312 0 0 0 0

koridor 0 0 0 0.234 0 0

takluk 0 0 0 0 0.78 0

satu 0.3325 0 0 0 0 0.181363636

kartika 0 0.624 0 0 0 0

reda 0 0 0.141818182 0 0 0

tua 0.39 0 0 0 0 0

tangkap 0 0.312 0 0 0 0

debar 0 0 0 0.1995 0 0.181363636

ajaib 0 0 0 0.1995 0 0.181363636

milik 0.7225 0 0.175151515 0.289 0 0

kamar 0 0 0.141818182 0 0 0

langkah 0 0 0 0.234 0 0

wan 0 0 0 0 0.665 0.362727273

laut 0 0 0 0 0.78 0

ho 0.39 0 0 0 0 0

cemas 0 0 0 0 0 0.212727273

memang 0 0.312 0 0 0 0

ia 0.4475 0.358 0.216969697 0.358 0.298333333 0.406818182

pakat 0.39 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 138: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

123

angkat 0 0 0 0 0 0.212727273

pulang 0 0.512666667 0.233030303 0 0.426666667 0.582272727

infus 0 0 0 0 0.78 0

pamit 0 0 0.141818182 0 0 0

seru 0.39 0 0 0 0 0

uang 0 0.439333333 0.1 0.165 1.098333333 0

ayah 0.213333333 1.196666667 0.233030303 0.128 0.855 0.233181818

pakai 0 0.238666667 0 0.179 0 0.162727273

lauk 0 0.312 0 0 0 0

bentur 0 0 0 0 0 0.212727273

dokter 0 0 0.283636364 0 0 0

adu 0.39 0 0 0 0 0

arni 0 0 0 0.468 0 0

dolar 0 0 0 0 0.78 0

jadi 0.275 0.22 0.19969697 0 0.55 0

concordia 0 0 0 0 0 0.212727273

kiplik 0 0 1.135151515 0 0 0

wasit 0 0 0 0.234 0 0

bentuk 0 0 0.2 0.165 0.55 0

sensasi 0 0 0 0.234 0 0

vila 0 0 0 0 0 0.212727273

turut 0 0 0.216969697 0 0 0.162727273

selai 0 0.312 0 0 0 0

mbah 0.39 0 0 0 0 0

konon 0 0 0 0 0 0.212727273

tenaga 0 0 0 0 0.78 0

ada 0.240833333 0.192666667 0.262727273 0 0 0.131363636

turun 0 0.238666667 0 0 0 0.814090909

bosan 0 0 0.141818182 0 0 0

lafal 0 0.312 0 0 0 0

cewek 0 0 0.141818182 0 0 0

tunda 0 0 0.141818182 0 0 0

matahari 0.39 0 0 0 0 0

utara 0 0.266 0 0 0 0.181363636

benar 0.253333333 0 0.276363636 0 0 0.138181818

sepupu 0 0 0 0 0.78 0

sudah 0 0.192666667 0.262727273 0.289 0 0

ketika 0 0 0.141818182 0 0 0

gerutu 0 0 0.241818182 0 0 0

disari-sarikan 0 0.312 0 0 0 0

zaidun 0.39 0 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 139: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

124

begitu 0 0 0 0 0 0.212727273

sekarang 0 0 0 0 0 0.212727273

awak 0 0 0.283636364 0 0 0

gilir 0 0.238666667 0 0.358 0 0

jawab 0 0.532 0 0 0 0

benci 0.39 0 0 0 0 0

ragam 0 0 0.141818182 0 0 0

bulan 0.3325 0 0.120909091 0 0 0

kriiiiiiiiiiiiinnnggggg 0.39 0 0 0 0 0

dahaga 0.39 0 0 0 0 0

padas 0 0 0 0.234 0 0

lagu 0 0 0.241818182 0.1995 0 0

gantung 0 0 0.141818182 0 0 0

padat 0 0 0 0.234 0 0

seolah-olah 0 0 0 0.234 0 0

duga 0 0.312 0 0 0 0

cela 0.78 0 0 0 0 0

arti 0 0 0 0 0 0.212727273

tanah 0.298333333 0.238666667 0 0 0 0.162727273

ragu 0 0 0.120909091 0 0 0.181363636

biar 0 0 0.241818182 0 0 0

tuan 0 0 0.141818182 0 0 0

terbit 0.3325 0 0 0 0.665 0

dahulu 0 0 0 0 0 0.212727273

tatap 0 0 0.141818182 0 0 0

hirau 0 0 0 0.234 0 0

yang 0.78 0 0 0 0 0

sabarmenunggu 0 0.153333333 0 0.23 0 0.731818182

hutan 0 0.312 0 0 0 0

pesona 0 0 0 0.234 0 0

papa 0.665 0 0 0 0 0

iring 0 0 0 0.399 0 0

selamat 0.3325 0 0 0 0.665 0

pedal 0 0 0.141818182 0 0 0

makhluk 0.39 0 0 0 0 0

namun 0.225833333 0.361333333 0.164242424 0.1355 0 0.123181818

asing 0 0 0.120909091 0 0 0.181363636

gemintang 0.39 0 0 0 0 0

pura 0 0 0.283636364 0 0 0

sepoi 0.39 0 0 0 0 0

rupa 0 0 0 0 0 0.362727273

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 140: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

125

haji 0 0 0 0.468 0 0

tanda 0 0.385333333 0.175151515 0.1445 0 0.131363636

hari 0.298333333 0.238666667 0 0 0 0.162727273

enam 0 0 0.283636364 0 0 0

teori 0.39 0 0 0 0 0

tense-nya 0 0 0.141818182 0 0 0

haru 0.39 0 0 0 0 0

miskin 0 0 0 0 0 0.212727273

punk 0 0 0.141818182 0 0 0

plot 0 0 0 0.234 0 0

sodor 0 0 0 0.1995 0.665 0

habis 0 0 0.141818182 0 0 0

tiang 0.39 0 0 0 0 0

tsu 0 0.624 0 0 0 0

lukis 0 0 0 0 0 0.425454545

motor 0 0 0.120909091 0.1995 0 0

tengah 0 0.312 0 0 0 0

lihat 0 0 0 0 0 0.212727273

wajah 0.225833333 0.180666667 0 0.271 0 0.369545455

bunga 0 0 0.120909091 0.1995 0 0

ayo 0 0.266 0 0.1995 0 0

tampung 0 0 0 0 0 0.212727273

tabuhan 0 0 0.141818182 0 0 0

hobi 0 0 0 0 0 0.212727273

wujud 0.78 0 0 0 0 0

para 0 0 0.141818182 0 0 0

familiar 0 0 0.141818182 0 0 0

doa 0 0 1.276969697 0 0 0

pelan 0 0 0.241818182 0 0 0

bingung 0 0 0.141818182 0 0 0

wahai 0.78 0 0 0 0 0

benda 0 0 0 0.1995 0 0.181363636

tabah 0.665 0 0 0 0 0

hormat 0.39 0 0 0 0 0

engkau 1.195 0 0.108484848 0 0 0

salah 0.253333333 0 0.553333333 0 0 0.276818182

batang 0.665 0.266 0 0 0 0

gelas 0 0 0.108484848 0 0.596666667 0.162727273

salak 0 0 0 0.399 0 0

hua 0 0 0 0 0 0.212727273

masalah 0 0 0.141818182 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 141: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

126

bersih 0.3325 0 0 0.1995 0 0

koper 0 0 0 0.234 0 0

rela 0.3325 0 0.120909091 0 0 0

rantig-ranting 0 0 0 0 0 0.212727273

rayap 0.39 0 0 0 0 0

nikah 0 0 0 0.234 0 0

dari 0 0 0.241818182 0 0 0

paku 0 0 0.141818182 0 0 0

kecuali 0.39 0 0 0 0 0

demonstrasi 0 0 0 0.234 0 0

nepal 0 0 0 0.234 0 0

iwin 0 0 0 0 2.341666667 0

maling 0 0.312 0 0 0 0

kanak-kanak 0 0 0 0.234 0 0

gegas 0 0.266 0.120909091 0 0 0

kapal 0 0 0 0 0 0.362727273

kadang 0 0.624 0 0 0 0

jaket 0 0 0.141818182 0 0 0

si 0 0.180666667 0.246363636 0.1355 0.903333333 0.123181818

kesal 0 0 0.141818182 0 0 0

muak 0 0 0.141818182 0 0 0

kuat 0 0.238666667 0 0.358 0 0

pagelaran 0 0 0.141818182 0 0 0

unggul 0 0 0 0 0.78 0

laki 0 0 0.108484848 0.179 0 0.162727273

kuap 0 0 0 0.234 0 0

bahasa 0 0 0.120909091 0 0 0.181363636

sulit 0 0 0.120909091 0 0.665 0

sahara 0.3325 0.266 0 0 0 0

kuak 0 0 0 0 0 0.212727273

laku 0.298333333 0 0.108484848 0.179 0 0

nganga 0 0.266 0.120909091 0 0 0

dua 0.298333333 0.238666667 0 0.179 0 0

mulia 0.39 0 0 0 0 0

mahayana 0 0 0 0.234 0 0

dengki 0 0 0 0 0.78 0

teror 0 0 0 0 0.78 0

kadangkala 0 0 0.141818182 0 0 0

raih 0 0.238666667 0.108484848 0 0 0.162727273

obrol 0 0 0.141818182 0 0 0

samping 0 0 0.141818182 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 142: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

127

kiak 0 0.312 0 0 0 0

aspal 0 0 0 0 0.78 0

angin 0.3325 0 0 0 0 0.181363636

kotor 0 0 0.120909091 0 0 0.181363636

apakah 0.275 0 0.2 0 0 0.15

kian 0 0 0 0 0.78 0

napas 0 0 0.141818182 0 0 0

ceng 0.39 0 0 0 0 0

karena 0 0 0 0 0 0.212727273

anatolia 0 0.624 0 0 0 0

abadi 0.39 0 0 0 0 0

harun 0 0.439333333 0.399393939 0.165 0 0

bayar 0 0.312 0 0 0 0

harum 0.39 0 0 0 0 0

terpa 0 0 0 0.1995 0 0.181363636

ton 0 0 0.141818182 0 0 0

empat 0 0 0 0 0 0.212727273

timur 0 0 0.141818182 0 0 0

cina 0 0 0 0 0 0.212727273

mus 0 0.477333333 0 0 0 0.162727273

lama 0 0 0.241818182 0 0 0

tangan 0.481666667 0.192666667 0 0.289 0 0.131363636

peranjat 0.39 0 0 0 0 0

paman 0 0.312 0 0 0 0

raja 0 0.624 0 0 0 0

garcia 0.39 0 0 0 0 0

latar 0 0 0.141818182 0 0 0

atur 0 0 0 0.234 0 0

potong 0.665 0.266 0 0 0 0

iklan 0 0 0.141818182 0 0 0

gerimis 0 0 0 0 0.78 0

yaitu 0.39 0 0 0 0 0

lempuyangan 0 0 0 0 0 0.212727273

amat 0 0 0 0.234 0 0

kecil 0 0 0 0 0.78 0

tempe 0 0.312 0 0 0 0

tak 0 0.192666667 0 0.7225 0 0.131363636

sentak 0.39 0 0 0 0 0

dang 0 0 0 0 0 0.212727273

marching 0 0 0 0.234 0 0

palsu 0 0 0.141818182 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 143: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

128

diam 0.3325 0.266 0 0 0 0

pagi 0 0.478 0 0.358 0 0

tempo 0 0 0.108484848 0.358 0 0

titip 0 0.266 0 0.1995 0 0

rencana 0 0 0.425757576 0 0 0

damba 0 0 0 0 0 0.212727273

tuhu 0.39 0 0 0 0 0

akan 0.39 0 0 0 0 0

tepat 0 0.312 0 0 0 0

linna 0 0.312 0 0 0 0

surut 0 0 0 0.234 0 0

gambar 0 0.312 0 0 0 0

semena-mena 0 0 0.141818182 0 0 0

bungkus 0 0.312 0 0 0 0

ancam 0 0 0 0 0.78 0

malam 0.366666667 0.146666667 0.133333333 0.66 0 0.1

akar 0 0 0 0 1.995 0

suruh 0 0.238666667 0 0.179 0 0.162727273

istri 0.55 0 0 0 0 0.3

gundah 0 0.312 0 0 0 0

me-leluri 0.39 0 0 0 0 0

kau 0 0.202666667 0.460909091 0 0 0

hawa 0 0 0 0 0.78 0

keluh 0 0 0 0 0 0.212727273

perhati 0 0 0 0.1995 0.665 0

bantu 0 0.312 0 0 0 0

kal 0 0.266 0 0 0 0.725454545

dia 0.191666667 0.153333333 0.209393939 0.46 0 0.209090909

asa 0.225833333 0.180666667 0.082121212 0 0.451666667 0.369545455

kak 0 0 0 0 0.78 0

minat 0 0.312 0 0 0 0

tabla 0 0 0 0.234 0 0

kingayah 0 0 0 0 0 0.425454545

tay 0 0 0 0 0 0.212727273

cita 0.39 0 0 0 0 0

tas 0 0.202666667 0.092121212 0.4565 0 0.138181818

mudah 0 0.266 0.120909091 0 0 0

tarik 0 0 0 0.3045 0.506666667 0.414545455

mereka 0.3325 0 0 0 0 0.362727273

tolol 0 0 0.141818182 0 0 0

tan 0 0.312 0 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 144: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

129

firdaus 0.39 0 0 0 0 0

negara 0 0 0.141818182 0 0 0

lestari 0 0 0 0 0.78 0

panggil 0 0.312 0 0 0 0

cemerlang 0 0 0 0 0.78 0

tirai 0 0 0 0 0 0.212727273

rena 0 0 0.283636364 0 0 0

helat 0.39 0 0 0 0 0

king 0 0 0 0 0 0.212727273

tuntun 0 0 0.49969697 0 0 0

cuci 0 0 0.120909091 0 0 0.181363636

apa 0 0.312 0 0 0 0

dengansabar 0 0 0.141818182 0 0 0

pokok 0 0 0.141818182 0 0 0

bakar 0.3325 0 0 0.1995 0 0

dadak 0.298333333 0.238666667 0 0.179 0 0

mundur 0 0 0 0.234 0 0

ordil 0 0 0 0.468 0 0

hitung 0.39 0 0 0 0 0

sabarbersua 0 0 0 0.234 0 0

hadir 0.298333333 0 0 0 0 0.325454545

api 0.39 0 0 0 0 0

ikut 0 0 0.141818182 0 0 0

betas 0.39 0 0 0 0 0

belakang 0 0 0.120909091 0.1995 0 0

lapis 0 0 0.141818182 0 0 0

pernah 0 0 0 0 0.78 0

urai 0.39 0 0 0 0 0

dahan 0.78 0 0 0 0 0

masak 0 0 0.141818182 0 0 0

coklat 0 0 0 0.234 0 0

lingkar 0 0.266 0 0 0.665 0

timpa 0.39 0 0 0 0 0

positif 0 0 0 0 0.78 0

gimana 0 0 0.141818182 0 0 0

amen 0 0 0.141818182 0 0 0

sobat 0 0 0.141818182 0 0 0

menit 0 0.238666667 0.108484848 0 0 0.162727273

hati 0.8275 0.330666667 0 0 0.826666667 0.225454545

manja 0 0.266 0.120909091 0 0 0

saleha 0 0 0 0.234 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 145: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

130

tugas 0 0 0 0.234 0 0

andung 0 0 0 0 0 0.212727273

kantor 0 0 0.141818182 0 0 0

kumal 0 0 0 0.234 0 0

asap 0 0 0 0 0.78 0

waktu 0.39 0 0 0 0 0

ungkap 0.39 0 0 0 0 0

bahagia 0.39 0 0 0 0 0

bangan 0.39 0 0 0 0 0

perintah 0 0 0 0 0 0.212727273

manis 0 0 0 0 0.78 0

teduh 0 0 0 0 0 0.212727273

halau 0.39 0 0 0 0 0

undang 0.3325 0 0.120909091 0 0 0

riah 0.39 0 0 0 0 0

hibur 0.39 0 0 0 0 0

jerit 0 0 0.141818182 0 0 0

gebu 0 0 0 0.234 0 0

sandal 0 0 0.141818182 0 0 0

persetan 0 0 0.141818182 0 0 0

jumpa 0 0 0 0.234 0 0

luang 0 0 0 0 0 0.212727273

pintal 0 0 0.141818182 0 0 0

hidup 1.280833333 0 0.077575758 0.128 0 0.116363636

pacu 0 0 0 0.234 0 0

tepi 0 0 0 0.234 0 0

kampung 0 0 0 0 0.78 0

delapan 0 0 0 0.234 0 0

properti 0 0 0 0.234 0 0

anggap 0 0 0.241818182 0 0 0

campur 0.39 0 0 0 0 0

tadi 0 0 0 0 0 0.212727273

pada 0 0.405333333 0.092121212 0.152 0.506666667 0

muhammadiyah 0 0 0 0 0 0.212727273

berantung 0 0.312 0 0 0 0

ubah 0 0.312 0 0 0 0

murai 0 0 0 0 0 0.212727273

kuat-kan 0 0.312 0 0 0 0

datar 0.39 0 0 0 0 0

bong 0 0 0.141818182 0 0 0

andalusia 0 0 0.141818182 0 0 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 146: IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL … · identifikasi makna kata sabar dalam artikel berbahasa indonesia dengan algoritma k-means clustering ... department of informatics

131

tebar 0 0 0 0 0.78 0

kriminalisasi 0 0 0.141818182 0 0 0

langgam 0.39 0 0 0 0 0

dewi 0 0 0 0 0.78 0

genggam 0 0 0 0.1995 0 0.181363636

tuju 0 0 0.141818182 0 0 0

pasang 0 0 0.108484848 0.179 0.596666667 0

inggris 0 0 0.141818182 0 0 0

santai 0 0 0.141818182 0 0 0

marini 0 0 0.141818182 0 0 0

ya 0 0 0.141818182 0 0 0

the 0 0 0.120909091 0 0 0.181363636

puti 0 0 0 0.468 0 0

ciut 0 0.312 0 0 0 0

harkat 0 0 0 0 0 0.212727273

kepalang 0.39 0 0 0 0 0

belah 0 0 0.141818182 0 0 0

tawan 0 0 0 0 0 0.212727273

luka 0.665 0 0.120909091 0 0 0

biasa 0 0 0.141818182 0 0 0

mental 0 0 0 0.234 0 0

sabaringin 0 0 0 0.234 0 0

tawar 0.3325 0.266 0 0 0 0

belas 0 0 0 0.234 0 0

ambruk 0 0 0.141818182 0 0 0

podium 0 0 0 0.468 0 0

serta 0.3325 0 0 0 0 0.181363636

basah 0 0 0 0 0.665 0.362727273

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI