PENERAPAN TEXT MINING UNTUK MEMBANTU KEPUTUSAN … · DAFTAR PUSTAKA [1] Kusnawi. (2007). Pengantar...
Transcript of PENERAPAN TEXT MINING UNTUK MEMBANTU KEPUTUSAN … · DAFTAR PUSTAKA [1] Kusnawi. (2007). Pengantar...
PENERAPAN TEXT MINING UNTUK MEMBANTU KEPUTUSAN PENGAMBILANMATAKULIAH DENGAN KETERKAITAN MATERI MENGGUNAKAN METODE
ASSOCIATION RULES ANALYSIS PADA FAKULTAS INFORMATIKA IT TELKOM
Riski Pratama¹, Hetti Hidayati², Shaufiah³
¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
AbstrakKebutuhan akan informasi di bidang pendidikan khususnya tingkat universitas dinilai cenderungmeningkat. Salah satunya adalah kebutuhan mahasiswa akan informasi mengenai materi yangdiajarkan dari matakuliah yang ada di Fakultas Informatika IT Telkom. Banyaknya matakuliahdengan materi yang cukup banyak dan berbeda-beda sehingga hanya dapat memberikan sebagiankecil informasi. Karena itu diperlukan sebuah sistem yang dapat mengolah data matakuliahtersebut menjadi informasi tambahan berupa keterkaitan materi. Hasil yang diharapkan berupainformasi sekelompok matakuliah berdasarkan materi tertentu yang memiliki keterkaitan.
Dari hasil tersebut diharapkan dapat membantu mahasiswa dalam menentukan keputusanpengambilan matakuliah berdasarkan keterkaitan materi. Informasi-informasi tersebutmenghasilkan materi-materi apa saja yang terdapat di dalam suatu matakuliah dan jugaketerkaitan dari suatu materi.
Kata Kunci : Text Mining, Parsing, Stemming, Stopwords Removal, Algoritma Apriori, FrequentItemsets, Association Rules
AbstractThe need for information in the field of education, especially at university level assessed is likelyto increase. One is the need for information about the material students are taught from thecourse in the Faculty of Informatics IT Telkom. The number of subjects with a lot of material anddifferent so that can only provide a small portion of information. Therefore we need a system thatcan process data is subject to additional information in the form of linkage material. Results areexpected in the form of information based on certain material group of subjects that haverelevance.
From these results are expected to assist students in determining the course of decision-makingbased on linkage material. Such information should produce any material contained in a subjectand relevance of the material.
Keywords : Text Mining, Parsing, Stemming, Stopwords Removal, Apriori Algorithm, Frequentitemsets,Association Rules
Powered by TCPDF (www.tcpdf.org)
Tugas Akhir - 2012
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
1
BAB I PENDAHULUAN
1.1 Latar Belakang
Semakin ketatnya pembelajaran di perguruan tinggi menuntut mahasiswa dapat menentukan
langkah-langkah yang harus diambil untuk mempermudah dalam pembelajaran setiap
semesternya.Untuk itu, setiap mahasiswa harus dapat melakukan beberapa evaluasi yang
bertujuan untuk mengetahui informasi berupa materi yang diajarkan dalam matakuliah dan lebih
baik juga mengetahui keterkaitan materi satu dengan materi lainnya. Evaluasi tersebut dilakukan
untuk membantu mahasiswa dalam menentukan langkah pengambilan mata kuliah setiap
semesternya agar dapat meringankan selama menjalani matakuliah yang diambil tersebut
dikarenakan matakuliah memiliki hubungan materi yang saling mendukung dalam belajar.
Mahasiswa mengalami kesulitan dalam mencari sekelompok matakuliah berdasarkan materi
tertentu, misalnya seluruh matakuliah yang mengandung materi “aljabar”. Mahasiswa biasanya
mencari informasi berupa keterkaitan matakuliah dengan bertanya kepada senior yang sudah
mengambil matakuliah tersebut sebelumnya. Pencarian informasi tersebut masih bersifat manual
dan tidak menutup kemungkinan bahwa informasi tersebut masih bisa saja salah atau tidak
diberikan lebih detailnya.
Diharapkan apabila mahasiswa mencari matakuliah yang berhubungan dengan “aljabar”, maka
seharusnya ditampilkan matakuliah lainnya yang dimana isinya mengandung materi “aljabar”
beserta matakuliah lain yang juga mengandung materi penting yang berhubungan dengan materi
“aljabar” tersebut, misalnya materi penting “Himpunan”, “Enumerasi” dan materi penting lainnya
yang berasosiasi dengan materi-materi di atas. Mungkin juga materi penting lain yang dianggap
tidak ada hubungannya dapat berasosiasi dengan materi yang dicari oleh mahasiswa.
Dengan mempertimbangkan kondisi diatas maka pada Tugas Akhir ini,maka akan dibangun dan
di analisis bagaimana membangun suatu sistem yang dapat membantu mahasiswa dalam
menentukan pengambilan mata kuliah yang memiliki keterkaitan materi dengan menerapkan Text
Mining dan menggunakan metode Association Rules Analysis.
Tugas Akhir - 2012
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
2
Penggunaan text mining disebabkan karena data mentah yang akan diteliti dan diolah adalah
materi dari matakuliah yang bertipe text dan karena data yang diolah ditujukan untuk olahan data
text yang cukup besar. Metode Association Rules Analysis digunakan karena metode ini adalah
salah satu metode data mining yang digunakan di dalam menemukan hubungan asosiasi yang
menarik pada sekumpulan data yang besar.
Sistem Text Mining yang dibangun dengan menggunakan metode Association Rules Analysis
akan melakukan pem-filter-an, penyimpanan kata penting pada tiap materi dalam matakuliah,
menemukan dan menganalisa relasi antar materi, dan kemudian menampilkan hasil analisa
tersebut kepada user. Dengan sistem ini nantinya diperoleh list matakuliah dari yang paling
berhubungan dengan matakuliah yang dipilih oleh user sampai dengan yang paling sedikit
hubungannya dengan matakuliah yang dipilih.
1.2 Rumusan Masalah
Berdasarkan latar belakang permasalahan di atas, maka perumusan masalah yang akan diangkat
dalam Tugas Akhir ini, yaitu :
1. Bagaimana menerapkan Text Mining menggunakan metode Association Rules Analysis agar
dapat membantu mahasiswa dalam menentukan pengambilan matakuliah yang saling
memiliki keterkaitan materi ?
2. Bagaimana menganalisa asosiasi antar materi dari matakuliah dan bagaimana cara untuk
menampilkan hasil tersebut sebagai informasi kepada user?
1.3 Tujuan
Berdasarkan perumusan masalah di atas, maka tujuan dari Tugas Akhir ini, yaitu :
1. Penerapan Text Mining menggunakan metode Association Rules Analysis dapat memberikan
informasi berupa keterkaitan matakuliah berdasarkan asosiasi materinya.
2. Penerapan Text Mining menggunakan metode Association Rules Analysis dapat memberikan
rekomendasi dan membantu keputusan mahasiswa dalam menentukan pengambilan
matakuliah yang saling memiliki keterkaitan materi.
Tugas Akhir - 2012
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
3
1.4 Batasan Masalah
Adapun batasan masalah pada tugas akhir ini, yaitu:
1. Kurikulum yang digunakan yaitu kurikulum tahun ajaran 2008.
2. Raw data yang digunakan untuk preprocessing berupa silabus dari matakuliah.
3. Dokumen yang di preprocessing hanya dokumen dalam bahasa indonesia.
4. Hasil penerapan Text Mining menggunakan metode Association Rules Analysis hanya bersifat
memberikan informasi berupa keterkaitan materi.
1.5 Metodologi Penyelesaian Masalah
Metodologi yang digunakan dalam menyelesaikan Tugas Akhir ini, yaitu:
1. Studi Literatur
Mempelajari literatur-literatur yang berhubungan dengan teori Data Mining, Text Mining, dan
metode yang akan digunakan yaitu Association Rules Analysis.
2. Pengumpulan Data
Data yang akan dijadikan penelitian dari raw datayaitu dokumen-dokumen yang diajarkan
dari seluruh matakuliah yang terdapat di Fakultas IT Telkom.
3. Analisis dan Perancangan Sistem
Melakukan analisis sistem, menerapkan metode Association Rules Analysis dalam merancang
sistem, dan menentukan kebutuhan dari sistem yang akan dibangun seperti kebutuhan
fungsionalitas sistem, seperti :
a. Raw Data : dokumen-dokumen yang akan diajarkan dari setiap matakuliah
b. Preprocessing : melakukan parsing, stemming, dan stopwords removal untuk
mendapatkan materi dari dokumen yang diajarkan pada setiap matakuliah baik itu materi
utama ataupun sub-sub materi dari materi utama
c. Algoritma Apriori : menyeleksi materi-materi yang didapat dari hasil preprocessing untuk
mendapatkan frequent itemsets yang nantinya digunakan untuk mencari asosiasi dari satu
materi ke materi yang lainnya.
d. Association Rules : generate materi yang terasosiasi setelah melalui proses-proses pada
preprocessing dan penggunaan algoritma apriori.
Tugas Akhir - 2012
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
4
4. Implementasi
Mengimplementasikan hasil analisis dan rancangan ke dalam suatu perangkat lunak yang
merupakan sistem yang dapat membantu keputusan dalam pengambilan matakuliah dengan
melakukan pengujian dari metode aturan Association Rules Analysis.
5. Pengujian
Melakukan pengujian terhadap fungsionalitas sistem yang telah di bangun untuk
meminimalisir adanya bug/error dan untuk menentukan nilai minimum support dan
confidence yang paling optimal
6. Pembuatan Laporan
Mendokumentasikan pengerjaan Tugas Akhir ini ke dalam bentuk laporan.
Powered by TCPDF (www.tcpdf.org)
Tugas Akhir - 2012
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
32
BAB V PENUTUP
Pada bab ini berisi kesimpulan dan saran yang didapat berdasarkan dengan pembuatan sistem text
mining untuk memberikan rekomendasi pengambilan matakuliah berdasarkan keterkaitan materi
nya.
5. 1 Kesimpulan
Selama pembuatan tugas akhir ini berlangsung, dapat ditarik kesimpulan sebagai berikut:
1. Penerapan metode Association Rules Analysis dapat memberikan informasi berdasarkan dari
rules yang didapat setelah melalui proses preprocessing, generate frequent itemsets, dan
generate association rules.
2. Penggunaan stoplist untuk stopwords removal pada tahap preprocessing sangat menentukan
jumlah words yang didapat untuk setiap matakuliah
3. Semakin tinggi batasan minimum support count dan yang ditentukan maka association rules
yang dihasilkan semakin sedikit sehingga menurunkan kuantitas dari rekomendasi
pengambilan matakuliah yang dihasilkan sebagai output, begitu juga sebaliknya.
4. Semakin rendah batasan minimum confidence yang ditentukan maka association rules yang
dihasilkan semakin banyak, tetapi banyaknya hasil association rules tidak menentukan bahwa
itu hasil yang paling optimal dan begitu juga sebaliknya.
5. Dengan menganalisa rules yang dihasilkan ditambah dengan hasil expert judgement, dapat
disimpulkan bahwa informasi yang dihasilkan cukup menarik (interesting) dan berguna untuk
memberikan informasi yang lebih spesifik dalam menunjukkan keterkaitan suatu materi.
5. 2 Saran
Pada tugas akhir ini dari proses pengembangan aplikasi program ini diberikan saran :
1. Target data dapat ditambahkan berupa matakuliah dengan dokumen yang berbahasa Inggris.
2. Rekomendasi untuk pengambilan matakuliah dapat dicari dengan penggunaan metode
pencarian lain seperti klasifikasi jenis matakuliah tanpa melalui proses parsing, stemming,
dan stopwords removal.
3. Text cleaning dapat dilakukan secara langsung oleh sistem dengan suatu metode tanpa harus
dilakukan secara manual.
Powered by TCPDF (www.tcpdf.org)
Tugas Akhir - 2012
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika
DAFTAR PUSTAKA
[1] Kusnawi. (2007).Pengantar Solusi Data Mining.Yogyakarta.
[2] Soumen, C. (2003). Mining The Web : Discovering Knowledge From Hypertext Data.
San Fransisco.
[3] Bill, F. (1999). “What is Information Retrieval”, Virginia.
[4] Michael, H., Bettina, G., Kurt, H.(2005). A Computational Environment for Mining
Association Rules and Frequent Item Sets.
[5] Jiawei, H., & Micheline Kamber, “Data Mining Concepts and Techniques Second
Edition”
[6] Christian, B., &Rudolf, K.(2002). “Induction of Association Rules : Apriori
Implementation”. Germany.
[7] Tala, Fadillah Z.(2003). A Study of Stemming Effects on Information Retrieval in
Bahasa Indonesia. Amsterdam.
[8] Johansyah, Rizmi L.(2010). Tentang Parsing, Stoplist, dan Dictionary.Jakarta.
[9] Li, P., Chen, J., & Bian, F. (2004). A Developed Algorithm of Apriori Based
Association Analysis.WuHan University.
[10] Feldman, R., &Sanger, J.(2007). The Text Mining Handbook.New York : Cambridge
University Press
[11] http://fpmipa.upi.edu/staff/yudi/stop_words_list.txt
Powered by TCPDF (www.tcpdf.org)
Tugas Akhir - 2012
Fakultas Teknik Informatika Program Studi S1 Teknik Informatika