INF 305 Data Mining -...

14
INF INF 305 Data Mining 305 Data Mining Taufik Fuadi Abidin Jurusan Informatika FMIPA Universitas Syiah Kuala [email protected] www.informatika.unsyiah.ac.id/tfa Pengantar WEKA Pengantar WEKA (Waikato Environment for Knowledge Analysis) (Waikato Environment for Knowledge Analysis)

Transcript of INF 305 Data Mining -...

Page 1: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

INFINF‐‐305 Data Mining305 Data Mining

Taufik Fuadi AbidinJurusan Informatika

FMIPA Universitas Syiah Kuala

[email protected]/tfa

Pengantar WEKAPengantar WEKA(Waikato Environment for Knowledge Analysis)(Waikato Environment for Knowledge Analysis)

Page 2: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

Dikembangkan di University of Waikato, New ZealandDikembangkan menggunakan JavaFree software under the GNU General Public License

PendahuluanPendahuluan

http://www.cs.waikato.ac.nz/ml/weka/

Page 3: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

Weka adalah perangkat lunak data mining yang memiliki sekumpulan algoritma standar data miningWeka dapat dijalankan berbasis GUI dan secara langsung melalui Command Line (advanced users)Weka dapat digunakan untuk melakukan pre‐processing, klasifikasi, clustering (pengelompokan), regresi, association rule mining (ARM) dan visualisasi

Apa itu Weka?Apa itu Weka?

Page 4: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

Versi stable saat ini (September 2012) adalah 3.6.8 dan dapat diunduh melalui URL:http://prdownloads.sourceforge.net/weka/weka‐3‐6‐8.zip

FAQ dari Weka dapat diperoleh di Weka WIKI: http://weka.wikispaces.com/Frequently+Asked+Questions

Versi Stabil WekaVersi Stabil Weka

Page 5: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

Tampilan WekaTampilan Weka

Penggunaan Advance

Page 6: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

Dalam Weka, setiap dataset merupakan instance dari class: weka.core.InstanceSetiap instance memiliki beberapa atribut (field)Domain dari atribut dapat berupa:

Nominal: jeruk, apel, pepayaNumerik: bilangan bulat dan pecahanString: diapit oleh tanda petikDate: tanggalRelasional

DatasetDataset

Page 7: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

Contoh DatasetContoh Dataset

Page 8: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

ARFF: Attribute‐Relation File FormatARFF terdiri dari dua bagian:

Header: menjelaskan tipe atributBagian Data: meliputi data yang dipisah dengan koma

ARFF File (Representasi Data)ARFF File (Representasi Data)

Page 9: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

ARFF File (Contoh Format)ARFF File (Contoh Format)

Page 10: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

Contoh Data dalam ARFFContoh Data dalam ARFFDapat dilihat dalam direktori Data pada folder dimana Weka diinstalDiantaranya:

Weather.arffIris.arffLabor.arffSoybean.arff

Page 11: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

Data: Iris.arffData: Iris.arff

Page 12: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

Data: Iris.arff (Detail)Data: Iris.arff (Detail)

Page 13: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

Data: weather.arffData: weather.arff

Page 14: INF 305 Data Mining - cs.unsyiah.ac.idcs.unsyiah.ac.id/~mahman/matakuliah_semester_lima/data_mining/weka.pdfyang memiliki sekumpulan algoritma standar data mining Weka dapat dijalankan

Latihan: Ubah dalam Format arffLatihan: Ubah dalam Format arffage income student credit_rating buys_computer

<=30 high no fair no<=30 high no excellent no30…40 high no fair yes>40 medium no fair yes>40 low yes fair yes>40 low yes excellent no31…40 low yes excellent yes<=30 medium no fair no<=30 low yes fair yes>40 medium yes fair yes<=30 medium yes excellent yes31…40 medium no excellent yes31…40 high yes fair yes>40 medium no excellent no