Weka Adalah Aplikasi Data Mining Open Source Berbasis Java

9
Weka adalah aplikasi data mining open source berbasis Java. Aplikasi ini dikembangkan pertama kali oleh Universitas Waikato di Selandia Baru sebelum menjadi bagian dari Pentaho. Weka terdiri dari koleksi algoritma machine learning yang dapat digunakan untuk melakukan generalisasi / formulasi dari sekumpulan data sampling. Makalah ini membahas dari 2 cara penggunaan di weka yaitu dari segi browsing dan scripting. Dengan algoritma yang termasuk klasifikasi. 1. Penggunaan Browsing Gambar 1. Tampilan Awal Weka 3.6 Empat tombol diatas dapat digunakan untuk menjalanankan Aplikasi : 1. Explorer : untuk menggali lebih jauh data dengan aplikasi WEKA 2. Experimenter : untuk melakukan percobaan dengan pengujian statistic skema belajar 3. Knowledge Flow : untuk pengetahuan pendukung 4. Simple CLI : menggunakan tampilan command-line yang memungkinkan langsung mengeksekusi perintah weka untuk Sistem Operasi yg tidak menyediakan secara langsung Sebelumnya, saya menggunakan dataset sebagai berikut :

description

weka

Transcript of Weka Adalah Aplikasi Data Mining Open Source Berbasis Java

Page 1: Weka Adalah Aplikasi Data Mining Open Source Berbasis Java

Weka adalah aplikasi data mining open source berbasis Java. Aplikasi ini dikembangkan pertama kali oleh Universitas Waikato di Selandia Baru sebelum menjadi bagian dari Pentaho. Weka terdiri dari koleksi algoritma machine learning yang dapat digunakan untuk melakukan generalisasi / formulasi dari sekumpulan data sampling.

Makalah ini membahas dari 2 cara penggunaan di weka yaitu dari segi browsing dan scripting. Dengan algoritma yang termasuk klasifikasi.

1. Penggunaan Browsing

Gambar 1. Tampilan Awal Weka 3.6

Empat tombol diatas dapat digunakan untuk menjalanankan Aplikasi : 

1. Explorer : untuk menggali lebih jauh data dengan aplikasi WEKA 2. Experimenter : untuk melakukan percobaan dengan pengujian statistic skema belajar 3. Knowledge Flow : untuk pengetahuan pendukung 4. Simple CLI : menggunakan tampilan command-line yang memungkinkan langsung

mengeksekusi perintah weka untuk Sistem Operasi yg tidak menyediakan secara langsung

Sebelumnya, saya menggunakan dataset sebagai berikut :

Department Status Age Salarysales senior 31-40 mediumsales junior 21-30 lowsales junior 31-40 lowsystems junior 21-30 mediumsystems senior 31-40 highsystems junior 21-30 mediumsystems senior 41-50 highmarketing senior 31-40 mediummarketing junior 31-40 mediumsecretary senior 41-50 mediumsecretary junior 21-30 low

Page 2: Weka Adalah Aplikasi Data Mining Open Source Berbasis Java

Dataset tersebut masih belum berbentuk .arff, cara untuk mengconvert menjadi .arrf sebagai berikut :

1. Membuat table di Ms. Excell

2. Save As dengan type CSV (comma delimeted). Save dengan salary.csv3. Buka Program Weka, pilih Explorer, pilih Open File untuk mengambil dataset

salary.csv. Jangan lupa untuk memilih Files Of Type dengan csv. Maka akan terbuka tampilan seperti di bawah ini :

Page 3: Weka Adalah Aplikasi Data Mining Open Source Berbasis Java

4. Kemudian untuk mendapatkan file bertype .arff, silahkan pilih Tombol Save. Kemudian save dengan salary.arff.

5. Dataset salary.arff telah siap digunakan.6. Menggunakan algoritma 0R di Weka.7. Algoritma 0R. Dengan menggunakan dataset salary pilih tab classify, Pilih “Choose” ZeroR

Page 4: Weka Adalah Aplikasi Data Mining Open Source Berbasis Java

8. Klik Start untuk mengetahui hasilnya.

=== Run information ===Scheme:weka.classifiers.rules.ZeroR Relation: salaryInstances: 11Attributes: 4 department status age salaryTest mode:10-fold cross-validation=== Classifier model (full training set) ===ZeroR predicts class value: mediumTime taken to build model: 0.05 seconds=== Stratified cross-validation ====== Summary ===Correctly Classified Instances 6 54.5455 % akurasi yang diperolehIncorrectly Classified Instances 5 45.4545 %Kappa statistic 0 Mean absolute error 0.4347 Hasil akar dari MSERoot mean squared error 0.4771Relative absolute error 100 %Root relative squared error 100 %Total Number of Instances 11 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 1 1 0.545 1 0.706 0.017 medium 0 0 0 0 0 0.021 low 0 0 0 0 0 0 highWeighted Avg. 0.545 0.545 0.298 0.545 0.385 0.015=== Confusion Matrix === a b c <-- classified as 6 0 0 | a = medium 3 0 0 | b = low 2 0 0 | c = high

Page 5: Weka Adalah Aplikasi Data Mining Open Source Berbasis Java

Penggunaan Orange

Tampilan Awal Orange Data Mining

1. Pilih New, Beri nama schema sesuai keinginan. Misal salary, klik OK.

2. Pilih file dan data table pada tab Data.

Page 6: Weka Adalah Aplikasi Data Mining Open Source Berbasis Java

3. Hubungkan antara File dan data table dengan mengklik samping notasi dan geser.

4. Pada File, klik dua kali untuk mengambil dataset yang sudah kita buat bertype .tab. Pilih Reload untuk menyimpan dataset dan close.

5. Maka jika data table diklik 2x, akan muncul dataset kita.

Page 7: Weka Adalah Aplikasi Data Mining Open Source Berbasis Java

6. Buat sepeti gambar dibawah ini untuk memprediksi dengan algoritma 0R.

7. Maka jika kita klik data table(1) akan terlihat hasil dari algoritma 0R.

Page 8: Weka Adalah Aplikasi Data Mining Open Source Berbasis Java

8. Untuk penggunaan scripting bisa dilakukan dengan cara klik kanan pada canvas, ketikkan python, maka akan muncul python scripting, pilih python scripting.

9. Klik 2x pada symbol python scripting dibawah ini.

10.