RANCANG BANGUN FUZZY ASSOCIATION RULE MINER … · BISNIS ENTERPRISE RESOURCE PLANNING (ERP) Nama :...
Transcript of RANCANG BANGUN FUZZY ASSOCIATION RULE MINER … · BISNIS ENTERPRISE RESOURCE PLANNING (ERP) Nama :...
RANCANG BANGUN FUZZY ASSOCIATION RULE MINER UNTUK MENDETEKSI FRAUD PADA PROSES BISNIS ENTERPRISE RESOURCE PLANNING (ERP)
Nama : Fernandes P. Sinaga
NRP : 5110100190
Pembimbing 1 : Prof. Drs. Ec. Ir. Riyanarto Sarno, M.Sc., Ph.D.
Pembimbing 2 : Abdul Munif, S.Kom., M.Sc.
Latar Belakang
Proses bisnis dapat mengalami perubahan secara dinamis.
Perubahan menghasilkan variasi terhadap proses bisnis
Dalam prakteknya, variasi proses bisnis yang dijalankan dapatmengandung kecurangan / fraud.
Kecurangan pada variasi tersebut dikatakan sebagai fraud padaproses bisnis.
Fraud pada proses bisnis dapat mengakibatkan kerugian yang besar terhadap perusahaan.
Latar BelakangProses bisnis
berubah secaradinamis
Variasi proses bisnis (fraud)
Variasi proses bisnis (normal)
Variasi proses bisnis (normal)
Fraud proses bisnis
Latar Belakang PendeteksianFraud
Data Mining
Pemeriksaanpada Data
Alur proses tidakdiperiksa
Proses Mining
Memeriksa Alurproses
MendeteksiFraud berbobot
tinggi
RumusanMasalah
Rumusan masalah yang diangkat dalam Tugas Akhir ini dapatdipaparkan sebagai berikut:
Bagaimana mendapatkan data pelanggaran yang terdapat pada event log dari proses bisnis yang dijalankan.
Bagaimana cara menghitung bobot fraud dengan menggunakanalgoritma Fuzzy Sets Multi Attribute Decision Making.
Bagaimana cara menggabungkan algoritma Fuzzy dan Association Rule Learning (ARL) untuk menentukan aturan asosiasi data pelanggaran.
Bagaimana mendeteksi fraud dari suatu case dengan menggunakanbobot fraud dan aturan asosiasi pelanggaran yang dihasilkan.
Bagaimana melakukan kategorisasi hasil pendeteksian fraud ke dalamkelas fraud yang sesuai.
Bagaimana membuat plugin ProM yang menjalankan setiapperhitungan dan pendeteksian fraud.
BatasanMasalah
Permasalahan yang dibahas dalam Tugas Akhir ini memilikibeberapa batasan, di antaranya sebagai berikut:
Bahasa pemrograman menggunakan bahasa Java.
Data uji yang digunakan berupa event log dan model proses bisnisberekstensi pnml yang telah dimodifikasi sesuai dengan StandarOperasional Prosedur (SOP).
Data uji yang digunakan tidak riil, melainkan simulasi untuk proses bisnis aplikasi kredit pada bank dan proses bisnis procurement ERP.
Penilaian kepentingan kriteria pelanggaran menggunakan data dari pakar.
Nilai Threshold pada algoritma Fuzzy Association Rule Learningditentukan oleh pengguna plugin.
Plugin yang dihasilkan khusus untuk software ProM 6.0.
LandasanTeori
Pendeteksian Kecurangan / Fraud
Pendeteksian Fraud dengan metode penggalian data (Data Mining)
Pendeteksian Fraud dengan metode penggalian proses (Process Mining)
Fuzzy set Multiple Attribute Decision Making
Fuzzy Association Rule Learning
Event log
Petri net
PendeteksianKecurangan / Fraud
Fraud (kecurangan/penipuan) merupakan ketidakjujuran yang direncanakan menyebabkan cedera lain dengan membuatpernyataan palsu, menyembunyikan, atau mengabaikan faktamaterial
Proses penipuan bisnis adalah penipuan yang disebabkan olehsalah mengartikan urutan proses.
Fraud dapat disebabkan oleh 3 hal ini : Penekanan/pemaksaan.
Melihat kesempatan.
Pelaku fraud pasti berlaku dengan rasional atau sama dengannormal flow
PendeteksianKecurangan / Fraud
Pendeteksian fraud dapat dilakukan dengan melakukan kontrolinternal seperti mendefinisikan Standar Operasional Prosedur(SOP).
SOP mengatur alur proses bisnis, waktu standar, resource danorganization/role, serta penentuan pengambilan keputusan.
Fraud dapat terjadi karena pelanggaran pada proses bisnis / standar operasional prosedur dan adanya manipulasi data.
Fraud yang terjadi pada proses bisnis disebut Process-based Fraud
PendeteksianKecurangan / Fraud
Dalam process-based fraud, didefinisikan 6 tipe kecuranganberdasarkan cara kecurangan dilakukan:
1. Skipped Activity
2. Wrong Throughput Time
3. Wrong Resource
4. Wrong Duty
5. Wrong Pattern
6. Wrong Decision.
Skipped Activity
Jenis fraud di mana terdapat aktivitas yang di dalam SOP seharusnya dikerjakan, tetapi kenyataannya tidak dikerjakan ataudilewati
Berdasarkan jenis aktifitasnya, Skipped Activity ini terbagimenjadi 2 yaitu
Skip Sequence
Skip Decision
Aktifitas/Event Sequence
Aktifitas/Event Decision
Wrong Throughput Time
Jenis fraud di mana terjadi pengerjaan aktivitas yang lebih cepatatau lebih lama dari batasan waktu yang ditetapkan dalam SOP
Terdapat dua macam Wrong Throughput Time, yaitu Throughput Time Minimum apabila aktifitas yang dikerjakan di
bawah waktu normal
Throughput Time Maximum apabila waktu pengerjaan aktifitas di atas waktu normal.
Event LogModel SOP
Wrong Resource
Jenis fraud di mana suatu aktivitas tidak dikerjakan oleh orang yang mempunyai role yang sesuai dengan SOP
Wrong Duty
Jenis fraud di mana terdapat seorang pegawai yang melakukandua atau lebih aktivitas yang berbeda dalam satu proses yang berjalan. Fraud ini dapat juga disebut pelanggaran terhadapSegregation of Duty (SoD).
Terdapat tiga macam jenis Wrong Duty yaitu Wrong Duty Sequence apabila terjadi pada aktifitas sequence
Wrong Duty Decision apabila terjadi pada aktifitas decision
Wrong Duty Combine apabila terjadi pada aktifitas sequence dandecision.
Wrong Pattern
Jenis fraud di mana terjadi kesalahan urutan aktivitas yang tidak sesuaidengan urutan aktivitas yang ditetapkan pada model proses bisnisstandar di dalam SOP
Wrong Decision
Jenis fraud di mana terjadi kesalahan penarikan keputusan yang tidaksesuai dengan standar yang ditetapkan di dalam SOP
PendeteksianFraud denganmetodepenggaliandata (Data Mining)
Dalam konteks pendeteksian kecurangan, metode data miningdapat digunakan untuk memeriksa data-data sebagai input danmenghasilkan model atau pola sebagai output yang dapatdigunakan untuk mendeteksi adanya kecurangan dalam suatuproses
Metode-metode dalam penggalian data yang telah digunakandalam pendeteksian kecurangan:
Decision Tree
Neural dan Bayesian Network
Support Vector Machine
Metode-metode tersebut memiliki kelemahan dalam mendeteksikecurangan karena tidak mampu menganalisis perilaku alirankontrol proses.
PendeteksianFraud denganmetodepenggalianproses (Process Mining)
PendeteksianFraud denganmetodepenggalianproses (Process Mining)
Dalam upaya pendeteksian fraud, process mining menggunakan konseppengecekan kesesuaian (conformance checking) untuk membandingkandata proses yang berjalan dengan model proses bisnis standar.
Hal ini dilakukan untuk dapat melakukan beberapa macam analisis yang dapat dilakukan untuk mendeteksi fraud.
Analisis Control Flow
• Analisis ini penting untuk dapat mendeteksi kecurangan dalam bentuk skip activity danwrong pattern.
• Analisis dapat dilakukan dengan menggunakan plugin Conformance Checking yang terdapat pada ProM
Analisis Role Resource
• Analisis ini dapat dilakukan dengan melakukan filtering pada event log yaitu denganmengambil atribut resource dan role dalam event log, kemudian dicocokan dengan atributresource/role dalam model SOP.
Analisis Throughput Time
• Analisis ini dilakukan dengan menghitung interval waktu antar aktivitas. Interval inidihitung dari start time stamp dan completed time stamp.
Analisis Decision Point
• Analisis ini dilakukan untuk dapat mengetahui adanya case yang spesifik sebagai akibatdilakukannya suatu decision atau keputusan dalam proses
Fuzzy set Multiple Attribute Decision Making
Metode ini digunakan untuk menghitung bobot fraud suatu proses berjalan
Menggunakan data penilaian kepentingan dari pakar dan data pelanggaran yang dilakukan dalam proses
Menggunakan konsep fuzzy set dalam perhitungan bobotpenilaian pakar dan bobot pelanggaran.
Fuzzy Association Rule Learning
Metode ini digunakan untuk menghasilkan aturan asosiasi antarperilaku pelanggaran yang terjadi.
Menggunakan data pelanggaran dan bobot fraud dari metodeFuzzy MADM
Fuzzy association rule learning (Fuzzy ARL) memiliki konsep yang sama dengan metode Association Rule Learning (ARL)
Dalam konsep ARL, terdapat istilah antedecent dan consequent. Dalam pendeteksian fraud, digunakan perilaku pelanggaransebagai antedecent dan fraud sebagai consequent
Contoh: Skip Sequence Low, Wrong Resource Mid -> Fraud
Yang membedakan adalah Data yang digunakan berupa data fuzzy (0-1)
Perhitungan support menggunakan derajat inklusi
Fuzzy Association Rule Learning
Perhitungan Support pada ARL
Support(X,Y) = 𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝑋 𝑑𝑎𝑛 𝑌
𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖
Contoh : Support(a,b) = 5 / 10 = 0.5
Transaksi ID A B C D E F
T1 1 1 0 0 1 0
T2 0 1 0 1 0 0
T3 0 1 1 0 0 0
T4 1 1 0 1 0 0
T5 1 0 1 0 0 0
T6 0 1 1 0 0 0
T7 1 0 1 0 0 0
T8 1 1 1 0 1 0
T9 1 1 1 0 0 0
T10 1 1 1 0 0 1
Fuzzy Association Rule Learning
Perhitungan Support pada Fuzzy ARL
Support(X,Y) = 𝐽𝑢𝑚𝑙𝑎ℎ 𝐷𝑒𝑟𝑎𝑗𝑎𝑡 𝐼𝑛𝑘𝑙𝑢𝑠𝑖 𝑎𝑛𝑡𝑎𝑟𝑎 𝑋 𝑑𝑎𝑛 𝑌
𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖
Derajat inklusi = min(X,Y)
Contoh: Support(a,b) = (min(0.5,0.3) + (min(0.4+0.5) + min(0.3,0.5) +
min(0.2,0.7) + min(0.2+0.1)) / 10 = (0.3+0.4+0.3+0.2+0.1)/10 = 1.3 /10 = 0.13
Support(a,b) = 0.13
TransaksiID A B C D E F
T1 0.5 0.3 0 0 1 0
T2 0 1 0 0.3 0 0
T3 0 0.3 1 0 0 0
T4 0.4 0.5 0 1 0 0
T5 1 0 0.6 0 0 0
T6 0 0.6 0.1 0 0 0
T7 0.2 0 0.3 0 0 0
T8 0.3 0.5 0.3 0 0.3 0
T9 0.2 0.7 1 0 0 0
T10 0.2 0.1 1 0 0 1
Fuzzy Association Rule Learning
Rumus menghitung nilai confidence
Confidence(X,Y) = 𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝑋 𝑑𝑎𝑛 𝑌
𝐽𝑢𝑚𝑙𝑎ℎ 𝑇𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑀𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝑋
Nilai confidence digunakan sebagai tingkat kepastian dan keparahanfraud yang terjadi.
Contoh : Supp(a,b) = 0.13 Supp(a) = 0.28
Conf(a,b) = 𝑆𝑢𝑝𝑝(𝑎,𝑏)
𝑆𝑢𝑝𝑝(𝑎)= 0.13
0.28= 0.46
TransaksiID A B C D E F
T1 0.5 0.3 0 0 1 0
T2 0 1 0 0.3 0 0
T3 0 0.3 1 0 0 0
T4 0.4 0.5 0 1 0 0
T5 1 0 0.6 0 0 0
T6 0 0.6 0.1 0 0 0
T7 0.2 0 0.3 0 0 0
T8 0.3 0.5 0.3 0 0.3 0
T9 0.2 0.7 1 0 0 0
T10 0.2 0.1 1 0 0 1
Event log
Untuk dapat menerapkan teknik penggalian proses, hal yang penting untuk dilakukan yaitu mengekstrak event log dari sumberdata seperti database, log transaksi, jejak audit, dll.
Dalam aplikasi ProM, format event log yang dapat didukung yaituMXML (Mining eXtensible Markup Language) dan XES (eXtensibleEvent Stream).
Contoh Event log yang digunakan dalam tugas akhir ini:
event_id
case_id activity start_time complete_time resource
complete SID type
verification overrate
decision validation plafond
1 1receive_application1/23/2014
8:001/23/2014 8:05dinda
2 1check_completeness1/23/2014
8:051/23/2014 8:25bagus TRUE
3 1check_SID1/23/2014
8:251/23/2014 8:35galang FALSE
4 1check_loan_type1/23/2014
8:351/23/2014 8:55dadang general
5 1collateral_verification_locate
1/23/2014 8:551/23/2014 9:25bintang
6 1collateral_goverment
1/23/2014 9:251/23/2014 9:55heru
7 1complete_verification
1/23/2014 9:55
1/23/2014 10:25almas TRUE
8 1plafond_estimation1/23/2014
10:251/23/2014
10:45dian600,000,
000
Petri net
Dalam tugas akhir ini, konsep petri net akan digunakan untukmenggambarkan SOP dalam bentuk model proses dalam ekstensiPNML(Petri Net Markup Language).
Di dalam petri net SOP itu terdapat arc, place, dan transisi sebagaiaktivitas, serta terdapat informasi tambahan seperti standarwaktu, role, dan resource yang menjalankan satu aktivitas.
Selain itu, juga terdapat informasi tambahan untukmendefinisikan aturan decision yang terdapat pada model.
Metodologi
Conformance Checking
Conformance Checking atau pengecekan kesesuaian merupakansalah satu analisis spesifik dalam process mining.
Tujuannya adalah untuk mengukur penyimpangan perilaku antaraevent log dengan model proses bisnis standar yang telahdidefinisikan di dalam SOP sehingga kesamaan dan perbedaanbisa diselidiki.
Dalam tugas akhir ini, terdapat tiga macam pengecekankesesuaian yang dapat dilakukan yaitu:
Check Compliance using Conformance Checking Untuk mendeteksi pelanggaran skipped activity
Conformance Checking for Attribute Untuk mendeteksi pelanggaran throughput time, wrong resource,
wrong duty, dan wrong pattern
Check Wrong Decision. Untuk mendeteksi pelanggaran wrong decision
Check Compliance using Conformance Checking
Check Compliance Using Conformance Checking adalah pengecekankesesuaian antara proses dalam event logs dan model SOP Petri Net.
Analisa ini menggunakan konsep replay yang berarti model SOP Petri Net akan di replay atau dimainkan ulang pada event logs.
Apabila sesuai maka disebut conform dan apabila tidak makadicurigai sebagai fraud.
Analisa ini dilakukan untuk mendeteksi apakah terdapat aktifitasyang sengaja dilewati (Skip) dan tidak sesuai dengan model SOP
Conformance Checking for Attribute
Conformance Checking for Attribut adalah pengecekan atribut yang dimiliki oleh setiap aktifitas seperti lama pengerjaan aktifitas(Throughput Time), aktor yang menjalankan aktifitas tersebut, danurutan aktifitas sesudah dan sebelum aktifitas tersebut apakahsudah sesuai dengan model SOP.
Analisa ini dilakukan untuk mendeteksi: 1. Kesalahan eksekusi waktu (Wrong Throughput Time)
2. Kesalahan aktor dalam mengeksekusi aktifitas (Wrong Resource)
3. Terdapat satu aktor yang mengeksekusi lebih dari 1 aktifitas(Wrong Duty)
4. Terdapat urutan aktifitas yang tidak sesuai SOP (Wrong Pattern)
Check Wrong Decision.
Check Wrong Decision adalah pengecekan yang dilakukan padaaktifitas yang berupa decision atau aktifitas yang memilikipercabangan. Aktifitas yang berupa decision mengandung atributyang akan berpengaruh pada eksekusi aktifitas sesudahnya
Perhitunganbobot fraud dengan Fuzzy Set Multi Attribute Decision Making
Menentukan tabel kepentingan penilaian pakar
Membuat fungsi keanggotaan kepentingan
Tingkat
Kepentingan
Vector
Ratinga b c d
Very
Important 0.7 1 1 1 100% - 70%
Important 0.5 0.7 0.7 1 100% - 50%
Fair 0.2 0.5 0.5 0.8 80% - 20%
Week 0 0.3 0.3 0.5 0% - 50%
Very Week 0 0 0 0.3 0% - 30%
0
0.2
0.4
0.6
0.8
1
1.2
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1Der
ajat
Kea
ng
go
taan
Frequency
Fungsi Keanggotaan untuk Derajat Kepentingan
Very Week Week Fair
Important Very Important
Perhitunganbobot fraud dengan Fuzzy Set Multi Attribute Decision Making
Penilaian pakar terhadap kepentingan pelanggaran
Hitung bobot untuk tiap atribut fraud
Lower Bound = 𝑘=1𝑛 𝑎𝑘
𝑛=
0+0+0+0
4= 0
Middle Weight 1 = 𝑘=1𝑛 𝑏𝑘
𝑛=
0.3+0.3+0.3+0.3
4= 0.3
Middle Weight 2 = 𝑘=1𝑛 𝑐𝑘
𝑛=
0.3+0.3+0.3+0.3
4= 0.3
Upper Bound = 𝑘=1𝑛 𝑑𝑘
𝑛=
0.5+0.5+0.5+0.5
4= 0.5
Perhitunganbobot fraud dengan Fuzzy Set Multi Attribute Decision Making
Contoh hasil perhitungan bobot kepentingan atribut pelanggaran
Category Lower Middle1 Middle2 Upper
SKIP SEQUENCE 0 0.3 0.3 0.5
SKIP DECISION 0.7 1 1 1
THROUGHPUT
TIME MINIMUM 0.425 0.65 0.65 0.95
THROUGHPUT
TIME MAXIMUM 0.275 0.55 0.55 0.85
WRONG
RESOURCE 0 0.3 0.3 0.5
WRONG DUTY
SEQUENCE 0 0 0 0.3
WRONG DUTY
DECISION 0 0.3 0.3 0.5
WRONG DUTY
COMBINE 0 0.3 0.3 0.5
WRONG PATTERN 0 0.3 0.3 0.5
WRONG DECISION 0.7 1 1 1
Perhitunganbobot fraud dengan Fuzzy Set Multi Attribute Decision Making
Menentukan tabel derajat pelanggaran
Menentukan fungsi derajat pelanggaran
𝑥 =𝐽𝑢𝑚𝑙𝑎ℎ 𝑃𝑒𝑙𝑎𝑛𝑔𝑔𝑎𝑟𝑎𝑛
𝐽𝑢𝑚𝑙𝑎ℎ 𝐸𝑣𝑒𝑛𝑡 𝑀𝑎𝑘𝑠𝑖𝑚𝑎𝑙 𝑦𝑎𝑛𝑔 𝑑𝑎𝑝𝑎𝑡 𝑑𝑖𝑙𝑎𝑛𝑔𝑔𝑎𝑟
Atribut a b c dVery Bad 0 0 0.1 0.2Between Very Bad &Bad
0 0.1 0.2 0.3
Bad 0.1 0.2 0.3 0.4Between Bad & Fair 0.2 0.3 0.4 0.5Fair 0.3 0.4 0.5 0.6Between Fair & Good 0.4 0.5 0.6 0.7Good 0.5 0.6 0.7 0.8Between Good & VeryGood
0.7 0.8 0.9 1
Very Good 0.8 0.9 1 1
Perhitunganbobot fraud dengan Fuzzy Set Multi Attribute Decision Making
Masukkan hasil fuzzifikasi pelanggaran ke dalam atribut conformance pada tabel perhitungan bobot pelanggaran.
Kemudian, untuk tiap pakar, dilakukan penyesuaian nilai denganmenggunakan persamaan berikut
𝑃 =(𝐶𝑎+𝐶𝑏+𝐶𝑐+𝐶𝑑
4)+(
𝐷𝑎+𝐷𝑏+𝐷𝑐+𝐷𝑑4
)
2 notasi 𝐶𝑎,𝐶𝑏,𝐶𝑐,dan 𝐶𝑑 merupakan nilai vektor a,b,c,dan d pada Tabel
Derajat Pelanggaran sesuai dengan nilai fuzzifikasi pelanggarannya
notasi 𝐷𝑎, 𝐷𝑏, 𝐷𝑐, dan𝐷𝑑 merupakan nilai vector a,b,c,dan d pada TabelKepentingan sesuai dengan nilai kepentingan yang diberikan pakar.
Contoh: hasil conformance untuk atribut Skip Sequence adalah Baddan penilaian pakar 1 untuk atribut ini adalah Very Important
𝑃 =(0.1+0.2+0.3+0.4
4)+(
0.7+1+1+1
4)
2= 0.5875
Kemudian nilai penyesuaian tersebut difuzzifikasi berdasarkan fungsikeanggotaan Derajat Pelanggaran sehingga menjadi Between Fair & Good
Perhitunganbobot fraud dengan Fuzzy Set Multi Attribute Decision Making
Hasil penyesuaian Tabel Pelanggaran
Category Pakar 1 Pakar 2 Pakar 3 Pakar 4 Conformance
Skip Sequence
Between Fair & Good Bad
Skip Decision
Throughput Time Minimum
Throughput Time Maximum
Wrong Resource
Wrong Duty Sequence
Wrong Duty Decision
Wrong Duty Combine
Wrong Pattern
Wrong Decision
Selanjutnya hitung bobot untuk tiap atribut pelanggaranmenggunakan persamaan yang digunakan pada perhitunganbobot kepentingan.
Perhitunganbobot fraud dengan Fuzzy Set Multi Attribute Decision Making
Setelah menghitung bobot kepentingan dan bobot pelanggaran, langkah selanjutnya adalah menghitung final rating untukmenghitung bobot lower bound, middle1, middle 2, dan upper bound dengan menggunakan Persamaan :
𝐹𝑖𝑛𝑎𝑙𝑅𝑎𝑡𝑖𝑛𝑔 =1
𝑘𝑥[ 𝑆𝐶1𝑥𝑊𝐶1 +⋯+ 𝑆𝐶𝑛𝑥𝑊𝐶𝑛 ]
Kemudian dari final rating tersebut, diperoleh bobot fraud denganmenggunakan persamaan:
B𝑜𝑏𝑜𝑡𝐹𝑟𝑎𝑢𝑑 = 𝐹𝑟 𝐿𝐵 + 𝐹𝑟 𝑀1 + 𝐹𝑟 𝑀2 + 𝐹𝑟(𝑈𝐵)
Fuzzy Association Rule Learning
Data pelanggaran
beserta bobot
HitungProbabilitaspelanggaran
Hitung derajatkeanggotaanpelanggaran
Tiap Atributpelanggaran
dikelompokkanmenjadi:
-Low-Middle
-High
Nilai derajatkeanggotaan
digunakansebagai nilaifuzzy dalamproses fuzzy
ARL
Algoritma Apriori-Hitung nilai
support-Seleksi itemset
berdasarkanthreshold
Aturan asosiasi fraude.g Skip Sequence Low -> Fraud
Confidence = 0.9
Fuzzy Association Rule Learning
Tahap ini merupakan tahap training data pelanggaran untukmenghasilkan aturan asosiasi.
Persamaan menghitung probabilitas pelanggaran
𝑥 =𝐽𝑢𝑚𝑙𝑎ℎ 𝑃𝑒𝑙𝑎𝑛𝑔𝑔𝑎𝑟𝑎𝑛
𝐽𝑢𝑚𝑙𝑎ℎ 𝐸𝑣𝑒𝑛𝑡 𝑀𝑎𝑘𝑠𝑖𝑚𝑎𝑙 𝑦𝑎𝑛𝑔 𝑑𝑎𝑝𝑎𝑡 𝑑𝑖𝑙𝑎𝑛𝑔𝑔𝑎𝑟
Fungsi dan rumus keanggotaan pelanggaran
0
0.5
1
1.5
0 5 10 15 20 25 30 35 40 45
50 55 60 65 70 75 80 85
90 95
100
Deg
ree
Freq
Fungsi Keanggotaan Pelanggaran
Low Middle High
Fuzzy Association Rule Learning
Aturan asosiasi yang terbentuk digunakan untuk mendeteksifraud pada data testing.
Pengkategori menggunakan fungsi dan rumus keanggotaan Fraud
Nilai Fungsi Status Nilai Fungsi Status
a = 0.1 1 x<=a a = 0.1 0 x<a
b = 0.2 (b-x)/(b-a) a < x < b b = 0.2 (x-a)/(b-a) a <= x < b
0 x>=b c = 0.3 1 b <= x <= c
d = 0.4 (d-x)/(d-c) c < x < d
0 x >= d
Nilai Fungsi Status Nilai Fungsi Status
a = 0.3 0 x<a a=0.6 0 x<a
b = 0.4 (x-a)/(b-a) a <= x < b b = 0.7 (x-a)/(b-a) a <= x < b
c = 0.6 1 b <= x <= c 1 x >= b
d = 0.7 (d-x)/(d-c) c < x < d
0 x >= d
Fungsi membership Tidak Fraud Fungsi membership Semi Fraud
Fungsi membership Fraud Fungsi membership High
KombinasiPelanggaran
Aturanasosiasi
HasilDeteksi
Pelanggaran(Aturan,
Confidence)
Kategori Fraud:-Yakin Fraud
-Fraud-Semi Fraud-Tidak Fraud
Uji Coba Uji coba dilakukan terhadap 2 proses bisnis
Proses bisnis aplikasi kredit bank
Proses bisnis procurement ERP
Uji coba padaProses bisnisaplikasi kreditbank
Uji coba padaProses bisnisaplikasi kreditbank
Percobaan ini dilakukan pada data event logs dari studi kasusaplikasi kredit bank ini terdiri dari:
Data training sebanyak 130 case yang terdiri dari 100 case fraud dan30 case normal.
Data testing sebanyak 100 case yang terdiri dari 70 case fraud dan 30 case normal.
Uji coba padaProses bisnisaplikasi kreditbank
Perhitungan bobot pelanggaran
Aturan asosiasi
Tabel Hasil deteksi Fraud
Case Skip Throughput Time Wrong Wrong duty Wrong Wrong Fraudsequence
decision
Min Max resource Sequence
Decision
Combine
Pattern Decision
1 2 0 0 0 0 0 0 0 2 1 0.2334 0 0 0 0 0 2 0 0 0 0 0.0093 0 0 0 0 3 0 0 0 0 0 0.03285 0 0 0 0 0 0 2 0 0 0 0.0359 1 0 0 0 0 1 0 0 1 0 0.04966 0 0 0 0 1 0 0 1 0 0 0.05462 0 0 0 5 0 0 0 0 0 0 0.0821
ARL Support Confidence
SkipSL-Fraud 0.2152105 0.777869277
SkipDL-Fraud 0.093789 0.605090323
SkipDM-Fraud 0.1519425 0.690647727
SkipDH-Fraud 0.055 1
TminL-Fraud 0.254703778 0.90606087
TminM-Fraud 0.010785667 0.277345714
TmaxL-Fraud 0.192004167 0.817039007
TmaxM-Fraud 0.0449905 0.70419913
wResourceL-Fraud 0.205331222 0.865564871
Case Aturan Confidence bobot Kelas
1 Tidak Ada 0 0 Tidak Fraud
2 Tidak Ada 0 0 Tidak Fraud
11 TminL-Fraud 0.85907837 0.08095 Tidak Fraud
12 TminL-Fraud 0.85907837 0.08095 Tidak Fraud
24 wDutyDecL-Fraud 0.61327692 0.035 Tidak Fraud
25 wDutyDecL-Fraud 0.61327692 0.0328 Tidak Fraud
26wPatternL-
wDecisionL-Fraud1.41164615 0.2208 Yakin Fraud
27wPatternL-
wDecisionL-Fraud1.41164615 0.2112 Yakin Fraud
28wPatternL-
wDecisionL-Fraud1.41164615 0.2112 Yakin Fraud
29 wDecisionL-Fraud 0.41682898 0.1784 Fraud
30 wDecisionL-Fraud 0.41682898 0.1784 Fraud
34
SkipDL-
wPatternL-
wDecisionL-Fraud
0.36747989 0.4298 Semi Fraud
Pembentukanbantuan rule
Bantuan rule ini digunakan untuk menghasilkan rule untuk case yang normal
Hal ini digunakan untuk membantu sistem dalam mendeteksi case normal dengan baik
Case normal berupa: Case yang tidak terdapat pelanggaran
Case yang terdapat Cuma 1 jenis pelanggaran
Contoh: SkipSequenceLow -> Fraud , WrongDecision -> Fraud
Uji coba padaProses bisnisaplikasi kreditbank
Akurasi metode terhadap kasus aplikasi kredit bank tanpabantuan rule
Akurasi metode terhadap kasus aplikasi kredit bank denganbantuan rule
Min Confidence TP FP TN FN Accuracy
0.1 70 17 13 0 0.83
0.2 70 17 13 0 0.83
0.3 68 17 13 2 0.81
0.4 68 17 13 2 0.81
0.5 66 17 13 4 0.79
0.6 66 17 13 4 0.79
0.7 66 15 15 4 0.81
0.8 62 20 10 8 0.82
0.9 50 22 8 20 0.72
Min Confidence TP FP TN FN Accuracy
0.1 70 5 25 0 0.95
0.2 70 3 27 0 0.97
0.3 70 3 27 0 0.97
0.4 66 3 27 4 0.93
0.5 64 3 27 6 0.91
0.6 62 3 27 8 0.89
0.7 56 3 27 14 0.83
0.8 54 3 27 16 0.81
0.9 49 3 27 21 0.76
Uji coba padaProses bisnisprocurement ERP
Uji coba padaProses bisnisprocurement ERP
Percobaan ini dilakukan pada data event logs dari studi kasusprocurement ERP ini terdiri dari:
Data training sebanyak 100 case yang terdiri dari 70 case fraud dan30 case normal.
Data testing sebanyak 100 case yang terdiri dari 40 case fraud dan 60 case normal.
Uji coba padaProses bisnisprocurement ERP
Perhitungan bobot pelanggaran
Aturan asosiasi
Tabel Hasil deteksi Fraud
sequ
ence
decisi
on min max
seque
nce
decisi
on
combi
ne
1 0 0 0 0 0 0 0 0 0 0 0
2 0 0 0 0 0 0 0 0 0 0 0
11 0 0 1 0 0 0 0 0 0 0 0.081
12 0 0 0 1 0 0 0 0 0 0 0.06
21 0 0 0 0 0 2 0 0 0 0 0.006
22 0 0 0 0 0 0 1 0 0 0 0.035
Wrong Duty Wrong
Patter
n
Wrong
Decisio
n
FraudCase
Skip Throghput Wrong
resour
ce
ARL Support Confidence
SkipSL-Fraud 0.055998 0.36921868
SkipDL-Fraud 0.074731 0.62275833
TminL-Fraud 0.047079 0.40938502
TmaxL-Fraud 0.055466 0.40420202
SkipSL-wResourceL-Fraud 0.023112 1.02720247
SkipSL-wDutySecL-Fraud 0.020882 0.92807407
SkipSL-wDutyDecL-Fraud 0.029555 1.31354074
SkipSL-SkipDL-TmaxL-Fraud 0.011111 2
SkipSL-SkipDL-wResourceL-
Fraud0.005556 1
SkipSL-SkipDL-wDutySecL-Fraud 0.016667 3
SkipSL-SkipDL-wDutyDecL-
Fraud0.016667 3
SkipDL-TmaxL-wPatternL-
wDecisionL-Fraud0.022222 2
SkipDL-wDutyDecL-wPatternL-
wDecisionL-Fraud0.025 2.25
Case
Aturan Confidence bobot Kelas
1 Tidak Ada 0 0 Tidak Fraud
2 Tidak Ada 0 0 Tidak Fraud3 Tidak Ada 0 0 Tidak Fraud4 Tidak Ada 0 0 Tidak Fraud28 wDutySecL-Fraud 0.281262252 0.009 Tidak Fraud29 wDutyDecL-Fraud 0.259924528 0.035 Tidak Fraud30 wDecisionL-Fraud 0.436985882 0.1858 Tidak Fraud31 SkipSL-wPatternL-
Fraud2.474330864 0.0436 Yakin Fraud
32 SkipDL-wPatternL-wDecisionL-Fraud
9.66796 0.3934 Yakin Fraud
33 SkipSL-wPatternL-wDecisionL-Fraud
5.8772 0.31035 Yakin Fraud
98 SkipSL-wDutyDecL-wPatternL-wDecisionL-Fraud
2.30262 0.6905 Yakin Fraud
99 SkipSL-wDutyDecL-wPatternL-wDecisionL-Fraud
2.30262 0.6589 Yakin Fraud
100 SkipSL-wDutyDecL-wPatternL-wDecisionL-Fraud
2.30262 0.7169 Yakin Fraud
Uji coba padaProses bisnisprocurement ERP
Akurasi metode pada proses bisnis procurement ERP denganmenggunakan rule yang sama pada percobaan pada proses bisnisaplikasi kredit bank
Min
Confidence TP FP TN FN Accuracy
0.1 68 2 28 2 0.96
0.2 66 2 28 4 0.94
0.3 66 2 28 4 0.94
0.4 66 2 28 4 0.94
0.5 66 2 28 4 0.94
0.6 62 2 28 8 0.9
0.7 62 2 28 8 0.9
0.8 60 2 28 10 0.88
0.9 59 2 28 11 0.87
PengujianKegunaan
No. Pernyataan Pilihan jawaban
Sangat
setuju
Setuju Tidak
setuju
Sangat
tidak setuju
1 Menurut saya, plugin ini mudah
digunakan.
50 % 50%
2 Menurut saya, cukup mudah untuk
mengimpor event log ke dalam
aplikasi ProM dengan plugin ini.
80% 20%
3 Menurut saya, cukup mudah untuk
mengimpor model proses ke dalam
aplikasi ProM dengan plugin ini.
90% 10%
4 Menurut saya, cukup mudah dalam
mengkonversi event log ke event log
ontology
80% 20%
5 Menurut saya, cukup mudah dalam
melakukan setiap tahap
conformance checking dalam plugin
ini.
30% 70%
6 Menurut saya, cukup mudah untuk
memasukkan data penilaian pakar
dan nilai threshold ke dalam plugin.
70% 30%%
7 Menurut saya, cukup mudah untuk
melakukan pencarian aturan asosiasi
dan pendeteksian fraud.
40% 60%
8 Menurut saya, tabel hasil aturan
asosiasi mudah dibaca dan
dipahami.
50% 50%
9 Menurut saya, tabel hasil deteksi
fraud mudah dibaca dan dipahami.
70% 30%
10 Menurut saya, tampilan plugin ini
menarik dan mudah dipahami.
80% 20%
Kesimpulan
Untuk mendapatkan data pelanggaran yang terdapat pada event log dariproses bisnis yang berjalan dapat menggunakan konsep conformance checkingpada process mining yang memeriksa kesesuaian antara event log dan model proses bisnis standar yang dibantuk dengan konsep ontology dalampendeteksian kecurangan pada pengambilan keputusan.
Untuk dapat menghitung bobot dari pelanggaran yang dilakukan, dapatmenggunakan konsep fuzzy multi attribute decision making yang dapatmenghitung bobot fraud dari sisi subjektif dan objektif.
Dengan menggunakan fuzzy association rule learning dapat dihasilkan aturanasosiasi dari pelanggaran yang dilakukan dengan nilai confidence yang dapatmenjelaskan keparahan yang ditimbulkan oleh pelanggaran yang dilakukan.
Aturan asosiasi yang dihasilkan dapat digunakan untuk mendeteksi fraudpada proses bisnis berjalan dengan sangat baik dan akurat. Hal ini ditandaidengan nilai akurasi yang tinggi dari dua percobaan yang telah dilakukan.
Plugin berhasil melakukan perhitungan dan pendeteksian fraud serta mampumenampilkan hasil pendeteksian fraud ke dalam kategori fraud yang sesuai.
Untuk dapat memadukan hasil perhitungan dan pendeteksian fraud menjadiplugin ProM, digunakan plugin dasar bernama GettingStarted yang didapatdari repository ProM.
KelebihanMetode
Kelebihan metode fuzzy association rule learning dalam deteksifraud pada proses bisnis adalah dapat menghasilkan rule-rule yang dapat digunakan untuk mendeteksi kasus fraud pada proses bisnis dengan lebih baik
Ditunjukkan dengan hasil akurasi pendeteksian fraud denganrule/aturan yang dihasilkan sebesar.
Metode fuzzy arl lebih baik dari metode association rule karenadapat mendeteksi fraud dari intensitas/bobot yang rendah sampaiyang tinggi.
KelemahanMetode
Tergantung pada jumlah data training dan penentuan nilaithreshold
Aturan asosiasi yang dihasilkan hanya pada kasus fraud saja. Untuk kasus yang tidak fraud, tidak dapat dideteksi dengan baikdikarenakan tidak adanya rule untuk case yang tidak fraud
PendeteksianFraud DenganMetode ARL
Aturan asosiasi Support Confidence
SkipS-Fraud 0.55 1
SKipD-Fraud 0.35 1
Tmin-Fraud 0.45 1
Tmax-Fraud 0.45 1
Wresource-Fraud 0.3 1
wdecision-Fraud 0.25 1
SkipS-SkipD-Fraud 0.2 1
SkipS-Tmin-Fraud 0.2 1
SkipS-Tmax-Fraud 0.2 1
SkipD-Wdecision-Fraud 0.25 1
Case Aturan Confidence Status
1 SkipS-Tmin-Fraud 1 Fraud
2 SkipS-Tmax-Fraud 1 Fraud
3 SkipS-Fraud 1 Fraud
4 SkipS-Tmin-Fraud 1 Fraud
5 SkipS-Tmax-Fraud 1 Fraud
6 Tmin-Fraud 1 Fraud
7 Tmax-Fraud 1 Fraud
8 Tmax-Fraud 1 Fraud
9 Tmin-Fraud 1 Fraud
10 SkipS-Tmax-Fraud 1 Fraud
11 Tmax-Fraud 1 Fraud
12 SkipS-SkipD-Fraud 1 Fraud
13 Tidak ada 0Tidak Fraud
14 SkipS-Fraud 1 Fraud
15 wdecision-Fraud 1 Fraud
16 SkipD-Wdecision-Fraud 1 Fraud
17 SkipD-Wdecision-Fraud 1 Fraud
18 SkipD-Wdecision-Fraud 1 Fraud
19 SkipD-Wdecision-Fraud 1 Fraud
20 SkipD-Wdecision-Fraud 1 Fraud
PendeteksianFraud denganMetode Fuzzy ARL
Case Aturan Confidence bobot Kelas
1 Tidak Ada 0 0 Tidak Fraud
2 Tidak Ada 0 0 Tidak Fraud
11 TminL-Fraud 0.85907837 0.08095 Tidak Fraud
12 TminL-Fraud 0.85907837 0.08095 Tidak Fraud
24 wDutyDecL-Fraud 0.61327692 0.035 Tidak Fraud
25 wDutyDecL-Fraud 0.61327692 0.0328 Tidak Fraud
26wPatternL-
wDecisionL-Fraud1.41164615 0.2208 Yakin Fraud
27wPatternL-
wDecisionL-Fraud1.41164615 0.2112 Yakin Fraud
28wPatternL-
wDecisionL-Fraud1.41164615 0.2112 Yakin Fraud
29 wDecisionL-Fraud 0.41682898 0.1784 Fraud
30 wDecisionL-Fraud 0.41682898 0.1784 Fraud
34
SkipDL-
wPatternL-
wDecisionL-Fraud
0.36747989 0.4298 Semi Fraud
Saran
Penambahan jenis pelanggaran yang mungkin dapat terjadi padaproses bisnis yang berjalan. Hal ini dapat membuat pendeteksianfraud pada proses bisnis semakin kompleks.
Perlunya pendalaman dalam penentuan nilai threshold dalampembentukan aturan asosiasi dan penentuan batas kombinasiatribut pelanggaran untuk menghasilkan aturan asosiasi yang efektif.
Daftar Pustaka
R. Sarno, "Petri Net Model of ERP Business Process Variations for Small and Medium Enterprises," Journal of Theoretical and Applied Information Technology, vol. 54 No.1, pp. 31-38., 10th August 2013.
J. Stoop, "A case study on the theoretical and practical value of using process mining for the detection of fraudulent behavior in the procurement process," in Process Mining and Fraud Detection, Netherlands, Twente University, 2012.
R. D. Dewandono and R. Sarno, Process Sequence Mining For Fraud Detection Using Complex Event Processing, Surabaya, 2013.
"Report to the Nations on Occupational Fraud and Abuse," ACFE, 2012.
P. Goldman and H. Kaufman, Anti-Fraud Risk and Control Workbook, 2009.
W. v. d. Aalst, "Process Mining: Discovery, Conformance and Enhancement of Business Processes.," Springer, 2011.
W.v.d.Aalst and A.K.A. Medeiros, "Process Mining and Security: Detecting Anomalous Process Executions and Checking Process Conformance," Computer Science, vol. 121, pp. 3-21, 2005.
D. Sanchez, M. Vila, L. Cerda, and J. Serrano, "Association rules applied to credit card fraud detection," Expert Systems with Applications, 2009
Daftar Pustaka
E. Lundin, H. Kvarnstrom, and E. Jonsson, A Synthetic Fraud Data, ICICS, 2002.
"Surat Edaran Kepada Semua Bank Umum di Indonesia no.13/28/DPNP," Bank Indonesia, Jakarta, 2011.
M. Jans, N. Lybaert, K. Vanhoof, and J. M. van der Werf, "Business Process Mining for Internal Fraud Risk Reduction : Result of a Case Study".
M. Jans, N. Lybaert, K. Vanhoof, and J. M. van der Werf, "A business process mining application for internal transaction fraud mitigation," Expert Systems with Applications, vol. 38, pp. 13351-13359, 2011.
S. Huda, R. Sarno, T. Ahmad, and H. A. Santoso, "Identification of Process-based Fraud Patterns in Credit Application," 2013.
F. Ogwueleka, Data Mining Application in Credit Card Fraud Detection System, Nigeria: Department of Computer Science, University of Abuja, 2011.
A. Adriansyah, N. Sidorova, and B. F. v. Dongen, "Cost-Based Fitness in Conformance Checking," 2011.
N. Gehrke and M. Werner, "Process Mining," 2013.
M. P. Barreiros, A. Grillo, V. Cruz-Machado, and M. R. Cabrita, "Applying Fuzzy sets for ERP Systems Selection within the Construction Industry," 2010.
S. Gottwald, Universes of Fuzzy Sets and Axiomatizations of Fuzzy Set Theory, Springer: Studia Logica, 2006.
Daftar Pustaka
L. Helm, Fuzzy Association Rules An Implementation in R, Vienna: Vienna Univesityof Economics and Business Administration, 2007.
S. J. Chuu, A Fuzzy Multiple attributes Decision-Making for the Evaluation of Advanced Manufacturing Technology, Chungli, Taiwan: Department of Business Administration Nanya Institute of Technology.
M. Roubens, "Fuzzy sets and decision analysis," Fuzzy Sets and Systems, vol. 90, pp. 199-206, 1997.
F. Herrera, L. Martinez, and P.J. Sanchez, "Managing non-homogeneous," European Journal of Operational Research, vol. 166, pp. 115-132, 2005.
M. Delgado, "Mining Fuzzy Association Rules: An Overview," in BISC Conferece, 2003.
K.C.C. Chan and W. H. Au , "An Effective Algorithm for Discovering Fuzzy Rules in Relational Database," IEEE World Congress on Computational Intelligence, 1998.
T. P. Hong, C. S. Kuo, and S. C. Chi, "A Fuzzy Data Mining Algorithm for Quantitative Values," Knowledge-Based Intelligent Information Engineering Systems, 1999.
A. Gyenesei, "A Fuzzy Approach for Mining Quantitative Association Rules," Turku Centre for Computer Science Technical Reports, 2000.
W. v. d. Aalst, B. v. Dongen, C. Gunther, R. Mans, A. d. Medeiros, A. Rozinat, V. Rubin, M. Song, A. Weijters and H. Verbeek, "ProM 4.0 : comprehensive support for real process analysis," in 26th International Conference on Applications and Theory of Petri Nets, 2007.
R. Sarno, H. Ginardi, and E. W. Pamungkas, "Clustering of ERP Business Process Fragments," Surabaya, Indonesia, 2013.
Terima Kasih
Fuzzy Association Rule Learning
Dengan fungsi keanggotaan pelanggaran tersebut, dihitungderajat keanggotaan tiap atribut pelanggaran terhadap 3 kelaskeanggotaan low, middle dan high.
Nilai derajat keanggotaan digunakan sebagai nilai fuzzy dalamproses pencarian aturan asosiasi dengan fuzzy ARL
Fuzzy ARL menggunakan algoritma Apriori
Inti dari algoritma apriori adalah menghitung nilai support untuktiap itemset kemudian menyeleksi itemset berdasarkan thresholdyang ditentukan.
Aturan asosiasi yang diambil sebagai hasil dari tugas akhir iniadalah atribut pelanggaran yang berkombinasi dengan atributfraud untuk tiap n-itemset.
Contoh: Skip Sequence Low -> Fraud
Untuk tiap aturan yang dibentuk, nilai confidence digunakanuntuk menunjukkan besar pengaruh pelanggaran terhadap fraud.
ERP
ERP adalah sistem informasi yang diperuntukkan bagi perusahanmanufaktur maupun jasa yang berperan mengintegrasikan danmengotomasikan proses bisnis yang berhubungan dengan aspekoperasi, produksi maupun distribusi di perusahaan bersangkutan.
Atau dengan kata lain ERP digunakan untuk mengelola seluruhaktifitas perusahaan termasuk keuangan, produksi, HRD, marketing, supply chain, logistics, dll.
SAP adalah perusahaan yang memiliki pangsa pasar(marketshare) terbesar di dunia untuk software ERP.
PerhitunganBobotPelanggaran
Penilaian Bobot Fraud dengan Fuzzy set Decision Making.xlsx
HasilTraining Dan Testing
Hasil Training-Testing.xlsx
Training - procurementERP.xlsx