Shofyan G64134009Dibimbing oleh
Dr Imas Sukaesih Sitanggang, SSi MKom
Departemen Ilmu KompputerFakultas Ilmu Pengetahuan Alam dan MatematikaInstitut Pertanian Bogor 2015
Deteksi Pencilan Data Titik Api di Provinsi Riau Menggunakan
Algoritme Local Outlier Factor
• Latar Belakang• Penelitian Sebelumnya• Rumusan Masalah• Tujuan dan Manfaat• Ruang Lingkup• Metode• Lingkungan Pengembangan• Jadwal Penelitian• Daftar Pustaka
Why
How
Outline
2
Latar BelakangBadan National Penanggulangan
Bencana (BPBP)
1146 Riau Agustus 2013
Titik Panas
1252
Riau Agustus 2014
Titik Panas
3Sumber data: http://geospasial.bnpb.go.id/monitoring/hotspot/Satelit Terra modis nea
Sumber gambar : http://www.crisp.nus.edu.sg/browsedata/data_viewgmap.php?image_id=WV022014031103484280
• Baehaki D. 2014. Deteksi Pencilan Data Titik Panas Di Provinsi Riau Menggunakan Algoritme Clustering K-means [Skripsi]. Bogor(id): Insitut Pertanian Bogor.
• Cahyadarena M B. 2014. Deteksi Pencilan Pada Data Titik Panas Menggunakan Clustering Berbasis Medoids [Skripsi]. Bogor(id): Insitut Pertanian Bogor.
Penelitian Sebelumnya
4
• Bagaimana pencilan diidentifikasi dari data titik panas menggunakan metode local outlier factor dan informasi tentang karakteristik pencilan titik panas.
Rumusan Masalah
5
• Menentukan pencilan pada data titik panas di Provinsi Riau berdasarkan hasil algoritme local outlier factor data titik panas di Provinsi Riau.
• Analisis pencilan data titik panas yang dihasilkan berdasarkan aspek lokasi dan waktu.
Tujuan
6
Mengidentifikasi wilayah yang beresiko terjadi kebakaran hutan
Manfaat
7Sumber gambar:https://www.flickr.com/photos/gpsea/3813694681/in/album-72157621893775165/
Ruang Lingkup
8
Pencilan local Library DMwR package R
Ruang lingkup dari penelitian ini meliputi Pencilan yang dideteksi adalah pencilan lokal dan
Implementasi menggunakan library DMwR package R
Tahapan Penelitian
9
Deteksi pencilan titik panas
menggunakan algoritme local
outlier factor
Praproses data
Mulai Pengumpulandata titik panas
Visualisasi data
Selesai
Analisis pencilan
Pengumpulan Data Titik Panas
10
LATITUDE 2.0100000000
LONGITUDE 100.4560000000
BRIGHTNESS 314.4000000000
SCAN 1.0000000000
TRACK 1.0000000000
ACQ_DATE 1/7/2001
ACQ_TIME 0358
SATELLITE T
CONFIDENCE 61
VERSION 5.1
BRIGHT_T31 300.4000000000
FRP 10.3000000000
Januari 2001 – Maret 2015Source: https://
earthdata.nasa.gov/earth-observation-data/near-real-time/firms/active-fire-data
11
Praproses Data
13
LATITUDE 2.0100000000LONGITUDE 100.4560000000BRIGHTNESS 314.4000000000SCAN 1.0000000000TRACK 1.0000000000ACQ_DATE 1/7/2001ACQ_TIME 0358SATELLITE TCONFIDENCE 61VERSION 5.1BRIGHT_T31 300.4000000000FRP 10.3000000000
LATITUDE 2.0100000000
LONGITUDE 100.4560000000
ACQ_DATE 1/7/2001
• Membersihkan data titik api dari wilayah selain Provinsi Riau • Memilih atribut data titik api • Agregasi data
Deteksi Pencilan dengan Local Outlier Factor (Beunig 2000)
14
PencilanGlobal
Pencilan Local
Sebuah objek local outlier factor adalah rasio rataan dari o degan jarak k-ketetanggan lokal terdekat. Beunig (2000):
Local Outlier Factor (Beunig 2000)
15
reach-dist k (p, o) = max { k-distance(o), d(p, o) }.
dengank = jumlah
tetanggadistance = fungsi jaraklrd = local
reachability densityLOF = local outlier
factor
Visualisasi Data
16
Visualisasi dengan titik panas menggunakan pendekatan spasial
Sumber gambar:http://geospasial.bnpb.go.id/monitoring/hotspot/
Analisis Pencilan
17
Pencilan Local
• Ukuran Pemusatan Pencilan• Waktu Terjadinya Pencilan
Pada tahap ini diperlihatkan objek-objek pencilan dari data penelitian. Data hasil deteksi pencilan dianalisis untuk mengetahui informasi yang terdapat pada data
• Intel(R) Core(TM) i7-5500U 2.40GHz • RAM 12288 MB.
Lingkungan Pengembang
18
Kegiatan Tahun 20154 5 6 7 8 9 10 11 12
Penyusunan proposal Pengumpulan data Praproses data Kolokium Implementasi Local outlier factor Evaluasi hasil penelitian Penyusunan skripsi dan makalah seminar Seminar Sidang tugas akhir Revisi Skripsi dan penyelesaian Lulus (SKL)
Jadwal Penelitian
19
Daftar Pustaka
20
Baehaki D. 2014. Deteksi pencilan data titik panas di provinsi Riau menggunakan algoritme clustering K-Means [skripsi]. Bogor(ID): Insitut Pertanian Bogor.
Beunig Markus M, Kriegel Hans-Peter, Ng Raymond T, Sander J. 2000. LOF: Identifying Density-Based Local Outliers. ACM SIGMOD international conference on Management of data; 2, June 2000; New York, USA. New York (USA): ACM SIGMOD Volume 29 Issue Pages 93-104
Cahyadarena M B.2014. Deteksi Pencilan Pada Data Titik Panas Menggunakan Clustering Berbasis Medoids [skripsi]. Bogor(ID): Insitut Pertanian Bogor.
Terima [email protected]
Frequent Answer Question
21
• Bagaimana cara kerja algoritme LOF dengan data set kecil? (12 slide) • Kenapa Menggunakan library R, Tidak
membuat dari awal? (1 slide)• Data mengapa menggunakan algoritme Local
Outlier Factor? (2 slide)• Kenapa harus menggunakan analisis deteksi
pencilan? (1 sllide)• Apa itu titik panas? (1 slide)• Apa dampak kebakaran hutan? (1 slide)
GO
GO
GO
GO
GO
GO
Algoritme LOF dengan data set kecil
22
Data 4 data titik:a(0, 0), b(0, 1), c(1, 1), d(3, 0)
Hitung LOF untuk setiap titik dan tunjukkan 1 outlier teratas, dengan k = 2 dan fungsi jarak Manhattan
Langkah 1: menghitung semua jarak antara masing-masing dua titik data
23
a(0, 0), b(0, 1), c(1, 1), d(3, 0)
dist(a, b) = 1dist(a, c) = 2dist(a, d) = 3dist(b, c) = 1dist(b, d) = 3+1=4dist(c, d) = 2+1=3
Langkah 2: menghitung semua dist2 (o)
24
dist k (o): jarak antara o dan yang k-thNN (tetangga terdekat k-th)
dist2 (a) = dist (a, c) = 2 (c = ke-2 tetangga terdekat)
dist2 (b) = dist (b, a) = 1 (a / c ke-2 tetangga terdekat)
dist2 (c) = dist (c, a) = 2 (a ke-2 tetangga terdekat)
dist2 (d) = dist (d, a) = 3 (a / c ke-2 tetangga terdekat)
Langkah 3: menghitung semua Nk (o)
25
N2 (a) = {b, c}
N2 (b) = {a, c}
N2 (c) = {b, a}
N2 (d) = {a, c}
k-distance neighborhood dari o, N k (o) = {o’| o’ in D, dist(o, o’) ≤ dist k (o)}
Langkah 4: menghitung semua lrdk (o)
26
reach-dist k (p, o) = max { k-distance(o), d(p, o) }
Langkah 4: menghitung semua lrdk (o)
27
reach-distk (p, o) = max { k-distance(o), d(p, o) }
| Nk (o) | = jumlah anggota pada Nk (o)Contoh N2 (a) = {b, c} = 2
Langkah 4: menghitung semua lrdk (o)
28
reach-distk (p, o) = max { k-distance(o), d(p, o) }
=0.667
reachdist2 (b, a) = max{dist2(b), dist(b, a)} = max{1, 1} = 1reachdist2 (c, a) = max{dist2(c), dist(c, a)} = max{2, 2} = 2
Langkah 4: menghitung semua lrdk (o)
29
=0.5
=0.667
=0.33
Lakukan juga terhadap titik yang lain
Langkah 5: menghitung semua LOFk (o)
30
=0.5
=0.667
=0.33
Lakukan juga terhadap titik yang lain
Langkah 5: menghitung semua LOFk (o)
31
x
Langkah 5: menghitung semua LOFk (o)
32
LOF 2 (a) = (lrd 2 (b) + lrd 2 (c)) * ( reachdist 2 (a,b) + reachdist 2 (a,c)) = (0.5+0.667) * (1+2) = 3.501
LOF 2 (b) = (lrd 2 (a) + lrd 2 (c)) * ( reachdist 2 (b,a) + reachdist 2 (b,c)) = (0.667+0.667) * (2+2) = 5.336
LOF 2 (c) = (lrd 2 (b) + lrd 2 (a)) * ( reachdist 2 (c,b) + reachdist 2 (c,a)) = (0.5+0.667) * (1+2) = 3.501
LOF 2 (d) = (lrd 2 (a) + lrd 2 (c)) * ( reachdist 2 (d,a) + reachdist 2 (d,c)) = (0.667+0.667) * (3+3) = 8.004
Langkah 6: Urutkan semua LOFk (o)
33
LOF2(d) = 8.004LOF2(b) = 5.336LOF2 (a) = 3.501LOF2 (c) = 3.501
Data 4 data titik:a(0, 0), b(0, 1), c(1, 1), d(3, 0)Outlier teratas adalah titik d.
Back to list FAQ
Mengapa Menggunakan R ?
33
• R Gratis :open-source project
• R adalah bahasa. : experimentation and exploration
• Graphics dan data visualization
• Access to powerful :Akademisi Terkemuka dan peneliti
dari seluruh dunia menggunakan R. Lebih dari 2000
packages yang memperluas library R
• A robust, community yang ramai
• R is excellent for "mash-ups" : Mysql,Apache web
server, Google API, Quatum GIS, Postgres
Back to list FAQ
Mengapa Menggunakan LOF ?
34
• Baehaki D. 2014. Deteksi Pencilan Data Titik Panas Di Provinsi Riau Menggunakan Algoritme Clustering K-means [Skripsi]. Bogor(id): Insitut Pertanian Bogor.
• Cahyadarena M B. 2014. Deteksi Pencilan Pada Data Titik Panas Menggunakan Clustering Berbasis Medoids [Skripsi]. Bogor(id): Insitut Pertanian Bogor.
• Risti. 2015 . 2014. Deteksi Pencilan Pada Data Titik Panas Menggunakan DB Scan [Skripsi]. Bogor(id): Insitut Pertanian Bogor. (Masih Proses)
• SUCI A M Y A .2015. Aplikasi Berbasis Web untuk Mendeteksi Pencilan Titik PanasMenggunakan Algoritme Clustering K-Means dan Framework Shiny. [Skripsi]. Bogor(id): Insitut Pertanian Bogor. (Masih Proses)
Back to list FAQ
Mengapa Menggunakan LOF ?
35Sumber gambar:https://upload.wikimedia.org/wikipedia/commons/4/4e/LOF-idea.svg
• Ide dasar dari LOF: membandingkan kepadatan lokal titik dengan kepadatan tetangganya. A memiliki kepadatan yang jauh lebih rendah dibandingkan tetangganya.
Back to list FAQ
Kenapa menggunakan analisis pencilan?
36
• Agar segera diselidiki sumber titik panas, apakah berbahaya atau tidak
• Karena jika pencilan itu adalah Kebakaran, harus diselidiki lagi kenapa terjadi kebakaran di daerah tersebut
• Mencegah terjadinya kebakaran berdasarkan karakteristik pencilan titik panas.
Back to list FAQ
Apa itu titik panas?
36
• Titik panas merupakan suatu daerah di permukaan bumi yang memiliki suhu relatif lebih tinggi dibandingkan daerah di sekitarnya berdasarkan ambang batas suhu tertentu (Suwarsono et al 2013).
• Ambang batas yang digunakan oleh Kementrian Kehutanan dan Japan International Cooperation Agency untuk data titik panas satelit NOAA adalah 315o K atau 42o C (Guswanto dan Heriyanto 2009).
Guswanto, Heriyanto E. 2009. Operational Weather System for National Fire Danger Rating. Jurnal Meteorologi dan Geofisika. 10(2): 77-87
Suwarsono, Rokhmatuloh, Waryono T. 2013. Pengembangan ModelIdentifikasi Daerah Bekas Kebakaran Hutan dan Lahan (Burned Area) Menggunakan Citra MODIS di Kalimantan [Model Development of Burned
Area Identification Using MODIS Imagery in Kalimantan]. Jurnal Penginderaan Jauh. 10(2): 93-112.
Back to list FAQ
Apa dampak kebakaran hutan?
36
Menurut Sri Lestari S .2000. Dampak Dan Antisipasi Kebakaran Hutan . Jurnal Teknologi Lingkungan. 1(2) :171-175.
• Polusi Udara • Konsentrasi Debu meningkat antara 300 % hingga 700 %• Jarak Pandang (Visibility)• Penurunan Intensitas Curah Hujan.
Menurut Rasyid F .2014.Permasalahan dan Dampak Kebakaran Hutan.Jurnal Lingkar Widyaiswara. 1(4: 47-49
• kerugian antara US $ 2,84 - US $ 4,86 milyar • Berbagai jenis kayu kini telah menjadi langka. Kayu eboni
(Dyospyros ebenum dan D. celebica), kayu ulin (Eusyderoxylon zwageri), ramin (Gonystylus bancanus), dan beberapa jenis meranti (Shorea spp.)
Back to list FAQ
Top Related