PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19....

14
Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP “Manajemen Bencana di Era Revolusi Industri 5.0” ISBN 978-602-6697-38-7 Purwokerto, 10 Agustus 2019 212 PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS POLRESTABES SURABAYA Studi Kasus: Data Kecelakaan Lalu Lintas Polrestabes Surabaya Tahun 2018 Wahyu Rizky Nur Syamsi 1) dan Jaka Nugraha 2) 1,2) Program Studi Statistika Universitas Islam Indonesia Email: 1) [email protected], 2*) [email protected] ABSTRAK Kecelakaan merupakan suatu peristiwa yang tidak disengaja serta bersifat multi faktor yang selalu didahului oleh situasi dimana seorang atau lebih pemakai jalan telah gagal mengatasi lingkungan mereka. Kecelakaan yang masih sering terabaikan dan tidak dapat dihindari salah satunya adalah kecelakaan lalu lintas. Kota Surabaya sebagai salah satu kota besar di Indonesia, memiliki tingkat kecelakaan lalu lintas yang cukup tinggi. Jumlah kecelakaan terus mengalami peningkatan setiap tahunnya oleh karena itu perlu dilakukan upaya untuk memprediksi tingkat kecelakaan tersebut. Perlu dilakukan analisis untuk mengetahui karakteristik korban kecelakaan lalu lintas. Makalah ini membahas pengklasifikasian tingkat luka korban kecelakaan lalu lintas menggunakan metode CHAID (ChiSquare Automatic Interaction Detection). Metode CHAID umumnya dikenal sebagai metode pohon klasifikasi (Classification Tree Method). Inti dari metode ini adalah membagi data menjadi kelompok-kelompok yang lebih kecil berdasarkan keterkaitan antara variabel terikat dengan variabel bebas. Hasil metode CHAID membentuk pohon klasifikasi tingkat luka korban kecelakaan lalu lintas yang menunjukkan bahwa seluruh variabel independen signifikan terhadap variabel dependen, dimana variabel independennya terdiri dari variabel jenis hari terjadinya kecelakaan lalu lintas, waktu terjadinya kecelakaan lalu lintas, jenis kecelakaan yang terjadi, kendaraan yang terlibat dalam kecelakaan lalu lintas, usia korban kecelakaan lalu lintas, profesi korban kecelakaan lalu lintas, dan jenis kelamin korban kecelakaan lalu lintas. Menurut tingkat akurasi yang dihasilkan metode CHAID menunjukkan bahwa klasifikasi yang terbentuk dengan persentase data training 80% dan data testing 20% diperoleh tingkat akurasi sebesar 86,3%. Kata kunci: Kecelakaan lalu lintas, Pohon Klasifikasi, CHAID PENDAHULUAN Menurut Badan Kesehatan Dunia (WHO) dalam Suma’mur (2009), kecelakaan sebagai suatu kejadian yang tidak dapat dipersiapkan penanggulangan sebelumnya sehingga menghasilkan cedera yang riil. Kecelakaan yang masih sering terabaikan dan tidak dapat dihindari salah satunya adalah kecelakaan lalu lintas. Berdasarkan Undang- undang Nomor 22 Tahun 2009 tentang Lalu Lintas dan Angkutan Jalan, mengungkapkan kecelakaan lalu lintas adalah suatu peristiwa di jalan yang tidak diduga dan tidak disengaja yang melibatkan kendaraan dengan atau tanpa pengguna jalan lain yang mengakibatkan korban manusia dan/atau kerugian harta benda.

Transcript of PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19....

Page 1: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

212

PENERAPAN METODE CHAID MENGGUNAKAN SMOTE

DALAM KLASIFIKASI TINGKAT LUKA KORBAN

KECELAKAAN LALU LINTAS POLRESTABES SURABAYA Studi Kasus: Data Kecelakaan Lalu Lintas Polrestabes Surabaya

Tahun 2018

Wahyu Rizky Nur Syamsi1) dan Jaka Nugraha2)

1,2)Program Studi Statistika Universitas Islam Indonesia

Email: 1)[email protected], 2*)[email protected]

ABSTRAK

Kecelakaan merupakan suatu peristiwa yang tidak disengaja serta bersifat multi

faktor yang selalu didahului oleh situasi dimana seorang atau lebih pemakai jalan telah

gagal mengatasi lingkungan mereka. Kecelakaan yang masih sering terabaikan dan tidak

dapat dihindari salah satunya adalah kecelakaan lalu lintas. Kota Surabaya sebagai salah

satu kota besar di Indonesia, memiliki tingkat kecelakaan lalu lintas yang cukup tinggi.

Jumlah kecelakaan terus mengalami peningkatan setiap tahunnya oleh karena itu perlu

dilakukan upaya untuk memprediksi tingkat kecelakaan tersebut. Perlu dilakukan analisis

untuk mengetahui karakteristik korban kecelakaan lalu lintas. Makalah ini membahas

pengklasifikasian tingkat luka korban kecelakaan lalu lintas menggunakan metode

CHAID (Chi–Square Automatic Interaction Detection). Metode CHAID umumnya

dikenal sebagai metode pohon klasifikasi (Classification Tree Method). Inti dari metode

ini adalah membagi data menjadi kelompok-kelompok yang lebih kecil berdasarkan

keterkaitan antara variabel terikat dengan variabel bebas. Hasil metode CHAID

membentuk pohon klasifikasi tingkat luka korban kecelakaan lalu lintas yang

menunjukkan bahwa seluruh variabel independen signifikan terhadap variabel dependen,

dimana variabel independennya terdiri dari variabel jenis hari terjadinya kecelakaan lalu

lintas, waktu terjadinya kecelakaan lalu lintas, jenis kecelakaan yang terjadi, kendaraan

yang terlibat dalam kecelakaan lalu lintas, usia korban kecelakaan lalu lintas, profesi

korban kecelakaan lalu lintas, dan jenis kelamin korban kecelakaan lalu lintas. Menurut

tingkat akurasi yang dihasilkan metode CHAID menunjukkan bahwa klasifikasi yang

terbentuk dengan persentase data training 80% dan data testing 20% diperoleh tingkat

akurasi sebesar 86,3%.

Kata kunci: Kecelakaan lalu lintas, Pohon Klasifikasi, CHAID

PENDAHULUAN

Menurut Badan Kesehatan Dunia (WHO) dalam Suma’mur (2009), kecelakaan

sebagai suatu kejadian yang tidak dapat dipersiapkan penanggulangan sebelumnya

sehingga menghasilkan cedera yang riil. Kecelakaan yang masih sering terabaikan dan

tidak dapat dihindari salah satunya adalah kecelakaan lalu lintas. Berdasarkan Undang-

undang Nomor 22 Tahun 2009 tentang Lalu Lintas dan Angkutan Jalan, mengungkapkan

kecelakaan lalu lintas adalah suatu peristiwa di jalan yang tidak diduga dan tidak

disengaja yang melibatkan kendaraan dengan atau tanpa pengguna jalan lain yang

mengakibatkan korban manusia dan/atau kerugian harta benda.

Page 2: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

213

Berdasarkan WHO pada tahun 2013 ada 1,25 juta orang meninggal karena

kecelakaan lalu lintas, hal ini menunjukan bahwa setiap satu orang terbunuh setiap 25

detik. Berdasarkan Data Badan Pusat Statistik (BPS) disebutkan pada tahun 2015, jumlah

kecelakaan lalu lintas mencapai 98,9 ribu kasus. Angka tersebut meningkat 3,19 persen

dibandingkan tahun sebelumnya yang mencapai 95,5 ribu kasus. Indonesia berada di

peringkat ketiga di Asia di bawah Tiongkok dan India dengan total 38.279 total kematian

akibat kecelakaan lalu lintas di tahun 2015. Berdasarkan data Indonesia menduduki

peringkat ketiga tetapi dilihat dari presentase statistik dari jumlah populasi, Indonesia

berada di peringkat pertama dengan angka kematian 0,015 persen dari jumlah populasi di

bawah Tiongkok dengan presentase 0,018 persen dan India 0,017 persen. (Situmorang,

2016). Kota Surabaya sebagai salah satu kota besar di Indonesia, memiliki tingkat

kecelakaan lalu lintas yang cukup tinggi. Dari data Polda Jatim menunjukkan bahwa

selama triwulan I tahun 2010, jumlah kecelakaan di Kota Surabaya berada pada peringkat

kelima di Jawa Timur (Afidah & Susilaningrum, 2011).

Kendaraan bukan hanyak sebagai transportasi yang dapat memindahkan suatu objek

dari satu tempat ke tempat yang lain, tetapi kendaraan juga memudahkan manusia dalam

melakukan sehari-hari sehingga manusia tidak akan pernah lepas sebagai pengguna jalan.

Dibalik manfaat kendaraan bagi masyarakat, terdapat juga berbagai permasalahan yang

berkaitan dengan penggunaan jalan raya. Banyaknya pengguna jalan raya setiap hari

sehingga tidak mungkin luput dari permasalahan lalu lintas. Banyaknya korban

kecelakaan lalu lintas ini terjadi karena faktor manusianya sendiri, baik itu pengendara

atau pengguna jalan yang tidak berhati-hati dalam berlalu lintas dan disebabkan

kendaraan yang sebenarnya sudah tidak layak beroperasional, dan juga karena faktor

cuaca. Apabila masalah kecelakaan di jalan raya tidak diperhatikan dengan baik maka

dikhawatirkan akan terjadi peningkatan jumlah korban kecelakaan dari tahun ke tahun.

Dari permasalah kecelakaan lalu lintas tersebut diperlukan analisis tingkat kecelakaan

lalu lintas yang diharapkan dapat memberikan informasi sehingga mengurangi resiko

kecelakaan lalu lintas dan juga dapat menghindari kerugian baik terhadap korban maupun

masyarakat sekitar. Dengan ini menganalisis permasalahan tersebut yaitu dengan

mengklasifikasikan faktor-faktor yang mengakibatkan terjadinya kecelakaan lalu lintas.

Fikri (2018) telah mengaplikasikan Metode Chi-Squared Automatic Interaction Detection

(CHAID) dengan Synthetic Minority Oversampling Technique (SMOTE).

Menurut Hamakonda & Tairas (1991) dalam Milana & Abadyo (2013) klasifikasi

adalah pengelompokkan yang sistematis pada sejumlah objek, gagasan, buku atau benda-

benda lain ke dalam kelas atau golongan tertentu berdasarkan ciri-ciri yang sama.

Menurut Steyn & Stumph (1986) dalam Milana & Abadyo (2013) Salah satu metode

yang menggunakan teknik klasifikasi yaitu metode CHAID Metode CHAID umumnya

dikenal sebagai metode pohon klasifikasi (Classification Tree Method). Inti dari metode

ini adalah membagi data menjadi kelompok-kelompok yang lebih kecil berdasarkan

keterkaitan antara variabel terikat dengan variabel bebas. Analisis CHAID digunakan

ketika data yang dipakai adalah data dengan variabel-variabel kategorik. Metode CHAID

hanya efektif bila diterapkan pada data dengan pengamatan yang banyak. Metode ini

nantinya akan menghasilkan output berupa pohon klasifikasi yang akan mudah di

interpretasikan karena peneliti dapat melihat langsung bagaimana proses pemisahan dan

penggabungan variabel independen.

Page 3: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

214

Metode CHAID sudah lazim digunakan pada masalah pengklasifikasian diberbagai

bidang. Permana (2011) telah melakukan klasifikasi Alumni S1 FMIPA UNY dengan

Metode CHAID. Metode CHAID dianggap lebih unggul dibandingkan dengan regresi

logistik biner karena CHAID dapat membagi alumni menjadi beberapa segmen,

sedangkan regresi logistik biner hanya mengklasifikasikan alumni menjadi kategori lulus

tepat waktu dan tidak tepat waktu. Menurut Kunto (2006) juga telah berhasil menerapkan

analisis CHAID untuk segmentasi pasar.

METODE PENELITIAN

Data diperoleh dari Data Kecelakaan Kerja Lalu Lintas Polrestabes Surabaya tahun

2018. Variabel yang digunakan adalah jenis hari terjadinya kecelakaan lalu lintas, waktu

kejadian kecelakaan lalu lintas, jenis kecelakaan lalu lintas, kendaraan yang terlibat dalam

kecelakaan lalu lintas, usia korban kecelakaan lalu lintas, profesi korban kecelakaan lalu

lintas, jenis kelamin korban kecelakaan lalu lintas, dan tingkat luka kecelakaan lalu lintas.

Rincian kategori dari masing-masing variabel dapat dilihat pada Tabel 1.

Tabel 1. Tabulasi Kategori Setiap Variabel

Variabel Kategori

Tingkat Luka Korban (1) LR; (2) LB; (3)MD

Keterangan : LR = luka ringan, LB = luka berat, MD=meninggal

dunia.

Jenis Hari (1) Hari kerja; (2) Hari libur; (3) Akhir minggu

Waktu Kecelakaan (1) dini hari; (2) pagi hari; (3) siang hari; (4) malam hari

Jenis Kecelakaan (1) depan samping; (2) depan belakang;

(3) menabrak penyeberang jalan; (4) depan depan; (5) beruntun;

(6) sendiri

Kendaraan Terlibat (1) spm-spm; (2) spm-mbl; (3) spm; (4) spm-bus/truk; (5) spd-spm;

(6) mbl; (7) bus/truk-bus/truk (8) mbl-mbl; (9) spd-mbl;

(10) mbl-bus/truk; (11) bus/truk.

Keterangan : spm = sepeda motor, mbl = mobil,

Usia Korban (1)balita kanak-kanak; (2) remaja; (3) dewasa; (4) lansia; (5)manula

Profesi Korban (1)wiraswasta/wirausaha; (2) pelajar/mahasiswa; (3) PNS

TNI/POLRI; (4) lain-lain

Jenis Kelamin (1)Laki-laki; (2)perempuan

Page 4: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

215

HASIL DAN PEMBAHASAN

Analisis data dan pembuatan pohon klasifikasi menggunakan software SPSS dan

Sipina.

1. Analisis CHAID CHAID merupakan salah satu teknik klasifikasi dengan melibatkan beberapa

variabel kategorik dan salah satu variabelnya ditetapkan sebagai variabel independen

dan yang lainnya sebagai variabel independen. Alat utama dalam metode CHAID

adalah statistik Chi-Square. Hipotesis untuk uji independensi adalah

H0 : Faktor baris dan Faktor kolom saling independen

H1 : Faktor baris dan Faktor kolom tidak saling independen

Terdapat dua statistik uji yang berdistribusi Chi-Kuadrat yaitu Pearson Chi-

Kuadrat (2) dan likelihood ratio Chi-Kuadrat (G2) (Nugraha, 2014). Statistik uji Chi-

Square sebagai berikut (Agresti, 2002)

(1)

2 berdistribusi Chi-square dengan derajat bebas : (r-1)(c-1). adalah

observasi baris ke-i dan kolom ke-j. adalah frekuensi harapan baris ke-i dan

kolom ke-j. ri adalah baris ke-i untuk i=1,2,…,c dan cj adalah kolom ke-j untuk

j=1,2,…,c. Total observasi sebanyan n.

CHAID merupakan suatu teknik iteratif yang menguji satu-persatu variabel

independen yang digunakan dalam klasifikasi, dan menyusunnya berdasarkan pada

tingkat signifikansi statistik Chi-Square terhadap variabel dependennya. (Gallagher,

2000). CHAID akan membedakan variabel variabel independennya menjadi tiga

bentuk yang berbeda, yaitu monotonic, bebas dan mengambang (floting). Menurut

Magidson yang dikutip oleh Bagozzi (1994) dalam Kunto (2006), menerangkan

bahwa langkah-langkah analisis CHAID secara garis besar dapat dibagi menjadi tiga

tahap, yaitu Penggabungan, Pemisahan dan Penghentian. Penggabungan adalah

proses pengabungan level kategori yang tidak signifikan dari hasil pengujian

menggunakan statistik Chi-square. Pemisahan adalah proses pembagian kelompok

menggunakan variable independen yang dimulai dari varibel paling signifikan (p-

value paling kecil). Penghentian adalah tahap penghentian proses pemisahan ketika

semua sub kelompok telah dianalisis dan juga telah berisi pengamatan-pengamatan

dengan jumlah yang terlalu sedikit. Skema proses metode CHAID dengan urutan

analisis sebagaimana pada Gambar 1.

Page 5: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

216

Gambar 1 Diagram Alir Algoritma CHAID

2. Koreksi Bonferroni (Bonferroni Correction) Koreksi Bonferroni adalah suatu proses koreksi yang digunakan ketika beberapa

uji statistik untuk kebebasan atau ketidakbebasan dilakukan secara bersamaan (Sharp

et al., 2002 dalam Kunto, 2006). Koreksi Bonferroni biasanya digunakan dalam

pembandingan berganda.

Ketika terdapat sebanyak M uji perbandingan yang sudah dikatakan bebas satu

sama lain, peluang untuk melakukan kesalahan tipe 1 atau α (dalam satu atau lebih

uji-uji tersebut), akan sama dengan 1 dikurangi peluang untuk tidak melakukan

kesalahan tipe 1 dalam uji-uji tersebut, di mana nilainya akan lebih besar dari α yang

telah ditentukan. Secara umum, hal tersebut dapat dirumuskan sebagai berikut

(Bagozzi, 1994) dalam (Kunto, 2006):

Page 6: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

217

(2)

dengan M : pengali Bonferroni dan α :salah tipe 1.

Pengali Bonferroni untuk masing-masing tipe variabel variabel independen

adalah berbeda. Gallagher (2000) menyebutkan bahwa pengali Bonferroni untuk

masing-masing jenis variabel variabel independen adalah sebagai berikut:

a. Variabel Independen Monotonik

M = (3)

b. Variabel Independen Bebas

M = (4)

c. Variabel Independen Mengambang (Floating)

M = (5)

dengan M : pengali Bonferroni, c : banyaknya kategori asal, r : banyaknya kategori

baru dan i : kategori baru ke-i.

3. Evaluasi Klasifikasi

Jika metode CHAID digunakan untuk mengklasifikasikan data observasi, maka

perlu diuji keakuratan metode CHAID dalam mengklasifikasikan observasi yang

berasal dari sampel lain. Ketepatan hasil klasifikasi dapat dihitung dari nilai akurasi

yang didefinisikan sebagai porsentase dari observasi yang benar dalam

pengklasifikasian terhadap jumlah total observasi. Cara menghitung nilai akurasi

adalah sebagai berikut :

(6)

4. Tahap Penggabungan

Tahap penggabungan dilakukan menggunakan uji independensi chi-square

terhadap variabel jenis hari, waktu kecelakaan, jenis kecelakaan, kendaraan terlibat,

usia korban, profesi korban, dan jenis kelamin yang sudah di kategorikan. Tahapan

ini menghasilkan nilai chi-square dan p-value pada yang ditunjukkan dalam Tabel 2.

Page 7: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

218

Tabel 2. nilai Chi-square dan p-value

variabel independen terhadap variabel dependen

Variabel Independen Kategori Chi-Square P-value

Jenis Hari {1;3} dan 2 14,602 0,006

Waktu Kecelakaan 1, {2;3}, dan 4 80,581 0,000

Jenis Kecelakaan {1;4}, 2, 3, 5, dan 6 309,593 0,000

Kendaraan Terlibat {1;5}, {2;{8;10}},

{3;9}, 4, {6;11}, dan 7 376,042 0,000

Usia Korban {1;{2;3}} dan {4;5} 50,491 0,000

Profesi Korban {1;4}, 2, dan 3 22,505 0,001

Jenis Kelamin 1 dan 2 39,738 0,000

Berdasarkan Tabel 2 untuk p-value dikalikan dengan koreksi Bonferroni jenis

bebas karena variabel data kecelakaan lalu lintas termasuk data nominal. Hasil

perhitungan koreksi Bonferroni setiap variabel independen ditunjukkan dalam Tabel

3.

Tabel 3. Koreksi Bonferroni pada Variabel Independen

Variabel Koreksi Bonferroni Hasil

Jenis Hari

3

Waktu Kecelakaan

6

Jenis kecelakaan

15

Kendaraan Terlibat

179487

Usia Korban

25

Profesi Korban

6

Jenis Kelamin

1

Hasil dari perhitungan koreksi Bonferroni masing-masing variabel Independen

dikalikan dengan p-value dari masing-masing variabel independen sehingga diperoleh

p-value terkoreksi Bonferroni. Hasil p-value terkoreksi Bonferroni masing-masing

variabel ditampilkan dalam Tabel 3.

Page 8: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

219

5. Tahap Pemisahan

Pada tahap pemisahan, simpul akan dipisah menggunakan sebuah variabel

independen. Simpul ini akan dibagi menjadi beberapa bagian berdasarkan kategori

variabel independen pemisah simpul. Pada bagian ini akan dijelaskan tahap

pemisahan dari root node. Uji Chi-Square yang akan digunakan dalam menentukan

variabel independen pemisah simpul, tentunya variabel independen yang memiliki

nilai Chi-Square terbesar dan signifikan terhadap variabel dependen. Hasil uji Chi-

Square dari setiap variabel independen terhadap variabel dependen dapat dilihat pada

Tabel 4.

Tabel 4. Nilai chi-square dan p-value

variabel independen terhadap variabel dependen

Variabel

Independen

Kategori Chi-Square P-value

Jenis Hari {1;3} dan 2 14,602 0,018

Waktu Kecelakaan 1, {2;3}, dan 4 80,581 0,000

Jenis Kecelakaan {1;4}, 2, 3, 5, dan

6

309,593 0,000

Kendaraan Terlibat {1;5}, {2;{8;10}},

{3;9}, 4, {6;11},

dan 7

376,042 0,000

Usia Korban {1;{2;3}} dan

{4;5}

50,491 0,000

Profesi Korban {1;4}, 2, dan 3 22,505 0,006

Jenis Kelamin 1 dan 2 39,738 0,000

*(p-value terkoreksi Bonferroni)

Berdasarkan Tabel 4 nilai uji Chi-Square terbesar terdapat pada variabel

kendaraan terlibat dan p-value variabel kendaraan terlibat kurang dari taraf

signifikansi, sehingga variabel kendaraan terlibat digunakan sebagai variabel pemisah

pada root node. Pembentukan diagram pohon dihentikan karena memenuhi satu atau

lebih kriteria penghentian.

6. Klasifikasi CHAID

Analisis dalam penelitian ini adalah metode CHAID. Dalam metode CHAID ini,

selain menggunakan aplikasi SPSS dan Microsoft excel, penelitian ini juga

menggunakan aplikasi Sipina yang akan memberi output berupa diagram pohon

klasifikasi dari data kecelakaan lalu lintas di kota Surabaya tahun 2018. Diagram

pohon hasil analisis CHAID samapai kedalam 2 disajikan di Gambar 2.

Page 9: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

220

(a)

(b)

Gambar 2. Kedalaman 1 dan 2 Diagram Pohon CHAID

Berdasarkan diagram pohon hasil analisis CHAID menunjukkan bahwa seluruh

variabel bebas signifikan terhadap variabel terikatnya, yaitu variabel jenis hari

terjadinya kecelakaan lalu lintas, waktu terjadinya kecelakaan lalu lintas, jenis

kecelakaan yang terjadi, kendaraan yang terlibat dalam kecelakaan lalu lintas, usia

korban kecelakaan lalu lintas, profesi korban kecelakaan lalu lintas, dan jenis kelamin

korban kecelakaan lalu lintas.

Dari hasil diagram pohon CHAID bahwa terdapat simpul 135 buah, simpul akhir

terdapat 3 buah dan kedalaman sebanyak 6. Node teratas diketahui jumlah total

korban kecelakaan lalu lintas dikota Surabaya sebanyak 2970 yang terdiri dari 2424

korban yang mengalami luka ringan, 260 korban yang meninggal dunia, dan 286

korban yang mengalami luka berat.

Pada tahap pemisahan CHAID, variabel independen yang mempunyai asosiasi

paling kuat dengan tingkat luka korban adalah variabel kendaraan terlibat. Dari 2970

korban, sekitar 51,25% merupakan kelompok kendaraan terlibat spm-spm atau Spd-

Spm, sekitar 25,62% merupakan kelompok kendaraan terlibat spm-mbl, mbl-mbl,

atau mbl-bus/truk, sekitar 8,32% merupakan kelompok kendaraan terlibat spm-

bus/truk, sekitar 11,72% merupakan kelompok kendaraan terlibat spm atau spd-mbl,

sekitar 1,14% merupakan kelompok kendaraan terlibat bus/truk-bus/truk, dan sekitar

1,95% merupakan kelompok kendaraan terlibat mbl atau bus/truk.

Berdasarkan hasil CHAID, korban yang banyak tergolong mengalami luka ringan

yaitu berjenis kelamin perempuan berusia dewasa dan berprofesi

wiraswasta/wirausaha, kendaraan yang terlibat dalam kecelakaan adalah spm-spm

dimana kecelakaan terjadi pada pagi hari saat hari kerja dengan jenis kecelakaan

depan samping. Korban yang banyak tergolong mengalami luka berat yaitu

kecelakaan yang terjadi pada malam hari saat hari kerja dimana korban berprofesi

Page 10: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

221

wiraswasta/wirausaha. Korban yang banyak tergolong meninggal dunia yaitu korban

yang berusia lansia mengalami kecelakaan di pagi hari dengan kendaraan yang

terlibat adalah spm dan jenis kecelakaan depan samping.

Metode CHAID dapat meminimalisir atau meminimumkan jumlah korban yang

mengalami luka berat dan meninggal dunia, maka peneliti memberikan rekomendasi

karakteristik korban kepada POLRESTABES Surabaya seperti berikut:

a. Jika kendaraan terlibat adalah spm-spm, spd-spm dan waktu kecelakaan di malam

hari dan jenis hari terjadinya kecelakaan saat hari libur, akhir minggu dan jenis

kecelakaan adalah depan belakang, beruntun, sendiri dan jenis kelamin

perempuan maka dari data diperoleh luka berat sebanyak 5 (100%) sehingga

korban pada segmen ini diduga akan mengalami luka berat. (Segmen 18).

b. Jika kendaraan terlibat adalah spm-spm, spd-spm dan waktu kecelakaan di malam

hari dan jenis hari terjadinya kecelakaan saat hari libur, akhir minggu dan jenis

kecelakaan adalah depan samping, depan depan dan kendaraan terlibat spd-spm

maka dari data diperoleh luka berat sebanyak 2 (100%) sehingga korban pada

segmen ini diduga akan mengalami luka berat. (Segmen 21).

c. Jika kendaraan terlibat adalah spm-spm, spd-spm dan waktu kecelakaan di dini

hari dan usia korban lansia, remaja, balita & kanak-kanak dan profesi korban

PNS TNI/POLRI, pelajar/mahasiswa dan jenis kecelakaan depan belakang maka

dari data diperoleh luka berat sebanyak 2 (100%) sehingga korban pada segmen

ini diduga akan mengalami luka berat. (Segmen 31).

d. Jika kendaraan terlibat adalah spm-mbl, mbl-mbl, mbl-bus/truk dan waktu

kecelakaan di siang hari, malam hari dan profesi korban wiraswasta/wirausaha,

PNS TNI/POLRI, pelajar/mahasiswa dan jenis hari terjadinya kecelakaan saat

hari kerja, akhir minggu dan jenis kecelakaan depan belakang, depan depan dan

kendaraan terlibat mbl-mbl maka dari data diperoleh luka ringan sebanyak 1

(25%) dan luka berat sebanyak 3 (75%) sehingga korban pada segmen ini diduga

akan mengalami luka berat. (Segmen 38).

e. Jika kendaraan terlibat adalah spm-mbl, mbl-mbl, mbl-bus/truk dan waktu

kecelakaan di pagi hari dan jenis kelamin perempuan dan usia korban lansia dan

jenis hari terjadinya kecelakaan saat hari libur maka dari data diperoleh

meninggal dunia sebanyak 4 (100%) sehingga korban pada segmen ini diduga

akan meninggal dunia. (Segmen 43).

f. Jika kendaraan terlibat adalah spm-mbl, mbl-mbl, mbl-bus/truk dan waktu

kecelakaan di dini hari dan jenis kecelakaan beruntun dan jenis hari terjadinya

kecelakaan saat hari libur maka dari data diperoleh luka berat sebanyak 5 (71%)

dan meninggal dunia sebanyak 2 (29%) sehingga korban pada segmen ini diduga

akan mengalami luka berat. (Segmen 54).

g. Jika kendaraan terlibat adalah spm-bus/truk dan waktu kecelakaan di malam hari

dan profesi korban wiraswasta/wirausaha dan jenis hari terjadinya kecelakaan

saat hari kerja, akhir minggu maka dari data diperoleh luka ringan sebanyak 13

(24%), luka berat sebanyak 40 (73%), dan meninggal dunia sebanyak 2 (4%)

sehingga korban pada segmen ini diduga akan mengalami luka berat. (Segmen

62).

h. Jika kendaraan terlibat adalah spm-bus/truk dan waktu kecelakaan di dini hari

maka dari data diperoleh luka ringan sebanyak 5 (33%) dan meninggal dunia

sebanyak 10 (67%) sehingga korban pada segmen ini diduga akan meninggal

dunia. (Segmen 65).

Page 11: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

222

i. Jika kendaraan terlibat adalah spm, spd-mbl dan jenis kecelakaan depan

belakang, depan samping, depan depan dan umur dewasa dan waktu kejadian

pagi hari, malam hari maka dari data diperoleh meninggal dunia sebanyak 6

(100%) sehingga korban pada segmen ini diduga akan meninggal dunia. (Segmen

68).

j. Jika kendaraan terlibat adalah spm, spd-mbl dan jenis kecelakaan menabrak

penyeberang jalan dan waktu kejadian dini hari dan usia korban manula maka

dari data diperoleh luka ringan sebanyak 1 (10%) dan meninggal dunia sebanyak

9 (90%) sehingga korban pada segmen ini diduga akan meninggal dunia.

(Segmen 73).

k. Jika kendaraan terlibat adalah spm, spd-mbl dan jenis kecelakaan sendiri maka

dari data diperoleh luka ringan sebanyak 4 (11%), luka berat sebanyak 2 (6%),

dan meninggal dunia sebanyak 29 (83%) sehingga korban pada segmen ini

diduga akan meninggal dunia. (Segmen 76).

l. Jika kendaraan terlibat adalah bus/truk-bus/truk dan jenis kecelakaan depan

belakang dan waktu kejadian di malam hari, dini hari maka dari data diperoleh

luka berat sebanyak 7 (100%) sehingga korban pada segmen ini diduga akan

mengalami luka berat. (Segmen 79).

m. Jika kendaraan terlibat adalah mbl, bus/truk dan usia korban lansia, manula dan

jenis kelamin perempuan maka dari data diperoleh meninggal dunia sebanyak 15

(100%) sehingga korban pada segmen ini diduga akan meninggal dunia. (Segmen

83).

7. Tingkat Akurasi Dan Presisi Metode CHAID

Berdasarkan 15 segmen yang telah diuraikan sebelumnya maka dilakukan

perhitungan nilaI akurasi dan presisi agar dapat mengetahui sejauh mana model

dalam mengklasifikasikan dengan benar. Berikut adalah tingkat akurasi dan presisi

dengan menggunakan metode CHAID.

Tabel 5. Tingkat Akurasi dan Presisi Metode CHAID

Data Tingkat Luka LR MD LB

Training

LR 2381 11 32

MD 172 75 13

LB 195 3 88

Persentase 85,7%

Data Tingkat Luka

Testing

LR 612 0 0

MD 57 9 0

LB 45 0 19

Persentase 86,3%

Menurut tingkat akurasi yang dihasilkan metode CHAID pada tabel 3.4

dapat dilihat bahwa klasifikasi yang terbentuk dengan persentase data training

80% dan data testing 20% diperoleh tingkat akurasi data training sebesar

85,7% dan tingkat akurasi data testing sebesar 86,3%.

8. Validasi Sistem

Pada tahap validasi sistem, maka akan dibandingkan output dari metode CHAID,

Improve CHAID dan Improve C4.5. Dibawah ini tabel perbandingannya :

Page 12: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

223

Tabel 6. Validasi Sistem

Output CHAID Improve CHAID Improve C4.5

Akurasi 86,3% 82,5% 83,8%

Berdasarkan tabel di atas dapat diambil kesimpulan bahwa metode CHAID

memiliki nilai akurasi yang berbeda dengan metode lain atau dapat dikatakan metode

CHAID memiliki akurasi yang lebih baik atau optimal untuk mengklasifikasikan data

dalam penelitian ini.

KESIMPULAN

Berdasarkan hasil analisis dan pembahasan yang telah dijelaskan sebelumnya oleh

peneliti, maka dapat ditarik kesimpulan yaitu :

1. Gambaran umum pada data kecelakaan lalu lintas di kota Surabaya pada tahun 2018

terjadi kecelakaan sebanyak 1387 korban. Korban yang mengalami kecelakaan lalu

lintas sebagian besar berjenis kelamin laki-laki, berusia dewasa, berprofesi

wiraswasta/wirausaha, waktu kejadian kecelakaan pada pagi hari, jenis hari adalah

hari kerja, kendaraan terlibat sepeda motor dengan sepeda motor, dan jenis

kecelakaan depan samping dimana masing-masing karakteristik tersebut sebagian

besar mengalami luka ringan dan sebagian kecil mengalami luka berat dan

meninggal dunia.

2. Berdasarkan hasil analisis CHAID menunjukkan bahwa seluruh variabel bebas

signifikan terhadap variabel terikatnya, yaitu variabel jenis hari terjadinya

kecelakaan lalu lintas, waktu terjadinya kecelakaan lalu lintas, jenis kecelakaan yang

terjadi, kendaraan yang terlibat dalam kecelakaan lalu lintas, usia korban kecelakaan

lalu lintas, profesi korban kecelakaan lalu lintas, dan jenis kelamin korban

kecelakaan lalu lintas. Dapat dilihat dari hasil diagram pohon CHAID bahwa

terdapat simpul 135 buah, simpul akhir terdapat 3 buah dan kedalaman sebanyak 6.

Node teratas diketahui jumlah total korban kecelakaan lalu lintas dikota Surabaya

sebanyak 2970 yang terdiri dari 2424 korban yang mengalami luka ringan, 260

korban yang meninggal dunia, dan 286 korban yang mengalami luka berat. Pada

tahap pemisahan CHAID, variabel independen yang mempunyai asosiasi paling kuat

dengan tingkat luka korban adalah variabel kendaraan terlibat. Dari 2970 korban,

sekitar 51,25% merupakan kelompok kendaraan terlibat spm-spm atau Spd-Spm,

sekitar 25,62% merupakan kelompok kendaraan terlibat spm-mbl, mbl-mbl, atau

mbl-bus/truk, sekitar 8,32% merupakan kelompok kendaraan terlibat spm-bus/truk,

sekitar 11,72% merupakan kelompok kendaraan terlibat spm atau spd-mbl, sekitar

1,14% merupakan kelompok kendaraan terlibat bus/truk-bus/truk, dan sekitar 1,95%

merupakan kelompok kendaraan terlibat mbl atau bus/truk. Klasifikasi yang

menggolongkan korban mengalami luka ringan yaitu simpul 1, 2, 3, 6, 9, 10, 11, 12,

15, 19, 20, 23, 24, 27, 32, 35, 36, 37, 40, 41, 44, 45, 49, 51, 52, 55, 56, 57, 61, 63,

66, 69, 70, 71, 72, 78, 80, 84, dan 85 dengan persentase mengalami luka ringan

diatas 60%. Klasifikasi yang menggolongkan korban mengalami luka berat yaitu

simpul 8, 13, 18, 21, 31, 38, 54, 62 dan 79 dengan persentase mengalami luka berat

diatas 60%. Klasifikasi yang menggolongkan korban yang meninggal dunia yaitu

simpul 43, 65, 68, 73, 76, dan 83 dengan persentase korban meninggal dunia diatas

60%.

3. Menurut tingkat akurasi yang dihasilkan metode CHAID dapat dilihat bahwa

klasifikasi yang terbentuk dengan persentase data training 80% dan data testing 20%

Page 13: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

224

diperoleh tingkat akurasi data training sebesar 85,7% dan tingkat akurasi data testing

sebesar 86,3%.

Berdasarkan kesimpulan penelitian, maka direkomendasikan berupa saran-saran

sebagai berikut:

1. Pada penelitian selanjutnya diharapkan seluruh jenis kecelakaan lalu lintas dan

faktor-faktor penyebab kecelakaan lalu lintas yang berhubungan dengan tingkat luka

korban kecelakaan lalu lintas dapat dijadikan variabel independen.

2. Pada penelitian selanjutnya diharapkan dapat membandingkan tingkat keakuratan

metode pada analisis data yang belum di seimbangkan dan yang telah diseimbangkan

menggunakan aplikasi weka.

3. Pada penelitian selanjutnya diharapkan dapat membandingkan tingkat keakuratan

metode CHAID dengan metode lainnya sehingga dapat diperoleh model terbaik.

4. Bagi pihak kepolisian atau pihak terkait adakan pendidikan keselamatan yang terarah

dan penegakan hukum yang berefek jera, berikan hak mengemudi secara ketat,

sediakan sarana dan prasarana lalu lintas jalan yang memenuhi standar kelayakan

keselamatan, melakukan upaya pencegahan luka apabila terjadi kecelakaan,

melakukan upaya penanganan korban luka agar segera dapat ditolong untuk

meminimalkan tingkat keparahannya, pendidikan berlalu lintas sejak usia dini,

penegakkan hukum terhadap pelanggaran-pelanggaran lalu lintas yang potensial

menyebabkan fatalitas kecelakaan lalu lintas.

DAFTAR PUSTAKA

Afidah, L. N. & Susilaningrum, D. (2011). Pola Tingkatan Keparahan Korban

Kecelakaan Lalu Lintas Dengan Menggunakan Regresi Logistik Multinomial

(Studi Kasus: Kecelakaan Lalu Lintas di Surabaya). FMIPA ITS. Surabaya.

Fikri, B. A. (2018). Klasifikasi Tingkat Luka Korban Kecelakaan Lalu Lintas dengan

Metode Chi-Squared Automatic Interaction Detection (CHAID) with Synthetic

Minority Oversampling Technique (SMOTE). Universitas Islam Indonesia.

Yogyakarta.

Gallagher, C.A. (2000). An Iterative Approach to Classification Analysis.

https://www.casact.org/pubs/dpp/dpp90/90dpp237.pdf diakses pada 28 Februari

2019

Kunto, Y. S. (2006). Analisis CHAID Sebagai Alat Bantu Statistika Untuk Segmentasi

Pasar. Jurnal Manajemen Pemasaran, Vol. 1, No. 2, Oktober 2006: 88-98.

Milana, N. & Abadyo. (2013). CHAID untuk Mengklasifikasi Status Mahasiswa Setelah

Lulus Perkuliahan. Jurnal Online Universitas Negeri Malang, Vol. 1 No. 2 (2012)

Nugraha J. (2014). Pengantar Analisis Data Kategorik: Metode dan Aplikasi

Menggunakan Program R. Deepublish.

Permana, H. (2011). Klasifikasi dengan Metode CHAID (Chi-Squared Automatic

Interaction Detection). UNY. Yogyakarta.

Page 14: PENERAPAN METODE CHAID MENGGUNAKAN SMOTE DALAM KLASIFIKASI …digital.library.ump.ac.id/470/2/19. Full Paper_Wahyu.pdf · DALAM KLASIFIKASI TINGKAT LUKA KORBAN KECELAKAAN LALU LINTAS

Prosiding Seminar Nasional diselenggarakan Pendidikan Geografi FKIP UMP

“Manajemen Bencana di Era Revolusi Industri 5.0”

ISBN 978-602-6697-38-7

Purwokerto, 10 Agustus 2019

225

Situmorang. (2016). WHO: Angka Kecelakaan Lalu Lintas di Indonesia Tertinggi se-

Asia. http://entertainment.analisadaily.com/read/who-angka-kecelakaan-lalu-

lintas-di-indonesia-tertinggi-se-asia/240063/2016/05/29. Diakses pada tanggal 13

Mei 2019.

Suma'mur. (2009). Higiene Perusahaan Dan Kesehatan Kerja. CV. Sagung Seto.

Yogyakarta.

Undang-Undang Republik Indonesia No 22 tahun 2009. Tentang Lalu Lintas dan

Angkutan Jalan.

Witten, I. H. dan Frank, E. (2005). Data Mining : Pratical Machine Learning Tools and

Techniques Second Edition. Morgan Kauffman. San Francisco.