Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur...

13
1 Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur dengan Pendekatan Multivariate Adaptive Regression Spline Bootstrap Aggregating (MARS Bagging) Dimas Arvian Pandu Pratama 1 (1307100059), dan Bambang Widjanarko Otok 2 1 Mahasiswa Jurusan Statistika, ITS, Surabaya 2 Dosen Pembimbing, Jurusan Statistika, ITS, Surabaya [email protected]; [email protected] Abstrak Kemiskinan telah menjadi permasalahan yang belum terselesaikan hingga saat ini, baik di Indonesia umumnya, maupun di Jawa Timur khususnya, dan hal ini berkaitan erat dengan kesejahteraan rumah tangga. Begitu banyak faktor yang mempengaruhi kesejahteraan rumah tangga, oleh karena itu perlu dilakukan identifikasi faktor yang paling berpengaruh agar nantinya dapat digunakan untuk perencanaan pembangunan sehingga pembangunan lebih terarah pada peningkatan kesejahteraan masyarakat. Untuk mencapai tujuan tersebut maka perlu dibuat suatu klasifikasi berdasarkan faktor- faktor yang mempengaruhinya. Dalam penelitian ini, dilakukan klasifikasi kesejahteraan rumah tangga di provinsi Jawa Timur dengan pendekatan MARS bagging. Didapatkan empat belas faktor yang mempengaruhi kesejahteraan rumah tangga di Jawa Timur, faktor-faktor tersebut adalah variabel-variabel yang berkontribusi pada fungsi klasifikasi. Lima variabel di antaranya yang memiliki tingkat kepentingan tertinggi adalah jumlah anggota rumah tangga (X5), adanya anggota rumah tangga yang menggunakan telepon selular (X16), bahan bakar utama untuk memasak (X13), pengalaman membeli beras raskin selama tiga bulan terakhir (X15) dan tingkat pendidikan kepala rumah tangga (X4) dengan tingkat kepentingan masing-masing 100%, 57.04%, 45.11%, 29.18%, dan 26.29%. Pendekatan bagging dengan tiga puluh replikasi dataset berhasil menunjukkan akurasi klasifikasi dari klasifikasi model MARS dengan dataset tunggal. Tingkat kesalahan dan ketepatan klasifikasi yang diberikan adalah sebesar 13.51% dan 86.49%. Kata kunci: Kesejahteraan rumah tangga, klasifikasi, MARS bagging 1. Pendahuluan Kesejahteraan masyarakat merupakan tanggung jawab pemerintah negara. Sejak berlakunya desentralisasi kebijakan peme- rintahan, pemerintah daerah mendapatkan kesempatan besar untuk menangani secara langsung upaya penyejahteraan masyarakat, khususnya dalam upaya penanggulangan permasalahan kesejahteraan sosial. Salah satu permasalahan kesejahtera- an sosial yang telah lama menjadi per- masalahan yang belum dapat diatasi sepenuh- nya oleh pemerintah Indonesia adalah ke- miskinan (Sutaat, 2006). Jumlah penduduk miskin di Indonesia mengalami penurunan 2.43 juta pada tahun 2009 dari jumlah semula 34.96 juta jiwa pada tahun 2008 (Badan Pusat Statistik, 2009). Hal tersebut menunjukkan bahwa kemiskinan belum benar-benar terselesaikan walaupun telah banyak program pemerintah yang telah dilaksanakan. Telah banyak dilakukan kajian me- ngenai kesejahteraan dan kemiskinan, di antaranya Suryadarma dkk (2005), yang menentukan ukuran obyektif kesejahtraan rumah tangga untuk penargetan kemiskinan, dan juga Faturokhman dkk (1995), yang telah melakukan analisis data Survey Sosial Ekonomi Nasional (SUSENAS) tahun 1992. Hal tersebut menunjukkan bahwa banyak faktor yang mempengaruhi kesejahteraan rumah tangga sehingga perlu dilakukan identifikasi faktor yang paling berpengaruh supaya nantinya dapat digunakan untuk perencanaan pembangunan yang terarah pada peningkatan kesejahteraan masyarakat. Untuk mendeskripsikan karakteristik kesejahteraan rumah tangga dan melihat faktor yang paling berpengaruh, perlu dibuat suatu klasifikasi berdasarkan faktor-faktor yang mem- pengaruhinya. Propinsi Jawa Timur, sebagai pro- pinsi dengan jumlah penduduk terbanyak kedua di Indonesia, dihuni sekitar 6.02 juta penduduk miskin. Jumlah tersebut merupakan angka terbesar dibandingkan dengan propinsi lainnya di Indonesia (Badan Pusat Statistik, 2009). Sebuah kontradiksi di mana se- harusnya jumlah penduduk yang besar di Jawa Timur dapat menjadi potensi dalam pembangunan daerah, namun permasalahan kesejahteraan sosial, salah satunya kemiskin- an, masih belum dapat teratasi sampai tuntas.

Transcript of Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur...

Page 1: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

1

Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur dengan Pendekatan Multivariate Adaptive Regression Spline Bootstrap Aggregating (MARS Bagging)

Dimas Arvian Pandu Pratama1 (1307100059),

dan Bambang Widjanarko Otok2 1 Mahasiswa Jurusan Statistika, ITS, Surabaya

2 Dosen Pembimbing, Jurusan Statistika, ITS, Surabaya [email protected]; [email protected]

Abstrak

Kemiskinan telah menjadi permasalahan yang belum terselesaikan hingga saat ini, baik di Indonesia umumnya, maupun di Jawa Timur khususnya, dan hal ini berkaitan erat dengan kesejahteraan rumah tangga. Begitu banyak faktor yang mempengaruhi kesejahteraan rumah tangga, oleh karena itu perlu dilakukan identifikasi faktor yang paling berpengaruh agar nantinya dapat digunakan untuk perencanaan pembangunan sehingga pembangunan lebih terarah pada peningkatan kesejahteraan masyarakat. Untuk mencapai tujuan tersebut maka perlu dibuat suatu klasifikasi berdasarkan faktor-faktor yang mempengaruhinya. Dalam penelitian ini, dilakukan klasifikasi kesejahteraan rumah tangga di provinsi Jawa Timur dengan pendekatan MARS bagging. Didapatkan empat belas faktor yang mempengaruhi kesejahteraan rumah tangga di Jawa Timur, faktor-faktor tersebut adalah variabel-variabel yang berkontribusi pada fungsi klasifikasi. Lima variabel di antaranya yang memiliki tingkat kepentingan tertinggi adalah jumlah anggota rumah tangga (X5), adanya anggota rumah tangga yang menggunakan telepon selular (X16), bahan bakar utama untuk memasak (X13), pengalaman membeli beras raskin selama tiga bulan terakhir (X15) dan tingkat pendidikan kepala rumah tangga (X4) dengan tingkat kepentingan masing-masing 100%, 57.04%, 45.11%, 29.18%, dan 26.29%. Pendekatan bagging dengan tiga puluh replikasi dataset berhasil menunjukkan akurasi klasifikasi dari klasifikasi model MARS dengan dataset tunggal. Tingkat kesalahan dan ketepatan klasifikasi yang diberikan adalah sebesar 13.51% dan 86.49%. Kata kunci: Kesejahteraan rumah tangga, klasifikasi, MARS bagging

1. Pendahuluan Kesejahteraan masyarakat merupakan tanggung jawab pemerintah negara. Sejak berlakunya desentralisasi kebijakan peme-rintahan, pemerintah daerah mendapatkan kesempatan besar untuk menangani secara langsung upaya penyejahteraan masyarakat, khususnya dalam upaya penanggulangan permasalahan kesejahteraan sosial. Salah satu permasalahan kesejahtera-an sosial yang telah lama menjadi per- masalahan yang belum dapat diatasi sepenuh- nya oleh pemerintah Indonesia adalah ke-miskinan (Sutaat, 2006). Jumlah penduduk miskin di Indonesia mengalami penurunan 2.43 juta pada tahun 2009 dari jumlah semula 34.96 juta jiwa pada tahun 2008 (Badan Pusat Statistik, 2009). Hal tersebut menunjukkan bahwa kemiskinan belum benar-benar terselesaikan walaupun telah banyak program pemerintah yang telah dilaksanakan. Telah banyak dilakukan kajian me-ngenai kesejahteraan dan kemiskinan, di antaranya Suryadarma dkk (2005), yang menentukan ukuran obyektif kesejahtraan rumah tangga untuk penargetan kemiskinan, dan juga Faturokhman dkk (1995), yang telah

melakukan analisis data Survey Sosial Ekonomi Nasional (SUSENAS) tahun 1992. Hal tersebut menunjukkan bahwa banyak faktor yang mempengaruhi kesejahteraan rumah tangga sehingga perlu dilakukan identifikasi faktor yang paling berpengaruh supaya nantinya dapat digunakan untuk perencanaan pembangunan yang terarah pada peningkatan kesejahteraan masyarakat. Untuk mendeskripsikan karakteristik kesejahteraan rumah tangga dan melihat faktor yang paling berpengaruh, perlu dibuat suatu klasifikasi berdasarkan faktor-faktor yang mem- pengaruhinya. Propinsi Jawa Timur, sebagai pro-pinsi dengan jumlah penduduk terbanyak kedua di Indonesia, dihuni sekitar 6.02 juta penduduk miskin. Jumlah tersebut merupakan angka terbesar dibandingkan dengan propinsi lainnya di Indonesia (Badan Pusat Statistik, 2009). Sebuah kontradiksi di mana se-harusnya jumlah penduduk yang besar di Jawa Timur dapat menjadi potensi dalam pembangunan daerah, namun permasalahan kesejahteraan sosial, salah satunya kemiskin-an, masih belum dapat teratasi sampai tuntas.

Page 2: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

2

Penelitian-penelitian mengenai klasifikasi kesejahteraan rumah tangga pernah dilakukan sebelumnya. Salah satunya pernah dilakukan Een (2009) tentang klasifikasi kesejahteraan rumah tangga di Propinsi Jawa Tengah dengan pendekatan CART Arcing, hasilnya merupakan gambaran karakteristik rumah tangga miskin di Jawa Tengah sebagai masukan perancanaan pembangunan daerah Jawa Tengah. Dalam penelitian ini, untuk meng-klasifikasi kesejahteraan rumah tangga di Propinsi Jawa Timur, digunakan metode multivariate adaptive regression spline (MARS) yang dipadukan dengan salah satu pendekatan nonparametrik bootstrap aggegrating (bagging). Model MARS berguna untuk mengatasi permasalahan data ber-dimensi tinggi, sedangkan bagging yang dapat memperbaiki akurasi klsifikasi dari model MARS. 2. Kesejahteraan Berdasarkan Rancangan Undang-Undang tentang Sistem Kesejahteraan Sosial Nasional (RUU SKSN), kesejahteraan sosial adalah kondisi sosial ekonomi yang memungkinkan bagi setiap warga negara untuk dapat memenuhi kebutuhan yang bersifat jasmani, rohani dan sosial sesuai dengan harkat dan martabat manusia. Kesejahteraan menurut Cahyat et al (2007) merupakan kondisi dapat memenuhi kebutuh-an dasar baik material maupun non-material yang mencakup aspek gizi dan kesehatan, pengetahuan, dan kekayaan materi. Kemiskinan sendiri merupakan bentuk ketidakmampuan untuk meraih ke-sejahteraan dipandang dari sisi ekonomi -dalam memenuhi kebutuhan dasar makanan dan bukan makanan- yang diukur dari sisi pengeluaran. Penduduk Miskin adalah penduduk yang memiliki rata-rata pengeluar-an perkapita perbulan dibawah garis ke-miskinan (GK) (BPS, 2009). Selain itu, kemiskinan juga dijelaskan sebagai suatu situasi dimana seseorang atau rumah tangga mengalami kesulitan untuk memenuhi kebutuhan dasar, sementara lingkungan pendukungnya kurang memberikan peluang untuk meningkatkan kesejahteraan secara berkesinambungan atau untuk keluar dari kerentanan (Cahyat et al, 2007).

Tingkat kesejahteraan masyarakat antara lain dapat diukur melalui besarnya pendapatan/pengeluaran. Pengeluaran untuk kebutuhan konsumsi dapat mencerminkan tingkat kemampuan ekonomi masyarakat, dan kemampuan daya beli masyarakat dapat memberikan gambaran tentang tingkat kesejahteraan masyarakat. Semakin tinggi daya beli masyarakat menunjukkan me-ningkatnya kemampuan dalam memenuhi kebutuhan hidupnya dan selanjutnya akan berdampak meningkatnya kesejahteraan masyarakat (BPS, 2009). Dalam mengukur kesejahteraan rumah tangga diperlukan indikator moneter, indikator yang banyak digunakan adalah pendapatan dan pengeluaran (BPS, 2009, dan The World Bank, 2007). Indikator pengeluaran, dalam hal ini disebut juga konsumsi, dipilih karena sifatnya tetap dan relatif stabil terhadap berfluktuasinya pendapatan dari tahun ke tahun. Suryadarma (2005) mengungkapkan variabel-variabel yang menjadi ciri ke-sejahteraan suatu keluarga antara lain: kepemilikan asset, kepemilikan binatang ternak, status perkawinan kepala rumah tangga, jenis kelamin kepala rumah tangga, tingkat pendidikan kepala rumah tangga dan pasangannya, anggota rumah tangga yang bekerja, sektor pekerjaan, akses terhadap rumah tangga, konsumsi makanan dan indikator kesehatan, indikator kesejahteraan lainnya serta partisipasi politik dan akses kepada informasi. Jumlah anggota rumah tangga diduga mempunyai keterkaitan erat dengan kesejahteraan rumah tangga karena ke-miskinan dihitung berdasar pengeluaran dan jumlah anggota rumah tangga. Makin besar jumlah anggota rumah tangga akan makin besar pula resiko untuk menjadi miskin apabila pendapatannya tidak meningkat (Faturochman dan Molo, 1995). Umur kepala rumah tangga juga berkaitan dengan kesejahteraan rumah tangga walaupun hubungannya tidak begitu jelas, akan tetapi ada kecenderungan bahwa kepala rumah tangga yang lebih sejahtera lebih tua dibandingkan kepala rumah tangga yang kurang sejahtera. Jenis karakteristik lain adalah karakteristik jenis pekerjaan. Kemampuan mayoritas rumah tangga untuk keluar dari

Page 3: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

3

kemiskinan akan bergantung pada upah mereka dari pekerjaan yang dilakukan. Jadi penting untuk menguji hubungan antara kesejahteraan dengan jenis pekerjaan anggota rumah tangga yang berada dalam usia kerja. Dillon dan Hermanto dalam Faturochman dan Molo (1995) mengungkapkan bahwa ke-nyataannya, sebagian penduduk atau rumah tangga miskin di desa masih mengandalkan pertanian sebagai pekerjaan utamanya akan tetapi usaha-usaha di luar pertanian tetap menjadi sumber pendapatan komplementer dan alternatif bagi keluarga. Sedangkan rumah tangga miskin di kota lebih banyak mengandalkan penghasilan dari sektor-sektor jasa atau lebih dikenal dengan sektor informal. Sedangkan karakteristik umum penduduk miskin menurut Rusastra dan Togar, 2007 adalah sebagian besar tinggal di desa, bekerja di sektor pertanian, sifat pekerjaan adalah informal serta status pekerjaan sebagai pekerja keluarga yang tidak di bayar. Salah satu karakteristik umum penduduk miskin lainnya menurut The World Bank (2006) adalah sifat pekerjaan yang bersifat informal serta status pekerjaan sebagai pekerja keluarga yang tidak dibayar. 3. MARS

MARS diperkenalkan pada tahun 1991 oleh Friedman. Model MARS berguna untuk mengatasi permasalahan data berdimensi tinggi dan menghasilkan prediksi variabel respon yang akurat, dan menghasilkan model yang kontinu dalam knot berdasarkan nilai GCV terkecil (Friedman, 1991).

Model umum persamaan MARS dapat ditulis sebagai berikut (Friedman, 1991): 𝒇(𝒙) = 𝜶𝟎 + ∑ 𝜶𝒎∏ �𝒔𝒌𝒎. �𝒙𝒗(𝒌,𝒎)−𝒕𝒌𝒎�� + + 𝜺𝒊

𝑲𝒎𝒌=𝟏

𝑴𝒎=𝟏

(1) di mana, 𝜶𝟎 = fungsi basis induk (constant basis

function), 𝜶𝒎 = koefisien dari fungsi basis ke-m, M = fungsi basis maksimum (non-

constant basis function), Km = derajat interaksi, 𝒔𝒌𝒎 = bernilai 1 jika data berada di

sebelah kanan titik knot, atau bernilai -1 jika data berada di sebelah kiri titik knot,

𝒙𝒗(𝒌,𝒎) = variabel prediktor, dan 𝒕𝒌𝒎 = nilai knot dari variabel prediktor 𝑥𝑣(𝑘,𝑚).

MARS dapat menemukan letak dan jumlah knot yang diperlukan dalam suatu langkah forward/bacward stepwise (Otok, 2010). Forward stepwise dilakukan untuk mendapatkan fungsi dengan jumlah fungsi basis maksimum. Kriteria pemilihan fungsi basis pada forward stepwise adalah dengan meminimumkan Average Sum Of Square Residual (ASR). Sedangkan, untuk memenuhi konsep parsimoni (model yang sesederhana mungkin dengan variabel seminimal mungkin) dilakukan backward stepwise, bertujuan untuk memilih fungsi basis yang dihasilkan dari forward stepwise dengan meminimumkan nilai GCV (Friedman dan Silverman, 1989).

Menentukan model MARS yang optimal di antara model-model yang lain adalah dengan memilih model yang memiliki nilai GCV terendah. Kriteria GCV diperkenalkan oleh Wahba pada tahun 1979 (Otok, 2010). Fungsi GCV minimum didefinisikan sebagai:

𝐺𝐶𝑉∗(𝑀) =𝐴𝑆𝑅

[1 − 𝐶(𝑀)∗𝑛 ]2

=1𝑛∑ [𝑦𝑖 − 𝑓𝐾𝑛

𝑖=1 (𝑥𝑖)]2

[1 − 𝐶(𝑀)∗𝑛 ]2

(2) dimana: K =jumlah basis fungsi (nonconstant basis fungsi) yang ditentukan pada tahap forward xi = variabel prediktor yi = variabel respon

n = banyaknya pengamatan

𝐶(𝐾)∗= 𝐶(𝐾) + 𝑑𝐾 𝐶(𝐾) = Trace [B(BTB)-1BT]+1 𝑑 = nilai ketika setiap fungsi basis mencapai optimasi (2 ≤ 𝑑 ≤ 4)

Klasifikasi pada model MARS didasarkan pada pendekatan analisis regresi. Jika variabel respon terdiri dari dua nilai, maka dikatakan sebagai regresi dengan binary response (Cox dan Snell, 1989) sehingga dapat digunakan model probabilitas dengan

persamaan sebagai berikut : 𝜋 (𝑥) = 𝑒𝑓�(𝑥)

1+𝑒𝑓�(𝑥)

dan {1 − 𝜋(𝑥)} = 11+𝑒𝑓�(𝑥) dengan

𝑓(𝑥) = 𝑙𝑜𝑔𝑖𝑡 𝜋(𝑥) sehingga 𝑝𝑟𝑜𝑏(𝑌 = 1) =𝜋 (𝑥) dan 𝑝𝑟𝑜𝑏(𝑌 = 2) = 1 − 𝜋 (𝑥).

Variabel respon Y merupakan variabel respon biner (0 dan 1) dengan m banyaknya variabel prediktor, 1 mx x=x ( ,..., ) , sehingga model MARS untuk klasifikasi dapat dinyatakan sebagai berikut (Otok, 2008):

Page 4: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

4

ln � 𝜋(𝑥)1−𝜋(𝑥)

� = 𝛼0 + ∑ 𝛼𝑘 ∏ �𝑠𝑘𝑙�𝑥𝑖(𝑘,𝑙)−𝑥∗𝑖(𝑘,𝑙)��𝒎+ + 𝜀𝑖

𝐿𝑘𝑙=1

𝐾𝑘=1

(3) Pada prinsipnya, klasifikasi dilakukan untuk melihat seberapa besar ketepatan pe-ngelompokkan sekumpulan data untuk di-golongkan dengan tepat pada kelompoknya. Metode klasifikasi yang baik akan meng-hasilkan sedikit kesalahan klasifikasi atau akan menghasilkan peluang kesalahan klasifikasi (alokasi) yang kecil (Agresti, 1990). Untuk menghitung ketepatan klasifikasi digunakan alat ukur apparent error rate (APER). Nilai APER menyatakan representasi proporsi sampel yang salah diklasifikasikan oleh fungsi klasifikasi (Johnson dan Wichern, 1992). Jika subjek hanya diklasifikasikan menjadi dua kelompok 𝑦1dan 𝑦2, maka penentuan kesalahan pengklasifikasian dapat diketahui melalui tabel klasifikasi berikut.

Tabel 1 Tabel klasifikasi hasil

observasi Taksiran

𝑦1 𝑦2 𝑦1 𝑛11 𝑛12 𝑦2 𝑛21 𝑛22

di mana: 𝑛11 : Jumlah subjek dari 𝑦1 tepat diklasi-fikasikan sebagai 𝑦1 𝑛12 : Jumlah subjek dari 𝑦1 salah diklasi-fikasikan sebagai 𝑦2 𝑛21 : Jumlah subjek dari 𝑦2 salah diklasi-fikasikan sebagai 𝑦1 𝑛22 : Jumlah subjek dari 𝑦2 tepat diklasi-fikasikan sebagai 𝑦2 𝐴𝑃𝐸𝑅(%) = 𝑛12+𝑛21

𝑛11+𝑛12+𝑛21+𝑛22 (4)

4. Bagging Metode bagging pertama kali digunakan oleh Breiman (1994) sebagai alat untuk membentuk classifier yang lebih stabil. Bagging predictor adalah metode untuk membangkitkan multiple version dari prediktor dan menggunakannya untuk aggregate prediktor. Multiple versions dibentuk dengan replikasi bootstrap dari sebuah data set. Pada beberapa kasus bagging pada data set real dapat meningkatkan akurasi. Jika perubahan dalam data set menyebabkan perubahan yang signifikan

maka bagging dapat meningkatkan akurasi. Ide dasar dari bagging adalah menggunakan bootstrap resampling untuk membangkitkan prediktor dengan banyak versi, dimana ketika dikombinasikan seharusnya hasilnya lebih baik dibandingkan dengan prediktor tunggal yang dibangun untuk menyelesaikan masalah yang sama.

Sebuah data set £ terdiri dari {(𝑦𝑖 , 𝑥𝑖), 𝑖 = 1,2, … ,𝑛}. Dilakukan replikasi bootstrap sehingga didapatkan £𝑖∗ =(𝑦𝑖∗, 𝑥𝑖∗), 𝑖 = 1,2, … ,𝑛. Replikasi bootstrap dilakukan sebanyak B kali, sehingga didapatkan {£(𝐵)} dari £. {£(𝐵)} adalah resampling dengan pengembalian.

Penentuan besarnya jumlah replikasi B sangat variatif, karena besar kecilnya B dapat memberikan hasil yang berbeda pada setiap tahapan analisis. Sutton (2005) merekomendasikan replikasi sebanyak 25 atau lima puluh kali, namun Hastie dkk (2001) menyatakan bahwa peningkatan akurasi akan terjadi jika banyaknya replikasi ditingkatkan dari lima puluh ke seratus kali, sedangkan jika banyaknya ditingkatkan hingga lebih dari seratus kali akan menghasilkan akurasi yang tidak lebih besar dari akurasi replikasi seratus kali. Sementara itu, Efron dan Tibshirani (1993) merekomendasikan nilai B yang kecil, misalnya 25 kali.

Algoritma bagging untuk MARS adalah sebagai berikut. 1. Mengambil sampel bootstrap sebanyak n

dari data set £ dengan pengulangan sebanyak n.

2. Memodelkan MARS dari data set hasil sampel bootstrap £(𝐵).

3. Menghitung nilai misklasifikasi dari langkah 2. Nilai misklasifikasi pada langkah ini disebut misklasifikasi B

4. Mengulang langkah 1-4 sebanyak B kali (replikasi bootstrap).

5. Memperoleh misklasifikasi bagging dari rata-rata misklasifikasi pada setiap pengambilan sampel sampai B.

Page 5: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

5

5. Sumber Data dan Variabel Penelitian Data yang digunakan dalam penelitian

ini merupakan data sekunder, diambil dari hasil Survey Sosial Ekonomi Nasional

(SUSENAS) tahun 2009 Jawa Timur. Variabel respon dan variabel prediktor yang digunakan dalam penelitian ini adalah sebagai berikut.

Tabel 2 Variabel penelitian (1) variabel keterangan kategori skala

y kelompok rumah tangga berdasarkan pengeluaran per kapita yang sudah dikonversikan berdasarkan garis kemiskinan

1: rumah tangga miskin nominal 2: rumah tangga tidak miskin

x1 jenis kelamin kepala rumah tangga 1: laki-laki nominal 2: perempuan

x2 umur kepala rumah tangga, dihitung berdasarkan ulang tahun terakhir - interval

x3 status perkawinan kepala rumah tangga 1: kawin nominal 2: lainnya

x4 ijazah tertinggi yang dimiliki kepala rumah tangga

1: tidak punya ijazah

ordinal

2: tamat SD 3: tamat SLTP/Sederajat 4: tamat SLTA/Sederajat 5: tamat di atas SLTA 6: tidak pernah sekolah

x5

jumlah anggota rumah tangga, merupakan semua orang yang biasanya bertempat tinggal di suatu rumah tangga, baik yang berada di rumah tangga maupun sementara tidak ada saat pendataan

- interval

x6 kegiatan utama kepala rumah tangga 1: bekerja nominal 2: tidak bekerja

x7 lapangan usaha utama kepala rumah tangga 1: pertanian

nominal 2: non pertanian 3: tidak bekerja

x8 status pekerjaan utama kepala rumah tangga 1: buruh/karyawan

nominal 2: pengusaha 3: lainnya

x9 status penguasaan bangunan tempat tinggal

1: milik sendiri

nominal 2: kontrak/sewa 3: bebas sewa 4: dinas 5: lainnya

x10 sumber air minum

1: air kemasan bermerek

nominal

2: air isi ulang 3: leding meteran/leding eceran 4: sumur bor/pompa/sumur terlindung/sumur

tidak terlindung 5: mata air terlidung/mata air tidak terlindung 6: lainnya

x11 cara memperoleh air minum 1: membeli nominal 2: tidak membeli

x12 sumber penerangan 1: listrik PLN

nominal 2: listrik non PLN 3: lainnya

Page 6: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

6

Tabel 3 Variabel penelitian (2) variabel keterangan kategori skala

x13 bahan bakar energi utama untuk memasak

1: listrik

nominal 2: gas/elpiji 3: minyak tanah 4: arang/briket/kayu bakar 5: lainnya

x14 pengalaman mendapatkan pelayanan kesehatan gratis selama enam bulan terakhir

1: pernah nominal 2: tidak pernah

x15 pengalaman membeli beras raskin selama tiga bulan terakhir

1: pernah nominal 2: tidak pernah

x16 ada anggota rumah tangga yang dapat menggunakan telepon selular

1: ya nominal 2: tidak

x17 ada anggota rumah tangga yang menguasai penggunaan komputer desktop

1: ya nominal 2: tidak 6. Metode Analisis Data

Langkah pertama, untuk mendapatkan deskripsi karaketeristik kesejahteraan rumah tangga, dilakukan analisis statistik deskriptif terhadap variabel-veriabel perdiktor. Untuk mengetahui faktor-faktor apa saja yang mempengaruhi kesejahteraan rumah tangga dengan kesejahteraan rumah tangga di Jawa Timur, bagaimana pola hubungannya, dan bagaimana ketepatan klasifikasinya, dilakukan prosedur berikut. 1. Pembentukan model MARS untuk data

set awal: (1) menentukan BF; (2) menentukan MI; (3) menentukan MO di antara knot..

2. Mendapatkan model MARS terbaik untuk dataset tunggal berdasarkan nilai GCV terkecil.

3. Mendapatkan variabel yang signifikan berpengaruh dari model MARS terbaik untuk dataset tunggal.

4. Melakukan bagging dari pasangan variabel respon dan variabel prediktor yang signifikan dari model MARS terbaik untuk data set tunggal dengan lima belas, dua puluh, 25, dan tiga puluh replikasi bootstrap.

5. Melakukan pemodelan MARS pada setiap pengambilan sampel B replikasi bootstrap dengan jumlah BF, MI dan MO di antara knot sama dengan jumlah BF, MI dan MO di antara knot pada model MARS terbaik untuk data set tunggal.

6. Mendapatkan nilai tingkat misklasifikasi pada setiap pengambilan sampel B replikasi bootstrap.

7. Mendapatkan nilai tingkat misklasifikasi bagging dari rata-rata misklasifikasi pada setiap pengambilan sampel sampai B.

Model MARS bagging yang didapatkan adalah model MARS terbaik untuk data set tunggal. Hal ini dikarenakan nilai knot yang berubah-ubah untuk setiap replikasi sehingga estimasi parameternya tidak bisa dirata-rata. Selanjutnya dilakukan perhitungan nilai APER berdasarkan informasi yang didapat dari tabel klasifikasi untuk memverifikasi tingkat misklasifikasi dan tingkat ketepatan klasifikasi. 7. Hasil dan Pembahasan

Karakteristik kesejahteraan rumah tangga di Jawa Timur ditampilkan pada tabel berikut.

Page 7: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

7

Tabel 4 Statistik deskriptif (1)

aspek karakterstik RT miskin RT tidak miskin

total mean st.dev mean st.dev

kepe

ndud

ukan

jumlah anggota rumah tangga 4,33 1.6 3,44 1.49

umur kepala rumah tangga 50,42 14.39 49,40 13.96

n p(%) n p(%) n p(%)

jenis kelamin kepala rumah tangga

laki-laki 3815 86.27 21131 82.77

perempuan 607 13.73 4399 17.23

total 4422 100 25530 100

status perkawinan kepala rumah tangga

kawin 3738 84.53 20337 79.66

lainnya 684 15.47 5193 20.34

total 4422 100 25530 100

pend

idik

an tidak pernah sekolah 975 26.75 2670 73.25 3645 100

tidak mempunyai ijazah 1400 20.32 5490 79.68 6890 100

tamat SD 1461 16.4 7448 83.6 8909 100

tamat SLTP/Sederajat 483 7.24 6193 92.76 6676 100

tamat SLTA/Sederajat 92 4.25 2073 95.75 2165 100

tamat di atas SLTA 11 0.66 1656 99.34 1667 100

peru

mah

an

status penguasaan tempat tinggal

milik sendiri 4133 93.46 22269 87.23

kontrak/sewa 49 1.11 1361 5.33

bebas sewa 56 1.27 390 1.53

dinas 9 0.2 143 0.56

lainnya 175 3.96 1367 5.35

total 4422 100 25530 100

sumber air minum

air kemasan bermerek 10 0.62 1609 99.38 1619 100

air isi ulang 50 3.52 1371 96.48 1421 100

leding 312 6.85 4246 93.15 4558 100

sumur 3012 16.96 14749 83.04 17761 100

mata air 967 23.04 3230 76.96 4197 100

lainnya 71 17.93 325 82.07 396 100

cara memperoleh air minum

membeli* 582 6.51 8363 93.49 8945 100

tidak membeli** 3840 18.28 17167 81.72 21007 100

sumber penerangan

listrik PLN 4227 14.52 24893 85.48 29120 100

listrik non PLN 58 14.08 354 85.92 412 100

lainnya 137 32.62 283 67.38 420 100

bahan bakar memasak

listrik 22 5.91 350 94.09 372 100

gas/elpiji 464 4.85 9094 95.15 9558 100

minyak tanah 280 6 4389 94 4669 100

arang/briket/kayu bakar 3626 24 11480 76 15106 100

lainnya 30 12.15 217 87.85 247 100

Page 8: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

8

Tabel 5 Statistik deskriptif (2)

aspek karakterstik RT miskin RT tidak miskin total

n p(%) n p(%) n p(%) ke

tena

gake

rjaa

n kegiatan utama KRT bekerja* 3854 15.19 21515 84.81 25369 100

tidak bekerja** 568 12.39 4015 87.61 4583 100

lapangan usaha utama

pertanian* 2625 24 8521 76 11146 100

non pertanian** 1229 9 12994 91 14223 100

tidak bekerja 568 12 4015 88 4583 100

status pekerjaan

buruh/karyawan 596 8 6458 92 7054 100

pengusaha 2409 17 11943 83 14352 100

lainnya 849 21 3114 79 3963 100

tidak bekerja 568 12 4015 88 4583 100

sosi

al

ekon

omi

rum

ah

tang

ga pengalaman

mendapatkan pelayanan kesehatan gratis

pernah* 723 18.58 3169 81.42 3892 100

tidak pernah** 3699 14.19 22361 85.81 26060 100

pengalaman membeli beras raskin

pernah* 3848 20.71 14728 79.29 18576 100

tidak pernah** 574 5.05 10802 94.95 11376 100

tekn

olog

i in

form

asi

dan

kom

unik

asi kemampuan ART

menggunakan telepon genggam

ya* 1488 8.48 16061 91.52 17549 100

tidak** 2934 23.66 9469 76.34 12403 100

penguasaan ART menggunakan komputer desktop

ya* 42 1.82 2269 98.18 2311 100

tidak** 4380 15.85 23261 84.15 27641 100

*) signifikan berbeda pada α=0.05; α=0.01; α=0.001 **) signifikan berbeda pada α=0.05; α=0.01; α=0.001

Karakteristik di atas merupakan deskripsi dari setiap variabel prediktor 𝑥𝑖 berdasarkan kelompok pada variabel respon 𝑦, yaitu rumah tangga miskin dan rumah tangga tidak miskin.

Selanjutnya, dilakukan pemodelan dengan MARS terhadap y dan 𝑥𝑖 dengan cara trial and error, dengan mengombinasikan

beberapa kriteria model MARS, yaitu BF, MI, dan MO sampai diperoleh model terbaik dengan GCV minimum. Rincian kriteria-kriteria model MARS tersebut adalah: BF yang nilainya -dua hingga empat kali jumlah variabel- 34, 51, dan 68; MI yang bernilai 1, 2, dan 3; dan MO yang bernilai 0, 10, 20, 50, dan 100.

Tabel 6 Trial and error penentuan model terbaik MARS no BF MI MO GCV R2 Misclassification rate 1 68 3 0 0.219 0.225 0.1359 2 68 3 10 0.219 0.225 0.1353 3* 68 3 20 0.219 0.225 0.1351 4 68 3 50 0.219 0.225 0.1351 5 68 3 100 0.219 0.225 0.1358

*) model terbaik

Lima model yang ditampilkan pada tabel 1 adalah lima model dengan GCV minimum dari 45 kombinasi model MARS yang lain. Cara menentukan model terbaik adalah dengan mempertimbangkan GCV terkecil,

bila bernilai sama, pertimbangan selanjutnya adalah memilih model dengan R2 terbesar, bila ternyata beberapa model tersebut memiliki R2 yang sama, pertimbangan beralih kepada ketepatan klasifikasi (total corect)

Page 9: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

9

(4)

terbesar, bila masih belum dapat dipilih, pertimbangan beralih kepada kombinasi BF/MI/MO terkecil. Kelima model tersebut memiliki GCV dan R2 yang sama. Penyeleksian mengerucut kepada model nomor tiga dan empat yang memiliki tingkat kesalahan klasifikasi terkecil, yaitu 13.51%. Di antara model nomor tiga dan empat yang memiliki MO paling sedikit adalah model nomor tiga, sehingga model nomor tiga dengan kombinasi BF=68, MI=3, MO=20 dipilih sebagai model terbaik. Model terbaik MARS untuk memodelkan hubungan antara faktor-faktor yang mempengaruhi kesejahteraan dengan tingkat kesejahteraan di Jawa Timur dapat ditulis sebagai berikut: 𝑓(𝑥) = 2.001 − 0.295𝐵𝐹1 + 0.039𝐵𝐹4 + 0.158𝐵𝐹5 −0.120𝐵𝐹7 − 0.084𝐵𝐹9 + 0.024𝐵𝐹12 + 0.065𝐵𝐹13 −0.016𝐵𝐹15 + 0.043𝐵𝐹17 − 0.004𝐵𝐹19 − 0.004𝐵𝐹20 − 0.073𝐵𝐹21 + 0.027𝐵𝐹24 − 0.022𝐵𝐹25 − 0.001𝐵𝐹27 −0.002𝐵𝐹28 − 0.104𝐵𝐹29 − 0.068𝐵𝐹31 + 0.062𝐵𝐹33 −0.047𝐵𝐹35 + 0.045𝐵𝐹37 + 0.039𝐵𝐹38 − 0.001𝐵𝐹40 +0.016𝐵𝐹41 + 0.003𝐵𝐹43 + 0.041𝐵𝐹45 − 0.002𝐵𝐹48 +0.094𝐵𝐹49 − 0.037𝐵𝐹51 + 0.054𝐵𝐹53 + 0.030𝐵𝐹55 +0.099𝐵𝐹57 + 0.002𝐵𝐹60 + 0.004𝐵𝐹62 + 0.004𝐵𝐹63 −0.054𝐵𝐹65 + .686389𝐸 − 03𝐵𝐹67 dengan: 𝐵𝐹1 = (𝑋13 = 4) 𝐵𝐹4 = 𝑚𝑎𝑥(0,6.000 − 𝑋5) ∗ 𝐵𝐹1; 𝐵𝐹5 = (𝑋16 = 1) ∗ 𝐵𝐹1; 𝐵𝐹6 = (𝑋16 = 2) ∗ 𝐵𝐹1; 𝐵𝐹7 = (𝑋15 = 1); 𝐵𝐹9 = (𝑋4 = 6) ∗ 𝐵𝐹1; 𝐵𝐹10 = ( 𝑋4 = 1 𝑜𝑟 𝑋4 = 2 𝑜𝑟 𝑋4 = 3 𝑜𝑟 𝑋4 = 4 𝑜𝑟 𝑋4 = 5)

∗ 𝐵𝐹1; 𝐵𝐹12 = 𝑚𝑎𝑥(0, 5.000 − 𝑋5) ∗ 𝐵𝐹7; 𝐵𝐹13 = (𝑋16 = 1) ∗ 𝐵𝐹7; 𝐵𝐹15 = 𝑚𝑎𝑥(0,𝑋5 − 4.000) ∗ 𝐵𝐹13; 𝐵𝐹17 = (𝑋11 = 1) ∗ 𝐵𝐹7; 𝐵𝐹19 = 𝑚𝑎𝑥(0,𝑋2 − 57.000) ∗ 𝐵𝐹7;

𝐵𝐹20 = 𝑚𝑎𝑥(0, 57.000 − 𝑋2) ∗ 𝐵𝐹7; 𝐵𝐹21 = (𝑋7 = 1); 𝐵𝐹23 = 𝑚𝑎𝑥(0,𝑋5 − 4.000) ∗ 𝐵𝐹21; 𝐵𝐹24 = 𝑚𝑎𝑥(0, 4.000 − 𝑋5) ∗ 𝐵𝐹21; 𝐵𝐹25 = (𝑋4 = 1 𝑜𝑟 𝑋4 = 6); 𝐵𝐹27 = 𝑚𝑎𝑥(0,𝑋2 − 55.000) ∗ 𝐵𝐹23; 𝐵𝐹28 = 𝑚𝑎𝑥(0,55.000 − 𝑋2) ∗ 𝐵𝐹23; 𝐵𝐹29 = (𝑋12 = 3); 𝐵𝐹31 = 𝑚𝑎𝑥(0,𝑋5 − 3.000); 𝐵𝐹33 = (𝑋16 = 1) ∗ 𝐵𝐹31; 𝐵𝐹34 = (𝑋16 = 2) ∗ 𝐵𝐹31; 𝐵𝐹35 = (𝑋10 = 5) ∗ 𝐵𝐹1; 𝐵𝐹37 = 𝑚𝑎𝑥(0,𝑋5 − 4.000) ∗ 𝐵𝐹6; 𝐵𝐹38 = 𝑚𝑎𝑥(0, 4.000 − 𝑋5) ∗ 𝐵𝐹6; 𝐵𝐹40 = 𝑚𝑎𝑥(0, 64.000 − 𝑋2) ∗ 𝐵𝐹31; 𝐵𝐹41 = ( 𝑋4 = 3 𝑜𝑟 𝑋4 = 4 𝑜𝑟 𝑋4 = 5) ∗ 𝐵𝐹31; 𝐵𝐹43 = (𝑋1 = 1) ∗ 𝐵𝐹20; 𝐵𝐹45 = ( 𝑋10 = 1 𝑜𝑟 𝑋10 = 2 𝑜𝑟 𝑋10 = 3 𝑜𝑟 𝑋10 = 6) ∗ 𝐵𝐹23; 𝐵𝐹48 = 𝑚𝑎𝑥(0, 39.000 − 𝑋2) ∗ 𝐵𝐹4; 𝐵𝐹49 = (𝑋17 = 1) ∗ 𝐵𝐹1; 𝐵𝐹51 = (𝑋14 = 1) ∗ 𝐵𝐹10; 𝐵𝐹53 = ( 𝑋4 = 4 𝑜𝑟 𝑋4 = 5) ∗ 𝐵𝐹34; 𝐵𝐹55 = (𝑋8 = 2) ∗ 𝐵𝐹21; 𝐵𝐹57 = (𝑋11 = 1) ∗ 𝐵𝐹35; 𝐵𝐹60 = 𝑚𝑎𝑥(0, 68.000 − 𝑋2) ∗ 𝐵𝐹6; 𝐵𝐹62 = 𝑚𝑎𝑥(0, 2.000 − 𝑋5) ∗ 𝐵𝐹19; 𝐵𝐹63 = ( 𝑋4 = 2 𝑜𝑟 𝑋4 = 3 𝑜𝑟 𝑋4 = 5) ∗ 𝐵𝐹19; 𝐵𝐹65 = ( 𝑋10 = 4 𝑜𝑟 𝑋10 = 5) ∗ 𝐵𝐹17; 𝐵𝐹67 = (𝑋11 = 1) ∗ 𝐵𝐹40

Berkurang atau bertambahnya nilai 𝑓(𝑥) akibat bermaknanya kontribusi setiap BF terhadap model MARS (ditunjukkan oleh tanda negatif atau positif dari setipa koefisien BF) dapat diartikan pula sebagai berkurang atau bertambahnya kecenderungan suatu rumah tangga untuk diklasifikasikan ke dalam kelompok rumah tangga tidak miskin. Model MARS terbaik pada persamaan (4) dibentuk oleh empat belas variabel yang secara signifikan memberikan kontribusi pada model. Tingkat kepentingan dari masing-masing variabel tersebut terhadap model ditampilkan pada Tabel 7.

Tabel 7 tingkat kepentingan variabel

Variable Importance - GCV X5 100 0.112 X16 57.04 0.103 X13 45.109 0.101 X15 29.179 0.099 X4 26.293 0.099 X2 23.075 0.099 X7 18.114 0.099 X11 15.068 0.099 X10 12.599 0.099 X12 9.534 0.098 X1 7.341 0.098 X8 5.884 0.098 X17 5.679 0.098 X14 5.448 0.098 X3 0 0.098 X6 0 0.098 X9 0 0.098

Page 10: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

10

Tingkat kepentingan dari setiap variabel ditaksir oleh kenaikan nilai GCV. Nilai “-GCV” menunjukkan besarnya GCV yang berkurang apabila variabel tersebut dimasukkan dalam model. Berdasarkan tabel 2, dapat diketahui bahwa lima variabel dengan tingkat kepentingan tertinggi adalah X5, x16, x13, x15, dan X4, dengan tingkat kepentingan masing-masing 100%, 57.04%, 45.109%, 29.179%, dan 26.293%. Variabel selanjutnya adalah X2 dengan tingkat kepentingan 23.075%. Peringkat selanjutnya adalah variabel X7 dengan tingkat kepentingan 18.114%. Kemudian diikuti X11 dengan tingkat 15.068%. Selanjutnya variabel X10 dengan tingkat kepentingan 12.599%. Lima variabel terakhir yang memberikan kontribusi adalah X12, X1, X8, X17, dan X14

dengan tingkat kepentingan masing-masing 9.534%, 7.341%, 5.884%, 5.679%, dan 5.448%. Sedangkan variabel X3, X6 dan X9 tidak memberikan kontribusi pada model.

Dengan diketahuinya variabel mana saja yang berkontibusi pada model MARS -yang merupakan fungsi klasifikasi kesejahteraan rumah tangga- maka dapat didefinisikan faktor-faktor apa saja yang mempengaruhi klasifikasi kesejahteraan rumah tangga. Sehingga pemerintah Jawa Timur dapat menggunakan model ini untuk dijadikan pertimbangan dalam pembuatan kebijakan yang berkaitan dengan kesejahteraan rumah tangga.

Evaluasi klasifikasi dengan menghitung nilai APER dimulai dengan membuat tabel klasifikasi.

Tabel 8 Klasifikasi kesejahteraan rumah tangga miskin dan tidak miskin

kelas aktual kelas prediksi total

aktual 1 2 1 1207 3215 4422 2 832 24698 25530 total prediksi 2039 27913 29952

Dari tabel 8 dapat diketahui bahwa dari

4422 rumah tangga miskin, 1207 di antaranya tepat diklasifikasikan ke dalam kategori rumah tangga miskin, sedangkan 3215 rumah tangga lainnya salah diklasifikasikan ke dalam kategori rumah tangga tidak miskin. Begitu juga dari 25530 rumah tangga tidak miskin, 24698 di antaranya tepat dikalsifikasikan ke dalam kategori rumah tangga miskin, sedangkan 832 lainnya salah diklasifikasikan ke dalam kategori rumah tangga miskin.

Berdasarkan informasi tersebut dapat dihitung tingkat ketepatan klasifikasi dan nilai APER sebagai berikut, 𝑘𝑒𝑡𝑒𝑝𝑎𝑡𝑎𝑛 𝑘𝑙𝑎𝑠𝑖𝑓𝑖𝑘𝑎𝑠𝑖

=1207 + 24698

(4422 + 25530) 𝑥100%

𝑘𝑒𝑡𝑒𝑝𝑎𝑡𝑎𝑛 𝑘𝑙𝑎𝑠𝑖𝑓𝑖𝑘𝑎𝑠𝑖 = 86.49%

sedangkan: 𝐴𝑃𝐸𝑅 = 100% − 𝑘𝑒𝑡𝑒𝑝𝑎𝑡𝑎𝑛 𝑘𝑙𝑎𝑠𝑖𝑓𝑖𝑘𝑎𝑠𝑖 𝐴𝑃𝐸𝑅 = 100% − 86.49% 𝐴𝑃𝐸𝑅 = 13.51%.

Sehingga dapat disimpulkan bahwa ketepatan klasifikasi dengan pendekatan MARS adalah sebesar 86.49% dengan tingkat kesalahan 13.51%.

Selanjutnya dilakukan pendekatan bagging untuk mengetahui akurasi klasifikasi dari model MARS. Bagging dengan tiga puluh replikasi terbukti dapat menunjukkan akurasi klasifikasi model MARS dengan dataset tunggal, perbandingan hasil klasifikasi untuk setiap {£(𝐵)} dengan hasil klasifikasi model MARS dataset tunggal beserta penurunan tingkat kesalahan klasifikasinya ditampilkan pada tabel 9.

Page 11: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

11

Tabel 9 Perbandingan tingat kesalahan klasifikasi dari bagging dan dataset tunggal dan pemurunan klasifikasinya

{£(𝑩)} misclassificationB misclassification rate model MARS dataset tunggal

penurunan misclassification rate

{£(15)} 0.1363 0.1351 -0.009 {£(20)} 0.1362 0.1351 -0.008 {£(25)} 0.1425 0.1351 -0.055 {£(30)}* 0.1351 0.1351 0.000 {£(35)} 0.1366 0.1351 -0.011

*) replikasi terbaik Tabel 9 menunjukkan bahwa {£(15)}, {£(20)}, {£(25)}, dan {£(35)} belum berhasil mem-berikan akurasi klasifikasi yang lebih baik daripada klasifikasi model MARS dengan dataset tunggal. Penurunan tingkat kesalahan klasifikasi yang benilai nagatif menunjukkan bahwa tingkat kesalahan klasifikasi bagging lebih besar daripada tingkat kesalahan klasifikasi dengan dataset tunggal. Namun {£(30)} dapat memberikan akurasi klasifikasi, dengan memberikan tingkat misklasifikasi yang konvergen. Sehingga dapat disimpulkan bahwa bagging dengan tiga puluh replikasi dataset berhasil menunjukkan akurasi klasifikasi dari MARS dengan dataset tunggal..

8. Kesimpulan dan Saran Hasil analisis statistik deskriptif terhadap variabel prediktor 𝑥𝑖 berdasarkan kelompok variabel respon y menunjukkan adanya perbedaan karakteristik kesejahteraan rumah tangga pada rumah tangga miskin dan tidak miskin berdasarkan beberapa aspek, di antaranya juga telah terbukti perbedaannya secara signifikan pada pada α=0.05; α=0.01; α=0.001. Dari ketujuh belas variabel prediktor, didapati hanya empat belas variabel prediktor yang memberikan kontribusi terhadap model yang menggambarkan hubungan kesejahteraan rumah tangga di Jawa Timur dengan faktor-faktor yang mempengaruhinya, yang ditulis pada persamaan (4). Lima variabel dengan tingkat kontribusi tertinggi adalah jumlah anggota rumah tangga (X5), adanya anggota rumah tangga yang menggunakan telepon selular (X16), bahan bakar utama untuk memasak (X13), pengalaman membeli beras raskin selama tiga bulan terakhir (X15) dan tingkat pendidikan kepala rumah tangga (X4) dengan tingkat kepentingan masing-masing 100%, 57.04%, 45.11%, 29.18%, dan 26.29%. Klasifikasi kesejahteraan rumah tangga di

Jawa Timur dengan pendekatan MARS bagging dengan tiga puluh replikasi dataset terbukti dapat menunjukkan akurasi klasifi-kasi dari model MARS dengan dataset tung-gal. Pendekatan tersebut memberikan nilai kesalahan klasifikasi yang konvergen, yaitu 13.51%, dengan tingkat ketepatan klasifikasi sebesar 86.49%. Daftar Pustaka Aeni, Een Q.. (2009). Pendekatan CART

Arcing untuk Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Tengah [Thesis]. Institut Teknologi Sepuluh Nopember. Surabaya.

Agresti, A.. (1990). Categorical Data Analysis. John Wiley and Sons. New York.

Anonim. (2011). Scatter Plot. www.en.wikipedia.org (11 Pebruari 2011).

____. (2011). Matrix Plot. www.resample.com (11 Pebruari 2011).

Badan Pusat Statistik. (2009). Berita Resmi Statistik: Profil Kemiskinan di Indonesia Maret 2009. BPS. Jakarta.

____. (2009). Hasil Survei Sosial Ekonomi Nasional Tahun 2008 Provinsi Jawa Timur. BPS Provinsi Jawa Timur. Surabaya.

____. (2009). Meta Data Subdit Statistik Kerawanan Sosial. www.bps.go.id (3 Maret 2011)

____. (2009). Hasil Survey Sosial Ekonomi Nasional Tahun 2008 Propinsi Jawa Timur. BPS Jawa Timur. Surabaya.

____ dan The World Bank Institute. (2002). Dasar-dasar Analisis Kemiskinan. Jakarta.

Page 12: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

12

Breiman, L. (1994). Bagging Predictor. Technical Report No. 421. Department of Statistics University of California.

Budiantara, I.N., Suryadi, F., Otok, B.W., Guritno, S.. (2006). Pemodelan B-Spline dan MARS Pada Nilai Ujian Masuk terhadap IPK Mahasiswa Jurusan Disain Komunikasi Visual UK. Petra Surabaya. Jurnal Teknik Industri, Vol 8 No. 1, Surabaya.

Bühlman, P. dan Yu, B.. (2002). Analyzing Bagging, The Annals of Statistics, Vol. 30 no. 4, hal 927-961.

Cahyat, A., Gonner, C., dan Haug, M.. (2007). Mengkaji Kemiskinan dan Kesejahteraan Rumah Tangga : Sebuah Panduan dengan Contoh dari Kutai Barat, Indonesia. CIFOR. Bogor.

Cox, D.R. dan Snell, E.J.. (1989). Analysis of Binary Data. Second Edition. Chapman & Hall. London.

Djumena, Erlangga. (2011). BPS: Angka Kemiskinan Turun Terus Sejak 2006. www.bisniskeuangan.kompas.com (22 Pebruari 2011).

Efron, B. dan Tibshirani, R.J.. (1993). An Introduction to the Bootstrap. Chapman Hall, New York.

Faturokhman, Molo dan Marcelinus. (1995). Kemiskinan dan Kependudukan di Pedesaan Jawa: Analisis data Susenas 1992. Yogyakarta : Pusat Penelitian Kependudukan Universitas Gadjah Mada.

Friedman, J.H.. (1991). Multivariate Adaptive Regression Splines. The Annals of Statistics, Vol. 19 No. 1 (Maret 1991).

____. dan Silverman, B.W. (1989). Flexible Parsimony Smoothing and Additive Modelling. Technometrics, 31.

Hastie, T., Tibshirani, R., Friedman, J.. (2001). The Elements of Statistical Learning: Data Mining, Inference and Prediction. Springer-Verlag, New York.

Johnson, R. A., Wichern, D. W.. (1992). Applied Multivariate Statistical Analysis. Prentice Hall. New Jersey.

Mandaku, Fentje. (2009). Pemodelan terhadap Kelulusan Siswa Masuk Kelas Akselerasi menggunakan Analisis Regresi Logistik dan Multivariate Adaptive Regression Spline [Thesis]. Institut Teknologi Sepuluh Nopember. Surabaya.

Nash, M.S., Bradford, D.F.. (2001). Parametric and Non Parametric Logistic regression for Prediction of Pre-cense/Absence of an Amphibian. Las Vegas, Nevada.

Otok, B.W.. (2008). Multivariate Adaptive Regression Spline. Pelatihan MARS. Surabaya.

____. (2010). Multivariate Adaptive Regression Spline. FMIPA ITS: Surabaya.

____, Guritno, S., Subanar, Haryatmi, S.. (2006). Bootstrap dalam MARS untuk Klasifikasi Perbankan. Inferensi Jurnal Statistik, Volume 2, N0. 1, Januari 2006. FMIPA ITS Surabaya.

Rahmawati, D.I.. (1999). Analisis Kesempatan Kerja Penduduk Miskin di Provinsi DKI Jakarta [Skripsi]. Sekolah Tinggi Ilmu Statistik. Jakarta.

Rusastra, IW dan Togar AN 2007 “Karakteristik Wilayah dan Keluarga Miskin di Perdesaan: Basis Perumusan dan Intervensi Kebijakan”. Pusat Analisis Sosial Ekonomi Pertanian, Bogor

Suryadarma, D., Akhmad, H., dan Nina, T.. (2005). Ukuran Obyektif Kesejahteraan Keluarga untuk Penargetan Kemiskinan : Hasil Uji Coba Sistem Pemantauan Kesejahteraan oleh Masyarakat di Indonesia. SMERU. Jakarta.

Sutaat. (2006). Hasil-hasil Penelitian Tahun 2006 Puslitbang Kesejahteraan Sosial. Pusat Penelitian dan Pengembangan Kesejahteraan Sosial, Badan Pendidikan dan Kesejahteraan Sosial, Departemen Sosial Republik Indonesia. Jakarta.

Sutton, C.D.. (2005). Classification and Regression Trees, Bagging, and Boosting, Handbook of Statistics, Vol. 24. hal 303-329.

Page 13: Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur ...digilib.its.ac.id/public/ITS-Undergraduate-16439-1307100059-Paper.pdf · an perkapita perbulan dibawah garis ke-miskinan ...

13

Tanur, Erwin. (2009), Model Kesejahteraan Rumah Tangga Di Propinsi DKI Jakarta Dengan Metode MARS. Institut Teknologi Sepuluh Nopember. Surabaya.

The World Bank. (2006). Making The New Indonesia Work For The Poor. The World Bank. Jakarta.

___. (2007). Understanding Poverty. The World Bank. Jakarta.

Wahyuningrum, S., 2008. “Pendekatan MARS untuk Ketepatan Klasifikasi Desa/Kelurahan Miskin di Kalimantan Timur Tahun”. Tesis Institut Teknologi Sepuluh November, Surabaya.

Walpole, R.E.. (1993). Pengantar Statistika-Edisi ke-3. Jakarta: PT. Garmedia Pustaka Utama.