Regresi Binary Logistic

of 34 /34
Agung Priyo Utomo - STIS MODEL REGRESI MODEL REGRESI LOGISTIK LOGISTIK Oleh: Agung Priyo Utomo [email protected] [email protected]

Embed Size (px)

Transcript of Regresi Binary Logistic

Agung Priyo Utomo - STIS MODEL REGRESI LOGISTIK Oleh: Agung Priyo Utomo [email protected] [email protected] Priyo Utomo - STIS VARIABEL KUALITATIF/KATEGORIK Variabel Kualitatif/Kategorik sebagai variabel bebas Jenjang Pendidikan: SD, SLTP, SLTA, SLTA+ Jenis kelamin: Laki-laki, Perempuan Status daerah: Kota, Desa Status bekerja: Bekerja, Tidak Bekerja Variabel Kualitatif sebagai variabel tak bebas Pilihan Investasi: Saham, Valas, Obligasi, Deposito, Emas Pilihan Moda Transportasi ke tempat kerja: Kereta, Bus, Motor, Mobil Pribadi, Jalan kaki Lapangan kerja yg dimasuki: Pertanian, Non pertanian Agung Priyo Utomo - STIS REGRESI DG VARIABEL TAK BEBAS KUALITATIF 1. Apa yang mempengaruhi pilihan transportasi kerja?Variabel Tak bebas: Pilihan moda transportasi (kategorik): Kereta, bus, motor, mobil pribadi Variabel bebas: Jarak ke tempat kerja, Pendapatan (rupiah), Harga BBM, Kondisi Jalan, Kenyamanan 2. Apakah punya rumah atau tidak Variabel tak bebas: Kepemilikan rumahVariabel bebas: Pendapatan Keluarga, Banyaknya Anggota Keluarga, Jenisrumah, Usia Kepala Keluarga. Agung Priyo Utomo - STIS REGRESI DG VARIABEL TAK BEBAS KUALITATIF 3. Apa yang mempengaruhi kemiskinan?Variabel Tak bebas: Status Kemiskinan (Miskin/Tidak Miskin) Variabel bebas: Tingkat Pendidikan, Lapangan Kerja yg dimasuki, Pendapatan, Pengeluaran, Jumlah ART 4. Apakah yang mempengaruhi lapangan kerja yg dimasuki? Variabel tak bebas: Lapangan KerjaVariabel bebas: Usia, Jenis Kelamin, Pendidikan, Status Perkawinan Agung Priyo Utomo - STIS PEMODELAN MATEMATIS Yi = |1 + |2 Xi + ci

X=pendapatan keluarga Y=1 ;bila suatu keluarga punya rumah 0 ;bila suatu keluarga tidak punya rumah Secara matematis, dengan mengasumsikan E(ci) = 0,E(Yi| Xi) = |1 + |2Xi Secara statistik, ekspektasi kondisional dari Yi jika diberikan Xi

E(Yi| Xi)= (Yi=1) P(Yi=1|Xi) + (Yi=0) P(Yi=0|Xi) = P(Yi = 1| Xi) Agung Priyo Utomo - STIS PEMODELAN MATEMATIS Misalpi : probabilita bahwa keluargaimemiliki rumah,yaitu bila Yi = 1;(1 pi ): probabilita bahwa keluarga i tidak memilikirumah, yaitu bila Yi = 0, maka, E(Yi| X) = (Yi=0) P(Yi=0|Xi) + (Yi=1) P(Yi=1|Xi)= P(Yi=1|Xi)= pi Akibatnya:E(Yi| Xi) = |1 + |2Xi = pi Karena 0 spis 1, akibatnya:0s|1 + |2 Xis1 Agung Priyo Utomo - STIS CONTOH Akan dilihat hubungan antara pernah-tidaknya melakukan perjalanan ke luar negeri, dan penghasilan per bulan.Model: Yi = |1 + |2 Xi + ci

Yi = 1;Pernah melakukan perjalanan ke luar negeri = 0; Tidak pernah melakukan perjalanan ke luar negeri Xi = Pendapatan Apakah estimator hasil OLS dapat menjamin bahwabesaran |1 + |2 Xi terletak antara 0 dan 1? Agung Priyo Utomo - STIS Kel. Pernah ke Luar Negeri Pendapatan(Juta Rp.) Kel. Pernah ke Luar Negeri Pendapatan(Juta Rp.) 0102,82114,3 0213,42215,6 0315,32301,4 0402,12400,9 0501,92517,3 0613,62601,3 0713,72716,3 0801,72813,7 0901,22901,9 1001,53002,0 1111,93114,2 1212,03203,2 1302,13314,0 1412,93413,0 1501,13501,0 1611,83600,9 1717,03712,4 1802,23812,3 1902,03901,7 2016,04015,0 DATA Agung Priyo Utomo - STIS ANALISIS Taksiran model yang ditaksir dengan OLSsbb: Yi = -0,0637 + 0,1986 Xi

R2 = 0,4665 Interpretasi Model Intercept = -0,0637; Bila pendapatan Rp. 0, maka probabilitas bahwa orang tersebut pernah melakukan perjalanan ke luar negeri adalah negatif. Bila pendapatan lebih kecil dari Rp 321.000, probabilitas orang tersebut pernah melakukan perjalanan ke luar negeri masih negatif. Agung Priyo Utomo - STIS Bila pendapatan lebih besar Rp. 321.000probabilitas orang tersebut pernah melakukan perjalanan ke luar negeri positif. Tetapi, bila pendapatan lebih besar dari Rp. 5,4 juta, probabilitas pernah melakukan perjalanan ke luar negeri lebih dari satu. Slope = 0,1986, artinya bila pendapatan naik 1 unit (Rp.1 juta) probabilitas seseorang untuk melakukan perjalanan keluar negeri naik 20%. ANALISIS Agung Priyo Utomo - STIS Masalah:Persyaratan 0 s E(Yi | Xi) s 1 sulit untuk dipenuhi, bagaimana mengatasinya? Ada dua cara untuk mengatasi hal tersebut : Estimate modelnya dengan OLS. Bila E(Yi| Xi) terletak antara 0 dan 1 berarti tidak ada masalah Bila E(Yi| Xi) > 1, kita anggap E(Yi| Xi) = 1 Bila E(Yi| Xi) < 0, kita anggap E(Yi| Xi) = 0 E(Yi| Xi) akhirnya akan terletak antara 0 dan 1.Metode ini tidak populer karena kurang realistis. Agung Priyo Utomo - STIS Masalah:Persyaratan 0 s E(Yi | Xi) s 1 sulit untuk dipenuhi, bagaimana mengatasinya? Kita estimate model Yi = |1 + |2 Xi + i dengansuatu metode yang akan menjamin bahwa E(Yi| Xi) terletak antara 0 dan 1. Ada dua macam teknik yang dapat digunakan, yaitu : (i).Logit Logistic Regression (ii). Probit Probit Regression Agung Priyo Utomo - STIS LOGIT (FUNGSI LOGISTIK)Didefinisikan: ) X (i i ii 2 1e 11) X 1 Y ( E p| + | += = =

atauiZie 11p+=;dimana : Zi = |1 + |2 Xi

Pengamatan : pi terletak antara 0 dan 1, karena Zi terletak antara - dan . Bila Z ,makapi 1 Bila Z - , makapi 0 pi mempunyai hubungan non linier dengan Zi Agung Priyo Utomo - STIS LOGIT (FUNGSI LOGISTIK)

Secara keseluruhan, Model Logit adalah Model Non-Linier, baik dalam parameter maupun dalam variabel Oleh karena itu, metode OLS tidak dapat digunakan untuk mengestimasi model logit.Agung Priyo Utomo - STIS Definisi Logit:izie 11p+=iiizzzie 1ee 11p 1+=+= Sekarang, perhatikan rasio antara pi dan 1 pi : i 2 1 iiiiix zzzzziie ee1e 1ee 11p 1p| + |= = =||.|

\|+|.|

\|+=

Agung Priyo Utomo - STIS PerbandinganitudisebutOddsatauseringjuga disebut resiko. Untuk contoh perjalanan ke luar negeri, maka odd ratio merupakan perbandingan antara probabilitas seseorangpernahpergikeluarnegeridengan probabilitasseseorangtidakpernahpergikeluar negeri. Misalkansajabahwaprobabilitasseseorang pernahkeluarnegeriadalah80%.Dengan demikian,probabilitasbahwaseseorangtidak pernahpergikeluarnegeriadalah20%.Sehingga nilai odds adalah 4 banding 1.Agung Priyo Utomo - STIS Makinbesaroddsini,makinbesarkecenderungan seseorang pernah pergi ke luar negeri. Ekstrimnya,bilapkecilsekali,maka1pdekat dengan 1. Akibatnya odds mendekati nol. Sebaliknya,bilapdekatdengan1,maka1p mendekati nol. Sehingga odds sangat besar. Denganperkataanlain,oddsadalahsuatu indikatorkecenderunganseseorangpernahpergi ke luar negeri Ringkasnya,bilaoddsmendekatinolberarti kecenderunganseseorangpernahpergikeluar negeri sangat kecil sekali. Agung Priyo Utomo - STIS Bila odds ini kita log-kan, akan kita dapatkan log odds sebagai berikut: i 2 1 iiiix zp 1pln L | + | = =||.|

\|=Sehinggamodelyangakankitaperhatikanataukita analisis menjadi : i 2 1iiixp 1pln L | + | =||.|

\|= Ldisebutlog odds Catatan : L linier dalam X, juga linier dalam |1 dan |2 L disebut model Logit Karena0 s p s 1,L terletak antara - dan L tidak linier dalam p Agung Priyo Utomo - STIS |2 menyatakan perubahan dalamLbilaxberubah 1 unit |1 menyatakan log odds pada saat pendapatan sama dengan nol. Bila kita mengetahui tingkat pendapatan keluarga, katakanlah xi, kita dapat menghitung probabilitas bahwa seseorang pernah ke luar negeri dengan cara menghitung : Masalahnyasekarangbagaimanamenaksir|1dan |2 ? MLE ) x (ii 2 1e 11p| + | +=Agung Priyo Utomo - STIS PENGUJIAN SIGNIFIKANSI MODEL & PARAMETER Uji seluruh parameter (Uji G) H0 : |1 = |2 = .. = |P = 0 H1 : sekurang-kurangnya terdapat satu |j = 0 Statistik uji yang digunakan :((

=A) (Model likelihoodB) (Model likelihoodln 2 GModel B:model yang hanya terdiri dari konstanta saja Model A:model yang terdiri dari seluruh variabel Agung Priyo Utomo - STIS PENGUJIAN SIGNIFIKANSI MODEL & PARAMETER P2,o_ G berdistribusiKhi Kuadrat dengan derajat bebaspatau G ~ _p2. H0 ditolak jikaG> ;o :tingkat signifikansi. Bila H0 ditolak, artinya model A signifikan pada tingkat signifikansi o. Agung Priyo Utomo - STIS UJI SIGNIFIKANSI TIAP-TIAP PARAMETER: UJI WALD 212jjj~)( .e. sW _(((

||=H0: j = 0, untuk suatu j = 0, 1, , p H1: j 0 Statistik Uji yang digunakan: Pada tingkat signifikansi o, H0 akan ditolak bila Artinya parameter yang diuji signifikan pada tingkat signifikansi o 21 , jWo_ >Agung Priyo Utomo - STIS INTERPRETASI MODEL / PARAMETER Interpretasi koefisien-koefisien dalam model regresi logistik dilakukan melalui odds ratio (perbandingan resiko) atau adjusted probability (probabilitas terjadi). Odds didefinisikan dg p/(1-p), dimana p menyatakan probabilitas sukses (terjadinya peristiwa y = 1) dan 1-p menyatakan probabilitas gagal (terjadinya peristiwa y = 0). Odds Ratio (perbandingan resiko), adalah perbandingan nilai Odds (resiko) pada dua individu ; misalkan individu A dan individu B. Agung Priyo Utomo - STIS INTERPRETASI MODEL / PARAMETER Odds Ratio dituliskan sebagai. ;) X ( p 1) X ( p) X ( p 1) X ( pBBAA((((

= +XA : karakteristik individu A XB : karakteristik individu B Agung Priyo Utomo - STIS Adjusted probabilitas merupakan probabilitas terjadinya suatu peristiwa y = 1 dengan karakteristik yang telah diketahui. Dituliskan dg: dimana z = |0 + |1 x1 + . + |p xp (z) exp 1(z) . exp) x | 1 y ( P+= =ADJUSTED PROBABILITY Agung Priyo Utomo - STIS Variabel bebas: kategorik Membandingkan nilai odds dari salah satu nilai pada variabel tersebut dengan nilai odds dari nilai lainnya (Referensi). Misalkan kedua kategori tersebut adalah 1 dan 0 dengan 0 yang digunakan sebagai kategori referensi, maka interprestasi koefisien pada variabel ini adalah rasio dari nilai odds untuk kategori 1 terhadap nilai odds untuk kategori 0; dituliskan sebagai: ) .( exp) 0 x ( p 10) x ( p) 1 p(x - 11) p(x jjjjj| =||.|

\|= ==== +INTERPRETASI PARAMETER Agung Priyo Utomo - STIS Artinya resiko terjadinya peristiwa y=1 pada kategori xj = 1 sebesar exp. ( |j ) kali resiko terjadinya peristiwa y=1 pada kategori xj = 0. Variabel Bebas: Kontinyu (tidak kategorik) Setiap kenaikan C unit satuan pada variabel bebas akan mengakibatkan resiko terjadinya y = 1 sebesar exp ( C.|j ) kali lebih besar Agung Priyo Utomo - STIS Siapa pilih ParPolITU? Analisis hubungan antara karakteristik pemilih dengan pilihan parpol Variabel yg diduga berpengaruh terhadap pilihan: 1. PendidikanPendidikan dapat mencerminkan tingkat pengetahuan dan kecocokannya dengan program partai 2. Lapangan pekerjaan Pekerjaan sebagai proksi tingkat strata ekonomi pemilih ILUSTRASI Agung Priyo Utomo - STIS Variabel Tak Bebas: Apakah memilih partai ITU pada PEMILU lalu? Misal Ya = 1 dan Tidak = 0 Variabel bebas: Pendidikan tertinggi yg ditamatkan: Tidak Sekolah, Tidak tamat SD & Tamat SD = 1 SLTP dan SLTA = 2 Diploma I/II/III/Akademi, S-1, dan S-2/S-3 = 3 Definisi operasional: Pendidik1= 1; Tdk sekolah, Tidak tamat SD, & Tamat SD = 0; Lainnya Pendidik2 = 1; SLTP dan SLTA = 0; Lainnya Pembanding: kelompok yg lulus pendidikan tinggi Agung Priyo Utomo - STIS Lapangan Pekerjaan Utama: Pertanian= 1 Industri = 2 Perdagangan= 3 Definisi operasional: Pekerja1= 1; Pertanian= 0; Lainnya Pekerja2 = 1; Industri = 0; Lainnya Pembanding: lapangan usaha Perdagangan. Identifikasi Model:Ln (p/1-p) = o +|1 Pendidik1 + |2Pendidik2 + o1 Pekerja1 + o2 Pekerja2 + c Model terestimasi: Ln (p/1-p) = 2,383 2,280 Pendidik1 1,831 Pendidik2 1,130 Pekerja1 0,299 Pekerja2Agung Priyo Utomo - STIS Uji G: Nilai 2 log likelihood = 189,331, berarti modelsignifikan secara statistik Uji Wald: semua koefisien signifikan secara statistik padao = 5%, kecuali koefisien pada variabel pekerja(2) Perlukah variabel tersebut dikeluarkan dari model? Interpretasi Bila pendidikan = 0, dan lapangan usaha = 0, atau disaat pendidikan seseorang tinggi, dan bekerja di sektor perdagangan, maka probabilitas mereka mendukung Partai ITU adalah sebesar: Ln (p/1-p)= 2,383 (p/1-p)= e2,383 p= e2,383/ (1 + e2,383) = 91,55%. Agung Priyo Utomo - STIS Slop untuk variabel Pendidik1 adalah 2,280, artinya peluang penduduk berpendidikan rendah untuk mendukung Partai ITU lebih rendah. Terbukti dari nilai Exp(B= -2,280) = 0,102, berarti bahwa peluang penduduk berpendidikan rendah hanya 0,102 kali peluang penduduk berpendidikan tinggi untuk memilih partai ITU Slop Pendidik2 adalah 1,831, artinya peluang penduduk berpendidikan SLTP/SLTA untuk mendukung Partai ITU lebih rendah. Terbukti dari nilai Exp (B= -1,831) = 0,16, artinya bahwa peluang penduduk berpendidikan menengah hanya 0,16 kali peluang penduduk berpendidikan tinggi.Agung Priyo Utomo - STIS Secara analog, peluang penduduk yang bekerja di sektor pertanian atau industri untuk mendukung partai lebih rendah dibanding penduduk yang bekerja di sektor perdagangan Peluang penduduk yang bekerja di sektor pertanian untuk mendukung partai hanya 0,323 kali penduduk yang bekerja di sektor perdagangan Penduduk yang bekerja di sektor industri hanya 0,742 kali penduduk yang bekerja di sektor perdagangan Agung Priyo Utomo - STIS MODEL MULTINOMIAL LOGIT Kasus: PilihanInvestasi (Deposito, Saham, Obligasi, SBI) Kasus: Pilihan alat transportasi (Kereta api, Bus ataukendaraan umum bukan KA, Mobil pribadi, Motor) Model logistik dg 4 kategori mempunyai 3 fungsi logit: Fungsi logit untuk Y = 1 relatif terhadap fungsi logit untuk Y = 0 Fungsi logit untuk Y = 2 relatif terhadap fungsi logit untuk Y = 0 Fungsi logit untuk Y = 3 relatif terhadap fungsi logit untuk Y = 0 Kategori Y = 0kita sebut sebagi kategori rujukan (reference group).