MODEL PILIHAN KUALITATIF - · PDF filedimana s: peubah acak menyebar normal dgn nilai tengah...
Transcript of MODEL PILIHAN KUALITATIF - · PDF filedimana s: peubah acak menyebar normal dgn nilai tengah...
MODEL PILIHAN KUALITATIF
OlehBambang Juanda
Seringkali dalam suatu survei kita berhadapan dengan peubah kualitatif yang mempunyai skala pengukuran nominal atau ordinal. Nilai-nilai peubah respons kualitatif ini terbatas (limited dependent variable), bahkan sering hanya bernilai dua kemungkinan saja. Misalnya, apakah seseorang membeli mobil atau tidak; memilih atau tidak dalam Pilkada (pemilihan kepala daerah); punya penyakit jantung koroner atau tidak; dan masih banyak contoh lainnya. Peubah kualitatif yang hanya mempunyai dua kemungkinan nilai ini disebut peubah biner.
Seringkali dalam suatu survei kita berhadapan dengan peubah kualitatif yang mempunyai skala pengukuran nominal atau ordinal. Nilai-nilai peubah respons kualitatif ini terbatas (limited dependent variable), bahkan sering hanya bernilai dua kemungkinan saja. Misalnya, apakah seseorang membeli mobil atau tidak; memilih atau tidak dalam Pilkada (pemilihan kepala daerah); punya penyakit jantung koroner atau tidak; dan masih banyak contoh lainnya. Peubah kualitatif yang hanya mempunyai dua kemungkinan nilai ini disebut peubah biner.
Meskipun logis kita memperkirakan suatu hubungan langsung antara pendapatan dan perilaku pembelian, namun kita tidak dapat yakin apakah masing-masing konsumen dengan pendapatan tertentu pasti akan membeli produk. Oleh karena itu, tujuan model pilihan kualitatifadalah menentukan peluang bahwa individu dengan karakteristik-karakteristik tertentu akan memilih suatu pilihan tertentu dari beberapa alternatif yang tersedia. Jika pilihannya hanya ada dua alternatif disebut model pilihan biner.
Meskipun logis kita memperkirakan suatu hubungan langsung antara pendapatan dan perilaku pembelian, namun kita tidak dapat yakin apakah masing-masing konsumen dengan pendapatan tertentu pasti akan membeli produk. Oleh karena itu, tujuan model pilihan kualitatifadalah menentukan peluang bahwa individu dengan karakteristik-karakteristik tertentu akan memilih suatu pilihan tertentu dari beberapa alternatif yang tersedia. Jika pilihannya hanya ada dua alternatif disebut model pilihan biner.
Overview
ContinuousLinear
RegressionAnalysis
Response Analysis
Continuous
Categorical
RegressionAnalysis
- -Model Peluang Linear
-Model Probit
IlustrasiStudi mengenai pengaruh tingkat pendapatan, jenis kelamin dan umur terhadap membeli tidaknya seseorang pada suatu produk yang dijual dengan harga tertentu.
Peubah Penjelas (bebas): umur, jenis kelamin dan tingkat pendapatan
Peubah Respons(Y): membeli (=1) atau tidak (=0)
Ilustrasi utk 1 Peubah BebasStudi mengenai pengaruh tk pendapatan atau jenis kelamin (X) terhadap membeli tidaknya seseorang (Y) pada suatu produk yang dijual dengan harga tertentu.
Peubah Penjelas (bebas): Tk Pendapatan: X = Rp …… juta
atau Jenis Kelamin: X= 1, jika Pria0, jika Wanita
Peubah Respons: Y = 1, jika membeli 0, jika tidak membeli
Peubah Penjelas (bebas): Tk Pendapatan: X = Rp …… juta
atau Jenis Kelamin: X= 1, jika Pria0, jika Wanita
1. Model Peluang LinearYi = + Xi + εi (10.1)
Dimana Xi = nilai karakteristik (misalnya pendapatan) individu ke-i,Yi = 1 , jika pilihan kesatu dipilih (misalnya membeli mobil)
0 , jika pilihan kedua dipilih (tidak membeli mobil).εi = peubah acak yang menyebar bebas dengan nilai tengah 0.
Untuk menginterpretasikan persamaan (10.1) kita tentukan nilai harapan dari masing-masing pengamatan peubah respons Yi :
E(Yi) = + Xi (10.2)Karena Yi hanya mempunyai kemungkinan dua macam nilai (1 dan 0), kita dapat menggambarkan sebaran peluang Y dengan memisalkan:
Pi = P(Yi=1) dan 1-Pi = P(Yi=0), sehingga E(Yi) = 1 (Pi) + 0 (1-Pi) = Pi. (10.3)
model (10.1) peluang bahwa individu konsumen ke-i dengan pendapatan tertentu (Xi) akan membeli mobil.
Slope garis mengukur pengaruh perubahan 1 unit pendapatan terhadap perubahan peluang membeli mobil
Yi = + Xi + εi (10.1)Dimana Xi = nilai karakteristik (misalnya pendapatan) individu ke-i,
Yi = 1 , jika pilihan kesatu dipilih (misalnya membeli mobil)0 , jika pilihan kedua dipilih (tidak membeli mobil).
εi = peubah acak yang menyebar bebas dengan nilai tengah 0.Untuk menginterpretasikan persamaan (10.1) kita tentukan nilai harapan dari masing-masing pengamatan peubah respons Yi :
E(Yi) = + Xi (10.2)Karena Yi hanya mempunyai kemungkinan dua macam nilai (1 dan 0), kita dapat menggambarkan sebaran peluang Y dengan memisalkan:
Pi = P(Yi=1) dan 1-Pi = P(Yi=0), sehingga E(Yi) = 1 (Pi) + 0 (1-Pi) = Pi. (10.3)
model (10.1) peluang bahwa individu konsumen ke-i dengan pendapatan tertentu (Xi) akan membeli mobil.
Slope garis mengukur pengaruh perubahan 1 unit pendapatan terhadap perubahan peluang membeli mobil
Dugaan Model Peluang Linear
+ Xi , jika 0<(+Xi)<1Pi = 1 , jika (+Xi) ≥ 1
0 , jika (+Xi) ≤ 0 (10.4)
Sebaran Peluang bagi εi
Yi εi Peluang
1 1- - Xi Pi1 1- - Xi Pi
0 - - Xi 1 - Pi
E(εi) = (1- - Xi) Pi + (- - Xi) (1-Pi) = 0 sehingga Pi = + Xi
(1-Pi) = 1 - - Xi
Ragam komponen sisaan
Jadi, peubah Y menyebar menurut sebaran (distribusi) peluang Bernouli. Masalah heteroskedastisitas
)1()1()()1()( 222iiiiiii PPPXPXE
E(εi) = (1- - Xi) Pi + (- - Xi) (1-Pi) = 0 sehingga Pi = + Xi
(1-Pi) = 1 - - Xi
Ragam komponen sisaan
Jadi, peubah Y menyebar menurut sebaran (distribusi) peluang Bernouli. Masalah heteroskedastisitas
)1()1()()1()( 222iiiiiii PPPXPXE
)()1()](1[)()()( 2222iiiiiiiii EPPYEYEYEYEYVar
Kendala dalam model peluang linear perlu transformasi model (linear) awal sedemikian rupa sehingga prediksi nilai Y berada dalam selang (0;1) untuk semua nilai peubah bebas X. Salah satu bentuk transformasi yang mempunyai karakteristik seperti ini adalah fungsi peluang kumulatif (cumulative probability function), F.[1] Sebaran peluangnya dapat direpresentasikan dalam bentuk:
Pi = F( + Xi) = F(Zi)
Sebenarnya banyak fungsi peluang kumulatif yang mungkin dapat digunakan, namun disini hanya dua macam yang dipertimbangkan, yaitu fungsi peluang normal danlogistik kumulatif.
[1] Fungsi peluang kumulatif adalah F(xi)=Peluang (X≤xi)
Kendala dalam model peluang linear perlu transformasi model (linear) awal sedemikian rupa sehingga prediksi nilai Y berada dalam selang (0;1) untuk semua nilai peubah bebas X. Salah satu bentuk transformasi yang mempunyai karakteristik seperti ini adalah fungsi peluang kumulatif (cumulative probability function), F.[1] Sebaran peluangnya dapat direpresentasikan dalam bentuk:
Pi = F( + Xi) = F(Zi)
Sebenarnya banyak fungsi peluang kumulatif yang mungkin dapat digunakan, namun disini hanya dua macam yang dipertimbangkan, yaitu fungsi peluang normal danlogistik kumulatif.
[1] Fungsi peluang kumulatif adalah F(xi)=Peluang (X≤xi)
Model ProbitPi = F( + Xi) = F(Zi)
asumsikan ada suatu indeks Zi yg bernilai kontinu secara teoritis, yg ditentukan oleh nilai peubah penjelas X shg dapat ditulis:
Zi = + Xiasumsikan bahwa Z merupakan peubah acak yang menyebar normal sehingga peluang bahwa Z lebih kecil (atau sama dengan) Zi dapat dihitung dari fungsi peluang normal kumulatif. Untuk fungsi peluang normal baku kumulatif dapat dituliskan dalam rumus:
dimana s: peubah acak menyebar normal dgn nilai tengah 0 dan ragam1. Dgn rumus transformasi diatas, peubah Pi akan bernilai dlm selang (0;1). Pi menggambarkan peluang individu berkarakteristik (berpendapatan) Ximemilih pilihan-1 (beli mobil). Karena nilai peluang ini diukur berdasarkan luas daerah dibawah kurva normal baku dari - sampai Zi, maka peluang pilihan-1 (beli mobil) makin tinggi jika nilai indeks Zi makin tinggi. Untuk menduga indeks Zi, kita menggunakan kebalikan (inverse) dari fungsi normal baku kumulatif (10.9) dengan:
Zi = F-1(Pi) = + Xi
iZ
sii dseZFP 22
2
1)(
Pi = F( + Xi) = F(Zi) asumsikan ada suatu indeks Zi yg bernilai kontinu secara teoritis, yg ditentukan oleh nilai peubah penjelas X shg dapat ditulis:
Zi = + Xiasumsikan bahwa Z merupakan peubah acak yang menyebar normal sehingga peluang bahwa Z lebih kecil (atau sama dengan) Zi dapat dihitung dari fungsi peluang normal kumulatif. Untuk fungsi peluang normal baku kumulatif dapat dituliskan dalam rumus:
dimana s: peubah acak menyebar normal dgn nilai tengah 0 dan ragam1. Dgn rumus transformasi diatas, peubah Pi akan bernilai dlm selang (0;1). Pi menggambarkan peluang individu berkarakteristik (berpendapatan) Ximemilih pilihan-1 (beli mobil). Karena nilai peluang ini diukur berdasarkan luas daerah dibawah kurva normal baku dari - sampai Zi, maka peluang pilihan-1 (beli mobil) makin tinggi jika nilai indeks Zi makin tinggi. Untuk menduga indeks Zi, kita menggunakan kebalikan (inverse) dari fungsi normal baku kumulatif (10.9) dengan:
Zi = F-1(Pi) = + Xi
iZ
sii dseZFP 22
2
1)(
Hubungan Nilai Indeks Z dan Sebaran Peluang Normal Kumulatifnya
Z F(Z) Z F(Z)-3.0 .001 0.5 .691-2.5 .006 1.0 .841-2.0 .023 1.5 .933-2.0 .023 1.5 .933-1.5 .067 2.0 .977-1.0 .159 2.5 .994-0.5 .309 3.0 .9990.0 .500 3.5 .999
Model (Peluang) Linear vs Model Probit
Model Linear
Meskipun model probit lebih menarik dari model peluang linear, namun untuk menduga parameter koefisiennya menggunakan pendugaan kemungkinan maksimum (maximum likelihood, ML) non linear. Selain itu, justifikasi atau interpretasi koefisiennya agak terbatas. Oleh karena itu sebaiknya menggunakan model logit yang dibahas dalam subbab berikut
Meskipun model probit lebih menarik dari model peluang linear, namun untuk menduga parameter koefisiennya menggunakan pendugaan kemungkinan maksimum (maximum likelihood, ML) non linear. Selain itu, justifikasi atau interpretasi koefisiennya agak terbatas. Oleh karena itu sebaiknya menggunakan model logit yang dibahas dalam subbab berikut
menggunakan peubah penjelasnya (dpt peubah kategorik atau peubah numerik) untuk menduga peluang kejadian tertentu dari peubah respons kategori.
)(
)(
10
10
1)/1(
i
i
X
X
iie
eXYE
Model Regresi Logistik (Model logit)
Model Logit Sederhana :
)()( 1
1
1
1)(
10XgXii
eePXP
i
Sebaran Logistik menyerupai kurva berbentuk S, sehingga interpretasinya logis. 0 ≤ E(Y/X) ≤ 1
Interpretasi: Peluang kejadian tertentu dari peubah respons kategori(misalnya membeli) jika pendapatannya Xi
Transformasi Logit Peluang kejadian tertentu dari peubah respons kategori (pi), ditransformasi shg
i indeks semua kasus (observasi 1,2,..,n).pi peluang kejadian (misalnya, membeli) terjadi
untuk kasus ke-i.log adalah natural log (bilangan dasar e).
logit( ) logpp
pi
i
i
1ii Xxg 10)(
Peluang kejadian tertentu dari peubah respons kategori (pi), ditransformasi shg
i indeks semua kasus (observasi 1,2,..,n).pi peluang kejadian (misalnya, membeli) terjadi
untuk kasus ke-i.log adalah natural log (bilangan dasar e).
Fungsi g(x) sudah Linear dalam Parameter, dan -~ ≤ g(x) ≤ ~, shg dpt diduga dgn OLS
Assumption (peubah X berskala Interval)
Pi
Predictor (X)
Transformasilogit
Predictor (X)
Interpretasi Koefisien Model LogitUtk Peubah Bebas biner, mis Jenis Kelamin (X=1, X=0)
)(101
1)1(1
e
P
0
0
1)0(
e
eP
)(
)(
10
10
1)1(
e
eP
01
1)0(1
e
P
)(
)(
10
10
1)(
i
i
X
X
ie
eXP
X=1 X=0
Y=1
Y=0 )(101
1)1(1
e
P01
1)0(1
e
P
Y=0
P(1) : Peluang membeli produk utk konsumen Pria
P(0) : Peluang membeli produk utk konsumen Wanita )1(1
)1(
P
POdd pria
)0(1
)0(
P
POddwanita
1 1Jumlah
eP
P
P
POddsRatio
)0(1
)0(/
)1(1
)1( 1
Interpretasi Koefisien
1 = g(X+1) – g(X)
utk X biner: 1 = g(1) – g(0)
ii
i
i XXgXP
XP10)(
)(1
)(log
))0(1/()0(
))1(1/()1(log
)01(1
)0(log
)1(1
)1(log
PP
PP
P
P
P
P
Ukuran Asosiasi
1
)0(1/)0(
)1(1/)1( e
PP
PP
Odds Ratio:
“Berapa kali Kemungkinan membeli utk konsumen Pria dibandingkan Konsumen Wanita”
Interpretasi Pendekatan Peluang Relatif P(1)/P(0) ini berlaku bila P(x) kecil
Utk X kontinu, exp(1) : Berapa kali Kemungkinan membelinya jika X naik 1 unit
Ukuran Asosiasi
Properties of the Odds RatioODDS RATIO
OF GROUP A TO GROUP BNo
Association
=x+1=x
0-0.5
• SK (1-) 100% bagi Odds Ratio: exp(c ± z/2 c s)
• Dlm realitas P(x) jika x berbeda 1 unit (12 dgn 1011) dapat cukup berbeda. →Dilema utk peubah kontinu dimodelkan linear dlm model logit. Jika yakin bahwa logit tdk linear dgn covariate grouping (Dummy)
^^
Note:
Multiple Logistic Regression
Purchase Gender Income AgePurchase Gender Income Age
logit (pi) = 0 + 1X1 + 2X2 + 3X3
Ilustrasi model utk mengkaji pengaruh jenis kelamin (X1), umur (X2), dan tingkat pendapatan (X2) terhadap membeli tidaknya seseorang pada suatu produk yang dijual dengan
harga tertentu.
logit (pi) = iiii
i
i XXXXgXP
XP3322110)(
)(1
)(log
)(
)(
332210
332210
1)(
iii
iii
XXX
XXX
ie
eXP
logit (pi) = iiii
i
i XXXXgXP
XP3322110)(
)(1
)(log
Utk Peubah Bebas X kontinu, seringkali 1 unit terlalu kecil atau besar utk dipertimbangkan Pendugaan utk perubahan “c” unit
1),()(
cexcxc
g(x+c) – g(x) = c 1
Odds Ratio-nya:
Pengujian Model dgn p Peubah Bebas
Uji Model secara keseluruhan:H0: 1= 2=…=p=0H1: ada j≠0Likelihood Ratio Test Statistics (G) ~Uji parsial koefisien:
H0: j=0H1: j≠0WaldTest Statistics (W) ~ Z
2(p)
Uji Model secara keseluruhan:H0: 1= 2=…=p=0H1: ada j≠0Likelihood Ratio Test Statistics (G) ~Uji parsial koefisien:
H0: j=0H1: j≠0WaldTest Statistics (W) ~ Z
(p)
Categorical Variables Codings
132 1,000 ,000144 ,000 1,000155 ,000 ,000240 1,000191 ,000
LowM ediumHigh
INCO M E
Fem aleM ale
G ENDER
Frequ ency (1) (2)Param eter codin g
Classification Tablea
236 33 87,7131 31 19,1
61,9
O bserved01
PURCHASE
O verall Percentage
Step 10 1
PURCHASE PercentageCorrect
Predicted
The cut value is ,500a.
Variables in the Equation
.025 .018 1 .974 1 .160 1 .026
.511 .209 5 .954 1 .015 1 .66712 .305 2 .002
-.787 .253 9 .676 1 .002 .455-.686 .243 7 .945 1 .005 .503
-1 .325 .720 3 .382 1 .066 .266
A G EG E ND E R(1 )IN CO M EIN CO M E (1 )IN CO M E (2 )Constan t
S tep1
a
B S .E . W a ld d f S ig . E xp(B)
V a riab le(s) en tered on s tep 1 : A G E , G E ND ER , IN CO M E.a .
Variables in the Equation
.025 .018 1 .974 1 .160 1 .026
.511 .209 5 .954 1 .015 1 .66712 .305 2 .002
-.787 .253 9 .676 1 .002 .455-.686 .243 7 .945 1 .005 .503
-1 .325 .720 3 .382 1 .066 .266
A G EG E ND E R(1 )IN CO M EIN CO M E (1 )IN CO M E (2 )Constan t
S tep1
a
B S .E . W a ld d f S ig . E xp(B)
V a riab le(s) en tered on s tep 1 : A G E , G E ND ER , IN CO M E.a .
Adjusted Odds Ratio
Predictor
Gender
Outcome
PurchaseGender Purchase
Controlling for
Types of Logistic Regression
Response Variable
Yes No
BinaryTwoCategories
Type ofLogistic Regression
BinaryYes No
Categories Binary
Nominal
Ordinal
Threeor
MoreCategories