MODEL REGRESI
LOGISTIK ORDINAL Ordinal Logistic Regression Model
Bahan Kuliah
Sekolah Tinggi Ilmu Statistik
(STIS)
Oleh: Agung Priyo Utomo
Contoh-contoh (1)
Sebuah perusahaan riset pemasaran meneliti faktor yang mempengaruhi ukuran/kandungan soda (kecil, menengah, besar atau ekstra besar) yang orang pesan pada sebuah rumah makan cepat saji. Faktor-faktor yang diteliti termasuk jenis sandwich yang dipesan (burger atau ayam), apakah juga memesan kentang goreng, dan usia konsumen.
Penelitian tentang faktor-faktor yang mempengaruhi perolehan medali (emas, perak, perunggu) dalam suatu olimpiade renang. Variabel yang diduga berpengaruh adalah lamanya waktu berlatih, diet yang dilakukan, usia, dan popularitas olahraga renang di daerahnya.
Penelitian tentang variabel yang mempengaruhi ketahanan pangan suatu wilayah (sangat tahan pangan, tahan pangan, cukup tahan pangan, tidak tahan pangan). Variabel yang digunakan adalah luas lahan pertanian tanaman pangan, kondisi tanah, PDRB, dan sebagainya.
Penelitian tentang variabel yang mempengaruhi kemiskinan rumahtangga di suatu wilayah (sangat miskin, miskin, tidak miskin). Variabel yang digunakan adalah pengeluaran untuk konsumsi, jumlah ART yg bekerja, dan sebagainya.
Contoh-contoh (2)
1. Cumulative Logits
Menggunakan peluang kumulatif:
Shg Cumulative Logits didefinisikan sbg:
Sebuah model logit [P(Y j)] dpt dipandang seperti model logit dg respon biner dimana kategori 1 s.d j sbg kategori pertama dan kategori j+1 s.d J sbg kategori kedua.
Model RLO (1)
2. Proportional Odds Model
Merupakan model yg secara simultan menggunakan semua cumulative logit:
Setiap cumulative logit memiliki intersep masing-masing
Nilai j meningkat seiring dg j, selama P(Y j|x) meningkat seiring dg j utk nilai x yg tetap.
Model tsb memiliki efek yang sama utk masing-masing logit
Untuk sebuah variabel prediktor x kontinyu dan J = 4, dpt digambarkan model sbb:
Model RLO (2)
Untuk j tertentu, kurva variabel respon mpk kurva regresi logistik dg variabel respon biner dengan kategori hasil Y j dan Y > j.
Kurva yg terbentuk memiliki kemiringan yg sama, namun berbeda posisi secara horisontal lihat gb. 7.3 Agresti (2nd) p.276
Cumulative logit model
memenuhi:
Model RLO (3)
Odds ratio dari peluang kumulatif ini disebut rasio kecenderungan kumulatif (cumulative odds ratio)
Nilai odds utk respon j pada x = x1 adalah exp['(x1 x2)] kali nilai odds pd x = x2.
Nilai logaritma dari odds ratio kumulatif proportional thd jarak antara x1 dan x2 berlaku utk setiap logit
Karena sifat tersebut McCullagh (1980) menyebutnya dg proportional odds model.
Utk variabel prediktor tunggal, odds ratio kumulatif sama dg exp() jika x1 x2 = 1.
Penghitungan peluang untuk kategori ke-j sbb:
Model RLO (4)
Penulisan persamaan regresi logistik ordinal:
Jika menggunakan SAS:
Jika menggunakan SPSS:
Model RLO (5)
Contoh: Mental Impairment (Agresti (2nd) p. 279)
Mental impairment mpk variabel respon
berskala ordinal (well,
mild symptom
formation, moderate
symptom formation,
impaired).
The life events index (x1) is a composite
measure of the number
and severity of
important life events
such as birth of child,
new job, divorce, or
death in family that
occurred to the subject
within the past 3 years.
Socioeconomic status (x2). SES is measured
here as binary (1 =
high, 0 = low).
Output: Mental Impairment
Model untuk kasus di atas:
Output: Mental Impairment
Ilustrasi model:
Misal seseorang yg memiliki kategori SES low (x2 = 0) dan rata-rata skor life events (x1) = 4,275, maka prob mental impairment berkategori 1 (well) adalah
Koef. SES = 1,1112; pd index life events yg konstan,
Kecenderungan seseorang dg SES berkategori 1 untuk memiliki mental well (dibandingkan minimal mild) sebesar exp(1,1112) kali dibandingkan org dg SES berkategori 0.
Kecenderungan seseorang dg SES berkategori 1 untuk memiliki mental maks mild (dibandingkan minimal moderate) sebesar exp(1,1112) kali dibandingkan org dg SES berkategori 0.
Kecenderungan seseorang dg SES berkategori 1 untuk memiliki mental maks moderate (dibandingkan dg impaired) sebesar exp(1,1112) kali dibandingkan org dg SES berkategori 0.
Analisis RLO menggunakan SPSS (1)
Sebuah studi bertujuan untuk melihat faktor-faktor yang mempengaruhi keputusan melanjutkan pendidikan ke jenjang yg lebih tinggi. Penelitian dilakukan terhadap siswa SMA apakah mereka tidak ingin melanjutkan, memiliki keinginan kuat, atau sangat kuat (apply, masing-masing diberi kode 0, 1, 2). Variabel yg diteliti meliputi data tentang status pendidikan orang tua (pared, kode 0 = maks SMA & 1 = diatas SMA), apakah SMA Swasta (0) atau Negeri (1) (public), dan IPK (gpa).
Data yg digunakan bersumber dari http://www.ats.ucla.edu/stat/spss/dae/ologit.htm
Menu yg dipilih:
Analisis RLO menggunakan SPSS (2)
RLO mengasumsikan
bhw persamaan yg terbentuk
adalah paralel shg dalam
interpretasi menjadi mudah
Variabel bebas numerik atau yg sudah dinumerik-kan
Analisis RLO menggunakan SPSS (3)
Output RLO menggunakan SPSS (1)
Karena IPK (gpa)
kuantitatif/kontinu
Semua data valid
digunakan Digunakan untuk
mengetahui apakah
model dg beberapa
variabel bebas
lebih baik drpd
model tanpa
variabel bebas
(hanya intersep).
Nilai sig. sebesar 0.000 < (misal
5%) menunjukkan
bahwa model dg
variabel bebas
lebih baik dari
model tanpa
variabel bebas. [email protected]
Output RLO menggunakan SPSS (2)
Merupakan perkiraan/pendekatan untuk R2 seperti pada regresi OLS pada model non linier. (pada model
non linier tidak bisa dihitung R2 scr langsung spt pada
model regresi OLS).
Terdapat banyak jenis pseudo R2, dan masing-masing akan memberikan nilai perkiraan yg berbeda
Untuk menguji hipotesis: H0: Model cocok vs H1: model tidak cocok
Hasil menunjukkan bahwa nilai sig. (p-value) > (misal 5%), yg berarti model regresi cocok
Pendidikan ortu (pared) dan IPK (gpa) signifikan
(pd = 5%) mempengaruhi keinginan untuk melanjutkan studi
Test of Parallel Lines
Tujuan: menguji apakah koefisien slope sama untuk setiap kategori variabel respon
Hipotesis yg diuji:
H0: H1:
Penulisan Persamaan & Interpretasi
Persamaan regresi logistik ordinal:
( 0
( > 0)= 2,203 1,048 + 0,059 0,616
( 1
( > 1)= 4,299 1,048 + 0,059 0,616
Interpretasi: Tanda (-) pd variabel pared berarti siswa dg org tua berpendidikan diatas SMA
memiliki kecenderungan yg lebih kecil (dibandingkan siswa dg ortu berpendidikan maks SMA) utk tidak ingin melanjutkan (dibandingkan minimal memiliki keinginan kuat utk melanjutkan studi)
Koef variabel pared = -1,048, berarti siswa dg org tua berpendidikan diatas SMA memiliki kecenderungan sebesar 0,3506 kali (dibandingkan siswa dg ortu berpendidikan maks SMA) utk tidak ingin melanjutkan (dibandingkan minimal memiliki keinginan kuat utk melanjutkan studi)
Koef variabel pared = -1,048, berarti siswa dg org tua berpendidikan diatas SMA memiliki kecenderungan sebesar 0,3506 kali (dibandingkan siswa dg ortu berpendidikan maks SMA) utk maks memiliki keinginan kuat untuk melanjutkan (dibandingkan memiliki keinginan sangat kuat utk melanjutkan studi)
LATIHAN
Table 7.19 refers to a clinical trial for the treatment of small-cell lung cancer. Patients were randomly assigned to two treatment groups. The sequential therapy administered the same combination of chemotherapeutic agents in each treatment cycle; the alternating Therapy had three different combinations, alternating from cycle to cycle.
a) Fit a cumulative logit model with main effects for treatment and gender. Interpret.
b) Fit the model that also contains an interaction term. Interpret. Does it fit better? Explain why it is equivalent to using the four gender treatment combinations as levels of a single factor.
Top Related