ANALISIS REGRESI GANDA LOGISTIK

30
Multiple Regression Logistic ANALISIS REGRESI GANDA LOGISTIK

description

ANALISIS REGRESI GANDA LOGISTIK. Multiple Regression Logistic. Pengertian Regresi Logistik:. - PowerPoint PPT Presentation

Transcript of ANALISIS REGRESI GANDA LOGISTIK

Page 1: ANALISIS REGRESI GANDA LOGISTIK

Multiple Regression Logistic

ANALISISREGRESI GANDA LOGISTIK

Page 2: ANALISIS REGRESI GANDA LOGISTIK

Pengertian Regresi Logistik:

Suatu model matematik yang digunakan untuk mempelajari hubungan satu atau beberapa variabel independen dengan satu variabel dependen yang bersifat dikotomi (binary). Variabel bianry : adalah variabel yang hanya memiliki dua nilai, misalnya (sakit / sehat), (merokok/ tdk merokok), (BBLR/ normal) dll

Variabel Independen (prediktor) sebaiknya kategorik, agar mudah untuk menginterpretasikan hasil analisisnya.

Bila variabel prediktor 3 kategori atau lebih, maka dibuat dua kategori. Caranya ; dummy variabel, kategori ulang sesuai logika biologik.

Page 3: ANALISIS REGRESI GANDA LOGISTIK

Analisis regresi ganda logistik adalah alat statistik yang sangat kuat untuk menganalisis hubungan antara paparan dan penyakit dengan serentak mengontrol pengaruh sejumlah faktor perancu potensial.

Tujuan analisis regresi ganda logistik yaitu menemukan model regresi yang paling sesuai, paling irit, sekaligus masuk akal secara biologik, untuk menggambarkan hubungan antara variabel dependen dan satu set variabel prediktor dalam populasi.

Manfaat analisis regresi ganda : (a) Meramalkan terjadinya variabel dependen pada individu berdasarkan nilai-nilai sejumlah variabel prediktor yang ada pada individu tersebut.

Pengertian Regresi Logistik ............................

Page 4: ANALISIS REGRESI GANDA LOGISTIK

Manfaat : (b) Mengukur hubungan antara veriabel respon dan prediktor, setelah mengontrol pengaruh prediktor (kovariat) lainnya.

Pengertian Regresi Logistik ............................

Page 5: ANALISIS REGRESI GANDA LOGISTIK

Keistimewaan Regresi Logistik Ganda

(a) Kemampuan kengkonversi koefisien regresi (bi) menjadi rasio odds (OR). OR = exp [bi]

(b) Kemampuan menaksir probabilitas individu untuk sakit (mengalami event) berdasarkan nilai-nilai sejumlah variabel prediktor, dengan rumus sebagai berikut :

Page 6: ANALISIS REGRESI GANDA LOGISTIK

Macam Regresi logistik :

1. Regresi logistik sederhana Untuk mempelajari hubungan antara satu variabel prediktor dengan satu variabel dependen dikotomus.

2. Regresi logistik ganda (Multiple Regression Logistic) Untuk mempelajari hubungan antara beberapa variabel prediktor dengan satu varibel dependen dikotomus.

Page 7: ANALISIS REGRESI GANDA LOGISTIK

Model Regresi Ganda Logistik

Ln (p/(1-p) = logodd (logit). Logaritme natural dari odds.

Odds : rasio probabilitas suatu peristiwa untuk terjadi dan probabilitas suatu peristiwa untuk tidak terjadi

a = Konstanta ( intersep)b1 , b2 , .... bk = koefisien regresi variabel prediktor (slope)X1, X 2 ....Xk = variabel prediktor yg pengaruhnya akan

diteliti.p = probabilitas untuk terjadinya “peristiwa”

dari variabel dependen yg dikotomus.

Page 8: ANALISIS REGRESI GANDA LOGISTIK

Pembangunan model regresi ganda logistik hendaknya tidak terjebak oleh penggunaan veriabel prediktor yang terlalu banyak.

Pemilihan variabel sebaiknya dilakukan dengan cara-cara yang lebih purposif, dan tidak terpaku pada pendekatan yang sifatnya deterministik menurut kamaknaan statistik.

Membangun Model Regresi Ganda Logistik

Page 9: ANALISIS REGRESI GANDA LOGISTIK

Makin banyak variabel yang dimasukkan dalam model hanya akan meningfkatkan kesesuaian garis regresi dengan hubungan antara variabel dependen dan sejumpan variabel prediktor pada data sampel, tetapi belum tentu menggambarkan hubungan tersebut pada tingkat populasi.

Hal itu disebabkan karena, bertambahnya variabel prediktor (baik yang relevan maupun tidak relevan) hanya akan menaikkan nilai taksiran kesalahan baku, sehingga membuat model tersebut sangat tegantung kepada data pengamatan sampel.

Kesimpulannya, model tersebut tidak merefleksikan / meggambarkan hubungan variabel respon dan variabel-variabel prediktor dalam populasi yang sesungguhnya.

MEMBANGUN MODEL REGRESI GANDA LOGISTIK .......................

Page 10: ANALISIS REGRESI GANDA LOGISTIK

PROSEDUR PEMILIHAN VARIABEL

Agar diperoleh model regresi yang baik adalah sebagai berikut :

1. Melakukan analisis univariate untuk menyaring variabel-variabel yang penting.

2. Memasukkan dan/ atau mengeluarkan variabel- variabel dalam model multivariate

3. Memasukkan dan memeriksa kemungkinan ada interaksi variabel dalam model.

Page 11: ANALISIS REGRESI GANDA LOGISTIK

Melakukan analisis univariate untuk penyaringan awal :

Uji statistik yang dipakai adalah : chi-quadrat

Jika ada variabel prediktor lebih dari dua kategori, maka dibuat menjadi dua kategori terlebih dahulu. Perlu diingat bahwa dalam melakukan recode harus mempunyai alasan biologik.

Mickey dan Greenland : variabel variabel yang mempunyai nilai p= 0,25 dan memiliki kemaknaan biologik hendaknya dipertimbangkan untuk dimasukkan ke dalam model multivariate.

Page 12: ANALISIS REGRESI GANDA LOGISTIK

Univariate ........

Batasan P= 0,25, untuk mengantisipasi kemungkinan variabel yang secara terselubung sesungguhnya penting untuk dimasukkan dalam model. “Terselubung” kemungkinan variabel variabel secara kolektif dapat menjadi prediktor penting, walaupun secara sendiri sendiri merupakan prediktor lemah.

Page 13: ANALISIS REGRESI GANDA LOGISTIK

Beberapa Metode :1. Enter 2. Stepwise3. Forward 4. Backward

Conditional, LR (likelihood ratio), Wald

Memasukkan / mengeluarkan variabel dalam model regresi :

Page 14: ANALISIS REGRESI GANDA LOGISTIK

Memeriksa Kemungkinan Interaksi

Jika dengan uji interaksi menunjukkan kemaknaan statistik, maka kita katakan interaksi memberikan kontribusi penting kepada model. Jika suatu interaksi hanya memperbesar taksiran kesalahan baku (S.E.) dan tidak mengubah taksiran koefisiens regresi (b1), maka interaksi tersebut mungkin tidak penting.

Page 15: ANALISIS REGRESI GANDA LOGISTIK

Latihan

Sebuah studi Kohor prospektif, meneliti pengaruh aktifitas fisik (AF) terhadap

kejadian infark otot jantung (MI). Variabel lain yang diukur adalah umur dalam

kategori (AGRP) dan kebiasaan merokok.

Page 16: ANALISIS REGRESI GANDA LOGISTIK

Kategorisasi nilai variabel

MI = 1 : sakit 0 : tidak sakitAF = 1 : aktifitas fisik >= 2500 kcal/ hari

0 : aktifitas fisik < 2500 kcal/hari

AGRP = 1 : umur >= 55 tahun 0 : umur < 55 tahun

Kebiasaan merokok = 2 : merokok >= 15 btg / hari

1 : merokok < 15 btg /hari 0 : tidak merokok

Page 17: ANALISIS REGRESI GANDA LOGISTIK

Varabel rancanganKebiasaan merokok - Jumlah variabel yang dibutuhkan ( k-1) 3-

1 : 2- Sebagai contoh MRK menjadi D1 dan D2- Sebagai salah satu rancangan pengkodean

variabel tersebut, maka variabel bukan perokok sebagai variabel acuan (refference) dengan kode D1=0 D2=0

- Selanjutnya merokok <15 btg / hari D1=1 D2=0

- Dan merokok >= 15 btg/hari D1=0 D2=1

Page 18: ANALISIS REGRESI GANDA LOGISTIK

Sehingga menjadi :

Variabel asli Variabel rancangan

MRK D1 D2

Tidak merokok 0 0Merokok < 15 btg / hari 1 0Merokok >= 15 btg / hari 0 1

http://www.ziddu.com/download/8461706/RegresiLogistik.rar.html

File download :

Page 19: ANALISIS REGRESI GANDA LOGISTIK

Cek kelayakan variabel untuk dimasukkan dalam model :

Menggunakan chi-square

Kriteria variabel yang masuk p=0,25

Page 20: ANALISIS REGRESI GANDA LOGISTIK

Hasil analisis univariate... ?

AF p=0,000AGRP p=0,000D1 p=0,000D2 p=0,052

Page 21: ANALISIS REGRESI GANDA LOGISTIK

Hasil Regresi Logistik

B S.E. Wald df Sig. Exp(B)

95,0% C.I.for EXP(B)

Lower UpperStep 1(a)

AF-2,243 1,019 4,846 1 ,028 ,106 ,014 ,782

AGRP2,013 ,977 4,242 1 ,039 7,487 1,102 50,848

D12,478 1,084 5,225 1 ,022 11,920 1,424 99,793

D22,673 1,316 4,130 1 ,042 14,490 1,100 190,922

Constant-1,915 ,995 3,699 1 ,054 ,147

Page 22: ANALISIS REGRESI GANDA LOGISTIK

Persamaan yg di dapat :

Vari abl es i n the Equat i on

-2, 243 1, 019 4, 846 1 , 028 , 106

2, 013 , 977 4, 242 1 , 039 7, 487

2, 478 1, 084 5, 225 1 , 022 11, 920

2, 673 1, 316 4, 130 1 , 042 14, 490

-1, 915 , 995 3, 699 1 , 054 , 147

AF

AG RP

D1

D2

Const ant

St ep1

a

B S. E. Wald df Sig. Exp( B)

Var iable(s) ent er ed on st ep 1: AF, AG RP, D1, D2.a.

1P= _________________________________________ - [a + b1 (AF)+b2(AGRP)+b3(D1)+b4(D2) 1 + e

Page 23: ANALISIS REGRESI GANDA LOGISTIK

Meramalkan Probabilitas Individu untuk mengalami sakit

Berdasarkan persamaan tersebut diatas, berapa probabilitas untuk mengalami sakit pada individu dengan kriteria sebagai berikut ?1) Melakukan aktifitas fisik 2.000 kcal / hari2) Berumur 35 tahun3) Merokok rata-rata 5 btg / hari

Page 24: ANALISIS REGRESI GANDA LOGISTIK

Perhitungan :

1P= _________________________________________ - [-1,9146 – 2,2431(AF) + 2,0131 (AGRP) + 2,4782(D1) + 2,6734(D2)] 1 + e

Vari abl es i n the Equat i on

-2, 243 1, 019 4, 846 1 , 028 , 106

2, 013 , 977 4, 242 1 , 039 7, 487

2, 478 1, 084 5, 225 1 , 022 11, 920

2, 673 1, 316 4, 130 1 , 042 14, 490

-1, 915 , 995 3, 699 1 , 054 , 147

AF

AG RP

D1

D2

Const ant

St ep1

a

B S. E. Wald df Sig. Exp( B)

Var iable(s) ent er ed on st ep 1: AF, AG RP, D1, D2.a.

Page 25: ANALISIS REGRESI GANDA LOGISTIK

1P= _________________________________________ - [-1,9146 – 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)] 1 + e

Berdasarkan persamaan tersebut diatas, berapa probabilitas untuk mengalami sakit pada individu dengan kriteria sebagai berikut ?

1) Melakukan aktifitas fisik 2.000 kcal / hari

2) Berumur 35 tahun

3) Merokok rata-rata 5 btg / hari

AF = 0 tidak berisikoUmur = 0 tidak berisikokMerokok < 15 batang D1 = 1 D2=0

Page 26: ANALISIS REGRESI GANDA LOGISTIK

Perhitungan :

1P= _________________________________________ - [-1,9146 – 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)] 1 + e

= 0,64 64%

In mathematics, the exponential function is the function ex, where e is the number (approximately 2.718281828)

Page 27: ANALISIS REGRESI GANDA LOGISTIK

Interpretasi :Individu yang berumur 35 tahun dan hanya melakukan aktifitas fisik sebesar 2.000 kcal / hari, serta membunyai kebiasaan merokok 5 batang per hari, maka memiliki probabilitas untuk terkena MI sebesar 64%.

Page 28: ANALISIS REGRESI GANDA LOGISTIK

TERIMAKASIH

Page 29: ANALISIS REGRESI GANDA LOGISTIK

Interaksi

Asumsi adanya Interaksi1. Logika substantif / biologik2. Interaksi antara variabel a dan b, terjadi

bila efek a terhadap Y tergantung nilai b, atau efek b terhadap Y tergantung nilai a.

Page 30: ANALISIS REGRESI GANDA LOGISTIK