Berkenalan dengan Regresi Probit.pdf

1 | P a g e

Berkenalan dengan Regresi Probit

Wahyu Widhiarso Fakultas Psikologi Universitas Gadjah Mada

Yogyakarta | 2012

1 Pengantar

Ketika variabel dependen (Y) berbentuk dikotomi atau biner dan diasumsikan mengikuti distribusi binomial kita dapat menggunakan analisis regresi logit atau probit. Salah satu keuntungan untuk menggunakan regresi probit adalah bahwa nilainilai yang diperoleh dari pencocokan model (fitting) langsung dapat diubah menjadi probabilitas dengan menggunakan nilai dari tabel normal standar. Dalam hal ini kita hanya perlu mencari nilai probabilitas terkait dengan skor z yang diperoleh dari model.

2 Persamaan

Regresi linier dengan satu prediktor (X) didefinisikan dengan persamaan di bawah ini. B0 adalah intersep dan B1 adalah slope. Slope menunjukkan seberapa besar peranan prediktor (X) dalam menjelaskan variabel keluaran (Y).

0 1Y X

Regresi logistik dengan satu prediktor (X) didefinisikan dengan persamaan di bawah ini. Karena diterapkan pada data keluaran yang bersifat dikotomi (pilah), maka persamaan regresi ditransformasi menjadi probabilitas (P) yang merupakan kepanjangan dari P=1 (probabilitas untuk mendapatkan skor 1).

0 1

0 1

exp( )

1 exp( )

XP

X

atau 0 11

PLn X

P

Regresi Probit merupakan modifikasi regresi logistik dengan menetapkan persamaan regresi logit mengikuti distribusi normal. Dengan menggunakan regresi probit maka B0+B1X dilihat sebagai skor standar Z yang mengikuti distribusi normal, maka didapatkan :

exp( )

1 exp( )

ZP

Z

atau 1

PLn Z

P

Persamaan ini didasari pada distribusi normal (Φ) di bawah ini sehingga regresi probit ditunjukkan dengan Φ(Z) (Skrondal & Hesketh, 2004). Simbol

menunjukkan berlakunya fungsi deviasi standar distribusi normal (inverse standard normal distribution).

2

21

( 1) ( )2

t Z

P Y e dt z

2 | P a g e

Z adalah suatu variabel kontinu yang tidak teramati (laten) karena merupakan suatu "kecenderungan" munculnya sebuah kejadian. Jadi misalnya data teramati kita adalah lulus (kode 1) dan tidak lulus (kode 0), nilai Z menunjukkan kecenderungan atau probabilitas untuk lulus. Contoh lainnya adalah data pelanggan. Melakukan pembelian ulang (kode 1) dan tidak melakukan pembelian ulang (kode 0). Dalam kasus ini Z merupakan suatu kecenderungan pelanggan untuk melakukan pembelian ulang. Semakin besar nilai Z semakin besar kecenderungan pelanggan untuk melakukan pembelian ulang.

3 Hubungan antara Hasil Estimasi dan Probabilitas

Gambar di bawah ini menunjukkan hubungan antara hasil regresi probit dengan kurva normal yang diwujudkan dalam kontinum probabilitas. Ketika hasil persamaan regresi probit menghasilkan nilai nol, itu artinya nilai probabilitas yang dihasilkan sama dengan 50%. Ketika persamaan regresi probit menghasilkan nilai 1.645, itu artinya probabilitas yang didapatkan adalah 5%.

Luas Area 50% atau =0.050

1( ) (0.500) 0probit

Luas Area 5% atau =0.050

1( ) (0.050) 1.645probit

Luas Area 97.5% atau =0.975

1( ) (0.975) 1.96probit

Proses analisis dengan menggunakan program komputer akan menghasilkan nilai probit (Z) yang menunjukkan posisi individu dalam wilayah kurva normal. Oleh karena itu untuk menghasilkan informasi mengenai probabilitas yang dihasilkan kita perlu mentransformasinya dengan menggunakan tabel Z. Misalnya dengan memasukkan nilai individu yang memiliki X=1 ke dalam persamaan regresi kita dapatkan nilai untuk individu tersebut adalah Y=0. Nilai 0 ini kemudian ditransformasi melalui tabel Z menjadi 0.5 (50%).

Penghubung logit dan probit sering memberikan hasil yang sama meskipun penghubung probit mendiskriminasikan dengan lebih baik dan mendekati nilai median (0.5 respon probabilitas).

4 Praktek !

4.1.1 Data Kali ini kita meneliti seberapa besar probabilitas jejaka untuk memutuskan menikah didasarkan dari kesiapan (X1) dan tingkat kemandiriannya (X2).

3 | P a g e

Variabel keputusan menikah bersifat kategorikal, memutuskan menikah (kode 1) dan belum memutuskan menikah (kode 0). Data prediktor bersifat kontinyu karena didapatkan dari skor skala psikologi. Tabel di bawah ini contoh penampakan data ini.

4.1.2 Menganalisis Di program SPSS analisis regresi probit dengan tampilan data di atas lebih tepat dianalisis dengan menggunakan syntax. plum menikah with siap mandiri /link = probit /print = parameter summary.

Gambar di atas menunjukkan syntax yang dapat kita terapkan. Anda tinggal mengganti nama variabel di atas dengan nama variabel anda. Untuk kasus di atas, nama variabel yang dipakai disesuaikan dengan nama variabel di dalam data.

4.1.3 Hasil Analisis Berikut ini hasil output yang keluar dari SPSS.

Model Fitting Information. Bagian ini menunjukkan ‘kebaikan’ model yang kita kembangkan. Nilai 2 loglikelihood pada baris intercept only didapatkan dari model tanpa prediktor. Pada model tanpa prediktor ini nilai koefisien slope regresi diasumsikan sebesar nol (b1=0). Akibatnya hanya koefisien intersep saja yang dipakai. Berikut ini adalah model yang hanya melibatkan intersep () saja.

( ) oprobit

Model Final menggambarkan model yang mencakup variabel prediktor yang kita analisis. Nilai ini didapatkan dari proses iterasi untuk menemukan log likelihood

4 | P a g e

yang maksimal (baca tulisan estimasi maksimum likelihood di bab sebelumnya). Persamaan untuk model ini adalah sebagai berikut.

0 1( )probit X

Hasil analisis menunjukkan adanya perbedaan yang signifikan (2=113.463; p<0.05). Dapat disimpulkan bahwa melibatkan prediktor dalam model lebih baik daripada tidak melibatkannya sama sekali. Nilai df didapatkan dari jumlah prediktor yang dilibatkan di dalam model.

Pseudo R-Square. Rkuadrat dalam Regresi probit tidak sama dengan R kuadrat yang ditemukan dalam regresi linier (OLS). Namun demikian sejumlah ahli telah mencoba untuk mengembangkannya. Karena nilai ini tidak menunjukkan Rkuadrat yang sebenarnya maka dinamakan dengan R-Square pseudo (Rkuadrat semu).

Parameter Estimates. Bagian ini menunjukkan koefisien regresi. Probabilitas pengambilan keputusan menikah terprediksi dilaporkan dengan menggunakan koefisien ini. Nilai ambang (threshold) menunjukkan nilai konstan seperti halnya dalam regresi linier. Berdasarkan hasil di atas dapat dihasilkan persamaan regresi probit yang dihasilkan adalah:

1( ) ( )

1( ) -14.49 2.563( ) 0.229( )

F Z Z

F Z siap mandiri

Hasil analisis melalui program STATA dapat dilihat pada Tabel di bawah ini. . probit menikah siap mandiri Probit regression Number of obs = 100 LR chi2(2) = 113.46 Prob > chi2 = 0.0000 Log likelihood = -12.403309 Pseudo R2 = 0.8206 ------------------------------------------------------------------------------ menikah | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- siap | 2.56276 .7542198 3.40 0.001 1.084516 4.041004 mandiri | -.2288208 .1566053 -1.46 0.144 -.5357616 .07812 _cons | -14.49084 4.175093 -3.47 0.001 -22.67387 -6.307806 ------------------------------------------------------------------------------ Note: 22 failures and 25 successes completely determined.

5 | P a g e

F adalah fungsi distribusi normal kumulatif. Interpretasi koefisien dalam regresi probit tidak sama dengan regresi linier atau regresi logistik. Peningkatan probabilitas dalam analisis ini dikaitkan dengan peningkatan satu unit prediktor lain dan nilai awal prediktor. Dari hasil analisis ini dapat ketahui koefisien (beta) untuk kesiapan menikah adalah 2.563 (p<0.05). Nilai signifikansi di bawah 0.05 menunjukkan bahwa nilai koefisien ini berbeda secara signifikan dengan beta=0. Dengan kata lain merupakan prediktor pemilihan keputusan menikah yang signifikan. Sebaliknya, nilai koefisien kesiapan tidak signifikan (2.563; p<0.05) sehingga bukan merupakan prediktor pemilihan keputusan menikah.

4.1.4 Menerapkan Hasil Kita mendapatkan persamaan regresi F(Z)=[14.49+2.563(X1)+0.299(X2)]. Karena peranan kemandirian tidak signifikan, maka kita keluarkan dari persamaan. Dengan demikian persamaan kita menjadi F(Z)=14.49+2.563X1. Jika X1=0 maka F(Z)= [14.49+2.563(0)]=14.49. Jika X1=1 maka Z=19.61. Sekarang tinggal kita mentransformasikan nilai Z ini menjadi nilai probabilitas. Kita tinggal melihat tabel. Misalnya nilai Z=19.61 terletak pada wilayah 0.999 (mendekati 1). Kasus kita kali ini kurang pas untuk contoh penerapan karena nilai koefisien B0 dan B1 yang dihasilkan sangat besar sehingga mendekati 1. Berikut ini contoh lainnya. Misalnya peneliti hendak memprediksi kesuksesan berwirausaha berdasarkan kemauan mengambil resiko (X). Kesuksesan berwirausaha terdiri dari sukses=1 dan belum sukses=0. Persamaan regresi menghasilkan F(Z)=[2.061+0.188(X1)]. Ketika nilai X=0 maka nilai Z yang dihasilkan adalah 2.061+0.188 (0)=2.061. Kita lihat di tabel Z, nilai Z=2.061 sama dengan luas kurva sebesar 0.02 atau probabilitas sebesar 2%. Jika X=5 maka nilai Z=1.12 yang setara dengan probabilitas sebesar 13.1%. Artinya ketika kemauan individu mengambil resiko sebesar 5, maka probabilitas untuk suksesnya adalah 13.1%.

5 Referensi

Skrondal, A. and RabeHesketh, S. (2004). Generalized Latent Variable Modeling: Multilevel, Longitudinal and Structural Equation Models. Boca Raton, FL : Chapman & Hall/CRC

Berkenalan dengan Regresi Probit.pdf

Documents

Transcript of Berkenalan dengan Regresi Probit.pdf