Analisis Korelasi Regresi Linear

download Analisis Korelasi Regresi Linear

of 22

Transcript of Analisis Korelasi Regresi Linear

Analisis Korelasi Dan Regresi Linier

BAB X ANALISIS KORELASI DAN REGRESI LINIERTEORI DASAR ANALISIS KORELASI DAN REGRESI LINIER A. PengantarPenentuan teknik analisis yang akan digunakan dalam suatu analisis -- biasanya dibahas dalam metodologi penelitian -- sangat tergantung dari kerangka konseptual yang menjadi dasar analisis dan tujuan dari pelaksanaan analisis. Agar hasil analisis dapat ditafsirkan secara tepat, maka harus dihindari penggunaan teknik analisis yang tidak sesuai dengan skala pengukuran dari variabel yang digunakan dalam analisis. Dalam mengkaji hubungan antara dua variabel atau lebih, penting dipahami skala pengukuran dari setiap variabel tersebut, sehingga teknik analisis yang akan digunakan untuk menjelaskan hubungan atau kaitan antara variabel tersebut dapat dipilih yang paling sesuai. Apabila hal ini diabaikan, maka dapat menghasilkan interpretasi hasil yang kurang tepat (misleading). Sebagai contoh, analisis regresi mensyaratkan bahwa variabel yang digunakan paling tidak diukur secara interval, sehingga kalau ada salah satu variabel yang diukur secara nominal atau ordinal maka hasil yang diperoleh tidak dapat ditafsirkan secara tepat, oleh karena asumsi dalam penggunaan teknik ini yang tidak dapat dilanggar adalah bahwa variabel yang digunakan mengikuti distribusi normal. Pada bab ini teknik yang dibahas merupakan teknik analisis statistik inferensial, yaitu teknik yang mendasarkan pada pemanfaatan data yang diperoleh dari suatu sampel acak, sehingga hasilnya merupakan gambaran keadaan populasi dari mana sampel acak tersebut diambil. Teknik statistik semacam ini memberikan jaminan bahwa kesimpulan dan penafsiran dibuat dengan tingkat kesalahan yang rendah,5 biasanya dipakai 0,05 (5 %).

5 Tingkat kesalahan tersebut dalam teori probabilita dan uji hipotesis merupakan besarnya probabilita menolak hipotesis benar, atau disebut kesalahan tipe-1. Istilah umum yang dipakai adalah tetapi istilah lain yang juga sering dipakai adalah p-value, significancy of statistic (T, Z, 2, atau F), atau Pr> , Pr> , Pr > 2, Pr > F tergantung T Z statistik uji yang digunakan. BPS-UNFPA 96

Analisis Korelasi Dan Regresi Linier

Teknik analisis statistik yang dibahas dalam bab ini bersumber pada SPSS yang difokuskan hanya pada teknik yang dapat menjelaskan hubungan atau kaitan antara beberapa variabel, baik hubungan antara dua variabel (bivariate) maupun banyak variabel (multivariate). Pembahasan diutamakan pada cara membaca dan menafsirkan arti dari parameter yang diperoleh dari hasil pengolahan data yang terdapat pada output SPSS. Teknik analisis6 statistik yang dibahas meliputi Analisis Regresi, Analisis Path, Multiple Classification Analysis (MCA), Tabel Kontingensi, Model Logit, Model Log-Linear, Analisis Diskriminan, dan Analisis Faktor.

B. Analisis Regresi LinierAnalisis regresi merupakan alat yang dapat memberikan penjelasan hubungan antara dua jenis variabel yaitu hubungan antara variabel dependen atau variabel kriteria dengan variabel independen atau variabel prediktor7. Analisis hubungan antara dua variabel disebut sebagai analisis regresi sederhana jika hanya melibatkan satu variabel independen. Analisis disebut sebagai analisis regresi berganda jika melibatkan lebih dari satu variabel independen. Hubungan antara variabel dependen (Y) dengan variabel independen (X) dituliskan dalam model linier umum(3 ) ......... .1 Y = + X 1 + ........ + p X 0 1p

+e ,

e N , 2 ), (0

R sid a e ul

e= Y -Y

di mana i , i = 1,2,........p adalah koefisien regresi yang berarti besarnya perubahan pada Y , jika Xi bertambah satu satuan dan variabel yang lain konstan, adalah intercept. Residual e0

mengikuti distribusi normal dengan rata-rata 0 dan varians konstan sebesar 2. Asumsi dasar dalam analisis regresi adalah (i) setiap Y yang merupakan kombinasi linier atas X dan mengikuti distribusi normal, (ii) e tersebar secara acak dan tidak berpola mengikuti besarnya nilai X, (iii) tidak terdapat hubungan (korelasi) yang tinggi antar variabel X.6 Para pembaca dianggap sudah memahami prinsip dasar dari Analysis of Variance (ANOVA), karena semua uji statistik pada umumnya didasarkan pada dekomposisi dari total variance atas berbagai faktor penyebab perbedaan. 7 Analisis regresi dapat dipandang sebagai alat yang menjelaskan hubungan linear dari satu variabel ke variabel lainnya didekomposisikan dan diuraikan (descriptive tool), dan sebagai alat untuk menginduksikan (to infer) hubungan antar variabel pada populasi. Namun demikian keduanya dipandang dari segi teknik statistik sangat erat kaitannya, tetapi keduanya dapat dipandang terpisah paling tidak pada tingkat konseptual. Lebih jelasnya lihat Kim, J. and F.J. Kohout dalam Nie et. al Statistical Package for Social Sciences. Second edition. pp 321-322. New York: McGraw Hill Book Company 1975.

BPS-UNFPA

97

Analisis Korelasi Dan Regresi Linier

C. Analisis Regresi SederhanaAnalisis regresi sederhana hanya melibatkan satu variabel independen X, sehingga dalam persamaan (3.1) p=1, sehingga model liniernya adalah (3.2) ......... Y = 0 + 1 X + e, e N 2 ), (0, Residual e= Y -Y

Dengan model seperti pada persamaan (3.2) maka hipotesis yang diajukan untuk diuji adalah H 0: 1 = 0 terhadap H1: 1 0. Untuk menolak H0 harus dapat dibuktikan secara empirik bahwa 0 atau 1 1

bermakna (significant) atau dengan kata lain ada hubungan linier regresi antara Y

dan X seperti pada persamaan (3.2). Dalam output SPSS 9.0 for Windows untuk subprogram REGRESION, yang pertama perlu diketahui adalah apakah regresi Y pada X bermakna. Hal ini dapat dilihat pada output ANOVA sebagai berikut: ANOVASum of Squares Model 1 Regresion Residual Total 6475.18 3185.81 9660.99 Df 1 83 84 Mean Squares 6475.18 38.38 F 168.698 Sig. Uji hipotesis untuk mengetahui apakah regresi Y pada X ada, Tabel ANOVA dengan .000 =0,00 menunjukkan bahwa H 0 ditolak regresi Y pada X bermakna.

Selanjutnya adalah untuk mengetahui besarnya estimate koefisien regresi ( 1 ) serta standard

error-nya, ini dapat dilihat pada output COEFFICIENTS sebagai berikut:

COEFFICIENTSUnstandardized Coefficients B Std. Error Standardized Coefficients Beta t Sig.

0 = 47,17 (intercept) 1 = 0,307 (koeffisien regresi)

BPS-UNFPA

98

Analisis Korelasi Dan Regresi LinierModel 1 (Constant) X 47.170 .307 1.726 .024 27.337 12.988 .000 Y akan berubah sebesar 0,31 unit .000 untuk setiap perubahan satu unit dari X.

.819

Dapat dilihat bahwa karena regresi linier sederhana, maka pada dua tabel di atas t 2= F. Beta=0,819 yang merupakan koef. regresi baku sebenarnya adalah sama dengan r = koefisien korelasi antara Y dan X, karena beta dihitung berdasarkan vaiabel baku Z yang dihitung dengan caraZ= X X SD x , dengan SD = standard deviasi

Koefisien determinasi r2 = 0,670 (yaitu nilai Beta dikuadratkan atau (0.819)2) berarti bahwa variasi Y yang dapat dijelaskan oleh model sebesar 67 persen. Beberapa statistik dan estimasi dari parameter dapat pula diperoleh seperti rata-rata dan standard deviasi serta korelasi dari Y dan X. Para pembaca lebih lanjut dianjurkan untuk membaca SPSS Base 9.0 Application Guide.7

D. Analisis Regresi BergandaKalau satu variabel dependen Y perlu dijelaskan oleh lebih dari satu variabel independen X, maka kita perlu membuat model yang sesuai dengan tujuan studi. Model tersebut adalah regresi linier ganda (Multivariate Linear Regression) yang secara umum modelnya seperti pada persamaan (3.1). Selain berguna untuk dapat menjelaskan hubungan p variabel X secara bersama terhadap variabel Y, dengan analisis regresi ganda juga dapat diperoleh suatu penjelasan tentang peranan atau kontribusi relatif setiap variabel X terhadap variabel Y. Secara empirik walaupun misalnya model (3.1) signifikan, yang berarti bahwa secara bersama p variabel X dapat menjelaskan variabel Y, tidak berarti bahwa setiap variabel mempunyai pengaruh yang signifikan pada variabel Y. Suatu kajian tersendiri perlu dilakukan untuk kemudian dapat memilah variabel X yang berpengaruh secara parsial pada variabel Y.

BPS-UNFPA

99

Analisis Korelasi Dan Regresi Linier

Dengan model pada persamaan (3.1) maka uji hipotesis-nya adalah: H0: 1 = 2 = .........= p = 0 dengan H1: salah satu i 0, (i = 1,2,.....,p) yang dari ouput SPSS dapat dilihat pada output ANOVA dengan p=2 sebagai berikut ANOVASum of Squares Model 1 Regression Residual Total 11101.959 843.031 11944.991 df 2 104 106 Mean Squares 5550.980 8.106 F 684.793 Sig. .000 Dengan =0,00 mengindikasi-kan bahwa regresi Y pada X1 dan X2 signifikan.

Secara umum model regresi dengan Y pada X 1 dan X2 dapat digunakan lebih lanjut, namun demikian untuk mengetahui apakah X1 dan X2 secara parsial berpengaruh terhadap Y dapat diuji dengan melihat output COEFFICIENT sebagai berikut: COEFFICIENTSUnstandardized Coefficients B Model 1 (Constant) X1 X2 82.677 -.662 -.240 Std. Error .626 .263 .013 Standardized Coefficients Beta -.119 -.863 t 132.176 -2.518 -18.326 Sig. .000 X1 dan X2 secara parsial ber.013 pengaruh nyata pada Y tingkat signifikansi (p-value) masing.000 masing 0,013 dan 0,000.

Seberapa besar variasi dari variabel Y yang dapat dijelaskan oleh model dapat dilihat dari koefisien determinasi pada output MODEL SUMMARY berikut:MODEL SUMMARYVariables Model 1 Entered X1, X22

Removed

R .964

R Square .929

Adjusted R Square .928

Std. Error of the Estimate 2.85

Estimasi R

cenderung terlalu tinggi (overestimate), adjusted R2 (R2a) dirancang untuk

mengurangi bias tersebut yang dihitung dengan cara

BPS-UNFPA

100

Analisis Korelasi Dan Regresi Linier2 2 Ra = R

p(1 R 2 ) N p 1

dengan p adalah banyaknya variabel independen X pada persamaan (3.1). Secara matematis R2 dan R2a dapat dirumuskan dengan R2 = 1 R2a = 1 Residual sum of squares Total sum of squares Residual sum of squares/(N-p-1) Total sum of squares/(N-1)

Dengan menggunakan R2a = 0,928 maka variasi dari Y yang dapat dijelaskan oleh model adalah sebesar 93 persen.

1.

Pemilihan Variabel UtamaWalaupun model regresi linier ganda signifikan, mungkin tidak semua variabel

independen X mempunyai pengaruh nyata pada variabel dependen Y, lebih daripada itu lebih banyak variabel independen sebagai prediktor tidak membuat lebih mudah dalam melakukan analisis. Dalam hal ini cara yang paling banyak digunakan untuk memilih variabel yang signifikan tersebut adalah dengan cara bertatar (stepwise)8. Secara singkat metode stepwise ini dimulai tahap-1 dengan memasukkan variabel independen X yang mempunyai simpel korelasi (r) tertinggi dengan variabel dependen Y. Pada tahap-2 (dan seterusnya) variabel X yang mempunyai korelasi parsial tertinggi dengan variabel Y dimasukkan dalam model, akan tetapi pada tahap ini variabel X yang sudah masuk pada tahap-1 (atau sebelumnya) dapat dikeluarkan (removed) dari model jika tidak memenuhi kriteria pemilihan variabel yang dipilih (Wilks , Mahalanobis Distance, atau lainnya). Demikian seterusnya tahap berikutnya dilakukan seperti pada tahap-2 sehingga diperoleh variabel terbaik.

2.

Kontribusi Setiap Prediktor Terhadap Y

8 Terdapat dua cara lain, yaitu forward selection dan backward elimination, tetapi stepwise selection merupakan 7 metode pemilihan yang paling tepat. Lebih lanjut tentang hal ini lihat SPSS Base 9.0 Application Guide pp. 216. BPS-UNFPA 101

Analisis Korelasi Dan Regresi Linier

Dalam analisis adalah penting untuk mengetahui peranan setiap variabel X (prediktor) terhadap variabel Y yang kemudian dapat dibandingkan besarnya peranan setiap prediktor tersebut dalam menjelaskan variasi pada Y. Ukuran yang digunakan untuk tujuan tersebut adalah dengan melihat adjusted R2 dari setiap prediktor yang dapat dilihat dari output MODEL SUMMARY ketika melakukan pemilihan variabel dengan cara stepwise seperti berikut. MODEL SUMMARYModel (variables in the model) R R Square Adjusted R Square Adjusted R Square Change

Isian kolom Adjusted R Square Change merupakan selisih dari Adjusted R Square pada suatu baris terhadap baris sebelumnya di mana suatu variabel belum termasuk dalam model. X1 menjelaskan 17 persen variasi Variabel Y X2 menjelaskan 5 persen variasi Variabel Y X3 menjelaskan 1 persen variasi Variabel Y Interpretasi

X1 X1, X2 X1, X2, X3

.418 .480 .489

.175 .231 .239

.173 .229 .239

.173 .056 .010

3.

Diagnostik ModelPerlu dipastikan apakah model yang secara empirik adalah signifikan atau [Pr>F]