ANALISIS REGRESI JAMAK : SUATU KRITIKOleh :Abdullah M. Jaubah
Pendahuluan
Analisis regresi dipakai untuk mengestimasi koefisien-koefisien dari persamaan garis lurus yang melibatkan satu variabel independen atau lebih yang paling baik untuk memprediksi nilai dari variabel dependen. Penjualan tahunan dari para penjual atau para wiraniaga dapat diprediksi dari variabel-variabel independen seperti usia, tingkat pendidikan, dan pengalaman. Analisis regresi dapat berdasar atas model hubungan dari variabel-variabel ini. Suatu model yang baik dapat dipakai untuk memprediksi penjualan tahunan tadi.
Analisis regresi dapat mencakup statistik yaitu jumlah kasus yang valid untuk tiap variabel, rata-rata, dan deviasi standar. Tiap model regresi dapat mencakup koefisien-koefisien, matriks korelasi, korelasi parsial, koefisien korelasi jamak, koefisien determinasi jamak, koefisien determinasi jamak disesuaikan, kesalahan standar dari estimasi, analisis tabel varians, nilai-nilai yang diprediksi, residual-residual, 95% confidence interval untuk tiap koefisien regresi, matriks varians-kovarians, Variance Inflation Factor (VIF), tolerance, pengujian Durbin-Watson, ukuran-ukuran jarak (Mahalanobis, Cook, dan nilai-nilai leverage), DfBeta, DfFit, interval-interval prediksi, casewise diagnostic, plots termasuk scatterplots, partial plots, histogram, dan normal probability plots.
Data
Data untuk variabel dependen dan variabel-variabel independen harus berjenis kuantitatif. Variabel-variabel kategorikal seperti agama, Program Studi, atau wilayah dari penduduk, perlu dicatat ke dalam variabel-variabel berbentuk bilangan biner (dummy) atau jenis-jenis variabel lain karena variabel-variabel tersebut merupakan variabel-variabel berjenis nominal. Variabel-variabel karegorikal juga mencakup variabel-variabel berjenis ordinal. Analisis regresi dapat dikelompokkan ke dalam analisis regresi berjenis scale dan analisis regresi berjenis kategorikal.Regresi kategorikal memakai data kategorikal yang telah dikuantitatifkan dengan cara memakai nilai-nilai numerik pada kategori-kategori yang menghasilkan suatu persamaan regresi optimal untuk variabel-variabel yang telah mengalami transformasi. Analisis regresi linier standar melibatkan usaha meminimalkan jumlah dikuadratkan atas perbedaan-perbedaan antara variabel dependen dan variabel-variabel independen.
Asumsi-asumsi
Distribusi dari nilai variabel dependen memenuhi persyaratan normalitas distribusi data untuk tiap nilai variabel independen. Varians dari distribusi dari variabel dependen harus konstan untuk semua nilai dari variabel independen. Hubungan antara variabel dependen dan tiap variabel independen harus berbentuk garis lurus dan semua observasi harus independen. Suliyanto telah membahas mengenai Analisis Regresi Berganda. Suliyanto menyajikan contoh kasus : Seorang peneliti akan meneliti apakah ada pengaruh harga dan pendapatan terhadap konsumsi buah Duren. Untuk keperluan tersebut diambil sampel secara acak sebanyak 10 rumah tangga.[1]DataSuliyanto memakai data sebagai berikut :
X1X2Y
235
348
568
459
679
2613
346
459
544
633
Hasil analisis Suliyanto adalah sebagai berikut :
R2 = 0.875, R disesuaikan = 0.840, Standard Error of estimate = 1.1818, F-hitung = 24.567, dan Y = 2,5529 -1,0921X1+1,9608X2+
Deskripsi Data
Suliyanto tidak menyajikan deskripsi data dan grafik histogram dengan kurva normal. Deskripsi data mencakup persentil, Dispersi, Distribusi, dan kecenderungan sentral. Grafik histogram dengan kurva normal mencakup histogram dengan kurva normal dari variabel Y, X1, dan variabel X2. Deskripsi data dan grafik histogram dengan kurva normal berfungsi mendeskripsikan dan meringkas data. Deskripsi data dan grafik histogram dengan kurva normal adalah sebagai berikut :
Statistics
X1X2Y
NValid101010
Missing000
Mean4.004.707.40
Std. Error of Mean.471.423.933
Median4.004.508.00
Mode2a49
Std. Deviation1.4911.3372.951
Variance2.2221.7898.711
Skewness.000.334.255
Std. Error of Skewness.687.687.687
Kurtosis-1.334-.852.115
Std. Error of Kurtosis1.3341.3341.334
Range4410
Minimum233
Maximum6713
Percentiles52.003.003.00
102.003.003.10
202.203.204.20
252.753.754.75
303.004.005.30
403.404.006.80
504.004.508.00
604.605.008.60
705.005.709.00
755.256.009.00
805.806.009.00
906.006.9012.60
1006.007.0013.00
a. Multiple modes exist. The smallest value is shown
Histogram dengan Kurva Normal adalah sebagai berikut :
Pengujian Persyaratan AnalisisPengujian persyaratan analisis mencakup pengujian normalitas distribusi data dan pengujian homogenitas varians. Pengujian normalitas distribusi data menghasilkan informasi sebagai berikut :
Tests of Normality
Kolmogorov-SmirnovaShapiro-Wilk
StatisticdfSig.StatisticdfSig.
Y.19410.200*.94510.611
X1.14910.200*.91810.341
X2.20010.200*.93210.466
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
Nilai signifikansi Kolmogorov-Smirnov adalah 0.200 untuk variabel Y, 0.200 untuk variabel X1, dan 0.200 untuk variabel X2. Nilai-nilai ini adalah lebih besar daripada nilai 0.05 sehingga persyaratan normalitas distribusi data terpenuhi.Pengujian homogenitas varians menghasilkan informasi sebagai berikut :
Test of Homogeneity of Variances
Y
Levene Statisticdf1df2Sig.
4925120699760122.00045.000
Signifikansi adalah 0.000. Nilai ini adalah lebih kecil daripada nilai 0.05 sehingga persyaratan homogenitas varians dari variabel Y dan X1 adalah tidak terpenuhi.
Test of Homogeneity of Variances
Y
Levene Statisticdf1df2Sig.
3.99335.085
Signifikansi adalah 0.085. Nilai ini adalah lebih besar daripada nilai 0.05 sehingga persyaratan homogenitas varians dari variabel Y dan X2 adalah terpenuhi.
Hal ini berarti bahwa jumlah kasus hanya 10 kasus. Jumlah kasus minimal yaitu 30 kasus tidak terpenuhi dan homogenitas varians antara Y dan X1 juga tidak terpenuhi. Hal ini berarti bahwa pemakaian statistik parametrik adalah salah dan seharusnya statistik nonparametrik dipakai. Pemakaian statistik nonparametrik berarti bahwa judul penelitian yaitu Pengaruh pendapatan dan harga terhadap konsumsi buah Duren tidak dapat dipakai karena persamaan regresi tidak dapat disajikan jika Spearman Rho dipakai.
Pembahasan di bawah ini tidak memperhatikan dahulu persyaratan-persyaratan tersebut di atas untuk mengungkap kelemahan-kelemahan dari pembahasan yang dilakukan oleh Suliyanto.
Analisis Regresi Sederhana
Analisis regresi sederhana menghasilkan informasi sebagai berikut :
Model Summary
ModelRR SquareAdjusted R SquareStd. Error of the Estimate
1.354a.125.0162.928
a. Predictors: (Constant), X1
Koefisien korelasi sederhana antara X1 dan Y adalah 0.354. Hal ini berarti bahwa hubungan antara X1 dan Y adalah lemah. Koefisien determinasi adalah 0.125 atau 12.5%. Hal ini berarti bahwa pengaruh langsung dari variabel X1 terhadap variabel Y adalah 12.5% dan sisanya sebesar 87.5% merupakan pengaruh tidak langsung dari variabel-variabel di luar penelitian ini. Koefisien determinasi disesualkan adalah 0.016 atau 1.6%. Kesalahan standar dari estimasi adalah 2.928.ANOVAa
ModelSum of SquaresdfMean SquareFSig.
1Regression9.80019.8001.143.316b
Residual68.60088.575
Total78.4009
a. Dependent Variable: Y
b. Predictors: (Constant), X1
Tabel Anova di atas mengandung informasi bahwa F-hitung dengan derajat kebebasan 1 dan adalah 1.143 dan F-tabel dengan derajat kebebasan 1 dan 8 adalah 5.317655. Hal ini berarti bahwa F-hitung adalah lebih kecil daripada F-tabel sehingga persamaan regresi adalah tidak baik atau tidak cocok atau tidak signifikan.
Coefficientsa
ModelUnstandardized CoefficientsStandardized CoefficientstSig.Fraction Missing Info.
BStd. ErrorBeta
1(Constant)10.2002.7783.672.006
X1-.700.655-.354-1.069.316
Persamaan regresi sederhana adalah Y= 10.200 0.700X1. Hal ini berarti bahwa koefisien regresi adalah 0.7. Hal ini berarti bahwa pengaruh total dari variabel X1 terhadap variabel Y adalah -0.7. Hubungan ini berbentuk hubungan negatif dengan pengertian bahwa kenaikan pada X1 akan menurunkan Y dan penurunan pada X1 akan meningkatkan Y.
ANOVA Table
Sum of SquaresdfMean SquareF
Y * X1Between Groups(Combined)18.40044.600.383
Linearity9.80019.800.817
Deviation from Linearity8.60032.867.239
Within Groups60.000512.000
Total78.4009
F-hitung dengan derajat kebebasan 3 dan 5 adalah 0.239. F-tabel dengan derajat kebebasan 3 dan 5 adalah 5.409451. Hal ini berarti bahwa F-hitung adalah lebih kecil daripada F-tabel sehingga persamaan regresi memenuhi persyaratan linieritas persamaan regresi. Hal ini dapat disajikan dalam grafik sebagai berikut :
Persamaan regresi antara X2 dan Y adalah sebagai berikut :
Model Summary
ModelRR SquareAdjusted R SquareStd. Error of the Estimate
1.766a.586.5342.014
a. Predictors: (Constant), X2
Koefisien korelasi antara X2 dan Y adalah 0.766. Hal ini berarti bahwa hubungan antara variabel X2 dan variabel Y adalah sangat kuat. Koefisien determinasi adalah 0.586 atau 58.6%. Hal ini berarti bahwa pengaruh langsung dari variabel X2 terhadap variabel Y adalah 58.6% dan pengaruh tidak langsung adalah 41.4%. Kesalahan standar dari estimasi adalah 2.014.
ANOVAa
ModelSum of SquaresdfMean SquareFSig.
1Regression45.953145.95311.330.010b
Residual32.44784.056
Total78.4009
a. Dependent Variable: Y
b. Predictors: (Constant), X2
Tabel Anova mengandung informasi bahwa F-hitung adalah 11.330 dengan derajat kebebasan 1 dan 8. F-tabel dengan derajat kebebasan 1 dan 8 adalah 5.317655. Hal ini berarti bahwa F-hitung adalah lebih besar daripada F-tabel sehingga persamaan regresi adalah signifikan.
Coefficientsa
ModelUnstandardized CoefficientsStandardized CoefficientstSig.
BStd. ErrorBeta
1(Constant)-0.542.443-0.2210.831
X21.6890.5020.7663.3660.01
a. Dependent Variable: Y
Persamaan regresi adalah Y = -0.54 + 1.689X2. Hal ini berarti bahwa koefisien regresi adalah 1.689 dengan pengertian perubahan satu skor pada variabel X2 akan mengakibatkan perubahan pada variabel Y sebesar 1.689. Pengaruh total adalah 1.689 yang terdiri dari 58.6% dari 1.689 merupakan pengaruh langsung dan 41.4% merupakan pengaruh tidak langsung.
ANOVA Table
Sum of SquaresdfMean SquareF
Y * X2Between Groups(Combined)55.900413.9753.106
Linearity45.953145.95310.212
Deviation from Linearity9.94733.316.737
Within Groups22.50054.500
Total78.4009
Pengujian linieritas persamaan regresi menghasilkan F-hitung adalah 0.737 dengan derajat kebebasan 3 dan 5. F-tabel dengan derajat kebebasan 3 dan 5 adalah 5.409451. Hal ini berarti bahwa F-hitung adalah lebih kecil daripada F-tabel sehingga persamaan regresi memenuhi persyaratan linieritas persamaan regresi. Hal ini dapat disajikan dalam grafik sebagai berikut :
Analisis Regresi Jamak
Model Summaryb
ModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson
1.936a.875.8401.1823.386
a. Predictors: (Constant), X2, X1
b. Dependent Variable: Y
Analisis regresi jamak menghasilkan koefisien korelasi antara variabel X1, X2, dan variabel Y adalah 0.936. Hal ini berarti bahwa hubungan antara variabel-variabel ini adalah sangat kuat. Koefisien determinasi jamak adalah 0.875 atau 87.5%. Pengaruh lansung dari variabel X1 dan X2 terhadap variabel Y adalah 87.5% dan pengaruh tidak langsung dari variabel-variabel di luar variabel-variabel yang diteliti adalah 12.5%. Kesalahan standar dari estimasi adalah 1.182. Durbin-Watson adalah 3.386. Du dengan jumlah kasus sebanyak 8 dan k adalah 2 menunjukkan nilai sebesar 1.78 dan dl adalah 4-1.78 atau 2.22. Hal ini berarti bahwa autokorelasi terdapat antara variabel X1 dan variabel X2.
ANOVAa
ModelSum of SquaresdfMean SquareFSig.
1Regression68.624234.31224.567.001b
Residual9.77671.397
Total78.4009
a. Dependent Variable: Y
b. Predictors: (Constant), X2, X1
Tabel Anova mengandung informasi bahwa F-hitung adalah 24.567 dengan derajat kebebasan 2 dan 7. F-tabel dengan derajat kebebasan 2 dan 7 adalah 5.143253. Hal ini berarti bahwa F-hitung adalah lebih besar daripada F-tabel sehingga persamaan regresi jamak adalah signifikan.
Coefficientsa
ModelUnstandardized CoefficientsStandardized CoefficientstSig.Collinearity Statistics
BStd. ErrorBetaToleranceVIF
1(Constant)2.5531.6261.570.160
X1-1.092.271-.552-4.029.005.9501.052
X21.961.302.8896.490.000.9501.052
a. Dependent Variable: Y
Persamaan regresi jamak adalah Y = 2.553 -1.092X1 + 1.961X2. Hal ini berarti bahwa pengaruh total dari variabel X1 adalah -1.092 dan pengaruh total dari variabel X2 adalah 1.961. Pengujian kolinieritas menunjukkan bahwa variabel X1 dan variabel X2 tidak mengandung multikolinieritas karena nilai Tolerance adalah 0.950 dan nilai Variance Inflation Factor (VIF) adalah di bawah 10.
Collinearity Diagnosticsa
ModelDimensionEigenvalueCondition IndexVariance Proportions
(Constant)X1X2
112.8921.000.01.01.01
2.0756.212.05.91.24
3.0339.347.94.08.75
a. Dependent Variable: Y
Residuals Statisticsa
MinimumMaximumMeanStd. DeviationN
Predicted Value1.8812.137.402.76110
Residual-1.2511.118.0001.04210
Std. Predicted Value-1.9981.714.0001.00010
Std. Residual-1.059.946.000.88210
a. Dependent Variable: Y
Hasil perhitungan Suliyanto adalah :
R2 = 0.875R disesuaikan = 0.840Standard Error of estimate = 1.1818F-hitung = 24.567
Y = 2,5529 -1,0921X1+1,9608X2+
Hasil-hasil di atas adalah benar akan tetapi Suliyanto belum melakukan pengujian normalitas distribusi data, pengujian homogenitas varians, pengujian linieritas, pengujian heterosedastisitas, pengujian multikolinieritas, dan pengujian otokorelasi. Suliyanto menyebut Uji Asumsi Klasik yaitu Uji Normalitas, Non-Heterskedastisitas, Non-Multikolinieritas, Non-Autokorelasi, dan Linearitas akan tetapi tidak melakukan pengujian-pengujian tersebut. Pengujian Durbin-Watson menghasilkan du adalah 1.64, dl adalah 2.36 dan Durbin-Watson yang dihasilkan adalah 3.386. Hal ini berarti bahwa otokorelasi negatif terdapat antara variabel X1 dan X2. Suliyanto sangat menguasai perhitungan-perhitungan dalam pengujian asumsi klasik akan tetapi dalam contoh di atas Suliyanto tidak menerapkan kemampuan tersebut.Hal ini berarti bahwa kesimpulan dan implikasi yang disusun menjadi tidak bermakna dan tidak bermanfaat sebagai akibat dari kesalahan memakai teknik analisis data.
[1] Suliyanto. Analisis Regresi Berganda. http://management-unsoed.ac.id
Rangkuman
Tulisan Suliyanto banyak mengandung kesalahan dan kelemahan sehingga perlu dilakukan kritik seperti kritik yang telah dilakukan atas tulisannya tentang analisis regresi sederhana. Kesalahan dan kelemahan ini perlu dikritik karena jika pembahasan ini merupakan bahan perkuliahan maka kesalahan dan kelemahan akan berkembang secara eksponensial pada para mahasiswa dan mereka menganggap analisis mereka tentang analisis regresi jamak adalah benar dan serupa dengan bahan yang diterima oleh mereka dalam perkuliahan. Kritik lain akan dilancarkan pula atas tulisah Suliyanto yang berjudul Path Analysis (Analisis Jalur), http ://manajement-unsoed.ac.id
Depok Permata Regency, 24 Oktober 2014
UJI NORMALITAS NON-HETEROSKEDASTISITAS NON-MULTIKOLINIERITAS NON-AUTOKORELASI LINIERITAS11
Top Related