Regresi Ridge Dan Regresi Beda

22
REGRESI BEDA DAN REGRESI RIDGE Ria Dhea Layla N.K 1 , Febti Eka P. 2 1) 1311105003 2) 1311106009 email: 1) [email protected] 2) [email protected] ABSTRAK Analisis regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebab-akibat antara satu variabel dengan variabel- variabel yang lain. Pengujian asumsi klasik diperlukan untuk mengetahui apakah hasil estimasi regresi yang dilakukan benar-benar bebas dari adanya heteroskedastisitas, multikolinearitas, dan autokorelasi. Regresi beda merupakan salah satu metode yang digunakan untuk mengatasi autokorelasi. Beberapa cara yang bisa digunakan dalam mengatasi masalah multikolinearitas dalam model regresi ganda salah satunya adalah regresi ridge. Data yang digunakan untuk analisis regresi Ridge adalah data dari pendapatan perkapita Indonesia (dalam Triliun) (Y) dengan harga premium (X 1 ), harga solar (X 2 ), harga minyak bakar (X 3 ) dan harga minyak tanah (X 4 ). Sedangkan data yang digunakan untuk analisis regresi Beda adalah Oksidasi Tanaman dari Ammonia sampai Asam Nitrat. Variabel Respon (Y) adalah stack yang hilang oksidasi tanaman dari ammonia sampai asam sulfat sedangkan variabel prediktornya adalah temperatur pendingin air (X 1 ) dan konsentrasi asam (X 2 ). Hasil persamaan Regresi Ridge dengan nili θ=0,2, maka modelnya adalah ^ Y=101,45394 + 0,079129 X 1 +0,1213686 X 2 0,1105129 X 3 +0,524458 X 4 . Sedangkan persamaan hasil dari regresi beda stack yang hilang = -1,09 + 0,775 temperatur pendingin air + 0,118 konsentrasi asam I. PENDAHULUAN Analisis regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebab-akibat antara satu variabel dengan satu dengan variabel-variabel yang lain. Variabel "penyebab" disebut dengan bermacam-macam istilah: variabel penjelas, variabel eksplanatorik, variabel independen, atau secara bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel terkena akibat dikenal sebagai variabel yang dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Kedua variabel ini dapat merupakan variabel acak (random), namun variabel yang dipengaruhi harus selalu variabel acak (Wikipedia, 2012). Permasalahan yang dibahas pada makalah ini adalah bagaimana cara mengatasi kasus multikolinieritas antara variabel bebas pada studi kasus pendapatan perkapita Indonesia (dalam JURUSAN STATISTIKA FMIPA | INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 1

Transcript of Regresi Ridge Dan Regresi Beda

Page 1: Regresi Ridge Dan Regresi Beda

REGRESI BEDA DAN REGRESI RIDGERia Dhea Layla N.K 1 , Febti Eka P. 2

1) 1311105003 2)1311106009email: 1) [email protected] 2) [email protected]

ABSTRAKAnalisis regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebab-

akibat antara satu variabel dengan variabel-variabel yang lain. Pengujian asumsi klasik diperlukan untuk mengetahui apakah hasil estimasi regresi yang dilakukan benar-benar bebas dari adanya heteroskedastisitas, multikolinearitas, dan autokorelasi. Regresi beda merupakan salah satu metode yang digunakan untuk mengatasi autokorelasi. Beberapa cara yang bisa digunakan dalam mengatasi masalah multikolinearitas dalam model regresi ganda salah satunya adalah regresi ridge. Data yang digunakan untuk analisis regresi Ridge adalah data dari pendapatan perkapita Indonesia (dalam Triliun) (Y) dengan harga premium (X1), harga solar (X2), harga minyak bakar (X3) dan harga minyak tanah (X4). Sedangkan data yang digunakan untuk analisis regresi Beda adalah Oksidasi Tanaman dari Ammonia sampai Asam Nitrat. Variabel Respon (Y) adalah stack yang hilang oksidasi tanaman dari ammonia sampai asam sulfat sedangkan variabel prediktornya adalah temperatur pendingin air (X1) dan konsentrasi asam (X2). Hasil persamaan Regresi Ridge dengan nili θ=0,2, maka modelnya adalah

Y=101,45394+0,079129 X1+0,1213686 X2−0,1105129 X3+0,524458 X4. Sedangkan persamaan hasil dari regresi beda stack yang hilang = -1,09 + 0,775 temperatur pendingin air + 0,118 konsentrasi asam

I. PENDAHULUANAnalisis regresi dalam statistika adalah salah satu metode untuk menentukan hubungan

sebab-akibat antara satu variabel dengan satu dengan variabel-variabel yang lain. Variabel "penyebab" disebut dengan bermacam-macam istilah: variabel penjelas, variabel eksplanatorik, variabel independen, atau secara bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel terkena akibat dikenal sebagai variabel yang dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Kedua variabel ini dapat merupakan variabel acak (random), namun variabel yang dipengaruhi harus selalu variabel acak (Wikipedia, 2012).

Permasalahan yang dibahas pada makalah ini adalah bagaimana cara mengatasi kasus multikolinieritas antara variabel bebas pada studi kasus pendapatan perkapita Indonesia (dalam Triliun) dan bagaimana cara mengatasi autokorelasi pada studi kasus antara stack yang hilang oksidasi tanaman dari ammonia sampai asam sulfat. Tujuan yang ingin dicapai adalah untuk mengetahui penggunaan penerapan regresi ridge pada sebuah studi kasus yang mengalami kasus multikolinieritas dan untuk mengetahui penerapan penggunaan regresi beda pada sebuah studi kasus yang mengalamu autokorelasi.

II. LANDASAN TEORIPengujian asumsi klasik diperlukan untuk mengetahui apakah hasil estimasi regresi

yang dilakukan benar-benar bebas dari adanya heteroskedastisitas, multikolinearitas, dan autokorelasi. Model regresi akan dapat dijadikan alat estimasi yang tidak bias jika telah memenuhi persyaratan BLUE (best linear unbiased estimator) yakni tidak terdapat heteroskedastistas, tidak terdapat multikolinearitas, dan tidak terdapat autokorelasi ( Sudrajat 1988 : 164).

Jika terdapat heteroskedastisitas, maka varian tidak konstan sehingga dapat menyebabkan biasnya standar error. Jika terdapat multikolinearitas, maka akan sulit untuk mengisolasi pengaruh-pengaruh individual dari variabel, sehingga tingkat signifikansi koefisien regresi menjadi rendah. Dengan adanya autokorelasi mengakibatkan penaksir masih tetap bias

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

1

Page 2: Regresi Ridge Dan Regresi Beda

dan masih tetap konsisten hanya saja menjadi tidak efisien. Oleh karena itu, uji asumsi klasik perlu dilakukan. Pengujian-pengujian yang dilakukan adalah sebagai berikut:1. Uji Asumsi Multikolinieritas

Uji multikolinearitas bertujuan untuk menguji apakah dalam model regresi ditemukan adanya korelasi antar variabel bebas (independen). Dalam model regresi yang baik seharusnya tidak terjadi korelasi di antara variabel bebas. Uji Multikolinearitas dilakukan dengan melihat nilai tolerance dan variance inflation factor (VIF) dari hasil analisis dengan menggunakan SPSS. Apabila nilai tolerance value lebih tinggi daripada 0,10 atau VIF lebih kecil daripada 10 maka dapat disimpulkan tidak terjadi multikolinearitas.

2. Uji Asumsi Klasik HeteroskedasitisitasUji heteroskedastisitas bertujuan untuk menguji apakah dalam model regresi terjadi

ketidaksamaan varians dan residual satu pengamatan ke pengamatan yang lain. jika varians dari residual satu pengamatan ke pengamatan yang lain tetap, maka disebut homoskedastisitas dan jika berbeda disebut heteroskedastisitas. Model regresi yang baik adalah yang homoskedastisitas atau tidak terjadi heteroskedastisitas.

Uji heteroskedastisitas dilakukan dengan menggunakan uji Glejser, yang dilakukan dengan meregresikan nilai absolut residual yang diperoleh dari model regresi sebagai variabel dependen terhadap semua variabel independen dalam model regresi. Apabila nilai koefisien regresi dari masing-masing variabel bebas dalam model regresi ini tidak signifikan secara statistik, maka dapat disimpulkan tidak terjadi heteroskedastisitas (Sumodiningrat. 2001 : 271).3. Uji Asumsi Klasik Autokorelasi

Salah satu asumsi pada model regresi linier klasik adalah tidak adanya autokorelasi. Autokorelasi merupakan kondisi dimana terdapat korelasi atau hubungan antar pengamatan (observasi). Uji Autokorelasi bertujuan menguji apakah dalam suatu model regresi linear ada korelasi antara kesalahan pengganggu pada periode t dengan kesalahan pada periode t-1 (sebelumnya). Jika terjadi korelasi maka dinamakan ada problem autokorelasi. Model regresi yang baik adalah regresi yang bebas dari autokorelasi Uji autokorelasi dilakukan dengan menggunakan uji α=¿ 5%. Apabila D-WDurbin-Watson (D-W), dengan tingkat kepercayaan terletak antara -2 sampai +2 maka tidak ada autokorelasi (Santoso. 2002 : 219).

Analisis yang digunakan dalam makalah ini untuk mengatasi autokorelasi dan multikolinieritas adalah dengan menggunakan Regresi Beda dan Regresi Ridge. Berikut penjelasan tentang Regresi Beda dan Regresi Ridge.

4. Ridge RegressionBeberapa cara yang bisa digunakan dalam mengatasi masalah multikolinearitas dalam

Model Regresi Ganda antara lain Analisis komponen utama yaitu analisis dengan mereduksi peubah bebas (X) tanpa mengubah karakteristik peubah-peubah bebasnya, pemilihan model terbaik, regresi ridge dan lain lain.

Pada dasarnya metode Ridge juga merupakan metode kuadrat terkecil. Perbedaannya adalah bahwa pada metode ridge regression, nilai variabel bebasnya ditransformasikan dahulu melalui prosedur centering and rescaling. Prosedur ridge pertama kali dikemukakan oleh A.E. Hoerl pada 1962 Prosedur ini ditunjukan untuk mengatasi kondisi buruk (ill-conditioned). Kondisi ini terjadi apabila terdapat korelasi antar variabel bebas yang cukup tinggi sehingga

menyebabkan determinan X'⏟ X⏟ mendekati nol.

Metode Centering and RescalingPersamaaan regresi yang memiliki model:

Y i=β0+β1 X1+ β2 X2+εi

Persamaan tersebut dapat dibentuk menjadi Y i=β0+β1 ( X1 i−X1 )+β1 X1+β2 ( X 2i−X2 )+β2 X2+εi

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

2

Page 3: Regresi Ridge Dan Regresi Beda

¿ ( β0+β1 X 1+β2 X2 )+β1 ( X1 i−X1 )+β2 ( X2 i−X2 )+εi

Menurut rumus untuk mendapatkan β0, yaitu:β0=Y −β1 X1−β2 X2

Maka berlaku,Y=β0+β1 X1+β2 X2

SehinggaY i−( β0+β1 X1+β2 X2 )=β1 ( X1i−X1 )+β2 ( X2 i−X2 )+εi

Y i−Y =β1 ( X1i−X )+β2 ( X2 i−X 2)+εi

Jikay i=Y i−Y

x1 i=X1 i−X 1

x2 i=X2 i−X2

Maka didapatkan persamaan baru, yaitu:y i=β1 x1 i+β2 x2 i

Prosedur untuk membentuk persamaan pertama menjadi persamaan terakhir disebut dengan prosedur centering. Prosedur ini mengakibatkan hilangnya β0(intercept) yang membuat perhitungan untuk mencari model regresi menjadi lebih sederhana.Bila dari persamaan di atas kita bentuk persamaan:

Y i¿=β1 Z1i+β2 Z2 i+εi

'

dengan

Y i¿=

y i

√n−1Sy=

Y i−Y 1

√n−1Sy

Z1 i=x1i

√n−1 S1

=X1 i−X1

√n−1 S1

Z2i=x2i

√n−1 S2

=X2 i−X2

√n−1S2

maka prosedur ini disebut dengan prosedur Rescaling. Keseluruhan dari prosedur di atas disebut prosedur centering and rescaling.

Salah satu metode yang dapat digunakan untuk menaksir parameter regresi dari model regresi liner berganda adalah menggunakan metode kuadrat terkecil. Dugaan metode kuadrat

terkecil adalha b=( X ' X )−tX ' Y . Dengan mebentuk X ' Xmaka kesalahan yang

disebabkan pengaruh pembulatan menjadi lebih kecil. Terutama jika variabel bebas-nya lebih dari dua dan data yang ada besar.

Jika X ' X yang merupakan matriks korelasi adalah matriks identitas maka nilai dugaan variabel regressand akan sama dengan nilai sebenarnya. Apabila X ' X tidak mendekati matriks identitas melainkan menjauhinya, maka dapat dikatakan hampir singular (buruk). Kondisi ini disebut sebagai ill conditioned (Draper & Smith ,1981). Kondisi ini terjadi apabila terdapat korelasi antar variabel bebas yang cukup tinggi sehingga menyebabkan determinan X ' X mendekati nol. Maka antara variabel bebas terjadi multikolinieritas ganda tidak sempurna.

Apabila terjadi situasi tersebut, penaksiran parameter koefisien regresi masih mungkin dilakukan dengan metode kuadrat terkecil, tetapi dengan konsekuensi simpangan bakunya menjadi sangat sensitif sekalipun terjadi perubahan yang sangat kecil dalam datanya. Simpangan baku ini cenderung membesar sejalan dengan meningkatnya multikolinieritas. Apabila terjadi multikolinieritas tidak sempurna pada variabel regresso pada

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

3

Page 4: Regresi Ridge Dan Regresi Beda

diagonal utama X ' X ditambah bilangan kecil positif yang bernilai antara 0 dan 1 (Hoerl A.E, 1962). Prosedur ini disebut Ridge Trace. Kemudian prosedur tersebut dikembangkan oleh A.E Hoerl dan Robert W Kennard (1970) dan Normon R. Draper dan Harry Smith (1981) dengan mentransformasikan matriksX ' X menjadi matriks korelasi Z' Z.

Sehingga dugaan koefisien regresi menjadi:

B¿ (θ )= (Z ' Z+θI )−1ZT Y

dengan:B¿ (θ ) : estimator ridge regressionθ : ridge parameter (bilangan kecil positif terletak antara 0 dan 1)Z : Matriks n × k yang merupakan hasil transformasi variabel bebas melalui metode

centering dan rescaling.Sehingga nilai dugaan untuk variabel regressand menjadi:

Y (θ )=Z B¿ (θ )Proses tersebut di atas disebut dengan Ridge regression. Analisis

ridge regression dapat digunakan apabila Z' Z tidak singular. Asumsi yang

digunakan hanyalah ( Z ' Z )−t ada dan tidak sulit mendapatkannya (Draper & Herzberg, 1986). Pemilihan nilai θ sebenarnya diserahkan kepada analis. Untuk memperoleh nilai θ, analis mencobakan nilai θ ampai keadaan stabil. Ada beberapa metode yang bisa digunakan salah satunya yaitu dengan mencari nilai satistik Cp Mallows (Cθ ) dengan rumus:

Cθ=SSres, k

σ2 −n+2+2 tr ( H θ )dengan

tr ( H θ )=∑i=1

k λi

λi+θketerangan:

SSres ,k : Jumlah kuadrat residu dari persamaan Ridge Regressionn : banyaknya pengamatanλ i : Eigen value matriks ( Z ' Z+θI )tr ( H θ ) : Trace dari matriks H θ

σ 2 : penaksir varians metode kuadrat terkecilSetelah memperoleh nilai Cθ, nilai θ terpilih adalah nilai θ yang dapat meminimumkan nilai Cθ. Koefisien regresi dalam variabel asal digunakan rumus sebagai berikut :

b i=( Sy

S i)b i

'

dengan i : 1, 2, 3Sy : Galat baku dari data awal YSi : Galat baku dari data awal X ke-I

b i' : koefisien regresi setelah melalui metode ridge regression

5. Regresi Beda

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

4

Page 5: Regresi Ridge Dan Regresi Beda

Regresi beda merupakan salah satu metode yang digunakan untuk mengatasi autokorelasi. Dimana regresi ini dilakukan pada saat terjadi autokorelasi atau ketika saling dependent (berhubungan). Model regresi beda dapat dinyatakan dalam bentuk sebagai berikut:

y t− y t−1=β0+β1 ( x t−x t−1 )+εt

Regresi beda merupakan proses regresi dari differensiasi variabel y dan differensiasi

variabel x.

III. METODOLOGI PENELITIANData yang digunakan untuk menganalisis regresi ridge menggunakan data pendapatan

perkapita Indonesia (dalam Triliun) dengan variable bebas adalah harga premium (X1), harga solar (X2), harga minyak bakar (X3) dan harga minyak tanah (X4). Variabel prediktor (Y) yaitu pendapatan Indonesia.

Data yang dianalisis beda karena terjadi kasus autokorelasi adalah data stack yang hilang (Y) dengan temperatur pendingin air (X1) dan konsentrasi asam (X2).

IV. ANALISIS DAN PEMBAHASANA. STUDI KASUS PENDAPATAN PERKAPITA INDONESIA (DALAM TRILIUN)

Berikut adalah hasil dari hubungan regresi linier antara pendapatan perkapita Indonesia (dalam Triliun) dengan harga premium, harga solar, harga minyak bakar dan harga minyak tanah diperoleh taksiran model regresinya adalah sebagai berikut:

Tabel 1. Analisis RegresiRegression Analysis: pendapatan p versus harga premiu; harga solar; ...

The regression equation ispendapatan perkapita = 127 - 0,130 harga premiun + 0,527 harga solar - 0,981 harga m. bakar + 1,30 harga m. tanah

Predictor Coef SE Coef T P VIFConstant 126,53 33,62 3,76 0,002harga premiun -0,1304 0,2512 -0,52 0,611 82,119harga solar 0,5270 0,7022 0,75 0,465 188,192harga m. bakar -0,9815 0,4251 -2,31 0,036 21,278harga m. tanah 1,2978 0,2946 4,41 0,001 12,498

S = 32,4882 R-Sq = 90,3% R-Sq(adj) = 87,8%

Berdasarkan tabel 1 analisis regresi pendapatan perkapita Indonesia (dalam Triliun) dengan harga premium, harga solar, harga minyak bakar dan harga minyak tanah tersebut diperoleh persamaan regresinya yaitu pendapatan perkapita = 127 - 0,130 harga premiun + 0,527 harga solar - 0,981 harga minyak bakar + 1,30 harga minyak tanah, yang berarti bahwa setiap pengurangan nilai harga premium sebesar 1 satuan, maka nilai pendapatan perkapita akan berkurang sebesar koefisien dari harga premium (0,13 satuan), setiap pertambahan nilai harga solar sebesar 1 satuan, maka nilai pendapatan perkapita akan bertambah sebesar koefisien dari harga premium (0,527 satuan), setiap pengurangan nilai harga minyak bakar sebesar 1 satuan, maka nilai pendapatan perkapita akan berkurang sebesar koefisien dari harga minyak bakar (0,981 satuan), setiap pertambahan nilai harga minyak tanah sebesar 1 satuan, maka nilai pendapatan perkapita akan bertambah sebesar koefisien dari harga minyak tanah (1,3 satuan). Nilai R-Sq(adj) = 87,8%, berarti bahwa model tersebut dapat menjelaskan kebaikan data

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

5

Page 6: Regresi Ridge Dan Regresi Beda

sebesar 87,8%. Model tersebut sudah baik untuk mewakili data karena lebih dari standart kelayakan model yaitu 75%. Uji Signifikansi ParameterUji Signifikansi Parameter Secara SerentakHipotesisH0 : β=0H1 : β ≠ 0

Statistik Uji : F=MSregresi

MSresidual

=

∑ (Y −Y )2

p

∑ (Y −Y )2

(n−p−1 )Daerah Kritis : Tolak H0 jika Fhitung>F tabel(3,47) atau P value ¿αα=¿ 0,05

Tabel 2. ANOVA Uji Signifikan Secara SerentakAnalysis of Variance

Source DF SS MS F PRegression 4 148158 37039 35,09 0,000Residual Error 15 15832 1055Total 19 163990

Keputusan: Tolak H0 karena Fhitung>F tabel (2,87) atau P value ¿α yaitu 30,20 ¿ 2,87 atau 0,000 ¿0,05Kesimpulan : parameter signifikan secara serentakUji Signifikansi Parameter Secara IndividuHipotesisH0 : β i=0H1 : β i≠ 0

Statistik Uji: t=βi

S β i

Daerah Kritis : Tolak H0 jika |t|>t α2

,n−p−1(2,101) atau P value ¿α

α=¿ 0,05Tabel 3. Uji Individu

Predictor Coef SE Coef T P VIFConstant 126,53 33,62 3,76 0,002harga premiun -0,1304 0,2512 -0,52 0,611 82,119harga solar 0,5270 0,7022 0,75 0,465 188,192harga m. bakar -0,9815 0,4251 -2,31 0,036 21,278harga m. tanah 1,2978 0,2946 4,41 0,001 12,498

Tabel 4. Hasil Keputusan dan Kesimpulan Uji Signifikan Secara IndividuHipotesis |t| t tabel Keputusan Kesimpulan

H0 : β0=0

H1 : β0≠ 03,76

2,131Tolak H0

Parameter tidak signifikan

secara individu karena ada

salah satu paramaeter yang

tidak signifikan. Nilai VIF

>10 sehingga antara

pendapatan perkapita

H0 : β1=0

H1 : β1≠ 0-0,52 Gagal Tolak H0

H0 : β2=0 0,75 Gagal Tolak H0

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

6

Page 7: Regresi Ridge Dan Regresi Beda

H1 : β2≠ 0

Indonesia (dalam Triliun)

dengan harga premium, harga

solar, harga minyak bakar dan

harga minyak tanah

mempunyai multikolinieritas.

H0 : β3=0

H1 : β3≠ 0-2,31 Gagal Tolak H0

H0 : β4=0

H1 : β4 ≠ 04,41 Gagal Tolak H0

Uji Asumsi Residual IIDN ( Identik, Independen, Distribusi Normal)Pengujian Residual Identik

Untuk mengetahui adanya keidentikan antara pendapatan perkapita Indonesia (dalam Triliun) terhadap harga premium, harga solar, harga minyak bakar dan harga minyak tanah menggunakan uji Glejser sebagai berikut:Hipotesis : H0 : σ 1

2=σ22=…¿σn

2=σ2 (residual memenuhi asumsi identik, tidak ada heteroskedastisitas)

H1 : minimal ada satu σ i2=σ j

2 (terjadi heteroskedastisitas)

Statistik Uji: t=β i

√Var β i

Daerah kritis: Tolak H0 jika |t|>t α2

,n−p−1(2,101) atau P value ¿α

α=¿ 0,05

Tabel 5. Uji Residual IdentikAnalysis of Variance

Source DF SS MS F PRegression 4 2446,4 611,6 3,16 0,045Residual Error 15 2899,3 193,3Total 19 5345,7

Keputusan: Tolak H0 Kesimpulan: Terjadi heteroskedastisitas atau residualnya tidak memenuhi asumsi identikPengujian Residual Independen

Untuk mengetahui adanya independen antara pendapatan perkapita Indonesia (dalam Triliun) terhadap harga premium, harga solar, harga minyak bakar dan harga minyak tanah menggunakan uji Durbin Watson sebagai berikut:Hipotesis : H0 : ρ=0 (tidak terjadi autokorelasi)H0 : ρ ≠ 0(terjadi autokorelasi)

Daerah kritis : Gagal Tolak H0 bila dU<d<4-Du

Statistik uji : d=∑t−2

n

( et−e t−1 )

∑t=1

n

et2

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

7

Page 8: Regresi Ridge Dan Regresi Beda

Tabel 6. Durbin Watson Statistic

Durbin-Watson statistic = 1,86030

dU<d<4-dU1,83<1,86030<4-1,831,83<1,86030<2,17Kesimpulan :

Gagal tolak H0 artinya residual memenuhi asumsi independen karena tidak terjadi autokorelasi.Pengujian Residual Distribusi Normal

Analisis plot residual Normality Plot ini dilakukan untuk mengetahui adanya Distribusi Normal antara pendapatan perkapita Indonesia (dalam Triliun) terhadap harga premium, harga solar, harga minyak bakar dan harga minyak tanahHipotesis :H0 : F(x) = F0 (x), Residual data berdistribusi NormalH1 : F(x) ≠F0 (x), Residual data tidak berdistribusi NormalStatistik Uji: D =|Fn ( x )−F0 ( x )| ¿Keterangan :Fn(x) = Nilai distribusi kumulatif sanpelF0(x) = Nilai distribusi kumulatif yang ditetapkan, atau di bawah H 0 P(Z<Z i) untuk distribusi normalDaerah Kritis : Tolak H0 jika D>Dα

Gambar 1. Plot Distribusi NormalKesimpulan: menunjukkan bahwa nilai KS sebesar 0,095 yang menunjukkan bahwa D>Dα , maka gagal tolak H0, sehingga dapat dikatakan asumsi distribusi normal. P value sebesar 0,15 sehingga P value ¿α , maka gagal tolak H0 sehingga dapat dikatakan memenuhi asumsi distribusi normal.1. REGRESI RIDGE

Uji multikolinearitas bertujuan untuk menguji apakah dalam model regresi ditemukan adanya korelasi antar variabel bebas (independen). Apabila nilai VIF lebih kecil daripada 10 maka dapat disimpulkan tidak terjadi multikolinearitas.

Tabel 7. Uji Asumsi MultikolinieritasPredictor Coef SE Coef T P VIFConstant 126,53 33,62 3,76 0,002harga premiun -0,1304 0,2512 -0,52 0,611 82,119

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

8

Page 9: Regresi Ridge Dan Regresi Beda

harga solar 0,5270 0,7022 0,75 0,465 188,192harga m. bakar -0,9815 0,4251 -2,31 0,036 21,278harga m. tanah 1,2978 0,2946 4,41 0,001 12,498

Tabel 7 dapat diketahui bahwa nilai VIF pada masing-masing variabel prediktor memiliki nilai VIF yang lebih > 10 maka dapat disimpulkan terjadi multikolinearitas. Kasus multikolinieritas dapat diatasi dengan salah satunya Ridge Regeression.

Regresi Ridge pada kasus ini digunakan untuk menggatasi multikolinieritas antar variabel prediktor. Berikut adalah analisis regresi ridge bila terjadi multikolinieritas

Tabel 8. Regresi Ridge

θ β* VIF(β1) VIF (β2) VIF (β3) VIF (β4)

0,2 0,22904 0,607113 0,204415 -0,38497 -0,2011792820,2 0,190218 0,204415 0,193878 -0,03815 -0,1225694240,2 -0,09624 -0,38497 -0,03815 0,889303 -0,2156219110,2 0,5047 -0,20118 -0,12257 -0,21562 0,775892594

Rabel 8 menunjukkan hasil yaitu centering dan resclaing regresi ridge. Dari hasil tersebut diketahui bahwa nilai θ yang terpilih adalah 0,2, karena memiliki nilai VIF mendekati 1. Sehingga diperoleh persamaan regresi yang dibentuk sebagai berikut:

Y ¿=0,22904 Z1¿+0,190218 Z2

¿−0,09624 Z3¿+0,5047 Z4

¿

Setelah dikembalikan ke variabel asal (X) diperoleh persamaan regresi baru sebagai berikut:

Y=101,45394+0,079129 X1+0,1213686 X2−0,1105129 X3+0,524458 X4

Setiap penambahan nilai harga premium sebesar 1 satuan, maka nilai pendapatan perkapita akan bertambah sebesar koefisien dari harga premium (0,079129 satuan), setiap pertambahan nilai harga solar sebesar 1 satuan, maka nilai pendapatan perkapita akan bertambah sebesar koefisien dari harga premium (0,1213686 satuan), setiap penambahan nilai harga minyak bakar sebesar 1 satuan, maka nilai pendapatan perkapita akan berkurang sebesar koefisien dari harga minyak bakar (0,1105129 satuan), setiap pertambahan nilai harga minyak tanah sebesar 1 satuan, maka nilai pendapatan perkapita akan bertambah sebesar koefisien dari harga minyak tanah (0,524458 satuan).

Berikut merupakan gambar Ridge Trace dari data pendapatan perkapita Indonesia (dalam Triliun).

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

9

Page 10: Regresi Ridge Dan Regresi Beda

Gambar 2. Ridge Trace

Keterangan pada Gambar 2 X1 merupakan harga premium, X2 merupakan harga solar, X3 merupakan harga minyak bakar dan X4 merupakan harga minyak tanah. Berdasarkan Gambar 2 saat nilai k = 0,2 untuk masing-masing pola penelususran mulai mendekati grafik yang stabil, sehingga nilai konstanta k yang cocok untuk memperoleh koefisien penduga yang stabil adalah saat k = 0,2

Kasus multiko yang telah diatasi dengan menggunakan regresi ridge, kemudian dilakukan kelayakan model apakah model layak digunakan atau tidak dengan signifikansi parameter. HipotesisH0 : β=0H1 : β ≠ 0

Statistik Uji : F=MSregresi

MSresidual

=

∑ (Y −Y )2

p

∑ (Y −Y )2

(n−p−1 )Daerah Kritis : Tolak H0 jika Fhitung>F tabel (3,47) atau P value ¿αα=¿ 0,05

Tabel 9. ANOVA Regresi Ridge Data Pendapatan Perkapita Indonesia (dalam Triliun)

  df SS MS FP_valu

eRegression 4 16146,89 4036,721 2,46×1031 0,00

Residual 15 2,46×10−27 1,6410−28

Total 19 16146,89Keputusan: Tolak H0 Kesimpulan: parameter signifikan secara serentak. Maka dapat dikatakan ada hubungan linier antara variabel-variabel bebas X1, X2, X3, dan X4 dengan variabel Y.

R2=ssreg

sstot

=1

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

10

Page 11: Regresi Ridge Dan Regresi Beda

Nilai korelasi determinasi estimator yaitu 1 atau 100%Setelah dilakukan uji signifikansi serentak dari hasil regresi ridge, maka dilakukan uji

signifikansi parameter secara individu. Berikut uji signifikansi parameter secara individu hasil dari regresi ridge.HipotesisH0 : β i=0H1 : β i≠ 0

Statistik Uji: t=βi

S β i

Daerah Kritis : Tolak H0 jika |t|>t α2

,n−p−1(2,101) atau P value ¿α

α=¿ 0,05Tabel 10. ANOVA Regresi Ridge Uji Signifikansi Secara Individu

Hipotesis |t| t tabel Keputusan Kesimpulan

H0 : β0=0

H1 : β0≠ 01,93×1016

2,131

Gagal Tolak H0

Parameter signifikan secara

individu

H0 : β1=0

H1 : β1≠ 0-6,3×1013 Gagal Tolak H0

H0 : β2=0

H1 : β2≠ 0-5,3×1013 Gagal Tolak H0

H0 : β3=0

H1 : β3≠ 07,29×1013 Gagal Tolak H0

H0 : β4=0

H1 : β4 ≠ 0-2,4 ×1013 Gagal Tolak H0

Masalah multikolinearitas yang terjadi pada regresi linear berganda pada data Pendapatan Perkapita Indonesia (dalam Triliun) dapat diselesaikan dengan metode Regresi Ridge. Dengan menggunakan Ridge Trace, yaitu dengan menambah tetapan bias θ pada diagonal matriks X t X akan diperoleh pada nilai θ tertentu nilai VIF relatif dekat dengan 1 (kurang dari 10), sehingga koefisien β lebih stabil.

Dari hasil koeefisien determinisai juga dapat diketahui yaitu 100% hal ini menunjukkan bahwa estimator yang diperoleh sudah dapat digunakan dan variansi Pendapatan Perkapita Indonesia (dalam Triliun) dapat dijelaskan oleh jumlah harga premiun, harga solar, minyak bakar dan minyak tanah.

B. STUDI KASUS STACK YANG HILANG PADA OKSIDASI TANAMAN DARI AMMONIA SAMPAI ASAM SULFAT

Model Regresi yang didapat dari hubungan antara stack yang hilang oksidasi tanaman dari ammonia sampai asam sulfat (Y) yang dipengaruhi oleh temperatur pendingin air (X1) dan konsentrasi asam (X2) sebagai berikut:

Tabel 11. Analisis Regresi

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

11

Page 12: Regresi Ridge Dan Regresi Beda

Regression Analysis: y versus x1; x2

The regression equation isy = - 51,2 + 2,73 x1 + 0,129 x2

Predictor Coef SE Coef T PConstant -51,24 18,54 -2,76 0,013x1 2,7320 0,3949 6,92 0,000x2 0,1290 0,2329 0,55 0,587

S = 5,13733 R-Sq = 77,0% R-Sq(adj) = 74,5%

Output Minitab diatas didapatkan persamaan Stack yang Hilang (Y) = -51,2 + 2,73 Temperatur Pendingin Air (X1) + 0,129 Konsentrasi Asam (X2) . Artinya untuk setiap kenaikan temperatur sebanyak 10, maka stack yang hilang sebanyak 2,73 kali dengan asumsi variabel lain tetap, dan untuk setiap kenaikan konsentasi asam satu satuan maka stack yang hilang sebanyak 0,129 kali dengan asumsi variabel lain tetap. Tabel 11 didapatkan pula nilai koefisien determinasi sebesar 74,5 % yang menunjukkan model sudah baik, karena lebih dari 70%.Signifikansi ParameterSignifikansi Parameter Secara SerentakHipotesisH0 : β=0H1 : β ≠ 0

Statistik Uji : F=MSregresi

MSresidual

=

∑ (Y −Y )2

p

∑ (Y −Y )2

(n−p−1 )Daerah Kritis : Tolak H0 jika Fhitung>F tabel (3,47) atau P value ¿αα=¿ 0,05

Tabel 12. Uji SerentakAnalysis of Variance

Source DF SS MS F PRegression 2 1594,18 797,09 30,20 0,000Residual Error 18 475,06 26,39Total 20 2069,24

Keputusan: Tolak H0 karena Fhitung>F tabel(3,47) atau P value ¿α yaitu 30,20 ¿ 3,47 atau 0,000 ¿0,05Kesimpulan : parameter tidak signifikan secara serentak

Signifikansi Parameter Secara IndividuHipotesisH0 : β i=0H1 : β i≠ 0

Statistik Uji: t=βi

S β i

Daerah Kritis : Tolak H0 jika |t|>t α2

,n−p−1(2,101) atau P value ¿α

α=¿ 0,05Tabel 13. Uji Individu

Predictor Coef SE Coef T PConstant -51,24 18,54 -2,76 0,013x1 2,7320 0,3949 6,92 0,000

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

12

Page 13: Regresi Ridge Dan Regresi Beda

x2 0,1290 0,2329 0,55 0,587

S = 5,13733 R-Sq = 77,0% R-Sq(adj) = 74,5%

Tabel 14. Hasil Uji Individu

Hipotesis |t| t tabel Keputusan Kesimpulan

H0 : β0=0H1 : β0≠ 0 -2,76

2,101

Tolak H0

Parameter tidak signifikan secara individu karena ada salah satu paramaeter yang tidak signifikan

H0 : β1=0H1 : β1≠ 0 6,92 Tolak H0

H0 : β2=0H1 : β2≠ 0 0,55 Gagal Tolak H0

Uji Asumsi AutokorelasiBerikut Uji Asumsi untuk medeteksi adanya autokorelasi

Tabel 15. Uji Asumsi AutokorelasiSource DF Seq SSTemperatur Pendingin Air 1 1586,09Konsentrasi Asam 1 8,09

Durbin-Watson statistic = 0,793294

Tabel 15 tersebut dari nilai Durbin Watson menunjukkan terjadi autokorelasi karena nilai Durbin Watson (d) sebesar 0,793294, dimana nilai dL untuk k=2 dan n=21 adalah sebesar 1,1246 dan nilai dU adalah sebesar 1,5385. Karena nilai d masuk kedalam selang 0<d<1,1246 maka terjadi autokorelasi positif sehingga perlu dilakukan tindakan untuk mengatasi autokorelasi. Dalam mengatasi autokorelasi dilakukan dengan regresi beda.

Pengujian Residual Distribusi NormalAnalisis plot residual Normality Plot ini dilakukan untuk mengetahui

adanya Distribusi Hipotesis :H0 : F(x) = F0 (x), Residual data berdistribusi NormalH1 : F(x) ≠F0 (x), Residual data tidak berdistribusi NormalStatistik Uji: D =|Fn ( x )−F0 ( x )| ¿Keterangan :Fn(x) = Nilai distribusi kumulatif sanpelF0(x) = Nilai distribusi kumulatif yang ditetapkan, atau di bawah H0 P(Z<Z i) untuk distribusi normalDaerah Kritis : Tolak H0 jika D>Dα

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

13

Page 14: Regresi Ridge Dan Regresi Beda

Gambar 3. Plot NormalitasKesimpulan: menunjukkan bahwa nilai KS sebesar 0,091 yang

menunjukkan bahwa D>Dα , maka gagal tolak H0, sehingga dapat dikatakan asumsi distribusi normal. P value sebesar 0,15 sehingga P value ¿α , maka tolak H0 sehingga dapat dikatakan memenuhi asumsi distribusi normal.

2. REGRESI BEDAUji autokorelasi bertujuan untuk menguji apakah dalam model regresi ditemukan

adanya independensi antar variabel bebas yang dilihat dari nilai durbin watsonnya. Pada model regresi antara stack yang hilang dengan temperatur pendingin air (X1) dan konsentrasi asam (X2), dapat dilihat bahwa terjadi autokorelasi atau residual dari data tidak independen. Kasus autokorelasi dapat diatasi salah satunya dengan regresi beda

Regresi beda merupakan salah satu cara untuk mengatasi independensi. Pertama adalah melakukan differensiasi pada variabel respon (Y) dan variabel predictor (X), kemudian melakukan regresi kembali antara hasil differensiasi kedua variabel. Berikut adalah hasil dari differensiasi masing-masing variabel :

Tabel 16. Differinsiasi Variabel

diff_Stack yang hilang

diff_Temperatur pendingin air

diff_konsentrasi asam

* * *-5 0 -10 -2 2-9 -1 -3-10 -2 00 1 01 1 61 0 0-5 -1 -6-1 -5 -70 0 9-1 -1 -1-2 1 -61 1 11-4 -1 -4-1 0 -3

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

14

Page 15: Regresi Ridge Dan Regresi Beda

1 1 -140 0 71 1 16 0 20 0 9

Setelah dilakukan differensiasi terhadap semua variabel, maka dilakukan analisis regresi antara variabel yang telah didiferensiasikan tersebut. Berikut adalah hasil dari analisis regresi beda :

Tabel 17. Hasil Regresi BedaRegression Analysis: diff_Stack y versus diff_Tempera; diff_konsent

The regression equation isdiff_Stack yang hilang = - 1,09 + 0,775 diff_Temperatur pendingin air + 0,118 diff_konsentrasi asam

20 cases used, 1 cases contain missing values

Predictor Coef SE Coef T P VIFConstant -1,0907 0,8237 -1,32 0,203diff_Temperatur pendingin air 0,7746 0,5790 1,34 0,199 1,069diff_konsentrasi asam 0,1176 0,1365 0,86 0,401 1,069

S = 3,56583 R-Sq = 16,4% R-Sq(adj) = 6,6%

Model Regresi Beda : y t− y t−1=β0+β1( x t−x t−1)+εt

Berdasarkan analisis regresi stack yang hilang dengan Temperatur pendingin air dan konsentrasi asam tersebut diperoleh persamaan regresinya yaitu stack yang hilang = -1,09 + 0,775 temperatur pendingin air + 0,118 konsentrasi asam, yang berarti bahwa setiap kenaikan satu satuan temperatur pendingin air sebesar 1 satuan, maka stack yang hilang akan bertambah sebesar 0,775 satuan, setiap pertambahan konsentrasi asam sebesar 1 satuan, maka stack yang hilang akan bertambah sebesar koefisien dari 0,118 satuan. Nilai R-Sq(adj) = 6,6%, berarti bahwa model tersebut dapat menjelaskan kebaikan data sebesar 6,6%. Model tersebut jelek untuk mewakili data karena kurang dari standart kelayakan model yaitu 75%.

Uji Asumsi Residual IIDN ( Identik, Independen, Distribusi Normal)Pengujian Residual Identik

Untuk mengetahui adanya keidentikan antara stack yang hilang terhadap temperatur pendingin air dan konsentrasi asam menggunakan uji Glejser sebagai berikut:Hipotesis : H0 : σ 1

2=σ22=…¿σn

2=σ2 (residual memenuhi asumsi identik, tidak ada heteroskedastisitas)

H1 : minimal ada satu σ i2=σ j

2 (terjadi heteroskedastisitas)

Statistik Uji: t=β i

√Var β i

Daerah kritis: Tolak H0 jika |t|>t α2

,n−p−1 atau P value ¿α

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

15

Page 16: Regresi Ridge Dan Regresi Beda

α=¿ 0,05

Tabel 18. ANOVA Hasil Regresi BedaAnalysis of Variance

Source DF SS MS F PRegression 2 42,39 21,20 1,67 0,218Residual Error 17 216,16 12,72Total 19 258,55

Keputusan: Gagal Tolak H0 Kesimpulan: Tidak terjadi heteroskedastisitas atau residualnya memenuhi asumsi identikPengujian Residual Independen

Untuk mengetahui adanya independen antara pendapatan perkapita Indonesia (dalam Triliun) terhadap harga premium, harga solar, harga minyak bakar dan harga minyak tanah menggunakan uji Durbin Watson sebagai berikut:Hipotesis : H0 : ρ=0 (tidak terjadi autokorelasi)H0 : ρ ≠ 0(terjadi autokorelasi)Daerah kritis : Gagal Tolak H0 bila dU<d<4-Du

Statistik uji : d=∑t−2

n

( et−e t−1 )

∑t=1

n

et2

Tabel 19. Durbin Watson Hasil Regresi Beda

Durbin-Watson statistic = 1,78345

dU<d<4-dU1,41<1,78345 <4-1,411,41<1,7845<2,59Kesimpulan :

Gagal tolak H0 artinya residual memenuhi asumsi independen karena tidak terjadi autokorelasi.Pengujian Residual Distribusi Normal

Analisis plot residual Normality Plot ini dilakukan untuk mengetahui adanya Distribusi Hipotesis :H0 : F(x) = F0 (x), Residual data berdistribusi NormalH1 : F(x) ≠F0 (x), Residual data tidak berdistribusi NormalStatistik Uji: D =|Fn ( x )−F0 ( x )| ¿Keterangan :Fn(x) = Nilai distribusi kumulatif sanpelF0(x) = Nilai distribusi kumulatif yang ditetapkan, atau di bawah H0 P(Z<Z i) untuk distribusi normalDaerah Kritis : Tolak H0 jika D>Dα

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

16

Page 17: Regresi Ridge Dan Regresi Beda

1050-5-10

99

95

90

80

70

605040

30

20

10

5

1

RESI3

Perc

ent

Mean 8,215650E-16StDev 3,373N 20KS 0,203P-Value 0,038

Probability Plot of RESI3Normal

Gambar 4. Plot Normal setelah di Rergresi BedaKesimpulan: menunjukkan bahwa nilai KS sebesar 0,203 yang

menunjukkan bahwa D>Dα , maka gagal tolak H0, sehingga dapat dikatakan asumsi distribusi normal. P value sebesar 0,038 sehingga P value ¿α , maka tolak H0 sehingga dapat dikatakan tidak memenuhi asumsi distribusi normal.

| INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA

17