Ekonometrika Fix Tanpa Gambar

50
ANALISIS REGRESI LINEAR BERGANDA: PERSOALAN PERKIRAAN INTERVAL DAN PENGUJIAN HIPOTESIS A. Asumsi Kenormalan Tujuan dalam analisis regresi linear berganda hanya untuk mendapatkan perkiraan tunggal (point estimation), metode kuadrat terkecil yang biasa (OLS= Ordinary Least Square) sudah cukup tanpa memerlukan asumsi tentang distribusi probabilitas dari kesalahan pengganggu ɛ i , misalnya harus mengikuti distribusi normal. Akan tetapi, kalau tujuan kita selain untuk membuat perkiraan tunggal, juga harus membuat statistic induktif (statistical inference), asumsi mengenai distribusi probabilitas dari kesalahan pengganggu ɛ kemudian menjadi penting. Dalam persoalan induktif, kita beranggapan bahwa kesalahan pengganggu ɛ i mengikuti distribusi normal dengan rata-rata nol dan varian σ 2 , hal ini berlaku juga dalam regresi linear berganda. Dengan asumsi kenormalan ini, pemerkira dengan menggunakan metode kuadrat terkecil biasa (OLS) dari koefisien regresi parsial, yang sama dengan menggunakan maksimum likelihood (ML), estimator, merupakan pemerkira linear tidak bisa dengan varian terkecil atau minimum (BLUE). Lagi pula pemerkira b 12.3 ,b 13.2 ,danb 1.23 , mengikuti distribusi normal dengan rata-rata B 12.3 ,B 13.2 dan B 1.23 dengan varian b 12.3 , varian b 132 dan varian b 1.23 . Selain dari itu, ( n3) S e 2 σ 2 mengukiti distribusi khi-kuadrat dengan dengan kebebasan (n-3), yaitu Z n3 2 . Oleh karena itu 1

description

Makalah Ekonometrika kelompok 6 Asumsi kenormalan

Transcript of Ekonometrika Fix Tanpa Gambar

ANALISIS REGRESI LINEAR BERGANDA: PERSOALAN PERKIRAAN INTERVAL DAN PENGUJIAN HIPOTESISA. Asumsi KenormalanTujuan dalam analisis regresi linear berganda hanya untuk mendapatkan perkiraan tunggal (point estimation), metode kuadrat terkecil yang biasa (OLS= Ordinary Least Square) sudah cukup tanpa memerlukan asumsi tentang distribusi probabilitas dari kesalahan pengganggu , misalnya harus mengikuti distribusi normal. Akan tetapi, kalau tujuan kita selain untuk membuat perkiraan tunggal, juga harus membuat statistic induktif (statistical inference), asumsi mengenai distribusi probabilitas dari kesalahan pengganggu kemudian menjadi penting.Dalam persoalan induktif, kita beranggapan bahwa kesalahan pengganggu mengikuti distribusi normal dengan rata-rata nol dan varian , hal ini berlaku juga dalam regresi linear berganda. Dengan asumsi kenormalan ini, pemerkira dengan menggunakan metode kuadrat terkecil biasa (OLS) dari koefisien regresi parsial, yang sama dengan menggunakan maksimum likelihood (ML), estimator, merupakan pemerkira linear tidak bisa dengan varian terkecil atau minimum (BLUE). Lagi pula pemerkira , mengikuti distribusi normal dengan rata-rata dan dengan varian , varian dan varian .Selain dari itu, mengukiti distribusi khi-kuadrat dengan dengan kebebasan (n-3), yaitu . Oleh karena itu dalam praktiknya tidak diketahui, maka harus diperkirakan dengan /(n-3).Apabila ,, merupakan standart error dan , maka variable t berikut mengikuti fungsi t dengan derajad kebebasan (n-3):t = ((6.1)t = ((6.2)t = ((6.3)

Perhatikan bahwa besarnya derajat kebebasan adalah (n-3), sebab sewaktu menghitung , dalam rangka untuk menghitung standart error dari masing-masing koefisien regresi, kita harus memperkirakan 3 parameter, yaitu sebagai berikut. = - - - Atau = - - , di mana variable dengan huruf kecil merupakan deviasi.Distribusi t, yang nilainya dapat dibaca dalam table t sangat berguna untuk membuat perkiraan interval maupun untuk menguji hipotesis regresi parsial.Sebagai suatu ilustrasi, misalnya kita mempunyai data dari suatu Negara, di mana = pendapatan personal, = Variabel waktu, Y = pengeluaran konsumsi, dan kita ingin mempelajari hubungan antara pengeluaran konsumsi (Y) dengan pendapatan personalnya dan pengaruh trend / waktu (dengan menggunakan model berikut.E(Y/Di dalam membuat analisis regresi berganda dengan menggunakan data berkala (time series data), pengaruh waktu (trend) sebaiknya dimasukkan dalam model regresi, dengan alas an sebagai berikut:(1) Tujuan analisis mungkin hanya sekedar mengetahui tingah laku (behavior) variable tidak bebas Y yang bergerak menurut waktu. Sebagai contoh, grafik yang menujukkan fluktuasi (fluctuation) sering digambarkan untuk menjukkan flutuasi dari berbagai variable ekonomi yang penting, antara lain GNP/PDB, konsumsi nasional, harga, stok, angka indeks biaya hidup, produksi padi, ekspor, impor, dan lain sebagainya. Dengan melihat grafik tersebut, secara sepintas lalu kita bisa mengetahui apakah terjadi trend yang menaik (increasing), menurun (decreasing), atau tanpa trend sama sekali. Dalam analisis tersebut kita tidak ingin melihat factor-faktor penyebab yang membuat varibel tidak bebas mengalami penurunan atau peningakatan, tetapi hanya sekedar untuk mengetahui terjadinya perubahan menurut waktu saja.(2) Kadang-kadang variable waktu dipergunakan sebagai pengganti suatu variable dasar yang mempengaruhi Y. Akan tetapi, variable dasar tersebut tidak tersedia, mungkin sukar sekali untuk menyimpulkannya. Sebagai contoh, dalam meramalkan produksi, variabel teknologi sangat penting dan merupakan variable dasar, tetapi sukar memperoleh datanya, walaupun mudah dipahami bahwa memang ada pengaruh dari teknologi terhadap produksi, tetapi sukar untuk mengukurnya.Maka dari itu, mungkin lebih mudah untuk menganggap bahwa teknologi merupakan fungsi dari waktu ke waktu yang di ukur secara kronologis.Di dalam situasi tertentu, mungkin ada suatu kepercayaan/keyakinan varibel dasar yang mempengaruhi Y sangat berhubungan erat dengan waktu, maka dari itu, lebih mudah untuk menggunakan variable waktu dalam model regresi untuk menggantikan peran varibel dasar yang memang sukar untuk mengukurnya.Dalam ilustrasi di atas, di mana = pendapatan, Y = konsumsi, dan mungkin mewakili populasi/penduduk, konsumsi meningkat karena jumlah penduduk meningkat, padahal penduduk mungkin ada hubungan linear dengan waktu. Oleh karena itu, kalau data penduduk tidak tersedia, bisa diganti variable waktu, jadi = waktu.

Contoh Soal 6.1Berdasarkan data dari Website BPS Kalimantan Selatan, di mana :X2 menunjukkan Pendapatan Per Kapita Kabupaten Tanah Bumbu atas dasar harga berlaku tahun 2009-2013X3 menunjukkan variabel waktu (tahun)Y menunjukkan persen (%) angka harapan hidupBuat persamaan regresi berganda dilengkapi dengan Se,R2, R2, standard error, koefisien regresi berganda, dan nilai t observasi berdasarkan rumus (6.2 dan 6.3), kalau masing-masing koefisien regresi parsial sebenarnya nol.TahunX2X3Y

200924.249.278,99164,63

201024.030.367,64264,94

201125.905.459,38365,36

201227.695.865,50465,68

201329.223.425,28565,86

131.104.396,8015 326,47

26.220.879,36365,29

19

x2(X2-X2)x3(X3-X3)Y(Y - Y)x22x32x2x3x2yx3y

-1.971.600,37-2-0,663.887.208.018.984,14 4 0,43563.943.200,741.301.256,241,32

-2.190.511,72-1-0,354.798.341.595.457,35 10,12252.190.511,72766.679,100,35

-315.419,9800,0799.489.763.783,20 0 0,00490,00-22.079,400

1.474.986,1410,392.175.584.113.192,10 10,15211.474.986,14575.244,590,39

3.002.545,9220,579.015.282.001.708,66 4 0,32496.005.091,841.711.451,171,14

19.975.905.493.125,50101,0413.613.790,444.332.551,703,20

Belanja Statistikn = 5x2iyi = 4.332.551,70x2i2 = 19.975.905.493.125,50x3iyi = 3,20x3i2 = 10x2ix3i = 13.613.790,44yi2 = 1,04Pemecahan Menghitung b12.3 :Pembilang = (x2iyi)( x3i2) (x3iyi) (x2ix3i) = (4.332.551,70) (10) (3,20)(13.613.790,44) = 43.325.517 43.564.129,41 = -238.612,41

Penyebut= (x2i2) (x3i2) (x2ix3i)2= (19.975.905.493.125,50) (10) (13.613.790,44)2= 199.759.054.931.255 185.335.290.144.235= 14.423.764.787.020

-238.612,41b12.3= 14.423.764.787.020b12.3= -0,000000016543

Menghitung b13.2 :Pembilang = (x3iyi)(x2i2) (x2iyi) (x2ix3i) = (3,20) (19.975.905.493.125,50) (4.332.551,70) (13.613.790,44) = 63.922.897.578.001,60 58.982.450.914.265,70 = 4.940.446.663.735,85

Penyebut (sama dengan diatas) b13.2== 0,3425213

= 65,29 (-0,000000016543)(26.220.879,36) (0,3425213)(3) = 65,29 (-0,433772007) (1,0275639) = 64,6962 x3i2S2 b12.3 = Se2 (x2i2) (x3i2) (x2ix3i)2 (Penyebut)

ei2 Se2 = (n - 3)

ei2= yi2 - i2

i2= b12.3x2iyi + b13.2x3iyi= (-0,000000016543)(4.332.551,70) + (0,3425213)(3,20) = (-0,071673403) + (1,09606816) = 1,024394757 ei2= 1,04 1,024394757= 0,015605

Se2 = = 0,007803

Se = 0,007803 = 0,08833459

x3i2S2 b12.3 = Se2 (x2i2) (x3i2) (x2ix3i)2 (Penyebut)= (0,007803) = (0,007803) = (0,007803) = 0,007803 0,000000000000693300268526238= 0,00000000000000540982199531023

Sb12.3 = 0,00000000000000540982199531023 = 0,0000000735514921351717

x2i2S2 b13.2 = Se2 (x2i2) (x3i2) (x2ix3i)2 (Penyebut)= (0,007803) = (0,007803) = 0,007803 1,384930064= 0,010806609

Sb13.2 = 0,010806609 = 0,103954841

b12.3x2i yi + b13.2x3iyi i2 R2 = y i2

(-0,000000016543)(4.332.551,70) + (0,3425213)(3,20) =1,04

-0,071673403 + 1,09606816 = 1,04 = 0,984994959 R = = 0,992469122

Persamaan regresi; = b1.23 + b12.3X2 + b13.2X3 = 64,6962 + (-0,000000016543X2) + 0,3425213X3Standard error (0,0000000735514921351717) (0,103954841)R2 = Se = 0,08833459Standard eror hanya dihitung untuk koefisien regresi parsial saja. Untuk intercept (b1.23) tidak dihitung.b12.3 = -0,000000016543. Artinya, kalau X2 (Pendapatan per kapita) naik satu satuan (1 unit), diharapkan (persentasi angka harapan hidup) akan naik -0,0000002 kali, kalau X3(setiap tahunnya) tetap (konstan).b13.2 = 0,3425213. Artinya, kalau X3(setiap tahunnya) naik satu satuan (1 unit), diharapkan (persentasi harapan hidup) akan naik 0,04kali, kalau X2(Pendapatan perkapita) tetap (konstan).b1.23 = (intercept) = 64,6962. Artinya, kalau X2 =X3= 0, maka diharapkan nilai = 64,6962 (Y = perkiraan/ramalan Y, merupakan nilai regresi).R2 = 0,984994959. Artinya, sumbangan X2 dan X3 terhadap variasi (naik turunya) Y sebesar 98% (hampir 100% jika dibulatkan) , sisanya sebesar 2 % disebabkan oleh faktor-faktor lainnya, kalau persamaan regresi linier berganda = 64,6962 + (-0,000000016543X2) + 0,3425213X3

Ada 2 rumus untuk R2 : Se21. R2 = 1 - Sy2

(n -1)2. R2= 1 (1 R2) , k = 3 (n - k)

Rumus (1) y2Sy2 = (n-1) = = = 0,26

Se2 R2 = 1 - Sy2= 1

=1 - 0,030012= 0,969988 dibulatkan menjadi 0,96999

Rumus (2) (n -1) R 2 = 1 (1 R2) , k = 3 (n - k)= 1 ( 1 0,984994959) = 1 (0,015005)(2)= 1 0,03001= 0,96999(Apabila hasilnya tidak sama, hal ini terjadi karena pembulatan)Apabila B12.3 = B13.2 = 0: b12.3t = Sb12.3

-0,000000016543 = 0,0000000735514921351717 = -0,224917259

b13.2t = Sb13.2

0,3425213 = 0,103954841

= 3,294904756

= b1.23 + b12.3X2 + b13.2X3 = 64,6962 - 0,000000016543X2 + 0,3425213X3Standard error (0,0000000735514921351717) (0,103954841)Nilai t observasi (-0,224917259) (3,294904756)Se = 0,08833459R2 = 0,984994959R2 = 0,96999Untuk pengujian hipotesis, nilai t observasi dibandingkan dengan nilai t dari tabel t.

6.2 Pengujian Hipotesis Koefisien Regresi Parsial Secara Individu Kalau kita mempunyai anggapan atau asumsi bahwa i mengikuti distribusi normal dengan rata-rata nol dan varian 2, yaitu i ~ N ( 0, 2 ) , maka kita dapat menggunakan t untuk menguji hipotesis mengenai koefisien regresi parsial secara individu untuk contoh soal berikut.

Contoh Soal 6.2Dengan menggunakan contoh soal 6.1, uji pendapat atau hipotesis bahwa Pendapatan Per Kapita penduduk Tanbu (X2) tidak mempengaruhi persentasi harapan hidup penduduk (Y) kalau X3 konstan, dengan alternatif ada pengaruh. Pergunakan tingkat signifikan 0,10 atau 10%.

Pemecahan : Ho : B12.3 = 0Ha : B12.3 0 b12.3 t12.3 = s b12.3 -0,000000016543 = 0,0000000735514921351717 = -0,224917259

Dengan derajat kebebasan df(n-3)= 5-3= 2 dan /2 = 0,10/2 = 0,05, maka t 0,05(2) = 2,920 (dari tabel t). Oleh karena t < t 0,05(2), maka Ho diterima, artinya pendapat bahwa Pendapatan Perkapita tidak mempengaruhi persentasi angka harapan hidup dapat dibenarkan. Kita pergunakan uji dua arah.Karena Ho diterima, berarti kita menolak Ha, dengan demikian kita juga dapat menyimpulkan bahwa Pendapatan Perkapita memang tidak mempunyai pengaruh terhadap persentasi angka harapan hidup.Telah dibahas dalam bab 4 bahwa ada hubungan yang erat antara pengujian hipotesis dengan perkiraan interval. Untuk contoh ini dengan tingkat keyakinan sebesar 0,90 atau 90%, kita bisa membuat perkiraan interval B12.3 dengan Rumus sebagai berikut :b12.3 S< B12.3 < b12.3 + S

Contoh soal 6.3 Dengan menggunakan data contoh soal 6.1, buat perkiraan interval untuk B12.3 dengan tingkat keyakinan 0,90. Sekaligus dicek apakah dengan menggunakan pendekatan perkiraan interval, hipotesis bahwa B12.3 = 0 memang ditolak.Pemecahan : b12.3 - t/2Sb12.3 < B12.3 < b12.3 + t/2Sb12.3-0,000000016543 - 2,920 (0,0000000735514921351717) B12.3 -0,000000016543 + 2,920 (0,0000000735514921351717)-0,000000016543 0,000000214770357034701 B12.3 -0,000000016543 + 0,000000214770357034701-0,000000231313 B12.3 0,000000198227

B12.3 terletak dalam interval -0,000000231313 sampai 0,000000198227 dengan tingkat keyakinan 90%. Ini berarti bahwa kalau 100 sample dengan elemen atau observasi sebanyak n = 5. Dipilih dari suatu populasi dan kita sudah menghitung sebanyak 100 perkiraan interval seperti b12.3 + t/2 Sb12.3 kita mengharapkan bahwa ada 90 (90%) perkiraan interval yang akan memuat nilai parameter B12.3 yang sebenarnya, sedangkan ada lima perkiraan interval yang tidak memuat B12.3 kalau kita mengambil satu sampel secara acak atau random sample kita harapkan mudah-mudahan terpilih interval yang memuat B12.3. Oleh karena itu nilai hipotesis nol yang menyatakan bahwa B12.3 = 0 ternyata tidak terletak dalam interval dari sample yang terpilih yaitu antara --0,000000231313 sampai 0,000000198227 maka kita bisa menerima Ho : B12.3 = 0 dengan tingkat keyakinan 90% kesalahan sebesar 10%.

Dengan uraian ini, jelaslah bahwa baik dengan menggunakan

b12.3 t12.3 = S b12.3 = -0,224917259 Maupun dengan perkiraan interval -0,00000006835717612561 B12.3 0,00000041771466167991Kita dapat memperoleh suatu kesimpulan yang sama, yaitu menerima Ho : B12.3 = 0.Contoh Soal 6.4Dengan menggunakan contoh soal 6.1, uji pendapat bahwa B13.2 = 0, dengan alternatif B13.2 0. Pergunakan = 0,10 serta menggunakan pendekatan uji t (t test) dan perkiraan interval.PemecahanH0: B13.2 = 0Ha: B13.2 0 b13.2t = Sb13.2

0,3425213 = 0,103954841 = 3,29490475580642

Dari table t, t0,05(2) = 2,920Oleh karena t > t0,05(2), maka H0 ditolak, artinya pendapat atau hipotesis bahwa B13.2 = 0 tidak dapat diterima. Karena H0 ditolak, artinya memang ada pengaruh dari variable waktu (X3) terhadap persentasi angka harapan hidup kalau pendapat personal (personal income) tetap (konstan).Contoh Soal 6.5 Dengan menggunakan data contoh soal 6.1, buat perkiraan interval untuk B13.2 dengan tingkat keyakinan 0,90. Sekaligus dicek apakah dengan menggunakan pendekatan perkiraan interval, hipotesis bahwa B13.2 = 0 memang ditolak.Pemecahan : b13.2 - t/2Sb13.2 < B13.2 < b13.2 + t/2Sb13.20,3425213 2,920(0,103954841) B13.2 0,3425213 + 2,920(0,103954841)0,3425213 0,30354813572 B13.2 0,3425213 + 0,303548135720,03897316428 B13.2 0,64606943572

B13.2 terletak dalam interval 0,03897316428 sampai 0,64606943572 dengan tingkat keyakinan 90%. Ini berarti berarti kalau kita menarik 100 sample dari suatu populasi, kemudian dari setiap sample kita buat perkiraan interval b13.2 + t/2 Sb13.2 maka akan kita peroleh 100 perkiraan interval .Dari 100 interval ini +90%, akan memuat nilai parameter B13.2 yang sebenarnya dan yang sebesar 10% tidak memuat. Kalau kita mengambil satu sample saja secara acak mudah-mudahan perkiraan interval yang dihitung berdasarkan sample tersebut memuat B13.2 yang sebenarnya inilah pengertian tingkat keyakinan 90% berarti kita mentolerir kesalahan 10%.Dalam praktiknya, bisa juga kita peroleh interval yang tidak memuat B13.2 tetapi hal ini hanya terjadi 10 kali diantara 100. Jadi probabilitanya sebesar 10% saja. Setiap nilai t yang terletak dibawah setiap koefisien regresi dalam persamaan linier berganda dapat dipergunakan untuk menguji hipotesis bahwa koefisien regresi dari variable yang bersangkutan nol (artinya, mempunyai pengaruh terhadap Y) dengan alternative ada pengaruh. Caranya dengan membandingkan nilai t tersebut dengan nilai t/2(n-3) dari tabel(t). Apabila hipotesisi nol ditolak, berarti variable yang bersangkutan mempunyai pengaruh terhadap Y. Hal ini terjadi kalau t > t/2. Namun jika nilai t tersebut < t/2(n-3) dari tabel(t), maka hipotesisi nol diterima, berarti variable yang bersangkutan tidak mempunyai pengaruh terhadap Y, dan secara statistik pengaruh tersebut signifikan. Secara individu kita mungkin dapat menerima Ho tetapi secara keseluruhan (tidak melihat satu persatu) mungkin kita harus menolaknya, yang berarti secara keseluruhan variable-variable bebas tersebut mempengaruhi Y. Dengan demikian, persamaan regresi linier berganda yang kita peroleh berdasarkan perhitungan data empiris tidak boleh meramalkan Y, sebab tidak satu variable pun yang mempengaruhi Y. 6.3 pengujian Hipotesis koefisien Regresi Parsial secara menyeluruhTelah kita bicarakan dalam subbab 6.2 mengenai pengujian hipotesis regresi secara parsial individu, yaitu pengujian secara terpisah, bahwa koefisien regresi parsial yang bersangkutan sama dengan nol .sekarang perhatikan pengujian hipotesis secara sekaligus/serentak dan menyeluruh sebagai berikut .HO : B12.3=B13.2=0Hipotesis nol ini merupakan hipotesis secara simultan, bersama-sama sekaligus bahwa B12.3 dan B13.2 secara simultan/bersama-sama(simultaneously/jointly)mempunyai nilai sama dengan nol, yang berarti secara bersama-sama tidak mempengaruhi Y, sehingga = b1.23 + b12.3 X2 + b13.2X3 tidak boleh untuk memperkirakan/meramalkan Y.Pengujian hipotesis semacam ini disebut pengujian signifikan secara menyeluruh (overall significant test) untuk memperkirakan garis regresi, yaitu apakah variable tidak bebas Y berkorelasi/berhubungan secara linear terhadap kedua variable X2 dan X3 secara bersama-sama.Pengujian hipotesis koefisien regresi secara simultan tidak dapat dilakukan secara individu, pengujian dengan menggunakan criteria uji(t test criteria) tidak berlaku disini. Alasannya ialah dalam pengujian hipotesis mengenai koefisien regresi parsial secara individu, kita membuat anggapan secara implisit bahwa setiap pengujian hipotesis berdasarkan suatu sample yang berbeda dan bebas. Jadi dalam menguji b12.3 dengan hipotesis nol(bahwa B12.3 =0) menggunakan sampel bebas yang berbeda dengan sampel yang dipergunakan untuk menguji b13,2 dengan hipotesis nol ( bahwa B 13.2=O) Jelasnya, pengujian bagi setiap koefisien regresi parsial harus menggunakan sampel bebas yang berbeda. Dengan kata lain,didalam pengujian hipotesis mengenai koefisien regresi parsial secara individu, kita dapat membuat perkiraan interval dengan tingkat keyakinan sebesar 95% untuk B12.3. Apabila kita menggunakan data dari sampel yang sama untuk menguji bahwa B13.2 = 0, kemudian kita buat perkiraan interval juga dengan tingkat keyakinan 95% untuk B13.2 kita tidak dapat menjamin bahwa B12.3 dan B13.2 akan terletak dalam interval keyakinan masing-masing dengan probabilitas sebesar (1 ) (1 - ) = (0.95) (0.95). dengan perkataan lain, meskipun pernyataan :P(b12.3 - =1-P(b13. 2 - =1-Secara individu benar, tetapi akan tidak benar pernyataan berikut :P(b12,3 = (1-2Sebab interval keyakinan tidak akan bebas ( independent) kalau data dari sample yang sama dipergunakan untuk membut interval keyakinan.Untuk menguji koefisien regresi secara menyeluruh harus menggunakan criteria uji F (F test criteria) melalui peralatan analisis varian yang caranya akan dijelaskan dalam uraian berikut.

6.3.1 Analisis Varian untuk Pengujian Koefisien Regresi Parsial Secara MenyeluruhKriteria uji (t) dapat dipergunakan untuk menguji koefisien regresi parsial secara menyeluruh atau stimulant, masing-masing koefisien regresi parsial smengambil nilai nol secara bersama-sama, tetapi harus menggunakan criteria uji F (F test criteria) melalui penggunaan peralatan analisis varian.Ingat identitas berikut. = ( + + TSS = ESS + RSSTSS = Jumlah kuadrat (total sum of squares), mempunyai derajat kebebasan (df) = n 1.ESS = Jumah kuadrat regresi (explained sum of squares), mempunyai derajat kebebasan (df) = 2.RSS = Jumlah kuadrat kesalahan pengganggu (residual sum of squares), mempunyai derajat kebebasan (df) = n 3.

Tabel Anavar, untuk Regresi Tiga VariabelSumber VariasiJumlah Kuadrat(SS)Derajat Kebebasan (df)Rata-Rata Jumlah Kuadrat (MSS)*

Dari Regresi (ESS) + 2(k 1 ) +

Kesalahan Pengganggu (RSS)n 3

(n k )/ n 3 =

TSSn - 1

*Mean Sum of SquaresSekarang dapat ditunjukkan bahwa dengan asumsi kesalahan pengganggu Mengikuti distribusi normal dan hipotesis nol, dimana = = 0, variabel F sebagai berikut.F = (6.7)Mengikuti distribusi F dengan derajat kebebasan 2 dan (n 3) dengan symbol Dengan asumsi bahwa ), dapat ditunjukkan bahwa: E ( (6.8)Dengan tambahan asumsi bahwa dapat ditunjukkan bahwa:E( + ) / 2 = (6.9)Jadi, kalau hipotesis nol benar, maka (6.8) dan (6.9) sama-sama merupakan perkiraan dari . Hal ini tidak mengherankan, sebab kalau ada hubungan antara Y, X2, dan X3 yang sangat trivial, sumber variasi hanya dari kekuatan acak ( random forces) dari kesalahan pengganggu Akan tetapi, apabila hipotesis nol tidak benar(salah), yaitu bahwa X2 dan X3 benar-benar mempengaruhi Y, kesamaan (equality) antara (6.8) dan (6.9) tidak berlaku.Dalam hal ini ESS akan relative lebih besar daripada RSS dengan memperhitungkan besarnya derajat kebebasan masing-masing,. Maka dari itu, nilai rasio F dari (.7) merupakan suatu criteria uji untuk pengujian hipotesis nol. Bahwa koefisien regresi parsial secara bersama-sama mempunyai nilai nol, secar bersama-sama variable bebas tidak mempengaruhi Y. Apabila ternyata nilai F lebih besar dari F yang berasal daro table F, Ho harus ditolak. Dengan perkataan lain, F > Ho ditolak, sebaliknya Ha harus kita terima.Contoh Soal 6.6Dengan menggunakan data dari contoh soal 6.1 uji hipotesis bahwa Pendapatan Per kapita dan variable waktu tidak mempengaruhi persentase angka harapan hidup, dengan perkataan lain X2 dan X3 tidak mempengaruhi Y, dengan alternatif ada salah satu yang mempengaruhi. Pergunakan Pemecahan TSS= y2 = 1,04n = 5ESS= b12.3 x2iyi + b13.2 x3iyi= (-0,000000016543)(4.332.551,70) + (0,3425213)(3,20)= -0,0716734027731 + 1,09606816= 1,0243947572269RSS= ei2 = 0,015605Ho : b12.3 = b13.2 =0Ha : paling tidak salah satu tidak nolTABEL ANAVARSumberVariasiJumlah Kuadrat( SS)DerajatKebebasan( df )Rata-rataKuadrat( MSS )

Regresi (ESS)Kesalahan pengganggu (RSS)1,02439475722690,015605220,51219737861345 0,0078025

TSS1,044

F = = 65,6452904342775*F0,05(2) (2)= 19,0F0,01(2) (2)= 99,0Oleh karena F > F0,05(2) (2), maka Ho ditolak. Jadi, pendapat bahwa Pendapatan Per kapita (X2) dan variable waktu (X3) tidak mempengaruhi persentase angka harapan hidup (Y) tidak benar. Kedua variable tersebut mempengaruhi Y.Kalau kita pergunakan = 0.01 (1%), F0,01(2)(2) = 99,0. Ternyata F t0,025(3), maka H0 : B12 = 0 ditolak, artinya ada pengaruh yang signifikan / nyata dari Pendapatan perkapita terhadap persentasi angka harapan hidup (Y). H0 ditolak pada tingkat signifikan 5%, jadi diberi tanda satu bintang pada t(*), yang berarti sangat signifikan/nyata. Keputusan menolak H0 dengan tingkat keyakinan 95% berarti kita mentolerir kesalahan 5%.

Dengan menggunakan analisis varian, kita buat tabel anavar sebagai berikut.

Tabel AnavarSumber variasiJumlah Kuadrat(SS)DerajatKebebasan(df)Rata-rataKuadrat(MSS)

Regresi (dari X2) = ESSi2 = = 0,93968227110,939682271

Kesalahan Pengganggu = RSS0,10031772530,0334392417

TSSyi2 = 1,04

Dengan anggapan bahwa kesalahan penggangu mengikuti distribusi normal dan hipotesis nol, bahwa B12 = 0, maka variabel F sebagai berikut. F = = 28,10118362Mengikuti distribusi F dengan derajat kebebasan 1 dan 3. Kemudian dari tabel F, untuk = 0,05; F0,05(1)(3)= 10,1Oleh karena F > F0,05(1)(3), maka H0 ditolak. Artinya, X2 mempunyai pengaruh yang signifikan/nyata terhadap Y. Baik uji t maupun F sama-sama menghasilkan suatu penolakan H0 di tolak. Artinya, X2 mempunyai pengaruh yang signifikan. Dari regresi Y terhadap X2, kita peroleh persamaan regresi sebagai berikut. i = b1.2 + b12X2i = 59,60298 + 0,000000216888876526323X2 , (6.15)Se = 0,182863999 Standar error : (0,0000000409142858261848) R2 = 0,903541Nilai t observasi : (5,301054929)Setelah kita membuat persamaan regresi (6.15), misalkan kita memutuskan X3 (variabel waktu) dalam model regresi dan memperoleh regresi linear berganda seperti (6.14), kemudian timbul pertanyaan yang memerlukan jawaban sebagai berikut. (1) Setelah mengikuti X2 sudah berada dalam model dan ternyata pengaruhnya terhadap Y signifikan/nyata, berapakah kontribusi incremental atau marginal dari X3?(2) Apakah kontribusi marginal tersebut signifikan /nyata secara statistik (statistically significant)?(3) Kriteria apa yang harus dipergunakan untuk memutuskan bahwa suatu variabel baru harus masuk model ? Pertanyaan-pertanyaan tersebut akan dapat dijawab dengan menggunakan teknik analisis varian. Untuk menjelaskan bagaimana teknik analisis varian dapat dipergunakan untuk membantu memutuskan apakah suatu variabel baru perlu dimasukkan dalam model atau tidak, perhatikan tabel anavar berikut ini.

Tabel AnavarUntuk mementukan masuknya variabel dalam model regresiSumber VariasiSSDfMSS

ESS (dari X2 saja)

1Q1/1

ESS (tambahan dari X3)

1Q2/1

ESS (dari X2 dan X3)

2Q3/2

RSS

N 3Q4/(n 3)

Contoh soal 6.8Dengan menggunakan contoh soal 6.5 dan regresi Y terhadap X2 dari subbab 6.5,coba hitung kontribusi marginal dari X3 terhadap ESS setelah diketahui kontribusi X2 terhadap ESS.PemecahanKita buat tabel anavar dengan data dari contoh soal 6.5 dan regresi Y terhadap X dari subbab 6.5 sebagai berikut.Tabel Anavar(Analisis Margial / Incremental)Sumber VariasiSSDfMSS

ESS (dari 2 saja)ESS(tambahan dari X3)ESS(dari X2 dan X3)RSSQ1= 0,939682270705209Q2= 0,0847124865216911Q3 = 1,0243947572269Q4= 0,015605242773111220,9396822707052090,08471248652169110,512197378613450,00780262138655

TSSQ5 = 1,04

ESS (1) = =((19.975.905.493.125,50)= 0,939682270705209ESS (2)Q2 = Q3 Q1= (1,0243947572269) (0,939682270705209)= 0,0847124865216911ESS (3)Q3 = b12.3 + b13.2= (-0,000000016543) (4.332.551,70) + (0,3425213) (3,20)=-0,0716734027731 + 1,09606816= 1,0243947572269RSS (4)Q4 = Q5 Q3= 1,04 (1,0243947572269)= 0,0156052427731TSS (5)Q5 = = 1,04

Untuk mengetahui kontribusi Incremental X3 setelah memasukkan variabel X2 dalam model regresi,kita harus menghitung :F = F = F = F = 10,856926451374Sekarang, dengan asumsi kenormalan tentang kesalahan pengganggu dan hipotesis nol bahwa B13,2 = 0, dapat ditunjukkan bahwa F dari (6.16) mengikuti distribusi F dengan derajat kebebasan 1 dan 2. Dari tabel F,Untuk Untuk Oleh karena F lebih kecil dari ,maka H0:B13,2 = 0 diterima, ini berarti bahwa X3 memang tidak mempengaruhi Y.Prosedur analisis varian yang baru saja dijelaskan sangat berguna untuk dasar pembuatan keputusan apakah suatu variabel harus dimasukkan dalam model regresi atau tidak. Dalam praktek,sering kali suatu variabel dipertahankan dalam model walaupun kehadirannya dalam model tidak mengurangi nilai RSS atau meningkatakan nilai ESS secaran signifikan didalam uji F.Sering kali seorang peniliti dihadapkan pada tugas untuk memilih model regresi dari berbagai model regresi yang mencankup variabel tidak bebas Y yang sama, tetapi dengan variabel bebas yang berlainan biasanya seorang peneliti akan memilih suatu model regresi dengan nilai (R2 yang disesuaikan) sebesar mungkin. Makin besar makin baik suatu model regresi untuk memperkirakan/meramalkan nilai variabel tidak bebas. Oleh karena itu, apabila pemasukan suatu variabel bebas meningkat nilai variabel tersebut harus dipertahankan dalam model,walaupun tidak mengurangi nilai RSS secara signifikan menurut statistik.Pertanyaan yang kemudian timbul adalah: Kapan nilainya akan meningkat / bertambah? Dapat ditunjukkan bahwa nilai akan meningkat kalau nilai t dari koefisien dari variabel yang baru dimasukkan bernilai lebih besar dari satu ( > 1) dalam nilai mutlak,dimana nilai t dihitung berdasarkan hipotesis bahwa nilai parameter (koefisien regresi sebenarnya) nol. Jadi, dengan hipotesis ini kita lihat bahwa nilai t dari koefisien regresi variabel waktu (X3), sebesar (3,294904756), lebih besar dari 1. Jadi pemasukan variabel waktu (X3) akan menambah atau meningkatkan R2. Dalam contoh ini, kebetulan X3 juga pengaruhnya terhadap Y signifikan/nyata secara statistik.

DAFTAR PUSTAKAJ. Supranto. 2005. Ekonometri. Jakarta : Ghalia Indonesia