Bahan_Kuliah_12.pdf

download Bahan_Kuliah_12.pdf

of 15

Transcript of Bahan_Kuliah_12.pdf

  • 7/25/2019 Bahan_Kuliah_12.pdf

    1/15

    1

    LECTURE NOTES #12

    ENDOGENITAS

    I. Pendahuluan

    Salah satu asumsi yang perlu dipertahankan agar kita dapat memperolehestimator tidak bias dari suatu persamaan regresi dengan OLS adalah tidakadanya korelasi antara variabel bebas dengan residual, atau Cov(x,u)=0.Namun demikian dalam praktek empiris asumsi ini sangat mungkin tidakterpenuhi.

    Terdapat dua penyebab utama mengapa pelanggaran asumsi ini terjadi,yakni1. Omitted Variable, yang terjadi jika kita tidak memasukkan suatu

    variabel kedalam model (dan seharusnya ia ada). Akibatnya ketika y danx bervariasi maka u juga bervariasi pada arah yang dapat diduga.

    2. Simultaneity, yang terjadi akibat adanya variabel penjelas yangseharusnya bersama dengan variabel tergantung nilainya ditentukanmelalui suatu system. Hal ini terjadi ketika regresor dan salahsatu/beberapa regresan dipengaruhi oleh satu/lebih variabel yang tidakada pada model regresi (diluar model).

    Kedua pelanggaran asumsi ini masuk dalam masalah yang disebutendogenitas.

    Akibat adanya endogenitas adalah estimator yang diperoleh menjadi biasdan tidak konsisten (bahkan dengan meningkatkan jumlah sample).Permasalahan ini perlu diatasi dengan teknik khusus diantaranyaInstrumental Variabel (IV), Two Stage Least Squares (2SLS) dan Indirect

    Least Squares (ILS).

    II. Implikasi EndogenitasUntuk menunjukkan bias yang timbul akibat mengestimasi model denganmasalah endogenitas dapat ditunjukkan dengan model permintaan-penawaran sederhana suatu komoditas sbb:

    Persamaan 1 adalah fungsi supply dan persamaan 2 adalah fungsi demand.Kedua persamaan ini disebut dengan behavioural equation karenamenunjukkan perilaku suatu agen ekonomi. Persamaan 1 dan 2 adalahsuatu contoh klasik dari simultanitas.

    Kita dapat menyelesaikan system persamaan diatas dalam 2 variabelendogen (yakni qt dan pt) sebagai fungsi dari parameter, variabel eksogendan error term sbb:

    1 1

    1 2 1 2

    ; 0

    ; 0, 0

    t t t

    t t t t

    q p

    q p y v

    = + >

    = + + < >

    1)

    2)

  • 7/25/2019 Bahan_Kuliah_12.pdf

    2/15

    2

    Jika kita mengestimasi persamaan 1 dengan OLS tanpa memperhatikankenyataan bahwa nilainya ditentukan didalam suatu system (persamaan 3dan 4), maka kita akan memperoleh hasil yang bias. Hal ini dapat dilihatdari estimator 1sbb

    Komponen dengan error term disebelah kanan persamaan 5 tidak akanbernilai nol bahkan secara asimtotik. Hal ini disebabkan karena E(ptt)0.Dari persamaan 3 diketahui bahwa pt adalah fungsi dari t sehinggacovariansnya tidak akan sama dengan nol.

    III.

    Masalah Identifikasi (Order Condition)Jika masalah simultanitas/endogenitas terjadi maka diperlukan suatuteknik yang memungkinkan estimasi parameter persamaan 1 dan 2 secaratidak bias. Sebelum pembahasan kepada teknik yang relevan perlu terlebihdahulu ditentukan apakah parameter dimaksud memang dapat diestimasi.Tidak semua masalah simultanitas dapat diselesaikan. Salah satunecessaryconditionadalah terdapatnya kondisi teridentifikasi (identified).

    Dalam bahasa sederhananya kondisi identified diperoleh jika kita memilikicukup banyak informasi/data yang memungkinkan estimasi suatuparameter model. Ketersediaan informasi ini dapat berwujud sebagai

    kecukupan jumlah variabel eksogen dan terdapatnya instrumen variabel.

    Sebagai gambaran permasalahan indetifikasi, kita dapatmengilustrasikannya pada model permintaan-penawaran yang telahdiuraikan sebelumnya. Dalam praktek empiris data yang dimilikisebenarnya adalah data posisi ekuilibrium, dimana demand bertemudengan supply. Dengan demikian tanpa adanya informasi tambahan baik

    211 1

    1 1 1 1

    1 11 221 2

    1 1 1 1

    t tt t t t

    t tt t t t

    v ep y y u

    v eq y y u

    = + = +

    = + = +

    3)

    4)

    2

    1 1

    1 2 2 2 2

    1 2

    ( )

    t t t t t t t t

    t t t t

    t t

    t

    p q p p p p

    p p p p

    p

    p

    += = = +

    = +

    5)

  • 7/25/2019 Bahan_Kuliah_12.pdf

    3/15

    3

    dari sisi demand maupun supply maka tidak mungkin bagi kita untukmemulihkan fungsi demand dan supply dari data ekuilibrium dimaksud.

    Grafik 1.Identifikasi fungsi demand

    Jika kita memiliki suatu variabel eksogen pada fungsi supply misalnyatingkat upah, maka dengan menggunakan nilai berbagai tingkat upah (yanglain konstan, ceteris paribus) kita dapat mendeteksi fungsi demand. Padagrafik 1 dapat dilihat peningkatan upah akan menggeser kurva supply keatassehingga kita dapat memperoleh kurva demand.

    Dalam kondisi ini fungsi demand dapat dikatakan teridentifikasi. Padamodel permintaan dan penawaran yang ada, fungsi supply dapat dikatakanterindetifikasi karena kita memiliki shifting variabel pada fungsi demandyakni y (penghasilan) namun demikian fungsi demand adalah tidak

    teridentifikasi (under identified) karena kita tidak memiliki variabelpenggeser pada fungsi supply. Dengan demikian kita dapat mengestimasiparameter pada fungsi supply (1) tetapi tidak parameter fungsi demand.

    Dalam kasus dua persamaan simultan, permasalahan identifikasi sepertidiatas dapat diatasi dengan memasukkan paling tidak satu shifting variable(disebut juga variabel eksogen) kedalam masing-masing fungsi permintaandan penawaran. Shifting variabel ini tidak boleh sama, karena kita kembalitidak dapat mengidentifikasi masing-masing kurva. Seandainya kitamemasukkan variabel suku bunga kedalam fungsi demand dan juga supply,maka dengan mengubah suku bunga tidak hanya kurva demand yang

    bergerak tetapi juga supply sehingga proses identifikasi menjadi gagal.Syarat ini disebut dengan order condition.

    Hal ini dapat digeneralisir untuk suatu system persamaan yang lebihkompleks (terdiri dari 3 atau lebih variabel endogen). Syarat pertama yangdiperlukan tentunya system ini memenuhi kaidah matematis penyelesaiansystem persamaan linear (lihat Chiang & Wright, 2005). Orde conditionselanjutnya dapat ditentukan dengan melihat apakah satu persamaan

  • 7/25/2019 Bahan_Kuliah_12.pdf

    4/15

    4

    memiliki jumlah variabel eksogen yang dikeluarkan (excluded) yang samadengan atau lebih besar dari pada variabel endogen yang ada disisi sebelahkanan.

    Sebagai contoh misalnya kita akan mengestimasi parameter suatu model IS-

    LM, sbb

    Sistem ini dapat disederhanakan menjadi

    Ini adalah suatu system dengan 3 variabel endogen (Y,r dan e) serta 5variabel eksogen(M, c0,G,rf,dan ). Persamaan 1 adalah teridentifikasi

    karena jumlah variabel eksogen yang dikeluarkan yakni dan rf adalahsama dengan jumlah variabel endogen disebelah kanan (yakni r dan e).Persamaan 2 adalah teridentifikasi karena jumlah variabel eksogen yangdikeluarkan (5 buah) lebih besar dari variabel endogen sisi sebelah kanan (2buah). Demikian juga persamaan 3, ia adalah identified. Jika ordercondition terpenuhi dalam kondisi strict (lebih besar) maka persamaandisebut dengan overidentified.

    IV. Teknik EstimasiPermasalahan endogenitas tidak selalu diturunkan dari teori ekonomiseperti yang telah diuraikan diatas. Omitted variable juga menyebabkan

    permasalahan endogenitas. Disini perubahan variabel y tidak hanyadisebabkan oleh variabel bebas x, namun dengan berubahnya y, x jugamungkin berubah. Terkait dengan omitted variabel, hal ini terjadi karenaadanya korelasi antara variabel x dan error term (u). Jika permasalahanendogenitas disebabkan hal semacam ini maka metoda InstrumentalVariabel (IV) akan dapat digunakan.

    0 1

    1 2

    ( ) ( ) ( )

    ( )f

    Y C Y I r G NX e

    C c c Y

    I r

    NX e

    M m Y m r

    r r e e

    = + + +

    = +

    =

    =

    = +

    = +

    5)

    0 1

    1 2

    ( )f

    Y c c Y r G e

    M m Y m r

    r r e e

    = + + + +

    = +

    = +

    6)

    e

    7)

    8)

    e

  • 7/25/2019 Bahan_Kuliah_12.pdf

    5/15

    5

    IV.a. Instrumental Variable (IV)Misalnya kita akan mengestimasi hubungan antara upah yang diperoleh(log(wage)) dengan pendidikan (duc) dan variabel kapasitas kerja (abil),sbb:

    Selanjut asumsikan kita tidak dapat memperoleh proxy yang baik untukabil, sehingga diputuskan untuk menggabungkannya dengan error term.,atau

    Jika educ dan abil tidak berhubungan maka estimator OLS yang diperolehadalah tidak bias. Sebaliknya jika kedua variabel ini berhubungan, makamemasukkan secara eksplisit variabel abil akan menyebabkan estimatoryang diperoleh bersifat bias.

    Kita dapat tetap menggunakan persamaan 10 dengan menggunakan suatuinstrumental variabel terhadap educ. Suatu instrumental variabel adalahsuatu variabel lain, sebut saja sebagai z, dimana ia memenuhi asumsi1. z adalah tidak berkorelasi terhadap u

    2. z adalah berkorelasi dengan x (dalam contoh ini berarti educ).

    Perhatikan bahwa IV bukan proxy variabel terhadap abil. Sebaliknya iajustru tidak boleh berkorelasi dengan abil, karena abil sekarang telahdigabungkan dengan error term (u). Dengan demikian proxy yang baikuntuk abil justru bukan kandidat IV yang baik. Beberapa kandidat IV yangdapat dipertimbangkan pada contoh ini misalnya pendidikan ayah/ibu,lokasi rumah dari tempat pendidikan, kuartal kelahiran, dsb. Dapat dilihatbahwa variabel-variabel tersebut memiliki korelasi dengan educ tetapitidak/kurang berkorelasi dengan u. Wooldrige (2005) menyarankan agardalam pemilihan IV agar dilakukan berdasarkan auxiliary regression antara

    variabel bebas (educ) dengan kandidat IV. IV terpilih dilakukanberdasarkan tingkat signifikansi dan model fit tertinggi.

    Jika kita menggunakan IV sebagai penggati regressor semula maka perludiperhatikan adanya perubahan dalam perhitungan statistik inferensi.Dengan asumsi 11, 12 dan homokedastisitas maka varians dari1adalah

    0 1 2log( )wage educ abil e = + + + 9)

    0 1log( )wage educ u = + + 10)

    ( , ) 0Cov z u = 11)

    ( , ) 0Cov z x 12)

  • 7/25/2019 Bahan_Kuliah_12.pdf

    6/15

    6

    dimana sebagai penduga tak bias dari 2

    , kita dapat menggunakan residualkuadrat model semula, atau

    Sedangkan penduga bagi x2adalah varians dari data x dan 2x,zdiperolehdari koefisien determinasi regresi x terhadap z.

    Perhatikan bahwa kita tidak dapat menggunakan statistik R2 padaperhitungan IV. Hal ini disebabkan ketika x dan u berkorelasi maka, variansdari tidak dapat didekomposisi menjadi varians x dan varians residual,sehingga statistik R2tidak memiliki arti sesuai yang dikehendaki.

    Penggunaan teknik IV dalam kerangka multiple regression memiliki namadan teknik khusus yang disebut dengan Two Stage Least Squares (2SLS).Kita akan membahasnya pada bagian tersendiri.

    Contoh 1Kita menggunakan data dari Mroz.raw. Disini kita mencoba mengestimasi

    hubungan antara tingkat upah (log(wage)) terhadap pendidikan. Terdapatbanyak sekali variabel yang berpengaruh terhadap tingkat upah sehinggamodel yang hanya memasukkan variabel pendidikan sebagai penjelas sangatmungkin sekali mengalami omitted variabel (dan berarti endogenitas).

    Untuk mengatasi hal ini kita akan menggunakan variabel pendidikan ayahsebagai IV bagi educ. Untuk pembanding pertama kita akan melakukanregresi tanpa IV (hanya OLS), dengan hasil sbb

    Dependent Variable: LOG(WAGE)

    Method: Least Squares

    Date: 06/29/08 Time: 20:26Sample: 1 753 IF WAGENA

    Included observations: 428

    Variable Coefficient Std. Error t-Statistic Prob.

    C -0.185197 0.185226 -0.999843 0.3180

    EDUC 0.108649 0.014400 7.545125 0.0000

    2

    1 2 2

    ,

    var( )x x z

    n

    =

    2 2

    1

    0 1

    1 ;

    2

    ; 1,...,

    n

    i

    i

    i i i

    un

    u y x i n

    =

    =

    = =

    13)

    14)

  • 7/25/2019 Bahan_Kuliah_12.pdf

    7/15

    7

    R-squared 0.117883 Mean dependent var 1.190173

    Adjusted R-squared 0.115812 S.D. dependent var 0.723198

    S.E. of regression 0.680032 Akaike info criterion 2.071309

    Sum squared resid 197.0010 Schwarz criterion 2.090276

    Log likelihood -441.2600 F-statistic 56.92891

    Durbin-Watson stat 1.984707 Prob(F-statistic) 0.000000

    Tabel 1.Print Output Hasil Regresi Contoh 1 Metoda OLSDapat dilihat pada tabel 1, return terhadap pendidikan adalah hampirsebesar 11% (1 tahun peningkatan pendidikan akan meningkatkan upahsebesar 11%). Teknik IV pada Eviews dapat diterapkan dengan mengklikwindow estimate, pilih metoda TSLS (Two Stage Least Squares) danmasukkan fatheduc sebagai instrument. Hasil yang diperoleh adalah

    Dependent Variable: LOG(WAGE)

    Method: Two-Stage Least SquaresDate: 06/29/08 Time: 20:31

    Sample: 1 753 IF WAGENA

    Included observations: 428

    Instrument list: FATHEDUC

    Variable Coefficient Std. Error t-Statistic Prob.

    C 0.441103 0.446102 0.988795 0.3233

    EDUC 0.059173 0.035142 1.683850 0.0929

    R-squared 0.093438 Mean dependent var 1.190173

    Adjusted R-squared 0.091310 S.D. dependent var 0.723198

    S.E. of regression 0.689390 Sum squared resid 202.4601

    Durbin-Watson stat 1.968194 Second-stage SSR 221.9799

    Tabel 2.Print Output Hasil Regresi Contoh 1 Metoda IV

    Dapat dilihat disini return terhadap pendidikan turun menjadi 6%.Mengingat model OLS sangat mungkin mengalami masalah omittedvariabelmaka nilai yang diperoleh melalui IV dapat dikatakan lebih valid.

    IV.b. Two Stage Least Squares (2SLS)Kita dapat menggeneralisir kesimpulan diatas untuk kasus regresi bergandak variabel dimana paling tidak terdapat satu variabel penjelas adalahbersifat endogen (berkorelasi dengan error term). Hal yang dilakukanadalah menambah variabel eksogen baru diluar yang sudah ada untukmenjadi IV bagi variabel endogen.

    Sebagai ilustrasi perhatikan model regresi berikut:

  • 7/25/2019 Bahan_Kuliah_12.pdf

    8/15

    8

    Disini kita menotasikan y sebagai variabel endogen dan z sebagai variabel

    eksogen. Kita mengasumsikan bahwa y2 adalah berkorelasi dengan ui,sehingga ia adalah endogen. Estimasi persamaan 15 dengan menggunakanOLS akan menghasilkan hasil yang bias dan tidak konsisten untuk itu kitamenggunakan IV.

    Selanjutnya misalkan kita dapat memperoleh variabel eksogen baru zkyangberkorelasi terhadap y2tetapi tidak dengan u. Dengan demikian kita dapatmenyusun suatu reduced form, sbb

    Persamaan 16 disebut dengan reduced form, karena ia menunjukkanvariabel endogen sebagai fungsi dari seluruh variabel eksogen. Agar zkvalidsebagai IV bagi y2 maka koefisien k harus signifikan pada test dua arah.Catatan: kita tidak terlalu memperhatikan tingkat signifikansi dari koefisienlainnya (jj=1,,k-1). Asumsi lainnya yang perlu diperhatikan adalah bahwatidak terdapar kolinearitas sempurna dari variabel z.

    Perhatikan bahwa dalam persamaan 16 kita telah memiliki suatu IV sebagaibentuk multiple instruments (setiap variabel eksogen adalah IV bagi dirinyasendiri). Dalam bentuk seperti ini maka IV bagi y2 disebut dengan estimatorTwo Stage Least Squares(2SLS).

    Sesuai namanya estimasi dengan teknik ini dilakukan dalam dua tahap.Pertama, kita meregresikan variabel endogen terhadap seluruh variabeleksogen yang telah ada dan minimal satu variabel eksogen lain. Kedua kitameregresikan model awal (persamaan 15) dengan fitted value y2 (daripersamaan 16) sebagai IV. Dengan cara ini maka estimator yang diperolehadalah tidak bias dan konsisten. Catatan: dalam praktek kita tidakmelakukan tahap-tahap ini secara manual, prosedur rutin biasanya telahtersedia pada software statistik (termasuk) Eviews. Pelaksanaan secaramanual akan menghasilkan estimator yang salah.

    Prosedur 2SLS juga digunakan untuk mengestimasi parameter pada suatusystem persamaan simultan. Dengan syarat suatu persamaan adalahteridentifikasi, maka prosedur 2SLS dilaksanakan dengan (1) estimasireduced form setiap variabel endogen dengan seluruh variabel eksogen yangada pada system dan (2) gunakan fitted value pada langkah pertama sebagaiIV variabel endogen terkait.

    1 0 1 2 2 1 1 1... k k iy y z z u = + + + + + 15)

    2 0 1 1 2 2 2... k ky z z z v = + + + + + 16)

  • 7/25/2019 Bahan_Kuliah_12.pdf

    9/15

    9

    Contoh 2.Romer (1993) menyusun suatu model inflasi yang menunjukkan bahwasemakin terbuka suatu negara maka inflasinya akan semakin rendah.Namun demikian keputusan untuk membuka diri terhadap duniainternasional juga tergantung seberapa baik kinerja kebijakan khususnya

    inflasi. Dengan demikian kita memiliki suatu system persamaan simultansbb:

    Perhatikan bahwa hanya persamaan 17 yang teridentifikasi, sedangkanpersamaan 18 adalah unidentified. Terdapat 2 variabel eksogen dan salahsatunya (yakni log(land)) dapat digunakan sebagai IV bagi 1.

    Sesuai dengan prosedur 2SLS, maka pertama kita melakukan auxiliaryregression terhadap IV. Dengan menggunakan data yang disediakan padafile openness.raw maka diperoleh hasil sbb:

    Dependent Variable: OPEN

    Method: Least Squares

    Date: 06/30/08 Time: 08:51

    Sample: 1 114

    Included observations: 114

    Variable Coefficient Std. Error t-Statistic Prob.

    C 117.0845 15.84830 7.387829 0.0000

    LOG(PCINC) 0.546481 1.493240 0.365970 0.7151

    LOG(LAND) -7.567103 0.814216 -9.293727 0.0000

    R-squared 0.448668 Mean dependent var 37.07895

    Adjusted R-squared 0.438734 S.D. dependent var 23.75353

    S.E. of regression 17.79559 Akaike info criterion 8.621741

    Sum squared resid 35151.80 Schwarz criterion 8.693746Log likelihood -488.4392 F-statistic 45.16536

    Durbin-Watson stat 2.147425 Prob(F-statistic) 0.000000

    Tabel 3.Prosedur 2SLS Contoh 2 tahap 1.

    Disini kita memperoleh t statistik adalah sangat signifikan (=-9.29). Dengandemikian log(land) adalah valid sebagai IV bagi open. Dengan

    10 1 11 1

    20 2 21

    21 2

    inf log( )

    inf log( )

    log( )

    open pcinc u

    open pcinc

    land u

    = + + +

    = + +

    + +

    17)

    18)

  • 7/25/2019 Bahan_Kuliah_12.pdf

    10/15

    10

    menggunakan rutin 2SLS yang ada pada Eviews maka hasil estimasi yangdiperoleh adalah

    Dependent Variable: INF

    Method: Two-Stage Least Squares

    Date: 06/30/08 Time: 08:55

    Sample: 1 114

    Included observations: 114

    Instrument list: LOG(PCINC) LOG(LAND)

    Variable Coefficient Std. Error t-Statistic Prob.

    C 26.89934 15.40120 1.746575 0.0835

    OPEN -0.337487 0.144121 -2.341690 0.0210

    LOG(PCINC) 0.375825 2.015081 0.186506 0.8524

    R-squared 0.030876 Mean dependent var 17.26404Adjusted R-squared 0.013415 S.D. dependent var 23.99731

    S.E. of regression 23.83581 Sum squared resid 63064.20

    Durbin-Watson stat 2.092030 Second-stage SSR 61903.21

    Tabel 4.Prosedur 2SLS Contoh 2 tahap 2.

    Dapat dilihat pada tabel 4, koefisien openness menunjukkan tanda yangsesuai dengan hipotesis model dan ia juga signifikan pada=5%.

    V.

    Pengujian Endogenitas dan Overidentifying RestrictionSeluruh uraian diatas menunjukkan bahwa kita telah mengasumsikan ataumengetahui struktur endogenitas yang ada pada data. Dalam praktek seringkali hal ini tidak dimungkinkan. Kita memiliki serangkaian variabel (dandata sampelnya) namun tidak mengetahui struktur endogenitas yang ada.Kita mengetahui bahwa variabel x1 mempengaruhi x2 tetapi tidak tahuapakah x2juga mempengaruhi x1(yang berarti ada endogenitas).

    Kita perlu menguji endogenitas karena penggunaan IV (dan 2SLS) yangtidak tepat akan menghasilkan estimator yang tidak efisien (memilikivarians yang besar). Dengan kata lain jika kita memiliki model sepertipersamaan 15 yang sebenarnya y2 adalah murni eksogen dan kitamengestimasinya dengan menggunakan IV atau 2 SLS maka statisticalpowerdari model akan rendah.

    Salah satu teknik pengujian yang umum digunakan adalah yang diusulkanoleh Hausman (1978). Pengujian ini dilakukan dengan langkah-langkahsbb:

  • 7/25/2019 Bahan_Kuliah_12.pdf

    11/15

    11

    1. Misalnya kita memiliki model sbb:

    Dimana y2diduga endogen. Kita memiliki informasi variabel eksogen zj,

    j=1,,k-1 sehingga yang perlu dilakukan adalah mencari minimal satuvariabel eksogen lain untuk menjadi IV bagi y2.

    2. Asumsikan kita telah memperoleh variabel dimaksud, maka kemudianlakukan regresi reduced form

    3. Gunakan residual yang diperoleh dari estimasi persamaan 20 ( )sebagai variabel baru pada persamaan 19 dan estimasi dengan OLS.

    4. Gunakan test 2 arah untuk menguji apakah 1 adalah signifikan. Jikasignifikan maka dapat disimpulkan bahwa y2 adalah endogen.

    5. Kita juga dapat menggunakan kerangka pengujian berganda (F test)untuk melihat apakah dua atau lebih regresor adalah bersifat endogen.Hal ini adalah generalisasi langsung dari prosedur diatas dimana untuksetiap regresor yang diduga endogen bentuk reduced form. Residual darireduced form yang relevan kemudian dimasukkan dalam persamaanstructural (persamaan 19) dan lakukan pengujian bahwa 1== h=0

    dimana h adalah indeks variabel yang diduga endogen.

    Kondisi lain yang sering ditemui dalam penelitian empiris dengan kondisiendogenitas adalah overidentification . Overidentification terjadi ketikasuatu persamaan memiliki variabel eksogen (yang tidak ada padapersamaan atau IV) lebih banyak dari variabel endogen disisi sebelahkanan. Bound, Jaeger dan Baker 9995) menunjukkan penggunaan 2SLSdalam kondisi seperti ini memungkinkan terjadinya bias. Secara intuitifpenggunaan banyak IV untuk suatu variabel endogen akan meningkatkanprobabilitas variabel endogen tersebut untuk berkorelasi dengan error padapersamaan strukturalnya.

    Dengan demikian dapat dikatakan bahwa kita memerlukan jumlahinstrumen yang tepat untuk membentuk suatu IV bagi variabel endogentertentu. Cara ini bersifat trial and error namun demikian terdapat suatupengujian untuk menduga apakah IV yang digunakan telah memadai.Pengujian ini disebut dengan overidentifying restriction test.

    1 0 1 2 2 1 1 1... k k iy y z z u = + + + + +

    2 0 1 1 2 2 2... k ky z z z v = + + + + +

    19)

    20)

    1 0 1 2 2 1 1 1 1 2... k ky y z z v error = + + + + + +

    2v

    21)

  • 7/25/2019 Bahan_Kuliah_12.pdf

    12/15

    12

    Wooldrige (2005) megusulkan suatu kerangka kerja yang sederhana untukmenguji hal ini, yakni

    1. Estimasi persamaan structural dengan 2SLS dan peroleh residualnya(sebut saja ).

    2. Regresikan terhadap seluruh variabel eksogen, dan peroleh nilai R2(sebut saja R12).

    3. Dengan hipotesis null bahwa seluruh IV adalah tidak berkorelasi denganu1, maka

    dimana q adalah jumlah variabel eksogen dari luar model (IV) dikurangijumlah variabel endogen.

    4. Jika nilai statistik uji melebihi nilai kritis pada =5%, maka kita akanmenolak H0dan mengatakan bahwa paling tidak ada satu IV yang tidakeksogen.

    Contoh 3.Dengan menggunakan data Mroz.raw kita akan menguji apakah variabeleduc adalah bersifat endogen. Disini kita akan menggunakan variabel exper,exper2, motheduc dan fatheduc sebagai IV. Regresi IV akan memberikanhasil sbb

    Dependent Variable: EDUC

    Method: Least Squares

    Date: 06/30/08 Time: 09:38

    Sample: 1 753 IF WAGENA

    Included observations: 428

    Variable Coefficient Std. Error t-Statistic Prob.

    C 9.102640 0.426561 21.33958 0.0000

    EXPER 0.045225 0.040251 1.123593 0.2618

    EXPER^2 -0.001009 0.001203 -0.838572 0.4022MOTHEDUC 0.157597 0.035894 4.390609 0.0000

    FATHEDUC 0.189548 0.033756 5.615173 0.0000

    R-squared 0.211471 Mean dependent var 12.65888

    Adjusted R-squared 0.204014 S.D. dependent var 2.285376

    S.E. of regression 2.038967 Akaike info criterion 4.274378

    Sum squared resid 1758.575 Schwarz criterion 4.321797

    1u

    1u

    2 2

    1 qnR 22)

  • 7/25/2019 Bahan_Kuliah_12.pdf

    13/15

    13

    Log likelihood -909.7168 F-statistic 28.36041

    Durbin-Watson stat 1.939888 Prob(F-statistic) 0.000000

    Tabel 5.Pengujian Endogenitas (Regresi Reduced Form)

    Kita simpan residual dari regresi ini sebagai variabel v2, denganmengetikkan series v2=resid pada command window. Persamaan strukturalyang ingin diestimasi adalah regresi atas log(wage) terhadap educ, experdan exper2. Hasil yang diperoleh dengan memasukkan variabel v2 padapersamaan struktural adalah

    Dependent Variable: LOG(WAGE)

    Method: Least Squares

    Date: 06/30/08 Time: 09:40

    Sample: 1 753 IF WAGENA

    Included observations: 428

    Variable Coefficient Std. Error t-Statistic Prob.

    C 0.048100 0.394575 0.121904 0.9030

    EDUC 0.061397 0.030985 1.981499 0.0482

    EXPER 0.044170 0.013239 3.336272 0.0009

    EXPER^2 -0.000899 0.000396 -2.270623 0.0237

    V2 0.058167 0.034807 1.671105 0.0954

    R-squared 0.162350 Mean dependent var 1.190173

    Adjusted R-squared 0.154429 S.D. dependent var 0.723198

    S.E. of regression 0.665016 Akaike info criterion 2.033602Sum squared resid 187.0701 Schwarz criterion 2.081022

    Log likelihood -430.1908 F-statistic 20.49611

    Durbin-Watson stat 1.931343 Prob(F-statistic) 0.000000

    Tabel 6.Pengujian Endogenitas (Persamaan Struktural)

    Dapat dilihat dari tabel 6 bahwa t statistik adalah sebesar 1.67 dengan pvalue 9,5%. Dengan menggunakan =10%, kita dapat mengatakan bahwaeduc adalah bersifat endogen.

    Selanjutnya kita juga dapat menguji apakah penggunaan motheduc danfatheduc sebagai IV adalah tidak bias (tidak mengalami masalahoveridentfying restriction). Ingat bahwa kita memiliki satu variabelendogen namun 2 IV (motheduc dan fatheduc) yang berarti persamaanregresi yang dimiliki adalah overidentified.

  • 7/25/2019 Bahan_Kuliah_12.pdf

    14/15

    14

    Sesuai prosedur yang telah diuraikan diatas, maka hal pertama yangdilakukan adalah estimasi persamaan structural dengan seluruh IV. Hasilregresi diberikan sbb:

    Dependent Variable: LOG(WAGE)

    Method: Two-Stage Least Squares

    Date: 06/30/08 Time: 09:47

    Sample: 1 753 IF WAGENA

    Included observations: 428

    Instrument list: EXPER EXPER^2 MOTHEDUC FATHEDUC

    Variable Coefficient Std. Error t-Statistic Prob.

    C 0.048100 0.400328 0.120152 0.9044

    EDUC 0.061397 0.031437 1.953024 0.0515

    EXPER 0.044170 0.013432 3.288329 0.0011

    EXPER^2 -0.000899 0.000402 -2.237993 0.0257

    R-squared 0.135708 Mean dependent var 1.190173

    Adjusted R-squared 0.129593 S.D. dependent var 0.723198

    S.E. of regression 0.674712 Sum squared resid 193.0200

    Durbin-Watson stat 1.945659 Second-stage SSR 212.2096

    Tabel 7.Pengujian Overidentifying Restriction (Persamaan Struktural)

    Simpan residual dari persamaan ini sebagai series u. Kemudian lakukanregresi auxiliary u terhadap seluruh variabel eksogen sbb:

    Dependent Variable: U

    Method: Least Squares

    Date: 06/30/08 Time: 09:49

    Sample: 1 753 IF WAGENA

    Included observations: 428

    Variable Coefficient Std. Error t-Statistic Prob.

    C 0.010964 0.141257 0.077618 0.9382

    EXPER -1.83E-05 0.013329 -0.001376 0.9989

    EXPER^2 7.34E-07 0.000398 0.001842 0.9985MOTHEDUC -0.006607 0.011886 -0.555804 0.5786

    FATHEDUC 0.005782 0.011179 0.517263 0.6052

    R-squared 0.000883 Mean dependent var -1.05E-16

    Adjusted R-squared -0.008565 S.D. dependent var 0.672337

    S.E. of regression 0.675210 Akaike info criterion 2.064029

    Sum squared resid 192.8495 Schwarz criterion 2.111448

  • 7/25/2019 Bahan_Kuliah_12.pdf

    15/15

    15

    Log likelihood -436.7021 F-statistic 0.093496

    Durbin-Watson stat 1.946859 Prob(F-statistic) 0.984495

    Tabel 8.Pengujian Overidentifying Restriction (Auxiliary Regression)

    Dapat dilihat pada tabel 8, nilai R12 adalah sebesar 0.0009 sehingga nilaistatistik uji adalah nR12= 428(0.0009)=0.3852. Nilai2dengan df=1 (2 IV-1variabel endogen) adalah 3.84 dengan demikian hipotesis null seluruh IVadalah tidak berkorelasi dengan u1dapat diterima. Penggunaan motheducdan fatheduc adalah valid.