dasar statistik ekonometrika

download dasar statistik ekonometrika

of 25

Transcript of dasar statistik ekonometrika

1 EKONOMETRIKA 1.1 Definisi Ekonometrika : pengukuran ekonomi (harfiah) contoh suatu analisis mencoba mengukur pengaruh harga terhadap permintaan. Atau tekhnik analisis yg merupakan gabungan beberapa disiplin ilmu (teori ekonomi, statistik ekonomi, matematika ekonomi, statistikmatematis). Ekonometrika merupakan disiplin ilmu tersendiri, matematika ekonomi berhubungan dengan pembentukan model teori atau persamaan matematis tanpa melakukan verifikasi kebenaran suatu teori, statistika ekonomi berhubungan dengan pengumpulan pengolahan dan penyajian data apakah tabulasi, diagram dsb (widarjono : 4). 1.2 Metodologi ekonometrika Metodologi ekonometrika memiliki relavansi dengan pendekatan kuantitatif, karena metode ekonometrika mencoba melihat argumentasi teori yang dijabarkan oleh parameter variabel yang terukur. Sebuah teori di interprestasikan kedalam pemodelan matematis kemudian diestimasi untuk mendapatkan parameter sampel yang mendekati parameter pupulasinya. Kemudian dilakukan pengujian hipotesis terhadap hubungan variabel-variabel bentukan, selanjutnya hasil ini menjadi bahan analisis teori ekonomi yang dikaji untuk mengambil keputusan/kebijakan atau prediksi. Pernyataan teori/hipotesis

Spesifikasi model tidak Estimasi parameter dan uji hipotesis ya Kesimpulan/Prediksi

Sebagai contoh misalkan teori permintaan barang yang menyatakan bahwa harga berpengaruh negatif terhadap permintaan suatu kuantitas permintaan suatu komoditas. Langkah selanjutnya menuangkan teori ke dalam pemodelan matematis y=a+bx dimana b/ < o (hipotesis negatif). Y variabel terikat dan x variabel bebas. Model matemati diatas adalah model exact atau deterministik padahal model statistik atau ekonometrika mendasarai analisisnya pada pemodelan yang tidak pasti sehingga model matematis diatas dibentuk menjadi model yang sesuai dengan perilaku ekonomi Yi/t = a + bxi/t + ei/t atau yi/t = 0 + 1xi/t + ei/t tahap selanjutnya adalah pengumpulan data yang kemudian di olah dengan konsep statistik sesuai dengan metodologi analisa data yang dipilih. Tahapan ini berisi estimasi parameter 0 / 1 kemudian uji kelayakan model, uji hipotesis dan pengambilan keputusan.

2 DASAR-DASAR STATISTIKA DALAM EKONOMETRIKA Dalam metodologi ekonometrika ada dua analisa yang digunakan yakni analisa statistik dan analisa ekonomi. Analisa statistik terkait dengan verifikasi model estimasi parameter dan uji hipotesis (stastical inference) sedangkan analisis ekonomi melibatkan pemahaman teori ekonomi secara utuh yang dikaitkan dengan hasil anlisa statistik kemudian dituangkan sebagai dasar pengambilan kebijakan dan kesimpulan atas sebuah kajian ekonomi. Oleh sebab itu pemahaman ekonometrika tentu sangat tergantung dari pemahaman ilmu ekonomi, matematika dan statistika ekonomi. Berikut diuraikan secara ringkas konsep-konsep statistik yang mendasari pengembangan ekonometrika : 2.1 Exsperiment, sample space and event 2.1.1 Eksperimen Percobaan atau eksperimen sebagai langkah sebuah penelitian seringkali dipergunakan secara luas. Seperti halnya dalam pelemparan dadu atau koin, paling tidak ada dua hal atau sifat dasar dari setiap eksperimen : a. Possible outcomes, setiap percobaan memiliki kemungkinan hasil dari peristiw-peristiwa yang di harapkan. Misalkan pelemparan mata uang kemungkinan hasilnya bisa keluar gambar atau nominal koin. Ekspektasi mengenai relasi antar variabel bisa sesuai hipotesis atau sebaliknya. b. Pada tiap-tiap eksperimen akan sangat sulit menentukan kemungkinan hasil yang akan terjadi, hasil yang muncul merupakan estimasi dari perilaku yang dihipotesiskan dari setiap penarikan data. 2.1.2 Sample space (ruang sampel) Merupakan sebuah set yang berisi seluruh kemungkinan yang akan terjadi (total possible outcomes) dan setiap elemen dari ruang sampel disebut dengan sample point. Misalkan dari 3 orang anak dalam sebuah keluarga 2 diantaranya laki-laki (L), dari eksperimen ini terdapat 3 ruang sampel yaitu (LLP,LPL,PLL) dengan 2 sampel point yakni L & P. 2.1.3 Peristiwa (event/sample point) Bagian dari hasil eksperimen yang diinginkan atau merupakan sub set dari ruang sampel yang ada. Misalkan dari ruang sampel (LLP,LPL,PLL) diharapkan muncul kombinasi LLP maka LLP disebut sebagai event begitu juga LPL dan PLL yang merupakan sub set dari ruang sampel yang ada. Bukan tidak mungkin sebuah penelitian dihadapkan pada pemilihan suatu subset tertentu dari sekumpulan ruang sampel data yang ada. 2.2 Probabilitas dan variabel random 2.2.1 Probabilitas Setiap peluang munculnya sebuah peristiwa dari sekumpulan ruang sampel disebut probabilitas dari sample point tertentu dengan nilai maksimum sebesar kemunculan relatif

(frekuensi relatif) dari sebuah eksperimen. Probabilitas kejadian A dalam ruang sampel tertentu atau P(A) sama dengan berapa kali nilai A terjadi dari beberapa kali percobaan. Misal jika semua hasil yang mungkin adalah n dan semua kemungkinan hasil kejadian A adalah m maka probabilitas A P(A)=m/n. 2.2.2 Variabel random Sebuah percobaan yang mendasari hipotesisnya pada sekumpulan data (statisticalsample/infrence) adalah penarikan secara acak suatu peristiwa yang diharapkan dengan nilai bersifat diskrit/tertentu dan kontinu/interval. Contoh penjumlahan setiap sample point dari dua dadu yang dilempar adalah 2,4,6,8,10,12 merupakan nilai diskrit dari ruang sampel 1,2,3,4,5,6 pertama dan 1,2,3,4,5,6 kedua. Sedangkan variabel kontinu mengambil nilai di dalam satu interval tertentu, misal berat badan 60-70Kg. Statistik sampel merupakan distribusi probabilitas dari sekumpulan data yang digunakan sebagai sampel. Sifat-sifat penting dari distribusi probabilitas : a. Nilai harapan (expected value), nilai harapan dari sekumpulan probabilitas diskrit sample point yang ada.. yang didefinisikan sebagai : E(X) = x.f(x) dimana f(x) adalah pdf (probability density function) Contoh : dalam pelemparan sebuah dadu nilai harapan X yang muncul adalah EX=1(1/6)+2(1/6)+3(1/6)+4(1/6)+5(1/6)+6(1/6) b. Varian adalah distribusi dari nilai x disekitar rata-ratanya Var (X) = 2 = E(X-)2 c. Kovarian, apabila varian mengukur nilai dari sekumpulan distribusi rata-rata untuk satu variabel X. Maka kovarian mengukur nilai harapan dari sekumpulan distribusi rata-rata X atau Y. Cov(X,Y)=E[(X-x)(Y- y)] =E(XY)- x y d. koefisien korelasi Koefisien determinasi bernilai 0r1 jika r=0 maka tidak ada variasi variabel terikat (y) yang mampu dijelaskan oleh variasi variabel bebas (regresor) x. Sebaliknya bernilai 1 jika semua variasi y dijelaskan oleh x.

Sedangkan angka korelasi r merupakan akar dari r

2.3 Distribusi probabilitas dalam statistik ada beberapa distribusi probabilitas yang penting dan sering kali mendasar analisis ekonomi yakni distribusi normal, distribusi chi square, distribusi t. 2.3.1 Distribusi normal Suatu teori distribusi statistik yang terkenal adalah distribusi normal yang berbentuk lonceng (bell shaped). Distribusi normal diartikan senagai kondisi dimana data tersebar atau terkumpul pada daerah rata-rata dan hanya sedikit pada daerah outlier. Distribusi normal merupakan probabilitas normal yang kontinyu dan simetrik dari ukuran karakteristik data (parameter) rata-rata dan standar deviasi. Pengujian terhadap ditribusi normal dari sekumpulan data dilakukan terhadap presentase data observasi berada dalam plus-minus satu standar deviasi atau plus minus dua standar deviasi. Suatu distribusi dikatakan normal jika 65% data berada dalam satu standar deviasi, dan 95% data dalam dua standar deviasi. Persamaan matematis distribusi probabilitas normal : [ ]

Dengan : : rata-rata sampel : rata-rata populasi : simpangan baku (deviasi standar) populasi : 3,1416 e(exp) : 2,7183

Luas fungsi probabilitas sebelah kiri dan kanan 0,5 (simetrik), sedangkan luas total kurve normal adalah 1 , jika diambil secara random suatu sampel dengan nilai parameter diantara a dan b maka nilai x a dan b merupakan luas daerah pada absis (x) sebagaimana digambarkan dalam kurve berikut :

-3

-2

-

2

3

Gbr. Distribusi normal

Sumbu absis pada kurve normal merupakan nilai standar Z, nilai x dikonversikan ke dalam normal Z dengan formula : Nilai harapan dan varian : E(x) = dan Var (X) = 2 2.3.2 Distribusi chi-square (x2) Distribusi chi square digunakan untuk uji hipotesis yang berhubungan dengan varian atau variabel random. Apabila sebuah distribusi varian daria variabel yang bersifat random (rata-rata 0 dan varian 1) yakni Z1,Z2,Z3 . Zk dan masing-masing tidak saling tergantung (independent)maka jumlah kuadrat (square) dari distribusi normal (konversi Z) adalah : Akan memiliki distribusi chi-square (X2) dengan derajat kebebasan df=k, k adalah jumlah variabel bebas.P(X )2

K=2

K=5

K=10

X

2

Gambar. Distribusi chi-square 2.3.3 distribusi t Dalam praktik statistik varian dari sebuah variabel random sulit ditentukan namun secara teori varian ini menjadi asumsi dasar, dan diperhitungkan pada uji hipotesis. Oleh sebab itu telah dikembangkan distribusi t untuk menjawab kondisi tersebut. Sebuah variabel random dengan distribusi normal Z1 ~ N (=0 dan =1) dan Z2 mengikuti chi-square dengan df=k dan tidak tergantung (Z1 dan Z2 tidak tergantung/independent) maka varibel random tersebut memiliki distribusi t sebagai berikut :

K = 120 (normal) K = 20 K=5

Gambar. Distribusi t dengan berbagai df Perhatikan gambar, semakin besar sampel atau df(n-1) kurva semakin mendekati normal

3 REGRESI DAN KORELASI LINEAR SEDERHANA Apabila suatu model berusaha menggambarkan hubungan antar variabel dan selanjutnya sebagai alat prediksi atau dugaan terhadap nilai suatu variabel terikat oleh sekurang-kurangnya satu variabel prediktor, maka analisa yang bisa kita gunakan ialah analisa regresi dan korelasi. Analisa regresi dan korelasi digunakan untuk melihat hubungan (arah dan kekuatan) antar variabel. Regresi model digunakan untuk tujuan estimasi (prediksi) suatu variabel, sedangkan korelasi digunakan untuk melihat kekuatan hubungan diantara variabel-variabel kuantitatif. Analisis regresi linear sederhana menghasilkan persamaan berdasarkan pada data yang diobservasi dari variabel terikat (dependen) dan satu variabel bebas (independen). Regresi dengan satu variabel bebas disebut regresi linear sederhana. Sedangkan untuk menentukan apakah terdapat hubungan (kekuatan atau arah) antar variabel bebas dan satu variabel terikat disebut korelasi liner sederhana. Jika x adalah sebuah variabel bebas (regresor) dan y adalah varibel terikat, maka hubungan x dan y dalam persamaan regresi menjadi y = a + bx dimana a merupakan nilai intersep dan b disebut koefisien arah garis lurus (regresi liner). Persamaan tersebut merupakan persamaan estimasi atau prediksi nilai y, dimana nilai kecenderungan y tergantung dari besar kecilnya variabel x dengan perubahan konstan b ditambah a. misalkan sebuah persamaan konsumsi c = c0 + MPC (Yd), perubahan nilai C meningkat sesuai peningkatan Yd sebesar MPC + c0. Artinya apbila Yd meningkat 1 satuan maka C diprediksi meningkat sebesar c0 + MPC. 3.1 Persamaan regresi linear sederhana Contoh model regresi sederhana yang menggambarkan hubungan antara tingkat konsumsi dan pendapatan diatas, menjelaskan ketika terjadi kenaikan pendapatan cateris paribus maka konsumsi juga mengalami kenaikan linear sebesar C/Y (MPC), pada tingkat pendapatan nol terdapat konsumsi otonom C0. Dalam fungsi matematisnya C = C0 + MPC(Yd), C adalah konsumsi Yd merupakan pendapatan yang siap dikonsumsi. C0 dan MPC adalah parameter estimasi a dan b. Sehingga dalam persamaan/fungsi konsumsi dalam regresi ditulis sebagai Yi = a + bXi + ui. Berikut grafik yang menggambarkan hubungan antara konsumsi dan pendapatan : Y ui Y = a + bXi

b a X

Dalam setiap observasi data tersebar diantara garis regresi Y = a + bXi, seyogyanya data berada atau minimal mendekati garis regresi. Penyimpangan data terhadap garis estimasi disebut eror (ui).

Melihat kenyataan tersebut maka upaya terbaik yang harus dilakukan adalah dengan mencari nilai a dan b sedemikian hingga deviasi/penyimpangan/error dengan titik pengamatan/observasi sekecil mungkin. Metode yang kita gunakan untuk mencapai nilai error sekecil mungkin disebut OLS (ordinary least square). Metode OLS berusama meminimalkan error atau nilai sum square eror seminimal mungkin (MIN e). Kondisi ini bisa tercapai jika nilai a dan b atau parameter regresi a dan b sudah diketahui, berikut formula untuk mencari nilai parameter a dan b :

3.2 Kesalahan standar sampel estimasi Setiap penarikan sampel dari suatu populasi memiliki nilai standar kesalahan (standar eror), pada model regresi kesalahan standar populasi merupakan simpangan baku yang mengukur variasi titik-titik sampel (observasi) ditas atau dibawah garis regresi.

3.3 Pengujian koefisien garis regresi (signifikansi variabel bebas) Apabila sejumlah sampel dengan koefisien arah regresi b yang merupakan estimasi dari koefisien populasi , maka koefien arah regresi b memiliki kesalahan standar koefisien regresi atau kesalahan standar arah sebesar Sb yang didapatkan dari formula :

Model regresi memiliki asumsi distribusi normal sehingga didapatkan nilai statistik :

Jika koefisien populasi tidak diketahui maka :

Pada df=n-1 pada statistik t (atau Z jika data 30 atau jumlah n >0.5N), dengan pasangan-pasangan hipotesis :

a. Ho : =k dan Ha : k dimana k:koefisien (nilai parameter)populasi Ho ditolak jika |t stat| > t (/2 : df) b. Ho : k dan Ha : >k Ho ditolak jika t stat > t ( : df) c. Ho : k dan Ha : t (/2 : df) b. Ho : 0 dan Ha : >0 Ho ditolak jika t stat > t ( : df) c. Ho : 0 dan Ha : t (/2 : df) b. Ho : 0 dan Ha : >0 Ho ditolak jika t stat > t ( : df) c. Ho : 0 dan Ha : R2 model maka terdapat multikolinearitas. 4. Metode regresi auxiliary, dengan membandingkan nilai F pada masing-masing hasil regresi (parsial). Lalu nilai F yang dihasilkan dibandingkan dengan F tabel ((k-2);(n-k+1);), jika

signifikan (F>Ftabel) maka terdapat hubungan linear antar variabel bebas. Langkah untuk mendapatkan F hitung sebaga berikut ; R2 x1 x2 x3 xk / (k-2) F= 1-(R2 x1 x2 x3 xk )/ (n-k+1)

N : jumlah data k : klasifikasi (jumlah v.bebas termasuk konstanta) Cara menyembuhkan 1. Tanpa ada perbaikan : multikolinearitas tetap manghasilkan model yang BLUE, multikolinearitas hanya menyebabkan kita kesulitan mendapatkan error yang kecil. Masalah ini biasanya diakibatkan oleh jumlah observasi yang sedikit. Dalam konteks ini maka biasanya asumsi non multikolinearitas diabaikan. 2. Menghilangkan variabel independen yang menghasilkan korelasi/hubungn linear antar variabel yang kuat. 3. Transformasi variabel,menjadi bentuk differensial Yt = 0+ 1X1+ 2X2+ei diubah menjadi Yt Yt-1= 0+ (1X1-1xt-1)+ (2X2-2xt-1)+(et- et-1) model ini dikenal dengan bentuk diferensi pertama (first difference). 1.2 Heteroskedastisitas Metode OLS mengasumsikan bahwa residual (e/u) mempunyai rata-rata nol atau E(e)=0, mempunyai varian yang konstan var(e)=2 dan residual tidak saling berhubungan antara satu observasi dengan observasi yang lain cov(ei,ej)=0 sehingga menghasilkan estimator yang BLUE. Heteroskedastisitas adalah kondisi dimana varian tidak konstan atau (tidak homokedastisitas). Masalah ini biasanya terjadi terjadi pada tipe data cross section, pada fluktuasi data antar indiviu memiliki varian yang tinggi. Sedangkan pada data time series fluktuasinya stabil antar waktu. Sebagai contoh jika kita menganalisa prilaku penjualan pada perusahaan, maka kecenderungan penjualan perusahaan besar akan fluktuatif jika dibandingkan dengan perusahaan kecil. Kondisi ini mengakibatkan varian residualnya tidak stabil atau konstan, sementara metode OLS mensyaratkan model harus memenuhi taksiran yang BLUE. Jka model mengalami masalah heteroskedastisitas maka varian parameter estimasinya menjadi : var1 = xi22/(xi2)2 smentara modeltaksiran yang LUE var1 = 2/x1i2 ; varian konstan. Akibat heteroskedastisitas

1. Estmator metode OLS tidak mempunyai varian yang minimum lagi (no longer best) 2. Jika varian tidak minimum maka pehitungan SE metode OLS tidak bisa dipercaya kebenarannya 3. Akibat no 2 maka uji hipotesis maupun uji F tidak lagi bisa dipercaya kebenarannya. Cara mendeteksi 1. Metode informal, dengan metode grafik (sketergram) yakni dengan mendeteksi pola grafik antara variabel bebas dengan residual kuadrat (error). Jika kecenderungan residual kuadrat semakin meningkat seiring peningkatan variabel bebas maka model mengandung heterokedastisitas.

X1

Residual kuadrat 2. Metode park, dengan meregres varian (2) dengan variabel bebas karena menurut R.E. Park heterokedastisitas muncul diakibatkan oleh residual yang tergantung pada variabel bebas. Jika hasil parameter yang dihasilkan signiffikan menurut uji t, maka model mengandung unsur heterokedastisitas. Bentuk transformasi model uji park sebagai berikut : ln2=ln1+ln2x1+ ln3x2 tetapi karena 2 merupakan residual (deviasi) populasi, 2 diproksi menjadi ei sehinga modelnya lne2=ln1+ln2x1+ ln3x2. 3. Metode glejser, sama dengan metode yang dikembangkan oleh R.E.Park yakni dengan meregres residual (diabsolutkan) dengan variabel bebas model. Bentuk transformasi model metode Glejser adalah sebagai berikut : e=1+2x1+ 3x2, jika parameter signifikan maka model mengandung heterikedastisitas. Cara penyembuhan 1. Metode GLS (Generalized Least Square), yakni membagi setiap variabel dengan : Y/ i=(1/ i)+(2x1/ i)+ (3x2/ i)+(e/ i)

2. Transformasi model, jika kita asumsikan model proporsional tehadap x maka transformasi modelnya menjadi (Y/xi)=(1/xi )+ (2x1/xi )+(3x2/xi)+(e/xi). 1.3 Autokorelasi Autokorelasi berarti terdapat korelasi antara observasi yang satu dan observasi yang lainnya dalam rentang waktu yag berlainan. Atau korelasi antar residual yang satu dan residual yang lainnya. Deteksi autokorelasi Metode yang paling umum digunakan adalah metode durbin watson dimana autokorelasi diketahui ada atau tidak pada model dengan membandingkan nilai durbin watson (DW) dengan DW tabel. Dimana nilai DW hitung diperoleh dari : d 2(1-) dimana =etet-1/et2. Lalu cari DW tabel dengan ketentuan DW(n;k) k=jumlah variabel bebas. Lalu ketentuan penilaian ada tidaknya autokorelasi dengan metode ini sesuai rule of thumb sebagai beriut : 0