Regresi Linear Dengan R
Click here to load reader
description
Transcript of Regresi Linear Dengan R
-
Written by Rangga Handika
Regresi Linear dengan R
1. Model Keuangan
Dalam konteks pembahasan ekonometrika, tentunya kita tidak pernah lepas dari model
ekonomi. Namun buku ini membahas ekonometrika keuangan, yang tentunya menggunakan
model keuangan (bukan model ekonomi). Sub bagian ini membahas secara ringkas
pengertian model ekonomi dan perbedaan utama model keuangan dengan model ekonomi.
Literatur ekonometrika (seperti Hill et al., 2011) memberikan pengertian atas apa yang
dimaksudkan dengan model ekonomi. Model ekonomi merupakan suatu bentuk yang
memaparkan hubungan antara suatu variabel ekonomi dengan variabel ekonomi lainnya yang
akan digunakan untuk melakukan analisa ekonomi secara empiris (atau kuantitatif).
Hubungan antar variabel ekonomi tersebut diformulasikan berdasarkan teori ekonomi yang
ada.
Model keuangan sedikit berbeda dengan model ekonomi. Tentu kita juga bias
mengartikan bahwa model keuangan memaparkan hubungan antara variabel-variabel
keuangan berdasarkan teori keuangan. Lebih spesifik lagi, Brooks (2008) menjelaskan
perbedaan antara model keuangan dan model ekonomi, khususnya terkait perbedaan data
(variabel) keuangan dengan data ekonomi yaitu sebagai berikut:
1. Data ekonomi lebih rentan terhadap kesalahan pengukuran (measurement error) dan revisi
(data revision) sedangkan data keuangan relatif terhindar dari kedua masalah tersebut
karena data keuangan diperoleh ketika terjadi transaksi perdagangan dan dilakukan secara
online dan realtime.
2. Data keuangan tersedia dalam frekuensi yang lebih tinggi (misalnya dalam tiap bulanan
atau mingguan, bahkan ada dalam tiap jam atau menit yang disebut sebagai high
frequency data) sementara data ekonomi biasanya hanya ada tiap tahun atau semester atau
kuartal.
3. Data keuangan memiliki lebih banyak noisy yang artinya lebih rumit untuk memisahkan
komponen tren dari aspek random.
4. Data keuangan cenderung tidak terdistribusi secara normal, padahal tehnik ekonometrika
sebagian besar mengasumsikan distribusi normal.
5. Data keuangan yang memiliki frekuensi yang lebih tinggi cenderung memiliki
karakteristik khusus.
-
Written by Rangga Handika
Poin nomor 3 hingga nomor 5 memiliki implikasi serius bagi peneliti yang bermaksud
melakukan penelitian empiris di bidang keuangan yang artinya dalam menyusun suatu model
keuangan harus mempertimbangkan aspek-aspek tersebut.
Tiga macam tipe data keuangan yang umum tersedia:
1. Data keuangan time series, yang artinya data suatu variabel keuangan pada suatu runtutan
rentang waktu. Contoh: data harga harian suatu saham pada 2 Januari 2010 sampai dengan
30 Desember 2012.
2. Data keuangan cross section, yang artinya data suatu variabel keuangan pada berbagai
sampel pada suatu titik waktu tertentu. Contoh: data laba seluruh 45 perusahaan LQ-45
pada 31 Desember 2014.
3. Data keuangan panel, yang artinya data suatu variabel keuangan pada berbagai sampel
pada suatu runtutan rentang waktu. Contoh: data harga saham seluruh 45 perusahaan LQ-
45 pada 2 Januari 2010 sampai dengan 30 Desember 2012.
Contoh model keuangan adalah model ex-post Capital Asset Pricing Model (CAPM)
yang menjelaskan bahwa return suatu saham dapat dijelaskan oleh return pasar saham
(Jones, 2007 ; Bodie et al., 2009):
(5.1)
dimana:
Ri : return suatu saham (saham i)
rf : return instrumen keuangan risk free (misalnya BI rate)
i dan i : parameter dalam model regresi, adalah konstanta, adalah koefisien dari
variabel rM - rf untuk suatu saham i
rM : return pasar saham, biasanya return indeks (misalnya IHSG)
ei : komponen idiosyncratic (random / error)
2. Metode OLS Parameter Regresi
Model keuangan (5.1) dalam analisa ekonometrika kita sebut sebagai model regresi.
Dalam suatu model regresi, ada yang disebut sebagai dependent variable dan independent
variable. Dependent variable adalah suatu variabel yang variasi (perubahannya) dijelaskan
oleh independent variable. Pada model keuangan (5.1), Ri rf merupakan dependent variable
sedangkan RM rf merupakan independent variable.
-
Written by Rangga Handika
Suatu model keuangan regresi memiliki sejumlah asumsi sebagai berikut (Brooks, 2008
; Hill et al., 2011):
1. Expected value dari random error (e) adalah E(e) = 0.
2. Nilai varians dari random error (e) adalah var(e) = 2 (konstan).
3. Error yang satu dengan error yang lain secara statistik bersifat independen, atau
diformulasikan sebagai berikut cov(ei, ej) = 0.
4. Independent variable tidak bersifat random, dan minimal ada 2 nilai yang berbeda untuk 2
observasi dependent variable yang berbeda.
5. Nilai komponen error terdistribusi secara normal e ~ N(0, 2)
6. Komponen error dengan independent variable secara statistik bersifat independen, atau
diformulasikan sebagai berikut cov(ei, xi) = 0.
Dengan demikian, setiap model regresi harus dianalisa apakah observasinya memenuhi
asumsi-asumsi di atas. Tehnik analisa asumsi-asumsi tersebut bernama regression diagnostic
yang akan dibahas pada pertemuan berikutnya.
Berdasarkan model keuangan (5.1), jika data time series untuk dependent variable dan
independent variable tersedia, maka parameter regresi dan dapat ditentukan. Salah satu
tehnik menentukan parameter regresi adalah menggunakan tehnik ordinary least square
(OLS).
Tehnik OLS secara singkat dapat dijelaskan bahwa koefisien (intercept) dan koefisien
(slope) ditentukan sedemikian rupa sehingga garis lurus yang tercipta dari parameter dan
merupakan garis lurus yang paling fit / tepat yang menghubungkan antara dependent
variable dan independent variable (Hill et al., 2011). Garis lurus tersebut merupakan nilai
dependent variable yang diharapkan berdasarkan nilai suatu independent variable. Perbedaan
antara nilai yang diharapkan dengan nilai actual suatu dependent variable itulah yang disebut
sebagai residual. Tehnik OLS mencari parameter dan sedemikian rupa sehingga nilai
residualnya minimal. Detail proses tehnik OLS ini dapat dilihat pada Brooks (2008)
Chapter 2.
3. Model Regresi Sederhana dan Regresi Berganda
Model regresi sederhana (simple linear regression) adalah model regresi dengan 1
(satu) independent variable. Sedangkan model regresi berganda (multiple linear regression)
adalah model regresi dengan 2 (dua) atau lebih independent variables.
Berdasarkan model keuangan (5.1) dan data time series harian harga saham Bank BNI
dan harga IHSG pada 30 Desember 2004 hingga 31 Desember 2014 (terdapat pada file
-
Written by Rangga Handika
DATA_KEUANGAN_1.csv), maka kita dapat menyusun suatu model keuangan regresi
sederhana sebagai berikut:
(5.2)
dimana:
RBNI : return harian saham BNI
dan : parameter dalam model regresi sederhana (5.2)
rIHSG : return harian IHSG
e : komponen idiosyncratic (random / error)
Komponen rf pada model (5.2) diabaikan karena nilai rf untuk harian akan sangat kecil
(mendekati 0) sehingga dapat diabaikan. Perlu diperhatikan juga bahwa data time series
harian yang ada adalah data volume dan harga, bukan return. Return suatu saham dapat
dihitung dengan menggunakan selisih log harga saham hari ini dengan log harga saham hari
sebelumnya, atau pada R digunakan rumus sebagai berikut:
diff(log(vektor kolom harga saham)
Perintah R untuk model regresi sederhana (5.2):
data
-
Written by Rangga Handika
plot(RDate, RBNI$BNIReturn,xlab="Date",ylab="Return Saham BNI")
# menampilkan scatterplot return harian BNI
PriceIHSG
-
Written by Rangga Handika
names(lm_5_2) # isi hasil analisa regresi OLS model 5.2
output:
[1] "coefficients" "residuals" "effects" "rank"
[5] "fitted.values" "assign" "qr" "df.residual"
[9] "na.action" "xlevels" "call" "terms"
[13] "model"
intepretasi:
Ada 13 sub-report hasil analisa regresi OLS model 5.2 melalui perintah lm_5_2
summary(lm_5_2) # laporan utama hasil regresi OLS model 5.2
output:
Call:
lm(formula = RBNI$BNIReturn ~ RIHSG$IHSGReturn)
Residuals:
Min 1Q Median 3Q Max
-0.142250 -0.010305 -0.001269 0.008988 0.181666
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.0002867 0.0004338 -0.661 0.509
RIHSG$IHSGReturn 1.2028554 0.0297064 40.491 |t|). Pada output tersebut, nilai estimasi OLS parameter adalah negatif dan sangat kecil (mendekati nol) tetapi secara statistik tidak signifikan; sedangkan parameter adalah positif dan signifikan secara statistik pada tingkat keyakinan 99.9 persen (100 persen 0.1 persen).
Baris Signif. codes: menunjukkan bahwa tanda *** untuk tingkat keyakinan 99.9 persen, tanda ** untuk tingkat keyakinan 99 persen, tanda * untuk tingkat keyakinan 95 persen, dan tanda . untuk tingkat keyakinan 90 persen. Tanda ini akan dimunculkan (jika estimate suatu coefficient secara statistik signifikan) pada sebelah sisi
kanan nilai p-value (angka pada kolom Pr(>|t|)). Pada output di atas, kita mellihat
-
Written by Rangga Handika
tanda *** di sebelah kanan angka p-value coefficient
-
Written by Rangga Handika
predict ( ) melakukan prediksi dengan model regresi berdasarkan suatu data
plot ( ) melakukan plot diagnosa suatu model regresi
confint ( ) nilai confidence interval koefisien parameter pada model regresi
deviance ( ) nilai jumlah kuadrat residuals
vcov ( ) estimasi matriks variance-covariance
logLik ( ) nilai log-likelihood model regresi
AIC ( ) / BIC ( ) nilai kriteria informasi model regresi
Berdasarkan model keuangan (5.1) dan data time series harian harga saham Bank BNI,
harga IHSG, harga ASX 200 (Indeks harga saham Australia) dan harga SP 500 (Indeks harga
saham Amerika Serikat) pada 30 Desember 2004 hingga 31 Desember 2014 (terdapat pada
file DATA_KEUANGAN_1.csv), maka kita dapat menyusun suatu model keuangan
regresi berganda sebagai berikut:
(5.3)
dimana:
RBNI : return harian saham BNI
, 1, 2 dan 3 : parameter dalam model regresi berganda (5.3)
rIHSG : return harian IHSG
rASX 200 : return harian indeks ASX 200
rSP 500 : return harian indeks SP 500
e : komponen idiosyncratic (random / error)
Perintah R untuk model regresi berganda (5.3) melanjutkan perintah regresi sederhana (5.2)
sebelumnya:
PriceASX
-
Written by Rangga Handika
lm_5_3 |t|)
(Intercept) -0.0002427 0.0004442 -0.547 0.5848
RIHSG$IHSGReturn 1.1692907 0.0355936 32.851
-
Written by Rangga Handika
Residual standard error: 0.02127 on 2293 degrees of freedom
(179 observations deleted due to missingness)
Multiple R-squared: 0.4089, Adjusted R-squared: 0.4084
F-statistic: 793 on 2 and 2293 DF, p-value: < 2.2e-16
intepretasi:
Residuals merupakan nilai residu (error) dengan rentang nilai minimal, kuartil pertama, median (kuartil kedua), kuartil ketiga dan maksimal.
Coefficients merupakan angka koefisien hasil estimasi OLS parameter (intercept), 1 (variabel return IHSG RIHSG$IHSGReturn) dan 2 (variabel return indeks ASX 200 RASX$ASXReturn), koefisiennya pada kolom Estimate, beserta nilai standard error ada kolom Std. Error, nilai t-statistic pada kolom t-value dan nilai p-value pada kolom Pr(>|t|). Pada output tersebut, nilai estimasi OLS parameter adalah negatif dan sangat kecil (mendekati nol) tetapi secara statistik tidak signifikan; parameter 1 adalah positif dan signifikan secara statistik pada tingkat keyakinan 99.9 persen (100 persen 0.1 persen) sedangkan parameter 2 adalah positif kecil dan signifikan secara statistik pada tingkat keyakinan 95 persen (100 persen 5 persen).
Baris Signif. codes: menunjukkan bahwa tanda *** untuk tingkat keyakinan 99.9 persen, tanda ** untuk tingkat keyakinan 99 persen, tanda * untuk tingkat keyakinan 95 persen, dan tanda . untuk tingkat keyakinan 90 persen. Tanda ini akan dimunculkan (jika estimate suatu coefficient secara statistik signifikan) pada sebelah sisi
kanan nilai p-value (angka pada kolom Pr(>|t|)). Pada output di atas, kita mellihat tanda *** di sebelah kanan angka p-value coefficient 1
-
Written by Rangga Handika
intepretasi:
Nilai estimate sama dengan nilai pada kolom Estimate pada Coefficients yaitu sebesar -0.0002427471 (untuk intercept ), 1.1692906819 (untuk 1) dan 0.0909579806 (untuk 2).
confint(lm_5_3, level = 0.95)
# menyusun interval (dengan keyakinan 95 persen) koefisien parameter
output:
2.5 % 97.5 %
(Intercept) -0.001113787 0.0006282926
RIHSG$IHSGReturn 1.099491698 1.2390896655
RASX$ASXReturn 0.000432808 0.1814831533
intepretasi:
Menampilkan batas bawah (kolom 2.5 %) dan batas atas (kolom 97.5 %) pada interval estimasi koefisien parameter , 1 dan 2 pada tingkat keyakinan 95 persen.
Daftar Pustaka
Bodie, Z., Kane, A. & Marcus, A. J. 2009. Investments 8th
edition, McGraw-Hill / Irwin.,
New York USA.
Brooks, C., 2008. Introductory Econometrics for Finance 2nd
edition, Cambridge University
Press, New York USA.
Danielsson, J., 2011. Financial Risk Forecasting, John Wiley & Sons, United Kingdom.
Hill, R. C., Griffiths, W. E. & Lim, G. C. 2011. Principles of Econometrics 4th
edition, John
Wiley & Sons Inc., NJ USA.
Jones, C. P., 2007. Investments 11th
edition, John Wiley & Sons Inc., NJ USA.
Kleiber, C. & Zeileis, A. 2008. Applied Econometrics With R, Springer, Spring Street, NY.
Venables, W. N., Smith, D. M. & R Core Team. 1999 2004. An Introduction to R.