Copula
-
Upload
nenaibrahim -
Category
Documents
-
view
50 -
download
4
description
Transcript of Copula
![Page 1: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/1.jpg)
TOPIK DALAM STATISTIKA III
PREDIKSI RETURN SP100 DAN SP600DENGAN CLAYTON COPULA
Isran K Hasan 20113051
Eka Okta Satriani 20113063
Cukri Rahminiani 20113070
Sukono 20114055
PROGRAM STUDI MAGISTER MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT TEKNOLOGI BANDUNG
2014
![Page 2: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/2.jpg)
Bab 1
Pendahuluan
1.1 Latar Belakang
Indeks harga saham merupakan indikator utama yang menggambarkan pergerakan
harga saham dengan memiliki fungsi sebagai indikator tren pasar, indikator tingkat
keuntungan, tolak ukur kinerja fortofolio, serta penentuan strategi pasif dan produk
derivatif.
Peramalan (forecasting) adalah suatu usaha atau kegiatan yang akan terjadi
di masa mendatang mengenai objekobjek tertentu dengan menggunakan judgement,
pengalaman-pengalaman ataupun data historis. Subagyo (1986) menyatakan bahwa
pada dasarnya tidak ada suatu metode peramalan yang paling baik dan selalu cocok
digunakan untuk membuat peramalan dalam berbagai situasi. Untuk menghitung
peramalan ini ada beberapa metode yang digunakan diantaranya metode runtun
waktu (time series).
Peramalan dilakukan untuk mengestimasi suatu perilaku data berdasarkan
analisis dan pengolahan data historis. Data runtun waktu (time series) merupak-
an data yang diamati menurut urutan waktu untuk suatu peubah tertentu. Model
time series yang umum digunakan adalah Autoregressive (AR), Moving Average
(MA) dan kombinasi Autoregressive Moving Average (ARMA) yang mempunyai
asumsi Homoscedasticity (variansi yang homogen). Namun pada kasus data finansi-
al, termasuk data indeks harga saham, memiliki kecenderungan berfluktuasi secara
cepat dari waktu ke waktu sehingga variansi dari error-nya akan selalu berubah
setiap waktu(Heterogen). Ketidakpastian yang dihadapi data indeks harga saham
biasanya mengakibatkan terjadinya pengelompokan volatilitas (volatility clustering)
yaitu berkumpulnya sejumlah error dengan besar yang relatif sama dalam beberapa
1
![Page 3: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/3.jpg)
Prediksi Return S&P100 dan S&P600 dengan Clayton Copula
waktu yang berdekatan.
Volatilitas digunakan untuk menggambarkan fluktuasi dari suatu data, sehing-
ga memungkinkan datanya bersifat heteroskedastisitas. Dalam kasus ini, pemodelan
data time series dengan menggunakan metode AR, MA, ARMA menjadi kurang te-
pat untuk digunakan, maka diperlukan metode lain untuk mengatasi masalah kehe-
terogenan variansi tersebut. Salah satu metode yang dapat digunakan untuk menga-
tasi masalah keheterogenan variansi adalah metode Autoregressive Conditional He-
teroscedasticity (ARCH) yang diperkenalkan Engle pada tahun 1982. Perubahan
variansi pada model ARCH dipengaruhi oleh sejumlah T data acak sebelumnya.
Model tersebut digeneralisasikan oleh Bollerslev pada tahun 1986 untuk mengatasi
orde yang terlalu tinggi pada model ARCH, yang lebih dikenal dengan Generalized
Autoregressive Conditional Heteroscedasticity (GARCH).
Data historis mempunyai keterkaitan terhadap analisis karakteristik dan pola
data. Pola data menggambarkan suatu kecendrungan antar data yang nantinya
dapat digunakan sebagai acuan untuk melakukan suatu peramalan atau prediksi.
Data yang digunakan adalah data harga saham SP100 dan SP600 dari ta-
hun 2000-2014 (Finance.yahoo.com,2014). Data saham dipilih adalah data periode
harian selama 15 tahun terakhir, masing-masing data saham SP100 dan SP600 men-
cakup 3552 data.
1.2 Tujuan
Tujuan-Tujuan dalam tugas besar ini adalah:
1. Mengestimasi parameter dengan menggunakan model time series AR(1) dan
GARCH(1,1).
2. Memodelkan data dengan Kopula Gaussian.
3. Menggabungkan data SP100 dan SP600 yang dimodelkan dengan Kopula Ga-
ussian dengan menggunakan Kopula Clayton.
4. Memprediksi harga saham dengan Kopula Clayton.
2
![Page 4: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/4.jpg)
Bab 2
Model Deret Waktu S&P100 dan
S&P600
2.1 Data Harga Saham S&P100 dan S&P600
Pemodelan untuk data deret waktu membutuhkan asumsi bahwa data hari ini ber-
gantung dari data sebelumnya. ukuran kebergantungan dua variabel diartikan juga
sebagai korelasi. Ukuran korelasi dua variabel yang cukup populer digunakan adalah
koefisien korelasi Pearson. Misalkan Yt menyatakan harga saham saat t, dengan me-
an µY dan variansi σ2Y . Koefisien korelasi (ρ) didefinisikan sebagai ukuran hubungan
linier antara Yt dan Yt+1, dimana:
ρYt,Yt+1 =Cov(Yt, Yt+1)
σ2Yt
(a) Scatter Yt dengan Yt+1 S&P100 (b) Scatter Yt dengan Yt+1 S&P600
Gambar 2.1: Scatter plot antara harga saham Yt dengan Yt−1. Berdasarkan grafik,terdapat hubungan yang erat antara harga saham hari ini dengan hari berikutnya.
Nilai ρ antara 0 sampai 1, semakin mendekati 1 maka nilai korelasi atau hu-
3
![Page 5: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/5.jpg)
Prediksi Return S&P100 dan S&P600 dengan Clayton Copula
bungan kebergantungannya semakin tinggi. Nilai koefisien korelasi dari harga saham
S&P100 saat t dan t+ 1 adalah 0.998 sedangkan korelasi dari harga saham S&P600
saat t dan t+ 1 adalah 0.998 . Selain itu, diagram scatterplot menunjukkan bahwa
data harga saham menggerombol mengikuti garis lurus dengan kemiringan positif.
Dapat disimpulkan bahwa terdapat korelasi positif yang tinggi harga saham hari ini
dengan harga saham hari berikutnya.
Data yang digunakan adalah data harga Saham S&P100 dan S&P600 pada
tanggal 28 Juli 2000 sampai dengan 11 September 2014. Berikut adalah statistika
deskriptif dari kedua data tersebut.
Tabel 2.1: Statistika Deskriptif untuk S&P100 dan S&P600
S&P100 S&P600Mean 592.8091 89.1459
Median 577.4950 82.0850Variansi 11334.084 722.091Skewness 0.503 0.255Kurtosis 3.144 2.898
Berdasarkan Tabel 2.1, dapat diketahui bahwa nilai mean dan median tidak
jauh berbeda. Hal ini berarti, data yang ada cukup simetris. Hal tersebut juga
terlihat pada skewnes dimana skewnes kedua data mendekati 0. Dari kurtosis, dapat
diketahui bahwa nilainya mendekati 3. Dengan demikian, data dapat dikatakan
mendekati distribusi normal. Variansi pada data memberikan informasi bahwa data
cukup jauh menyebar. Hal ini menjadi salah satu penyebab bahwa pengolahan data
menggunakan data harga saham tidak dianjurkan dalam pemodelan time series.
(a) Plot harga saham S&P100 (b) Plot harga saham S&P600
Gambar 2.2: Plot antara harga saham S&P100 dan S&P 600. Berdasarkan gra-fik, dapat diketahui bahwa kedua data tidak menunjukkan kestasioneran mean danvariansi.
Berdasarkan Gambar 2.2, dapat diketahui bahwa data deret waktu pada harga
saham S&P100 dan S&P600 tidak menunjukan gejala stasioner. Dengan demikian,
4
![Page 6: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/6.jpg)
Prediksi Return S&P100 dan S&P600 dengan Clayton Copula
dapat dikatakan bahwa data tersebut tidak memenuhi syarat kestasioneran yang
diperlukan dalam model deret waktu. Indikator lain mengetahui suatu kestasioneran
suatu data adalah dengan mengetahui fungsi autokprelasi. Jika fungsi atukorelasi
menurun secara perlahan, maka dapat dikatakan data tersebut tidak stasioner. Jika
model tersebut cut off pada lag tertentu, dapat dikatakan bahwa data tersebut
stasioner.
Pola ACF pada Gambar 2.3 menunjukkan bahwa nilai ACF menurun secara
perlahan. Artinya, dapat diketahui bahwa data tersebut tidak stasioner. Pengo-
lahan model deret waktu dengan model tersebut tentu akan memberikan taksir-
an model yang jauh dari kondisi sebenarnya. Terdapat beberapa metode untuk
menstasionerkan suatu data, diantaranya return, regresi linier, pendekatan fungsi,
differencing, dsb. Metode yang umum digunakan pada data saham adalah return.
(a) ACF harga saham S&P100 (b) ACF harga saham S&P600
Gambar 2.3: Plot ACF harga saham S&P100 dan S&P 600. Berdasarkan grafik,dapat diketahui bahwa kedua data tidak menunjukkan kestasioneran.
Seiring berjalannya waktu, harga saham cenderung berubah. Perubahan har-
ga saham diiringi dengan perubahan return harga. Hal tersebut mengakibatkan
kecenderungan berubahnya variansi dan volatilitas dari suatu return harga. Return
harga suatu aset dibedakan menjadi dua jenis yaitu return sederhana dan return
majemuk. Dalam hal ini, return yang digunakan adalah return Majemuk.
Return majemuk sering disebut log return. Misalkan Xt adalah return harga
aset.
Xt = log(1 +Rt) = logPtPt−1
= log(Pt) − log(Pt−1)
Misalkan Y1 = 500 dan Y2 = 1000. Dengan demikian, dapat diketahui bahwa
nilai dari r1 = 1. Jika Y1 = 1000 dan Y2 = 500 akan memberikan hasil r1 = −0.5.
Seperti diketahui, jarak antara Y1 dan Y2 adalah sama-sama 500, yang menunjukkan
perbedaan tanda saja. Namun, dengan penggunaan return majemuk, selain mem-
berikan perbedaan tanda, namun memberikan hasil konstanta yang berbeda pula.
5
![Page 7: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/7.jpg)
Prediksi Return S&P100 dan S&P600 dengan Clayton Copula
Berbeda halnya dengan return majemuk. Misalkan Y1 = 500 dan Y2 = 1000.
Dengan demikian, dapat diketahui bahwa nilai dari X1 = 0.693. Jika Y1 = 1000
dan Y2 = 500 akan memberikan hasil X1 = −0.693. Seperti diketahui, jarak antara
Y1 dan Y2 adalah sama-sama 500, dengan return sederhana, log hanya memberikan
perbedaan tanda saja. Hal tersebut sering dikatakan sifat simetris pada return.
Hal tersebut menjadi salah satu alasan pemilihan return majemuk daripada return
sederhana.
(a) Plot Return S&P100 (b) Plot Return S&P600
Gambar 2.4: Plot Return harga saham S&P100 dan S&P600.
Gambar 2.4 memberikan informasi bahwa nilai mean cenderung satsioner. Na-
mun, variansinya dapat dikatakan tidak stasioner. Hal ini menjadi salah satu alasan
memodelkan data dengan konsep GARCH. Salah satu upaya mengetahui kestasio-
neran adalah dengan plot autocorrelation function. Berikut ini adalah ACF dari
return majemuk S&P100 dan S&P 600.
(a) ACF return harga sahamS&P100
(b) ACF return harga sahamS&P600
Gambar 2.5: Plot ACF return harga saham S&P100 dan S&P 600. Berdasarkangrafik, dapat diketahui bahwa kedua data cukup menunjukkan kestasioneran.
6
![Page 8: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/8.jpg)
Prediksi Return S&P100 dan S&P600 dengan Clayton Copula
2.2 Model AR(1)-GARCH(1,1)
Model AR(1)-GARCH(1,1) dapat dituliskan sebagai berikut:
Yt = µ+ α1Yt−1 +Xt (2.1)
dimana Xt = σtεt
σ2t = α0 + β1X
2t−1 + β2σ
2t−1 (2.2)
dengan εt ∼ N(0, 1). Untuk mengestimasi parameter µ dan α1 akan digunakan
metode OLS (ordinary least square). Misalkan nilai yang terobservasi dari t = 2
sampai t = T dan misalkan pula
f(α1, µ) =T∑t=2
(Yt − µ− α1Yt−1)2 (2.3)
untuk meminimalkan f(α1, µ), Perhatikan persamaan ∂f(α1,µ)∂µ
= 0 dan ∂f(α1,µ)∂α1
= 0
sehingga
∂f(α1, µ)
∂µ= −2
T∑t=2
(Yt − µ− α1Yt−1) = 0 (2.4)
dan∂f(α1, µ)
∂µ= −2
T∑t=2
(Yt − µ− α1Yt−1)(Yt−1) = 0 (2.5)
dengan menyelesaikan persamaan (2) dan (3) diperoleh
(T − 1)µ+ α1
T∑t=2
Yt−1 =T∑t=2
Yt
dan
µT∑t=2
Yt−1 + α1
T∑t=2
Y 2t−1 =
T∑t=2
YtYt−1
Atau dapat dituliskan sebagai berikutT∑t=2
Yt
T∑t=2
YtYt−1
=
T − 1T∑t=2
Yt−1
T∑t=2
Yt−1
T∑t=2
(Yt−1)2
(
µ
α1
)
Selanjutnya akan diestimasi parameter α0, β1 dan β2 dengan menggunakan maksi-
mum likelihood (MLE). Perhatikan bahwa Xt memiliki distribusi (bersyarat) normal
dengan E(Xt|Ft−1) =√σtE(ε|Ft−1) = 0 dan V ar(Xt|Ft−1) = σ2
t V ar(ε|Ft−1) = σ2t .
7
![Page 9: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/9.jpg)
Prediksi Return S&P100 dan S&P600 dengan Clayton Copula
Dari sini diperoleh fungsi peluangnya adalah
f(Xt|Xt−1) =1√
2πσ2t
exp
−1
2
(Xt
σt
)2
Selanjutnya akan diestimasi parameter menggunakan metode Maksimum Likelihood
dari fungsi peluang diatas diperoleh fungsi likelihood
L(θ) =n∏t=2
1√(2π(α0 + β1Xt−1 + β2σ2
t−1))exp
−1
2
(Xt
2(α0 + β1Xt−1 + β2σ2t−1)
)2
fungsi log-likehood adalah
`(θ) =1
2
n∑t=2
(log(2π) + log(α0 + β1Xt−1 + β2σ
2t−1) +
X2t
α0 + β1Xt−1 + β2σ2t−1
)
untuk memperoleh nilai estimasi (α0), (α1), dan (β1) diperoleh dengan memaksi-
mumkan fungsi log likelihood dengan cara mencari turunan parsial terhadap para-
meternya, yaitu:
∂(`(θ))
α0
= 0,∂(`(θ))
β1
= 0,∂(`(θ))
β2
= 0
Sehingga diperoleh
∂(`(θ))
α0
= −1
2
n∑t=2
(1
α0 + β1Xt−1 + β2σ2t−1
− X2t
α0 + β1Xt−1 + β2σ2t−1
)= −1
2
n∑t=2
(α0 + β1Xt−1 + β2σ
2t−1 −X2
t
α0 + β1Xt−1 + β2σ2t−1
)
∂(`(θ))
β1
= −1
2
n∑t=2
(r2t−1
α0 + β1Xt−1 + β2σ2t−1
−X2tX
2t−1
α0 + β1Xt−1 + (β2σ2t−1)2
)= −1
2
n∑t=2
(α0X
2t−1 + β1X
4t−1 + β2σ
2t−1X
2t−1 −X2
tX2t−1
α0 + β1Xt−1 + (β2σ2t−1)2
)
∂(`(θ))
β1
= −1
2
n∑t=2
(σ2t−1
α0 + β1Xt−1 + β2σ2t−1
−X2tX
2t−1
α0 + β1Xt−1 + (β2σ2t−1)2
)= −1
2
n∑t=2
(α0σ
2t−1 + β1X
2t−1σ
2t−1 + β2σ
4t−1 −X2
t σ2t−1
α0 + β1Xt−1 + (β2σ2t−1)2
)
8
![Page 10: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/10.jpg)
Prediksi Return S&P100 dan S&P600 dengan Clayton Copula
Untuk memaksimumkan fungsi log likelihoodnya akan digunakan perhitungan de-
ngan menggunakan program MATLAB
2.3 Penerapan Model pada data S&P100 dan S&P600
Pada tugas ini, data yang akan digunakan adalah data saham S&P100 dan S&P600
dari tanggal 28 juli 2000 sampai 11 september 2014. Data saham tersebut diolah
dengan menggunakan software MATLAB. Selanjutnya dengan menerapkan model
ini pada data S&P100 dan S&P600 diperoleh estimasi parameter sebagai berikut:
S&P100 S&P600µ 0.000038680049795 1.174097488765628× 10−4
α1 -0.093657943546480 -0.021541387640377α0 2× 10−6 1.630484378274826× 10−5
β1 0.886791561211049 0.843039248484122β2 0.097704530705975 0.156958751515878
Tabel 2.2: estimasi parameter data saham S&P100 dan S&P600
Selanjutnya, dari persamaan (1) diperoleh
εt =Yt − µ− α1Yt−1
α0 + β1X2t−1 + β2σ2
t−1
(2.6)
Dari persamaan error diatas dapat dihitung dilihat masing-masing statistik desk-
riptif dari error untuk S&P100 dan S&P600 sebagai berikut:
Tabel 2.3: Tabel Statistik Deskriptif Error
ERROR S&P100 ERROR S&P600Statistic Value Statistic Value
SampleSize 3552 SampleSize 3552Range 33.856 Range 81.464Mean -6.46E-05 Mean -0.00245
Variance 4.4616 Variance 3.5223Std.Deviation 2.1122 Std.Deviation 1.8768
Coef.ofVariation -32697 Coef.ofVariation -766.92Std.Error 0.03544 Std.Error 0.03149Skewness -0.63063 Skewness -17.518
ExcessKurtosis 8.4834 ExcessKurtosis 686.36
Dari sini terlihat bahwa data tersebut berdistribusi student t. Selanjutnya akan
dilihat dengan menggunakan menggunakan ACF dapat dilihat apakah eror dari
data tersebut tidak berkorelasi. Perhatikan gambar berikut:
9
![Page 11: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/11.jpg)
Prediksi Return S&P100 dan S&P600 dengan Clayton Copula
(a) S&P100 (b) S&P600
Gambar 2.6: Fitting histogram S&P100 dan S&P600 dengan distribusi normal dant.
(a) Normal PP Return S&P100(b) Normal PP Return ReturnS&P600
Gambar 2.7: Normal PP Return S&P100 dan S&P600.
(a) Fungsi Autokorelasi error daridata S&P100
(b) Fungsi Autokorelasi error daridata S&P600
Gambar 2.8: Fungsi Autokorelasi error dari data S&P100 dan S&P600.
Dari gambar diatas dapat dilihat bahwa eror dari kedua data tidak menempel
pada garis merah sehingga dapat disimpulkan bahwa eror dari kedua data tidak ber-
distribusi normal. terlihat juga dari plot bahwa eror dari kedua data tersebut tidak
berkorelasi karena autokorelasi dari semua lagnya berada dibawah batas signifikansi.
Selain menggunakan plot ACF, kebebasan dari error juga dapat diketahui de-
ngan residual plot.
10
![Page 12: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/12.jpg)
Model Distribusi Eror dengan Copula
(a) S&P 100 (b) S&P 600
Gambar 2.9: Plot Residual dari data S&P100 dan S&P600.
Berdasarkan Gambar 2.9, dapat diketahui bahwa error kedua data tidak ber-
korelasi. Hal tersebut dikarenakan tidak ada pola grafik.
Selanjutnya, akan dilihat apakah model AR(1)-GARCH (1,1) dapat merepre-
sentasikan kedua data return dengan membandingkan data return dan data yang
diperoleh dari hasil estimasi sehingga diperoleh
(a) Plot Hasil Model untuk dataS&P100
(b) Plot Hasil Model untuk dataS&P600
Gambar 2.10: Plot Hasil Model untuk data S&P100 dan S&P600.
Dari gambar ini terlihat bahwa model AR(1)-GARCH(1,1) cukup merepresentasikan
kedua data return.
11
![Page 13: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/13.jpg)
Bab 3
Model Distribusi Eror dengan
Copula
3.1 Distribusi Error S&P 100 dan S&P 600
Copula merupakan distribusi yang digunakan untuk mengkonstruksi beberapa dis-
tribusi yang saling bergantung. Informasi distribusi marginal dari distribusi tersebut
diperlukan dalam proses konstruksi. Copula sangat sensitif terhadap distribusi mar-
ginal tersebut. Oleh karena itu, penentuan distribusi marginal yang akurat sangat
diperlukan agar hasil konstruksi distribusi tepat.
Salah satu metode untuk menentukan parameter distribusi adalah dengan me-
lihat histogram dari suatu sampel acak. Histogram tersebut diharapkan mampu
memberikan informasi mengenai distribui yang tepat digunakan untuk pendekatan
sampel. Berikut adalah histogram dan pendekatan distribusi yang dianggap sesuai.
Berdasarkan 3.1, dapat diketahui bahwa gambar cukup simetris. Oleh karena
itu, distribusi yang dianggap tepat adalah distribusi normal dan t. Informasi menge-
nai kelancipan pada gambar tersebut sudah cukup jelas mengarahkan pada distribusi
t. Berikut adalah estimasi parameter distribusi sampel acak dengan menggunakan
distribusi t.
Tabel 3.1: Estimasi parameter error S&P100 dan S&P600
Distribusi t S&P100 S&P600µ 7.25355 ×10−2 5.43921 ×10−2
σ 1.04946 1.01296ν 1.89475 3.70339
Parameter tersebut dapat diuji keakuratannya dengan metode ’kuadrat error’.
12
![Page 14: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/14.jpg)
Model Distribusi Eror dengan Copula
(a) S&P 100
(b) S&P 600
Gambar 3.1: Pendekatan distribusi sampel error S&P 100 dan S&P 600.
Langkah pertama penggunaan metode ’kuadrat error’ adalah dengan menghitung
fungsi kumulatif F empirik dari sampel, Fem(x) = #data≤xn
. Selanjutnya, menghi-
tung fungsi kumulatif F berdasarkan parameter yang ditentukan Fθ,t(x). Dengan
mengetahui sampel tersebut, dapat diperoleh
KS(xt) =n∑t=1
(Fθ,t(xt)− Fem(xt))2
Selanjutnya akan diperoleh Hdata = KS(x)n
.
Dengan cara serupa, dapat dibangkitkan data secara berulang-ulang (Simulasi
Monte Carlo) sesuai dengan distribusi dan parameter yang telah diestimasi sebelum-
nya sehingga diperoleh Fem(x), Fθ,t(x), KS(x) dan Hsimulasi. Berikut adalah Hdata
untuk error S&P100 dan S&P600.
Tabel 3.2: Hdata S&P100 dan S&P600
Error S&P100 S&P600Hdata 2.0581 ×10−4 1.1340 ×10−4
13
![Page 15: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/15.jpg)
Model Distribusi Eror dengan Copula
Berdasarkan nilai Hsimulasi untuk error S&P 100 dan S&P 600, secara berurut-
an Hdata berada pada kuantil 0.713 dan 0.486. Dengan demikian, dapat disimpulkan
bahwa model sudah cukup akurat menggambarkan distribusi sampel dan dapat dip-
roses lebih lanjut dengan konsep Copula.
Berikut adalah histogram dari Hsimulasi untuk S&P100 dan S&P600.
(a) S&P 100 (b) S&P 600
Gambar 3.2: Histogram untuk H pada error S&P 100 dan S&P 600.
3.2 Fungsi Marginal dengan Gaussian Copula
Distribusi marginal error pada subbab sebelumnya memberikan informasi penting
dalam penerapan Copula pada error return harga saham. Dalam pembahasan pada
bab ini error dari S&P 100 disimbolkan dengan ε dan error dari S&P 600 disimbolkan
dengan δ.
S&P100⇒ ε1, ε2, ..., εT
S&P600⇒ δ1, δ2, ..., δT
Pada subbab sebelumnya, telah diketahui bahwa distribusi dari ε dan δ adalah
distribusi t. Dengan informasi tersebut akan dicari distribusi dari F (εt|Ωt−1) dan
F (δt|Ωt−1).
F (εt|Ωt−1) =
∂t−1
∂u1 ... ∂ut−1CΛ(u1, ..., ut)
cΛ(u1, ..., ut−1)(3.1)
dengan
14
![Page 16: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/16.jpg)
Model Distribusi Eror dengan Copula
∂t−1
∂u1 ... ∂ut−1
CΛ(u1, ..., ut) =
∫ Φ−1(ut)
∞cΛ(Φ−1(u1), ..., Φ−1(ut−1), st)d st
× 1
φ(Φ−1(u1))× ...× 1
φ(Φ−1(ut−1))(3.2)
dan
cΛ(u1, ..., ut−1) = |Λ|−0.5e−0.5(Φ−1(u1)...Φ−1(ut−1))(Λ−1−I)(Φ−1(u1)...Φ−1(ut−1))′ (3.3)
sedangkan uj = F (εj). Dengan mensubtitusikan persamaan 3.2 dan 3.3 ke persa-
maan 3.1 diperoleh
F (εt|Ωt−1) =
∫ Φ−1(ut)
−∞
f(Φ−1(u1), ..., Φ−1(ut−1), st)
f(Φ−1(u1), ...,Φ−1(ut−1))d st (3.4)
Dengan persamaan diatas dapat diperoleh
X = u1, ..., uT
Y = v1, ..., vT
dengan uT adalah F (εt|Ωt−1).
3.2.1 Penerapan Gaussian Copula pada data error
Berikut adalah Algoritma sederhana untuk memperoleh F (εt|Ωt−1)
1. Memanggil data error dari S&P100 dan S&P600
2. Fitting distribusi dengan t, diperoleh µ, σ, ν
3. Standarisasi error Kt = εt−µσ
4. Mencari CDF dari dengan distribusi t, dengan derajat kebebasan ν dan selan-
jutnya disimbolkan dengan W
5. Mencari Z, dimana Z = Φ−1(W )
15
![Page 17: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/17.jpg)
Model Distribusi Eror dengan Copula
6. Mencari parameter h dan matrix Λ
Λ(p, q) = h exp(−(p− q)2
2h)
dengan dekomposisi cholesky diperoleh Λ = LL′
7. Mencari matrik loglikelihood
L(θ) = −1
2V ′V +
1
2Z ′Z + (−1
2ln(|Λ|) +
n∑i=1
lnFi(xi))
dengan V = L−1Z
8. Mencari u, dengan h yang memaksimumkan likelihood untuk S&P 100 dan
S&P600, berturut-turut yaitu 0.43 dan 0.48
F (εt|Ωt−1) =
∂t−1
∂u1 ... ∂ut−1CΛ(u1, ..., ut)
cΛ(u1, ..., ut−1)
Algoritma hasil diatas, memberikan hasil sebagai berikut:
(a) S&P 100 (b) S&P 600
Gambar 3.3: Z S&P 100 dan S&P 600.
Gambar 3.3 memberikan informasi bahwa grafik cepat turun ke nilai 0 (mean rever-
sion) dengan demikian nilai h kurang dari 1. Dari kondisi tersebut, dapat ditentukan
bahwa nilai h berada pada selang 0 < h < 1. Dengan memaksimumkan fungsi log
likelihood, diperoleh h. Berikut adalah grafik hubungan antara h dengan nilai log
likelihoodnya.
Berdasarkan Gambar 3.4, dapat diketahui bahwa nilai dari h berturut-turut
untuk S&P 100 dan S&P 600 adalah 0.433 dan 0.484. Hal tersebut wajar karena
grafik error cepat menuju 0 atau mean reversion.
16
![Page 18: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/18.jpg)
Model Distribusi Eror dengan Copula
(a) S&P 100 (b) S&P 600
Gambar 3.4: h S&P 100 dan S&P 600.
Berikut adalah grafik dan histogram u dan v. Berdasarkan Grafik 3.5, dapat
diketahui bahwa u dan v berdistribusi uniform (0,1). Setelah memperoleh u dan v,
selanjutnya akan ditentukan Copula banding untuk menggabungkan kedua peubah
acak dari u dan v.
(a) S&P 100 (b) S&P 600
Gambar 3.5: Histogram u dan u S&P 100 dan S&P 600
Seharusnya, distribusi dari X dan Y adalah Uniform (0,1). Gambar 3.5 mem-
berikan informasi bahwa distribusi yang sesuai untuk X dan Y adalah uniform(0,1),
meskipun terdapat sedikit anomali di nilai kecil yang mendekati nol dan nilai besar
yang mendekati 1. Salah satu uji keseragaman yang digunakan adalah QQ plot.
Selain menggunakan QQ-plot, dengan konsep KS yang telah dijelaskan sebe-
lumnya, diperoleh nilai KS pada data berada di luar selang data bangkitan. Nilai H
yang diperoleh adalah Hdata = 0.2265 sedangkan Hsimulasi = [1.3010−5, 1.3510−3]
17
![Page 19: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/19.jpg)
Konstruksi Copula Bivariat dengan Clayton Copula
(a) S&P 100 (b) S&P 600
Gambar 3.6: Quantile-Quantile Plot u dan v
Berdasarkan Gambar 3.6, dapat diketahui bahwa data sudah menunjukan ke-
seragaman, namun terdapat sedikit anomali di ekor atas dan bawah. Namun, hal
tersebut dirasa tidak signifikan mempengaruhi sifat seragam data.
18
![Page 20: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/20.jpg)
Bab 4
Konstruksi Copula Bivariat
dengan Clayton Copula
Salah satu metode untuk mengkonstruksi dua distribusi adalah Copula. Copula
memiliki keistimewaan untuk menggabungkan dua distribusi yang tidak identik.
Copula dapat menggabungkan dua distribusi berbeda yang tidak saling bebas mes-
kipun tidak diketahui jenis hubungan diantara dua kerugian acak tersebut. Pada
dasarnya, Copula merupakan distribusi multivariat dengan marginal Uniform [0, 1]
yang berfungsi untuk menggabungkan dua fungsi distribusi dari dua kerugian acak.
4.1 Karakteristik Clayton Copula
Terdapat beberapa metode untuk mengkonstruksi Copula bivariat. Salah satu me-
tode yang umum digunakan adalah pendekatan Archimedean. Copula yang dikon-
struksi dengan metode ini disebut Archimedean Copula. Dengan φ(t) adalah fungsi
generator. Archimedean Copula didefinisikan sebagai (Nelsen 2006):
C(u, v) = φ−1[φ(u) + φ(v)] ∀ u, v ∈ [0, 1]
Pada kelas Archimedean, terdapat beberapa jenis Copula 1 parameter dengan spe-
sifikasi masing-masing. Beberapa diantaranya adalah Clayton Copula. Clayton
Copula memiliki fungsi generator sebagai berikut:
φ(t) =t−α
α(4.1)
19
![Page 21: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/21.jpg)
Konstruksi Copula Bivariat dengan Clayton Copula
Salah satu hal penting dalam fungsi generator adalah invers dan turunan dari fungsi
generator tersebut. Invers dan turunan dari fungsi generator salah satunya berguna
untuk menentukan penaksir parameter. Fungsi invers dan turunan pertama terha-
dap t untuk persamaan 4.1 adalah sebagai berikut.
φ−1(t) = (tα + 1)1α (4.2)
φ′(t) = −t−(α+1) (4.3)
Untuk mengetahui distribusi gabungan dari dua peubah acak, dapat diketahui da-
ri fungsi distribusi Copula. Fungsi distribusi kumulatif fungsi distribusi peluang
Clayton Copula adalah sebagai berikut:
C(u, v) = φ−1[φ(u) + φ(v)]
= φ−1(u−α−1α
+ v−α−1α
)C(u, v) = (u−α + v−α − 1)−
1α (4.4)
Berikut adalah grafik untuk fungsi distribusi cumulatif Clayton Copula. Berdasark-
an Gambar 4.1, dapat diketahui bahwa semakin besar nilai parameter α, nilai cdf
semakin membesar, meskipun hal ini tidak begitu tampak secara signifikan.
(a) α = 0 (b) α = 0.5 (c) α = 1
(d) α = 5 (e) α = 10 (f) α = 20
Gambar 4.1: Distribusi Kumulatif Clayton Copula
Dari persamaan 4.4, didapat turunan pertama terhadap u dan v yang merupakan
20
![Page 22: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/22.jpg)
Konstruksi Copula Bivariat dengan Clayton Copula
densitas dari Copula tersebut.
c(u, v) =
(1 +
1
a
)(uv)−1− 1
a (u−1a + v−
1a − 1)−a−2
(a) α = 0 (b) α = 0.5 (c) α = 1
(d) α = 5 (e) α = 10 (f) α = 20
Gambar 4.2: Fungsi Kepadatan Peluang Clayton Copula
(a) α = 0 (b) α = 0.5 (c) α = 1
(d) α = 5 (e) α = 10 (f) α = 20
Gambar 4.3: Scatterplot Clayton Copula
Gambar 4.2 dan 4.3 memberi informasi bahwa semakin besar nilai α, titik
semakin tebal berada pada daerah sekitar u dan v. Selain itu, nilai juga menumpuk
pada daerah sekitar u = 0 dan v = 0. Dengan informasi ini, dapat dikatakan
21
![Page 23: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/23.jpg)
Konstruksi Copula Bivariat dengan Clayton Copula
bahwa Copula tipe clayton bagus digunakan untuk dua distribusi yang memeiliki
kebergantungan di ekor bawah.
4.2 Penaksir Parameter pada Clayton Copula
Penaksir parameter distribusi Copula dapat ditaksir dengan menggunkan konsep
Kendall’s Tau. Kendall’s Tau merupakan salah satu ukuran asosiasi yang popu-
ler digunakan untuk mengukur asosiasi bertipe linear ataupun non-linear. Konsep
Ukuran asosiasi Kendall’s Tau erat kaitannya dengan konsep Concordance dan di-
scordance.
Misal (X, Y ) menyatakan peubah acak kontinu dari marginal eror S&P 100
dan S&P 600, sedangkan (ui, vi) dan (uj, vj) adalah dua observasi yang berbeda
dari (X, Y ).
• (ui, vi) dan (uj, vj) dikatakan concordant jika
(ui − uj) (vi − vj) > 0
Hal ini terjadi jika ui < uj dan vi < vj atau ui > uj dan vi > vj.
• (ui, vi) dan (uj, vj) dikatakan discordant jika
(ui − uj) (vi − vj) < 0
Hal ini terjadi jika ui < uj dan vi > vj atau ui > uj dan vi < vj.
Gambar 4.4: Ilustrasi concordant dan discordant pada dua peubah acak.
Kendall’s Tau pada sampel dapat didefinisikan sebagai peluang concordance
dikurangi peluang discordance:
τ = τX,Y = P [(Xi −Xj)(Yi − Yj) > 0]− P [(Xi −Xj)(Yi − Yj) < 0] (4.5)
22
![Page 24: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/24.jpg)
Konstruksi Copula Bivariat dengan Clayton Copula
Misal (u1, v1), (u2, v2), ... , (un, vn) adalah sampel acak dari (X, Y ) , maka terdapat
nC2 pasang observasi (ui, vi) dan (uj, vj) yang berbeda. Jika banyak pasangan yang
concordant dinyatakan dengan c dan pasangan yang discordant dinyatakan dengan
d, maka Kendall’s Tau sampel adalah
τ =c− dnC2
, −1 ≤ τ ≤ 1 (4.6)
Dalam bentuk Copula, ukuran asosiasi Kendall’s Tau adalah sebagai berikut (Nel-
sen. 2006):
τX,Y = P [(X1 − X2)(Y1 − Y2) > 0]− P [(X1 − X2)(Y1 − Y2) < 0] (4.7)
Untuk kelas Archimedean Copula, persamaan ukuran asosiasi Kendall’s Tau dapat
dinyatakan sebagai berikut(Nelsen, 2006):
τC = 1 +
∫ 1
0
φ(t)
φ′(t)dt (4.8)
Persamaan 4.8 jika dikombinasikan dengan persamaan 4.2 dan 4.3 dapat diperoleh
persamaan Kendall’s tau pada Clayton Copula.
τC = 1 +
∫ 1
0
φ(t)
φ′(t)dt = 1 +
∫ 1
0
t−α− 1α
−t−(α+1)dt
= 1 +4
α
(1
α + 2− 1
2
)τC =
α
α + 2(4.9)
4.3 Aplikasi Clayton Copula pada data marginal
Error S&P 100 dan S&P 600
Pada Bab 3, telah diketahui distribusi marginal bersyarat dari Error S&P 100 dan
S&P 600 menggunakan konsep Gaussian Copula. Dicurigai, distribusi marginal ber-
syarat dari Error S&P 100 dan S&P 600 saling memiliki kebergantungan. Oleh ka-
rena itu, untuk memprediksi nilai harga saham di masa mendatang, dapat diketahui
melalui konsep Copula bivariat, yang mampu mengakomodir nilai kebergantungan
diantara dua peubah acak tersebut.
Langkah awal untuk mengetahui Copula yang sesuai adalah dengan melihat
23
![Page 25: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/25.jpg)
Konstruksi Copula Bivariat dengan Clayton Copula
scatterplot dari kedua marginal error tersebut.
Gambar 4.5: Scatter fungsi marginal bersyarat error S&P 100 dan S&P 600
Berdasarkan Gambar 4.5 dan 4.3, dapat diketahui bahwa Copula tipe Clayton
sebenarnya tidak begitu sesuai digunakan untuk kedua peuabah acak tersebut. Hal
ini karena, untuk kondisi ekor atas, atau saat fungsi marginal kedua peuabah acak
mendekati satu, tidak bisa didekati oleh Copula Clayton. Meskipun demikian, akan
diketahui sejauh mana keakuratan penggunaan model Clayton Copula pada data.
Langkah lanjut untuk mengkonstruksi distribusi dengan menggunakan Cla-
yton Copula adalah mengetahui nilai Kendall’s Tau dan parameternya. Berdasarkan
persamaan 4.6 nilai Kendall’s tau yang diperoleh adalah 0.6020. Berdasarkan per-
samaan 4.9 dan penerapan konsep pada aljabar, dapat diketahui bahwa α = 2τ1−τ .
Dengan demikian, α = 20.60201−0.6020
,= 3.0255.
(a) n = 380 (b) n = 2000
Gambar 4.6: Plot u dan v simulasi dengan basis Clayton Copula
Pada dasarnya, distribusi u dan v simulasi berdistribusi uniform(0,1). Berikut
adalah histogram dan QQ plot dari u dan v simulasi. Dari QQplot diatas dapat
dilihat bahwa data u dan v dari hasil simulasi berdistribusi uniform (0,1).
24
![Page 26: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/26.jpg)
Konstruksi Copula Bivariat dengan Clayton Copula
Gambar 4.7: CDF u dan v simulasi dengan Clayton Copula
Gambar 4.8: Histogram dari u dan v simulasi
Gambar 4.9: Quantile-Quantile plot dari u dan v simulasi
Uji Keakuratan Model
Dalam sebuah model, salah satu hal penting adalah menguji keakuratan model
pada data riil. Terdapat beberapa metode yang digunakan dalam uji keakuratan
model, diantaranya metode grafik dan metode Uji Cumulative Distribution Function
(CDF test). Berikut uji keakuratan model dengan menggunakan metode grafik.
25
![Page 27: Copula](https://reader034.fdokumen.com/reader034/viewer/2022052219/563dba5f550346aa9aa51159/html5/thumbnails/27.jpg)
Konstruksi Copula Bivariat dengan Clayton Copula
(a) Riil (b) Simulasi (c) Fitting
Gambar 4.10: Plot u dan v simulasi dengan u dan v
Berdasarkan Gambar 4.10 dapat diketahui bahwa model pendekatan dengan
Clayton Copula berparameter a = 3.0255 untuk eror S&P 100 dan S&P 600 belum
cukup akurat, meskipun terdapat beberapa sampel yang mendekati.
Selanjutnya, akan dibahas mengenai Uji Cumulative Distribution Function
(CDF test). Pada CDF test, data observasi berpasangan dapat ditulis (ui, vi), di-
mana P [X ≤ ui, Y ≤ vi] dapat diketahui dari data observasi (empirical joint dis-
tribution). Sementara itu, C(ui, vi) dapat diketahui dari fungsi copula yang dipilih,
yaitu Clayton Copula, dengan parameter yang telah ditaksir sebelumnya, α. Uji
CDF dilakukan dengan membandingkan fungsi distribusi bersama empiris dengan
Copula yang dipilih.
SSD =n∑i=1
(P [X ≤ ui, Y ≤ vi]− C@(ui, vi)
)2(4.10)
Persamaan 4.10 sering disebut sebagai jumlah beda kuadrat (sum of square
difference / SSD). Semakin besar nilai SSD maka semakin besar pula error suatu
Copula dalam menaksir data sebenarnya. Begitupula sebaliknya. Nilai SSD terkecil
memberikan informasi bahwa Copula terebutlah yang paling sesuai memodelkan
data. Berdasarkan perhitungan, diperoleh nilai SSD adalah sebesar 53.1794.
26