Copula

TOPIK DALAM STATISTIKA III

PREDIKSI RETURN SP100 DAN SP600DENGAN CLAYTON COPULA

Isran K Hasan 20113051

Eka Okta Satriani 20113063

Cukri Rahminiani 20113070

Sukono 20114055

PROGRAM STUDI MAGISTER MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT TEKNOLOGI BANDUNG

2014

Bab 1

Pendahuluan

1.1 Latar Belakang

Indeks harga saham merupakan indikator utama yang menggambarkan pergerakan

harga saham dengan memiliki fungsi sebagai indikator tren pasar, indikator tingkat

keuntungan, tolak ukur kinerja fortofolio, serta penentuan strategi pasif dan produk

derivatif.

Peramalan (forecasting) adalah suatu usaha atau kegiatan yang akan terjadi

di masa mendatang mengenai objekobjek tertentu dengan menggunakan judgement,

pengalaman-pengalaman ataupun data historis. Subagyo (1986) menyatakan bahwa

pada dasarnya tidak ada suatu metode peramalan yang paling baik dan selalu cocok

digunakan untuk membuat peramalan dalam berbagai situasi. Untuk menghitung

peramalan ini ada beberapa metode yang digunakan diantaranya metode runtun

waktu (time series).

Peramalan dilakukan untuk mengestimasi suatu perilaku data berdasarkan

analisis dan pengolahan data historis. Data runtun waktu (time series) merupak-

an data yang diamati menurut urutan waktu untuk suatu peubah tertentu. Model

time series yang umum digunakan adalah Autoregressive (AR), Moving Average

(MA) dan kombinasi Autoregressive Moving Average (ARMA) yang mempunyai

asumsi Homoscedasticity (variansi yang homogen). Namun pada kasus data finansi-

al, termasuk data indeks harga saham, memiliki kecenderungan berfluktuasi secara

cepat dari waktu ke waktu sehingga variansi dari error-nya akan selalu berubah

setiap waktu(Heterogen). Ketidakpastian yang dihadapi data indeks harga saham

biasanya mengakibatkan terjadinya pengelompokan volatilitas (volatility clustering)

yaitu berkumpulnya sejumlah error dengan besar yang relatif sama dalam beberapa

1

Prediksi Return S&P100 dan S&P600 dengan Clayton Copula

waktu yang berdekatan.

Volatilitas digunakan untuk menggambarkan fluktuasi dari suatu data, sehing-

ga memungkinkan datanya bersifat heteroskedastisitas. Dalam kasus ini, pemodelan

data time series dengan menggunakan metode AR, MA, ARMA menjadi kurang te-

pat untuk digunakan, maka diperlukan metode lain untuk mengatasi masalah kehe-

terogenan variansi tersebut. Salah satu metode yang dapat digunakan untuk menga-

tasi masalah keheterogenan variansi adalah metode Autoregressive Conditional He-

teroscedasticity (ARCH) yang diperkenalkan Engle pada tahun 1982. Perubahan

variansi pada model ARCH dipengaruhi oleh sejumlah T data acak sebelumnya.

Model tersebut digeneralisasikan oleh Bollerslev pada tahun 1986 untuk mengatasi

orde yang terlalu tinggi pada model ARCH, yang lebih dikenal dengan Generalized

Autoregressive Conditional Heteroscedasticity (GARCH).

Data historis mempunyai keterkaitan terhadap analisis karakteristik dan pola

data. Pola data menggambarkan suatu kecendrungan antar data yang nantinya

dapat digunakan sebagai acuan untuk melakukan suatu peramalan atau prediksi.

Data yang digunakan adalah data harga saham SP100 dan SP600 dari ta-

hun 2000-2014 (Finance.yahoo.com,2014). Data saham dipilih adalah data periode

harian selama 15 tahun terakhir, masing-masing data saham SP100 dan SP600 men-

cakup 3552 data.

1.2 Tujuan

Tujuan-Tujuan dalam tugas besar ini adalah:

1. Mengestimasi parameter dengan menggunakan model time series AR(1) dan

GARCH(1,1).

2. Memodelkan data dengan Kopula Gaussian.

3. Menggabungkan data SP100 dan SP600 yang dimodelkan dengan Kopula Ga-

ussian dengan menggunakan Kopula Clayton.

4. Memprediksi harga saham dengan Kopula Clayton.

2

Bab 2

Model Deret Waktu S&P100 dan

S&P600

2.1 Data Harga Saham S&P100 dan S&P600

Pemodelan untuk data deret waktu membutuhkan asumsi bahwa data hari ini ber-

gantung dari data sebelumnya. ukuran kebergantungan dua variabel diartikan juga

sebagai korelasi. Ukuran korelasi dua variabel yang cukup populer digunakan adalah

koefisien korelasi Pearson. Misalkan Yt menyatakan harga saham saat t, dengan me-

an µY dan variansi σ2Y . Koefisien korelasi (ρ) didefinisikan sebagai ukuran hubungan

linier antara Yt dan Yt+1, dimana:

ρYt,Yt+1 =Cov(Yt, Yt+1)

σ2Yt

(a) Scatter Yt dengan Yt+1 S&P100 (b) Scatter Yt dengan Yt+1 S&P600

Gambar 2.1: Scatter plot antara harga saham Yt dengan Yt−1. Berdasarkan grafik,terdapat hubungan yang erat antara harga saham hari ini dengan hari berikutnya.

Nilai ρ antara 0 sampai 1, semakin mendekati 1 maka nilai korelasi atau hu-

3


bungan kebergantungannya semakin tinggi. Nilai koefisien korelasi dari harga saham

S&P100 saat t dan t+ 1 adalah 0.998 sedangkan korelasi dari harga saham S&P600

saat t dan t+ 1 adalah 0.998 . Selain itu, diagram scatterplot menunjukkan bahwa

data harga saham menggerombol mengikuti garis lurus dengan kemiringan positif.

Dapat disimpulkan bahwa terdapat korelasi positif yang tinggi harga saham hari ini

dengan harga saham hari berikutnya.

Data yang digunakan adalah data harga Saham S&P100 dan S&P600 pada

tanggal 28 Juli 2000 sampai dengan 11 September 2014. Berikut adalah statistika

deskriptif dari kedua data tersebut.

Tabel 2.1: Statistika Deskriptif untuk S&P100 dan S&P600

S&P100 S&P600Mean 592.8091 89.1459

Median 577.4950 82.0850Variansi 11334.084 722.091Skewness 0.503 0.255Kurtosis 3.144 2.898

Berdasarkan Tabel 2.1, dapat diketahui bahwa nilai mean dan median tidak

jauh berbeda. Hal ini berarti, data yang ada cukup simetris. Hal tersebut juga

terlihat pada skewnes dimana skewnes kedua data mendekati 0. Dari kurtosis, dapat

diketahui bahwa nilainya mendekati 3. Dengan demikian, data dapat dikatakan

mendekati distribusi normal. Variansi pada data memberikan informasi bahwa data

cukup jauh menyebar. Hal ini menjadi salah satu penyebab bahwa pengolahan data

menggunakan data harga saham tidak dianjurkan dalam pemodelan time series.

(a) Plot harga saham S&P100 (b) Plot harga saham S&P600

Gambar 2.2: Plot antara harga saham S&P100 dan S&P 600. Berdasarkan gra-fik, dapat diketahui bahwa kedua data tidak menunjukkan kestasioneran mean danvariansi.

Berdasarkan Gambar 2.2, dapat diketahui bahwa data deret waktu pada harga

saham S&P100 dan S&P600 tidak menunjukan gejala stasioner. Dengan demikian,

4


dapat dikatakan bahwa data tersebut tidak memenuhi syarat kestasioneran yang

diperlukan dalam model deret waktu. Indikator lain mengetahui suatu kestasioneran

suatu data adalah dengan mengetahui fungsi autokprelasi. Jika fungsi atukorelasi

menurun secara perlahan, maka dapat dikatakan data tersebut tidak stasioner. Jika

model tersebut cut off pada lag tertentu, dapat dikatakan bahwa data tersebut

stasioner.

Pola ACF pada Gambar 2.3 menunjukkan bahwa nilai ACF menurun secara

perlahan. Artinya, dapat diketahui bahwa data tersebut tidak stasioner. Pengo-

lahan model deret waktu dengan model tersebut tentu akan memberikan taksir-

an model yang jauh dari kondisi sebenarnya. Terdapat beberapa metode untuk

menstasionerkan suatu data, diantaranya return, regresi linier, pendekatan fungsi,

differencing, dsb. Metode yang umum digunakan pada data saham adalah return.

(a) ACF harga saham S&P100 (b) ACF harga saham S&P600

Gambar 2.3: Plot ACF harga saham S&P100 dan S&P 600. Berdasarkan grafik,dapat diketahui bahwa kedua data tidak menunjukkan kestasioneran.

Seiring berjalannya waktu, harga saham cenderung berubah. Perubahan har-

ga saham diiringi dengan perubahan return harga. Hal tersebut mengakibatkan

kecenderungan berubahnya variansi dan volatilitas dari suatu return harga. Return

harga suatu aset dibedakan menjadi dua jenis yaitu return sederhana dan return

majemuk. Dalam hal ini, return yang digunakan adalah return Majemuk.

Return majemuk sering disebut log return. Misalkan Xt adalah return harga

aset.

Xt = log(1 +Rt) = logPtPt−1

= log(Pt) − log(Pt−1)

Misalkan Y1 = 500 dan Y2 = 1000. Dengan demikian, dapat diketahui bahwa

nilai dari r1 = 1. Jika Y1 = 1000 dan Y2 = 500 akan memberikan hasil r1 = −0.5.

Seperti diketahui, jarak antara Y1 dan Y2 adalah sama-sama 500, yang menunjukkan

perbedaan tanda saja. Namun, dengan penggunaan return majemuk, selain mem-

berikan perbedaan tanda, namun memberikan hasil konstanta yang berbeda pula.

5


Berbeda halnya dengan return majemuk. Misalkan Y1 = 500 dan Y2 = 1000.

Dengan demikian, dapat diketahui bahwa nilai dari X1 = 0.693. Jika Y1 = 1000

dan Y2 = 500 akan memberikan hasil X1 = −0.693. Seperti diketahui, jarak antara

Y1 dan Y2 adalah sama-sama 500, dengan return sederhana, log hanya memberikan

perbedaan tanda saja. Hal tersebut sering dikatakan sifat simetris pada return.

Hal tersebut menjadi salah satu alasan pemilihan return majemuk daripada return

sederhana.

(a) Plot Return S&P100 (b) Plot Return S&P600

Gambar 2.4: Plot Return harga saham S&P100 dan S&P600.

Gambar 2.4 memberikan informasi bahwa nilai mean cenderung satsioner. Na-

mun, variansinya dapat dikatakan tidak stasioner. Hal ini menjadi salah satu alasan

memodelkan data dengan konsep GARCH. Salah satu upaya mengetahui kestasio-

neran adalah dengan plot autocorrelation function. Berikut ini adalah ACF dari

return majemuk S&P100 dan S&P 600.

(a) ACF return harga sahamS&P100

(b) ACF return harga sahamS&P600

Gambar 2.5: Plot ACF return harga saham S&P100 dan S&P 600. Berdasarkangrafik, dapat diketahui bahwa kedua data cukup menunjukkan kestasioneran.

6


2.2 Model AR(1)-GARCH(1,1)

Model AR(1)-GARCH(1,1) dapat dituliskan sebagai berikut:

Yt = µ+ α1Yt−1 +Xt (2.1)

dimana Xt = σtεt

σ2t = α0 + β1X

2t−1 + β2σ

2t−1 (2.2)

dengan εt ∼ N(0, 1). Untuk mengestimasi parameter µ dan α1 akan digunakan

metode OLS (ordinary least square). Misalkan nilai yang terobservasi dari t = 2

sampai t = T dan misalkan pula

f(α1, µ) =T∑t=2

(Yt − µ− α1Yt−1)2 (2.3)

untuk meminimalkan f(α1, µ), Perhatikan persamaan ∂f(α1,µ)∂µ

= 0 dan ∂f(α1,µ)∂α1

= 0

sehingga

∂f(α1, µ)

∂µ= −2

T∑t=2

(Yt − µ− α1Yt−1) = 0 (2.4)

dan∂f(α1, µ)

∂µ= −2

T∑t=2

(Yt − µ− α1Yt−1)(Yt−1) = 0 (2.5)

dengan menyelesaikan persamaan (2) dan (3) diperoleh

(T − 1)µ+ α1

T∑t=2

Yt−1 =T∑t=2

Yt

dan

µT∑t=2

Yt−1 + α1

T∑t=2

Y 2t−1 =

T∑t=2

YtYt−1

Atau dapat dituliskan sebagai berikutT∑t=2

Yt

T∑t=2

YtYt−1

=

T − 1T∑t=2

Yt−1

T∑t=2

Yt−1

T∑t=2

(Yt−1)2

(

µ

α1

)

Selanjutnya akan diestimasi parameter α0, β1 dan β2 dengan menggunakan maksi-

mum likelihood (MLE). Perhatikan bahwa Xt memiliki distribusi (bersyarat) normal

dengan E(Xt|Ft−1) =√σtE(ε|Ft−1) = 0 dan V ar(Xt|Ft−1) = σ2

t V ar(ε|Ft−1) = σ2t .

7


Dari sini diperoleh fungsi peluangnya adalah

f(Xt|Xt−1) =1√

2πσ2t

exp

−1

2

(Xt

σt

)2

Selanjutnya akan diestimasi parameter menggunakan metode Maksimum Likelihood

dari fungsi peluang diatas diperoleh fungsi likelihood

L(θ) =n∏t=2

1√(2π(α0 + β1Xt−1 + β2σ2

t−1))exp

−1

2

(Xt

2(α0 + β1Xt−1 + β2σ2t−1)

)2

fungsi log-likehood adalah

`(θ) =1

2

n∑t=2

(log(2π) + log(α0 + β1Xt−1 + β2σ

2t−1) +

X2t

α0 + β1Xt−1 + β2σ2t−1

)

untuk memperoleh nilai estimasi (α0), (α1), dan (β1) diperoleh dengan memaksi-

mumkan fungsi log likelihood dengan cara mencari turunan parsial terhadap para-

meternya, yaitu:

∂(`(θ))

α0

= 0,∂(`(θ))

β1

= 0,∂(`(θ))

β2

= 0

Sehingga diperoleh

∂(`(θ))

α0

= −1

2

n∑t=2

(1

α0 + β1Xt−1 + β2σ2t−1

− X2t

α0 + β1Xt−1 + β2σ2t−1

)= −1

2

n∑t=2

(α0 + β1Xt−1 + β2σ

2t−1 −X2

t

α0 + β1Xt−1 + β2σ2t−1

)

∂(`(θ))

β1

= −1

2

n∑t=2

(r2t−1

α0 + β1Xt−1 + β2σ2t−1

−X2tX

2t−1

α0 + β1Xt−1 + (β2σ2t−1)2

)= −1

2

n∑t=2

(α0X

2t−1 + β1X

4t−1 + β2σ

2t−1X

2t−1 −X2

tX2t−1

α0 + β1Xt−1 + (β2σ2t−1)2

)

∂(`(θ))

β1

= −1

2

n∑t=2

(σ2t−1

α0 + β1Xt−1 + β2σ2t−1

−X2tX

2t−1

α0 + β1Xt−1 + (β2σ2t−1)2

)= −1

2

n∑t=2

(α0σ

2t−1 + β1X

2t−1σ

2t−1 + β2σ

4t−1 −X2

t σ2t−1

α0 + β1Xt−1 + (β2σ2t−1)2

)

8


Untuk memaksimumkan fungsi log likelihoodnya akan digunakan perhitungan de-

ngan menggunakan program MATLAB

2.3 Penerapan Model pada data S&P100 dan S&P600

Pada tugas ini, data yang akan digunakan adalah data saham S&P100 dan S&P600

dari tanggal 28 juli 2000 sampai 11 september 2014. Data saham tersebut diolah

dengan menggunakan software MATLAB. Selanjutnya dengan menerapkan model

ini pada data S&P100 dan S&P600 diperoleh estimasi parameter sebagai berikut:

S&P100 S&P600µ 0.000038680049795 1.174097488765628× 10−4

α1 -0.093657943546480 -0.021541387640377α0 2× 10−6 1.630484378274826× 10−5

β1 0.886791561211049 0.843039248484122β2 0.097704530705975 0.156958751515878

Tabel 2.2: estimasi parameter data saham S&P100 dan S&P600

Selanjutnya, dari persamaan (1) diperoleh

εt =Yt − µ− α1Yt−1

α0 + β1X2t−1 + β2σ2

t−1

(2.6)

Dari persamaan error diatas dapat dihitung dilihat masing-masing statistik desk-

riptif dari error untuk S&P100 dan S&P600 sebagai berikut:

Tabel 2.3: Tabel Statistik Deskriptif Error

ERROR S&P100 ERROR S&P600Statistic Value Statistic Value

SampleSize 3552 SampleSize 3552Range 33.856 Range 81.464Mean -6.46E-05 Mean -0.00245

Variance 4.4616 Variance 3.5223Std.Deviation 2.1122 Std.Deviation 1.8768

Coef.ofVariation -32697 Coef.ofVariation -766.92Std.Error 0.03544 Std.Error 0.03149Skewness -0.63063 Skewness -17.518

ExcessKurtosis 8.4834 ExcessKurtosis 686.36

Dari sini terlihat bahwa data tersebut berdistribusi student t. Selanjutnya akan

dilihat dengan menggunakan menggunakan ACF dapat dilihat apakah eror dari

data tersebut tidak berkorelasi. Perhatikan gambar berikut:

9


(a) S&P100 (b) S&P600

Gambar 2.6: Fitting histogram S&P100 dan S&P600 dengan distribusi normal dant.

(a) Normal PP Return S&P100(b) Normal PP Return ReturnS&P600

Gambar 2.7: Normal PP Return S&P100 dan S&P600.

(a) Fungsi Autokorelasi error daridata S&P100

(b) Fungsi Autokorelasi error daridata S&P600

Gambar 2.8: Fungsi Autokorelasi error dari data S&P100 dan S&P600.

Dari gambar diatas dapat dilihat bahwa eror dari kedua data tidak menempel

pada garis merah sehingga dapat disimpulkan bahwa eror dari kedua data tidak ber-

distribusi normal. terlihat juga dari plot bahwa eror dari kedua data tersebut tidak

berkorelasi karena autokorelasi dari semua lagnya berada dibawah batas signifikansi.

Selain menggunakan plot ACF, kebebasan dari error juga dapat diketahui de-

ngan residual plot.

10

Model Distribusi Eror dengan Copula

(a) S&P 100 (b) S&P 600

Gambar 2.9: Plot Residual dari data S&P100 dan S&P600.

Berdasarkan Gambar 2.9, dapat diketahui bahwa error kedua data tidak ber-

korelasi. Hal tersebut dikarenakan tidak ada pola grafik.

Selanjutnya, akan dilihat apakah model AR(1)-GARCH (1,1) dapat merepre-

sentasikan kedua data return dengan membandingkan data return dan data yang

diperoleh dari hasil estimasi sehingga diperoleh

(a) Plot Hasil Model untuk dataS&P100

(b) Plot Hasil Model untuk dataS&P600

Gambar 2.10: Plot Hasil Model untuk data S&P100 dan S&P600.

Dari gambar ini terlihat bahwa model AR(1)-GARCH(1,1) cukup merepresentasikan

kedua data return.

11

Bab 3

Model Distribusi Eror dengan

Copula

3.1 Distribusi Error S&P 100 dan S&P 600

Copula merupakan distribusi yang digunakan untuk mengkonstruksi beberapa dis-

tribusi yang saling bergantung. Informasi distribusi marginal dari distribusi tersebut

diperlukan dalam proses konstruksi. Copula sangat sensitif terhadap distribusi mar-

ginal tersebut. Oleh karena itu, penentuan distribusi marginal yang akurat sangat

diperlukan agar hasil konstruksi distribusi tepat.

Salah satu metode untuk menentukan parameter distribusi adalah dengan me-

lihat histogram dari suatu sampel acak. Histogram tersebut diharapkan mampu

memberikan informasi mengenai distribui yang tepat digunakan untuk pendekatan

sampel. Berikut adalah histogram dan pendekatan distribusi yang dianggap sesuai.

Berdasarkan 3.1, dapat diketahui bahwa gambar cukup simetris. Oleh karena

itu, distribusi yang dianggap tepat adalah distribusi normal dan t. Informasi menge-

nai kelancipan pada gambar tersebut sudah cukup jelas mengarahkan pada distribusi

t. Berikut adalah estimasi parameter distribusi sampel acak dengan menggunakan

distribusi t.

Tabel 3.1: Estimasi parameter error S&P100 dan S&P600

Distribusi t S&P100 S&P600µ 7.25355 ×10−2 5.43921 ×10−2

σ 1.04946 1.01296ν 1.89475 3.70339

Parameter tersebut dapat diuji keakuratannya dengan metode ’kuadrat error’.

12


(a) S&P 100

(b) S&P 600

Gambar 3.1: Pendekatan distribusi sampel error S&P 100 dan S&P 600.

Langkah pertama penggunaan metode ’kuadrat error’ adalah dengan menghitung

fungsi kumulatif F empirik dari sampel, Fem(x) = #data≤xn

. Selanjutnya, menghi-

tung fungsi kumulatif F berdasarkan parameter yang ditentukan Fθ,t(x). Dengan

mengetahui sampel tersebut, dapat diperoleh

KS(xt) =n∑t=1

(Fθ,t(xt)− Fem(xt))2

Selanjutnya akan diperoleh Hdata = KS(x)n

.

Dengan cara serupa, dapat dibangkitkan data secara berulang-ulang (Simulasi

Monte Carlo) sesuai dengan distribusi dan parameter yang telah diestimasi sebelum-

nya sehingga diperoleh Fem(x), Fθ,t(x), KS(x) dan Hsimulasi. Berikut adalah Hdata

untuk error S&P100 dan S&P600.

Tabel 3.2: Hdata S&P100 dan S&P600

Error S&P100 S&P600Hdata 2.0581 ×10−4 1.1340 ×10−4

13


Berdasarkan nilai Hsimulasi untuk error S&P 100 dan S&P 600, secara berurut-

an Hdata berada pada kuantil 0.713 dan 0.486. Dengan demikian, dapat disimpulkan

bahwa model sudah cukup akurat menggambarkan distribusi sampel dan dapat dip-

roses lebih lanjut dengan konsep Copula.

Berikut adalah histogram dari Hsimulasi untuk S&P100 dan S&P600.

(a) S&P 100 (b) S&P 600

Gambar 3.2: Histogram untuk H pada error S&P 100 dan S&P 600.

3.2 Fungsi Marginal dengan Gaussian Copula

Distribusi marginal error pada subbab sebelumnya memberikan informasi penting

dalam penerapan Copula pada error return harga saham. Dalam pembahasan pada

bab ini error dari S&P 100 disimbolkan dengan ε dan error dari S&P 600 disimbolkan

dengan δ.

S&P100⇒ ε1, ε2, ..., εT

S&P600⇒ δ1, δ2, ..., δT

Pada subbab sebelumnya, telah diketahui bahwa distribusi dari ε dan δ adalah

distribusi t. Dengan informasi tersebut akan dicari distribusi dari F (εt|Ωt−1) dan

F (δt|Ωt−1).

F (εt|Ωt−1) =

∂t−1

∂u1 ... ∂ut−1CΛ(u1, ..., ut)

cΛ(u1, ..., ut−1)(3.1)

dengan

14


∂t−1

∂u1 ... ∂ut−1

CΛ(u1, ..., ut) =

∫ Φ−1(ut)

∞cΛ(Φ−1(u1), ..., Φ−1(ut−1), st)d st

× 1

φ(Φ−1(u1))× ...× 1

φ(Φ−1(ut−1))(3.2)

dan

cΛ(u1, ..., ut−1) = |Λ|−0.5e−0.5(Φ−1(u1)...Φ−1(ut−1))(Λ−1−I)(Φ−1(u1)...Φ−1(ut−1))′ (3.3)

sedangkan uj = F (εj). Dengan mensubtitusikan persamaan 3.2 dan 3.3 ke persa-

maan 3.1 diperoleh

F (εt|Ωt−1) =

∫ Φ−1(ut)

−∞

f(Φ−1(u1), ..., Φ−1(ut−1), st)

f(Φ−1(u1), ...,Φ−1(ut−1))d st (3.4)

Dengan persamaan diatas dapat diperoleh

X = u1, ..., uT

Y = v1, ..., vT

dengan uT adalah F (εt|Ωt−1).

3.2.1 Penerapan Gaussian Copula pada data error

Berikut adalah Algoritma sederhana untuk memperoleh F (εt|Ωt−1)

1. Memanggil data error dari S&P100 dan S&P600

2. Fitting distribusi dengan t, diperoleh µ, σ, ν

3. Standarisasi error Kt = εt−µσ

4. Mencari CDF dari dengan distribusi t, dengan derajat kebebasan ν dan selan-

jutnya disimbolkan dengan W

5. Mencari Z, dimana Z = Φ−1(W )

15


6. Mencari parameter h dan matrix Λ

Λ(p, q) = h exp(−(p− q)2

2h)

dengan dekomposisi cholesky diperoleh Λ = LL′

7. Mencari matrik loglikelihood

L(θ) = −1

2V ′V +

1

2Z ′Z + (−1

2ln(|Λ|) +

n∑i=1

lnFi(xi))

dengan V = L−1Z

8. Mencari u, dengan h yang memaksimumkan likelihood untuk S&P 100 dan

S&P600, berturut-turut yaitu 0.43 dan 0.48

F (εt|Ωt−1) =

∂t−1

∂u1 ... ∂ut−1CΛ(u1, ..., ut)

cΛ(u1, ..., ut−1)

Algoritma hasil diatas, memberikan hasil sebagai berikut:

(a) S&P 100 (b) S&P 600

Gambar 3.3: Z S&P 100 dan S&P 600.

Gambar 3.3 memberikan informasi bahwa grafik cepat turun ke nilai 0 (mean rever-

sion) dengan demikian nilai h kurang dari 1. Dari kondisi tersebut, dapat ditentukan

bahwa nilai h berada pada selang 0 < h < 1. Dengan memaksimumkan fungsi log

likelihood, diperoleh h. Berikut adalah grafik hubungan antara h dengan nilai log

likelihoodnya.

Berdasarkan Gambar 3.4, dapat diketahui bahwa nilai dari h berturut-turut

untuk S&P 100 dan S&P 600 adalah 0.433 dan 0.484. Hal tersebut wajar karena

grafik error cepat menuju 0 atau mean reversion.

16


(a) S&P 100 (b) S&P 600

Gambar 3.4: h S&P 100 dan S&P 600.

Berikut adalah grafik dan histogram u dan v. Berdasarkan Grafik 3.5, dapat

diketahui bahwa u dan v berdistribusi uniform (0,1). Setelah memperoleh u dan v,

selanjutnya akan ditentukan Copula banding untuk menggabungkan kedua peubah

acak dari u dan v.

(a) S&P 100 (b) S&P 600

Gambar 3.5: Histogram u dan u S&P 100 dan S&P 600

Seharusnya, distribusi dari X dan Y adalah Uniform (0,1). Gambar 3.5 mem-

berikan informasi bahwa distribusi yang sesuai untuk X dan Y adalah uniform(0,1),

meskipun terdapat sedikit anomali di nilai kecil yang mendekati nol dan nilai besar

yang mendekati 1. Salah satu uji keseragaman yang digunakan adalah QQ plot.

Selain menggunakan QQ-plot, dengan konsep KS yang telah dijelaskan sebe-

lumnya, diperoleh nilai KS pada data berada di luar selang data bangkitan. Nilai H

yang diperoleh adalah Hdata = 0.2265 sedangkan Hsimulasi = [1.3010−5, 1.3510−3]

17

Konstruksi Copula Bivariat dengan Clayton Copula

(a) S&P 100 (b) S&P 600

Gambar 3.6: Quantile-Quantile Plot u dan v

Berdasarkan Gambar 3.6, dapat diketahui bahwa data sudah menunjukan ke-

seragaman, namun terdapat sedikit anomali di ekor atas dan bawah. Namun, hal

tersebut dirasa tidak signifikan mempengaruhi sifat seragam data.

18

Bab 4

Konstruksi Copula Bivariat

dengan Clayton Copula

Salah satu metode untuk mengkonstruksi dua distribusi adalah Copula. Copula

memiliki keistimewaan untuk menggabungkan dua distribusi yang tidak identik.

Copula dapat menggabungkan dua distribusi berbeda yang tidak saling bebas mes-

kipun tidak diketahui jenis hubungan diantara dua kerugian acak tersebut. Pada

dasarnya, Copula merupakan distribusi multivariat dengan marginal Uniform [0, 1]

yang berfungsi untuk menggabungkan dua fungsi distribusi dari dua kerugian acak.

4.1 Karakteristik Clayton Copula

Terdapat beberapa metode untuk mengkonstruksi Copula bivariat. Salah satu me-

tode yang umum digunakan adalah pendekatan Archimedean. Copula yang dikon-

struksi dengan metode ini disebut Archimedean Copula. Dengan φ(t) adalah fungsi

generator. Archimedean Copula didefinisikan sebagai (Nelsen 2006):

C(u, v) = φ−1[φ(u) + φ(v)] ∀ u, v ∈ [0, 1]

Pada kelas Archimedean, terdapat beberapa jenis Copula 1 parameter dengan spe-

sifikasi masing-masing. Beberapa diantaranya adalah Clayton Copula. Clayton

Copula memiliki fungsi generator sebagai berikut:

φ(t) =t−α

α(4.1)

19


Salah satu hal penting dalam fungsi generator adalah invers dan turunan dari fungsi

generator tersebut. Invers dan turunan dari fungsi generator salah satunya berguna

untuk menentukan penaksir parameter. Fungsi invers dan turunan pertama terha-

dap t untuk persamaan 4.1 adalah sebagai berikut.

φ−1(t) = (tα + 1)1α (4.2)

φ′(t) = −t−(α+1) (4.3)

Untuk mengetahui distribusi gabungan dari dua peubah acak, dapat diketahui da-

ri fungsi distribusi Copula. Fungsi distribusi kumulatif fungsi distribusi peluang

Clayton Copula adalah sebagai berikut:

C(u, v) = φ−1[φ(u) + φ(v)]

= φ−1(u−α−1α

+ v−α−1α

)C(u, v) = (u−α + v−α − 1)−

1α (4.4)

Berikut adalah grafik untuk fungsi distribusi cumulatif Clayton Copula. Berdasark-

an Gambar 4.1, dapat diketahui bahwa semakin besar nilai parameter α, nilai cdf

semakin membesar, meskipun hal ini tidak begitu tampak secara signifikan.

(a) α = 0 (b) α = 0.5 (c) α = 1

(d) α = 5 (e) α = 10 (f) α = 20

Gambar 4.1: Distribusi Kumulatif Clayton Copula

Dari persamaan 4.4, didapat turunan pertama terhadap u dan v yang merupakan

20


densitas dari Copula tersebut.

c(u, v) =

(1 +

1

a

)(uv)−1− 1

a (u−1a + v−

1a − 1)−a−2

(a) α = 0 (b) α = 0.5 (c) α = 1

(d) α = 5 (e) α = 10 (f) α = 20

Gambar 4.2: Fungsi Kepadatan Peluang Clayton Copula

(a) α = 0 (b) α = 0.5 (c) α = 1

(d) α = 5 (e) α = 10 (f) α = 20

Gambar 4.3: Scatterplot Clayton Copula

Gambar 4.2 dan 4.3 memberi informasi bahwa semakin besar nilai α, titik

semakin tebal berada pada daerah sekitar u dan v. Selain itu, nilai juga menumpuk

pada daerah sekitar u = 0 dan v = 0. Dengan informasi ini, dapat dikatakan

21


bahwa Copula tipe clayton bagus digunakan untuk dua distribusi yang memeiliki

kebergantungan di ekor bawah.

4.2 Penaksir Parameter pada Clayton Copula

Penaksir parameter distribusi Copula dapat ditaksir dengan menggunkan konsep

Kendall’s Tau. Kendall’s Tau merupakan salah satu ukuran asosiasi yang popu-

ler digunakan untuk mengukur asosiasi bertipe linear ataupun non-linear. Konsep

Ukuran asosiasi Kendall’s Tau erat kaitannya dengan konsep Concordance dan di-

scordance.

Misal (X, Y ) menyatakan peubah acak kontinu dari marginal eror S&P 100

dan S&P 600, sedangkan (ui, vi) dan (uj, vj) adalah dua observasi yang berbeda

dari (X, Y ).

• (ui, vi) dan (uj, vj) dikatakan concordant jika

(ui − uj) (vi − vj) > 0

Hal ini terjadi jika ui < uj dan vi < vj atau ui > uj dan vi > vj.

• (ui, vi) dan (uj, vj) dikatakan discordant jika

(ui − uj) (vi − vj) < 0

Hal ini terjadi jika ui < uj dan vi > vj atau ui > uj dan vi < vj.

Gambar 4.4: Ilustrasi concordant dan discordant pada dua peubah acak.

Kendall’s Tau pada sampel dapat didefinisikan sebagai peluang concordance

dikurangi peluang discordance:

τ = τX,Y = P [(Xi −Xj)(Yi − Yj) > 0]− P [(Xi −Xj)(Yi − Yj) < 0] (4.5)

22


Misal (u1, v1), (u2, v2), ... , (un, vn) adalah sampel acak dari (X, Y ) , maka terdapat

nC2 pasang observasi (ui, vi) dan (uj, vj) yang berbeda. Jika banyak pasangan yang

concordant dinyatakan dengan c dan pasangan yang discordant dinyatakan dengan

d, maka Kendall’s Tau sampel adalah

τ =c− dnC2

, −1 ≤ τ ≤ 1 (4.6)

Dalam bentuk Copula, ukuran asosiasi Kendall’s Tau adalah sebagai berikut (Nel-

sen. 2006):

τX,Y = P [(X1 − X2)(Y1 − Y2) > 0]− P [(X1 − X2)(Y1 − Y2) < 0] (4.7)

Untuk kelas Archimedean Copula, persamaan ukuran asosiasi Kendall’s Tau dapat

dinyatakan sebagai berikut(Nelsen, 2006):

τC = 1 +

∫ 1

0

φ(t)

φ′(t)dt (4.8)

Persamaan 4.8 jika dikombinasikan dengan persamaan 4.2 dan 4.3 dapat diperoleh

persamaan Kendall’s tau pada Clayton Copula.

τC = 1 +

∫ 1

0

φ(t)

φ′(t)dt = 1 +

∫ 1

0

t−α− 1α

−t−(α+1)dt

= 1 +4

α

(1

α + 2− 1

2

)τC =

α

α + 2(4.9)

4.3 Aplikasi Clayton Copula pada data marginal

Error S&P 100 dan S&P 600

Pada Bab 3, telah diketahui distribusi marginal bersyarat dari Error S&P 100 dan

S&P 600 menggunakan konsep Gaussian Copula. Dicurigai, distribusi marginal ber-

syarat dari Error S&P 100 dan S&P 600 saling memiliki kebergantungan. Oleh ka-

rena itu, untuk memprediksi nilai harga saham di masa mendatang, dapat diketahui

melalui konsep Copula bivariat, yang mampu mengakomodir nilai kebergantungan

diantara dua peubah acak tersebut.

Langkah awal untuk mengetahui Copula yang sesuai adalah dengan melihat

23


scatterplot dari kedua marginal error tersebut.

Gambar 4.5: Scatter fungsi marginal bersyarat error S&P 100 dan S&P 600

Berdasarkan Gambar 4.5 dan 4.3, dapat diketahui bahwa Copula tipe Clayton

sebenarnya tidak begitu sesuai digunakan untuk kedua peuabah acak tersebut. Hal

ini karena, untuk kondisi ekor atas, atau saat fungsi marginal kedua peuabah acak

mendekati satu, tidak bisa didekati oleh Copula Clayton. Meskipun demikian, akan

diketahui sejauh mana keakuratan penggunaan model Clayton Copula pada data.

Langkah lanjut untuk mengkonstruksi distribusi dengan menggunakan Cla-

yton Copula adalah mengetahui nilai Kendall’s Tau dan parameternya. Berdasarkan

persamaan 4.6 nilai Kendall’s tau yang diperoleh adalah 0.6020. Berdasarkan per-

samaan 4.9 dan penerapan konsep pada aljabar, dapat diketahui bahwa α = 2τ1−τ .

Dengan demikian, α = 20.60201−0.6020

,= 3.0255.

(a) n = 380 (b) n = 2000

Gambar 4.6: Plot u dan v simulasi dengan basis Clayton Copula

Pada dasarnya, distribusi u dan v simulasi berdistribusi uniform(0,1). Berikut

adalah histogram dan QQ plot dari u dan v simulasi. Dari QQplot diatas dapat

dilihat bahwa data u dan v dari hasil simulasi berdistribusi uniform (0,1).

24


Gambar 4.7: CDF u dan v simulasi dengan Clayton Copula

Gambar 4.8: Histogram dari u dan v simulasi

Gambar 4.9: Quantile-Quantile plot dari u dan v simulasi

Uji Keakuratan Model

Dalam sebuah model, salah satu hal penting adalah menguji keakuratan model

pada data riil. Terdapat beberapa metode yang digunakan dalam uji keakuratan

model, diantaranya metode grafik dan metode Uji Cumulative Distribution Function

(CDF test). Berikut uji keakuratan model dengan menggunakan metode grafik.

25


(a) Riil (b) Simulasi (c) Fitting

Gambar 4.10: Plot u dan v simulasi dengan u dan v

Berdasarkan Gambar 4.10 dapat diketahui bahwa model pendekatan dengan

Clayton Copula berparameter a = 3.0255 untuk eror S&P 100 dan S&P 600 belum

cukup akurat, meskipun terdapat beberapa sampel yang mendekati.

Selanjutnya, akan dibahas mengenai Uji Cumulative Distribution Function

(CDF test). Pada CDF test, data observasi berpasangan dapat ditulis (ui, vi), di-

mana P [X ≤ ui, Y ≤ vi] dapat diketahui dari data observasi (empirical joint dis-

tribution). Sementara itu, C(ui, vi) dapat diketahui dari fungsi copula yang dipilih,

yaitu Clayton Copula, dengan parameter yang telah ditaksir sebelumnya, α. Uji

CDF dilakukan dengan membandingkan fungsi distribusi bersama empiris dengan

Copula yang dipilih.

SSD =n∑i=1

(P [X ≤ ui, Y ≤ vi]− C@(ui, vi)

)2(4.10)

Persamaan 4.10 sering disebut sebagai jumlah beda kuadrat (sum of square

difference / SSD). Semakin besar nilai SSD maka semakin besar pula error suatu

Copula dalam menaksir data sebenarnya. Begitupula sebaliknya. Nilai SSD terkecil

memberikan informasi bahwa Copula terebutlah yang paling sesuai memodelkan

data. Berdasarkan perhitungan, diperoleh nilai SSD adalah sebesar 53.1794.

26

Copula

Documents

Transcript of Copula