Copula.pdf
-
Upload
nenaibrahim -
Category
Documents
-
view
33 -
download
1
description
Transcript of Copula.pdf
-
1 Pendahuluan
Salah satu sifat dari peubah acak adalah memiliki fungsi distribusi. Fungsi dis-
tribusi dengan satu peubah acak disebut fungsi distribusi univariat. Sedangkan untuk
lebih dari satu peubah acak disebut fungsi distribusi multivariat. Analisis data un-
tuk kasus distribusi multivariat biasanya diasumsikan masing - masing marginalnya
berasal dari keluarga distribusi yang sama. Namun, dalam prakteknya seringkali
data - data observasi tidak semuanya memiliki distribusi yang sama. Sehingga jika
menganalisis data-data observasi memiliki distribusi berbeda seringkali dipaksakan
agar memiliki distribusi yang sama akibatnya analisis data yang diperoleh seingkali
tidak akurat. Salah satu cara yang digunakan untuk mengatasi masalah tersebut
yaitu pendekatan copula.
2 Konsep Copula
Pada Bagian ini dibahas mengenai Copula 2-dimensi (atau selanjutnya hanya
disebut Copula saja), teorema Sklar dan Copula Archimedean. Copula adalah se-
buah fungsi yang menggabungkan sebuah fungsi distribusi multivariat ke fungsi dis-
tribusi marginalnya yang berdimensi satu (Nelsen, 1999). Kata Copula pertama kali
diperkenalkan oleh Sklar(1959) pada teorema yang menggunakan namanya. Copula
merupakan pemodelan distribusi bersama yang memiliki beberapa keunggulan yaitu
marginal - marginal tidak harus dari distribusi yang sama dan dapat menangkap
tail dependence diantara masing - masing variabel. Selain itu, Copula merupakan
alat untuk memodelkan kebergantungan dari beberapa peubah acak. Sebelum mem-
bahas mengenai Copula lebih lanjut, pertama-tama akan dibahas beberapa definisi
yang berhubungan dengan Copula.
Definisi 2.1 (Persegi). Persegi atau interval di R2 adalah perkalian silang (cartesianproduct) dari 2 interval tertutup dalam bentuk
B = [x1, x2] [y1, y2]
titik - titik ujung dari persegi B adalah (x1, y1), (x2, y1), (x1, y2), (x2, y2)
Definisi 2.2 (Volume-H). Misalkan S1 dan S2 subset tak kosong dari R dan misalkanH:R2 R dengan DomH = S1 S2. Misalkan B = [x1, x2] [y1, y2] adalah persegidimana B DomH. Maka Volume-H dari B diberikan oleh
VH(B) = H(x2, y2)H(x2, y1)H(x1, y2) +H(x1, y1)
1
-
Misalkan jika kita definisikan turunan orde pertama dari fungsi H pada persegi B
yaitu:
x2x1H(x, y) = H(x2, y)H(x1, y)
y2y1H(x, y) = H(x, y2)H(x, y1)
maka volumeH dari persegi B adalah beda orde kedua dari fungsi H pada persegiB, dapat ditulis:
VH(B) = x2x1
y2y1H(x, y)
Definisi 2.3 (Fungsi 2 increasing). Misalkan H adalah fungsi bernilai real. Hdikatakan 2 increasing jika VH(B) 0 untuk semua persegi B di R2 dimana titikujung dari B ada di DomH.
Sebagai contoh misalkan H adalah fungsi yang terdefinisi pada I2 oleh H(x, y) =
max(x, y). Perhatikan gambar dibawah ini:
Dari gambar diatas dapat dilihat bahwa H adalah fungsi monoton tidak turun
Gambar 1: H(x, y) = max(x, y)
pada x dan y. Tetapi, H(x, y) bukan fungsi 2-increasing karena VH(I2) = H(1, 1)
H(1, 0)H(0, 1) +H(0, 0) = 1.Definisi 2.4 (Fungsi grounded). Misalkan S1, S2 merupakan subset tak kosong dari
R dan H:R2 R dengan DomH = S1 S2. Jika S1, S2 memiliki elemen terkecimasing-masing a, b maka H dikatakan fungsi grounded jika H(a, y) = H(x, b) =
0, (x, y) S1 S2Sebagai contoh misalkan H(x, y) adalah fungsi dengan [1, 1] [0,] diberikan
oleh
H(x, y) =(x+ 1)(ey 1)x+ 2ey 1
2
-
maka H(x, y) merupakan fungsi grounded karena H(x, 0) = 0 dan H(1, y) = 0.
Definisi 2.5 (Copula Bivariat). Copula bivariat adalah suatu fungsi distribusi bi-
variat C yang memetakan [0, 1]2 ke [0, 1]yang memenuhi sifat berikut:
1. C adalah fungsi 2-increasing
2. C adalah fungsi grounded
3. C(u, 1) = u dan C(1, v) = v u, v [0, 1]
Dari definisi diatas dapat dilihat bahwa Copula juga merupakan fungsi distribusi
bivariat dengan daerah asalnya adalah [0, 1]2. Setelah melihat definisi Copula, se-
lanjutnya akan dijelaskan mengenai Teorema Sklar yang menjadi dasar dari teori
Copula. Teorema Sklar menjelaskan peran dari Copula dalam menghubungkan an-
tara fungsi distribusi bivariat dan marginal dari masing-masing.
Teorema 2.1 (Teorema Sklar). Misalkan X dan Y adalah dua peubah acak dengan
fungsi distribusi FX dan GY . Misalkan HX,Y adalah fungsi distribusi bivariat untuk
X dan y maka terdapat suatu Copula C yang unik sedemikian sehingga
HX,Y (x, y) = C(FX(x), GY (x))
Sebaliknya, jika C adalah suatu Copula dan FX dan GY adalah fungsi distribusi maka
HX,Y adalah fungsi distribusi bivariat dengan marginal FX dan GY
Teorema Sklar menunjukkan pentingnya copula dalam pemodelan distribusi bi-
variat. Terdapat dua hal penting dalam teorema Sklar. Pertama, copula dapat
diperoleh dari setiap fungsi distribusi bersama. Kedua, copula dapat dikombinasikan
dengan setiap distribusi marginal F dan G untuk memperoleh fungsi distribusi bi-
variat.
3 Copula Archimedean
Pada bagian ini kita akan membahas mengenai salah satu cara dalam mengkon-
struksi copula. Misalkan H(x, y)adalah fungsi distribusi bivariat dengan marginal F
dan G maka terdapat fungsi sedemikian sehingga
(H(x, y)) = (F (x)) + (G(y))
atau untuk copula dapat ditulis
(C(u, v)) = (u) + (v)
3
-
Copula dengan bentuk diatas disebut Copula Archimedean (archimedean Copula).
Dari sini suatu Copula bisa dikonstruksi dengan menyelesaikan bentuk diatas yaitu
dengan mencari invers dari fungsi atau 1 sehingga diperoleh
C(u, v) = 1((u) + (v))
Setiap fungsi kontinu dan memenuhi (1) = 0, (u) < 0 dan (u) > 0. Se-lanjutnya fungsi disebut fungsi generator. Jika (0) = maka fungsi disebutfungsi generator kuat (strictly generator) dan C(u, v) = 1((u) + (v)) disebutCopula Archimedean Kuat (Strictly Archimdean Copula). Nelsen (2006) memberikan
beberapa contoh dari archimedean copula.
1. Independent Copula
Fungsi generatornya yang digunakan adalah (t) = lnt, dari sini diperolehfungsi inversnya yaitu 1 = et sehingga diperoleh independent copula se-bagai berikut;
C(u, v) = 1((u) + (v))
= eln(u)+ln(v) = uv
2. Clayton Copula
Fungsi generatornya yang digunakan adalah (t) = t1 , dari sini diperoleh
fungsi inversnya yaitu 1 = (t + 1)1 sehingga diperoleh Clayton Copula
sebagai berikut;
C(u, v) = 1((u) + (v))
= (u + v 1) 1
3. Gumbel Copula Fungsi Generator yang digunakan adalah (t) = (lnt),dari sini dipeoleh fungsi inversnya adalah 1 = exp(t 1 sehingga diperolehGumbel Coula sebagai berikut;
C(u, v) = 1((u) + (v))
= exp(((lnu) + (lnv)) 1 )
4
-
4 Copula Multivariat
Pada bagian ini akan dibahas mengenai perluasan dari Copula Bivariat yaitu
Copula Multivariat. pada bagian ini juga akan dibahas kembali definisi mengenai
Copula dalam kasus multivariat. Sebelum membahas mengenai Copula Multivariat
lebih lanjut, pertama-tama akan dibahas beberapa definisi yang berhubungan dengan
Copula multivariat.
Definisi 4.1 (m box). m box di Rn adalah perkalian silang (cartesian product)dari m interval tertutup dalam bentuk
B = [a1, b1] [a2, b2] [an, bn]
Definisi 4.2 (Volume-H). Misalkan S1, S2,... ,Sn subset tak kosong dari R danmisalkan H:Rn R dengan DomH = S1S2 ...Sn. Misalkan B adalah n boxdimana B DomH. Maka volume-H dari B diberikan oleh
VH(B) = baH(t) =
bnan
bn1an1 ...
b2a2
b1a1H(t)
Dimana
bkakH(t) = H(t1, .., tk1, bk, tk+1, .., tn)H(t1, .., tk1, ak, tk+1, .., tn)
Sebagai contoh, Misalkan H adalah fungsi berdimensi 3 dengan domain R3 danB adalah 3 box [x1, x2] [y1, y2] [z1, z2]. Maka volume-H dari B adalah
VH(B) = H(x2, y2, z2)H(x2, y2, z1)H(x2, y1, z2)H(x1, y2, z2)+H(x2, y1, z1) +H(x1, y2, z1) +H(x1, y1, z2)+H(x1, y1, z1)
Definisi 4.3 (Fungsi m increasing). Misalkan H adalah fungsi bernilai real. Hdikatakan m increasing jika VH(B) 0 untuk semua persegi B di Rm dimana titikujung dari B ada di DomH.
Definisi 4.4 (Copula Multivariat). Copula C berdimensi-m (m-dimensional copula)
adalah fungsi C: [0, 1]m [0, 1] yang memenuhi sifat-sifat:1. C(1,1,...,1,an,1,...,1)=an untuk setiap n m dan n [0, 1]2. C(a1, ..., am)=0 jika an = 0 untuk setiap n m3. Copula C bersifat m increasing
5
-
Sifat 1 menyatakan bahwa jika terdapat m 1 peubah acak yang mempunyaipeluang marginal sama dengan satu maka fungsi distribusi bersama m peubah acak
sama dengan peubah acak sisanya yang tidak diketahui peluang marginalnya.
Sifat 2 menyatakan bahwa fungsi distribusi dari m peubah acak sama dengan
nol, jika sembarang peubah acak memiliki peluang marginalnya sama dengan nol.
Sifat 2 juga sering disebut sifat grounded (Grounded Properties).
Sifat 3 identik dengan sifat monoton naik untuk m dimensi.
5 Teorema Sklar Untuk Multivariat
Teorema sklar merupakan dasar dari pemodelan fungsi distribusi multivariat de-
ngan model copula. Teorema Sklar menjelaskan bahwa terdapat copula yang bisa
menghubungkan fungsi distribusi multivariat dan marginal univariatnya.
Teorema 5.1. Misalkan F adalah fungsi distribusi multivariat dengan marginals
F1, F2, ..., Fm . Kemudian terdapat suatu Copula C sedemikian sehingga :
F (x1, x2, ..., xm) = C(F (x1), F (x2), ..., F (xm)) (1)
xi R, i = 1, 2, ...,m. Jika Fi kontinu i = 1, 2, ...,m, maka C unik; jika tidak, Cunik dalam RanF1 ... RanFm dimana RanFi menyatakan range dari Fi. Seba-liknya, jika C adalah copula dan F (x1), F (x2), ..., F (xm) merupakan fungsi distribusi
univariat, maka fungsi F yang didefinisikan pada persamaan 1 adalah fungsi dis-
tribusi multivariat dengan marginal F (x1), F (x2), ..., F (xm)
6 Ukuran Asosiasi
6.1 Koefisien Korelasi Pearson
Koefisien korelasi Pearson merupakan salah satu ukuran asosiasi yang digunakan
untuk mengukur kekuatan dan arah hubungan linier dari dua variabel. Korelasi
pearson didefinisikan sebagai berikut:
Definisi 6.1. Misalkan X dan Y merupakan dua peubah acak, koefisien korelasi
Pearson untuk populasi antara dua peubah acak X dan Y dinyatakan sebagai berikut:
X,Y =Cov(X,Y )
V ar(X)V ar(Y )
=E(XY ) E(X)E(Y )
V ar(X)V ar(Y )
Asumsi yang harus dipenuhi oleh peubah acak X dan Y ketika kita menggu-
nakan koefisien korelasi Pearson untuk mengukur asosiasi antara kedua peubah acak
tersebut adalah:
6
-
1. Peubah acak X dan Y memiliki distribusi bivariat normal
2. Masing-masing peubah acak X dan Y berdistribusi normal
3. X dan Y mempunyai variansi berhingga
Harus diingat bahwa nilai koefisien korelasi yang kecil (tidak signifikan) bukan berarti
kedua variabel tersebut tidak saling berhubungan. Mungkin saja dua variabel mem-
punyai keeratan hubungan yang kuat namun nilai koefisien korelasinya mendekati
nol, misalnya pada kasus hubungan non linier.
Selanjutnya, Koefisien korelasi Pearson memiliki beberapa sifat-sifat yaitu:
1. Nilai X,Y selalu terletak antara -1 dan +1
2. Nilai X,Y bersifat invariant jika ditransformasi dengan transformasi fungsi
monoton linier .
3. Nilai X,Y bersifat tidak invariant jika ditransformasi dengan transformasi
fungsi monoton nonlinier.
4. Nilai X,Y menyatakan ukuran asosiasi secara linier, artinya jika kita menda-
patkan X,Y = x berarti X dan Y berasosiasi secara linier sebesar x. Asosiasi
linier sempurna ditunjukkan dengan diperolehnya nilai X,Y = 1 (berasosiasi
secara positif)dan X,Y = 1 (berasosiasi secara negatif)
5. Jika X dan Y saling bebas maka nilai X,Y = 0. Hal ini tidak berlaku seba-
liknya.
6.2 Kendall Tau
Definisi 6.2. Kendall?s tau didefinisikan sebagai peluang Concordance dikurangi
peluang Discordance, sebagai berikut :
X,Y = P [(Xi Xj) > 0] P [(Yi Yj) < 0]
Selanjutnya, Misalkan (x1, y1), (x2, y2), ..., (xn, yn) adalah sampel acak dari n ob-
servasi yang berasal dari vektor (X, Y) yang merupakan peubah acak kontinu, maka
akan terdapat Cn2 pasang observasi (xi, yi) dan (xj , yj) yang berbeda. Kemudian
banyaknya pasangan yang concordant dinyatakan dengan c dan banyak pasangan
yang discordant dinyatakan dengan d. Kendalls Tau untuk sampel dinyatakan de-
ngan:
t =c dCn2
Sama halnya dengan korelasi pearson, nilai terletak antara -1 dan 1. Namun,
tidak seperti korelasi pearson yang mengasumsikan X dan Y berdistribusi normal,
kendalls tau bisa digunakan untuk X dan Y tidak berdistribusi normal. Selain itu,
7
-
kendalls tau bersifat invariant jika ditransformasi baik transformasi fungsi monoton
linier maupun tak linier.
6.3 Spearman Rho
Ukuran asosiasi Spearmans Rho, sama halnya dengan Kendalls Tau, juga di-
dasarkan pada banyaknya pasangan yang concordant dan discordant. Misalkan (X1, Y1),
(X2, Y2), dan (X3, Y3) adalah vektor random yang saling bebas, masing-masing memi-
liki fungsi distribusi bersama H, dan fungsi peluang marginal F dan G. Maka, untuk
populasi didapatkan Spearmans Rho:
s(X,Y ) = 3(P [(X1 X2)(Y1 Y3) > 0] P [(X1 X2)(Y1 Y3) < 0])
Sedangkan Spearmans Rho untuk sampel, dinyatakan dengan:
rX,y = 1 6ni=1 d
2i
n(n2 1
Sama halnya dengan kendalls tau, nilai spearman rho juga terletak diantara -1 dan
1. Selanjutnya, Spearman Rho juga bersifat invariant jika ditransformasi baik trans-
formasi fungsi monoton linier maupun tak linier.
Untuk lebih jelas mengenai sifat invariant, perhatikan tabel berikut:
Korelasi Pearson Kendalls tau Spearman Rho
(X,Y) 0.0754 0.0283 0.0326
(2X+1, 3Y+1) 0.0754 0.0283 0.0326
(2X ,3Y ) 0.1303 0.0283 0.0326
(X3, Y 3) 0.0923 0.0283 0.0326
(X4, Y 4) -0.0054 -0.0598 -0.0819
Tabel diatas dibuat dengan membangkitkan X dan Y yang berdistribusi Nor-
mal(0,1) sebanyak 100 data terlihat bahwa untuk korelasi pearson dari 2X+1 dan
3Y+1 dimana keduanya adalah fungsi monoton linier diperoleh korelasi sebesar
0.0754. Nilai ini sama dengan nilai korelasi X dan Y. Namun, nilainya berubah
jika ditransformasi dengan fungsi monoton tidak linier dan fungsi tidak monoton.
Selanjutnya, untuk Kendalls tau dan Spearman Rho terlihat bahwa nilai akan selalu
sama, baik ditransformasi dengan fungsi monoton linier maupun nonlinier. Namun
nilainya berubah jika ditransformasi dengan fungsi tidak monoton.
8