Copula.pdf

1 Pendahuluan

Salah satu sifat dari peubah acak adalah memiliki fungsi distribusi. Fungsi dis-

tribusi dengan satu peubah acak disebut fungsi distribusi univariat. Sedangkan untuk

lebih dari satu peubah acak disebut fungsi distribusi multivariat. Analisis data un-

tuk kasus distribusi multivariat biasanya diasumsikan masing - masing marginalnya

berasal dari keluarga distribusi yang sama. Namun, dalam prakteknya seringkali

data - data observasi tidak semuanya memiliki distribusi yang sama. Sehingga jika

menganalisis data-data observasi memiliki distribusi berbeda seringkali dipaksakan

agar memiliki distribusi yang sama akibatnya analisis data yang diperoleh seingkali

tidak akurat. Salah satu cara yang digunakan untuk mengatasi masalah tersebut

yaitu pendekatan copula.

2 Konsep Copula

Pada Bagian ini dibahas mengenai Copula 2-dimensi (atau selanjutnya hanya

disebut Copula saja), teorema Sklar dan Copula Archimedean. Copula adalah se-

buah fungsi yang menggabungkan sebuah fungsi distribusi multivariat ke fungsi dis-

tribusi marginalnya yang berdimensi satu (Nelsen, 1999). Kata Copula pertama kali

diperkenalkan oleh Sklar(1959) pada teorema yang menggunakan namanya. Copula

merupakan pemodelan distribusi bersama yang memiliki beberapa keunggulan yaitu

marginal - marginal tidak harus dari distribusi yang sama dan dapat menangkap

tail dependence diantara masing - masing variabel. Selain itu, Copula merupakan

alat untuk memodelkan kebergantungan dari beberapa peubah acak. Sebelum mem-

bahas mengenai Copula lebih lanjut, pertama-tama akan dibahas beberapa definisi

yang berhubungan dengan Copula.

Definisi 2.1 (Persegi). Persegi atau interval di R2 adalah perkalian silang (cartesianproduct) dari 2 interval tertutup dalam bentuk

B = [x1, x2] [y1, y2]

titik - titik ujung dari persegi B adalah (x1, y1), (x2, y1), (x1, y2), (x2, y2)

Definisi 2.2 (Volume-H). Misalkan S1 dan S2 subset tak kosong dari R dan misalkanH:R2 R dengan DomH = S1 S2. Misalkan B = [x1, x2] [y1, y2] adalah persegidimana B DomH. Maka Volume-H dari B diberikan oleh

VH(B) = H(x2, y2)H(x2, y1)H(x1, y2) +H(x1, y1)

1

Misalkan jika kita definisikan turunan orde pertama dari fungsi H pada persegi B

yaitu:

x2x1H(x, y) = H(x2, y)H(x1, y)

y2y1H(x, y) = H(x, y2)H(x, y1)

maka volumeH dari persegi B adalah beda orde kedua dari fungsi H pada persegiB, dapat ditulis:

VH(B) = x2x1

y2y1H(x, y)

Definisi 2.3 (Fungsi 2 increasing). Misalkan H adalah fungsi bernilai real. Hdikatakan 2 increasing jika VH(B) 0 untuk semua persegi B di R2 dimana titikujung dari B ada di DomH.

Sebagai contoh misalkan H adalah fungsi yang terdefinisi pada I2 oleh H(x, y) =

max(x, y). Perhatikan gambar dibawah ini:

Dari gambar diatas dapat dilihat bahwa H adalah fungsi monoton tidak turun

Gambar 1: H(x, y) = max(x, y)

pada x dan y. Tetapi, H(x, y) bukan fungsi 2-increasing karena VH(I2) = H(1, 1)

H(1, 0)H(0, 1) +H(0, 0) = 1.Definisi 2.4 (Fungsi grounded). Misalkan S1, S2 merupakan subset tak kosong dari

R dan H:R2 R dengan DomH = S1 S2. Jika S1, S2 memiliki elemen terkecimasing-masing a, b maka H dikatakan fungsi grounded jika H(a, y) = H(x, b) =

0, (x, y) S1 S2Sebagai contoh misalkan H(x, y) adalah fungsi dengan [1, 1] [0,] diberikan

oleh

H(x, y) =(x+ 1)(ey 1)x+ 2ey 1

2

maka H(x, y) merupakan fungsi grounded karena H(x, 0) = 0 dan H(1, y) = 0.

Definisi 2.5 (Copula Bivariat). Copula bivariat adalah suatu fungsi distribusi bi-

variat C yang memetakan [0, 1]2 ke [0, 1]yang memenuhi sifat berikut:

1. C adalah fungsi 2-increasing

2. C adalah fungsi grounded

3. C(u, 1) = u dan C(1, v) = v u, v [0, 1]

Dari definisi diatas dapat dilihat bahwa Copula juga merupakan fungsi distribusi

bivariat dengan daerah asalnya adalah [0, 1]2. Setelah melihat definisi Copula, se-

lanjutnya akan dijelaskan mengenai Teorema Sklar yang menjadi dasar dari teori

Copula. Teorema Sklar menjelaskan peran dari Copula dalam menghubungkan an-

tara fungsi distribusi bivariat dan marginal dari masing-masing.

Teorema 2.1 (Teorema Sklar). Misalkan X dan Y adalah dua peubah acak dengan

fungsi distribusi FX dan GY . Misalkan HX,Y adalah fungsi distribusi bivariat untuk

X dan y maka terdapat suatu Copula C yang unik sedemikian sehingga

HX,Y (x, y) = C(FX(x), GY (x))

Sebaliknya, jika C adalah suatu Copula dan FX dan GY adalah fungsi distribusi maka

HX,Y adalah fungsi distribusi bivariat dengan marginal FX dan GY

Teorema Sklar menunjukkan pentingnya copula dalam pemodelan distribusi bi-

variat. Terdapat dua hal penting dalam teorema Sklar. Pertama, copula dapat

diperoleh dari setiap fungsi distribusi bersama. Kedua, copula dapat dikombinasikan

dengan setiap distribusi marginal F dan G untuk memperoleh fungsi distribusi bi-

variat.

3 Copula Archimedean

Pada bagian ini kita akan membahas mengenai salah satu cara dalam mengkon-

struksi copula. Misalkan H(x, y)adalah fungsi distribusi bivariat dengan marginal F

dan G maka terdapat fungsi sedemikian sehingga

(H(x, y)) = (F (x)) + (G(y))

atau untuk copula dapat ditulis

(C(u, v)) = (u) + (v)

3

Copula dengan bentuk diatas disebut Copula Archimedean (archimedean Copula).

Dari sini suatu Copula bisa dikonstruksi dengan menyelesaikan bentuk diatas yaitu

dengan mencari invers dari fungsi atau 1 sehingga diperoleh

C(u, v) = 1((u) + (v))

Setiap fungsi kontinu dan memenuhi (1) = 0, (u) < 0 dan (u) > 0. Se-lanjutnya fungsi disebut fungsi generator. Jika (0) = maka fungsi disebutfungsi generator kuat (strictly generator) dan C(u, v) = 1((u) + (v)) disebutCopula Archimedean Kuat (Strictly Archimdean Copula). Nelsen (2006) memberikan

beberapa contoh dari archimedean copula.

1. Independent Copula

Fungsi generatornya yang digunakan adalah (t) = lnt, dari sini diperolehfungsi inversnya yaitu 1 = et sehingga diperoleh independent copula se-bagai berikut;

C(u, v) = 1((u) + (v))

= eln(u)+ln(v) = uv

2. Clayton Copula

Fungsi generatornya yang digunakan adalah (t) = t1 , dari sini diperoleh

fungsi inversnya yaitu 1 = (t + 1)1 sehingga diperoleh Clayton Copula

sebagai berikut;

C(u, v) = 1((u) + (v))

= (u + v 1) 1

3. Gumbel Copula Fungsi Generator yang digunakan adalah (t) = (lnt),dari sini dipeoleh fungsi inversnya adalah 1 = exp(t 1 sehingga diperolehGumbel Coula sebagai berikut;

C(u, v) = 1((u) + (v))

= exp(((lnu) + (lnv)) 1 )

4

4 Copula Multivariat

Pada bagian ini akan dibahas mengenai perluasan dari Copula Bivariat yaitu

Copula Multivariat. pada bagian ini juga akan dibahas kembali definisi mengenai

Copula dalam kasus multivariat. Sebelum membahas mengenai Copula Multivariat

lebih lanjut, pertama-tama akan dibahas beberapa definisi yang berhubungan dengan

Copula multivariat.

Definisi 4.1 (m box). m box di Rn adalah perkalian silang (cartesian product)dari m interval tertutup dalam bentuk

B = [a1, b1] [a2, b2] [an, bn]

Definisi 4.2 (Volume-H). Misalkan S1, S2,... ,Sn subset tak kosong dari R danmisalkan H:Rn R dengan DomH = S1S2 ...Sn. Misalkan B adalah n boxdimana B DomH. Maka volume-H dari B diberikan oleh

VH(B) = baH(t) =

bnan

bn1an1 ...

b2a2

b1a1H(t)

Dimana

bkakH(t) = H(t1, .., tk1, bk, tk+1, .., tn)H(t1, .., tk1, ak, tk+1, .., tn)

Sebagai contoh, Misalkan H adalah fungsi berdimensi 3 dengan domain R3 danB adalah 3 box [x1, x2] [y1, y2] [z1, z2]. Maka volume-H dari B adalah

VH(B) = H(x2, y2, z2)H(x2, y2, z1)H(x2, y1, z2)H(x1, y2, z2)+H(x2, y1, z1) +H(x1, y2, z1) +H(x1, y1, z2)+H(x1, y1, z1)

Definisi 4.3 (Fungsi m increasing). Misalkan H adalah fungsi bernilai real. Hdikatakan m increasing jika VH(B) 0 untuk semua persegi B di Rm dimana titikujung dari B ada di DomH.

Definisi 4.4 (Copula Multivariat). Copula C berdimensi-m (m-dimensional copula)

adalah fungsi C: [0, 1]m [0, 1] yang memenuhi sifat-sifat:1. C(1,1,...,1,an,1,...,1)=an untuk setiap n m dan n [0, 1]2. C(a1, ..., am)=0 jika an = 0 untuk setiap n m3. Copula C bersifat m increasing

5

Sifat 1 menyatakan bahwa jika terdapat m 1 peubah acak yang mempunyaipeluang marginal sama dengan satu maka fungsi distribusi bersama m peubah acak

sama dengan peubah acak sisanya yang tidak diketahui peluang marginalnya.

Sifat 2 menyatakan bahwa fungsi distribusi dari m peubah acak sama dengan

nol, jika sembarang peubah acak memiliki peluang marginalnya sama dengan nol.

Sifat 2 juga sering disebut sifat grounded (Grounded Properties).

Sifat 3 identik dengan sifat monoton naik untuk m dimensi.

5 Teorema Sklar Untuk Multivariat

Teorema sklar merupakan dasar dari pemodelan fungsi distribusi multivariat de-

ngan model copula. Teorema Sklar menjelaskan bahwa terdapat copula yang bisa

menghubungkan fungsi distribusi multivariat dan marginal univariatnya.

Teorema 5.1. Misalkan F adalah fungsi distribusi multivariat dengan marginals

F1, F2, ..., Fm . Kemudian terdapat suatu Copula C sedemikian sehingga :

F (x1, x2, ..., xm) = C(F (x1), F (x2), ..., F (xm)) (1)

xi R, i = 1, 2, ...,m. Jika Fi kontinu i = 1, 2, ...,m, maka C unik; jika tidak, Cunik dalam RanF1 ... RanFm dimana RanFi menyatakan range dari Fi. Seba-liknya, jika C adalah copula dan F (x1), F (x2), ..., F (xm) merupakan fungsi distribusi

univariat, maka fungsi F yang didefinisikan pada persamaan 1 adalah fungsi dis-

tribusi multivariat dengan marginal F (x1), F (x2), ..., F (xm)

6 Ukuran Asosiasi

6.1 Koefisien Korelasi Pearson

Koefisien korelasi Pearson merupakan salah satu ukuran asosiasi yang digunakan

untuk mengukur kekuatan dan arah hubungan linier dari dua variabel. Korelasi

pearson didefinisikan sebagai berikut:

Definisi 6.1. Misalkan X dan Y merupakan dua peubah acak, koefisien korelasi

Pearson untuk populasi antara dua peubah acak X dan Y dinyatakan sebagai berikut:

X,Y =Cov(X,Y )

V ar(X)V ar(Y )

=E(XY ) E(X)E(Y )

V ar(X)V ar(Y )

Asumsi yang harus dipenuhi oleh peubah acak X dan Y ketika kita menggu-

nakan koefisien korelasi Pearson untuk mengukur asosiasi antara kedua peubah acak

tersebut adalah:

6

1. Peubah acak X dan Y memiliki distribusi bivariat normal

2. Masing-masing peubah acak X dan Y berdistribusi normal

3. X dan Y mempunyai variansi berhingga

Harus diingat bahwa nilai koefisien korelasi yang kecil (tidak signifikan) bukan berarti

kedua variabel tersebut tidak saling berhubungan. Mungkin saja dua variabel mem-

punyai keeratan hubungan yang kuat namun nilai koefisien korelasinya mendekati

nol, misalnya pada kasus hubungan non linier.

Selanjutnya, Koefisien korelasi Pearson memiliki beberapa sifat-sifat yaitu:

1. Nilai X,Y selalu terletak antara -1 dan +1

2. Nilai X,Y bersifat invariant jika ditransformasi dengan transformasi fungsi

monoton linier .

3. Nilai X,Y bersifat tidak invariant jika ditransformasi dengan transformasi

fungsi monoton nonlinier.

4. Nilai X,Y menyatakan ukuran asosiasi secara linier, artinya jika kita menda-

patkan X,Y = x berarti X dan Y berasosiasi secara linier sebesar x. Asosiasi

linier sempurna ditunjukkan dengan diperolehnya nilai X,Y = 1 (berasosiasi

secara positif)dan X,Y = 1 (berasosiasi secara negatif)

5. Jika X dan Y saling bebas maka nilai X,Y = 0. Hal ini tidak berlaku seba-

liknya.

6.2 Kendall Tau

Definisi 6.2. Kendall?s tau didefinisikan sebagai peluang Concordance dikurangi

peluang Discordance, sebagai berikut :

X,Y = P [(Xi Xj) > 0] P [(Yi Yj) < 0]

Selanjutnya, Misalkan (x1, y1), (x2, y2), ..., (xn, yn) adalah sampel acak dari n ob-

servasi yang berasal dari vektor (X, Y) yang merupakan peubah acak kontinu, maka

akan terdapat Cn2 pasang observasi (xi, yi) dan (xj , yj) yang berbeda. Kemudian

banyaknya pasangan yang concordant dinyatakan dengan c dan banyak pasangan

yang discordant dinyatakan dengan d. Kendalls Tau untuk sampel dinyatakan de-

ngan:

t =c dCn2

Sama halnya dengan korelasi pearson, nilai terletak antara -1 dan 1. Namun,

tidak seperti korelasi pearson yang mengasumsikan X dan Y berdistribusi normal,

kendalls tau bisa digunakan untuk X dan Y tidak berdistribusi normal. Selain itu,

7

kendalls tau bersifat invariant jika ditransformasi baik transformasi fungsi monoton

linier maupun tak linier.

6.3 Spearman Rho

Ukuran asosiasi Spearmans Rho, sama halnya dengan Kendalls Tau, juga di-

dasarkan pada banyaknya pasangan yang concordant dan discordant. Misalkan (X1, Y1),

(X2, Y2), dan (X3, Y3) adalah vektor random yang saling bebas, masing-masing memi-

liki fungsi distribusi bersama H, dan fungsi peluang marginal F dan G. Maka, untuk

populasi didapatkan Spearmans Rho:

s(X,Y ) = 3(P [(X1 X2)(Y1 Y3) > 0] P [(X1 X2)(Y1 Y3) < 0])

Sedangkan Spearmans Rho untuk sampel, dinyatakan dengan:

rX,y = 1 6ni=1 d

2i

n(n2 1

Sama halnya dengan kendalls tau, nilai spearman rho juga terletak diantara -1 dan

1. Selanjutnya, Spearman Rho juga bersifat invariant jika ditransformasi baik trans-

formasi fungsi monoton linier maupun tak linier.

Untuk lebih jelas mengenai sifat invariant, perhatikan tabel berikut:

Korelasi Pearson Kendalls tau Spearman Rho

(X,Y) 0.0754 0.0283 0.0326

(2X+1, 3Y+1) 0.0754 0.0283 0.0326

(2X ,3Y ) 0.1303 0.0283 0.0326

(X3, Y 3) 0.0923 0.0283 0.0326

(X4, Y 4) -0.0054 -0.0598 -0.0819

Tabel diatas dibuat dengan membangkitkan X dan Y yang berdistribusi Nor-

mal(0,1) sebanyak 100 data terlihat bahwa untuk korelasi pearson dari 2X+1 dan

3Y+1 dimana keduanya adalah fungsi monoton linier diperoleh korelasi sebesar

0.0754. Nilai ini sama dengan nilai korelasi X dan Y. Namun, nilainya berubah

jika ditransformasi dengan fungsi monoton tidak linier dan fungsi tidak monoton.

Selanjutnya, untuk Kendalls tau dan Spearman Rho terlihat bahwa nilai akan selalu

sama, baik ditransformasi dengan fungsi monoton linier maupun nonlinier. Namun

nilainya berubah jika ditransformasi dengan fungsi tidak monoton.

8

Copula.pdf

Documents

Transcript of Copula.pdf