Copula.pdf

8
1 Pendahuluan Salah satu sifat dari peubah acak adalah memiliki fungsi distribusi. Fungsi dis- tribusi dengan satu peubah acak disebut fungsi distribusi univariat. Sedangkan untuk lebih dari satu peubah acak disebut fungsi distribusi multivariat. Analisis data un- tuk kasus distribusi multivariat biasanya diasumsikan masing - masing marginalnya berasal dari keluarga distribusi yang sama. Namun, dalam prakteknya seringkali data - data observasi tidak semuanya memiliki distribusi yang sama. Sehingga jika menganalisis data-data observasi memiliki distribusi berbeda seringkali ”dipaksakan” agar memiliki distribusi yang sama akibatnya analisis data yang diperoleh seingkali tidak akurat. Salah satu cara yang digunakan untuk mengatasi masalah tersebut yaitu pendekatan copula. 2 Konsep Copula Pada Bagian ini dibahas mengenai Copula 2-dimensi (atau selanjutnya hanya disebut Copula saja), teorema Sklar dan Copula Archimedean. Copula adalah se- buah fungsi yang ”menggabungkan” sebuah fungsi distribusi multivariat ke fungsi dis- tribusi marginalnya yang berdimensi satu (Nelsen, 1999). Kata Copula pertama kali diperkenalkan oleh Sklar(1959) pada teorema yang menggunakan namanya. Copula merupakan pemodelan distribusi bersama yang memiliki beberapa keunggulan yaitu marginal - marginal tidak harus dari distribusi yang sama dan dapat menangkap tail dependence diantara masing - masing variabel. Selain itu, Copula merupakan alat untuk memodelkan kebergantungan dari beberapa peubah acak. Sebelum mem- bahas mengenai Copula lebih lanjut, pertama-tama akan dibahas beberapa definisi yang berhubungan dengan Copula. Definisi 2.1 (Persegi). Persegi atau interval di R 2 adalah perkalian silang (cartesian product ) dari 2 interval tertutup dalam bentuk B =[x 1 ,x 2 ] × [y 1 ,y 2 ] titik - titik ujung dari persegi B adalah (x 1 ,y 1 ), (x 2 ,y 1 ), (x 1 ,y 2 ), (x 2 ,y 2 ) Definisi 2.2 (Volume-H). Misalkan S 1 dan S 2 subset tak kosong dari R dan misalkan H:R 2 R dengan DomH = S 1 × S 2 . Misalkan B =[x 1 ,x 2 ] × [y 1 ,y 2 ] adalah persegi dimana B DomH. Maka Volume-H dari B diberikan oleh V H (B)= H(x 2 ,y 2 ) - H(x 2 ,y 1 ) - H(x 1 ,y 2 )+ H(x 1 ,y 1 ) 1

description

Cop

Transcript of Copula.pdf

  • 1 Pendahuluan

    Salah satu sifat dari peubah acak adalah memiliki fungsi distribusi. Fungsi dis-

    tribusi dengan satu peubah acak disebut fungsi distribusi univariat. Sedangkan untuk

    lebih dari satu peubah acak disebut fungsi distribusi multivariat. Analisis data un-

    tuk kasus distribusi multivariat biasanya diasumsikan masing - masing marginalnya

    berasal dari keluarga distribusi yang sama. Namun, dalam prakteknya seringkali

    data - data observasi tidak semuanya memiliki distribusi yang sama. Sehingga jika

    menganalisis data-data observasi memiliki distribusi berbeda seringkali dipaksakan

    agar memiliki distribusi yang sama akibatnya analisis data yang diperoleh seingkali

    tidak akurat. Salah satu cara yang digunakan untuk mengatasi masalah tersebut

    yaitu pendekatan copula.

    2 Konsep Copula

    Pada Bagian ini dibahas mengenai Copula 2-dimensi (atau selanjutnya hanya

    disebut Copula saja), teorema Sklar dan Copula Archimedean. Copula adalah se-

    buah fungsi yang menggabungkan sebuah fungsi distribusi multivariat ke fungsi dis-

    tribusi marginalnya yang berdimensi satu (Nelsen, 1999). Kata Copula pertama kali

    diperkenalkan oleh Sklar(1959) pada teorema yang menggunakan namanya. Copula

    merupakan pemodelan distribusi bersama yang memiliki beberapa keunggulan yaitu

    marginal - marginal tidak harus dari distribusi yang sama dan dapat menangkap

    tail dependence diantara masing - masing variabel. Selain itu, Copula merupakan

    alat untuk memodelkan kebergantungan dari beberapa peubah acak. Sebelum mem-

    bahas mengenai Copula lebih lanjut, pertama-tama akan dibahas beberapa definisi

    yang berhubungan dengan Copula.

    Definisi 2.1 (Persegi). Persegi atau interval di R2 adalah perkalian silang (cartesianproduct) dari 2 interval tertutup dalam bentuk

    B = [x1, x2] [y1, y2]

    titik - titik ujung dari persegi B adalah (x1, y1), (x2, y1), (x1, y2), (x2, y2)

    Definisi 2.2 (Volume-H). Misalkan S1 dan S2 subset tak kosong dari R dan misalkanH:R2 R dengan DomH = S1 S2. Misalkan B = [x1, x2] [y1, y2] adalah persegidimana B DomH. Maka Volume-H dari B diberikan oleh

    VH(B) = H(x2, y2)H(x2, y1)H(x1, y2) +H(x1, y1)

    1

  • Misalkan jika kita definisikan turunan orde pertama dari fungsi H pada persegi B

    yaitu:

    x2x1H(x, y) = H(x2, y)H(x1, y)

    y2y1H(x, y) = H(x, y2)H(x, y1)

    maka volumeH dari persegi B adalah beda orde kedua dari fungsi H pada persegiB, dapat ditulis:

    VH(B) = x2x1

    y2y1H(x, y)

    Definisi 2.3 (Fungsi 2 increasing). Misalkan H adalah fungsi bernilai real. Hdikatakan 2 increasing jika VH(B) 0 untuk semua persegi B di R2 dimana titikujung dari B ada di DomH.

    Sebagai contoh misalkan H adalah fungsi yang terdefinisi pada I2 oleh H(x, y) =

    max(x, y). Perhatikan gambar dibawah ini:

    Dari gambar diatas dapat dilihat bahwa H adalah fungsi monoton tidak turun

    Gambar 1: H(x, y) = max(x, y)

    pada x dan y. Tetapi, H(x, y) bukan fungsi 2-increasing karena VH(I2) = H(1, 1)

    H(1, 0)H(0, 1) +H(0, 0) = 1.Definisi 2.4 (Fungsi grounded). Misalkan S1, S2 merupakan subset tak kosong dari

    R dan H:R2 R dengan DomH = S1 S2. Jika S1, S2 memiliki elemen terkecimasing-masing a, b maka H dikatakan fungsi grounded jika H(a, y) = H(x, b) =

    0, (x, y) S1 S2Sebagai contoh misalkan H(x, y) adalah fungsi dengan [1, 1] [0,] diberikan

    oleh

    H(x, y) =(x+ 1)(ey 1)x+ 2ey 1

    2

  • maka H(x, y) merupakan fungsi grounded karena H(x, 0) = 0 dan H(1, y) = 0.

    Definisi 2.5 (Copula Bivariat). Copula bivariat adalah suatu fungsi distribusi bi-

    variat C yang memetakan [0, 1]2 ke [0, 1]yang memenuhi sifat berikut:

    1. C adalah fungsi 2-increasing

    2. C adalah fungsi grounded

    3. C(u, 1) = u dan C(1, v) = v u, v [0, 1]

    Dari definisi diatas dapat dilihat bahwa Copula juga merupakan fungsi distribusi

    bivariat dengan daerah asalnya adalah [0, 1]2. Setelah melihat definisi Copula, se-

    lanjutnya akan dijelaskan mengenai Teorema Sklar yang menjadi dasar dari teori

    Copula. Teorema Sklar menjelaskan peran dari Copula dalam menghubungkan an-

    tara fungsi distribusi bivariat dan marginal dari masing-masing.

    Teorema 2.1 (Teorema Sklar). Misalkan X dan Y adalah dua peubah acak dengan

    fungsi distribusi FX dan GY . Misalkan HX,Y adalah fungsi distribusi bivariat untuk

    X dan y maka terdapat suatu Copula C yang unik sedemikian sehingga

    HX,Y (x, y) = C(FX(x), GY (x))

    Sebaliknya, jika C adalah suatu Copula dan FX dan GY adalah fungsi distribusi maka

    HX,Y adalah fungsi distribusi bivariat dengan marginal FX dan GY

    Teorema Sklar menunjukkan pentingnya copula dalam pemodelan distribusi bi-

    variat. Terdapat dua hal penting dalam teorema Sklar. Pertama, copula dapat

    diperoleh dari setiap fungsi distribusi bersama. Kedua, copula dapat dikombinasikan

    dengan setiap distribusi marginal F dan G untuk memperoleh fungsi distribusi bi-

    variat.

    3 Copula Archimedean

    Pada bagian ini kita akan membahas mengenai salah satu cara dalam mengkon-

    struksi copula. Misalkan H(x, y)adalah fungsi distribusi bivariat dengan marginal F

    dan G maka terdapat fungsi sedemikian sehingga

    (H(x, y)) = (F (x)) + (G(y))

    atau untuk copula dapat ditulis

    (C(u, v)) = (u) + (v)

    3

  • Copula dengan bentuk diatas disebut Copula Archimedean (archimedean Copula).

    Dari sini suatu Copula bisa dikonstruksi dengan menyelesaikan bentuk diatas yaitu

    dengan mencari invers dari fungsi atau 1 sehingga diperoleh

    C(u, v) = 1((u) + (v))

    Setiap fungsi kontinu dan memenuhi (1) = 0, (u) < 0 dan (u) > 0. Se-lanjutnya fungsi disebut fungsi generator. Jika (0) = maka fungsi disebutfungsi generator kuat (strictly generator) dan C(u, v) = 1((u) + (v)) disebutCopula Archimedean Kuat (Strictly Archimdean Copula). Nelsen (2006) memberikan

    beberapa contoh dari archimedean copula.

    1. Independent Copula

    Fungsi generatornya yang digunakan adalah (t) = lnt, dari sini diperolehfungsi inversnya yaitu 1 = et sehingga diperoleh independent copula se-bagai berikut;

    C(u, v) = 1((u) + (v))

    = eln(u)+ln(v) = uv

    2. Clayton Copula

    Fungsi generatornya yang digunakan adalah (t) = t1 , dari sini diperoleh

    fungsi inversnya yaitu 1 = (t + 1)1 sehingga diperoleh Clayton Copula

    sebagai berikut;

    C(u, v) = 1((u) + (v))

    = (u + v 1) 1

    3. Gumbel Copula Fungsi Generator yang digunakan adalah (t) = (lnt),dari sini dipeoleh fungsi inversnya adalah 1 = exp(t 1 sehingga diperolehGumbel Coula sebagai berikut;

    C(u, v) = 1((u) + (v))

    = exp(((lnu) + (lnv)) 1 )

    4

  • 4 Copula Multivariat

    Pada bagian ini akan dibahas mengenai perluasan dari Copula Bivariat yaitu

    Copula Multivariat. pada bagian ini juga akan dibahas kembali definisi mengenai

    Copula dalam kasus multivariat. Sebelum membahas mengenai Copula Multivariat

    lebih lanjut, pertama-tama akan dibahas beberapa definisi yang berhubungan dengan

    Copula multivariat.

    Definisi 4.1 (m box). m box di Rn adalah perkalian silang (cartesian product)dari m interval tertutup dalam bentuk

    B = [a1, b1] [a2, b2] [an, bn]

    Definisi 4.2 (Volume-H). Misalkan S1, S2,... ,Sn subset tak kosong dari R danmisalkan H:Rn R dengan DomH = S1S2 ...Sn. Misalkan B adalah n boxdimana B DomH. Maka volume-H dari B diberikan oleh

    VH(B) = baH(t) =

    bnan

    bn1an1 ...

    b2a2

    b1a1H(t)

    Dimana

    bkakH(t) = H(t1, .., tk1, bk, tk+1, .., tn)H(t1, .., tk1, ak, tk+1, .., tn)

    Sebagai contoh, Misalkan H adalah fungsi berdimensi 3 dengan domain R3 danB adalah 3 box [x1, x2] [y1, y2] [z1, z2]. Maka volume-H dari B adalah

    VH(B) = H(x2, y2, z2)H(x2, y2, z1)H(x2, y1, z2)H(x1, y2, z2)+H(x2, y1, z1) +H(x1, y2, z1) +H(x1, y1, z2)+H(x1, y1, z1)

    Definisi 4.3 (Fungsi m increasing). Misalkan H adalah fungsi bernilai real. Hdikatakan m increasing jika VH(B) 0 untuk semua persegi B di Rm dimana titikujung dari B ada di DomH.

    Definisi 4.4 (Copula Multivariat). Copula C berdimensi-m (m-dimensional copula)

    adalah fungsi C: [0, 1]m [0, 1] yang memenuhi sifat-sifat:1. C(1,1,...,1,an,1,...,1)=an untuk setiap n m dan n [0, 1]2. C(a1, ..., am)=0 jika an = 0 untuk setiap n m3. Copula C bersifat m increasing

    5

  • Sifat 1 menyatakan bahwa jika terdapat m 1 peubah acak yang mempunyaipeluang marginal sama dengan satu maka fungsi distribusi bersama m peubah acak

    sama dengan peubah acak sisanya yang tidak diketahui peluang marginalnya.

    Sifat 2 menyatakan bahwa fungsi distribusi dari m peubah acak sama dengan

    nol, jika sembarang peubah acak memiliki peluang marginalnya sama dengan nol.

    Sifat 2 juga sering disebut sifat grounded (Grounded Properties).

    Sifat 3 identik dengan sifat monoton naik untuk m dimensi.

    5 Teorema Sklar Untuk Multivariat

    Teorema sklar merupakan dasar dari pemodelan fungsi distribusi multivariat de-

    ngan model copula. Teorema Sklar menjelaskan bahwa terdapat copula yang bisa

    menghubungkan fungsi distribusi multivariat dan marginal univariatnya.

    Teorema 5.1. Misalkan F adalah fungsi distribusi multivariat dengan marginals

    F1, F2, ..., Fm . Kemudian terdapat suatu Copula C sedemikian sehingga :

    F (x1, x2, ..., xm) = C(F (x1), F (x2), ..., F (xm)) (1)

    xi R, i = 1, 2, ...,m. Jika Fi kontinu i = 1, 2, ...,m, maka C unik; jika tidak, Cunik dalam RanF1 ... RanFm dimana RanFi menyatakan range dari Fi. Seba-liknya, jika C adalah copula dan F (x1), F (x2), ..., F (xm) merupakan fungsi distribusi

    univariat, maka fungsi F yang didefinisikan pada persamaan 1 adalah fungsi dis-

    tribusi multivariat dengan marginal F (x1), F (x2), ..., F (xm)

    6 Ukuran Asosiasi

    6.1 Koefisien Korelasi Pearson

    Koefisien korelasi Pearson merupakan salah satu ukuran asosiasi yang digunakan

    untuk mengukur kekuatan dan arah hubungan linier dari dua variabel. Korelasi

    pearson didefinisikan sebagai berikut:

    Definisi 6.1. Misalkan X dan Y merupakan dua peubah acak, koefisien korelasi

    Pearson untuk populasi antara dua peubah acak X dan Y dinyatakan sebagai berikut:

    X,Y =Cov(X,Y )

    V ar(X)V ar(Y )

    =E(XY ) E(X)E(Y )

    V ar(X)V ar(Y )

    Asumsi yang harus dipenuhi oleh peubah acak X dan Y ketika kita menggu-

    nakan koefisien korelasi Pearson untuk mengukur asosiasi antara kedua peubah acak

    tersebut adalah:

    6

  • 1. Peubah acak X dan Y memiliki distribusi bivariat normal

    2. Masing-masing peubah acak X dan Y berdistribusi normal

    3. X dan Y mempunyai variansi berhingga

    Harus diingat bahwa nilai koefisien korelasi yang kecil (tidak signifikan) bukan berarti

    kedua variabel tersebut tidak saling berhubungan. Mungkin saja dua variabel mem-

    punyai keeratan hubungan yang kuat namun nilai koefisien korelasinya mendekati

    nol, misalnya pada kasus hubungan non linier.

    Selanjutnya, Koefisien korelasi Pearson memiliki beberapa sifat-sifat yaitu:

    1. Nilai X,Y selalu terletak antara -1 dan +1

    2. Nilai X,Y bersifat invariant jika ditransformasi dengan transformasi fungsi

    monoton linier .

    3. Nilai X,Y bersifat tidak invariant jika ditransformasi dengan transformasi

    fungsi monoton nonlinier.

    4. Nilai X,Y menyatakan ukuran asosiasi secara linier, artinya jika kita menda-

    patkan X,Y = x berarti X dan Y berasosiasi secara linier sebesar x. Asosiasi

    linier sempurna ditunjukkan dengan diperolehnya nilai X,Y = 1 (berasosiasi

    secara positif)dan X,Y = 1 (berasosiasi secara negatif)

    5. Jika X dan Y saling bebas maka nilai X,Y = 0. Hal ini tidak berlaku seba-

    liknya.

    6.2 Kendall Tau

    Definisi 6.2. Kendall?s tau didefinisikan sebagai peluang Concordance dikurangi

    peluang Discordance, sebagai berikut :

    X,Y = P [(Xi Xj) > 0] P [(Yi Yj) < 0]

    Selanjutnya, Misalkan (x1, y1), (x2, y2), ..., (xn, yn) adalah sampel acak dari n ob-

    servasi yang berasal dari vektor (X, Y) yang merupakan peubah acak kontinu, maka

    akan terdapat Cn2 pasang observasi (xi, yi) dan (xj , yj) yang berbeda. Kemudian

    banyaknya pasangan yang concordant dinyatakan dengan c dan banyak pasangan

    yang discordant dinyatakan dengan d. Kendalls Tau untuk sampel dinyatakan de-

    ngan:

    t =c dCn2

    Sama halnya dengan korelasi pearson, nilai terletak antara -1 dan 1. Namun,

    tidak seperti korelasi pearson yang mengasumsikan X dan Y berdistribusi normal,

    kendalls tau bisa digunakan untuk X dan Y tidak berdistribusi normal. Selain itu,

    7

  • kendalls tau bersifat invariant jika ditransformasi baik transformasi fungsi monoton

    linier maupun tak linier.

    6.3 Spearman Rho

    Ukuran asosiasi Spearmans Rho, sama halnya dengan Kendalls Tau, juga di-

    dasarkan pada banyaknya pasangan yang concordant dan discordant. Misalkan (X1, Y1),

    (X2, Y2), dan (X3, Y3) adalah vektor random yang saling bebas, masing-masing memi-

    liki fungsi distribusi bersama H, dan fungsi peluang marginal F dan G. Maka, untuk

    populasi didapatkan Spearmans Rho:

    s(X,Y ) = 3(P [(X1 X2)(Y1 Y3) > 0] P [(X1 X2)(Y1 Y3) < 0])

    Sedangkan Spearmans Rho untuk sampel, dinyatakan dengan:

    rX,y = 1 6ni=1 d

    2i

    n(n2 1

    Sama halnya dengan kendalls tau, nilai spearman rho juga terletak diantara -1 dan

    1. Selanjutnya, Spearman Rho juga bersifat invariant jika ditransformasi baik trans-

    formasi fungsi monoton linier maupun tak linier.

    Untuk lebih jelas mengenai sifat invariant, perhatikan tabel berikut:

    Korelasi Pearson Kendalls tau Spearman Rho

    (X,Y) 0.0754 0.0283 0.0326

    (2X+1, 3Y+1) 0.0754 0.0283 0.0326

    (2X ,3Y ) 0.1303 0.0283 0.0326

    (X3, Y 3) 0.0923 0.0283 0.0326

    (X4, Y 4) -0.0054 -0.0598 -0.0819

    Tabel diatas dibuat dengan membangkitkan X dan Y yang berdistribusi Nor-

    mal(0,1) sebanyak 100 data terlihat bahwa untuk korelasi pearson dari 2X+1 dan

    3Y+1 dimana keduanya adalah fungsi monoton linier diperoleh korelasi sebesar

    0.0754. Nilai ini sama dengan nilai korelasi X dan Y. Namun, nilainya berubah

    jika ditransformasi dengan fungsi monoton tidak linier dan fungsi tidak monoton.

    Selanjutnya, untuk Kendalls tau dan Spearman Rho terlihat bahwa nilai akan selalu

    sama, baik ditransformasi dengan fungsi monoton linier maupun nonlinier. Namun

    nilainya berubah jika ditransformasi dengan fungsi tidak monoton.

    8