Bentuk Alternatif Model Regresi

20
Written by: Rangga Handika Bentuk Alternatif Model Regresi 1. Persamaan Polinomial (Suku Banyak) Salah satu variasi dalam model regresi adalah model regresi persamaan polynomial (suku banyak). Terkadang hubungan antara dependent variable dengan independent variable(s) tidak cukup dijelaskan dengan hubungan linear biasa tetapi memerlukan hubungan pangkat dua (kuadrat) atau bahkan lebih. Contoh pada model regresi sederhana (5.2) sebelumnya: (5.2) Ketika hubungan antara return saham BNI dengan return IHSG menjadi suku banyak menjadi sebagai berikut: (7.1) Maka model regresi (7.1) merupakan model regresi dengan persamaan polinomial. Perintah R: data <- read.csv("C:/Users/hp/Documents/Buku/Buku 1/Data/DATA_KEUANGAN_1.csv") # membaca data keuangan # gunakan alamat file yang tepat di komputer Anda untuk implementasi script ini head(data, n=5) # menampilkan 5 baris pertama data tail(data, n=5) # menampilkan 5 baris terakhir data PriceBBNI <- matrix(data[,3]) # membuat vektor kolom harga saham harian BNI RDate <- matrix(data[2:nrow(data),1]) # membuat vektor kolom tanggal return harga saham BNI (baris 2 s/d akhir) RDate = strptime(RDate, "%d/%m/%Y",tz="GMT") # memformat vektor waktu dd/mm/yyyy CSV menjadi format waktu standar R RDate = data.frame(RDate) # memformat vektor kolom RDate BNIReturn <- diff(log(PriceBBNI)) # membuat vektor kolom return saham harian BNI RBNI = data.frame(RDate,BNIReturn) # membuat matriks RBNI yang terdiri dari vektor kolom tanggal dan return BNI PriceIHSG <- matrix(data[,5]) # membuat vektor kolom harga saham harian IHSG IHSGReturn <- diff(log(PriceIHSG)) # membuat vektor kolom return saham harian IHSG RIHSG = data.frame(RDate,IHSGReturn) # membuat matriks RIHSG yang terdiri dari vektor kolom tanggal dan return IHSG

description

bentuk altrenatif regresi linier Statistika

Transcript of Bentuk Alternatif Model Regresi

  • Written by: Rangga Handika

    Bentuk Alternatif Model Regresi

    1. Persamaan Polinomial (Suku Banyak)

    Salah satu variasi dalam model regresi adalah model regresi persamaan polynomial

    (suku banyak). Terkadang hubungan antara dependent variable dengan independent

    variable(s) tidak cukup dijelaskan dengan hubungan linear biasa tetapi memerlukan

    hubungan pangkat dua (kuadrat) atau bahkan lebih.

    Contoh pada model regresi sederhana (5.2) sebelumnya:

    (5.2)

    Ketika hubungan antara return saham BNI dengan return IHSG menjadi suku banyak

    menjadi sebagai berikut:

    (7.1)

    Maka model regresi (7.1) merupakan model regresi dengan persamaan polinomial.

    Perintah R:

    data

  • Written by: Rangga Handika

    lm_7_1 |t|)

    (Intercept) -0.0001248 0.0004587 -0.272 0.786

    RIHSG$IHSGReturn 1.0748889 0.0371843 28.907 < 2e-16 ***

    I(RIHSG$IHSGReturn^2) 0.1130111 0.7742737 0.146 0.884

    I(RIHSG$IHSGReturn^3) 61.8338674 11.8398351 5.223 1.92e-07 ***

    ---

    Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

    Residual standard error: 0.02102 on 2379 degrees of freedom

    (92 observations deleted due to missingness)

    Multiple R-squared: 0.4159, Adjusted R-squared: 0.4151

    F-statistic: 564.6 on 3 and 2379 DF, p-value: < 2.2e-16

    interpretasi:

    Residuals merupakan nilai residu (error) dengan rentang nilai minimal, kuartil pertama, median (kuartil kedua), kuartil ketiga dan maksimal.

    Coefficients merupakan angka koefisien hasil estimasi OLS parameter (intercept), 1 (variabel return IHSG RIHSG$IHSGReturn), 2 (variabel return IHSG pangkat dua), dan 3 (variabel return IHSG pangkat tiga). Angka koefisiennya tercatat pada kolom Estimate, beserta nilai standard error ada kolom Std. Error, nilai t-statistic pada kolom t-value dan nilai p-value pada kolom Pr(>|t|). Pada output tersebut, nilai estimasi OLS parameter adalah negatif dan sangat kecil (mendekati nol) tetapi secara statistik tidak signifikan; parameter 1 adalah positif dan signifikan secara statistik pada tingkat keyakinan 99,9 persen (100 persen 0,1 persen), parameter 2 adalah positif kecil dan secara statistik tidak signifikan, sedangkan parameter 3 adalah bernilai positif dan sangat besar dan juga signifikan secara statistik pada tingkat keyakinan 99,9 persen (100

    persen 0,1 persen). Setiap kenaikan (positif) 1 satuan return IHSG akan menyebabkan kenaikan (positif) return saham BNI sebesar 1,0748889 satuan, setiap kenaikan (positif) 1

    satuan return IHSG pangkat dua (kuadrat) akan menyebabkan kenaikan (positif) return

    saham BNI sebesar 0,1130111 satuan, dan setiap setiap kenaikan (positif) 1 satuan return

    IHSG pangkat tiga akan menyebabkan kenaikan (positif) return saham BNI sebesar

    61.8338674 satuan.

  • Written by: Rangga Handika

    Baris Signif. codes: menunjukkan bahwa tanda *** untuk tingkat keyakinan 99,9 persen, tanda ** untuk tingkat keyakinan 99 persen, tanda * untuk tingkat keyakinan 95 persen, dan tanda . untuk tingkat keyakinan 90 persen. Tanda ini akan dimunculkan (jika estimate suatu coefficient secara statistik signifikan) pada sebelah sisi

    kanan nilai p-value (angka pada kolom Pr(>|t|)). Pada output di atas, kita mellihat tanda *** di sebelah kanan angka p-value coefficient 1

  • Written by: Rangga Handika

    # transformasi data volume BNI menjadi log volume BNI1

    RDate = data.frame(RDate) # memformat vektor kolom RDate

    LVBBNI

  • Written by: Rangga Handika

    Coefficients merupakan angka koefisien hasil estimasi OLS parameter (intercept) dan (variabel log volume saham BNI). Angka koefisiennya tercatat pada kolom Estimate, beserta nilai standard error ada kolom Std. Error, nilai t-statistic pada kolom t-value dan nilai p-value pada kolom Pr(>|t|). Pada output tersebut, nilai estimasi OLS parameter adalah negatif dan signifikan secara statistik pada tingkat keyakinan 99 persen (100 persen 1 persen) sedangkan untuk parameter adalah positif (tetapi sangat kecil) dan signifikan secara statistik pada tingkat keyakinan 99 persen (100 persen 1 persen). Hati hati dalam membaca koefisien untuk variabel yang ditransformasikan,

    karena angka 1 di sini menunjukkan setiap satuan hasil natural logaritma suatu bilangan.

    Pada situasi model (7.2) ini, maka setiap kenaikan 1 satuan natural logaritma volume

    saham BNI akan menaikkan return saham BNI sebesar 0,0007562 satuan return. Kalimat

    setiap kenaikan 1 satuan natural logaritma volume saham BNI bermakna kompleks karena kenaikan 1 satuan natural logaritma tidak linear, artinya kenaikan dari 4 ke 5

    sangat berbeda dengan kenaikan dari 8 ke 9. Sebagai catatan, kenaikan 1 satuan

    logaritma dari 4 ke 5 ekuivalen dengan kenaikan angka volume sekitar 94 (e5-e

    4 dimana e

    adalah bilangan euler e 2.71828) satuan sedangkan kenaikan 1 satuan logaritma dari 8 ke 9 ekuivalen dengan kenaikan angka volume sekitar 5,122 e

    9-e

    8 dimana e adalah

    bilangan euler e 2.71828) satuan.

    Baris Signif. codes: menunjukkan bahwa tanda *** untuk tingkat keyakinan 99,9 persen, tanda ** untuk tingkat keyakinan 99 persen, tanda * untuk tingkat keyakinan 95 persen, dan tanda . untuk tingkat keyakinan 90 persen. Tanda ini akan dimunculkan (jika estimate suatu coefficient secara statistik signifikan) pada sebelah sisi

    kanan nilai p-value (angka pada kolom Pr(>|t|)). Pada output di atas, kita mellihat tanda ** di sebelah kanan angka p-value intercept 0,00237 dan tanda ** di sebelah kanan angka p-value coefficient 0,00110.

    Nilai standar error residual (komponen error model regresi (7.2)) sebesar 0,02733 dengan 2.401 derajat bebas.

    Nilai Goodness of fit model regresi (7.2) sebesar 0,004431 (unadjusted R-squared) dan 0,004016 (adjusted R-squared). Penulis merekomendasikan menggunakan angka adjusted

    R-squared. Artinya bahwa variasi (perubahan) dependent variable return saham BNI

    dapat dijelaskan 0,40 persen melalui variasi (perubahan) independent variable natural

    logaritma dari volume saham BNI sebagaimana diformulasikan pada model regresi (7.2).

    Nilai F-statistik adalah 10.69 untuk 1 variabel (variabel volume saham BNI) pada 2.401 derajat bebas dengan nilai p-value 0,001095, yang artinya variabel volume saham BNI

    secara statistik signifikan mempengaruhi variabel return saham BNI. Nilai p-value F-

    statistik untuk 1 variabel akan sama dengan nilai p-value pada independent variabel

    tersebut (perbedaan yang tampak di output antara angka 0,001095 dengan angka 0,00110 hanya karena proses pembulatan).

    3. Dummy Variable Pada Independent Variable

    Variasi lainnya adalah ketika ada komponen dummy variable pada variable

    independent2. Dummy variable (atau juga disebut dichotomous atau indicator variable)

    adalah sebuah variabel numerik yang bersifat kualitatif untuk menjelaskan suatu kondisi pada

    2 Ada variasi lainnya yaitu dummy variable pada dependent variable. Topik ini adalah topik yang cukup

    advanced sehingga tidak dimasukkan dalam pembahasan di buku ini.

  • Written by: Rangga Handika

    suatu variabel. Contoh: Nilai suatu variable return diberi angka 0 jika return bernilai negatif

    atau nol dan diberi angka 1 jika return bernilai positif. Dummy variable juga biasa digunakan

    untuk menganalisa faktor seasonality yang ada pada time series data.

    Contoh:

    (7.3)

    Model regresi (7.3) merupakan ekstensi model regresi (5.2) dengan menambahkan Dummy

    Variable return IHSG periode sebelumnya. Nilai dummy variable ini adalah 0 jika return

    IHSG periode sebelumnya adalah negatif atau 0 dan 1 jika return IHSG periode sebelumnya

    adalah positif). Model regresi (7.3) ini menganalisa apakah return positif indeks periode

    sebelumnya berpengaruh terhadap return suatu saham (BNI) yang menjawab hipotesa bahwa

    sentimen positif indeks akan memberikan dampak positif pada periode berikutnya.

    Perintah R (melanjutkan script R pada sub-bagian 1. Dan 2. sebelumnya):

    DIHSGReturn = 0)

    # menyusun series dummy variable return IHSG

    # 1 jika positif dan 0 jika negatif atau 0

    DIHSGReturn

  • Written by: Rangga Handika

    lm_7_3 |t|)

    (Intercept) -6.866e-05 6.706e-04 -0.102 0.918

    VAREG_7_3$X 1.201e+00 2.994e-02 40.095 |t|). Pada output tersebut, nilai estimasi OLS parameter adalah negatif dan sangat kecil (mendekati nol) dan secara statistik tidak signifikan; parameter 1 adalah positif dan signifikan secara statistik pada tingkat keyakinan 99,9 persen (100 persen 0,1 persen) sedangkan parameter 2 adalah negatil kecil dan tidak signifikan secara statistik. Setiap kenaikan (positif) 1 satuan return IHSG akan menyebabkan kenaikan (positif) return

    saham BNI sebesar 1,201 satuan sedangkan setiap keberadaan sentimen positif berupa

    return IHSG yang positif pada periode sebelumnya ternyata justru menyebabkan

    penurunan (negatif) return saham BNI sebanyak 0,0005324 satuan.

    Baris Signif. codes: menunjukkan bahwa tanda *** untuk tingkat keyakinan 99,9 persen, tanda ** untuk tingkat keyakinan 99 persen, tanda * untuk tingkat keyakinan 95 persen, dan tanda . untuk tingkat keyakinan 90 persen. Tanda ini akan dimunculkan (jika estimate suatu coefficient secara statistik signifikan) pada sebelah sisi

    kanan nilai p-value (angka pada kolom Pr(>|t|)). Pada output di atas, kita mellihat tanda *** di sebelah kanan angka p-value coefficient 1

  • Written by: Rangga Handika

    Nilai standar error residual (komponen error model regresi (5.3)) sebesar 0,02124 dengan 2.342 derajat bebas. Ada informasi disebutkan bahwa sebanyak 129 observasi

    dieliminasi karena ketiadaan data (missing values).

    Nilai Goodness of fit model regresi (7.3) sebesar 0,4073 (unadjusted R-squared) dan 0,4068 (adjusted R-squared). Penulis merekomendasikan menggunakan angka adjusted R-

    squared. Artinya bahwa variasi (perubahan) dependent variable return saham BNI dapat

    dijelaskan 40,68 persen melalui variasi (perubahan) independent variables return IHSG

    dan dummy independent variable return positif IHSG periode sebelumnya sebagaimana

    dijelaskan pada persamaan model regresi (7.3).

    Nilai F-statistik adalah 804,8 untuk 2 variabel (variabel return IHSG dan dummy variabel return IHSG periode sebelumnya) pada 2.342 derajat bebas dengan nilai p-value < 2.2e-

    16 (lebih kecil daripada angka 2 x 10-16

    ), yang artinya variabel return IHSG dan dummy

    variabel return IHSG periode sebelumnya secara bersama-sama (keduanya) signifikan

    secara statistik dalam mempengaruhi variabel return saham BNI.

    Contoh lainnya:

    (7.4.A)

    (7.4.B)

    Model regresi (7.4.A) dan (7.4.B) merupakan model yang menganalisa apakah faktor

    musiman (seasonality) kuartalan memberikan pengaruh pada return saham BNI. Angka

    Dummy Variablesnya adalah sebagai berikut:

    Q1 = bernilai 1 jika data pada kuartal pertama dan 0 jika tidak pada kuartal pertama

    Q2 = bernilai 1 jika data pada kuartal kedua dan 0 jika tidak pada kuartal kedua

    Q3 = bernilai 1 jika data pada kuartal ketiga dan 0 jika tidak pada kuartal ketiga

    Q4 = bernilai 1 jika data pada kuartal keempat dan 0 jika tidak pada kuartal keempat

    Untuk diperhatikan bahwa jika kita memasukkan komponen intercept ( ) pada persamaan

    regresi tersebut, maka kita tidak bisa memasukkan keempat dummy variables tersebut, hanya

    tiga karena dummy variabel yang keempat tercermin secara tidak langsung pada intercept

    tersebut. Jika kita memasukkan keempat dummy variables dan intercept ( ) pada suatu

    persamaan regresi maka akan terjadi permasalahan yang disebut sebagai dummy variable trap

    (Brooks, 2008 Chapter 9). Dengan demikian, persamaan regresi yang benar adalah hanya

    memasukkan tiga dummy variables dan intercept ( ) sebagaimana model regresi (7.4.A)

    atau memasukkan seluruh empat dummy variables dan tidak memasukkan intercept ( )

    sebagaimana model (7.4.B).

  • Written by: Rangga Handika

    Perintah R:

    data

  • Written by: Rangga Handika

    colnames(VAREG_7_4)

  • Written by: Rangga Handika

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    VAREG_7_4$Q1 0.000677 0.001094 0.619 0.536

    VAREG_7_4$Q2 0.001267 0.001082 1.171 0.242

    VAREG_7_4$Q3 0.001554 0.001086 1.431 0.153

    VAREG_7_4$Q4 -0.001194 0.001097 -1.089 0.276

    Residual standard error: 0.02711 on 2471 degrees of freedom

    Multiple R-squared: 0.002014, Adjusted R-squared: 0.0003984

    F-statistic: 1.247 on 4 and 2471 DF, p-value: 0.289

    interpretasi:

    output Model (7.4.A)

    Residuals merupakan nilai residu (error) dengan rentang nilai minimal, kuartil pertama, median (kuartil kedua), kuartil ketiga dan maksimal.

    Coefficients merupakan angka koefisien hasil estimasi OLS parameter (intercept, yang mencerminkan dummy variable kuartal keempat), 1 (dummy variabel kuartal 1), 2 (dummy variabel kuartal 2) dan 3 (dummy variabel kuartal 3), koefisiennya pada kolom Estimate, beserta nilai standard error ada kolom Std. Error, nilai t-statistic pada kolom t-value dan nilai p-value pada kolom Pr(>|t|). Pada output tersebut, nilai estimasi OLS parameter adalah negatif dan secara statistik tidak signifikan; parameter 1 adalah positif dan secara statistik tidak signifikan; parameter 2 adalah positif dan secara statistik tidak signifikan sedangkan parameter 3 adalah positif dan secara statistik signifikan pada tingkat keyakinan 90 persen (100 persen 10 persen). Dengan demikian, hanya pada kuartal ketiga yang secara statistik signifikan memberikan kenaikan return

    yang positif sebesar 0,002748 satuan kepada return saham BNI. Sementara itu

    keberadaan kuartal pertama, kuartal kedua dan kuartal keempat secara statistik tidak

    signifikan mempengaruhi return saham BNI berturut-turut sebesar positif 0,001871

    (kuartal pertama) ; positif 0,002461 (kuartal kedua) ; dan negatif 0,001194 (kuartal

    keempat).

    Baris Signif. codes: menunjukkan bahwa tanda *** untuk tingkat keyakinan 99,9 persen, tanda ** untuk tingkat keyakinan 99 persen, tanda * untuk tingkat keyakinan 95 persen, dan tanda . untuk tingkat keyakinan 90 persen. Tanda ini akan dimunculkan (jika estimate suatu coefficient secara statistik signifikan) pada sebelah sisi

    kanan nilai p-value (angka pada kolom Pr(>|t|)). Pada output di atas, kita mellihat tanda *** di sebelah kanan angka p-value coefficient 3 0,0751. Artinya hanya keberadaan kuartal ketiga yang memberikan dampak terhadap return saham BNI.

    Nilai standar error residual (komponen error model regresi (7.4.A)) sebesar 0,02711 dengan 2.471 derajat bebas.

    Nilai Goodness of fit model regresi (7.4.A) sebesar 0,001548 (unadjusted R-squared) dan 0,000336 (adjusted R-squared). Penulis merekomendasikan menggunakan angka adjusted

    R-squared. Artinya bahwa variasi (perubahan) dependent variable return saham BNI

    dapat dijelaskan 0,03 persen melalui faktor musiman (seasonality) kuartalan

    sebagaimana dijelaskan pada persamaan model regresi (7.4.A).

    Nilai F-statistik adalah 1,277 pada 2.471 derajat bebas dengan nilai p-value 0,2805, yang artinya faktor musiman (seasonality) kuartalan secara bersama-sama (keempat kuartal)

    tidak signifikan secara statistik dalam mempengaruhi variabel return saham BNI.

  • Written by: Rangga Handika

    output Model (7.4.B)

    Residuals merupakan nilai residu (error) dengan rentang nilai minimal, kuartil pertama, median (kuartil kedua), kuartil ketiga dan maksimal.

    Coefficients merupakan angka koefisien hasil estimasi OLS parameter 1 (dummy variabel kuartal 1), 2 (dummy variabel kuartal 2), 3 (dummy variabel kuartal 3) dan 4 (dummy variabel kuartal 4), koefisiennya pada kolom Estimate, beserta nilai standard error ada kolom Std. Error, nilai t-statistic pada kolom t-value dan nilai p-value pada kolom Pr(>|t|). Pada output tersebut, nilai estimasi OLS parameter parameter 1 adalah positif dan secara statistik tidak signifikan; parameter 2 adalah positif dan secara statistik tidak signifikan; parameter 3 adalah positif dan secara statistik tidak signifikan; sedangkan parameter 4 adalah negatif dan secara statistik tidak signifikan . Dengan demikian, tidak ada faktor musiman (kuartalan) yang mempengaruhi return saham BNI.

    Keberadaan kuartal pertama, kuartal kedua, kuartal ketiga dan kuartal keempat secara

    statistik tidak signifikan mempengaruhi return saham BNI berturut-turut sebesar positif

    0,000677 (kuartal pertama) ; positif 0,001267 (kuartal kedua) ; positif 0,001554 (kuartal

    ketiga) dan dan negatif 0,001194 (kuartal keempat).

    Baris Signif. codes: menunjukkan bahwa tanda *** untuk tingkat keyakinan 99,9 persen, tanda ** untuk tingkat keyakinan 99 persen, tanda * untuk tingkat keyakinan 95 persen, dan tanda . untuk tingkat keyakinan 90 persen. Tanda ini akan dimunculkan (jika estimate suatu coefficient secara statistik signifikan) pada sebelah sisi

    kanan nilai p-value (angka pada kolom Pr(>|t|)). Pada output di atas, kita mellihat bahwa tidak ada tanda signifikansi pada keempat faktor musiman (seasonality) kuartalan

    tersebut. Artinya tidak ada faktor musiman (seasonality) kuartalan yang mempengaruhi

    return saham BNI.

    Nilai standar error residual (komponen error model regresi (7.4.B)) sebesar 0,02711 dengan 2.471 derajat bebas.

    Nilai Goodness of fit model regresi (7.4.B) sebesar 0,002014 (unadjusted R-squared) dan 0,0003984 (adjusted R-squared). Penulis merekomendasikan menggunakan angka

    adjusted R-squared. Artinya bahwa variasi (perubahan) dependent variable return saham

    BNI dapat dijelaskan 0,04 persen (pembulatan) melalui faktor musiman (seasonality)

    kuartalan sebagaimana dijelaskan pada persamaan model regresi (7.4.B).

    Nilai F-statistik adalah 1,247 pada 2.471 derajat bebas dengan nilai p-value 0,289, yang artinya faktor musiman (seasonality) kuartalan secara bersama-sama (keempat kuartal)

    tidak signifikan secara statistik dalam mempengaruhi variabel return saham BNI.

    Kesimpulan hasil output regresi model (7.4.A) dan model (7.4.B) adalah bahwa faktor

    musiman (seasonality) kuartalan tidak mepengaruhi return saham BNI.

    5. Tehnik Regresi dengan Data Outliers

    Data ekstrim (outliers) terkadang menyebabkan analisa regresi menjadi kompleks. Hal

    ini dikarenakan model OLS regresi standar melakukan inferensi berdasarkan mostly

    distributed values, sehingga nilai ekstrim merupakan hal yang tidak lazim. Ada beberapa hal

    yang perlu dicermati ketika menemukan nilai ekstrim dalam suatu data kita:

  • Written by: Rangga Handika

    1. Nilai ekstrim terkadang merupakan kesalahan pencatatan data. Pada situasi ini kita perlu

    melakukan double-checks atas nilai ekstrim tersebut. Jika memang terjadi kesalahan

    pencatatan data, maka nilai ekstrim bisa dikeluarkan dari observasi.

    2. Nilai ekstrim memang benar ada, akan tetapi jumlahnya sangat sedikit dan bukan

    merupakan karakteristik utama data. Nilai ekstrim tersebut timbul karena terjadi sesuatu

    yang sangat luar biasa dan di luar kewajaran. Jika memang karena hal ini, maka kita juga

    bisa mengeluarkan nilai ekstrim tersebut dari observasi.

    3. Nilai ekstrim merupakan karakteristik khas suatu data yang memang wajar terjadi,

    contohnya pada harga listrik (power market) di Australia (disebut sebagai price spikes).

    Hal ini menjadi tantangan para ahli permodelan data untuk melakukan permodelan dan

    manajemen risiko atas nilai ekstrim tersebut. Untuk menghadapi nilai ekstrim semacam

    ini, memang diperlukan model khusus yang mampu merekonstruksi pergerakan variabel

    yang terjadi.

    Sub bab ini membahas 2 (dua) contoh model regresi yang digunakan untuk menghadapi

    nilai ekstrim. Kedua model tersebut adalah resistant regression dan quantile regression.

    Resistant regression adalah tehnik regresi yang robust untuk menghadapi permasalahan

    kehadiran nilai ekstrim dengan menghasilkan nilai estimasi yang stabil walaupun ada

    sejumlah (hingga persentase tertentu) nilai ekstrim. Tehnik yang digunakan dalam contoh

    resistant regression di sini adalah tehnik Rousseeuw dan Leroy (1987), Marazzi (1993) dan

    Rousseeuw dan Hubert (1997). Software R menyediakan fitur untuk menjalankan tehnik

    tersebut dengan package MASS (Ripley et al., 2015).

    Contoh penerapan resistant regression pada suatu model regresi:

    (7.5)

    dimana:

    CA : saldo current account (US Dolar)

    STD : persentase utang jangka pendek

    CD : persentase utang concessional

    Berdasarkan data keuangan (terdapat pada file DATA_KEUANGAN_3.csv) cross

    section 18 negara tentang persentase utang jangka pendek (STD), persentase utang

    concessional (CD) dan saldo current account (CA) dalam juta US Dolar pada tahun 20 pada

    tahun 20103.

    3 Sumber data http://www.imf.org/external/data.htm

  • Written by: Rangga Handika

    Perintah R:

    data75

  • Written by: Rangga Handika

    Residual standard error: 7487 on 16 degrees of freedom

    Multiple R-squared: 0.1904, Adjusted R-squared: 0.08916

    F-statistic: 1.881 on 2 and 16 DF, p-value: 0.1846

    > rownames(data75)[-okdata]

    [1] "Thailand" "Malaysia"

    Resistant regression model (7.5)

    Call:

    lm(formula = data75$CA ~ data75$STD + data75$CD, subset = okdata)

    Residuals:

    Min 1Q Median 3Q Max

    -4382 -2383 -1325 1378 12021

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) 1714.77 2974.96 0.576 0.573

    data75$STD -249.72 159.97 -1.561 0.141

    data75$CD 12.01 41.31 0.291 0.775

    Residual standard error: 4486 on 14 degrees of freedom

    Multiple R-squared: 0.1865, Adjusted R-squared: 0.07026

    F-statistic: 1.605 on 2 and 14 DF, p-value: 0.2358

    interpretasi:

    Model OLS (7.5)

    Residuals merupakan nilai residu (error) dengan rentang nilai minimal, kuartil pertama, median (kuartil kedua), kuartil ketiga dan maksimal.

    Coefficients merupakan angka koefisien hasil estimasi OLS parameter (intercept), 1 (variabel STD) dan 2 (variabel CD), koefisiennya pada kolom Estimate, beserta nilai standard error ada kolom Std. Error, nilai t-statistic pada kolom t-value dan nilai p-value pada kolom Pr(>|t|). Pada output tersebut, nilai estimasi OLS parameter adalah negatif dan sangat besar tetapi secara statistik tidak signifikan; parameter 1 adalah positif dan sangat besar tetapi secara statistik tidak signifikan (hampir signifikan

    pada tingkat keyakinan 90 persen) sedangkan parameter 2 adalah positif kecil dan tidak signifikan secara statistik. Setiap kenaikan (positif) 1 satuan persentase utang jangka

    pendek akan menyebabkan kenaikan (positif) saldo current account sebesar 271,842 juta

    US Dolar dan setiap kenaikan (positif) 1 satuan persentase utang concessional akan

    menyebabkan kenaikan (positif) saldo current account sebesar 2,866 juta US Dollar.

    Baris Signif. codes: menunjukkan bahwa tanda *** untuk tingkat keyakinan 99,9 persen, tanda ** untuk tingkat keyakinan 99 persen, tanda * untuk tingkat keyakinan 95 persen, dan tanda . untuk tingkat keyakinan 90 persen. Tanda ini akan dimunculkan (jika estimate suatu coefficient secara statistik signifikan) pada sebelah sisi

    kanan nilai p-value (angka pada kolom Pr(>|t|)). Pada output di atas, tidak ada tanda di sebelah kanan angka p-value coefficient 1 0,113 dan 2 0,967. Artinya variable utang jangka pendek dan utang concessional tidak secara signifikan memperngaruhi saldo

    current account.

    Nilai standar error residual (komponen error model regresi (7.5)) sebesar 7.487 dengan 16 derajat bebas.

  • Written by: Rangga Handika

    Nilai Goodness of fit model regresi (7.5) sebesar 0,1904 (unadjusted R-squared) dan 0,08916 (adjusted R-squared). Penulis merekomendasikan menggunakan angka adjusted

    R-squared. Artinya bahwa variasi (perubahan) dependent variable saldo current account

    dapat dijelaskan 8,92 (pembulatan) persen melalui variasi (perubahan) independent

    variables utang jangka pendek dan utang concessional sebagaimana dijelaskan pada

    persamaan model regresi (7.5).

    Nilai F-statistik adalah 1,881 untuk 2 variabel (variabel utang jangka pendek dan variabel utang concessional) pada 16 derajat bebas dengan nilai p-value 0,1846, yang

    artinya variabel utang jangka pendek dan variabel utang concessional secara bersama-

    sama (keduanya) secara statistik tidak signifikan dalam mempengaruhi variabel saldo

    current account.

    "Thailand" "Malaysia

    Menunjukkan nilai ekstrim terdapat pada data negara (baris) Thailand dan Malaysia.

    Resistant regression model (7.5)

    Residuals merupakan nilai residu (error) dengan rentang nilai minimal, kuartil pertama, median (kuartil kedua), kuartil ketiga dan maksimal.

    Coefficients merupakan angka koefisien hasil estimasi OLS parameter (intercept), 1 (variabel STD) dan 2 (variabel CD), koefisiennya pada kolom Estimate, beserta nilai standard error ada kolom Std. Error, nilai t-statistic pada kolom t-value dan nilai p-value pada kolom Pr(>|t|). Pada output tersebut, nilai estimasi OLS parameter adalah positif dan sangat besar tetapi secara statistik tidak signifikan; parameter 1 adalah negatif dan besar tetapi secara statistik tidak signifikan (mendekati signifikan pada

    tingkat keyakinan 90 persen) sedangkan parameter 2 adalah positif kecil dan tidak signifikan secara statistik. Setiap kenaikan (positif) 1 satuan persentase utang jangka

    pendek akan menyebabkan penurunan (negatif) saldo current account sebesar 249,72 juta

    US Dolar dan setiap kenaikan (positif) 1 satuan persentase utang concessional akan

    menyebabkan kenaikan (positif) saldo current account sebesar 12,01 juta US Dollar.

    Baris Signif. codes: menunjukkan bahwa tanda *** untuk tingkat keyakinan 99,9 persen, tanda ** untuk tingkat keyakinan 99 persen, tanda * untuk tingkat keyakinan 95 persen, dan tanda . untuk tingkat keyakinan 90 persen. Tanda ini akan dimunculkan (jika estimate suatu coefficient secara statistik signifikan) pada sebelah sisi

    kanan nilai p-value (angka pada kolom Pr(>|t|)). Pada output di atas, tidak ada tanda di sebelah kanan angka p-value coefficient 1 0,141 dan 2 0,775. Artinya variable utang jangka pendek dan utang concessional tidak secara signifikan memperngaruhi saldo

    current account.

    Nilai standar error residual (komponen error model regresi (7.5)) sebesar 4.486 dengan 14 derajat bebas.

    Nilai Goodness of fit model regresi (7.5) sebesar 0,1865 (unadjusted R-squared) dan 0,07026 (adjusted R-squared). Penulis merekomendasikan menggunakan angka adjusted

    R-squared. Artinya bahwa variasi (perubahan) dependent variable saldo current account

    dapat dijelaskan 7,03 (pembulatan) persen melalui variasi (perubahan) independent

    variables utang jangka pendek dan utang concessional sebagaimana dijelaskan pada

    persamaan model regresi (7.5).

    Nilai F-statistik adalah 1,605 untuk 2 variabel (variabel utang jangka pendek dan variabel utang concessional) pada 14 derajat bebas dengan nilai p-value 0,2358, yang

    artinya variabel utang jangka pendek dan variabel utang concessional secara bersama-

    sama (keduanya) secara statistik tidak signifikan dalam mempengaruhi variabel saldo

    current account.

  • Written by: Rangga Handika

    Quantile regression adalah tehnik regresi yang melakukan regresi pada dependent

    variable pada tingkat kuartil (quantile) tertentu pada suatu nilai independent variable terkait

    (conditional on independent variable). Tehnik quantile regression dikembangkan oleh

    Koenker dan Hallock (2001) dan Koenker (2005) melalui package quantreg.

    Contoh penerapan quantile regression pada suatu model regresi (5.3):

    Perintah R:

    data

  • Written by: Rangga Handika

    # menggambar hasil estimasi parameter (alpha dan beta)

    # untuk berbagai tingkat quantile, dari 0.05 s/d 0.95

    output:

    Model OLS (5.2) sama seperti output regresi OLS (5.2) di sub bab 5.3.

    Call:

    lm(formula = RBNI$BNIReturn ~ RIHSG$IHSGReturn)

    Residuals:

    Min 1Q Median 3Q Max

    -0.142250 -0.010305 -0.001269 0.008988 0.181666

    Coefficients:

    Estimate Std. Error t value Pr(>|t|)

    (Intercept) -0.0002867 0.0004338 -0.661 0.509

    RIHSG$IHSGReturn 1.2028554 0.0297064 40.491 |t|)

    (Intercept) -0.01026 0.00043 -23.90992 0.00000

    RIHSG$IHSGReturn 1.08104 0.02153 50.21166 0.00000

    Call: rq(formula = lm_5_2, tau = 0.5)

    tau: [1] 0.5

    Coefficients:

    Value Std. Error t value Pr(>|t|)

    (Intercept) -0.00134 0.00036 -3.68150 0.00024

    RIHSG$IHSGReturn 1.03857 0.02287 45.40933 0.00000

    Call: rq(formula = lm_5_2, tau = 0.75)

    tau: [1] 0.75

    Coefficients:

    Value Std. Error t value Pr(>|t|)

    (Intercept) 0.00827 0.00050 16.41924 0.00000

    RIHSG$IHSGReturn 1.08277 0.02315 46.77631 0.00000

  • Written by: Rangga Handika

    interpretasi:

    Model OLS (5.2)

    Sama dengan interpretasi model OLS (5.2) pada sub bagian 5.3. Quantile Regression model (5.2)

    tau memaparkan nilai persentil dari suatu quantile regression, 0.25 untuk kuartil pertama, 0.5 untuk kuartil kedua (median), dan 0.75 untuk kuartil ketiga.

    Coefficients merupakan angka koefisien hasil estimasi OLS parameter (intercept), dan (variabel return IHSD), koefisiennya pada kolom Estimate, beserta nilai standard error ada kolom Std. Error, nilai t-statistic pada kolom t-value dan nilai p-value pada kolom Pr(>|t|). Pada output tersebut, nilai estimasi quantile regression parameter adalah -0,01026 (kuartil pertama), -0,00134 (kuartil kedua), 0,00827 (kuartil ketiga) dan

    untuk parameter adalah 1,08104 (kuartil pertama),1,03857 (kuartil kedua), 1,08277 (kuartil ketiga). Hasil ini mengindikasikan bahwa model regresi (5.2) relatif stabil untuk

    berbagai jenis kuartil.

    Grafik output menunjukkan bahwa nilai estimasi intercept berada di kisaran -0,03 sampai dengan 0,02 dan untuk berada di kisaran 1 sampai dengan 1,4 untuk tingkatan observasi 0,05 sampai dengan 0,95. Hasil ini menunjukkan bahwa secara umum model

    (5.2) menunjukkan kestabilan estimasi parameter.

  • Written by: Rangga Handika

    Daftar Pustaka

    Brooks, C. 2008. Introductory Econometrics for Finance 2nd

    edition, Cambridge University

    Press, New York USA.

    Hill, R. C., Griffiths, W. E. & Lim, G. C. 2011. Principles of Econometrics 4th

    edition, John

    Wiley & Sons Inc., NJ USA.

    Kleiber, C. & Zeileis, A. 2008. Applied Econometrics With R, Springer, Spring Street, NY.

    Koenker, R. 2005. Quantile Regression, Cambridge University Press, Cambridge.

    Koenker, R. & Hallock, K. F. 2001. Quantile Regression, Journal of Economic Perspectives,

    15(4), 143 156. Marazzi, A. 1993. Algorithms, Routines and S Functions for Robust Statistics, Wadsworth

    and Brooks/Cole.

    Ripley, B., Venables, B., Bates, D. M., Hornik, K., Gebhardt, A. & Firth, D. 2015. Package

    MASS, CRAN. Rousseeuw, P. J. & Hubert, M. 1997. L1-Statistical Procedures and Related Topics, IMS

    Lecture Notes, 31, 201214. Rousseeuw, P. J. & Leroy, A. M. 1987. Robust Regression and Outlier Detection, Wiley.