Gelombang Bunyi Adalah Kompresi Mekanikal Atau Gelombang Longitudinal Yang Merambat Melalui Medium
Estimasi Parameter Pada Regresi Semiparametrik Untuk Data Longitudinal (2)
-
Upload
wilan-dita-nesyia-wirana -
Category
Documents
-
view
31 -
download
0
Transcript of Estimasi Parameter Pada Regresi Semiparametrik Untuk Data Longitudinal (2)
-
ESTIMASI PARAMETER PADA REGRESI SEMIPARAMETRIK UNTUK DATA LONGITUDINAL
Lilis Laome1
1Jurusan Matematika FMIPA Universitas Haluoleo Kendari 93232
e-mail : [email protected]
Abstrak Misal
iy merupakan variabel respon,
iX adalah variabel prediktor yang berhubungan linier dengan
iy
dan i
t adalah variabel prediktor lain yang berhubungan secara tidak linier dengan i
y , model tersebut dikatakan model semiparametrik dan dapat ditulis dengan :
( ) , 1, 2, ...,Ti i i i
y X f t i n
dimana, ( )i
f t adalah fungsi yang tidak diketahui. Suatu model semiparametrik untuk data longitudinal dapat ditulis dengan :
( ) , 1, 2, ..., ; 1, 2, ...,Tij ij ij ij i
y X f t i n j n Dengan menggunakan metode Penalized Likelihood diperoleh estimator komponen parametrik
T T
-1
= X PX X Py dan estimator komponen nonparametrik
1 1 1 ( )T T T -1f V K V I - X X PX X P y , dimana 1 1 1 1 1( )T P = V V V K V Kata kunci : regresi semiparametrik, data longitudinal, dan penalized likelihood. Abstract Let
iy is response variable,
iX is predictor variable which linear relation with
iy and
it is another
predictor which nonlinear relation with i
y , the model is semiparametric,
( ) , 1, 2, ...,Ti i i i
y X f t i n
where, ( )if t is unknown function. The semiparametriic model for longitudinal data is : ( ) , 1, 2, ..., ; 1, 2, ...,T
ij ij ij ij iy X f t i n j n
With using Penalized Likelihood method are obtained parametric component estimator
T T
-1
= X PX X Py And nonparametric component estimator
1 1 1 ( )T T T -1f V K V I - X X PX X P y , where 1 1 1 1 1( )T P = V V V K V Keywords: semiparametric regression, longitudinal data, and penalized likelihood
I. LATAR BELAKANG
Analisis regresi adalah salah satu alat statistik yang banyak digunakan untuk mengetahui
hubungan antara dua atau lebih variabel. Misalkan y adalah variabel respon dan t adalah variabel
prediktor, maka untuk n pengamatan hubungan variabel tersebut dapat dinyatakan dengan :
( ) , 1, 2, ...,i i i
y f t i n
-
JIMT, Vol 5 No. 2, Nopember 2008 : 60-64:
2
dengan ( )i
f t adalah fungsi regresi dan i
adalah error random yang diasumsikan independen dan
identik dengan mean 0 dan variansi 2 .
Ada dua pendekatan yang dapat digunakan untuk mengestimasi ( )i
f t yaitu pendekatan
parametrik dan nonparametrik. Pendekatan parametrik digunakan bila bentuk fungsi ( )i
f t diketahui
berdasarkan pada teori dan pengalaman masa lalu. Sedangkan pendekatan nonparametrik digunakan
bila tidak adanya informasi tentang bentuk hubungan variabel respon dan variabel prediktor. Namun
dalam perkembangan analisis regresi, untuk mengatasi permasalahan bila variabel prediktornya tidak
dapat diestimasi dengan pendekatan parametrik maupun nonparametrik, maka diperkenalkan regresi
yang merupakan gabungan dari regresi parametrik dan regresi nonparametrik, yaitu regresi
semiparametrik [1].
Penelitian tentang regresi semiparametrik telah banyak dilakukan. [2] tentang estimator
spline pada model semiparametrik. [3] tentang pendekatan kernel dalam regresi semiparametrik dan
pemilihan bandwidth optimal. Dan [4] tentang model linier parsial pada hilangnya data komponen
parametrik. Namun penelitian-penelitian tersebut hanya pada data cross section atau data yang
diamati pada suatu waktu tertentu. Untuk kasus khusus, regresi semiparametrik dapat digunakan pada
data longitudinal.
II. TINJAUAN PUSTAKA
II.1 Data Longitudinal
Studi longitudinal didefinisikan sebagai suatu studi terhadap unit eksperimen dengan respon
yang diamati dalam dua atau lebih interval. Data longitudinal adalah pengamatan berulang pada unit
eksperimen, berbeda dengan data cross section yaitu data dari masing-masing individu diamati
dalam sekali waktu [5]. Ada beberapa keuntungan dari studi mengenai data longitudinal
dibandingkan dengan data cross section. Pertama, studi longitudinal lebih powerful dari studi cross
section untuk sejumlah subjek yang tetap. Dengan kata lain, untuk memperoleh kekuatan uji statistik
yang sama, studi longitudinal membutuhkan subjek yang lebih sedikit. Kedua, dengan jumlah subjek
yang sama, hasil pengukuran error menghasilkan penaksir efek perlakuan yang lebih efisien dari data
cross section. Ketiga, data longitudinal mampu menyediakan informasi tentang perubahan individu,
sedangkan data cross section tidak [5].
-
Estimasi Parameter pada Regresi Semiparametrik untuk Data Longitudinal
3
II.2 Model Semiparametrik Untuk Data Longitudinal
Regresi semiparametrik adalah gabungan antara regresi parametrik dan regresi
nonparametrik. Model regresi semiparametrik dapat ditulis sebagai berikut :
( ) , 1, 2, ...,Ti i i i
y X f t i n (1)
dimana i
y adalah variabel respon ke -i , iX adalah komponen parametrik, ( )if t adalah fungsi regresi
dan i
adalah error random, dimana 2(0, )i
N . Regresi semiparametrik untuk data longitudinal
dapat ditulis dengan :
( ) , 1, 2,..., ; 1, 2,...,Tij ij ij ij i
y X f t i n j n (2)
dimana terdapat n subjek dengan subjek ke-i mempunyai ni observasi menurut waktu. yij , i = 1,...,n,
j = 1,...,ni merupakan respon untuk subjek ke-i pada waktu ke-j. 1 2( , , ..., )T
p adalah vektor
1p pada koefisien regresi parametrik i
X , dengan Tij
X diasumsikan tidak mempunyai intersep,
( )ij
f t adalah fungsi yang terdeferensiabel dua kali dengan panjang periode sama dengan P dan ij
adalah eror random yang saling bebas dengan mean 0 dan variansi 2 R .
III. PEMBAHASAN
Asumsi data mengikuti model pada persamaan (2) dengan 2m
Wf dan 20N ( , R) .
Estimasi parameter pada model regresi semiparametrik untuk data longitudinal, diperoleh dengan
cara memaksimumkan Penalized Log Likelihood (PLL). Misalkan 1
n
i
i
N n
dan 2V R maka
fungsi distribusi dari adalah
12
1 1( ) exp
2(2 )
T
Nf
V
V
(3)
selanjutnya akan dicari distribusi dari y = X + f + dengan metode Moment Generate Function
(MGF) diperoleh :
-
JIMT, Vol 5 No. 2, Nopember 2008 : 60-64:
4
2
( ) [exp( )]
[exp{ ( )}]
exp( ( )) [exp( )]1
exp( ( )) exp( )2
1exp( ( ) )
2
T
y
T
T T
T T
T T
M E
E
E
2
t t y
t X + f +
t X + f t
t X + f t Rt
t X + f t Rt
sehingga dari metode MGF diatas diperoleh 2( , )N y X + f R . Berikut diberikan fungsi likelihood
dari y adalah:
12 1( , , ) (2 ) exp 2N
T
f y V V (4)
dengan y X f . Selanjutnya, untuk estimasi parameter dan fungsi f didapat dari
memaksimumkan PLL. Diketahui fungsi log likelihood ( , , ) f y dari model semiparametrik tersebut
adalah :
11
log ( ) log(2 ) log ( ) ( )2 2 2
TN N , f, y ( V ) y X f V y X f (5)
Selanjutnya, fungsi PLL untuk model (2) dapat ditulis dengan :
2( , ) [ ]2
b
a
PLL dt
'' f, y f (t) (6)
dimana ( , ) f, y merupakan fungsi likelihood, 0 merupakan parameter smoothing dan 2[ ]b
a
dt ''f (t)
merupakan fungsi penalti. Persamaan (6) dapat disederhanakan dengan :
1 1 1
1 1 1
1log(2 ) log( ) ( 2 2
2 2 2
2 )2
T T T
T T T T T T
N NPLL
V y V y y V X y V f
X V X X V f + f V f f Kf
(7)
Dengan membuat 0PLL
akan diperoleh :
-
Estimasi Parameter pada Regresi Semiparametrik untuk Data Longitudinal
5
1 1 1
1 1 1
12 2 2 0
2
0 (8)
T T T
T T T
y V X X V X X V f
X V y X V X X V f
Selanjutnya dengan membuat 0PLL
f
akan diperoleh :
1 1 11 1 1
1 1
1 1 1
12 2 2 0
20
( ) ( )
( ) ( ) (9)
T T T T T
T T T T
T
T
y V X V f V f K
y V X V V f K f
V K f V y X
f V K V y X
Untuk memperoleh estimator , substitusi (9) ke (8) :
1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
( ) ( )
( ) ( )
( ) ( )
(10)
T T T T
T T T T T T
T T T T T T
T T
-1
-1
X V y X V X-X V K V y X = 0
X V X X V K V X = X V X V K V y
= X V X X V K V X XV X V K V y
= X PX X Py
dimana 1 1 1 1( )T P = V V K V
Substitusi (10) ke (9), diperoleh :
1 1 1
1 1 1
( )
( ) (11)
T T T
T T T
-1
-1
f = V K V y - X X PX X Py
f V K V I - X X PX X P y
Untuk mendapatkan matrik ( )A , substitusi (10) dan (11) ke :
1 1 1
1 1 1
1 1 1 1 1 1
( )
( )
( ) ( )
( )
T T T T T
T T T T T
T T T T
-1 -1
-1 -1
-1
y X f
X X PX XPy V K V I-X X PX X P y
X XPX X P V K V I-X X PX XP y
I V K V X XPX X P V K V y
A y
dimana 1 1 1( ) ( )T T T -1A I V K V X X PX X P
-
JIMT, Vol 5 No. 2, Nopember 2008 : 60-64:
6
IV. KESIMPULAN
Diberikan model ( )ij i ij ij
y f t X dimana 1, 2, ..., , 1, 2, ...,i
i n j n . Error random
berdistribusi normal dengan mean nol dan variansi V . Berdasarkan analisis yang dilakukan dapat
disimpulkan dalam estimasi model semiparametrik yaitu estimasi parameter untuk komponen
parametrik diperoleh :
1 T T
X PX X Py
dan estimasi komponen nonparametrik diperoleh :
1 1 1 ( )T T T -1f V K V I - X X PX X P y dimana 1 1 1 1 1( )T P = V V V K V
V. DAFTAR PUSTAKA
[1] Engle, R. F., Granger, C. W. J., Rice, J., dan Weiss, A. 1986. Semiparametric Estimates of The
Relation Between Weather and Electricity Sales, Journal of the American Statistical
Association. Vol. 81, hal 310-320.
[2] Srinadi, I.A.M. 2002. Estimator Spline pada Model Semiparametrik. Tesis. Surabaya: Institut
Teknologi Sepuluh Nopember.
[3] Mulianah. 2006. Pendekatan Kernel dalam Regresi Semiparametrik dan Pemilihan Bandwith
Optimal. Tesis. Surabaya : Institut Teknologi Sepuluh Nopember.
[4] Ampa, A. T. 2006. Model Linier Parsial Pada Hilangnya Data Komponen Parametri. Tesis.
Surabaya : Institut Teknologi Sepuluh Nopember.
[5] Kuswanto, H. 2005. Model Gamma-Frailty Untuk Data Longitudinal dan Pendugaan Korelasi
Serial dengan Metode Composite Likelihood, Tesis. Surabaya : Institut Teknologi Sepuluh
Nopember.