Post on 30-Nov-2015
PENCOCOKAN MODEL ADITIF TERGENERALISIR SEMIPARAMETRIK MENGGUNAKAN PENDEKATAN
ESTIMATOR SPLINE
ARTIKEL ILMIAH
Artikel Ilmiah Ini Diambil Dari Sebagian Skripsi Untuk Memenuhi Persyaratan Penyelesaian Program Sarjana Sains Jurusan Matematika Fakultas Matematika
dan Ilmu Pengetahuan Alam Universitas Jember
Oleh :
EKA WIDI HANDAYANINIM 011810101124
JURUSAN MATEMATIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS JEMBER2006
PENGESAHAN
Artikel ini diterima oleh Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas
Jember pada :
Hari :
Tanggal :
Tempat : Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Jember
Dosen Pembimbing,
Ketua
(Dosen Pembimbing Utama)
Sekretaris
(Dosen Pembimbing Anggota)
Drs. I Made Tirta, M.Sc., Ph.D.
NIP 131 474 500
Drs. Budi Lestari, PGD.Sc., M.Si.
NIP 131 945 800
PENCOCOKAN MODEL ADITIF TERGENERALISIR SEMIPARAMETRIK MENGGUNAKAN PENDEKATAN
ESTIMATOR SPLINE
Fitting of Generalized Additive Semiparametric Models Using Spline Estimator Approach
Eka Widi Handayani1, I Made Tirta2, Budi Lestari2
1 Mahasiswa Jurusan Matematika FMIPA Universitas Jember2 Staf Pengajar Jurusan Matematika FMIPA Universitas Jember
ABSTRACTGeneralized Additive Semiparametric Model is an analysis model by using both parametric and nonparametric approaches. The parametric component is determinated by scatterplot smoother and determinant coefficient, , i.e., by large value of determinant coefficient means that we can use a linear model (parametric model) approach. In this paper, we investigate the estimate model by using spline estimator which is applied to the evaporation data. The result showed that moisturizer and wind speed give a significant influence to the evaporation. Key Words: Generalized Additive Semiparametric Model, Scatterplot Smoother,
Determinant Coefficient, Spline
ABSTRAKModel aditif tergeneralisir semiparametrik merupakan model analisis dengan menggunakan pendekatan parametrik dan nonparametrik. Penentuan komponen parametrik dan nonparametrik dilakukan dengan menggunakan scatterplot smoother dan koefisien determinasi , dengan koefisien determinasi yang besar menunjukkan model yang lebih cocok jika didekati dengan menggunakan pendekatan linier (parametrik). Tulisan ini bertujuan untuk mengetahui bentuk estimasi model menggunakan estimator spline dan aplikasinya pada data evaporasi. Dari hasil penelitiam diperoleh bahwa kelembaban dan kecepatan angin memberikan pengaruh yang signifikan terhadap evaporasi.
Kata Kunci: Model Aditif Tergeneralisir Semiparametrik, Scatterplot Smoother, Koefisien Determinasi, Spline
1
PENDAHULUAN
Kondisi data riil di lapangan yang sangat kompleks mendorong munculnya
berbagai macam model baru yang lebih fleksibel seperti model aditif tergeneralisir
(Generalized Additive Model) yang digunakan untuk mengidentifikasi dan
mengelompokkan fungsi nonlinier. Model ini diasumsikan berdistribusi keluarga
eksponensial dan memiliki fungsi link. Hastie (1990) menyebutkan bahwa metode
penghalusan dan algoritma yang digunakan dalam pencocokan model ini terdiri dari
penghalus diagram pencar (scatterplot smoother), algoritma backfitting, dan algoritma
local scoring. Adapun metode penghalusan yang dapat memberikan suatu hasil analisis
numerik yang lebih baik menurut Hastie (1990) adalah penghalus spline. Oleh karena itu
dalam tulisan ini metode penghalusan yang digunakan adalah metode penghalusan
spline (smoothing spline method) dan permasalahan yang dibahas dalam penelitian ini
yakni mengetahui bentuk estimasi dan penghalus spline serta aplikasinya pada data
evaporasi (penguapan).
TINJAUAN PUSTAKA
Model linier paling sederhana menurut Ratih (2000) adalah model regresi linier
sederhana yang hanya melibatkan satu variabel respon dan satu variabel prediktor.
Model linier diformulasikan sebagai berikut:
(1)
dengan adalah variabel respon; sebagai variabel prediktor;
merupakan koefisien linier; dan e adalah galat (error). Model ini
kemudian digeneralisir menjadi model linier tergeneralisir (Generalized Linear Model)
untuk memenuhi suatu kondisi ketika variabel respon tidak berdistribusi normal tetapi
masih saling bebas. Sehingga menurut Tirta (2003), komponen-komponen penting
dalam model linier tergeneralisir yaitu prediktor linier; distribusi keluarga eksponensial
dan fungsi hubungan yang differensiabel.
2
Model aditif (Additive Model), menurut Hastie dan Tibshirani (1990), merupakan
generalisasi atau bentuk pengembangan dari model linier pada persamaan (1). Sama
dengan model linier, model aditif juga diasumsikan berdistribusi normal dengan fungsi
yang tidak harus linier. Prediktor pada model aditif disebut dengan prediktor aditif.
Model aditif dapat ditulis sebagai berikut:
(2)
dengan adalah fungsi dari prediktor; dan e adalah galat. Menurut Bashet
dan Bishop (2005), model aditif disebut sebagai model nonparametrik jika koefisien
linier dalam persamaan (1) digantikan oleh penghalus .
Sehingga model aditif juga dapat dituliskan dalam bentuk persamaan sebagai berikut:
(3)
dengan , untuk , sebagai fungsi licin (smooth function). Model
aditif dapat dikombinasikan sebagai model semiparametrik .
Model aditif dapat digunakan untuk menganalisis hampir semua jenis data, tetapi
terdapat beberapa macam persoalan yang tidak tepat jika diselesaikan dengan
menggunakan model aditif seperti pada persamaan (2). Misalnya, distribusi normal tidak
tepat untuk data diskrit yang didapat dari hasil pencacahan, sehingga diperlukan model
baru dengan bentuk distribusi yang lebih luas dan fleksibel yakni model aditif
tergeneralisir yang menggeneralisir model aditif ke dalam bentuk distribusi keluarga
eksponensial selain distribusi normal. Model aditif tergeneralisir juga memuat
komponen acak, komponen tetap yakni prediktor aditif dan fungsi link yang
menghubungkan komponen acak dengan prediktor aditif tersebut. Model ini mirip
dengan model linier tergeneralisir, kecuali jika fungsi licinnya digunakan untuk
menggantikan parameter regresinya. Salah satu aspek yang unik dari model aditif
tergeneralisir adalah fungsi nonparametrik yang diestimasi menggunakan penghalus
diagram pencar yang merupakan pondasi dari algoritma model aditif tergeneralisir.
Berikut diberikan contoh penghalus diagram pencar dalam bentuk sederhana (Gambar 1)
3
yang mengindikasikan bagaimana penghalus diagram pencar digunakan untuk
menggambarkan estimasi pada model aditif tergeneralisir.
Gambar 1: Ilustrasi Penghalus Spline. Gambar kiri menunjukkan diagram pencar samaran dari plot variabel respon terhadap variabel prediktor X. Gambar kanan, penghalus diagram pencar telah ditambahkan untuk menggambarkan kecenderungan (trend) variabel respon terhadap variabel prediktor X (Sumber: Hastie dan Tibshirani, 2004).
Hastie dan Tibshirani (1990), membahas berbagai macam penghalus diagram
pencar. Salah satu dari penghalus diagram pencar tersebut adalah penghalus spline yang
merupakan solusi dari:
(4)
dengan adalah parameter penghalus dalam interval . Nilai besar akan
menghasilkan kurva yang mulus, sedangkan kecil akan menghasilkan gambar kurva
yang kasar. Suku pertama pada persamaan (4) digunakan untuk mengukur kerapatan
data, sedangkan suku kedua memperlihatkan kurva suatu fungsi. Salah satu penghalus
spline adalah spline kubik dengan titik perubahan yang terjadi di dalam suatu kurva
disebut dengan titik knots. Model spline kubik dapat dituliskan sebagai berikut
(Budiantara dan Subanar, 1997):
(5)
dengan,
4
Dalam model aditif tergeneralisir terdapat dua algoritma perulangan terpisah
yang digunakan yaitu algoritma backfitting (innerloop) dan algoritma local scoring
(outerloop). Algoritma backfitting merupakan algoritma perulangan yang digunakan
untuk mengestimasi model aditif dengan menggunakan beberapa tipe regresi penghalus,
Algoritma ini dimulai dengan memberikan fungsi inisial . Masing-masing
iterasi berputar melalui residu parsial dan mengestimasi komponen-komponen fungsi
licin ke dalam residu parsialnya sampai komponen dari fungsi licin tidak berubah atau
sudah memenuhi kriteria kekonvergenan. Dengan cara yang sama, estimasi bentuk aditif
pada persamaan (3) diselesaikan dengan mengganti regresi linier terbobot
dalam regresi variabel dependen biasa dengan algoritma backfitting terbobot untuk
mengestimasi model aditif terbobot yang dikenal dengan algoritma local scoring.
Algoritma ini dimulai dengan mengestimasi fungsi inisial dan selama
masing-masing iterasi, variabel dependen biasa dan bobot dihitung, kemudian fungsi
licin diestimasi dengan menggunakan algoritma backfitting terbobot hingga memenuhi
kriteria kekonvergenan. Dalam pemilihan parameter penghalus terdapat beberapa
metode yang digunakan yakni validasi silang (Cross Validation) sebagai berikut:
(6)
dengan menyatakan kecocokan pada saat (Hastie dan Tibshirani, 1990).
Karena memerlukan waktu yang lama untuk menghitung jumlah maka Wahba (1990)
memperkenalkan generalisir dari validasi silang yakni validasi silang tergeneralisir
(Generalized Cross Validation) dan didefinisikan sebagai berikut:
(7)
Dalam GCV tidak terdapat elemen diagonal seperti pada formula validasi silang, dan
diganti dengan . Selain itu juga digunakan statistik AIC (Akaike Information
Criterion) yang diformulasikan sebagai berikut:
5
(8)
nilai perhitungan statistik AIC yang lebih kecil menunjukkan formulasi model yang lebih
bagus. Model semiparametrik merupakan model gabungan antara model parametrik
dengan nonparametrik. Misal diberikan suatu model , model ini disebut
sebagai model parametrik jika fungsi jelas atau diketahui. Model parametrik ini
didasarkan pada asumsi-asumsi yang mengikuti suatu bentuk distribusi tertentu.
Sebaliknya, jika fungsi tidak didasarkan pada suatu bentuk distribusi tertentu dengan
hubungan fungsi yang juga tidak diketahui, linier atau tidak, maka model ini disebut
sebagai model nonparametrik. Sehingga model semiparametrik dapat ditulis sebagai
berikut (Hastie dan Tibshirani, 1990):
(9)
METODE PENELITIAN
Ada dua macam sumber data yang digunakan dalam penelitian ini yakni data
simulasi yang dibangkitkan melalui program R dan data riil yang merupakan data
sekunder mengenai agroklimatologi (evaporasi, kelembaban, dan kecepatan angin) dari
sub proyek Pekalen, Sampean, bulan November 2004. Data riil ini diperoleh dari Kantor
Pengairan Kabupaten Jember dengan komponen sebagai berikut:
a. data evaporasi sebagai variabel responnya ( );
b. data kecepatan angin ( ) dan kelembaban ( ) sebagai variabel prediktornya.
Dalam analisis data, proses pertama yang dilakukan adalah menyusun data sampel
observasi. Data tersebut dijadikan sebagai input program yang kemudian akan
dijalankan dalam paket R. Secara umum langkah-langkah penyusunan data tersebut
yakni melakukan identifikasi data dan melakukan analisis data dengan prosedur GAM.
Sebelum menganalisis data riil, terlebih dahulu dilakukan analisis data simulasi yang
dibangkitkan melalui program paket R dengan langkah-langkah sebagai berikut:
a. membangkitkan variabel prediktor ;
6
b. membangkitkan nilai estimasi untuk komponen parametrik;
c. membangkitkan fungsi licin untuk komponen nonparametrik;
d. membangkitkan nilai galat;
e. membangkitkan nilai variabel respon ;
f. melihat ukuran letak data;
g. melihat sebaran distribusi data simulasi;
h. melihat dan memeriksa kelinieran data simulasi;
i. menganalisis model menggunakan prosedur dalam GAM.
Sedangkan langkah-langkah untuk menganalisis data riil yakni:
a. memasukkan data pengamatan dalam paket R;
b. melihat ukuran letak data dan sebaran data;
c. melakukan identifikasi data pengamatan, melihat komponen parametrik dan
nonparametrik data dengan melihat kelinieran melalui scatterplot data;
d. menganalisis data riil menggunakan prosedur GAM;
e. melihat sebaran data riil;
f. melakukan uji hipotesis, hipotesis ditolak ketika nilai-P kurang dari ;
g. mengambil keputusan dan kesimpulan.
HASIL DAN PEMBAHASAN
Data simulasi yang dibangkitkan melalui program paket R digunakan untuk
menguji teori-teori dan asumsi-asumsi yang ada dalam penelitian ini. Setelah asumsi-
asumsi yang ada terpenuhi selanjutnya teori-teori tersebut diterapkan dalam analisis data
riil. Ada dua macam variabel prediktor dalam analisis data simulasi, yakni variabel
prediktor dan . Variabel prediktor dimodelkan secara parametrik sedangkan
variabel prediktor dimodelkan secara nonparametrik. Jumlah sampel pengamatan
yang dibangkitkan dalam penelitian ini ada 30 sampel (n=30) dengan simpangan baku
. Untuk menunjukkan adanya korelasi atau hubungan antara variabel prediktor
dengan variabel respon pada data simulasi digunakan perintah scatterplot matrix sebagai
berikut:
7
scatterplot.matrix(~y+x1+x2,reg.line=lm,smooth=TRUE,diagonal='histogram')
Perintah scatterplot matrix di atas memberikan hasil seperti pada Gambar 2 berikut ini.
Gambar 2 Scatterplot Matrix Data Simulasi
Pada Gambar 2, diagonal gambar menunjukkan histogram data sedangkan luar
diagonal menunjukkan scatterplot dari data simulasi. Dalam scatterplot matrix tersebut,
hubungan antara variabel prediktor dengan variabel respon lebih cocok jika
digunakan pendekatan linier karena data menyebar lurus mengikuti garis regresinya,
sedangkan hubungan antara variabel prediktor dengan variabel respon lebih cocok
jika digunakan pendekatan nonlinier. Hasil tersebut menunjukkan bahwa dalam analisis
selanjutnya variabel prediktor dimodelkan sebagai komponen parametrik dan
variabel prediktor sebagai komponen nonparametrik yang diestimasi menggunakan
penghalus spline. Pada data simulasi akan digunakan perbandingan dari beberapa titik
knots guna mencari model spline optimal. Tabel 1 berikut menyajikan ringkasan statistik
nilai GCV dengan berbagai titik knots untuk memperoleh model spline optimal.
Tabel 1 Nilai GCV Untuk Berbagai Titik Knots Pada Data Simulasi
Model Pendekatan Nilai GCV Nilai
Spline dengan knots 0,3 4,5450 0,357
Spline dengan knots 0,7 4,3344 0,387
Spline dengan knots 0,8 4,3298 0,388
Spline dengan knots 0,3 dan 0,7 4,7078 0,362
8
xFr
eque
ncy
y
0.0 0.2 0.4 0.6 0.8
48
1216
0.0
0.4
0.8
x
Freq
uenc
y
x0
4 6 8 10 12 14 16 0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.4
0.8
x
Freq
uenc
y
x1
Spline dengan knots 0,3 dan 0,8 4,7078 0,362
Spline dengan knots 0,7 dan 0,8 4,7144 0,361
Spline dengan knots 0,3; 0,7 dan 0,8 5,1444 0,333
Catatan: Hasil diperoleh dengan menggunakan program R
Dari bermacam-macam model pendekatan spline yang diberikan pada Tabel 1
didapat model spline optimal dengan titik knots 0,8 (cetak tebal) karena memiliki nilai
GCV minimum yakni sebesar 4,3298. Ringkasan statistik model spline optimal dengan
titik knots 0,8 untuk komponen parametrik dan nonparametrik disajikan pada
Tabel 2 berikut ini.
Tabel 2 Ringkasan Statistik Model Spline Optimal Untuk Komponen Parametrik dan Nonparametrik
Parameter Estimasi Standar Kesalahan Nilai t Nilai-P
7,99 1,81 4,42 0,02x10-2 ***
0,94 1,48 0,63 0,53
-0,34 4,24 -0,08 0,94
-4,23 3,89 -1,09 0,29
6,40 3,27 1,96 0,06 .
2,86 2,41 1,19 0,25
Catatan:1. hasil diperoleh dengan menggunakan program R (umum);2. angka yang ada sudah merupakan pembulatan sampai dua tempat desimal (khusus);. signifikan pada 10%, *** signifikan pada 0,1%.
Ringkasan analisis pada Tabel 2 memberikan model spline kubik dengan titik knots
optimal 0,8 sebagai berikut:
dengan,
9
Model spline kubik tersebut memiliki nilai koefisien determinasi sebesar
sebesar 38,8% yang berarti bahwa variabel prediktor dan mampu menjelaskan
38,8% dari variabel respon . Berikut diberikan Gambar 3 yang menunjukkan gambar
penghalus spline untuk data simulasi.
Gambar 3 Penghalus Spline Dengan Titik Knots Optimal Pada Data Simulasi
Ringkasan Analisis Variansi untuk model spline kubik optimal dengan titik knots
optimal 0,8 diberikan pada Tabel 3 berikut ini.
Tabel 3 ANOVA Untuk Model Spline Pada Data Simulasi
Sumber Variasi
Derajat bebas
Jumlah kuadrat
Rata-rata jumlah kuadrat
Nilai F Nilai-P
1 19,69 19,69 5,68 0,03 *
4 61,22 15,31 4,42 0,01 **
Residual 24 83,13 3,46
Total 29 164,04
Catatan: 1. hasil diperoleh dengan menggunakan program R (umum);2. angka yang ada sudah merupakan pembulatan sampai dua tempat desimal (khusus);* signifikan pada 5%, ** signifikan pada 1%.Dari Tabel 3, nilai-P untuk variabel prediktor sebesar 0,03 dan sebesar 0,01.
Nilai-P kedua variabel prediktor dan kurang dari tingkat signifikansi
sehingga ditolak. Jadi dapat disimpulkan bahwa variabel prediktor dan
memberikan pengaruh yang signifikan terhadap variabel respon .
Data riil dalam penelitian ini merupakan data sekunder mengenai
agroklimatologi (evaporasi, kecepatan angin dan kelembaban) dari Sub Proyek Pekalen
Sampean, bulan November 2004. Dalam penelitian ini, diduga bahwa kecepatan angin
10
0.2 0.4 0.6 0.8 1.0
-4-2
02
4
x1
pa
rtia
l fo
r x1
0.0 0.2 0.4 0.6 0.8
-4-2
02
46
x2
bs(x
2, kn
ots
= 0
.8)
dan kelembaban memberikan pengaruh pada tingkat evaporasi. Menurut Bayong (1999),
agroklimatologi merupakan terapan dari ilmu klimatologi yang merupakan suatu ilmu
yang mencari gambaran dan penjelasan mengenai iklim. Dalam penelitian ini model
yang digunakan adalah model semiparametrik yang merupakan suatu model gabungan
antara model parametrik dan model nonparametrik, sehingga sebelum dilakukan analisis
model harus dilakukan eksplorasi data terlebih dahulu guna mengetahui hubungan
kelinieran atau adanya korelasi antar variabel yang dilakukan dengan menggunakan
scatterplot smoother. Perintah scatterplot matrix pada paket R adalah sebagai berikut:
scatterplot.matrix(~kec.angin+kelembaban+evp,reg.line=lm, smooth=TRUE, diagonal = 'histogram', data=cuaca)
Perintah scatterplot matrix di atas memberikan hasil seperti pada Gambar 4 berikut ini:
Gambar 4 Scatterplot Matrix Data Evaporasi
Pada Gambar 4, diagonal gambar menunjukkan histogram dari data sedangkan di
luar diagonal menunjukkan gambar scatterplot dari masing-masing variabel prediktor
dengan variabel responnya. Pada Gambar 4 ditunjukkan bahwa scatterplot antara
evaporasi dengan kecepatan angin menunjukkan hubungan yang lebih cocok jika
digunakan pendekatan linier, sedangkan scatterplot antara evaporasi dengan kelembaban
lebih cocok jika digunakan pendekatan nonlinier. Sehingga dapat disimpulkan bahwa
kecepatan angin dimodelkan secara parametrik dan kelembaban secara nonparametrik
yang akan diestimasi menggunakan penghalus spline. Selain itu, sebagai perbandingan
untuk menentukan komponen parametrik dan nonparametrik dapat juga digunakan
perbandingan nilai koefisien determinasi , dengan nilai lebih besar menunjukkan
11
x
Freq
uenc
y
ev aporasi
83 84 85 86 87 88
24
6
8385
87
x
Freq
uenc
y
kelembaban
2 3 4 5 6 7 20 30 40 50 60 70
2040
60
x
Freq
uenc
y
kec.angin
variabel prediktor lebih linier yang kemudian dimodelkan secara parametrik dan
demikian sebaliknya. Hasil analisis menunjukkan bahwa nilai koefisien determinasi
untuk variabel prediktor kecepatan angin adalah sebesar 0,567; sedangkan untuk
kelembaban adalah sebesar 0,37. Oleh karena itu format model untuk data riil yakni:
gam.1<-gam(evp~s(kelembaban)+ kec.angin).
Untuk mempermudah dalam menentukan model spline optimal maka digunakan
titik knots yang juga dipilih dengan menggunakan metode GCV. Tabel 4 berikut
menyajikan ringkasan statistik nilai GCV dari data evaporasi dengan menggunakan
berbagai model pendekatan spline dari titik knots ekstrem berbeda untuk memperoleh
model spline optimal.
Tabel 4 Nilai GCV Model Spline Untuk Berbagai Titik Knots Pada Data Evaporasi
Model Pendekatan Nilai GCV Nilai
Spline dengan knots 82,5 1,11380 0,684
Spline dengan knots 84,7 1,19720 0,674
Spline dengan knots 86,7 1,12280 0,694
Spline dengan knots 87,5 0,99664 0,729
Spline dengan knots 82,5 dan 84,7 1,19720 0,674
Spline dengan knots 82,5 dan 86,7 1,12280 0,694
Spline dengan knots 82,5 dan 87,5 0,99664 0,729
Spline dengan knots 84,7 dan 86,7 1,19110 0,689
Spline dengan knots 84,7 dan 87,5 1,05400 0,725
Lanjutan Tabel 4
Spline dengan knots 86,7 dan 87,5 0,97296 0,746
Spline dengan knots 82,5; 86,7 dan 87,5 0,97296 0,746
Catatan: Hasil diperoleh dengan menggunakan program R
12
Dari Tabel 4 didapat model spline optimal (cetak tebal) untuk titik knots 82,5; 86,7 dan
87,5 dengan nilai GCV minimum yakni sebesar 0,97296. Ringkasan statistik untuk
model spline kubik dengan titik knots optimal dapat dilihat pada Tabel 5 berikut ini.
Tabel 5 Ringkasan Statistik Model Spline Optimal Untuk Data Kecepatan Angin dan Kelembaban
Parameter Estimasi Standar Kesalahan Nilai t Nilai-P
1,73 0,55 3,14 0,46x10-2 **
0,07 0,02 3,65 0,13x10-2 **
0,93 0,46 2,02 0,06 .
3,48 1,45 2,41 0,02 *
-0,61 1,73 -0,35 0,73
0,85 1,37 0,62 0,54
-3,94 1,34 -2,95 0,01 **
1,02 0,78 1,30 0,21
Catatan:1. hasil diperoleh dengan menggunakan program R (umum);2. angka yang ada sudah merupakan pembulatan sampai dua tempat desimal (khusus);. signifikan pada 10%, * signifikan pada 5%, ** signifikan pada 1%.
Hasil ringkasan analisis pada Tabel 5 memberikan model spline kubik dengan titik-titik
knots optimal 82,5; 86,7 dan 87,5 sebagai berikut:
dengan,
dan,
13
Gambar penghalus spline dengan titik knots optimal dapat dilihat pada Gambar 5
berikut ini.
(a) (b)
Gambar 5 Penghalus Spline dengan Titik Knots Optimal Pada Data Evaporasi
Model spline kubik dengan titik knots optimal yang diberikan pada Gambar 5
memberikan nilai koefisien determinasi sebesar 0,746 atau sebesar 74,6%, hal ini
menunjukkan bahwa variabel kelembaban dan kecepatan angin mampu menjelaskan
74,6% tingkat evaporasi pada Sub Proyek Pekalen Sampean. Dengan demikian dapat
dinyatakan bahwa perubahan pola data evaporasi pada tiga titik knots yakni 82,5; 86,7
dan 87,5 cukup signifikan. Dari Gambar 5 (b) terlihat bahwa model spline optimal
mengestimasi tingkat evaporasi yang naik sampai pada tingkat kelembaban 82,5% dan
86,7%, kemudian menurun hingga pada tingkat kelembaban lebih dari 87,5%, model
spline optimal mengestimasi kembali kenaikan tingkat evaporasi. Ringkasan Analisis
Variansi model spline kubik optimal dengan titik knots optimal dapat dilihat dalam
Tabel 6 berikut ini.
Tabel 6 ANOVA Untuk Model Spline Optimal Pada Data Evaporasi
Sumber Variasi
Derajat bebas
Jumlah kuadrat
Rata-rata jumlah kuadrat
Nilai F Nilai-P
Kecepatan angin
1 49,58 49,58 66,46 3,09e-08 ***
Kelembaban 5 18,52 3,70 4,97 0,31x10-2 **
Residual 23 17,16 0,75
Total 29 85,26
Catatan:
14
20 30 40 50 60 70
-2-1
01
23
kec.angin
pa
rtia
l fo
r ke
c.a
ng
in
83 84 85 86 87 88
-5-3
-10
12
kelembaban
bs(k
ele
mb
ab
an, kno
ts =
c(8
2.5
, 8
6.7
, 8
7.5
))
1. hasil diperoleh dengan menggunakan program R (umum);2. angka yang ada sudah merupakan pembulatan sampai dua tempat desimal (khusus);** signifikan pada 1%, *** signifikan pada 0,1%.
Ringkasan Analisis Variansi model spline kubik pada Tabel 4.6 diperoleh nilai-P
untuk variabel kecepatan angin adalah sebesar 3,09e-08 dan kelembaban sebesar
0,31x10-2. Nilai-P kedua komponen tersebut kurang dari tingkat signifikansi
sehingga ditolak. Jadi dapat disimpulkan bahwa kecepatan angin dan kelembaban
memberikan pengaruh yang signifikan terhadap tingkat evaporasi.
KESIMPULAN
Kesimpulan yang dapat diperoleh dari penelitian ini yakni estimasi model aditif
tergeneralisir semiparametrik dengan penghalus spline adalah sebagai berikut:
.
dengan adalah titik knots optimal yang diperoleh melalui nilai GCV minimum. Model
semiparametrik merupakan suatu model gabungan antara model dengan pendekatan
parametrik (linier) dan nonparametrik. Eksplorasi komponen parametrik dan
nonparametrik dilakukan dengan menggunakan scatterplot smoother dan koefisien
determinasi R2, dengan nilai koefisien determinasi R2 yang lebih besar menunjukkan
model yang lebih cocok jika digunakan pendekatan parametrik dan sebaliknya. Hasil
analisis pada data evaporasi menunjukkan bahwa model aditif tergeneralisir
semiparametrik memberikan model sebagai berikut:
dengan tiga titik knots optimal yakni 82,5; 86,7 dan 87,5 dan koefisien determinasi
sebesar 74,6%. Dengan demikian dapat disimpulkan bahwa kecepatan angin dan tingkat
kelembaban 82,5%; 86,7% dan 87,5% mampu menjelaskan 74,6% tingkat evaporasi
pada Sub Proyek Pekalen Sampean.
15
DAFTAR PUSTAKA
Basset, P. A. dan Bishop, G. 2005. Generalized Additive Models. http://www.bioss.sari.ac/. [3 Agustus 2005]
Bayong, T. 1999. Klimatologi Umum. Bandung: ITB
Budiantara, I. N dan Subanar. 1997. Regresi Spline dan Permasalahannya, Majalah Berkala Penelitian Pasca Sarjana, Jilid 10. Yogyakarta: UGM
Hastie, T. 1990. Generalized Additive Models. Bab 7 dari Statistical Models in S eds J. M. Chambers dan T. Hastie, Wadsworth & Brooks/Cole.
Hastie, T dan Tibshirani, R. 1990. Generalized Additive Models. London: Chapman and Hall.
Hastie, T dan Tibshirani, R. 2004. GAM: Generalized Additive Models. http://www-stat.stanford.edu/. [29 Agustus 2005].
Ratih, R. 2000. Inferensi Pada Model-Model Linier Tergeneralisasi, Majalah Matematika Dan Statistika, Volume 1. FMIPA, Universitas Jember.
Tirta, I. M. 2003. Model Statistika Linier. Jurusan Matematika, FMIPA, Universitas Jember.
Wahba, G. 1990. Spline Models For Observational Data. Philadelphia: Society for Industrial And Applied Mathematics.
16