Artikel Skripsiku

28
PENCOCOKAN MODEL ADITIF TERGENERALISIR SEMIPARAMETRIK MENGGUNAKAN PENDEKATAN ESTIMATOR SPLINE ARTIKEL ILMIAH Artikel Ilmiah Ini Diambil Dari Sebagian Skripsi Untuk Memenuhi Persyaratan Penyelesaian Program Sarjana Sains Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Jember Oleh : EKA WIDI HANDAYANI NIM 011810101124

Transcript of Artikel Skripsiku

Page 1: Artikel Skripsiku

PENCOCOKAN MODEL ADITIF TERGENERALISIR SEMIPARAMETRIK MENGGUNAKAN PENDEKATAN

ESTIMATOR SPLINE

ARTIKEL ILMIAH

Artikel Ilmiah Ini Diambil Dari Sebagian Skripsi Untuk Memenuhi Persyaratan Penyelesaian Program Sarjana Sains Jurusan Matematika Fakultas Matematika

dan Ilmu Pengetahuan Alam Universitas Jember

Oleh :

EKA WIDI HANDAYANINIM 011810101124

JURUSAN MATEMATIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS JEMBER2006

Page 2: Artikel Skripsiku

PENGESAHAN

Artikel ini diterima oleh Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas

Jember pada :

Hari :

Tanggal :

Tempat : Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Jember

Dosen Pembimbing,

Ketua

(Dosen Pembimbing Utama)

Sekretaris

(Dosen Pembimbing Anggota)

Drs. I Made Tirta, M.Sc., Ph.D.

NIP 131 474 500

Drs. Budi Lestari, PGD.Sc., M.Si.

NIP 131 945 800

Page 3: Artikel Skripsiku

PENCOCOKAN MODEL ADITIF TERGENERALISIR SEMIPARAMETRIK MENGGUNAKAN PENDEKATAN

ESTIMATOR SPLINE

Fitting of Generalized Additive Semiparametric Models Using Spline Estimator Approach

Eka Widi Handayani1, I Made Tirta2, Budi Lestari2

1 Mahasiswa Jurusan Matematika FMIPA Universitas Jember2 Staf Pengajar Jurusan Matematika FMIPA Universitas Jember

ABSTRACTGeneralized Additive Semiparametric Model is an analysis model by using both parametric and nonparametric approaches. The parametric component is determinated by scatterplot smoother and determinant coefficient, , i.e., by large value of determinant coefficient means that we can use a linear model (parametric model) approach. In this paper, we investigate the estimate model by using spline estimator which is applied to the evaporation data. The result showed that moisturizer and wind speed give a significant influence to the evaporation. Key Words: Generalized Additive Semiparametric Model, Scatterplot Smoother,

Determinant Coefficient, Spline

ABSTRAKModel aditif tergeneralisir semiparametrik merupakan model analisis dengan menggunakan pendekatan parametrik dan nonparametrik. Penentuan komponen parametrik dan nonparametrik dilakukan dengan menggunakan scatterplot smoother dan koefisien determinasi , dengan koefisien determinasi yang besar menunjukkan model yang lebih cocok jika didekati dengan menggunakan pendekatan linier (parametrik). Tulisan ini bertujuan untuk mengetahui bentuk estimasi model menggunakan estimator spline dan aplikasinya pada data evaporasi. Dari hasil penelitiam diperoleh bahwa kelembaban dan kecepatan angin memberikan pengaruh yang signifikan terhadap evaporasi.

Kata Kunci: Model Aditif Tergeneralisir Semiparametrik, Scatterplot Smoother, Koefisien Determinasi, Spline

1

Page 4: Artikel Skripsiku

PENDAHULUAN

Kondisi data riil di lapangan yang sangat kompleks mendorong munculnya

berbagai macam model baru yang lebih fleksibel seperti model aditif tergeneralisir

(Generalized Additive Model) yang digunakan untuk mengidentifikasi dan

mengelompokkan fungsi nonlinier. Model ini diasumsikan berdistribusi keluarga

eksponensial dan memiliki fungsi link. Hastie (1990) menyebutkan bahwa metode

penghalusan dan algoritma yang digunakan dalam pencocokan model ini terdiri dari

penghalus diagram pencar (scatterplot smoother), algoritma backfitting, dan algoritma

local scoring. Adapun metode penghalusan yang dapat memberikan suatu hasil analisis

numerik yang lebih baik menurut Hastie (1990) adalah penghalus spline. Oleh karena itu

dalam tulisan ini metode penghalusan yang digunakan adalah metode penghalusan

spline (smoothing spline method) dan permasalahan yang dibahas dalam penelitian ini

yakni mengetahui bentuk estimasi dan penghalus spline serta aplikasinya pada data

evaporasi (penguapan).

TINJAUAN PUSTAKA

Model linier paling sederhana menurut Ratih (2000) adalah model regresi linier

sederhana yang hanya melibatkan satu variabel respon dan satu variabel prediktor.

Model linier diformulasikan sebagai berikut:

(1)

dengan adalah variabel respon; sebagai variabel prediktor;

merupakan koefisien linier; dan e adalah galat (error). Model ini

kemudian digeneralisir menjadi model linier tergeneralisir (Generalized Linear Model)

untuk memenuhi suatu kondisi ketika variabel respon tidak berdistribusi normal tetapi

masih saling bebas. Sehingga menurut Tirta (2003), komponen-komponen penting

dalam model linier tergeneralisir yaitu prediktor linier; distribusi keluarga eksponensial

dan fungsi hubungan yang differensiabel.

2

Page 5: Artikel Skripsiku

Model aditif (Additive Model), menurut Hastie dan Tibshirani (1990), merupakan

generalisasi atau bentuk pengembangan dari model linier pada persamaan (1). Sama

dengan model linier, model aditif juga diasumsikan berdistribusi normal dengan fungsi

yang tidak harus linier. Prediktor pada model aditif disebut dengan prediktor aditif.

Model aditif dapat ditulis sebagai berikut:

(2)

dengan adalah fungsi dari prediktor; dan e adalah galat. Menurut Bashet

dan Bishop (2005), model aditif disebut sebagai model nonparametrik jika koefisien

linier dalam persamaan (1) digantikan oleh penghalus .

Sehingga model aditif juga dapat dituliskan dalam bentuk persamaan sebagai berikut:

(3)

dengan , untuk , sebagai fungsi licin (smooth function). Model

aditif dapat dikombinasikan sebagai model semiparametrik .

Model aditif dapat digunakan untuk menganalisis hampir semua jenis data, tetapi

terdapat beberapa macam persoalan yang tidak tepat jika diselesaikan dengan

menggunakan model aditif seperti pada persamaan (2). Misalnya, distribusi normal tidak

tepat untuk data diskrit yang didapat dari hasil pencacahan, sehingga diperlukan model

baru dengan bentuk distribusi yang lebih luas dan fleksibel yakni model aditif

tergeneralisir yang menggeneralisir model aditif ke dalam bentuk distribusi keluarga

eksponensial selain distribusi normal. Model aditif tergeneralisir juga memuat

komponen acak, komponen tetap yakni prediktor aditif dan fungsi link yang

menghubungkan komponen acak dengan prediktor aditif tersebut. Model ini mirip

dengan model linier tergeneralisir, kecuali jika fungsi licinnya digunakan untuk

menggantikan parameter regresinya. Salah satu aspek yang unik dari model aditif

tergeneralisir adalah fungsi nonparametrik yang diestimasi menggunakan penghalus

diagram pencar yang merupakan pondasi dari algoritma model aditif tergeneralisir.

Berikut diberikan contoh penghalus diagram pencar dalam bentuk sederhana (Gambar 1)

3

Page 6: Artikel Skripsiku

yang mengindikasikan bagaimana penghalus diagram pencar digunakan untuk

menggambarkan estimasi pada model aditif tergeneralisir.

Gambar 1: Ilustrasi Penghalus Spline. Gambar kiri menunjukkan diagram pencar samaran dari plot variabel respon terhadap variabel prediktor X. Gambar kanan, penghalus diagram pencar telah ditambahkan untuk menggambarkan kecenderungan (trend) variabel respon terhadap variabel prediktor X (Sumber: Hastie dan Tibshirani, 2004).

Hastie dan Tibshirani (1990), membahas berbagai macam penghalus diagram

pencar. Salah satu dari penghalus diagram pencar tersebut adalah penghalus spline yang

merupakan solusi dari:

(4)

dengan adalah parameter penghalus dalam interval . Nilai besar akan

menghasilkan kurva yang mulus, sedangkan kecil akan menghasilkan gambar kurva

yang kasar. Suku pertama pada persamaan (4) digunakan untuk mengukur kerapatan

data, sedangkan suku kedua memperlihatkan kurva suatu fungsi. Salah satu penghalus

spline adalah spline kubik dengan titik perubahan yang terjadi di dalam suatu kurva

disebut dengan titik knots. Model spline kubik dapat dituliskan sebagai berikut

(Budiantara dan Subanar, 1997):

(5)

dengan,

4

Page 7: Artikel Skripsiku

Dalam model aditif tergeneralisir terdapat dua algoritma perulangan terpisah

yang digunakan yaitu algoritma backfitting (innerloop) dan algoritma local scoring

(outerloop). Algoritma backfitting merupakan algoritma perulangan yang digunakan

untuk mengestimasi model aditif dengan menggunakan beberapa tipe regresi penghalus,

Algoritma ini dimulai dengan memberikan fungsi inisial . Masing-masing

iterasi berputar melalui residu parsial dan mengestimasi komponen-komponen fungsi

licin ke dalam residu parsialnya sampai komponen dari fungsi licin tidak berubah atau

sudah memenuhi kriteria kekonvergenan. Dengan cara yang sama, estimasi bentuk aditif

pada persamaan (3) diselesaikan dengan mengganti regresi linier terbobot

dalam regresi variabel dependen biasa dengan algoritma backfitting terbobot untuk

mengestimasi model aditif terbobot yang dikenal dengan algoritma local scoring.

Algoritma ini dimulai dengan mengestimasi fungsi inisial dan selama

masing-masing iterasi, variabel dependen biasa dan bobot dihitung, kemudian fungsi

licin diestimasi dengan menggunakan algoritma backfitting terbobot hingga memenuhi

kriteria kekonvergenan. Dalam pemilihan parameter penghalus terdapat beberapa

metode yang digunakan yakni validasi silang (Cross Validation) sebagai berikut:

(6)

dengan menyatakan kecocokan pada saat (Hastie dan Tibshirani, 1990).

Karena memerlukan waktu yang lama untuk menghitung jumlah maka Wahba (1990)

memperkenalkan generalisir dari validasi silang yakni validasi silang tergeneralisir

(Generalized Cross Validation) dan didefinisikan sebagai berikut:

(7)

Dalam GCV tidak terdapat elemen diagonal seperti pada formula validasi silang, dan

diganti dengan . Selain itu juga digunakan statistik AIC (Akaike Information

Criterion) yang diformulasikan sebagai berikut:

5

Page 8: Artikel Skripsiku

(8)

nilai perhitungan statistik AIC yang lebih kecil menunjukkan formulasi model yang lebih

bagus. Model semiparametrik merupakan model gabungan antara model parametrik

dengan nonparametrik. Misal diberikan suatu model , model ini disebut

sebagai model parametrik jika fungsi jelas atau diketahui. Model parametrik ini

didasarkan pada asumsi-asumsi yang mengikuti suatu bentuk distribusi tertentu.

Sebaliknya, jika fungsi tidak didasarkan pada suatu bentuk distribusi tertentu dengan

hubungan fungsi yang juga tidak diketahui, linier atau tidak, maka model ini disebut

sebagai model nonparametrik. Sehingga model semiparametrik dapat ditulis sebagai

berikut (Hastie dan Tibshirani, 1990):

(9)

METODE PENELITIAN

Ada dua macam sumber data yang digunakan dalam penelitian ini yakni data

simulasi yang dibangkitkan melalui program R dan data riil yang merupakan data

sekunder mengenai agroklimatologi (evaporasi, kelembaban, dan kecepatan angin) dari

sub proyek Pekalen, Sampean, bulan November 2004. Data riil ini diperoleh dari Kantor

Pengairan Kabupaten Jember dengan komponen sebagai berikut:

a. data evaporasi sebagai variabel responnya ( );

b. data kecepatan angin ( ) dan kelembaban ( ) sebagai variabel prediktornya.

Dalam analisis data, proses pertama yang dilakukan adalah menyusun data sampel

observasi. Data tersebut dijadikan sebagai input program yang kemudian akan

dijalankan dalam paket R. Secara umum langkah-langkah penyusunan data tersebut

yakni melakukan identifikasi data dan melakukan analisis data dengan prosedur GAM.

Sebelum menganalisis data riil, terlebih dahulu dilakukan analisis data simulasi yang

dibangkitkan melalui program paket R dengan langkah-langkah sebagai berikut:

a. membangkitkan variabel prediktor ;

6

Page 9: Artikel Skripsiku

b. membangkitkan nilai estimasi untuk komponen parametrik;

c. membangkitkan fungsi licin untuk komponen nonparametrik;

d. membangkitkan nilai galat;

e. membangkitkan nilai variabel respon ;

f. melihat ukuran letak data;

g. melihat sebaran distribusi data simulasi;

h. melihat dan memeriksa kelinieran data simulasi;

i. menganalisis model menggunakan prosedur dalam GAM.

Sedangkan langkah-langkah untuk menganalisis data riil yakni:

a. memasukkan data pengamatan dalam paket R;

b. melihat ukuran letak data dan sebaran data;

c. melakukan identifikasi data pengamatan, melihat komponen parametrik dan

nonparametrik data dengan melihat kelinieran melalui scatterplot data;

d. menganalisis data riil menggunakan prosedur GAM;

e. melihat sebaran data riil;

f. melakukan uji hipotesis, hipotesis ditolak ketika nilai-P kurang dari ;

g. mengambil keputusan dan kesimpulan.

HASIL DAN PEMBAHASAN

Data simulasi yang dibangkitkan melalui program paket R digunakan untuk

menguji teori-teori dan asumsi-asumsi yang ada dalam penelitian ini. Setelah asumsi-

asumsi yang ada terpenuhi selanjutnya teori-teori tersebut diterapkan dalam analisis data

riil. Ada dua macam variabel prediktor dalam analisis data simulasi, yakni variabel

prediktor dan . Variabel prediktor dimodelkan secara parametrik sedangkan

variabel prediktor dimodelkan secara nonparametrik. Jumlah sampel pengamatan

yang dibangkitkan dalam penelitian ini ada 30 sampel (n=30) dengan simpangan baku

. Untuk menunjukkan adanya korelasi atau hubungan antara variabel prediktor

dengan variabel respon pada data simulasi digunakan perintah scatterplot matrix sebagai

berikut:

7

Page 10: Artikel Skripsiku

scatterplot.matrix(~y+x1+x2,reg.line=lm,smooth=TRUE,diagonal='histogram')

Perintah scatterplot matrix di atas memberikan hasil seperti pada Gambar 2 berikut ini.

Gambar 2 Scatterplot Matrix Data Simulasi

Pada Gambar 2, diagonal gambar menunjukkan histogram data sedangkan luar

diagonal menunjukkan scatterplot dari data simulasi. Dalam scatterplot matrix tersebut,

hubungan antara variabel prediktor dengan variabel respon lebih cocok jika

digunakan pendekatan linier karena data menyebar lurus mengikuti garis regresinya,

sedangkan hubungan antara variabel prediktor dengan variabel respon lebih cocok

jika digunakan pendekatan nonlinier. Hasil tersebut menunjukkan bahwa dalam analisis

selanjutnya variabel prediktor dimodelkan sebagai komponen parametrik dan

variabel prediktor sebagai komponen nonparametrik yang diestimasi menggunakan

penghalus spline. Pada data simulasi akan digunakan perbandingan dari beberapa titik

knots guna mencari model spline optimal. Tabel 1 berikut menyajikan ringkasan statistik

nilai GCV dengan berbagai titik knots untuk memperoleh model spline optimal.

Tabel 1 Nilai GCV Untuk Berbagai Titik Knots Pada Data Simulasi

Model Pendekatan Nilai GCV Nilai

Spline dengan knots 0,3 4,5450 0,357

Spline dengan knots 0,7 4,3344 0,387

Spline dengan knots 0,8 4,3298 0,388

Spline dengan knots 0,3 dan 0,7 4,7078 0,362

8

xFr

eque

ncy

y

0.0 0.2 0.4 0.6 0.8

48

1216

0.0

0.4

0.8

x

Freq

uenc

y

x0

4 6 8 10 12 14 16 0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.4

0.8

x

Freq

uenc

y

x1

Page 11: Artikel Skripsiku

Spline dengan knots 0,3 dan 0,8 4,7078 0,362

Spline dengan knots 0,7 dan 0,8 4,7144 0,361

Spline dengan knots 0,3; 0,7 dan 0,8 5,1444 0,333

Catatan: Hasil diperoleh dengan menggunakan program R

Dari bermacam-macam model pendekatan spline yang diberikan pada Tabel 1

didapat model spline optimal dengan titik knots 0,8 (cetak tebal) karena memiliki nilai

GCV minimum yakni sebesar 4,3298. Ringkasan statistik model spline optimal dengan

titik knots 0,8 untuk komponen parametrik dan nonparametrik disajikan pada

Tabel 2 berikut ini.

Tabel 2 Ringkasan Statistik Model Spline Optimal Untuk Komponen Parametrik dan Nonparametrik

Parameter Estimasi Standar Kesalahan Nilai t Nilai-P

7,99 1,81 4,42 0,02x10-2 ***

0,94 1,48 0,63 0,53

-0,34 4,24 -0,08 0,94

-4,23 3,89 -1,09 0,29

6,40 3,27 1,96 0,06 .

2,86 2,41 1,19 0,25

Catatan:1. hasil diperoleh dengan menggunakan program R (umum);2. angka yang ada sudah merupakan pembulatan sampai dua tempat desimal (khusus);. signifikan pada 10%, *** signifikan pada 0,1%.

Ringkasan analisis pada Tabel 2 memberikan model spline kubik dengan titik knots

optimal 0,8 sebagai berikut:

dengan,

9

Page 12: Artikel Skripsiku

Model spline kubik tersebut memiliki nilai koefisien determinasi sebesar

sebesar 38,8% yang berarti bahwa variabel prediktor dan mampu menjelaskan

38,8% dari variabel respon . Berikut diberikan Gambar 3 yang menunjukkan gambar

penghalus spline untuk data simulasi.

Gambar 3 Penghalus Spline Dengan Titik Knots Optimal Pada Data Simulasi

Ringkasan Analisis Variansi untuk model spline kubik optimal dengan titik knots

optimal 0,8 diberikan pada Tabel 3 berikut ini.

Tabel 3 ANOVA Untuk Model Spline Pada Data Simulasi

Sumber Variasi

Derajat bebas

Jumlah kuadrat

Rata-rata jumlah kuadrat

Nilai F Nilai-P

1 19,69 19,69 5,68 0,03 *

4 61,22 15,31 4,42 0,01 **

Residual 24 83,13 3,46

Total 29 164,04

Catatan: 1. hasil diperoleh dengan menggunakan program R (umum);2. angka yang ada sudah merupakan pembulatan sampai dua tempat desimal (khusus);* signifikan pada 5%, ** signifikan pada 1%.Dari Tabel 3, nilai-P untuk variabel prediktor sebesar 0,03 dan sebesar 0,01.

Nilai-P kedua variabel prediktor dan kurang dari tingkat signifikansi

sehingga ditolak. Jadi dapat disimpulkan bahwa variabel prediktor dan

memberikan pengaruh yang signifikan terhadap variabel respon .

Data riil dalam penelitian ini merupakan data sekunder mengenai

agroklimatologi (evaporasi, kecepatan angin dan kelembaban) dari Sub Proyek Pekalen

Sampean, bulan November 2004. Dalam penelitian ini, diduga bahwa kecepatan angin

10

0.2 0.4 0.6 0.8 1.0

-4-2

02

4

x1

pa

rtia

l fo

r x1

0.0 0.2 0.4 0.6 0.8

-4-2

02

46

x2

bs(x

2, kn

ots

= 0

.8)

Page 13: Artikel Skripsiku

dan kelembaban memberikan pengaruh pada tingkat evaporasi. Menurut Bayong (1999),

agroklimatologi merupakan terapan dari ilmu klimatologi yang merupakan suatu ilmu

yang mencari gambaran dan penjelasan mengenai iklim. Dalam penelitian ini model

yang digunakan adalah model semiparametrik yang merupakan suatu model gabungan

antara model parametrik dan model nonparametrik, sehingga sebelum dilakukan analisis

model harus dilakukan eksplorasi data terlebih dahulu guna mengetahui hubungan

kelinieran atau adanya korelasi antar variabel yang dilakukan dengan menggunakan

scatterplot smoother. Perintah scatterplot matrix pada paket R adalah sebagai berikut:

scatterplot.matrix(~kec.angin+kelembaban+evp,reg.line=lm, smooth=TRUE, diagonal = 'histogram', data=cuaca)

Perintah scatterplot matrix di atas memberikan hasil seperti pada Gambar 4 berikut ini:

Gambar 4 Scatterplot Matrix Data Evaporasi

Pada Gambar 4, diagonal gambar menunjukkan histogram dari data sedangkan di

luar diagonal menunjukkan gambar scatterplot dari masing-masing variabel prediktor

dengan variabel responnya. Pada Gambar 4 ditunjukkan bahwa scatterplot antara

evaporasi dengan kecepatan angin menunjukkan hubungan yang lebih cocok jika

digunakan pendekatan linier, sedangkan scatterplot antara evaporasi dengan kelembaban

lebih cocok jika digunakan pendekatan nonlinier. Sehingga dapat disimpulkan bahwa

kecepatan angin dimodelkan secara parametrik dan kelembaban secara nonparametrik

yang akan diestimasi menggunakan penghalus spline. Selain itu, sebagai perbandingan

untuk menentukan komponen parametrik dan nonparametrik dapat juga digunakan

perbandingan nilai koefisien determinasi , dengan nilai lebih besar menunjukkan

11

x

Freq

uenc

y

ev aporasi

83 84 85 86 87 88

24

6

8385

87

x

Freq

uenc

y

kelembaban

2 3 4 5 6 7 20 30 40 50 60 70

2040

60

x

Freq

uenc

y

kec.angin

Page 14: Artikel Skripsiku

variabel prediktor lebih linier yang kemudian dimodelkan secara parametrik dan

demikian sebaliknya. Hasil analisis menunjukkan bahwa nilai koefisien determinasi

untuk variabel prediktor kecepatan angin adalah sebesar 0,567; sedangkan untuk

kelembaban adalah sebesar 0,37. Oleh karena itu format model untuk data riil yakni:

gam.1<-gam(evp~s(kelembaban)+ kec.angin).

Untuk mempermudah dalam menentukan model spline optimal maka digunakan

titik knots yang juga dipilih dengan menggunakan metode GCV. Tabel 4 berikut

menyajikan ringkasan statistik nilai GCV dari data evaporasi dengan menggunakan

berbagai model pendekatan spline dari titik knots ekstrem berbeda untuk memperoleh

model spline optimal.

Tabel 4 Nilai GCV Model Spline Untuk Berbagai Titik Knots Pada Data Evaporasi

Model Pendekatan Nilai GCV Nilai

Spline dengan knots 82,5 1,11380 0,684

Spline dengan knots 84,7 1,19720 0,674

Spline dengan knots 86,7 1,12280 0,694

Spline dengan knots 87,5 0,99664 0,729

Spline dengan knots 82,5 dan 84,7 1,19720 0,674

Spline dengan knots 82,5 dan 86,7 1,12280 0,694

Spline dengan knots 82,5 dan 87,5 0,99664 0,729

Spline dengan knots 84,7 dan 86,7 1,19110 0,689

Spline dengan knots 84,7 dan 87,5 1,05400 0,725

Lanjutan Tabel 4

Spline dengan knots 86,7 dan 87,5 0,97296 0,746

Spline dengan knots 82,5; 86,7 dan 87,5 0,97296 0,746

Catatan: Hasil diperoleh dengan menggunakan program R

12

Page 15: Artikel Skripsiku

Dari Tabel 4 didapat model spline optimal (cetak tebal) untuk titik knots 82,5; 86,7 dan

87,5 dengan nilai GCV minimum yakni sebesar 0,97296. Ringkasan statistik untuk

model spline kubik dengan titik knots optimal dapat dilihat pada Tabel 5 berikut ini.

Tabel 5 Ringkasan Statistik Model Spline Optimal Untuk Data Kecepatan Angin dan Kelembaban

Parameter Estimasi Standar Kesalahan Nilai t Nilai-P

1,73 0,55 3,14 0,46x10-2 **

0,07 0,02 3,65 0,13x10-2 **

0,93 0,46 2,02 0,06 .

3,48 1,45 2,41 0,02 *

-0,61 1,73 -0,35 0,73

0,85 1,37 0,62 0,54

-3,94 1,34 -2,95 0,01 **

1,02 0,78 1,30 0,21

Catatan:1. hasil diperoleh dengan menggunakan program R (umum);2. angka yang ada sudah merupakan pembulatan sampai dua tempat desimal (khusus);. signifikan pada 10%, * signifikan pada 5%, ** signifikan pada 1%.

Hasil ringkasan analisis pada Tabel 5 memberikan model spline kubik dengan titik-titik

knots optimal 82,5; 86,7 dan 87,5 sebagai berikut:

dengan,

dan,

13

Page 16: Artikel Skripsiku

Gambar penghalus spline dengan titik knots optimal dapat dilihat pada Gambar 5

berikut ini.

(a) (b)

Gambar 5 Penghalus Spline dengan Titik Knots Optimal Pada Data Evaporasi

Model spline kubik dengan titik knots optimal yang diberikan pada Gambar 5

memberikan nilai koefisien determinasi sebesar 0,746 atau sebesar 74,6%, hal ini

menunjukkan bahwa variabel kelembaban dan kecepatan angin mampu menjelaskan

74,6% tingkat evaporasi pada Sub Proyek Pekalen Sampean. Dengan demikian dapat

dinyatakan bahwa perubahan pola data evaporasi pada tiga titik knots yakni 82,5; 86,7

dan 87,5 cukup signifikan. Dari Gambar 5 (b) terlihat bahwa model spline optimal

mengestimasi tingkat evaporasi yang naik sampai pada tingkat kelembaban 82,5% dan

86,7%, kemudian menurun hingga pada tingkat kelembaban lebih dari 87,5%, model

spline optimal mengestimasi kembali kenaikan tingkat evaporasi. Ringkasan Analisis

Variansi model spline kubik optimal dengan titik knots optimal dapat dilihat dalam

Tabel 6 berikut ini.

Tabel 6 ANOVA Untuk Model Spline Optimal Pada Data Evaporasi

Sumber Variasi

Derajat bebas

Jumlah kuadrat

Rata-rata jumlah kuadrat

Nilai F Nilai-P

Kecepatan angin

1 49,58 49,58 66,46 3,09e-08 ***

Kelembaban 5 18,52 3,70 4,97 0,31x10-2 **

Residual 23 17,16 0,75

Total 29 85,26

Catatan:

14

20 30 40 50 60 70

-2-1

01

23

kec.angin

pa

rtia

l fo

r ke

c.a

ng

in

83 84 85 86 87 88

-5-3

-10

12

kelembaban

bs(k

ele

mb

ab

an, kno

ts =

c(8

2.5

, 8

6.7

, 8

7.5

))

Page 17: Artikel Skripsiku

1. hasil diperoleh dengan menggunakan program R (umum);2. angka yang ada sudah merupakan pembulatan sampai dua tempat desimal (khusus);** signifikan pada 1%, *** signifikan pada 0,1%.

Ringkasan Analisis Variansi model spline kubik pada Tabel 4.6 diperoleh nilai-P

untuk variabel kecepatan angin adalah sebesar 3,09e-08 dan kelembaban sebesar

0,31x10-2. Nilai-P kedua komponen tersebut kurang dari tingkat signifikansi

sehingga ditolak. Jadi dapat disimpulkan bahwa kecepatan angin dan kelembaban

memberikan pengaruh yang signifikan terhadap tingkat evaporasi.

KESIMPULAN

Kesimpulan yang dapat diperoleh dari penelitian ini yakni estimasi model aditif

tergeneralisir semiparametrik dengan penghalus spline adalah sebagai berikut:

.

dengan adalah titik knots optimal yang diperoleh melalui nilai GCV minimum. Model

semiparametrik merupakan suatu model gabungan antara model dengan pendekatan

parametrik (linier) dan nonparametrik. Eksplorasi komponen parametrik dan

nonparametrik dilakukan dengan menggunakan scatterplot smoother dan koefisien

determinasi R2, dengan nilai koefisien determinasi R2 yang lebih besar menunjukkan

model yang lebih cocok jika digunakan pendekatan parametrik dan sebaliknya. Hasil

analisis pada data evaporasi menunjukkan bahwa model aditif tergeneralisir

semiparametrik memberikan model sebagai berikut:

dengan tiga titik knots optimal yakni 82,5; 86,7 dan 87,5 dan koefisien determinasi

sebesar 74,6%. Dengan demikian dapat disimpulkan bahwa kecepatan angin dan tingkat

kelembaban 82,5%; 86,7% dan 87,5% mampu menjelaskan 74,6% tingkat evaporasi

pada Sub Proyek Pekalen Sampean.

15

Page 18: Artikel Skripsiku

DAFTAR PUSTAKA

Basset, P. A. dan Bishop, G. 2005. Generalized Additive Models. http://www.bioss.sari.ac/. [3 Agustus 2005]

Bayong, T. 1999. Klimatologi Umum. Bandung: ITB

Budiantara, I. N dan Subanar. 1997. Regresi Spline dan Permasalahannya, Majalah Berkala Penelitian Pasca Sarjana, Jilid 10. Yogyakarta: UGM

Hastie, T. 1990. Generalized Additive Models. Bab 7 dari Statistical Models in S eds J. M. Chambers dan T. Hastie, Wadsworth & Brooks/Cole.

Hastie, T dan Tibshirani, R. 1990. Generalized Additive Models. London: Chapman and Hall.

Hastie, T dan Tibshirani, R. 2004. GAM: Generalized Additive Models. http://www-stat.stanford.edu/. [29 Agustus 2005].

Ratih, R. 2000. Inferensi Pada Model-Model Linier Tergeneralisasi, Majalah Matematika Dan Statistika, Volume 1. FMIPA, Universitas Jember.

Tirta, I. M. 2003. Model Statistika Linier. Jurusan Matematika, FMIPA, Universitas Jember.

Wahba, G. 1990. Spline Models For Observational Data. Philadelphia: Society for Industrial And Applied Mathematics.

16