ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI...

6
1 Abstrak—Jawa Timur merupakan kontributor terbesar untuk total produksi kedelai di Indonesia. Produksi kedelai dalam negeri saat ini baru mampu memenuhi 907.031 ton (41,22%) dari kebutuhan sedangkan kekurangannya berasal dari impor. Untuk mengatasi defisit produksi diarahkan pada upaya menekan impor dan meningkatkan produksi. Oleh karena itu perlu dilakukan analisis yang tepat untuk memodelkan jumlah produksi kedelai serta faktor-faktor yang mempe- ngaruhi. Penelitian ini menggunakan enam variabel yang diduga mempengaruhi produksi kedelai. Data yang digunakan adalah data pada tahun 2011. Faktor-faktor yang mempengaruhi produksi kedelai, sebagian memiliki pola tertentu (parametrik) dan sebagian lagi tidak memiliki pola tertentu (nonparametrik) sehingga pemodelan terbaik untuk produksi kedelai adalah dengan regresi semiparametrik. Penelitian ini menggunakan pendekatan spline dengan titik knot optimum didapatkan dari metode Generalized Cross Validation (GCV). Berdasarkan hasil analisis didapatkan variabel luas panen kedelai, alokasi pupuk bersubsidi, dan ketinggian rata-rata dari permukaan laut merupakan variabel memberikan pengaruh signifikan terhadap produksi kedelai. Nilai koefisien determinasi yang dihasilkan dari model regresi semiparametrik spline sebesar 98,2%. Kata Kunci—gcv, produksi kedelai, regresi semiparametrik, spline. I. PENDAHULUAN NDONESIA merupakan negara agraris. Tanaman pangan Indonesia diantaranya adalah padi, jagung, kedelai, kacang tanah, kacang hijau, ubi kayu, dan ubi jalar. Sebagai salah satu tanaman pangan, kedelai banyak dimanfaatkan dalam produksi tahu, tempe, kecap, dan juga susu. Kedelai merupakan sumber protein nabati yang penting di Indonesia [1]. Kebutuhan akan komoditi kedelai terus meningkat dari tahun ke tahun baik sebagai bahan pangan utama, pakan ternak maupun sebagai bahan baku industri skala besar/pabrikan hingga skala kecil/rumah tangga [2]. Berdasarkan [3], total luas panen tanaman kedelai di 33 provinsi di Indonesia mencapai 622.254 Ha dengan provinsi yang memiliki luas panen terbesar adalah provinsi Jawa Timur seluas 252.815 Ha. Tahun 2011, Jawa Timur memberikan kontribusi sebesar 43,49% untuk total produksi kedelai nasional [4]. Untuk memenuhi kebutuhan kedelai tersebut, produksi dalam negeri saat ini baru mampu memenuhi 907.031 ton (41,22%) dari kebutuhan sedangkan ARAM III Tahun 2011 baru mencapai 870.068 ton atau 37,85% dari total kebutuhan, sedangkan kekurangannya berasal dari impor. Besarnya impor tersebut, menyebabkan kehilangan devisa negara yang cukup besar dan sangat rentan terhadap Ketahanan Pangan Nasional [3]. Untuk mengatasi defisit produksi dan peningkatan daya saing kedelai lokal pada pasar nasional diarahkan pada upaya menekan impor dan meningkatkan produksi [5]. Oleh karena itu, perlu dilakukan analisis yang tepat mengetahui faktor-faktor yang mempengaruhi produksi kedelai. Penelitian tentang prediksi penawaran dan permintaan kedelai menggunakan metode Analisis Deret Waktu dilakukan oleh [6] dan [7]. Sementara itu, [8] menggunakan teori permintaan penawaran serta teori elastisitas dalam penelitiannya. Berdasarkan studi awal yang dilakukan oleh peneliti, faktor-faktor yang mempengaruhi produksi kedelai, sebagian memiliki pola tertentu (parametrik) dan sebagian lagi tidak memiliki pola tertentu (nonparametrik). Akibatnya, untuk mendapatkan model produksi kedelai terbaik adalah dengan Regresi Semiparametrik. Analisis dengan metode Regresi Semiparametrik juga pernah dilakukan oleh [9] dan [10]. Sebagai langkah awal analisis adalah menentukan variabel-variabel prediktor yang bertindak sebagai variabel komponen parametrik dan variabel komponen nonparametrik. Cara untuk menentukan hal tersebut adalah dengan menyelidiki plot antara masing-masing variabel prediktor dengan varibel respon [11]. Jika plot antara variabel prediktor dengan variabel respon mengarah ke suatu bentuk kurva tertentu maka variabel prediktor tersebut merupakan varibel komponen parametrik. Sedangkan jika plot tersebut tidak mengikuti pola tertentu maka variabel prediktor tersebut adalah variabel komponen nonparametrik [12]. Oleh karena itu metode regresi semiparametrik spline adalah metode yang tepat untuk memodelkan produksi kedelai. Pendekatan spline digunakan karena mudah dalam interpretasi model. Tujuan dari penelitian ini yaitu untuk mengetahui faktor-faktor yang mempengaruhi produksi kedelai di Jawa Timur. Penelitian ini dibatasi pada kabupaten/kota penghasil kedelai. II. TINJAUAN PUSTAKA A. Regresi Parametrik Dalam regresi parametrik terdapat asumsi yang sangat kaku dan kuat yaitu bentuk kurva regresi diketahui, misalnya linear, kuadratik, kubik, polinomial derajat p, eksponen, dan lain-lain [11]. Bentuk kurva tersebut umumnya dilihat melalui scatter plot yang dilakukan di awal. Apabila pada scatter plot terlihat bahwa data memiliki kecenderungan mengikuti pola ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PRODUKSI KEDELAI DI PROVINSI JAWA TIMUR DENGAN METODE REGRESI SEMIPARAMETRIK SPLINE Dita Amelia, I Nyoman Budiantara Jurusan Statistika, FMIPA, Institut Teknologi Sepuluh Nopember (ITS) Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia e-mail: [email protected], [email protected] I

Transcript of ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI...

Page 1: ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI …digilib.its.ac.id/public/ITS-paper-34622-1309100009-Paper.pdf · metode Generalized Cross Validation ... Berdasarkan hasil analisis didapatkan

1

Abstrak—Jawa Timur merupakan kontributor terbesar untuk total produksi kedelai di Indonesia. Produksi kedelai dalam negeri saat ini baru mampu memenuhi 907.031 ton (41,22%) dari kebutuhan sedangkan kekurangannya berasal dari impor. Untuk mengatasi defisit produksi diarahkan pada upaya menekan impor dan meningkatkan produksi. Oleh karena itu perlu dilakukan analisis yang tepat untuk memodelkan jumlah produksi kedelai serta faktor-faktor yang mempe-ngaruhi. Penelitian ini menggunakan enam variabel yang diduga mempengaruhi produksi kedelai. Data yang digunakan adalah data pada tahun 2011. Faktor-faktor yang mempengaruhi produksi kedelai, sebagian memiliki pola tertentu (parametrik) dan sebagian lagi tidak memiliki pola tertentu (nonparametrik) sehingga pemodelan terbaik untuk produksi kedelai adalah dengan regresi semiparametrik. Penelitian ini menggunakan pendekatan spline dengan titik knot optimum didapatkan dari metode Generalized Cross Validation (GCV). Berdasarkan hasil analisis didapatkan variabel luas panen kedelai, alokasi pupuk bersubsidi, dan ketinggian rata-rata dari permukaan laut merupakan variabel memberikan pengaruh signifikan terhadap produksi kedelai. Nilai koefisien determinasi yang dihasilkan dari model regresi semiparametrik spline sebesar 98,2%.

Kata Kunci—gcv, produksi kedelai, regresi semiparametrik,

spline.

I. PENDAHULUAN NDONESIA merupakan negara agraris. Tanaman pangan Indonesia diantaranya adalah padi, jagung, kedelai, kacang tanah, kacang hijau, ubi kayu, dan ubi jalar. Sebagai salah

satu tanaman pangan, kedelai banyak dimanfaatkan dalam produksi tahu, tempe, kecap, dan juga susu. Kedelai merupakan sumber protein nabati yang penting di Indonesia [1]. Kebutuhan akan komoditi kedelai terus meningkat dari tahun ke tahun baik sebagai bahan pangan utama, pakan ternak maupun sebagai bahan baku industri skala besar/pabrikan hingga skala kecil/rumah tangga [2]. Berdasarkan [3], total luas panen tanaman kedelai di 33 provinsi di Indonesia mencapai 622.254 Ha dengan provinsi yang memiliki luas panen terbesar adalah provinsi Jawa Timur seluas 252.815 Ha. Tahun 2011, Jawa Timur memberikan kontribusi sebesar 43,49% untuk total produksi kedelai nasional [4].

Untuk memenuhi kebutuhan kedelai tersebut, produksi dalam negeri saat ini baru mampu memenuhi 907.031 ton (41,22%) dari kebutuhan sedangkan ARAM III Tahun 2011 baru mencapai 870.068 ton atau 37,85% dari total kebutuhan, sedangkan kekurangannya berasal dari impor. Besarnya

impor tersebut, menyebabkan kehilangan devisa negara yang cukup besar dan sangat rentan terhadap Ketahanan Pangan Nasional [3]. Untuk mengatasi defisit produksi dan peningkatan daya saing kedelai lokal pada pasar nasional diarahkan pada upaya menekan impor dan meningkatkan produksi [5]. Oleh karena itu, perlu dilakukan analisis yang tepat mengetahui faktor-faktor yang mempengaruhi produksi kedelai.

Penelitian tentang prediksi penawaran dan permintaan kedelai menggunakan metode Analisis Deret Waktu dilakukan oleh [6] dan [7]. Sementara itu, [8] menggunakan teori permintaan penawaran serta teori elastisitas dalam penelitiannya. Berdasarkan studi awal yang dilakukan oleh peneliti, faktor-faktor yang mempengaruhi produksi kedelai, sebagian memiliki pola tertentu (parametrik) dan sebagian lagi tidak memiliki pola tertentu (nonparametrik). Akibatnya, untuk mendapatkan model produksi kedelai terbaik adalah dengan Regresi Semiparametrik. Analisis dengan metode Regresi Semiparametrik juga pernah dilakukan oleh [9] dan [10]. Sebagai langkah awal analisis adalah menentukan variabel-variabel prediktor yang bertindak sebagai variabel komponen parametrik dan variabel komponen nonparametrik. Cara untuk menentukan hal tersebut adalah dengan menyelidiki plot antara masing-masing variabel prediktor dengan varibel respon [11]. Jika plot antara variabel prediktor dengan variabel respon mengarah ke suatu bentuk kurva tertentu maka variabel prediktor tersebut merupakan varibel komponen parametrik. Sedangkan jika plot tersebut tidak mengikuti pola tertentu maka variabel prediktor tersebut adalah variabel komponen nonparametrik [12]. Oleh karena itu metode regresi semiparametrik spline adalah metode yang tepat untuk memodelkan produksi kedelai. Pendekatan spline digunakan karena mudah dalam interpretasi model. Tujuan dari penelitian ini yaitu untuk mengetahui faktor-faktor yang mempengaruhi produksi kedelai di Jawa Timur. Penelitian ini dibatasi pada kabupaten/kota penghasil kedelai.

II. TINJAUAN PUSTAKA

A. Regresi Parametrik Dalam regresi parametrik terdapat asumsi yang sangat

kaku dan kuat yaitu bentuk kurva regresi diketahui, misalnya linear, kuadratik, kubik, polinomial derajat p, eksponen, dan lain-lain [11]. Bentuk kurva tersebut umumnya dilihat melalui scatter plot yang dilakukan di awal. Apabila pada scatter plot terlihat bahwa data memiliki kecenderungan mengikuti pola

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PRODUKSI KEDELAI DI PROVINSI JAWA TIMUR DENGAN

METODE REGRESI SEMIPARAMETRIK SPLINE

Dita Amelia, I Nyoman Budiantara Jurusan Statistika, FMIPA, Institut Teknologi Sepuluh Nopember (ITS)

Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia e-mail: [email protected], [email protected]

I

Page 2: ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI …digilib.its.ac.id/public/ITS-paper-34622-1309100009-Paper.pdf · metode Generalized Cross Validation ... Berdasarkan hasil analisis didapatkan

2

linear maka maka digunakan model regresi parametrik linear, begitu pula dengan bentuk kurva yang lainnya. Apabila dimisalkan terdapat L buah variabel prediktor dan satu variabel respon yang diketahui bahwa pola data mengikuti pola linear maka regresi yang digunakan adalah regresi parametrik linear berganda dengan model regresi

iLiLiii xxxy εββββ +++++= ...22110 , (1) Apabila disajikan dalam bentuk matriks menjadi :

+

=

nLLnnn

L

L

L

n xxx

xxxxxxxxx

y

yyy

ε

εεε

β

βββ

3

2

1

2

1

0

21

32313

22212

12111

3

2

1

1

111

(2)

B. Regresi Non Parametrik Berbeda dengan regresi parametrik, pada regresi non-

parametrik bentuk kurva regresi diasumsikan tidak diketahui. Tujuan utama dari regresi adalah mencari estimator untuk kurva regresi dan dalam pendekatan regresi nonparametrik ini akan menggunakan asumsi yang longgar sehingga peneliti tidak memaksakan memakai bentuk kurva yang kaku namun membiarkan data sendiri yang akan mencari bentuk estimasi dari kurva regresinya. Kurva regresi dalam regresi non-parametrik diasumsikan halus (smooth) dan termuat dalam suatu ruang fungsi tertentu. Beberapa model regresi non-parametrik yang banyak digunakan diantaranya Spline, Kernel, Deret Fourier, dan MARS.

C. Regresi Semiparametrik Spline Dalam regresi semiparametrik, terdapat dua komponen

yaitu komponen parametrik dan komponen nonparametrik [13]. Komponen parametrik dimana bentuk kurvanya diketahui, dan komponen nonparametrik dimana bentuk kurvanya tidak diketahui. Model regresi semiparametrik yang banyak digunakan dalam dasawarsa terakhir adalah regresi semiparametrik spline. Spline merupakan nama sebuah fungsi yang pertama kali dikembangkan Whittaker pada Tahun 1921. Spline memiliki kemampuan yang sangat baik untuk menangani data yang perilakunya berubah-ubah pada sub-sub interval tertentu [11]. Misalkan terdapat kurva regresi semiparametrik :

iiliL tfxtxxxh εβ ++= )(),,,,( '21 (3)

ni ,,2,1 = Ll ,,2,1, = Dengan f fungsi komponen nonparametrik yang termuat di

dalam ruang Sobolev [ ]baW m ,2 dan β'lix komponen

parametrik. Ruang Sobolev [ ]baW m ,2 didefinisikan sebagai berikut [11].

[ ] ( )

∞<= ∫b

a

mm dttffbaW 2)(2 )(;, (4)

Estimator kurva regresi f̂ dan β̂ diperoleh dari meminimumkan Penalized Least Square (PLS) berikut :

( ) ( )∫∑ +−−=

−b

a

mn

iilii dttftfxyn 2)(

1

2'1 )()( γβ (5)

untuk setiap [ ]baWf m ,2∈ . Spline merupakan potongan polinomial yang memuat titik-

titik knot. Titik knot merupakan titik perpaduan bersama dimana terjadi perubahan pola perilaku fungsi. Secara umum, fungsi spline dengan order p dan K knot dapat dituliskan,

∑∑=

++=

−+=K

k

pkkp

p

j

jj Ktttf

10)()( αα (6)

Dimisalkan x merupakan variabel komponen parametrik dan t merupakan variabel komponen nonparametrik maka model regresi semiparametrik spline dapat dituliskan,

i

Q

qqiqli

iQiQiili

QLL

tfx

tftftfx

tftftfxxy

εβ

εβ

εβββ

++=

+++++=

++++++++=

∑=1

'

2211'

11110

)(

)()()(

)()()(

(7)

Bentuk )( qiq tf dapat dijabarkan,

∑∑=

++=

−+=K

k

pkqiqkp

p

j

jqijqqiq Ktttf

1)(

0)()( αα (8)

dengan p adalah order atau derajat spline dan K adalah

jumlah knot dalam spline. pkqi Kt +− )( merupakan potongan-

potongan dengan nilai,

<≥−

=− +kqi

kqip

kqipkqi Kt

KtKtKt

,0,)(

)( (9)

D. Generalized Cross Validation (GCV) Metode yang digunakan untuk memilih knot yang optimal

adalah dengan metode Generalized Cross Validation (GCV). Metode GCV dapat dituliskan sebagai berikut [14].

[ ]( )2211

2121

),,,(

),,,(),,,(

k

kk

KKKAItracen

KKKMSEKKKGCV

−=

dimana,

( )2

1

121 ˆ),,,( ∑

=

− −=n

iiik yynKKKMSE (10)

dan kKKK ,,, 21 merupakan titik-titik knot.

III. METODOLOGI PENELITIAN Data yang digunakan dalam penelitian ini adalah data

sekunder yang didapatkan dari Dinas Pertanian Provinsi Jawa Timur, Badan Ketahanan Pangan Provinsi Jawa Timur, Badan Pusat Statistik Provinsi Jawa Timur, dan Dinas PU Pengairan Provinsi Jawa Timur. Unit pengamatan yang digunakan adalah 35 kabupaten/kota di Provinsi Jawa Timur. Variabel respon dan variabel prediktor yang digunakan dalam penelitian ini adalah :

Page 3: ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI …digilib.its.ac.id/public/ITS-paper-34622-1309100009-Paper.pdf · metode Generalized Cross Validation ... Berdasarkan hasil analisis didapatkan

3

1. Produksi Kedelai (y) 2. Luas Panen Kedelai (x1) 3. Luas Puso Kedelai (t1) 4. Konsumsi Kedelai (t2) 5. Curah Hujan (t3) 6. Alokasi Pupuk Bersubsidi (t4) 7. Ketinggian Rata-rata dari Permukaan Laut (t5) Struktur data penelitian tertera pada Tabel 1.

Adapun langkah-langkah analisis data yang dilakukan dalam penelitian ini adalah : 1. Menjelaskan data yang diperoleh secara deskriptif 2. Membuat scatter plot untuk masing – masing prediktor

dengan respon 3. Menentukan variabel komponen parametrik dan

komponen nonparametrik dalam regresi semiparametrik 4. Memodelkan data dengan pendekatan Regresi

Semiparametrik Spline 5. Memilih titik knot optimal dengan metode Generalized

Cross Validation (GCV) 6. Menentukan model terbaik 7. Menghitung Koefisien Determinasi R2 dan MSE 8. Melakukan pengujian signifikansi parameter 9. Melakukan uji asumsi residual, yaitu identik, independen,

dan berdistribusi normal (IIDN) 10. Kesimpulan

IV. HASIL DAN PEMBAHASAN

A. Deskripsi Produksi Kedelai di Provinsi Jawa Timur beserta Faktor-faktor yang Diduga Mempengaruhi

Sebagai provinsi dengan jumlah produksi kedelai terbesar di Indonesia, Jawa Timur merupakan aset berharga bagi pertanian Indonesia. Gambar 1 menunjukkan pengelompokan kabupaten/kota di Jawa Timur berdasarkan jumlah produksi kedelai yang dihasilkan. Blok berwarna putih menunjukkan kabupaten/kota yang tidak menghasilkan produksi kedelai karena memang tidak terdapat lahan penanaman kedelai, kabupaten/kota yang dimaksud adalah Kota Probolinggo, Kota Malang, dan Kota Blitar. Sebagian besar kabupaten/kota menghasilkan produksi kedelai di bawah angka 12.354 ton. Kabupaten Banyuwangi merupakan kabupaten penghasil kedelai terbesar di Jawa Timur dengan produksi lebih dari 49.413 ton.

B. Deteksi Outlier pada Data Produksi Kedelai Berdasarkan pembahasan sebelumnya, diketahui bahwa

varians pada data produksi kedelai amatlah besar. Hal ini menyebabkan munculnya dugaan terjadinya outlier pada data produksi kedelai. Dugaan outlier ditelusuri dengan menguji kesamaan mean antara rata-rata dengan Wmean data produksi kedelai.

Langkah selanjutnya adalah menguji kesamaan mean antara nilai rata-rata dan Wmean produksi kedelai dengan hipotesis sebagai berikut.

371,9479:371,9479:

1

0

≠=

µµ

HH

dengan menggunakan taraf signifikansi 5% didapatkan

nilai 6667,0=valuep yang memberikan keputusan gagal tolak

0H , artinya tidak terdapat perbedaan nilai mean antara rata-rata dan Wmean data produksi kedelai. Hasil tersebut mengindikasikan bahwa tidak terjadi outlier pada data produksi kedelai sehingga data dapat digunakan untuk analisis lebih lanjut.

Tabel 1. Struktur Data Penelitian

Respon ( y )

Prediktor Komponen

Parametrik ( x )

Komponen Nonparametrik ( t )

1x 1t

5t

1y 1,1x 1,1t 1,5t

2y 2,1x 2,1t 2,5t

35y 35,1x 35,1t 35,5t

Tabel 2. Deskripsi Jumlah Produksi Kedelai di Jawa Timur beserta Faktor-faktor yang

Diduga Mempengaruhinya Variabel Rata-rata Varians Minimum Maksimum

y 10486 187778751 1 61767

1x 7223 76896937 1 35150

1t 15,89 1389,57 0,00 172,00

2t 12936 59610904 1499 34485

3t 1726,8 186698,7 274,3 2307,8

4t 7175 21991547 134 16223

5t 91,7 29787,5 2,0 831,0

Gambar. 1. Jumlah Produksi Kedelai Tiap Kabupaten/Kota di Jawa Timur

Tabel 3. Nilai Rata-rata, Tmean, dan Wmean pada Data Produksi Kedelai

Keterangan Alpha Nilai

Rata-rata - 10486 Tmean 0,05 8699,871 Wmean 0,05 9479,371

Page 4: ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI …digilib.its.ac.id/public/ITS-paper-34622-1309100009-Paper.pdf · metode Generalized Cross Validation ... Berdasarkan hasil analisis didapatkan

4

C. Plot antara Produksi Kedelai dengan Faktor-faktor yang Diduga Mempengaruhinya

Untuk menentukan variabel-variabel yang termasuk dalam komponen parametrik ataupun komponen non parametrik maka dapat dilihat berdasarkan scatter plot antara variabel respon jumlah produksi kedelai ( y ) dengan masing-masing variabel prediktor yang diduga mempengaruhinya. Gambar 2 memperlihatkan masing-masing plot yang terbentuk untuk enam variabel yang diduga berpengaruh.

Berdasarkan Gambar 2 dapat dilihat bahwa terdapat enam buah scatter plot dengan masing-masing sebaran titik yang berbeda-beda. Plot antara produksi kedelai ( y ) dengan

variabel luas panen kedelai ( 1x ) membentuk pola sebaran titik yang cenderung linear sehingga termasuk dalam komponen parametrik. Sementara itu scatter plot antara variabel respon dengan variabel prediktor selain luas panen tidak mengikuti suatu pola tertentu, sehingga variabel-variabel tersebut dimasukkan dalam komponen nonparametrik.

D. Pemilihan Titik Knot Optimal

Dalam pendekatan regresi semiparametrik spline, dikenal adanya titik yang disebut dengan knot yaitu titik perpaduan bersama dimana terjadi perubahan pola perilaku fungsi.

Metode GCV digunakan untuk menentukan letak knot optimal dalam setiap variabel yang termasuk komponen non-parametrik. Knot yang digunakan beragam yaitu sebanyak satu knot, dua knot, tiga knot, dan juga kombinasi. Nilai GCV terkecil terdapat pada hasil knot kombinasi seperti pada Tabel 4, sehingga knot kombinasi paling optimal yang akan digunakan untuk proses pemodelan. Sebagaimana yang tertera dalam Tabel 5, knot kombinasi optimal memberikan jumlah knot yang berbeda untuk setiap komponen nonparametrik.

E. Pemodelan Regresi Semiparametrik Spline Titik knot optimal yang diperoleh dari knot kombinasi

digunakan dalam pemodelan regresi semiparametrik spline dan membentuk persamaan sebagai berikut.

( )( )

( ) ( )( ) ( )

( ) ( )++

++

++

+

+

−−−−+

−−−++

−+−−

++−+−

+−−−+−=

082,81434,0898,06,149093224,142,126111296,698,122821888,591655,0

25,18510586,2925,17680207,223547,08,338117249,10443,0

49,1684547,04041,201,28920331,0ˆ

554

444

33

322

111

iii

iii

ii

iii

iiii

tttttt

ttttt

ttxy

F. Uji Parameter Model Regresi Pengujian secara overall dilakukan untuk melihat

signifikansi parameter terhadap variabel respon secara keseluruhan dengan melibatkan seluruh variabel prediktor. Hasil dari uji overall dapat dilihat pada Tabel 6.

Tabel 6. ANOVA Model Regresi Semiparametrik Spline

Sumber Variasi df SS MS F P-value

Regresi 14 6277119167 448365655

78,2320 0,00 Error 20 114624566 5731228

Total 34 6391743734

Tabel 7. Uji Parsial Model Regresi Semiparametrik Spline

Variabel Parameter Koefisien hitungt P-value

- 0β -0,0331 -0,4213 0,6780326

1x 1β 1,2892 16,8513 0,00*

1t 11α -20,4041 -1,7080 0,1031063

21α -0,4547 -1,9483 0,06554504

2t 12α -0,0443 -0,4872 0,6314058

22α 1,7249 0,3137 0,7569832

3t 13α 0,3547 0,4790 0,6371034

23α -22,0207 -1,2992 0,2086451

33α 29,0586 1,4421 0,1647521

4t 14α 0,1655 0,9574 0,3497933

24α 59,1888 4,8013 0,0001086689*

34α -69,1296 -4,7469 0,0001232661*

44α 14,3224 3,0368 0,006512625*

5t 15α -0,8980 -0,3481 0,7314316

25α -0,3400 -2,6895 0,01409778*

* – Memberikan pengaruh yang signifikan pada alpha 0,05

40000200000 160800 30000150000

60000

45000

30000

15000

0

200010000

60000

45000

30000

15000

0

1600080000 8004000

Luas Panen (Ha)

Prod

uksi

(To

n)

Luas Kerusakan / Puso (Ha) Konsumsi (Ton)

Curah Hujan per Tahun (mm) Pupuk (Ton) Tinggi dari Permukaan (m)

Gambar. 2. Scatterplot antara Produksi Kedelai dengan Faktor-faktor yang Diduga Mempengaruhinya

Tabel 4. Nilai GCV Menggunakan 1 Titik Knot, 2 Titik knot, 3 Titik knot, dan

Knot Kombinasi No. Knot GCV 1 1 Titik Knot 13000513 2 2 Titik Knot 12524071 3 3 Titik Knot 10582160 4 Kombinasi Knot 7583856

Cetak tebal – Nilai GCV terkecil

Tabel 5. Titik Knot Optimal pada Knot Kombinasi

Knot

1t 2t 3t 4t 5t

168,490 33811,8 1768,25 12282,8 814,082

1851,25 12611,2

14909,6

Page 5: ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI …digilib.its.ac.id/public/ITS-paper-34622-1309100009-Paper.pdf · metode Generalized Cross Validation ... Berdasarkan hasil analisis didapatkan

5

Berdasarkan Tabel 6 diketahui nilai valuep sebesar 0,00.

Dengan membandingkan nilai valuep terhadap nilai α

sebesar 5% didapatkan keputusan untuk tolak 0H yang berarti bahwa terdapat minimal satu variabel yang memberikan pengaruh signifikan terhadap model. Untuk mengetahui secara lebih jelas variabel-variabel mana sajakah yang memberikan pengaruh signifikan terhadap model maka dilakukan pengujian parsial sebagaimana dalam Tabel 7.

Dalam Tabel 7 diberikan nilai hitungt dan valuep dari masing-masing estimasi parameter. Apabila dibandingkan antara valuep dengan α sebesar 5% maka didapatkan lima parameter yang memberikan pengaruh yang signifikan terhadap model. Masing-masing estimasi parameter yang signifikan tersebut merupakan parameter dari variabel luas panen kedelai atau ( 1x ), alokasi pupuk bersubsidi ( 4t ), dan

ketinggian rata-rata dari permukaan laut ( 5t ). Variabel-variabel tersebut dikatakan sebagai variabel yang berpengaruh secara signifikan. G. Uji Asumsi Residual

Terdapat asumsi residual yang harus dipenuhi dalam analisis regresi yaitu asumsi residual identik, independen, dan berdistribusi normal. Asumsi identik atau homoskedastisitas dapat diuji menggunakan metode formal seperti uji glejser. Berikut adalah hasil pengujian asumsi residual identik dengan uji glejser.

Dari hasil pengujian didapatkan nilai hitungF sebesar

1,182466 dengan valuep sebesar 0,357. Karena nilai valuep lebih besar dibandingkan taraf signifikansi α sebesar 0,05 maka gagal menolak 0H sehingga kesimpulan yang didapat adalah tidak terjadi kasus heteroskedastisitas pada residual atau asumsi residual identik terpenuhi.

Asumsi residual selanjutnya yang harus dipenuhi dalam pemodelan regresi adalah asumsi independen pada residual. Asumsi residual independen yaitu asumsi bahwa tidak ada korelasi antar residual. Salah satu cara untuk mengetahui ada tidaknya korelasi dari residual yaitu dengan melihat plot ACF atau Autocorrelation Function. Dari plot ACF yang ada pada Gambar 3, terlihat bahwa dari 34 lag yang ada, tidak ada satupun lag yang keluar dari batas toleransi. Karena tidak ada lag yang keluar dari batas toleransi maka dapat dikatakan bahwa asumsi residual independen terpenuhi.

Selain memenuhi asumsi identik dan independen, residual juga harus memenuhi asumsi distribusi normal. Pengujian asumsi residual berdistribusi normal dilakukan dengan

menggunakan uji Kolmogorov Smirnov dan didapatkan hasil untuk nilai 202,035;05,0 =D . Sementara nilai untuk D adalah :

166383565,0)()( 0 =−= xFxFSupD nx

Karena nilai nDD ;α< berarti gagal tolak 0H sehingga dapat disimpulkan bahwa kumpulan data residual tersebut berdistribusi normal. Dengan terpenuhinya asumsi residual berdistribusi normal tersebut, maka residual dari model regresi semiparametrik spline telah memenuhi semua asumsi residual yang disyaratkan.

H. Faktor-faktor yang Mempengaruhi Produksi Kedelai di Jawa Timur

Setelah dilakukan pengujian parameter model regresi dan semua asumsi residual telah terpenuhi, maka model regresi yang didapatkan tersebut dapat diinterpretasikan untuk lebih mempermudah pemahaman terhadap model. Berdasarkan analisis didapatkan nilai koefisien determinasi atau 2Rsebesar 98,2% yang berarti variabel luas panen kedelai, luas puso kedelai, konsumsi kedelai, curah hujan, alokasi pupuk bersubsidi, dan ketinggian rata-rata dari permukaan laut mampu menjelaskan variabilitas produksi kedelai sebesar 98,2%. Berdasarkan Gambar 4 diketahui bahwa plot antara produksi kedelai aktual dengan produksi kedelai hasil pemodelan (fits) digambarkan oleh dua garis yang berhimpit. Hasil ini menunjukkan bahwa model regresi semiparametrik spline yang terbentuk merupakan model yang baik untuk memodelkan produksi kedelai karena menghasilkan dugaan yang mendekati nilai aktualnya.

Tabel 8. ANOVA untuk Uji Glejser

Sumber Variasi df SS MS F P-value

Regresi 14 33017251 2358375

1,182466 0,357 Error 20 39889093 1994455

Total 34 72906345

302520151051

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

LagA

utoc

orre

lati

on

Gambar. 3. Plot Autocorrelation Function (ACF) Residual

403020100

70000

60000

50000

40000

30000

20000

10000

0

order

Prod

uksi

Ked

elai

(to

n)

Produksi AktualProduksi Pemodelan (Fits)

Variable

Gambar 4. Plot antara Produksi Kedelai Aktual dengan Fits

Page 6: ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI …digilib.its.ac.id/public/ITS-paper-34622-1309100009-Paper.pdf · metode Generalized Cross Validation ... Berdasarkan hasil analisis didapatkan

6

Model regresi yang terbentuk menggunakan titik knot optimal yang berasal dari knot kombinasi yaitu:

( )

( )( ) ( )

( ) ( )( ) ( )++

++

++

+

+

−−−−+

−−−++

−+−−

++−+−

+−−−+−=

082,81434,0898,06,149093224,142,126111296,698,122821888,591655,0

25,18510586,2925,17680207,223547,08,338117249,10443,0

49,1684547,04041,201,28920331,0ˆ

554

444

33

322

111

iii

iii

ii

iii

iiii

tttttt

ttttt

ttxy

Interpretasi model untuk variabel-variabel yang signifikan dilakukan untuk mengetahui pengaruh dari masing-masing variabel tersebut terhadap jumlah produksi kedelai, Variabel luas panen kedelai ( 1x ) mempengaruhi jumlah produksi kedelai secara linear yakni bila luas panen kedelai naik sebesar satu hektar maka jumlah produksi kedelai cenderung naik sebesar 1,2892 ton dengan asumsi variabel lain konstan.

Interpretasi model terhadap variabel alokasi pupuk bersubsidi ( 4t ) dengan asumsi variabel lain konstan ialah sebagai berikut.

≥+−<≤−<≤+−

<

=

61,14909;5498,4129,6874261,1490918,12611;7726,9269,14479918,1261184,12282;3543,5956,727006

84,12282;1655,0

ˆ

44

44

44

44

tttttt

tt

y

Saat alokasi pupuk bersubsidi kurang dari 12.282,84 ton maka bila alokasi pupuk bersubsidi naik sebesar 1 ton, maka jumlah produksi kedelai cenderung bertambah sebesar 0,1655 ton. Pada saat alokasi pupuk bersubsidi terlentak antara 12.282,84 ton hingga 12.611,18 ton maka bila alokasi pupuk bersubsidi naik sebesar 1 ton akan cenderung menambah jumlah produksi kedelai sebesar 59,3545 ton. Pada saat alokasi pupuk bersubsidi terlentak pada segmen 12.611,18 dan 14.909,61 ton maka bila alokasi pupuk bersubsidi naik sebesar 1 ton, jumlah produksi kedelai cenderung menurun sebesar 9,7726 ton yaitu tepatnya untuk Kabupaten Banyuwangi, Lamongan, dan Tuban. Sedangkan jumlah produksi kedelai cenderung meningkat sebesar 4,5498 ton dengan alokasi pupuk bersubsidi naik sebesar 1 ton, apabila alokasi pupuk bersubsidi terletak pada angka lebih dari 14.909,61 ton yaitu untuk Kabupaten Jember.

Interpretasi model terhadap variabel ketinggian rata-rata dari permukaan laut ( 5t ) dengan asumsi variabel lain konstan adalah:

≥−<−

=0816,814;238,1788,276

0816,814;898,0ˆ

55

55

tttt

y

Saat ketinggian rata-rata wilayah kurang dari 814,0816 meter dari permukaan laut, maka bila variabel ketinggian rata-rata dari permukaan laut naik sebesar satu meter, maka jumlah produksi kedelai Jawa Timur cenderung turun sebesar 0,898 ton. Sedangkan saat ketinggian rata-rata wilayah lebih dari atau sama dengan 814,0816 meter dari permukaan laut, maka bila variabel ketinggian rata-rata dari permukaan laut naik sebesar satu meter, maka jumlah produksi kedelai Jawa Timur cenderung turun sebesar 1,238 ton yaitu untuk Kota Batu.

V. KESIMPULAN DAN SARAN Faktor-faktor yang mempengaruhi produksi kedelai di

Jawa Timur yaitu variabel luas panen kedelai, alokasi pupuk bersubsidi, dan variabel ketinggian rata-rata dari permukaan laut. Nilai koefisien determinasi atau 2R sebesar 98,2% sehingga dapat dikatakan bahwa model regresi semi-parametrik spline yang dihasilkan merupakan model yang baik. Saran yang dapat disampaikan berdasarkan hasil analisis dan pembahasan yang telah dilakukan yaitu untuk pihak instansi terkait agar dalam pengambilan kebijakan untuk peningkatan produksi kedelai hendaknya disesuaikan dengan wilayah yang memiliki ketinggian yang sesuai, serta mengupayakan penyediaan pupuk yang tepat utamanya untuk daerah potensial seperti Kabupaten Banyuwangi, Lamongan, dan Tuban. Sedangkan untuk pengembangan dari penelitian ini, hendaknya menambah variabel lain yang juga diduga mempengaruhi dimana untuk saat ini masih terkendala dalam hal penyediaan data. Variabel yang dimaksud yakni harga riil kedelai tingkat produsen, harga riil benih kedelai, volume impor kedelai, dan harga riil kedelai impor.

DAFTAR PUSTAKA [1] D. Mursito, “Heritabilitas dan Sidik Lintas Karakter Fenotipik Beberapa

Galur Kedelai (Glycine Max. (L) Merrill),” Skripsi Sarjana, Universitas Sebelas Maret, Surakarta (2003).

[2] Dirjen Tanaman Pangan, “Pedoman Teknis Produksi Tanaman Kedelai,” Kementerian Pertanian RI (2012).

[3] BPS, “Tabel Luas Panen-Produktivitas-Produksi Tanaman Kedelai Seluruh Provinsi,” Jakarta (2012).

[4] Dinas Pertanian Provinsi Jawa Timur, “Tabel Kontribusi Jawa Timur terhadap Nasional untuk Tanaman Kedelai Tahun 1970-2011,” Surabaya (2012).

[5] D. Handayani, T. Bantacut, J. M. Munandar, dan S. Budijanto, “Simulasi Kebijakan Daya Saing Kedelai Lokal pada Pasar Domestik,” J. Tek. Ind. Pertanian, Vol 19, (2009) 7-15.

[6] W. B. Komalasari, “Prediksi Penawaran dan Permintaan Kedelai Dengan Analisis Deret Waktu,” Informatika Pertanian, Vol 17, No. 2 (2008).

[7] D. Maretha, “Peramalan Produksi dan Konsumsi Kedelai Nasional Serta Implikasinya Terhadap Strategi Pencapaian Swasembada Kedelai Nasional,” Skripsi Sarjana, Institut Pertanian Bogor, Bogor (2008).

[8] R. Purnamasari, “Analisis Faktor-faktor yang Mempengaruhi Produksi dan Impor Kedelai di Indonesia,” Skripsi Sarjana, Institut Pertanian Bogor, Bogor (2006).

[9] M. A. Kadiri, R. J. Carroll, and M. P. Wand, “Marginal longitudinal semiparametric regression via penalized splines,” Stat.Probab.Lett, Vol 80, (2010) 1242-1252.

[10] I. N. Budiantara, “Model Keluarga Spline Polinomial Truncated Dalam Regresi Semiparametrik,” Berkala MIPA, Vol 15, (2005) 49-59.

[11] I. N. Budiantara, “Spline dalam Regresi Nonparametrik dan Semiparametrik, Sebuah Pemodelan Statistika Masa Kini dan Masa Mendatang,” Pidato Pengukuhan Guru Besar, Institut Teknologi Sepuluh Nopember, Surabaya (2009).

[12] I. Yahya, I. N. Budiantara, K. Fitriasari, “Analisis Regresi Semiparametrik Pada Kasus Hilangnya Respon,” Jurnal Matematika, Vol. 9, (2006) 124-132.

[13] D. Ruppert, M. P. Wand, and R. J. Carrol, Semiparametric Regression, New York: Cambridge University Press (2003).

[14] G. Wahba, Spline Models for Observation Data, Pensylvania: University of Winsconsin at Madison (1990).