Oleh : Fuji Rahayu W 1208 100 043) -...
Transcript of Oleh : Fuji Rahayu W 1208 100 043) -...
Oleh :Fuji Rahayu W (1208 100 043)
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA
2012
Indonesia sebagai negara maritim
Penduduk Indonesia banyak yang
menggantungkan hidupnya pada sektor
perikanan
Metode regresi utk memodelkan jumlah produksi ikan laut di
Jatim
Meningkatkan jumlah produksi ikan laut melalui pemilihan variabel kendali
yang tepat
RumusanMasalah
1. Bagaimana bentuk persamaan model regresi untuk jumlah penangkapan ikan laut di Provinsi Jawa Timur.
2. Bagaimana model regresi yang terbentuk darivariabel bebas terhadap variabel respon.
Batasan massalah dalam Tugas Akhir ini adalah :
1. Variabel responnya adalah jumlahpenangkapan ikan di perairan laut (Y)dan variabel bebasnya adalah jumlahnelayan (X1), jumlah motor boatpenangkap ikan (X2), jumlah alatpenangkapan ikan (X3) dan jumlahPDRB nelayan (X4).
2. Data stastistik yang diambil adalah datatahunan tentang perikanan di ProvinsiJawa Timur dari tahun 1980-2010berdasarkan Badan Pusat StatistikProvinsi Jawa Timur.
3. Selang kepercayaan yang digunakan adalah 95 %.
4. Metode yang digunakan adalah Regresi Linier Bertatar Langkah Mundur.
Tujuan Penelitian
1. Menentukan model regresi untuk jumlahpenangkapan ikan laut di Provinsi Jawa Timur.
2. Menentukan besarnya sumbangan variabel bebas secara keseluruhan terhadap variabel respon dari model regresi yang didapat.
Manfaat yang diharapkan pada tugas akhir ini adalah untuk memberikaninformasi mengenai seberapa besar pengaruh variabel bebas terhadapjumlah penangkapan ikan laut di Provinsi Jawa Timur yang diharapkanmempunyai prospek hasil penangkapan ikan yang lebih bagus kedepannya.
2.1 Analisis Regresi
Analisis regresi merupakan sebuah alat statistik yang memberikan penjelasan tentangpola hubungan (model) antara dua variabel atau lebih. Dalam analisis regresi, dikenal dua jenisvariabel yaitu variabel respon yaitu variabel yang keberadaannya dipengaruhi oleh variabellainnya dan dinotasikan dengan Y dan variabel bebas yaitu variabel yang bebas yangkeberadaannya tidak dipengaruhi oleh variabel lainnya dan dinotasikan dengan X.
2.2 Analisis Regresi Linier Berganda
Analisis regresi linier berganda (Multiple Linier Regression) ialah suatu alat analisisdalam ilmu statistik yang berguna untuk mengukur hubungan matematis antara lebih dari duapeubah. Regresi linear berganda juga merupakan regresi dimana variabel terikatnya (Y)dihubungkan atau dijelaskan lebih dari satu variabel, mungkin dua, tiga dan seterusnya variabelbebas. Bentuk umum dari persamaan regresi linier berganda dapat ditulis sebagai berikut:
Y = 0 + 1X1i + 2X2i + ….. + kXki + i ; i = 1,2, …, n
dengan :Y : variabel responβ0, β1...βk : parameter regresiX1i , X2i .. Xki : variabel bebasεi : errork : banyaknya parameter
2.3 Regresi Bertatar
Metode regresi bertatar umumnya dipakai sebagai pemilihan model terbaikapabila antar variabel bebasnya mengalami multikolinieritas karena dengan metodebertatar ini dapat menghilangkan variabel yang mempunyai multikolinieritas tinggi.
Metode begresi bertatar langkah mundur (backward selection) mencobamemeriksa hanya regresi “terbaik” yang mengandung sejumlah tertentu peubahperamal. Metode ini bekerja dengan mengeluarkan satu per satu variabel bebas yangtidak signifikan dan dilakukan terus menerus sampai tidak ada variabel bebas yangtidak signifikan, langkah-langkah metode backward adalah sebagai berikut :
1. Menghitung persamaan regresi yang mengandung semua peubah peramal.2. Menghitung nilai F-parsial untuk setiap peubah peramal.3. Membandingkan nilai F-parsial terendah, misalnya FL, dengan nilai F
bertaraf nyata tertentu dari tabel, misalnya F0.a. Jika FL < F0, buang peubah ZL yang menghasilkan FL dari persamaan
regresi, kemudian hitung kembali persamaan regresi tanpa menyertakan peubahtersebut; kembali ke langkah (2).
b. Jika FL > F0, ambillah persamaan regresi tersebut.
1)kSSRes/(nSSReg/k
MSEMSRF
hitung
2.4 Pengujian Parameter Regresi
1. Uji serentak
Uji serentak bertujuan untuk menguji apakah antara variabel-variabel bebas X dan terikat Y benar-benarterdapat hubungan linier (linear relation). Hipotesa :H0 : βi = 0, dimana i = 1,2,3,4,...kH1 : ada i dimana βi ≠ 0, dimana i = 1,2,3,4,...kStatistik Uji :
Kriteria Pengujian :Tolak Ho jika Fhitung > FTabel (α , p, n- p-1 ).
1)kSSRes/(nSSReg/k
MSEMSRF
hitung
2. Uji Individu
Dalam pengujian ini ingin diketahui apakah jika secara terpisah, suatu variabel X masih memberikankontribusi secara signifikan terhadap variabel terikat Y. Hipotesa :H0 : βi = 0H1 : βi ≠ 0Statistik Uji :
jika thitung > ttabel (n-p), maka tolak H0
)()ˆ(.
ˆ
j
j
j
j
hitungbs
b
est
2.5 Uji Asumsi Residual
Karena model regresi yang dibentuk didasarkan dengan meminimumkanjumlah kuadrat error, maka residual (sisaan) yang dalam hal ini dianggap sebagai suatukesalahan dari pengukuran harus memenuhi beberapa asumsi, diantarannya :
• Identik : memiliki varian yang konstan• Bebas (saling bebas) : tidak ada autokorelasi antar residual• Berdistribusi Normal
a
1. Uji Identik (Heteroscedasticitas)
Hipotesa :
Statustik uji :
Kriteria pengujian:Apabila nilai F hitung < F Tabel, maka H0 diterima atau residual tidak terdapat
heterokedastisitas.
0 1 1 2 2 ...i n nX X X
2. Uji Asumsi Independen
Hipotesa :
Statistik uji Durbin-Watson :
n
tn
t
t
tt
e
eed
2
1
2
21
Kriteria pengujian : Ho: tak ada otokorelasi positifBila: d < dL : tolak Ho, d >dU : terima Ho, dL≤d≤dU : tak dapat disimpulkan
Ho: tak ada otokorelasi negatif Bila:d >4 - dL : tolak Ho, d<4-dU : terima Ho, 4-dU ≤d≤ 4-dL : tak dapat disimpulkan
Ho: tak ada otokorelasi positif dan negatifBila: d < dL atau d > 4- dL : tolak Ho, dU<d<4-dU : terima Ho, dL≤d≤dU atau4-dU ≤d≤ 4-dL : tak dapatdisimpulkan
3. Uji Asumsi Distribusi Normal
Uji asumsi distribusi normal adalah untuk melihat apakah nilai residual terdistribusinormal atau tidak. Model regresi yang baik adalah memiliki nilai residual yang terdistribusinormal. Jadi uji normalitas bukan dilakukan pada masing-masing variabel tetapi pada nilairesidualnya.
4. Uji Multikolinieritas
Multikolinearitas merupakan korelasi atau hubungan yang kuat diantara variabel-variabel bebas dalam persamaan regresi linear berganda. Multikolinearitas terjadi jika nilaiVariance Inflation Factor (VIF) lebih besar dari 10.
Metodologi Penelitian
PengumpulanData
Metodepenelitian
Penarikan kesimpulan
Penyusunan laporan
Dalam Tugas Akhir ini, data di ambil dari Badan Pusat Statistik Provinsi Jawa Timur. Data stastistik yang diambil adalah data tahunan tentang perikanan di Provinsi Jawa Timur dari tahun 1980-2010.
Langkah1: Memeriksa asumsi
Langkah 2: Mengolah data denganbantuan Minitab 15
Langkah 3: Menafsirkan output
Langkah4:Mengembangkanpersamaan model
4.1 Analisis Regresi
Dengan menggunakan program aplikasi MINITAB diperoleh hasil output komputer sebagai berikut:
Tabel 4.1 Hasil Printout Analisis Regresi Y terhadapX1, X2, X3, X4
The regression equation is
Y = 168109 + 0,554 X1 - 2,4 X2 - 4,68 X3 + 0,0137 X4
Predictor Coef SE Coef T P VIF
Constant 168109 118997 1,41 0,170
X1 0,5539 0,5890 0,94 0,356 2,829
X2 -2,42 10,58 -0,23 0,821 18,364
X3 -4,678 3,040 -1,54 0,136 2,139
X4 0,01365 0,01092 1,25 0,222 21,074
S = 60074,9 R-Sq = 70,6% R-Sq(adj) = 66,1%
Analysis of Variance
Source DF SS MS F P
Regression 4 2,25770E+11 56442424985 15,64 0,000
Residual Error 26 93833719809 3608989223
Total 30 3,19603E+11
Durbin-Watson statistic = 1,48237
Analisis dan Pembahasan
Dari hasil pengolahan data minitab pada Tabel 4.1 diperoleh suatu model parameterregresi dengan metode kuadrat terkecil dan persamaan regresinya sebagai berikut:
Yi = 168109 + 0,554X1i - 2,4X2i - 4,68X3i + 0,0137X4i + εi
Setelah dilakukan pengujian parameter untuk uji serentak, didapat bahwa = 15,6393 >Ftabel (5%,4,26) = 2,74 atau nilai p-value = 0.000 < = 0.05. Yang berarti secara statistik signifikan, makaH0 ditolak sehingga dapat disimpulkan bahwa secara bersama-sama terdapat pengaruh variabel X1,X2, X3 dan X4 terhadap variabel Y.
Sedangkan untuk uji individu didapat berdasarkan hasil output diperoleh bahwa koefisienregresi dari masing-masing X1, X2, X3, dan X4 tidak signifikan karena nilai thitung dari masing-masing koefisiennya lebih kecil daripada ttabel, sehingga Ho diterima. Maka dapat disimpulkanbahwa koefisien regresi variabel X1, X2, X3, dan X4 yang bersesuaian dengan parameter regresisecara individual tidak memberikan pengaruh yang berarti terhadap model.
3.2 Uji Asumsi Residual
a. Uji Identik (Heteroscedasticitas).Dari hasil pengolahan diperoleh Fhitung = 3,25 > Ftabel (5%,4,26) = 2,74, dengan demikian Ho
ditolak, maka dapat disimpulkan bahwa terjadi heteroskedastisitas.
b. Independen (Autokorelasi)Secara umum, pengujian autokorelasi dapat menggunakan plot ACF seperti pada Gambar
1. Jika tidak ada lag yang keluar dari garis merah, maka dapat disimpulkan bahwa tidak terdapatkorelasi antar variabelnya.
c.Uji NormalitasHasil minitab pada Gambar 2 menggunakan test Kolmogorov Smirnov menunjukkan p-
value < 0,150 maka H0 ditolak, jadi residual tidak memenuhi asumsi normal.
d. MultikolinearitasDari hasil Analisis multikolinearitas menggunakan minitab pada Tabel 1 ditemukan nilai
VIF yang lebih besar dari 10 yaitu variabel X2 dan X4 sehingga diduga ada multikolinearitas antarvariabel bebas tersebut.
Gambar 1. Plot ACF residual 1 Gambar 2. Uji Normalits residual 1
3.3 Perbaikan Model
Dari model yang didapat sebelumnya, masih terdapat heterokedastisitas dan multikolenieritas serta residualnya belum berdistribusi normal. Oleh karena itu, antar variabel bebasnya perludiadakan tinjauan ulang terhadap model tersebut dengan melakukan transformasi terhadap semua variabelnya, yaitu variabel Y, X1, X2, X3 dan X4 dengan menggunakan transformasi Box-Cox.. Untuk selanjutnya, semua variabel yang sudah ditransformasi diberi lambang Y*, X1*, X2*, X3* dan X4
*.dengan :Y* mempunyai nilai X1* mempunyai nilai (X1)2
X2* mempunyai nilai In X2
X3* mempunyai nilai In X3
X4* mempunyai nilai (X4)0,18
Setelah dilakukan transformasi dengan menggunakan Box-Cox didapat persamaanregresinya, yaitu :Y* = 11,1 - 0,000000 X1* - 0,339 X2* - 0,199 X3* - 0,209 X4*Selajutnya dari hasil transformasi semua variabelnya dilakukan analisis regresidengan metode bertatar seleksi langkah mundur untuk mengatasi kasusmultikolinieritas dan uji asumsi normalnya. Secara umum, pengolahan metodeanalisis regresi seleksi bertatar langkah mundur dapat dilihat pada Tabel 2. Daripengolahan tersebut didapat persamaan model regresinya adalah sebagai berikut :Yi* = 8,40 - 0,330 X4i* + εi
Tabel 2 Hasil Printout Analisis Regresi Metode Seleksi bertatar Langkah Mundur
Backward elimination. Alpha-to-Remove: 0,05
Response is Y* on 4 predictors, with N = 31
Step 1 2 3 4
Constant 11,120 10,978 8,907 8,397
X1* -0,00000
T-Value -0,18
P-Value 0,859
X2* -0,34 -0,35 -0,28
T-Value -1,02 -1,09 -1,02
P-Value 0,316 0,286 0,318
X3* -0,20 -0,19
T-Value -0,46 -0,44
P-Value 0,650 0,661
X4* -0,209 -0,211 -0,220 -0,330
T-Value -1,77 -1,83 -1,96 -11,51
P-Value 0,089 0,078 0,060 0,000
S 0,680 0,668 0,658 0,658
R-Sq 82,84 82,82 82,69 82,05
R-Sq(adj) 80,20 80,91 81,46 81,43
Mallows Cp 5,0 3,0 1,2 0,2
Tabel 3. Hasil printout Analisis Regresi Yi*
dengan variabel X4* dan Yi-1
The regression equation is
Y* = 5,55 - 0,228 X4* + 0,371 Y*(i-1)
30 cases used, 1 cases contain missing values
Predictor Coef SE Coef T P VIF
Constant 5,553 1,321 4,20 0,000
X4* -0,22760 0,05703 -3,99 0,000 4,373
Y*(i-1) 0,3712 0,1581 2,35 0,026 4,373
S = 0,594065 R-Sq = 86,0% R-Sq(adj) = 85,0%
Setelah dilakukansemua asumsi uji residual ternyatamasih ada autokorlasi. Untukmengatasi autokorelasi tersebut,maka dilakukan lag satu kali padavariabel Y*. Kemudian, variabelY* yang sudah mengalami lagtersebut dimasukkan sebagaivariabel bebasnya. Yangdiregresikan dengan X4* denganvariabel responya adalah Y*seperti pada Tabel 3.
Karena semua asumsi residual terpenuhi, maka model yang digunakan adalah :
Yi* = 5,55 - 0,228 X4i* + 0,371 Yi-1* dengan :Yi* adalah X4i* adalah (X4i)
0,18
Y* = 5,88 - 0,502 X2* + 0,430 Y*(i-i) + εi (5)dengan :Yi* adalah X2* mempunyai nilai In X2
Untuk selanjutnya, akan dibahas kasus multikolinieritas. Padapembahasan sebelumnya, ditemukan adanya kasus multikolinieritasantara variabel X2* dan X4* sebelum dilakukan proses seleksi bertatar.Multikolinearitas ditandai dengan tingginya nilai koefisien determinasiR2 jika antar variabel tersebut di regresikan. Hasil pengolahan minitabantara variabel X2* dan X4* dapat dilihat pada Tabel 4.15. Dapat dilihatpada Tabel 4.15 tersebut bahwa R2 yang didapat sangat besar yaitu 93,5%. Sekarang akan dicoba memasukkan variabel X2* dalam model yangdapat dilihat pada Tabel 4.16. Dari pengolahan minitab didapatpersamaan model regresinya adalah sebagai berikut :
The regression equation is
X2* = 1,83 + 0,396 X4*
Predictor Coef SE Coef T P VIF
Constant 1,8331 0,2519 7,28 0,000
X4* 0,39632 0,01942 20,41 0,000 1,000
S = 0,445915 R-Sq = 93,5% R-Sq(adj) = 93,3%
Analysis of Variance
Source DF SS MS F P
Regression 1 82,823 82,823 416,53 0,000
Residual Error 29 5,766 0,199
Total 30 88,590
Tabel 4.15 Hasil Analisis Regresi variabel X4* terhadap X2*
Selanjutnya dari persamaan (5) juga akan dilakukan uji asumsi residual
untuk melihat apakah model tersebut benar-benar signifikan atau tidak. Jika
model tersebut memenuhi semua asumsi residualnya, tidak menutup kemungkinan model tersebut juga
bisa dipakai.
Uji Asumsi Residual
a. Uji Identik (Heteroscedasticitas).Dari hasil pengolahan diperoleh Fhitung = 2,08 < Ftabel (5%,2,28) = 3,34, dengan demikian Ho
diterima, maka dapat disimpulkan bahwa tidak terjadi heteroskedastisitas.
b. Independen (Autokorelasi)Secara umum, pengujian autokorelasi dapat menggunakan plot ACF seperti pada Gambar
4.18. Jika tidak ada lag yang keluar dari garis merah, maka dapat disimpulkan bahwa tidak terdapatkorelasi antar variabelnya.
c.Uji NormalitasHasil minitab pada Gambar 4.19 menggunakan test Kolmogorov Smirnov menunjukkan p-
value < 0, 05 maka H0 diterima, jadi residual memenuhi asumsi normal.
d. MultikolinearitasDari hasil Analisis multikolinearitas menggunakan minitab pada Tabel 4.16 ditemukan nilai
VIF yang kurang dari dari 10 sehingga disimpulkan bahwa tidak ada multikolinearitas antar variabelbebas.
IV. PENUTUP
Dari hasil analisa model yang terbentuk, didapatkan kesimpulan sebagai berikut :
Model terbaik penangkapan ikan laut di Provinsi Jawa Timur tahun 1980-2010 setelahdilakukan pemilihan model terbaik berdasarkan kriteria yang ada dengan metoderegresi linier bertatar langkah mundur adalah sebagai berikut :
dengan :
Y* = 5,88 - 0,502 X2* + 0,430 Y*(i-i) + εi
Yi* adalah
X2* mempunyai nilai In X2
Besar sumbangan variabel bebasn terhadap variabel responnya adalah 85,2%.