Post on 22-Mar-2019
35
BAB 4
HASIL DAN PEMBAHASAN
Dalam bagian hasil dan pembahasan ini akan ditampilkan proses pengolahan data,
dalam bentuk statement dalam R Language, diagram pencar, tabel-tabel dan grafik yang
digunakan dalam analisis data beserta hasil dan pembahasannya. Dengan memperhatikan
segi efisiensi dalam penelitian ini, maka tidak semua data yang diolah akan ditampilkan
tetapi hanya beberapa bagian saja yang dipilih oleh penulis yaitu data berukuran n=30
untuk 2 variabel bebas, 3 varabel bebas dan 5 variabel bebas. Proses pengolahan yang
tidak diuraikan dalam hasil dan pembahasan ini akan ditampilkan hasil akhir
pengolahannya saja, yaitu dalam bentuk nilai standard error dan persamaan regresi yang
diperoleh.
Proses penelitian dilakukan dengan R Language. Data sampel dibangkitkan
dengan fungsi ‘rnorm (random number)’ yang merupakan bilangan acak yang memiliki
sebaran normal baku, default dari ‘rnorm’ adalah standar deviasi = 1, mean = 0 dan
memiliki rentang nilai dari -3 sampai 3. Fungsi ‘runif (random uniform)’ digunakan
untuk membantu memperbesar nilai dari fungsi ‘rnorm’
4.1 Proses Pengolahan Data
Dalam bagian ini akan ditampilkan sebagian dari proses pengolahan data
beserta hasil-hasil dari proses yang ditampilkan. Proses pengolahan data disajikan
dalam bentuk diagram-diagram dan gambar-gambar yang menunjukkan bahwa
data yang dibangkitkan memenuhi asumsi pendugaan untuk regresi linier
36
berganda, kemudian dilanjutkan dengan pengolahan data menggunakan metode
kuadrat terkecil, metode bootstrap pairs dan metode bootstrap residual.
4.1.1 Proses Pengolahan Data untuk Sampel n=30 dengan 2 Variabel Bebas
Berikut ini akan ditampilkan tahapan-tahapan dalam proses pengolahan
data untuk sampel berukuran n=30 dengan 2 variabel bebas.
4.1.1.1 Pembangkitan Data untuk Sampel n=30 dengan 2 Variabel Bebas
Data akan dibangkitkan dengan R Languge. Statement yang digunakan
untuk membangkitkan data dalam R Language adalah sebagai berikut
> library(stats)
> n=30 > set.seed(12343) > x=10*runif(n) > set.seed(12344) > x1=15*runif(n)+x+rnorm(n) > set.seed(12345) > x2=20*runif(n)+x+rnorm(n) > set.seed(12347) > y=x+x1+x2+rnorm(n) > data.entry(y,x1,x2)
Hasil pembangkitan data disajikan dalam tabel 4.1 :
37
Tabel 4.1 Hasil Pembangkitan Data untuk Sampel n=30 dengan 2 Variabel Bebas
Keterangan :
y menunjukkan variabel tak bebas,
x1 menunjukkan variabel bebas pertama,
x2 menunjukkan variabel bebas kedua.
38
4.1.1.2 Matrik Korelasi untuk Sampel n=30 dengan 2 Variabel Bebas
Dari data yang sudah dibangkitkan akan diperlihatkan gambaran dalam
bentuk diagram pencar. Diagram pencar digunakan untuk mengetahui validitas
asumsi dari pendugaan regresi linier berganda. Pertama-tama akan diperlihatkan
matrik korelasi, untuk melihat apakah ada hubungan antar variabel. Matrik
korelasi diperoleh dengan statement R Language sebagai berikut :
> library (base) > matx=matrix(c(x1,x2),ncol=2) > round(cor(matx),4)
Hasil pengolahan dengan R Language menunjukkan hasil sebagai berikut: [x1] [x2]
[x1] 1.0000 0.0092
[x2] 0.0092 1.0000
Dari matrix korelasi terlihat bahwa korelasi antar x1 dengan x2 sebesar
0.0092 dan nilai ini dianggap sangat kecil sehingga dapat ditafsirkan bahwa tidak
ada korelasi atau menunjukkan tidak terjadi multikolinieritas.antar variabel x.
Untuk lebih jelasnya, akan ditampilkan hubungan antara variabel x1 dan x2
dengan diagram pencar yang disajikan pada gambar berikut
> op <- par(mfrow = c(1,1), pty = "s") > plot(x1,x2)
39
Gambar 4.1 Diagram Pencar (Scatter Plot) x1 dengan x2
Dari gambar tersebut diatas terlihat bahwa tidak ada hubungan antara
variabel x1 dengan x2. Berdasarkan besaran koefisien korelasi dan diagram
pencar menunjukkan bahwa asumsi dalam regresi linier berganda yang
memerlukan tidak terjadi multikolinieritas dapat dipenuhi dari data yang telah
dibangkitkan.
4.1.1.3 Koefisien Korelasi Linier untuk Sampel n=30 dengan 2 Variabel Bebas
Proses berikutnya akan menunjukkan koefisien korelasi linier antar
variabel y dengan variabel x. Dalam R Language dihasilkan dengan statement
sebagai berikut
> op <- par(mfrow = c(1,2), pty = "s") > plot(x1,y) > plot(x2,y)
40
Hasil yang diperoleh ditunjukkan oleh gambar 4.2
Gambar 4.2 Diagram Pencar Antara Data Y dengan Data X
Dari gambar menunjukkan hubungan yang linier dan korelasi positif yang
tinggi antara kedua variabel. Sehingga memenuhi asumsi pendugaan untuk regresi
linier berganda.
4.1.1.4 Metode Kuadrat Terkecil untuk Sampel n=30 dengan 2 Variabel Bebas
Dari data yang telah dibangkitkan, data akan diolah dengan menggunakan
metode kuadrat terkecil. Statement dalam R Language adalah sebagai berikut :
> library(stats) > reg=lm(y~x1+x2) > reg
> summary(reg) > ytopi=reg$fit > residual=reg$res > data.entry(y,x1,x2,ytopi,residual)
41
Hasil pengolahan data ditunjukkan pada tabel 4.2
Tabel 4.2 Hasil pengolahan Data dengan Metode Kuadrat Terkecil dari
Sampel n=30 dengan 2 Variavel Bebas
Keterangan :
ytopi menunjukkan y estimasi (Ŷ)
residual menunjukkan selisih antara y dengan y estimasi
42
Dengan menggunakan metode kuadrat terkecil diperoleh
Persamaan regresi : Ŷ = -1.493 + 1.289 X1 + 1.164X2
Nilai standard error : 2.522
Dari hasil yang diperoleh dengan metode kuadrat terkecil, akan ditunjukkan
korelasi antara y estimasi dengan nilai residual.
Statement dalam R Language adalah sebagai berikut :
> library(graphics) > op <- par(mfrow = c(1,1), pty = "s") > plot(ytopi,residual)
Dihasilkan gambar dalam bentuk diagram pencar seperti dalam gambar 4.3 :
Gambar 4.3 Diagram Pencar Ŷ dengan Residual
Dari gambar terlihat bahwa nilai penyimpangan (residual) tidak
dipengaruhi oleh besarnya nilai y estimasi, yang berarti bahwa persamaan regresi
yang dihasilkan memenuhi asumsi untuk persamaan regresi linier
43
berganda(homoskedastisitas). Dengan perkataan lain, besarnya nilai
penyimpangan sama untuk setiap nilai pendugaan variabel tak bebas
4.1.1.5 Distribusi untuk Sampel n=30 dengan 2 Variabel Bebas
Untuk mengetahui bentuk distribusi maka akan ditunjukkan bentuk
distribusi dari nilai residual dari persamaan regresi yang telah dihasilkan.
Statement dalam R Language untuk memeperoleh gambar distribusi nilai residual
adalah
> library(graphics) > res=reg$res > plot(density(res))
Hasil yang diperoleh ditunjukkan oleh gambar 4.4 :
Gambar 4.4 Bentuk Distribusi Residual Regresi dengan 2 Variabel Bebas
44
Gambar 4.4 menunjukkan kurva normal yang berbentuk genta yang
mempunyai arti bahwa data yang dibangkitkan mampunyai distribusi normal atau
menyebar secara normal.
4.1.1.6 Metode Bootstrap Pairs untuk Sampel n=30 dengan 2 Variabel Bebas
Selanjutnya akan dilakukan pengolahan data dengan menggunakan metode
bootstrap pairs.
statement berikut ini digunakan untuk mengolah data dengan bootstrap pairs
dalam R Language
> ybaru<-0 > for(i in 1:1000){ > set.seed(i+123) > ybaru[i]=y[sample(n,rep=T)] > } > x1baru<-0 > for(i in 1:1000){ > set.seed(i+123) > x1baru[i]=x1[sample(n,rep=T)] > } > x2baru<-0 > for(i in 1:1000){ > set.seed(i+123) > x2baru[i]=x2[sample(n,rep=T)] > } > regbaru=lm(ybaru~x1baru+x2baru) > regbaru > residual=regbaru$res > residualboot<-0 > for(i in 1:1000){ > set.seed(i+123) > residualboot[i]=residual[sample(1000,rep=T)] > } > sdror=sd(residualboot) > sdror > data.entry(ybaru,x1baru,x2baru)
45
Data yang diolah dengan menggunakan metode bootstrap pairs akan
menghasilkan nilai-nilai baru berukuran n=1000. Dalam tabel 4.3 berikut ini akan
ditampilkan sebagian dari hasil pengolahan data.
Tabel 4.3 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Pairs dari
Sampel n=30 dengan 2 Variabel Bebas
. . .
. . .
46
Keterangan :
ybaru menunjukkan nilai y yang diperoleh setelah dilakukan proses
bootstrap pairs 1000 kali
x1baru menunjukkan nilai x1 yang diperoleh setelah dilakukan proses
bootstrap pairs 1000 kali
x2baru menunjukkan nilai x2 yang diperoleh setelah dilakukan proses
bootstrap pairs 1000 kali
Sebagai contoh dari hasil pengolahan data dengan menggunakan metode
bootstrap pairs, terlihat bahwa sampel no.1 terpilih kembali sebagai sampel
no.999, sampel no.2 terpilih kembali sebagai sampel no.509 dan sampel no.3
terplilih kembali sebagai sampel no.997. Hal ini menjelaskan inti dari metode
bootstrap pairs untuk model regresi yaitu sampling dengan pengembalian dengan
probabilitas terpilih yang sama untuk setiap n dan proses bootstrap dilakukan
secara berpasangan untuk semua variabel
Dari hasil pengolahan data dengan metode bootstrap pairs diperoleh
persamaan regresi yaitu Ŷ = -1.374 + 1.290 X1 + 1.154 X2 dan nilai standard
error yang dihasilkan adalah 2.413741
4.1.1.7 Metode Bootstrap Residual untuk Sampel n=30 dengan 2 Variabel Bebas
Hasil pengolahan data dengan menggunakan metode bootstrap residual
ditunjukkan dalam tabel 4.4 dengan statement dalam R Language sebagai berikut
> ytopi=reg$fit
> residual=reg$res
47
> ytopibaru<-0 > for(i in 1:1000){ > set.seed(i+123) > ytopibaru[i]=ytopi[sample(n,rep=T)] > } > residualboot<-0 > for(i in 1:1000){ > set.seed(i+110) > residualboot[i]=residual[sample(n,rep=T)] > } > x1baru<-0 > for(i in 1:1000){ > set.seed(i+123) > x1baru[i]=x1[sample(n,rep=T)] > } > x2baru<-0 > for(i in 1:1000){ > set.seed(i+124) > x2baru[i]=x2[sample(n,rep=T)] > } > ybarures=ytopibaru+residualboot > regbaru=lm(ybarures~x1baru+x2baru) > regbaru > meanrb=mean(residualboot) > resboot=residualboot-meanrb > sderror=sd(resboot) > sderror
> data.entry(x1baru,x2baru,ytopibaru,residualboot,ybaru)
48
Tabel 4.4 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Residual
dari Sampel n=30 dengan 2 Variabel Bebas
. . .
. . .
Keterangan :
x1baru menunjukkan nilai x1 setelah dilakukan proses bootstrap 1000
kali
49
x2baru menunjukkan nilai x2 setelah dilakukan proses bootstrap 1000
kali
ytopibaru menunjukkan nilai y estimasi setelah dilakukan proses
bootstrap 1000 kali
residualboot menunjukkan nilai residual setelah dilakukan proses bootstrap
1000 kali
ybaru menunjukkan nilai y yang baru untuk prosedur bootstrap
residual
Dari hasil pengolahan data dengan metode bootstrap residual terlihat bahwa
untuk data x1baru, data no.1 terpilih kembali sebagai data no.508, data no.2
terpilih kembali sebagai data no.504 dan 996, sedangkan untuk data x2baru
terlihat bahwa data no.1 terpilih kembali sebagai data no.995. Hal ini menjelaskan
metode bootstrap residual untuk model regresi yaitu sampling dengan
pengembalian dengan probabilitas terpilih yang sama untuk setiap n
Dari hasil pengolahan data dengan metode bootstrap residual diperoleh
persamaan regresi yaitu Ŷ = -1.503 + 1.298 X1 + 1.157X2 dan nilai standar
error yang dihasilkan adalah 2.352203
4.1.2 Proses Pengolahan Data untuk Sampel n=30 dengan 3 Variabel Bebas
Proses pengolahan data yang dilakukan untuk data sampel berukuran
n=30 dengan 3 variabel bebas sama dengan proses-proses yang dilakukan untuk
data sampel berukuran n=30 dengan 2 variabel bebas dan bentuk pembahasannya
50
pun sama, sehingga untuk pembahasan-pembahasan yang sudah dijelaskan
sebelumnya tidak dilakukan penjelasan lebih lanjut.
4.1.2.1 Pembangkitan Data untuk Sampel n=30 dengan 3 Variabel Bebas
Statement dalam R Language untuk membangkitkan data sejumlah n=30
dengan 3 variabel bebas adalah sebagai berikut :
> library(stats)
> n=30 > set.seed(12343) > x=10*runif(n) > set.seed(12344) > x1=15*runif(n)+x+rnorm(n) > set.seed(12345) > x2=20*runif(n)+x+rnorm(n) > set.seed(12346) > x3=35*runif(n)+x+rnorm(n) > set.seed(12347) > y=x+x1+x2+x3+rnorm(n) > data.entry(y,x1,x2,x3)
Hasil pembangkitan data ditunjukkan dalam tabel 4.5 :
51
Tabel 4.5 Hasil Pembangkitan Data untuk Sampel n=30 dengan 3 Variabel
Bebas
Keterangan :
y menunjukkan variabel tak bebas,
x1 menunjukkan variabel bebas pertama,
x2 menunjukkan variabel bebas kedua.
x3 menunjukkan variabel bebas ketiga.
52
4.1.2.2 Matrik Korelasi untuk Sampel n=30 dengan 3 Variabel Bebas
Matrik korelasi dihasilkan dengan statement berikut ini
> library (base) > matx=matrix(c(x1,x2,x3),ncol=3) > round(cor(matx),4)
Hasil yang diperoleh adalah sebagai berikut :
[x1] [x2] x3]
[x1] 1.0000 0.1682 0.2645
[x2] 0.1682 1.0000 -0.0470
[x3] 0.2645 -0.0470 1.0000
Matrik korelasi diatas menunjukkan bahwa korelasi antar peubah bebas dari data
yang diperoleh relatif kecil, sehingga antar variabel bebas dapat dianggap tidak memiliki
hubungan (tidak multikolinieritas).
Hubungan antara variabel x ditunjukkan pada gambar 4.5
> op <- par(mfrow = c(1,3), pty = "s") > plot(x1,x2) > plot(x1,x3) > plot(x2,x3)
Gambar 4.5 Diagram Pencar Antar variabel X
53
4.1.2.3 Koefisien Korelasi Linier untuk Sampel n=30 dengan 3 Variabel Bebas
Koefisien korelasi linier dihasilkan oleh statement berikut ini dan
ditunjukkan oleh gambar dibawahnya.
> op <- par(mfrow = c(1,3), pty = "s") > plot(x1,y) > plot(x2,y) > plot(x3,y)
Gambar 4.6 Diagram Pencar Antara Data Y dan Data X
4.1.2.4 Metode Kuadrat Terkecil untuk Sampel n=30 dengan 3 Variabel Bebas
Statement dalam R untuk menghasilkan suatu fungsi kuadrat terkecil
adalah sebagai berikut
> library(stats) > reg=lm(y~x1+x2+x3) > reg
> summary(reg) > ytopi=reg$fit > residual=reg$res > data.entry(y,x1,x2,x3,ytopi,residual) Hasil pengolahan data ditunjukkan pada tabel 4.6 :
54
Tabel 4.6 Hasil pengolahan Data dengan Metode Kuadrat Terkecil dari
Sampel n=30 dengan 3 Variavel Bebas
Keterangan :
ytopi menunjukkan y estimasi (Ŷ)
residual menunjukkan selisih antara y dengan y estimasi
55
Dengan menggunakan metode kuadrat terkecil diperoleh
Persamaan regresi : Ŷ = 3.158+ 1.240X1 + 1.182X2 + 1.089 X3
Nilai standard error : 2.351
Dari hasil yang diperoleh dengan metode kuadrat terkecil, akan
ditunjukkan korelasi antara y estimasi dengan residual.
Statement dalam R Language adalah sebagai berikut :
> library(graphics) > op <- par(mfrow = c(1,1), pty = "s") > plot(ytopi,residual)
Gambar 4.7 Diagram Pencar Ŷ dengan Residual
4.1.2.5 Distribusi Residual Regresi untuk Sampel n=30 dengan 3 Variabel Bebas
Untuk mengetahui bentuk distribusi maka akan ditunjukkan bentuk distribusi dari
nilai residual dari persamaan regresi yang telah dihasilkan.
Statement dalam R Language untuk memperoleh gambar distribusi nilai residual
adalah
56
> library(graphics) > res=reg$res > plot(density(res))
Diperoleh gambar sebagai berikut :
Gambar 4.8 Distribusi Residual Regresi Dengan 3 Variabel Bebas
4.1.2.6 Metode Bootstrap Pairs untuk Sampel n=30 dengan 3 Variabel Bebas
Statement berikut ini digunakan untuk mengolah data dengan bootstrap
pairs dalam R Language
> ybaru<-0 > for(i in 1:1000){ > set.seed(i+123) > ybaru[i]=y[sample(n,rep=T)] > } > x1baru<-0 > for(i in 1:1000){ > set.seed(i+123) > x1baru[i]=x1[sample(n,rep=T)]
57
> } > x2baru<-0 > for(i in 1:1000){ > set.seed(i+123) > x2baru[i]=x2[sample(n,rep=T)] > } > x3baru<-0 > for(i in 1:1000){ > set.seed(i+123) > x3baru[i]=x3[sample(n,rep=T)] > } > regbaru=lm(ybaru~x1baru+x2baru) > regbaru > residual=regbaru$res > residualboot<-0 > for(i in 1:1000){ > set.seed(i+123) > residualboot[i]=residual[sample(1000,rep=T)] > } > sdror=sd(residualboot) > sdror > data.entry(ybaru,x1baru,x2baru,x3baru)
Hasil pengolahan data akan ditunjukkan dalam tabel 5.7 :
58
Tabel 4.7 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Pairs dari
Sampel n=30 dengan 3 Variabel Bebas
. . . .
. . .
Keterangan :
ybaru menunjukkan nilai y setelah dilakukan proses
bootstrap pairs 1000 kali
59
x1baru,x2baru,x3baru menunjukkan nilai x1,x2 dan x3 setelah dilakukan
proses bootstrap pairs 1000 kali
Dari hasil pengolahan data dengan metode bootstrap pairs diperoleh
persamaan regresi yaitu Ŷ = -2.856 + 1.238 X1 + 1.173 X2 + 1.083 X3 dan
nilai standar error yang dihasilkan adalah 2.193715
4.1.2.7 Metode Bootstrap Residual untuk Sampel n=30 dengan 3 Variabel Bebas
Hasil pengolahan data dengan menggunakan metode bootstrap residual
diperoleh dengan statement dalam R Language sebagai berikut
> ytopi=reg$fit
> residual=reg$res > ytopibaru<-0 > for(i in 1:1000){ > set.seed(i+123) > ytopibaru[i]=ytopi[sample(n,rep=T)] > } > residualboot<-0 > for(i in 1:1000){ > set.seed(i+110) > residualboot[i]=residual[sample(n,rep=T)] > } > x1baru<-0 > for(i in 1:1000){ > set.seed(i+123) > x1baru[i]=x1[sample(n,rep=T)] > } > x2baru<-0 > for(i in 1:1000){ > set.seed(i+124) > x2baru[i]=x2[sample(n,rep=T)] > } > x3baru<-0 > for(i in 1:1000){ > set.seed(i+125) > x3baru[i]=x3[sample(n,rep=T)] > }
60
> ybarures=ytopibaru+residualboot > regbaru=lm(ybarures~x1baru+x2baru) > regbaru > meanrb=mean(residualboot) > resboot=residualboot-meanrb > sderror=sd(resboot) > sderror
> data.entry(x1baru,x2baru,x3baru,ytopibaru,residualboot,ybaru)
Hasil pengolahan data ditampilkan dalam tabel 4.8
61
Tabel 4.8 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Residual
dari Sampel n=30 dengan 3 Variabel Bebas
. . .
. . .
Keterangan :
x1baru,x2baru,x3baru menunjukkan nilai x1,x2 dan x3 setelah dilakukan
proses bootstrap 1000 kali
62
ytopibaru menunjukkan nilai y estimasi setelah dilakukan
proses bootstrap 1000 kali
residualboot menunjukkan nilai residual setelah dilakukan
proses bootstrap 1000 kali
ybaru menunjukkan nilai y yang baru untuk prosedur
bootstrap residual
Dari hasil pengolahan data dengan metode bootstrap residual diperoleh
persamaan regresi yaitu Ŷ = -3.045 + 1.245 X1 + 1.182 X2 + 1.081 X3 dan nilai
standar error yang dihasilkan adalah 2.175285
4.1.3 Proses Pengolahan Data untuk Sampel n=30 dengan 5 Variabel Bebas
Proses pengolahan data yang dilakukan untuk data sampel berukuran
n=30 dengan 5 variabel bebas sama dengan proses-proses yang dilakukan untuk
data sampel sebelumnya begitu pula bentuk pembahasannya, sehingga untuk
pembahasan-pembahasan yang sudah dijelaskan sebelumnya tidak dilakukan
penjelasan lagi.
4.1.3.1 Pembangkitan Data untuk Sampel n=30 dengan 5 Variabel Bebas
Statement dalam R Language untuk membangkitkan data sejumlah n=30
dengan 5 variabel bebas adalah sebagai berikut :
> library(stats) > n=30 > set.seed(12343)
63
> x=10*runif(n) > set.seed(12344) > x1=15*runif(n)+x+rnorm(n) > set.seed(12345) > x2=20*runif(n)+x+rnorm(n) > set.seed(12346) > x3=35*runif(n)+x+rnorm(n) > set.seed(12348) > x4=40*runif(n)+x+rnorm(n) > set.seed(12349) > x5=45*runif(n)+x+rnorm(n) > set.seed(12347) > y=x+x1+x2+x3+x3+x4+rnorm(n) > data.entry(y,x1,x2,x3,x4,x5)
Hasil pembangkitan data ditunjukkan dalam tabel 4.9
64
Tabel 4.9 Hasil Pembangkitan Data untuk Sampel n=30 dengan 5
Variabel Bebas
Keterangan :
y menunjukkan variabel tak bebas,
x1 menunjukkan variabel bebas pertama,
x2 menunjukkan variabel bebas kedua.
65
x3 menunjukkan variabel bebas ketiga.
x4 menunjukkan variabel bebas keempat
x5 menunjukkan variabel bebas kelima
4.1.3.2 Matrik Korelasi untuk Sampel n=30 dengan 5 Variabel Bebas
Matrik korelasi dihasilkan dengan statement berikut ini
> library (base) > matx=matrix(c(x1,x2,x3,x4,x5),ncol=5) > round(cor(matx),4)
Hasil yang diperoleh adalah sebagai berikut :
[x1] [x2] [x3] [x4] [x5]
[x1] 1.0000 0.1682 0.2645 0.4519 0.4637
[x2] 0.1682 1.0000 -0.0470 -0.1043 0.0183
[x3] 0.2645 -0.0470 1.0000 0.1379 0.3258
[x4] 0.4519 -0.1043 0.1379 1.0000 0.4133
[x5] 0.4637 0.0183 0.3258 0.4133 1.0000
Hubungan antar variabel x ditunjukkan oleh diagram pencar berikut ini
> op <- par(mfrow = c(2,3), pty = "s") > plot(x1,x2) > plot(x1,x3) > plot(x1,x4) > plot(x1,x5) > plot(x2,x3) > plot(x2,x4) > op <- par(mfrow = c(2,2), pty = "s") > plot(x2,x5) > plot(x3,x4) > plot(x3,x5)
66
> plot(x4,x5)
Gambar 4.9 Diagram Pencar Antar variabel X
67
4.1.3.3 Koefisien Korelasi Linier untuk Sampel n=30 dengan 5 Variabel Bebas
Koefisien korelasi linier untuk data dengan 5 variabel tidak dapat
digambarkan karena akan terjadi hyperplane.
4.1.3.4 Metode Kuadrat Terkecil untuk Sampel n=30 dengan 5 Variabel Bebas
Statement dalam R untuk menghasilkan suatu fungsi kuadrat terkecil
adalah sebagai berikut
> library(stats) > reg=lm(y~x1+x2+x3+x4+x5) > reg
> summary(reg) > ytopi=reg$fit > residual=reg$res > data.entry(y,x1,x2,x3,x4,x5,ytopi,residual) Hasil pengolahan data ditunjukkan dalam tabel 4.10
68
Tabel 4.10 Hasil pengolahan Data dengan Metode Kuadrat Terkecil dari
Sampel n=30 dengan 5 Variavel Bebas
Keterangan :
ytopi menunjukkan y estimasi (Ŷ)
residual menunjukkan selisih antara y dengan y estimasi
69
Dengan menggunakan metode kuadrat terkecil diperoleh persamaan regresi
Ŷ = -4.494 + 1.175X1 + 1.204 X2 + 1.085 X3 + 1.050 X4 + 1.019X5
Nilai standard error : 2.36
Dari hasil yang diperoleh dengan metode kuadrat terkecil, akan ditunjukkan
korelasi antara y estimasi dengan residual.
Statement dalam R Language adalah sebagai berikut :
> library(graphics) > op <- par(mfrow = c(1,1), pty = "s") > plot(ytopi,residual)
Gambar 4.10 Diagram Pencar Ŷ dengan Residual
4.1.3.5 Distribusi Residual Regresi untuk Sampel n=30 dengan 5 Variabel Bebas
Untuk mengetahui bentuk distribusi maka akan ditunjukkan bentuk
distribusi dari nilai residual dari persamaan regresi yang telah dihasilkan
statement dalam R Language untuk memeperoleh gambar distribusi nilai residual
adalah
> library(graphics) > res=reg$res > plot(density(res))
70
Diperoleh gambar sebagai berikut :
Gambar 4.11 Distribusi Residual Regresi Dengan 5 Variabel Bebas
4.1.3.6 Metode Bootstrap Pairs untuk Sampel n=30 dengan 5 Variabel Bebas
Statement berikut ini digunakan untuk mengolah data dengan bootstrap
pairs dalam R Language
> ybaru<-0 > for(i in 1:1000){ > set.seed(i+123) > ybaru[i]=y[sample(n,rep=T)] > } > x1baru<-0 > for(i in 1:1000){
71
> set.seed(i+123) > x1baru[i]=x1[sample(n,rep=T)] > } > x2baru<-0 > for(i in 1:1000){ > set.seed(i+123) > x2baru[i]=x2[sample(n,rep=T)] > } > x3baru<-0 > for(i in 1:1000){ > set.seed(i+123) > x3baru[i]=x3[sample(n,rep=T)] > } > x4baru<-0 > for(i in 1:1000){ > set.seed(i+123) > x4baru[i]=x4[sample(n,rep=T)] > } > x5baru<-0 > for(i in 1:1000){ > set.seed(i+123) > x5baru[i]=x5[sample(n,rep=T)] > } > regbaru=lm(ybaru~x1baru+x2baru) > regbaru > residual=regbaru$res > residualboot<-0 > for(i in 1:1000){ > set.seed(i+123) > residualboot[i]=residual[sample(1000,rep=T)] > } > sdror=sd(residualboot) > sdror > data.entry(ybaru,x1baru,x2baru,x3baru,x4baru,x5baru)
Hasil pengolahan data ditunjukkan dalam tabel 4.11
72
Tabel 4.11 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Pairs dari
Sampel n=30 dengan 5 Variabel Bebas
. . .
. . .
Keterangan :
ybaru menunjukkan nilai y setelah dilakukan proses bootstrap pairs 1000 kali
73
x1baru, x2baru, x3baru, x4baru, x5baru menunjukkan nilai
x1,x2,x3,x4,x5 setelah dilakukan proses bootstrap pairs 1000
kali
Dari hasil pengolahan data dengan metode bootstrap pairs diperoleh
persamaan regresi yaitu
Ŷ = : -4.229 + 1.164 X1 + 1.199 X2 + 1.078 X3 + 1.050 X4 + 1.023X5
dan nilai standar error yang dihasilkan adalah 2.094366
4.1.3.7 Metode Bootstrap Residual untuk Sampel n=30 dengan 5 Variabel Bebas
Hasil pengolahan data dengan menggunakan metode bootstrap residual
ditunjukkan dalam tabel 4.12 dengan statement dalam R Language sebagai
berikut
> ytopi=reg$fit
> residual=reg$res > ytopibaru<-0 > for(i in 1:1000){ > set.seed(i+123) > ytopibaru[i]=ytopi[sample(n,rep=T)] > } > residualboot<-0 > for(i in 1:1000){ > set.seed(i+110) > residualboot[i]=residual[sample(n,rep=T)] > } > x1baru<-0 > for(i in 1:1000){ > set.seed(i+123) > x1baru[i]=x1[sample(n,rep=T)] > }
74
> x2baru<-0 > for(i in 1:1000){ > set.seed(i+124) > x2baru[i]=x2[sample(n,rep=T)] > } > x3baru<-0 > for(i in 1:1000){ > set.seed(i+125) > x3baru[i]=x3[sample(n,rep=T)] > } > x4baru<-0 > for(i in 1:1000){ > set.seed(i+126) > x4baru[i]=x4[sample(n,rep=T)] > } > x5baru<-0 > for(i in 1:1000){ > set.seed(i+127) > x5baru[i]=x5[sample(n,rep=T)] > } > ybarures=ytopibaru+residualboot > regbaru=lm(ybarures~x1baru+x2baru) > regbaru > meanrb=mean(residualboot) > resboot=residualboot-meanrb > sderror=sd(resboot) > sderror > data.entry(x1baru,x2baru,x3baru,x4baru,x5baru,ytopibaru, +residualboot,ybaru)
75
Tabel 4.12 Sebagian Hasil Pengolahan Data dengan Metode Bootstrap Residual
dari Sampel n=30 dengan 5 Variabel Bebas
.
.
.
.
.
.
Keterangan :
x1baru, x2baru, x3baru, x4baru, x5baru
menunjukkan nilai x1,x2,x3,x4,x5 setelah dilakukan
proses bootstrap 1000 kali
76
ytopibaru menunjukkan nilai y estimasi setelah dilakukan proses bootstrap
1000 kali
residualboot menunjukkan nilai residual setelah dilakukan proses bootstrap
1000 kali
ybaru menunjukkan nilai y yang baru untuk prosedur bootstrap
residual
Dari hasil pengolahan data dengan metode bootstrap residual diperoleh
persamaan regresi yaitu
Ŷ = -4.537 +1.166 X1 +1.203 X2 + 1.075 X3 +1.057 X4 +1.026 X5
dan nilai standar error yang dihasilkan adalah 2.09187
4.2 Hasil dan Pembahasan
Dari semua data yang sudah diolah, didapatlah persamaan regresi dan
standard error untuk masing-masing sampel dan masing-masing jumlah variabel.
Dari tabel persamaan regresi dan tabel standard error yang akan diperlihatkan
dalam tabel 4.13 dan 4.14 dapat dilihat perbedaan nilai dari persamaan regresi dan
nilai dari standar error yang dihasilkan oleh metode kuadrat terkecil, metode
bootstrap pairs dan bootstrap residual.
Dari tabel standar error (tabel 4.14), terlihat bahwa meskipun terdapat
perbedaan nilai yang dihasilkan oleh masing-masing metode, namun perbedaan
nilai tersebut tidak terlalu jauh atau saling mendekati satu sama lain, meskipun
77
demikian tetap terlihat pola-pola yang menunjukkan bahwa nilai standar error
metode yang satu lebih kecil dibandingkan metode lainnya
Hasil dari persamaan regresi dan standar error yang diperoleh dengan
menggunakan metode kuadrat terkecil, metode bootstrap pairs dan bootstrap
residual untuk semua jumlah data dan semua variabel dapat dilihat dalam tabel
4.13 dan 4.14.
78
Tabel 4.13 Hasil Persamaan Regresi
2 var Ŷ = -1.493 + 1.289 X1 + 1.164 X2 3 var Ŷ = -3.158 + 1.240 X1 + 1.182 X2 + 1.089 X3 N = 30 5 var Ŷ = -4.494 + 1.175 X1 + 1.204 X2 + 1.085 X3 + 1.050 X4 + 1.019 X5 2 var Ŷ = -0.4812 + 1.3055 X1 + 1.0844 X2 3 var Ŷ = -1.530 + 1.291 X1 + 1.089 X2 + 1.053 X3 N = 100 5 var Ŷ = -2.657 + 1.248 X1 + 1.092 X2 + 1.048 X3 + 1.031 X4 + 1.033 X5 2 var Ŷ = -0.2022 + 1.2924 X1 + 1.0749 X2 3 var Ŷ = -1.131 + 1.279 X1 + 1.076 X2 + 1.050 X3 N = 200 5 var Ŷ = -2.261 + 1.241 X1 + 1.072 X2 + 1.045 X3 + 1.030 X4 + 1.035 X5 2 var Ŷ = -0.2357 + 1.2507 X1 + 1.1283 X2 3 var Ŷ = -0.9261 + 1.2435 X1 + 1.1275 X2 + 1.0352 X3 N = 500 5 var Ŷ = -2.538 + 1.214 X1 + 1.116 X2 + 1.030 X3 + 1.038 X4 + 1.046 X5 2 var Ŷ = -0.4634 + 1.2405 X1 + 1.1555 X2 3 var Ŷ = -1.282 + 1.229 X1 + 1.149 X2 + 1.046 X3
Kua
drat
Ter
keci
l
N = 950 5 var Ŷ = -2.537 + 1.208 X1 + 1.139 X2 + 1.043 X3 + 1.025 X4 + 1.041 X5 2 var Ŷ = -1.374 + 1.290 X1 + 1.154 X2 3 var Ŷ = -2.856 + 1.238 X1 + 1.173 X2 + 1.083 X3 N = 30 5 var Ŷ = -4.229 + 1.164 X1 + 1.199 X2 + 1.078 X3 + 1.050 X4 + 1.023 X5 2 var Ŷ = -0.6672 + 1.3283 X1 + 1.0786 X2 3 var Ŷ = -1.838 + 1.317 X1 + 1.079 X2 + 1.061 X3 N = 100 5 var Ŷ = -2.920 + 1.271 X1 + 1.081 X2 + 1.053 X3 + 1.026 X4 + 1.039 X5 2 var Ŷ = 0.1435 + 1.2907 X1 + 1.0588 X2 3 var Ŷ = -0.7936 + 1.2806 X1 + 1.0579 X2 + 1.0491 X3 N = 200 5 var Ŷ = -1.785 + 1.248 X1 + 1.055 X2 + 1.047 X3 + 1.034 X4 + 1.021 X5 2 var Ŷ = -0.3539 + 1.2548 X1 + 1.1320 X2 3 var Ŷ = -0.8725 + 1.2496 X1 + 1.1303 X2 + 1.0267 X3 N = 500 5 var Ŷ = -2.324 + 1.223 X1 + 1.119 X2 + 1.024 X3 + 1.042 X4 + 1.034 X5 2 var Ŷ = -0.5594 + 1.2432 X1 + 1.1521 X2 3 var Ŷ = -1.499 + 1.229 X1 + 1.145 X2 + 1.053 X3
Boo
tstr
ap P
airs
N = 950 5 var Ŷ = -2.459 + 1.212 X1 + 1.135 X2 + 1.051 X3 + 1.023 X4 + 1.030 X5 2 var Ŷ = -1.503 + 1.298 X1 + 1.157 X2 3 var Ŷ = -3.045 + 1.245 X1 + 1.182 X2 + 1.081 X3 N = 30 5 var Ŷ = -4.537 + 1.166 X1 + 1.203 X2 + 1.075 X3 + 1.057 X4 + 1.026 X5 2 var Ŷ = -0.1788 + 1.3055 X1 + 1.0645 X2 3 var Ŷ = -1.307 + 1.289 X1 + 1.067 X2 + 1.060 X3 N = 100 5 var Ŷ = -2.554 + 1.252 X1 + 1.069 X2 + 1.059 X3 + 1.037 X4 + 1.026 X5 2 var Ŷ = -0.006287 + 1.296905 X1 + 1.063794 X2 3 var Ŷ = -0.9169 + 1.2802 X1 + 1.0635 X2 + 1.0514 X3 N = 200 5 var Ŷ = -2.127 + 1.240 X1 + 1.056 X2 + 1.044 X3 + 1.024 X4 + 1.047 X5 2 var Ŷ = 0.09165 + 1.23955 X1 + 1.11495 X2 3 var Ŷ = -0.7653 + 1.2317 X1 + 1.1147 X2 + 1.0423 X3 N = 500 5 var Ŷ = -2.387 + 1.199 X1 + 1.106 X2 + 1.034 X3 + 1.045 X4 + 1.044 X5 2 var Ŷ = -0.6801 + 1.2472 X1 + 1.1561 X2 3 var Ŷ = -1.499 + 1.236 X1 + 1.153 X2 + 1.043 X3
Boo
tstr
ap R
esid
ual
N = 950 5 var Ŷ = -2.823 + 1.214 X1 + 1.142 X2 + 1.040 X3 + 1.028 X4 + 1.042 X5
79
N =
950
2.43
2.40
2468
2.39
7367
2.38
2
2.35
9644
2.33
4539
2,29
9
2.31
0374
2.28
7538
N =
500
2.47
2.36
3669
2.34
8681
2.44
5
2.34
7885
2.33
2889
2.31
4
2.18
8768
2.22
7493
N =
200
2.44
2
2.34
9687
2.42
0663
2.38
8
2.29
766
2.36
4284
2.32
2.24
5379
2.32
2361
N =
100
2.45
2
2.45
0007
2.43
7318
2.39
5
2.34
7942
2.34
3996
2.35
6
2.30
7948
2.27
1965
N =
30
2.52
2
2.41
3741
2.35
2203
2.35
1
2.19
3715
2.17
5285
2.36
2.09
4366
2.09
187
Kua
drat
T
erke
cil
Boo
tstr
ap
Pair
s
Boo
tstr
ap
Res
idua
l
Kua
drat
T
erke
cil
Boo
tstr
ap
Pair
s
Boo
tstr
ap
Res
idua
l
Kua
drat
T
erke
cil
Boo
tstr
ap
Pair
s
Boo
tstr
ap
Res
idua
l
2 V
aria
bel
3 V
aria
bel
5 va
riab
el
Tab
el 4
.14
Has
il St
anda
rd e
rror
80
4.3 Analisis Grafik
Untuk memudahkan analisis dalam membandingkan metode-metode
kuadrat terkecil, bootstrap pairs dan bootstrap residual , maka nilai dari standar
error yang dihasilkan akan disajikan dalam bentuk grafik seperti berikut ini :
Grafik Standard Error untuk 2 Variabel
2,252,3
2,352,4
2,452,5
2,55
N = 30 N =100
N =200
N =500
N =950
Jumlah Data (N)
Nila
i Sta
ndar
d Er
ror
Kuadrat Terkecil
Bootstrap Pairs
BootstrapResidual
Gambar 4.12 Grafik Standar Error untuk 2 variabel bebas
Grafik Standard Error untuk 3 Variabel
22,052,1
2,152,2
2,252,3
2,352,4
2,452,5
N = 30 N =100
N =200
N =500
N =950
Jumlah Data (N)
Nila
i Sta
ndar
d Er
ror
Kuadrat TerkecilBootstrap PairsBootstrap Residual
Gambar 4.13 Grafik Standar Error untuk 3 variabel bebas
81
Grafik Standard Error untuk 5 Variabel
1,952
2,052,1
2,152,2
2,252,3
2,352,4
N = 30 N =100
N =200
N =500
N =950
Jumlah Data (N)
Nila
i Sta
ndar
d Er
ror
Kuadrat TerkecilBootstrap PairsBootstrap Residual
Gambar 4.14 Grafik Standar Error untuk 5 variabel bebas
Dari grafik dapat kita lihat bahwa kisaran nilai standard error untuk
masing-masing metode yang menunjukkan bahwa nilai standard error untuk
metode kuadrat terkecil, metode bootstrap pairs dan metode bootstrap residual
saling mendekati dan tidak menunjukkan perbedaan nilai yang terlalu jauh.
Dapat kita lihat pula bahwa nilai standard error untuk metode bootstrap
pairs dan metode bootstrap residual lebih kecil dibandingkan dengan nilai
standard error metode kuadrat terkecil. Selanjutnya, bila dibandingkan lagi antara
metode bootstrap pairs dan metode bootstrap residual terlihat bahwa nilai
standard error bootstrap residual cenderung lebih kecil dibandingkan nilai
standard error metode bootstrap pairs terutama untuk data dengan ukuran n yang
kecil, tetapi untuk data-data tertentu nilai standard error bootstrap pairs lebih
kecil dibandingkan nilai standard error bootstrap residual.