Re Gresi

10
3. Metodologi Penelitian Algoritma program R untuk program regresi linier sederhana adalah: 1. Menghitung persamaan atau model regresi, nilai ^ y dan nilai error 2. Menghitung nilai jumlah kuadrat atau sum of square 3. Menghitung nilai kuadrat tengah atau mean square 4.Menghitung nilai F-hitung 5. Menghitung nilai standard error (SE), t-hitung dan P-value 6. Menghitung nilai koefisien determinasi (R-sq) dan R-sq adjusted 7. Membuat penampilan untuk persamaan atau model regresi, standard error (SE), t-hitung, P-value, koefisien determinasi (R-sq) dan R-sq adjusted 8. Membuat penampilan untuk tabel ANOVA 9. Membuat scatter plot untuk hasil pemodelan regresinya Program R untuk regresi linier sederhana adalah sebagai berikut: regresi=function(y,x) { options(width=1000) if (length(y)!=length(x)) k = 1 n = length(x) for (i in 1:n) k[i]=1 X = cbind(k,x) b = (solve(t(X)%*%X))%*%t(X)%*%y y.hat = X %*% b e = y-y.hat SSR = sum((y.hat-mean(y))^2) SSE = sum(e^2) SST = SSE + SSR MSR = SSR/1 MSE = SSE/(n-1-1) F = MSR/MSE cov.b = solve(t(X)%*%X)*MSE se.b = sqrt(diag(cov.b)) t.value = (1/se.b)*b p.value = 2*(1-pt(abs(t.value),n-2)) rsq=SSR/SST*100 rsq1=(1-(MSE/(SST/(n-1))))*100 cat("The regression equation is : ","\n","Y.hat = ",b[1]) if(b[2]> 0)cat(" + ",b[2],"X","\n") else cat(b[2],"X","\n") cat("\n estimate std.error t.value p-Value \n") for (i in 1:2) { if (i==1) cat("intercept ",b[i]," ",se.b[i]," ",t.value[i]," ",p.value[i],"\n") else cat( "x ",b[i]," ",se.b[i]," ",t.value[i]," ",p.value[i],"\n") } cat("\n","S = ",sqrt(MSE)," R-sq = ",rsq,"%", " R-sq(adj) = ",rsq1,"%","\n")

description

regresi linier dengan software R

Transcript of Re Gresi

3. Metodologi PenelitianAlgoritma program R untuk program regresi linier sederhana adalah:1. Menghitung persamaan atau model regresi, nilai dan nilai error2. Menghitung nilai jumlah kuadrat atau sum of square3. Menghitung nilai kuadrat tengah atau mean square4. Menghitung nilai F-hitung5. Menghitung nilai standard error (SE), t-hitung dan P-value6. Menghitung nilai koefisien determinasi (R-sq) dan R-sq adjusted7. Membuat penampilan untuk persamaan atau model regresi, standard error (SE), t-hitung, P-value, koefisien determinasi (R-sq) dan R-sq adjusted8. Membuat penampilan untuk tabel ANOVA9. Membuat scatter plot untuk hasil pemodelan regresinya

regresi=function(y,x){options(width=1000)if (length(y)!=length(x)) k = 1n = length(x)for (i in 1:n) k[i]=1X = cbind(k,x)b = (solve(t(X)%*%X))%*%t(X)%*%yy.hat = X %*% be = y-y.hatSSR = sum((y.hat-mean(y))^2)SSE = sum(e^2)SST = SSE + SSRMSR = SSR/1MSE = SSE/(n-1-1)F = MSR/MSEcov.b = solve(t(X)%*%X)*MSEse.b = sqrt(diag(cov.b))t.value = (1/se.b)*bp.value = 2*(1-pt(abs(t.value),n-2))rsq=SSR/SST*100rsq1=(1-(MSE/(SST/(n-1))))*100cat("The regression equation is : ","\n","Y.hat = ",b[1])if(b[2]> 0)cat(" + ",b[2],"X","\n")else cat(b[2],"X","\n")cat("\n estimate std.error t.value p-Value \n")for (i in 1:2){if (i==1) cat("intercept ",b[i]," ",se.b[i]," ",t.value[i]," ",p.value[i],"\n")else cat( "x ",b[i]," ",se.b[i]," ",t.value[i]," ",p.value[i],"\n")}cat("\n","S = ",sqrt(MSE)," R-sq = ",rsq,"%"," R-sq(adj) = ",rsq1,"%","\n")cat("\n Analysis of Variance \n")cat ("\n df SS MS F P-Value \n")cat ("Regression 1 ",SSR," ",MSR," ",F," ",p.value[2],"\n")cat ("Eror ", n-2, " ",SSE," ",MSE,"\n") cat ("Total ", n-1, " ",SST," ","\n") plot(x,y)abline(a=b[1],b=b[2])}Program R untuk regresi linier sederhana adalah sebagai berikut:

4. Analisis dan PembahasanPada bab ini akan dianalisis dan dibahas faktor-faktor apa saja yang berpengaruh terhadap IPK mahasiswa dari output regresi program R. Data yang diambil adalah data mahasiswa mata kuliah Komputasi Statistik Kelas A. Inputan dalam program adalah y dan x, di mana y adalah respon dan x adalah prediktor.4.1. Pengaruh Rata-rata Jam Belajar Mahasiswa Terhadap IPK MahasiswaFaktor pertama yang akan dianalisis adalah rata-rata jam belajar mahasiswa sehari-hari terhadap IPK. Output regresi dari program R adalah sebagai berikut:

Hasil regresi program R pada pengaruh rata-rata jam belajar mahasiswa terhadap IPK mahasiswa, didapatkan model regresi 3.126945+0.02971218 X. Jadi pada pengaruh rata-rata jam belajar mahasiswa terhadap IPK mahasiswa adalah apabila rata-rata jam belajar mahasiswa bertambah satu jam, maka IPK mahasiswa cenderung naik sebesar 0.02971218 dan jika rata-rata jam belajar mahasiswa 0 jam, maka intersep garis regresi dengan IPK mahasiswa (y) berada di titik 3.126945.Dilihat dari nilai koefisien determinasinya (R-sq) maka rata-rata jam belajar mahasiswa mampu menjelaskan variabilitas IPK mahasiswa dalam model sebesar 0.719615%, sedangkan 99.280385% sisanya dijelaskan oleh variabel lain yang tidak dimasukkan ke dalam model. Dari analisis output di atas, model regresi belum mampu menjelaskan variabilitas IPK mahasiswa ,karena nilai koefisien determinasinya kurang dari 70%. Dari tabel ANOVA di atas dapat diketahui derajat bebas dari regresi adalah 1, error sebesar 53 dan total sebesar 54. Kemudian untuk nilai sum of square untuk regresi adalah 0.03485509, error sebesar 4.808719 dan total sebesar 4.843575. Selanjutnya untuk mean square regresi adalah 0.03485509 dan error adalah 0.09073056. Nilai F hitung diketahui sebesar 0.3841604dan P-value sebesar 0.5380407.4.1.1. Pengujian Hipotesis Uji Hipotesis pada :H0 : H1 :

P-Value = 0t-hitung= 29.80115 = 2,01Karena t-hitung t-tabel dan P-value maka tolak H0, sehingga dapat disimpulkan bahwa garis regresi tidak berpotongan atau melewati titik (0,0).

Uji Hipotesis pada :H0 : H1 :

P-Value = 0.5380407t-hitung = 0.6198068 = 2,01 Karena t-hitung t-tabel dan P-value maka gagal tolak H0, sehingga dapat disimpulkan bahwa rata-rata jam belajar mahasiswa tidak berpengaruh signifikan terhadap IPK mahasiswa.

Uji Hipotesis pada dan :H0 : H1 :

P-Value = 0.5380407F-hitung = 0.3841604 = 4,035Karena F-hitung F-tabel dan P-value maka gagal tolak H0, jadi dapat disimpulkan bahwa tidak ada hubungan atau independen antara rata-rata jam belajar mahasiswa dengan IPK mahasiswa.Scatter plot untuk pengaruh rata-rata jam belajar mahasiswa dengan IPK mahasiswa adalah sebagai berikut

4.2. Pengaruh Uang Saku Mahasiswa Terhadap IPK MahasiswaFaktor kedua yang dianalisis adalah pengaruh uang saku mahasiswa terhadap IPK mahasiswa. Output regresi dari program R adalah sebagai berikut:

Hasil regresi program R pada pengaruh uang saku mahasiswa terhadap IPK mahasiswa, didapatkan model regresi 3.065525+2.012098e-07 X. Jadi pada pengaruh uang saku mahasiswa terhadap IPK mahasiswa adalah apabila uang saku mahasiswa bertambah satu rupiah, maka IPK mahasiswa cenderung naik sebesar 2.012098e-07 dan jika uang saku mahasiswa 0 rupiah, maka intersep garis regresi dengan IPK mahasiswa (y) berada di titik 3.065525.Dilihat dari nilai koefisien determinasinya (R-sq) maka uang saku mahasiswa mampu menjelaskan variabilitas IPK mahasiswa dalam model sebesar 2.787259%, sedangkan 97.212741% sisanya dijelaskan oleh variabel lain yang tidak dimasukkan ke dalam model. Dari analisis output di atas, model regresi belum mampu menjelaskan variabilitas IPK mahasiswa ,karena nilai koefisien determinasinya kurang dari 70%. Kemudian untuk korelasi antara uang saku mahasiswa dengan IPK mahasiswa sebesar 0.9530568, hal itu menunjukkan bahwa hubungan antara uang saku mahasiswa dengan IPK mahasiswa semakin erat, sebab nilai korelasinya mendekati nilai 1.Dari tabel ANOVA di atas dapat diketahui derajat bebas dari regresi adalah 1, error sebesar 53 dan total sebesar 54. Kemudian untuk nilai sum of square untuk regresi adalah 0.135003, error sebesar 4.708572 dan total sebesar 4.843575. Selanjutnya untuk mean square regresi adalah 0.135003 dan error adalah 0.08884097. Nilai F hitung diketahui sebesar 1.519603 dan P-value sebesar 0.2231198.4.2.1. Pengujian Hipotesis Uji Hipotesis pada :H0 : H1 :

P-Value = 0t-hitung= 28,82355 = 2,01Karena t-hitung t-tabel dan P-value maka tolak H0, sehingga dapat disimpulkan bahwa garis regresi tidak berpotongan atau melewati titik (0,0).

Uji Hipotesis pada :H0 : H1 :

P-Value = 0.2231198t-hitung = 1,232722 = 2,01 Karena t-hitung t-tabel dan P-value maka gagal tolak H0, sehingga dapat disimpulkan bahwa uang saku mahasiswa tidak berpengaruh signifikan terhadap IPK mahasiswa.

Uji Hipotesis pada dan :H0 : H1 :

P-Value = 0.2231198F-hitung = 1,519603 = 4,035Karena F-hitung F-tabel dan P-value maka gagal tolak H0, jadi dapat disimpulkan bahwa tidak ada hubungan atau independen antara uang saku mahasiswa dengan IPK mahasiswa.Scatter plot pengaruh uang saku mahasiswa terhadap IPK mahasiswa adalah sebagai berikut:

4.3. Pengaruh IP Semester 1 Mahasiswa Terhadap IPK Mahasiswa

Hasil regresi program R pada pengaruh IP Semester 1 mahasiswa terhadap IPK mahasiswa, didapatkan model regresi 1.459651+0.5570168 X. Jadi pada pengaruh IP Semester 1 mahasiswa terhadap IPK mahasiswa adalah apabila IP Semester 1 mahasiswa bertambah satu satuan, maka IPK mahasiswa cenderung naik sebesar 0.5570168 dan jika IP Semester 1 mahasiswa 0, maka intersep garis regresi dengan IPK mahasiswa (y) berada di titik 1.459651.Dilihat dari nilai koefisien determinasinya (R-sq) maka uang saku mahasiswa mampu menjelaskan variabilitas IPK mahasiswa dalam model sebesar 72.68138%, sedangkan 27.31862% sisanya dijelaskan oleh variabel lain yang tidak dimasukkan ke dalam model. Dari analisis output di atas, model regresi sudah mampu menjelaskan variabilitas IPK mahasiswa ,karena nilai koefisien determinasinya lebih dari 70%. Kemudian untuk korelasi antara IP Semester 1 mahasiswa dengan IPK mahasiswa sebesar 72.16593 hal itu menunjukkan bahwa hubungan antara IP Semester 1 mahasiswa dengan IPK mahasiswa sangat erat, sebab nilai korelasinya lebih dari 1.Dari tabel ANOVA di atas dapat diketahui derajat bebas dari regresi adalah 1, error sebesar 53 dan total sebesar 54. Kemudian untuk nilai sum of square untuk regresi adalah 3.520377, error sebesar 1.323198 dan total sebesar 4.843575. Selanjutnya untuk mean square regresi adalah 3.520377 dan error adalah 0.024966. Nilai F hitung diketahui sebesar 141.0068 dan P-value sebesar 2.220446e-16.4.3.1. Pengujian Hipotesis Uji Hipotesis pada :H0 : H1 :

P-Value = 1.079137e-13t-hitung= 9.928925 = 2,01Karena t-hitung t-tabel dan P-value maka tolak H0, sehingga dapat disimpulkan bahwa garis regresi tidak berpotongan atau melewati titik (0,0).

Uji Hipotesis pada :H0 : H1 :

P-Value = 2.220446e-16t-hitung = 11.87463 = 2,01 Karena t-hitung t-tabel dan P-value maka tolak H0, sehingga dapat disimpulkan bahwa IP Semester 1 mahasiswa berpengaruh signifikan terhadap IPK mahasiswa.

Uji Hipotesis pada dan :H0 : H1 :

P-Value = 2.220446e-16F-hitung = 141.0068 = 4,035Karena F-hitung F-tabel dan P-value maka tolak H0, jadi dapat disimpulkan bahwa ada hubungan antara uang saku mahasiswa dengan IPK mahasiswa.Scatter plot pengaruh IP Semester 1 mahasiswa terhadap IPK mahasiswa adalah sebagai berikut:

5. KesimpulanDari analisis 3 faktor yang memengaruhi IPK mahasiswa mata kuliah Komputasi Statistik Kelas A, didapatkan hasil sebagai berikut:1. Faktor pertama adalah pengaruh rata-rata jam belajar mahasiswa terhadap IPK mahasiswa. Dari pengujian hipotesis menggunakan uji-t didapatkan hasil bahwa rata-rata jam belajar mahasiswa tidak berpengaruh signifikan terhadap IPK mahasiswa. Kemudian dilakukan juga pengujian serentak menggunakan uji F, didapatkan hasil bahwa rata-rata jam belajar mahasiswa tidak mempunyai hubungan atau independen dengan IPK mahasiswa.2. Faktor kedua adalah pengaruh uang saku mahasiswa terhadap IPK mahasiswa. Dari pengujian hipotesis menggunakan uji-t didapatkan hasil bahwa uang saku mahasiswa tidak berpengaruh signifikan terhadap IPK mahasiswa. Kemudian dilakukan juga pengujian serentak menggunakan uji F, didapatkan hasil bahwa uang saku mahasiswa tidak mempunyai hubungan atau independen dengan IPK mahasiswa.3. Faktor pertama adalah pengaruh IP Semester 1 mahasiswa terhadap IPK mahasiswa. Dari pengujian hipotesis menggunakan uji-t didapatkan hasil bahwa IP Semester 1 mahasiswa berpengaruh signifikan terhadap IPK mahasiswa. Kemudian dilakukan juga pengujian serentak menggunakan uji F, didapatkan hasil bahwa IP Semester 1 mahasiswa mempunyai hubungan dengan IPK mahasiswa.