UAS anreg

download UAS anreg

of 7

description

analisis regresi

Transcript of UAS anreg

Bagian A (Konsep)1. Metode regresi adalah menentukan pola hubungan (secara matematis) antara variabel dependen dengan satu atau lebih variabel independen. Manfaat dari metode ini dapat digunakan untuk menjelaskan atau memprediksi variabilitas dari variabel dependen dengan menggunakan informasi dari satu atau lebih variabel independen melalui suatu persamaan matematis. Persamaan matematis bisa saja berupa suatu garis atau kurva yang diduga terlebih dahulu dari suatu Scatterplot. Scatter plot adalah suatu gambaran awal atau sederhana dari hubungan variabel dependen dan independen.Bila suatu model regresi digunakan tanpa suatu kualifikasi biasanya mewakili linier regresi. Ada 2 macam pada metode regresi yaitu Regresi Linier sederhana dan Regresi linier berganda

2.Dalam analisis regresi linier sederhanaa. Postulated modelnya adalah

atau secara matriks dapat ditulis

dimana

Y = variabel respon/ DependenX1 = variabel predictor/ Independen0 = Intercept Y populasi1= Koefisien slope populasi

= residual Y= matriks respon berukuran n1X= matriks prediktor berukuran n(p+1)= matriks parameter berukuran 1(p+1)= matriks residual berukuran n1.

b.Model dugaan setiap pengamatan atau b0 + b1 Xi ,

Untuk mempermudah menghitung penaksir koefisien regresi maka persamaan normal diubah ke bentuk matrik

Dengan metode OLS koefisien model regresi dapat diestimasi secara matriks dengan persamaan

c.Ya, dikarenakan nilai E( Statistik)= E (Parameter)Statistik merupakan besaran yang dihasilkan dari sampel yang digunakan untuk menduga populasi dan Parameter merupakan besaran yang dihasilkan dari PopulasiE( b0 )= o dan E( b1 )= 1d.Residual harus memenuhi syarat tertentu, yaitu identik (homoskedastisitas), independen (tidak ada autokorelasi) dan berdistribusi Normal (0,2). Jika tidak memenuhi maka model regresi tersebut tidak sesuai diterapkan pada data. Solusi jika syarat tidak terpenuhi adalah :- Jika residual tidak identik dapat digunakan metode regresi terboboti.- Jika residual tidak independen dapat digunakan metode generalized least square atau generalized difference regression.- Jika residual tidak berdistribusi normal dapat dilakukan transformasi variabel.3.The best selection model adalah pemilihan model regresi terbaik dengan menentukan variabel prediktor yang sesuai yaitu yang menghasilkan parameter signifikan, R2 tinggi, MSE rendah, serta model yang memenuhi semua asumsi.4.Multikolinieritas dalam analisis regresi adalah adanya korelasi yang signifikan pada variabel independen. Multikolinieritas dapat mengganggu analisis regresi yaitu dapat menghasilkan tanda koefisien regresi yang tidak sesuai dengan tanda koefisien korelasi, serta menghasilkan R2 tinggi namun parameter tidak signifikan. Multikolinieritas dapat dideteksi dari matriks korelasi, nilai VIF, atau kesesuaian tanda koefisien regresi dengan koefisien korelasi. Multikolinieritas dapat diatasi dengan metode principal component regression (PCR), ridge regression, atau menghilangkan variabel yang menyebabkan multikolinieritas.5.Model polinomial adalah model yang menggunakan prediktor yang berpangkat lebih dari satu. MODEL SECARA UMUM :

(*)

Contoh model polinomial orde 3 Misal p=3; Z1=X; Z2=X2; Z3=X3; dan , maka model (*) menjadi 6.Model linear memiliki dua sifat yaitu regresi sederhana dan regresi berganda dengan kurva yang dihasilkan membentuk garis lurus, sedangkan untuk model non linear dalam parameternya bersifat kuadratik dan kubik dengan kurva yang dihasilkan membentuk garis lengkung.Model linier intrinsik merupakan model yang dapat di ubah bentuknya menjadi linier, yaitu dengan cara mentransformasikan variabel. Salah satu metodenya adalah metode exponensial

Bentuk persamaan matematis model regresi linear .Bentuk persamaan matematis model regresi non linear ada beberapa jenis, diantaranya :

1. Polinomial, contoh : (kuadratik)

(kubik)2. Exponensial, contoh :

Bagian B (Permasalahan)B1. Permasalahan Program Pemberian Beasiswa di Perguruan Tinggi

1.Model regresi yang terbentuk umtuk program pemberian beasiswa di perguruan tinggi adalah .

a.Interpretasi dari adalah Jika uang kiriman orang tua naik satu satuan maka pengeluaran mahasiswa per bulan cenderung naik 0,961 satuan.b.Untuk mengetahui apakah pengeluaran mahasiswa berbeda secara signifikan dilakukan dengan melihat uji signifikansi parameter. Hipotesis :H0: 1=0 (pengeluaran mahasiswa dan mahasiswi sama)H1: 1o (pengeluaran mahasiswa dan mahasiswi berbeda).Hasil uji signifikansi parameter :Predictor Coef SE Coef T PConstant -15.77 34.86 -0.45 0.659X1 0.96069 0.05217 18.41 0.000D1 17.601 5.427 3.24 0.007D2 27.13 11.15 2.43 0.032

Statistika Uji : P valueDaerah Kritis : P-value untuk D1= 0.007 bernilai kurang dari 0,05 sehingga Tolak H0Kesimpulan :pengeluaran mahasiswa berbeda signifikan dengan pengeluaran mahasiswi.c.Untuk mengetahui apakah kepemilikan motor berpengaruh pada pengeluaran mahasiswa dilakukan dengan melihat uji signifikansi parameter.Hipotesis :H0: 2=0 (kepemilikan sepeda motor tidak berpengaruh terhadap pengeluaran mahasiswa)H0: 2o (kepemilikan sepeda motor berpengaruh terhadap pengeluaran mahasiswa).Hasil uji signifikansi parameter :Predictor Coef SE Coef T PConstant -15.77 34.86 -0.45 0.659X1 0.96069 0.05217 18.41 0.000D1 17.601 5.427 3.24 0.007D2 27.13 11.15 2.43 0.032

Statistika Uji : P value Daerah Kritis : P-value untuk D2= 0.032 bernilai kurang dari 0,05 sehingga Tolak H0Kesimpulan : kepemilikan sepeda motor berpengaruh terhadap pengeluaran mahasiswa.d.Model persamaan regresi untuk mahasiswa yang tidak memiliki sepeda motor :

Model persamaan regresi untuk mahasiswa yang memiliki sepeda motor :

Model persamaan regresi untuk mahasiswi yang tidak memiliki sepeda motor :

Model persamaan regresi untuk mahasiswi yang memiliki sepeda motor :

B2. Pemilihan Model Terbaik1. Metode Best Subsetsmenentukan semua kemungkinan persamaan regresi, kemudian membandingkan seluruh model yang mungkin dibuat, yang bisa dilihat sebagai acuan kriteria model terbaik adalah dengan melihat pada :a. Nilai R2 maksimum. b. Nilai R2 terkoreksi maksimum. c. Statistik Uji, Cp Mallows. Dari Data terlampir sebanyak 25 data dengan variable Y dan 4 buah predictor X1,X2,X3 dan X4 maka dengan Metode Best Subsets didapatkan hasil sebagai berikutTabel Model Regresi, R2, R2 adj, dan Cp mallow

Dari seluruh kemungkinan model regresi dalam tabel diatas dipilih satu model terbaik dari tiap-tiap ukuran banyaknya variabel independen, yaitu dengan kriteria R2 maksimum, R2adj maksimum, dan nilai Cp mallow yang mendekati parameter.Dari hasil perhitungan di atas dapat disimpulkan bahwa model terbaik yang dapat kita sarankan adalah ketika model memuat jumlah variabel independen sebanyak 3 yaitu dengan model Y= f(X1, X3, X4, ) dengan R2 44,67%, R2 adj 36,8% dan nilai Cpmallows yang mendekati parameter. Namun jika dibandingkan model 3 variabel independen dengan model 4 variabel independen, nilai R2 bertambah 0,6% dan nilai Cpmallows juga sudah sesuai dengan banyaknya parameter, tapi dari nilai R2 adj terjadi penurunan 2,5% yang artinya dengan penambahan 1 variabel independen justru menyebabkan R2 adj turun (meskipun R2 bertambah), maka model terbaik yang dipilih dari metode Best Subsets adalah model dengan 3 variabel independen Y=f(X1, X3, X4)

2. Metode Forward

1..Meregresikan variabel respon, Y, dengan setiap varia bel prediktor, misal X1, X2, ... , Xk. Kemudian dipilih model yang mempunyai nilai R2 tertinggi. Misal m del tersebut adalah yang memuat prediktor Xa, yaitu b0 + baXa.2. Korelasi paling tinggi dihasilkan oleh Y dengan X3 sehingga X3 digunakan sebagai prediktor terlebih dahulu. Dari hasil uji signifikansi parameter diperoleh p-value kurang dari 0,05 sehingga X3 signifikan.3. Selanjutnya dimasukkan variabel dengan korelasi tertinggi kedua yaitu X1. Diperoleh p-value yang kurang dari 0,05 untuk X1 dan X3 sehingga X1 dan X3 signifikan.4. Selanjutnya dimasukkan variabel dengan korelasi tertinggi ketiga yaitu X4. Diperoleh p-value yang kurang dari 0,05 untuk X1 dan X3, dan p-value lebih dari 0,05 untuk X4. Jadi X4 tidak perlu dimasukkan dalam model

5. sehingga model akhirnya adalah : B3. Permasalahan Proses Produksia.Matriks X yang terbentuk dari data proses produksi :

b.Postulated model : .Interpretasi Jika kecepatan motor naik satu putaran per jam maka waktu kerusakan bertambah sebesar 1.

c.

d. Uji secara overallHipotesis:H0 : 1=1=2=0H1 : minimal ada satu 1, 1 atau 2 0.Hasil uji signifikansi parameter :Source DF SS MS F PRegression 3 2826.7 942.2 8.39 0.007Residual Error 8 898.0 112.2Total 11 3724.7

Statistika Uji : P valueDaerah Kritis : P-value untuk D1= 0.007 bernilai kurang dari 0,05 sehingga Tolak H0Kesimpulan : minimal ada satu prediktor yang berpengaruh signifikan.Uji secara IndividuHipotesis 1,1 dan 2

H0 : 1 =0H1 : 1 0H0 : 1= 0H1 : 1 0.H0 : 2=0H1 : 2 0.

Hasil uji signifikansi parameter :Predictor Coef SE Coef T PConstant -383.1 112.1 -3.42 0.009X1 3.9929 0.8922 4.48 0.002Z1 11.011 7.610 1.45 0.186Z2 10.996 7.505 1.47 0.181

Statistika Uji : P valueDaerah Kritis :P-value untuk X1= 0.002 bernilai KURANG dari 0,05 sehingga Tolak H0P-value untuk Z1= 0.186 bernilai LEBIH dari 0,05 sehingga Gagal Tolak H0P-value untuk Z2= 0.181 bernilai LEBIH dari 0,05 sehingga Gagal Tolak H0Kesimpulan : X1 berpengaruh terhadap Y secara signifikan, sedangkan Z1dan Z2 tidak berpengaruh terhadap Y secara signifikan. e.Untuk mengetahui apakah shif berpengaruh terhadap waktu kerusakan dilakukan dengan melihat uji signifikansi parameter. Hipotesis :H0 : 1= 2=0H1 : minimal ada satu 1atau20Hasil uji signifikansi parameter :Source DF SS MS F PRegression 2 578.7 289.3 0.83 0.468Residual Error 9 3146.0 349.6Total 11 3724.7

Statistika Uji : P valueDaerah Kritis :P-value = 0,468 bernilai LEBIH dari 0,05 sehingga Gagal Tolak H0Kesimpulan : shift tidak berpengaruh terhadap waktu kerusakan.f.Untuk mengetahui apakah ada perbedaan antara shif pagi dan shif siang dengan melihat nilai p value, dimana value bernilai LEBIH dari 0,05 sehingga Gagal Tolak H0 yang artinya shif pagi dan shif siang tidak ada perbedaanPredictor Coef SE Coef T PConstant 118.000 9.348 12.62 0.000Z1 17.00 13.22 1.29 0.231Z2 9.00 13.22 0.68 0.513g. HipotesisH0 : 1=0H1 :1 0Artinya jika pada statistika uji P-value bernilai LEBIH dari 0,05 sehingga Gagal Tolak H0 dan jika P-value bernilai KURANG dari 0,05 sehingga Tolak H0 h. Langkah menguji shift siang dan shif malam-Membuat Hipotesis-Membuat Statistika Uji-Daerah kritis-Kesimpulan