KORELASI DAN REGRESI
Transcript of KORELASI DAN REGRESI
KORELASI DAN REGRESI
Tujuan
Setelah mengikuti perkuliahan ini, diharapkan mahasiswa akan memahami :
โ Teknik pengolahan data dengan menggunakan analisa regresi sederhana
โ Teknik pengolahan data dengan menggunakan analisa korelasi
โ Teknik pengolahan data dengan menggunakan analisa regresi berganda
PENDAHULUAN
Gagasan perhitungan ditetapkan oleh Sir Francis Galton
Persamaan regresi : persamaan matematik yang memungkinkan peramalan nilai suatu peubah tak bebas (dependent variable) dari nilai peubah bebas (independent variable)
Diagram pencar = scatter diagram โ diagram yang menggambarkan nilai-nilai observasi peubah tak bebas dan peubah bebas.
Nilai peubah bebas ditulis pada sumbu x (sumbu horisontal)
Nilai peubah tak bebas ditulis pada sumbu y (sumbu vertikal)
Nilai peubah tak bebas ditentukan oleh nilai peubah bebas.
Definisi
Regresi Linear sederhana :โ Analisis yang digunakan untuk mengestimasi nilai suatu
variabel berdasarkan nilai variabel lainnya
Beda regresi dan korelasi adalah :โ Regresi bentuk hubungan antara variabel YANG
MEMPENGARUHI variabel yang lain, atau bentuk
hubungan antara VARIABEL INDEPENDENT terhadap
VARIABEL DEPENDENT
โ Korelasi besarnya derajad atau tingkat hubungan dan
arah hubungan antara variabel yang satu dengan variabel
yang lain
Hubungan X dan Y (1)
Kemungkinan hubungan X dan Y :
โ Linear searah
โ Linear berlawanan
โ Curvilinear searah
โ Curvilinear berlawanan
โ Linear berlawanan dengan lebih menyebar
โ Tidak ada hubungan
Hubungan X dan Y (2)
Linear searah Linear berlawanan
arah
Hubungan X dan Y (3)
Curvilinear searahCurvilinear
berlawanan arah
Hubungan X dan Y (4)
Linear berlawanan
arah & menyebarTidak ada
hubungan
Jenis-jenis persamaan regresi
a. Regresi linier
- Regresi linier sederhana
- Regresi linier berganda
b. Regresi non linier
- Regresi eksponensial
Regresi Linear Sederhana
Persamaan Garis Regresi๐ = ๐ + ๐๐ โ ๐ = ๐ฝ0 + ๐ฝ1๐
Dimana :๐ = dependent variabel (peubah tak bebas)
X = independent variabel (peubah bebas)
a = intercept (konstanta)
b = slope (kemiringan)
Metode kuadrat terkecil : untuk menentukan garis estimasi yang terbaik berdasarkan kriteria menghasilkan nilai โei2 yang sekecil mungkin.
Estimasi Koefisien Regresi
๐ =๐๐ฅ๐ฆ
๐๐ฅ๐ฅ
๐ = เดค๐ โ ๐ เดค๐
๐๐ฅ๐ฅ = ฯ ๐๐ โ เดค๐ 2 = ฯ๐๐2 โ
(ฯ ๐๐)2
๐
๐๐ฆ๐ฆ = ฯ(๐๐ โ เดค๐)2= ฯ๐๐2 โ
(ฯ ๐๐)2
๐
๐๐ฅ๐ฆ = ฯ ๐๐ โ เดค๐ ๐๐ โ เดค๐ = ฯ๐๐ ๐๐ โ(ฯ ๐๐)(ฯ ๐๐)
๐
Contoh Penentuan Koefisien
RegresiBiaya perawatan kendaraan
Umur Kendaraan (tahun) Biaya reparasi (Rp. Juta)
5 3,1
11 4
4 3
5 3,4
3 2,5
2 2
Contoh Penentuan Koefisien
Regresi
No. Umur (X) Biaya (Y) XY X2 Y2
1 5,0 3,1 15,5 25,0 9,61
2 11,0 4,0 44,0 121,0 16,00
3 4,0 3,0 12,0 16,0 9,00
4 5,0 3,4 17,0 25,0 11,56
5 3,0 2,5 7,5 9,0 6,25
6 2,0 2,0 4,0 4,0 4,00
Total 30,0 18,0 100,0 200,0 56,42
Contoh Penentuan Koefisien
Regresi
าง๐ฅ =30
6= 5 เดค๐ฆ =
18
6= 3
๐๐ฅ๐ฅ = ฯ ๐๐ โ เดค๐ 2 = ฯ๐๐2 โ
(ฯ ๐๐)2
๐= 200 โ
30 2
6= 50
๐๐ฆ๐ฆ = ฯ(๐๐ โ เดค๐)2= ฯ๐๐2 โ
(ฯ ๐๐)2
๐= 56,42 โ
182
6= 2,42
๐๐ฅ๐ฆ = ฯ ๐๐ โ เดค๐ ๐๐ โ เดค๐ = ฯ๐๐ ๐๐ โ(ฯ ๐๐)(ฯ ๐๐)
๐= 100 โ
30(18)
6= 10
๐ =๐๐ฅ๐ฆ
๐๐ฅ๐ฅ=
10
50= 0,2
๐ = เดค๐ โ ๐ เดค๐ = 3 โ 0,2(5) = 2
Y = 2 + 0,2X
Intercept slope
Standard Error of Estimation (Se)
๐๐ = ๐๐ โ ๐๐ = ๐๐ โ ๐ โ ๐๐๐๐๐๐ธ = ฯ๐1
2 = ๐๐๐ โ (๐๐๐2 /๐๐๐)
๐๐๐ธ = ฯ๐๐2 = ๐๐๐ โ (
๐๐๐2
๐๐๐)
๐๐2 =
๐๐๐ธ
(๐โ2)
๐๐ = ๐๐2
๐๐๐ธ = ฯ๐๐2 = ๐๐๐ โ (
๐๐๐2
๐๐๐) = 2,42 โ
102
50= 0,42
๐๐2 =
๐๐๐ธ
(๐โ2)=
0,42
(6โ2)= 0,105
๐๐ = ๐๐2 = 0,105 = 0,324
Standard Error of Estimation (Se)
error
Slope
errorerror
Intersep
X
Y
Standard Error of Estimation (Se)
Persamaan garis
hubungan X dan Y menunjukkan hubungan X dan Y
regresi
merupakan estimator yang lebih
akurat untuk menunjukkan
Persamaan
merupakan
kurang
garis
estimator
akurat
regresi
yang
untuk
XX
YY
Analisis Residual
Residual adalah error yang terjadi pada garis regresi
Residual menunjukkan perbedaan antara y prediksi dengan y aktualnya
Tujuan analisis residual adalah untuk menguji sebagian atau seluruh asumsi yang mendasari regresi yaitu :โ Model adalah linear
โ Suku error mempunyai raians yang konstan
โ Semua suku error independen
โ Suku error terdistribusi normal
Residual Plot
Non-linear Residual Plot Non-independent Residual
Inferensia terhadap Koefisien
RegresiUji Hipotesa :
Ho : ร1 = 0
Ha : ร1 โ 0
Ho : Tidak ada pengaruh yang signifikan
dari X terhadap Y Ha : Ada pengaruh
yang signifikan dari X terhadap Y
Inferensia terhadap Koefisien
Regresi
๐๐ =๐๐
๐๐๐๐ก =
๐โ๐ฝ1
๐๐
๐๐ =๐๐
๐๐๐=
0,324
50= 0,046
๐ก =๐โ๐ฝ1
๐๐=
0,2โ0
0,046= 4,35
t0,05/(6-2) = 2,776 < thitung
Kesimpulan : H0 DITOLAK โ ada
pengaruh yang signifikan dari umur
kendaraan terhadap biaya perawatan.
Estimasi Interval untuk Slope
Populasib - t/2,db.Sb 1 b + t/2,db.Sb
0,2 โ 2,78(0,046) 1 0,2 + 2,78(0,046)
0,072 1 0,329
Estimasi Interval untuk Slope
Populasi Dengan menggunakan tingkat kepercayaan
95%, nilai 1 berkisar antara 0,072 hingga
0,329. Artinya, bila umur kendaraan
bertambah satu tahun, maka biaya
perawatannya akan meningkat antara Rp.
72.000,- hingga Rp. 329.000,-
Koefisien bertanda positif, berarti arah
hubungannya searah.
Koefisien Determinasi
Ukuran ketepatan/kecocokan garis regresi yang dibuat dari hasil estimasi terhadap sekelompok data hasilobservasi
Semakin besar nilai R2, semakin bagus garis regresi yang terbentuk, dansebaliknya
Untuk mengukur proporsi dari jumlah variasi Y yang diterangkan oleh model regresi atau untuk mengukur besar sumbangan variabel X terhadap variasi variabel Y
Nilai R square 0 hingga 1
Koefisien Determinasi
๐ 2 =๐๐๐2
๐๐๐๐๐๐
๐ 2 =๐๐๐2
๐๐๐๐๐๐=
102
50(2,42)= 0,83
Output SPSS
Coefficientsa
Model
Unstand
Coeffi
B
ardized
cients
Std. Error
Standardized
Coefficients
Beta t Sig.
1 (Constant) 2.000 .265 7.559 .002
Umur Kendaraan .200 .046 .909 4.364 .012
a. Dependent Variable: Biaya Reparasi
Slope (b)=0.2Intersep
(a)=2
Sb= 0.046Inferensia
terhadap slope
Output SPSS
Model Summary
Model R R Square
Adjusted
R Square
Std. Error of
the Estimate
1 .909a .826 .783 .32404
a. Predictors: (Constant), Umur Kendaraan
Koefisien Determinasi= 0.826Se=0.3204
Output SPSS
ANOVAb
Model
Sum of
Squares df Mean Square F Sig.
1 Regression 2.000 1 2.000 19.048 .012a
Residual .420 4 .105
Total 2.420 5
a. Predictors: (Constant), Umur Kendaraan
b. Dependent Variable: Biaya Reparasi
SSE =0.42 Se2 = 0.105
Koefisien Korelasi
Koefisien korelasi (r) : ukuran hubungan linier peubah x dan y
Besaran yg tidak punya satuan
Nilai r terletak antara -1 hingga 1
Tanda koef. Korelasi menunjukkan arahhubungan
Nilai r yang (+) ditandai oleh nilai b yang (+)
Nilai r yang (-) ditandai oleh nilai b yang (-)
Hanya mencerminkan keeratan hubungan linear dari dua variabel yang terlibat
Bersifat simetris (bolak-balik)
Variabel yang terlibat tidak harus dependentdan independent
Koefisien Korelasi
Jika nilai r mendekati +1 atau r mendekati -1 maka x dan y memiliki korelasi linier yang tinggi.
Jika nilai r = +1 atau r = -1 maka x dan y memiliki korelasi linier sempurna
Jika nilai r = 0 maka x dan y tidak memiliki relasi (hubungan) linier (dalam kasus r mendekati 0, anda dapat melanjutkan analisis ke regresi eksponensial.
Koefisien determinasi sampel = R = r2
Ukuran proporsi keragaman total nilai peubah y yang dapat dijelaskan oleh nilai peubah x melalui hubungan linier.
Koefisien Korelasi
๐ 2 =๐๐๐2
๐๐๐๐๐๐
๐ 2 =๐๐๐2
๐๐๐๐๐๐=
102
50(2,42)= 0,83
๐ = ๐ 2
๐ = ๐ 2 = 0,83 = 0,91
Output SPSS
Co rr e lat io ns
Umur
Kendaraan
Biaya
Reparasi
Umur Kenda raan Pearson Correlat ion 1 .909*
Sig. (2-tai led) . . 012
N 6 6
Biaya Reparas i Pearson Correlat ion .909* 1
Sig. (2-tai led) .012 .
N 6 6
*. Correlat ion is s ignif icant a t the 0.05 level (2-tai led).
Beberapa Bentuk Hubungan
Linear Antara Dua Variabel
r = + 1 , berhub ungan posit if
sempurna
-4
-6
-2
6
4
2
0
-1 0 -5 0 5 1 0
Beberapa Bentuk Hubungan
Linear Antara Dua Variabel
r = - 1, berhubungan
negatif sempurna
10
5
-10 -5
0
-50
-10
5 10
Beberapa Bentuk Hubungan
Linear Antara Dua Variabel
r = -0.11, tidak terdapat
hubungan yang kuat
-
6.0
-6 0 6
(6.0)
Beberapa Bentuk Hubungan
Linear Antara Dua Variabel
r = 0.78, terdapat
hubungan positif
-6
0
6
-6 0 6
Beberapa Bentuk Hubungan
Linear Antara Dua Variabel
R = - 0 , 8 4 , t e r da pa t hubunga n
ne ga t i f
-6
0
6
-1 0 -5 0 5 10
Inferensia terhadap Koefisien
Korelasi Populasi Hipotesa :
โ Ho: = 0
โ Ha: โ 0
Interpretasi :โ Ho: ada hubungan yang signifikan antara X dan Y
โ Ha: tidak ada hubungan yang signifikan antara X dan Y
Inferensia terhadap Koefisien
Korelasi Populasi
๐ก = ๐๐ โ 2
1 โ ๐2
๐ก = ๐๐โ2
1โ๐2= 0,91
6โ2
1โ0,83= 4,41
t,db = 2,776
Inferensia terhadap Koefisien
Korelasi Populasi Kesimpulan :
โ Tolak Ho Ada hubungan yang signifikan
antara umur kendaraan dengan biaya
perawatannya
โ Karena nilai r adalah 0,91 (positif), maka bila
umur kendaraan bertambah, akan
mengakibatkan biaya perawatannya juga akan
meningkat
Inferensia terhadap Koefisien
RegresiHipotesa untuk menguji
signifikansi pengaruh X1 terhadap
Y:โ Ho : 1 = 0
โ Ha : 1 โ 0
T hitung = 1,859 dengan probabilitas0.105
Dengan menggunakan alpha 0.05, maka hipotesa null diterima, artinya tidak ada pengaruh yang signifikan dari X1 terhadap Y
Inferensia terhadap Koefisien
Regresi Hipotesa untuk menguji signifikansi
pengaruh X2 terhadap Y
โฆ H0 : 2 = 0
โฆ Ha : 2 0
Thitung = 3,511 dengan probabilitas 0,010
Dengan menggunakan alpha 0,05, maka
hipotesa null ditolak, artinya ada pengaruh
yang signifikan dari X2 terhadap Y.
Koefisien Determinasi
b. Dependent Variable: Y
M ode l Summary
Model R R Square
Adjusted
R Square
Std. Error of
the Estimate
1 .854a .729 .651 1.07064
a. Predictors: (Constant), X2, X1
AN OVAb
Model
Sum of
Squares df Mean Square F Sig.1 Regression 21.576 2 10.788 9.411 .010a
Residual 8.024 7 1.146
Total 29.600 9
a. Predictors: (Constant), X2, X1
Persoalan Multicollinearity
Multikolinearitas akan menimbulkanpermasalahan karena :
โ Tidak dapat memprediksi Y dengan baik bilaindependent variabel saling berhubungan
โ Akan menurunkan derajad signifikansi
hubungan
โ Dimungkinkan variabel-variabel yang salingberhubungan sebenarnya menggambarkansatu variabel yang sama
โ Kontribusi individual dari tiap variabel sulit
dipisahkan
Kasus
Di bawah ini terdapat data beberapa
variabel :
X1 X2 Y
74 5 28
87 11 33
69 4 21
93 9 40
81 7 38
97 10 46
Kasus 1
Berdasarkan variabel X1 dan Y,
buatlah :
โ Analisa regresi sederhana
โ Analisa korelasi