KORELASI DAN REGRESI
Tujuan
Setelah mengikuti perkuliahan ini, diharapkan mahasiswa akan memahami :
– Teknik pengolahan data dengan menggunakan analisa regresi sederhana
– Teknik pengolahan data dengan menggunakan analisa korelasi
– Teknik pengolahan data dengan menggunakan analisa regresi berganda
PENDAHULUAN
Gagasan perhitungan ditetapkan oleh Sir Francis Galton
Persamaan regresi : persamaan matematik yang memungkinkan peramalan nilai suatu peubah tak bebas (dependent variable) dari nilai peubah bebas (independent variable)
Diagram pencar = scatter diagram → diagram yang menggambarkan nilai-nilai observasi peubah tak bebas dan peubah bebas.
Nilai peubah bebas ditulis pada sumbu x (sumbu horisontal)
Nilai peubah tak bebas ditulis pada sumbu y (sumbu vertikal)
Nilai peubah tak bebas ditentukan oleh nilai peubah bebas.
Definisi
Regresi Linear sederhana :– Analisis yang digunakan untuk mengestimasi nilai suatu
variabel berdasarkan nilai variabel lainnya
Beda regresi dan korelasi adalah :– Regresi bentuk hubungan antara variabel YANG
MEMPENGARUHI variabel yang lain, atau bentuk
hubungan antara VARIABEL INDEPENDENT terhadap
VARIABEL DEPENDENT
– Korelasi besarnya derajad atau tingkat hubungan dan
arah hubungan antara variabel yang satu dengan variabel
yang lain
Hubungan X dan Y (1)
Kemungkinan hubungan X dan Y :
– Linear searah
– Linear berlawanan
– Curvilinear searah
– Curvilinear berlawanan
– Linear berlawanan dengan lebih menyebar
– Tidak ada hubungan
Hubungan X dan Y (2)
Linear searah Linear berlawanan
arah
Hubungan X dan Y (3)
Curvilinear searahCurvilinear
berlawanan arah
Hubungan X dan Y (4)
Linear berlawanan
arah & menyebarTidak ada
hubungan
Jenis-jenis persamaan regresi
a. Regresi linier
- Regresi linier sederhana
- Regresi linier berganda
b. Regresi non linier
- Regresi eksponensial
Regresi Linear Sederhana
Persamaan Garis Regresi𝑌 = 𝑎 + 𝑏𝑋 → 𝑌 = 𝛽0 + 𝛽1𝑋
Dimana :𝑌 = dependent variabel (peubah tak bebas)
X = independent variabel (peubah bebas)
a = intercept (konstanta)
b = slope (kemiringan)
Metode kuadrat terkecil : untuk menentukan garis estimasi yang terbaik berdasarkan kriteria menghasilkan nilai ∑ei2 yang sekecil mungkin.
Estimasi Koefisien Regresi
𝑏 =𝑆𝑥𝑦
𝑆𝑥𝑥
𝑎 = ത𝑌 − 𝑏 ത𝑋
𝑆𝑥𝑥 = σ 𝑋𝑖 − ത𝑋 2 = σ𝑋𝑖2 −
(σ 𝑋𝑖)2
𝑛
𝑆𝑦𝑦 = σ(𝑌𝑖 − ത𝑌)2= σ𝑌𝑖2 −
(σ 𝑌𝑖)2
𝑛
𝑆𝑥𝑦 = σ 𝑋𝑖 − ത𝑋 𝑌𝑖 − ത𝑌 = σ𝑋𝑖 𝑌𝑖 −(σ 𝑋𝑖)(σ 𝑌𝑖)
𝑛
Contoh Penentuan Koefisien
RegresiBiaya perawatan kendaraan
Umur Kendaraan (tahun) Biaya reparasi (Rp. Juta)
5 3,1
11 4
4 3
5 3,4
3 2,5
2 2
Contoh Penentuan Koefisien
Regresi
No. Umur (X) Biaya (Y) XY X2 Y2
1 5,0 3,1 15,5 25,0 9,61
2 11,0 4,0 44,0 121,0 16,00
3 4,0 3,0 12,0 16,0 9,00
4 5,0 3,4 17,0 25,0 11,56
5 3,0 2,5 7,5 9,0 6,25
6 2,0 2,0 4,0 4,0 4,00
Total 30,0 18,0 100,0 200,0 56,42
Contoh Penentuan Koefisien
Regresi
ҧ𝑥 =30
6= 5 ത𝑦 =
18
6= 3
𝑆𝑥𝑥 = σ 𝑋𝑖 − ത𝑋 2 = σ𝑋𝑖2 −
(σ 𝑋𝑖)2
𝑛= 200 −
30 2
6= 50
𝑆𝑦𝑦 = σ(𝑌𝑖 − ത𝑌)2= σ𝑌𝑖2 −
(σ 𝑌𝑖)2
𝑛= 56,42 −
182
6= 2,42
𝑆𝑥𝑦 = σ 𝑋𝑖 − ത𝑋 𝑌𝑖 − ത𝑌 = σ𝑋𝑖 𝑌𝑖 −(σ 𝑋𝑖)(σ 𝑌𝑖)
𝑛= 100 −
30(18)
6= 10
𝑏 =𝑆𝑥𝑦
𝑆𝑥𝑥=
10
50= 0,2
𝑎 = ത𝑌 − 𝑏 ത𝑋 = 3 – 0,2(5) = 2
Y = 2 + 0,2X
Intercept slope
Standard Error of Estimation (Se)
𝑒𝑖 = 𝑌𝑖 − 𝑌𝑖 = 𝑌𝑖 − 𝑎 − 𝑏𝑋𝑖𝑆𝑆𝐸 = σ𝑒1
2 = 𝑆𝑌𝑌 − (𝑆𝑋𝑌2 /𝑆𝑋𝑋)
𝑆𝑆𝐸 = σ𝑒𝑖2 = 𝑆𝑌𝑌 − (
𝑆𝑋𝑌2
𝑆𝑋𝑋)
𝑆𝑒2 =
𝑆𝑆𝐸
(𝑛−2)
𝑆𝑒 = 𝑆𝑒2
𝑆𝑆𝐸 = σ𝑒𝑖2 = 𝑆𝑌𝑌 − (
𝑆𝑋𝑌2
𝑆𝑋𝑋) = 2,42 −
102
50= 0,42
𝑆𝑒2 =
𝑆𝑆𝐸
(𝑛−2)=
0,42
(6−2)= 0,105
𝑆𝑒 = 𝑆𝑒2 = 0,105 = 0,324
Standard Error of Estimation (Se)
error
Slope
errorerror
Intersep
X
Y
Standard Error of Estimation (Se)
Persamaan garis
hubungan X dan Y menunjukkan hubungan X dan Y
regresi
merupakan estimator yang lebih
akurat untuk menunjukkan
Persamaan
merupakan
kurang
garis
estimator
akurat
regresi
yang
untuk
XX
YY
Analisis Residual
Residual adalah error yang terjadi pada garis regresi
Residual menunjukkan perbedaan antara y prediksi dengan y aktualnya
Tujuan analisis residual adalah untuk menguji sebagian atau seluruh asumsi yang mendasari regresi yaitu :– Model adalah linear
– Suku error mempunyai raians yang konstan
– Semua suku error independen
– Suku error terdistribusi normal
Residual Plot
Non-linear Residual Plot Non-independent Residual
Inferensia terhadap Koefisien
RegresiUji Hipotesa :
Ho : ß1 = 0
Ha : ß1 ≠ 0
Ho : Tidak ada pengaruh yang signifikan
dari X terhadap Y Ha : Ada pengaruh
yang signifikan dari X terhadap Y
Inferensia terhadap Koefisien
Regresi
𝑆𝑏 =𝑆𝑒
𝑆𝑋𝑋𝑡 =
𝑏−𝛽1
𝑆𝑏
𝑆𝑏 =𝑆𝑒
𝑆𝑋𝑋=
0,324
50= 0,046
𝑡 =𝑏−𝛽1
𝑆𝑏=
0,2−0
0,046= 4,35
t0,05/(6-2) = 2,776 < thitung
Kesimpulan : H0 DITOLAK → ada
pengaruh yang signifikan dari umur
kendaraan terhadap biaya perawatan.
Estimasi Interval untuk Slope
Populasib - t/2,db.Sb 1 b + t/2,db.Sb
0,2 – 2,78(0,046) 1 0,2 + 2,78(0,046)
0,072 1 0,329
Estimasi Interval untuk Slope
Populasi Dengan menggunakan tingkat kepercayaan
95%, nilai 1 berkisar antara 0,072 hingga
0,329. Artinya, bila umur kendaraan
bertambah satu tahun, maka biaya
perawatannya akan meningkat antara Rp.
72.000,- hingga Rp. 329.000,-
Koefisien bertanda positif, berarti arah
hubungannya searah.
Koefisien Determinasi
Ukuran ketepatan/kecocokan garis regresi yang dibuat dari hasil estimasi terhadap sekelompok data hasilobservasi
Semakin besar nilai R2, semakin bagus garis regresi yang terbentuk, dansebaliknya
Untuk mengukur proporsi dari jumlah variasi Y yang diterangkan oleh model regresi atau untuk mengukur besar sumbangan variabel X terhadap variasi variabel Y
Nilai R square 0 hingga 1
Koefisien Determinasi
𝑅2 =𝑆𝑋𝑌2
𝑆𝑋𝑋𝑆𝑌𝑌
𝑅2 =𝑆𝑋𝑌2
𝑆𝑋𝑋𝑆𝑌𝑌=
102
50(2,42)= 0,83
Output SPSS
Coefficientsa
Model
Unstand
Coeffi
B
ardized
cients
Std. Error
Standardized
Coefficients
Beta t Sig.
1 (Constant) 2.000 .265 7.559 .002
Umur Kendaraan .200 .046 .909 4.364 .012
a. Dependent Variable: Biaya Reparasi
Slope (b)=0.2Intersep
(a)=2
Sb= 0.046Inferensia
terhadap slope
Output SPSS
Model Summary
Model R R Square
Adjusted
R Square
Std. Error of
the Estimate
1 .909a .826 .783 .32404
a. Predictors: (Constant), Umur Kendaraan
Koefisien Determinasi= 0.826Se=0.3204
Output SPSS
ANOVAb
Model
Sum of
Squares df Mean Square F Sig.
1 Regression 2.000 1 2.000 19.048 .012a
Residual .420 4 .105
Total 2.420 5
a. Predictors: (Constant), Umur Kendaraan
b. Dependent Variable: Biaya Reparasi
SSE =0.42 Se2 = 0.105
Koefisien Korelasi
Koefisien korelasi (r) : ukuran hubungan linier peubah x dan y
Besaran yg tidak punya satuan
Nilai r terletak antara -1 hingga 1
Tanda koef. Korelasi menunjukkan arahhubungan
Nilai r yang (+) ditandai oleh nilai b yang (+)
Nilai r yang (-) ditandai oleh nilai b yang (-)
Hanya mencerminkan keeratan hubungan linear dari dua variabel yang terlibat
Bersifat simetris (bolak-balik)
Variabel yang terlibat tidak harus dependentdan independent
Koefisien Korelasi
Jika nilai r mendekati +1 atau r mendekati -1 maka x dan y memiliki korelasi linier yang tinggi.
Jika nilai r = +1 atau r = -1 maka x dan y memiliki korelasi linier sempurna
Jika nilai r = 0 maka x dan y tidak memiliki relasi (hubungan) linier (dalam kasus r mendekati 0, anda dapat melanjutkan analisis ke regresi eksponensial.
Koefisien determinasi sampel = R = r2
Ukuran proporsi keragaman total nilai peubah y yang dapat dijelaskan oleh nilai peubah x melalui hubungan linier.
Koefisien Korelasi
𝑅2 =𝑆𝑋𝑌2
𝑆𝑋𝑋𝑆𝑌𝑌
𝑅2 =𝑆𝑋𝑌2
𝑆𝑋𝑋𝑆𝑌𝑌=
102
50(2,42)= 0,83
𝑟 = 𝑅2
𝑟 = 𝑅2 = 0,83 = 0,91
Output SPSS
Co rr e lat io ns
Umur
Kendaraan
Biaya
Reparasi
Umur Kenda raan Pearson Correlat ion 1 .909*
Sig. (2-tai led) . . 012
N 6 6
Biaya Reparas i Pearson Correlat ion .909* 1
Sig. (2-tai led) .012 .
N 6 6
*. Correlat ion is s ignif icant a t the 0.05 level (2-tai led).
Beberapa Bentuk Hubungan
Linear Antara Dua Variabel
r = + 1 , berhub ungan posit if
sempurna
-4
-6
-2
6
4
2
0
-1 0 -5 0 5 1 0
Beberapa Bentuk Hubungan
Linear Antara Dua Variabel
r = - 1, berhubungan
negatif sempurna
10
5
-10 -5
0
-50
-10
5 10
Beberapa Bentuk Hubungan
Linear Antara Dua Variabel
r = -0.11, tidak terdapat
hubungan yang kuat
-
6.0
-6 0 6
(6.0)
Beberapa Bentuk Hubungan
Linear Antara Dua Variabel
r = 0.78, terdapat
hubungan positif
-6
0
6
-6 0 6
Beberapa Bentuk Hubungan
Linear Antara Dua Variabel
R = - 0 , 8 4 , t e r da pa t hubunga n
ne ga t i f
-6
0
6
-1 0 -5 0 5 10
Inferensia terhadap Koefisien
Korelasi Populasi Hipotesa :
– Ho: = 0
– Ha: ≠ 0
Interpretasi :– Ho: ada hubungan yang signifikan antara X dan Y
– Ha: tidak ada hubungan yang signifikan antara X dan Y
Inferensia terhadap Koefisien
Korelasi Populasi
𝑡 = 𝑟𝑛 − 2
1 − 𝑟2
𝑡 = 𝑟𝑛−2
1−𝑟2= 0,91
6−2
1−0,83= 4,41
t,db = 2,776
Inferensia terhadap Koefisien
Korelasi Populasi Kesimpulan :
– Tolak Ho Ada hubungan yang signifikan
antara umur kendaraan dengan biaya
perawatannya
– Karena nilai r adalah 0,91 (positif), maka bila
umur kendaraan bertambah, akan
mengakibatkan biaya perawatannya juga akan
meningkat
Inferensia terhadap Koefisien
RegresiHipotesa untuk menguji
signifikansi pengaruh X1 terhadap
Y:– Ho : 1 = 0
– Ha : 1 ≠ 0
T hitung = 1,859 dengan probabilitas0.105
Dengan menggunakan alpha 0.05, maka hipotesa null diterima, artinya tidak ada pengaruh yang signifikan dari X1 terhadap Y
Inferensia terhadap Koefisien
Regresi Hipotesa untuk menguji signifikansi
pengaruh X2 terhadap Y
◦ H0 : 2 = 0
◦ Ha : 2 0
Thitung = 3,511 dengan probabilitas 0,010
Dengan menggunakan alpha 0,05, maka
hipotesa null ditolak, artinya ada pengaruh
yang signifikan dari X2 terhadap Y.
Koefisien Determinasi
b. Dependent Variable: Y
M ode l Summary
Model R R Square
Adjusted
R Square
Std. Error of
the Estimate
1 .854a .729 .651 1.07064
a. Predictors: (Constant), X2, X1
AN OVAb
Model
Sum of
Squares df Mean Square F Sig.1 Regression 21.576 2 10.788 9.411 .010a
Residual 8.024 7 1.146
Total 29.600 9
a. Predictors: (Constant), X2, X1
Persoalan Multicollinearity
Multikolinearitas akan menimbulkanpermasalahan karena :
– Tidak dapat memprediksi Y dengan baik bilaindependent variabel saling berhubungan
– Akan menurunkan derajad signifikansi
hubungan
– Dimungkinkan variabel-variabel yang salingberhubungan sebenarnya menggambarkansatu variabel yang sama
– Kontribusi individual dari tiap variabel sulit
dipisahkan
Kasus
Di bawah ini terdapat data beberapa
variabel :
X1 X2 Y
74 5 28
87 11 33
69 4 21
93 9 40
81 7 38
97 10 46
Kasus 1
Berdasarkan variabel X1 dan Y,
buatlah :
– Analisa regresi sederhana
– Analisa korelasi
Top Related