Download - KORELASI DAN REGRESI

Transcript
Page 1: KORELASI DAN REGRESI

KORELASI DAN REGRESI

Page 2: KORELASI DAN REGRESI

Tujuan

Setelah mengikuti perkuliahan ini, diharapkan mahasiswa akan memahami :

– Teknik pengolahan data dengan menggunakan analisa regresi sederhana

– Teknik pengolahan data dengan menggunakan analisa korelasi

– Teknik pengolahan data dengan menggunakan analisa regresi berganda

Page 3: KORELASI DAN REGRESI

PENDAHULUAN

Gagasan perhitungan ditetapkan oleh Sir Francis Galton

Persamaan regresi : persamaan matematik yang memungkinkan peramalan nilai suatu peubah tak bebas (dependent variable) dari nilai peubah bebas (independent variable)

Diagram pencar = scatter diagram → diagram yang menggambarkan nilai-nilai observasi peubah tak bebas dan peubah bebas.

Nilai peubah bebas ditulis pada sumbu x (sumbu horisontal)

Nilai peubah tak bebas ditulis pada sumbu y (sumbu vertikal)

Nilai peubah tak bebas ditentukan oleh nilai peubah bebas.

Page 4: KORELASI DAN REGRESI

Definisi

Regresi Linear sederhana :– Analisis yang digunakan untuk mengestimasi nilai suatu

variabel berdasarkan nilai variabel lainnya

Beda regresi dan korelasi adalah :– Regresi bentuk hubungan antara variabel YANG

MEMPENGARUHI variabel yang lain, atau bentuk

hubungan antara VARIABEL INDEPENDENT terhadap

VARIABEL DEPENDENT

– Korelasi besarnya derajad atau tingkat hubungan dan

arah hubungan antara variabel yang satu dengan variabel

yang lain

Page 5: KORELASI DAN REGRESI

Hubungan X dan Y (1)

Kemungkinan hubungan X dan Y :

– Linear searah

– Linear berlawanan

– Curvilinear searah

– Curvilinear berlawanan

– Linear berlawanan dengan lebih menyebar

– Tidak ada hubungan

Page 6: KORELASI DAN REGRESI

Hubungan X dan Y (2)

Linear searah Linear berlawanan

arah

Page 7: KORELASI DAN REGRESI

Hubungan X dan Y (3)

Curvilinear searahCurvilinear

berlawanan arah

Page 8: KORELASI DAN REGRESI

Hubungan X dan Y (4)

Linear berlawanan

arah & menyebarTidak ada

hubungan

Page 9: KORELASI DAN REGRESI

Jenis-jenis persamaan regresi

a. Regresi linier

- Regresi linier sederhana

- Regresi linier berganda

b. Regresi non linier

- Regresi eksponensial

Page 10: KORELASI DAN REGRESI

Regresi Linear Sederhana

Persamaan Garis Regresi𝑌 = 𝑎 + 𝑏𝑋 → 𝑌 = 𝛽0 + 𝛽1𝑋

Dimana :𝑌 = dependent variabel (peubah tak bebas)

X = independent variabel (peubah bebas)

a = intercept (konstanta)

b = slope (kemiringan)

Metode kuadrat terkecil : untuk menentukan garis estimasi yang terbaik berdasarkan kriteria menghasilkan nilai ∑ei2 yang sekecil mungkin.

Page 11: KORELASI DAN REGRESI

Estimasi Koefisien Regresi

𝑏 =𝑆𝑥𝑦

𝑆𝑥𝑥

𝑎 = ത𝑌 − 𝑏 ത𝑋

𝑆𝑥𝑥 = σ 𝑋𝑖 − ത𝑋 2 = σ𝑋𝑖2 −

(σ 𝑋𝑖)2

𝑛

𝑆𝑦𝑦 = σ(𝑌𝑖 − ത𝑌)2= σ𝑌𝑖2 −

(σ 𝑌𝑖)2

𝑛

𝑆𝑥𝑦 = σ 𝑋𝑖 − ത𝑋 𝑌𝑖 − ത𝑌 = σ𝑋𝑖 𝑌𝑖 −(σ 𝑋𝑖)(σ 𝑌𝑖)

𝑛

Page 12: KORELASI DAN REGRESI

Contoh Penentuan Koefisien

RegresiBiaya perawatan kendaraan

Umur Kendaraan (tahun) Biaya reparasi (Rp. Juta)

5 3,1

11 4

4 3

5 3,4

3 2,5

2 2

Page 13: KORELASI DAN REGRESI

Contoh Penentuan Koefisien

Regresi

No. Umur (X) Biaya (Y) XY X2 Y2

1 5,0 3,1 15,5 25,0 9,61

2 11,0 4,0 44,0 121,0 16,00

3 4,0 3,0 12,0 16,0 9,00

4 5,0 3,4 17,0 25,0 11,56

5 3,0 2,5 7,5 9,0 6,25

6 2,0 2,0 4,0 4,0 4,00

Total 30,0 18,0 100,0 200,0 56,42

Page 14: KORELASI DAN REGRESI

Contoh Penentuan Koefisien

Regresi

ҧ𝑥 =30

6= 5 ത𝑦 =

18

6= 3

𝑆𝑥𝑥 = σ 𝑋𝑖 − ത𝑋 2 = σ𝑋𝑖2 −

(σ 𝑋𝑖)2

𝑛= 200 −

30 2

6= 50

𝑆𝑦𝑦 = σ(𝑌𝑖 − ത𝑌)2= σ𝑌𝑖2 −

(σ 𝑌𝑖)2

𝑛= 56,42 −

182

6= 2,42

𝑆𝑥𝑦 = σ 𝑋𝑖 − ത𝑋 𝑌𝑖 − ത𝑌 = σ𝑋𝑖 𝑌𝑖 −(σ 𝑋𝑖)(σ 𝑌𝑖)

𝑛= 100 −

30(18)

6= 10

𝑏 =𝑆𝑥𝑦

𝑆𝑥𝑥=

10

50= 0,2

𝑎 = ത𝑌 − 𝑏 ത𝑋 = 3 – 0,2(5) = 2

Y = 2 + 0,2X

Intercept slope

Page 15: KORELASI DAN REGRESI

Standard Error of Estimation (Se)

𝑒𝑖 = 𝑌𝑖 − 𝑌𝑖 = 𝑌𝑖 − 𝑎 − 𝑏𝑋𝑖𝑆𝑆𝐸 = σ𝑒1

2 = 𝑆𝑌𝑌 − (𝑆𝑋𝑌2 /𝑆𝑋𝑋)

𝑆𝑆𝐸 = σ𝑒𝑖2 = 𝑆𝑌𝑌 − (

𝑆𝑋𝑌2

𝑆𝑋𝑋)

𝑆𝑒2 =

𝑆𝑆𝐸

(𝑛−2)

𝑆𝑒 = 𝑆𝑒2

𝑆𝑆𝐸 = σ𝑒𝑖2 = 𝑆𝑌𝑌 − (

𝑆𝑋𝑌2

𝑆𝑋𝑋) = 2,42 −

102

50= 0,42

𝑆𝑒2 =

𝑆𝑆𝐸

(𝑛−2)=

0,42

(6−2)= 0,105

𝑆𝑒 = 𝑆𝑒2 = 0,105 = 0,324

Page 16: KORELASI DAN REGRESI

Standard Error of Estimation (Se)

error

Slope

errorerror

Intersep

X

Y

Page 17: KORELASI DAN REGRESI

Standard Error of Estimation (Se)

Persamaan garis

hubungan X dan Y menunjukkan hubungan X dan Y

regresi

merupakan estimator yang lebih

akurat untuk menunjukkan

Persamaan

merupakan

kurang

garis

estimator

akurat

regresi

yang

untuk

XX

YY

Page 18: KORELASI DAN REGRESI

Analisis Residual

Residual adalah error yang terjadi pada garis regresi

Residual menunjukkan perbedaan antara y prediksi dengan y aktualnya

Tujuan analisis residual adalah untuk menguji sebagian atau seluruh asumsi yang mendasari regresi yaitu :– Model adalah linear

– Suku error mempunyai raians yang konstan

– Semua suku error independen

– Suku error terdistribusi normal

Page 19: KORELASI DAN REGRESI

Residual Plot

Non-linear Residual Plot Non-independent Residual

Page 20: KORELASI DAN REGRESI

Inferensia terhadap Koefisien

RegresiUji Hipotesa :

Ho : ß1 = 0

Ha : ß1 ≠ 0

Ho : Tidak ada pengaruh yang signifikan

dari X terhadap Y Ha : Ada pengaruh

yang signifikan dari X terhadap Y

Page 21: KORELASI DAN REGRESI

Inferensia terhadap Koefisien

Regresi

𝑆𝑏 =𝑆𝑒

𝑆𝑋𝑋𝑡 =

𝑏−𝛽1

𝑆𝑏

𝑆𝑏 =𝑆𝑒

𝑆𝑋𝑋=

0,324

50= 0,046

𝑡 =𝑏−𝛽1

𝑆𝑏=

0,2−0

0,046= 4,35

t0,05/(6-2) = 2,776 < thitung

Kesimpulan : H0 DITOLAK → ada

pengaruh yang signifikan dari umur

kendaraan terhadap biaya perawatan.

Page 22: KORELASI DAN REGRESI

Estimasi Interval untuk Slope

Populasib - t/2,db.Sb 1 b + t/2,db.Sb

0,2 – 2,78(0,046) 1 0,2 + 2,78(0,046)

0,072 1 0,329

Page 23: KORELASI DAN REGRESI

Estimasi Interval untuk Slope

Populasi Dengan menggunakan tingkat kepercayaan

95%, nilai 1 berkisar antara 0,072 hingga

0,329. Artinya, bila umur kendaraan

bertambah satu tahun, maka biaya

perawatannya akan meningkat antara Rp.

72.000,- hingga Rp. 329.000,-

Koefisien bertanda positif, berarti arah

hubungannya searah.

Page 24: KORELASI DAN REGRESI

Koefisien Determinasi

Ukuran ketepatan/kecocokan garis regresi yang dibuat dari hasil estimasi terhadap sekelompok data hasilobservasi

Semakin besar nilai R2, semakin bagus garis regresi yang terbentuk, dansebaliknya

Untuk mengukur proporsi dari jumlah variasi Y yang diterangkan oleh model regresi atau untuk mengukur besar sumbangan variabel X terhadap variasi variabel Y

Nilai R square 0 hingga 1

Page 25: KORELASI DAN REGRESI

Koefisien Determinasi

𝑅2 =𝑆𝑋𝑌2

𝑆𝑋𝑋𝑆𝑌𝑌

𝑅2 =𝑆𝑋𝑌2

𝑆𝑋𝑋𝑆𝑌𝑌=

102

50(2,42)= 0,83

Page 26: KORELASI DAN REGRESI

Output SPSS

Coefficientsa

Model

Unstand

Coeffi

B

ardized

cients

Std. Error

Standardized

Coefficients

Beta t Sig.

1 (Constant) 2.000 .265 7.559 .002

Umur Kendaraan .200 .046 .909 4.364 .012

a. Dependent Variable: Biaya Reparasi

Slope (b)=0.2Intersep

(a)=2

Sb= 0.046Inferensia

terhadap slope

Page 27: KORELASI DAN REGRESI

Output SPSS

Model Summary

Model R R Square

Adjusted

R Square

Std. Error of

the Estimate

1 .909a .826 .783 .32404

a. Predictors: (Constant), Umur Kendaraan

Koefisien Determinasi= 0.826Se=0.3204

Page 28: KORELASI DAN REGRESI

Output SPSS

ANOVAb

Model

Sum of

Squares df Mean Square F Sig.

1 Regression 2.000 1 2.000 19.048 .012a

Residual .420 4 .105

Total 2.420 5

a. Predictors: (Constant), Umur Kendaraan

b. Dependent Variable: Biaya Reparasi

SSE =0.42 Se2 = 0.105

Page 29: KORELASI DAN REGRESI

Koefisien Korelasi

Koefisien korelasi (r) : ukuran hubungan linier peubah x dan y

Besaran yg tidak punya satuan

Nilai r terletak antara -1 hingga 1

Tanda koef. Korelasi menunjukkan arahhubungan

Nilai r yang (+) ditandai oleh nilai b yang (+)

Nilai r yang (-) ditandai oleh nilai b yang (-)

Hanya mencerminkan keeratan hubungan linear dari dua variabel yang terlibat

Bersifat simetris (bolak-balik)

Variabel yang terlibat tidak harus dependentdan independent

Page 30: KORELASI DAN REGRESI

Koefisien Korelasi

Jika nilai r mendekati +1 atau r mendekati -1 maka x dan y memiliki korelasi linier yang tinggi.

Jika nilai r = +1 atau r = -1 maka x dan y memiliki korelasi linier sempurna

Jika nilai r = 0 maka x dan y tidak memiliki relasi (hubungan) linier (dalam kasus r mendekati 0, anda dapat melanjutkan analisis ke regresi eksponensial.

Koefisien determinasi sampel = R = r2

Ukuran proporsi keragaman total nilai peubah y yang dapat dijelaskan oleh nilai peubah x melalui hubungan linier.

Page 31: KORELASI DAN REGRESI

Koefisien Korelasi

𝑅2 =𝑆𝑋𝑌2

𝑆𝑋𝑋𝑆𝑌𝑌

𝑅2 =𝑆𝑋𝑌2

𝑆𝑋𝑋𝑆𝑌𝑌=

102

50(2,42)= 0,83

𝑟 = 𝑅2

𝑟 = 𝑅2 = 0,83 = 0,91

Page 32: KORELASI DAN REGRESI

Output SPSS

Co rr e lat io ns

Umur

Kendaraan

Biaya

Reparasi

Umur Kenda raan Pearson Correlat ion 1 .909*

Sig. (2-tai led) . . 012

N 6 6

Biaya Reparas i Pearson Correlat ion .909* 1

Sig. (2-tai led) .012 .

N 6 6

*. Correlat ion is s ignif icant a t the 0.05 level (2-tai led).

Page 33: KORELASI DAN REGRESI

Beberapa Bentuk Hubungan

Linear Antara Dua Variabel

r = + 1 , berhub ungan posit if

sempurna

-4

-6

-2

6

4

2

0

-1 0 -5 0 5 1 0

Page 34: KORELASI DAN REGRESI

Beberapa Bentuk Hubungan

Linear Antara Dua Variabel

r = - 1, berhubungan

negatif sempurna

10

5

-10 -5

0

-50

-10

5 10

Page 35: KORELASI DAN REGRESI

Beberapa Bentuk Hubungan

Linear Antara Dua Variabel

r = -0.11, tidak terdapat

hubungan yang kuat

-

6.0

-6 0 6

(6.0)

Page 36: KORELASI DAN REGRESI

Beberapa Bentuk Hubungan

Linear Antara Dua Variabel

r = 0.78, terdapat

hubungan positif

-6

0

6

-6 0 6

Page 37: KORELASI DAN REGRESI

Beberapa Bentuk Hubungan

Linear Antara Dua Variabel

R = - 0 , 8 4 , t e r da pa t hubunga n

ne ga t i f

-6

0

6

-1 0 -5 0 5 10

Page 38: KORELASI DAN REGRESI

Inferensia terhadap Koefisien

Korelasi Populasi Hipotesa :

– Ho: = 0

– Ha: ≠ 0

Interpretasi :– Ho: ada hubungan yang signifikan antara X dan Y

– Ha: tidak ada hubungan yang signifikan antara X dan Y

Page 39: KORELASI DAN REGRESI

Inferensia terhadap Koefisien

Korelasi Populasi

𝑡 = 𝑟𝑛 − 2

1 − 𝑟2

𝑡 = 𝑟𝑛−2

1−𝑟2= 0,91

6−2

1−0,83= 4,41

t,db = 2,776

Page 40: KORELASI DAN REGRESI

Inferensia terhadap Koefisien

Korelasi Populasi Kesimpulan :

– Tolak Ho Ada hubungan yang signifikan

antara umur kendaraan dengan biaya

perawatannya

– Karena nilai r adalah 0,91 (positif), maka bila

umur kendaraan bertambah, akan

mengakibatkan biaya perawatannya juga akan

meningkat

Page 41: KORELASI DAN REGRESI

Inferensia terhadap Koefisien

RegresiHipotesa untuk menguji

signifikansi pengaruh X1 terhadap

Y:– Ho : 1 = 0

– Ha : 1 ≠ 0

T hitung = 1,859 dengan probabilitas0.105

Dengan menggunakan alpha 0.05, maka hipotesa null diterima, artinya tidak ada pengaruh yang signifikan dari X1 terhadap Y

Page 42: KORELASI DAN REGRESI

Inferensia terhadap Koefisien

Regresi Hipotesa untuk menguji signifikansi

pengaruh X2 terhadap Y

◦ H0 : 2 = 0

◦ Ha : 2 0

Thitung = 3,511 dengan probabilitas 0,010

Dengan menggunakan alpha 0,05, maka

hipotesa null ditolak, artinya ada pengaruh

yang signifikan dari X2 terhadap Y.

Page 43: KORELASI DAN REGRESI

Koefisien Determinasi

b. Dependent Variable: Y

M ode l Summary

Model R R Square

Adjusted

R Square

Std. Error of

the Estimate

1 .854a .729 .651 1.07064

a. Predictors: (Constant), X2, X1

AN OVAb

Model

Sum of

Squares df Mean Square F Sig.1 Regression 21.576 2 10.788 9.411 .010a

Residual 8.024 7 1.146

Total 29.600 9

a. Predictors: (Constant), X2, X1

Page 44: KORELASI DAN REGRESI

Persoalan Multicollinearity

Multikolinearitas akan menimbulkanpermasalahan karena :

– Tidak dapat memprediksi Y dengan baik bilaindependent variabel saling berhubungan

– Akan menurunkan derajad signifikansi

hubungan

– Dimungkinkan variabel-variabel yang salingberhubungan sebenarnya menggambarkansatu variabel yang sama

– Kontribusi individual dari tiap variabel sulit

dipisahkan

Page 45: KORELASI DAN REGRESI

Kasus

Di bawah ini terdapat data beberapa

variabel :

X1 X2 Y

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

Page 46: KORELASI DAN REGRESI

Kasus 1

Berdasarkan variabel X1 dan Y,

buatlah :

– Analisa regresi sederhana

– Analisa korelasi