KORELASI DAN REGRESI

Post on 02-May-2022

11 views 0 download

Transcript of KORELASI DAN REGRESI

KORELASI DAN REGRESI

Tujuan

Setelah mengikuti perkuliahan ini, diharapkan mahasiswa akan memahami :

– Teknik pengolahan data dengan menggunakan analisa regresi sederhana

– Teknik pengolahan data dengan menggunakan analisa korelasi

– Teknik pengolahan data dengan menggunakan analisa regresi berganda

PENDAHULUAN

Gagasan perhitungan ditetapkan oleh Sir Francis Galton

Persamaan regresi : persamaan matematik yang memungkinkan peramalan nilai suatu peubah tak bebas (dependent variable) dari nilai peubah bebas (independent variable)

Diagram pencar = scatter diagram → diagram yang menggambarkan nilai-nilai observasi peubah tak bebas dan peubah bebas.

Nilai peubah bebas ditulis pada sumbu x (sumbu horisontal)

Nilai peubah tak bebas ditulis pada sumbu y (sumbu vertikal)

Nilai peubah tak bebas ditentukan oleh nilai peubah bebas.

Definisi

Regresi Linear sederhana :– Analisis yang digunakan untuk mengestimasi nilai suatu

variabel berdasarkan nilai variabel lainnya

Beda regresi dan korelasi adalah :– Regresi bentuk hubungan antara variabel YANG

MEMPENGARUHI variabel yang lain, atau bentuk

hubungan antara VARIABEL INDEPENDENT terhadap

VARIABEL DEPENDENT

– Korelasi besarnya derajad atau tingkat hubungan dan

arah hubungan antara variabel yang satu dengan variabel

yang lain

Hubungan X dan Y (1)

Kemungkinan hubungan X dan Y :

– Linear searah

– Linear berlawanan

– Curvilinear searah

– Curvilinear berlawanan

– Linear berlawanan dengan lebih menyebar

– Tidak ada hubungan

Hubungan X dan Y (2)

Linear searah Linear berlawanan

arah

Hubungan X dan Y (3)

Curvilinear searahCurvilinear

berlawanan arah

Hubungan X dan Y (4)

Linear berlawanan

arah & menyebarTidak ada

hubungan

Jenis-jenis persamaan regresi

a. Regresi linier

- Regresi linier sederhana

- Regresi linier berganda

b. Regresi non linier

- Regresi eksponensial

Regresi Linear Sederhana

Persamaan Garis Regresi𝑌 = 𝑎 + 𝑏𝑋 → 𝑌 = 𝛽0 + 𝛽1𝑋

Dimana :𝑌 = dependent variabel (peubah tak bebas)

X = independent variabel (peubah bebas)

a = intercept (konstanta)

b = slope (kemiringan)

Metode kuadrat terkecil : untuk menentukan garis estimasi yang terbaik berdasarkan kriteria menghasilkan nilai ∑ei2 yang sekecil mungkin.

Estimasi Koefisien Regresi

𝑏 =𝑆𝑥𝑦

𝑆𝑥𝑥

𝑎 = ത𝑌 − 𝑏 ത𝑋

𝑆𝑥𝑥 = σ 𝑋𝑖 − ത𝑋 2 = σ𝑋𝑖2 −

(σ 𝑋𝑖)2

𝑛

𝑆𝑦𝑦 = σ(𝑌𝑖 − ത𝑌)2= σ𝑌𝑖2 −

(σ 𝑌𝑖)2

𝑛

𝑆𝑥𝑦 = σ 𝑋𝑖 − ത𝑋 𝑌𝑖 − ത𝑌 = σ𝑋𝑖 𝑌𝑖 −(σ 𝑋𝑖)(σ 𝑌𝑖)

𝑛

Contoh Penentuan Koefisien

RegresiBiaya perawatan kendaraan

Umur Kendaraan (tahun) Biaya reparasi (Rp. Juta)

5 3,1

11 4

4 3

5 3,4

3 2,5

2 2

Contoh Penentuan Koefisien

Regresi

No. Umur (X) Biaya (Y) XY X2 Y2

1 5,0 3,1 15,5 25,0 9,61

2 11,0 4,0 44,0 121,0 16,00

3 4,0 3,0 12,0 16,0 9,00

4 5,0 3,4 17,0 25,0 11,56

5 3,0 2,5 7,5 9,0 6,25

6 2,0 2,0 4,0 4,0 4,00

Total 30,0 18,0 100,0 200,0 56,42

Contoh Penentuan Koefisien

Regresi

ҧ𝑥 =30

6= 5 ത𝑦 =

18

6= 3

𝑆𝑥𝑥 = σ 𝑋𝑖 − ത𝑋 2 = σ𝑋𝑖2 −

(σ 𝑋𝑖)2

𝑛= 200 −

30 2

6= 50

𝑆𝑦𝑦 = σ(𝑌𝑖 − ത𝑌)2= σ𝑌𝑖2 −

(σ 𝑌𝑖)2

𝑛= 56,42 −

182

6= 2,42

𝑆𝑥𝑦 = σ 𝑋𝑖 − ത𝑋 𝑌𝑖 − ത𝑌 = σ𝑋𝑖 𝑌𝑖 −(σ 𝑋𝑖)(σ 𝑌𝑖)

𝑛= 100 −

30(18)

6= 10

𝑏 =𝑆𝑥𝑦

𝑆𝑥𝑥=

10

50= 0,2

𝑎 = ത𝑌 − 𝑏 ത𝑋 = 3 – 0,2(5) = 2

Y = 2 + 0,2X

Intercept slope

Standard Error of Estimation (Se)

𝑒𝑖 = 𝑌𝑖 − 𝑌𝑖 = 𝑌𝑖 − 𝑎 − 𝑏𝑋𝑖𝑆𝑆𝐸 = σ𝑒1

2 = 𝑆𝑌𝑌 − (𝑆𝑋𝑌2 /𝑆𝑋𝑋)

𝑆𝑆𝐸 = σ𝑒𝑖2 = 𝑆𝑌𝑌 − (

𝑆𝑋𝑌2

𝑆𝑋𝑋)

𝑆𝑒2 =

𝑆𝑆𝐸

(𝑛−2)

𝑆𝑒 = 𝑆𝑒2

𝑆𝑆𝐸 = σ𝑒𝑖2 = 𝑆𝑌𝑌 − (

𝑆𝑋𝑌2

𝑆𝑋𝑋) = 2,42 −

102

50= 0,42

𝑆𝑒2 =

𝑆𝑆𝐸

(𝑛−2)=

0,42

(6−2)= 0,105

𝑆𝑒 = 𝑆𝑒2 = 0,105 = 0,324

Standard Error of Estimation (Se)

error

Slope

errorerror

Intersep

X

Y

Standard Error of Estimation (Se)

Persamaan garis

hubungan X dan Y menunjukkan hubungan X dan Y

regresi

merupakan estimator yang lebih

akurat untuk menunjukkan

Persamaan

merupakan

kurang

garis

estimator

akurat

regresi

yang

untuk

XX

YY

Analisis Residual

Residual adalah error yang terjadi pada garis regresi

Residual menunjukkan perbedaan antara y prediksi dengan y aktualnya

Tujuan analisis residual adalah untuk menguji sebagian atau seluruh asumsi yang mendasari regresi yaitu :– Model adalah linear

– Suku error mempunyai raians yang konstan

– Semua suku error independen

– Suku error terdistribusi normal

Residual Plot

Non-linear Residual Plot Non-independent Residual

Inferensia terhadap Koefisien

RegresiUji Hipotesa :

Ho : ß1 = 0

Ha : ß1 ≠ 0

Ho : Tidak ada pengaruh yang signifikan

dari X terhadap Y Ha : Ada pengaruh

yang signifikan dari X terhadap Y

Inferensia terhadap Koefisien

Regresi

𝑆𝑏 =𝑆𝑒

𝑆𝑋𝑋𝑡 =

𝑏−𝛽1

𝑆𝑏

𝑆𝑏 =𝑆𝑒

𝑆𝑋𝑋=

0,324

50= 0,046

𝑡 =𝑏−𝛽1

𝑆𝑏=

0,2−0

0,046= 4,35

t0,05/(6-2) = 2,776 < thitung

Kesimpulan : H0 DITOLAK → ada

pengaruh yang signifikan dari umur

kendaraan terhadap biaya perawatan.

Estimasi Interval untuk Slope

Populasib - t/2,db.Sb 1 b + t/2,db.Sb

0,2 – 2,78(0,046) 1 0,2 + 2,78(0,046)

0,072 1 0,329

Estimasi Interval untuk Slope

Populasi Dengan menggunakan tingkat kepercayaan

95%, nilai 1 berkisar antara 0,072 hingga

0,329. Artinya, bila umur kendaraan

bertambah satu tahun, maka biaya

perawatannya akan meningkat antara Rp.

72.000,- hingga Rp. 329.000,-

Koefisien bertanda positif, berarti arah

hubungannya searah.

Koefisien Determinasi

Ukuran ketepatan/kecocokan garis regresi yang dibuat dari hasil estimasi terhadap sekelompok data hasilobservasi

Semakin besar nilai R2, semakin bagus garis regresi yang terbentuk, dansebaliknya

Untuk mengukur proporsi dari jumlah variasi Y yang diterangkan oleh model regresi atau untuk mengukur besar sumbangan variabel X terhadap variasi variabel Y

Nilai R square 0 hingga 1

Koefisien Determinasi

𝑅2 =𝑆𝑋𝑌2

𝑆𝑋𝑋𝑆𝑌𝑌

𝑅2 =𝑆𝑋𝑌2

𝑆𝑋𝑋𝑆𝑌𝑌=

102

50(2,42)= 0,83

Output SPSS

Coefficientsa

Model

Unstand

Coeffi

B

ardized

cients

Std. Error

Standardized

Coefficients

Beta t Sig.

1 (Constant) 2.000 .265 7.559 .002

Umur Kendaraan .200 .046 .909 4.364 .012

a. Dependent Variable: Biaya Reparasi

Slope (b)=0.2Intersep

(a)=2

Sb= 0.046Inferensia

terhadap slope

Output SPSS

Model Summary

Model R R Square

Adjusted

R Square

Std. Error of

the Estimate

1 .909a .826 .783 .32404

a. Predictors: (Constant), Umur Kendaraan

Koefisien Determinasi= 0.826Se=0.3204

Output SPSS

ANOVAb

Model

Sum of

Squares df Mean Square F Sig.

1 Regression 2.000 1 2.000 19.048 .012a

Residual .420 4 .105

Total 2.420 5

a. Predictors: (Constant), Umur Kendaraan

b. Dependent Variable: Biaya Reparasi

SSE =0.42 Se2 = 0.105

Koefisien Korelasi

Koefisien korelasi (r) : ukuran hubungan linier peubah x dan y

Besaran yg tidak punya satuan

Nilai r terletak antara -1 hingga 1

Tanda koef. Korelasi menunjukkan arahhubungan

Nilai r yang (+) ditandai oleh nilai b yang (+)

Nilai r yang (-) ditandai oleh nilai b yang (-)

Hanya mencerminkan keeratan hubungan linear dari dua variabel yang terlibat

Bersifat simetris (bolak-balik)

Variabel yang terlibat tidak harus dependentdan independent

Koefisien Korelasi

Jika nilai r mendekati +1 atau r mendekati -1 maka x dan y memiliki korelasi linier yang tinggi.

Jika nilai r = +1 atau r = -1 maka x dan y memiliki korelasi linier sempurna

Jika nilai r = 0 maka x dan y tidak memiliki relasi (hubungan) linier (dalam kasus r mendekati 0, anda dapat melanjutkan analisis ke regresi eksponensial.

Koefisien determinasi sampel = R = r2

Ukuran proporsi keragaman total nilai peubah y yang dapat dijelaskan oleh nilai peubah x melalui hubungan linier.

Koefisien Korelasi

𝑅2 =𝑆𝑋𝑌2

𝑆𝑋𝑋𝑆𝑌𝑌

𝑅2 =𝑆𝑋𝑌2

𝑆𝑋𝑋𝑆𝑌𝑌=

102

50(2,42)= 0,83

𝑟 = 𝑅2

𝑟 = 𝑅2 = 0,83 = 0,91

Output SPSS

Co rr e lat io ns

Umur

Kendaraan

Biaya

Reparasi

Umur Kenda raan Pearson Correlat ion 1 .909*

Sig. (2-tai led) . . 012

N 6 6

Biaya Reparas i Pearson Correlat ion .909* 1

Sig. (2-tai led) .012 .

N 6 6

*. Correlat ion is s ignif icant a t the 0.05 level (2-tai led).

Beberapa Bentuk Hubungan

Linear Antara Dua Variabel

r = + 1 , berhub ungan posit if

sempurna

-4

-6

-2

6

4

2

0

-1 0 -5 0 5 1 0

Beberapa Bentuk Hubungan

Linear Antara Dua Variabel

r = - 1, berhubungan

negatif sempurna

10

5

-10 -5

0

-50

-10

5 10

Beberapa Bentuk Hubungan

Linear Antara Dua Variabel

r = -0.11, tidak terdapat

hubungan yang kuat

-

6.0

-6 0 6

(6.0)

Beberapa Bentuk Hubungan

Linear Antara Dua Variabel

r = 0.78, terdapat

hubungan positif

-6

0

6

-6 0 6

Beberapa Bentuk Hubungan

Linear Antara Dua Variabel

R = - 0 , 8 4 , t e r da pa t hubunga n

ne ga t i f

-6

0

6

-1 0 -5 0 5 10

Inferensia terhadap Koefisien

Korelasi Populasi Hipotesa :

– Ho: = 0

– Ha: ≠ 0

Interpretasi :– Ho: ada hubungan yang signifikan antara X dan Y

– Ha: tidak ada hubungan yang signifikan antara X dan Y

Inferensia terhadap Koefisien

Korelasi Populasi

𝑡 = 𝑟𝑛 − 2

1 − 𝑟2

𝑡 = 𝑟𝑛−2

1−𝑟2= 0,91

6−2

1−0,83= 4,41

t,db = 2,776

Inferensia terhadap Koefisien

Korelasi Populasi Kesimpulan :

– Tolak Ho Ada hubungan yang signifikan

antara umur kendaraan dengan biaya

perawatannya

– Karena nilai r adalah 0,91 (positif), maka bila

umur kendaraan bertambah, akan

mengakibatkan biaya perawatannya juga akan

meningkat

Inferensia terhadap Koefisien

RegresiHipotesa untuk menguji

signifikansi pengaruh X1 terhadap

Y:– Ho : 1 = 0

– Ha : 1 ≠ 0

T hitung = 1,859 dengan probabilitas0.105

Dengan menggunakan alpha 0.05, maka hipotesa null diterima, artinya tidak ada pengaruh yang signifikan dari X1 terhadap Y

Inferensia terhadap Koefisien

Regresi Hipotesa untuk menguji signifikansi

pengaruh X2 terhadap Y

◦ H0 : 2 = 0

◦ Ha : 2 0

Thitung = 3,511 dengan probabilitas 0,010

Dengan menggunakan alpha 0,05, maka

hipotesa null ditolak, artinya ada pengaruh

yang signifikan dari X2 terhadap Y.

Koefisien Determinasi

b. Dependent Variable: Y

M ode l Summary

Model R R Square

Adjusted

R Square

Std. Error of

the Estimate

1 .854a .729 .651 1.07064

a. Predictors: (Constant), X2, X1

AN OVAb

Model

Sum of

Squares df Mean Square F Sig.1 Regression 21.576 2 10.788 9.411 .010a

Residual 8.024 7 1.146

Total 29.600 9

a. Predictors: (Constant), X2, X1

Persoalan Multicollinearity

Multikolinearitas akan menimbulkanpermasalahan karena :

– Tidak dapat memprediksi Y dengan baik bilaindependent variabel saling berhubungan

– Akan menurunkan derajad signifikansi

hubungan

– Dimungkinkan variabel-variabel yang salingberhubungan sebenarnya menggambarkansatu variabel yang sama

– Kontribusi individual dari tiap variabel sulit

dipisahkan

Kasus

Di bawah ini terdapat data beberapa

variabel :

X1 X2 Y

74 5 28

87 11 33

69 4 21

93 9 40

81 7 38

97 10 46

Kasus 1

Berdasarkan variabel X1 dan Y,

buatlah :

– Analisa regresi sederhana

– Analisa korelasi