Bab 13 dan bab 14

38
REGRESI LINIER dalam NOTASI MATRIKS REGRESI & KORELASI: BERGANDA & PARSIAL Oleh Siti Choirun Nisak

Transcript of Bab 13 dan bab 14

REGRESI LINIER dalam NOTASI MATRIKS

REGRESI & KORELASI:BERGANDA & PARSIAL

Oleh

Siti Choirun Nisak

REGRESI LINIER dalam NOTASI MATRIKS

Oleh

Siti Choirun Nisak

PENDAHULUAN

APA ITU REGRESI ?

BAGAIMANA BENTUK MODELNYA DALAM MATRIKS

BAGAIMANA CARA PENDUGAAN MENGGUNAKAN MATRIKS

Model dan Penduga Kuadrat Terkecil

MODEL REGRESI LINIER SEDEHANA dengan SATU PEUBAH X

iii XY 10

Y adalah variabel tidak bebasXi adalah variabel bebas, dengan i = 1, 2, 3, ... , n; β0 dan β1 adalah parameter – parameter yang tidak diketahui; εi adalah error (kesalahan penggangu).

Model dan Penduga Kuadrat TerkecilεXβY

nY

YY

2

1

nX

XX

1

11

2

1

1

0

n

2

1

Y adalah vektor kolom berukuran n x 1 (n baris dan 1 kolom)X adalah matriks berukuran n x 2 (n baris 2 kolom) β adalah vektor kolom berukuran 2 x 1 (2 baris dan 1 kolom) ε adalah vektor kolom berukuran n x 1

Model dan Penduga Kuadrat Terkecil

εXβY

10

2

1

Pendugaan parameter tersebut dilakukan dengan menggunakan Metode Kuadrat Terkecil error (Ordinary Least Square), sehingga diperoleh penduga parameter dalam bentuk matrik berikut,

Contoh pada data Leghron Putih yang telah dibahas pada bab 10 pada table 10.1

4.94

1.931.87

1.51

1.516.41

1

0

YXXXb TT 1)(

Contoh pada Tabel 10.1 matrik X’X berukuran 2x2, sedangkan X’Y matrik berukuran 2x1. Untuk data table 10.1,

2'

ii

i

XXXnXX

ii

i

YXYYX '

nXXX

XXn i

ii

ii

2

221'

)(1)( XX Bersifat non singular

65104167.02421875.32421875.324609375.16

108.498.4954.249

04.24804.24951)( 1'XX

Sehingga diperoleh nilai duga parameter untuk data Leghron Putih sebagi berikut:

69.726.55

10.46716.935

65104167.02421875.32421875.324609375.16)( '1' XXXX

Nilai duga itu ternyata sama dengan yang diperoleh pada bab 10. sehingga model regresi dapat dituliskan,

iXY 169.726.55Interpretasi model :setiap kenaikan 1 satuan variabel bobot badan maka akan meningkatkan besarnya konsumsi pangan sebesar 7.69 satuan.

Analisis Ragam regresi linier sederhana

Analisis ragam dalam regresi disajikan dengan menggunakan uji F dengan hipotesis uji sebagai berikut :

H0 : βi = 0 dan H1 : βi ≠ 0

Simpangan Baku, Selang Kepercayaan dan Uji Hipotesis bagi Koefisien

RegresiDengan pendekatan matrik, matrik ragam peragam bagi adalah

Dimana nilai diduga dengan simpangan baku

Simpangan Baku, Selang Kepercayaan dan Uji Hipotesis bagi Koefisien

RegresiUntuk menguji tiap – tiap koefisien pada model regresi maka digunakan uji t. Dengan melakukan pengujian terhadap hipotesis nol (H0) yang menyatakan bahwa

H0 : βi = 0 dan hipotesis alternative H1 = βi ≠ 0

)( i

iihitung V

bt

Simpangan Baku, Selang Kepercayaan dan Uji Hipotesis bagi Koefisien

RegresiUji Parsial pada kasus Leghron putih,

H0 : β1 = 0 dan hipotesis alternative H1 = β1 ≠ 0

Karena t hitung > t tabel (2.262) maka Ho ditolak.Jadi dapat disimpulkan bahwa bobot badan (X) berpengaruh nyata terhadap konsumsi pangan (Y) pada data Leghron Putih .

**03.46433.369.7

hitungt

Peramalan dengan notasi matrik

Peramalan dengan notasi matrik

Peubah Indikator atau BinerPerhatikan dua contoh bebas dengan ragam homogeny dan hopotesis nol bahwa nilai tengah keduanya sama. Lihat data pada table 5.2, persamaan bagi model dengan menggunakan analisis ragam yang di dekati dengan analisis regresi dalam matrik adalah,

Dituliskan dalam bentuk matrik,

Peubah Indikator atau Biner

Kolom matrik X adalah indicator atau dummy variable sehingga bersifat singular. Untuk menduga parameter yaitu dengan mengeliminasi kolom X dan membuat parameter baru, dapat dituliskan,

Peubah Indikator atau Biner

Contoh kasus pada Bab 5, tabel 5.2, dapat di definisikan dalam matrik regresi berikut,

2.59

2.642.53

8.57

Y

01

0111

11

X

77

713'XX

)6(7676/16/16/1

)( 1'XX

04.525.61)(ˆ

ˆˆ '1'

1

0 YXXX

REGRESI & KORELASI:BERGANDA & PARSIAL

Oleh

Siti Choirun Nisak

PENDAHULUANAnalisa regresi dan korelasi sederhana membahas tentang keterkaitan antara sebuah variabel (variabel terikat/dependen) dengan (sebuah) variabel lain (variabel bebas/independen).

Regresi untuk menentukan bentuk persamaan yang akan digunakan untuk meramal (predict) rerata Y melalui X.

Korelasi: pengukuran mengenai derajat keeratan antara dua variabelnya yang bergantung pada pola variasi atau interrelasi yang dapat bersifat simultan.

Dalam bab ini akan dibahas Korelasi atau asosiasi (hubungan antara variabelvariabel) yang diminati pada analisis regresi berganda.

Persamaan Linier dan Interpretasinya dalam Lebih dari Dua Dimensi

Persamaan 14.1 berupa sebuah bidang dalam ruang berdimensi tiga, dapat ditulis persamaannya sebagai berikut,

Y = b0 + b1X1 + b2X2

Berikut titik yang diplotkan memiliki koordinat sebagai berikut,

Titik X1 X2 Y

1 10 2 11

2 10 4 7

3 10 6 3

4 20 2 14

5 20 4 10

6 20 6 6

7 30 2 17

8 30 4 13

9 30 6 9

Diperoleh persamaan regresi Y = 12 + 0.3X1 - 2X2 . kedua titik X1 dan X2 akan membentuk kemiringan yang sama terhadap Y, namun kemiringan tersebut tidak harus sama. Kedua sifat tersebut berhubungan dengan koefisien regresi parsial.

Regresi Linier Berganda, Parsial dan Simultan

persamaan regresi dituliskan sebagai berikut:

Dimana adalah nilai harapan populai Yuntuk gugus X tertentu.

Bilamana analisis regresi diperoleh dari sampel populasi, maka Model untuk regresi linier berganda diberikan sebagai berikut:

Persamaan tersebut dapat dituliskan ,

Regresi Linier Berganda, Parsial dan Simultan

di mana Y adalah variabel tak bebas (dependen), X adalah variabel bebas (independen), dan adalah residual, sedangkan indeks k pada variabel bebas adalah untuk mengidentifikasi variabel yang bersangkutan. Jumlah dari variabel penjelas adalah k.sedangkan adalah koefisien regresi parsial.

Contoh Persamaan Regresi Linier Berganda

Persamaan regresi bergandadalam notasi matriks bisa dituliskan ,εXβY

1

2

1

11

1

0

11

212

111

1

2

1

,,

1

11

,

TTkkkTkTT

k

k

TT XX

XXXX

Y

YY

εβXY

Prinsip dasar dari metode kuadrat terkecil adalah meminimumkan jumlah kuadrat residual, sehingga diperoleh nilai duga parameter,

Contoh Persamaan Regresi Linier Berganda

Agar dapat dicari penduga parameter, maka matrik X’X harus non singular.

kiikiikiki

kiiiiii

kiii

XXXXXX

XXXXXXXXXn

221

12112

1

21

XX'

iki

ii

i

YX

YXY

1'YX

Regresi Linier Berganda, Dua Variabel Independen

Misalnya jika terdapat data dengan variable bebas, X1 presentasi nitrogen, X2 klor dan X3 kalium dengan variable respon Y adalah log lamanya daun terbakar dalam detik yang berasala dari 30 sampel tembakau yang diambil langsung dari petani. . Langkah perhitungannya1.Hitung jumlah, jumlah kuadrat, dan jumlah hasil kali data tersebut.2.Susun matrik X, X’X, X’Y dan persamaan normal nya

28996.052855.0)(ˆ

ˆˆ '1'

2

1 YXXX

Regresi Linier Berganda, Dua Variabel Independen

3. Menghitung JK model, JK regresi dan JK sisa yang diringkas pada tabel ANOVA regresi berikut,

UJI SIGNIFIKANSI: Uji tHipotesisH0: i = 0Ha: i 0

Statistik Uji

Aturan PenolakanTolak H0 jika t < -t/2 atau t > t /2

dimana t/2 didasarkan pada distribusi t dengan derajat bebas n – p – 1.

ib

isbt

Uji Parsial

H0 : β1 = 0 dan hipotesis alternative H1 = β1 ≠ 0

Uji hipotesis tiap koefisien

**45.5009401717.052855.0

1

1

sbbthitung

H0 : β2 = 0 dan hipotesis alternative H1 = β2 ≠ 0

**11.3008715337.028996.0

2

2

sbbthitung

Korelasi Parsial dan GandaUntuk menghitung koefisien korelasi parsial, pertama definisikan R sebagai matrik korelasi sederhana antara k peubah X1,…,Xk,

1..................

...1

...1

321

122321

11312

kkk

k

rrr

rrrrrr

R

kkkkk

k

k

CCCC

CCCCCCCC

CR

..................

...

...

321

2232221

1131211

1

Sehingga koefisien korelasi parsial antara Xi dan Yj , jjii

ijij CC

Cr

Korelasi matrik X1,X2, dan Y pada table 14.2 diberikan padamatrik berikut,

Dengan demikian diperoleh,

Untuk menguji koefisien korelasi tersebut digunakan statistic uji t dengan rumus,

1499638.0717729.0499638.01209400.0717729.0209400.01

R

956151.0349346.0613105.0349346.0484865.0149205.0613105.0149205.0750361.0

1 CR

723829.0)956151.0(750361.0

613105.02.1

Yr 513076.0

)956151.0(484865.0349346.0

1.2

Yr

21 rknrthitung

**11.3

513076.0(127513076.0

hitungt

Koefisien korelasi ganda, RY.1,…,k, mengukur keeratan hubungan antara dua atau lebih variable bebas secara bersama-sama dengan suatu variable terikat. Koefisien korelasi ganda didefinikan dengan rumus,

Untuk data tembakau dengan anggapan hanya ada X1 dan X2 saja,

)()(

,...,1. totalJKregresiJKR kY

8017.068952.629985.4

)()(

12. totalJK

regresiJKRY

Regresi Linier Berganda, Contoh Lebih LanjutDengan mempertimbangkan adanya interaksi antar peubah X

untuk data tembakau 14.1, disini Y akan dihubungkan dengan X1 nitrogen, X2 Klor, dan X3 potasium, dan pengaruh dari nitrogen-klor X1X2 yang disebut sifat interaksi, maka model

Peningatan satu unit X2 akan berpengaruh meningkatnya dalam memprediksi Y. Adanya interaksi antara X1 dan X2 menyebabkan X2 tidak bebas pada level X1.

Pendugaan parameter dilakukan dengan menggunakan SAS PROC REG, diperoleh tabel General Linier Model Procedure pada output 14.1 halaman 340.

Regresi Linier Berganda, Contoh Lebih Lanjut

Pada output tersebut diperoleh tabel ANOVA penduga regresi, kolom PARTIAL SS diperoleh jumlah kuadrat masing-masing X dan JK secara simultan. Dengan statistik uji F disimpulkan bahwa semua X penting bagi regresi ini. Jadi tidak perlu mempertimbangkan adanya X yang harus dibuang.

Lain-lain

Prosedur pada bab ini dapat dikembangkan dalam model polynomial yang linier dalam parameter tetapi tidak linier dalam peubahnya. Persamaan polynom tersebut digambarkan,

gugus menjadi kemungkinan bahwa perubahan linier dalam Y yang diakibatkan oleh perubahan satu satuan dalam X1 yang bergantung pada nilai X2. Gagalnya perubahan linier itu tetap menunjukkan interaksi. Pernyataan diatas bersifat setangkup dalam X1 dan X2.

Koefisien Regresi Parsial Baku

Koefisien regresi parsial baku adalah koefisien regresi yang diperoleh dengan lebih dulu membakukan setiap peubah, jadi setiap peubah diukur dari rata-ratanya dalam satuan simpangan baku. Koefisien regresi parsial baku dilambangkan dengan .

Atau

Kedua persamaan tersebut menghasilkan persamaan yang menghubungkan b dengan b’.

Koefisien Regresi Parsial Baku

Karena tidak memiliki satuan maka perbandingan antara sembarang dua koefisien tersebut memberikan ukuran terhadappentingnya secara relatif dari dua peubah bebas X yang terlibat. Jika besarnya dua kali dari , maka kira-kira X1 dua kali lebih penting daripada X2 dalam menduga atau meramalakan nilai Y.

Contoh Koefisien Regresi Parsial Baku

Untuk contoh pada 14.5, diperoleh

Dari ilustrasi tersebut X1 memiliki pengaruh dua kali lebih penting daripada X2 dalam peramalan Y.