REGRESI LINEAR SEDERHANA DAN...
Transcript of REGRESI LINEAR SEDERHANA DAN...
REGRESI LINEAR SEDERHANADAN KORELASIDAN KORELASI
1. Model Regresi Linear 2. Penaksir Kuadrat Terkecil3 Prediksi Nilai Respons3. Prediksi Nilai Respons4. Inferensi Untuk Parameter-parameter Regresi5. Kecocokan Model Regresi6. Korelasi
Utriweni MukhaiyarMA 2181 Analisis Data
Tujuanj2
2. Melakukan prediksi terhadap nilai suatu variabel, misalkan Y, berdasarkan nilai variabelyang lain , misalkan X, dengan menggunakan
i l iy g g ggmodel regresi linier (interpolasi).
f(X)f(X)
Suhu (X) Gula yang Dihasilkan (Y)
X menentukan Y
prediktorrespons
b k b h
peubah acak
Memiliki distribusi
3
bukan peubahacak
Observasi 1 2 3 … n
X X X X XX X1 X2 X3 … Xn
Y Y1 Y2 Y3 … Yn
Variabel yang nilainya mempengaruhivariabel yang lainnya.
1
Variabel yang kejadiannya lebih dahuluterjadi.
2
Variabel yang variansinya terkecil
terjadi.
3
4
MODEL REGRESI LINEAR SEDERHANAMODEL REGRESI LINEAR SEDERHANA
0 1i i iY X e
- 1 dan 0 merupakan parameter-parameter model yang akan ditaksir
- ei adalah galat pada observasi ke-i (acak)
5
Sumber Galat6
1. Ketidakmampuan model regresi dalammemodelkan hubungan prediktor dan responsmemodelkan hubungan prediktor dan responsdengan tepat
2. Ketidakmampuan peneliti dalam melakukan pengukuran dengan tepat
3. Ketidakmampuan model untuk melibatkanb l d ksemua variabel prediktor
Penaksir Kuadrat TerkecilPenaksir Kuadrat Terkecil
- 1 dan 0 ditaksir dengan metode kuadrat terkecil (least 1 0 g (square)
- Asumsi-asumsi :
1. Ada pengaruh X terhadap Y
2. untuk i = 1 2 n Y X e 2.
3. Nilai harapan dari ei adalah 0, atau E[ ei ] = 0
4 V i i d i t k i 1 2
0 1 , untuk i 1, 2, ..., n i i iY X e
4. Variansi dari ei, sama untuk semua i = 1, 2,…, n
5. ei berdistribusi normal untuk semua i = 1, 2,…, n
7
6. e1,e2,...,en saling bebas (independen)
Misalkan b adalah taksiran bagi dan b adalahMisalkan b1 adalah taksiran bagi 1 dan b0 adalahtaksiran bagi 0. Maka taksiran bagi model regresiadalah
0 1ˆ i iY b b X
Kriteria penaksiran kuadrat terkecil adalahmeminimumkan
n
2
1 ii
e
ˆterhadap b0 dan b1, dengan 0 1ˆ . i i i i ie Y Y Y b b X
88
Diperolehp
1
1
n
i iiXY
X X Y YJKb
1
2
1
nXX
ii
bJK X X
0 1 b Y b X
Sedangkan taksiran untuk variansi galat acak adalahg g
2
2 1
ˆˆ
n
i iG i
Y YJK
2 2
n n
9
Suhu (X) 1 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2Suhu (X) 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2
Gula yg dihasilkan (Y) 8.1 7.8 8.5 9.8 9.5 8.9 8.6 10.2 9.3 9.2 10.5Sumber: Walpole and Myers, 1989
ei
10
1 nn = 11
1 n
1
1x x 1.5
n
iin 1
1y y 9.13
n
iin
1
x x y y1 8091
n
i iib
1
2
1
1.8091x x
n
ii
b
0 1 6.4136 b Y b X
ˆ 6.4136 1.8091 Y X 1111
Model persamaan regresi1111
Prediksi Nilai Responsp12
Prediksi model Suhu (xi) Gula yg dihasilkan (yi) iˆ(y ) i i iˆe y y 1 8.1 8.22 -0.12
1.1 7.8 8.40 -0.60
1.2 8.5 8.58 -0.08
22 1ˆ ˆy y 0.49
i i
1.3 9.8 8.77 1.03
1.4 9.5 8.95 0.55
1.5 8.9 9.13 -0.23 y y
9 i i
1.6 8.6 9.31 -0.71
1.7 10.2 9.49 0.71
1.8 9.3 9.67 -0.37
1.9 9.2 9.85 -0.65
2 10.5 10.03 0.47
T k i i i l kTaksiran variansi galat acak
Misalkan suhu proses (X) adalah 1.55 satuan suhu.
Maka prediksi banyaknya gula yang dihasilkan padah t b t d l hsuhu tersebut adalah
y 6.4136 1.8091x = 6.4136 + 1.8091(1.55)
=9.217705
13
ASUMSI KENORMALAN
11• Asumsi ei berdistribusi normal
untuk semua i = 1, 2,…, n
• Yi beristribusi normal untuk i 1 2 2 semua i = 1, 2,…, n
• b dan b berdistribusi33
• b0 dan b1 berdistribusinormal
14
INFERENSI UNTUK PARAMETER 0
0 00
2XX
bT =ˆ / JK
n
ix n
XX1 ii
berdistribusi t dengan derajat kebebasan n-2.
Selang kepercayaan (1-α) untuk 0 :
n n2 2
0 / 2 XX 0 0 / 2 XX1 1
ˆ ˆb / JK b / JK
i ii i
t x n t x n
15t/2 adalah nilai distribusi t dengan derajat kebebasan n-2
INFERENSI UNTUK PARAMETER 1
1 11
XX
bT =ˆ/ JK
berdistribusi t dengan derajat kebebasan n-2.
Selang kepercayaan (1-α) untuk 1 :
ˆ ˆt t / 2 / 21 1 1
XX XX
b bJK JK
t t
16t/2 adalah nilai distribusi t dengan derajat kebebasan n-2
PENGUJIAN PARAMETER REGRESIPENGUJIAN PARAMETER REGRESI
Rumusan HipotesisRumusan Hipotesis
H0 : β0 = 0
H β ≠ 0
H0 : β1 = 0
H β ≠ 0 bH1 : β0 ≠ 0 H1 : β1 ≠ 0 00 n
2i
i 1
btx
ˆ nJK
11
XX
bt ˆJK
XXnJK XX
17
SELANG PREDIKSISELANG PREDIKSI
Misalkan nilai respons Y untuk X = X0 adalah Y0, dan
ˆ
p 0 0,misalkan adalah prediksi model regresi bagi Y0. Maka
0 02
0 XX
Y -YTˆ 1+(1/n)+[(x x) / JK ]
berdistribusi t dengan derajat kebebasan n-2.
Selang prediksi (1 – α) bagi y0 adalah
2 20 0
0 / 2 0 0 / 2XX XX
(x x) (x x)1 1ˆ ˆ ˆ ˆy t 1+ + y y t 1+ +n JK n JK
XX XX
18
CONTOH 1 SELANG KEPERCAYAAN 1 CONTOH 1 SELANG KEPERCAYAAN 1-
1(2.26)(0.4) (2.26)(0.4)1.8091 1.8091
1.1 1.1 TINJAU CONTOH SEBELUMNYA
Selang kepercayaan95% untuk β1 :
b1=1,8091 b0=6,4136 Selang kepercayaan95% untuk β0 :
19 025.85 25.856.4136 (2.26)(0.4) 6.4136 (2.26)(0.4)
(11)(1.1) (11)(1.1)
CONTOH 2 UJI HIPOTESIS
t > t &t0 > t0.025 &
t1 > t0.025
maka masing-masingH ditolakH0 ditolak
Kesimpulan
β0 dan β1 tidak dapatdiabaikan
20
Kecocokan Model RegresiKecocokan Model Regresi
Salah satu alat ukur untuk melihat apakah model regresi yang diperoleh sudah memadai adalahkoefisien determinasi yaitu
n2
iˆ(y y)JK
2 2R i=1
n2T
ii=1
JKR = = , dengan 0 R 1JK (y y)
Besaran R2 menunjukkan proporsi variasi total dalamrespons Y yang diterangkan oleh model regresi yang diperoleh
21
diperoleh
UJI KEBAIKAN MODEL
H0 : Model regresi yang diperoleh tidak memadai
H1 : Model memadai
Statistik uji2ˆ
n
i(y y)JK 1
ˆ ˆ
ii=R
(y y)JKf
Tolak H0 pada tingkat keberartian α jika f > f,(1,n-2), dimanaf,(1,n-2) adalah nilai distribusi F dengan derajat kebebasan 1 dan n – 2. dan n 2.
22
CONTOH 3
Untuk contoh sebelumnya diperoleh R2 = 0,499.
Artinya proporsi variasi total dalam respons Y yang diterangkan oleh model regresi yang diperoleh adalah49.9%
Uji kebaikan model
2ˆ n
i(y y)JK 1 8.99
ˆ ˆ
ii=RJKf
Untuk α = 5%, titik kritis f0 05 (1 9) = 5,12, 0.05,(1,9) ,
f > f0.05,(1,9), model memadai.23
KorelasiKorelasi
Mengukur hubungan linear dua peubah acak Misalkan X dan Y adalah dua peubah acak,
maka korelasi antara X dan Y dinyatakanmaka korelasi antara X dan Y dinyatakandengan
X YXY
E (X )(Y )
X Y
24
25
Gambar 1 Korelasi positif Gambar 2 Korelasi negatif
Gambar 3 Korelasi nol Gambar 4 Korelasi nol
26
Korelasi dapat ditaksir dengan koefisien korelasi
KORELASI SAMPEL
Korelasi dapat ditaksir dengan koefisien korelasisampel, yaitu
XYXY
XX YY
JKrJK JK
n
i ii=1
(X X)(Y Y) i=1
n n2 2
i i
(X X) (Y Y)
27
i=1 i=1
CONTOH 4Data dua peubah acak berat badan bayi (kg) dan ukurandada bayi (cm)
CONTOH 4
beratberat (kg)(kg) ukuranukuran dada (cm)dada (cm)
2.752.75 29.529.5
2.152.15 26.326.3
4.414.41 32.232.2
5 525 52 36 536 55.525.52 36.536.5
3.213.21 27.227.2
4.324.32 27.727.7
2.312.31 28.328.3
4.34.3 30.330.3
3 713 71 28 728 73.713.71 28.728.7
Rata-rata berat = 3.63 , Rata-rata ukuran dada = 29.6328
38
30
32
34
36
(cm)
24
26
28
30ukuran
20
22
1 2 3 4 5 6
berat (kg)
9
i ii=1
9 92 2
(X X)(Y Y)r 0.78
(X X) (Y Y)
i ii=1 i=1
(X X) (Y Y)
29
Referensi30
Referensi
Pasaribu, U.S., 2007, Catatan Kuliah Biostatistika. Walpole, Ronald E. Dan Myers, Raymond H., Ilmu Peluang dan
Statistika untuk Insinyur dan Ilmuwan Edisi 4 Bandung Penerbit ITB Statistika untuk Insinyur dan Ilmuwan, Edisi 4, Bandung: Penerbit ITB, 1995.