REGRESSI & KORELASI
-
Upload
adil-athilshipate -
Category
Documents
-
view
29 -
download
1
description
Transcript of REGRESSI & KORELASI
UJI REGRESSI LINIERUJI REGRESSI LINIER
Oleh :Oleh :
Dr.dr. Buraerah.Abd.Hakim,MScDr.dr. Buraerah.Abd.Hakim,MSc( Jurusan : Biostatistik/KKB FKM – UH)( Jurusan : Biostatistik/KKB FKM – UH)
FAKULTAS KESEHATAN MASYARAKAT
UNIVERSITAS HASANUDDIN
KORELASI DAN KORELASI DAN REGRESSI REGRESSI LINIERLINIER
TUJUANTUJUAN Menguji hubungan antara satu variabel Menguji hubungan antara satu variabel Dependen Dependen
(var. respon)(var. respon) dengan satu atau beberapa dengan satu atau beberapa var. var. Independen (var. predictor). Independen (var. predictor).
1.1. Jika variabel dependen dihubungkan dengan hanya Jika variabel dependen dihubungkan dengan hanya satu variabel independen maka persamaan regresi satu variabel independen maka persamaan regresi yang dihasilkan ialah yang dihasilkan ialah “regresi linier sederhana” “regresi linier sederhana”
2.2. Jika variabel independennya lebih dari satu Jika variabel independennya lebih dari satu menghasilkan menghasilkan “ regresi linier berganda” (multiple “ regresi linier berganda” (multiple linier regression ). linier regression ).
RUMUS RUMUS UMUMUMUM
Keterangan : Keterangan : a = (a = (ββo) o) →→ Intercept Intercept
ialah estimasi atau perkiraan teoritis variabel ialah estimasi atau perkiraan teoritis variabel dependen (var.Y) bilamana variabel independen (var. x) = 0dependen (var.Y) bilamana variabel independen (var. x) = 0
b = (b = (ββ11) ) →→ Slope Slopeialah koefisien arah yang merupakan ialah koefisien arah yang merupakan
perubahan dalam variabel dependen yang dicocokkan untuk perubahan dalam variabel dependen yang dicocokkan untuk sebuah perubahan dalam variabel xsebuah perubahan dalam variabel x
Y = a + bx
Y = a + bx Y = a + bx Ialah persamaan regressi untuk data hasil Ialah persamaan regressi untuk data hasil observasi ( sampel ). observasi ( sampel ).
Y = Y = ββo + o + ββ11xxii + e + e
Ialah persamaan garis regressi untuk data Ialah persamaan garis regressi untuk data populasi. populasi.
RUMUS UMUMRUMUS UMUM
Keterangan : Keterangan : eeii = = ErrorError
Ialah random error yang terjadi disekitar garis Ialah random error yang terjadi disekitar garis regressi atau perbedaan antara harga regressi atau perbedaan antara harga observasi Yobservasi Yii dan mean sub populasi dan mean sub populasi
(sampel) pada titik x(sampel) pada titik xii
Diasumsikan berdistribusi normal Diasumsikan berdistribusi normal independen variabel-variabel random dengan independen variabel-variabel random dengan mean = 0 dan varians = mean = 0 dan varians = σσ² ²
RUMUS UMUMRUMUS UMUM
Y = a + bx
Slope
Intercept
b
Var. X
Var. Y
a
PERSAMAAN GARIS REGRESSIPERSAMAAN GARIS REGRESSI
Y = a + bx
YY →→ Estimator (penaksir)Estimator (penaksir)ialah garis regressi yang diperoleh dari hasil perhitungan ialah garis regressi yang diperoleh dari hasil perhitungan sampel ( data observasi ). sampel ( data observasi ).
ŶŶ →→ Estimate (Yang ditaksir)Estimate (Yang ditaksir)ialah garis regressi pada populasi yang ialah garis regressi pada populasi yang
dimaksudkan untuk ditaksir nilainya berdasarkan hasil dimaksudkan untuk ditaksir nilainya berdasarkan hasil perhitungan sampel. perhitungan sampel.
ββ00 →→Intercept PopulasiIntercept Populasiialah nilai variabel dependen pada populasi ialah nilai variabel dependen pada populasi (var. Y) bilamana variabel independen (var. X) = 0 (var. Y) bilamana variabel independen (var. X) = 0 ( tidak diketahui ) ( tidak diketahui )
ββ11 →→Slope PopulasiSlope Populasiialah kofisien arah yang merupakan perubahan dalam ialah kofisien arah yang merupakan perubahan dalam
variabel variabel dependen yang dicocokkan untuk sebuah dependen yang dicocokkan untuk sebuah perubahan dalam perubahan dalam variabel X dalam populasi ( tidak variabel X dalam populasi ( tidak diketahui ). diketahui ).
NOTASI / TERMINOLOGINOTASI / TERMINOLOGI
10000
50000
30000
40000
20000
60000
03000020000 4000010000
Gaji awal
SCATTER DIAGRAMSCATTER DIAGRAM Gaji sekarang
Dalam kenyataan hasil perpotongan antara Dalam kenyataan hasil perpotongan antara variabel Y dan variabel X berdasarkan data variabel Y dan variabel X berdasarkan data hasil observasi hasil observasi tidak semuanya tepat jatuh tidak semuanya tepat jatuh pada garis regressi tetapi hanya sebagian pada garis regressi tetapi hanya sebagian saja. saja.
Konsekuensinya adalah Konsekuensinya adalah terjadi terjadi penyimpanganpenyimpangan hasil observasi dari hasil observasi dari persamaan garis yang diduga yang dikenal persamaan garis yang diduga yang dikenal dengan dengan “random errror disekitar garis “random errror disekitar garis regressi”.regressi”. Yang ditunjukkan pada scatter Yang ditunjukkan pada scatter diagram berikut : diagram berikut :
MEMILIH GARIS REGRESSIMEMILIH GARIS REGRESSI
Scatter Diagramnya gaji awal dan gaji sekarang adalah :Scatter Diagramnya gaji awal dan gaji sekarang adalah :
10000
50000
30000
40000
20000
60000
0
3000020000 4000010000
Gaji awal
Gaj
i se
kara
ng
RANDOM ERRORRANDOM ERROR
Untuk menghilangkan error tersebut Untuk menghilangkan error tersebut digunakan digunakan “metode kuadrat terkecil” “metode kuadrat terkecil” (Least (Least Square)Square)
(Least Square) (Least Square) ialah suatu persamaan garis ialah suatu persamaan garis dimana jumlah kuadrat dari jarak vertikal dimana jumlah kuadrat dari jarak vertikal tiap-tiap titik pengamatan terhadap garis tiap-tiap titik pengamatan terhadap garis tersebut minimum. tersebut minimum. (dianggap = 0)(dianggap = 0)
MENGHILANGKANMENGHILANGKAN RANDOM ERRORRANDOM ERROR
INTERCEP DAN SLOPEINTERCEP DAN SLOPE
((ΣΣYYii) () (ΣΣXXii²²) - () - (ΣΣXXii) () (ΣΣXXiiYYii))aa == ---------------------------------- ---------------------------------- nn ΣΣXXi i ²² – ( – (ΣΣXXii))²²
nn ΣΣXXiiYYi i - - ((ΣΣYYii) () (ΣΣXXii) ) b b == ---------------------------- ---------------------------- nn ΣΣXXii²² – ( – (ΣΣXXii))²²
a = Ῡ- bX
Perhitungan parameter intercep dan slope dilakukan sebagai berikut :
INTERCEP DAN SLOPEINTERCEP DAN SLOPE
((ΣΣYYii) () (ΣΣXXii²²) - () - (ΣΣXXii) () (ΣΣXXiiYYii))c c == ---------------------------------- ---------------------------------- nn ΣΣYYi i ²² – ( – (ΣΣYYii))²²
nn ΣΣXXiiYYi i - - ((ΣΣYYii) () (ΣΣXXii) ) d d == ---------------------------- ---------------------------- nn ΣΣXXii²² – ( – (ΣΣYYii))²²
Perhitungan parameter intercep dan slope dilakukan sebagai berikut :
BENTUK PERSAMAAN GARIS REGRESSIBENTUK PERSAMAAN GARIS REGRESSI
1.1. Regressi LinierRegressi LinierŶ = a + bxŶ = a + bx
2.2. Parabola Kuadratik Parabola Kuadratik Ŷ = a + bx + cx²Ŷ = a + bx + cx²
3.3. Parabola KubikParabola KubikŶ = a + bx + cx² + dx³Ŷ = a + bx + cx² + dx³
4.4. EksponenEksponenŶ = ab.Ŷ = ab.
5.5. GeometrikGeometrikŶ = axŶ = ax
6.6. GompertzGompertzŶ = pqŶ = pq
7.7. LogistikLogistik 11
Ŷ = ---------------Ŷ = --------------- abJ + cabJ + c
8.8. HiperbolaHiperbola 11
Ŷ = ---------------Ŷ = --------------- a + b a + b
bx
b
BENTUK PERSAMAAN GARIS REGRESSIBENTUK PERSAMAAN GARIS REGRESSI
CONTOH PENGGUNAAN REGRESSICONTOH PENGGUNAAN REGRESSI
Seorang peneliti ingin mengetahui pengaruh tingkat intelegensi (IQ) mahasiswa STIKES-NH, terhadap nilai statistik yang dicapainya. Untuk keperluan tersebut ditarik sampel sebesar 12 mahasiswa, kemudian dilakukan test (IQ), selanjutnya para mahasiswa tersebut diberi test statistik dengan hasil seperti yang tercantung pada tabel berikut :
CONTOH PENGGUNAAN REGRESSICONTOH PENGGUNAAN REGRESSI NomorNomor
Mah.Mah.
Skor testSkor test
IQ (xIQ (xii))
Nilai statistik (Nilai statistik (YYii)) XXii22 xxiiYYii
11
22
33
44
55
66
77
88
99
1010
1111
1212
6565
5050
5555
6565
5555
7070
6565
7070
5555
7070
5050
5555
8585
7474
7676
9090
8585
8787
9494
9898
8181
9191
7676
7474
42254225
25002500
30253025
42254225
30253025
49004900
42254225
49004900
30253025
49004900
25002500
30253025
55255525
37003700
41804180
58505850
46754675
60906090
61106110
68606860
44554455
63706370
38003800
40704070
n = n = 1212 ∑∑xxi i = = 725725 ∑∑YYi i = = 10111011 ∑∑xxii2 2 = = 4447544475 ∑∑ xxiiYYi = i = 6168561685
PENYELESAIANPENYELESAIAN
((ΣΣYYii) () (ΣΣXXii²) - (²) - (ΣΣXXii) () (ΣΣXXiiYYii) ) (1011)(44475) – (725)(61685)(1011)(44475) – (725)(61685)aa = ------------------------------------ = ------------------------------------------ = ------------------------------------ = ------------------------------------------ n n ΣΣXXi i ² – (² – (ΣΣXXii))² ² 12(44475) – ( 725)12(44475) – ( 725)22
= = 0,50430,5043
n n ΣΣXXiiYYi i - (- (ΣΣYYii) () (ΣΣXXii) ) (12)(61685) – (1011)(725)(12)(61685) – (1011)(725)b b = ---------------------------- = -------------------------------------- = = ---------------------------- = -------------------------------------- = 0,89720,8972 n n ΣΣXXii² – (² – (ΣΣXXii))² ² (12)(44475) – (725)(12)(44475) – (725)22
Y = 0,5043 + 0,8972(X)
CONTOH PENGGUNAAN REGRESSICONTOH PENGGUNAAN REGRESSI
NomorNomor
Mah.Mah.
Skor testSkor test
IQ (xIQ (xii))Y = a + bxY = a + bx
^̂YY
Nilai YNilai Yii
asliasli
11
22
33
44
55
66
77
88
99
1010
1111
1212
6565
5050
5555
6565
5555
7070
6565
7070
5555
7070
5050
5555
0,5043 + 0,89720,5043 + 0,8972 x x 6565
0,5043 + 0,89720,5043 + 0,8972 x x 5050
0,5043 + 0,89720,5043 + 0,8972 x x 5555
0,5043 + 0,89720,5043 + 0,8972 x x 6565
0,5043 + 0,89720,5043 + 0,8972 x x 5555
0,5043 + 0,89720,5043 + 0,8972 x x 7070
0,5043 + 0,89720,5043 + 0,8972 x x 7070
0,5043 + 0,89720,5043 + 0,8972 x x 6565
0,5043 + 0,89720,5043 + 0,8972 x x 5555
0,5043 + 0,89720,5043 + 0,8972 x x 7070
0,5043 + 0,89720,5043 + 0,8972 x x 5050
0,5043 + 0,89720,5043 + 0,8972 x x 5555
58,8258,82
45,3645,36
59,8559,85
58,8258,82
59,8559,85
63,3163,31
58,8258,82
63,3163,31
59,8559,85
63,3163,31
45,3645,36
59,8559,85
8585
7474
7676
9090
8585
8787
9494
9898
8181
9191
7676
7474
MODEL GARIS REGRESSI MODEL GARIS REGRESSI
Nilai IQ
1.00.75.50.250.00
Nila
i sta
tistik
1.00
.75
.50
.25
0.00
ANALISIS KORELASI ANALISIS KORELASI
Garis regressi dianggap parameter terbaik untuk untuk sekumpulan data berbentuk linier.
Besarnya derajat hubungan antara variabel x dan Y (korelasi antara x dan Y) dinyatakan dengan “ r ” yang dikenal dengan istilah Koefisien korelasi. biasa juga diberi simbol dengan “ R “
ANALISIS KORELASI ANALISIS KORELASI
BENTUK RUMUS UMUMNYA ADALAH : ^
∑ (Yi – Y)2 – ∑(Yi – Yi) 2
r2 = -----------------------------------------
∑( Yi – Y )2
r2 disebut “ Koefisien Determinasi “ atau Koefisien Penentu. sering disebut dengan R Square = (R2)
ANALISIS KORELASI ANALISIS KORELASI
Untuk Menghitung Nilai Korelasi “ r “ atau R digunakan rumus sebagai berikut :
n ∑ Xi Y - (∑ Xi) (∑ Yi )
r = ----------------------------------------------------------
{ n ∑ Xi2 – (∑ Xi )2} { n ∑ Yi
2 – (∑ Yi )2 }
Bentuk Lain :
r = 1 - S2y.x / S2
y
ANALISIS KORELASI ANALISIS KORELASI
Apabila telah diketahui nilai ‘b’ maka koefisien determinasi r2 dapat dihitung sebagai berikut :
n ∑ Xi Y - (∑ Xi) (∑ Yi )
r2 = --------------------------------------
n ∑ Yi2 – (∑ Yi )2
Sedangkan rumus korelasi r adalah sebagai berikut :
r = bSx / Sy
Model Summaryb
.626a .392 .331 5.322055Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), VAR Xa.
Dependent Variable: VARYb.
HASIL ANALISIS KORELASI HASIL ANALISIS KORELASI
R (Korelasi) = r = 0,626
R Square (Pengaruh)= r2 = 0,392
Adjusted R Square (Perkiraan) = 0,331
Standard error of the estimate = 5,322055
Hasil perhitungan dengan teknik komputerisasi adalah sebagai berikut :
HASIL ANALISIS KORELASIHASIL ANALISIS KORELASI
Terminologi Hasil Print Out Terminologi Hasil Print Out Analisis RegressiAnalisis Regressi
Hasil Print Out Analisis RegressiHasil Print Out Analisis Regressi
------------------------------------Variabel in EquationVariabel in Equation----------------------------------------------------
Variabel Variabel BB SE BSE B BetaBeta TT Sig.TSig.T
SALBEGSALBEG 1.9094501.909450 0.0474100.047410 0.8801170.880117 40.27640.276 0.00000.0000
(Constant)(Constant) 771.282303771.282303 955.471941955.471941 2.1702.170 0.03050.0305
------------------------------------------------------------------------------------------------------------------------------------------------ Kofisien Kofisien → [ B ]→ [ B ]
Ialah intercept “a” (constan) dan slope “b” (salbeg) dari Ialah intercept “a” (constan) dan slope “b” (salbeg) dari hasil analisis regressi. hasil analisis regressi.
Terminologi Hasil Print Out Analisis RegressiTerminologi Hasil Print Out Analisis Regressi
Koefisien Regressi Terstandarisasi. Koefisien Regressi Terstandarisasi. → [Beta]→ [Beta]
ialah koefisien regressi ialah koefisien regressi ββ1 apabila variabel x dan y 1 apabila variabel x dan y diekspresikan sebagai “skor standar” (Z – score)diekspresikan sebagai “skor standar” (Z – score) Diperoleh dengan menggunakan rumus :Diperoleh dengan menggunakan rumus :
SSxx
Beta = Beta = ββ11 -------- --------
SSyy
Ket :Ket : Sx : ialah standar deviasi dari variabel XSx : ialah standar deviasi dari variabel X Sy : ialah standar deviasi dari variabel YSy : ialah standar deviasi dari variabel Y
Estimasi standar ErrorEstimasi standar Error → [SE B]→ [SE B]
ialah estimasi standar error dari “ialah estimasi standar error dari “ββ11ββ00” untuk populasi” untuk populasi
Terminologi Hasil Print Out Analisis RegressiTerminologi Hasil Print Out Analisis Regressi
Uji Hipotesis Uji Hipotesis → [ T dan Sig. T ] → [ T dan Sig. T ]
ialah uji hipotesis mengenai ada atau tidaknya ialah uji hipotesis mengenai ada atau tidaknya hubungan linier antara variabel X dan variabel Y. hubungan linier antara variabel X dan variabel Y. atau “slope dari regressi populasi (atau “slope dari regressi populasi (ββ11) = 0) = 0
Rumus yang digunakan :Rumus yang digunakan :
ββ11
t t = ----------= ----------
SS ββ11
Apabila tidak ada hubungan linier antara Apabila tidak ada hubungan linier antara variabel X dan varibel Y maka data dari variabel X dan varibel Y maka data dari sampel akan berdistribusi “student’s” t,sampel akan berdistribusi “student’s” t,
dengan derajat kebebasan N – 2 . dengan derajat kebebasan N – 2 .
Uji statistik yang digunakan untuk menguji Uji statistik yang digunakan untuk menguji bahwa intercept (bahwa intercept (ββ00) = 0 ialah : ) = 0 ialah :
ββ00
t t = ----------= ----------
SS ββ00
Terminologi Hasil Print Out Analisis RegressiTerminologi Hasil Print Out Analisis Regressi
Generalisasi Sampel Terhadap Populasi Generalisasi Sampel Terhadap Populasi Generalisasi Sampel Terhadap Populasi Generalisasi Sampel Terhadap Populasi
Untuk melakukan generalisasi hasil sampel Untuk melakukan generalisasi hasil sampel terhadap parameter populasi, maka digunakan terhadap parameter populasi, maka digunakan prinsip prinsip “LINE”.“LINE”. → Linearity, Independency, → Linearity, Independency, Normality, Equality variance. Normality, Equality variance.
LinearityLinearityialah nilai-nilai mean seluruhnya terletak pada ialah nilai-nilai mean seluruhnya terletak pada garis lurus yang merupakan garis regressi garis lurus yang merupakan garis regressi populasipopulasi
YYii = = ββ00 + + ββ11XXii + e + eii → dimana ei diasumsikan → dimana ei diasumsikan berdistribusi normal independen dengan mean = 0 berdistribusi normal independen dengan mean = 0 dan varians = dan varians = σσ²²
Indenpendency Indenpendency secara statistik maka variabel Y harus independen secara statistik maka variabel Y harus independen antara satu dengan lainnya. antara satu dengan lainnya.
Normality dan Equality varianceNormality dan Equality variance
ialah untuk setiap nilai variabel independen X ialah untuk setiap nilai variabel independen X maka variabel dependen Y maka variabel dependen Y → akan berdistribusi → akan berdistribusi normal dengan mean = normal dengan mean = μμy/x dan variance konstan y/x dan variance konstan = = σσ²²
Artinya tidak setiap perubahan variabel Artinya tidak setiap perubahan variabel independen X diikuti oleh perubahan yang sama independen X diikuti oleh perubahan yang sama oleh variabel dependenoleh variabel dependen Y.Y.
Generalisasi Sampel Terhadap Populasi Generalisasi Sampel Terhadap Populasi
Asumsi regressiAsumsi regressi
Generalisasi Sampel Terhadap Populasi Generalisasi Sampel Terhadap Populasi
β0+β1X
Y1
ei
X2 X4X3X1 x
y
Goodness Of FitGoodness Of Fit
Ialah salah satu prosedur statistik yang Ialah salah satu prosedur statistik yang digunakan untuk menentukan / menetapkan digunakan untuk menentukan / menetapkan
seberapa baik suatu model yang dipilih seberapa baik suatu model yang dipilih berdasarkan data sampel dan memang sesuai berdasarkan data sampel dan memang sesuai
dengan keadaan nyata dengan keadaan nyata
( populasi ) dilapangan. ( populasi ) dilapangan. → dikenal dengan istilah → dikenal dengan istilah “Goodness Of Fit”. “Goodness Of Fit”.
Goodness Of FitGoodness Of FitKoefisien Determinasi Koefisien Determinasi → [ R Square = R→ [ R Square = R² ] ² ]
• Ialah ukuran goodness of fit yang digunakan Ialah ukuran goodness of fit yang digunakan untuk menentukan model linier untuk satu untuk menentukan model linier untuk satu persamaan garis lurus. persamaan garis lurus.
• Niali dari R² ini berada diantara 0 sampai Niali dari R² ini berada diantara 0 sampai dengan 1. dengan 1.
0 0 → berarti nilai observasi tidak ada / sebagian → berarti nilai observasi tidak ada / sebagian kecil saja jatuh pada garis regressi.kecil saja jatuh pada garis regressi.
1 → berarti seluruh nilai observasi terletak pada 1 → berarti seluruh nilai observasi terletak pada garis regressi. garis regressi.
Goodness Of FitGoodness Of Fit
• Multiple RMultiple RIalah banyaknya persentase (%) variabilitas Ialah banyaknya persentase (%) variabilitas variabel dependen Y yang dapat diterangkan variabel dependen Y yang dapat diterangkan oleh variabel independen X. oleh variabel independen X.
• Adjusted R Square. Adjusted R Square. ialah koreksi dari ialah koreksi dari RR² sehingga gambarannya ² sehingga gambarannya lebih mendekati model dalam populasi. lebih mendekati model dalam populasi.
Goodness Of FitGoodness Of Fit
• Print Out Hasil analisisPrint Out Hasil analisis
----------------------------------------------------------------------------------------------------------------------------
Multiple RMultiple R 0.880120.88012
R Square R Square 0.774610.77461
Adjusted R Square Adjusted R Square 0.774130.77413
Standar error Standar error 3246.14226 3246.14226
----------------------------------------------------------------------------------------------------------------------------
SEKIAN DAN TERIMA KASIH