Statistika UjiHip Anova RegKor

download Statistika UjiHip Anova RegKor

of 30

Transcript of Statistika UjiHip Anova RegKor

1 Dipersiapkan oleh: [email protected] PENGUJIAN HIPOTESIS Langkah-langkahdalampengujianhipotesismengenaiparamaterpopulasi ulawan hipotesis alternatifnya dapat diringkaskan sebagai berikut: 1.Nyatakan hipotesis nol-nya, 0 0: u = u H2.Pilih hipotesis alternatif yang sesuai di antara 0 1: u < u H , 0 1: u > u H , atau 0 1: u = u H3.Tentukan taraf nyatanya, yaitu nilaio. 4.Pilihlahstatistikujiyangsesuaidankemudiantentukanwilayah kritiknya. 5.Hitung nilai statistik uji berdasarkan data contohnya. 6.Keputusan: Tolak 0Hbila nilai statistik uji tersebut jatuh di wilayah kritik, sedangkan bila nilai itu jatuh di luar wilayah kritiknya terimalah 0H . Uji Hipotesis Mengenai Nilaitengah Populasi Prosedurujihipotesismengenainilaitengahpopulasidiringkaskanpada tabel berikut: 0HNilai Statistik Uji 1HWilayah Kritik 0 = nxzo = ;o diketahui atau30 > n0 < 0 > 0 = o < z zo> z z2 / o < z zatau 2 / o> z z0 = n sxt = ;o tidak diketahui dan 30 < n0 < 0 > 0 = o < t to> t t2 o < t tatau 2 Dipersiapkan oleh: [email protected] 2 o> t t0 2 1d = ( )( ) ( )222 1210 2 1n nd x xzo + o =1odan 2odiketahui atau30 ,2 1> n n0 2 1d < 0 2 1d > 0 2 1d = o < z zo> z z2 / o < z zatau 2 / o> z z0 2 1d = ( )( ) ( )2 10 2 11 1 n n sd x xtp+ =22 1 + = n n v , 21o =22otetapi nilainya tidak diketahui dan30 ,2 1< n n , dan ( ) ( )2 21 1 2 21 21 12pn s n ssn n + =+ 0 2 1d < 0 2 1d > 0 2 1d = o < t to> t t2 o < t tatau 2 o> t t0 2 1d = ( )( ) ( )222 1210 2 1n s n sd x xt+ =( )( )( )( )( ) (((

+(((

+=1 122222121212222 121nn snn sn s n sv2 1o = o dannilainyatidak diketahui. 0 2 1d < 0 2 1d > 0 2 1d = o < t to> t t2 o < t tatau 2 o> t t0dD = n sd dtd0= ;1 = n vUji bagi pengamatan berpasangan. 0dD < 0dD > 0dD = o < t to> t t2 o < t tatau 2 o> t t3 Dipersiapkan oleh: [email protected] Uji Hipotesis Mengenai Proporsi Populasi Prosedurujihipotesismengenainilaitengahpopulasidiringkaskanpada tabel berikut: No 0H1HWilayah Kritik Statistik Uji 1 0p p =0p p o> z z0p p =2 / o < z z atau 2 / o> z z2 0 2 1d p p = 0 2 1d p p < o < z z1 21 2(1 ) (1 )c c c cp pzp p p pn n= +1 21 2cX Xpn n+=+ Dengan X1 dan X2 berturut-turutmenyatakan banyaknyakeberhasilan dalamn1dann2ulangan (jumlah sampel). 0 2 1d p p > o> z z 0 2 1d p p = 2 / o < z z atau 2 / o> z z Latihan Soal: 1.BPSmenyatakanbahwarata-ratapengeluaranpendudukuntuk kesehatandisuatuwilayahtertentuperbulannyaadalahRp.125.000 dengansimpanganbakuRp.24.000.Untukmengujipernyataanini sebuahlembagarisetmengambil100pendudukdiwilayahtersebut 4 Dipersiapkan oleh: [email protected] secara acak. Apakah anda sependapat dengan pernyataan BPS tersebut bilacontohtersebutmenghasilkanrata-ratapengeluaranuntuk kesehatan sebesar Rp. 135.000. 2.The Appliance Center reports on it TV commercials that more than 70 percent of our customers have purchased an appliance with us before.Thepresidentofthecompanyhiredamarketingresearchfirmto independentlyvalidatethisclaim.Inasampleof200recentbuyers, 160 reported that they had, in fact, purchased and an appliance from the ApplianceCenterbefore.Atthe.01significancelevelistheclaimof the commercial correct?Jawab: buyers. repeatare customers the of percent70 thanmore thatreasonable is It. Reject 09 . 3200) 70 . 1 )( 70 (.70 .200160z 2.33. z if Reject 70 . :70 . :0010HHHH==>>stt 3.Misalnyasebuahperusahaan/pabrikmobilinginmembandingkan kinerjaduabuahpabriknyayangmemproduksimodelmobilyang identik.Keduapabrikitumemilikimesinyangsamanamun produksinyabisaberbedakarenaperbedaankemampuanmanajerial, hubunganketenagakerjaan,dll.Untukitu,secaraacakdilakukan pengamatan selama 40 hari dan hasilnya sebagai berikut: Pabrik-1Pabrik-2 Rataan Output harian420408 Standard Deviasi Output harian2520 5 Dipersiapkan oleh: [email protected] Apakahdatadiatasdapatdigunakansebagaibuktiyangnyata tentang perbedaan kinerja kedua pabrik tersebut ? 4.A sample of 200 Lion Store charge customers 50 years or older showed that20didnotpaytheirentirebalanceattheendofthemonth.A sampleof300customersunder30showedthat50didnotpaytheir entire balance at the end of the month.At the .02 significance level can we conclude that a larger percent of the younger customers do not pay their entire balance at the end of the month?Jawab: 50. overfor those less is amountentire the paying notthose of percentThe . Reject 11 . 2200) 86 (. 14 .300) 86 (. 14 .1667 . 10 .1667 .30050, 10 .20020, 14 .300 20050 20 -2.06. if Reject ::0010Hzp p p z HHHY O cY OY O =+== = = =++=>s Hen123456 78 Before 108 5 2 3 7 3 3 After7 5 6 8 8 810 2 7 Dipersiapkan oleh: [email protected] ANALYSIS OF VARIANCE Test for Equal Variances of Two Populations 0HNilai Statistik Uji 1HWilayah Kritik 2 21 2o o =2122sfs= ;Dengan derajat bebas v1=n1-1 untuk numerator, dan v2= n2-1 untuk denominator 2 21 2o o 2 21 2o o =1 1 2( , ) f f v vo 1 /2 1 2( , ) f f v vo Latihan Soal: TheInletSquareShoppingmallisconsideringtwodispensingmachines forsoft-drinks.Testsshowthatbothmachinescontrolthemeanamount dispensed,howeverthereseemstobeadifferenceinthevariability.The FizzitModelhadastandarddeviationof0.30ouncesforasampleof10.The Yale Model had a standard deviation of .15 ounces for a sample of 8.Atthe.10significancelevelisthereadifferenceinthevariabilityofthe two machines? Jawab: dispensed. amounts in the variation in the difference a is There. Reject 00 . 415 .30 .68 . 3 if Reject ::02202 212 20HFF HHHY FY F= =>==o oo o Analysis of Variance Test of Mean -The F distribution is also used for testing whether two or more sample means came from the same or equal populations.8 Dipersiapkan oleh: [email protected] -This technique is called analysis of variance or ANOVA -The null and alternate hypotheses for n-sample means is given as: = = = =tH 2 1 0:: 1Hpaling sedikit ada sepasang mean( ) ' , i idimana ' i i =-ANOVA requires the following conditions oThe sampled populations follow the normal distribution. oThe samples are independent oThe populations have equal standard deviations. ANOVA Table Source of Variation Sum of SquaresDegrees of Freedom Mean Square F Treatments (k) SST = ( )2kk k Gn X X k-1MST= SST/(k-1) MST MSE ErrorSSE = ( )2.i ki k kX X

n-kMSE= SSE/(n-k) TotalTSS =SST+SSE= ( )2ii GX X n-1 Latihan Soal: Theplantmanagerbelievesthatthetemperatureinthepackagingareaof theplantaffectsthedailyrateofproduction.Toinvestigatetheplant temperature is set at 65 degrees, 70 degrees, and 72 degrees.The number ofunitsproducedateachofthesetemperaturesforasampleofdaysis 9 Dipersiapkan oleh: [email protected] collected.Atthe.05significancelevelisthereadifferenceinthedaily production? Temperature: 650700720 689 11415 6510 3517 438 657 78 Jawab res. temperatu all forsame not the is produced units of numbermeanThe . Reject 87 . 517 / 5 . 1882 / 1 . 1303.59. F if Reject same. not the are means treatment The ::00172 70 65 0HFHHH= =>= = Perhitungan Anova 650 SSE TSS700 SSE TSS720 SSE TSS 6.002.781.828.001.650.429.002.472.72 1.0011.1140.3214.0053.0844.2215.0019.6158.52 6.002.781.825.002.945.5210.000.337.02 3.001.7818.925.002.945.5217.0041.3393.12 4.000.1111.223.0013.8018.928.006.610.42 6.002.781.825.002.945.527.0012.760.12 7.000.080.128.006.610.42 Avg (Group)4.33 6.71 10.57Avg (Total)7.35 Total 21.3375.9477.4380.2689.71162.36 SSE188.48 TSS318.55 10 Dipersiapkan oleh: [email protected] SST130.07 MST65.04 MSE11.09 F5.87 Fcrit3.59 Tabel Anova SUMMARY GroupsCountSumAverageVariance 6506.0026.004.334.27 7007.0047.006.7112.90 7207.0074.0010.5714.95 ANOVA Source of VariationSSdfMSFP-valueF crit Between Groups130.072.0065.045.870.013.59 Within Groups188.4817.0011.09 Total318.5519.00 When I reject the null hypothesis that the means are equal, I want to know whichtreatmentmeansdiffer?Oneofthesimplestproceduresisthrough the use of confidence intervals around the difference in treatment means. ( )1 21 21 1X X t MSEn n| | + |\ . t is obtained from the t table with degrees of freedom (n - k). Latihan Soal: Can plant manager conclude that there is a difference between the two results of the two treatments (650 and 720)? 11 Dipersiapkan oleh: [email protected] Jawab: ( ) ( )1 14.33 10.57 1.74 11.09 6.24 3.22 9.46, 3.026 7| | + = = |\ . Becausezeroisnotintheinterval,weconcludethatthispairofmeans differs. So, the mean number of daily rate of production of these treatments (650 and 720) is different. Two Factor Anova Sometimes there are other causes of variation. For the two-factor ANOVA wetestwhetherthereisasignificantdifferencebetweenthetreatment effectandwhetherthereisadifferenceintheblockingeffect(asecond treatment variable). Two Factor ANOVA Table Source of Variation Sum of SquaresDegrees of Freedom Mean Square F Treatments (k) SST = ( )2kk k Gn X X k-1MST= SST/(k-1) MST MSE Block (b) SSB = ( )2b Gr X X b-1MSB= SSB/(b-1) ErrorSSE = TSS-SST-SSB (k-1)( b-1)MSE= SSE/(k-1)( b-1) TotalTSS =SST+SSE= ( )2ii GX X n-1 12 Dipersiapkan oleh: [email protected] Latihan Soal Databerikutmenyajikanbanyaknyakatapermenithasilketikkan4 sekretaris dengan menggunakan 4 jenis processor komputer berbeda:

Intel Dual CoreIntel Quad Core AMD AthlonAMD Phenom Kim78627177 Amanda57496260 Steve69787283 Kevin71665967 Gunakan taraf nyata 5% untuk menguji hipotesis bahwa: a.Jenis mesin ketik tidak berpengaruh pada kecepatan mengetik. b.Keempat sekretaris tersebut mengetik sama cepatnya. Jawab: 13 Dipersiapkan oleh: [email protected] Perhitungan Anova

Intel Dual Core SSTSSBTSS Intel Quad Core SSTSSBTSS AMD AthlonSSTSSBTSS AMD Phenom SSTSSBTSS Kim78.00 5.6478.77 108.9462.00 58.14446.27 30.9471.00 9.77252.02 11.8277.00 70.1413.14 89.07 Amanda57.00111.5749.00344.5762.0030.9460.0057.19 Steve69.002.0778.00108.9472.0019.6983.00238.32 Kevin71.0011.8266.002.4459.0073.3267.000.32 Avg Col 68.75 63.75 66.00 71.75Avg Row 72.00 57.00 75.50 65.75Avg Total 67.56Total5.6478.77234.39255.0058.14446.27486.89264.009.77252.02135.77287.0070.1413.14384.89 SST143.69 SSB790.19TSS1241.94SSE308.06MST47.90MSB263.40MSE34.23 14 Dipersiapkan oleh: [email protected] Anova: Two-Factor Without Replication SUMMARYCountSumAverageVariance Kim42887254 Amanda42285732.66667 Steve430275.539 Kevin426365.7524.91667 Intel Dual Core427568.7576.25 Intel Quad Core425563.75142.9167 AMD Athlon 42646642 AMD Phenom428771.75104.9167 ANOVA Source of VariationSSdfMSFP-valueF crit Rows790.18753263.39587.695070.0074433.862548 Columns143.6875347.895831.399270.305233.862548 Error308.0625934.22917 Total1241.93815 15 Dipersiapkan oleh: [email protected] ANALISIS REGRESI DAN KORELASI Model Regresi Linier Sederhana Model populasi regresi linier sederhana dinyatakan dalam persamaan: i i iX Y c + | + o =;n i , , 2 , 1 =dengan - nX X X , , ,2 1adalah variabel kontrol - icadalah komponen sisaan yang tidak diketahui nilainya (acak) -o dan|adalah parameter yang akan diestimasi. Dalampersamaanregresidiatas,komponensisaan(ic =galat) merupakan komponen yang dapat menunjukkan: 1.Pengaruhdariberbagaivariabelyangtidakdimasukkandalampersamaan regresi karena berbagai pertimbangan 2.Penetapan persamaan matematika yang tidak sempurna 3.Kesalahanpengukurandalampengumpulandanpemrosesandataobservasi Modelpopulasiregersilinierinididugadenganmetodekuadratterkecil (leastsquaremethod).Prinsipinimeminimumkanselisihkuadratantara nilaiYobservasidannilaiYdugaan.Modelsampeluntukregresilinier sederhana adalah: bX a Y + =,dengan2 2X n XY X n XYb= danX b Y a =di mana: -Y: nilai dugaan bagi variabel tak bebas -Y : variabel/variabel tak bebas16 Dipersiapkan oleh: [email protected] -X : variabel/variabel bebas-Y : rata-rata dari nilai variabel/variabel tak bebas -X : rata-rata dari nilai variabel/variabel bebas -n : jumlah data sampel -a : intersep-Y/ adalah penduga bagi intersepo -b : kemiringan (slope)/ penduga bagi koefisien regresi| Besarnya nilai a dan b dapat diinterpretasikan sebagai berikut: pada saat X bernilainolmakabesarnyadugaannilaiYadalahsebesara,danbesarnya dugaanperubahannilaiYjikaterjadiperubahanpadanilaiXsatusatuan adalah sebesar b. TheStandardErrorofEstimatemeasuresthescatter,ordispersion,ofthe observed valuesaround the line of regression. The formula that is used to compute the standard error: ( )22 2Y YJKGsn n= = Selang Kepercayaan dan Pengujian Hipotesis bagiodan|Selang Kepercayaan bagioSelangKepercayaan( ) % 100 1 o bagiparametero dalamgarisregresi xx Y| o + =| adalah: xxniixxniinJx s tanJx s ta = =+ < < 122 /122 / o ooDengan 2 / otadalah sebaran t yang berderajat bebas n-2 17 Dipersiapkan oleh: [email protected] Selang Kepercayaan bagi|SelangKepercayaan( ) % 100 1 o bagiparameter| dalamgarisregresi xx Y| o + =| adalah: xx xxJs tbJs tb2 / 2 / o o| + < < Dengan 2 / otadalah sebaran t yang berderajat bebas n-2 Keterangan: Suatu taksiran tak bias bagi 2odirumuskan sebagai 2 22== =nJ JnJKGKTG sxy yy, dengan ( )nxx x x Jniiniinii xx211212|.|

\| = = == = ( )nyy y y Jniiniinii yy211212|.|

\| = = == = ( )( )nx yy x y y x x Jniiniinii inii i xy|.|

\||.|

\| = = = == =1 11 1 Selang Kepercayaan bagi 0| x YSelang Kepercayaan ( ) % 100 1 o bagi rataan respon 0| x Ydiberikan oleh ( ) ( )xxx YxxJx xns t yJx xns t y202 / 0 |202 / 01 10+ + < n dbt to maka 0Hditolak dan berlaku sebaliknya. Pendekatan Analisis Ragam Pengujianmodelregresidapatjugadilakukandenganmenggunakan analisis ragam, komponen keragamannya diuraikan dalam tabel berikut: Tabel analisis ragam untuk regresi linier sederhana Sumber Keragaman Derajat Bebas Jumlah Kuadrat Kuadrat Tengah F-hitung Regresi 1JKRKTRKTR/KTG Galatn-1JKGKTG Totaln-2JKT Keterangan: - yyJ JKT =- xyJ b JKR . =-JKR JKT JKG =-JKR KTR =-( ) 2 = n JKG KTG 20 Dipersiapkan oleh: [email protected] Analisis ragam di atas digunakan untuk menguji hipotesis0 :0= | H . 0Hakan ditolak bila ( ) 2 , 1 hitung >nF Fo dan berlaku sebaliknya. Latihan Soal 1 GunakandatapadaLatihanSoal2untukmelihatpengaruhdariTenaga Kerja (TK) terhadapGDP Nasional (model regresi linier sederhana). Jawab:SUMMARY OUTPUT Regression Statistics Multiple R0.917413486 R Square0.841647504 Adjusted R Square0.834106909 Standard Error41315.58833 Observations23 ANOVA dfSSMSFSignificance F Regression11.90525E+111.90525E+11111.61552877.33955E-10 Residual21358465346221706977839 Total222.26372E+11 CoefficientsStandard Errort StatP-valueLower 95%Upper 95% Intercept-111864.375544460.25084-2.5160536290.020069175-204324.5283-19404.22261 TK0.0061715020.00058415610.564825077.33955E-100.0049566840.007386321 Regresi Linier Berganda 21 Dipersiapkan oleh: [email protected] SekarangkitaakanmembicarakanmasalahpendugaannilaipeubahtakbebasYberdasarkanhasilpengukuranpadabeberapapeubahbebas nX X X , , ,2 1 .Misalsaja,kitainginmendugakecepatananginsebagai fungsi dari ketinggian tempat, suhu dan tekanan.Model populasi regresi linier berganda adalah: i n nX X X Y c + | + + | + | + o = 2 2 1 1(4) dengan - nX X X , , ,2 1adalah himpunan variabel kontrol -o dan n| | | , , ,2 1adalah parameter yang akan diestimasi. - icadalah komponen sisaan yang tidak diketahui nilainya (acak) Modelpopulasiregresilinierinididugadenganmetodekuadratterkecil (leastsquaremethod).Prinsipinimeminimumkanselisihkuadratantara nilaiYobservasi dan nilai Y dugaan. Model sampel untuk regresi linier sederhana adalah: n nX b X b X b a Y + + + + = 2 2 1 1(5) dengan-Y: nilai dugaan bagi peubah tak bebas - Y : peubah/variabel tak bebas- iX: peubah/variabel bebas- n : jumlah data sampel - a : intersep-Y adalah penduga bagi intersepo - b : kemiringan (slope) adalah penduga bagi koefisien regresi| Modelpopulasiregresilinierinididugadenganmetodekuadratterkecil (leastsquaremethod).Prinsipinimeminimumkanselisihkuadratantara nilai Y observasi dan nilai Y dugaan. 22 Dipersiapkan oleh: [email protected] ( ) = = = =niki k i i iniix b x b x b b y e JKG122 2 1 1 012DenganmenurunkanJKGterhadap kb b b , , ,1 0 kemudiansamakan dengan nol maka diperoleh persamaan normal sebagai berikut: = = = = == = = = == = = == + + + += + + + += + + + +nii kiniki knii kinii kinikinii iniki i knii iniiniiniiniki kniiniiy x x b x x b x x b x by x x x b x x b x b x by x b x b x b nb1 1212 211 110111112 1 2121 111 01 1 12 211 1 0 Misalkan dinotasikan matriks sebagai berikut: Matriks (((((

=kn nkkx xx xx xX 12 121 11111 Matriks(((((((((

= = = = == = == =nikinii kinikiniki iniiniinikiniix x x xx x x xx x nX X A1211111121111 11' Matriks (((((

=kbbbb10 23 Dipersiapkan oleh: [email protected] Matriks (((((((((

=======nii ki knii iniiy x gy x gy gg111 110 Persamaan normal:g Ab =Jika matriks A nonsingular maka koefisien regresig A b1 = Dugaan bagi 2oUntuk persamaan regresi linier : n i e x b x b x b b yi ki k i i i, , 2 , 1 ;2 2 1 1 0 = + + + + + = Dapat dirumuskan: JKR JKT JKG = ,yyJ JKT =nyg b JKRniikjj j210|.|

\| === Dan dugaan bagi 2odirumuskan sebagai: 12 = =k nJKGKTG s Selang Kepercayaan dan Uji Hipotesis Selang Kepercayaan bagi 0 20 0, , , |kx x x Y Selangkepercayaan( ) % 100 1 o untukrataanrespon 0 20 0, , , |kx x x Y dirumuskan oleh: 24 Dipersiapkan oleh: [email protected] 01 |0 2 0 , , , | 01 |0 2 0 0 20 0x A x s t y x A x s t ykx x x Y + < < o o 2 otadalah sebaran tdengan derajat bebas n-k-1. Selang Kepercayaan bagi 0ySelangSelangkepercayaan( ) % 100 1 o untukrepsontunggal 0ydirumuskan oleh: 01 |0 2 0 0 01 |0 2 01 1 x A x s t y y x A x s t y + + < < + o o 2 otadalah sebaran tdengan derajat bebas n-k-1. Pengujian Hipotesis Ujihipotesisbagi 0 0:j jH | | = danlawanalternatifnyaadalah 0 1:j jH | | = atau 0 1:j jH | | > menggunakannilaikritisyang dirumuskan : ijj jc sbt0| =dengan derajat bebas dari sebaran t sebesar n-k-1. Note: Gunakan sebarant dengan 2 otuntuk uji dua arah, dan otuntuk uji satu arah. Latihan Soal 2: Dengan menggunakan data di bawah ini, akan coba dimodelkan persamaan regresi linier berganda sebagai berikut: 0 1 2 3 t t t tGDP GEI INF TK o o o o c = + + + + TAHUNGDPGEITKINF1984184458.318884.151707907.010.5 1985188627.919697.649943612.04.7 1986212475.414242.757587608.05.9 1987222598.514854.259415707.09.1 25 Dipersiapkan oleh: [email protected] 1988236004.218149.661331571.05.8 1989253805.519348.362230688.06.0 1990271968.224716.763838246.010.0 1991290870.725248.364925209.09.5 1992309659.226668.566928756.05.0 1993329775.928428.067627359.010.5 1994354460.828106.270985706.09.2 1995383792.325136.667107536.08.6 1996413797.928465.675241508.06.5 1997433245.927340.774802384.011.1 1998376374.927234.887671605.077.6 1999379352.525862.388814897.021.5 2000398016.97792.289835383.09.4 2001411132.111161.890808640.012.6 2002429121.29095.391648668.010.0 2003449363.716059.490785986.05.1 2004471970.614918.293721611.06.4 2005498792.59943.094947049.017.1 2006526144.315042.095452152.02.9 Model regresi linier di atas menjelaskan bahwa kita ingin melihat pengaruh daripengeluaranpemerintahuntukinfrastruktur(GEI),tingkatinflasi (INF), dan jumlah tenaga kerja (TK) nasional terhadap GDP nasional Jawab: SUMMARY OUTPUT Regression Statistics Multiple R0.955476772 R Square0.912935862 26 Dipersiapkan oleh: [email protected] Adjusted R Square0.899188893 Standard Error32207.27512 Observations23 ANOVA dfSSMSFSignificance F Regression32.06663E+11 68887635270 66.409974052.94127E-10 Residual19197088628451037308571 Total222.26372E+11 CoefficientsStandard Errort StatP-valueLower 95%Upper 95% Intercept-248986.578651871.27238 -4.800086198 0.000124442-357554.3992-140418.758 GEI3.8853684621.1474643293.386047273 0.0031007711.4836980256.287038899 TK0.0072307690.00052896213.669723552.7861E-110.0061236380.0083379 INF -1594.902039512.3277841-3.113050060.00572605-2667.216413-522.5876657 Koefisien Determinasi dan Koefisien Korelasi Koefisienkorelasi(r)dankoefisiendeterminasi(2r atau 2R )yang merupakan suatu ukuran kebaikan suai (Goodness of Fit) Sekarang kita akan membahas kebaikan suai garis regresi yang dicocokkan terhadapsekumpulandata;yaitukitainginmengetahuisebaikmanagarisregresi sampel mencocokkan data. Koefisien determinasi 2r(untuk regresisederhana) atau 2R(untuk regresi berganda). 2 2221 12 2 2 xy i ixyi i y xS y xS JKRrJKT y y S S| | = = = = = Dengan ixadalah simpangan (galat) rata-rata sampel,( ) X X xi i =27 Dipersiapkan oleh: [email protected] iyadalah simpangan (galat) rata-rata sampel,( ) Y Y yi i = ( )22 2 21 i i iJKR y Y Y x | = = = ( )22i iJKT y Y Y = = ( )( ) = =nXX X X xii i i2222 ( )( ) = =nYY Y Y yii i i2222 ( )) 1 ( 121 12122|.|

\|== = ==n nX X nnX XSniiniiniix ;untuk ukuran sampel kecil ( )) 1 ( 121 12122|.|

\|== = ==n nY Y nnY YSniiniiniiy;untuk ukuran sampel kecil Dalam formulasi yang lain, koefisien korelasi dapat diformulasikan sebagai ( )( )( )1X YX X Y Yrn S S = Sifat 2r : 1. 2rmerupakan besaran positif. 2.Batasnilainya,1 02s s r .Suatu 2r sebesar1artinyasuatu kecocokkansempurna,sedangkan 2r yangbernilai0berartitidakada hubungan antara variabel tak bebas dengan variabel yang menjelaskan. 28 Dipersiapkan oleh: [email protected] Suatubesaranyangberhubunganerattetapisecarakonsepsangatberbeda dari 2r adalahkoefisienkorelasi,yaituukuranyangmenyatakantingkat keeratan hubungan antara dua variabel. Koefesien korelasi dirumuskan oleh: 2r r = Beberapa sifat r: 1.rdapatbernilainegatifataupositif,nilainyaberadapadaselang 1 1 s s r . 2.Simetris,artinyakoefisenkorelasiantaraXdanY( )XYr samadengan koefisien korelasi antara Y dan X ( )YXr . 3.JikaXdanYbebassecarastatistikmakakoefisienkorelasiantara keaduanyaadalah0;tetapikalau0 = r tidakberartikeduavariabel tersebut saling bebas. 4.r hanyalah suatu ukuran hubungan linier atau ketergantungan linier saja dan tidak mempunyai arti untuk menggambarkan hubungan nonlinier. Koefisiendeterminasi 2r adalahukuranyanglebihberartidarir.Halini dikarenakan 2r menyatakan proporsi variasi total dalam variabel tak bebas yangdijelaskanolehvariabelbebasdankarenanyamemberikansuatu ukurankeseluruhanmengenaisejauhmanavariasidalamsatuvariabel menentukanvariasidalamvariabellain.Halinilahyangtidakdapat dijelaskan oleh r. Agarlebihjelasmemahamikoefesiankorelasidankoefisiendeterminasi,misalkandiberikankoefesienkorelasiantaraXdanYdalamFungsi RegresiSampel i i iu X Y + + =1 0| | ,yaitu987 . 0 = r ,koesisienkorelasi sebesar0.987menunjukkanbahwakeduavariabelberkorelasipositif dengansangatbaik.Sedangkoefisiendeterminasi,yakni974 , 02= rmengartikanbahwa97,4persendarivariasiataukeragamanvariabelY dapat dijelaskan oleh variabel X. 2ryang besar menyarankan bahwa garis regresi sampel sangat baik dalam mencocokkan data. 29 Dipersiapkan oleh: [email protected] Did a computed r come from a population of paired observations with zero correlation? Ho: = 0 (The correlation in the population is zero.) H1: 0 (The correlation in the population is different from zero. t test for the coefficient of correlation 221r ntr= dengan derajat bebas n-2 Koefisien korelasi pada Latihan 2 kasus Regresi Berganda sebelumnya: GDPGEITKINF GDP1.000 GEI-0.1831.000 TK0.917-0.3661.000 INF0.1060.2310.2591.000 30 Dipersiapkan oleh: [email protected]