1-suwarno-modul-9-analisis-regresi (1)

26
rancis Galton, adalah orang yang pertama kali memperkenalkan alat statistik yang bernama analisis regresi dan analisis korelasi. Ia lahir pada 16 Februari 1822 di Birmingham, Inggris. Galton mempelajari hubungan antara tinggi badan ayah dan anak. Ia mengamati bahwa tinggi anak yang bera-sal dari tinggi dan pendek cenderung “mundur (regress)” ke arah rataan grup. Ia menamakan kecenderungan ini regresi ke arah “mediokritas (sedang)”. Galton kemudian mengem-bangkan suatu deskripsi matematis bagi kecenderungan re-gresi ini. Istilah regresi tetap bertahan sampai hari ini untuk menjelaskan hubungan statistik antara dua atau lebih peu-bah. Dengan mempelajari modul 9 ini, Anda memperoleh pengetahuan tentang beberapa konsep yang terkait dengan analisis regresi linear sederhana dan analisis korelasi. Setelah mempelajari modul ini, secara umum, Anda diharapkan dapat membedakan penggunaan analisis regresi linear sederhana dan analisis korelasi. Secara khusus, Anda diharapkan dapat: 1. Membedakan analisis regresi linear sederhana dengan analisis korelasi. 2. Menentukan korelasi linear antara dua peubah 1 MODUL 9 ANALISIS REGRESI LINEAR SEDERHANA DAN KORELASI Drs. Suwarno, M.Si. PENDAHULUAN F

description

staistik

Transcript of 1-suwarno-modul-9-analisis-regresi (1)

Page 1: 1-suwarno-modul-9-analisis-regresi (1)

rancis Galton, adalah orang yang pertama kali memperkenalkan alat statistik yang

bernama analisis regresi dan analisis korelasi. Ia lahir pada 16 Februari 1822 di Birmingham, Inggris.

Galton mempelajari hubungan antara tinggi badan ayah dan anak. Ia mengamati bahwa tinggi anak yang bera-sal dari tinggi dan pendek cenderung “mundur (regress)” ke arah rataan grup. Ia menamakan kecenderungan ini regresi ke arah “mediokritas (sedang)”. Galton kemudian mengem-bangkan suatu deskripsi matematis bagi kecenderungan re-gresi ini.

Istilah regresi tetap bertahan sampai hari ini untuk menjelaskan hubungan statistik antara dua atau lebih peu-bah.

Dengan mempelajari modul 9 ini, Anda memperoleh pengetahuan tentang beberapa konsep yang terkait dengan analisis regresi linear sederhana dan analisis korelasi.

Setelah mempelajari modul ini, secara umum, Anda diharapkan dapat membedakan penggunaan analisis regresi linear sederhana dan analisis korelasi.

Secara khusus, Anda diharapkan dapat:1. Membedakan analisis regresi linear sederhana dengan analisis korelasi.2. Menentukan korelasi linear antara dua peubah3. Menjelaskan pegertian peubah tak bebas (dependent variables) dengan peubah

bebas (independent variables).4. Menjelaskan asumsi-asumsi yang mendasari analisis regresi linear sederhana5. Menentukan dan mengartikan penduga inetersep dan slope pada regresi linear

sederhana.6. Menjelaskan konsep koefisien determinasi 7. Melakukan uji hipotesis terhadap intersep dan slope pada regresi linear seder-

hana.

Sajian materi modul ini dibagi dalam tiga kegiatan belajar, yaitu:

Kegiatan Belajar 1: mencakup hakekat regresi linear, regresi linear sederhana, peubah tak bebas dengan peubah bebas, asumsi-asumsi dalam regresi linear

1

MODUL

9ANALISIS REGRESI LINEAR

SEDERHANA DAN KORELASI

Drs. Suwarno, M.Si.

PENDAHULUAN

F

Page 2: 1-suwarno-modul-9-analisis-regresi (1)

sederhana, pengertian interesep dan slope, konsep koefisien deter-minasi.

Kegiatan Belajar 2: Inferensi dalam analisis regresi linear sederhana: uji hipotesis interesep dan slope.

Kegiatan Belajar 3: mencakup hakekat korelasi, analisis korelasi, perbedaan analisis kore-lasi dan analisis regresi linear sederhana.

Agar Anda dapat memahami modul ini dengan baik, sebaiknya Anda bekerja sama dalam kelompok belajar untuk mendiskusikan dan menyelesaikan kesulitan yang Anda hadapi ketika mempelajari modul. Mulailah dengan membaca dan mencoba memahami penjelasan dalam modul disertai dengan catatan-catatan yang Anda anggap perlu. Kerjakan setiap contoh soal dan latihan, dan melihat penyelesaiannya kemudian setelah Anda selesai mengerjakan. Demikian juga ketika Anda mengerjakan soal tes formatif. Jika hasil yang Anda peroleh masih salah, pahami kembali teorinya dan kerjakan kembali soalnya hingga Anda tidak menemukan kesalahan.

Selamat Belajar, Semoga Berhasil.

2

Page 3: 1-suwarno-modul-9-analisis-regresi (1)

Kegiatan Belajar 1

Analisis Regresi Linear Sederhana

Analisis regresi merupakan alat statistik yang memanfaatkan hubungan antara dua atau lebih peubah kuantitatif sehingga salah satu peubah bisa diramalkan dari peubah-peubah lainnya. Misalnya, jika kita tahu hubungan antara kemampuan awal siswa dan prestasi belajarnya pada tahun pertama di Sekolah Menengah Pertama (SMP), maka kita dapat meramal prestasi belajar siswa melalui analisis regresi jika kemampuan awal siswa telah kita ketahui.

Pada modul ini, kita akan membahas analisis regresi dengan satu peubah peramal untuk meramal peubah yang menarik perhatian kita. Di dalam modul ini khususnya, kita kupas gagasan dasar analisis regresi dan membahas pendugaan paramter-parameter yang ada di dalam model.

9.1.1 Hubungan Antara Peubah-peubahKonsep suatu hubungan antara dua peubah, seperti misalnya antara pendapatan keluarga dan pengeluaran keluarga untuk perumahan, sudah sangat kita kenal. Kita akan membe-dakan antara hubungan fungsional dan hubungan statistik, dan akan mengupas masing-masing itu.

Hubungan Fungsional antara Dua PeubahSuatu hubungan fungsional antara dua peubah dinyatakan melalui suatu rumus matematis. Jika X peubah bebas (independent variable) dan Y peubah takbebas (dependent variable), hubungan fungsional adalah berbentuk:

Y = f(X)

Jika suatu nilai X diketahui, fungsi f dapat menunjukkan nilai Y padanannya.

Contoh 9.1.1 Perhatikan hubungan antara volume penjualan dalam rupiah (Y) sebuah produk yang dijual pada harga tetap tertentu dan banyaknya unit barang yang terjual (X). Jika harga jualnya adalah Rp 2.000,- per unit, maka hubungan antara keduanya dapat dinyatakan oleh persamaan:

Y = 2XHubungan fungsional ini ditunjukkan dalam Gambar 9.1. Banyaknya unit terjual dan volume penjualan selama tiga periode terakhir (harga jual tetap konstan pada Rp 2.000,- per unit) ialah sebagai berikut:

3

Page 4: 1-suwarno-modul-9-analisis-regresi (1)

Gambar 9.1.1 Teladan Hubungan Fungsional

Tabel 9.1.1 Banyaknya unit terjual pada setiap periode

PeriodeBanyaknya Unit

TerjualVolume Penjualan(Ribuan Rupiah)

123

75 25130

150 50 260

Amatan-amatan ini kemudian diplotkan dalam Gambar 9.1.1 Perhatikan bahwa semua titik amatan jatuh tepat pada garis hubungan fungsional. Inilah ciri hubungan fungsional.

Hubungan Statistik antara Dua PeubahHubungan statistik, tidak seperti fungsional, tidaklah sempurna. Pada umumnya, amatan-amatan untuk suatu hubungan statistik tidak jatuh tepat pada kurva hubungan tersebut.

Contoh 9.1.2. Suatu penelitian ingin mengetahui hubungan antara Perhatian Orang Tua (POT) dengan Prestasi Belajar Siswa. Tabel 9.1.1. mencantumkan data skore POT dan prestasi belajar siswa untuk 10 siswa yang dipilih secara acak dari suatu sekolah. Data ini diplotkan dalam Gambar 9.1.2a. Prestasi belajar siswa diambil sebagai peubah takbebas atau peubah respons Y, sedangkan skore POT sebagai peubah bebas atau peubah peramal X. Pengeplotannya dilakukan seperti sebelumnya. Sebagai misal, siswa pertama diplotkan sebagai X = 30, Y = 44.

4

300

200

100

50 1000 X

YRibuan Rp

Unit terjual

Y = 2X

Page 5: 1-suwarno-modul-9-analisis-regresi (1)

Gambar 9.1.2 Hubungan Statistik antara POT dan Prestasi Belajar Siswa

Gambar 9.1.2a secara jelas mengindikasikan adanya suatu hubungan antara skore POT dengan prestasi belajar siswa, dalam pengertian bahwa semakin besar skore POT, semakin besar pula prestasi belajarnya. Akan tetapi, hubungan ini tidak sempurna. Titik-titiknya agak memencar, menunjukkan bahwa ada keragaman prestasi belajar yang tidak bisa dijelaskan oleh skore POT. Misalnya, dua siswa runtutan (1 dan 8) yang sama-sama memiliki skore POT 30, namun keduanya memiliki prestasi belajar yang sedikit berbeda. Karena perpencarannya titik-titik di dalam suatu hubungan statistik, maka Gambar 9.1.2a dinamakan diagram pencar atau plot pencar. Dalam terminologi statistika, setiap titik dalam diagram pencar menyatakan suatu tindakan (trial) atau suatu kasus.

Dalam Gambar 9.1.2b, kita telah memplot suatu garis yang menggambarkan hubungan statistik antara prestasi belajar siswa dengan POT. Garis ini mengindikasikan kecenderungan umum bervariasinya prestasi belajar siswa berkaitan dengan berubahnya skore POT. Perhatikan bahwa sebagian besar titik tidak jatuh tepat pada garis hubungan statistik tersebut. Perpencaran titik-titik di sekitar garis ini menggambarkan keragaman prestasi belajar siswa yang tidak ada kaitannya dengan skore POT dan biasanya dianggap bersifat acak. Hubungan statistik bisa sangat bermanfaat, walaupun hubungan semacam ini tidak memiliki kepastian seperti halnya hubungan fungsional.

Contoh 9.1.3. Gambar 9.1.3. menyajikan data umur dan kandungan sejenis steroid di dalam plasma untuk 17 perempuan sehat yang berumur antara 8 dan 25 tahun. Data ini mengindikasikan adanya suatu hubungan statistik yang kurvilinear (tidak linear). Kurva ini mengimplikasikan bahwa sejalan dengan semakin tingginya umur, kandungan steroid naik sampai suatu titik tertentu dan kemudian mulai menurun. Perhatikan sekali lagi memencarnya titik-titik di sekitar kurva hubungan statistik ini, yang tipikal pada semua hubungan statistik.

5

80706050403020

100

90

80

70

60

50

40

X

Y

a b

Page 6: 1-suwarno-modul-9-analisis-regresi (1)

Gambar 9.1.3. Hubungan Statistik Kurvilinear antara Umur dan Kandungan Steroid pada Perempuan Sehat Berumur 8 sampai 25.

9.1.2. Model Regresi dan Kegunaannya

Konsep DasarModel regresi merupakan suatu cara formal untuk mengekspresikan dua unsur penting suatu hubungan statistik :1. Suatu kecenderungan berubahnya peubah tidak bebas Y secara sistematis sejalan dengan

berubahnya peubah besar X.2. Perpencaran titik-titik di sekitar kurva hubungan statistik itu.

Kedua ciri ini disatukan dalam suatu model regresi dengan cara mempostulatkan bahwa :1. Ada suatu rencana peluang peubah Y untuk setiap taraf (level) peubah X.2. Rataan sebaran-sebaran peluang berubah secara sistematis sejalan dengan berubahnya

nilai peubah X.

Contoh 9.1.4. Misalkanlah Y menyatakan prestasi belajar siswa dan X menyatakan skore perhatian orang tua (POT). Dalam hal ini di dalam model regresi peubah Y diperlakukan sebagai suatu peubah acak. Untuk setiap skore perhatian orang tua, ada sebaran peluang bagi Y. Gambar 9.1.4. menunjukkan sebaran peluang demikian ini untuk X = 30, yaitu skore POT sebesar 30. Tabel 9.1.1. Nilai amatan Y yang sesungguhnya (44 dalam contoh kita ini) dengan demikian dipandang sebagai suatu amatan acak dari sebaran peluang ini.

6

0 10 15 20 25 5 X

Y

5

10

15

20

25

30

Tingkat Steroid

Umur (th)

Skore POTX

70

50

30

0 Prestasi Belajar

Distribusi Peluang bagi Y

Garis Regresi

Page 7: 1-suwarno-modul-9-analisis-regresi (1)

Gambar 9.1.4. Representasi Gambar bagi Model Regresi Linear

Gambar 9.1.4. juga menunjukkan sebaran peluang Y untuk ukuran lot X = 50 dan X = 70. Perhatikan bahwa rataan sebaran-sebaran peluang ini mempunyai hubungan yang sistematis dengan taraf-taraf peubah X. Hubungan sistematis ini dinamakan fungsi regresi Y terhadap X. Grafik fungsi regresi ini dinamakan kurva regresi. Perhatikan bahwa fungsi regresi dalam Gambar 9.1.4. adalah linear. Ini berimplikasi untuk contoh kita bahwa prestasi belajar siswa rata-rata bervariasi secara linear dengan skore POT. Tentu saja tidak ada alasan apriori mengapa prestasi belajar siswa mempunyai hubungan linear dengan skore POT.

Dua model regresi mungkin saja berbeda dalam hal bentuk fungsi regresinya, dalam hal bentuk sebaran peluang bagi peubah Y, atau dalam hal lainnya lagi. Apapun perbedaannya, konsep sebaran peluang bagi Y untuk X yang diketahui merupakan pasangan formal bagi diagram pencar dalam suatu relasi statistik. Begitu pula, kurva regresi, yang menjelaskan hubungan antara rataan sebaran-sebaran peluang bagi Y dengan X, merupakan pasangan formal bagi kecenderungan umum bervariasinya Y secara sistematis terhadap X dalam suatu hubungan statistik.

Catatan :Ungkapan “peubah bebas” atau “peubah peramal” bagi X dan “peubah takbebas” atau “peubah respons” bagi Y dalam suatu model regresi adalah kebiasaan saja. Tidak ada implikasi bahwa Y bergantung secara kausal pada X. Betapa pun kuatnya suatu hubungan statistik, ini tidak berimplikasi adanya hubungan sebab-akibat. Dalam kenyataannya, suatu peubah bebas mungkin saja sesungguhnya bergantung secara kausal pada peubah responsnya, seperti bila kita menduga suhu (respons) dari tinggi air raksa (peubah bebas) dalam suatu termometer.

Bentuk Fungsional Hubungan RegresiPemilihan bentuk fungsional hubungan regresi terkait dengan pemilihan peubah bebasnya. Ada kalanya, teori bilang ilmu bersangkutan bisa menunjukkan bentuk fungsional yang cocok. Teori belajar, misalnya, mungkin mengindikasikan bahwa fungsi regresi yang menghubungkan biaya produksi dengan berapa kali suatu item tertentu telah pernah muncul harus memiliki bentuk tertentu dengan sifat-sifat asimtotik tertentu pula.

Yang lebih sering dijumpai adalah bahwa bentuk fungsional hubungan regresi tersebut tidak diketahui sebelumnya, sehingga harus ditetapkan setelah datanya diperoleh dan dianalisis. Oleh karenanya, fungsi regresi linier atau kuadratik sering digunakan sebagai suatu hampiran yang cukup memuaskan bagi fungsi regresi yang tidak diketahui bentuknya. Bahkan, kedua jenis fungsi regresi yang sederhana itu masih juga sering digunakan meskipun teori yang mendasarinya menunjukkan bentuk fungsionalnya, terutama bila bentuk fungsional yang ditunjukkan oleh teori terlalu rumit namun secara logis bisa dihampiri oleh suatu fungsi linier atau kuadratik.

Cakupan Model. Ketika memformulasikan suatu model regresi, kita biasanya harus membatasi cakupan model ke suatu selang atau daerah nilai-nilai tertentu peubah bebasnya. Cakupan ini ditentukan oleh rancangan penelitian atau oleh jangkauan data yang tersedia.

7

Page 8: 1-suwarno-modul-9-analisis-regresi (1)

Misalnya, sebuah perusahaan yang mempelajari pengaruh harga terhadap volume penjualan menyelidiki enam tingkat harga, mulai dari Rp 4.950,- sampai Rp 6.950,-. Disini cakupan model akan dibatasi pada harga-harga yang berkisar dari dekat Rp 5.000,- ke dekat Rp 7.000,-. Bentuk fungsi regresi akan cukup meragukan di luar kisaran harga ini sebab penelitian tidak memberikan informasi mengenai sifat hubungan statistik di bawah Rp 4.950,- dan di atas Rp 6.950,-.

Kegunaan Analisis RegresiAnalisis regresi mempunyai tiga kegunaan utama: (1) deskripsi, (2) kontrol atau kendali, dan (3) peramalan. Ketiga kegunaan itu telah diilustrasikan oleh ketiga contoh yang telah dikemukakan di atas. Studi tentang pembelian traktor mempunyai tujuan deskripsi. Dalam studi biaya pengoperasian kantor cabang, tujuannya adalah pengendalian administrasi; dengan mengembangkan suatu hubungan statistik yang bermanfaat antara biaya dengan peubah-peubah bebas di dalam sistem itu, maka pihak menejemen berhasil menetapkan biaya standart untuk setiap kantor cabang. Dalam studi medis terhadap anak-anak pendek, tujuannya adalah peramalan. Dokter dapat menggunakan hubungan statistik untuk meramalkan kekurangan hormon pertumbuhan pada anak-anak pendek dengan menggunakan indikator-indikator sederhana yang mudah diukur.

Di dalam praktek, beberapa kegunaan regresi sering ditemukan dalam suatu analisis regresi, misalnya ialah contoh hubungan POT dengan prestasi belajar siswa. Pengetahuan mengenai hubungan antara skore POT dengan prestasi belajar siswa, di masa datang dapat digunkan untuk memberikan pengetahuan pada orang tua bahwa anaknya perlu mendapatkan perhatian dalam belajarnya, jika ingin anaknya mempunyai prestasi belajar yang cukup baik.

9.1.3 Model Regresi Linear Sederhana dengan sebaran Suku-suku Galat Tidak Diketahui

Model Pada Kegiatan Belajar I ini, kita akan membahas suatu model regresi dasar yang melibatkan hanya satu peubah bebas dan fungsi regresinya linear. Adapun model regresinya dapat dituliskan sebagai berikut:

Yi = 0 + 1Xi + i (9.1.1)

Dalam hal ini :Yi adalah nilai perubahan respons dalam amatan ke-i0 dan 1 adalah parameterXi adalah konstanta yang diketahui, yaitu nilai peubah bebas dari amatan ke-i1 adalah suku galat yang bersifat acak dengan rataan E{i} = 0 dan ragam 2{i} = 2; i dan j tidak berkorelasi sehingga peragam (covariance) {I, j} = 0 untuk semua i, j; i ji = 1, 2, . . . ., n

8

Page 9: 1-suwarno-modul-9-analisis-regresi (1)

Model regresi (9.1.1) dikatakan sederhana, linear dalam parameter, dan linier dalam peubah bebas. Dikatakan “sederhana” karena hanya ada satu peubah bebas, “linear dalam parameter” karena tidak ada parameter yang muncul sebagai salah satu eksponen atau dikalikan atau dibagi oleh parameter lain, dan “linear dalam peubah bebas” sebab peubah ini di dalam model berpangkat satu. Model yang linear dalam parameter dan linear dalam peubah bebas juga dinamakan model ordo-pertama.

Ciri-Ciri Penting Model1. Nilai Yi teramati pada amatan ke-i merupakan jumlah dua komponen : (1) suku

konstan 0 + 1Xi dan (2) suku galat i. Jadi Yi adalah suatu peubah acak.2. Karena E{i} = 0, maka kita peroleh :

E{Yi} = E{0 + 1Xi + i} = 0 + 1Xi + E{i} = 0 + 1Xi

Perhatikan bahwa 0 + 1Xi memainkan peranan sebagai konstanta. Jadi, respons Yi

bila nilai X pada amatan ke-i adalah Xi berasal dari suatu sebaran peluang yang rataannya adalah :

E{Yi} = 0 + 1Xi (9.1.2)

oleh karena itu kita peroleh fungsi regresi bagi model (9.1.1), yaitu :

E{Y} = 0 + 1X (9.1.3)

Karena fungsi regresi menghubungkan rataan sebaran peluang bagi Y untuk X tertentu dengan nilai X itu sendiri.

3. Nilai teramati Y pada amatan ke-i lebih besar atau lebih kecil daripada nilai fungsi regresi dengan selisih sebesar i.

4. Setiap suku galat i diasumsikan mempunyai ragam yang sama 2. oleh karenanya, respons Yi mempunyai ragam yang sama pula :

2 {Yi} = 2 (9.1.4)

Karena, berdasarkan sifat variansi, kita memperoleh :

2{0 + 1Xi + i} = 2 {i) = 2

Jadi, model regresi (9.1.1) mengasumsikan bahwa sebaran peluang bagi Y mempunyai ragam yang sama 2, tidak tergantung pada nilai peubah bebas X.

5. Suku-suku galat diasumsikan tidak berkorelasi. Oleh karenanya, hasil dari setiap amatan manapun yang mempengaruhi galat dari amatan lain yang manapun baik posotof atau negatif, kecil atau besar. Karena galat, i dan j tidak berkorelasi, maka begitu juga dengan respons Yi dengan Yj.

6. Ringkasan model regresi (9.1.1) mengimplementasikan bahwa peubah respons Y i

bersal dari sebaran peluang dengan rataan E{Yi) = 0 + 1Xi dan ragam 2 yang sama untuk semua nilai X. lebih lanjut, dua amatan sembarang Y i dan dan Yj tidak berkorelasi.

9

Page 10: 1-suwarno-modul-9-analisis-regresi (1)

Contoh 9.1.5.Misalkan bahwa model regresi (9.1.1) dapat diterapkan pada Contoh Hubungan Skore Perhatian Orang Tua dengan Prestasi Belajar Siswa dan model itu ialah sebagai berikut:

Yi = 15.6 + 1.09Xi + i

Pada Gambar 9.1.5 dapat dilihat fungsi regresi :

E{Y} = 15.6 + 1.09X

Gambar 9.1.5

Misalnya bahwa suatu skore POT Xi = 40 dan ternyata prestasi belajar siswa yang teramati ialah Y1 = 62. maka galatnya ialah I = +2.8 sebab

E{Y1) = 15.6 + 1.09(40) = 59.2

dan

Yi = 62 = 59.2+2.8

Gambar 9.1.5 memperlihatkan sebaran peluang bagi Y untuk X= 40, dan memperlihatkan dari mana di dalam sebaran ini amatan Y1 = 62 beasal. Perhatikan sekali lagi bahwa suku galat I tidak lain adalah simpangan Yi dari nilai rataannya E(Yi).

Gambar 9.1.5 juga memperhatikan sebaran peluang bagi Y bila X = 20. Perhatikan bahwa sebaran ini mempunyai ragam yang sama seperti sebaran peluang bagi Y untuk X = 45, sesuai dengan persyaratan model regresi (9.1.1).

Makna Parameter Regresi

10

Y1 = 62

(Y1) = 2.8

E(Y1) = 59.2

E(Y) =15.6 +1.09X

20 40 X

Skore POT

Page 11: 1-suwarno-modul-9-analisis-regresi (1)

Kedua parameter 0 dan 1 dalam model regresi (9.1.1) dinamakan koefisien regresi. 1

adalah kemiringan (slope) garis regresi. Kemiringan menunjukkan perubahan rataan sebaran peluang bagi Y untuk stiap kenaikan X satu satuan. Parameter 0 adalah nilai intersep Y garis regresi tersebut. Bila cakupan model tidak mencakup X = 0, maka 0

tidak mempunyai makna.

Contoh 9.1.6: Gambar 9.1.6 memperlihatkan fungsi regresi :

E(Y) = 15.6 + 1.09X

bagi contoh hubungan POT dengan prestasi belajar siswa. Kemiringan 1 = 1.09 menunjukkan bahwa kenaikan skore POT satu satuan akan menaikkan rataan sebaran peluang bagi Y sebesar 1.09.

Gambar 9.1.6. Fungsi regresi E(Y) = 15.6 + 1.09X

Intersep 0 = 15.6 menunjukkan nilai fungsi pada X = 0. Akan tetapi, karena model regresi linear ini diformulasikan untuk diterapkan pada skore POT yang berkisar antara 20 sampai 80, maka dalam hal ini 0 tidak mempunyai makna. Khususnya, parameter ini tidak berarti bisa diartikan sebagai rata-rata prestasi belajar siswa bila tidak mendapatkan perhatian oranmg tua sama sekali. Suatu model dengan fungsi regresi kurvilinear dan satuan nilai 0 yang berbeda daripada yang ada di dalam model linear ini mungkin diperlukan cakupan model yang diperluas sampai nol.

9.1.4 Pendugaan Fungsi Regresi

11

50

Y

0 10 20 30 40 x

E(Y) = 15.6 + 1.09 X

1 = 1.09

Kemirinagn X

0 = 15.6

Skore POT

Prestasi Belajar

Page 12: 1-suwarno-modul-9-analisis-regresi (1)

Kita coba perhatikan Contoh hubungan Skore Perhatian Orang Tua (POT) dengan Prestasi Belajar Siswa untuk mengilustrasikan pendugaan fungsi regresi linear sederhana. Data observasional untuk runtutan siswa yang teramati, yaitu skore POT (X) dan prestasi belajar siswa disajikan dalam Tabel 9.1. Kita akan melambangkan amatan (X, Y) dari tindakan pertama sebagai (X1, Y1) untuk tindakan kedua sebagai (X2, Y2) dan secara umum untuk tindakan ke-i sebagai (Xi, Yi), dengan i = 1, 2, . . . ., n. Untuk data dalam Tabel 9.1, X1 = 30, Y1 = 40, dan seterusnya, dan n = 10.

Tabel 9.1.2 Data Skore Perhatian Orang Tua (POT) dan Prestasi Belajar Siswa

Runtutan ke- I Skore POT Xi Prestasi Belajar Yi

12345678910

30206080405060307060

44388798627080479285

Metode Kuadrat TerkecilUntuk mendapatkan penduga yang “baik” bagi parameter regresi 0 dan 1 kita akan menerapkan metode kuadrat terkecil. Untuk setiap amatan sampel(Xi, Yi), metode kuadrat terkecil akan menggunakan simpangan Yi dari nilai harapannya :

Yi – (0 + 1Xi) (9.1.7)

Lebih tepatnya metode kuadrat terkecil akan menggunakan jumlah n simpangan kuadrat. Kriterium ini dilambangkan sebagai Q :

Q = (9.1.8)

Menurut metode kuadrat terkecil, penduga bagi 0 dan 1 ialah nilai-nilai b0 dan b1

yang meminimumkan kriterium Q untuk data amatan yang dimiliki.

Contoh 9.1.5. Gambar 9.1.7a mengulang kembali diagram pencar data dalam Tabel 9.1.1 untuk Contoh hubungan skore POT dengan Prestasi Belajar Siswa. Dalam Gambar 9.1.7b diplotkan garis regresi suaian (fitted regression line) dengan menggunakan nilai dugaan sembarang berikut:

12

Page 13: 1-suwarno-modul-9-analisis-regresi (1)

Gambar 9.1.9 Strategi untuk Analisis Regresi

Misalkanlah bahwa:b0 = 30 b1 = 0

maka simpangan dari garis regresi ialah Yi – 30 – (0)Xi. Perhatikan bahwa setiap simpangan digambarkan sebagai jarak vertikal antara yi dengan garis regresi suaian. Tampak jelas bahwa garis ini kurang cocok (kurang pas) bagi data tersebut. Ini tercermin dari besarnya simpangan-simpangan. Simpangan yang besar membuat simpangan kuadrat juga besar. Jumlah simpangan kuadrat Q ialah :

Q = (44-30)2 + (38 – 30)2 + . . . . +(85 – 30)2 = 20415

Nilai ini jelas cukup besar.

Sekarang perhatikan jika b0 = 15 dan b1 = 1.5. Garis ini lebih cocok (namun masih belum baik), simpangan –simpangan sudah jauh lebih kecil, sehingga jumlah simpangan-simpangan kuadrat berkurang menjadi Q = 4545. Ini berarti garis regresi yang lebih cocok menghasilkan Q yang lebih kecil.

Tujuan metode kuadrat terkecil adalah menemukan nilai dugaan b0 dan b1 yang menghasilkan Q minimum. Dalam pengertian tertentu, yang segera akan kita bahas, nilai dugaan itu akan menghasilkan fungsi regresi linier yang “baik”.

13

80706050403020

100

90

80

70

60

50

40

X

Y

Revisi model regresi atau

bangun model baru

Mulai

Analisis Data Eksplorasi analysis

Bangun satu atau lebih

model regresi

Identifikasi model yang palik sesuai

suitable modelBuat inferensi berdasar model

regresi

Selesai

TDK

YA

Apakah satu atau

lebih model regresi tsb cocok untuk

data?

Page 14: 1-suwarno-modul-9-analisis-regresi (1)

Penduga Kuadrat Terkecil. Penduga b0 dan b1 yang memenuhi kriterium kuadrat terkecil dapat ditemukan dalam dua cara berikut. Pertama, digunakan suatu prosedur pencarian numerik. Prosedur ini untuk berbagai nilai dugaan b0 dan b1 yang berbeda sampai diperoleh nilai dugaan yang meminimumkan Q. Pendekatan kedua adalah menemukan nilai-nilai b0 dan b1 secara analitis yang meminimumkan Q. Pendekatan analitis mungkin dilakukan bila model regresinya secara sistematis tidak terlalu rumit, seperti halnya di sini. Dapat diperlihatkan nilai-nilai b0 dan b1 yang meminimumkan Q untuk data sampel yang dimiliki diberikan oleh sistem persamaan linear berikut :

(9.1.9a)

(9.1.9b)

Persamaan (9.1.9a) dan (9.1.9b) dinamakan persamaan normal; b0 dan b1 dinamakan penduga titik (point estimator) bagi 0 dan 1.

Besaran-besaran Yi, Xi, dan seterusnya di dalam (9.1.9) dihitung dari amatan-amatan sampel(Xi, Yi). Dengan demikian, kedua persamaan itu bisa diselesaikan. Untuk memperoleh b0 dan b1 bisa dihitung secara langsung menggunakan rumus :

(9.1.10a)

(9.1.10b)

dalam hal ini dan berturut-turut adalah rataan Xi dan rataan Yi.

Persamaan normal (9.1.9) dapat diturunkan secara kalkulus. Untuk suatu data amatan (Xi, Yi), besaran Q dalam (9.1.8) merupakan suatu fungsi dan yang meminimumkan

Q dapat diturunkan dengan cara mendiferensialkan (9.1.8) terhadap dan . Kita peroleh:

Selanjutnya kedua turunan parsial ini disamakan dengan nol, dan dengan menggunakan dan untuk menyatakan dan yang meminimumkan Q, maka:

Sistem persamaan ini dinamakan persamaan normal. Dengan menyelesaikan persamaan-persamaan normal ini diperoleh:

14

Page 15: 1-suwarno-modul-9-analisis-regresi (1)

Rumus terakhir ini merupakan versi lain dari rumusan yang telah disajikan di depan, namun akan menghjasilkan nilai yang sama (pembaca dapat membuktikannya).

Penduga kuadrat terkecil ini ialah penduga tak bias dan merupakan fungsi linear dari , yaitu:

a. dan (jadi merupakan penduga tak bias).

b.

dimana:

dimana:

(jadi baik maupun merupakan kombinasi linear atau fungsi linear dari ).

Latihan 1

1. Tabel di bawah ini menyajikan skore motivasi belajar Matematika (X) dan prestasi belajar Matematika (Y) dari 20 siswa yang dipilih secara acak dari suatu sekolah menengah pertama.

X 78 60 57 40 59 70 65 66 68 58 44 38 70 60 65 68 50 74 46 54Y 85 70 65 45 78 89 50 60 75 50 50 40 87 75 78 80 45 90 50 58

a. Gambarkan diagram pencar untuk data di atas!b. Tentukan nilai dugaan koefisien regresi b1 dan b0!c. Tuliskan persamaan regresi dugaannya!d. Gambarkan garis regresi dugaan tersebut pada gambar diagram pencar pada soal a!

15

Page 16: 1-suwarno-modul-9-analisis-regresi (1)

2. Suatu penelitian telah dilakukan untuk menentukan hubungan antara peubah bebas X dan peubah tak bebas Y. Data hasil penelitian telah dihitung dan didapatkan hasil

sebagai berikut: ; ; ; ; ;

n=12.a. Tentukan nilai dugaan b1 dan b0!b. Tuliskan persamaan regresi dugaannya!

Rangkuman

Hubungan statistik antara peubah babas X dan peubah tak bebas Y telah kita pelajari di muka. Analisis regresi mempelajari hubungan antara rerata semua Y yang berkaitan dengan X tertentu. Dalam analisis regresi sederhana kita menganggap bahwa hubungan antara X dan Y berbentuk garis lurus yaitu:

; dimana merupakan suku galat yang bersifat acak.Dengan metode kuadrat terkecil kita duga persamaan regresi tersebut berdasarkan data berpasangan (Xi, Yi) i=1, 2, 3, ..., n. Adapun rumus dugaan dari koefisien regresi tersebut adalah:

, dan

.Dari nilai dugaan koefisien regresi tersebut di atas didapatkan penduga garis regresi sebagai berikut:

.Kita ketahui bahwa penduga-penduga di atas merupakan penduga tak bias.

Tes Formatif 1

Kerjakanlah semua soal di bawah ini, dengan cara menemukan satu pilihan jawaban yang paling tepat!

A. Pada tabel di bawah ini, data menunjukkan harga X yang menyatakan tingkat kenyamanan guru dalam lingkungannya bekerja, dan Y yang menyatakan motivasi guru dalam untuk meningkatkan kinerjanya dalam memberikan pembelajaran terhadap siswanya.

X 93 96 108 86 92 80 96 117 95 92 96 108 92 Y 73 69 83 54 67 51 70 85 78 74 76 79 68

Bila masalah tersebut didalam regresi dimodelkan dengan model regresi linear:

16

Page 17: 1-suwarno-modul-9-analisis-regresi (1)

, maka:

1. Nilai dugaan untuk b1 adalah:a. 1,268b. 0,998c. 0,898d. 0,998e. -1,268

2. Nilai dugaan untuk b0 adalah:a. -25,131b. -15,132c. -5,321d. 1,825e. 5,321

3. Untuk Xk=100 maka nilai dugaan bagi Yk yaitu sama dengan:a. 84,479b. 80,345c. 76,684d. 74,668e. 67,864

4. Untuk Xk=80 maka nilai dugan bagi Yk yaitu sama dengan:a. 56,708b. 65,078c. 45,780d. 54,708e. 65,708

5. Oleh sebab itu untuk Xk=80, maka didapatkan nilai galat (residu) ek sama dengan:a. 7,508b. 5,708c. -5,708d. -6,780e. -7,807

B. Data pada tabel di bawah ini menunjukkan nilai X yang menyatakan skore total dalam ujian masuk di suatu sekolah, dan Y yang menyatakan nilai tes pelajaran Fisika dari sampel randon 20 siswa tahun pertama pada sekolah tersebut.

X 53 36 88 84 86 64 45 48 39 67 Y 45 43 89 79 84 66 49 48 43 76X 54 73 65 29 52 22 76 32 51 37 Y 59 77 56 28 51 27 76 34 60 32

17

Page 18: 1-suwarno-modul-9-analisis-regresi (1)

Bila masalah tersebut didalam regresi dimodelkan dengan model regresi linear:, maka:

6. Nilai dugaan untuk b1 adalah:a. 0,943b. 0,749c. 0,643d. 0,479e. 0,394

7. Nilai dugaan untuk b0 adalah:a. 0,943b. 3,881c. 4,184d. 6,184e. 8,418

8. Untuk Xk=80 maka nilai dugaan bagi Yk yaitu sama dengan:a. 84,479b. 79,624c. 76,624d. 69,188e. 60,624

9. Untuk Xk=64 maka nilai dugan bagi Yk yaitu sama dengan:a. 34,536b. 35,653c. 45,365d. 54,536e. 64,536

10. Oleh sebab itu untuk Xk=64, maka didapatkan nilai galat (residu) ek sama dengan:a. 6,424b. 4,464c. 4,264d. 2,464e. 1,464

Balikan dan Tindak Lanjut Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang terdapat di bagian akhir Modul ini. Hitunglah jawaban Anda yang benar. Kemudian gunakan rumus di bawah ini untuk mengetahui tingkat penguasaan Anda terhadap materi Kegiatan Belajar 1.

18

Page 19: 1-suwarno-modul-9-analisis-regresi (1)

Rumus:

Arti tingkat penguasaan yang Anda dapat:

90% - 100% = baik sekali80% - 89% = baik

70% - 79% = cukup < 70% = kurang

Bila Anda mencapai tingkat penguasan 80% atau lebih, Anda dapat meneruskan dengan Kegiatan Belajar selanjutnya. Bagus! Tetapi bila tingkat penguasaan Anda masih di bawah 80%, Anda harus mengulangi Kegiatan Belajar 1, terutama bagian yang belum Anda kuasai.

19