Dynamic Regression

5
3.2 Fungsi Regresi Populasi dengan Satu Variable Data pada Tabel 3.1 adalah salah satu sampel yang diambil dari populasi dari semua kemungkinan kembar tiga. Tinggi Ayah (X 1 ), Tinggi Ibu (X 2 ) dan Tinggi Anak laki-laki (Y). Tabel 3.1 Sampel data tinggi badan Ayah, Ibu dan Anak laki- laki ; n = 25 i X 1,i X 2,i Y i 1 68 64 69 2 72 66 71 3 73 65 71 4 70 62 71 5 72 60 69 6 69 62 68 7 75 63 73 8 72 60 67 9 69 62 72 10 69 62 68 11 75 64 73 12 72 64 68 13 69 64 72 14 73 64 73 15 78 62 75 16 70 67 72 17 72 64 69 18 72 62 70 19 71 66 70 20 69 62 70

description

jajaj

Transcript of Dynamic Regression

3.2 Fungsi Regresi Populasi dengan Satu Variable

Data pada Tabel 3.1 adalah salah satu sampel yang diambil dari populasi dari semua kemungkinan kembar tiga. Tinggi Ayah (X1), Tinggi Ibu (X2) dan Tinggi Anak laki-laki (Y).

Tabel 3.1 Sampel data tinggi badan Ayah, Ibu dan Anak laki-laki ; n = 25iX1,iX2,iYi

1686469

2726671

3736571

4706271

5726069

6696268

7756373

8726067

9696272

10696268

11756473

12726468

13696472

14736473

15786275

16706772

17726469

18726270

19716670

20696270

21716573

22686564

23696672

24756674

25756575

Untuk alasan genetik, mungkin terdapat hubungan sebab dalam populasi antara X1 dan X2 di satu sisi, dan Y disisi lain. Seorang ayah dan ibu yang tinggi, cenderung memiliki anak laki-laki yang tinggi, dan seorang ayah dan ibu yang pendek, cenderung pula memiliki anak laki-laki yang pendek. Tentu saja, faktor lain juga dapat mempengaruhi tinggi badan anak laki-laki. Misalnya kualitas gizi yang diterima selama masa pertumbuhan dapat mempengaruhi tinggi badan anak laki-laki di usia kuliah.

Variable X dapat berupa stokastik (memiliki pergerakan acak) atau deterministik (tanpa komponen acak).

3.2.1 Asumsi Fungsi Regresi Populasi

LinearitasDalam analisis regresi kita asumsikan bahwa populasi output (Y) mungkin berhubungan secara linear dengan input (X) dengan rata-rata koefisiennya tetap. Hubungan secara linear yang dimaksud adalah linear dalam koefisien. Namun dalam hal ini kita juga bisa mengatasi hubungan variabel yang non linear. Contoh hubungan variabel yang non linear diberikan dalam Bagian 3.8.5. Asumsi linearitas mengizinkan kita untuk mengembangkan :(1) Teori yang relatif sederhana(2) Beberapa kegunaan statistik yang mudah diperoleh

Hubungan StokastikKita juga mengasumsikan bahwa hubungan antara output dan input adalah stokastik. Input tidak sempurna memprediksi output. Ketidaksempurnaan ini diwakili oleh istilah gangguan stokastik aditif yang mewakili semua variasi dalam output yang tidak terkait dengan gerakan di input.

Hal ini dapat dengan mudah mengilustrasikan grafik dengan beberapa ide tentang regresi jika hanya terdapat satu input. Oleh karena itu, untuk mempermudah persentasi, kita mulai dengan pertimbangan untuk hubungan antara tinggi badan ayah (X1) dan tinggi badan anak laki-laki (Y). Dalam bagian 3.7 kita pertimbangkan kasus beberapa input (perkalian regresi). Sebagai contoh tinggi badan, dua asumsi tentang hubungan populasi antara Y dan X1 dapat dituliskan : (3.2.1)

Perhitungan (3.2.1) adalah Fungsi Regresi Populasi (PRF). Output Y sering disebut variabel terikat dan input (X) sering disebut variabel bebas. Koefisien b1 dalam (3.2.1) adalah parameter yang diduga; itu adalah perubahan rata-rata populasi di Y per satu unit di X1. C adalah konstanta yang diduga; menangkap akibat dari semua variabel bebas pada keseluruhan nilai Y (sebagai lawan variabilitas dari Y).

Gangguan yg dimilikiGangguan ini menggambarkan akibat dari semua dikecualikan variabel bebas pada variabilitas dari Y (sebagai lawan dari keseluruhan nilai Y). Istilah gangguan stokastik ai biasanya diasumsikan memiliki rata-rata 0 dan berdistribusi normal dengan ragam konstan . Gangguan ini juga diasumsikan untuk menjadi independen dari variabel X. Mengetahui nilai-nilai X tidak akan membantu kita untuk memprediksi nilai-nilai gangguan. Asumsi normalitas terkadang turun, tetapi memungkinkan kita untuk melakukan inferensia statistik menggunakan pendugaan sampel dari parameter C dan b1.

3.2.2 Prediksi menggunakan PRF (satu input)

Jika parameter (C dan b1) dalam persamaan (3.2.1) kita ketahui, kita dapat menggunakannya untuk memprediksi nilai Y untuk setiap nilai yang diberikan oleh X1. Tentu saja, dalam praktiknya, kita tidak mengetahui parameter PRF. Tetapi mengasumsikan bahwa mereka diketahui untuk saat ini akan membantu kita untuk membayangkan ide PRF.

Dalam (3.2.1), Yi di sisi kiri persamaan dipecah menjadi dua bagian penjumlahan pada sisi kanan persamaan. Bagian pertamaadalah himpunan dari prediksi Y (dinotasikan ) didasarkan pada parameter C dan b1 dan pada nilai yang diberikan oleh . Bagian yang kedua adalah gangguan, dimana tidak dapat diprediksi dari persamaan 3.2.1.Sebagai contoh, anggap C = 28 dan b1 = 0.6. kemudian diberikan tinggi badan ayah X1 = 74 inchi, kita dapat menggunakan persamaan (3.2.1) untuk memprediksi tinggi badan anak laki-laki sebagai : . Dalam membuat prediksi ini, kita menetapkan a1 adalah nilai harapan dari nol karena nilainya tidak diprediksi oleh persamaan 3.2.1. Jika anak tersebut memiliki ketinggian sebenarnya berbeda dari dugaan sebesar 72,4 inchi, maka perbedaannya sama dengan a1. Sebagai contoh, jika a1 = 5, kemudian dari persamaan 3.2.1, maka tinggi anak pada kenyataannya adalah .

Ide memprediksi ketinggian anak dengan persamaan PRF (3.2.1) diilustrasikan pada Gambar 3.1. Garis PRF untuk contoh ini memiliki sumbu Y intersep C = 28 dan kemiringan (slope) b1 = 0.6. temukan X1 = 74 inchi sepanjang sumbu horizontal. Dari titik ini membaca hingga garis prediksi PRF, . Sekarang baca dari garis horizontal prediksi PRF menuju sumbu vertikal. Ini memberikan bahwa nilai prediksi (72.4 inchi) dari tinggi anak