Model Statistika Linier

491
FMIPA-UNEJ Daftar Isi Judul JJ J I II 0 dari 490 Cari Halaman Kembali Layar Penuh Tutup Keluar Versi Cetak: Judul: Analisis Regresi dengan R Tahun terbit: 2009 Penerbit: Jember University Press ISBN 979-8176-65-0

Transcript of Model Statistika Linier

Page 1: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

0 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Versi Cetak:

Judul: Analisis Regresi dengan R

Tahun terbit: 2009

Penerbit: Jember University PressISBN 979-8176-65-0

Page 2: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

1 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Page 3: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

2 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Analisis Regresi dengan R(ANRER)

Page 4: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

3 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

I. M. Tirta, (Prof. Drs. M.Sc., Ph.D.)[email protected]; [email protected]

December 3, 2011

Page 5: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

4 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Page 6: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

5 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

DAFTAR ISI

1 DASAR-DASAR PEMODELAN STOKASTIK 23

1.1 Prinsip Pemodelan . . . . . . . . . . . . . . . . . . . . 27

1.2 Langkah-langkah Penting Dalam Pemodelan . . . . . . . 37

1.2.1 Langkah penting dalam Pemodelan secara Umum 37

1.2.2 Langkah Penting dalam Pemodelan Statistika . . . 39

1.3 Metode Mengestimasi Parameter . . . . . . . . . . . . 45

Page 7: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

6 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.3.1 Metode Kuadrat Terkecil . . . . . . . . . . . . . 45

1.3.2 Metode Likelihood Maksimum . . . . . . . . . . 47

1.3.3 Mencari Maksimum dengan Metode Numerik . . 48

1.4 Model Linier dan Perkembangannya . . . . . . . . . . . 52

1.4.1 Model linier klasik . . . . . . . . . . . . . . . . 53

1.4.2 Model Linier Tercampur . . . . . . . . . . . . . 56

1.4.3 Model Linier Tergeneralisir . . . . . . . . . . . . 60

1.4.4 Model untuk Data Tidak Normal dan Tidak Saling

Bebas . . . . . . . . . . . . . . . . . . . . . . . 64

1.4.5 Pengembangan Lain Model Linier . . . . . . . . 67

1.5 Model-model Nonlinier . . . . . . . . . . . . . . . . . . . 70

1.6 Tinjauan singkat Program Statistika R . . . . . . . . . . 71

1.6.1 Aplikasi R untuk Manipulasi Grafik . . . . . . . . 77

1.6.2 Aplikasi R untuk Model Statistika/ Analisis Regresi 88

1.6.3 RCommnder RGUI untuk analisis dasar . . . . . . 91

1.7 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . 92

1.8 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . 94

1.9 Latihan . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

Page 8: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

7 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2 ALJABAR MATRIKS UNTUK STATISTIKA 97

2.1 Materi . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

2.2 Defenisi dan Jenis Matriks . . . . . . . . . . . . . . . . . 100

2.3 Operasi Matriks dan Sifat-sifatnya . . . . . . . . . . . . 105

2.3.1 Operasi uner . . . . . . . . . . . . . . . . . . . 105

2.3.2 Operasi biner . . . . . . . . . . . . . . . . . . . 106

2.3.3 Determinan dan Invers Matriks . . . . . . . . . . 115

2.4 Kebergantungan Linier dan Rank Matriks . . . . . . . . . 118

2.5 Bentuk Kuadrat dan Diferensial Matriks . . . . . . . . . 123

2.6 Aplikasi R untuk Operasi Matriks . . . . . . . . . . . . . 134

2.6.1 Mendefinisikan matriks . . . . . . . . . . . . . . . 135

2.6.2 Operasi Matriks dengan R . . . . . . . . . . . . . 139

2.7 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . 144

2.8 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . . 145

2.9 Latihan Soal-soal . . . . . . . . . . . . . . . . . . . . . 147

3 MODEL LINIER KLASIK 151

3.1 Bentuk dan Asumsi . . . . . . . . . . . . . . . . . . . . 154

3.2 Estimasi Parameter . . . . . . . . . . . . . . . . . . . . 156

3.2.1 Estimasi dengan Metode Kuadrat Terkecil . . . . 156

Page 9: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

8 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.2.2 Estimasi dengan Metode Likelihood Maksimum . 161

3.3 Uji Inferensial dari βj . . . . . . . . . . . . . . . . . . . 165

3.3.1 Distribusi βj . . . . . . . . . . . . . . . . . . . . 165

3.3.2 Estimasi selang dari βj . . . . . . . . . . . . . . . 169

3.3.3 Uji Hipotesis . . . . . . . . . . . . . . . . . . . 170

3.3.4 Koefisien Determinasi R2 . . . . . . . . . . . . . 172

3.4 Penggunaan Matriks untuk Regresi Peubah Ganda . . . . 180

3.4.1 Perluasan hasil untuk Regresi Peubah Ganda . . . 180

3.4.2 Pendekatan Matriks Metode Kuadrat Terkecil . . 183

3.4.3 Pendekatan Matriks untuk Metode Kemungkinan

Maksimum . . . . . . . . . . . . . . . . . . . . . 186

3.5 Interval Keyakinan µ dan Prediksi Y . . . . . . . . . . . 191

3.6 Melaporkan Nilai Probabilitas p . . . . . . . . . . . . . . 194

3.7 Model Linier dengan Variabel Kualitatif . . . . . . . . . . 196

3.7.1 Variabel Boneka dengan Model Berkonstanta . . . 197

3.7.2 Variabel Boneka dengan Konstanta tidak Eksplisit 202

3.8 Ilustrasi Model Linier Normal dengan R . . . . . . . . . . 206

3.8.1 Simulasi dengan R . . . . . . . . . . . . . . . . . 206

3.8.2 Menggunakan Fungsi lm() . . . . . . . . . . . . 213

Page 10: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

9 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.8.3 Model dengan Variabel Kualitatif . . . . . . . . . 218

3.8.4 Analisis dengan Subset . . . . . . . . . . . . . . . 231

3.9 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . . 233

3.10 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . 235

3.11 Latihan Soal- Soal . . . . . . . . . . . . . . . . . . . . . 236

4 DIAGNOSTIK DAN TRANSFORMASI 239

4.1 Asumsi Analisis Regresi Klasik . . . . . . . . . . . . . . . 242

4.2 Memeriksa Sebaran Data melalui Grafik . . . . . . . . . . 243

4.3 Pemeriksaan Hubungan Peubah melalui Grafik . . . . . . 248

4.3.1 Diagram pencar data . . . . . . . . . . . . . . . 248

4.3.2 Diagram Pencar Sisa . . . . . . . . . . . . . . . 252

4.3.3 Memeriksa Model Melalui Diagram . . . . . . . . 253

4.4 Uji Statistika Terkait Asumsi . . . . . . . . . . . . . . . 260

4.5 Memeriksa Model melalui AIC . . . . . . . . . . . . . . . 261

4.6 Transformasi Data . . . . . . . . . . . . . . . . . . . . . 265

4.7 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . . 270

4.8 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . 272

4.9 Latihan Soal-soal . . . . . . . . . . . . . . . . . . . . . . 273

Page 11: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

10 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5 MODEL LINIER TERGENERALISIR 275

5.1 Distribusi Keluarga Eksponensial . . . . . . . . . . . . . . 277

5.1.1 Bentuk umum . . . . . . . . . . . . . . . . . . . 277

5.1.2 Nilai-tengah dan Ragam dari a(Y ) . . . . . . . . 278

5.1.3 Beberapa Bentuk Khusus . . . . . . . . . . . . . 283

5.2 Konsep Dasar Model Linier Tergeneralisir . . . . . . . . 292

5.2.1 Sisi lain Model Linier Normal . . . . . . . . . . . 292

5.2.2 Generalisasi Model Linier Klasik ke Model Linier

Tergeneralisir . . . . . . . . . . . . . . . . . . . . 293

5.3 Estimasi pada Model Linier Tergeneralisir . . . . . . . . 298

5.3.1 Metode Penduga Kuadrat Terkecil . . . . . . . . 301

5.3.2 Metode Penduga Likelihood Maksimum . . . . . 303

5.4 Inferensi pada Model Linier Tergeneralisir . . . . . . . . 312

5.4.1 Distribusi dari Penduga Likelihood Maksimum . . 314

5.4.2 Kecocokan Model . . . . . . . . . . . . . . . . . 317

5.5 Model Logit, Probit dan Log-linier . . . . . . . . . . . . . 322

5.6 dispersi berlebih . . . . . . . . . . . . . . . . . . . . . . 325

5.7 Ilustrasi GLM dengan R . . . . . . . . . . . . . . . . . . 326

5.7.1 Data dengan Sebaran Binomial . . . . . . . . . . 330

Page 12: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

11 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.7.2 Prediksi pada GLM . . . . . . . . . . . . . . . . 343

5.8 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . . 345

5.9 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . 347

5.10 Latihan Soal-soal . . . . . . . . . . . . . . . . . . . . . . 348

6 MODEL UNTUK RESPON TIDAK SALING BEBAS 349

6.1 Model Marjinal . . . . . . . . . . . . . . . . . . . . . . . 355

6.2 Quasi-Likelihood dan Generalized Estimating Equations

(GEE) . . . . . . . . . . . . . . . . . . . . . . . . . . . 360

6.3 Generalisasi dan Bentuk GEE . . . . . . . . . . . . . . . 363

6.4 Ilustrasi GEE dengan R . . . . . . . . . . . . . . . . . . 368

6.5 Gamma-HGLM dan Model Lainnya . . . . . . . . . . . . 374

6.5.1 Gamma-HGLMs . . . . . . . . . . . . . . . . . . 375

6.5.2 Likelihood Bersama: Model JGIG . . . . . . . . . 378

6.5.3 Estimasi Parameter β dan v . . . . . . . . . . . . 380

6.5.4 Pendugaan parameter dispersi ν dan α . . . . . . 388

6.5.4.1 Prosedur Pendugaan . . . . . . . . . . . 390

6.5.5 Analisis HGLM dengan R . . . . . . . . . . . . . 391

6.6 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . 396

6.7 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . . 397

Page 13: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

12 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.8 Latihan Soal-soal . . . . . . . . . . . . . . . . . . . . . 398

GLOSARIUM 399

A BEBERAPA FUNGSI TERKAIT REGRESI 417

A.1 Fungsi dari Paket stats . . . . . . . . . . . . . . . . . . . 418

A.2 Fungsi dari Paket cars . . . . . . . . . . . . . . . . . . . 419

A.3 Fungsi dari Paket gam . . . . . . . . . . . . . . . . . . . 420

A.4 Fungsi dari Paket graphics . . . . . . . . . . . . . . . . . 421

A.5 Fungsi dari Paket gee . . . . . . . . . . . . . . . . . . . 422

A.6 Fungsi dari Paket lme4 . . . . . . . . . . . . . . . . . . . 423

A.7 Fungsi dari Paket hglm . . . . . . . . . . . . . . . . . . 424

A.8 Fungsi dari Paket glmmML . . . . . . . . . . . . . . . . 425

A.9 Skrip Manipulasi Grafik . . . . . . . . . . . . . . . . . . 426

A.10 Skrip Membangkitkan Data Regresi dengan Peubah Kelom-

pok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428

B DATA UNTUK ILUSTRASI 431

B.1 Data dari Paket actuar . . . . . . . . . . . . . . . . . . . 432

B.2 Data dari Paket ade4 . . . . . . . . . . . . . . . . . . . 433

Page 14: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

13 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.3 Data dari Paket agricolae . . . . . . . . . . . . . . . . . 439

B.4 Data dari Paket asuR . . . . . . . . . . . . . . . . . . . 441

B.5 Data dari Paket car . . . . . . . . . . . . . . . . . . . . 443

B.6 Data dari Paket DAAG . . . . . . . . . . . . . . . . . . . 446

B.7 Data dari Paket dataset . . . . . . . . . . . . . . . . . . 452

B.8 Data dari Paket demogR . . . . . . . . . . . . . . . . . . 458

B.9 Data dari Paket faraway . . . . . . . . . . . . . . . . . . 459

B.10 Data dari Paket gam . . . . . . . . . . . . . . . . . . . . 466

B.11 Data dari Paket ISwR . . . . . . . . . . . . . . . . . . . 467

B.12 Data dari Paket lmtest . . . . . . . . . . . . . . . . . . . 470

B.13 Data dari Paket MASS . . . . . . . . . . . . . . . . . . . 471

B.14 Data dari Paket UsingR . . . . . . . . . . . . . . . . . . 476

Page 15: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

14 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Page 16: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

15 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

DAFTAR GAMBAR

1.1 Diagram Menunjukkan Langkah-langkah dalam Pemo-

delan Statistika . . . . . . . . . . . . . . . . . . . . . . 42

1.2 Pembagian dan Perkembangan Model Linear . . . . . . 66

1.3 Ilustrasi Regresi . . . . . . . . . . . . . . . . . . . . . 69

1.4 Contoh Histogram dengan Kurva Densitas . . . . . . . 83

1.5 Contoh Diagram Pencar dengan rug dan boxplot . . . . 84

1.6 Contoh Gabungan Grafik Besar dengan Grafik Mini . . 85

Page 17: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

16 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.7 Contoh Gabungan Grafik dengan Pembagian Layar . . 86

1.8 Contoh Gabungan Grafik dengan pembagian layar . . . 87

3.1 Ilustrasi Garis regresi dan sabuk keyakinan . . . . . . . 193

3.2 Sebaran data dengan variabel kualitatif . . . . . . . . . 198

3.3 Garis Regresi sejajar dengan selisih konstanta β2 dan

gradien sama (β1) . . . . . . . . . . . . . . . . . . . . . 201

3.4 Garis Regresi berbeda dengan selisih konstanta β2 dan

selisih gradien β3 . . . . . . . . . . . . . . . . . . . . . 203

3.5 Grafik Penduga β1 = α dari penarikan sampel 100 kali

masing-masing berukuran 60. Nilai parameter sebe-

narnya adalah α = 3. . . . . . . . . . . . . . . . . . . . 211

3.6 Grafik Penduga β1 = α dari beberapa penarikan sampel

dengan ukuran mulai 10 sampai dengan 1000. Nilai

parameter sebenarnya adalah α = 3. . . . . . . . . . . 212

3.7 Contoh Histogram dengan Kurva Densitas Data Cars . 216

3.8 Diagram Pencar X dengan Y yang mengandung kelom-

pok yang dapat digabung . . . . . . . . . . . . . . . . . 221

3.9 Diagram Pencar X dengan Y mengandung kelompok

yang perlu dipisah . . . . . . . . . . . . . . . . . . . . 227

Page 18: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

17 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4.1 Grafik Quantile dari Data Berdistribusi Normal (kiri)

dan Data Cenderung Tidak Berdistribusi Normal (Kanan)244

4.2 Grafik Sebaran Peluang dari Data Berdistribusi Normal

(lebih simetris, warna biru) dan Data Tidak Berdis-

tribusi Normal (tidak siumetris, warna merah) . . . . . 245

4.3 Boxplot respon dengan kelompok . . . . . . . . . . . . 247

4.4 Grafik Pencar Data dengan Hubungan Linear dan Ra-

gam Relatif Konstan . . . . . . . . . . . . . . . . . . . 249

4.5 Grafik Pencar Data dengan hubungan Linear tetapi Ra-

gam Relatif tidak Konstan . . . . . . . . . . . . . . . . 250

4.6 Grafik Pencar Data dengan hubungan lebih cenderung

nonlinear . . . . . . . . . . . . . . . . . . . . . . . . . . 251

4.7 Grafik Pencar Data dengan Hubungan Eksponensial . . 252

4.8 Grafik Pencar Sisa Data yang memenuhi syarat ho-

moskedastisitas. . . . . . . . . . . . . . . . . . . . . . . 254

4.9 Grafik Pencar Sisa Data yang tidak memenuhi syarat

homoskedastisitas. . . . . . . . . . . . . . . . . . . . . 255

Page 19: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

18 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4.10 Grafik Diagnostik dari Objek yang Dihasilkan oleh Fungsi

lm(). Grafik menunjukkan data relatif memenuhi asumsi

Model Linier Normal . . . . . . . . . . . . . . . . . . . 258

4.11 Grafik Diagnostik dari Objek yang Dihasilkan oleh Fungsi

lm(). Grafik menunjukkan data tidak memenuhi asumsi

Model Linier Normal, yang ditandai dengan adanya hu-

bungan tidak linier dan pencilan . . . . . . . . . . . . . 259

4.12 Sebaran data asli (naik dan membuka ke atas) dan trans-

formasi yang bisa dilakukan. Beberapa transformasi meng-

hasilkan sebaran yang mengikuti garis lurus tetapi ragam

tidak konstan . . . . . . . . . . . . . . . . . . . . . . . . 266

4.13 Sebaran data asli (naik dan terbuka ke bawah) dan trans-

formasi yang bisa dilakukan. Beberapa transformasi meng-

hasilkan sebaran yang mengikuti garis lurus tetapi ragam

tidak konstan . . . . . . . . . . . . . . . . . . . . . . . . 268

4.14 Sebaran data asli (dengan ragam tidak stabil) dan trans-

formasi yang bisa dilakukan. Beberapa transformasi hanya

menghasilkan ragam yang sedikit lebih stabil . . . . . . . 269

Page 20: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

19 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.1 Plot Densitas dari sampel dengan berbagai nilai-tengah

dengan ukuran sampel 100 . . . . . . . . . . . . . . . . 289

5.2 Sebaran Data dengan ukuran sampel 100 dengan dis-

tribusi Normal (b) dan Gamma (r) . . . . . . . . . . . 290

5.3 Respon dengan Fungsi Hubungan Logit dan Probit . . 296

5.4 Diagram Pencar Prediksi dan Data Asli Peluang Ke-

berhasilan Berbagai Kelompok . . . . . . . . . . . . . . 335

Page 21: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

20 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Page 22: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

21 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

DAFTAR TABEL

1.1 Tabel jumlah (kg) salak dan anggur dan harga yang

dibayar . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

1.2 Fungsi dan paket untuk menggambar grafik R . . . . . 79

2.1 Fungsi R terkait matriks . . . . . . . . . . . . . . . . . 134

3.1 Alternatif Penulisan Model dalam Formula R . . . . . . 225

Page 23: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

22 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.1 Rangkuman Distribusi Anggota Keluarga Eksponensial 288

5.2 Ciri-ciri khas Distribusi Keluarga Eksponensial . . . . . 291

5.3 Jumlah Sukses(S) dan Gagal dalam Berbagai Kelom-

pok Faktor . . . . . . . . . . . . . . . . . . . . . . . . . 324

5.4 Distribusi dan Link pada R . . . . . . . . . . . . . . . 329

5.5 Jumlah Kelulusan dalam Berbagai Kelompok Perlakuan 331

5.6 Format Data R Jumlah Kelulusan dan Kegagalan . . . 332

6.1 Respon Pengukuran berulang . . . . . . . . . . . . . . 358

Page 24: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

23 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

BAB 1

DASAR-DASAR PEMODELAN STOKASTIK

Analisis regresi sering disebut model statistika (statistical model, yaitu

barkaitan dengan mempelajari hubungan fungsional (bukan sekedar

hubungan asosiasi) dua peubah atau lebih. Dalam analisis ini satu

peubah atau lebih (disebut peubah respon) diuji hubungan fungsion-

alnya dengan beberapa peubah lain (disebut peubah penjelas). Bentuk

Page 25: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

24 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

fungsi yang dihasilkan sering disebut sebagai model matematika atau

secara lebih khusus model statistika. Pada bab ini akan dibahas prin-

sip dasar pemodelan matematika, khususnya pemodelan statistika.

Page 26: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

25 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Kompetensi

Pembaca diharapkan memahami hakekat pemodelan dalam bidang

statistika serta mempunyai gambaran tentang kedudukan dan perkem-

bangan regresi atau model linier dalam uji statistika. Secara lebih

khusus diharapkan:

1. dapat menyebutkan hakekat dari pemodelan matematika, khusus-

nya pemodelan statistika;

2. dapat menjelaskan langkah-langkah penyusunan model statistika;

3. dapat menjelaskan langkah-langkah mengestimasi parameter da-

lam model statistika;

4. dapat menjelaskan perkembangan model statistika penting.

5. dapat menentukan dan mengeksplorasi paket statistika R terkait

dengan analisis regresi

Page 27: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

26 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Materi

1. Prinsip Pemodelan

2. Langkah-langkah PemodelanStatistika

3. Estimasi Parameter dalam Model Statistika

4. Perkembangan Model Statistika

5. Tinjauan singkat R

Page 28: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

27 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.1. Prinsip Pemodelan

Ketika kita menganalisis data dengan menggunakan metode statistika,

hampir selalu menekankan asumsi yang dikenakan terhadap data yang

dianalisis. Asumsi-asumsi itu dapat meliputi hubungan antara pe-

ubah, maupun sebaran dari galat (error). Namun, mungkin tidak

semua kita menyadari bahwa saat itu sebenarnya sedang diterapkan

suatu pemodelan (dalam hal ini pemodelan statistik) dalam meme-

cahkan persoalan, maupun membuat suatu kesimpulan tentang ma-

salah yang dihadapi. Ketika membicarakan model atau pemodelan

dalam bidang matematika atau statistika, mungkin pikiran kita mem-

bayangkan materi matematika tingkat lanjut (advanced mathematics)

yang membutuhkan pemahaman kalkulus lanjut maupun persamaan

diferensial. Pemodelan, baik disadari atau tidak, implisit atau ek-

splisit, sebenarnya selalu dilakukan pada saat kita menggunakan ma-

tematika (atau khususnya statistika) dalam memecahkan masalah ke-

hidupanm riil. Bahkan, sejak di SLTP/SMU penyelesaian soal-soal

bentuk cerita (words problem), sebenarnya merupakan aplikasi pemo-

delan matematika. Demikian juga aplikasi sistim persamaan linier da-

lam kehidupan sehari-hari, sebagian besar merupakan bentuk aplikasi

Page 29: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

28 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

pemodelan matematika.

Definisi 1.1 (Prinsip Pemodelan). Model matematika dari suatu ma-

salah adalah rumusan masalah dalam bentuk persamaan matematika

Definisi 1.2. Pemodelan matematika adalah proses menerjemahkan

masalah dalam bahasa umum(sehari-hari) ke dalam bahasa atau per-

samaan matematika

Sebagai ilustrasi, berikut disampaikan contoh soal penerapan

sistim persamaan linier dan langkah- langkah penyelesaian yang di-

anjurkan.

Contoh 1.1. Seorang ibu membeli 3 kilogram salak dan 2 kilogram

anggur. Ibu tersebut harus membayar sebesar Rp 17 000,- Sedangkan

ibu lain yang membeli 3 kilogram salak dan 5 kilogram anggur harus

membayar Rp 29.000,-. Jika pedagang memberlakukan harga tetap

terhadap kedua ibu- ibu tadi, berapa harga perkilogram salak dan

harga perkilogram anggur? Selanjutnya berapa harga harus dibayar

jika seseorang membeli x kg salak dan y kg anggur?

Page 30: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

29 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Untuk menjawab persoalan di atas dianjurkan untuk menem-

puh langkah- langkah berikut. Hal ini dimungkinkan hanya dilakukan

secara implisit.

1. Kita misalkan bilangan yang ingin dicari (dalam hal ini harga

satu kilogram salak dan harga satu kilogram anggur) masing-

masing sebagai a dan b. Kita membuat persamaan matema-

tika dari persoalan dalam bentuk cerita tadi. Dalam hal ini

sebenarnya kita sedang membuat model matematika suatu per-

soalan. Untuk soal di atas model matematika yang diperoleh

adalah3a+ 2b = 1700

3a+ 5b = 29000

(1.1)

2. Kita menyelesaikan persamaan matematika di atas dengan teori

matematika yang kita miliki. Dengan metode eleminasi dan sub-

stitusi balik kita memperoleh a = 3000 dan b = 4000.

3. Mensubsitusikan secara serempak nilai a dan b yang diperoleh ke

sistim persamaan yang dimiliki untuk memeriksa apakah hasil

yang kita peroleh benar atau tidak.

Page 31: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

30 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4. Menyimpulkan bahwa harga satu kilogram salak adalah Rp 3000

dan harga satu kilogram anggur adalah Rp 4000.

Jadi harga x kg salak dan y kg anggur adalah

H = 3000x+ 4000y

Jadi dapat dipahami bahwa pemodelan atau menerjemahkan

masalah sehari-hari ke persamaan matematika merupakan bagian yang

sangat penting dalam menggunakan matematika untuk menyelesaikan

persoalan sehari- hari. Pentingnya pemodelan dalam matematika juga

dinyatakan oleh Prof. J. Neyman, yang dikutip dari Meyer, sebagai

berikut:

Whenever we use mathematics in order to study some obser-vational phenomena we must essentially begin by building amathematical model (deterministic or probabilistic) for thesephenomena. Of necessity, the model must simplify mattersand certain details must be ignored. The success of the modeldepends on whether or not the details ignored are really unim-portant in the development of the phenomena studied. Thesolution of mathematical problems may be correct and yet bein considerable disagreement with the observed data simplybecause the underlying assumptions made are not warranted.It is usually quite difficult to state with certainty, whether or

Page 32: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

31 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

not a given mathematical model is adequate before some ob-servational data are obtained. In order to check the validity ofthe model, we must deduce a number of consequences of ourmodel and then compare these predicted results with observa-tions. [Kapan saja kita menggunakan metematika untuk mem-pelajari fenomena yang teramati, kita mesti perlu memulai de-ngan membangun suatu model matematika (deterministik atauprobabilistik) untuk fenomena tersebut. Sangat penting, mo-del yang dibuat harus menyederhanakan persoalan dan bebe-rapa rincian mesti diabaikan. Keberhasilan model bergantungpada apakah rincian yang diabaikan benar- benar tidak pen-ting dalam pengembangan fenomena yang dipelajari. Biasanyasangat sulit untuk menyatakan dengan pasti, apakah suatu mo-del matematika adalah tepat atau tidak sebelum diperoleh datapengamatan. Dalam rangka memeriksa validitas model, kitaharus menurunkan sejumlah konsekuensi (dalil) dari model kitadan membandingkan hasil dugaan teoritis dengan pengamatan](Meyer [28]).

Pembuatan model dari suatu persoalan adalah ibarat pembu-

atan peta suatu wilayah. Dalam proses pembuatan peta, harus ada

penyederhanaan, yaitu mengabaikan rincian hal-hal yang tidak men-

jadi kepentingan. Sangat jelaslah bahwa peta yang baik adalah peta

yang sederhana namun memuat secara akurat informasi yang diper-

lukan. Peta yang terlalu rinci, dalam hal tertentu menjasdi tidak ko-

Page 33: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

32 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

munikatif, karena terlalu banyak terdapat informasi yang tidak diper-

lukan. Sementara, di lain pihak, peta yang terlalu sederhana yang

mengabaikan informasi yang penting, dapat menjerumuskan pemba-

canya kepada sasaran yang keliru. Demikian juga, dalam menye-

lesaikan persoalan dengan menggunakan matematika, biasanya kita

selalu memulai dengan model yang paling sederhana yang berarti

banyak informasi yang diabaikan. Karenanya penyelesaian persoalan

secara matematis ini, mungkin benar tapi tidak bermanfaat dan tidak

bermakna, karena model yang dibangun tidak sesuai dengan data

yang diamati, akibat adanya asumsi penting yang dibuat untuk men-

dasarinya diabaikan. Itulah sebabnya dalam penyelesaian persoalan

secara matematika (atau statistika khususnya), biasanya dimulai dari

model yang sederhana kemudian dikembangkan secara berangsur-angsur

ke model yang lebih kompleks yang semakin sesuai dengan kondidi

riil di lapangan. Pada Contoh 1.1, sebenarnya setelah diperoleh kes-

impulan akhir tentang harga barang. Hasil tersebut perlu diperiksa

atau dicocokkan dengan keadaan riil dilapangan dengan mengambil

beberapa informasi yang lain, apakah temuan tersebut berlaku, meny-

impang sedikit atau banyak. Sehingga kita bisa mengambil langkah

Page 34: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

33 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

apakah model yang kita pakai perlu diperbaiki atau tidak. Pada Con-

toh 1.1, ada asumsi yang dikenakan dalam persoalan tersebut yaitu

pedagang diasumsikan mengenakan harga yang tetap kepada semua

pembeli. Ini berarti peubah harga dianggap merupakan peubah tetap

yang tidak bersifat acak. Dengan demikian mengambil dua pembeli

sudah cukup untuk mementukan atau menghitung harga dua komu-

ditas (anggur dan salak).

Persoalan akan menjadi lebih kompleks apabila dalam kenyataan

di lapangan pedagang mengenakan harga yang berbeda-beda kepada

pembeli dan sangat boleh jadi kenyataan inilah yang banyak terjadi di

lapangan, terutama di pasar-pasar tradisional. Dalam kondisi ini ada

kemungkinan dari beberapa pembeli diperoleh informasi (data) yang

berbeda- beda misalnya dari 10 pembeli diperoleh informasi seperti

pada Tabel 1.1 yang berupa data fiktif.

Kedua sifat alami dari gejala ini menuntut pemodelan yang ber-

beda. Pemodelan yang pertama yang tidak memperhitungkan ada-

nya sebaran harga disebut pemodelan deterministik (matematika).

Dalam pemodelan ini peubah yang diamati dianggap tetap (fixed)

dan tidak memiliki sebaran sehingga hubungan yang diperoleh meru-

Page 35: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

34 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Tabel 1.1: Tabel jumlah (kg) salak dan anggur dan harga yang dibayar

Nomor

Pembeli

Jumlah Kg

Salak (X1)

Jumlah Kg

Anggur (X2)

Jumlah

Harga dalam

Rupiah (H)

1 2 4 20 500

2 6 3 29 000

3 3 2 17 000

4 4 5 31 500

5 5 6 40 000

6 6 3 30 500

7 3 5 29 000

8 2 2 14 500

9 5 6 39 500

10 6 6 41 000

Page 36: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

35 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

pakan hubungan matematika yang bersifat fungsional murni (misal-

nya, y = f(x)). Pemodelan yang kedua, menganggap peubah harga

berubah-ubah dengan sebaran tertentu (misalnya, normal). Pemo-

delan yang kedua ini disebut pemodelan stokastik (statistika). Hu-

bungan yang diperoleh selain mengandung komponen fungsional, juga

mengandung adanya galat yang merupakan peubah acak yang berdis-

tribusi dengan sebaran tertentu. Jadi hubungan yang diperoleh men-

jadi y = f(x, α, β) + e, dengan e adalah peubah acak/ random yang

berdistribusi normal, misalnya. Fungsi f dan sebaran e biasanya

bergantung kepada suatu konstanta yang belum diketahui yang dise-

but parameter. Parameter inilah yang biasanya menjadi fokus ke-

pentingan dalam pemodelan statistika. Dalam contoh di atas X1, X2

dan Y disebut variabel/ peubah yang diketahui dari data sedang-

kan α dan β adalah parameter (yang akan dicari nilainya). Dengan

demikian, persamaan matematika yang sekarang harus diselesaikan

adalah

h = β1x1 + β2x2 + ε.

Selanjutnya dengan mengenakan beberapa pembatasan atau asumsi

pada ε, akan diperoleh berbagai variasi model. Asumsi yang paling

Page 37: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

36 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

sederhana yang juga menghasilkan model yang paling sederhana ada-

lah bahwa εi berdistribusi identik dan independen mengikuti sebaran

normal. Model-Statistika Linier membahas berbagai alternatif model

serta penyelesaiannya. Dengan prosedur penyelesaian model stokastik,

dihasilkan persamaan berupa dugaan harga (h)

h = 3001, 73x1 + 3968, 40x2

dengan 3001,732 disebut penduga β1 atau β1 yaitu dugaan harga 1 kg

salak dan 3968,40 disebut β2 yaitu dugaan harga 1 kg anggur.

Page 38: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

37 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.2. Langkah-langkah Penting Dalam Pemodelan

1.2.1. Langkah penting dalam Pemodelan secara Umum

Dari uraian pada Contoh 1.1 sebenarnya sudah tergambar langkah-

langkah yang penting dalam pemodelan secara umum. Langkah- lang-

kah tersebut dapat diuraikan secara lebih eksplisit seperti berikut ini.

1. Penentuan model. Langkah ini meliputi:

(a) menentukan/ mengidentifikasi peubah beserta batas semes-

tanya;

(b) menentukan jenis dan derajat fungsi yang dibentuk;

Penentuan jenis dan derajat fungsi disesuaikan dengan kondisi,

tujuan dan sifat permasalahan yang dihadapi.

2. Menyelesaikan model. Langkah ini meliputi menghitung nilai

peubah atau konstanta yang ada pada model dengan menggu-

nakan kaidah- kaidah matematika baik secara analitik maupun

numerik.

Page 39: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

38 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3. Melakukan verifikasi. Hasil yang diperoleh dari penyelesa-

ian model sebelum disimpulkan atau diinterpretasikan ke da-

lam persoalan nnyata semestinya diverifikasi apakah sudah se-

suai dengan model yang digunakan. Langkah ini penting untuk

meyakinkan tidak adanya kesalahan perhitungan, kesalahan pe-

mrograman (kalau menggunakan komputer), maupun kesalahan

konsep matematika yang digunakan dalam menyelesaikan model.

4. Menarik kesimpulan. Selanjutnya hasil yang diperoleh diin-

terpretasikan sesuai dengan persoalan riil yang menjadi dasar

pemilihan model.

5. Melakukan uji kecocokan. Karena pada umumnya pemo-

delan dimulai dari model yang sederhana dengan mengabaikan

hal-halyang kompleks, atau menggunakan asumsi- asumsi secara

ketat, maka tidak mustahil hasil yang diperoleh tidak terlalu co-

cok dengan kondisi riil di lapangan. Melalui langkah ini seseo-

rang mendapat gambaran apakah model yang dipilih sesuai atau

perlu menggunakan meningkatkan kompleksitas modelnya de-

ngan menambah variabel maupun konstanta dalam model atau

Page 40: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

39 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

mencoba hubungan fungsi yang lebih kompleks.

1.2.2. Langkah Penting dalam Pemodelan Statistika

Sebenarnya langkah- langkah dalam pemodelan stokastik sudah ter-

gambar langkah- langkah yang penting dalam pemodelan secara umum.

Namun ada beberapa langkah yang sifatnya khas yang tidak dilakukan

dalam pemodelan umum. Sifat khas ini disebabkan karena dalam

pemodelan statistika ada parameter yang menjadi kepentingan dan

ada komponen galat yang bersifat acak dan memiliki sebaran ter-

tentu. Langkah-langkah penting yang harus ditempuh dalam pemo-

delan stokastik dapat diuraikan seperti berikut ini.

1. Penentuan model yang meliputi:

(a) menentukan/ mengidentifikasi peubah;

(b) menentukan parameter yang menjadi kepentingan;

(c) menentukan hubungan antara parameter dan peubah serta

(d) menentukan distribusi komponen acak.

Page 41: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

40 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Penentuan hubungan serta distribusi ini disesuaikan dengan kon-

disi dan sifat permasalahan yang dihadapi.

2. Mengestimasi parameter yang menjadi kepentingan. Lang-

kah ini identik dengan Penyelesaian persamaan matematika yang

diperoleh sebagai model matematika dari permasalahan yang di-

hadapi. Langkah ini meliputi menghitung nilai estimasi titik

yang ada pada model dengan menggunakan kaidah- kaidah sta-

tistika baik secara analitik maupun numerik.

3. Menarik kesimpulan/ melakukan uji inferensi. Dalam pe-

modelan stokastik, karena peubah yang dihadapi adalah peubah

yang bersifat random/ acak maka nilai estimasi titik yang yang

diperoleh masih harus dilanjutkan dengan perhitugan estimasi

interval/selang keyakinan atau dilanjutkan dengan uji signifi-

kansi secara statistika:

(a) bagaimana besaran kesalahan dari dugaan yang diperoleh,

(b) bagaimana sebaran atau rentangan atau interval dari hasil

yang diperoleh?

Page 42: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

41 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

(c) apakah hasil yang diperoleh secara statistika signifikan atau

tidak.

4. Melakukan uji kecocokan (goodness of fit) atau mengadakan

diagnostik model. Hasil yang diperoleh selain diuji signifikansinya,

mestinya juga diuji kecocokannya dengan kondisi riil dilapangan.

Melalui langkah diagnostik diperiksa

(a) apakah ada kecocokan atau tidak antara asumsi yang di-

lakukan dengan kondisi riil data;

(b) apakah perlu melalukan remidi (mentransformasi data se-

hingga kondisi yang disyaratkan oleh model terpenuhi) atau

(c) apakah perlu mencari alternatif model yang lebih cocok.

Uji kecocokan ini biasanya dilakukan pada sisa/residu dari peng-

gunaan model. Itu sebabnya langkah ini kebanyakan dilakukan

sesudah model dipilih. Diagram langkah-langkah pemodelan,

khususnya untuk model stokastik/ model statistika, dapat dili-

hat pada Gambar 1.1

Page 43: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

42 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Problem Riil

Solusi Riil (Kesimpulan)

Model Matematika Menyelesaikan Model/

menyelesaikan

Persamaan

PEMODELAN MATEMATIKA

interpretasi, generalisasi

identifikasi, simplifikasi

Verifikasi

(Komputasi)

(Uji Model)

Gambar 1.1: Diagram Menunjukkan Langkah-langkah dalam Pemo-

delan Statistika

Page 44: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

43 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dalam hal pengembangan model statistika, para Teorisi sta-

tistika, atau statistisi, menurunkan metode umum/ prosedur dalam

mengestimasi parameter, menguji dan mendiagnosis, serta meremidi

model yang dibuat. Para praktisi berkewajiban menerapkan metode

sesuai dengan persyaratan yang ditentukan atau yang dihasilkan oleh

para statistisi. Selain itu, tugas para teorisi statistika (statistisi) ada-

lah juga membangun berbagai model alternatif, untuk berbagai kon-

disi di lapangan. Kemudian, secara deduktif (matematis) menurunkan

sifat- sifat dari model tersebut, cara mengestimasi parameter, cara

mendiagnosis model serta mengaplikasikan model-model yang ditu-

runkan kedalam suatu paket komputer yang ramah (gampang dipakai

dan dipahami) sehingga bisa dipakai oleh para praktisi di lapangan.

Lebih tegasnya menurut Mendenhall (1979) dikatakan:

The statisticians study various inferential procedures, look-

ing for the best predictor or decicion-making process for a

given situation. Even more important, the statistician pro-

vides information concerning the goodness of an inferential

procedures. [Para statistisi mempelajari berbagai prose-

dur penarikan kesimpulan, mencari penduga terbaik- atau

Page 45: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

44 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

proses pengambilan keputusan untuk kondisi tertentu. Bah-

kan lebih jauh mereka menyediakan informasi berkaitan

dengan kecocokan dari suatu prosedur pengambilan kepu-

tusan] (Mendenhall [26]).

Bagi para analis (praktisi) statistika, tugas pokoknya adalah

mempelajari model- model yang ditawarkan beserta persyaratan dan

prosedur yang harus ditempuh dalam menerapkan model tersebut.

Hal ini sejalan dengan fungsi dan tujuan ilmu statistika itu sendiri se-

bagaimana digambarkan Wackery et al. [49] bahwa tujuan statistika

adalah membuat kesimpulan tentang populasi berdasarkan informasi

yang diperoleh pada suatu sampel dan untuk memberikan ukuran de-

rajat kecocokan dari kesimpulan itu.

Page 46: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

45 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.3. Metode Mengestimasi Parameter

Salah satu langkah pokok dalam pemodelan statistika adalah menges-

timasi parameter yang menjadi kepentingan. Dalam analisis regresi,

ada dua kelompok parameter yang menjadi kepentingan yaitu yang

paling penting adalah parameter efek tetap atau parameter regresi βj(j = 0, 1, 2, ..., k) tergantung pada dimensinya) dan biasanya diper-

lukan juga mengestimasi parameter dispersi (misalnya, σ, tergantung

pada model yang dihadapi). Kadang- kadang parameter dispersi ini

diasumsikan diketahui. Ada dua metode yang banyak dipakai dalam

mengestimasi parameter efek tetap dalam model linier yaitu:

1. metode kuadrat terkecil (least square method) dan

2. metode likelihood maksimum (maximum likelihood method).

1.3.1. Metode Kuadrat Terkecil

Pada dasarnya parameter yang diestimasi adalah parameter dari garis

regresi dari model yang mewakili populasi. Hal ini diperoleh berda-

sarkan informasi atau sebaran sampel yang dimiliki. Metode kuadrat

Page 47: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

46 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

terkecil (least square), menggunakan pendekatan geometris. Secara

geometris, garis yang paling mewakili sebaran sampel adalah garis

yang mempunyai simpangan minimum, atau error/galat terkecil dari

pencaran data. Untuk memudahkan perhitungan, jarak yang aslinya

berupa harga mutlak dari error, |εi| diganti dengan kuadrat galat terse-

but, yaitu ε2i .

Langkah langkah dalam mengestimasi parameter dari sampel se-

banyak n dengan metode kuadrat terkecil adalah:

1. mengubah persamaan model

yi = xiβ + εi menjadi εi = xiβ − yi;

2. mencari bentuk kuadrat dan jumlah kuadrat dari galat, yaitu

Q =∑n

i=1 ε2i ;

3. menghitung penduga parameter dengan mencari minimum dari

Q terhadap βj.

Dalam statistika, kalau kita membahas maksimum/ minimum

suatu fungsi, pada umumnya yang menjadi kepentingan adalah ni-

lai peubah atau paremeter yang menyebabkan fungsi itu mencapai

Page 48: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

47 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

maksimum/ minimum, bukan nilai maksimum/ atau minimum fungsi

tersebut. Dalam hal ini yang menjadi kepentingan adalah nilai β,

bukan nilai Q.

1.3.2. Metode Likelihood Maksimum

Kalau metode kuadrat terkecil menggunakan pendekatan geometris,

maka metode likelihood maksimum menggunakan pendekatan distribusi.

Dari data yang dimiliki serta asumsi distribusi yang diberlakukan pada

data tersebut kita memperoleh fungsi likelihood dari data tersebut.

Jelasnya langkah tersebut dapat diuraikan sebagai berikut.

1. Tentukan likelihood dari data Y1, Y2, · · · , Yn, yang saling bebas

dan mempunyai fungsi kepadatan peluang masing- masing, mi-

salnya ψi(θ). Likelihood keseluruhan ini adalah

L(θ) =n∏i=1

ψi(θ)

Fungsi likelihood tidak lain adalah fungsi kepadatan probabilitas

darai Y , hanya saja nilai y dianggap diketahui (dari data), tetapi

parameternya (θ) yang tidak diketahui.

Page 49: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

48 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2. Tentukan maksimum dari L atau log−L terhadap parameter θ.

Dalam kenyataannya, orang lebih seringmencari maksimum dari

fungsi log-likelihood, log (L) dari pada L. Hal ini bisa dilakukan

karena yang dicari adalah penyelesaian (nilai variabel y yang meye-

babkan terjadinya nilai Lmaksimum) bukan nilai maksimum L. Fungsi

log adalah fungsi monoton yang tidak mengubah nilai y yangmenye-

babkan L maksimum. Selain itu transformasi logaritma juga mem-

berikan beberapa keuntunan dalam perhitungan yaitu menghilangkan

exponen dan menyederhanakan produk menjadi jumlah.

`(θ) =n∑i=1

log (ψ(θ))

1.3.3. Mencari Maksimum dengan Metode Numerik

Pada umumnya maksimum suatu fungsi tidak bisa diperoleh secara

analitik, oleh karenanya diperlukan pendekatan yang disebut metode

numerik. Mencari maksimum/ minimum suatu fungsi F pada dasarnya

sama dengan mencari nilai nol atau penyelesaian fungsi f(θ) = F ′(θ) =

dF/dθ. Metode numerik yang biasa dipakai dalam mencari maksimum

Page 50: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

49 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

likelihood adalah Metode Newton-Raphson yang merupakan metode

iteratif. Langkah- langkah pokok dari metode Newton-Raphson ini

dapat diuraikan sebagai berikut:

1. menentukan nilai awal b0

2. melakukan iterasi sampai konvergen (sampai kriteria konver-

gensi terpenuhi)

b1 = b0 −F ′(b0)

F ′′(b0)(1.2)

atau

b1 = b0 −f(b0)

f ′(b0)(1.3)

dengan f = F ′.

Apabila peubah atau parameternya berdimensi tinggi, maka fungsi

turunan pertamanya berupa vektor (D) sedang turunan keduanya

akan berupa matriks yang disebut matriks Hessian (H). Bentuk mul-

tivariat dari Newton- Raphson ini adalah

b1 = b0 −D(b0)H−1(b0). (1.4)

Page 51: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

50 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Lebih khusus lagi, dalam statistika matriks Hessian ini kadang

kadang lebih sederhana jika diganti dengan negatif dari nilai hara-

pannya yang disebut matriks informasi dan dinotasikan I = −E[H].

Persamaan iterasi yang menggunakan matriks informasi dikenal de-

ngan metode skoring dari Fisher (Fisher’s scoring) yang ditunjukkan

oleh persamaan berikut.

b1 = b0 + D(b0)I−1(b0)(1.5)

Ada tiga hal penting yang harus diperhatikan dalam mengap-

likasikan metode numerik (Newton-Raphson maupun skoring dari Fisher)

yaitu: (i) algoritma yang dipakai (lengkap atau terpartisi), (ii) nilai

awal dan (iii) kriteria konvergensi.

Nilai awal untuk b0 ditentukan sedemikian sehingga pada saat

itu xb0 = y, sedangkan kriteria konvergensi bisa menggunakan max

(|b1 − b0| < δ,) untuk δ bilangan positif sangat kecil, misalnya 10−3.

Jika parameter yng diestimasi terdiri atas beberapa unsur, maka ada

beberapa cara yang ditempuh dalam mengestimasi dengan menggu-

nakan metode Newton-Raphson yaitu seperti berikut ini.

1. Mengestimasi secara serempak dengan memperlakukan param-

Page 52: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

51 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

eteryang diestimasi sebagai sebuah vektor penduga. Cara ini

disebut pendekatan algoritma penuh. Cara ini cocok apabila

setiap unsur dari vektor parameter mempunyai sifat-sifat (kon-

vergensi) yang relatif sama.

2. Mengelompokkan unsur-unsur parameter yang sejenis. Unsur-

unsur sejenis lalu diberlakukan sebagai suatu vektor. Dengan

demikian akan diperoleh lebih dari satu vektor parameter. Ma-

sing - masing vektor parameter yang diestimasi dengan cara

multivariate, tetapi pendugaan vektor satu dengan lainnya di-

lakukan secara selang-seling. Selang seling dapat dilakukan pada

setiap iterasi (nested), atau setelah masing- masing konvergen

pada kondisi tertentu(zig-zag). Algoritma seperti ini disebut al-

goritma terpartisi (partitioned algorithm). Pengelompokan bi-

asanya dilakukan berdasarkan parameter regresi (β) dan param-

eter dispersi (φ) yang biasanya kedua jenis parameter ini mem-

punyai sifat-sifat yang berbeda terutama dilihat dari kecepatan

konvergensinya.

Pembahasan kedua algoritma di atas (penuh dan terpartisi) dapat

dilihat pada Smyth [33] dan Smyth [34].

Page 53: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

52 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.4. Model Linier dan Perkembangannya

Perkembangan pemodelan stokastik, terutama model linier, dapat di-

katakan dimulai pada abad ke 19 yang didasari oleh teori matematika

yang diletakkan diantaranya oleh Gauss, Boole, Cayley dan Sylvester

yang terkait dengan teori invarian dalam aljabar. Teori invarian al-

jabar mempelajari bentuk-bentuk kuantitas yang tidak berubah ter-

hadap suatu transformasi linier. Teori invarian ini yang mendasari

perkembangan teori nilai eigen, vektor eigen, matriks determinan,

metode dekomposisi dan masih banyak lagi yang lainnya. Salah satu

contoh dalam statistika kita tahu bahwa korelasi dua peubah acak

tidak berubah walaupun peubah- peubah tersebut mengalami trans-

formasi.

Perkembangan model linier dimulai dengan perkembangan ana-

lisis regresi pada abad 19 oleh Pearson perkembangan korelasi segera

setelah itu. Teori regresi ini yang menjadi dasar perkembangan teori

model linier. Perkembangan model linier tidak bisa dilepaskan dengan

perkembangan teori matriks atau aljabar linier. Melalui teori matriks

(determinan, invers, perkalian matriks) pembahasan model linier da-

pat didekati secara umum (Lihat Statsoft [35]). Dalam subbab ini

Page 54: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

53 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

perkembngan model linier lebih dititik beratkan dari dua asumsi dasar

yaitu distribusi dan independensi galat.

Sebagaimana diuraikan sebelumnya, bahwa pemodelan dimulai

dari yang sederhana, yang secara matematis mudah diselesaikan, ke-

mudian berkembang ke arah yang lebih realistik. Hal ini dapat di-

lakukan, salah satunya dengan menerapkan berbagai asumsi yang ber-

beda terhadap distribusi galat dalam model yang digunakan. Prin-

sip seperti ini telah berkembang dari model yang paling sederhana

(klasik), ke model hirarkis tergeneralisir yang saat ini merupakan pe-

modelan yang paling terkini. Dalam sub-bab ini diuraikan secara

ringkas perkembangan model linier ditinjau dari segi distribusi dan

independensi galatnya.

1.4.1. Model linier klasik

Pemodelan linier memiliki bentuk umum

yi =

p∑j=0

xijβj + εi (1.6)

Page 55: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

54 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Untuk i = 1, 2, . . . , n dan j = 1, 2, . . . , p, atau dalam bentuk matriks

Y = Xβ + ε (1.7)

Dalam hal ini (i) ε merupakan galat atau error yang diasumsikan

merupakan peubah acak yang memenuhi distribusi tertentu, misal-

nya normal; (ii) peubah x adalah peubah tetap yang tidak bersifat

acak dan (iii) β adalah parameter yang menentukan koefisien dari pe-

ubah peubah tetap tadi. Dalam ilustrasi pada Contoh 1.1. misalnya,

dianggap bahwa sebenarnya ada hubungan yang bersifat tetap yang

menentukan harga barang di pasar. Namun, selain itu masih ada lagi

faktor lain yang bersifat acak yang menyebabkan harga barang tadi

dalam kenyataannya dari pembeli ke pembeli mungkin menyimpang

dari fungsi hubungan tadi. Dalam pemodelan statistika/ stokastik, ke-

dua komponen ini dipisahkan yaitu yang bersifat tetap dan fungsional

dinotasikan dengan f(x, β), yang bisa disebut sebagai komponen tetap

(fixed), sedangkan komponen lainnya, ε, yang bersifat acak disebut se-

bagai komponen acak (random component) atau dalam hal ini secara

khusus disebut komponen galat (error component). Dari segi fungsi

hubungan f , bentuk yang paling sederhana adalah hubungan linier,

sehingga dari aspek ini model yang paling sederhana yang kita miliki

Page 56: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

55 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

adalah model linier. Sedangkan dari segi komponen acaknya, yang pal-

ing sederhana adalah asumsi bahwa galatnya berdistribusi normal dan

saling independen antara satu respon dengan respon lainnya. Asumsi

ini menghasilkan model linier normal sederhana atau normal linear

models (NLM). Dari kedua hal tersebut lahirlah yang disebut model

normal sederhana atau model linier klasik yang secara formal dapat

diuraikan sebagai berikut.

Definisi 1.3 (Bentuk dan Asumsi Model Linier Klasik).

Model:

yi =k∑j=0

xijβi + εi (1.8)

atau untuk keseluruhan respon dapat dituliskan dalam bentuk

matriks seperti persamaan (1.7),

Y = Xβ + ε

Asumsi: xi bukan peubah acak dan diukur tanpa galat dan εi in-

dependen dengan ε′i untuk setiap i 6= i′ dan masing- masing

berdistribusi N(0, σ2).

Page 57: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

56 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Berdasarkan asumsi di atas diperoleh bahwa secara keseluruhan

ε dapat dianggap berdistribusi multivariat normal (MVN) dengan koe-

fisen variasi konstan, yang dinotasikan dengan ε ∼ MVN(0, σ2I).

Model mensyaratkan bahwa respon ke i dan ke i′ adalah saling bebas

(independen), yang berarti tidak ada korelasi diantaranya. Beberapa

referensi yang membahas model linier normal ini diantaranya adalah

Neter et al. [31], Bowerman et al.[3].

1.4.2. Model Linier Tercampur

Berdasarkan kenyataan di lapangan banyak ditemukan pengamatan

yang menghasilkan respon yang tidak saling independen. Misalnya,

apabila pada suatu subjek dilakukan pengamatan yang berulang- ulang

maka respon yang diperoleh antara satu dengan sebelumnya, atau satu

dengan berikutnya, dapat dipastikan akan saling berkorelasi. Dengan

demikian, pengamatan yang diperoleh bukan lagi merupakan hasil

pengamatan atau respon tunggal, tetapi merupakan vektor respon.

Tentu saja respon seperti ini dapat ditangani dengan metode multi-

variat. Namun ada kekhasan dari pengamatan seperti ini, yaitu kore-

lasi/ hubungan antara respon satu dengan lainnya biasanya berpola,

Page 58: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

57 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

sehingga dianggap kurang pas kalau ditangani dengan metode mul-

tivariat biasa. Untuk menangani respon-respon semacam ini model

linier klasik di atas lalu dikembangkan menjadi model linier tercam-

pur atau linear mixed models (LMM). Dalam model ini hubungan

antara respon yang satu dengan lainnya dianggap berasal dari pen-

garuh suatu peubah yang tidak kentara atau laten (subjek, misalnya).

Untuk itu komponen tetap (f(x)) diuraikan lagi menjadi komponen

tetap dan komponen efek acak (random effects). Dengan demikian

model ini memiliki dua komponen acak yaitu komponen error (ε) dan

komponen efek acak yang biasanya dinotasikan dengan u. Model ini

biasa disebut model linier tercampur (linear mixed model) yang dapat

didefinisikan sebagai berikut.

Definisi 1.4 (Bentuk dan Asumsi Model Linier Tercampur).

Model:

Y = Xβ + Zu + ε (1.9)

Asumsi: u ∼ MVN(0, σ21I) dan ε ∼ MVN(0, σ2

2I). u independen

dengan ε.

Page 59: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

58 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Sebenarnya ragam u dapat bervariasi sehingga membentuk ma-

triks ragam-koragam dari (Y) yang bervariasi juga. Struktur ma-

triks ragam-koragam ini dapat dibentuk sesuai kondisi respon yang

dihadapi. Bentuk yang paling sederhana di atas menghasilkan matriks

ragam-koragam yang disebut matriks uniform atau compound symme-

try atau seragam. Dengan menggunakan jumlah peubah acak yang

berdistribusai normal dan saling independen bisa diperoleh bahwa

bentuk ragam-koragam Y , yang identik dengan jenis korelasi uniform,

adalah

V =

σ21 + σ2

2 · · · σ21 · · · σ2

1

σ21 · · · σ2

1 + σ22 · · · σ2

1...

. . ....

. . ....

σ21 · · · σ2

1 · · · σ21 + σ2

2

atau secara umum

V = φ

1 · · · ρ · · · ρ...

. . ....

. . ....

ρ · · · 1 · · · ρ...

. . ....

. . ....

ρ · · · ρ · · · 1

(1.10)

Page 60: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

59 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Model ini mengasumsikan bahwa korelasi antara pengamatan

satu dan lainnya bersifat konstan (uniform). Struktur lain yang juga

banyak diterapkan adalah Auto Regresive 1 (AR1) atau disebut ragam-

koragam dengan korelasi serial yaitu:

V = φ

1 ρ ρ2 · · · ρk

ρ. . .

.... . .

...

ρ2 · · · 1 · · · ρ...

. . ....

. . . ρ

ρk · · · ρ2 ρ 1

(1.11)

Model ini mengasumsikan bahwa seiring dengan jarak yang makin

jauh, maka korelasi/ hubungan antara respon tersebut semakin kecil.

Dalam beberapa paket komputer, yang dimodelkan adalah struktur

korelasinya, bukan matriks ragam-koragamnya.

Model linier tercampur sering juga disebut dengan istilah mo-

del linier bertingkat (hierarchical linear model). Istilah bertingkat di-

gunakan karena model ini biasa juga didefinisikan secara bertingkat

seperti berikut ini.

Definisi 1.5. Asumsi Model Linier Tercampur/ Bertingkat

Page 61: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

60 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1. Ada efek acak ui yang berhubungan dengan strata atau subjek ke

i, untuk i = 1, ...n dimana antara satu efek acak dengan lainnya

saling independen dan berdistribusi normal dengan nilai-tengah

0;

2. Kondisional terhadap efek acak ke i , respon-respon di dalam

strata ini juga saling independen dan berdistribusi normal de-

ngan nilai-tengah dan ragam konstan.

Model linier Campuran banyak diaplikasikan untuk data yang

berasal dari pengukuran berulang yang dikenal dengan data longitu-

dinal atau repeated meassurement. Referensi yang bisa dijadikan acuan

untuk mempelajari model linier bertingkat ini diantaranya adalah Bab

4 dari Davidian dan Giltinan [9], Diggle et al. [10], Laird dan Ware

[19]. Sedangkan untuk model yang lebih umum yaitu termasuk model-

model non-linier dapat dilihat pada Davidian dan Giltinan [9]

1.4.3. Model Linier Tergeneralisir

Kondisi lain yang banyak ditemukan di lapangan yang tidak dapat

ditangani langsung oleh model linier klasik adalah adanya kenyataan

Page 62: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

61 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

bahwa, distribusi respon tidak mesti Normal. Sejauh ini, kondisi se-

perti ini biasanya ditangani dengan melakukan transpormasi pada re-

spon. Transpormasi yang banyak dipakai adalah transpormasi log-

aritma. Namun, ada beberapa permasalahan yang mungkin timbul

sebagai efek dari transpormasi ini misalnya seperti berikut ini. Re-

spon yang sudah ditranspormasi mungkin mendekati distribusi nor-

mal, tetapi akibat transpormasi ada kemungkinan syarat yang lain

(syarat ketidak-bergantungan) menjadi tidak terpenuhi. Adanya ker-

ancuan dalam menafsirkan hasil penelitian oleh karena efek yang di-

uji adalah dalam skala logaritma, bukan dalam sekala aslinya. Hal

ini menyebabkan kesimpulan terasa janggal misalnya, ”ada hubungan

positif antara log-konsentrasi pemupukan dengan log-panen”. Untuk

menangani kondisi dimana respon yang ada tidak berdistribusi Nor-

mal, tetapi masih saling bebas, maka para statistisi yang dipelopori

oleh Nelder dan Wedderburn [30] telah mengembangkan model linier

yang dikenal dengan generalized linear model (GLM). Model ini di In-

donesai dikenal dengan model linier terampatatau tergeneralisir. Mo-

del linier ini menggunakan asumsi bahwa repon memiliki distribusi

keluarga ekponensial. Distribusi keluarga eksponensial adalah dis-

Page 63: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

62 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

tribusi yang sifatnya lebih umum, dimana distribusi- distribusi yang

banyak kita kenal (Normal, Gamma, Poisson) termasuk di dalamnya

dan merupakan bentuk- bentuk khusus dari distribusi Keluarga Eks-

ponensial. Definisi distribusi Keluarga Eksponensial ini akan dibahas

pada bab selanjutnya. Kalau kita simak model linier klasik, kita men-

emukan beberapa hal yang sifatnya khas dan istimewa yaitu:

1. ada komponen tetap yang disebut prediktor linier ;

2. respon yi berdistribusi normal dan saling independen dan

3. nilai-tengah yi adalah µi =∑k

j=0 xijβj.

Pada model linier tergeneralisir/terampat, hubungan di atas men-

galami perubahan atau generalisasi, sebagaimana dalam definisi ber-

ikut:

Definisi 1.6 (Asumsi Model Linier Tergeneralisir). Model linier ter-

generalisir adalah model yang mengandung tiga hal yaitu:

1. komponen tetap yang disebut prediktor linier ηi =∑k

j=0 xijβj;

Page 64: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

63 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2. respon yi berdistribusi secara independen dalam keluarga eks-

ponensial;

3. hubungan antara nilai-tengah dengan prediktor linier ditunjukkan

fungsi g(.) yang disebut fungsi ’link’ sedemikian sedingga g(µi) =

ηi. Fungsi g() disebut fungsi hubungan (link-function).

Ada fungsi hubungan khusus yang disebut fungsi hubungan kanonik

atau natural yang berkaitan erat dengan distribusi y. Misalnya, jika

distribusinya normal maka g() adalah identitas. Dari hal di atas di-

katakan bahwa komponen penting dalam model linier tergeneralisir

ada tiga yaitu:

(i) adanya prediktor linier,

(ii) adanya distribusi keluarga eksponensial dan

(iii) adanya fungsi-hubungan.

Referensi yang umum dijadikan acuan utama mempelajari mo-

del linier tergeneralisir ini adalah generalized linear models oleh Mc-

Cullagh dan Nelder [24], sedangkan sebagai pemula dapat digunakan

pengantar yang ditulis oleh Dobson [11].

Page 65: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

64 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.4.4. Model untuk Data Tidak Normal dan Tidak Saling

Bebas

Seiring dengan semakin luasnya penggunaan metode statistika dalam

menganalisis data, maka data yang dihadapi ada kemungkinan tidak

saja tidak berdistribusi Normal tetapi juga tidak saling bebas. Untuk

menganalisis data semacam ini ada tiga kelompok metode yang banyak

dipakai untuk menyelesaikan model linier tercampur tergeneralisir.

GLMM . Model ini merupakan kombinasi antara LMM dan GLM.

Pada model ini, walau komponen galat tidak harus berdistribusi

Normal, tetapi komponen acaknya masih diasumsikan berdis-

tribusi Normal dan menggunakan bentuk aditif seperti pada mo-

del linier tercampur normal. Model linier ini biasa disebut seba-

gai Model linier tercampur tergeneralisir (GLMM = Generalized

Linear Mixed Model)

HGLM Model ini menggunakan bentuk multiplikatif dan komponen

acaknya tidak dibatasi dengan distribusi Normal. Model linier

ini sering juga disebut Model linier hirarkis/ bertingkat terger-

eralisasir (HGLM=Hierarchical Generalized Linear Model). Mo-

Page 66: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

65 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

del linier ini termasuk model linier yang relatif baru dan masih

sedang dikembangkan (lihat misalnya Lee dan Nelder [20] dan

Tirta ([37], [39],[38].

GEE Pendekatan yang relatif lebih praktis, Liang & Zeger [21] dan

Zeger & Liang [52] memperkenalkan metode yang disebut dise-

but Generalized Estimating Equations (untuk selanjutnya dis-

ingkat GEE) yang merupakan sebuah analogi atau generalisasi

multivariat dari quasi-likelihood. Manakala tidak ada fungsi like-

lihood yang pasti untuk dijadikan acuan, cukup beralasan untuk

menduga/ mengestimasi dengan menyelesaikan sebuah analogi

multivariat dari metode quasi-score yang diperkenalkan Wed-

derburn [51] dimana kita hanya perlu menentukan bentuk mean

atau nilai-tengah(sebagai momen pertama) dan matriks ragam-

koragam (sebagai momen kedua), tanpa perlu mengetahui ben-

tuk pasti likelihoodnya. Pembahasan yang lebih detil dapat

dibaca pada Diggle et al. [10] (Lihat juga Yasi et al. Perkem-

bangan dan pembagian model linear dapat diliustrasikan dalam

bentuk bagan seperti pada Gambar 1.2.

Page 67: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

66 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

εXβY +=

Komponen Acak

Komponen Tetap

Univariat? Multivariat?

Independen? Dependen (Multi kolinieritas)?

RKU Seleksi Variabel

R. BERTATAR STEPWISE

Normal? Tidak Normal?

Independen? Tidak Independen?

NLM/MLK LMM/MLC

GLMM/MLCT GEE

GLM/MLC

Var.Laten? REGRESI GULUD (RIDGE)

SEM

Pencilan/Outlier?

REGRESI ROBUST

Faktor emua ANOVA/MANOVA

Gambar 1.2: Pembagian dan Perkembangan Model Linear

Page 68: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

67 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.4.5. Pengembangan Lain Model Linier

Selain berkembang akibat variasi asumsi distribusi dari galat, model

linier juga berkembang ke arah variasi kondisi peubah bebas atau pe-

ubah penjelas X, seperti ditujukkan oleh Gambar 1.2. Asumsi dasar

dari peubah X adalah bukan peubah acak (tidak memiliki distribusi)

dan merupakan besaran kuantitatif.

Dalam perkembangannya, ada kalanya Xj, j = 0, 1, 2, 3, . . . , p−1 merupakan peubah acak sedangkan Xj dan X ′j tidak saling bebas

untuk suatu j 6= j′, dalam kondisi seperti ini, dikatakan terjadi multi-

kolinieritas antara peubah bebas X. Tingginya multikolinieritas dapat

menyebabkan adanya estimasi parameter tidak teliti. Secara matema-

tis Xj dan X ′j yang tidak saling bebas, menunjukkan bahwa salah satu

kolom matriks X merupakan kombinasi linier linier dari kolom-kolom

lainnya yang menyebabkan X tidak dalam rank penuh, sehingga invers

matriks XTX menjadi tidak terdefinisikan. Ada beberapa prosedur

atau tehnik untuk menangani masalah multikolinieritas, diantaranya

adalah regresi Ridge dan Regresi dengan Komponen Utama (RKU)

(lihat Neter et al[31]).

Tidak jarang juga kumpulan data yang kita miliki, sesungguh-

Page 69: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

68 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

nya merupakan sekumpulan dari berapa kelompok data atau sampel

sesungguhnya terdiri atas beberapa subsampel. Persoalan yang di-

hadapi adalah apakah model (garis regresi) masing- masing kelompok

harus berbeda atau dapat digabung dalam satu model yang sama.

Dalam hal ini sebagian peubah penjelas Xj akan merupakan peubah

kualitatif, atau merupakan indikator kelompok atau grup dari kelom-

pok yang ada pada data, sampel maupun populasi. Analisis model

linier yang menangani data semacam ini menggunakan peuban boneka

dummy variable dan dapat dilihat pada Neter et al[31].

Page 70: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

69 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

50 60 70 80 90

5060

7080

90

NMat

NF

is

LP

Gambar 1.3: Ilustrasi Data dengan pencilan dan kelompok. Data ini

memerlukan pemisahan model dari subsampel

Page 71: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

70 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.5. Model-model Nonlinier

Pada model-model yang telah dibicarakan sebelumnya, ada ciri khas

hubungan antara parameter dan peubah prediktornya, yaitu adanya

kombinasi linier antara peubah prediktor dengan parameter regresinya

(yaitu ηi =∑p

i=1 xijβj. Sementara itu hubungan antara µi dengan ηitidak selalu linier (misalnya log, resiprokal dan lain-lain). Ciri-ciri

tersebut menyebabkan model yang telah dibicarakan masih termasuk

kelompok model linier.

Perkembangan lain dari model statistika tidak mewajibkan ada-

nya kombinasi linier (ηi), tetapi mengadopsi bentuk yang lebih luas

yaitu polinomial atau bentuk aditif, η(x) = α +∑p

j=1 fj(xj). Ter-

masuk dalam model ini adalah GAM (generalized additive models)

(Hastie dalam Chamber & Hastie [5], Hastie & Tibsirani [14]), regresi

lokal (Cleveland et al., dalam Chamber & Hastie [5], Venables& Ripley

[46]).

Page 72: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

71 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.6. Tinjauan singkat Program Statistika R

Penggunaan piranti lunak komputer dalam analisis regresi hampir

tidak bisa ditunda lagi. Selain untuk mempercepat proses perhitun-

gan, penggunaan piranti lunak memungkinkan peneliti atau analis

data dapat melakukan dengan cepat (i) berbagai alternatif model

(baik dilihat dari jenis sebaran, jenis hubungan serta jumlah peu-

bah yang dimuat) serta memilih model yang terbaik; (ii) melengkapi

hasil analissi data secara numerik dengan visualisasi grafik yang dapat

membantu pemahaman dalam menginterpretasi model. Dalam sub-

bab ini akan dibahas secara singkat beberapa kemampuan R terkait

pemodelan statistika atau analisis regresi, diantaranya:

1. kemampuan umum terkait cara mengaktifkan paket, melihat-

dokumentasi paket termasuk contoh penggunaannya;

2. kemampuan manipulasi grafik terkait pemeriksaan asumsi mo-

del yang dipergunakan dan visualisasi untuk melengkapi hasil

analisis secara numerik;

3. paket-paket R yang terkait dengan berbagai bentuk analisis re-

Page 73: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

72 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

gresi mulai dari yang paling sederhana (regresi klasik) sampai

yang sangat kompleks (respon nonnormal dan tidak saling be-

bas, hubungan nonlinier).

R adalah piranti lunak utuk analisis data dan penyajian grafik

yang berbasis Open Sources. Sebagian besar kemampuan R hanya

bisa dimanfaatkan melalio pendekatan CLI (command line interface),

yaitu dengan mengirim perintah dalam bentuk kumpulan perintah

baris atau skrip. Hanya sebagian kecil kemampuan R yang dapat

dimafaatkan melaui menu grafis GUI(graphical user interface) Ada

dua cara memanfaatkan R melalui CLI.

1. Menulis perintah langsung pada Rconsole. Untuk pertintah-

perintah singkat yang jarang diulang, biasanya langsung ditulis

pada layar Rconsole.

2. Menulis skrip secara terpisah. Untuk perintah yang agak pan-

jang dan sering diulang (misalnya dalam simulasi), perintah-

perintah R ditulis secara tersendiri pada editor skrip. Kumpulan

perintah ini selanjutnya dapat dijalankan sebagian atau secara

Page 74: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

73 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

keseluruhan sesuai kebutuhan. Untuk mengaktifkan editor skrip

pada R dapat dilakukan langkah berikut:

(a) Pada menu File pilih New Script atau Open Script

(b) setelah perintah ditulis pada layar editor eksekusinya dapat

dilakukan dengan mengaktifkan menu Edit pada Editor,

selanjutnya bisa pilih run lines atau run all

Hampir semua paket atau Pustaka R yang terkait dengan ana-

lisis data tingkat lanjut (advanced statistical analyses), termasuk re-

gresi hanya bisa dimanfaatkan melalui pendekatan perintah baris atau

skrip. Hanya sebagian kecil dan yang masih bersifat mendasar yang

dapat dimanfaatkan melalui pendekatan menu, misalnya RComman-

der (lihat Tirta [43]. Untuk itu, pembaca perlu memahami cara me-

manfaatkan R melalui skrip (Untuk dokumentasi lebih detail dapat

dilihat pada Tirta [42]). Secara umum ada beberapa perintah pen-

ting yang perlu dikuasai untuk dapat memanfaatkan R dengan baik

yaitu:(i) cara mengaktifkan paket, (ii) melihat dokumentasi paket, (iii)

menjalankan contoh pada paket.

1. Mengaktifkan paket. Kemampuan R tersusun atas fungsi-fungsi

Page 75: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

74 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

yang dikemas dalam bentuk paket. Paket yang dimiliki R belum

bisa dimanfaatkan sampai paket itu diaktifkan. Ada dua cara

mengaktifkan suatu paket yaitu.library(nama_paket)

require(nama_paket)

Misalnya untuk mengaktifkan paket gee, kita dapat memanggil

dengan salah satu cara berikut.

library(gee)

require(gee)

Jika dilakukan akan muncul pesan

Loading require package: gee

2. Membaca dokumentasi pada paket.Setelah paket diaktifkan, se-

lenjutnya dokukmentasinya dapat dipanggil. Berikut adalah

Page 76: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

75 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

cara memanggil dokumentasi paket, dengan contoh khusus paket

gee.

help(nama_paket)?nama_paket

help(gee)

?gee

Setelah perintah tersebut dijalankan, maka akan muncul doku-

mentasi tentang paket gee, diantaranya berisi (i) cara meman-

faatkan paket gee,(ii) jenis dan interpretasi keluaran gee, (iii)

referensi terkait gee, serta (iv) contoh penggunaan gee.

3. Menjalankan contoh-contoh pada paket. Satu paket R dapat

terdiri atas beberapafungsi analisis. untuk menjalankan contoh-

contoh fungsi pada paket dapat ditempuh dua cara. (Paket gee

secara kebetulanjuga memuat fungsi analissi yang disebut gee).

(a) Dengan melakukan perintah langsung.

Page 77: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

76 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

example(nama_fungsi)example(gee)

(b) Dengan menyalin teks pada contoh; dengan cara ini teks

contoh yang ada pada dokumentasi, disalin (copy) lalu ditem-

pelkan (paste) pada Rconsole.

4. Menyimpan objek dan memeriksa komponen objek. Hasil perhi-

tungan dengan R biasanya disimpan dalam bentuk objek. Kom-

ponen objek dapat dilihat dengan menggunakan perintah names(nama_objek).

nama_objek<-fungsi

names(nama_objek)

Sebagai contoh komponen objek yang dihasilkan oleh analisis

model linier dapat ditujnukkan pada tampilan berikut.

lm1<-lm(y~x)

names(lm1)

"coefficients" "residuals" "effects" "rank"

"fitted.values" "assign" "qr" "df.residual"

"xlevels" "call" "terms" "model"

Page 78: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

77 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Selanjutnya untuk mencetak sebagian komponen dari objek ber-

sangkutan dilakukan dengan perintah

newline print(objek$komponen)).

Berikut adalah perintah dan hasil keluaran yang dilakukan pada

objek lm1 di atas.> print(lm1$coeff)

(Intercept) x

-3.317963 3.111967

>print(lm1$call)

lm(formula = y ~ x)

1.6.1. Aplikasi R untuk Manipulasi Grafik

Selain analisis statistik secara numerik, analisis regresi juga perlu

dilengkapi dengan visualisasi data melalui grafik. Visualisasi grafik

selain bermanfaat untuk mendapatkan gambaran tentang kondisi data

terkait dengan asumsi-asumsi sebaran (histogram, QQPlot, Boxplot,

Page 79: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

78 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

diagram pencar sisa), juga bermanfaat dalam memberikan visualisasi

model (diagram pencar data yang dilengkapi garis regresi, khususnya

untuk dua dimensi). Tabel 1.2 memuat beberapa paket dan fungsi

yang terkait dengan penyajian grafik dalam analisis regresi.

Visualisai tentang sebaran data baik terkait sebaran univariat,

maupun pencaran bivariat dapat disajikan dalam berbagai cara (lay-

out), misalnya menyisipkan grafik kecil dalam grafik besar, atau mem-

bagi lay out layar. Informasi lebih lengkap dapat dilihat pada Tirta

[42] atau Burns [4]. Berikut adalah beberapa contoh penyajian grafik

terkait regresi.

1. Histogram dilengkapi dengan kurva densitas (baik teoritis mau-

pun emperik). Grafik ini memberikan gambaran secara intuitif

kesesuaian sebaran data dengan sebaran teoritis yang menjadi

asumsi (skrip berikut hasilnya terlihat pada Gambar 1.4).

hist(x,freq=FALSE,ylim=c(0,0.45),

main="HISTOGRAM DENGAN KURVA DENSITAS")

lines(density(x),lty=4) #densitas emperik

lines(sort(x),dnorm(sort(x)))#densitas teoritik

Page 80: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

79 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Tabel 1.2: Fungsi dan paket untuk menggambar grafik R

Fungsi Paket Penggunaan

barplot() graphics menggambar grafik batang

hist() graphics menggambar histogram

boxplot() graphics menggambar boxplot

plot() graphics menggambar grafik X-Y

pairs() graphics menggambar Matriks Dia-

gram Pencar

abline() graphics menggambar garis lurus

yang diketahui konstanta

dan gradiennya

contour() graphics menggambar kontur

persp() graphics menggambar boxplot

rug() graphics menggambar sebaran data

pada sumbu

qq.plot() car menggambar plot per-

bandingan kuantil

reg.line() car menggambar garis regresi

scatterplot(),

sp()

car menggambar diagram pen-

car data

spm(),

scatterplot.matrix(),

car diagram pencar beberapa

pasang peubah

Page 81: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

80 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2. Diagram pencar dilengkapi dengan rugplot dan boxplot marjinal

(untuk peubah penjelas dan peubah respon). Grafik ini mem-

berikan gambaran secara intuitif kesesuaian sebaran data secara

univariate (skrip berikut hasilnya terlihat pada Gambar 1.5)

plot(x,y,xlab="X", ylab="Y",col="red",

main="DIAGRAM PENCAR DENGAN RUG & BOXPLOT")

abline(lm(y~x),col="blue")

rug(side=1, jitter(x, 5),col="green" )

rug(side=2, jitter(y, 20),col="green" )

par(mar=c(1,2,5,1))

boxplot(y, axes=F)

par(mar=c(5,1,1,2))

boxplot(x, horizontal=T, axes=F)

3. Diagram pencar dilengkapi dengan histogram dan qqplot marjinal

(untuk peubah penjelas dan peubah respon). Grafik ini memberikan

gambaran secara intuitif kesesuaian sebaran data secara univariate.

Grafk dapat disajikan dengan menyisipkan histogram dan qqplot di

Page 82: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

81 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dalam diagram pencar (lihat Gambar 1.6) atau dengan mengatur

lay out tampilan grafik seperti Gambar 1.7dan Gambar 1.8. Berikut

adalah skrip untuk Layout c(1,2)-c(2,1), untuk Gambar 1.7, yaitu

pertama layar dibagi atas 1 baris dan 2 kolom, selanjutnya layar

kolom kedua dibagi menjadi 2 baris 1 kolom.

split.screen(c(1,2))

split.screen(c(2,1), screen = 2)

screen(1)

plot(x,y,main="Diagram Pencar (X,Y)")

abline(lm(y~x))

screen(3)

hist(y, probability=T,

main="Histogram Y")

lines(density(y), col="red", lwd=2)

screen(4)

qq.plot(x,main="QQ.norm X")

Skrip berikut adalah untuk Layout c(2,1)-c(1,2), untuk Gambar 1.8,

yaitu pertama layar dibagi atas 2 baris dan 1 kolom, selanjutnya

layar baris kedua dibagi menjadi 1 baris 2 kolom.

Page 83: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

82 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

split.screen(c(2,1))

split.screen(c(1,2), screen = 2)screen(1)

plot(x,y,main="Diagram Pencar (X,Y)")

abline(lm(y~x))

screen(3)

hist(y, probability=T,

main="Histogram Y")

lines(density(y), col="red", lwd=2)

screen(4)

qq.plot(x,main="QQ.norm X")

Page 84: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

83 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

HISTOGRAM DENGAN KURVA DENSITAS

x

Den

sity

−3 −2 −1 0 1 2

0.0

0.1

0.2

0.3

0.4

Gambar 1.4: Contoh Histogram dengan Kurva Densitas.Kurva lang-

sung adalah densitas teoritis, kurva putus-putus adalah

densitas emperik data

Page 85: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

84 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

40 45 50 55 60

120

130

140

150

160

170

180

DIAGRAM PENCAR DENGAN RUG & BOXPLOT

X

Y

Gambar 1.5: Contoh Diagram Pencar dengan rug dan boxplot(densitas

data)

Page 86: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

85 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

40 45 50 55 60

120

130

140

150

160

170

180

DIAGRAM BESAR DENGAN GRAFIK MINI

x

yHistY

−2 −1 0 1 2

4050

60

QQNorm

norm quantiles

x

Gambar 1.6: Contoh Gabungan Grafik Besar (Diagram Pencar) de-

ngan Grafik Mini(Histogram dan QQPlot)

Page 87: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

86 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

40 45 50 55 60

120

130

140

150

160

170

180

Diagram Pencar (X,Y)

x

y

Histogram Y

y

Fre

quen

cy

120 140 160 180

05

1020

−2 −1 0 1 240

4550

5560

QQ.norm X

norm quantiles

x

40 45 50 55 60

120

130

140

150

160

170

180

Diagram Pencar (X,Y)

x

y

Histogram Y

y

Fre

quen

cy

120 140 160 180

05

1020

−2 −1 0 1 240

4550

5560

QQ.norm X

norm quantiles

x

40 45 50 55 60

120

130

140

150

160

170

180

Diagram Pencar (X,Y)

x

y

Histogram Y

y

Fre

quen

cy

120 140 160 180

05

1020

−2 −1 0 1 240

4550

5560

QQ.norm X

norm quantiles

x

40 45 50 55 60

120

130

140

150

160

170

180

Diagram Pencar (X,Y)

x

y

Histogram Y

y

Fre

quen

cy

120 140 160 180

05

1020

−2 −1 0 1 240

4550

5560

QQ.norm X

norm quantiles

x

40 45 50 55 60

120

130

140

150

160

170

180

Diagram Pencar (X,Y)

x

y

Histogram Y

y

Fre

quen

cy

120 140 160 180

05

1020

−2 −1 0 1 240

4550

5560

QQ.norm X

norm quantiles

x

40 45 50 55 60

120

130

140

150

160

170

180

Diagram Pencar (X,Y)

x

y

Histogram Y

y

Den

sity

120 140 160 180

0.00

00.

010

0.02

0

−2 −1 0 1 240

4550

5560

QQ.norm X

norm quantiles

x

Gambar 1.7: Contoh Gabungan Grafik dengan pembagian layar

(1,2)dan (2,1)

Page 88: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

87 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

40 45 50 55 60

120

140

160

180

Diagram Pencar (X,Y)

x

y

Histogram Y

y

Den

sity

120 140 160 180

0.00

00.

010

0.02

0

−2 −1 0 1 2

4045

5055

60

QQ.norm X

norm quantiles

x

Gambar 1.8: Contoh Gabungan Grafik dengan pembagian layar

(2,1)dan (1,2)

Page 89: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

88 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.6.2. Aplikasi R untuk Model Statistika/ Analisis Regresi

Analisis regresi menggunakan R tersebar dalam banyak paket, di-

antaranya ada yang telah terintegrasi dengan paket minimal R ada

pula yang harus diinstal dan dipanggil secara khusus. Berikut ada-

lah fungsi-fungsi yang dipakai menganalisis model linier beserta paket

yang memuatnya.

Fungsi dan paket untuk model statistika dalam R

Fungsi Paket Penggunaan

lm() stats regresi/model linier dengan respon

berdistribusi Normal. Paket ini telah

terintegrasi dengan R dan sudah da-

pat dimanfaatkan melalui menu RCom-

mander

Page 90: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

89 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

glm() stats regresi/model linier dengan respon

berdistribusi Keluarga Eksponensial

termasuk distribusi Normal denganre-

spon masih saling bebas. Paket ini

telah terintegrasi dengan R dan su-

dah dapat dimanfaatkan melalui menu

RCommander

lme() lme4 *) regresi/ model liner tercampur baik un-

tuk respon berdistribusi keluarga eks-

ponensial (termasuk distribusi Normal)

... lmm *) Berbagai fungsi untuk menangani data

dengan respon berdistribusi normal

tetapi tidak saling bebas dengan pen-

dekatan Bayesian dan Markov Chained

Monte Carlo

Page 91: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

90 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

glmmML()glmmML

*)

regresi dengan respon berdistribusi

Keluarga Eksponensial denganpen-

dekatan Likelihood Maksimum

lrm() Design *) Khusus untuk data dengan respon

berdistribusi Binomial dan fungsi hu-

bungan logit

gee() gee *) regresi dengan dengan respon berdis-

tribusi Keluarga Eksponensial dan

tidak saling bebas

geese() geepack

*)

regresi linier dengan dengan respon

berdistribusi Keluarga Eksponensial

dan tidak saling bebas. Hampir sama

dengan gee(), tetapi memiliki alter-

natif pemodelan yang lebih luwes ter-

masuk pemodelan koragamnya

gam() gam,

mgcv

regresi atau model statistika dengan

hubungan yang lebih luas termasuk

noonlinier dan semiparamerik

nls() stats estimasi model nonlinier dengan meng-

gunakan kuadrat terkecil nonlinier ter-

bobot

Page 92: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

91 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

*) menunjukkan bahwa paket harus diinstal secara khusus

1.6.3. RCommnder RGUI untuk analisis dasar

Ada RGUI yang disebut RCommander yang telah menyediakan bebe-

rapa analisis regresi mendasar melalui menu grafis, diantaranya:

1. regresi linier klasik sederhana (satu peubah bebas dan satu pe-

ubah penjelas);

2. model linier klasik dengan beberapa peubah poenjelas termasuk

peubah kualitatif;

3. GLM (model linier terampat/ tergeneralisir).

Selain kemampuan analisis regresi tersebut di atas, manfaat peng-

gunaan RComander adalah memudahkan pengguna mengimpor data

dari berbagaiformat termasuk format excel yang banyak dipakai kalan-

gan peneliti di Indonesia. Penjelasan rinci RCommander dapat dilihat

pada Tirta [42] dan [43] .

Page 93: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

92 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.7. Ringkasan

Hal-hal penting yang perlu dipahami dalam bab ini adalah seperti

berikut.

1. Pemodelan stokastik mengandung komponen tetap yang meru-

pakan komponen regresi dan komponen kesalahan yang bersifat

acak yang memiliki sebaran tertentu;

2. Kepentingan utama dalam analisis model stokastik (analisis re-

gresi) adalah mengestimasi koefisien komponen tetap (parameter

regresi).

3. Metode yang biasa dipakai untuk mengestimasi koefisien regresi

adalah metode kuadrat terkecil dan metode kecenderungan mak-

simum.

4. Analisis model linier (regresi linier) telah berkembang untuk

menanganiberbagai kondisi dari komponen acak (bersebaran nor-

mal atau tidak, saling bebas atau tidak).

Page 94: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

93 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5. Untuk komponen acak yang bersebaran normal dan saling bebas,

analisisnya biasa disebut model linier normal.

6. Untuk komponen acak yang tidak bersebaran normal, tetapi

masih dalam sebaran keluarga eksponensial dan masih saling

bebas, analisisnya biasa disebut model linier tergeneralisir (ter-

ampat).

7. Berbagai pendekatan telah dikembangkan untuk komponen acak

yang masih bersebaran keluarga eksponensial tetapi tidak saling

bebas, diantaranya adalah GEE, GLMM, dan HGLM.

8. Hampir semua analisis di atas telah tersedia pada paket sta-

tistika berbasis open source R yang dapat diperoleh secara gratis.

Page 95: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

94 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.8. Bacaan Lebih Lanjut

Pada dasarnya semua referensi yang dapat dibaca untuk pengemban-

gan materi pemodelan statistika telah diuraikan pada sesi perkemban-

gan model statistika. Berikut adalah kata kunci yang dapat dipakai

untuk melacak (searching) materi pengembangan baik diperpustakaan

maupun di internet. Bahan bahan ini biasanya dikemas dalam salah

satu topik berikut:statistical model, linear model, regression. Untuk

model linear tergeneralisir/terampat dapat juga dilacak dengan kata

kunci berikut: logit, probit, log-linear.

Page 96: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

95 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1.9. Latihan

1. Jelaskan apa perbedaan penting antara pemodelan matematika

secara umum dan pemodelan statistika.

2. Sebutkan langkah-langkah penting pemodelan statistika.

3. Sebutkan beberapa macam pemodelan statistika linier yang anda

kenal dilihat dari asumsi distribusi dan kebergantungannya.

4. Sebutkan beberapa macam pemodelan statistika nonlinier yang

anda kenal.

5. Carilah referensi yang terkait dengan pemodelan statistika linier

baik di perpustakaan maupun di internet. Sebutkan masing- ma-

sing lima referensi yang belum terdaftar dalam Daftar Pustaka

dari buku ini.

6. Lakukan eksplorasi pada R

(a) buat grafik X-Y (plot(x,y,...) dengan memberi judul

utama, label pada sumbu X dan sumbu Y;

Page 97: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

96 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

(b) buat tampilan jendela grafik dengan berbagai outline.

(c) buat histogram dengan dilengkapi judul dan kurva sebaran;

(d) buat diagram pencar yang dilengkapi dengan marjin box-

plot;

(e) bagaimana menggunakan fungsi lm();

(f) sebutkan komponen objek yang dihasilkan dari fungsi lm();

(g) jalankan contoh analisis regresi dengan glm;

(h) periksa komponen-komponen objek yang dihasilkan oleh

fungsi glm.

7. Lakukan eksplorasi pada RCommander:

(a) panggil salah satu data dari pustaka yang ada;

(b) sebutkan grafik yang dapat dibuat melalui menu RCom-

mander;.

(c) aktifkan plugin terkait demo/animasi statistika;

(d) analisis salahsatu data dengan analisi regresi sederhana, se-

lanjutnya buat grafik diagnostiknya.

Page 98: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

97 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

BAB 2

ALJABAR MATRIKS UNTUK STATISTIKA

Analisis data, khususnya estimasi parameter dalam regresi multivariat,

banyak melibatkan operasi matriks. Dalam bab ini akan dibahas teori

matriks yang banyak terkait dengan statistika.

Page 99: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

98 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Kompetensi

Setelah membaca bab ini, pembaca diharapkan memahami aljabar ma-

triks, turunan yang berkaitan dengan matriks serta menggunakannya

dalam statistika, khususnya dalam analisis regresi.

Page 100: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

99 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2.1. Materi

1. Definisi dan jenis matriks

2. Operasi matriks

3. Kebergantungan linier

4. Bentuk kuadrat dan turunannya

5. Aplikasi R untuk matriks

Page 101: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

100 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2.2. Defenisi dan Jenis Matriks

Definisi 2.1. Matriks adalah kumpulan unsur yang disusun dalam

baris dan kolom yang berbentuk persegi panjang.

Matriks biasanya dinotasikan dengan huruf besar tebal, misalnya

A,B, sedangkan unsur-unsurnya bisa berupa bilangan atau huruf ke-

cil. Banyaknya baris dan kolom matriks disebut ordo matriks matriks.

Matriks yang memiliki n baris dan m kolom,dikatakan berordo n×mdan dinotasikan dengan An×m = [aij]. Dalam hal ini, aij adalah unsur

yang berada pada baris ke i dan kolom ke j dengan i = 1, 2, · · · , ndan j = 1, 2, 3, · · · ,m.

Contoh 2.1. Matriks A berikut adalah matriks yang berordo 4 ×3;

A =

3 4 5

1 3 6

7 10 20

5 7 2

Beberapa matriks khusus yang banyak digunakan dalam sta-

tistika diantaranya adalah matriks bujur sangkar, matriks diagonal,

Page 102: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

101 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

matriks skalar dan matriks simetrik. Definisi formal masing- masing

jenis matriks tersebut dapat dilihat pada buku-buku teks standar yang

membahas matriks.

Definisi 2.2. Matriks bujur sangkar (square matrix), adalah matriks

dengan banyak barisnya sama dengan banyak kolomnya, yaitu n = m.

Pada matriks bujur sangkar, unsur unsur yang berada pada

baris dan kolom dengan nomor sama disebut diagonal utama (yaitu:

aii, i = 1, 2, · · · , n.)

Contoh 2.2.

B =

3 14 5

11 3 6

7 10 20

Definisi 2.3. Matriks diagonal adalah matriks yang semua unsurnya,

selain unsur-unsur pada diagonal utamanya, adalah nol, yaitu aij = 0

untuk setiap i 6= j.

Contoh 2.3.

D =

3 0 0

0 0 0

0 0 2

Page 103: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

102 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Definisi 2.4. Matriks skalar adalah matriks diagonal yang semua un-

surnya sama, tetapi tidak sama dengan 0.

Contoh 2.4.

C =

3 0 0

0 3 0

0 0 3

Definisi 2.5. Matriks identitas I adalah matriks skalar yang semua

unsurnya 1

Contoh 2.5.

I =

1 0 0

0 1 0

0 0 1

Definisi 2.6. Matriks nol (0) adalah matriks yang semua unsurnya

adalah 0.

Definisi 2.7. Matriks simetris adalah matriks yang unsur-unsurnya

simetris terhadap diagonal utama, yaitu aij = aji untuk setiap i dan

j.

Page 104: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

103 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Contoh 2.6.

A =

3 1 5

1 2 0

5 0 4

Contoh 2.7.

Dalam statistika, matriks simetris yang banyak ditemukan adalah ma-

triks korelasi (R) dan matriks varians-kovarians atau matriks ragam-

koragam(V).

R =

1 r12 · · · r1nr21 1 · · · r2n...

.... . .

...

rn1 r2n · · · 1

dan V =

σ21 σ12 · · · σ1n

σ21 σ22 · · · σ2n

......

. . ....

σn1 σ2n · · · σ2n

Selain matriks-matriks umum di atas, dalam statistika ada yang

disebut matriks desain X. Matriks ini merupakan matriks yang meng-

hubungkan parameter β dengan peubah- peubah penjelas Xj. Pada

Page 105: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

104 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

umumnya model yang dipergunakan selalu mengandung konstanta se-

hingga kolom pertama matriks X biasanya beranggotakan 1.

X =

1 x11 x12 · · · x1p1 x21 x22 · · · x2p...

.... . .

...

1 xn1 xn2 · · · xnp

Page 106: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

105 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2.3. Operasi Matriks dan Sifat-sifatnya

Operasi matriks yang penting yang banyak dipergunakan dalam sta-

tistika diantaranya adalah operasi uner yaitu: invers dan transpos dan

operasi biner yaitu penjumlahan dan perkalian.

2.3.1. Operasi uner

Untuk melakukan operasi uner diperlukan cukup satu matriks. Ope-

rasi yang termasuk uner adalah operasi invers baik untuk penjumlahan

maupun perkalian dan operasi transpos.

Definisi 2.8. Invers penjumlahan suatu matriks A ditulis−A, adalah

matriks yang unsur-unsurnya adalah negatif dari unsur-unsur matriks

A

Contoh 2.8.

Jika A =

3 1 5

1 −2 0

5 0 −4

, maka −A =

−3 −1 −5

−1 2 0

−5 0 4

.

Page 107: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

106 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Definisi 2.9. Transpos matriks A (berordo m×n) ditulis AT adalah

matriks berordo n×m yang diperoleh dengan menukar baris matriks

A menjadi kolom dan sebaliknya, yaitu jika B = AT , maka bij = aji.

Contoh 2.9.

Jika A =

4 5

1 7

2 4

maka AT =

(4 1 2

5 7 4

)

Hasil 2.1. Jika A adalah matriks simetris, maka A = AT

Definisi 2.10. Invers perkalian suatu matriks A ditulis A−1, adalah

matriks yang jika dikalikan dengan A menghasilkan matriks identitas

yaitu A.A−1 = A−1.A = I.

2.3.2. Operasi biner

Dalam operasi matriks secara simbolik kita akan banyak menggunakan

notasi∑

. dan∏. Untuk itu dalam subbab ini akan dibahas secara

sepintas kedua notasi tersebut.

Page 108: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

107 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Definisi 2.11.

n∑i=1

f(xi) = f(x1) + f(x2) + · · ·+ f(xi) + · · ·+ f(xn).

Sifat-sifat operator Sigma diberikan dalam hasil berikut ini.

Hasil 2.2. Sifat- sifat operator Sigma adalah

1. Jika k adalah suatu konstanta, makan∑i=1

k = nk.

2. Jika k adalah suatu konstanta, dan f adalah fungsi dalam ximaka

n∑i=1

kf(xi) = kn∑i=1

f(xi).

3. Jika k1, k2 adalah konstanta dan f(xi) = x2i + k1xi + k2, maka

n∑i=1

f(xi) =n∑i=1

x2i + k1

n∑i=1

+nk2.

Page 109: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

108 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Bukti:

1∑n

i=1 k = k + k + · · ·+ k︸ ︷︷ ︸n

= nk.

2∑n

i=1 kf(xi) = kf(x1) + kf(x2) + · · ·+ kf(xn)

= k(f(x1) + f(x2) + · · ·+ f(xn))

= kn∑i=1

f(xi).

3∑n

i=1 f(xi) =n∑i=1

(x2i + k1xi + k2

)=(x21 + k1x1 + k2

)+ · · ·+

(x2n + k1xn + k2

)= x21 + · · ·+ x2n + k1x1 + · · ·+ k1xn + k2 + · · ·+ k2︸ ︷︷ ︸

n

=n∑i=1

x2i +n∑i=1

k1xi + nk2

=n∑i=1

x2i + k1

n∑i=1

xi + nk2.

Page 110: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

109 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Untuk lebih meringkas notasi, kadang-kadang jumlah untuk selu-

ruh rentangan indeks hanya dinotasikan dengan tanda titik (.) untuk

indeks tersebut, misalnya

xi. =n∑j=1

xij

x.j =m∑i=1

xij.

Jika operator∑

merupakan penjumlahan yang berulang, maka

operator untuk perkalian berulang disebut operator∏

yang didefinisi-

kan seperti berikut ini.

Definisi 2.12.

n∏i=1

f(xi) = f(x1)× f(x2)× · · · × f(xi)× · · · × f(xn).

Sedangkan sifat-sifat operator∏

dinyatakan dalam hasil berikut.

Hasil 2.3. Sifat- sifat operator∏

adalah:

Page 111: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

110 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

jika k adalah suatu konstanta, makan∏i=1

k = kn;

jika k adalah suatu konstanta, dan f adalah fungsi dalam ximaka

n∏i=1

kf(xi) = knn∏i=1

f(xi);

jika k1, k2 adalah konstanta dan f(xi) = (x2i )(k1xi)(k2), maka

n∏i=1

f(xi) =n∏i=1

x2i × kn1n∏i=1

xi × kn2 .

Pembuktian hasil∏

di atas analog dengan pembuktian sifat-

sifat operator∑

.

Penjumlahan Matriks

Matriks yang bisa dijumlahkan (ditambah dan dikurangi) adalah ma-

triks yang berdordo sama. Matriks yang berordo sama disebut Kon-

formabel (conformable) terhadap penjumlahan. Penjumlahan matriks

Page 112: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

111 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dilakukan dengan menjumlahkan unsur unsur yang seletak, yaitu un-

sur unsur yang terletak pada baris dan kolom yang sama atau yang

mempunyai indeks yang sama.

Definisi 2.13. Jika A = (aij) dan B = (bij) i = 1, 2, · · · ,m; j =

1, 2, · · · , n maka A + B adalah matriks C yang berordo m×n dengan

unsur unsurnya adalah cij = aij + bij.

Contoh 2.10.

Jika

A =

3 5

8 4

6 10

dan B =

6 8

2 4

3 10

,

maka

A + B =

3 + 6 5 + 8

8 + 2 4 + 4

6 + 3 10 + 10

=

9 13

10 8

9 20

.

Definisi 2.14. Selisih dua matriks didefinisikan sebagai jumlah de-

ngan negatif matriks pengurang, yaitu A−B = A + (−B).

Page 113: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

112 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Hasil 2.4. Sifat- sifat penting dari penjumlahan matriks adalah

A + B = B + A komutatif

A + 0 = 0 + A identitas

A + (−A) = 0 invers

A + (B + C) = (A + B) + C assosatif

(A + B)T = AT + BT distribusi transpus

Perkalian matriks

Perkalian matriks bisa dilakukan apabila banyaknya kolom matriks

terkali sama dengan banyaknya baris matriks pengali. Matriks-matriks

yang dapat dikalikan disebut matriks-matriks yang conformable ter-

hadap perkalian. Selain perkalian dengan sesama matriks, matriks

juga dapat dikalikan dengan skalar.

Definisi 2.15. Hasil kali suatu matriks dengan suatu skalar adalah

matriks yang unsur- unsurnya adalah hasil kali setiap unsur matriks

dengan skalar tersebut, yaitu kA = (kaij) .

Page 114: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

113 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Contoh 2.11.

3

3 −2 −6

1 2 0

−5 0 4

=

9 −6 −18

3 6 0

−15 0 12

.

Definisi 2.16. Hasil kali dua matriks adalah matriks yang berordo

sedemikian sehingga barisnya sama dengan baris matriks yang dika-

likan dan kolomnya sama dengan kolom matriks pengali. Unsur unsur

dari matriks pengali merupakan kombinasi linier dari baris matriks

terkali dengan kolom dari matriks pengali. Jadi jika Am×nBn×p, maka

Cm×p = AB dengan

cik = ai1b1k + ai2b2k + · · ·+ ainbnk

=n∑j=1

aijbjk.

Contoh 2.12.

Jika

A =

3 −2 −6

1 2 0

−5 0 4

dan B =

3 −1 2

5 2 0

0 2 4

,

Page 115: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

114 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

maka AB adalah

=

(3)(3) + (−2)(5) + (−6)(0) (3)(−1) + (−2)(2) + (−6)(2)

(1)(3) + (2)(5) + (0)(0) (1)(−1) + (2)(2) + (0)(2)

(−5)(3) + (0)(5) + (4)(0) (−5)(−1) + (0)(2) + (4)(2)

(3)(2) + (−2)(0) + (−6)(4)

(1)(2) + (2)(0) + (0)(4)

(−5)(2) + (0)(0) + (4)(4)

=

−1 −19 −18

13 3 2

−15 13 6

.

Hasil 2.5. Sifat-sifat operasi perkalian yang penting di antaranya ada-

lah:

1. nonkomutatif, yaitu secara umum AB 6= BA;

2. assosiatif, yaitu (AB)C = A(BC);

3. distributif perkalian terhadap penjumlahan, yaitu

A(B + C) = AB + AC.

Page 116: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

115 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4. distributif transpos terhadap perkalian, yaitu (AB)T = BTAT.

2.3.3. Determinan dan Invers Matriks

Definisi 2.17. Determinan dari suatu matriks bujur sangkar A, dino-

tasikan dengan |A| atau det(A), adalah fungsi skalar yang didefinisi-

kan sedemikian rupa sehingga merupakan jumlah hasil kali unsur- un-

sur yang sejajar diagonal utama dikurangi jumlah unsur-unsur yang

sejajar diagonal lain. Dalam bentuk notasi

|A| =n∏i=1

aii +n∏i=1

ai,i+1 + · · ·+ a1n

n−1∏i=1

ai+1,i −n∏i=1

an+1−i,i − · · ·

− a11n−1∏i=2

an+2−i,i.

Definisi 2.18. Matriks yang determinannya tidak nol disebut ma-

triks nonsinguler, sedangkan matriks yang determinannya 0 disebut

matriks singuler.

Contoh 2.13.

Page 117: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

116 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Jika A =

3 4 1

5 7 6

3 2 5

, maka det A adalah

|A| = (3)(7)(5) + (4)(6)(3) + (1)(5)(2)

− (3)(7)(1)− (5)(4)(5)− (3)(2)(6)

= 105 + 72 + 10− 21− 100− 36

= 187− 157 = 30

Definisi 2.19. Teras(trace) suatu matriks bujur sangkar adalah jum-

lah unsur diagonal utama dari matriks tersebut, yaitu tr(A) =∑n

i=1 aii.

Contoh 2.14.

Dari

A =

−1 −19 −18

13 3 2

−15 13 6

,

maka tr(A) = −1 + 3 + 6 = 8.

Untuk matriks bujur sangkar beordo 2, cara mencari invers ada-

lah sebagai berikut.

Page 118: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

117 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Hasil 2.6. Jika A =

(a c

b d

), maka

| A |= ac− bd

A−1 = 1|A|

(d −c−b a

)Contoh 2.15. Bertikut adalahcontoh matriks bujur sangkar berordo

2× 2 dan inversnya

A =

(1 2

−1 2

),

maka

A−1 =1

4

(2 −2

1 1

)=

(1/2 −1/2

1/4 1/4

)

Page 119: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

118 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2.4. Kebergantungan Linier dan Rank Matriks

Dalam statistika pada umumnya kolom-kolom matriks mewakili peu-

bah - peubah acak yang bisa saling bebas atau tidak saling bebas satu

sama lain. Kondisi ini akan mempengaruhi apakah matriks yang akan

dihasilkan mempunyai rank penuh atau tidak, apakah matriks yang

dihasilkan akan mempunyai invers atau tidak.

Definisi 2.20. Suatu kolom dari matriks A dikatakan bergantung

linier dengan kolom-kolom lainnya jika dia dapat dinyatakan sebagai

kombinasi linier dari kolom-kolom lainnya tersebut.

Definisi 2.21. Rank suatu matriks adalah bilangan yang menun-

jukkan banyaknya maksimum kolom yang saling bebas linier.

Definisi 2.22. Suatu matriks dikatakan mempunyai rank penuh jika

ranknya sama dengan banyaknya kolom

Hasil 2.7. Suatu matriks bujur sangkar akan nonsingular jika mem-

punyai rank penuh, sebaliknya akan singular jika tidak mempuyai rank

penuh.

Page 120: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

119 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Contoh 2.16.

Matriks A =

3 4 1

5 7 6

3 2 5

adalah matriks nonsingular dengan rank

penuh 3. Tetapi B =

3 4 1

18 7 6

15 2 5

tidak mempunyai rank penuh

karena kolom pertama merupakan 3× kolom ketiga dan karenanya

B adalah matriks singular dan tidak memiliki invers. Penyelesaian

konkrit dari kegergantungan ini dapat dihitung dengan membentuk

sistim persamaan homogen antara kolom-kolom matriks dan mencari

apakah sistem persamaan homogen tersebut mempunyai atau tidak

penyelesaian tidak nol.

Hasil 2.8. Jika matriks Anp bukan matriks bujur sangkar (n < p),

paling tidak ada (p− n) kolom yang dapat dinyatakan sebagai kombi-

nasi linier dari kolom lainnya. Dengan demikian maka A tidak akan

mempunyai rank penuh.

Contoh 2.17.

Page 121: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

120 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Matriks A =

3 4 1 1

5 7 6 1

3 2 5 1

mempunyai banyak kolom yang lebih be-

sar dari banyaknya baris, karena itu pasti salah satu dari kolom yang

ada dapat dinyatakan sebagai kombinasi linier dari yang lainnya. Se-

cara aljabar hal ini mengandung pengertian bahwa sistim persamaan

ak1 + b+ k2 + ck3 + dk4 = 0, dengan kj adalah kolom ke j, mempun-

yai penyelesaian dimana sekalar a, b, c, d tidak semuanya sama dengan

nol.

3a+ 4b+ c+ d = 0 (1)

5a+ 7b+ 6c+ d = 0 (2)

3a+ 2b+ 5c+ d = 0 (3)

Selanjutnya (1)-(3) dan (2)-(3) akan menghasilkan

2b+−4c = 0 (4)

2a+ 5b+ c = 0 (5)

Page 122: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

121 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Persamaan (4) menghasilkan hubungan b = 2c yang dapat disubsti-

tusikan ke (5)

2a+ 10c+ c7 = 0

2a+ 11c = 0

a = −11

2c (7)

Selanjutnya jika (7) disubstitusikan ke persamaan (1) akan meng-

hasilkan

−33

2c+ 8c+ c+ d = 0

d =33

2c− 9c =

15

2c

Jadi sistim persamaan ini mempunyai penyelesaian yang bersifat pa-

rametrik, salah satu diantaranya adalah untuk c = 2, maka diperoleh

b = 4, a = −11, d = 15.

Dalam statistika, jika X adalah matriks desain yang kolomnya

menunjukkan peubah-peubah penjelas dan barisnya merupakan sam-

pel, untuk menjamin agar X mempunyai rank penuh, maka banyaknya

Page 123: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

122 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

sampel selalu diusahakan jauh lebih banyak dari banyaknya peubah

penjelas yang menjadi perhatian.

Page 124: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

123 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2.5. Bentuk Kuadrat dan Diferensial Matriks

Definisi 2.23. Misalkan

x =

x1x2x3· · ·xn

dan A =

a11 a12 · · · an1a21 a22 · · · an2...

.... . .

...

an1 an2 · · · ann

,

maka Q = xTAx =

(n∑i=1

[n∑j=1

xjaij

]xi

); merupakan matriks 1 ×1

(skalar) yang disebut matriks bentuk kuadrat.

Matriks A pada umumnya merupakan matriks simetrik, misal-

nya matriks korelasi ataupun matriks ragam - koragamnya. Dalam

statistika

Definisi 2.24. Matriks bentuk kuadrat Q disebut definit positif apa-

bila Q > 0 untuk setiap x 6= 0 dan Q = 0 jika dan hanya jika x = 0.

Selanjutnya matriks A dari Q disebut matriks positif definit.

Page 125: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

124 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Definisi 2.25. Matriks bentuk kuadrat Q disebut semi definit positif

apabila Q ≥ 0 untuk setiap x 6= 0 dan Q = 0 paling tidak untuk

satu x 6= 0. Selanjutnya matriks A dariQ disebut matriks positif semi

definit.

sering diperlukan turunan suatu matriks terhadap sekelompok

peubah dalam satu vektor. Pada dasarnya turunan satu peubah ter-

hadap suatu vektor adalah adalah suatu vektor atau matriks yang

unsur-unsurnya adalah turunan peubah pertama terhadap peubah

unsur-unsur vektor penurun sedemikain sehingga posisi unsurnya se-

suai dengan posisi unsur yang diturukan dan unsur penurun.

Definisi 2.26. Misalkan

x =

x1x2x3...

xn

dan g =(g(x)

)

Page 126: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

125 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

maka

∂g

∂x=

∂g∂x1∂g∂x2∂g∂x3...∂g∂xn

dan

∂g

∂xT=

(∂g

∂x

)T=

∂g∂x1∂g∂x2∂g∂x3

· · ·∂g∂xn

Contoh 2.18.

Jika g = (2x1 + 5x2), dan x =

(x1x2

), maka

∂g

∂x=

(2

5

)

Page 127: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

126 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Contoh 2.19.

Jika

g =

g1g2g3...

gn

, dan x =

x1x2x3...

xp

,

maka yang dapat dilakukan adalah∂g

∂xTyang menghasilkan matriks

n× p atau∂gT

∂xyang menghasilkan matriks p× n.

∂g

∂xT=

dg1/dx1 dg1/dx2 · · · dg1/dxpdg2/dx1 dg2/dx2 · · · dg2/dxpdg3/dx1 dg3/dx2 · · · dg3/dxp

......

. . ....

dgn/dx1 dgn/dx2 · · · dgn/dxp

Contoh 2.20.

Page 128: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

127 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Misalkan x =

(x1x2

)dan A =

(1 2

2 1

)maka

1. Ax =

(x1 + 2x22x1 + x2

);

2. xTAx =(x1(x1 + 2x2) + x2(2x1 + x2)

)=(x21 + 4x1x2 + x22

)yang

merupakan bentuk kuadrat;

3.∂Ax

∂xT=

∂(x1 + 2x2)

∂x1

∂(x1 + 2x2)

∂x2∂(2x1 + x2)

∂x1

∂(2x1 + x2)

∂x2

=

(1 2

2 1

)= A;

Page 129: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

128 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4. Turunan xTAx terhadap x adalah

∂xTAx

∂x=

∂(x21 + 4x1x2 + x22)

∂x1∂(x21 + 4x1x2 + x22)

∂x2

=

(2x1 + 4x24x1 + 2x2

)= 2

(1 2

2 1

)(x1x2

)= 2Ax;

5. Karena xTAx pada dasarnya adalah suatu skalar, maka dapat

Page 130: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

129 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

juga diturunkan terhadap xT .

∂xTAx

∂xT=

(∂(x21 + 4x1x2 + x22)

∂x1

∂(x21 + 4x1x2 + x22)

∂x2

)=(2x1 + 4x2 4x1 + 2x2

)= 2

(x1 x2

)(1 2

2 1

)= 2xTA;

6. berdasarkan hasil butir 3 dan 4 di atas maka, maka diperoleh

∂2[xTAx

]∂xT∂x

=∂2[xTAx

]∂x∂xT

= 2A.

Hasil 2.9. Misalkan A adalah matriks simetrik berordo n× n dan x

adalah vektor baris berordo n, maka

1.∂xTA

∂x=∂Ax

∂xT= A

2.∂xTAx

∂x= 2Ax

Page 131: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

130 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.∂2[xTAx

]∂xT∂x

= 2A

Contoh 2.21.

Misalkan A =

(2 1

1 3

), x =

(x1x2

), sedangkan x1 = 2t1 + 3t2

dan x2 = 3t1 + t2, jika t =

(2 3

3 1

), maka:

1. x = Bt dan∂x

∂tT= B;

2. Ax =

(2x1 + x2x1 + 3x2

)=

(2(2t1 + 3t2) + 3t1 + t22t1 + 3t2 + 3(3t1 + t2)

), sehingga

∂Ax

∂xT=

A dan

3.∂Ax

∂tT=

(7 7

11 6

)=

(2 1

1 3

)(2 3

3 1

)= AB =

∂Ax

∂xT∂x

∂tT.

Hasil di atas dapat diperluas pada hasil berikut. Bukti umum

dari hasil berikut tidak dibahas dalam buku ini.

Page 132: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

131 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Hasil 2.10. Misalkan y adalah vektor peubah yang merupakan fungsi

dari x, yaitu merupakan hasil perkalian antara x dengan suatu matriks

simetrik dan F adalah matriks peubah yang merupakan fungsi dari y,

yaitu hasil kali y dengan suatu matriks simetrik, maka berlaku sifat

turunan rantai sebagai berikut:

∂F

∂x=

∂F

∂yT∂y

∂xatau

∂F

∂x=∂F

∂y

∂yT

∂x

Contoh 2.22. Misalkan X,Y dan β adalah matriks-matriks sedemi-

kian sehingga

Q = (Y −Xβ)T (Y −Xβ)

adalah suatu bentuk kuadrat (matriks 1× 1). Tentukan

1. ∂Q/∂β

2. ∂2Q/ (∂βT∂β)

Jawab:

Q = (Y −Xβ)T (Y −Xβ)

=(YT − βTXT

)(Y −Xβ)

= YTY − βTXTY −(βTXTY

)T+ βTXTXβ

Page 133: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

132 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

mengingat βTXTY adalah matriks 1×1, maka identik dengan traspos-

nya dan persamaan di atas menjadi

Q = YTY − 2βTXTY + βTXTXβ.

Maka

∂Q

∂β= 0− 2XTY + 2XTXβ

= 2(XTXβ −XTY

)= −2

(XTY −XTXβ

)= −2XT (Y −Xβ) , dan

∂2Q

∂βT∂β= 2XTX.

Contoh 2.23. Misalkan X,Y dan β adalah matriks-matriks sedemi-

kian sehingga

Q = (Y −Xβ)T V−1 (Y −Xβ)

adalah suatu bentuk kuadrat (matriks 1×1), dengan V adalah matriks

simetrik.

Page 134: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

133 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Tunjukkan bahwa

∂Q

∂β= −2XTV−1 (Y −Xβ) , dan

∂2Q

∂βT∂β= 2XTV−1X.

Page 135: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

134 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Tabel 2.1: Fungsi R terkait matriksNo perintah R Keterangan

1 matrix(c,b,k) menyusun matriks berordo b× k2 diag(M) menyusun matriks diagonal, atau

mengambildiagonal dari matriks bu-

jur sangkar

3 t(M) transpos matriks M

4 A*B perkalian unsur-unsur pada baris

dan kolom yang bersesuaian

5 A%*%B perkalian dua matriks yang kon-

formabel

6 solve(M) menghitung inverse matriks M

2.6. Aplikasi R untuk Operasi Matriks

Untuk aplikasi R tentang matriks dan operasinya, selain menggunakan

beberapa fungsi yang telah didefinisikan secara internal, pembaca da-

pat juga mencari paket/library yang berkaitan dengan matriks. Be-

berapafungsi R terkait matriks diberikan pada Tabel 2.1

Page 136: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

135 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2.6.1. Mendefinisikan matriks

Matriks dapat didefinisikan dengan beberapa cara yaitu:

1. memberikan data elemen matriks (c(a11, a21, a31, ..., a21,

a22, ...) yang selanjutnya disusun dalam bentuk baris dan

kolom. Ingat bahwa R akan melengkapi seluruh baris kolom 1

baru melengkapi kolom 2 dan seterusnya.

>x<-seq(1,10,1)

>xmat<-matrix(x,2,5)

>ymat<-matrix(x,5,2)

>xmat

[,1] [,2] [,3] [,4] [,5]

[1,] 1 3 5 7 9

[2,] 2 4 6 8 10

> ymat

[,1] [,2]

[1,] 1 6

[2,] 2 7

Page 137: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

136 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

[3,] 3 8

[4,] 4 9

[5,] 5 10

2. menjadikan matriks data yang sudah tersusun dalam bentuk

baris dan kolom dengan perintah as.matrix(). Untuk matriks

berukuran besar, mungkin tidak praktis mencetak seluruh el-

emennya, tetapi kita bisa memeriksa dimensi/ordonya dengan

dim(). Pada contoh berikut data kecepatan dan jarak tempuh

mobil yang berupa tabel dengan 50 baris dan 2 kolom didefinisi-

kan menjadi matriks berordo 50 ×2.

>data(cars)

>x<-as.matrix(cars)

>dim(x)

[1] 50 2

>amat<-x%*%t(x)

>bmat<-t(x)%*%x

Page 138: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

137 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

>dim(amat)

[1] 50 50

>dim(bmat)

[1] 2 2

3. beberapa matriks didefinisikan secara khusus diantaranya adalah

(a) matriks dengan elemen yang sama, misalnya k dengan ordo

m× n.

>matrix(0,2,3)

[,1] [,2] [,3]

[1,] 0 0 0

[2,] 0 0 0

>matrix(1,2,3)

[,1] [,2] [,3]

[1,] 1 1 1

[2,] 1 1 1

Page 139: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

138 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

>matrix(5,2,3)

[,1] [,2] [,3][1,] 5 5 5

[2,] 5 5 5

(b) matriks diagonal atau matriks identitas.

> diag(1,3)

[,1] [,2] [,3]

[1,] 1 0 0

[2,] 0 1 0

[3,] 0 0 1

> diag(2,3)

[,1] [,2] [,3]

[1,] 2 0 0

[2,] 0 2 0

[3,] 0 0 2

>diag(c(1,2,3,4,5))

Page 140: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

139 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

[,1] [,2] [,3] [,4] [,5][1,] 1 0 0 0 0

[2,] 0 2 0 0 0

[3,] 0 0 3 0 0

[4,] 0 0 0 4 0

[5,] 0 0 0 0 5

Sebaliknya jika diag() dilakukan pada matrik bujur sangkar,

maka fungsi ini akan mengekstrak diagonal matriks tersebut.

> diag(bmat)

speed dist

13228 124903

2.6.2. Operasi Matriks dengan R

Beberapa operasi matriks yang dapat dilakukan yang terkait dengan

kebutuhan statistika diantaranya adalah perkalian matriks, determi-

nan ((det()) invers dan transpose matriks.

xmat%*%ymat

Page 141: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

140 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

[,1] [,2]

[1,] 95 220

[2,] 110 260

> ymat%*%xmat

[,1] [,2] [,3] [,4] [,5]

[1,] 13 27 41 55 69

[2,] 16 34 52 70 88

[3,] 19 41 63 85 107

[4,] 22 48 74 100 126

[5,] 25 55 85 115 145

>det(xmat%*%ymat)

[1] 500

> solve(xmat%*%ymat)

[,1] [,2]

[1,] 0.52 -0.44

[2,] -0.22 0.19

Page 142: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

141 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

> det(ymat%*%xmat)

[1] 0

> solve(ymat%*%xmat) #tes walau kita tahu det=0.

Error in ... system is exactly singular

Untukmatriks yang berordo sama, ada kalanya diperlukan hasil

perkalian dari unsur-unsur seletak. Pada R perkalian ini dinotasikan

dengan A*B. Berikut adalah contoh perkalian tersebut.

> A.mat<-matrix(c(2,3,4,1),2,2)

> B.mat<-matrix(c(1,3,2,5),2,2)

> A.mat

[,1] [,2]

[1,] 2 4

[2,] 3 1

> B.mat

[,1] [,2]

[1,] 1 2

[2,] 3 5

Page 143: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

142 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

> A.mat*B.mat

[,1] [,2][1,] 2 8

[2,] 9 5

> B.mat*A.mat

[,1] [,2]

[1,] 2 8

[2,] 9 5

Jadi perkalian tersebut di atas bersifat komutatif (A* B=B*A).

Akan tetapi, tidak demikian halnya dengan perkalian umum matriks,

seperti pada contoh berikut, yang pada umumnya A%*% B 6= B%*% A

> B.mat%*%A.mat

[,1] [,2]

[1,] 8 6

[2,] 21 17

Page 144: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

143 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

> A.mat%*%B.mat

[,1] [,2][1,] 14 24

[2,] 6 11

Berikut adalah matriks pada Contoh 2.15 yang dihitung dengan

R.

> A<-matrix(c(1,-1,2,2),2,2)

> print(A)

[,1] [,2]

[1,] 1 2

[2,] -1 2

> solve(A)

[,1] [,2]

[1,] 0.50 -0.50

[2,] 0.25 0.25

Page 145: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

144 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2.7. Bacaan Lebih Lanjut

Referensi umum mengenai matriks dapat dijumpai pada buku-buku

teks tentang matriks atau aljabar linier. Namun tidak banyak refer-

ensi yang membahas turunan matriks/ vektor terutama yang terkait

dengan statistika. Pembahasan dalam bab ini, terutama mengenai ap-

likasi matriks dalam statistika, dapat dijumpai pada Timm [36, Bab

1], Searle [32], Harville [13], dan Neter et al. [31].

Page 146: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

145 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2.8. Ringkasan

Beberapa halpenting terkait matriks perlu dipahamidenganbaik di-

antaraya seperti berikut ini.

1. Matriks adalah kumpulan unsur yang disusun dalam baris dan

kolum sehingga membentuk persegi panjang.

2. Operasi matriks ada yang bersifat uner (negatif dan transpos)

dan bersifat biner(penjumlahan dan perkalian).

3. Matriks yang dapat dilakukan operasi tertentu dikatakan kon-

formabel untuk operasi tersebut.

4. Operasi penjumlahan bersifat asosiatif, memiliki identitas 0,

memiliki invers, dan komutatif.

5. Operasi perkalian secara umum memehuhi sifat asosiatif, ma-

triks bujur sangkar memiliki identitas, beberapa diantaranya

memiliki invers.

Page 147: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

146 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6. Suatu kolom dari matriks A dikatakan bergantung linier dengan

kolom-kolom lainnya jika dia dapat dinyatakan sebagai kombi-

nasi linier dari kolom-kolom lainnya tersebut.

7. suatu matriks bujur sangkar dikatakan memiliki rank penuh jika

semua kolomnya bebas(tidak bergantung) linier dengan kolom

lainnya.

8. Matriks bujursangkar yang memiliki invers disebut matriks non-

singuler, matriks ini memiliki rank penuh dan determinan tidak

nol.

9. Bentuk yTAy dengan y matriks peubah, dan A matriks kon-

stanta, disebut matriks bentuk kuadrat.

Page 148: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

147 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2.9. Latihan Soal-soal

Kerjakan soal-soal berikut secara sendiri atau berkelompok.

1. Sebutkan definisi matriks berikut dan beri masing- masing satu

(1) contoh.

(a) Matriks diagonal

(b) Matriks skalar

(c) Matriks simetrik

(d) Matriks nonsinguler.

2. Buatlah dua buah matriks (A,B), masing- masing berordo 2×2

, selanjutnya hitung

(a) AB

(b) BA

(c) A−1

3. Selidiki apakah matriks-matriks berikut mempunyai rank kolom

lengkap atau tidak.

Page 149: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

148 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

(a) A =

1 2 4

3 3 6

2 4 1

5 5 3

6 2 −1

(b) B =

1 2 4 1

5 5 3 0

2 4 1 2

6 2 −1 −4

3 3 6 0

(c) C =

3 3 6 3 3 −1

1 2 4 1 1 1

5 5 3 0 0 1

6 2 −1 4 3 5

2 4 1 2 5 10

4. Diketahui

A =

1 2 4

2 3 6

4 6 1

Page 150: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

149 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dan

x =

xyz

Tentukan

(a) Q = XTAX

(b)∂Q

∂x

(c)∂2Q

∂xT∂x

baik dengan cara menurunkan unsur-unsurnya maupun dengan

cara keseluruhan dengan cara matriks.

5. Diketahui

A =

3 2 4

2 3 5

4 6 1

.

Definisikan A pada R, selanjutnya tentukan:

(a) AT

Page 151: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

150 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

(b) ATA

(c) AAT

(d)(AAT

)−1(e)

(ATA

)−1

Page 152: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

151 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

BAB 3

MODEL LINIER KLASIK

Regresi linier dengan respon bersifat kontinu merupakan bentuk pe-

modelan statistika yang paling sederhana dan model ini telah dipergu-

nakan selama beberapa dekade. Pada bab ini akan dibahas pemodelan

statistika dengan respon kontinu berdistribusi normal.

Page 153: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

152 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Kompetensi

Pembaca diharapkan memahami prinsip model linier normal atau mo-

del linier klasik, merumuskan model, mengestimasi parameter dan me-

lakukan uji inferensi, terutama dengan menggunakan paket Statistika

R.

Page 154: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

153 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Materi

1. Bentuk dan Asumsi

2. Estimasi parameter

3. Uji inferensial

4. Pendekatan matriks untuk model linier peubah ganda

5. Model linier dengan peubah kualitatif

6. Ilustrasi dengan R

Page 155: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

154 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.1. Bentuk dan Asumsi

Misalkan hubungan antara peubah respon (Yi) dengan peubah tetap

(Xi) untuk subjek i = 1, 2, ...n, ditentukan oleh

Y1 = β0 + β1X1 + ε1...

......

Yi = β0 + β1Xi + εi...

......

Yn = β0 + β1Xn + εn

(3.1)

dengan:

1. Xi adalah peubah tetap yang tidak bersifat acak (lebih lanjut

diasumsikan Xi diukur tanpa kesalahan);

2. εi, yaitu komponen kesalahannya, adalah berdistribusi identik

dan independen normal dengan nilai-tengah 0 dan varian kon-

stan (misalnya σ2);

3. kesalahan individu satu dengan lainnya saling bebas, yaitu untuk

i 6= i′, maka εi||εi′ atau korelasi εi dengan εi′ adalah 0.

Page 156: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

155 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dari asumsi dapat ditentukan bahwa ekspektasi dari setiap respon

adalah

E [Yi] = β0 + β1Xi (3.2)

yang merupakan sebuah garis lurus yang kita sebut garis regresi Po-

pulasi. Sedangkan sebaran setiap pasangan (Xi, Yi) akan berada pada

atau sekitar garis tersebut sesuai dengan besarnya εi.

Page 157: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

156 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.2. Estimasi Parameter

Dalam kenyataan, kita hanya memiliki pasangan-pasangan data (Xi, Yi)

untuk i = 1, 2, · · · , n. Dari data yang kita miliki kita ingin menges-

timasi regesi populasi maupun simpangan sebaran datanya. Maka

parameter yang menjadi kepentingan utama dalam regresi sederhana

di atas adalah komponen dari koefisien regresi β =

(β0β1

). Parameter

lain yang juga perlu diestimasi adalah komponen ragam σ2. Seba-

gaimana telah disebutkan sebelumnya ada dua metode yang akan di-

gunakan dalam mengestimasi parameter yaitu metode kuadrat terkecil

dan metode kecenderungan (likelihood) maksimum.

3.2.1. Estimasi dengan Metode Kuadrat Terkecil

Seperti telah diuraikan pada Bab 1, bahwa dengan metode kuadrat

terkecil, secara geometris kita mencari garis sedemikian sehingga ke-

salahan (selisih ordinat titik terhadap garis) menjadi minimum. Untuk

mengakomodasi tanda positif dan negatif, maka yang diminimumkan

adalah jumlah kuadrat selisih ordinat tadi. Untuk mengestimasi pa-

Page 158: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

157 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

rameter dengan menggunakan metode kuadrat terkecil maka ditem-

pun langkah-langkah berikut ini.

1. Karena yang akan diminimumkan adalah kuadrat galat, maka

langkah pertama yang harus dilakukan adalah mengubah model

linier menjadi eksplisit terhadap galat. Dari bentuk model pada

persamaan (3.1), diperoleh rumusan galat

εi = Yi − (β0 + β1Xi) (3.3)

2. Mengkuadratkan kesalahan yang diperoleh serta menjumlahkan-

nya untuk seluruh pasangan data. Dari bentuk tersebut diper-

oleh bentuk jumlah kuadrat kesalahan sebagai berikut

Q =n∑i=1

ε2i =n∑i]1

[Yi − (β0 + β1Xi)]2 =

n∑i=1

[Yi −

1∑j=0

βjXij

]2(3.4)

Dalam hal ini Xi0 = 1 dan Xi1 = Xi.

3. Menurunkan bentuk kuadrat yang diperoleh terhadap parame-

ter yang menjadi kepentingan. Estimasi dengan metode kua-

drat terkecil diproses dengan mencari minimum Q terhadap βj.

Page 159: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

158 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Minimum dari Q terhadap diperoleh dengan mencari turunan

pertama maupun ke dua

∂Q

∂β0= −2

n∑i=1

[Yi − (β0 + β1Xi)]

∂Q

∂β1= −2

n∑i=1

[Yi − (β0 + β1Xi)]Xi

4. Menyusun persamaan normal yang diperoleh dari sistem per-

samaan ∂Q/∂βj = 0. Dari hasil sebelumnya diperoleh per-

samaan normal

∑ni=1 [Yi − (β0 + β1Xi)] = 0∑ni=1 [Yi − (β0 + β1Xi)]Xi = 0

. (3.5)

Persamaan normal di atas selanjutnya dapat disederhanakan

Page 160: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

159 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

menjadi

n∑i=1

Yi − nβ0 − β1n∑i=1

Xi = 0 (3.6a)

n∑i=1

XiYi − β0n∑i=1

Xi − β1n∑i=1

X2i = 0 (3.6b)

5. Dari persamaan normal (3.6a) di atas diperoleh

β0 =1

n

n∑i=1

Yi − β11

n

n∑i=1

Xi (3.7a)

= Y − β1X (3.7b)

Hasil persamaan (3.7) ini selanjutnya disubstitusikan pada per-

Page 161: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

160 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

samaan normal (3.6b) sehingga diperoleh:

β1 =

∑XiYi −

∑Xi

∑Yi

n∑X2i −

(∑Xi)

2

n

(3.8a)

=n∑n

i=1XiYi − (∑n

i=1Xi) (∑n

i=1 Yi)

n∑X2i − (

∑Xi)

2 (3.8b)

=

∑XiYi − X

∑Yi∑

X2i − n

(X)2 . (3.8c)

Mengingat bahwa∑(

Xi − X)2

=∑X2i −

∑X2 =

∑X2i −

nX2, maka

β1 =

∑Yi(Xi − X)∑(Xi − X

)2 (3.8d)

Sebagaimana telah disampaikan bahwa metode kuadrat terke-

cil belum memanfaatkan informasi distribusi dari εi. Oleh karena itu

apabila σ2 tidak diketahui, tidak ada cara khusus dengan metode kua-

drat terkecil untuk mengestimasi σ2. Namun, σ2 biasa diestimasi dari

Page 162: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

161 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

rata-rata kuadrat deviasi data terhadap garis regresi yang diperoleh

dari βj. Dalam hal ini derajat kebebasan yang dimiliki oleh deviasi

ini adalah n− k dengan k adalah banyaknya penduga βj. Jadi untuk

model dengan dua parameter β0 dan β1, maka

σ2 = s2e =1

n− 2

n∑i=1

[Yi − (β0 + β1Xi)

]2(3.9)

3.2.2. Estimasi dengan Metode Likelihood Maksimum

Sesuai dengan prinsip model linier normal, maka setiap peubah respon

Yi merupakan sampel dari peubah acak yang berdistribusi normal dan

saling independen dengan nilai-tengah E(Yi) = β0 + β1Xi dan ragam

σ2, yaitu Yi ∼ N(E(Yi), σ2). Dengan demikian kita peroleh seperti

berikut ini.

1. Likelihood Yi adalah

Li =1

σ√

2πexp

[−1

2

(Yi − β0 − β1Xi

σ

)2].

Page 163: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

162 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2. Likelihood dari Y = (Y1, Y2, · · · , Yi, · · · , Yn)T yang komponen-

nya saling bebas adalah

L =n∏i=1

Li

=

[1

σ√

]nexp

[−1

2

n∑i=1

(Yi − β0 − β1Xi

σ

)2].

Log-likelihood l = e logL = lnL, selanjutnya dalam banyak

buku teks statistika hanya ditulis logL, adalah

l = −n log(σ√

2π)− 1

2

n∑i=1

(Yi − β0 − β1Xi

σ

)2

= −n2

log(2πσ2

)− 1

2σ2

n∑i=1

(Yi − β0 − β1Xi)2 .

Page 164: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

163 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Selanjutnya turunan l terhadap β0, β1 dan σ2 diperoleh sebagai

berikut

∂l

∂β0= − 1

2σ2(2)(−1)

n∑i=1

(Yi − β0 − β1Xi)

=1

σ2

n∑i=1

(Yi − β0 − β1Xi)

∂l

∂β1= − 1

2σ2(2)(−1)

n∑i=1

(Yi − β0 − β1Xi)Xi

∂l

∂β1=

1

σ2

n∑i=1

(Yi − β0 − β1Xi)Xi

∂l

∂σ2= − n

2σ2+

1

2σ4

n∑i=1

(Yi − β0 − β1Xi)2 .

Dari persamaan di atas diperoleh persamaan normal untuk β0 dan β1identik dengan persamaan normal (3.5). Selanjutnya dari ∂l/∂σ2 = 0

diperoleh

−nσ2 +n∑i=1

(Yi − β0 − β1Xi)2 = 0

Page 165: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

164 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

sehingga penduga kemungkinan maksimum untuk σ2 adalah

σ2 =1

n

n∑i=1

(Yi − β0 − β1Xi)2 .

Sebenarnya estimasi σ2 di atas berlaku untuk kondisi β0, β1 atau µ

yang diketahui. Jika tidak diketahui, maka penduga di atas akan

menjadi bias. Untuk menghilangkan bias maka pembaginya (dera-

jat kebebasannya) harus dikurangi sebesar banyaknya parameter yang

harus diestimasi sebelumnya. Dalam kasus model sederhana yang kita

bahas, banyaknya parameter ada 2 yaitu (β0, β1). Dengan demikian

derajat kebebasannya menjadi n − 2 dan bentuk penduga σ untuk

penduga llikelihood seteleh disesuaikan manjadi

σ2 =1

n− 2

n∑i=1

(Yi − β0 − β1Xi

)2(3.10)

Page 166: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

165 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.3. Uji Inferensial dari βj

Sebagaimana dijelaskan dalam langkah-langkah pemodelan stokastik,

bahwa besaran yang diperoleh dari penyelesaian model, yang berupa

penduga, harus diuji secara statistik. Untuk keperluan ini, perlu dike-

tahui distribusi dari penduga yang diperoleh.

3.3.1. Distribusi βj

Setelah memperoleh estimasi dari parameter βj, maka selanjutya kita

perlu memperoleh sifat sebaran dari penduga- penduga tersebut. Da-

pat ditunjukkan (dianjurkan untuk membuktikan sendiri) bahwa penduga-

penduga yang diperoleh adalah penduga tak bias dalam arti

E[β0

]= β0 dan E

[β1

]= β1.

Sedangkan untuk ragam βj diperoleh hasil yang berbeda untuk kasus

σ2 diketahui dan σ2 tidak diketahui.

Page 167: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

166 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Distribusi βj bila σ2 diketahui

Ragam dari penduga-penduga βj dapat diturunkan dengan menggu-

nakan prinsip bahwa:

1. untuk suatu konstanta c, maka Var(cY ) = c2 Var (Y );

2. Bahwa Yi dan Yi′ adalah saling bebas karenanya Var[∑Yi]] =∑

[Var(Yi)] ;

3. Var(Yi) = σ2, sedang komponen yang lain berfungsi sebagai pe-

ubah tidak acak sehingga tidak memiliki ragam dan dalam kon-

teks ini dapat diaggap sebagai konstanta c.

Dari bentuk penduga β0, seperti pada persamaan (3.7) dan β1 pada

persamaan (3.8), dapat lihat bahwa βj merupakan kombinasi linier

dari Yi yang mempunyai ragam σ2. Dari kenyataan ini dapat dihitung

ragam βj seperti berikut ini.

Hasil 3.1. Jika σ2 diketahui, maka ragam dari penduga β0 dan β1

Page 168: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

167 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

masing masing adalah:

Var(β0) =

[1

n+

X2∑(Xi − X)2

]σ2 (3.11)

Var(β1) =σ2∑

(Xi − X)2(3.12)

Kita lihat bahwa sesungguhnya penduga βj merupakan kombi-

nasi linier dari Yi yang berdistribusi normal. Oleh karena itu jika

σ2 diketahui maka masing-masing penduga βj berdistribusi normal

dengan ragam seperti pada Hasil 3.1. Dengan demikian bisa kita sim-

pulkan hasil-hasil berikut

Hasil 3.2. Jika σ2 diketahui dan var (βj) dihitung seperti pada Hasil

3.1, maka

βj − βj√var(βj)

∼ N(0, 1) (3.13)

dengan N(0, 1) adalah distribusi Normal Baku.

Page 169: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

168 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Distribusi βj bila σ2 tidak diketahui

Dalam kenyataannya, σ2 lebih sering tidak diketahui dan harus dies-

timasi dari data yang ada seperti yang telah dilakukan sebelumnya

yaitu

s2e = σ2 =1

n− 2

n∑i=1

(Yi − β0 − β1Xi

)2Hasil 3.3. Apabila σ2 tidak lagi diketahui tetapi diganti dengan σ2 =

s2e, maka var(βj) dinotasikan dengan s2(βj); j = 0, 1 menjadi

s2(β0) =

[1

n+

X2∑(Xi − X)2

]s2e (3.14a)

=

[1

n+

(1/n∑Xi)

2∑X2i − 1/n (

∑Xi)

2

]s2e, (3.14b)

dan

s2(β1) =s2e∑

(Xi − X)2(3.15a)

=s2e∑

X2i − 1/n (

∑Xi)

2 . (3.15b)

Page 170: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

169 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Hasil 3.4. Apabila σ2 tidak lagi diketahui tetapi diganti dengan σ2 =

s2e, dan var(βj) diganti dengan s2(βj); j = 0, 1, terutatama jika ukuran

sampel tidak cukup besar, maka

βj − βj√s2(βj)

=βj − βjs(βj)

∼ tn−2, (3.16)

Hasil di atas dapat diperluas untuk banyaknya parameter lebih

dari dua misalnya k. Jika ukuran sampel cukup besar, maka sesuai

sifat distribusi t, distribusi t akan mendekati N(0,1). Dengan demikian

distribusinya identik dengan sebelumnya, ketika σ2 diketahui.

3.3.2. Estimasi selang dari βj

Sesuai dengan distribusi dari βj, maka estimasi selang diperoleh de-

ngan melihat nilai t atau z yang membatasi prosentase atau luas

daerah dari kurva fungsi kepadatannya. Pada umumnya kita menghi-

tung estimasi selang yang simetrik.

Hasil 3.5. Penduga selang βj untuk tarap kepercayaan (1−α)×100%

atau tarap signifikansi α×100%, jika σ diketahui atau n cukup besar

Page 171: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

170 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

adalah

βj − zα/2√var(βj) ≤ βj ≤ βj + zα/2

√var(βj) (3.17)

Hasil 3.6. Penduga selang βj untuk tarap kepercayaan (1−α)×100%)

atau tarap signifikansi α× 100%, dinotasikan I.K (1−α)× 100% jika

σ tidak diketahui dan n kecil adalah

βj − tα/2,n−2s(βj) ≤ βj ≤ βj + tα/2,n−2s(βj) (3.18)

3.3.3. Uji Hipotesis

Selain menghitung penduga interval (estimasi interval/selang keyaki-

nan) dari parameter regresi βj, sering juga dilakukan uji hipotesis un-

tuk mengetahui apakah koefisien regresi populasi dianggap signifikan

atau tidak. Dalam statistika dua macam hipotesis yang biasanya diuji,

yaitu hipotesis nul (H0) dan hipotesis alternatif (HA), untuk parame-

ter βj, dengan j = 0, 1, 2, · · · , p.H0 : βj = 0; yaitu βj tidak signifikan

HA : βj 6= 0; yaitu βj signifikanAdapun kriteria penerimaan atau penolakan H0 dapat dilakukan

dengan beberapa cara yaitu

Page 172: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

171 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1. melihat I.K (1− α)× 100% dari βj yaitu

0 ∈ I.K. : H0 diterima

0 6∈ I.K. : H0 ditolak

2. dengan membandingkan nilai statistik yang diperoleh, yaitu

th =βj

s(βj)dengan tα/2,n−k

dan dengan kriteria

th < tα/2,n−k : H0 diterima

th ≥ tα/2,n−k : H0 ditolak

3. Dengan menghitung nilai probabilitas p, atau Nilai p yang di-

definisikan sebagai

p = 2P (T > th); dengan catatan T ∼ tn−k

Selanjutnya kriteria penerimaan hipotesis adalah

p > 5% : H0 diterima atau βj tidak signifikan

1% < p ≤ 5% : H0 ditolak dengan βj signifikan

p ≤ 1% : H0 ditolak dengan βj sangat signifikan

Page 173: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

172 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Jika βj tidak signifikan atau dapat dianggap 0, berarti tidak ada

hubungan atau pengaruh signifikan Xj terhadap Y . Dengan kata lain,

tidak ada kontribusi signifikan dari peubah Xj terhadap model yang

diperiksa.

3.3.4. Koefisien Determinasi R2

Selain dengan melihat signifikan tidaknya koefisien regresi, baik ti-

daknya model dapat juga dilihat dari koefisien determinasi, R2, yang

didefinisikan dengan

R2 =

N∑i=1

(yi − y)2 −N∑i=1

(yi − y)2

N∑i=1

(yi − y)2.

(Lihat Mendenhall [27]). Jadi R2 ekuivalen dengan rasio penurunan

jumlah kuadrat dari model yang digunakan terhadap jumlah kuadrat

deviasi terhadap rata-rata y. Semakin besar R2 berarti semakin kecil

simpangan data terhadap garis regresi model. Secara ekstrim R2 = 1

Page 174: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

173 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

menunjukkan bahwa simpangan nilai observasi dengan nilai estimasi

sama dengan 0 dan model menjadi sempurna yaitu tidak ada data

yang menyimpang dari (berada di luar) garis regresi. Dengan kata

lain semakin besar R2, semakin kecil selisih nilai observasi dengan

nilai rata-rata regresi yang berarti semakin besar manfaat garis regresi

dalam menjelaskan hubungan antara prediktor dan respon.

Contoh 3.1. Misalkan data untuk 10 pasangan (X, Y ) ditunjukkan

oleh tabel berikut.

No X Y

1 10 15

2 12 18

3 10 20

4 15 25

5 13 20

6 10 12

7 14 25

8 11 20

9 12 22

10 10 15

Page 175: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

174 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dari data di atas kita akan melakukan hal-hal sebagai berikut:

1. menghitung koefisien regresi, beserta standar kesalahannya, an-

tara X dan Y dengan menggunakan metode kuadrat terkecil

atau maksimum laikelihood;

2. menentukan penduga selang dari koefisien regresi yang diper-

oleh;

3. menguji hipotesis

Estimasi parameter regresi β

Untuk persoalan ini, karena hanya ada satu macam peubah penjelas

X, maka model yang akan kita pakai adalah

Y = β0 + β1X + ε

Untuk menghitung bj = βj secara manual, maka kita perlu melengkapi

tabel di atas sebagai berikut:

Page 176: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

175 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

No X Y X2 XY Y − β0 + β1X

1 10 15 100 150 0,8100

2 12 18 144 216 3,2400

3 10 20 100 200 16,8100

4 15 25 225 375 0,4225

5 13 20 169 260 3,0625

6 10 12 100 120 15,2100

7 14 25 196 350 1,6900

8 11 20 121 220 4,6225

9 12 22 144 264 4,8400

10 10 15 100 150 0,8100

Total 117 192 1399 2305 51,5175

Kolom terakhir sesungguhnya baru diisi setelah kita memperoleh β0dan β1. Isianini diperlukan guna menghitung σ2.

Page 177: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

176 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dengan demikian

β1 =n∑n

i=1XiYi − (∑n

i=1Xi) (∑n

i=1 Yi)

n∑X2i − (

∑Xi)

2

=10× 2305− 117× 192

10× 1399− 1172

= 1, 95.

Nilai β1 selanjutnya digunakan untuk menghitung a, yaitu

β0 =1

n

n∑i=1

Yi − β11

n

n∑i=1

Xi

= 192/10− 1, 95× 117/10 = 3, 60.

Untuk penduga ragam diperoleh

σ2 = 51, 5175/8 = 6, 44 atau σ = 2, 54.

Karena rumus akhir yang diperoleh dengan metode likelihood mak-

simum dan de-ngan metode kuadrat terkecil adalah ekuivalen, maka

apabila perhitungan dikerjakan dengan metode likelihood maksimum,

akan diperoleh penduga yang sama.

Page 178: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

177 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Selanjutnya kita bisa menghitung standar kesalahan dari penduga-

penduga di atas.

s2(β0) =

[1

n+

(1/n∑Xi)

2∑X2i − 1/n (

∑Xi)

2

]s2e

=

(1/10 +

(1/10‘× 117)2

1399− 1/10× 1172

)× 6, 44

=

(1/10 +

136, 89

1399− 1368, 9

)× 6, 44 = 29, 30

s(β0) = 5, 41.

s2(β1) =s2e∑

X2i − 1/n (

∑Xi)

2

=6, 44

1399− 1368, 9= 0, 2140

s(β1) = 0, 46.

Penduga selang dari β

Setelah mendapat standar kesalahan masing-masing penduga, maka

selanjutnya kita dapat menghitung penduga selang dari masing-masing

Page 179: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

178 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

penduga tersebut untuk selang kepercayaan yang ditentukan, misal-

nya 95% atau taraf signifikansi (α) 5%. Karena ukuran sampel, 10,

tidak cukup besar dan σ2 tidak diketahui maka kita menggunakan

distribusi t8 sebagai distribusi penduga yang kita dapat. Untuk se-

lang simetrik, secara manual kita peroleh nilai t95%/2,8 adalah 2,31.

Selang kepercayaan 95% masing-masing penduga kita peroleh sebagai

berikut.

βj − t5%/2,8 × s(βj

)≤ βj ≤ βj + t5%/2,8 × s

(βj

)Setelah memasukkan angka-angka yang didapat sebelumnya maka diper-

oleh

1. untuk j = 0

(3, 60− 2, 31× 5, 41) ≤ β0 ≤ (3, 60 + 2, 31× 5, 41)

−8, 90 ≤ β0 ≤ 16, 10

2. Untuk j = 1

(1, 95− 2, 31× 0, 46) ≤ β1 ≤ (3, 60 + 1, 95× 0, 46)

0.89 ≤ β1 ≤ 3, 01

Page 180: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

179 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Uji hipotesis dari β

Untuk uji hipotesis kita menggunakan statistik

t0βj =βj − 0

s/√n

=3, 61− 0

5, 41= 0, 665 untuk β0 dan

=1, 95− 0

0, 46= 4, 239 untuk β1

Niilai p untuk masing-masing penduga adalah: p = 0, 26 untuk

β0 dan p = 0, 001 untuk β1 oleh karena itu koefisien regresi signifikan

(sangat signifikan) tetapi konstanta tidak signifikan. Hal tersebut se-

suai juga dengan kenyataan bahwa 0 ∈ IKβ0tetapi 0 6∈ IKβ1

. Analisis

dengan R menghasilkan keluaran sebagai berikut (perbedaan pada

beberapa desimal disebabkan adanya pembulatan pada perhitungan

manual).

Page 181: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

180 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.4. Penggunaan Matriks untuk Regresi Peubah

Ganda

3.4.1. Perluasan hasil untuk Regresi Peubah Ganda

Apabila pada model linier ada lebih dari dua koefisien regresi, mi-

salnya βj, j = 0, 1, 2, . . . , p dengan k = (p + 1) > 2, maka model li-

nier (regresi) tersebut disebut regresi berganda. Hasil-hasil yang telah

diperoleh sebelumnya dapat digeneralisir dengan mudah untuk kasus

berganda(dengan peubah ganda), diantaranya adalah seperti berikut

ini.

1. Penduga σ2 adalah

s2e = σ2 =1

n− k

n∑i=1

(Yi −

k−1∑j=0

βjXij

)2

2. Kesalahan penduga adalah s(βj) =√vjj dengan v ∈ V dan V =

s2e(XTX)−1

Page 182: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

181 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3. Distribusi penduga βj adalah

βj − βjs(βj)

∼ tn−k,

4. Selang kepercayaan (1− α)× 100% untuk βj adalah

βj − tα/2,n−ks(βj) ≤ βj ≤ βj + tα/2,n−ks(βj)

Secara umum, terutama jika parameternya lebih dari 2, maka estimasi

parameter lebih praktis dilakukan dengan menggunakan pendekatan

matriks. Hubungan peubah pada persamaan (3.1) dapat juga dit-

uliskan dalam bentuk matriks dengan mendefinisikan matriks- matriks

berikut

Y =

Y1Y2...

Yi...

Yn

; X =

1 x12 · · · x1p1 x22 · · · x2p...

......

...

1 xn2 · · · xnp

; β =

β0β1...

βj...

βp

; ε =

ε1ε2...

εi...

εn

Page 183: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

182 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Sistim persamaan (3.1) selanjutnya dapat dinyatakan dalam bentuk

matriks seperti berikut:

Y = Xβ + ε (3.19)

dengan ε dapat dianggap berdistribusi multivariat normal,

MVN(Xβ,V).

Ketidak saling bergantungan antara komponen dalam vektor kesa-

lahan digambarkan oleh bentuk matriks ragam-koragamnya yang berben-

tuk matriks skalar seperti pada persamaan (3.20)

V = σ2I =

σ2 0 · · · 0

0 σ2 · · · 0...

.... . .

...

0 0 · · · σ2

(3.20)

Apabila data yang dianalisis memiliki ragam seperti di atas, maka

datanya disebut berfifat homoskedastik, sebaliknya jika tidak, maka

disebut heteroskedastik. Bentuk matriks ragam yang bersifat het-

eroskedastisitsa dapat dilihat pada persamaan (3.21). Estimasi ben-

tuk matriks juga dapat dilakukan dengan metode kuadrat terkecil dan

Page 184: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

183 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

kemungkinan maksimum.

V =

σ21 0 · · · 0

0 σ22 · · · 0

......

. . ....

0 0 · · · σ2n

(3.21)

3.4.2. Pendekatan Matriks Metode Kuadrat Terkecil

Penggunaan matriks dalam menganalisis model linier dapat dilakukan

dengan melihat bentuk umum matriks, selanjutnya menurunkan ben-

tuk matriks yang diperoleh dengan menggunakan prinsip-prinsip difer-

ensial matriks. Langkah-langkah yang ditempuh dalam menurunkan

penduga β dengan kuadrat terkecil adalah seperti berikut ini.

1. mengubah model menjadi eksplisit terhadap matriks kesalahan,

yaitu ε = Y −Xβ

Page 185: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

184 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2. membentuk matriks bentuk kuadrat

Q = εT ε

= (Y −Xβ)T (Y −Xβ)

= YTY − 2βTXTY + βTXTXβ (3.22)

3. mencari turunan pertama dan kedua Q terhadap β (lihat Con-

toh 2.22 halaman 131).

∂Q

∂β= −2XTY + 2XTXβ

= −2(XTY −XTXβ

)(3.23)

∂2Q

∂βT∂β= 2XTX. (3.24)

4. menentukan persamaan iterasi Newton-Raphson atau skoring

Fisher untuk β, dengan mengambil nilai awal untuk β = b0

yaitu

b1 = b0 −(XTX

)−1 (XTXβ −XTY

)b1 = b0 +

(XTX

)−1XT(Y −Xb0) (3.25)

Page 186: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

185 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Apabila datanya bersifat heteroskedastik, maka bentuk kuadrat harus

dibobot dengan invers matriks ragam-koragam. Metode kuadrat terke-

cil yang telah dibobot disebut Weighted Least Square-WLS atau Gen-

eralized Least Square-GLS. Dengan menggunakan hasil pada Contoh

2.23 halaman 132, maka kita memperoleh persamaan berikut.

Q = (Y −Xβ)TV−1(Y −Xβ) (3.26)

b1 = b0 +(XTV−1X

)−1XTV−1(Y −Xb0) (3.27)

Untuk distribusi normal sesungguhnya solusi langsung tanpa menggu-

nakan iterasi Newton-Raphson dapat diperoleh dengan mencari solusi

−2(XTY −XTXβ

)= 0 atau − 2

(XTV−1Y −XTV−1Xβ

)= 0

yang menghasilkan

β =(XTX

)−1XTY (3.28)

untuk kondisi homoskedastik dan

β =(XTV−1X

)−1XTV−1Y (3.29)

untuk kondisi heteroskedastik. Sebenarnya penyelesaian untuk ka-

sus distribusi normal dapat dilakukan langsung tanpa iterasi. Namun

Page 187: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

186 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

penurunan iterasi diberikan sebagai pendekatan yang berlaku umum.

Tanpa iterasi rumus yang diperoleh adalah

β = (XTX)−1XTYuntuk kasus homoskedastik atau (3.30)

= (XTV−1TX)−1XTV−1Y (3.31)

untuk kasus heteroskedastik.

3.4.3. Pendekatan Matriks untuk Metode Kemungkinan Mak-

simum

Hasil yang diperoleh pada sub di atas dapat, khususnya turunan like-

lihood terhadap β, dapat juga dilakukan secara serempak dengan

mengggunakan pendekatan ’multivariat’, dalam arti semua data re-

spon dapat dianggap merupakan satu kesatuan vektor respon dengan

multivariat normal dengan nilai-tengah µ = Xβ dan matriks ragam-

koragam V = σ2I. Fungsi kepadatan probabilitas dari Y yang berdis-

tribusi multivariat normal (MVN) adalah

f(Y,µ) =1√

(2π)n|V|exp

[−1

2(Y − µ)T V−1 (Y − µ)

](3.32)

Page 188: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

187 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Untuk menerapkan metode kemungkinan maksimum dengan pen-

dekatan matriks maka dapat ditempuh langkah-langkah berikut:

1. menganggap Y berdistribusi MVN (Xβ,V) sehingga mempun-

yai bentuk likelihood

L =1√

(2π)n|V|exp

[−1

2(Y −Xβ)TV−1(Y −Xβ)

]

2. menentukan fungsi log-likelihood inti l(β), yaitu

l(β) = −1

2(Y −Xβ)TV−1(Y −Xβ) = −1

2Q

3. menentukan turunan pertama dan kedua likelihood inti terhadap

β, yaitu

∂l(β)

∂β= −1

2

∂Q

∂β

∂2l(β)

∂βT∂β= −1

2

∂Q

∂βT∂β

Page 189: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

188 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4. Sekali pun bentuk turunan pertama dan keduanya sedikit ber-

beda dengan hasil dari metode kuadrat terkecil, karena perka-

lian dengan konstanta −12, namun bentuk akhir dari persamaan

iterasi Newton-Raphsonnya adalah identik, karena invers atau

kebalikannya akan saling meniadakan, yaitu

b1 = b0 −[−1

2

∂Q

∂βT∂β

]−1 [−1

2

∂Q

∂β

]= b0 −

[∂Q

∂βT∂β

]−1 [∂Q

∂β

].

Dengan demikian persamaan di atas akan menghasilkan bentuk

iterasi Newton-Raphson yang identik dengan metode kuadrat

terkecil, yaitu

b1 = b0 +(XTV−1X

)−1XTV−1(Y −Xb0)

Hasil 3.7. Untuk model linier sederhana dengan V = σ2I, jika σ dike-

tahui, maka var(β) = σ2(XTX)−1. Jadi secara umum dapat dikatakan

bahwa jika σ2 diketahui, maka

β ∼MVN(β, σ2

[XTX

]−1)(3.33)

Page 190: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

189 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dari bentuk estimasi di sebelumnya dapat dilihat bahwa β meru-

pakan hasil transformasi dari peubah acak Y, dalam hal ini dapat

dianggap bahwa

β =(XTV−1X

)−1XTV−1(Y) + B.

Dengan menggunakan hasil bahwa var(AY + B) = AVAT, maka

Var(β) =[(

XTV−1X)−1

XTV−1]

V[(

XTV−1X)−1

XTV−1]T

=[(

XTV−1X)−1

XTV−1]

V[V−1X

(XTV−1X

)−1]=(XTV−1X

)−1= σ2

(XTX

)−1.

Hasil 3.8. Jika σ2 tidak diketahui, maka diganti dengan

σ2 = s2e =1

n− k

[YTY − βXTY

](3.34)

Bukti:

s2e =1

n− k

[(Y −Xβ)T (Y −Xβ)

]=

1

n− k

[YTY − βT

XTY −YTXβ + βTXTXβ

]

Page 191: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

190 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dengan menggunakan hasil bahwa β =(XTX

)−1XTY dan kenya-

taan bahwa βTXTY = YTXβ, maka diperoleh

s2e =1

n− k

[YTY − βXTY

].

Page 192: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

191 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.5. Interval Keyakinan µ dan Prediksi Y

Ada dua macam prediksi yang bisa dibuat yaitu estimasi nilai-tengah

µ dan prediksi untuk nilai tunggal y pada suatu kombinasi nilai predik-

tor misalnya xo = (1, x1, x2, · · · , xp)T . Perhatikan bahwa

y = µ+ ε

dengan µi = x0T β dan var(ε) = σ2. Dengan demikian kita memiliki

dua macam ragam yaitu ragam untuk estimasi µ dan ragam untuk

prediksi y yang besarnya dapat ditentukan sebagai berikut:

1. Ragam µ pada titik x = x0 adalah

Vµ = σ2[x0

T (XTX)−1x0

]2. Ragam yi pada titik x = x0 adalah

Vy = σ2[1 + x0

T(XTX

−1)

x0

]Selanjutnya interval keyakinan (1−α)×100% pada suatu nilai predik-

tor x = x0 masing-masing adalah

Page 193: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

192 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

µ = x0T β ± tn−k,α/2

√Vµi

untuk prediksi µ dan

y = x0T β ± tn−k,α/2

√Vyi

untuk prediksi nilai y.

Dengan demikian interval prediksi y selalu lebih lebar dari in-

terval keyakinan nilai-tengah pada setiap kombinasi nilai prediktor.

Untuk regresi linier sederhana dengan satu prediktor X, untuk suatu

nilai prediktor x0 < x < x1, interval-interval ini akan membentuk

sabuk keyakinan (confident belt) seperti pada Gambar 3.1.

Page 194: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

193 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

38.0 38.5 39.0 39.5 40.0

185

190

195

200

Sabuk Keyakinan 95% Prediksi Y dan Mu

x

y Y = a + b X

Gambar 3.1: Ilustrasi Garis regresi dan sabuk keyakinan nilai-tengah

µ dan sabuk prediksi y

Page 195: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

194 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.6. Melaporkan Nilai Probabilitas p

Selain menghitung estimasi interval maupun melakukan uji hipotesis

dengan distribusi t maupun z, paket- paket statistik biasa melaporkan

nilai probabilitas yang disebut nilai p yaitu luas daerah yang berada

dibagian ujung yang dibatasi oleh statistik t∗. Dengan kata lain p

adalah peluang bahwa kesimpulan yang kita peroleh keliru. Untuk

hipotesis β = 0, nilai p dapat dihitug dengan

p = P (tn−1 ≥ |t∗|) dengan t∗ =β − βS(β)

.

Untuk hipotesis β = 0 dan uji dua arah yang simetris maka

p = 1− P (−t∗ ≤ tn−1 ≤ t∗)

= 2P (tn−1 < −|t∗|)

Dengan demikian semakin kecil nilai p akan semakin signifikan hasil-

nya dan semakin kuat penolakan H0. Dalam bahasa R perhitungan p

dapat dilakukan dengan

p<-2*(1-pt(abs(t),df)) ataup<-2*(pt(-abs(t),df))

Page 196: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

195 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Hasil 3.9. Penolakan Hipotesis nol (Ho) dengan menggunakan p ada-

lah sebagai berikut: Ho ditolak pada taraf signifikansi alpha(α)(α ×100%) jika dan hanya jika p ≤ (α× 100%)

Secara individu, uji signifikansi koefisien βj dengan menggu-

nakan nilai p dapat dilakukan sebagai berikut:

1. βj sangat signifikan jika p ≤ 1%;

2. βj signifikan jika 1% < p ≤ 5%;

3. βj tidak signifikan jika p > 5%;

Page 197: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

196 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.7. Model Linier dengan Variabel Kualitatif

Misalkan beberapa peubah penjelas dalam model linier merupakan

peubah kualitatif (kelompok) dengan dua tingkat (misalnya L=Laki-

laki dan P=perempuan). Pertanyaan mendasar dari data seperti ini

adalah, apakah penyebaran data antara kelompok yang satu (L) ber-

beda dengan kelompok yang lain (P). Apakah garis regresi penduga

data cukup diwakili satu garis atau dua garis yang berbeda. Empat

kemungkinan sebaran data jika dipisahkan berdasarkan kelompok di-

ilustrasikan dengan Gambar 3.2. Pada gambar diilustrasikan ada 4

kemungkinan penyebaran datanya yaitu:

1. kedua kelompok menyebar sama sehingga tidak perlu dibedakan

antara kelompok satu dengan yang lain sehingga cenderung mem-

bentuk satu garis lurus;

2. kedua kelompok menyebar berbeda dengan kecenderungan memi-

liki kemiringan yang sama tetapi konstanta berbeda sehingga

membentuk dua garis lurus sejajar;

3. kedua kelompok menyebar berbeda dengan kecenderungan memi-

Page 198: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

197 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

liki kemiringan yang berbeda tetapi konstanta sama sehingga

membentuk dua berkas garis;

4. kedua kelompok menyebar berbeda dengan kecenderungan memi-

liki kemiringan maupun konstanta yang berbeda sehingga mem-

bentuk dua garis lurus berbeda;

3.7.1. Variabel Boneka dengan Model Berkonstanta

Untuk menangani data dengan variabel kualitatif, kita dapat menan-

ganinya dengan memperkenalkan varibel boneka (dummy variable).

Misalkan g adalah variabel kualitatif dengan gi = L atau gi = P .

Kita dapat mendefinisikan vektor D dengan

Di =

1 jika gi = L

0 untuk yang lain(3.35)

Dengan demikian bentuk model antara Yi dengan variabel-variabel

lainnya dapat dituliskan sebagai

Yi = β0 + β1X1 + β2Di + εi (3.36)

Page 199: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

198 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

oo

o

o o

ooo

o

o

oo

o

oo

o

oo

o

o

o

o

o

oo

o

o

oo

o

0 5 10 15

1020

3040

5060

70

data (x,y)

X

Y

**

*

**

* **

*

*

**

*

**

*

**

*

*

*

*

*

*

*

*

**

*

*

o

o

o

o

o

o

oo

o

o

o

oo

o

oo

o

o

oooo

o

o

o

o

o

o

o

o

0 2 4 6 8 10 12 14

010

3050

70

data (x,y)

X

Y

*

*

*

*

*

*

**

*

*

*

*

*

*

**

*

*

****

*

*

*

*

*

*

*

*

o

o

o

o oo

o

o

o o

o

o

o

o

oo

o

o

o

o

oo

o

o

o

oo

o

o

o

0 5 10 15

1020

3040

5060

70

data (x,y)

X

Y

*

*

** **

*

*

**

*

*

*

*

**

*

*

*

*

**

*

*

**

*

*

*

*o o

o

o

o

o

o

oo

o

oo

oo

o

o

o

oo

oo

o

oo o

oo

o

o

o

0 5 10 15

010

2030

4050

60

data (x,y)

X

Y

*

*

*

*

*

*

*

***

**

***

*

* **

**

***

*

**

**

*

Gambar 3.2: Sebaran data dilihat dari adanya kelompok atau peubah

kualitatif. Pada gambar terlihat empat model penye-

baran data untuk satu variabel kualitatif dengan dua kat-

egori (L,P).

Page 200: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

199 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Jika diteliti lebih jauh, maka model untuk kelompok L dan kelompok

P , masing masing adalah:

L : Yi = β0 + β1Xi + β2 + εi

= (β0 + β2) + β1X1 (3.37)

P : Yi = β0 + β1X1 + εi (3.38)

Dengan demikian pengenalan variabel boneka D di atas menunjukkan:

1. model yang diperiksa adalah model linier paralel yaitu model

dengan konstanta berbeda (β0 dan β0 + β2) tetapi gradien sama

(β1);

2. β2 adalah parameter yang menentukan apakah model untuk ke-

dua kelompok perlu dibedakan konstantanya

Secara formal uji hipotesis β2 adalah

H0: β2=0 (menunjukkan model untuk kedua kelompok sama)

HA: β2 6= 0 (menunjukkan model untuk kedua kelompok ber-

beda)

Page 201: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

200 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Secara geometris model yang dihasilkan jika β2 signifikan dapat diilus-

trasikan dengan Gambar 3.3.

Apabila kita ingin memeriksa apakah selain konstantanya gradi-

ennya juga berbeda, kita perlu memperkenalkan peubah boneka lain

yang mewakili adanya interaksi antara peubah X dengan g. Misalkan

kita definisikan vektor Dx dengan

Dxi = Di ∗Xi (3.39)

Dengan demikian bentuk model antara Yi dengan variabel-variabel

lainnya dapat dituliskan sebagai

Yi = β0 + β1X1 + β2Di + β3Dxi + εi (3.40)

Jika diteliti lebih jauh, maka sekarang model untuk kelompok L dan

kelompok P , masing masing adalah:

L : Yi = β0 + β1Xi + β2 + β3Xi + εi

= (β0 + β2) + (β1 + β3)X1 (3.41)

P : Yi = β0 + β1X1 + εi (3.42)

Page 202: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

201 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

β1

β1 β2

Gambar 3.3: Garis Regresi sejajar dengan selisih konstanta β2 dan gra-

dien sama (β1)

Page 203: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

202 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Jadi signifikan tidaknya β2 menentukan perlu tidaknya model de-

ngan konstanta berbeda, sedangkan signifikan tidaknya β3 menen-

tukan perlu tidaknya model dengan gradien berbeda untuk kedua

kelompok yang ada.

Secara geometris model yang dihasilkan jika β2 signifikan dapat

diilustrasikan dengan Gambar 3.4.

Di =

1 jika gi = L

0 untuk yang lain(3.43)

3.7.2. Variabel Boneka dengan Konstanta tidak Eksplisit

Dalam hal tertentu, kita merlukan model dengan konstanta implisit.

Paling tidak ada dua kondisi kenapa model ini bermanfaat yaitu:

1. secara teoritik pada saat nilai peubah penjelas nol, nilai respon

juga nol;

2. untuk model dengan peubah kualitatif (kelompok), model ini

memudahkan interpretasi konstanta masing- masing kelompok.

Page 204: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

203 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

β1+β3

β1 β2

Gambar 3.4: Garis Regresi berbeda dengan selisih konstanta β2 dan

selisih gradien β3

Page 205: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

204 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Untuk model dengan variebel kualitatif dengan konstanta implisit,

definisi peubah boneka harus dibuat secara terpisah untuk masing-

masing kelompok seperti berikut:

1. diperlukan k variabel boneka untuk satu peubah kualitatif de-

ngan tingkat kelompok sebanyak k;

2. untuk peubah kualitatif g dengan dua tingkat P,L, maka perlu

didefinisikan dua peubah boneka misalnya DL dan DP dengan

DLi =

1 jika gi = L

0 untuk yang lain

DPi =

1 jika gi = P

0 untuk yang lain

Sedangkan bentuk modelnya akan menjadi

Yi = β1X1 + β2DLi + +β2DPi + εi (3.44)

Jika diteliti lebih jauh, maka model untuk kelompok L dan

kelompok P , masing- masing adalah:

L : Yi = β2 + β1Xi + εi

P : Yi = β3 + β1X1 + εi

Page 206: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

205 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Jadi konstanta untuk kelompok L adalah β2 dan konstanta un-

tuk kelompok P adalah β3.

Page 207: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

206 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.8. Ilustrasi Model Linier Normal dengan R

3.8.1. Simulasi dengan R

Untuk lebih memahami konsep-konsep statistika, ilustrasi program

komputer dengan meggunakan data simulasi sangat bermanfaat. Un-

tuk keperluan memeriksa sifat-sifat prosedur analisis data yang telah

dibicarakan, maka ada beberapa hal yang harus diimplementasikan

dalam komputer diantaranya:

1. mensimulasi data yang memenuhi asumsi sebagaimana dihara-

pkan, misalnya Y ∼ N(Xβ, σ2). Ini berarti untuk mensimulasi

data kita harus menetapkan X dan β;

2. mengestimasi balik β dari data Y baik dengan cara langsung

mapun dengan melalui iterasi numerik Newton-Raphson;

3. mengulang-ulang proses 1. dan 2. untuk melihat sifat-sifat pen-

duga β secara umum;

4. mengimplementasikan program yang dibuat untuk data riil. Im-

plementasi data riil dalam buku ini selanjutnya dilakukan de-

Page 208: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

207 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

ngan menggunakan library dan dataset yang sudah ada yaitu

lm().

Contoh 3.2. Misalkan kita akan mensimulasi data sederhana dengan

ukuran n = 60 dan X ∼ N(50, 25) (ingat bahwa berbeda dengan Y ,

tidak ada keharusan X untuk mengikuti distribusi tertentu). Misalkan

pula β = (3, 5)T dan varian kesalahan σ2 adalah 16, artinya Y ∼N(µ, σ2) dan µ = Xβ dan kita akan memeriksa model

Yi = 3 + 5xi + εi i = 1, . . . , 60

Untuk membangkitkan data Y, ada dua cara yang bisa ditem-

puh.

1. Sesuai dengan sifat bahwa, jika X ∼ (0, σ2), maka X + C ∼N(C, σ2). Jadi kita perlu membangkitkan ε ∼ N(0, σ2) lalu

mendefisikan Y = µ+ ε

n<-60

x<-rnorm(60,50,5)

sgm<-4

Page 209: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

208 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

x<- rnorm(n,0,sgm)

eps<-rnorm(0,sgm)

mu<-3+5*xydat<-mu+eps

2. membangkitkan langsung Y ∼ N(µ, σ2)

ydat<-rnorm(n,mu,sgm)

Selanjutnya dari data yang ada (ydat), kita dapat mengestimasi

balik β. Untuk model dengan distribusi normal kita dapat menghi-

tungnya dengan dua cara yaitu dengan cara langsung melalui

β =(XTX

)−1XTY

atau secara umum (yang berlaku untuk semua distribusi) dengan it-

erasi Newton-Raphson

b1 = b0 +(XTX

)−1(Y −Xb0)

Ragam estimator/penduga, untuk kasus σ yang diketahui, dapat di-

hitung dengan

V ar(β) = σ2(XTX

)−1

Page 210: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

209 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Jika σ tidak diketahui, dapat diganti dengan penduganya yaitu:

σ =

√(Y −Xβ)T(Y −Xβ)

N − k

x.mat<-as.matrix(cbin(1,x))

b.hat<-solve(t(x.mat)%*%xmat)%*%t(x.mat)%*%ydat

print(b.hat)

Keluaran yang diperoleh dari program diatas adalah

>print(b.hat)

[,1]

2.831853

x 4.760870

print(sgm^2*solve(t(x.mat)%*%x.mat))

x

0.269456174 0.008044395

x 0.008044395 0.023198465

Page 211: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

210 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Proses di atas dapat dilakukan berulang-ulang, misalnya 100

kali, selanjutnya dihitung nilai-tengah dan ragam estimator. Hasilya

sangat dekat dengan ragam yang diperoleh melalui pendugaan di atas.

Dalam contoh berikut hasil estimasi dari 100 kali pendugaan disimpan

dalam matriks mh.

>var(mh) # varian dari 100 kali pendugaan

[,1] [,2]

[1,] 0.301722464 0.006733643

[2,] 0.006733643 0.019071798

>mean(mh[,1])

[1] 2.963071

>mean(mh[,2])

[1] 4.985726

Jika diperlukan kita juga dapat membuat grafik penduga dari

100 ulangan simulasi yang masing-masing mengambil sampel beruku-

ran 60 (Gambar 3.5). Pengulangan juga dapat divariasi dengan meningkatkan

ukuran sampel pada setiap simulasi. Simulasi ini sangat baik un-

tuk mengilustrasikan hunbungan antara ukuran sampel dan ketelitian

pendugaan. Gambaran grafik yang diperoleh apabila dalam setiap

Page 212: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

211 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

pengambilan sampel dilakukan penambahan jumlah sampel seperti

pada Gambar 3.6. Pada gambar tersebut terlihat bahwa semakin be-

sar ukuran sampel pendugaan semakin teliti, karena ragam pendugaan

semakin mengecil.

Gambar 3.5: Grafik Penduga β1 = α dari penarikan sampel 100 kali

masing-masing berukuran 60. Nilai parameter sebe-

narnya adalah α = 3.

Page 213: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

212 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Gambar 3.6: Grafik Penduga β1 = α dari beberapa penarikan sam-

pel dengan ukuran mulai 10 sampai dengan 1000. Nilai

parameter sebenarnya adalah α = 3.

Page 214: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

213 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.8.2. Menggunakan Fungsi lm()

lm() adalah fungsi yang ada pada R untuk menganalisis data dengan

model linier normal. Format perintahnya adalah:lm(formula, data,...)

Komponen parameter fungsi lm() dapat djelaskan sebagai ber-

ikut ini.

1. formula adalah peubah respon dan peubah- peubah penjelas

yang dinyatakan dalam bentuk y~x1+x2+. . .. Jika ingin meng-

gunakan persamaan regresi tanpa konstanta maka pada formula

ditulis y~x1+x2-1 atau y~0+x1+x2. Pada bagian ini juga dapat

dimasukkan data yang telah ditansformasi misalnya log(y)~x1+x2

dan sejenisnya.

2. data adalah nama data yang akan dianalisis, yaitu yang memuat

nama-mana peubah yang dimasukkan pada formula

Dari hasil analisis menggunakan fungsi lm(), ada beberapa in-

formasi yang dapat diekstrak dari objek yang dihasilkan diantaranya:

1. coef(objek) untuk mengekstrak koefisien regresi β.

Page 215: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

214 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2. deviance(objek) untuk mengekstrak jumlah kuadrat sisa.

3. formula(objek) untuk mengekstrak rumusan model yang diper-

gunakan

4. plot(objek) untuk menghasilkan grafik yaitu seperti grafik sisa,

grafik fitted value dan beberapa disgnostik.

5. print(objek) untuk mencetak hasil singkat analisis.

6. step(objek) untuk memeriksa model yang paling cocok dengan

cara melihat angka (Akaike’s Information Criterion) yang paling

kecil(lihat sesi 4.5.

7. summary(objek)untuk mencetak lengkap hasil analisis.

Untuk mengetahui lebih jauh komponen-komponen yang tersedia dari

suatu objek dapat dilakukan dengan

>names(objek)

Contoh 3.3. Misalkan kita ingin mencari persamaan regresi (model

linier) dari peubah kecepatan/speed dan jarak tempuh distance kenda-

Page 216: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

215 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

raan pada data cars.Perintah dan hasil keluaran untuk mengetahui

ringkasan data adalah:

> data(cars)

> summary(cars)

speed dist

Min. : 4.0 Min. : 2.00

1st Qu.:12.0 1st Qu.: 26.00

Median :15.0 Median : 36.00

Mean :15.4 Mean : 42.98

3rd Qu.:19.0 3rd Qu.: 56.00

Max. :25.0 Max. :120.00

Setelah diketahui nama peubah- peubahnya, selanjutnya kita da-

pat menggambar diagram pencar (Gambar 3.7) serta menulis perintah

model linier seperti berikut:

>contoh.lm<-lm(dist~speed,data=cars)

>print(summary(contoh.lm))

Call: lm(formula = dist ~ speed, data = cars)

Residuals:

Page 217: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

216 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5 10 15 20 25

020

4060

8010

012

0

DIAGRAM PENCAR SPEED VS. DISTANCE

speed

dist

Gambar 3.7: Histogram dengan Kurva Densitas untuk peubah Speed

dan Distance pada Data Cars

Page 218: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

217 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Min 1Q Median 3Q Max

-29.069 -9.525 -2.272 9.215 43.201

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -17.5791 6.7584 -2.601 0.0123*

speed 3.9324 0.4155 9.464 1.49e-12 ***

---

Signif.codes:0`***'0.001`**'0.01`*'0.05 `.' 0.1` ' 1

Residual standard error: 15.38 on 48 degrees of freedom

Multiple R-Squared: 0.6511,

Adjusted R-squared: 0.6438

F-statistic: 89.57 on 1 and 48 DF,

p-value:1.490e-12

Dari hasil yang diperoleh dapat disimpulkan bahwa konstanta

α = β0 adalah signifikan (1% < p < 5%) dan koefisien speed adalah

sangat signifikan (p < 1%).

Untuk mengetahui komponen-komponen yang dapat diekstrak

dari objek contoh.lm dapat dilakukan dengan perintah berikut. Se-

Page 219: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

218 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dangkan untuk memanggil salah satu komponen objek dilakukan de-

ngan NamaObjek$komponen.

>names(contoh.lm)

[1] "coefficients" "residuals" "effects" "rank"

[5] "fitted.values" "assign" "qr" "df.residual"

[9] "xlevels" "call" "terms" "model"

>contoh.lm$coeff

(Intercept) speed

-17.579095 3.932409

3.8.3. Model dengan Variabel Kualitatif

Andaikan selain variabel penjelas X data juga mengandung variabel

kualitatif G, maka variabel kualitatif ini pun perlu diperiksa apakah

berpengaruh pada hubungan variabel X dan Y . Untuk menghadapi

data yang mengandung peubah kualitatif, secara umum dapat di-

lakukan lengkah-langkah berikut ini.

1. Lakukan eksplorasi secara grafis dengan menggambar Diagram

Pencar (Scattergram) data, untuk melihat secara intuitif apakah

Page 220: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

219 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

regresi perlu dipisah atau dapat digabung.

2. Analisis data dengan memasukkan peubah kualitatif sesuai de-

ngan indikasi yang ditunjukkan oleh diagram pencar.

3. Lakukan uji signifikansi baik untuk peubah kualitatif maupun

kuantitatif

Ada beberapa cara (yang biasa disebut formula) untuk memasukkan

variabel kualitatif (misalnya grup) pada R seperti diuraikan berikut

ini.

1. Y ∼ X ∗ G. Dengan formula ini kita mencoba model paling

lengkap yaitu memeriksa kemungkinan bahwa setiap kelompok

memiliki model yang berbeda.

2. Y ∼ X +G. Formula ini adalah untuk memeriksa kemungkinan

model regresi sejajar (dengan gradien sama tetapi kemungkinan

konstanta berbeda).

3. Y ∼ G/X. Formula ini adalah untuk memeriksa signifikansi mo-

del masing-masing kelompok dengan memaksa model dengan

Page 221: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

220 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

gradien berbeda. Berbeda dengan pendekatan pertama yang

lebih melihat perlu tidaknya model dipisah, dengan formula ter-

akhir ini, kita memaksa untuk menggunakan model terpisah dan

selanjutnya melihat signifikansi masing, masing model. Model

dari ketiga kelompok bisa sama-sama signifikan, tetapi mungkin

saja ketiganya dapat digabung menjadi satu.

Berikut adalah beberapa contoh dengan berbagai kondisi peubah

kualitatif

Contoh 3.4.

Suatu data yang mengandung peubah kuantitatif X, Y dan peu-

bah kualitatif g sebarannya ditunjukkan oleh Gambar 3.8. Pada Gam-

bar terlihat bahwa data mengandung variabel kualitatif g tetapi kedua

subkelompok data terlihat cukup membaur dan tidak perlu dibedakan

antara kedua sub kelompok datatersebut.

Call:

lm(formula = y ~ g * x, data = sim.data.reg)

Coefficients:Estimate Std. Error t value Pr(>|t|)

Page 222: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

221 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

35 40 45 50 55 60 65 70

120

140

160

180

200

220

DIAGRAM PENCAR

X

Y

g

LP

Gambar 3.8: Diagram Pencar X dengan Y yang mengandung kelompok

yang dapat digabung

Page 223: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

222 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

(Intercept) 6.10606 0.79364 7.694 2.47e-10 ***

g[T.P] -0.34794 1.12238 -0.310 0.758

x 3.88663 0.08370 46.433 < 2e-16 ***

g[T.P]:x 0.01706 0.11837 0.144 0.886

---

Signif.codes: 0'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1

Dengan formula di atas (Y ∼ G ∗X) kita ingin mendapat gam-

baran perlu tidaknya memisahkan konstanta dan gradien garis regresi

masing-masing kelompok. Dari hasil di atas diperoleh:

1. koefisien g[T.P] tidak signifikan, berarti selisih konstanta dua

kelompok tidak signifikan;

2. koefisien g[T.P]:x tidak signifikan, berarti selisih gradien dua

kelompok tidak signifikan.

Jadi untuk data ini tidak perlu dipisahkan model atau garis regresi

dari masing-masing kelompok.

Call:

lm(formula = y ~ g + x, data = sim.data.reg)

Page 224: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

223 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 6.03583 0.62101 9.719 1.06e-13 ***

g[T.P] -0.20747 0.55184 -0.376 0.708

x 3.89516 0.05868 66.383 < 2e-16 ***

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Dengan formula ini (Y ∼ G+X) kita memaksa untuk menggu-

nakan gradien yang sama (regresi sejajar), tetapi hanya melihat kemu-

ngkinan perlu tidaknya memisahkan konstantanya. Hasil di atas me-

nunjukkan kita tidak perlu memisahkan konstanta dari masing-masing

kelompok.

Call:

lm(formula = y ~ g/x, data = sim.data.reg)

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 6.1061 0.7936 7.694 2.47e-10 ***

g[T.P] -0.3479 1.1224 -0.310 0.758gL:x 3.8866 0.0837 46.433 < 2e-16 ***

Page 225: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

224 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

gP:x 3.9037 0.0837 46.637 < 2e-16 ***

---

Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1

Dengan formula ini (Y ∼ G/X) kita memaksa memeriksa model

atau regressi terpisah untuk masing-masing kelompok. Hasil menun-

jukkan bahwa regresi masing-masing kelompok sama-sama signifikan,

tetapi tidak ada informasi apakah kedua model atau garis regresi itu

dapat digabung atau tidak. Karena model menggunakan model de-

ngan konstanta, kita masih bisa melihat bahwa selisih konstanta dari

kelompok L dan kelompok P tidak signifikan.

Secara keseluruhan bentuk model yang dapat dimasukan dalam

formula R dapat dirangkum dalam Tabel 3.1 (lihat juga Kuhnert &

Venables [18]). Pada notasi tersebut x menunjukkan variabel kuanti-

tatif sedangkan G menunjukan variabel kualitatif (faktor), sedangkan

y dapat berupa kualitatif atau faktor (pada regresi logistik yang akan

dibahas kemudian). Pada model G/(x1+x2) kelompok yang ada di-

paksa memiliki regresi yang berbeda, sedangkan pada y~G*(x1+x2)

kelompok dilihat semua kemungkinannya apakah perlu regresi ber-

Page 226: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

225 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

beda, sejajar atau bergabung (satu).

Tabel 3.1: Alternatif Penulisan Model dalam Formula R

No Bentuk Arti

1 y~x regresi sederhana

2 y~x-1 regresi tanpa konstanta

3 log(y)~x regresi dengan transformasi pada Y

4 y~log(x) regresi dengan transformasi pada X

5 y~x1+x2+... regresi multivariat

6 y~G+x1+x2 regresi paralel

7 y~G/(x1+x2) regresi berbeda

8 y~G*(x1+x2) regresi dengan interaksi

Contoh 3.5.

Data berikut mengandung peubah kuantitatif X, Y dan peu-

bah kualitatif G dengan kategori (L, P ), sebarannya ditunjukkan oleh

Gambar 3.9. Pada Gambar terlihat bahwa data mengandung vari-

abel kualitatif g dan kedua subkelompok data terlihat memiliki ke-

Page 227: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

226 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

cenderungan yang berbeda. Kita akan melakukan eksplorasi model

dan memilih model yang terbaik dengan mencoba (i) mengabaikan

adanya kelompok, (ii) mencoba model paralel, dan (ii) mencoba mo-

del terpisah..

1. Analisis dengan mengabaikan kelompok. Jika analisis regresi di-

lakukan dengan mengabaikan kelompok, (Y ∼ X), maka gabun-

gan kedua kelompok akan saling meniadakan kecenderungan masing-

masing sehingga menghasilkan hubungan yang tidak signifikan.

Call:

lm(formula = y ~ x, data = DataSimReg)

Residuals:

Min 1Q Median 3Q Max

-11.2012 -2.1944 0.1407 2.9430 11.2207

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -8.73271 3.53350 -2.471 0.0164 *

x 0.07325 0.06855 1.068 0.2897---

Page 228: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

227 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

35 40 45 50 55 60 65 70

−15

−10

−5

05

DIAGRAM PENCARDENGAN KELOMPOK

X

Y

g

LP

Gambar 3.9: Diagram Pencar X dengan Y mengandung kelompok yang

perlu dipisah

Page 229: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

228 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1

Residual standard error: 4.682 on 58 degrees of freedom

Multiple R-squared: 0.0193,Adjusted R-squared: 0.002394

F-statistic: 1.142 on 1 and 58 DF, p-value: 0.2897

Terlihat bahwa gradien atau koefisien regresi(koefisien X)tidak sig-

nifikan dan koefisien determinasinya juga sangat kecil (0,02).

2. Model paralel. Model berikutnya yang banyak umum dicoba orang

adalah model regresi paralel, (Y ∼ X + G), dengan model ini kita

memberi ruang perbedaan konstanta tetapi tidak pada gradien re-

gresi.

Call:

lm(formula = y ~ x + g, data = DataSimReg)

Residuals:

Min 1Q Median 3Q Max

-10.55982 -2.81816 -0.09043 2.73765 10.66159

Page 230: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

229 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Coefficients:Estimate Std. Error t value Pr(>|t|)

(Intercept) -9.21175 3.56600 -2.583 0.0124 *

x 0.07079 0.06860 1.032 0.3065

g[T.P] 1.20796 1.20967 0.999 0.3222

---

Signif. codes:0'***'0.001'**'0.01'*'0.05 '.'0.1 ''1

Residual standard error: 4.682 on 57 degrees of freedom

Multiple R-squared: 0.03616,Adjusted R-squared: 0.002345

F-statistic: 1.069 on 2 and 57 DF, p-value: 0.35

Dari hasil terlihat bahwa gradien masih tetap tidak signifikan, demikian

juga selisih konstanta (g[T.P]) tidak signifikan, dan koefisien deter-

minasi hanya membaik sedikit menjadi 0,04.

3. Model terpisah. Diagram pencar mengindikasikan kelompok memi-

liki kecenderungan berbeda, karena itu sebenarnya yang paling ma-

suk akal adalah mencoba regresi berbeda dan sekaligus memisahkan

konstanta secara eksplisit, Y ∼ X/G− 1.

Page 231: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

230 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

lm(formula = y ~ g/x - 1, data = DataSimReg)

Residuals:

Min 1Q Median 3Q Max-4.91870 -1.46909 -0.06663 1.31627 4.12724

Coefficients:

Estimate Std. Error t value Pr(>|t|)

gL 15.39683 2.07712 7.413 7.20e-10 ***

gP -31.43454 2.04057 -15.405 < 2e-16 ***

gL:x -0.41683 0.04056 -10.276 1.69e-14 ***

gP:x 0.52931 0.03933 13.457 < 2e-16 ***

---

Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1''1

Residual standard error: 1.927 on 56 degrees of freedom

Multiple R-squared: 0.9258,Adjusted R-squared: 0.9205

F-statistic: 174.7 on 4 and 56 DF, p-value: < 2.2e-16

Hasil menunjukkan bahwa baik konstanta maupun gradien untuk

masing-masing kelompok semuanya signifikan. Sementara itu koe-

Page 232: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

231 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

fisien determinasi yang dihasilkan jauh lebih baik dari sebelumnya

yaitu 0,93.

Ilustrasi di atas menunjukkan bahwa jika data mengandung peubah

kualitatif, sangat perlu dilakukan eksplorasi data (dengan menggam-

bar grafik diagram pencarnya), selanjutnya memilih model yang ter-

baik melibatkan peubah kualitatif tadi. Jika tidak, akan diperoleh

hasil yang tidak sesuai dengan kondisi sebenarnya.

3.8.4. Analisis dengan Subset

Untuk data yang terdiri atas beberapa kelompok (mengandung peu-

bah kualitatif), analisis dapat dilakukan pada seluruh atau sebagian

data tersebut melalui pemanfaatan parameter subset, dengan

subset=nama.var.kualitatif=="simbol.sub.kelompok"

Pada Contoh 3.5, kita dapat juga menganalisis secara terpisah

data untuk masing-masing kelompok L dan P .

lm(formula = y ~ x, data = DataSimReg, subset = g == "P")

Residuals:

Page 233: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

232 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Min 1Q Median 3Q Max

-4.91870 -1.19517 -0.04871 0.97073 4.12724

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -31.43454 2.04449 -15.38 3.51e-15 ***

x 0.52931 0.03941 13.43 9.99e-14 ***

---

Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''1

Residual standard error: 1.931 on 28 degrees of freedom

Multiple R-squared: 0.8656,Adjusted R-squared: 0.8608

F-statistic: 180.4 on 1 and 28 DF, p-value: 9.99e-14

Ternyata hasilnya identik dengan hasil sebelumnya yaitu:

1. Intersept (konstanta) = koefisien gP = - 31,43;

2. Koefisien X = koefisien gP:x= 0,53

Dengan cara yang sama kita dapatmelakukan analisis untuk subkelompok L

dengan membuat subset = g == "L". Hasilnya identik dengan konstanta

dan koefisien untuk g.L.

Page 234: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

233 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.9. Ringkasan

1. Untuk analisis regresi klasik, respon atau galat harus berdistribusi

normal dengan ragam konstan dan satu sama lain saling bebas.

2. Peubah penjelas Xj , dapat berupa peubah kualitatif maupun kuan-

titatif bersifat tetap,diukur tanpa sebaran.

3. Estimasi parameter regresi dapat dilakukan dengan metode kuadtar

terkecil dan metode likelihood maksimum, dan untuk regresi klasik,

keduanya identik.

4. sebelum melakukan analisis sebaiknya dilakukan eksplorasi data se-

cara grafis, terutama jika mengandung peubah kualitatif/faktor.

5. Untuk mengakomodasi peubah kualitatif, R memiliki beberapa al-

ternatif formula sesuai kondisi data (misalnya apakah regresi paralel

ataukah regresi terpisah).

6. R dapat menganalisis sebagian data dengan memanfaatkan parame-

ter subset sesuai kebutuhan.

7. Dalam mengeksplorasi model-model regresi, selain memeriksa sig-

nifikan tidaknya koefisien regresi,perlu diperhatikan nilai koefisien

Page 235: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

234 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

determinasinya.

Page 236: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

235 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.10. Bacaan Lebih Lanjut

Pembahasan mengenai Model Linier Normal dapat dilihat pada Bowerman

et al.[3] dan Neter et al. [31]. Aplikasi R untuk Regresi yang cukup intensif

dapat dilihat pada Faraway [12]. Pembaca dapat juga membaca buku teks

untuk S-Plus oleh Crawley [8] dan Venables & Ripley [47].

Page 237: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

236 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3.11. Latihan Soal- Soal

1. Tuliskan bentuk akhir (dalam bentuk vektor), persamaan iterasi Sko-

ring Fisher untuk mengestimasi parameter regresi pada model linier

sederhana dengan metode kuadrat terkecil

2. Tuliskan bentuk akhir (dalam bentuk vektor), persamaan iterasi Sko-

ring Fisher untuk mengestimasi parameter regresi pada model linier

sederhana dengan metode likelihood maksimum

3. Jelaskan distribusi penduga likelihood, baik untuk sampel besar ma-

upun untuk sampel kecil.

4. Eksplorasi beberapa data pada R, lakukan beberapa alternatif ana-

lisis regresi, selanjutnya tentukan model terbaik menurut anda. de-

ngan

5. Diketahui keluaran hasil analsis regresi dengan dua peubah kuanti-

tatifX,Y dan satu peubah faktor g = (L,P ) sebagai berikut. Selidiki

apakah masih mungkin dilakukan perbaikan model dan model mana

yang dianjurkan? Jelaskan jawaban anda.

Coefficients:Estimate Std. Error t value Pr(>|t|)

Page 238: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

237 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

(Intercept) 13.14713 2.14083 6.141 8.95e-08 ***

x1 3.03882 0.04181 72.686 < 2e-16 ***

g[T.P] -1.85228 3.00107 -0.617 0.540

x1:g[T.P] -0.05652 0.05824 -0.971 0.336

---

Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''1

Residual standard error: 1.986 on 56 degrees of freedom

Multiple R-squared: 0.9948,Adjusted R-squared: 0.9945

F-statistic: 3575 on 3 and 56 DF, p-value: < 2.2e-16

6. Diketahui keluaran hasil analsis regresi dengan dua peubah kuanti-

tatifX,Y dan satu peubah faktor g = (L,P ) sebagai berikut. Selidiki

apakah masih mungkin dilakukan perbaikan model dan model mana

yang dianjurkan? Jelaskan jawaban anda.

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 52.84661 2.33328 22.649 <2e-16 ***

x 2.94982 0.04557 64.737 <2e-16 ***

g[T.P] -67.23481 3.27086 -20.556 <2e-16 ***x:g[T.P] 0.03452 0.06347 0.544 0.589

Page 239: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

238 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

---

Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.'0.1 ''1

Residual standard error: 2.165 on 56 degrees of freedom

Multiple R-squared: 0.9974,Adjusted R-squared: 0.9973

F-statistic: 7233 on 3 and 56 DF, p-value: < 2.2e-16

Page 240: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

239 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

BAB 4

DIAGNOSTIK DAN TRANSFORMASI

Dalam analisis regresi, sebagaimana telah dibahas padaawal buku ini, se-

lain perlu mengestimasi dan menguji koefisien regresi, perlu juga dilakukan

uji kecocokan model serta prosedur untuk memilih model yang lebih baik.

Dalam bab ini akan dibahas beberapa hal dan prosedur terkait dengan

pemeriksaan dan pemilihan model.

Page 241: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

240 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Kompetensi

Diharapkan agar pembaca memahami teknik dan prosedur untuk memeriksa

kecocokan model serta dapat melakukan penanganan jika model yang telah

dipilih kurang sesuai sehingga menghasilkanmodel yang lebih baik.

Page 242: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

241 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Materi

1. Asumsi analisis regresi klasik

2. Memeriksa sebaran data melalui grafik

3. Memeriksa hubungan peubah melalui grafik

4. Beberapa uji terkait asumsi

5. Memeriksa model melalui AIC

6. Transformasi data

Page 243: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

242 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4.1. Asumsi Analisis Regresi Klasik

Sebagaimana telah disebutkan pada bab sebelumnya bahwa bentuk model

linear dapat dituliskan dengan dengan Y = f(X,β) + ε. Ada beberapa

asumsi mendasar dari model linier ini diantaranya:

(i) fungsi f adalah fungsi linier;

(ii) nilai-tengah dari kesalahan εi yaitu E(εi) adalah 0

(iii) ragam kesalahan adalah konstan, yaitu σ2 dan

(iv) distribusi kesalahan adalah normal.

Pemeriksaan terhadap asumsi di atas dapat dilakukan baik melalui uji sta-

tistika maupun secara intuitif menggunakan grafik. Dalam buku ini hanya

dibahas pemeriksaan asumsi secara intuitif menggunakan grafik/ diagram.

Pada prinsipnya kegiatan ini hampir sama dengan eksplorasi data. Be-

danya adalah eksplorasi data dilakukan sebeum melakukan analisis, sedang-

kan diagnostik dilakukan setelah melakukan analisis. Dengan demikian,

jika sebelum melakukan analisis telah dilakukan eksplorasi data pekerjaan

mendiagnostik model menjadi lebih sederhana. Berikut adalah beberapa

tampilan grafik yang dapat dimanfaatkan untuk memeriksa asumsi yang

diperlukan dan memperoleh gambaran kasar secera intuitif.

Page 244: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

243 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4.2. Memeriksa Sebaran Data melalui Grafik

Untuk memeriksa distribusi data, secara grafis dapat dilakukan dengan

membuat beberapa grafik dianrananya: grafik QQNorm, grafik densitas

dan Grafik Boxplot. QQNorm pada dasarnya adalah grafik yang menya-

jikan sebaran quantil normal teoritis, dengan quantil data. Apabila datanya

berdistribusi normal maka sebarannya akan mendekati garis lurus. Peny-

impangan yang sangat mencolok pada ujung-ujung grafik menunjukkan

datanya menyimpang dari distribusi normal. Pada Gambar 4.1 diberikan

grafik QQNorm dari data yang berdistribusi normal dan yang tidak berdis-

tribusi normal. Pada grafik untuk data ke dua, selain terlihat menyimpang

dari garis lurus di bagian ujung atas, yang berarti datanya cenderung tidak

simetris ke kanan. Penafsiran yang lebih rinci dari bentuk-bentuk grafik

QQ-Norm dapat dilihat pada Tirta [43].

Simetris tidaknya sebaran data juga dapat dilihat melalui plot densi-

tas. Gambar 4.2 menunjukkan grafik sebaran peluang dari masing-masing

data yang sebelumnya digambar dengan QQNorm. Dari grafik ini juga

terlihat data ke dua cenderung lebih tidak simetris.

Grafik Boxplot dapat digunakan untuk memperoleh gambaran se-

baran data terutama kesimetrisannya.Selain itu dengan boxlot dapat juga

dilacak adanya pencilan (outlier). Deskripsi komponen grafik boxplot

Page 245: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

244 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Gambar 4.1: Grafik Quantile dari Data Berdistribusi Normal

(kiri) dan Data Cenderung Tidak Berdistribusi Normal

(Kanan)

Page 246: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

245 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Gambar 4.2: Grafik Sebaran Peluang dari Data Berdistribusi Normal

(lebih simetris, warna biru) dan Data Tidak Berdistribusi

Normal (tidak siumetris, warna merah)

Page 247: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

246 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dapat dilihat pada Faraway [12]dan Tirta [43]. Jika data mengandung

peubah kualitatif/ kelompok, boxplot dapat juga dibuat perkelompok,

seperti pada Gambar 4.3.

Page 248: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

247 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

L P

5010

015

020

025

0

BOXPLOT Y

g

Y

Gambar 4.3: Boxplot respon dengan kelompok. Terindikasi salah satu

kelompok (P) mengandung pencilan

Page 249: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

248 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4.3. Pemeriksaan Hubungan Peubah melalui Gra-

fik

4.3.1. Diagram pencar data

Pemeriksaan terhadap asumsi kelineran dalam fungsi f dapat dilakukan

secara kasar dengan menggambar diagram percar dari data maupun

residu/ sisa. Dari pencaran data akan dapat diperoleh gambaran se-

cara kasar apakah hubungan antara X dan Y mengikuti hubungan

linear atau hubungan kuadratik atau yang lainnya.

Diagram pencar data, khususnya untuk satu peubah penjelas,

dengan berbagai jenis fungsi dan distribusi dapat dilihat pada berba-

gai gambar berikut:

1. Gambar 4.4 dan Gambar 4.5 adalah grafik dari data dengan hu-

bungan Y = f(X, β) = β0+β1X yang berupa fungsi linier. Dari

gambar-gamber tersebut terlihat bahwa pencaran data terletak

pada suatu garis lurus. Dekat tidaknya pencaran data dengan

suatu garis sangat bergantung pada besarnya ragam semakin be-

sar ragamnya semakin jauh datanya dari garis sehingga semakin

Page 250: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

249 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

tidak kelihatan kalau data tersebut membentuk suatu garis lu-

rus. Namun kedua grafk tersebut mempunyai perbedaan dari

kekonstanan ragam yang terkait dengan jenis distribusi datanya.

Gambar 4.4: Grafik Pencar Data dengan Hubungan Linear dan Ragam

Relatif Konstan

2. Gambar 4.6 adalah grafik dari data dengan hubungan Y =

Page 251: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

250 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Gambar 4.5: Grafik Pencar Data dengan hubungan Linear tetapi Ra-

gam Relatif tidak Konstan

Page 252: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

251 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

f(X, β) = β0 + β1X2. dari Gambar terlihat bahwa pecaran da-

datnya berbetuk parabola yang mengindikasikan bahwa hubun-

gannya adalah hubungan kuadratik.

Gambar 4.6: Grafik Pencar Data dengan hubungan lebih cenderung

nonlinear

3. Gambar 4.7 adalah grafik dari data dengan hubungan Y =

f(X, β) = β0e(β1X). Dari diagram pencar terlihat sebaran data

Page 253: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

252 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

mengikuti grafik eksponensial.

Gambar 4.7: Grafik Pencar Data dengan Hubungan Eksponensial

4.3.2. Diagram Pencar Sisa

Sisa atau residu adalah selisih antara nilai observasi (observed value)

dengan nilai yang diperoleh melalui pengepasan garis regresi (fitted

Page 254: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

253 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

value). Residu ini merupakan penduga dari kesalahan atau error.

Syarat kekonstanan ragam ditunjukkan oleh adanya sebaran merata

sehingga lebar sebaran dari kiri ke kanan relatif konstant (Gambar

4.8). Adanya ketidak konstanan ragam ditandai dengan lebar sebaran

yang tidak konstan dari kiri ke kanan (Gambar 4.9). Data yang mem-

punyai ragam konstan disebut bersifat homoskedastik sebaliknya

jika ragam tidak konstan disebut bersifat heteroskedastik.

4.3.3. Memeriksa Model Melalui Diagram

Pada dasarnya model statistika dikembangkan untuk mengakomodasi

jenis data dengan kondisi tertentu, misalnya adanya hubungan linier,

saling independen dan bersifat random. Cara yang paling sederhana

untuk memeriksa kondisi linieritas, dan kekonstanan koefisien variasi

adalah dengan menggunakan pendekatan intuitif melalui pemeriksaan

pencaran residu (sisa).

Dari sifat residu sebagai penduga dari kesalahan, maka dapat

disimpulkan bahwa secara geometris pencaran residu harus memenuhi

beberapa sifat yaitu:

Page 255: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

254 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

100 150 200 250 300

−5

05

Nilai Pengepasan

Sis

a

Gambar 4.8: Grafik Pencar Sisa Data yang memenuhi syarat ho-

moskedastisitas.

Page 256: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

255 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

100 150 200 250 300

−2

02

4

Nilai Pengepasan

Sis

a

Gambar 4.9: Grafik Pencar Sisa Data yang tidak memenuhi syarat ho-

moskedastisitas.

Page 257: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

256 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1. sebaran mengikuti pola garis lurus;

2. menyebar secara acak dan seimbang di sekitar 0;

3. lebar sebaran dari kiri ke kanan relatif konstan.

Sebaran data dapat diperiksa dengan menggunakan grafik QQNorm

dengan ciri-ciri:

1. sebaran titik mengikuti garis lurus,

2. penyimpangan kentara terhadap garis lurus menunjukkan data

menyimpang dari sebaran normal dan salah satunya ditunjukkan

adanya ketidak simetrisan sebaran.

Paket/library lm() secara automatis menyediakan 4 macam gra-

fik yang dapat dipergunakan untuk mendiagnostik model diantaranya:

1. grafik QQNorm untuk memeriksa sebaran data;

2. grafik sisa untuk melihat kelinieran dan juga kekonstannan ra-

gam;

Page 258: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

257 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3. grafik residual baku dan nilai ekspektasi;

4. grafik Jarak Cook (Cook’s Distance) untuk memeriksa adanya

pencilan (Outlier/pencilan). Lihat Faraway [12, Bab 7] untuk

pembahasan dan diagnostik berhubungan dengan pencilan.

Berikut adalah contoh keluaran grafik yang digabung menjadi satu

tampilan yang dapat dibuat dengan perintah plot(NamaObjek).

Page 259: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

258 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Gambar 4.10: Grafik Diagnostik dari Objek yang Dihasilkan oleh

Fungsi lm(). Grafik menunjukkan data relatif

memenuhi asumsi Model Linier Normal

Page 260: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

259 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Gambar 4.11: Grafik Diagnostik dari Objek yang Dihasilkan oleh

Fungsi lm(). Grafik menunjukkan data tidak memenuhi

asumsi Model Linier Normal, yang ditandai dengan ada-

nya hubungan tidak linier dan pencilan

Page 261: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

260 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4.4. Uji Statistika Terkait Asumsi

Pemeriksaan melalui grafik cukup memberikan gambaran secara in-

tuitif apakah data yang dimiliki memenuhi asumsi atau tidak. Pe-

meriksaan yang lebih teliti (lebih eksak) dapat dilakukan melalui uji

statistika di antaranya adalah:

1. uji kenormalan shapiro-wilk;

2. uji homogenitas ragam Bartlett dan Levenge.

Dari Gambar 3.7 terlihat bahwa sebaran data tidak memiliki var-

iansi konstan, yang mengindikasikan tidak adanya homoskedastisitas

atau data tidak menyebar secara normal. Ternyata hasil uji statistika

(dengan Shapiro-Wilk)juga menunjukan bahwa data menyebar tidak

mengikuti sebaran normal, ditunjukkan oleh nilai p < 5%.

Shapiro-Wilk normality test

data: cars$dist

W = 0.9514, p-value = 0.0391

Page 262: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

261 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4.5. Memeriksa Model melalui AIC

Pemeriksaan dapat juga dilakukan dengan menggunakan kriteria in-

formasi Akaike (AIC, Akaike’s Information Criterion) yang menghi-

tung perimbangan antara besarnya likelihood dengan banyaknya vari-

abel dalam model. Besarnya AIC dihitung melalui rumus berikut

AIC = −2l(θ) + 2q, (4.1)

dengan l(θ) adalah nilai likelihood dari model yang dihadapi dan q

adalah banyaknya parameter dalam model. Secara umum, semakin ke-

cil nilai AIC model yang dipakai semakin cocok. Model yang dianggap

terbaik adalah model dengan nilai AIC minimum. Namun demikian,

dengan pertimbangan aspek lain, perbedaan AIC yang tidak terlalu

besar mungkin dapat diabaikan. Untuk pembahasan lebih mendalam

tentang AIC dapat dilihat pada Akaike [1], Chamber & Hastie [5] dan

Venables & Ripley [47] serta Hjorth [15].

Pada R, model terbaik menggunakan AIC diperoleh dengan mem-

berikan perintah step(objel.lm). Pada contoh berikut ditunjukkan

bahwa pada regresi

Y = β0 + β1X1 + β2X2 + β3X3 + β4X4

Page 263: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

262 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

diperoleh hanya satu koefisien yang signifikan. Kita dapat saja lang-

sung memilih model hanya menyertakan satu variabel penjelas ini.

Melalui perintah step() dapat diketahui kombinasi yang terbaik di-

antara tiga variabel tadi.

lm(formula = y ~ x1 + x2 + x3 + x4)

Coefficients:Estimate Std. Error t value Pr(>|t|)

(Intercept) 1.98333 9.91166 0.200 0.8434x1 1.97890 0.09044 21.881 1.93e-15 ***x2 0.02657 0.08598 0.309 0.7605x3 2.97230 0.07208 41.236 < 2e-16 ***x4 0.13376 0.07710 1.735 0.0981 .---Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.098 on 20 degrees of freedomMultiple R-Squared: 0.9919, Adjusted R-squared: 0.9903F-statistic: 613.9 on 4 and 20 DF, p-value: < 2.2e-16

Nilai AIC dari model lengkap ini dapat diperoleh dengan per-

intah AIC(model). Untuk model ini diperoleh AIC=114,42. Lang-

kah selanjutnya adalah menelusuri model terbaik atau yang lebih baik

Page 264: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

263 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

melalui perintah step(lm1).Start: AIC= 41.47y ~ x1 + x2 + x3 + x4

Df Sum of Sq RSS AIC- x2 1 0.4 88.5 39.6<none> 88.0 41.5- x4 1 13.2 101.3 43.0- x1 1 2107.4 2195.5 119.9- x3 1 7484.7 7572.7 150.8

Step: AIC= 39.59y ~ x1 + x3 + x4

Df Sum of Sq RSS AIC<none> 88.5 39.6- x4 1 13.2 101.6 41.1- x1 1 2205.1 2293.5 119.0- x3 1 7494.7 7583.2 148.9

Call:lm(formula = y ~ x1 + x3 + x4)

Model yang disarankan adalah

Y = β0 + β1X1 + β3X3 + β4X4

Page 265: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

264 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

yang dianggap sudah cukup baik dengan nilai AIC = 39,59.

Selain menyediakan fasilitas pemeriksaan AIC, R melalui menu

RCommander juga menyediakan beberapa uji untuk mendiagnostik

model diantaranya: diantaranya FIV (Faktor Inflansi Variansi/Ragam)

untuk memeriksa adanya multi kolinieritas, Uji heteroskedastisitas

Brues Pagan, Uji autokorelasi Durbin-Watson, Uji Pencilan Berfer-

roni. Namun konsep yang mendasari masih diluar lingkup pemba-

hasan buku ini.

Page 266: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

265 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4.6. Transformasi Data

Untuk data yang distribusinya, atau distribusi residunya menunjukkan

adanya penyimpangan dari syarat yang harus dipenuhi bagi penggu-

naan regresi linier klasik, maka harus dilakukan remidi sehingga per-

syaratan tersebut menjadi relatif terpenuhi. Remidi yang dilakukan

biasanya adalah dengan mentransformasikan data dengan suatu fungsi

yang sesuai. Selanjutnya data hasil transformasi ini yang dianalisis

dengan regresi klasik.

Bentuk grafik dan transformasi yang mungkin dilakukan untuk

mengatasi ketidak linieran diantaranya adalah seperti berikut ini.

1. Kurva naik dengan terbuka ke atas maka transformasi dilakukan

pada Y dan tranformasi yang bisa dicoba adalah Y1 = log(Y )

atau Y1 =√Y atau Y1 = 1/Y seperti terlihat pada Gambar 4.12

2. Kurva naik dan terbuka kebawah maka transformasi dilakukan

pada X dan trandformasi yang bisa dicoba adalah X1 = log(X)

atau X1 =√X atau X1 = 1/X seperti terlihat pada Gambar

4.13

Page 267: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

266 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Gambar 4.12: Sebaran data asli (naik dan membuka ke atas) dan trans-

formasi yang bisa dilakukan. Beberapa transformasi meng-

hasilkan sebaran yang mengikuti garis lurus tetapi ragam

tidak konstan

Page 268: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

267 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3. Kurva menurun dan terbuka keatas maka transformasi dapat

dilakukan pada X atau Y dengan salah satu transformasi se-

belumnya.

Untuk menstabilkan ragam dapat dicoba beberapa transformasi

diantaranya Y1 = log(Y ), Y1√Y atau Y1 = 1/Y . Pada Gambar 4.14

terlihat bahwa transformasi tidak selalu dapat menstabilkan ragam.

Page 269: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

268 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Gambar 4.13: Sebaran data asli (naik dan terbuka ke bawah) dan trans-

formasi yang bisa dilakukan. Beberapa transformasi meng-

hasilkan sebaran yang mengikuti garis lurus tetapi ragam

tidak konstan

Page 270: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

269 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Gambar 4.14: Sebaran data asli (dengan ragam tidak stabil) dan trans-

formasi yang bisa dilakukan. Beberapa transformasi hanya

menghasilkan ragam yang sedikit lebih stabil

Page 271: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

270 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4.7. Ringkasan

1. Sebelum dan sesudah melakukan analisis regresi sangat perlu di-

adakan pemeriksaan terkait sebaran data dan sisa untuk mem-

peroleh gambaran terpenuhi tidaknya asumsi yang diperlukan;

pemeriksaan sebaran sisa sering disebut sebagai langkah mendi-

agnostik model;

2. diagnostik model dapat dilakukan secara intuitif melalui grafik

(misalnya untuk melihat sebaran dapat digunakan Normal-Plot,

Boxplot, atau plot densitas);

3. pemeriksaan sebaran dapat juga dilakukanj melalui uji statistika

(uji normalitas, atau uji homogenitas);

4. untuk data yang mengandung peubah kualitatif/faktor selain

grafik secara keseluruhan, perlu juga diperiksa grafik perkelom-

pok;

5. jika tidak terpenuhi asumsi yang diperlukan, dapat dicoba trans-

formasi yang sesuai sehingga asumsi yang diperlukan terpenuhi;

Page 272: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

271 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6. pemilihan modeldapat dilakukan dengan melihat nilai AIC atau

nilai koefisien determinasi. Makin kecil nilai AICnya, model

makin baik, sementara itu semakin besar nilai koefisien deter-

minasinya, model semakin baik.

Page 273: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

272 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4.8. Bacaan Lebih Lanjut

Pembahasan mengenai Analisis Sisa pada Model Linier Normal dapat

dilihat pada Bowerman et al. [3] dan Neter et al. [31]. Referensi

terkait R dapat dilihat pada Crawley [8] dan Kuhnert & Venables

[18]. Khusus eksplorasi grafik dari R dapat dilihat pada Maindonald

[23], Vezalini [48], Zoonekyn [55], dan Murrel [29].

Page 274: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

273 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

4.9. Latihan Soal-soal

1. Jelaskan penggunaan (qqplot() dan plot(density())) untuk

memeriksa distribusi data

2. Jelaskan ciri-ciri ideal sebaran sisa/residu yang memenuhi asumsi

model linier normal

3. sebutkan uji statistika yang dapatdigunakan untuk menguji nor-

malitas data.

4. Sebutkan transformasi yang dapat dilakukan berdasarkan ciri-

ciri sebarab sisa maupun data

5. Sebutkan kriteria pemilihan model dengan menggunakan AIC

6. Suatu data mengandung peubah kualitatif/faktor dengan dua

kategori. Dari pemeriksaan grafik respon secara keseluruhan

diperoleh gambaran bahwa data memiliki dua puncak (bimodal).

Apakah ini berarti data tidak memenuhi sebaran normal, lang-

kah apa yang perlu dilakukan?

Page 275: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

274 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Page 276: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

275 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

BAB 5

MODEL LINIER TERGENERALISIR

Model Linier telah digunakan selama bertahun-tahun dalam analisis

statistika, khususnya untuk menganalisis data kontinu (data dengan

distribusi kontinu). Tehnik ini berdasarkan pada asuumsi pada dis-

tribusi normal pada komponen acaknya dan adanya hubungan linier

antara nilai-tengah dengan komponen sistematik (peubah eksplana-

Page 277: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

276 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

torinya). Model linier ini selanjutnya mengalami perkembangan de-

ngan memberikan asumsi yang lebih longgar baik pada distribusinya

maupun pada hubungan antara nilai-tengah dengan komponen sis-

timetiknya. Distribusi data tidak lagi terbatas pada distribusi nor-

mal tetapi merupakan anggota dari distribusi Keluarga Eksponensial.

Pada bab ini akan dibicarakan distribusi keluarga eksponensial dengan

sifat-sifatnya serta beberapa distribusi penting, baik distribusi diskrit

maupun distribusi kontinu, yang termasuk dalam kelompok keluarga

eksponensial. Selanjutnya akan dibahas perluasan model (regresi) li-

nier berdasarkan distribusi keluarga eksponensial, yang dikenal de-

ngan sebutan Generalized Linear Model (GLM).

Page 278: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

277 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.1. Distribusi Keluarga Eksponensial

5.1.1. Bentuk umum

Kita mulai dengan definisi formal dari distribusi keluarga eksponen-

sial. Ada beberapa variasi mendefinisikan distribusi keluarga ekspoen-

sial dan dalam buku ini dipilih yag paling sederhana.

Definisi 5.1. Suatu peubah acak Y dengan fungsi kepadatan proba-

bilitas (f.k.p.) f dan parameter θ dikatakan menjadi anggota distribusi

keluarga eksponensial, jika f dapat dinyatakan sebagai:

f(y; θ) = exp[a(y)b(θ) + c(θ) + d(y)]. (5.1)

Pada (5.1) s(y) = exp(d(y)); t(θ) = exp(c(θ)). Dalam beberapa

kasus fungsi a, b, c dan d mungkin mengandung parameter lain yang

disebut parameter nuisan/ gangguan Dobson [11, pages 22-23] yang

pada tidak menjadi perhatian utama dan sering dianggap sebagai pa-

rameter yang telah diketahui (tidak perlu diestimasi). 1

1McCullagh dan Nelder dalam [24] mendefinisikan distribusi keluarga ekspo-

nensial dengan parameter gangguan yang eksplisit, φ.

Page 279: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

278 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dalam keadaan khusus a(y) = y, maka(5.1) menjadi:

f(y) = exp[yb(θ) + c(θ) + d(y)] (5.2)

dan (5.2) disebut bentuk kanonik dari distribusi keluarga eksponensial

dan b(θ) disebut parameter natural dari distribusinya.

5.1.2. Nilai-tengah dan Ragam dari a(Y )

Fungsi Skor [U] E[U ] danVar[U ]

Dobson [11, halaman 23-24] mendefinisikan fungsi skor dari f(y) ter-

hadap θ sebagai U = dl(y)/dθ, dengan l(y) = log f(y) = ln f(y).

Perhitungan E[U ] dan Var[U ] dibutuhkan untuk menurunkan nilai-

tengah dan ragam Y atau dalam bentuk yang lebih umum, E[a(Y )]

dan Var[a(Y )].

U =d l(y)

d θ, (5.3)

=1

f(y)

d f(y)

d θ. (5.4)

Page 280: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

279 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dengan demikian

E[U ] =

∫1

f(y)

d f(y)

d θf(y) dy,

=

∫d f(y)

d θdy,

=d

d θ

∫f(y) dy,

=d 1

d θ,

= 0. (5.5)

Persamaan (5.3) dan (5.4) juga menghasilkan:

d f(y)

d θ= f(y)

d l(y)

d θ. (5.6)

Page 281: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

280 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Selanjutnya kita perlu menunjukkan bahwa E[U ′] + E[U2] = 0.

E[U ′] = E

(dU

d θ

),

=d

d θE[U ], (5.7)

=d 0

d θ,

= 0. (5.8)

Tetapi dari (5.6), ruas kanan dari (5.7) menjadi dd θ

∫ d l(y)d θ

f(y) dy.

Jadi, bersama dengan (5.6), menghasilkan:

0 =d

d θ

∫d l(y)

d θf(y) dy,

=

∫d2l(y)

d θ2f(y) dy +

∫d l(y)

d θ

d f(y)

d θdy,

=

∫d2l(y)

d θ2f(y) dy +

∫ (d l(y)

d θ

)2

f(y) dy,

=

∫U ′ f(y) dy +

∫U2 f(y) dy

= E[U ′] + E[U2].

Page 282: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

281 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Jadi,

E[−U ′] = E[U2],

dan

Var[U ] = E[−U ′]. (5.9)

Untuk persamaan(5.1), U dan U ′ terhadap θ adalah:

U =d

d θ[a(y)b(θ) + c(θ) + d(y)],

= a(y)b′(θ) + c′(θ), (5.10)

dan

U ′ = a(y)b′′(θ) + c′′(θ). (5.11)

Nilai-tengah dan ragam distribusi keluarga eksponensial diberi-

kan dalam hasil berikut ini.

Hasil 5.1. Nilai-tengah dan ragam a(Y ) yang didefinisikan seperti

pada Definisi 5.1 mempunyai nilai-tengah dan ragam, masing-masing

E[a(Y )] = −c′(θ)

b′(θ). (5.12)

Page 283: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

282 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Var[a(Y )] =b′′(θ)c′(θ)− c′′(θ)b′(θ)

[b′(θ)]3. (5.13)

Nilai-tengah dan ragam dari a(Y ) diturunkan seperti berikut

ini. Dari persamaan (5.5) dan persamaan (5.10), diperoleh bahwa

E[a(Y ))b′(θ) + c′(θ)] = 0, karenanya

E[a(Y )] = −c′(θ)

b′(θ).

Dari persamaan (5.9) dan persamaan (5.11), dan menerapkan per-

samaan (5.12), diperoleh bahwa

Var[U ] = E[−U ′],= E [−a(Y )b′′(θ)− c′′(θ)] ,= −E[a(Y )]b′′(θ)− c′′(θ),

= −c′(θ)

b′(θ)b′′(θ)− c′′(θ). (5.14)

Tetapi dengan persamaan (5.10),

Var[U ] = [b′(θ)]2Var[a(Y )]. (5.15)

Page 284: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

283 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Akibatnya, persamaan (5.14) dan persamaan (5.15) menghasilkan

Var[a(Y )] =b′′(θ)c′(θ)− c′′(θ)b′(θ)

[b′(θ)]3.

5.1.3. Beberapa Bentuk Khusus

Berikut ini adalah beberapa distribusi yang menjadi anggota keluarga

eksponensial.

Page 285: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

284 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Distribusi Binomial dengan Parameter n, p

Distribusi Binomial juga termasuk anggota keluarga eksponensial. Dis-

tribusi Binomial dengan parameter n, p mempunyai fungsi kepadatan

f(y) =

(n

y

)py(1− p)n−y; y = 0, 1, 2, . . . , n

= exp

[y log p+ (n− y) log(1− p) + log

(n

y

)]= exp

[y log

(p

1− p

)+ n log(1− p) + log

(n

y

)]= exp

[ylogit p+ n log(1− p) + log

(n

y

)]Dengan

logit p = log

(p

1− p

)Jadi b(θ) = logit p; c(θ) = n log(1 − p). Dengan mencari turunan

pertama dan kedua masing-masing b(θ) dan c(θ) diperoleh

E(Y ) = np dan V ar(Y ) = np(1− p)

Page 286: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

285 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dalam prakteknya distribusi Binomial (n, p) sering dimodifikasi men-

jadi distribusi Binomial (1, µ) dengan mentransformasi x = y/n; x =

0, . . . , 1 sehingga mempunyai nilai-tengah µX = µ dan ragam Var(X) =

σ2X = µ(1− µ).

Distribusi Poisson dengan Parameter θ.

Peubah acak Y yang berdistribusi Poisson mempunyai fungsi kepa-

datan probabilitas

f(y) =θye−θ

y!, y = 0, 1, 2, 3, · · ·

= exp[y log θ − θ − log y!]. (5.16)

Pada persamaan (5.16) b(θ) = log θ, c(θ) = −θ, d(y) = − log y. De-

ngan demikian E[Y ] = θ dan Var[Y ] = θ.

Page 287: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

286 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Distribusi Normal dengan Parameter θ dan σ

Bentuk fungsi kepadatan probabilitas dari peubah acak Y yang berdis-

tribusi Normal adalah

f(y) =1√2πσ

exp

(−1

2

(y − θσ

)2), −∞ < y <∞,

= exp

(− y2

2σ2+yθ

σ2− θ2

2σ2− 1

2log(2πσ2)

). (5.17)

Pada persamaan (5.17) b(θ) = θ/σ2, d(y) = y2/(2σ2) dan c(θ) =

−θ2/(2σ2) − 12

log(2πσ2). Di sini σ adalah parameter nuisan. Jadi,

E[Y ] = θ dan Var[Y ] = σ2.

Distribusi Gamma dengan parameters θ dan skala φ.

Peubah acak Y yang berdistribusi Gamma mempunyai fungsi kepa-

datan probabilitas

f(y) =θ(yθ)φ−1e−yθ

Γ(φ), y > 0,

= exp[−yθ + (φ− 1) log y + φ log θ − log Γ(φ)]. (5.18)

Page 288: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

287 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Padapersamaan (5.18) b(θ) = −θ, a(y) = y, c(θ) = φ log θ−log Γ(φ), d(y) =

(φ− 1) log y. Maka, E[Y ] = φ/θ, Var[Y ] = φ/θ2. Di sini φ adalah pa-

rameter nuisan.

Distribusi lainnya

Beberapa distribusi lainnya yang termasuk keluarga eksponensial ada-

lah:

Distribusi Pareto

Distribusi Eksponensial

Distribusi Binomial Negatif

Distribusi Invers Gauss [24, page 22] dan [11, page 34]

Rangkuman beberapa distribusi khusus diberikan pada Tabel

5.1. Karakteristik lain masing-masing distribusi anggota keluarga eks-

ponensial yang penting dapat diragkum pada Tabel 5.2.

Sebagai ilustrasi pada Gambar 5.1 ditunjukkan densitas data de-

ngan distribusi Normal Standar dan Gamma Standar dengan berba-

gai nilai-tengah/mean. Gambar menunjukkan bahwa untuk distribusi

Page 289: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

288 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Tabel 5.1: Rangkuman Distribusi Anggota Keluarga Eksponensial

Binomial Normal Poisson Gamma

Notasi Bin(1, µ) N(µ, σ2) P (µ) G(µ, ν)

φ 1 σ2 1 ν−1

b(θ) logit µ θ2/2 exp(θ) − log(−θ)µ(θ) = E(Y ; θ) θ exp(θ) −1/θ

link kanonik logit identitas log resiprokal

θ = η = logit µ θ = η = µ θ = η = logµ θ = η = 1/µ

Gamma seiring dengan kenaikan nilai-tengah, ragam ikut meningkat,

sedangkan untuk distribusi normal, ragamnya konstan. Pada Gambar

5.2 ditunjukkan sebaran data dengan hubungan antara X dan Y yang

sama tetapi yang satu berdistribusi Normal yang satu berdistribusi

Gamma. Terlihat untuk sebaran data Gamma, selain sebarannya lebih

lebar dari sebaran normal, semakin ke kanan semakin lebar sebaran

data.

Page 290: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

289 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Gambar 5.1: Plot Densitas dari sampel dengan berbagai nilai-tengah

dengan ukuran sampel 100

Page 291: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

290 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Gambar 5.2: Sebaran Data dengan ukuran sampel 100 dengan dis-

tribusi Normal (b) dan Gamma (r)

Page 292: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

291 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Tabel 5.2: Ciri-ciri khas Distribusi Keluarga EksponensialNo Nama Jenis Ruang

Rentang

Hubungan

Ragam

dan Nilai-

tengah

lain-

lain

1 Binomial diskrit 0, 1, 2, · · · , n linier simetrik

2 Poisson diskrit 0, 1, 2, · · · linier tidak

simetrk

3 Gamma kontinue 0 < x <∞ kuadratik tidak

simetrik

4 Normal kontinue −∞ < x <∞ bebas simetrik

Page 293: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

292 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.2. Konsep Dasar Model Linier Tergeneralisir

5.2.1. Sisi lain Model Linier Normal

Selama bertahun- tahun, model linier berikut telah digunakan secara

luas dalam analisis statistika terutama untuk data kontinu:

Y = Xβ + e (5.19)

dengan Y = (Y1, · · · , Yi, · · · , Yn)T , e = (e1, · · · , en)T , X = suatu

N×p matriks peubah eksplanatori atau sering disebut matriks desain

dan β = (β1, · · · , βp)T . Lihat Dobson [11, subbab 3.1] dan McCullagh

& Nelder [24, hal. 7].

Asumsi yang mendasari model ini adalah: ei ∼ NID(0,σ2), dan

karenanya Y ∼ N(E[Xβ], Iσ2). Asumsi-asumsi ini dapat diuraikan

secara lebih terinci seperti berikut ini.

(i) Yi berdistribusi normal dan saling bebas dengan ragam kon-

stan, yaitu Yi ∼ NID ( xiTβ, σ2), dengan xi

T adalah peubah

eksplanatori untuk Yi dan sama dengan baris ke-i dari matriks

X.

Page 294: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

293 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

(ii) Ada suatu fungsi (misalkan η) dari peubah eksplanatori yang

disebut prediktor linier dari peubah respon Y . Pada kasus di

atas fungsi ini adalah ηi = xTi β.

(iii) Ada hubungan antara prediktor (ηi) dan komponen acak (µi).

Dalam kasus di atas ηi = µi (yaitu hubungan identitas).

Model linier persamaan (5.19) dengan asumsi di atas sering disebut

Model Linier Klasik. Model ini telah dibahas pada bab sebelumnya.

5.2.2. Generalisasi Model Linier Klasik ke Model Linier Ter-

generalisir

Dalam Model Linier Tergeneralisir (MLT) atau Generalized Lin-

ear Models (GLM), asumsi model lebih longgar dan digeneralisasikan

dengan cara berikut:

(i) Asumsi (i) diperluas untuk memungkinkan Yi mempunyai dis-

tribusi yang sama dan saling bebas dari distribusi keluarga

eksponensial.

Page 295: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

294 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

(ii) Pada asumsi (iii) hubungan antara komponen prediktor (η) dan

komponen acak (µ) tidak mesti identitas, tetapi diperluas untuk

suatu fungsi monoton dan diferensiabel, g, yaitu ηi = g(µi).

Fungsi g disebut fungsi link. atau link function.

Jadi dalam model linier tergeneralisir ada tiga komponen yang penting

yaitu:

1. komponen distribusi, yaitu y berdistribusi keluarga eksponen-

sial;

2. komponen prediktor linier, yaitu η = xTβ;

3. fungsi link yaitu fungsi monoton dan diferensiabel g sehingga

g(µ) = η. Adanya fungsi link memungkinkan prediktor linier

memiliki daerah rentang seluruh bilangan riil (−∞ < x < ∞)

tetapi respon y memiliki rentang tertentu (misalnya 0 < y < 1

untuk binomial; dan bilangan cacah untuk respon hasil pencac-

ahan (count data).

Diantara fungsi- fungsi link yang dapat digunakan, ada yang

disebut fungsi link kanonik yaitu fungsi hubungan yang terjadi pada

Page 296: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

295 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

saat b(θ) = η =∑p

j=0 βjxj. Untuk distribusi binomial, misalnya

fungsi yang bisa dipakai adalah:

(i) fungsi logit, yang nerupakan fungsi link kanonik yaitu

η = log

1− µ

);

(ii) fungsi probit, yaitu

η = Φ−1(µ);

dimana Φ adalah fungsi kumulatif dari distribusi Normal, yaitu

Φ(x) =

∫ x

−∞

1√2π

exp

[−1

2z2]dz;

dan

(iii) komplementari ln-ln, yaitu

η = log[− log(1− µ)].

Page 297: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

296 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

−6 −4 −2 0 2 4 6

0.0

0.2

0.4

0.6

0.8

1.0

Logit/Probit

prediktor

Pelua

ng

Gambar 5.3: Respon dengan Fungsi Hubungan Logit (kurva langsung)

dan Probit (kurva putus-putus).

Page 298: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

297 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Grafik respon mengunakan fungsi hubungan probit dan logit dapat

dilihat pada Gambar 5.3. Dalam prakteknya fungsi hubungan logit

lebih banyak dipilih dibanding dengan fungsi probit maupun komple-

menter. Penelusuran penurunan rumus fungsi logit jauh lebih mudah

dibanding fungsi probit.

Untuk distribusi Normal dan Poisson masing- masing mempun-

yai link kanonik identitas dan log. Rangkuman distribusi keluarga

eksponensial termasuk fungsi link kanonik untuk tiap-tiap distribusi

dapat dilihat pada Tabel 5.1 pada buku ini (Lihat juga McCullagh &

Nelder [24, hal. 23]). Rangkuman distribusi dan fungsi link kanonik

dan link lain yang dapat dipergunakan, pada program R akan dibahas

pada seksi 5.7 pada halaman 326.

Page 299: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

298 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.3. Estimasi pada Model Linier Tergeneralisir

Ada dua metode yang biasa digunakan untuk mengestimasi parameter

pada model linier. Metode tersebut adalah dan metode kuadrat

terkecil dan metode likelihood maksimum.

1. Metode kuadrat terkecil dalam mengestimasi parameter berkai-

tan dengan mencari nilai yang sedekat mungkin dengan nilai

harapannya[2, section 4.9]. Hal ini biasanya dilakukan dengan

meminimalkan jumlah kuadrat kesalahan (galat). Metode ini

sering disebut metode kuadrat terkecil. Sebagai contoh, mi-

salkan mencari penduga dari parameter β dari model persamaan

(5.19), dari Model Linier Normal. Langkah-langkah yang bisa

ditempuh, secara umum adalah

(a) Mula-mula model persamaan (5.19) disusun seperti

e = y −Xβ.

(b) Bentuk kuadrat dari kuadrat kesalahan didefinisikan seba-

Page 300: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

299 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

gai

Q =n∑i=1

e2i = eTe = (y −Xβ)T(y −Xβ).

Dalam bentuk ini informasi tentang distribusi ei sama sekali

belum diperhitungkan dalam perhitungan estimasi param-

eter.

(c) BiasanyaQ dibobot dengan invers dari matriks ragam - kor-

agam (misalkan V ). Penduga kuadrat terkecil terbobot

b dari β selanjutnya diperoleh dengan meminimalkan

Qw = (y −Xβ)TV−1(y −Xβ)

terhadap parameter β, yaitu, menyelesaikan persamaan (un-

tuk model linier klasik)

∂Qw

∂β= −2XTV−1(y −Xβ) = O, (5.20)

atau ekuivalen dengan menyelesaikan Persamaan Nor-

mal

XTV−1Xb = XTV−1y.

(Lihat juga [32, subbab 12.8]).

Page 301: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

300 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dengan metode kuadrat terkecil terbobot, maka sebagian infor-

masi tentang distribusi ei, yaitu ragamnya, telah diperhitungkan

dalam menghitung penduga parameter.

2. Metode likelihood maksimum likelihood digunakan khususnya

jika distribusi peubah acaknya diasumsian diketahui [6, Subbab

9.2]. Penduga likelihood maksimum (p.l.m.) dari suatu param-

eter θ biasanya dinotasikan dengan θ dan didefinisikan sebagai

nilai dari ruang rentang parameter (misalnya Ω) yang memaksi-

mumkan fungsi likelihood L(y, θ), yaitu:

θ ∈ Ω adalah p.l.m jika dan hanya jika L(θ) ≥ L(θ), ∀ θ ∈ Ω.

Penghitungan θ dapat dilakukan dalam beberapa langkah ber-

ikut:

(i) Langkah pertama adalah menentukan fungsi dari data y.

Ini merupakan fungsi kepadatan bersama dari y, hanya saja

dalam hal ini yang menjadi peubah yang tidak diketahui

adalah parameter θ, sedangkan y adalah data yang dike-

Page 302: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

301 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

tahui. Jika datanya saling bebas maka

L(y, θ) =N∏i=1

f(yi, θ)

(ii) Langkah berikutnya adalah mencari maksimum dari l(y, θ) =

logL(y, θ) terhadap θ. Ini merupakan maksimum lokal dari

fungsi l terhadap θ. Maka θ adalah:

a. nilai θ sedemikian sehinga dl/dθ = 0 dan d2l/dθ2 < 0;

atau

b. Nilai batas dari ruang parameter jika Ω terbatas.

Persamaan dl/dθ = 0, umumnya tidak dapat diselesaikan secara

aljabar ata analitik, oleh karenanya metode iterasi, seperti metode

Newton-Raphson, sering diaplikasikan.

5.3.1. Metode Penduga Kuadrat Terkecil

Sebagaimana pada model linier klasik, metode kuadrat terkecil men-

cari penduga yang menyebban terjadinya kesalahan minimum. Untuk

Page 303: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

302 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

itu persamaan (5.19) perlu diubah sehingga bentuk e menjadi eksplisit

selanjutnya diturunkan minimum dari eT e, seperti pada persamaan

(5.20). Tambahan komplikasi terjadi karena dalam MLT hubungan

antara prediktor linier dan komponen acak tidak mesti beupa identi-

tas, tetapi melalui suatu fungsi yang disebut fungsi link, g(). Dengan

demikian

∂Qw

∂β=

(∂µ

∂η

)T∂Qw

∂µ

= −2

(∂µ

∂η

)TXTV−1(y − µ),

= 0,

dimana

(∂ µ

∂η

)adalah matrik diagonal berordo N dengan unsur di-

agonal ke-i adalah

(∂µi∂ηi

)yang nilainya bergantung pada fungsi link

yang digunakan. Untuk mengaplikasikan metode iterasi Newton-Raphson,

Page 304: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

303 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

diperluka bentuk turuann kedua yang dapat dinyatakan dengan

∂2Qw

∂βT∂β=

(∂µ

∂η

)∂Qw

∂µ

= 2

(∂µ

∂η

)TXTV−1X

(∂µ

∂η

).

Dengan demikian bentuk lengkap iterasi Newton Raphson dengan

Metode Kuadrat Terkecil Terbobot Weighted Least Square adalah

b1 = b0 +

[(∂µ

∂η

)TXTV−1X

(∂µ

∂η

)]−1 [(∂µ

∂η

)TXTV−1(y − µ)

],

(5.21)

dengan g(µ) = Xβ.

5.3.2. Metode Penduga Likelihood Maksimum

Penduga likelihood maksimum untuk model linier tergeneralisir dapat

diturunkan sebagai berikut (lihat [11, Lampiran 1]):

l(y) =n∑i=1

yib(θi) +n∑i=1

c(θi) +n∑i=1

c(θi) +n∑i=1

d(yi), (5.22)

Page 305: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

304 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dengan

E[Yi] = µi = −c′(θi)

b′(θi)berdasarkan persamaan (5.12), (5.23)

and

g(µi) = xTi β =

p∑j=1

xijβj = ηi. (5.24)

Untuk memperoleh β, kita gunakan persamaan:

Uj =n∑i=1

∂li∂βj

,

dengan

li = yib(θi) + c(θi) + d(yi) (5.25)

dan∂li∂βj

=∂li∂θi

∂θi∂µi

∂µi∂βj

.

Page 306: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

305 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dari persamaan (5.25) kita peroleh

∂li∂θi

= yib′(θi) + c′(θi),

= b′(θi)

[yi +

c′(θi)

b′(θi)

]= b′(θi)(yi − µi) by persamaan (5.12). (5.26)

Dari persamaan (5.23), kita peroleh

∂µi∂θi

=

(c′′(θi)b

′(θi)− b′′(θi)c′(θi)[b′(θi)]2

),

= b′(θi)Var[Yi] berdasar persamaan (5.13).

Oleh karena itu,∂θi∂µi

=1

b′(θi) Var[Yi]. (5.27)

Sekarang∂µi∂βj

=∂µi∂ηi

∂ηi∂βj

,

dan dari persamaan (5.24) kita peroleh

∂ηi∂βj

= xij,

Page 307: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

306 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dan∂µi∂βj

= xij

(∂µi∂ηi

). (5.28)

Oleh karena itu

∂li∂βj

=b′(θi)(yi − µi)b′(θi) Var[Yi]

xij

(∂µi∂ηi

)berdasar (5.26),(5.27),(5.28),

=

((yi − µi)xij

Var(Yi)

)(∂µi∂ηi

), (5.29)

dan

Uj =n∑i=1

∂li∂βj

=n∑i=1

((yi − µi)xij

Var(Yi)

)(∂µi∂ηi

)(5.30)

for j = 1, 2, 3, · · · , p. Umumnya, metode iterasi seperti metode Newton-

Raphson , digunakan untuk menyelesaikan sistim persamaan U = O.

Pendekatan iterasi ke- m-th dari f(x) = 0 dengan Newton-Raphson

adalah:

x(m) = x(m−1) −(f(x(m−1))

f ′(x(m−1))

),

dengan x(m−1) adalah nilai pendekatan dari x setelah iterasi ke-(m−1).

Dengan cara yang sama untuk persamaan U = O, rumus iterasinya

Page 308: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

307 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

adalah:

b(m) = b(m−1) −[U′

(m−1)]−1

U(m−1) (5.31)

dengan U(m−1) adalah vektor U yang dinilai pada β = b(m−1) dan

U′(m−1)

=

(∂2l

∂βj∂βk

)(m−1)

(5.32)

adalah matriks turunan kedua dari fungsi likelihood l yang dinilai

pada β = b(m−1). Pada prakteknya digunakan metode alternatif dise-

but metode skoring. Dalam metode skoring ini matriks persamaan

(5.32) diganti dengan suatu matriks nilai harapan

E

(∂2l

∂βj ∂βk

).

Matriks di atas sama dengan negatif dari mariks ragam - koragam atau

matriks informasidari Uj’s, I = E[UUT ] dengan unsur ke − (j, k)

adalah

Ijk = E

(∂l

∂βj

∂l

∂βk

),

= −E(

∂2l

∂βj ∂βk

)(5.33)

Page 309: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

308 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

untuk j, k = 1, 2, 3, · · · , p (lihat [11, Lampiran A] dan [32, hal.341]).

Oleh karena itu persamaan (5.31) menjadi

b(m) = b(m−1) + [I(m−1)]−1U(m−1).

Dengan mengalikan (perkalian kiri) kedua ruas dengan I(m−1) akan

menghasilkan

I(m−1)b(m) = I(m−1)b(m−1) + U(m−1). (5.34)

Dari persamaan (5.30) dan persamaan (5.33) dan mengetahui bahwa

E[Yi− µi]2 = Var[Yi], dapat dilihat bahwa unsur (j, k) dari I adalah

Ijk =n∑i=1

xijxikVar[Yi]

(∂µi∂ηi

)2

. (5.35)

Persamaan persamaan (5.35) menunjukkan bahwa I dapat dinyatakan

sebagai

I = XTW,

dengan W adalah matriks diagonal N ×N dengan unsur-unsur:

wii =1

Var[Yi]

(∂µi∂ηi

)2

. (5.36)

Page 310: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

309 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dengan menggunakan “bobot” yang sama, matriks W, per-

samaan (5.30) dapat dinyatakan dalam bentuk matriks seperti

∂l

∂β= XTW

(∂η

∂µ

)(y − µ) (5.37)

dengan

(∂η

∂µ

)is suatu matriks diagonal N×N dengan unsur diagonal

ke-i adalah

(∂ηi∂µi

).

Oleh karena itu bentuk umum dari persamaan penduga dengan

menggunakan iterasi Newton Raphson adalah

b(m) = b(m−1) + XTWX−1

XTW

(∂η

∂µ

)(5.38a)

atau dalam bentuknya yang asli

b(m) =b(m−1) +

(XT

(∂µ

∂η

)(1

var(Y)

)(∂µ

∂η

)TX

)−1(

XT

(1

var(Y)

)(∂µ

∂η

)(Y − µ)

)(5.38b)

Page 311: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

310 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Dapat ditunjukkan bahwa persamaan (5.38) identik dengan (5.21)

sehingga dikatakan penduga maksimum likelihood untuk GLM identik

dengan metode kuadrat terkecil terbobot.

Ada bentuk lain yang juga biasa dipakai dalam merumuskan

bentuk iterasi Newton-Raphson untuk GLM yang dapat diturunkan

seperti berikut ini. Berdasar persamaan (5.30) dan persamaan (5.35)

dapat diunjukkan bahwa ruas kanan dari persamaan persamaan (5.34)

adalah suatu vektor dengan unsur-unsur berbentuk:

p∑k=1

n∑i=1

xijxikVar[Yi]

(∂µi∂ηi

)2

b(m−1)k +

n∑i=1

(yi − µi)xijVar[Yi]

(∂µi∂ηi

).

yang sama dengan

n∑i=1

p∑k=1

xijwiixikb(m−1)k +

n∑i=1

xijwii(yi − µi)(∂µi∂ηi

)−1.

Ini berarti bahwa id dapat dinyatakan sebagai XTWz dengan unsur-

unsur vektor z adalah berbentuk:

zi =

p∑k=1

xikb(m−1)k + (yi − µi)

(∂µi∂ηi

)−1,

Page 312: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

311 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dimana i = 1, 2, 3, · · · , N , dan, µi dan ∂µi/ ∂ηi dinilsi pada β = b(m−1).

Persamaan persamaan (5.34) menjadi

XTWXb(m)

= XTWz. (5.39)

Selanjutnya β diambil sama dengan b(m) untuk m yang terakhir. Per-

samaan (5.39) menunjukkan bahwa penduga likelihood maksimum

ekuivalen dengan penduga kuadrat terkecil terbobot [11, hal. 41].

Page 313: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

312 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.4. Inferensi pada Model Linier Tergeneralisir

Jika penduga θ konsisten, maka dia juga secara asimptotik tak

bias, yaitu

limN→∞

E[θ] = θ.

Hal- hal berikut merupakan konsekuensi.

(i) Untuk N besar, berdasar Teorema limit pusat:

θ − θ√Var[θ]

≈ N(0, 1).

(ii) Sama dengan(i),

(θ − θ)2

Var[θ]≈ χ2

1.

Dalam bentuk matriks dapat dinyatakan sebagai

(θ − θ)TV−(θ − θ) ≈ χ2q. (5.40)

Dengan q adalah rank matriks V, dan V− adalah:

Page 314: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

313 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

– invers tergeneralisir dari matriks ragam - koragam V

jika V singular, atau

– invers dari matriks ragam - koragam V jika V adalah non-

singular.

Untuk MLT dengan p parameter dan skore terhadap βj = U ,

maka kita memiliki:

Uj =∂l

∂βjj = 1, 2, 3, · · · , p,

E[Uj] = 0 [lihat persamaan (5.5)],

dengan matriks ragam - koragam I=E[UUT]. Jadi analog dengan

persamaan (5.40) setidaknya secara asimtotik:

U ∼ N(0,I) or UTI−1U ∼ χ2p, (5.41)

dengan asumsi I adalah nonsingular Dobson [11].

Page 315: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

314 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.4.1. Distribusi dari Penduga Likelihood Maksimum

Pendekatan Taylor tingkat ke-n untuk fungsi f pada x = a adalah:

f(x) = f(a) + f ′(a)(x− a) +1

2f ′′(a)(x− a)2 + · · ·+ 1

n!fn(a)(x− a)n.

Dengan mengambil pendekatan Taylor tingkat pertama pada fungsi

skor U(β) pada β = b (sebagai penduga), kita peroleh:

U(β) ≈ U(b) +H(b)(β − b), (5.42)

dengan

U(b) =

U1

U2

...

Up

=

∂l∂β1∂l∂β2...∂l∂βp

βj=bj

,

and

H(b) =

∂2l∂β2

1

∂2l∂β1∂β2

· · · ∂2l∂β1∂βp

∂2l∂β2∂β1

∂2l∂β2

2· · · ∂2l

∂β2∂βp...

.... . .

...∂2l

∂βp∂β1∂2l

∂βp∂β2· · · ∂2l

∂β2p

βj=bj

.

Page 316: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

315 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Secara asimptotik H = E[H]. Berdasar persamaan (5.33) maka−I=E[H](Dobson

[11]. Oleh karena itu persamaan (5.42) menjadi:

U(β) ≈ U(b)− I(β − b). (5.43)

Tetapi, b adalah maksimum dari l, akibatnya U(b)=0. Oleh

karena itu persamaan (5.43) menjadi

U(β) ≈ −I(β − b)

dan

b− β ≈ I−1U(β). (5.44)

Dengan mengambil nilai harapan dari kedua ruas persamaan (5.44),

lalu menerapkan bahwa E[U]=0, dapat disimpilkan bahwa E[b] = β.

Akibatnya secara asimtotik b adalah takbias. Lebih lanjut, matriks

ragam - koragam dari b − β (sebut saja, V ) dapat dihitung sebagai

berikut:

E[(b− β)(b− β)T] = E[I−1U(I−1U)T ],

= E[I−1UUTI−1],

Page 317: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

316 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Karena I adalah konstan dan simetrik, maka

E[(b− β)(b− β)T] = I−1E[UUT ]I−1

= I−1II−1 = I−1. (5.45)

Oleh karena itu

(b− β)TI(b− β) ≈ χ2p. (5.46)

Statistik persamaan (5.46) disebut statistik Wald. Statistik ini ekuiv-

alen dengan (b− β) ∼ N(0, I−1), yang membawa konsekuensi bahwa,

secara asimtotik, untuk N besar:

(i) standar kesalahan (s.k.) dari penduga masing-masing bj adalah

s.k.(bj) =√vjj,

dengan vjj adalah unsur ke-(j, j) dari I−1;

(ii) interval keyakinan dua sisi (1− α)× 100% untuk βj adalah

bj ± zα/2√vjj,

Page 318: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

317 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dalam prakteknya, jika N kecil digunakan pendekatan distribusi

t, yaitu

bj ± tN−p,α/2√vjj;

dengan p menunjukkann banyaknya parameter βj yang akan

diduga.

(iii) korelasi antara penduga adalah:

corr(bjbk) =vjk√vjj√vkk

.

5.4.2. Kecocokan Model

Kecocokan model ditentukan dengan membandingkan model yang di-

ajukan dengan model lengkap atau model maksimal maximal model/

saturated model. Model maksimal didefinisikan sebagai:

(i) GLM/LMT yang mempunyai distribusi yang sama dengan mo-

del yang diajukan;

(ii) model menggunakan fungsi link yang sama dengan model yang

diajukan; dan

Page 319: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

318 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

(iii) model yang mempunyai jumlah parameter sama dengan banyak-

nya pengamatan. Dengan kata lain “ia menyediakan informasi

lengkap dari data” (Lihat Dobson [11, hal. 56]).

Untuk menguji kecocokan model, dipergunakan statistik perbandin-

gan likelihood:

λ =L(bmax; y)

L(b; y),

atau

log λ = l(bmax; y)− l(b; y). (5.47)

Distribusi dari persamaan (5.47) dapat diturunkan dengan menggu-

nakan pendekatan Taylor ordo dua dari likelihood l ada titik penduga

β = b.

l(β; y) = l(b; y) + (β − b)U(b) + 12(β − b)TH(b)(β − b). (5.48)

Dengan argumen analog dengan persamaan (5.43), persamaan

(5.48) dapat disederhanakan menjadi:

l(b; y)− l(β; y) =1

2(b− β)TI(b− β). (5.49)

Page 320: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

319 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Ini berarti

2[l(b; y)− l(β; y)] ≈ χ2p, (5.50)

dengan syarat I matriks dengan rank penuh atau matriks nonsingular.

notasi χ2p menunjukkan sebaran chi-kuadrat dengan derajat kebebasan

p.

Devian dan Distribusinya

Statistik pada persamaan (5.47) dapat dimodifikasi dengan cara ber-

ikut sehingga pendekatan distribusinya dapat dikenali.

D = 2 log λ = 2[l(bmax; y)− l(b; y)]. (5.51)

D disebut devian (the deviance). Persamaan persamaan (5.51) dapat

disusun lagi menjadi:

D = 2[l(bmax; y)− l(βmax; y) (5.52a)

−(l(b; y)− l(β; y)) (5.52b)

+(l(βmax; y)− l(β; y))]. (5.52c)

Berdasar persamaan (5.50), bagian pertama dari ruas kanan,

persamaan, (5.52a) berdistribusi χ2n karena memiliki N parameter.

Page 321: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

320 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Bagian ketiga, (5.52c) mendekati 0 jika model yang ditentukan dengan

jumlah parameter p sama baiknya dengan model maksimal. Bagian

kedua, berdistribusi χ2p. Oleh karena itu jika bagian pertama saling

bebas dengan bagian kedua, D mendekati berdistribusi χ2N−p (lihat

juga [16, page 154]). Statistik persamaan (5.51) dapat juga diper-

gunakan untuk menguji apakah suatu model sama baiknya dengan

model yang lainnya (yang memiliki parameter berbeda, lihat [11, hal.

60-64]). Misalnya, untuk menentukan apakah model dengan jumlah

parameter p secara signifikan lebih baik dari model dengan jumlah

parameter q (dengan q < p), kita menggunakan statistik berikut:

4D = Dq −Dp (5.53a)

= 2[l(bmax; y)− l(bq; y)] (5.53b)

− 2[l(bmax; y)− l(bp; y)] (5.53c)

= 2[l(bp; y)− l(bq; y)]. (5.53d)

Berdasar persamaan (5.51) bagian pertama dari persamaan (5.53b)

adalah ∼ χ2N−q dan bagian kedua, (5.53c) adalah∼ χ2

N−p. Oleh karena

itu sepanjang kedua bagian ini saling bebas, maka persamaan (5.53d)

adalah ∼ χ2p−q.

Page 322: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

321 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Cara lain untuk memeriksa kecocokan model dan assumsinya

adalah dengan menggunakan kriteria AIC (seperti pada persamaan

(4.1)) dan analisis grafik dari sisa/residu. Penggunaan dari kedua

teknik ini telah diilustrasikan pada bab sebelumnya. Uraian detil da-

pat dilihat pada Dobson [11, Bab 5] dan Neter et al. [31, Bab 2 ].

Page 323: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

322 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.5. Model Logit, Probit dan Log-linier

Secara matematis, GLM menggabungkan analisis untuk beberapa je-

nis distribusi (diantaranya Normal, Binomial dan Poisson). Model

Linier dengan distribusi Binomial dan fungsi fungsi hubungan probit

dan logit biasa disebut regresi logistik atau lebih spesifik regresi pro-

bit dan logit. Yang termasuk dalam regresi ini adalah regresi biner

(dengan respon Y hanya dua kategori, misalnya 0-1, lulus-tidak lulus,

sukses(S)-gagal(G) dan sebagainya; atau respon dengan k kategori).

Untuk respon biner yang diukur adalah rasio peluang sukses dan tidak

sukses, yang biasa disebut odd. Log odd ini dianggap bergantung se-

cara linier pada beberapa veriabel penjelas.

logit(Yi = S) = log

(P (Yi = S)

P (Yi = G)

)=

p∑j=0

βjXij

atau

Probit(Yi = S) = Φ−1 (Yi = S) =

p∑j=0

βjXij

Odd =p

1− p

Page 324: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

323 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Ada dua jenis data utama yang dapat dianalissi dengan model

logit yaitu data yang berasal dari tabel kontingensi dan dari data

yang langsung memiliki respon biner. Karena pada dasarya model

logit menggunakan data dalam bentuk persen, maka harus diketahui

dengan jelas jumlah sukses dan gagal pada tiap-tiap kelompok, ter-

utama jika jumlah subjek tiap-tiap kelompok tidak sama. (Lihat mo-

del Tabel 5.32).

Apabila respon bukan merupakan respon biner, tetapi meru-

pakan respon hasil pencacahan (count data), dengan jumlah maksi-

mum yang tidak bisa ditentukan, maka distribusi yang paling cocok

dengan respon ini adalah distribusi Poisson dengan fungsi hubungan

log. Model ini lebih dikenal dengan model atau regresi Log-linier.

2Banyaknya Total maupun G tidak perlu ditulis eksplisit dalam tabel jika total

masing-masing kelompok sama

Page 325: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

324 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Tabel 5.3: Jumlah Sukses(S) dan Gagal dalam Berbagai Kelompok

FaktorPerlakuan

Faktor Kategori (Biner) P1 ... PkF1 S n11 ... n1p

Total N11 ... N1p

F2 S n21 ... n2p

Total N21 ... N2p

F3 S n31 ... n3p

Total N31 ... N3p

Page 326: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

325 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.6. dispersi berlebih

Sebagaimana telah dibahas sebelumnya bahwa sebaran anggota kelu-

arga eksponensial memiliki fungsi variansi yang menggambarkan ke-

wajaran hubungan antara rerata dengan variansinya. Sebagai contoh

(i) untuk sebaran Poisson, secara umum besarnya rerata dan vari-

ansi dari sebaran Poisson adalah sama, sedangkan (ii) untuk sebaran

Binomial, besarnya variansi dinyatakan dengan np(1− p). Sering ter-

jadi kita menghadapi data dengan besarnya dispersi jauh melebihi

besarnya rerata. Kondisi ini disebut dispersi berlebih overdispersion.

Salah satu indikasi adanya dispersi berlebih ini adalah besarnya sisaan

deviansi jauh melebihi besarnya derajat kebebasannya [8].

Page 327: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

326 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.7. Ilustrasi GLM dengan R

Analisis GLM pada R dapat dimanfaatkan melalui dua cara yaitu lang-

sung memanggil fungsi glm() atau melalui menu dengan memanggil

paket RCommander. Pemeriksaan asumsi dapat dilihat dari grafik

diagnostik mendasar sedangkan pemilihan model terbaik dapat di-

lakukan dengan memeriksa nilai AIC dari model yang dicoba.

Pengaktifan menu glm pada RCommander dilakukan dengan

statistics => models => Generalized Linear Model

Sedangkan dengan menggunakan skrip, fungsi glm() dapat di-

pangil dengan mengunakan format berikut:

glm(formula, family = (link=), data, x = FALSE,

y = TRUE, contrasts =, ...)

1. formula. Seperti umumnya pada model linier, formula berben-

tuk y x1+x2 ....Pada dasarnya penulisan yang berlaku pada

fungsi lm(), misalnya penulisan formula untuk peubah faktor

(kualitatif), juga berlaku pada fungsi glm ().

Page 328: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

327 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2. family. Pilihan family yang tersedia adalah dengan link kanon-

iknya.binomial(link = "logit")

gaussian(link ="identity")

Gamma(link = "inverse")

inverse.gaussian(link = "1/mu^2")

poisson(link = "log")

quasi(link = "identity", variance = "constant")

quasibinomial(link = "logit")

quasipoisson(link = "log")

3. Objek glm. ADa beberapainformasi yang dapat diekstrak terkait

dengan objek yang dihasilkan melalui analisis glm, di antaranya:

(a) coef(objek) untuk mengekstrak koefisien regresi β.

(b) deviance(objek) untuk mengekstrak jumlah kuadrat sisa.

(c) formula(objek) untuk mengekstrak rumusan model yang

dipergunakan

(d) plot(objek) untuk menghasilkan grafik yaitu seperti gra-

fik sisa, grafik fitted value dan beberapa disgnostik.

Page 329: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

328 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

(e) print(objek) untuk mencetak hasil singkat analisis.

(f) step(objek) untuk memeriksa model yang paling cocok

dengan cara melihat angka (Akaike’s Information Crite-

rion) yang paling besar.

(g) summary(objek)untuk mencetak lengkap hasil analisis.

Selain itu, objek glm memuat beberapa komponen penting diantara-

nya:

[1] "coefficients" "residuals" "fitted.values"

[4] "effects" "R" "rank"

[7] "qr" "family" "linear.predictors"

[10] "deviance" "aic" "null.deviance"

[13] "iter" "weights" "prior.weights"

[16] "df.residual" "df.null" "y"

[19] "converged" "boundary" "model"

[22] "call" "formula" "terms"

[25] "data" "offset" "control"

[28] "method" "contrasts" "xlevels"

Page 330: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

329 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Rangkuman distribusi (family) dan link yang dapat dipilih di-

berikan pada Tabel 5.4. Tanda K menunjukkan link kanonik yang

sekaligus merupakan default link dari glm() pada R.

Tabel 5.4: Distribusi dan Link pada R

family(link) binomial Poisson normal Gamma

logit K × × ×probit X × × ×cloglog X × × ×identity × X K Xlog × K X Xinverse × X X K

Keterangan K: fungsi hubungan kanonik; X: fungsi yang dimungkinkan; ×fungsi yang tidak bisa dilakukan.

Regresi logistik, selain dapat diakses melalui fungsi glm() de-

ngan pilihan distribusi dan link yang sesuai, pada R juga dapat diak-

Page 331: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

330 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

ses secara khusus melalui fungsi multinom() dan polr() pada paket

MASS (Lihat Venable & Ripley [47]). Ketiga metode cara mengakses

regresi logistik ini telah juga diakomodasi dalam menu RCommander

untuk R versi 2.1 ke atas.

5.7.1. Data dengan Sebaran Binomial

Analisis model linier tergereralisir dengan sebaran Binomial dapat di-

lakukan dengan dua macam pendekatan, yaitu

1. Data dalam bentuk tabel kontingensi yang menunjukkan ba-

nyaknya subjek dalam Sukses dan Gagal.

2. Data dengan respon yang langsung terkategori Sukses atau Ga-

gal.

Contoh 5.1. Berikut adalah contoh data fiktif yang dimodifikasi dari

Venables & Ripley [47]. Ada tujuh perlakuan yang dibedakan un-

tuk jenis kelamin laki-laki dan perempuan. Tiap tiap kelompok ada

30 subjek. Jumlah yang dicatat adalah jumlah subjek yang dinya-

takan lulus dari masing-masing kelompok. Data asli diberikan pada

Page 332: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

331 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Tabel 5.5, sedangkan format data yang akan dianalisis dengan R di-

berikan dalam Tabel 5.6. Walaupun data yang tercatat merupakan

hasil pencacahan jumlah yang sukses, tetapi hasil pencacahan ini lebih

menggambarkan relatif terhadap jumlah individu dalam kelompok

yang berhingga dan diketahui. Oleh karena itu secara tidak langsung

data ini menggambarkan persentase keberhasilan dalam tiap kelom-

pok.

Tabel 5.5: Jumlah Kelulusan dalam Berbagai Kelompok Perlakuan

Perlakuan

J. Kelamin P1 P2 P3 P4 P5 P6 P7 P8

L 1 4 9 13 18 20 24 27

P 0 2 6 10 12 16 18 20

Jumlah peserta masing-masing kelompok adalah 30.

Selanjutnya data kelulusan dan kegagalan dikelompokkan men-

jadi 1 matriks respon berordo 16× 2 (cbind(Lulus, Gagal). Analisis

data selanjutnya dilakukan denganresp<-cbind(Lulus, Gagal)

Page 333: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

332 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Tabel 5.6: Format Data R Jumlah Kelulusan dan Kegagalan

J. Kelamin Perlakuan Lulus Gagal

L P1 1 29

L P2 4 26

L P3 9 21

... ... ... ...

L P8 27 3

P P1 0 30

P P2 2 8

... ... ... ...

P P8 20 10

Page 334: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

333 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

logit1<-glm(resp~J.Kelamin*Perlakuan, family=binomial)

summary(logit1)

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) -3.07944 0.41892 -7.351 1.97e-13 ***

J.Kelamin[T.P] -0.13465 0.60694 -0.222 0.824

Perlakuan 0.66177 0.08431 7.850 4.17e-15 ***

J.Kelamin[T.P]:Perl -0.13109 0.11526 -1.137 0.255

---

Significant code `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 170.5715 on 15 degrees of freedom

Residual deviance: 9.3193 on 12 degrees of freedom

AIC: 68.881

Sepintas tidak begitu nampak signifikan adanya pengaruh je-

nis kelamin, tetapi ada baiknya jika grafik diagram pencar dipisahkan

Page 335: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

334 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

antara L dan P. Grafik diagram pencar prediksi dengan data asli dibe-

rikan pada Gambar 5.4. Dari diagram pencar masih dapat dibedakan

antara respon untuk kelompok L dan P pada berbagai kelompok per-

lakuan. Dari grafik tersebut dapat diperkirakan prosentase keberhasi-

lan pada perlakuan P5 adalah sekitar 36% untuk kelompok P dan

sekitar 56% untuk kelompok L. Pada analisis ini tidak ada indikasi

dispersi berlebih karena besarnya Residual devians= 9,13 lebih ke-

cil dari derajat kebebasdannya (12).

Ada kalanya kita dihadapkan pada data yang setiap subjeknya

sudah dikategorikan sebagai kondisi Sukses atau Gagal. Misalnya

muncul tidaknya gejala suatu penyakit pada individu. Dalam jenis

data ini respon sudah dalam kategori biner, misalnya Sukses atau Ga-

gal, ada atau tidak tidak ada gejala. Berikut adalah Contoh dari

data klasik yang ada pada R yaitu kyphosis. Data ini berisi tentang

muncul tidaknya penyakit kyphosis pada anak yang pernah mengalami

operasi. Untuk mengaktifkan data tersebut dapat dilakukan perintah

berikut:library(gam)

data(kyphosis)

print(summary(kyphosis))

Page 336: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

335 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1 2 3 4 5 6 7 8

0.2

0.4

0.6

0.8

Prediksi dengan Logit

Perlakuan

Pro

b

L

L

L

L

L

L

L

L

P

P

P

P

P

P

P

P

Gambar 5.4: Diagram Pencar Prediksi dan Data Asli Peluang Keber-

hasilan Berbagai Kelompok

Page 337: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

336 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Ringkasan data tersebut menunjukkan ada empat peubah satu

diantaranya merupakan kategori biner. Kita dapat memeriksa apakah

muncul tidaknya penyakit kyphosis ada hubungannya dengan peubah

yang lainnya (Age, Number dan Start).Hal ini dapat dilakukan melalui

GLM dengan memilih sebaran Binomial.

Kyphosis Age Number Start

absent :64 Min. : 1.00 Min. : 2.000 Min. : 1.00

present:17 1st Qu.: 26.00 1st Qu.: 3.000 1st Qu.: 9.00

Median : 87.00 Median : 4.000 Median :13.00

Mean : 83.65 Mean : 4.049 Mean :11.49

3rd Qu.:130.00 3rd Qu.: 5.000 3rd Qu.:16.00

Max. :206.00 Max. :10.000 Max. :18.00

call:

glm(formula = Kyphosis ~ Age + Number + Start, family = binomial(logit),

data = kyphosis)

Deviance Residuals:Min 1Q Median 3Q Max

Page 338: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

337 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

-2.3124 -0.5484 -0.3632 -0.1659 2.1613

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) -2.036934 1.449575 -1.405 0.15996

Age 0.010930 0.006446 1.696 0.08996 .

Number 0.410601 0.224861 1.826 0.06785 .

Start -0.206510 0.067699 -3.050 0.00229 **

---

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 83.234 on 80 degrees of freedom

Residual deviance: 61.380 on 77 degrees of freedom

AIC: 69.38

Number of Fisher Scoring iterations: 5

Page 339: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

338 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Data dengan sebaran Poisson

Contoh 5.2. Contoh berikut diambil dari data warpbreaks pada

database R. Data ini adalah tentang banyaknya kerusakan yang ter-

jadi pada dua jenis wool (A dan B) yang diberi tiga macam tekanan

(rendah menengah dan tinggi). Karena data merupakan hasil pen-

cacahan maka distribusi yang paling cocok adalah Poisson dengan pi-

lihan alternatif fungsi hubungan log atau identitas (linier). Kita akan

mencoba kedua model dan memeriksa mana yang lebih baik dengan

menggunakan kriteria AIC.

Dengan model ini semua koefisien regresi signifikan yang berarti

ada beda signifikan dari jumlah kerusakan dilihat baik dari jenis wool

maupun tingkat tekanan. Model ini mempunyai nilai AIC 497,36

glm(formula = breaks ~ wool + tension,

family = poisson(link = identity), data = warpbreaks)

Deviance Residuals:

Min 1Q Median 3Q Max

-3.8266 -1.5822 -0.4776 1.1656 4.5603

Page 340: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

339 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) 38.440 1.600 24.025 < 2e-16 ***

woolB -4.877 1.413 -3.452 0.000557 ***

tensionM -9.173 1.863 -4.925 8.44e-07 ***

tensionH -14.385 1.783 -8.070 7.03e-16 ***

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for poisson family taken to be 1)

Null deviance: 297.37 on 53 degrees of freedom

Residual deviance: 214.70 on 50 degrees of freedom

AIC: 497.36

Distribusi Poisson dengan hubungan log

Model ini juga menunjukkan beda signifikan antara jumlah kerusakan

dilihat dari jenis wool dan tingkattekanan, tetapi model ini memi-

liki AIC yang sedikit lebih rendah 493,06. Ini berarti model dengan

Page 341: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

340 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

hubungan log sedikit lebih baik dari pada model dengan hubungan

identitas.

glm(formula = breaks ~ wool + tension,

family = poisson(link = log), data = warpbreaks)

Deviance Residuals:

Min 1Q Median 3Q Max

-3.6871 -1.6503 -0.4269 1.1902 4.2616

Coefficients:

Estimate Std. Error z value Pr(>|z|)

(Intercept) 3.69196 0.04541 81.302 < 2e-16 ***

woolB -0.20599 0.05157 -3.994 6.49e-05 ***

tensionM -0.32132 0.06027 -5.332 9.73e-08 ***

tensionH -0.51849 0.06396 -8.107 5.21e-16 ***

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for poisson family taken to be 1)

Page 342: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

341 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Null deviance: 297.37 on 53 degrees of freedomResidual deviance: 210.39 on 50 degrees of freedom

AIC: 493.06

Contoh 5.3. Data berikut diambil dari data kyphosis dari data base

R pada paket gam tentang hasil operasi anak terkait dengan muncul

tidaknya penyakit paska operasi yang disebut khyposis. Data ini

merekam muncul tidaknya penyakit yang tersebut, dihubungkan de-

ngan usia anak (Age) dalam bulan, tingkat operasi mulai (Start) Lihat

Chamber & Hastie[5].

Respon muncul tidaknya Khyposis merupakan data biner yang

berdistribusi binomial. Kita dapat menggunakan Khyposis sebagai

respon dan variabel lainnya sebagai veriabel penjelas dengan menggu-

nakan fungsi hubungan logit. Kita dapat mulai dengan model yang

agak lengkap dan selanjutnya memerintahkan R untuk menghitung

model terbaik dengan kriteria AIC.

glm(formula = Kyphosis ~ Age + Number + Start,

family = binomial(link = logit), data = kyphosis)

Page 343: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

342 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Coefficients:Estimate Std. Error z value Pr(>|z|)

(Intercept) -2.036934 1.449575 -1.405 0.15996

Age 0.010930 0.006446 1.696 0.08996 .

Number 0.410601 0.224861 1.826 0.06785 .

Start -0.206510 0.067699 -3.050 0.00229 **

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 83.234 on 80 degrees of freedom

Residual deviance: 61.380 on 77 degrees of freedom

AIC: 69.38

Model ini memiliki AIC 69,38 tetapi dari koefisien regresinya

terlihat hanya ada satu koefisienyang signifikan. Untuk itu kita akan

lakukan penelusuran alternatif model dengan menggunakan perintah

step(). Ternyata dari segi nilai AIC, alternatif model- model yang

lain tidak menyebabkan adanya oenurunan AIC yang berarti dan di-

anggap model lengkap ini sudah cukup baik.

Page 344: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

343 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.7.2. Prediksi pada GLM

Setelah model yang dianggap baik diperoleh, selanjutnya model terse-

but dapat dipakai untuk mempredikasi baik nilai link (kombinasi li-

nier) maupun responnya.

predict(object, newdata = NULL,

type = c("link", "response", "terms"),

se.fit = FALSE, dispersion = NULL, terms = NULL,

na.action = na.pass, ...)

Tipe yang merupakan default adalah ”link”, yaitu R menghi-

tung hasil kombinasi linier∑xijβj. Pada contoh di atas diperoleh

βj masing-masing adalah (-2,036934, 0,010930; 0.410601;-0,206510),

sehingga untuk x1 = 70, x2 = 3, x3 = 10 diperoleh η = −2, 105097.

Untuk prediksi respon yang ditafsirkan sebagai peluang munculnya

kyphosis ketika Age=70, Number=3, Start=10, diperoleh dengan memilih

type=”response” yang menghasilkan 0,1086024.

> predict(glm2,data.frame(Age=70,Number=3,Start=10)

[1] -2.105097

Page 345: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

344 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

> predict(glm2,data.frame(Age=70,Number=3,Start=10),type="link")

[1] -2.105097

> predict(glm2,data.frame(Age=70,Number=3,Start=10),

type="response")

[1] 0.1086024

Page 346: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

345 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.8. Ringkasan

1. Distribusi/ Sebaran keluarga eksponensial menggabungkan dis-

tribusi - distribusi yang telah banyak dikenal (misalnya Binom-

ial, Poisson, Normal, Gamma) menjadi satu kesatuan distribusi.

2. Masing-masing sebaran anggota keluarga eksponensial memiliki

ciri khas dilihat dari ruang rentang (diskrit kontinu, terbatas tak

terbatas), dan hubungan nilai-tengah dengan ragamnya (bebas,

linier atau kuadratik).

3. Ada tida komponen penting model linier tergeneralisir yaitu: (i)

komponen respon dengan sebaranpada anggota keluarga ekspo-

nensial, (ii) ada komponen kombinasi linier antara peubah pen-

jelas dengan parameter regresi, dan (iii) ada fungsi (kontinu dan

diferensiabel) yang menghubungkan antara nilai tengah dengan

kombinasi linier tadi.

4. Beberapa bentuk khusus regresi yang termasuk model linierter-

generalisir diantaranya adalah regresi logistik (logit, probit de-

ngan respon bersebaran Binomial), regresi log-linier (dengan re-

Page 347: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

346 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

spon bersebaran Poisson).

5. Pemilihan model terbaik dapat dilakukan dengan melihat nilai

AIC.

Page 348: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

347 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.9. Bacaan Lebih Lanjut

Referensi yang biasa dijadikan acuan utama mempelajari model linier

tergeneralisir ini adalah McCullagh dan Nelder [24], sedangkan seba-

gai pemula dapat menggunakan pengantar yang ditulis oleh Dobson

[11]. Khusus hubungannya dengan paket Splus atau R dapat dibaca

referensi Chamber & Hastie [5], Ripley & Venables [47]

Page 349: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

348 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

5.10. Latihan Soal-soal

1. Tuliskan bentuk umum sebaran keluarga eksponensial. Jelaskan

kaitannya dengan beberapa bentuk khusus seperti Binomial, Pois-

son, Normal dan Gamma.

2. Sebutkan ciri-ciri khas dari sebaran Binomial,Poisson, Normal

dan Gamma dilihat dari ruang rentang, fungsi ragam dan link

kanonik.

3. Jelaskan manfaatdan fungsi dari fungsi link pada model linier

tergeneralisir (kaitkan dengan skala peubah penjelas dan peubah

respon).

4. Jelaskan apa yang dimaksud dengan regresi logistik dan log-

linier.

5. Suatu data dianalisis dengan model linier tergeneralisir dengan

sebaran Poisson dan fungsi link log. Dari hasil analisi diperoleh

β0, β1 dan β2. Tuliskan bentuk model (persamaan regresi) yang

diperoleh.

Page 350: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

349 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

BAB 6

MODEL UNTUK RESPON TIDAK SALING

BEBAS

Pada Bab 5 telah didiskusikan perluasan model linier untuk data

yang berdistribusi Keluarga Eksponensial dimana distribusi Normal

merupakan salah satu bentuk khususnya. Dalam perluasan tersebut

distribusi galat (error) masih saling bebas, hanya saja tidak harus

Page 351: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

350 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

berdistribusi Normal. Dalam eksperimen yang melibatkan penguku-

ran berulang (repeated measurement) atau pengamatan waktu pan-

jang (longitudinal) umumnya respon yang dihasilkan adalah berupa

vektor data yang kemungkinan besar tidak saling bebas. Ada bebe-

rapa kondisi eksperimen yang menghasilkan data yang tidak saling

bebas diantaranya seperti berikut ini.

1. subjek penelitian mendapat beberapa perlakuan yang berbeda

atau memiliki beberapa respon yang berbeda, misalnya: (i) sub-

jek (sekelompok siswa) diberi beberapa tes (ujian) yang berbeda

dan skor untuk semua ujian dipeljari secara simultan; (ii) je-

nis benih tertentu diberi berbagai tingkat pemupukan atau per-

lakuan lainnya.

2. subjek diberi satu perlakuan tetapi respon diamati pada inter-

val waktu berbeda, misalnya respon terhadap suatu perlakuan

diamati setiap 6 jam selama 24 jam;

Respon yang dihasilkan dapat berupa: (i) hasil pengukuran yang

biasanya bersekala interval seperti skor tes, produksi pertanian; (ii)

hasil pencacahan (misalnya banyaknya salah sambung pada hubungan

Page 352: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

351 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

tilpun, banyaknya kejadian pada tempat dan interval waktu tertentu)

atau (iii) berupa respon biner (misalnya banyaknya prosentase sukses

pada setiap interval waktu tertentu).

Ada dua pendekatan yang dipergunakan untuk menganalisis data

sejenis ini. Kedua pendekatan ini relatif baru yang diperkenalkan

satu-dua dekade lalu. Pendekatan pertama adalah model marjinal

yang diperkenalkan oleh Liang & Zeger tahun 1986, yang lebih dike-

nal dengan pendekatan GEE (Generalized Estimating Equation). Pen-

dekatan ini tidak didasarkan atas bentuk likelihood lengkap dari re-

spon, tetapi hanya berdasarkan hubungan antara nilai-tengah (momen

pertama) dan ragamnya (momen kedua) serta bentuk matriks kore-

lasinya. Pendekatan kedua adalah pendekatan Model Linier Tergen-

eralisir Hirarkis yang dipelopori oleh Lee & Nelder tahun 1996. Model

ini selain menggunakan likelihood lengkap, juga menggabungkan pen-

dekatan multiplikatif dan pendekatan aditif.

Walau sudah diperkenalkan dua dekade lalu, pendekatan GEE

belum banyak diimplemantasikan pada paket komputer. R sebagai

open source termasuk salah satu diantara sedikit paket yang telah

mengimplementasikannya. Ada dua paket fungsi yang mengimple-

Page 353: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

352 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

mentasikan GEE pada R yaitu gee dan geePackages. Namun kedua

paket fungsi ini belum bisa diakses melalui menu. Dalam bab ini akan

dibahas perluasan model (regresi) linier untuk data yang mungkin se-

lain tidak berdistribusi Normal juga tidak saling bebas.

Page 354: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

353 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Kompetensi

Setelah menyimak materi pada bab ini, pembaca diharapkan:

1. dapat membedakan data dengan respon saling bebas dan data

dengan respon tidak saling bebas;

2. dapat menjelaskan beda dan generalisasi dari model linier klasik,

tergeneralisir (GLM), dan GEE;

3. dapat menganaisis dan menginterpretasikan hasil menggunakan

GEE

Page 355: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

354 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Materi

1. Model marjinal

2. Quasi-likelihood dan GEE

3. Generalisasi dan bentuk GEE

Page 356: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

355 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.1. Model Marjinal

Perhatikan bahwa model linier mempunyai bentuk umum yang telah

diuraikan pada bab sebelumnnya yaitu:

Y = Xβ + ε (6.1)

Dalam perkembangannya di lapangan, ada kemungkinan baik ε mau-

pun Y tidak lagi berdistribusi normal. Apabila data yang tidak berdis-

tribusi normal ini masih saling bebas, maka model linier yang mem-

pelajari hubungan peubah untuk jenis data ini disebut model linier

tergeneralisir (Generalized Linear Models, untuk selanjutnya disingkat

GLM). Pembahasan tentang GLM telah dibahas pada Bab 5.1 dan

Bab 5. Referensi yang membahas secara komprehensif tentang GLM

diberikan oleh McCullagh & Nelder [24]. Jika Yi tidak berdistribusi

normal, maka pada persamaan di atas terjadi perubahan asumsi yaitu:

1. hubungan yang ada antara ekspektasi/rataan dan prediktor li-

nier adalah

g(µ) = η

dengan g(.) adalah fungsi monoton dan diferensiabel yang dise-

but fungsi link;

Page 357: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

356 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2. sedangkan ragamnya menjadi

V ar(Y ) = ψv(µ),

dengan ψ adalah parameter skala yang bukan menjadi perhatian

utama sehingga sering diasumsikan diketahui. Fungsi v() dise-

but fungsi ragam yang bentuk khususnya bergantung pada jenis

distribusinya, misalnya untuk distribusi Poisson, secara umum

berlaku v(µ) = ψµ, yaitu berlaku hubungan linier antara nilai-

tengah dan ragam pada distribusi Poisson.

Apabila data yang tidak berdistribusi normal tersebut juga tidak

saling bebas, dengan kata lain Yi bukanlah respon tunggal tetapi meru-

pakan vektor respon, yi = (Yi1, Yi2, YijYit)T . Diggle et al. [10] men-

guraikan beberapa metode analisis utuk jenis respon ini, salah satu

diantaranya, yang banyak digunakan adalah model marjinal. Dalam

sebuah model marjinal, regresi dari respon terhadap peubah eksplana-

tori dimodelkan secara terpisah dengan korelasi dalam unit/subjeknya.

Dalam regresi tersebut, ekspektasi marjinal E(Yij) dimodel sebagai

fungsi dari peubah bebas atau peubah eksplanatori (X). Ekspektasi

marjinal adalah rata- rata respon dari subpopulasi yang memiliki pe-

Page 358: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

357 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

ubah eksplanatori yang sama. Model marjinal secara khusus memiliki

asumsi berikut.

1. Ekspektasi marjinal, E(Yij) = µij, bergantung pada vektor pe-

ubah eksplanatori xij dengan hubungan g(µij) = xijβ, dengan

g(.) adalah fungsi link yang diketahui seperti misalnya logit un-

tuk respon binomial, dan β adalah vektor parameter yang akan

diduga;

2. Ragam marjinal tergantung pada rataan atau ekspektasi marji-

nal menurut hubungan V ar(Yij) = φv(µij), dengan v(.) adalah

fungsi ragam yang diketahui dan φ adalah parameter skala yang

mungkin perlu diduga juga

3. Korelasi antara Yij dan Yik adalah sebuah fungsi dari rataan

marjinal dan mungkin juga parameter - parameter tambahan ,

yaitu Corr(Yij, Yik) = ψ(µij;µik;α) dimana ψ(.) adalah sebuah

fungsi yang disumsikan diketahui (Diggle et al. [10]).

Dalam kedua kasus di atas, menganalisis data asli (dalam ben-

tuk multivariat) dianggap lebih memberikan gambaran yang benar

Page 359: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

358 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Tabel 6.1: Respon Pengukuran berulangPengulangan Variabel Penjelas

No. Subjek T1 T2 ... Tt X ...

1 S1 y11 y12 ... y1t x12 S2 y21 y22 ... y2t x2... ... ... ... ... ... ...

n Sn yn1 yn2 ... ynt xn

dibandingkan dengan menganalis rata-rata respon. Dengan kata lain

menganalisis profil lebih tepat dari pada menganalisis rata-rata. Sub-

jek mungkin memiliki rata-rata saa tetapi profilnya berbeda. Secara

keseluruhan respon Y bukanlah sekedar vektor data tetapi matriks

data. Pada matriks data tersebut yj menunjukkan vektor data untuk

pengamatan ke-j. Sedangkan yijmenunjukkan respon untuk subjek

ke-i pada pengamatan ke-jMasing-masing subjek penelitian memiliki

Page 360: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

359 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

respon multivariate berupa vektor dengan panjang p.

Y =

y1

T

y2T

· · ·yN

P

=

Y11 Y12 · · · Y1tY21 Y22 · · · Y2t...

.... . .

...

Yn1 Yn2 · · · Ynt

Page 361: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

360 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.2. Quasi-Likelihood dan Generalized Estimat-

ing Equations (GEE)

Dalam model linier yang peubah responnya masih saling bebas, mes-

kipun tidak berdistribusi normal, fungsi likelihoodnya relatif mudah

dievaluasi dan dimaksimumkan. Metode yang menganalisis data yang

tidak berdistribusi normal tetapi masih saling bebas disebut GLM.

Untuk data yang tidak saling bebas, dengan model marjinal, kita

hanya menentukan bentuk nilai-tengah (sebagai momen pertama) dan

matriks ragam - koragam (sebagai momen kedua). Untuk distribusi

normal, kedua momen ini telah cukup menentukan fungsi likelihood-

nya, namun tidak demikian halnya dengan distribusi lainnya seperti

distribusi binomial, poisson dan gamma, misalnya. Untuk mengetahui

keseluruhan likelihood diperlukan asumsi-asumsi lainnya. Meskipun

dengan asumsi-asumsi tambahan, likelihood seringkali tetap sulit di-

tentukan dan melibatkan banyak paremeter gangguan (nuisance) se-

lain parameter regresi (β) dan parameter korelasi (misalnya,α) yang

harus diduga. Untuk alasan ini, pendekatan yang relatif mudah di-

pahami dan masuk akal dalam mengatasi kesulitan ini adalah dengan

Page 362: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

361 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

menggunakan Generalized Estimating Equations (untuk selanjutnya

disingkat GEE) yang pertama diperkenalkan oleh Liang dan Zeger

(yaitu Liang & Zeger [21], Zeger & Liang [52],[53], Liang et al. [22],

Zeger et al. [54]). GEE merupakan sebuah analogi atau generalisasi

multivariat dari quasi-likelihood untuk respon saling bebas(Diggle,

et al. [10]). Manakala tidak ada fungsi likelihood yang pasti un-

tuk dijadikan acuan, cukup beralasan untuk menduga/ mengestimasi

dengan menyelesaikan sebuah analogi multivariat dari metode quasi-

score yang diperkenalkan Wedderburn [51], yaitu:

S(β) =n∑i=1

(∂µi∂β

)TV ar (Yi)

−1 (Yi − µi) = 0 (6.2)

Karena secara umum berlaku g(µij) = xiβ , maka melalui fungsi

hungungan (link function) akan langsung dapat dicari turunan g(.)

terhadap η dan karenanya persamaan (6.2) dapat dimodifikasi menjadi

S(β) =n∑i=1

XiT

(∂µi∂ηi

)TV ar (Yi)

−1 (Yi − µi) = 0 (6.3)

dimana, Yi,µi dan ηi adalah vektor dan V ar(Yi) merupakan

matrik simetris. Dalam kasus multivariat, ada tambahan komplikasi

Page 363: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

362 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

seperti Sβ yang sesungguhnya juga tergantung pada parameter β ma-

upun α, karena V ar(Yi) = φV ar(Yi;β;α). Pada bab ini akan diba-

has analisis model linier untuk respon yang tidak saja berdistribusi

tidak normal tetapi juga respon tersebut tidak saling bebas. Respon

seperti ini dihasilkan oleh pengamatan berulang (repeated meassure-

ment/longitudinal data), misalnya pengamatan yang dilakukan pada

tiap interval waktu tertentu. Tentu saja akan lebih baik jika data yang

dihasilkan oleh beberapa pengamatan ini diuji secara serempak, tidak

satu-persatu maupun diwakili oleh rata-ratanya.

Page 364: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

363 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.3. Generalisasi dan Bentuk GEE

Dibandingkan dengan persamaan untuk memperoleh penduga pada

model linier normal (NLM) seperti pada persamaan (3.1) pada hala-

man 154 dan pada model linier tergenaralisasi (GLM), GEE ini men-

galami generalisasi atau perbedaan dalam beberapa hal yaitu:

1. Dalam NLM dan GLM respon Yi, ekspektasi E(Yi) = µi meru-

pakan variabel univariat, sedangkan dalam GEE mereka berupa

vektor yang berhubungan dengan subjek ke-i, sebagai konseku-

ensinya maka model (3.1) harus digeneralisasi dengan memper-

timbangkan jumlah untuk seluruh individu/subjek Y;

2. Dalam NLM, nilai

(∂µi∂ηi

)adalah 1, pada GLM nilainya be-

rantung pada fungsi link g(.); sedangkan dalam GEE, karena

ekspektasi dan prediktor linier dua-duanya merupakan vektor

berukuran t, maka merupakan ia matrik diagonal berukuran t×t

dengan unsur diagonalnya adalah

(∂µij∂ηij

)yang nilainya riilnya

juga masih bergantung pada fungsi link g(.) yang digunakan;

Page 365: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

364 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

3. Dalam NLM ragam dari respon, var(Yi) = φv(µi) adalah kon-

stan yaitu σ2, dalam GLM dia adalah tidak konstan tetapi berupa

matriks diagonal, sedangkan dalam GEE dia berupa matriks ra-

gam - koragam yang bersifat umum (simetris) yang tidak saja

bergantung pada µ atau β tetapi juga pada φ dan α, yang dapat

dinyatakan dalam bentuk

vi = φ√v(µiR(α)

√v(µi

dengan R(α) adalah matriks korelasi yang diasumsikan, mi-

salnya struktur korelasi seragam yang biasa disebut exchage-

able/uniform, model rangkaian waktu AR-1, dan lain- lain (Ken-

ward & Smith [17]). Dengan demikian secara keseluruhan V ar(Y)

untuk NLM adalah σ2I, untuk GLM adalah matriks diagonal de-

ngan unsur diagonal V ar(Yi), sedangan pada GEE dia adalah

matriks diagonal blok dengan blok ke-i adalah Vi. Untuk struk-

Page 366: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

365 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

tur korelasi seragam bentuknya matriks korelasinya adalah

R =

1 α · · · α

α 1 · · · α...

.... . .

...

α α · · · 1

.

Sedangkan model korelasi AR-1 yang biasa juga disebut model

korelasi serial adalah:

R =

1 α α2 · · · αp−1

α 1 α · · · αp−2

......

.... . .

...

αp−1 αp−2 αp−3 · · · 1

.

Dengan mencari turunan, terhadap β, dari ruas kiri pada per-

samaan (6.3), maka diperoleh persamaan dalam bentuk iterasi

Fisher Scoring, untuk penduga β dapat dinyatakan dengan per-

samaan berikut

Page 367: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

366 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

b(1) =b(0) +

[n∑i=1

XiT

(∂µi∂ηi

)[var(Yi)]

−1(∂µi∂ηi

)Xi

]−1[

n∑i=1

XiT

(∂µi∂ηi

)[var(Yi)]

−1 (Yi − µi)

](6.4)

Dalam bentuk iterasi seperti persamaan (6.4), maka ragam ”bi-

asa” b, yang biasa disebut ragam naive dapat ditentukan dengan

Vn =

[n∑i=1

XiT

(∂µi∂ηi

)[var(Yi)]

−1(∂µi∂ηi

)Xi

]−1(6.5)

sedangkan ragam yang lebih tegar, biasa disebut sandwich/ ro-bust variance diperoleh dengan menerapkan hukum bahwa untukmatriks konstanta A, maka var(AY ) = ATvar(Y )A dengan

A =

[n∑i=1

XiT

(∂µi∂ηi

)[var(Yi)]

−1(∂µi∂ηi

)Xi

]−1[

n∑i=1

XiT

(∂µi∂ηi

)[var(Yi)]

−1

]

Page 368: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

367 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Jika perkalian dengan invers dinotasikan dengan ’pecahan’ se-

perti notasi art:KenwardSmith95, maka A dapat dinotasikan de-

ngan:

A =

[n∑i=1

XiT

(∂µi∂ηi

)[var(Yi)]

−1

][

n∑i=1

XiT

(∂µi∂ηi

)[var(Yi)]

−1(∂µi∂ηi

)Xi

]

Page 369: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

368 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.4. Ilustrasi GEE dengan R

Fasilitas GEE hanya dapat dimanfaatkan melalui skrip dengan men-

gaktifkan paket gee. Format fungsi gee() adalah:

gee(formula, id,

data, subset, na.action,

R = NA, b = NA,

tol = 0.001, maxiter = 25,

family = gaussian, corstr = "independence",

Mv = 1, silent = TRUE, contrasts = NULL,

scale.fix = FALSE, scale.value = 1, v4.4compat = FALSE)

id adalah variabel yang menunjukkan terjadinya pengukuran

berulang. Selain alternatif family dan link seperti pada glm(), de-

ngan gee() juga tersedia beberapa alternatif model korelasi di an-

taranya adalah:

1. "independence" yang berarti kita mengasumsikan respon saling

bebas. Jadi model ini identik dengan model glm()

Page 370: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

369 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

2. "exchangeable" yang berarti kita mengasumsikan adanya ko-

relasi seragam atau yang lebih dikenal dengan compound sym-

metry,

3. "AR-M" jika kita mengasumsikan model deret waktu Auto Re-

gressive orde M,

4. "unstructured" untuk model korelasi tanpa struktur. Model

ini juga disebut model multivariate penuh.

Contoh 6.1. Pada data warpbreaks apabila dianggap bahwa fak-

tor wool yang sama mendapat tiga macam perlakuan tekanan, atau

faktor wool dianggap sebagai faktor acak, maka data tersebut dapat

dianalisis melalui gee() dengan wool sebagai id. Berikut adalah hasil

yang diperoleh dengan menggunakan model korelasi seragam dan deret

waktu AR-1 dengan distribusi Poisson

Model:

Link: Logarithm

Variance to Mean Relation: Poisson

Correlation Structure: Exchangeable

Page 371: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

370 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Call:

gee(formula = breaks ~ tension, id = wool, data = warpbreaks,

family = poisson(link = log), corstr = "exchangeable")

Coefficients:

Estimate Naive S.E. Naive z Robust S.E. Robust z

(Intercept)3.5942635 0.09055356 39.692126 0.15869419 22.648992

tensionM -0.3213204 0.12808197 -2.508709 0.22270597 -1.442801

tensionH -0.5184885 0.13619100 -3.807069 0.06441329 -8.049403

Estimated Scale Parameter: 4.601903

Number of Iterations: 1

Koefisien korelasi model di atas adalah r = 0, 02088982. Untuk ko-

relasi dengan asumsi AR-1 diperileh hasil berikut:

Model:

Link: Logarithm

Variance to Mean Relation: Poisson

Correlation Structure: AR-M , M = 1

Page 372: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

371 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Call:gee(formula = breaks ~ tension, id = wool, data = warpbreaks,

family = poisson(link = log), corstr = "AR-M", Mv = 1)

Summary of Residuals:

Min 1Q Median 3Q Max

-22.415091 -8.095630 -2.695504 6.304496 33.584909

Coefficients:

Estimate Naive S.E. Naive z Robust S.E. Robust z

(Intercept)3.5949833 0.08689454 41.371797 0.15918021 22.584360

tensionM -0.3245601 0.13381637 -2.425414 0.22496947 -1.442685

tensionH -0.5178782 0.14221001 -3.641644 0.06567149 -7.885892

Estimated Scale Parameter: 4.601424

Number of Iterations: 2

Working Correlation

[,1] [,2] [,3] [,4]

Page 373: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

372 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

[1,] 1.000000e+00 4.125981e-02 1.702372e-03 7.023956e-05

[2,] 4.125981e-02 1.000000e+

Contoh 6.2.

Data Orange merupakan data tentang usia dan keliling batang pohon

jeruk untuk berbagai jenis pohon jeruk. Dapat dianggap bahwa satu jenis

pohon jeruk diamati secara berulang untuk tingkat umur yang berbeda.

Dalam konteks model marjinal, jenis pohon menjadi pertimbangan dalam

estimasi hubungan antara usia dan keliling pohon, tetapi tidak secara ek-

splisit masuk kedalam model. Karena pengamatan berulangnya berdasar-

kan waktu, maka model korelasi yang dianggap lebih cocok adalah model

AR-1, bukan seragam.

Model:

Link: Logarithm

Variance to Mean Relation: Gamma

Correlation Structure: AR-M , M = 1

Call:

gee(formula = circumference ~ age, id = Tree, data = Orange,family = Gamma(link = log), corstr = "AR-M", Mv = 1)

Page 374: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

373 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Summary of Residuals:

Min 1Q Median 3Q Max

-55.95909 -3.67571 10.05171 24.64189 69.23206

Coefficients:

Estimate Naive S.E. Naive z Robust S.E. Robust z

(Intercept)3.374827865 0.14418605 23.40606 2.215775e-02 152.3092

age 0.001202957 0.00010245 11.74185 3.813379e-05 31.5457

Estimated Scale Parameter: 0.095224

Correlation parameter = 0.8461830

Page 375: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

374 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.5. Gamma-HGLM dan Model Lainnya

Pada bagian ini diuraikan secara ringkas bentuk Model Linier Tergeneral-

isir Bertingkat (HGLM=Hierarchical Generalized Linear Model), khususnya

Gamma-HGLM yang menggunakan asumsi distribusi Gamma. Pada bab

ini juga diuraikan hasil-hasil matematika yang dapat diturunkan berkai-

tan dengan estimasi parameter untuk model sekawan (Gamma-Inverse-

Gamma) melalui pendekatan likelihood bersama (joint likelihood) yang bi-

asa juga disebut dengan pendekatan khusus subjek (Subject Specific Model).

Secara khusus model likelihood bersama untuk model sekawan, dalam buku

ini disebut JGIG.

Model yang dibahas termasuk model bertingkat/hierarkis, yaitu Hi-

erarchical Generalized Linear Models dengan distribusi Gamma, yang se-

lanjutnya disebut JGIG. Model ini termasuk perkembangan model terbaru

dari model linier yang mulai diperkenalkan oleh Lee & Nelder [20] (kurang

lebih satu dekade setelah diperkenalkannya GEE). Sampai saat ini, mo-

del ini belum terimplementasi ke dalam paket komputer yang banyak ber-

edar (termasuk R). Program terbatas telah ditulis dan tersedia bagi yang

berminat. Gamma-HGLM yang dibahas baru terbatas pada pendekatan

likelihood bersama yang merupakan akumulasi riset penulis sejak tahun

1999.

Page 376: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

375 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.5.1. Gamma-HGLMs

Model yang dibahas termasuk bagian dari HGLM. Bersama dengan fungsi

hubungan yang dipilih, HGLM, mempersatukan pendekatan model aditif

dan multiplikatif yang sekaligus juga memperluas distribusi efek acak yang

dimungkinkan memiliki distribusi tidak normal. Model ini dapat diang-

gap sebagai pengembangan dari model GLMM (Generalized Linear Mixed

Models, yaitu Model Linier Tergeneralisasi Campuran yang mensyaratkan

efek acak harus berdistribusi normal.

Dalam HGLM, nilai-tengah bersyarat yij |Ui didefinisikan sebagai fungsi

dari efek tetap µi atau β, dan efek acak Ui, yaitu E(yi|Ui) = ψ(µi, Ui). Un-

tuk meminimalkan bias, nilai-tengah efek acak U disyaratkan sedemikian

sehingga nilai-tengah tak bersyarat E(yij) sama dengan µij . Jadi, jika

menggunakan model aditif (misalnya pada GLMM) syaratnya E(yi|Ui) =

µi + ZiUi = µi,yaitu syaratnya E(Ui)=0. Jika menggunakan model multi-

plicatif syaratnya E(yi|Ui) = µiUi = µi, yaitu E(Ui)=1.

Pada model Gamma-HGLM yi|Ui diasumsikan berdistribusi Gamma

sedangkan Ui berdistribusi Inverse-Gamma, untuk model sekawan (lihat

Tirta [40]) atau Lognormal, untuk model taksekawan lihat Tirta [41]) de-

ngan nilai-tengah satu. Model Gamma-Inverse-Gamma dapat dirangkum

sebagai berikut ini. Misalkan bahwa, untuk individu atau strata kei dari

Page 377: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

376 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

jumlah m, sebanyak ni respon teramati,sedemikain sehingga secara keselu-

ruhan ada respon sebanyak N =∑m

i=1 ni. Misalkan

yi = [yi1, · · · , yij , · · · , yini ]T

merupakan vektor data berukuran ni untuk individu atau strata ke i dengan

i = 1, . . . ,m. Definisi Gamma Inverse Gamma Model (GIGM), mengikuti

HGLMs (Lee & Nelder [20]), seperti berikut.

1. Untuk i = 1, . . . ,m, ada efek acak γi, berkaitan dengan individu atau

strata ke i yang saling bebas dan berdistribusi inverse gamma dengan

likelihood

f2(γi, α) =(α− 1)α

Γ(α)γ−(α+1) exp

(−α− 1

γi

), (6.6)

dan

E(γi) = µγ = 1, var(γi) = σ2γ =1

α− 2, dengan α > 2. (6.7)

Selanjutnya ini dinotasikan γi ∼ IG(1, α).

2. Bersyarat dengan efek acak γi, respon yij , untuk i = 1, . . . ,m and j =

1, . . . , ni, mengikuti GLMs dengan distribusi gamma dan memiliki

nilai-tengah µ′ij = µijγi dan parameter bentuk ν, yang berarti:

Page 378: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

377 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

(a) untuk j = 1, . . . , ni, yij |γi, berdistribusi gamma dan saling be-

bas, G(µijγi, ν), dengan densitas

f1(yij , µij , ν|γi) =1

Γ(ν)

(νyijµijγi

)νy−1ij exp

(− νyijµijγi

), (6.8)

yang memiliki nilai-tengah bersyarat

E(yij |γi) = µ′ij = µijγi, (6.9a)

dan bersyarat

var(yij |γi) =µ′ 2ijν

=µ2ijγ

2i

ν; (6.9b)

(b) untuk matriks desain xij dan parameter regresi yang diketahui

β hubungan berikut berlaku

g(µ′ij) = η′

dengan g adalah fungsi-link. Secara khusus, untuk hubungan-

log (log-link)

log(µ′ij) = η′ = xijTβ + ln(γi), (6.10)

Page 379: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

378 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dan hubungan antara matriks desain, efek tetap dan efek acak

dapat dinyatakan dalam bentuk matriks seperti:

yi = g−1 (Xiβ + Zivi) + εi, (6.11)

dengan g(x) = ln(x) and vi = ln(γi).

Dapat ditunjukkan (Tirta [40]) dan Tirta [41]) bahwa model HGLM

yang diajukan mempunyai korelasi berbentuk seragam. Jadi dengan model

GIG yang diajukan, tidak ada kebebasan memilih bentuk korelasi.

6.5.2. Likelihood Bersama: Model JGIG

Model sekawan Gamma-Inverse Gamma Model (selanjutnya disingkat Mo-

del GIG) telah didefinisikan pada Tirta [38]. Distribusi bersama merupakan

hasil kali distribusi bersyarat y|γ dengan distribusi efek acak γ. Sedangkan

log-likelihood bersama merupakan jumlah log-likelihood bersyarat dengan

log-likelihood dari efek acak.

Data dimodel dalam bentuk efek tetap (β) dan log dari efek acak

log(U) = v, dengan y = g−1(Xβ + Zv) + ε, dengan g(x), adalah fungsi

hubungan. Matriks y adalah matriks data dan X matrix desain. Matriks

ZT = [ZT1 ZT

2 . . . ZTi . . .ZT

m], dengan Zi adalah matriks ni × m dengan

Page 380: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

379 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

unsur 0 dan 1 mengindikasikan setiap efek acak yang diaplikasikan. Unsur

zij,k, (yaitu baris ke j dan kolom ke k dari matriks Zi) untuk i, k = 1, . . . ,m

dan j = 1, . . . , ni, dengan z(ij,k) = 1 untuk i = k, dan 0 untuk i 6= k.

Likelihood bersama antara y dan efek acak γ adalah:

f(y,γ) =

m∏i=1

ni∏j=1

(yν−1ij

Γ(ν)

µij

)ν)γ−niνi exp

ni∑t=1

yitµit

)γ−1i

×

(α− 1)α

Γ(α)γ−(α+1)i exp

(−α− 1

γi

). (6.12)

Sedangkan log-Likelihood inti dari y dan v = log(γ) untuk y ∼ GIG(µ, ν, α),

adalah:

h(µ,v, ν, α) =

m∑i=1

ni∑j=1

l1(yij , µij , ν|vi) +

m∑i=1

l2(vi, α) (6.13)

Dalam persamaan di atas, l1(yij , µij , ν|vi) adalah log-likelihood untuk y|γyaitu

l1(yij , µij , ν|γi) = − ln

Γ(ν)

+ νln(νyij)− ln(µ′ij) − ln(yij)−νyijµ′ij

,

Page 381: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

380 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dengan µ′ij = µij exp(vi). Sedangkan l2(vi, α) adalah log-likelihood dari log

effect acak, v = ln(γ), yaitu

l2(vi, α) = α ln(α− 1)− ln

Γ(α)−viα+

α− 1

exp(vi)

. (6.14)

Bentuk likelihood bersama ini selanjutnya dijadikan dasar untuk mengesti-

masi parameter (β,v, ν dan α) dengan menggunakan pendekatan likelihood

maksimum.

6.5.3. Estimasi Parameter β dan v

Estimasi Parameter β dan v dapat dilakukan dengan dua cara yaitu de-

ngan cara bergantian (alternate algorithm) dan secara simultan (simulta-

neous/multivariate algorithm)

Estimasi Bergantian β dan v

Dengan cara ini, β dan v diestimasi secara bergantian sampai syarat kon-

vergensi secara keseluruhan terpenuhi.

Page 382: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

381 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Turunan dan Persamaan score β

Turunan fungsi log-likelihood bersama seperti persamaan (6.13), terhadap

β dan v, dicari dengan memperhatikan bahwa:

1. bersyarat terhadap random effect v, respon yij adalah saling inde-

penden dengan nilai-tengah µ′ij = µijui. Ui adalah random efek/efek

acak dan bila berdistribusi inverse gama biasa dinotasikann dengan

γi;

2. distribusi yij adalah gamma dengan rataan µ′ij .

3. β hanya ada pada bagian likelihood bersyarat, jadi estimasi β|v atau

β|u dapat mengikuti atau prosedur GLM yang dapat dirumuskan

secara umum

bs = bs−1 +

(m∑i=1

XTi WiXi

)−1 m∑i=1

XTi Wi∆i(yi−µ′i)

∣∣∣∣∣∣s−1

.

(6.15)

dengan

(a) ∆i =adalah matriks diagonal dengan(∂η′ijµ′ij

)yang bergantung

Page 383: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

382 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

pada fungsi hubungan/link yang dipakai. Untuk link-log,

∆i =

diag(

1µ′ij

)(b) Wi adalah matriks diagonal dengan unsur diberikan oleh:

wij =

(∂µ′ij∂η′ij

)21

V (µ′ij). (6.16)

V (.) adalah fungsi ragam yang bergantung pada jenis distribusi

yang dipakai. Untuk distribusi gamma V (µ′ij =(µ′ij

)2sehingga

menghasilkan Wi = In. Untuk distribusi lain misalnya Poisson

dengan link-log, maka V (µ′ij =(µ′ij

)sehingga Wi=diag

(µ′ij

)(lihat pada Dobson [11] dan McCullagh & Nelder [24]).

Dengan demikian hasil yang diperoleh untuk Gamma-HGLM dapat diper-

luas untuk distribusi lainnya dengan sedikit melakukan modifikasi pada

fungsi link dan fungsi ragamnya.

Page 384: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

383 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Turunan log-likelihood terhadap v

Turunan pertama h(y,µ,v) terhadap v bersyarat β adalah

Dv =∂h(y,µ,v)

∂v,

Dv adalah vektor dengan ukuran m dengan unsur ke i, di,

di =∂h(y,µ,v)

∂vi=∂l1(y,µ|v)

∂vi+∂l2(v, α)

∂vi.

Untuk i 6= i′, vi dan vi′ adalah saling independen, maka

∂h(y,µ,v)

∂vi=∂l1(y,µ|vi)

∂vi+∂l2(vi, α)

∂vi

=

ni∑j=1

∂l1(yij , µ′ij |vi)

∂vi+∂l2(vi, α)

∂vi.

φ∂h(y,µ,v)

∂vi=

ni∑j=1

(νyijµ′ij− ν

)− α+

α− 1

exp(vi)

ni∑j=1

yijµij exp(vi)

− niν − α+α− 1

exp(vi). (6.17)

Page 385: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

384 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Persamaan di atas kebetulan memiliki penyelesaian analitik sehingga unsur

ke-i dari v, vi, dapat dihitung langsung tanpa iterasi dengan

vi = ln(γi) = ln

ν∑ni

j=1

yijµij

+ α− 1

niν + α

. (6.18)

Algorithma estimasi bergantian dari β dan v adalah:

1. tentukan nilai awal untuk |beta,v dan parameter dispersinya;

2. ulangi langkahberikut sampai konvergen

(a) hitung nilai β dengan prpsedur GLM;

(b) perbarui nilai v dengan persamaan (6.18).

Mengingat kita bisa memanfaatkan pustaka GLM yang talah ada, imple-

mentasi algoritma ini ke program komputer sangat sederhana (strightfor-

ward).

Estimasi Simultan β dan v

Pendugaan β and v dilakukan dengan metode Newton-Raphson. Untuk

itu dibutuhkan turunan fungsi log-likelihood terhadap β dan v yang dapat

Page 386: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

385 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dirangkum seperti berikut ini.

∂l(µ|v)

∂β=φ−1

m∑i=1

(∂η′i∂β

)SiV

−1i (yi − µi′), (6.19)

atau

∂l(µ|v)

∂β=φ−1

m∑i=1

(∂η′i∂β

)Wi∆i(yi − µi′), (6.20)

dengan

Si−1 =∆i =

∂η′i∂µi

′ = diag

(∂η′ij∂µ′ij

). (6.21)

Pada persamaan di atas Wi = diag(wij) = SiV−1i Si = ∆−1i V−1i ∆−1i yaitu

Wi∆i = SiV−1i , dengan Vi matriks diagonal yang unsurnya adalah fungsi

.

Turunan pertama dari likelihood bersama terhadap v, diturunkan

dari (6.13) yang menghasilkan bentuk matriks

∂h(µ,v)

∂v= φ−1

m∑i=1

ZTi Wi∆i(yi−µ′i) + d

, (6.22)

Page 387: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

386 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dengan d = ∂l(v, α)/∂v adalah vektor dengan panjang m dan unsur ke i

adalah di = φ∂l(v, α)

∂vi, i = 1, 2, . . . ,m.

Matriks informasi bersama antara β dan v

Nilai harapan turunan kedua dari fungsi likelihood bersama terhadap v

adalah

E

(∂2h(µ,v)

∂v ∂vT

)= −φ−1

(m∑i=1

ZTi WiZi −

∂d

∂vT

).

Jadi

Iv = φ−1

(m∑i=1

ZTi WiZi + U

)(6.23)

untuk U = diag

−φ∂

2l(α, v)

∂v2i

= diag

α− 1

ν exp(vi)

; i ∈ 1, 2, . . . ,m.

Page 388: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

387 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Turunan silang

−E∂2h(µ,v)

∂β ∂vT

=φ−1

m∑i=1

XTi WiZi, dan

−E∂2h(µ,v)

∂v ∂βT

=φ−1

m∑i=1

ZTi WiXi.

Jadi, matriks informasi bersama terhadap β dan v adalah I = φ−1H

, dengan

H =

[ ∑XT

i WiXi∑

XTi WiZi∑

ZTi WiXi

∑ZTi WiZi + U

].

Persamaan Skor untuk pendugaan β dan v

Langkah ke s dari persamaan skor untuk pendugaan β dan v pada suatu

nilai ν dan α, adalah[b

v

]s

=

[b

v

]s−1

+ H−1

[ ∑XT

i Wi∆i(yi − µ′)∑ZTi Wi∆i(yi − µ′) + d

]∣∣∣∣∣s−1

, (6.24)

dengan subskrip (s− 1) berarti rumus tersebut dinilai menggunakan hasil

pada langkah ke(s− 1).

Page 389: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

388 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.5.4. Pendugaan parameter dispersi ν dan α

Pendugaan parameter dispersi menggunakan likelihood yang disesuaikan

seperti disarankan oleh Cox & Reid [7], McCullagh & Tibshirani [25] dan

Lee & Nelder [20]. Penyesuaian menghasilkan h-log-likelihood yang disesu-

aikan untuk pendugaan ν and α pada HGLMs hA = h − 1

2ln |2πφH| =

h +1

2ln∣∣2πφH−1

∣∣ , dengan h adalah log-likelihood bersama (6.13) dan

φH−1 adalah matriks informasi untuk (β,v)T .

Pendugaan parameter dispersi dilakukan menggunakan metode it-

erasi Newton-Raphson, yaitu θs = θs−1 −H−1θθDθ|s−1, dengan θ = (ν, α)T

dan

Dθ =

∂hA∂ν

∂hA∂α

; HθθT =

∂2hA∂ν2

∂2hA∂α∂ν

∂2hA∂ν∂α

∂2hA∂α2

.

Unsur-unsur matriks adalah sebagai berikut ini.

Page 390: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

389 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

∂ha∂ν

=m∑i=1

ni∑j=1

digamma(nu) + ln

νyijµ′ij− yijµ′ij

+ 1

+

− 1

2

m+ rank(X)

ν+ trace

(KUν

). (6.25)

∂hA∂α

=m∑i=1

(−∂ ln

Γ(α)

∂α

α− 1+ ln(α− 1)− vi −

1

exp(vi)

)

− 1

2trace

(KUα

). (6.26)

∂2hA∂ν2

= −N∞∑r=1

1

(ν + r − 1)2+N

ν+

1

2

(m+ rank(X)

ν2

−traceK(Uν,ν)

+ trace

(KUν)(KUν)

). (6.27)

∂2hA∂α2

=

m∑i=1

−∞∑r=1

1

(α+ r − 1)2− α

(α− 1)2+

2

α− 1

+1

2trace

(KUα)(KUα)

. (6.28)

∂2hA∂ν ∂α

= −1

2

trace(KUν,α)− trace(KUν)(KUα)

(6.29)

Page 391: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

390 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.5.4.1. Prosedur Pendugaan

Model yang diperoleh memiliki banyak parameter. Beberapa diantaranya

lebih mudah diduga dibanding yang lainnya. Jadi pendugaan secara serem-

pak menggunakan model multivariat penuh akan tidak efisien. Smyth ([33]

dan [34]) menyarankan untuk mengelompokkan parameter sesuai dengan

kemudahan pendugaannya dan selanjutnya memanfaatkan algoritma par-

tissi. Salah satu algoritma yang diajukan disebut prosedur coupled. Prose-

dur ini terdiri atas dua kelompok putaran yaitu putaran dalam dan putaran

luar. Pada putaran dalam beberapa parameter yang sejenis diestimasi de-

ngan metode Newton-Raphson atau metode Skor Fisher. Kriteria konver-

gensi secara keseluruhan dilakukan secara global yaitu apabila kriteria pada

masing-masing putaran dalam telah tepenuhi.

Secara ringkas prosedur tersebut dapat dirumuskan sebagai berikut.

1. Tentukan nilai awal β0,v0, α0, ν0.

2. Kondisional terhadap α0, ν0 lakukan pendugaan β dan v.

3. Kondisional terhadap nilai baru β dan v lakukan pendugaan ter-

hadap (α, ν).

4. Ulangi prosedur di atas sampai konvergensi global terpenuhi.

Page 392: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

391 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.5.5. Analisis HGLM dengan R

Sebagaimana disebutkan sebelumnya, secara umum metode HGLM belum

terimplemantasikan ke paket komputer yang banyak beredar. Namun,

khusus untuk metode JGIG, paket analisis telah dirintis. Penggunaannya

adalah sebagai berikut

hglm(formula, distribusi = Gamma(link=log),

data, cluster, subset=NULL, na.action, offset,

start.coef = NULL, start.sigma = NULL,

control = glm.control(epsilon = 1e-08, maxit =

100, trace = FALSE), n.points = 16)

formula : deskripsi simbolik dari model yang dicoba

(dinyatakan dalam bentuk y~x1+x2...)

distribusi : jenis distribusi dan fungsi link yang diasumsikan

untuk respon. Untuk sementara distribusi yang

berlaku hanya distribusi Gamma dengan fungsi

link=Log. Distribusi dan link ini sekaligus

menjadi nilai default.

data : data frame yang memuat variabel yang dipanggil

Page 393: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

392 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

dalam formula.klaster : variabel yang berfungsi sebagai klaster yang

diperlakukan sebagai efek acak

offset : dapat dipergunakan untuk menentukan nilai komponen

yang telah diketahui yang mau diikutsertakan dalam

prediktor. Komponen ini dimodelkan dengan

koefisien1 (opsional)

Pada contoh berikut data adalah data tentang pohon jeruk (Orange)

yang berisi umur phon (age), lingkaran pohon (circumference) untuk berba-

gai jenis pohon (Tree). Dalam konteks HGLM dapat dianggap bahwa pen-

gukuran dihasilkan dari beberapa jenis pohon (Tree) yang dimati untuk

beberapa tingkat usia dan diukur besar lingkaran bantangnya. Dalam hal

ini Tree dapat diperlakukan sebagai peubah yang menunjukkan adanya

pengukuran berulang.

data(Orange)

attach(Orange)

hglm(circumference~age, distribusi=Gamma(link=log),

klaster=Tree,data=Orange)

Hasil yang diperoleh adalah sebagai berikut.Estimator dan SE parameter tetap dengan memperhitungkan

Page 394: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

393 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

efek acak

Komponen Penduga Kesalahan Nilai_t Nilai_P

baku

(Intercept) 3.542547344 8.607523e-02 41.15641 0.000000e+00

age 0.001174635 8.262093e-05 14.21716 1.232348e-14

Besarnya Parameter Dispersi Respon = 0.05615005

Besarnya Parameter Dispersi Efek Acak = 2.082785

Banyaknya klaster sebagai efek acak 5

dengan frekwensi dari 7 sampai 7

Penduga efek acak dengan asumsi inverse gamma

Min. 1st Qu. Median Mean 3rd Qu. Max.

0.8187 0.8764 0.9243 0.9845 1.1440 1.1590

Sebagai perbandingan, jika analisis menggunakan gee() dengan struk-

tur korelasi seragam, diperoleh hasil yang hampir sama, yaitu:

Model:Link: Logarithm

Page 395: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

394 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Variance to Mean Relation: Gamma

Correlation Structure: Exchangeable

Call:

gee(formula = circumference ~ age, id = Tree, data = Orange,

family = Gamma(link = log), corstr = "exchangeable")

Summary of Residuals:

Min 1Q Median 3Q Max

-81.517777 -10.244679 -3.616427 12.901823 55.383573

Coefficients:

Estimate Naive S.E. Naive z Robust S.E. Robust z

(Intercept)3.5244517 9.203927e-02 38.29291 4.409318e-02 79.93190

age 0.0011859 7.020315e-05 16.89202 4.072747e-05 29.11728

Estimated Scale Parameter: 0.05615

Number of Iterations: 1

Perbedaan antara gee() dengan JGIG yang diajukan di atas adalah:

Page 396: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

395 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

1. gee() hanya didasarkan hubungan bentuk momen, Gamma-HGLM,

khususnya JGIG, menggunakan likelihood penuh, untuk JGIG diper-

gunakan likelihood bersama (joint likelihood);

2. dengan gee() kita dapat memilih alternatif struktur korelasi, tetapi

dengan Gamma-HGLM hanya menggunakan struktur korelasi ser-

agam;

3. dengan gee() model yang diperoleh adalah model rata-rata populasi

(marjinal), tetapi dengan JGIG model yang diperoleh adalah mo-

del individu (efek acak diestimasi secara eksplisit, sehingga prediksi

individu lebih akurat).

Page 397: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

396 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.6. Bacaan Lebih Lanjut

Referensi model linier dengan pendekatan GEE dalam bentuk buku teks

masih sangat jarang, diantaranya adalah Diggle et al. [10]. Sedangkan

dalam bentuk jurnal cukup banyak diantarnya adalah yang ditulis langsung

oleh Liang dengan kawan-kawannya seperti: Liang & Zeger [21], Zeger &

Liang [52], Waclawiw & Liang [50], Liang et al. [22], Zeger & Liang [53], dan

Zeger et al. [54]. Model linier dengan pendekatann HGLM termasuk model

linier yang relatif baru dan masih sedang dikembangkan (lihat misalnya Lee

dan Nelder [20] dan Tirta [37]). Publikasi HGLM terkait dengan aplikasi

program R dapat dibaca pada Tirta et.al [45] dan Tirta et.al [44].

Page 398: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

397 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.7. Ringkasan

1. Analisis regresi dengan data yang mengandung respon multivariat,

misalnya data yang dikukur secara berulang baik diukur dengan ku-

run waktu berbeda maupun dengan perlakuan berbeda, dapat di-

lakukan dengan beberapa alternatif seperti GEE, GLMM, dan HGLM.

2. GEE tidak menggunakan metodelekelihood lengkap, tetapi menggu-

nakan pendekatan marjinal dengan menetapkan bentuk momen per-

tama (nilai tengah) dan momen keduanya (ragam-koragam).

3. Paket GEE pada R menyediakan berbagai alernatif bentuk distribusi

seperti halnyapada GLM dan berbagai bentuk korelasi (seperti ser-

agam, AR-M, saling bebas).

4. HGLM menggunakan pendekatan likelihood murni dengan model

bertingkat sehingga menghasilkan bentuk likelihood marjinal yang

dapat dilacak, atau menggunakan pendekatan lain (misalnya Lap-

place dan Markov Chained Monte Carlo). Dalam buku ini hanya

dibatasi pada bentuk sekawan yaitu Gamma-Inverse-Gamma dan

Poisson-Gamma. Model ini menghasilkan bentuk korelasi seragam.

Page 399: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

398 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

6.8. Latihan Soal-soal

1. Berikan tiga contoh pengamatan yang menghasilkan data dengan re-

spon multivariat.

2. Secara teoritis, jelaskan bilamana penggunaan model korelasi ex-

changeable sesuai.

3. Secara teoritis, jelaskan bilamana penggunaan model korelasi se-

rial/auto regressive-1 sesuai.

4. Dalam menggunakan paket gee,apa yang sesungguhnya dilakukan

apabila kita memilih alternatif berikut:

(a) bentuk korelasi="independence", dengan berbagai bentuk dis-

tribusi/ family dan link.

(b) bentuk korelasi="independence", dengan bentuk bentuk dis-

tribusi/ family=="gaussian" dan link="identity".

5. Lakukan eksplorasi pada fungsi geese pada paket geepack. Band-

ingkan struktur dan hasilnya dengan paket gee.

Page 400: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

399 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

GLOSARIUM

A

AIC Akaike’s Information Criterion adalah salah satu kriteria yang

dijadikan patokan memilih model yang baik dengan menghi-

tung perimbangan besarnya maksimum likelihood dan banyak-

nya variabel yang dipergunakan dalam model.

alpha(α) Taraf signifikansi = peluang kesalahan tipe I, peluang secara

Page 401: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

400 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

keliru menolak hipotesis null yang benar.

B

Boxplot tampilah grafis dari kuantil data yang dinyatakan dalam bentuk

kotak. Pada Boxplot digambarkan posisi median (Q2), kuantil

1(Q1) dan kuantil 3(Q3). Boxplot juga memberi gambaran ada

tidaknya pencilan (outlier).

C

CLI Command Line Interface adalah program yang menjembatani

komunikasi antara komputer dengan pengguna dengan meng-

gunakan perintah-perintah yang ditulis dalam baris perintah,

tidak menggunakan grafis ataupun maouse. CLI merupakan

interface utama dari R.

D

derajat kebebasan Angka yang menunjukkan banyaknya informasi yang

saling bebas setelah mengestimasi beberapa parameter.

Page 402: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

401 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Diagram Pencar (Scattergram) Diagram pencar adalah representasi gra-

fik dari distribusi dua peubah acak yang disajikan dalam ben-

tuk titik-titik dengan koordinat ditentukan oleh nilai observasi

pasangan peubah acak tadi.

distribusi diskrit sebaran yang memiliki fungsi kepadatan dengan daerah

asal (domain) berupa himpunan titik-titik yang tercacah (mi-

salnya sebagian himpunan bilangan cacah, sebagian himpunan

bilangan asli).

distribusi kontinu sebaran yang memiliki fungsi kepadatan dengan daerah

asal (domain) berupa himpunan interval (misalnya seluruh bi-

langan real, bilangan real nonnegatif, a < x < b.).

distribusi Normal Baku Distribusi Normal dengan nilai-tengah 0 dan ra-

gam 1.

E

estimasi interval/selang keyakinan Interval/Selang Keyakinan adalah se-

lang yang diyakini memuat nilai parameter populasi dengan

Page 403: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

402 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

tingkat peluang tertentu. Tingkat peluang yang banyak di-

pakai adalah 95% dan 99%.

estimasi titik Nilai tertentu yang merupakan penduga suatu parameter.

G

GLM GLM Generalized Linear Models atau Model Linear Tergeneral-

isir/ Terampat adalah analisis regresi untuk respon-respon yang

tidak harus berdistribusi normal, tetapi masih dalam distribusi

keluarga eksponensial (misalnya Poisson, Binomial, Gamma).

Dalam GLM hubungan antara mean/ nilai-tengah respon dan

peubah penjelas bisa berupa fungsi log, resiprokal atau fungsi

lainnya.

GUI Graphical User Interface adalah program yang menjembatani

komunikasi antara komputer dengan pengguna dengan meng-

gunakan tampilan grafis seperti menu atau ikon, yang biasanya

siap diklik dengan mouse. Program GUI untuk R biasa disebut

RGUI.

Page 404: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

403 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

H

hipotesis alternatif Disebut juga hipotesis kerja yaitu hipotesis yang diru-

muskan sesuai dengan hasil kajjian teori yang melandasi peneli-

tian.

hipotesis nul Disebut juga hipotesis nihil, yaitu hipotesis yang diuji pada

prosedur statistika, yang menyatakan kenetralan (tidak ada

beda signifikan, tidak ada hubungan signifikan dan sebagainya).

histogram Grafik yang menggunakan segiempat sebagai representasi frekuensi

atau peluang dari observasi pada setiap interval.

J

Jarak Cook Suatu ukuran yang menunjukkan pengaruh suatu nilai penga-

matan pada regresi berganda.

K

Keluarga Eksponensial Keluarga Eksponensial adalah distribusi yang meru-

pakan kesatuan (unifikasi) distribusi-distribusi penting yang

Page 405: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

404 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

banyak dipakai seperti antara lain Normal, Gamma, Binom-

ial, Poisson dalam satu bentuk distribusi.

kolinieritas Kondisi yang ditunjukkan oleh adanya peubah penjelas saling

berkorelasi satu sama lain.

Konformabel Dua matrik dikatakan komformabel apabila kepada kedu-

anya dapat dilakukan operasi matriks biner. Untuk operasi

penjumlahan disebut konformabel terhadap penjumlahan. Ma-

triks yang komformabel terhadap penjumlahan berordo sama.

Untuk operasi perkalian disebut konformabel terhadap per-

kalian. Matriks yang konformabel terhadap perkalian adalah

sedemikain hingga banyaknya kolom matriks terkali sama de-

ngan banyaknya baris matriks pengali.

M

matriks bentuk kuadrat quadratic form adalah matrika yang berbentuk

yTAy dengan vektor peubah, dan A matriks simetrik. Pada

dasarnya matriks ini berordo 1× 1.

Matriks Diagram Pencar Matriks Diagram Pencar (Scatter Plot Matrix)

Page 406: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

405 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

adalah matriks yang menggambarkan diagram pencar lebih dari

dua variabel. Pada diagonal biasanya disajikan densitas, his-

togram atau diagram kuantil, sedangkan pada off diagonal dis-

ajikan diagram pencar masing-masing pasangan variabel.

matriks ragam-koragam adalah matriks simetris yang unsur diagonaluta-

manya merupakan ragam dari peubah-peubah, sedangkan un-

sur di luar diagonal utama merupakan koragam dari peubah

yang bersesuaian, misalnya mii = σ2i ,mij = σij .

model Istilah lain untuk regresi peubah ganda, terdiri atas model li-

nier, model linier terampat/tegreneralisir, model nonlinier, mo-

del linier campuran dan lain-lain.

N

Nilai p Termasuk peluang kesalahan tipe I, yaitu peluang yang menun-

jukkan bahwa hasil yang dicapai merupakan hal yang kebetulan

jika ternyata Ho benar.

Page 407: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

406 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

O

Open Sources Open Source adalah program komputer yang dikembangkan

dengan kode (source code) terbuka yang dapat diakses dan di-

modifikasi orang lain.

ordo matriks adalah bilangan yang menunjukkan banyaknya baris dan

banyaknya kolom suatu matriks Am×n menunjukkan matriks

terdiri atas m baris n kolom.

Outlier/pencilan Pencilan adalah data yang besarnya menyimpang dari

kelompoknya melebihi batas kewajaran distribusi data.

P

Parameter Parameter (statistika) adalah ukuran deskriptif numerik dari

populasi.

Populasi Populasi adalah kumpulan seluruh data yang menjadi perha-

tian dalam penelitian. Jadi populasi adalah seluruh subjek

penelitian beserta karakteristiknya yang menjadi kepentingan.

Pustaka Pustaka (library), khususnya dalam program S-Plus dan R,

adalah kumpulan paket- paket program yang dibuat khusus

Page 408: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

407 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

untuk keperluan tertentu yang merupakan pengayaan dari pro-

gram utama/inti R atau SPlus.

Q

QQPlot QQplot atau Plot Kuantil adalah diagram yang menggambarkan

hubungan antara quantil teoritis suatu distribusi dengan kuan-

til riil suatu data. Khusus untuk distribusi normal grafiknya

disebut QQnorm.

S

sampel Sampel adalah sebagian dari populasi yang secara representatif

mewakili populasi.

sisa/residu Selisih antara nilai observasi Y dengan nilai prediksinya ( Y ).

skrip Skrip adalah naskah yang berisi berbagai perintah yang harus

dilaksanakan oleh komputer melalui suatu bahasa atau pro-

gram tertentu.

Page 409: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

408 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Page 410: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

409 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

DAFTAR PUSTAKA

[1] H. Akaike. Information theory and extension of maximum likelihood

theory. In B.N. Petrov and F. Csahi, editors, 2nd Symposium on

Information Theory, pages 267–281. Buddapest, 1972.

[2] G.P. Beaumont. Intermediate Mathematical Statistics. Chapman and

Hall, London, 1st edition, 1980.

Page 411: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

410 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

[3] Bowerman,B.L. R.T. Cornell and D.A. Dickey. Linear Statistical Mod-

els, an Appplied Approach. Duxbury Press, Boston, 1986.

[4] P.J. Burns. S Poetry. http://www.r-project.org, 1998.

[5] J.M. Chamber and T.J. Hastie. Statistical Model in S. Chapman and

Hall, London, 1992.

[6] D.R. Cox and D.V. Hinkley. Theoretical Statistics. Chapman and Hall,

London, 1st edition, 1974.

[7] D.R. Cox and N. Reid. Parameter orthogonality and approximate

conditional inference. J. R. Statist. Soc., 49:1–39, 1987.

[8] Crawley. Statistical Computing: An Introduction to Data Analysis

using S-Plus. Wiley, England, 2004.

[9] M. Davidian and D.M. Giltinan. Nonlinear Models for Repeated Mea-

surement Data. Chapman and Hall, London, 1995.

[10] Diggle P.J., K-Y. Liang and S.L. Zeger. Analysis of Longitudinal Data.

Oxford Science Publications, London, 1st edition, 1994.

[11] A.J. Dobson. An Introduction to Generalized Linear Models. Chapman

and Hall, London, 1990.

Page 412: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

411 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

[12] J.J. Faraway. Practical Regression and Anova Using R.

http://www.stat. Isa.umic.edu/∼faraway/book/, 2002.

[13] D.A. Harville. Matrix Algebra From a Statistician’s Perspective.

Springer, New York, 1997.

[14] T.J. Hastie & R.J. Tibshirani. Generalized Additive Models. Chapman

& Hall, London, 5th edition, 1990.

[15] J.S.U. Hjortn. Computer Intensive Statistical Methods: Validation,

Model Selection and Bootstap. Chapman & Hall, London, 1994.

[16] R.V. Hogg and A.T. Craig. Introduction to Mathematical Statistics.

Prentice-Hall, Englewood Cliffs, 5th edition, 1995.

[17] M.G. Kenward and D.M. Smith. Computing the generalized estimating

equation for repeated measurements. Genstat Newsletter, 32:50–62,

1995.

[18] P. Kuhnert and B. Venables. An Introduction to R: Software

for Statistical Modelling & Computing. CSIRO, http://cran.r-

project.org/doc/contrib/Kuhnert+Venables-R Course Notes.zip,

2005. [17 April 2006].

Page 413: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

412 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

[19] N.M. Laird and J.H. Ware. Random effects models for longitudinal

data. Biometrics, 38:963–974, 1982.

[20] Y. Lee and J.A. Nelder. Hierarchical generalized linear models. J.R.

Statist. Soc., 58:619–678, 1996.

[21] K-Y Liang and S.L. Zeger. Longitudinal data analysis using general-

ized linear models. Biometrika, 73:13–22, 1986.

[22] Liang,K-Y, S.L. Zeger and B. Qaqish. Multivariate regression analyses

for categorical data (with discussion). J.R. Statist. Soc., 54:3–40, 1992.

[23] J.H. Maindonald. Using R for Data Analysis and Graphics An Intro-

duction. ANU-Australia, June 2001.

[24] P. McCullagh and J.A. Nelder. Generalized Linear Models. Chapman

and Hall, London, 2nd edition, 1989.

[25] P. McCullagh and R. Tibshirani. A simple method for the adjustment

of profile likelihoods. J. R. Statist. Soc., 52:325–344, 1990.

[26] W. Mendenhall. Introduction to Probability and Statistics. Duxbury,

Belmont USA, 5th edition, 1979.

Page 414: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

413 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

[27] W. Mendenhall. Beginning Statistics A to Z. Duxbury, Belmont USA,

1993.

[28] P.L. Meyer. Introductory Probability and Statistical Applications.

Addison-Wisley Pub. Co., Massachusets, 2nd edition, 1970.

[29] P Murrell. R Graphics. Chapman& Hall/CRC, 2006.

[30] J.A. Nelder and R.W.M. Wedderburn. Generalized linear models.

J.R.Statist.Soc., 57:359–407, 1972.

[31] Neter J., W. Wasserman and M.H. Kutner. Applied Linear Statistical

Models. Irwin, Illinois, 2nd edition, 1985.

[32] S.R. Searle. Matrix Algebra Useful for Statistics. John Wiley and Sons,

New York, 1st edition, 1982.

[33] G.K. Smyth. Generalized linear models with varying dispersion. J.R.

Statist. Soc, 51:47–60, 1989.

[34] G.K. Smyth. Partitioned algorithms for maximum likelihood and other

nonlinear estimation. Statistics and Computing, 6:201–216, 1996.

[35] StatSoft. Electronic Statistics Textbook. http://www.statsoftinc.com/

textbook/ stathome.html, 2006.

Page 415: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

414 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

[36] N.H. Timm. Multivariate Analysis with Applications in Education and

Psychology. Brooks/Cole, California, 1975.

[37] I M. Tirta. Analysis of Gamma Data with Random Effects. PhD thesis,

Department of Mathematics Statistics and Computing Sciences, The

University of New England, Armidale, NSW Australia, 1999.

[38] I M. Tirta. The conjugate model for gamma data with random effects.

A paper submitted for MIHMI (Majalah Ilmiah Himpunan Matema-

tika Indonesia), 1999.

[39] I M. Tirta. Marginal likelihood appraoch in Gamma-Inverse-Gamma

model. Proceeding of The SEAMS (South East Asian Mathematical

Society)-GMU(Gadjah Mada University, 26-29 July 1999, pages 454–

462, 1999.

[40] I M. Tirta. The conjugate model in Gamma data with random ef-

fetcs. MIHMI (Journal of Indonesian Mathematical Society), 6(1):57–

78, 2000.

[41] I M. Tirta. A nonconjugate model for Gamma data with random

effects. Jurnal Ilmu Dasar (Journal of Basic Sciences), 1(1):46–58,

2000.

Page 416: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

415 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

[42] I M. Tirta. Buku Panduan Program Statistika R. Penerbit Universitas

Jember, Jember, 2005. ISBN 979-8176-37-5.

[43] I M. Tirta. Analisis Data dengan Aplikasi R. Andi Offset, Yogya,

2008. Naskah Buku Teks disetujui DIKTI dan sedang diajukan ke

Percetakan Andi Offset.

[44] Tirta I M. Lestari B. & Dewi Y. S. Estimasi efek tetap dan acak pada

model multiplikatif dengan likelihood bersama. Jurnal Ilmu Dasar,

7(1), 2006.

[45] Tirta I M. Lestari B. & Dewi Y. S. Estimasi efek tetap dan efek acak

pada model multiplikatif dengan aplikasi open source software (oss)-r.

Jurnal Teknologi. ACADEMIA ISTA, 11(2):195–202, 2007.

[46] W.N. Venables and B.D. Ripley. Modern Applied Statistics with S-plus.

Springer, New York, 1994.

[47] W.N. Venables and B.D. Ripley. Modern Applied Statistics with S-plus.

Springer, New York, 3rd edition, 1996.

[48] J. Vezalini. Using R for Introductory Statistics. http://www.r-

project.org, 2002.

Page 417: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

416 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

[49] Wackerly D.D., Mendenhall W. &Scheafer R. L. . Mathematical Statis-

tics with Application. Duxbury, Belmont USA, 5th edition, 1996.

[50] M.A. Waclawiw and K-Y Liang. Prediction of random effects in the

generalized linear model. J. Amer. Statist. Assoc., 88:171–178, 1993.

[51] R.W.M. Wedderburn. Quasi-likelihood functions, generalized linear

models, and the Gauss-Newton method. Biometrika, 61:439–447, 1974.

[52] S.L. Zeger and K-Y. Liang. Longitudinal data analysis for discrete and

continuous outcomes. Biometrics, 42:121–130, 1986.

[53] S.L. Zeger and K-Y. Liang. An overview of methods for the analysis

of longitudinal data. Statistics in Medicine, 11:1825–1839, 1992.

[54] S.L. Zeger, K-Y. Liang and P.S. Albert. Models for longitudinal data:

A generalized estimating equation approach. Biometrics, 44:1049–

1060, 1988.

[55] V. Zoonekyn. Statistics with R. http://zoonek2.free.fr/

UNIX/48 R/all.html, 2005.

Page 418: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

417 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

LAMPIRAN A

BEBERAPA FUNGSI TERKAIT REGRESI

Page 419: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

418 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

A.1. Fungsi dari Paket stats

AIC(object, ..., k = 2)

glm(formula, family = gaussian, data, weights, subset,

na.action, start = NULL, etastart, mustart,

offset, control = glm.control(...), model = TRUE,

method = "glm.fit", x = FALSE, y = TRUE, contrasts = NULL, ...)

lm(formula, data, subset, weights, na.action,

method = "qr", model = TRUE, x = FALSE, y = FALSE,

qr = TRUE, singular.ok = TRUE, contrasts = NULL,

offset, ...)

nlm(f, p, ..., hessian = FALSE, typsize = rep(1, length(p)),

fscale = 1, print.level = 0, ndigit = 12, gradtol = 1e-6,

stepmax = max(1000 * sqrt(sum((p/typsize)^2)), 1000),

steptol = 1e-6, iterlim = 100, check.analyticals = TRUE)

predict (object, ...)

Page 420: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

419 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

A.2. Fungsi dari Paket cars

qq.plot(x, ...)

scatterplot(x, ...)

scatterplot.matrix(x, ...)

Page 421: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

420 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

A.3. Fungsi dari Paket gam

gam(formula, family = gaussian, data, weights, subset,

na.action, start, etastart, mustart, control =

gam.control(...),model=FALSE, method, x=FALSE, y=TRUE, ...)

Page 422: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

421 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

A.4. Fungsi dari Paket graphics

boxplot(x, ...)

contour(x, ...)

abline(a, b, untf = FALSE, ...)

abline(h=, untf = FALSE, ...)

abline(v=, untf = FALSE, ...)

abline(coef=, untf = FALSE, ...)

abline(reg=, untf = FALSE, ...)

hist(x, ...)

persp(x, ...)

plot(x, y, ...)

segments(x0, y0, x1, y1,

col = par("fg"), lty = par("lty"), lwd = par("lwd"), ...)

Page 423: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

422 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

A.5. Fungsi dari Paket gee

gee(formula, id,

data, subset, na.action,

R = NULL, b = NULL,

tol = 0.001, maxiter = 25,

family = gaussian, corstr = "independence",

Mv = 1, silent = TRUE, contrasts = NULL,

scale.fix = FALSE, scale.value = 1, v4.4compat = FALSE)

Page 424: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

423 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

A.6. Fungsi dari Paket lme4

lmer(formula, data, family, method, control, start,

subset, weights, na.action, offset, contrasts,

model, ...)

nlmer(formula, data, control, start, verbose,

subset, weights, na.action, contrasts,

model, ...)

Page 425: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

424 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

A.7. Fungsi dari Paket hglm

hglm(formula, distribusi = Gamma(link=log), data, klaster,

subset=NULL, na.action, offset, start.coef = NULL,

start.sigma = NULL, control = glm.control(epsilon

= 1e-08, maxit = 100, trace = FALSE), n.points = 16,

gee=FALSE, plot=FALSE)

Page 426: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

425 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

A.8. Fungsi dari Paket glmmML

glmmML(formula, family = binomial, data, cluster, weights,

cluster.weights, subset, na.action,

offset, prior = c("gaussian", "logistic", "cauchy"),

start.coef = NULL, start.sigma = NULL, fix.sigma = FALSE,

control = list(epsilon = 1e-08, maxit = 200, trace = FALSE),

method = c("Laplace", "ghq"), n.points = 8, boot = 0)

glmmboot(formula, family = binomial, data, cluster, weights, subset,

na.action, offset, start.coef = NULL,

control = list(epsilon = 1e-08, maxit = 200, trace = FALSE), boot = 0)

Page 427: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

426 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

A.9. Skrip Manipulasi Grafik

plot(x,y, main="DIAGRAM BESAR DENGAN GRAFIK MINI")

abline(lm(y~x), col="blue")

op <- par(fig=c(.02,.5,.55,.98), new=TRUE)

hist(x, probability=T,

col="light blue", xlab="HistY", ylab="", main="", axes=F)

lines(density(x), col="red", lwd=2)

box()

op1 <- par(fig=c(.46,.98,.02,.45), new=TRUE)

qq.plot(x, main="QQNorm", dist="norm")

box()

par(op)

par(op1)

split.screen(c(1,2))

split.screen(c(2,1), screen = 2)

Page 428: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

427 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

screen(1)plot(x,y,main="Diagram Pencar (X,Y)")

abline(lm(y~x))

screen(3)

hist(y, probability=T,

main="Histogram Y")

lines(density(y), col="red", lwd=2)

screen(4)

qq.plot(x,main="QQ.norm X")

Page 429: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

428 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

A.10. Skrip Membangkitkan Data Regresi dengan

Peubah Kelompok

#simulasi data regresi dengan kelompok

require

n<-60 #genap

ns<-.5*n

sd<-20

g<-rep(c("L","P"),each=ns)

x1<-round(rnorm(n,50,8))

x2<-round(rnorm(n,50,8))

y1a<-10+x1[1:ns]*3.1+4*x2[1:ns]+rnorm(ns,0,sd)

y1b<-10+x1[(ns+1):n]*3+4*x2[(ns+1):n]+rnorm(ns,0,sd)

y1<-c(y1a,y1b)

y2a<-50+x1[1:ns]*3+4*x2[1:ns]+rnorm(ns,0,sd)

y2b<--50+x1[(ns+1):n]*3+4*x2[(ns+1):n]+rnorm(ns,0,sd)

y2<-c(y2a,y2b)

Page 430: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

429 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

y3a<-60-.5*x1[1:ns]-.5*x2[1:ns]+rnorm(ns,0,sd)y3b<--70+.5*x1[(ns+1):n]+x2[(ns+1):n]+rnorm(ns,0,sd)

y3<-c(y3a,y3b)

DataSimReg<-data.frame(y1,y2,y3,g,x1,x2)

Page 431: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

430 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Page 432: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

431 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

LAMPIRAN B

DATA UNTUK ILUSTRASI

Page 433: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

432 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.1. Data dari Paket actuardental Individual dental claims data set

gdental Grouped dental claims data set

hachemeister Hachemeister data set

Page 434: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

433 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.2. Data dari Paket ade4

abouheif.eg Phylogenies and quantitative traits from

Abouheif

acacia Spatial pattern analysis in plant communities

aminoacyl Codon usage

apis108 Allelic frequencies in ten honeybees

populations at eight microsatellites loci

ardeche Fauna Table with double (row and column)

partitioning

arrival Arrivals at an intensive care unit

atlas Small Ecological Dataset

atya Genetic variability of Cacadors

avijons Bird species distribution

avimedi Fauna Table for Constrained Ordinations

aviurba Ecological Tables Triplet

bacteria Genomes of 43 Bacteria

banque Table of Factors

baran95 African Estuary Fishes

bf88 Cubic Ecological Data

bordeaux Wine Tasting

Page 435: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

434 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

bsetal97 Ecological and Biological Traitsbuech Buech basin

butterfly Genetics-Ecology-Environment Triple

capitales Road Distances

carni19 Phylogeny and quantative trait of carnivora

carni70 Phylogeny and quantitative traits of carnivora

carniherbi49 Taxonomy, phylogenies and quantitative traits

of carnivora and herbivora

casitas Enzymatic polymorphism in Mus musculus

chatcat Qualitative Weighted Variables

chats Pair of Variables

chazeb Charolais-Zebus

chevaine Enzymatic polymorphism in Leuciscus cephalus

clementines Fruit Production

cnc2003 Frequenting movie theaters in France in 2003

coleo Table of Fuzzy Biological Traits

corvus Corvus morphology

deug Exam marks for some students

doubs Pair of Ecological Tables

dunedata Dune Meadow Data

ecg Electrocardiogram data

Page 436: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

435 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

ecomor Ecomorphological Convergence

elec88 Electoral Data

escopage K-tables of wine-tasting

euro123 Triangular Data

fission Fission pattern and heritable morphological

traits

friday87 Faunistic K-tables

fruits Pair of Tables

ggtortoises Microsatellites of Galapagos tortoises

populations

granulo Granulometric Curves

hdpg Genetic Variation In Human Populations

housetasks Contingency Table

humDNAm human mitochondrial DNA restriction data

ichtyo Point sampling of fish community

irishdata Geary's Irish Data

julliot Seed dispersal

jv73 K-tables Multi-Regions

kcponds Ponds in a nature reserve

lascaux Genetic/Environment and types of variables

lizards Phylogeny and quantitative traits of lizards

Page 437: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

436 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

macaca Landmarks

macon Wine Tasting

mafragh Phyto-Ecological Survey

maples Phylogeny and quantitative traits of flowers

mariages Correspondence Analysis Table

meau Ecological Data : sites-variables,

sites-species, where and when

meaudret Ecological Data : sites-variables,

sites-species, where and when

microsatt Genetic Relationships between cattle breeds

with microsatellites

mjrochet Phylogeny and quantitative traits of teleos

fishes

mollusc Faunistic Communities and Sampling Experiment

monde84 Global State of the World in 1984

morphosport Athletes' Morphology

newick.eg Phylogenetic trees in Newick format

njplot Phylogeny and trait of bacteria

olympic Olympic Decathlon

oribatid Oribatid mite

ours A table of Qualitative Variables

Page 438: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

437 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

palm Phylogenetic and quantitative traits of

amazonian palm trees

pap Taxonomy and quantitative traits of carnivora

perthi02 Contingency Table with a partition in Molecular

Biology

presid2002 Results of the French presidential elections of

2002

procella Phylogeny and quantitative traits of birds

rankrock Ordination Table

rhone Physico-Chemistry Data

rpjdl Avifauna and Vegetation

santacatalina Indirect Ordination

sarcelles Array of Recapture of Rings

seconde Students and Subjects

skulls Morphometric Evolution

steppe Transect in the Vegetation

syndicats Two Questions asked on a Sample of 1000

Respondents

t3012 Average temperatures of 30 French cities

tarentaise Mountain Avifauna

taxo.eg Examples of taxonomy

Page 439: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

438 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

tintoodiel Tinto and Odiel estuary geochemistry

tithonia Phylogeny and quantitative traits of flowers

tortues Morphological Study of the Painted Turtle

toxicity Homogeneous Table

trichometeo Pair of Ecological Data

ungulates Phylogeny and quantitative traits of ungulates.

vegtf Vegetation in Trois-Fontaines

veuvage Example for Centring in PCA

westafrica Freshwater fish zoogeography in west Africa

worksurv French Worker Survey (1970)

yanomama Distance Matrices

zealand Road distances in New-Zealand

Page 440: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

439 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.3. Data dari Paket agricolae

CIC Data for AMMI Analysis

ComasOxapampa Data AUDPC Comas - Oxapampa

Glycoalkaloids Data Glycoalkaloids

LxT Data Line by tester

RioChillon Data and analysis Mother and baby trials

carolina1 Data Carolina I

carolina2 Data Carolina II

carolina3 Data Carolina III

clay Data of Ralstonia population in clay soil

corn Data of corn

cotton Data of cotton

disease Data evaluation of the disease overtime

genxenv Data of potato yield in a different environment

grass Data for Friedman test

growth Data growth of trees

haynes Data of yield for nonparametrical stability

analysis

homog1 Data of frijol

huasahuasi Data of yield in Huasahuasi

Page 441: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

440 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

ltrv Data clones from the LTVR populationmarkers Data of molecular markers

melon Data of yield of melon in a Latin square

experiment

natives Data of native potato

pamCIP Data Potato Wild

paracsho Data of Paracsho biodiversity

plots Data for an analysis in split-plot

potato Data of cutting

ralstonia Data of population bacterial Wilt: AUDPC

rice Data of Grain yield of rice variety IR8

sinRepAmmi Data for AMMI without repetition

soil Data of soil analysis for 13 localities

sweetpotato Data of sweetpotato yield

trees Data of species trees. Pucallpa

wilt Data of Bacterial Wilt (AUDPC) and soil

Page 442: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

441 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.4. Data dari Paket asuR

BtheB Beat the Blues Data

BtheBlong Beat the Blues Data

budworm budworm data

cathedral Medieval cathedrals in England

flowers Flower

gala Species diversity on the Galapagos Islands

growth Weight Gain of two Species at different

Nitrogen Concentrations

houseflies Housfly Development

mytrees Simulated tree data

oring O-ring data

pea Pea data

plants Plant height

schoolclass Schools and Classes

unemployment data on long / short term unemployment

weight Weight Gain

wellplate wellplate

wellplate2 wellplate

wellplate3 wellplate

Page 443: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

442 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Page 444: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

443 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.5. Data dari Paket car

Adler Experimenter Expectations

Angell Moral Integration of American Cities

Anscombe U. S. State Public-School Expenditures

Baumann Methods of Teaching Reading Comprehension

Bfox Canadian Women's Labour-Force Participation

Blackmoor Exercise Histories of Eating-Disordered and

Control Subjects

Burt Fraudulent Data on IQs of Twins Raised Apart

Can.pop Canadian Population Data

Chile Voting Intentions in the 1988 Chilean

Plebiscite

Chirot The 1907 Romanian Peasant Rebellion

Cowles Cowles and Davis's Data on Volunteering

Davis Self-Reports of Height and Weight

DavisThin Davis's Data on Drive for Thinness

Duncan Duncan's Occupational Prestige Data

Ericksen The 1980 U.S. Census Undercount

Florida Florida County Voting

Freedman Crowding and Crime in U. S. Metropolitan Areas

Page 445: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

444 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Friendly Format Effects on RecallGinzberg Data on Depression

Greene Refugee Appeals

Guyer Anonymity and Cooperation

Hartnagel Canadian Crime-Rates Time Series

Leinhardt Data on Infant-Mortality

Mandel Contrived Collinear Data

Migration Canadian Interprovincial Migration Data

Moore Status, Authoritarianism, and Conformity

Mroz U.S. Women's Labor-Force Participation

OBrienKaiser O'Brien and Kaiser's Repeated-Measures Data

Ornstein Interlocking Directorates Among Major Canadian

Firms

Pottery Chemical Composition of Pottery

Prestige Prestige of Canadian Occupations

Quartet Four Regression Datasets

Robey Fertility and Contraception

SLID Survey of Labour and Income Dynamics

Sahlins Agricultural Production in Mazulu Village

Soils Soil Compositions of Physical and Chemical

Characteristics

Page 446: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

445 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

States Education and Related Statistics for the U.S.

States

UN GDP and Infant Mortality

US.pop Population of the United States

Vocab Vocabulary and Education

Womenlf Canadian Women's Labour-Force Participation

Page 447: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

446 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.6. Data dari Paket DAAG

ACF1 Aberrant Crypt Foci in Rat Colons

Cars93.summary A Summary of the Cars93 Data set

DAAGxdb List, each of whose elements hold rows

of a file, in character format

Lottario Ontario Lottery Data

Manitoba.lakes The Nine Largest Lakes in Manitoba

SP500W90 Closing Numbers for S and P 500 Index - First

100 Days of 1990

SP500close Closing Numbers for S and P 500 Index

ais Australian athletes data set

allbacks Measurements on a Selection of Books

anesthetic Anesthetic Effectiveness

ant111b Averages by block of corn yields, for treatment

111 only

antigua Averages by block of yields for the Antigua

Corn data

appletaste Tasting experiment that compared four apple

varieties

austpop Population figures for Australian States and

Page 448: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

447 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Territoriesbiomass Biomass Data

bomsoi Southern Oscillation Index Data

bomsoi2001 Southern Oscillation Index Data

bostonc Boston Housing Data -- Corrected

carprice US Car Price Data

cerealsugar Percentage of Sugar in Breakfast Cereal

cfseal Cape Fur Seal Data

cities Populations of Major Canadian Cities (1992-96)

codling Dose-mortality data, for fumigation of codling

moth with methyl bromide

cottonworkers Occupation and wage profiles of British cotton

workers

cuckoohosts Comparison of cuckoo eggs with host eggs

cuckoos Cuckoo Eggs Data

dengue Dengue prevalence, by administrative region

dewpoint Dewpoint Data

droughts Periods Between Rain Events

elastic1 Elastic Band Data Replicated

elastic2 Elastic Band Data Replicated Again

elasticband Elastic Band Data

Page 449: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

448 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

fossilfuel Fossil Fuel Data

fossum Female Possum Measurements

frogs Frogs Data

frostedflakes Frosted Flakes data

fruitohms Electrical Resistance of Kiwi Fruit

geophones Seismic Timing Data

head.injury Minor Head Injury (Simulated) Data

headInjury Minor Head Injury (Simulated) Data

hills Scottish Hill Races Data

hills2000 Scottish Hill Races Data - 2000

houseprices Aranda House Prices

humanpower1 Oxygen uptake versus mechanical power, for

humans

humanpower2 Oxygen uptake versus mechanical power, for

humans

ironslag Iron Content Measurements

jobs Canadian Labour Force Summary Data (1995-96)

kiwishade Kiwi Shading Data

leafshape Full Leaf Shape Data Set

leafshape17 Subset of Leaf Shape Data Set

leaftemp Leaf and Air Temperature Data

Page 450: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

449 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

leaftemp.all Full Leaf and Air Temperature Data Set

litters Mouse Litters

lung Cape Fur Seal Lung Measurements

measles Deaths in London from measles

medExpenses Family Medical Expenses

mifem Mortality Outcomes for Females Suffering

Myocardial Infarction

mignonette Darwin's Wild Mignonette Data

milk Milk Sweetness Study

modelcars Model Car Data

monica WHO Monica Data

moths Moths Data

nsw74demo Labour Training Evaluation Data

nsw74psid1 Labour Training Evaluation Data

nsw74psid3 Labour Training Evaluation Data

nsw74psidA A Subset of the nsw74psid1 Data Set

oddbooks Measurements on 12 books

orings Challenger O-rings Data

ozone Ozone Data

pair65 Heated Elastic Bands

possum Possum Measurements

Page 451: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

450 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

possumsites Possum Sites

poxetc Deaths from various causes, in London from

1629 till 1881, with gaps

primates Primate Body and Brain Weights

races2000 Scottish Hill Races Data - 2000

rainforest Rainforest Data

rareplants Rare and Endangered Plant Species

rice Genetically Modified and Wild Type Rice Data

roller Lawn Roller Data

science School Science Survey Data

seedrates Barley Seeding Rate Data

socsupport Social Support Data

softbacks Measurements on a Selection of Paperback Books

sorption sorption data set

spam7 Spam E-mail Data

stVincent Averages by block of yields for the St. Vincent

Corn data

sugar Sugar Data

tinting Car Window Tinting Experiment Data

toycars Toy Cars Data

two65 Unpaired Heated Elastic Bands

Page 452: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

451 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

vince111b Averages by block of corn yields, for treatment

111 only

vlt Video Lottery Terminal Data

wages1833 Wages of Lancashire Cotton Factory Workers in

1833

whoops Deaths from whooping cough, in London

zzDAAGxdb List, each of whose elements hold rows of a

file, in character format

Page 453: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

452 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.7. Data dari Paket dataset

AirPassengers Monthly Airline Passenger Numbers 1949-1960

BJsales Sales Data with Leading Indicator

BJsales.lead (BJsales)

Sales Data with Leading Indicator

BOD Biochemical Oxygen Demand

CO2 Carbon Dioxide uptake in grass plants

ChickWeight Weight versus age of chicks on different diets

DNase Elisa assay of DNase

EuStockMarkets Daily Closing Prices of Major European Stock

Indices, 1991-1998

Formaldehyde Determination of Formaldehyde

HairEyeColor Hair and Eye Color of Statistics Students

Harman23.cor Harman Example 2.3

Harman74.cor Harman Example 7.4

Indometh Pharmacokinetics of Indomethicin

InsectSprays Effectiveness of Insect Sprays

JohnsonJohnson Quarterly Earnings per Johnson & Johnson Share

LakeHuron Level of Lake Huron 1875-1972

LifeCycleSavings Intercountry Life-Cycle Savings Data

Page 454: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

453 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Loblolly Growth of Loblolly pine treesNile Flow of the River Nile

Orange Growth of Orange Trees

OrchardSprays Potency of Orchard Sprays

PlantGrowth Results from an Experiment on Plant Growth

Puromycin Reaction velocity of an enzymatic reaction

Seatbelts Road Casualties in Great Britain 1969-84

Theoph Pharmacokinetics of theophylline

Titanic Survival of passengers on the Titanic

ToothGrowth The Effect of Vitamin C on Tooth Growth in

Guinea Pigs

UCBAdmissions Student Admissions at UC Berkeley

UKDriverDeaths Road Casualties in Great Britain 1969-84

UKgas UK Quarterly Gas Consumption

USAccDeaths Accidental Deaths in the US 1973-1978

USArrests Violent Crime Rates by US State

USJudgeRatings Lawyers' Ratings of State Judges in the US

Superior Court

USPersonalExpenditure Personal Expenditure Data

VADeaths Death Rates in Virginia (1940)

WWWusage Internet Usage per Minute

Page 455: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

454 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

WorldPhones The World's Telephones

ability.cov Ability and Intelligence Tests

airmiles Passenger Miles on Commercial US Airlines,

1937-1960

airquality New York Air Quality Measurements

anscombe Anscombe's Quartet of "Identical" Simple Linear

Regressions

attenu The Joyner-Boore Attenuation Data

attitude The Chatterjee-Price Attitude Data

austres Quarterly Time Series of the Number of

Australian Residents

beaver1 (beavers) Body Temperature Series of Two Beavers

beaver2 (beavers) Body Temperature Series of Two Beavers

cars Speed and Stopping Distances of Cars

chickwts Chicken Weights by Feed Type

co2 Mauna Loa Atmospheric CO2 Concentration

crimtab Student's 3000 Criminals Data

discoveries Yearly Numbers of Important Discoveries

esoph Smoking, Alcohol and (O)esophageal Cancer

euro Conversion Rates of Euro Currencies

euro.cross (euro) Conversion Rates of Euro Currencies

Page 456: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

455 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

eurodist Distances Between European Cities

faithful Old Faithful Geyser Data

fdeaths (UKLungDeaths)

Monthly Deaths from Lung Diseases in the UK

freeny Freeny's Revenue Data

freeny.x (freeny) Freeny's Revenue Data

freeny.y (freeny) Freeny's Revenue Data

infert Infertility after Spontaneous and Induced

Abortion

iris Edgar Anderson's Iris Data

iris3 Edgar Anderson's Iris Data

islands Areas of the World's Major Landmasses

ldeaths (UKLungDeaths)

Monthly Deaths from Lung Diseases in the UK

lh Luteinizing Hormone in Blood Samples

longley Longley's Economic Regression Data

lynx Annual Canadian Lynx trappings 1821-1934

mdeaths (UKLungDeaths)

Monthly Deaths from Lung Diseases in the UK

morley Michaelson-Morley Speed of Light Data

mtcars Motor Trend Car Road Tests

Page 457: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

456 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

nhtemp Average Yearly Temperatures in New Haven

nottem Average Monthly Temperatures at Nottingham,

1920-1939

precip Annual Precipitation in US Cities

presidents Quarterly Approval Ratings of US Presidents

pressure Vapor Pressure of Mercury as a Function of

Temperature

quakes Locations of Earthquakes off Fiji

randu Random Numbers from Congruential Generator

RANDU

rivers Lengths of Major North American Rivers

rock Measurements on Petroleum Rock Samples

sleep Student's Sleep Data

stack.loss (stackloss)

Brownlee's Stack Loss Plant Data

stack.x (stackloss) Brownlee's Stack Loss Plant Data

stackloss Brownlee's Stack Loss Plant Data

state.abb (state) US State Facts and Figures

state.area (state) US State Facts and Figures

state.center (state) US State Facts and Figures

state.division (state)

Page 458: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

457 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

US State Facts and Figures

state.name (state) US State Facts and Figures

state.region (state) US State Facts and Figures

state.x77 (state) US State Facts and Figures

sunspot.month Monthly Sunspot Data, 1749-1997

sunspot.year Yearly Sunspot Data, 1700-1988

sunspots Monthly Sunspot Numbers, 1749-1983

swiss Swiss Fertility and Socioeconomic Indicators

(1888) Data

treering Yearly Treering Data, -6000-1979

trees Girth, Height and Volume for Black Cherry Trees

uspop Populations Recorded by the US Census

volcano Topographic Information on Auckland's Maunga

Whau Volcano

warpbreaks The Number of Breaks in Yarn during Weaving

women Average Heights and Weights for American Women

Page 459: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

458 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.8. Data dari Paket demogR

Data sets in package demogR:

goodman Demographic data from Venezuela, Madagascar and

the United States in the late 1960s

Page 460: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

459 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.9. Data dari Paket faraway

aatemp Annual mean temperatures in Ann Arbor, Michigan

abrasion Wear on materials according to type, run and

position

aflatoxin aflatoxin dosage and liver cancer in lab

animals

africa miltary coups and politics in sub-Saharan

Africa

alfalfa Effects of seed inoculum, irrigation and shade

on alfalfa yield

amlxray Match pair study for AML and Xray link

babyfood Respiratory disease rates of babies fed in

different ways

beetle Beetles exposed to fumigant

bliss Bliss insecticide data

breaking Breaking strength of materials

broccoli Broccoli weight variation

cathedral Cathedral nave heights and lengths in England

chicago Chicago insurance redlining

chiczip Chicago zip codes north-south

Page 461: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

460 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

chmiss Chicago insurance redliningchoccake Chocolate cake experiment with split plot

design

chredlin Chicago insurance redlining

clot Blood clotting times

cmob Social class mobility from 1971 to 1981 in the

UK

cns Malformations of the central nervous system

coagulation Blood coagulation times by diet

composite Strength of a thermoplastic composite

depending on two factors

cornnit Corn yields from nitrogen application

corrosion Corrosion loss in Cu-Ni alloys

cpd Projected and actual sales of 20 consumer

products

ctsib Effects of surface and vision on balance

death Death penalty in Florida 1977

debt psychology of debt

diabetes Diabetes and obesity, cardiovascular risk

factors

dicentric Radiation dose effects on chromosomal

Page 462: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

461 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

abnormality

divusa Divorce in the USA 1920-1996

drugpsy Choice of drug treatment for psychiatry

patients

dvisits Doctor visits in Australia

eco Ecological regression example

eggprod Treatment and block effects on egg production

eggs Laboratory testing of dried egg fat content

epilepsy Seizure rates of epileptics under treatment

esdcomp Complaints about emergency room doctors

exa Non parametric regression test data A

exb Non parametric regression test data B

eyegrade grading of eye pairs for distance vision

fat Percentage of Body Fat and Body Measurements

femsmoke Mortality due to smoking according age group in

women

fpe 1981 French Presidential Election

fruitfly Longevity of fruiflies depending on sexual

activity and thorax length

gala Species diversity on the Galapagos Islands

gavote Undercounted votes in Georgia in 2000

Page 463: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

462 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

presidential election

haireye Hair and eye color

happy love, work and happiness

hormone Hormones and Sexual Orientation

hprice Housing prices in US cities 86-94

hsb Career choice of high school students

infmort Infant mortality according to income and region

irrigation Agricultural experiment with irrigation

jsp Junior Schools Project

kanga Historic Kangaroos

lawn Cut-off times of lawnmowers

leafblotch Leaf blotch on barley

mammalsleep Sleep in Mammals: Ecological and Constitutional

Correlates

meatspec Meat spectrometry to determine fat content

melanoma Melanoma by type and location

motorins Third party motor insurance claims in Sweden in

1977

neighbor Questionnaire study of neighborly help

nels88 Subset of National Education Longitudinal Study

1988

Page 464: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

463 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

nepali Nepali child heath study

nes96 US 1996 national election study

oatvar Yields of oat varieties planted in blocks

odor Odor of chemical by production settings

ohio Ohio Children Wheeze Status

orings Spache Shuttle Challenger O-rings

ozone Ozone readings in LA

parstum Marijuana and parent alcohol and drug use

peanut Carbon dioxide effects on peanut oil extraction

penicillin Penicillin yields by block and treatment

pima Diabetes survey on Pima Indians

pipeline NIST data on ultrasonic measurements of defects

in the Alaska pipeline

pneumo Pneumonoconiosis in coal miners

potuse Marijuana usage by youth

prostate Prostate cancer surgery

psid Panel Study of Income Dynamics subset

pulp Brightness of paper pulp depending on shift

operator

pvc Production of PVC by operator and resin railcar

rabbit Rabbit weight gain by diet and litter

Page 465: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

464 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

ratdrink Rat growth weights affected by additives

rats Effect of toxic agents on rats

resceram Shape and plate effects on current noise in

resistors

salmonella Salmonella reverse mutagenicity assay

sat School expenditure and test scores from USA in

1994-95

savings Savings rates in 50 countries

seatpos Car seat position depending driver size

semicond Semiconductor split-plot experiment

sexab Post traumatic stress disorder in abused adult

females

sexfun Marital sex ratings

solder Solder skips in circuit board manufacture

sono Sonoluminescence

soybean Germination failures for soybean seeds

spector Teaching methods in Economics

speedo Speedometer cable shrinkage

star Star light intensities and temperatures

stat500 Scores for students in Stat500 class

strongx Strong interaction experiment data

Page 466: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

465 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

suicide Suicide method data from the UK

teengamb Study of teenage gambling in Britain

toenail Toenail infection treatment study

troutegg Survival of trout eggs depending on time and

location

truck Truck leaf spring experiment

turtle Incubation temperature and the sex of turtles

twins Twin IQs from Burt

uncviet UNC student opinions about the Vietnam War

uswages Weekly wages of US male workers in 1988

vision Vision acuity tests

wafer resitivity of wafer in semiconductor experiment

wavesolder Defects in a wave soldering process

wbca Wisconsin breast cancer database

weldstrength welding strength DOE

wheat Insect damage to wheat varieties

Page 467: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

466 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.10. Data dari Paket gam

gam.data Simulated dataset for gam

gam.newdata Simulated dataset for gam

kyphosis A classic example dataset for GAMs

Page 468: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

467 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.11. Data dari Paket ISwR

IgM Immunoglobulin G

alkfos Alkaline phosphatase data

ashina Ashina's crossover trial

bcmort Breast cancer mortality

bp.obese Obesity and blood pressure

caesar.shoe (caesarean)

Caesarean section and maternal shoe size

coking Coking data

cystfibr Cystic fibrosis lung function data

eba1977 Lung cancer incidence in four Danish cities

1968-1971

energy Energy expenditure

ewrates Rates of lung and nasal cancer mortality, and

total mortality.

fake.trypsin Trypsin by age groups

graft.vs.host Graft versus host disease

heart.rate Heart rates after enalaprilat

hellung Growth of Tetrahymena cells

Page 469: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

468 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

intake Energy intakejuul Juul's IGF data

juul2 Juul's IGF data, extended version

kfm Breast-feeding data

lung Methods for determining lung volume

malaria Malaria antibody data

melanom Survival after malignant melanoma

nickel Nickel smelters in South Wales

nickel.expand Nickel smelters in South Wales, expanded

philion Dose response data

react Tuberculin reactions

red.cell.folate Red cell folate data

rmr Resting metabolic rate

secher Birth weight and ultrasonography

secretin Secretin-induced blood glucose changes

stroke Estonian stroke data

tb.dilute Tuberculin dilution assay

thuesen Ventricular shortening velocity

tlc Total lung capacity

vitcap Vital capacity

vitcap2 Vital capacity, full data set

Page 470: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

469 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

wright Comparison of Wright peak-flow meters

zelazo Age at walking

Page 471: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

470 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.12. Data dari Paket lmtest

ChickEgg Chickens, Eggs, and Causality

Mandible Mandible Data

USDistLag US Macroecnomic Data

bondyield Bond Yield

currencysubstitution Currency Substitution

ftemp Femal Temperature Data

fyff U.S. Macroeconomic Time Series

gmdc U.S. Macroeconomic Time Series

growthofmoney Growth of Money Supply

ip U.S. Macroeconomic Time Series

jocci U.S. Macroeconomic Time Series

lhur U.S. Macroeconomic Time Series

moneydemand Money Demand

pw561 U.S. Macroeconomic Time Series

unemployment Unemployment Data

valueofstocks Value of Stocks

wages Wages

Page 472: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

471 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.13. Data dari Paket MASS

Aids2 Australian AIDS Survival Data

Animals Brain and Body Weights for 28 Species

Boston Housing Values in Suburbs of Boston

Cars93 Data from 93 Cars on Sale in the USA in 1993

Cushings Diagnostic Tests on Patients with Cushing's

Syndrome

DDT DDT in Kale

GAGurine Level of GAG in Urine of Children

Insurance Numbers of Car Insurance claims

Melanoma Survival from Malignant Melanoma

OME Tests of Auditory Perception in Children with

OME

Pima.te Diabetes in Pima Indian Women

Pima.tr Diabetes in Pima Indian Women

Pima.tr2 Diabetes in Pima Indian Women

Rabbit Blood Pressure in Rabbits

Rubber Accelerated Testing of Tyre Rubber

SP500 Returns of the Standard and Poors 500

Sitka Growth Curves for Sitka Spruce Trees in 1988

Page 473: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

472 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Sitka89 Growth Curves for Sitka Spruce Trees in 1989Skye AFM Compositions of Aphyric Skye Lavas

Traffic Effect of Swedish Speed Limits on Accidents

UScereal Nutritional and Marketing Information on US

Cereals

UScrime The Effect of Punishment Regimes on Crime Rates

VA Veteran's Administration Lung Cancer Trial

abbey Determinations of Nickel Content

accdeaths Accidental Deaths in the US 1973-1978

anorexia Anorexia Data on Weight Change

bacteria Presence of Bacteria after Drug Treatments

beav1 Body Temperature Series of Beaver 1

beav2 Body Temperature Series of Beaver 2

biopsy Biopsy Data on Breast Cancer Patients

birthwt Risk Factors Associated with Low Infant Birth

Weight

cabbages Data from a cabbage field trial

caith Colours of Eyes and Hair of People in Caithness

cats Anatomical Data from Domestic Cats

cement Heat Evolved by Setting Cements

chem Copper in Wholemeal Flour

Page 474: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

473 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

coop Co-operative Trial in Analytical Chemistry

cpus Performance of Computer CPUs

crabs Morphological Measurements on Leptograpsus

Crabs

deaths Monthly Deaths from Lung Diseases in the UK

drivers Deaths of Car Drivers in Great Britain 1969-84

eagles Foraging Ecology of Bald Eagles

epil Seizure Counts for Epileptics

farms Ecological Factors in Farm Management

fgl Measurements of Forensic Glass Fragments

forbes Forbes' Data on Boiling Points in the Alps

galaxies Velocities for 82 Galaxies

gehan Remission Times of Leukaemia Patients

genotype Rat Genotype Data

geyser Old Faithful Geyser Data

gilgais Line Transect of Soil in Gilgai Territory

hills Record Times in Scottish Hill Races

housing Frequency Table from a Copenhagen Housing

Conditions Survey

immer Yields from a Barley Field Trial

leuk Survival Times and White Blood Counts for

Page 475: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

474 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Leukaemia Patients

mammals Brain and Body Weights for 62 Species of Land

Mammals

mcycle Data from a Simulated Motorcycle Accident

menarche Age of Menarche data

michelson Michelson's Speed of Light Data

minn38 Minnesota High School Graduates of 1938

motors Accelerated Life Testing of Motorettes

muscle Effect of Calcium Chloride on Muscle

Contraction in Rat Hearts

newcomb Newcomb's Measurements of the Passage Time of

Light

nlschools Eighth-Grade Pupils in the Netherlands

npk Classical N, P, K Factorial Experiment

npr1 US Naval Petroleum Reserve No. 1 data

oats Data from an Oats Field Trial

painters The Painter's Data of de Piles

petrol N. L. Prater's Petrol Refinery Data

phones Belgium Phone Calls 1950-1973

quine Absenteeism from School in Rural New South

Wales

Page 476: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

475 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

road Road Accident Deaths in US States

rotifer Numbers of Rotifers by Fluid Density

ships Ships Damage Data

shoes Shoe wear data of Box, Hunter and Hunter

shrimp Percentage of Shrimp in Shrimp Cocktail

shuttle Space Shuttle Autolander Problem

snails Snail Mortality Data

steam The Saturated Steam Pressure Data

stormer The Stormer Viscometer Data

survey Student Survey Data

synth.te Synthetic Classification Problem

synth.tr Synthetic Classification Problem

topo Spatial Topographic Data

waders Counts of Waders at 15 Sites in South Africa

whiteside House Insulation: Whiteside's Data

wtloss Weight Loss Data from an Obese Patient

Page 477: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

476 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

B.14. Data dari Paket UsingR

BushApproval U.S. President George Bush approval ratings

HUMMER Deliveries of new HUMMER vehicles

KSI Data set on automobile deaths and injuries in

Great Britain

MLBattend Major league baseball attendance data

OBP On base percentage for 2002 major league

baseball season

age.universe Best estimate of the age of the universe

aid monthly payment for federal program

alaska.pipeline Comparison of in-field and laboratory

measurement of defects

alltime.movies Top movies of all time

aosat Artic Oscillation data based on SAT data

arctic.oscillations Measurement of sea-level pressure at

the arctic

babies Mothers and their babies data

babyboom Babyboom: data for 44 babies born in one

24-hour period.

batting Batting statistics for 2002 baseball season

Page 478: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

477 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

baycheck Population estimate of type of Bay Checkerspotbutterfly

best.times Best track and field times by age and distance

blood blood pressure readings

breakdown Time of insulating fluid to breakdown

bright.stars List of bright stars with Hipparcos catalog

number

brightness Brightness of 966 stars

bumpers Bumper repair costs for various automobiles

bycatch Number of Albatrosses accidentaly caught during

a fishing haul

cabinet Estimated tax savings for US President Bush's

cabinet

camp Mount Campito Yearly Treering Data, -3435-1969.

cancer cancer survival times

carbon Carbon Monoxide levels at different sites

carsafety Fatality information in U.S. for several

popular cars

central.park Weather in Central Park NY in May 2003

central.park.cloud Type of day in Central Park, NY May 2003

cfb Bootstrap sample from the Survey of Consumer

Page 479: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

478 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Finances

chicken weight gain of chickens fed 3 different rations

chips Measurements of chip wafers

co2emiss Carbon Dioxide Emissions from the U.S.A. from

fossil fuel

coins The coins in my change bin

coldvermont Daily minimum temperature in Woodstock Vermont

corn Comparison of corn for new and standard variety

crime violent crime rates in 50 states of US

deflection Deflection under load

diamond Price by size for diamond rings

divorce Time until divorce for divorced women (by age)

do ~~function to do ... ~~

dottodot Dot-to-dot puzzle

dowdata The Dow Jones average from Jan 1999 to October

2000

dvdsales Monthly DVD player sales since introduction to

May 2004

emissions CO2 emissions data and gross domestic product

for 26 countries

ewr Taxi in and taxi out times at EWR (Newark)

Page 480: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

479 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

airport for 1999-2001

exec.pay Direct compensation for 199 United States CEOs

in the year 2000

fat Body measurements to predict percentage of body

fat in males

father.son Pearson's data set on heights of fathers and

their sons

female.inc Income distribution for females in 2001

firstchi Age of mother at birth of first child

five.yr.temperature Five years of weather in New York City

florida County-by-county results of year 2000 US

presidential election in Florida

galileo Galileo data on falling bodies

galton Galton's height data for parents and children

gap Sales data for the Gap

gasprices Monthly average gasoline prices in the United

States

goalspergame Goals per game in NHL

google Google stock values during 2005-02-07 to

2005-07-07

grades Current and previous grades

Page 481: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

480 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

grip Effects of cross-country ski-pole grip

hall.fame Data frame containing baseball statistics

including Hall of Fame membership

healthy Healthy or not?

heartrate Simulated data of age vs. max heart rate

home Maplewood NJ homedata

homedata Maplewood NJ assessed values for years 1970 and

2000

homeprice Sale price of homes in New Jersey in the year

2001

homework Homework averages for Private and Public

schools

iq IQ scores

kid.weights Weight and height measurement for a sample of

U.S. children

last.tie Last tie in 100 coin tosses

lawsuits Law suit settlements

malpract malpractice settlements

mandms Proportions of colors in various M and M's

varieties

math Standardized math scores

Page 482: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

481 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

maydow Dow Jones industrial average and May maximum

temperature

midsize Price of new and used of three mid-sized cars

mw.ages Age distribution in year 2000 in Maplewood New

Jersey

nba.draft NBA draft lottery odds for 2002

normtemp Body temperature and heart rate of 130 health

individuals

npdb National Practioner Data Bank

nym.2002 Random sample of 2002 New York City Marathon

finishers

oral.lesion Oral lesion location by town

ozonemonthly Monthly mean ozone values at Halley Bay

Antartica

paradise Annual snowfall at Paradise Ranger Station,

Mount Ranier

pi2000 first 2000 digits of pi

primes Primes numbers less than 2003

puerto Incomes for Puerto Rican immigrants to Miami

rat Survival times of 20 rats exposed to radiation

reaction.time Reaction time with cell phone usage

Page 483: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

482 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

reddrum Growth of red drum

salmon.rate Simulated Data on Rate of Recruitment for

Salmon

salmonharvest Salmon harvest in Alaska from 1980 to 1998

samhda Substance Abuse and Mental Health Data for

teens

scatter.with.hist Scatterplot with histograms

scrabble Distribution of Scrabble pieces

simple.sim Simplify the process of simulation

skateranks Judges scores for disputed ice skating

competition

slc Sodium-Lithium countertransport

smokyph Water pH levels at 75 water samples in the

Great Smoky Mountains

south Murder rates for 30 Southern US cities

southernosc Southern Oscillations

sp500.excess Excess returns of S&P 500

squareplot Create a squareplot alternative to a segmented

barplot

stud.recs Student records

student.expenses Some simulated data on student expenses

Page 484: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

483 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

superbarplot super segmented barplot

tastesgreat Does new goo taste great?

tcm1y One-year treasury security values

tempsalinity Temperature/Salinity measurements along a

moving Eddy

too.young What age is too young for a male to data a

female?

twins Burt's IQ data for twins

u2 Song and lengths for U2 albums

urchin.growth Data on growth of sea urchins

vacation vacation days

watertemp Temperature measurement of water at 85m depth

yellowfin Yellow fin tuna catch rate in Tropical Indian

Ocean

/

Page 485: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

484 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

INDEKS PENULIS

Akaike, 261

Bowerman, 56, 235, 272

Burns, 78

Chamber, 70, 261, 341, 347

Cleveland, 70

Crawley, 235, 272, 325

Davidian, 60

Diggle, 356, 357

Dobson, 63, 277, 313, 315, 347

Faraway, 235, 257

Giltinan, 60

Harville, 144

Hastie, 70, 261

Hjorth, 261

Page 486: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

485 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Kenward, 364

Kuhnert, 272

Kutner, 272

Laird, 60

Liang, 361

Maindonald, 272

McCullagh, 277, 355

Mendenhall, 44

Meyer, 31

Murrel, 272

Nelder, 277, 347, 355

Neter, 56, 144, 235, 272

Ripley, 235, 261, 347

Searle, 144

Smith, 364

Smyth, 51

Tibshirani, 70

Timm, 144

Tirta, 65, 73, 78, 91, 243, 246, 396

Venables, 70, 235, 261, 272

Vezalini, 272

Wackery, 44

Ware, 60

Wasserman, 272

Wedderburn, 361

Zeger, 361

Zoonekyn, 272

Page 487: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

486 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

INDEKS SUBJEK

seragam, 364

algoritma

lengkap, 50

penuh, 51

terpartisi, 50, 51

AR-1, 364

boneka, 197

CLI, 72

distribusi

Binomial, 284

Binomial Negatif, 287

eksponensial, 287

Gamma, 286

Inverse Gauss, 287

Normal, 286

Page 488: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

487 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

Pareto, 287

Poisson, 285

eksplanatori, 275

eleminsi, 29

fungsi hubungan

kanonik, 63

natural, 63

Gamma-HGLM, 374

GEE, 351, 363, 364

GLM, 363

GLS, 185

GUI, 72

heteroskedastik, 182, 185

homoskedastik, 182, 185

invariant, 52

JGIG, 374, 394

kanonik, 278

keluarga eksponensial, 62, 276, 277

korelasi

serial, 59

uniform, 58

log komplementer, 297

logistik, 322

logit, 90, 297, 322

longitudinal, 60, 350

matriks

determinan, 115

ordo, 113

positif definit, 123

positif semi definit, 124

singuler, 115

teras, 116

model linier

bertingkat, 59

GEE, 65

GLM, 61

GLMM, 64

Page 489: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

488 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

HGLM, 64

hirarkis tergeneralisir, 64

klasik, 53

LMM, 57

NLM, 55

normal, 53

tergeneralisir, 62

multikolinieritas, 67

Newton-Raphson, 50, 184

pemodelan, 30

deterministik, 33

stokastik, 35

probit, 297, 322

regresi

Ridge, 67

repeated

measurement, 60

measurements, 350

measures, 350

sampel, 44, 45

sekawan, 374, 375

sistematis, 275

skoring

Fisher, 50

skoring Fisher, 184

skrip, 72

WLS, 185

Page 490: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

489 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

INDEKS FUNGSI R

?NamaPaket, 75

abline(), 79

barplot(), 79

boxplot(), 79

contour(), 79

example(), 75

gee(), 90, 368, 369

glm(), 89, 326, 368

glmML(), 90

help(), 75

hist(), 79

library(), 74

lm(), 88, 213

Page 491: Model Statistika Linier

FMIPA-UNEJ

Daftar Isi

Judul

JJ J I II

490 dari 490

Cari Halaman

Kembali

Layar Penuh

Tutup

Keluar

lmer(), 89

lmm(), 89

lrm(), 90

nls(), 90

pairs(), 79

persp(), 79

plot(), 79, 257

qq.plot(), 79

reg.line(), 79

require(), 74

rug(), 79

scatterplot(), 79

scatterplot.matrix(), 79

sp(), 79

split.screen(), 81

spm(), 79