MODEL-MODEL STATISTIKA (Handout/ E-book Untuk Program S2 ...
Model Statistika Linier
Transcript of Model Statistika Linier
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
0 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Versi Cetak:
Judul: Analisis Regresi dengan R
Tahun terbit: 2009
Penerbit: Jember University PressISBN 979-8176-65-0
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
1 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
2 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Analisis Regresi dengan R(ANRER)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
3 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
I. M. Tirta, (Prof. Drs. M.Sc., Ph.D.)[email protected]; [email protected]
December 3, 2011
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
4 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
5 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
DAFTAR ISI
1 DASAR-DASAR PEMODELAN STOKASTIK 23
1.1 Prinsip Pemodelan . . . . . . . . . . . . . . . . . . . . 27
1.2 Langkah-langkah Penting Dalam Pemodelan . . . . . . . 37
1.2.1 Langkah penting dalam Pemodelan secara Umum 37
1.2.2 Langkah Penting dalam Pemodelan Statistika . . . 39
1.3 Metode Mengestimasi Parameter . . . . . . . . . . . . 45
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
6 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.3.1 Metode Kuadrat Terkecil . . . . . . . . . . . . . 45
1.3.2 Metode Likelihood Maksimum . . . . . . . . . . 47
1.3.3 Mencari Maksimum dengan Metode Numerik . . 48
1.4 Model Linier dan Perkembangannya . . . . . . . . . . . 52
1.4.1 Model linier klasik . . . . . . . . . . . . . . . . 53
1.4.2 Model Linier Tercampur . . . . . . . . . . . . . 56
1.4.3 Model Linier Tergeneralisir . . . . . . . . . . . . 60
1.4.4 Model untuk Data Tidak Normal dan Tidak Saling
Bebas . . . . . . . . . . . . . . . . . . . . . . . 64
1.4.5 Pengembangan Lain Model Linier . . . . . . . . 67
1.5 Model-model Nonlinier . . . . . . . . . . . . . . . . . . . 70
1.6 Tinjauan singkat Program Statistika R . . . . . . . . . . 71
1.6.1 Aplikasi R untuk Manipulasi Grafik . . . . . . . . 77
1.6.2 Aplikasi R untuk Model Statistika/ Analisis Regresi 88
1.6.3 RCommnder RGUI untuk analisis dasar . . . . . . 91
1.7 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . 92
1.8 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . 94
1.9 Latihan . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
7 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2 ALJABAR MATRIKS UNTUK STATISTIKA 97
2.1 Materi . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
2.2 Defenisi dan Jenis Matriks . . . . . . . . . . . . . . . . . 100
2.3 Operasi Matriks dan Sifat-sifatnya . . . . . . . . . . . . 105
2.3.1 Operasi uner . . . . . . . . . . . . . . . . . . . 105
2.3.2 Operasi biner . . . . . . . . . . . . . . . . . . . 106
2.3.3 Determinan dan Invers Matriks . . . . . . . . . . 115
2.4 Kebergantungan Linier dan Rank Matriks . . . . . . . . . 118
2.5 Bentuk Kuadrat dan Diferensial Matriks . . . . . . . . . 123
2.6 Aplikasi R untuk Operasi Matriks . . . . . . . . . . . . . 134
2.6.1 Mendefinisikan matriks . . . . . . . . . . . . . . . 135
2.6.2 Operasi Matriks dengan R . . . . . . . . . . . . . 139
2.7 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . 144
2.8 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . . 145
2.9 Latihan Soal-soal . . . . . . . . . . . . . . . . . . . . . 147
3 MODEL LINIER KLASIK 151
3.1 Bentuk dan Asumsi . . . . . . . . . . . . . . . . . . . . 154
3.2 Estimasi Parameter . . . . . . . . . . . . . . . . . . . . 156
3.2.1 Estimasi dengan Metode Kuadrat Terkecil . . . . 156
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
8 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.2.2 Estimasi dengan Metode Likelihood Maksimum . 161
3.3 Uji Inferensial dari βj . . . . . . . . . . . . . . . . . . . 165
3.3.1 Distribusi βj . . . . . . . . . . . . . . . . . . . . 165
3.3.2 Estimasi selang dari βj . . . . . . . . . . . . . . . 169
3.3.3 Uji Hipotesis . . . . . . . . . . . . . . . . . . . 170
3.3.4 Koefisien Determinasi R2 . . . . . . . . . . . . . 172
3.4 Penggunaan Matriks untuk Regresi Peubah Ganda . . . . 180
3.4.1 Perluasan hasil untuk Regresi Peubah Ganda . . . 180
3.4.2 Pendekatan Matriks Metode Kuadrat Terkecil . . 183
3.4.3 Pendekatan Matriks untuk Metode Kemungkinan
Maksimum . . . . . . . . . . . . . . . . . . . . . 186
3.5 Interval Keyakinan µ dan Prediksi Y . . . . . . . . . . . 191
3.6 Melaporkan Nilai Probabilitas p . . . . . . . . . . . . . . 194
3.7 Model Linier dengan Variabel Kualitatif . . . . . . . . . . 196
3.7.1 Variabel Boneka dengan Model Berkonstanta . . . 197
3.7.2 Variabel Boneka dengan Konstanta tidak Eksplisit 202
3.8 Ilustrasi Model Linier Normal dengan R . . . . . . . . . . 206
3.8.1 Simulasi dengan R . . . . . . . . . . . . . . . . . 206
3.8.2 Menggunakan Fungsi lm() . . . . . . . . . . . . 213
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
9 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.8.3 Model dengan Variabel Kualitatif . . . . . . . . . 218
3.8.4 Analisis dengan Subset . . . . . . . . . . . . . . . 231
3.9 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . . 233
3.10 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . 235
3.11 Latihan Soal- Soal . . . . . . . . . . . . . . . . . . . . . 236
4 DIAGNOSTIK DAN TRANSFORMASI 239
4.1 Asumsi Analisis Regresi Klasik . . . . . . . . . . . . . . . 242
4.2 Memeriksa Sebaran Data melalui Grafik . . . . . . . . . . 243
4.3 Pemeriksaan Hubungan Peubah melalui Grafik . . . . . . 248
4.3.1 Diagram pencar data . . . . . . . . . . . . . . . 248
4.3.2 Diagram Pencar Sisa . . . . . . . . . . . . . . . 252
4.3.3 Memeriksa Model Melalui Diagram . . . . . . . . 253
4.4 Uji Statistika Terkait Asumsi . . . . . . . . . . . . . . . 260
4.5 Memeriksa Model melalui AIC . . . . . . . . . . . . . . . 261
4.6 Transformasi Data . . . . . . . . . . . . . . . . . . . . . 265
4.7 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . . 270
4.8 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . 272
4.9 Latihan Soal-soal . . . . . . . . . . . . . . . . . . . . . . 273
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
10 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5 MODEL LINIER TERGENERALISIR 275
5.1 Distribusi Keluarga Eksponensial . . . . . . . . . . . . . . 277
5.1.1 Bentuk umum . . . . . . . . . . . . . . . . . . . 277
5.1.2 Nilai-tengah dan Ragam dari a(Y ) . . . . . . . . 278
5.1.3 Beberapa Bentuk Khusus . . . . . . . . . . . . . 283
5.2 Konsep Dasar Model Linier Tergeneralisir . . . . . . . . 292
5.2.1 Sisi lain Model Linier Normal . . . . . . . . . . . 292
5.2.2 Generalisasi Model Linier Klasik ke Model Linier
Tergeneralisir . . . . . . . . . . . . . . . . . . . . 293
5.3 Estimasi pada Model Linier Tergeneralisir . . . . . . . . 298
5.3.1 Metode Penduga Kuadrat Terkecil . . . . . . . . 301
5.3.2 Metode Penduga Likelihood Maksimum . . . . . 303
5.4 Inferensi pada Model Linier Tergeneralisir . . . . . . . . 312
5.4.1 Distribusi dari Penduga Likelihood Maksimum . . 314
5.4.2 Kecocokan Model . . . . . . . . . . . . . . . . . 317
5.5 Model Logit, Probit dan Log-linier . . . . . . . . . . . . . 322
5.6 dispersi berlebih . . . . . . . . . . . . . . . . . . . . . . 325
5.7 Ilustrasi GLM dengan R . . . . . . . . . . . . . . . . . . 326
5.7.1 Data dengan Sebaran Binomial . . . . . . . . . . 330
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
11 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.7.2 Prediksi pada GLM . . . . . . . . . . . . . . . . 343
5.8 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . . 345
5.9 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . 347
5.10 Latihan Soal-soal . . . . . . . . . . . . . . . . . . . . . . 348
6 MODEL UNTUK RESPON TIDAK SALING BEBAS 349
6.1 Model Marjinal . . . . . . . . . . . . . . . . . . . . . . . 355
6.2 Quasi-Likelihood dan Generalized Estimating Equations
(GEE) . . . . . . . . . . . . . . . . . . . . . . . . . . . 360
6.3 Generalisasi dan Bentuk GEE . . . . . . . . . . . . . . . 363
6.4 Ilustrasi GEE dengan R . . . . . . . . . . . . . . . . . . 368
6.5 Gamma-HGLM dan Model Lainnya . . . . . . . . . . . . 374
6.5.1 Gamma-HGLMs . . . . . . . . . . . . . . . . . . 375
6.5.2 Likelihood Bersama: Model JGIG . . . . . . . . . 378
6.5.3 Estimasi Parameter β dan v . . . . . . . . . . . . 380
6.5.4 Pendugaan parameter dispersi ν dan α . . . . . . 388
6.5.4.1 Prosedur Pendugaan . . . . . . . . . . . 390
6.5.5 Analisis HGLM dengan R . . . . . . . . . . . . . 391
6.6 Bacaan Lebih Lanjut . . . . . . . . . . . . . . . . . . . . 396
6.7 Ringkasan . . . . . . . . . . . . . . . . . . . . . . . . . 397
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
12 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.8 Latihan Soal-soal . . . . . . . . . . . . . . . . . . . . . 398
GLOSARIUM 399
A BEBERAPA FUNGSI TERKAIT REGRESI 417
A.1 Fungsi dari Paket stats . . . . . . . . . . . . . . . . . . . 418
A.2 Fungsi dari Paket cars . . . . . . . . . . . . . . . . . . . 419
A.3 Fungsi dari Paket gam . . . . . . . . . . . . . . . . . . . 420
A.4 Fungsi dari Paket graphics . . . . . . . . . . . . . . . . . 421
A.5 Fungsi dari Paket gee . . . . . . . . . . . . . . . . . . . 422
A.6 Fungsi dari Paket lme4 . . . . . . . . . . . . . . . . . . . 423
A.7 Fungsi dari Paket hglm . . . . . . . . . . . . . . . . . . 424
A.8 Fungsi dari Paket glmmML . . . . . . . . . . . . . . . . 425
A.9 Skrip Manipulasi Grafik . . . . . . . . . . . . . . . . . . 426
A.10 Skrip Membangkitkan Data Regresi dengan Peubah Kelom-
pok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428
B DATA UNTUK ILUSTRASI 431
B.1 Data dari Paket actuar . . . . . . . . . . . . . . . . . . . 432
B.2 Data dari Paket ade4 . . . . . . . . . . . . . . . . . . . 433
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
13 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.3 Data dari Paket agricolae . . . . . . . . . . . . . . . . . 439
B.4 Data dari Paket asuR . . . . . . . . . . . . . . . . . . . 441
B.5 Data dari Paket car . . . . . . . . . . . . . . . . . . . . 443
B.6 Data dari Paket DAAG . . . . . . . . . . . . . . . . . . . 446
B.7 Data dari Paket dataset . . . . . . . . . . . . . . . . . . 452
B.8 Data dari Paket demogR . . . . . . . . . . . . . . . . . . 458
B.9 Data dari Paket faraway . . . . . . . . . . . . . . . . . . 459
B.10 Data dari Paket gam . . . . . . . . . . . . . . . . . . . . 466
B.11 Data dari Paket ISwR . . . . . . . . . . . . . . . . . . . 467
B.12 Data dari Paket lmtest . . . . . . . . . . . . . . . . . . . 470
B.13 Data dari Paket MASS . . . . . . . . . . . . . . . . . . . 471
B.14 Data dari Paket UsingR . . . . . . . . . . . . . . . . . . 476
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
14 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
15 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
DAFTAR GAMBAR
1.1 Diagram Menunjukkan Langkah-langkah dalam Pemo-
delan Statistika . . . . . . . . . . . . . . . . . . . . . . 42
1.2 Pembagian dan Perkembangan Model Linear . . . . . . 66
1.3 Ilustrasi Regresi . . . . . . . . . . . . . . . . . . . . . 69
1.4 Contoh Histogram dengan Kurva Densitas . . . . . . . 83
1.5 Contoh Diagram Pencar dengan rug dan boxplot . . . . 84
1.6 Contoh Gabungan Grafik Besar dengan Grafik Mini . . 85
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
16 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.7 Contoh Gabungan Grafik dengan Pembagian Layar . . 86
1.8 Contoh Gabungan Grafik dengan pembagian layar . . . 87
3.1 Ilustrasi Garis regresi dan sabuk keyakinan . . . . . . . 193
3.2 Sebaran data dengan variabel kualitatif . . . . . . . . . 198
3.3 Garis Regresi sejajar dengan selisih konstanta β2 dan
gradien sama (β1) . . . . . . . . . . . . . . . . . . . . . 201
3.4 Garis Regresi berbeda dengan selisih konstanta β2 dan
selisih gradien β3 . . . . . . . . . . . . . . . . . . . . . 203
3.5 Grafik Penduga β1 = α dari penarikan sampel 100 kali
masing-masing berukuran 60. Nilai parameter sebe-
narnya adalah α = 3. . . . . . . . . . . . . . . . . . . . 211
3.6 Grafik Penduga β1 = α dari beberapa penarikan sampel
dengan ukuran mulai 10 sampai dengan 1000. Nilai
parameter sebenarnya adalah α = 3. . . . . . . . . . . 212
3.7 Contoh Histogram dengan Kurva Densitas Data Cars . 216
3.8 Diagram Pencar X dengan Y yang mengandung kelom-
pok yang dapat digabung . . . . . . . . . . . . . . . . . 221
3.9 Diagram Pencar X dengan Y mengandung kelompok
yang perlu dipisah . . . . . . . . . . . . . . . . . . . . 227
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
17 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.1 Grafik Quantile dari Data Berdistribusi Normal (kiri)
dan Data Cenderung Tidak Berdistribusi Normal (Kanan)244
4.2 Grafik Sebaran Peluang dari Data Berdistribusi Normal
(lebih simetris, warna biru) dan Data Tidak Berdis-
tribusi Normal (tidak siumetris, warna merah) . . . . . 245
4.3 Boxplot respon dengan kelompok . . . . . . . . . . . . 247
4.4 Grafik Pencar Data dengan Hubungan Linear dan Ra-
gam Relatif Konstan . . . . . . . . . . . . . . . . . . . 249
4.5 Grafik Pencar Data dengan hubungan Linear tetapi Ra-
gam Relatif tidak Konstan . . . . . . . . . . . . . . . . 250
4.6 Grafik Pencar Data dengan hubungan lebih cenderung
nonlinear . . . . . . . . . . . . . . . . . . . . . . . . . . 251
4.7 Grafik Pencar Data dengan Hubungan Eksponensial . . 252
4.8 Grafik Pencar Sisa Data yang memenuhi syarat ho-
moskedastisitas. . . . . . . . . . . . . . . . . . . . . . . 254
4.9 Grafik Pencar Sisa Data yang tidak memenuhi syarat
homoskedastisitas. . . . . . . . . . . . . . . . . . . . . 255
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
18 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.10 Grafik Diagnostik dari Objek yang Dihasilkan oleh Fungsi
lm(). Grafik menunjukkan data relatif memenuhi asumsi
Model Linier Normal . . . . . . . . . . . . . . . . . . . 258
4.11 Grafik Diagnostik dari Objek yang Dihasilkan oleh Fungsi
lm(). Grafik menunjukkan data tidak memenuhi asumsi
Model Linier Normal, yang ditandai dengan adanya hu-
bungan tidak linier dan pencilan . . . . . . . . . . . . . 259
4.12 Sebaran data asli (naik dan membuka ke atas) dan trans-
formasi yang bisa dilakukan. Beberapa transformasi meng-
hasilkan sebaran yang mengikuti garis lurus tetapi ragam
tidak konstan . . . . . . . . . . . . . . . . . . . . . . . . 266
4.13 Sebaran data asli (naik dan terbuka ke bawah) dan trans-
formasi yang bisa dilakukan. Beberapa transformasi meng-
hasilkan sebaran yang mengikuti garis lurus tetapi ragam
tidak konstan . . . . . . . . . . . . . . . . . . . . . . . . 268
4.14 Sebaran data asli (dengan ragam tidak stabil) dan trans-
formasi yang bisa dilakukan. Beberapa transformasi hanya
menghasilkan ragam yang sedikit lebih stabil . . . . . . . 269
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
19 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.1 Plot Densitas dari sampel dengan berbagai nilai-tengah
dengan ukuran sampel 100 . . . . . . . . . . . . . . . . 289
5.2 Sebaran Data dengan ukuran sampel 100 dengan dis-
tribusi Normal (b) dan Gamma (r) . . . . . . . . . . . 290
5.3 Respon dengan Fungsi Hubungan Logit dan Probit . . 296
5.4 Diagram Pencar Prediksi dan Data Asli Peluang Ke-
berhasilan Berbagai Kelompok . . . . . . . . . . . . . . 335
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
20 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
21 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
DAFTAR TABEL
1.1 Tabel jumlah (kg) salak dan anggur dan harga yang
dibayar . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.2 Fungsi dan paket untuk menggambar grafik R . . . . . 79
2.1 Fungsi R terkait matriks . . . . . . . . . . . . . . . . . 134
3.1 Alternatif Penulisan Model dalam Formula R . . . . . . 225
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
22 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.1 Rangkuman Distribusi Anggota Keluarga Eksponensial 288
5.2 Ciri-ciri khas Distribusi Keluarga Eksponensial . . . . . 291
5.3 Jumlah Sukses(S) dan Gagal dalam Berbagai Kelom-
pok Faktor . . . . . . . . . . . . . . . . . . . . . . . . . 324
5.4 Distribusi dan Link pada R . . . . . . . . . . . . . . . 329
5.5 Jumlah Kelulusan dalam Berbagai Kelompok Perlakuan 331
5.6 Format Data R Jumlah Kelulusan dan Kegagalan . . . 332
6.1 Respon Pengukuran berulang . . . . . . . . . . . . . . 358
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
23 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
BAB 1
DASAR-DASAR PEMODELAN STOKASTIK
Analisis regresi sering disebut model statistika (statistical model, yaitu
barkaitan dengan mempelajari hubungan fungsional (bukan sekedar
hubungan asosiasi) dua peubah atau lebih. Dalam analisis ini satu
peubah atau lebih (disebut peubah respon) diuji hubungan fungsion-
alnya dengan beberapa peubah lain (disebut peubah penjelas). Bentuk
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
24 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
fungsi yang dihasilkan sering disebut sebagai model matematika atau
secara lebih khusus model statistika. Pada bab ini akan dibahas prin-
sip dasar pemodelan matematika, khususnya pemodelan statistika.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
25 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kompetensi
Pembaca diharapkan memahami hakekat pemodelan dalam bidang
statistika serta mempunyai gambaran tentang kedudukan dan perkem-
bangan regresi atau model linier dalam uji statistika. Secara lebih
khusus diharapkan:
1. dapat menyebutkan hakekat dari pemodelan matematika, khusus-
nya pemodelan statistika;
2. dapat menjelaskan langkah-langkah penyusunan model statistika;
3. dapat menjelaskan langkah-langkah mengestimasi parameter da-
lam model statistika;
4. dapat menjelaskan perkembangan model statistika penting.
5. dapat menentukan dan mengeksplorasi paket statistika R terkait
dengan analisis regresi
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
26 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Materi
1. Prinsip Pemodelan
2. Langkah-langkah PemodelanStatistika
3. Estimasi Parameter dalam Model Statistika
4. Perkembangan Model Statistika
5. Tinjauan singkat R
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
27 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.1. Prinsip Pemodelan
Ketika kita menganalisis data dengan menggunakan metode statistika,
hampir selalu menekankan asumsi yang dikenakan terhadap data yang
dianalisis. Asumsi-asumsi itu dapat meliputi hubungan antara pe-
ubah, maupun sebaran dari galat (error). Namun, mungkin tidak
semua kita menyadari bahwa saat itu sebenarnya sedang diterapkan
suatu pemodelan (dalam hal ini pemodelan statistik) dalam meme-
cahkan persoalan, maupun membuat suatu kesimpulan tentang ma-
salah yang dihadapi. Ketika membicarakan model atau pemodelan
dalam bidang matematika atau statistika, mungkin pikiran kita mem-
bayangkan materi matematika tingkat lanjut (advanced mathematics)
yang membutuhkan pemahaman kalkulus lanjut maupun persamaan
diferensial. Pemodelan, baik disadari atau tidak, implisit atau ek-
splisit, sebenarnya selalu dilakukan pada saat kita menggunakan ma-
tematika (atau khususnya statistika) dalam memecahkan masalah ke-
hidupanm riil. Bahkan, sejak di SLTP/SMU penyelesaian soal-soal
bentuk cerita (words problem), sebenarnya merupakan aplikasi pemo-
delan matematika. Demikian juga aplikasi sistim persamaan linier da-
lam kehidupan sehari-hari, sebagian besar merupakan bentuk aplikasi
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
28 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
pemodelan matematika.
Definisi 1.1 (Prinsip Pemodelan). Model matematika dari suatu ma-
salah adalah rumusan masalah dalam bentuk persamaan matematika
Definisi 1.2. Pemodelan matematika adalah proses menerjemahkan
masalah dalam bahasa umum(sehari-hari) ke dalam bahasa atau per-
samaan matematika
Sebagai ilustrasi, berikut disampaikan contoh soal penerapan
sistim persamaan linier dan langkah- langkah penyelesaian yang di-
anjurkan.
Contoh 1.1. Seorang ibu membeli 3 kilogram salak dan 2 kilogram
anggur. Ibu tersebut harus membayar sebesar Rp 17 000,- Sedangkan
ibu lain yang membeli 3 kilogram salak dan 5 kilogram anggur harus
membayar Rp 29.000,-. Jika pedagang memberlakukan harga tetap
terhadap kedua ibu- ibu tadi, berapa harga perkilogram salak dan
harga perkilogram anggur? Selanjutnya berapa harga harus dibayar
jika seseorang membeli x kg salak dan y kg anggur?
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
29 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Untuk menjawab persoalan di atas dianjurkan untuk menem-
puh langkah- langkah berikut. Hal ini dimungkinkan hanya dilakukan
secara implisit.
1. Kita misalkan bilangan yang ingin dicari (dalam hal ini harga
satu kilogram salak dan harga satu kilogram anggur) masing-
masing sebagai a dan b. Kita membuat persamaan matema-
tika dari persoalan dalam bentuk cerita tadi. Dalam hal ini
sebenarnya kita sedang membuat model matematika suatu per-
soalan. Untuk soal di atas model matematika yang diperoleh
adalah3a+ 2b = 1700
3a+ 5b = 29000
(1.1)
2. Kita menyelesaikan persamaan matematika di atas dengan teori
matematika yang kita miliki. Dengan metode eleminasi dan sub-
stitusi balik kita memperoleh a = 3000 dan b = 4000.
3. Mensubsitusikan secara serempak nilai a dan b yang diperoleh ke
sistim persamaan yang dimiliki untuk memeriksa apakah hasil
yang kita peroleh benar atau tidak.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
30 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4. Menyimpulkan bahwa harga satu kilogram salak adalah Rp 3000
dan harga satu kilogram anggur adalah Rp 4000.
Jadi harga x kg salak dan y kg anggur adalah
H = 3000x+ 4000y
Jadi dapat dipahami bahwa pemodelan atau menerjemahkan
masalah sehari-hari ke persamaan matematika merupakan bagian yang
sangat penting dalam menggunakan matematika untuk menyelesaikan
persoalan sehari- hari. Pentingnya pemodelan dalam matematika juga
dinyatakan oleh Prof. J. Neyman, yang dikutip dari Meyer, sebagai
berikut:
Whenever we use mathematics in order to study some obser-vational phenomena we must essentially begin by building amathematical model (deterministic or probabilistic) for thesephenomena. Of necessity, the model must simplify mattersand certain details must be ignored. The success of the modeldepends on whether or not the details ignored are really unim-portant in the development of the phenomena studied. Thesolution of mathematical problems may be correct and yet bein considerable disagreement with the observed data simplybecause the underlying assumptions made are not warranted.It is usually quite difficult to state with certainty, whether or
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
31 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
not a given mathematical model is adequate before some ob-servational data are obtained. In order to check the validity ofthe model, we must deduce a number of consequences of ourmodel and then compare these predicted results with observa-tions. [Kapan saja kita menggunakan metematika untuk mem-pelajari fenomena yang teramati, kita mesti perlu memulai de-ngan membangun suatu model matematika (deterministik atauprobabilistik) untuk fenomena tersebut. Sangat penting, mo-del yang dibuat harus menyederhanakan persoalan dan bebe-rapa rincian mesti diabaikan. Keberhasilan model bergantungpada apakah rincian yang diabaikan benar- benar tidak pen-ting dalam pengembangan fenomena yang dipelajari. Biasanyasangat sulit untuk menyatakan dengan pasti, apakah suatu mo-del matematika adalah tepat atau tidak sebelum diperoleh datapengamatan. Dalam rangka memeriksa validitas model, kitaharus menurunkan sejumlah konsekuensi (dalil) dari model kitadan membandingkan hasil dugaan teoritis dengan pengamatan](Meyer [28]).
Pembuatan model dari suatu persoalan adalah ibarat pembu-
atan peta suatu wilayah. Dalam proses pembuatan peta, harus ada
penyederhanaan, yaitu mengabaikan rincian hal-hal yang tidak men-
jadi kepentingan. Sangat jelaslah bahwa peta yang baik adalah peta
yang sederhana namun memuat secara akurat informasi yang diper-
lukan. Peta yang terlalu rinci, dalam hal tertentu menjasdi tidak ko-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
32 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
munikatif, karena terlalu banyak terdapat informasi yang tidak diper-
lukan. Sementara, di lain pihak, peta yang terlalu sederhana yang
mengabaikan informasi yang penting, dapat menjerumuskan pemba-
canya kepada sasaran yang keliru. Demikian juga, dalam menye-
lesaikan persoalan dengan menggunakan matematika, biasanya kita
selalu memulai dengan model yang paling sederhana yang berarti
banyak informasi yang diabaikan. Karenanya penyelesaian persoalan
secara matematis ini, mungkin benar tapi tidak bermanfaat dan tidak
bermakna, karena model yang dibangun tidak sesuai dengan data
yang diamati, akibat adanya asumsi penting yang dibuat untuk men-
dasarinya diabaikan. Itulah sebabnya dalam penyelesaian persoalan
secara matematika (atau statistika khususnya), biasanya dimulai dari
model yang sederhana kemudian dikembangkan secara berangsur-angsur
ke model yang lebih kompleks yang semakin sesuai dengan kondidi
riil di lapangan. Pada Contoh 1.1, sebenarnya setelah diperoleh kes-
impulan akhir tentang harga barang. Hasil tersebut perlu diperiksa
atau dicocokkan dengan keadaan riil dilapangan dengan mengambil
beberapa informasi yang lain, apakah temuan tersebut berlaku, meny-
impang sedikit atau banyak. Sehingga kita bisa mengambil langkah
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
33 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
apakah model yang kita pakai perlu diperbaiki atau tidak. Pada Con-
toh 1.1, ada asumsi yang dikenakan dalam persoalan tersebut yaitu
pedagang diasumsikan mengenakan harga yang tetap kepada semua
pembeli. Ini berarti peubah harga dianggap merupakan peubah tetap
yang tidak bersifat acak. Dengan demikian mengambil dua pembeli
sudah cukup untuk mementukan atau menghitung harga dua komu-
ditas (anggur dan salak).
Persoalan akan menjadi lebih kompleks apabila dalam kenyataan
di lapangan pedagang mengenakan harga yang berbeda-beda kepada
pembeli dan sangat boleh jadi kenyataan inilah yang banyak terjadi di
lapangan, terutama di pasar-pasar tradisional. Dalam kondisi ini ada
kemungkinan dari beberapa pembeli diperoleh informasi (data) yang
berbeda- beda misalnya dari 10 pembeli diperoleh informasi seperti
pada Tabel 1.1 yang berupa data fiktif.
Kedua sifat alami dari gejala ini menuntut pemodelan yang ber-
beda. Pemodelan yang pertama yang tidak memperhitungkan ada-
nya sebaran harga disebut pemodelan deterministik (matematika).
Dalam pemodelan ini peubah yang diamati dianggap tetap (fixed)
dan tidak memiliki sebaran sehingga hubungan yang diperoleh meru-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
34 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 1.1: Tabel jumlah (kg) salak dan anggur dan harga yang dibayar
Nomor
Pembeli
Jumlah Kg
Salak (X1)
Jumlah Kg
Anggur (X2)
Jumlah
Harga dalam
Rupiah (H)
1 2 4 20 500
2 6 3 29 000
3 3 2 17 000
4 4 5 31 500
5 5 6 40 000
6 6 3 30 500
7 3 5 29 000
8 2 2 14 500
9 5 6 39 500
10 6 6 41 000
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
35 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
pakan hubungan matematika yang bersifat fungsional murni (misal-
nya, y = f(x)). Pemodelan yang kedua, menganggap peubah harga
berubah-ubah dengan sebaran tertentu (misalnya, normal). Pemo-
delan yang kedua ini disebut pemodelan stokastik (statistika). Hu-
bungan yang diperoleh selain mengandung komponen fungsional, juga
mengandung adanya galat yang merupakan peubah acak yang berdis-
tribusi dengan sebaran tertentu. Jadi hubungan yang diperoleh men-
jadi y = f(x, α, β) + e, dengan e adalah peubah acak/ random yang
berdistribusi normal, misalnya. Fungsi f dan sebaran e biasanya
bergantung kepada suatu konstanta yang belum diketahui yang dise-
but parameter. Parameter inilah yang biasanya menjadi fokus ke-
pentingan dalam pemodelan statistika. Dalam contoh di atas X1, X2
dan Y disebut variabel/ peubah yang diketahui dari data sedang-
kan α dan β adalah parameter (yang akan dicari nilainya). Dengan
demikian, persamaan matematika yang sekarang harus diselesaikan
adalah
h = β1x1 + β2x2 + ε.
Selanjutnya dengan mengenakan beberapa pembatasan atau asumsi
pada ε, akan diperoleh berbagai variasi model. Asumsi yang paling
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
36 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
sederhana yang juga menghasilkan model yang paling sederhana ada-
lah bahwa εi berdistribusi identik dan independen mengikuti sebaran
normal. Model-Statistika Linier membahas berbagai alternatif model
serta penyelesaiannya. Dengan prosedur penyelesaian model stokastik,
dihasilkan persamaan berupa dugaan harga (h)
h = 3001, 73x1 + 3968, 40x2
dengan 3001,732 disebut penduga β1 atau β1 yaitu dugaan harga 1 kg
salak dan 3968,40 disebut β2 yaitu dugaan harga 1 kg anggur.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
37 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.2. Langkah-langkah Penting Dalam Pemodelan
1.2.1. Langkah penting dalam Pemodelan secara Umum
Dari uraian pada Contoh 1.1 sebenarnya sudah tergambar langkah-
langkah yang penting dalam pemodelan secara umum. Langkah- lang-
kah tersebut dapat diuraikan secara lebih eksplisit seperti berikut ini.
1. Penentuan model. Langkah ini meliputi:
(a) menentukan/ mengidentifikasi peubah beserta batas semes-
tanya;
(b) menentukan jenis dan derajat fungsi yang dibentuk;
Penentuan jenis dan derajat fungsi disesuaikan dengan kondisi,
tujuan dan sifat permasalahan yang dihadapi.
2. Menyelesaikan model. Langkah ini meliputi menghitung nilai
peubah atau konstanta yang ada pada model dengan menggu-
nakan kaidah- kaidah matematika baik secara analitik maupun
numerik.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
38 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3. Melakukan verifikasi. Hasil yang diperoleh dari penyelesa-
ian model sebelum disimpulkan atau diinterpretasikan ke da-
lam persoalan nnyata semestinya diverifikasi apakah sudah se-
suai dengan model yang digunakan. Langkah ini penting untuk
meyakinkan tidak adanya kesalahan perhitungan, kesalahan pe-
mrograman (kalau menggunakan komputer), maupun kesalahan
konsep matematika yang digunakan dalam menyelesaikan model.
4. Menarik kesimpulan. Selanjutnya hasil yang diperoleh diin-
terpretasikan sesuai dengan persoalan riil yang menjadi dasar
pemilihan model.
5. Melakukan uji kecocokan. Karena pada umumnya pemo-
delan dimulai dari model yang sederhana dengan mengabaikan
hal-halyang kompleks, atau menggunakan asumsi- asumsi secara
ketat, maka tidak mustahil hasil yang diperoleh tidak terlalu co-
cok dengan kondisi riil di lapangan. Melalui langkah ini seseo-
rang mendapat gambaran apakah model yang dipilih sesuai atau
perlu menggunakan meningkatkan kompleksitas modelnya de-
ngan menambah variabel maupun konstanta dalam model atau
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
39 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
mencoba hubungan fungsi yang lebih kompleks.
1.2.2. Langkah Penting dalam Pemodelan Statistika
Sebenarnya langkah- langkah dalam pemodelan stokastik sudah ter-
gambar langkah- langkah yang penting dalam pemodelan secara umum.
Namun ada beberapa langkah yang sifatnya khas yang tidak dilakukan
dalam pemodelan umum. Sifat khas ini disebabkan karena dalam
pemodelan statistika ada parameter yang menjadi kepentingan dan
ada komponen galat yang bersifat acak dan memiliki sebaran ter-
tentu. Langkah-langkah penting yang harus ditempuh dalam pemo-
delan stokastik dapat diuraikan seperti berikut ini.
1. Penentuan model yang meliputi:
(a) menentukan/ mengidentifikasi peubah;
(b) menentukan parameter yang menjadi kepentingan;
(c) menentukan hubungan antara parameter dan peubah serta
(d) menentukan distribusi komponen acak.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
40 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Penentuan hubungan serta distribusi ini disesuaikan dengan kon-
disi dan sifat permasalahan yang dihadapi.
2. Mengestimasi parameter yang menjadi kepentingan. Lang-
kah ini identik dengan Penyelesaian persamaan matematika yang
diperoleh sebagai model matematika dari permasalahan yang di-
hadapi. Langkah ini meliputi menghitung nilai estimasi titik
yang ada pada model dengan menggunakan kaidah- kaidah sta-
tistika baik secara analitik maupun numerik.
3. Menarik kesimpulan/ melakukan uji inferensi. Dalam pe-
modelan stokastik, karena peubah yang dihadapi adalah peubah
yang bersifat random/ acak maka nilai estimasi titik yang yang
diperoleh masih harus dilanjutkan dengan perhitugan estimasi
interval/selang keyakinan atau dilanjutkan dengan uji signifi-
kansi secara statistika:
(a) bagaimana besaran kesalahan dari dugaan yang diperoleh,
(b) bagaimana sebaran atau rentangan atau interval dari hasil
yang diperoleh?
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
41 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(c) apakah hasil yang diperoleh secara statistika signifikan atau
tidak.
4. Melakukan uji kecocokan (goodness of fit) atau mengadakan
diagnostik model. Hasil yang diperoleh selain diuji signifikansinya,
mestinya juga diuji kecocokannya dengan kondisi riil dilapangan.
Melalui langkah diagnostik diperiksa
(a) apakah ada kecocokan atau tidak antara asumsi yang di-
lakukan dengan kondisi riil data;
(b) apakah perlu melalukan remidi (mentransformasi data se-
hingga kondisi yang disyaratkan oleh model terpenuhi) atau
(c) apakah perlu mencari alternatif model yang lebih cocok.
Uji kecocokan ini biasanya dilakukan pada sisa/residu dari peng-
gunaan model. Itu sebabnya langkah ini kebanyakan dilakukan
sesudah model dipilih. Diagram langkah-langkah pemodelan,
khususnya untuk model stokastik/ model statistika, dapat dili-
hat pada Gambar 1.1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
42 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Problem Riil
Solusi Riil (Kesimpulan)
Model Matematika Menyelesaikan Model/
menyelesaikan
Persamaan
PEMODELAN MATEMATIKA
interpretasi, generalisasi
identifikasi, simplifikasi
Verifikasi
(Komputasi)
(Uji Model)
Gambar 1.1: Diagram Menunjukkan Langkah-langkah dalam Pemo-
delan Statistika
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
43 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dalam hal pengembangan model statistika, para Teorisi sta-
tistika, atau statistisi, menurunkan metode umum/ prosedur dalam
mengestimasi parameter, menguji dan mendiagnosis, serta meremidi
model yang dibuat. Para praktisi berkewajiban menerapkan metode
sesuai dengan persyaratan yang ditentukan atau yang dihasilkan oleh
para statistisi. Selain itu, tugas para teorisi statistika (statistisi) ada-
lah juga membangun berbagai model alternatif, untuk berbagai kon-
disi di lapangan. Kemudian, secara deduktif (matematis) menurunkan
sifat- sifat dari model tersebut, cara mengestimasi parameter, cara
mendiagnosis model serta mengaplikasikan model-model yang ditu-
runkan kedalam suatu paket komputer yang ramah (gampang dipakai
dan dipahami) sehingga bisa dipakai oleh para praktisi di lapangan.
Lebih tegasnya menurut Mendenhall (1979) dikatakan:
The statisticians study various inferential procedures, look-
ing for the best predictor or decicion-making process for a
given situation. Even more important, the statistician pro-
vides information concerning the goodness of an inferential
procedures. [Para statistisi mempelajari berbagai prose-
dur penarikan kesimpulan, mencari penduga terbaik- atau
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
44 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
proses pengambilan keputusan untuk kondisi tertentu. Bah-
kan lebih jauh mereka menyediakan informasi berkaitan
dengan kecocokan dari suatu prosedur pengambilan kepu-
tusan] (Mendenhall [26]).
Bagi para analis (praktisi) statistika, tugas pokoknya adalah
mempelajari model- model yang ditawarkan beserta persyaratan dan
prosedur yang harus ditempuh dalam menerapkan model tersebut.
Hal ini sejalan dengan fungsi dan tujuan ilmu statistika itu sendiri se-
bagaimana digambarkan Wackery et al. [49] bahwa tujuan statistika
adalah membuat kesimpulan tentang populasi berdasarkan informasi
yang diperoleh pada suatu sampel dan untuk memberikan ukuran de-
rajat kecocokan dari kesimpulan itu.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
45 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.3. Metode Mengestimasi Parameter
Salah satu langkah pokok dalam pemodelan statistika adalah menges-
timasi parameter yang menjadi kepentingan. Dalam analisis regresi,
ada dua kelompok parameter yang menjadi kepentingan yaitu yang
paling penting adalah parameter efek tetap atau parameter regresi βj(j = 0, 1, 2, ..., k) tergantung pada dimensinya) dan biasanya diper-
lukan juga mengestimasi parameter dispersi (misalnya, σ, tergantung
pada model yang dihadapi). Kadang- kadang parameter dispersi ini
diasumsikan diketahui. Ada dua metode yang banyak dipakai dalam
mengestimasi parameter efek tetap dalam model linier yaitu:
1. metode kuadrat terkecil (least square method) dan
2. metode likelihood maksimum (maximum likelihood method).
1.3.1. Metode Kuadrat Terkecil
Pada dasarnya parameter yang diestimasi adalah parameter dari garis
regresi dari model yang mewakili populasi. Hal ini diperoleh berda-
sarkan informasi atau sebaran sampel yang dimiliki. Metode kuadrat
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
46 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
terkecil (least square), menggunakan pendekatan geometris. Secara
geometris, garis yang paling mewakili sebaran sampel adalah garis
yang mempunyai simpangan minimum, atau error/galat terkecil dari
pencaran data. Untuk memudahkan perhitungan, jarak yang aslinya
berupa harga mutlak dari error, |εi| diganti dengan kuadrat galat terse-
but, yaitu ε2i .
Langkah langkah dalam mengestimasi parameter dari sampel se-
banyak n dengan metode kuadrat terkecil adalah:
1. mengubah persamaan model
yi = xiβ + εi menjadi εi = xiβ − yi;
2. mencari bentuk kuadrat dan jumlah kuadrat dari galat, yaitu
Q =∑n
i=1 ε2i ;
3. menghitung penduga parameter dengan mencari minimum dari
Q terhadap βj.
Dalam statistika, kalau kita membahas maksimum/ minimum
suatu fungsi, pada umumnya yang menjadi kepentingan adalah ni-
lai peubah atau paremeter yang menyebabkan fungsi itu mencapai
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
47 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
maksimum/ minimum, bukan nilai maksimum/ atau minimum fungsi
tersebut. Dalam hal ini yang menjadi kepentingan adalah nilai β,
bukan nilai Q.
1.3.2. Metode Likelihood Maksimum
Kalau metode kuadrat terkecil menggunakan pendekatan geometris,
maka metode likelihood maksimum menggunakan pendekatan distribusi.
Dari data yang dimiliki serta asumsi distribusi yang diberlakukan pada
data tersebut kita memperoleh fungsi likelihood dari data tersebut.
Jelasnya langkah tersebut dapat diuraikan sebagai berikut.
1. Tentukan likelihood dari data Y1, Y2, · · · , Yn, yang saling bebas
dan mempunyai fungsi kepadatan peluang masing- masing, mi-
salnya ψi(θ). Likelihood keseluruhan ini adalah
L(θ) =n∏i=1
ψi(θ)
Fungsi likelihood tidak lain adalah fungsi kepadatan probabilitas
darai Y , hanya saja nilai y dianggap diketahui (dari data), tetapi
parameternya (θ) yang tidak diketahui.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
48 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. Tentukan maksimum dari L atau log−L terhadap parameter θ.
Dalam kenyataannya, orang lebih seringmencari maksimum dari
fungsi log-likelihood, log (L) dari pada L. Hal ini bisa dilakukan
karena yang dicari adalah penyelesaian (nilai variabel y yang meye-
babkan terjadinya nilai Lmaksimum) bukan nilai maksimum L. Fungsi
log adalah fungsi monoton yang tidak mengubah nilai y yangmenye-
babkan L maksimum. Selain itu transformasi logaritma juga mem-
berikan beberapa keuntunan dalam perhitungan yaitu menghilangkan
exponen dan menyederhanakan produk menjadi jumlah.
`(θ) =n∑i=1
log (ψ(θ))
1.3.3. Mencari Maksimum dengan Metode Numerik
Pada umumnya maksimum suatu fungsi tidak bisa diperoleh secara
analitik, oleh karenanya diperlukan pendekatan yang disebut metode
numerik. Mencari maksimum/ minimum suatu fungsi F pada dasarnya
sama dengan mencari nilai nol atau penyelesaian fungsi f(θ) = F ′(θ) =
dF/dθ. Metode numerik yang biasa dipakai dalam mencari maksimum
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
49 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
likelihood adalah Metode Newton-Raphson yang merupakan metode
iteratif. Langkah- langkah pokok dari metode Newton-Raphson ini
dapat diuraikan sebagai berikut:
1. menentukan nilai awal b0
2. melakukan iterasi sampai konvergen (sampai kriteria konver-
gensi terpenuhi)
b1 = b0 −F ′(b0)
F ′′(b0)(1.2)
atau
b1 = b0 −f(b0)
f ′(b0)(1.3)
dengan f = F ′.
Apabila peubah atau parameternya berdimensi tinggi, maka fungsi
turunan pertamanya berupa vektor (D) sedang turunan keduanya
akan berupa matriks yang disebut matriks Hessian (H). Bentuk mul-
tivariat dari Newton- Raphson ini adalah
b1 = b0 −D(b0)H−1(b0). (1.4)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
50 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Lebih khusus lagi, dalam statistika matriks Hessian ini kadang
kadang lebih sederhana jika diganti dengan negatif dari nilai hara-
pannya yang disebut matriks informasi dan dinotasikan I = −E[H].
Persamaan iterasi yang menggunakan matriks informasi dikenal de-
ngan metode skoring dari Fisher (Fisher’s scoring) yang ditunjukkan
oleh persamaan berikut.
b1 = b0 + D(b0)I−1(b0)(1.5)
Ada tiga hal penting yang harus diperhatikan dalam mengap-
likasikan metode numerik (Newton-Raphson maupun skoring dari Fisher)
yaitu: (i) algoritma yang dipakai (lengkap atau terpartisi), (ii) nilai
awal dan (iii) kriteria konvergensi.
Nilai awal untuk b0 ditentukan sedemikian sehingga pada saat
itu xb0 = y, sedangkan kriteria konvergensi bisa menggunakan max
(|b1 − b0| < δ,) untuk δ bilangan positif sangat kecil, misalnya 10−3.
Jika parameter yng diestimasi terdiri atas beberapa unsur, maka ada
beberapa cara yang ditempuh dalam mengestimasi dengan menggu-
nakan metode Newton-Raphson yaitu seperti berikut ini.
1. Mengestimasi secara serempak dengan memperlakukan param-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
51 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
eteryang diestimasi sebagai sebuah vektor penduga. Cara ini
disebut pendekatan algoritma penuh. Cara ini cocok apabila
setiap unsur dari vektor parameter mempunyai sifat-sifat (kon-
vergensi) yang relatif sama.
2. Mengelompokkan unsur-unsur parameter yang sejenis. Unsur-
unsur sejenis lalu diberlakukan sebagai suatu vektor. Dengan
demikian akan diperoleh lebih dari satu vektor parameter. Ma-
sing - masing vektor parameter yang diestimasi dengan cara
multivariate, tetapi pendugaan vektor satu dengan lainnya di-
lakukan secara selang-seling. Selang seling dapat dilakukan pada
setiap iterasi (nested), atau setelah masing- masing konvergen
pada kondisi tertentu(zig-zag). Algoritma seperti ini disebut al-
goritma terpartisi (partitioned algorithm). Pengelompokan bi-
asanya dilakukan berdasarkan parameter regresi (β) dan param-
eter dispersi (φ) yang biasanya kedua jenis parameter ini mem-
punyai sifat-sifat yang berbeda terutama dilihat dari kecepatan
konvergensinya.
Pembahasan kedua algoritma di atas (penuh dan terpartisi) dapat
dilihat pada Smyth [33] dan Smyth [34].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
52 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.4. Model Linier dan Perkembangannya
Perkembangan pemodelan stokastik, terutama model linier, dapat di-
katakan dimulai pada abad ke 19 yang didasari oleh teori matematika
yang diletakkan diantaranya oleh Gauss, Boole, Cayley dan Sylvester
yang terkait dengan teori invarian dalam aljabar. Teori invarian al-
jabar mempelajari bentuk-bentuk kuantitas yang tidak berubah ter-
hadap suatu transformasi linier. Teori invarian ini yang mendasari
perkembangan teori nilai eigen, vektor eigen, matriks determinan,
metode dekomposisi dan masih banyak lagi yang lainnya. Salah satu
contoh dalam statistika kita tahu bahwa korelasi dua peubah acak
tidak berubah walaupun peubah- peubah tersebut mengalami trans-
formasi.
Perkembangan model linier dimulai dengan perkembangan ana-
lisis regresi pada abad 19 oleh Pearson perkembangan korelasi segera
setelah itu. Teori regresi ini yang menjadi dasar perkembangan teori
model linier. Perkembangan model linier tidak bisa dilepaskan dengan
perkembangan teori matriks atau aljabar linier. Melalui teori matriks
(determinan, invers, perkalian matriks) pembahasan model linier da-
pat didekati secara umum (Lihat Statsoft [35]). Dalam subbab ini
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
53 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
perkembngan model linier lebih dititik beratkan dari dua asumsi dasar
yaitu distribusi dan independensi galat.
Sebagaimana diuraikan sebelumnya, bahwa pemodelan dimulai
dari yang sederhana, yang secara matematis mudah diselesaikan, ke-
mudian berkembang ke arah yang lebih realistik. Hal ini dapat di-
lakukan, salah satunya dengan menerapkan berbagai asumsi yang ber-
beda terhadap distribusi galat dalam model yang digunakan. Prin-
sip seperti ini telah berkembang dari model yang paling sederhana
(klasik), ke model hirarkis tergeneralisir yang saat ini merupakan pe-
modelan yang paling terkini. Dalam sub-bab ini diuraikan secara
ringkas perkembangan model linier ditinjau dari segi distribusi dan
independensi galatnya.
1.4.1. Model linier klasik
Pemodelan linier memiliki bentuk umum
yi =
p∑j=0
xijβj + εi (1.6)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
54 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Untuk i = 1, 2, . . . , n dan j = 1, 2, . . . , p, atau dalam bentuk matriks
Y = Xβ + ε (1.7)
Dalam hal ini (i) ε merupakan galat atau error yang diasumsikan
merupakan peubah acak yang memenuhi distribusi tertentu, misal-
nya normal; (ii) peubah x adalah peubah tetap yang tidak bersifat
acak dan (iii) β adalah parameter yang menentukan koefisien dari pe-
ubah peubah tetap tadi. Dalam ilustrasi pada Contoh 1.1. misalnya,
dianggap bahwa sebenarnya ada hubungan yang bersifat tetap yang
menentukan harga barang di pasar. Namun, selain itu masih ada lagi
faktor lain yang bersifat acak yang menyebabkan harga barang tadi
dalam kenyataannya dari pembeli ke pembeli mungkin menyimpang
dari fungsi hubungan tadi. Dalam pemodelan statistika/ stokastik, ke-
dua komponen ini dipisahkan yaitu yang bersifat tetap dan fungsional
dinotasikan dengan f(x, β), yang bisa disebut sebagai komponen tetap
(fixed), sedangkan komponen lainnya, ε, yang bersifat acak disebut se-
bagai komponen acak (random component) atau dalam hal ini secara
khusus disebut komponen galat (error component). Dari segi fungsi
hubungan f , bentuk yang paling sederhana adalah hubungan linier,
sehingga dari aspek ini model yang paling sederhana yang kita miliki
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
55 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
adalah model linier. Sedangkan dari segi komponen acaknya, yang pal-
ing sederhana adalah asumsi bahwa galatnya berdistribusi normal dan
saling independen antara satu respon dengan respon lainnya. Asumsi
ini menghasilkan model linier normal sederhana atau normal linear
models (NLM). Dari kedua hal tersebut lahirlah yang disebut model
normal sederhana atau model linier klasik yang secara formal dapat
diuraikan sebagai berikut.
Definisi 1.3 (Bentuk dan Asumsi Model Linier Klasik).
Model:
yi =k∑j=0
xijβi + εi (1.8)
atau untuk keseluruhan respon dapat dituliskan dalam bentuk
matriks seperti persamaan (1.7),
Y = Xβ + ε
Asumsi: xi bukan peubah acak dan diukur tanpa galat dan εi in-
dependen dengan ε′i untuk setiap i 6= i′ dan masing- masing
berdistribusi N(0, σ2).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
56 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Berdasarkan asumsi di atas diperoleh bahwa secara keseluruhan
ε dapat dianggap berdistribusi multivariat normal (MVN) dengan koe-
fisen variasi konstan, yang dinotasikan dengan ε ∼ MVN(0, σ2I).
Model mensyaratkan bahwa respon ke i dan ke i′ adalah saling bebas
(independen), yang berarti tidak ada korelasi diantaranya. Beberapa
referensi yang membahas model linier normal ini diantaranya adalah
Neter et al. [31], Bowerman et al.[3].
1.4.2. Model Linier Tercampur
Berdasarkan kenyataan di lapangan banyak ditemukan pengamatan
yang menghasilkan respon yang tidak saling independen. Misalnya,
apabila pada suatu subjek dilakukan pengamatan yang berulang- ulang
maka respon yang diperoleh antara satu dengan sebelumnya, atau satu
dengan berikutnya, dapat dipastikan akan saling berkorelasi. Dengan
demikian, pengamatan yang diperoleh bukan lagi merupakan hasil
pengamatan atau respon tunggal, tetapi merupakan vektor respon.
Tentu saja respon seperti ini dapat ditangani dengan metode multi-
variat. Namun ada kekhasan dari pengamatan seperti ini, yaitu kore-
lasi/ hubungan antara respon satu dengan lainnya biasanya berpola,
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
57 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
sehingga dianggap kurang pas kalau ditangani dengan metode mul-
tivariat biasa. Untuk menangani respon-respon semacam ini model
linier klasik di atas lalu dikembangkan menjadi model linier tercam-
pur atau linear mixed models (LMM). Dalam model ini hubungan
antara respon yang satu dengan lainnya dianggap berasal dari pen-
garuh suatu peubah yang tidak kentara atau laten (subjek, misalnya).
Untuk itu komponen tetap (f(x)) diuraikan lagi menjadi komponen
tetap dan komponen efek acak (random effects). Dengan demikian
model ini memiliki dua komponen acak yaitu komponen error (ε) dan
komponen efek acak yang biasanya dinotasikan dengan u. Model ini
biasa disebut model linier tercampur (linear mixed model) yang dapat
didefinisikan sebagai berikut.
Definisi 1.4 (Bentuk dan Asumsi Model Linier Tercampur).
Model:
Y = Xβ + Zu + ε (1.9)
Asumsi: u ∼ MVN(0, σ21I) dan ε ∼ MVN(0, σ2
2I). u independen
dengan ε.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
58 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Sebenarnya ragam u dapat bervariasi sehingga membentuk ma-
triks ragam-koragam dari (Y) yang bervariasi juga. Struktur ma-
triks ragam-koragam ini dapat dibentuk sesuai kondisi respon yang
dihadapi. Bentuk yang paling sederhana di atas menghasilkan matriks
ragam-koragam yang disebut matriks uniform atau compound symme-
try atau seragam. Dengan menggunakan jumlah peubah acak yang
berdistribusai normal dan saling independen bisa diperoleh bahwa
bentuk ragam-koragam Y , yang identik dengan jenis korelasi uniform,
adalah
V =
σ21 + σ2
2 · · · σ21 · · · σ2
1
σ21 · · · σ2
1 + σ22 · · · σ2
1...
. . ....
. . ....
σ21 · · · σ2
1 · · · σ21 + σ2
2
atau secara umum
V = φ
1 · · · ρ · · · ρ...
. . ....
. . ....
ρ · · · 1 · · · ρ...
. . ....
. . ....
ρ · · · ρ · · · 1
(1.10)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
59 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Model ini mengasumsikan bahwa korelasi antara pengamatan
satu dan lainnya bersifat konstan (uniform). Struktur lain yang juga
banyak diterapkan adalah Auto Regresive 1 (AR1) atau disebut ragam-
koragam dengan korelasi serial yaitu:
V = φ
1 ρ ρ2 · · · ρk
ρ. . .
.... . .
...
ρ2 · · · 1 · · · ρ...
. . ....
. . . ρ
ρk · · · ρ2 ρ 1
(1.11)
Model ini mengasumsikan bahwa seiring dengan jarak yang makin
jauh, maka korelasi/ hubungan antara respon tersebut semakin kecil.
Dalam beberapa paket komputer, yang dimodelkan adalah struktur
korelasinya, bukan matriks ragam-koragamnya.
Model linier tercampur sering juga disebut dengan istilah mo-
del linier bertingkat (hierarchical linear model). Istilah bertingkat di-
gunakan karena model ini biasa juga didefinisikan secara bertingkat
seperti berikut ini.
Definisi 1.5. Asumsi Model Linier Tercampur/ Bertingkat
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
60 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1. Ada efek acak ui yang berhubungan dengan strata atau subjek ke
i, untuk i = 1, ...n dimana antara satu efek acak dengan lainnya
saling independen dan berdistribusi normal dengan nilai-tengah
0;
2. Kondisional terhadap efek acak ke i , respon-respon di dalam
strata ini juga saling independen dan berdistribusi normal de-
ngan nilai-tengah dan ragam konstan.
Model linier Campuran banyak diaplikasikan untuk data yang
berasal dari pengukuran berulang yang dikenal dengan data longitu-
dinal atau repeated meassurement. Referensi yang bisa dijadikan acuan
untuk mempelajari model linier bertingkat ini diantaranya adalah Bab
4 dari Davidian dan Giltinan [9], Diggle et al. [10], Laird dan Ware
[19]. Sedangkan untuk model yang lebih umum yaitu termasuk model-
model non-linier dapat dilihat pada Davidian dan Giltinan [9]
1.4.3. Model Linier Tergeneralisir
Kondisi lain yang banyak ditemukan di lapangan yang tidak dapat
ditangani langsung oleh model linier klasik adalah adanya kenyataan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
61 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
bahwa, distribusi respon tidak mesti Normal. Sejauh ini, kondisi se-
perti ini biasanya ditangani dengan melakukan transpormasi pada re-
spon. Transpormasi yang banyak dipakai adalah transpormasi log-
aritma. Namun, ada beberapa permasalahan yang mungkin timbul
sebagai efek dari transpormasi ini misalnya seperti berikut ini. Re-
spon yang sudah ditranspormasi mungkin mendekati distribusi nor-
mal, tetapi akibat transpormasi ada kemungkinan syarat yang lain
(syarat ketidak-bergantungan) menjadi tidak terpenuhi. Adanya ker-
ancuan dalam menafsirkan hasil penelitian oleh karena efek yang di-
uji adalah dalam skala logaritma, bukan dalam sekala aslinya. Hal
ini menyebabkan kesimpulan terasa janggal misalnya, ”ada hubungan
positif antara log-konsentrasi pemupukan dengan log-panen”. Untuk
menangani kondisi dimana respon yang ada tidak berdistribusi Nor-
mal, tetapi masih saling bebas, maka para statistisi yang dipelopori
oleh Nelder dan Wedderburn [30] telah mengembangkan model linier
yang dikenal dengan generalized linear model (GLM). Model ini di In-
donesai dikenal dengan model linier terampatatau tergeneralisir. Mo-
del linier ini menggunakan asumsi bahwa repon memiliki distribusi
keluarga ekponensial. Distribusi keluarga eksponensial adalah dis-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
62 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tribusi yang sifatnya lebih umum, dimana distribusi- distribusi yang
banyak kita kenal (Normal, Gamma, Poisson) termasuk di dalamnya
dan merupakan bentuk- bentuk khusus dari distribusi Keluarga Eks-
ponensial. Definisi distribusi Keluarga Eksponensial ini akan dibahas
pada bab selanjutnya. Kalau kita simak model linier klasik, kita men-
emukan beberapa hal yang sifatnya khas dan istimewa yaitu:
1. ada komponen tetap yang disebut prediktor linier ;
2. respon yi berdistribusi normal dan saling independen dan
3. nilai-tengah yi adalah µi =∑k
j=0 xijβj.
Pada model linier tergeneralisir/terampat, hubungan di atas men-
galami perubahan atau generalisasi, sebagaimana dalam definisi ber-
ikut:
Definisi 1.6 (Asumsi Model Linier Tergeneralisir). Model linier ter-
generalisir adalah model yang mengandung tiga hal yaitu:
1. komponen tetap yang disebut prediktor linier ηi =∑k
j=0 xijβj;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
63 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. respon yi berdistribusi secara independen dalam keluarga eks-
ponensial;
3. hubungan antara nilai-tengah dengan prediktor linier ditunjukkan
fungsi g(.) yang disebut fungsi ’link’ sedemikian sedingga g(µi) =
ηi. Fungsi g() disebut fungsi hubungan (link-function).
Ada fungsi hubungan khusus yang disebut fungsi hubungan kanonik
atau natural yang berkaitan erat dengan distribusi y. Misalnya, jika
distribusinya normal maka g() adalah identitas. Dari hal di atas di-
katakan bahwa komponen penting dalam model linier tergeneralisir
ada tiga yaitu:
(i) adanya prediktor linier,
(ii) adanya distribusi keluarga eksponensial dan
(iii) adanya fungsi-hubungan.
Referensi yang umum dijadikan acuan utama mempelajari mo-
del linier tergeneralisir ini adalah generalized linear models oleh Mc-
Cullagh dan Nelder [24], sedangkan sebagai pemula dapat digunakan
pengantar yang ditulis oleh Dobson [11].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
64 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.4.4. Model untuk Data Tidak Normal dan Tidak Saling
Bebas
Seiring dengan semakin luasnya penggunaan metode statistika dalam
menganalisis data, maka data yang dihadapi ada kemungkinan tidak
saja tidak berdistribusi Normal tetapi juga tidak saling bebas. Untuk
menganalisis data semacam ini ada tiga kelompok metode yang banyak
dipakai untuk menyelesaikan model linier tercampur tergeneralisir.
GLMM . Model ini merupakan kombinasi antara LMM dan GLM.
Pada model ini, walau komponen galat tidak harus berdistribusi
Normal, tetapi komponen acaknya masih diasumsikan berdis-
tribusi Normal dan menggunakan bentuk aditif seperti pada mo-
del linier tercampur normal. Model linier ini biasa disebut seba-
gai Model linier tercampur tergeneralisir (GLMM = Generalized
Linear Mixed Model)
HGLM Model ini menggunakan bentuk multiplikatif dan komponen
acaknya tidak dibatasi dengan distribusi Normal. Model linier
ini sering juga disebut Model linier hirarkis/ bertingkat terger-
eralisasir (HGLM=Hierarchical Generalized Linear Model). Mo-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
65 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
del linier ini termasuk model linier yang relatif baru dan masih
sedang dikembangkan (lihat misalnya Lee dan Nelder [20] dan
Tirta ([37], [39],[38].
GEE Pendekatan yang relatif lebih praktis, Liang & Zeger [21] dan
Zeger & Liang [52] memperkenalkan metode yang disebut dise-
but Generalized Estimating Equations (untuk selanjutnya dis-
ingkat GEE) yang merupakan sebuah analogi atau generalisasi
multivariat dari quasi-likelihood. Manakala tidak ada fungsi like-
lihood yang pasti untuk dijadikan acuan, cukup beralasan untuk
menduga/ mengestimasi dengan menyelesaikan sebuah analogi
multivariat dari metode quasi-score yang diperkenalkan Wed-
derburn [51] dimana kita hanya perlu menentukan bentuk mean
atau nilai-tengah(sebagai momen pertama) dan matriks ragam-
koragam (sebagai momen kedua), tanpa perlu mengetahui ben-
tuk pasti likelihoodnya. Pembahasan yang lebih detil dapat
dibaca pada Diggle et al. [10] (Lihat juga Yasi et al. Perkem-
bangan dan pembagian model linear dapat diliustrasikan dalam
bentuk bagan seperti pada Gambar 1.2.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
66 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
εXβY +=
Komponen Acak
Komponen Tetap
Univariat? Multivariat?
Independen? Dependen (Multi kolinieritas)?
RKU Seleksi Variabel
R. BERTATAR STEPWISE
Normal? Tidak Normal?
Independen? Tidak Independen?
NLM/MLK LMM/MLC
GLMM/MLCT GEE
GLM/MLC
Var.Laten? REGRESI GULUD (RIDGE)
SEM
Pencilan/Outlier?
REGRESI ROBUST
Faktor emua ANOVA/MANOVA
Gambar 1.2: Pembagian dan Perkembangan Model Linear
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
67 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.4.5. Pengembangan Lain Model Linier
Selain berkembang akibat variasi asumsi distribusi dari galat, model
linier juga berkembang ke arah variasi kondisi peubah bebas atau pe-
ubah penjelas X, seperti ditujukkan oleh Gambar 1.2. Asumsi dasar
dari peubah X adalah bukan peubah acak (tidak memiliki distribusi)
dan merupakan besaran kuantitatif.
Dalam perkembangannya, ada kalanya Xj, j = 0, 1, 2, 3, . . . , p−1 merupakan peubah acak sedangkan Xj dan X ′j tidak saling bebas
untuk suatu j 6= j′, dalam kondisi seperti ini, dikatakan terjadi multi-
kolinieritas antara peubah bebas X. Tingginya multikolinieritas dapat
menyebabkan adanya estimasi parameter tidak teliti. Secara matema-
tis Xj dan X ′j yang tidak saling bebas, menunjukkan bahwa salah satu
kolom matriks X merupakan kombinasi linier linier dari kolom-kolom
lainnya yang menyebabkan X tidak dalam rank penuh, sehingga invers
matriks XTX menjadi tidak terdefinisikan. Ada beberapa prosedur
atau tehnik untuk menangani masalah multikolinieritas, diantaranya
adalah regresi Ridge dan Regresi dengan Komponen Utama (RKU)
(lihat Neter et al[31]).
Tidak jarang juga kumpulan data yang kita miliki, sesungguh-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
68 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
nya merupakan sekumpulan dari berapa kelompok data atau sampel
sesungguhnya terdiri atas beberapa subsampel. Persoalan yang di-
hadapi adalah apakah model (garis regresi) masing- masing kelompok
harus berbeda atau dapat digabung dalam satu model yang sama.
Dalam hal ini sebagian peubah penjelas Xj akan merupakan peubah
kualitatif, atau merupakan indikator kelompok atau grup dari kelom-
pok yang ada pada data, sampel maupun populasi. Analisis model
linier yang menangani data semacam ini menggunakan peuban boneka
dummy variable dan dapat dilihat pada Neter et al[31].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
69 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
50 60 70 80 90
5060
7080
90
NMat
NF
is
LP
Gambar 1.3: Ilustrasi Data dengan pencilan dan kelompok. Data ini
memerlukan pemisahan model dari subsampel
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
70 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.5. Model-model Nonlinier
Pada model-model yang telah dibicarakan sebelumnya, ada ciri khas
hubungan antara parameter dan peubah prediktornya, yaitu adanya
kombinasi linier antara peubah prediktor dengan parameter regresinya
(yaitu ηi =∑p
i=1 xijβj. Sementara itu hubungan antara µi dengan ηitidak selalu linier (misalnya log, resiprokal dan lain-lain). Ciri-ciri
tersebut menyebabkan model yang telah dibicarakan masih termasuk
kelompok model linier.
Perkembangan lain dari model statistika tidak mewajibkan ada-
nya kombinasi linier (ηi), tetapi mengadopsi bentuk yang lebih luas
yaitu polinomial atau bentuk aditif, η(x) = α +∑p
j=1 fj(xj). Ter-
masuk dalam model ini adalah GAM (generalized additive models)
(Hastie dalam Chamber & Hastie [5], Hastie & Tibsirani [14]), regresi
lokal (Cleveland et al., dalam Chamber & Hastie [5], Venables& Ripley
[46]).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
71 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.6. Tinjauan singkat Program Statistika R
Penggunaan piranti lunak komputer dalam analisis regresi hampir
tidak bisa ditunda lagi. Selain untuk mempercepat proses perhitun-
gan, penggunaan piranti lunak memungkinkan peneliti atau analis
data dapat melakukan dengan cepat (i) berbagai alternatif model
(baik dilihat dari jenis sebaran, jenis hubungan serta jumlah peu-
bah yang dimuat) serta memilih model yang terbaik; (ii) melengkapi
hasil analissi data secara numerik dengan visualisasi grafik yang dapat
membantu pemahaman dalam menginterpretasi model. Dalam sub-
bab ini akan dibahas secara singkat beberapa kemampuan R terkait
pemodelan statistika atau analisis regresi, diantaranya:
1. kemampuan umum terkait cara mengaktifkan paket, melihat-
dokumentasi paket termasuk contoh penggunaannya;
2. kemampuan manipulasi grafik terkait pemeriksaan asumsi mo-
del yang dipergunakan dan visualisasi untuk melengkapi hasil
analisis secara numerik;
3. paket-paket R yang terkait dengan berbagai bentuk analisis re-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
72 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
gresi mulai dari yang paling sederhana (regresi klasik) sampai
yang sangat kompleks (respon nonnormal dan tidak saling be-
bas, hubungan nonlinier).
R adalah piranti lunak utuk analisis data dan penyajian grafik
yang berbasis Open Sources. Sebagian besar kemampuan R hanya
bisa dimanfaatkan melalio pendekatan CLI (command line interface),
yaitu dengan mengirim perintah dalam bentuk kumpulan perintah
baris atau skrip. Hanya sebagian kecil kemampuan R yang dapat
dimafaatkan melaui menu grafis GUI(graphical user interface) Ada
dua cara memanfaatkan R melalui CLI.
1. Menulis perintah langsung pada Rconsole. Untuk pertintah-
perintah singkat yang jarang diulang, biasanya langsung ditulis
pada layar Rconsole.
2. Menulis skrip secara terpisah. Untuk perintah yang agak pan-
jang dan sering diulang (misalnya dalam simulasi), perintah-
perintah R ditulis secara tersendiri pada editor skrip. Kumpulan
perintah ini selanjutnya dapat dijalankan sebagian atau secara
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
73 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
keseluruhan sesuai kebutuhan. Untuk mengaktifkan editor skrip
pada R dapat dilakukan langkah berikut:
(a) Pada menu File pilih New Script atau Open Script
(b) setelah perintah ditulis pada layar editor eksekusinya dapat
dilakukan dengan mengaktifkan menu Edit pada Editor,
selanjutnya bisa pilih run lines atau run all
Hampir semua paket atau Pustaka R yang terkait dengan ana-
lisis data tingkat lanjut (advanced statistical analyses), termasuk re-
gresi hanya bisa dimanfaatkan melalui pendekatan perintah baris atau
skrip. Hanya sebagian kecil dan yang masih bersifat mendasar yang
dapat dimanfaatkan melalui pendekatan menu, misalnya RComman-
der (lihat Tirta [43]. Untuk itu, pembaca perlu memahami cara me-
manfaatkan R melalui skrip (Untuk dokumentasi lebih detail dapat
dilihat pada Tirta [42]). Secara umum ada beberapa perintah pen-
ting yang perlu dikuasai untuk dapat memanfaatkan R dengan baik
yaitu:(i) cara mengaktifkan paket, (ii) melihat dokumentasi paket, (iii)
menjalankan contoh pada paket.
1. Mengaktifkan paket. Kemampuan R tersusun atas fungsi-fungsi
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
74 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
yang dikemas dalam bentuk paket. Paket yang dimiliki R belum
bisa dimanfaatkan sampai paket itu diaktifkan. Ada dua cara
mengaktifkan suatu paket yaitu.library(nama_paket)
require(nama_paket)
Misalnya untuk mengaktifkan paket gee, kita dapat memanggil
dengan salah satu cara berikut.
library(gee)
require(gee)
Jika dilakukan akan muncul pesan
Loading require package: gee
2. Membaca dokumentasi pada paket.Setelah paket diaktifkan, se-
lenjutnya dokukmentasinya dapat dipanggil. Berikut adalah
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
75 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
cara memanggil dokumentasi paket, dengan contoh khusus paket
gee.
help(nama_paket)?nama_paket
help(gee)
?gee
Setelah perintah tersebut dijalankan, maka akan muncul doku-
mentasi tentang paket gee, diantaranya berisi (i) cara meman-
faatkan paket gee,(ii) jenis dan interpretasi keluaran gee, (iii)
referensi terkait gee, serta (iv) contoh penggunaan gee.
3. Menjalankan contoh-contoh pada paket. Satu paket R dapat
terdiri atas beberapafungsi analisis. untuk menjalankan contoh-
contoh fungsi pada paket dapat ditempuh dua cara. (Paket gee
secara kebetulanjuga memuat fungsi analissi yang disebut gee).
(a) Dengan melakukan perintah langsung.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
76 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
example(nama_fungsi)example(gee)
(b) Dengan menyalin teks pada contoh; dengan cara ini teks
contoh yang ada pada dokumentasi, disalin (copy) lalu ditem-
pelkan (paste) pada Rconsole.
4. Menyimpan objek dan memeriksa komponen objek. Hasil perhi-
tungan dengan R biasanya disimpan dalam bentuk objek. Kom-
ponen objek dapat dilihat dengan menggunakan perintah names(nama_objek).
nama_objek<-fungsi
names(nama_objek)
Sebagai contoh komponen objek yang dihasilkan oleh analisis
model linier dapat ditujnukkan pada tampilan berikut.
lm1<-lm(y~x)
names(lm1)
"coefficients" "residuals" "effects" "rank"
"fitted.values" "assign" "qr" "df.residual"
"xlevels" "call" "terms" "model"
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
77 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Selanjutnya untuk mencetak sebagian komponen dari objek ber-
sangkutan dilakukan dengan perintah
newline print(objek$komponen)).
Berikut adalah perintah dan hasil keluaran yang dilakukan pada
objek lm1 di atas.> print(lm1$coeff)
(Intercept) x
-3.317963 3.111967
>print(lm1$call)
lm(formula = y ~ x)
1.6.1. Aplikasi R untuk Manipulasi Grafik
Selain analisis statistik secara numerik, analisis regresi juga perlu
dilengkapi dengan visualisasi data melalui grafik. Visualisasi grafik
selain bermanfaat untuk mendapatkan gambaran tentang kondisi data
terkait dengan asumsi-asumsi sebaran (histogram, QQPlot, Boxplot,
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
78 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
diagram pencar sisa), juga bermanfaat dalam memberikan visualisasi
model (diagram pencar data yang dilengkapi garis regresi, khususnya
untuk dua dimensi). Tabel 1.2 memuat beberapa paket dan fungsi
yang terkait dengan penyajian grafik dalam analisis regresi.
Visualisai tentang sebaran data baik terkait sebaran univariat,
maupun pencaran bivariat dapat disajikan dalam berbagai cara (lay-
out), misalnya menyisipkan grafik kecil dalam grafik besar, atau mem-
bagi lay out layar. Informasi lebih lengkap dapat dilihat pada Tirta
[42] atau Burns [4]. Berikut adalah beberapa contoh penyajian grafik
terkait regresi.
1. Histogram dilengkapi dengan kurva densitas (baik teoritis mau-
pun emperik). Grafik ini memberikan gambaran secara intuitif
kesesuaian sebaran data dengan sebaran teoritis yang menjadi
asumsi (skrip berikut hasilnya terlihat pada Gambar 1.4).
hist(x,freq=FALSE,ylim=c(0,0.45),
main="HISTOGRAM DENGAN KURVA DENSITAS")
lines(density(x),lty=4) #densitas emperik
lines(sort(x),dnorm(sort(x)))#densitas teoritik
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
79 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 1.2: Fungsi dan paket untuk menggambar grafik R
Fungsi Paket Penggunaan
barplot() graphics menggambar grafik batang
hist() graphics menggambar histogram
boxplot() graphics menggambar boxplot
plot() graphics menggambar grafik X-Y
pairs() graphics menggambar Matriks Dia-
gram Pencar
abline() graphics menggambar garis lurus
yang diketahui konstanta
dan gradiennya
contour() graphics menggambar kontur
persp() graphics menggambar boxplot
rug() graphics menggambar sebaran data
pada sumbu
qq.plot() car menggambar plot per-
bandingan kuantil
reg.line() car menggambar garis regresi
scatterplot(),
sp()
car menggambar diagram pen-
car data
spm(),
scatterplot.matrix(),
car diagram pencar beberapa
pasang peubah
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
80 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. Diagram pencar dilengkapi dengan rugplot dan boxplot marjinal
(untuk peubah penjelas dan peubah respon). Grafik ini mem-
berikan gambaran secara intuitif kesesuaian sebaran data secara
univariate (skrip berikut hasilnya terlihat pada Gambar 1.5)
plot(x,y,xlab="X", ylab="Y",col="red",
main="DIAGRAM PENCAR DENGAN RUG & BOXPLOT")
abline(lm(y~x),col="blue")
rug(side=1, jitter(x, 5),col="green" )
rug(side=2, jitter(y, 20),col="green" )
par(mar=c(1,2,5,1))
boxplot(y, axes=F)
par(mar=c(5,1,1,2))
boxplot(x, horizontal=T, axes=F)
3. Diagram pencar dilengkapi dengan histogram dan qqplot marjinal
(untuk peubah penjelas dan peubah respon). Grafik ini memberikan
gambaran secara intuitif kesesuaian sebaran data secara univariate.
Grafk dapat disajikan dengan menyisipkan histogram dan qqplot di
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
81 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dalam diagram pencar (lihat Gambar 1.6) atau dengan mengatur
lay out tampilan grafik seperti Gambar 1.7dan Gambar 1.8. Berikut
adalah skrip untuk Layout c(1,2)-c(2,1), untuk Gambar 1.7, yaitu
pertama layar dibagi atas 1 baris dan 2 kolom, selanjutnya layar
kolom kedua dibagi menjadi 2 baris 1 kolom.
split.screen(c(1,2))
split.screen(c(2,1), screen = 2)
screen(1)
plot(x,y,main="Diagram Pencar (X,Y)")
abline(lm(y~x))
screen(3)
hist(y, probability=T,
main="Histogram Y")
lines(density(y), col="red", lwd=2)
screen(4)
qq.plot(x,main="QQ.norm X")
Skrip berikut adalah untuk Layout c(2,1)-c(1,2), untuk Gambar 1.8,
yaitu pertama layar dibagi atas 2 baris dan 1 kolom, selanjutnya
layar baris kedua dibagi menjadi 1 baris 2 kolom.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
82 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
split.screen(c(2,1))
split.screen(c(1,2), screen = 2)screen(1)
plot(x,y,main="Diagram Pencar (X,Y)")
abline(lm(y~x))
screen(3)
hist(y, probability=T,
main="Histogram Y")
lines(density(y), col="red", lwd=2)
screen(4)
qq.plot(x,main="QQ.norm X")
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
83 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
HISTOGRAM DENGAN KURVA DENSITAS
x
Den
sity
−3 −2 −1 0 1 2
0.0
0.1
0.2
0.3
0.4
Gambar 1.4: Contoh Histogram dengan Kurva Densitas.Kurva lang-
sung adalah densitas teoritis, kurva putus-putus adalah
densitas emperik data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
84 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
40 45 50 55 60
120
130
140
150
160
170
180
DIAGRAM PENCAR DENGAN RUG & BOXPLOT
X
Y
Gambar 1.5: Contoh Diagram Pencar dengan rug dan boxplot(densitas
data)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
85 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
40 45 50 55 60
120
130
140
150
160
170
180
DIAGRAM BESAR DENGAN GRAFIK MINI
x
yHistY
−2 −1 0 1 2
4050
60
QQNorm
norm quantiles
x
Gambar 1.6: Contoh Gabungan Grafik Besar (Diagram Pencar) de-
ngan Grafik Mini(Histogram dan QQPlot)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
86 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
40 45 50 55 60
120
130
140
150
160
170
180
Diagram Pencar (X,Y)
x
y
Histogram Y
y
Fre
quen
cy
120 140 160 180
05
1020
−2 −1 0 1 240
4550
5560
QQ.norm X
norm quantiles
x
40 45 50 55 60
120
130
140
150
160
170
180
Diagram Pencar (X,Y)
x
y
Histogram Y
y
Fre
quen
cy
120 140 160 180
05
1020
−2 −1 0 1 240
4550
5560
QQ.norm X
norm quantiles
x
40 45 50 55 60
120
130
140
150
160
170
180
Diagram Pencar (X,Y)
x
y
Histogram Y
y
Fre
quen
cy
120 140 160 180
05
1020
−2 −1 0 1 240
4550
5560
QQ.norm X
norm quantiles
x
40 45 50 55 60
120
130
140
150
160
170
180
Diagram Pencar (X,Y)
x
y
Histogram Y
y
Fre
quen
cy
120 140 160 180
05
1020
−2 −1 0 1 240
4550
5560
QQ.norm X
norm quantiles
x
40 45 50 55 60
120
130
140
150
160
170
180
Diagram Pencar (X,Y)
x
y
Histogram Y
y
Fre
quen
cy
120 140 160 180
05
1020
−2 −1 0 1 240
4550
5560
QQ.norm X
norm quantiles
x
40 45 50 55 60
120
130
140
150
160
170
180
Diagram Pencar (X,Y)
x
y
Histogram Y
y
Den
sity
120 140 160 180
0.00
00.
010
0.02
0
−2 −1 0 1 240
4550
5560
QQ.norm X
norm quantiles
x
Gambar 1.7: Contoh Gabungan Grafik dengan pembagian layar
(1,2)dan (2,1)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
87 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
40 45 50 55 60
120
140
160
180
Diagram Pencar (X,Y)
x
y
Histogram Y
y
Den
sity
120 140 160 180
0.00
00.
010
0.02
0
−2 −1 0 1 2
4045
5055
60
QQ.norm X
norm quantiles
x
Gambar 1.8: Contoh Gabungan Grafik dengan pembagian layar
(2,1)dan (1,2)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
88 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.6.2. Aplikasi R untuk Model Statistika/ Analisis Regresi
Analisis regresi menggunakan R tersebar dalam banyak paket, di-
antaranya ada yang telah terintegrasi dengan paket minimal R ada
pula yang harus diinstal dan dipanggil secara khusus. Berikut ada-
lah fungsi-fungsi yang dipakai menganalisis model linier beserta paket
yang memuatnya.
Fungsi dan paket untuk model statistika dalam R
Fungsi Paket Penggunaan
lm() stats regresi/model linier dengan respon
berdistribusi Normal. Paket ini telah
terintegrasi dengan R dan sudah da-
pat dimanfaatkan melalui menu RCom-
mander
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
89 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
glm() stats regresi/model linier dengan respon
berdistribusi Keluarga Eksponensial
termasuk distribusi Normal denganre-
spon masih saling bebas. Paket ini
telah terintegrasi dengan R dan su-
dah dapat dimanfaatkan melalui menu
RCommander
lme() lme4 *) regresi/ model liner tercampur baik un-
tuk respon berdistribusi keluarga eks-
ponensial (termasuk distribusi Normal)
... lmm *) Berbagai fungsi untuk menangani data
dengan respon berdistribusi normal
tetapi tidak saling bebas dengan pen-
dekatan Bayesian dan Markov Chained
Monte Carlo
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
90 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
glmmML()glmmML
*)
regresi dengan respon berdistribusi
Keluarga Eksponensial denganpen-
dekatan Likelihood Maksimum
lrm() Design *) Khusus untuk data dengan respon
berdistribusi Binomial dan fungsi hu-
bungan logit
gee() gee *) regresi dengan dengan respon berdis-
tribusi Keluarga Eksponensial dan
tidak saling bebas
geese() geepack
*)
regresi linier dengan dengan respon
berdistribusi Keluarga Eksponensial
dan tidak saling bebas. Hampir sama
dengan gee(), tetapi memiliki alter-
natif pemodelan yang lebih luwes ter-
masuk pemodelan koragamnya
gam() gam,
mgcv
regresi atau model statistika dengan
hubungan yang lebih luas termasuk
noonlinier dan semiparamerik
nls() stats estimasi model nonlinier dengan meng-
gunakan kuadrat terkecil nonlinier ter-
bobot
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
91 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
*) menunjukkan bahwa paket harus diinstal secara khusus
1.6.3. RCommnder RGUI untuk analisis dasar
Ada RGUI yang disebut RCommander yang telah menyediakan bebe-
rapa analisis regresi mendasar melalui menu grafis, diantaranya:
1. regresi linier klasik sederhana (satu peubah bebas dan satu pe-
ubah penjelas);
2. model linier klasik dengan beberapa peubah poenjelas termasuk
peubah kualitatif;
3. GLM (model linier terampat/ tergeneralisir).
Selain kemampuan analisis regresi tersebut di atas, manfaat peng-
gunaan RComander adalah memudahkan pengguna mengimpor data
dari berbagaiformat termasuk format excel yang banyak dipakai kalan-
gan peneliti di Indonesia. Penjelasan rinci RCommander dapat dilihat
pada Tirta [42] dan [43] .
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
92 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.7. Ringkasan
Hal-hal penting yang perlu dipahami dalam bab ini adalah seperti
berikut.
1. Pemodelan stokastik mengandung komponen tetap yang meru-
pakan komponen regresi dan komponen kesalahan yang bersifat
acak yang memiliki sebaran tertentu;
2. Kepentingan utama dalam analisis model stokastik (analisis re-
gresi) adalah mengestimasi koefisien komponen tetap (parameter
regresi).
3. Metode yang biasa dipakai untuk mengestimasi koefisien regresi
adalah metode kuadrat terkecil dan metode kecenderungan mak-
simum.
4. Analisis model linier (regresi linier) telah berkembang untuk
menanganiberbagai kondisi dari komponen acak (bersebaran nor-
mal atau tidak, saling bebas atau tidak).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
93 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5. Untuk komponen acak yang bersebaran normal dan saling bebas,
analisisnya biasa disebut model linier normal.
6. Untuk komponen acak yang tidak bersebaran normal, tetapi
masih dalam sebaran keluarga eksponensial dan masih saling
bebas, analisisnya biasa disebut model linier tergeneralisir (ter-
ampat).
7. Berbagai pendekatan telah dikembangkan untuk komponen acak
yang masih bersebaran keluarga eksponensial tetapi tidak saling
bebas, diantaranya adalah GEE, GLMM, dan HGLM.
8. Hampir semua analisis di atas telah tersedia pada paket sta-
tistika berbasis open source R yang dapat diperoleh secara gratis.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
94 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.8. Bacaan Lebih Lanjut
Pada dasarnya semua referensi yang dapat dibaca untuk pengemban-
gan materi pemodelan statistika telah diuraikan pada sesi perkemban-
gan model statistika. Berikut adalah kata kunci yang dapat dipakai
untuk melacak (searching) materi pengembangan baik diperpustakaan
maupun di internet. Bahan bahan ini biasanya dikemas dalam salah
satu topik berikut:statistical model, linear model, regression. Untuk
model linear tergeneralisir/terampat dapat juga dilacak dengan kata
kunci berikut: logit, probit, log-linear.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
95 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1.9. Latihan
1. Jelaskan apa perbedaan penting antara pemodelan matematika
secara umum dan pemodelan statistika.
2. Sebutkan langkah-langkah penting pemodelan statistika.
3. Sebutkan beberapa macam pemodelan statistika linier yang anda
kenal dilihat dari asumsi distribusi dan kebergantungannya.
4. Sebutkan beberapa macam pemodelan statistika nonlinier yang
anda kenal.
5. Carilah referensi yang terkait dengan pemodelan statistika linier
baik di perpustakaan maupun di internet. Sebutkan masing- ma-
sing lima referensi yang belum terdaftar dalam Daftar Pustaka
dari buku ini.
6. Lakukan eksplorasi pada R
(a) buat grafik X-Y (plot(x,y,...) dengan memberi judul
utama, label pada sumbu X dan sumbu Y;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
96 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(b) buat tampilan jendela grafik dengan berbagai outline.
(c) buat histogram dengan dilengkapi judul dan kurva sebaran;
(d) buat diagram pencar yang dilengkapi dengan marjin box-
plot;
(e) bagaimana menggunakan fungsi lm();
(f) sebutkan komponen objek yang dihasilkan dari fungsi lm();
(g) jalankan contoh analisis regresi dengan glm;
(h) periksa komponen-komponen objek yang dihasilkan oleh
fungsi glm.
7. Lakukan eksplorasi pada RCommander:
(a) panggil salah satu data dari pustaka yang ada;
(b) sebutkan grafik yang dapat dibuat melalui menu RCom-
mander;.
(c) aktifkan plugin terkait demo/animasi statistika;
(d) analisis salahsatu data dengan analisi regresi sederhana, se-
lanjutnya buat grafik diagnostiknya.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
97 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
BAB 2
ALJABAR MATRIKS UNTUK STATISTIKA
Analisis data, khususnya estimasi parameter dalam regresi multivariat,
banyak melibatkan operasi matriks. Dalam bab ini akan dibahas teori
matriks yang banyak terkait dengan statistika.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
98 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kompetensi
Setelah membaca bab ini, pembaca diharapkan memahami aljabar ma-
triks, turunan yang berkaitan dengan matriks serta menggunakannya
dalam statistika, khususnya dalam analisis regresi.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
99 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.1. Materi
1. Definisi dan jenis matriks
2. Operasi matriks
3. Kebergantungan linier
4. Bentuk kuadrat dan turunannya
5. Aplikasi R untuk matriks
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
100 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.2. Defenisi dan Jenis Matriks
Definisi 2.1. Matriks adalah kumpulan unsur yang disusun dalam
baris dan kolom yang berbentuk persegi panjang.
Matriks biasanya dinotasikan dengan huruf besar tebal, misalnya
A,B, sedangkan unsur-unsurnya bisa berupa bilangan atau huruf ke-
cil. Banyaknya baris dan kolom matriks disebut ordo matriks matriks.
Matriks yang memiliki n baris dan m kolom,dikatakan berordo n×mdan dinotasikan dengan An×m = [aij]. Dalam hal ini, aij adalah unsur
yang berada pada baris ke i dan kolom ke j dengan i = 1, 2, · · · , ndan j = 1, 2, 3, · · · ,m.
Contoh 2.1. Matriks A berikut adalah matriks yang berordo 4 ×3;
A =
3 4 5
1 3 6
7 10 20
5 7 2
Beberapa matriks khusus yang banyak digunakan dalam sta-
tistika diantaranya adalah matriks bujur sangkar, matriks diagonal,
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
101 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
matriks skalar dan matriks simetrik. Definisi formal masing- masing
jenis matriks tersebut dapat dilihat pada buku-buku teks standar yang
membahas matriks.
Definisi 2.2. Matriks bujur sangkar (square matrix), adalah matriks
dengan banyak barisnya sama dengan banyak kolomnya, yaitu n = m.
Pada matriks bujur sangkar, unsur unsur yang berada pada
baris dan kolom dengan nomor sama disebut diagonal utama (yaitu:
aii, i = 1, 2, · · · , n.)
Contoh 2.2.
B =
3 14 5
11 3 6
7 10 20
Definisi 2.3. Matriks diagonal adalah matriks yang semua unsurnya,
selain unsur-unsur pada diagonal utamanya, adalah nol, yaitu aij = 0
untuk setiap i 6= j.
Contoh 2.3.
D =
3 0 0
0 0 0
0 0 2
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
102 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Definisi 2.4. Matriks skalar adalah matriks diagonal yang semua un-
surnya sama, tetapi tidak sama dengan 0.
Contoh 2.4.
C =
3 0 0
0 3 0
0 0 3
Definisi 2.5. Matriks identitas I adalah matriks skalar yang semua
unsurnya 1
Contoh 2.5.
I =
1 0 0
0 1 0
0 0 1
Definisi 2.6. Matriks nol (0) adalah matriks yang semua unsurnya
adalah 0.
Definisi 2.7. Matriks simetris adalah matriks yang unsur-unsurnya
simetris terhadap diagonal utama, yaitu aij = aji untuk setiap i dan
j.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
103 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Contoh 2.6.
A =
3 1 5
1 2 0
5 0 4
Contoh 2.7.
Dalam statistika, matriks simetris yang banyak ditemukan adalah ma-
triks korelasi (R) dan matriks varians-kovarians atau matriks ragam-
koragam(V).
R =
1 r12 · · · r1nr21 1 · · · r2n...
.... . .
...
rn1 r2n · · · 1
dan V =
σ21 σ12 · · · σ1n
σ21 σ22 · · · σ2n
......
. . ....
σn1 σ2n · · · σ2n
Selain matriks-matriks umum di atas, dalam statistika ada yang
disebut matriks desain X. Matriks ini merupakan matriks yang meng-
hubungkan parameter β dengan peubah- peubah penjelas Xj. Pada
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
104 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
umumnya model yang dipergunakan selalu mengandung konstanta se-
hingga kolom pertama matriks X biasanya beranggotakan 1.
X =
1 x11 x12 · · · x1p1 x21 x22 · · · x2p...
.... . .
...
1 xn1 xn2 · · · xnp
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
105 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.3. Operasi Matriks dan Sifat-sifatnya
Operasi matriks yang penting yang banyak dipergunakan dalam sta-
tistika diantaranya adalah operasi uner yaitu: invers dan transpos dan
operasi biner yaitu penjumlahan dan perkalian.
2.3.1. Operasi uner
Untuk melakukan operasi uner diperlukan cukup satu matriks. Ope-
rasi yang termasuk uner adalah operasi invers baik untuk penjumlahan
maupun perkalian dan operasi transpos.
Definisi 2.8. Invers penjumlahan suatu matriks A ditulis−A, adalah
matriks yang unsur-unsurnya adalah negatif dari unsur-unsur matriks
A
Contoh 2.8.
Jika A =
3 1 5
1 −2 0
5 0 −4
, maka −A =
−3 −1 −5
−1 2 0
−5 0 4
.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
106 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Definisi 2.9. Transpos matriks A (berordo m×n) ditulis AT adalah
matriks berordo n×m yang diperoleh dengan menukar baris matriks
A menjadi kolom dan sebaliknya, yaitu jika B = AT , maka bij = aji.
Contoh 2.9.
Jika A =
4 5
1 7
2 4
maka AT =
(4 1 2
5 7 4
)
Hasil 2.1. Jika A adalah matriks simetris, maka A = AT
Definisi 2.10. Invers perkalian suatu matriks A ditulis A−1, adalah
matriks yang jika dikalikan dengan A menghasilkan matriks identitas
yaitu A.A−1 = A−1.A = I.
2.3.2. Operasi biner
Dalam operasi matriks secara simbolik kita akan banyak menggunakan
notasi∑
. dan∏. Untuk itu dalam subbab ini akan dibahas secara
sepintas kedua notasi tersebut.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
107 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Definisi 2.11.
n∑i=1
f(xi) = f(x1) + f(x2) + · · ·+ f(xi) + · · ·+ f(xn).
Sifat-sifat operator Sigma diberikan dalam hasil berikut ini.
Hasil 2.2. Sifat- sifat operator Sigma adalah
1. Jika k adalah suatu konstanta, makan∑i=1
k = nk.
2. Jika k adalah suatu konstanta, dan f adalah fungsi dalam ximaka
n∑i=1
kf(xi) = kn∑i=1
f(xi).
3. Jika k1, k2 adalah konstanta dan f(xi) = x2i + k1xi + k2, maka
n∑i=1
f(xi) =n∑i=1
x2i + k1
n∑i=1
+nk2.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
108 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Bukti:
1∑n
i=1 k = k + k + · · ·+ k︸ ︷︷ ︸n
= nk.
2∑n
i=1 kf(xi) = kf(x1) + kf(x2) + · · ·+ kf(xn)
= k(f(x1) + f(x2) + · · ·+ f(xn))
= kn∑i=1
f(xi).
3∑n
i=1 f(xi) =n∑i=1
(x2i + k1xi + k2
)=(x21 + k1x1 + k2
)+ · · ·+
(x2n + k1xn + k2
)= x21 + · · ·+ x2n + k1x1 + · · ·+ k1xn + k2 + · · ·+ k2︸ ︷︷ ︸
n
=n∑i=1
x2i +n∑i=1
k1xi + nk2
=n∑i=1
x2i + k1
n∑i=1
xi + nk2.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
109 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Untuk lebih meringkas notasi, kadang-kadang jumlah untuk selu-
ruh rentangan indeks hanya dinotasikan dengan tanda titik (.) untuk
indeks tersebut, misalnya
xi. =n∑j=1
xij
x.j =m∑i=1
xij.
Jika operator∑
merupakan penjumlahan yang berulang, maka
operator untuk perkalian berulang disebut operator∏
yang didefinisi-
kan seperti berikut ini.
Definisi 2.12.
n∏i=1
f(xi) = f(x1)× f(x2)× · · · × f(xi)× · · · × f(xn).
Sedangkan sifat-sifat operator∏
dinyatakan dalam hasil berikut.
Hasil 2.3. Sifat- sifat operator∏
adalah:
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
110 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
jika k adalah suatu konstanta, makan∏i=1
k = kn;
jika k adalah suatu konstanta, dan f adalah fungsi dalam ximaka
n∏i=1
kf(xi) = knn∏i=1
f(xi);
jika k1, k2 adalah konstanta dan f(xi) = (x2i )(k1xi)(k2), maka
n∏i=1
f(xi) =n∏i=1
x2i × kn1n∏i=1
xi × kn2 .
Pembuktian hasil∏
di atas analog dengan pembuktian sifat-
sifat operator∑
.
Penjumlahan Matriks
Matriks yang bisa dijumlahkan (ditambah dan dikurangi) adalah ma-
triks yang berdordo sama. Matriks yang berordo sama disebut Kon-
formabel (conformable) terhadap penjumlahan. Penjumlahan matriks
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
111 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dilakukan dengan menjumlahkan unsur unsur yang seletak, yaitu un-
sur unsur yang terletak pada baris dan kolom yang sama atau yang
mempunyai indeks yang sama.
Definisi 2.13. Jika A = (aij) dan B = (bij) i = 1, 2, · · · ,m; j =
1, 2, · · · , n maka A + B adalah matriks C yang berordo m×n dengan
unsur unsurnya adalah cij = aij + bij.
Contoh 2.10.
Jika
A =
3 5
8 4
6 10
dan B =
6 8
2 4
3 10
,
maka
A + B =
3 + 6 5 + 8
8 + 2 4 + 4
6 + 3 10 + 10
=
9 13
10 8
9 20
.
Definisi 2.14. Selisih dua matriks didefinisikan sebagai jumlah de-
ngan negatif matriks pengurang, yaitu A−B = A + (−B).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
112 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Hasil 2.4. Sifat- sifat penting dari penjumlahan matriks adalah
A + B = B + A komutatif
A + 0 = 0 + A identitas
A + (−A) = 0 invers
A + (B + C) = (A + B) + C assosatif
(A + B)T = AT + BT distribusi transpus
Perkalian matriks
Perkalian matriks bisa dilakukan apabila banyaknya kolom matriks
terkali sama dengan banyaknya baris matriks pengali. Matriks-matriks
yang dapat dikalikan disebut matriks-matriks yang conformable ter-
hadap perkalian. Selain perkalian dengan sesama matriks, matriks
juga dapat dikalikan dengan skalar.
Definisi 2.15. Hasil kali suatu matriks dengan suatu skalar adalah
matriks yang unsur- unsurnya adalah hasil kali setiap unsur matriks
dengan skalar tersebut, yaitu kA = (kaij) .
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
113 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Contoh 2.11.
3
3 −2 −6
1 2 0
−5 0 4
=
9 −6 −18
3 6 0
−15 0 12
.
Definisi 2.16. Hasil kali dua matriks adalah matriks yang berordo
sedemikian sehingga barisnya sama dengan baris matriks yang dika-
likan dan kolomnya sama dengan kolom matriks pengali. Unsur unsur
dari matriks pengali merupakan kombinasi linier dari baris matriks
terkali dengan kolom dari matriks pengali. Jadi jika Am×nBn×p, maka
Cm×p = AB dengan
cik = ai1b1k + ai2b2k + · · ·+ ainbnk
=n∑j=1
aijbjk.
Contoh 2.12.
Jika
A =
3 −2 −6
1 2 0
−5 0 4
dan B =
3 −1 2
5 2 0
0 2 4
,
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
114 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
maka AB adalah
=
(3)(3) + (−2)(5) + (−6)(0) (3)(−1) + (−2)(2) + (−6)(2)
(1)(3) + (2)(5) + (0)(0) (1)(−1) + (2)(2) + (0)(2)
(−5)(3) + (0)(5) + (4)(0) (−5)(−1) + (0)(2) + (4)(2)
(3)(2) + (−2)(0) + (−6)(4)
(1)(2) + (2)(0) + (0)(4)
(−5)(2) + (0)(0) + (4)(4)
=
−1 −19 −18
13 3 2
−15 13 6
.
Hasil 2.5. Sifat-sifat operasi perkalian yang penting di antaranya ada-
lah:
1. nonkomutatif, yaitu secara umum AB 6= BA;
2. assosiatif, yaitu (AB)C = A(BC);
3. distributif perkalian terhadap penjumlahan, yaitu
A(B + C) = AB + AC.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
115 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4. distributif transpos terhadap perkalian, yaitu (AB)T = BTAT.
2.3.3. Determinan dan Invers Matriks
Definisi 2.17. Determinan dari suatu matriks bujur sangkar A, dino-
tasikan dengan |A| atau det(A), adalah fungsi skalar yang didefinisi-
kan sedemikian rupa sehingga merupakan jumlah hasil kali unsur- un-
sur yang sejajar diagonal utama dikurangi jumlah unsur-unsur yang
sejajar diagonal lain. Dalam bentuk notasi
|A| =n∏i=1
aii +n∏i=1
ai,i+1 + · · ·+ a1n
n−1∏i=1
ai+1,i −n∏i=1
an+1−i,i − · · ·
− a11n−1∏i=2
an+2−i,i.
Definisi 2.18. Matriks yang determinannya tidak nol disebut ma-
triks nonsinguler, sedangkan matriks yang determinannya 0 disebut
matriks singuler.
Contoh 2.13.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
116 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Jika A =
3 4 1
5 7 6
3 2 5
, maka det A adalah
|A| = (3)(7)(5) + (4)(6)(3) + (1)(5)(2)
− (3)(7)(1)− (5)(4)(5)− (3)(2)(6)
= 105 + 72 + 10− 21− 100− 36
= 187− 157 = 30
Definisi 2.19. Teras(trace) suatu matriks bujur sangkar adalah jum-
lah unsur diagonal utama dari matriks tersebut, yaitu tr(A) =∑n
i=1 aii.
Contoh 2.14.
Dari
A =
−1 −19 −18
13 3 2
−15 13 6
,
maka tr(A) = −1 + 3 + 6 = 8.
Untuk matriks bujur sangkar beordo 2, cara mencari invers ada-
lah sebagai berikut.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
117 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Hasil 2.6. Jika A =
(a c
b d
), maka
| A |= ac− bd
A−1 = 1|A|
(d −c−b a
)Contoh 2.15. Bertikut adalahcontoh matriks bujur sangkar berordo
2× 2 dan inversnya
A =
(1 2
−1 2
),
maka
A−1 =1
4
(2 −2
1 1
)=
(1/2 −1/2
1/4 1/4
)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
118 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.4. Kebergantungan Linier dan Rank Matriks
Dalam statistika pada umumnya kolom-kolom matriks mewakili peu-
bah - peubah acak yang bisa saling bebas atau tidak saling bebas satu
sama lain. Kondisi ini akan mempengaruhi apakah matriks yang akan
dihasilkan mempunyai rank penuh atau tidak, apakah matriks yang
dihasilkan akan mempunyai invers atau tidak.
Definisi 2.20. Suatu kolom dari matriks A dikatakan bergantung
linier dengan kolom-kolom lainnya jika dia dapat dinyatakan sebagai
kombinasi linier dari kolom-kolom lainnya tersebut.
Definisi 2.21. Rank suatu matriks adalah bilangan yang menun-
jukkan banyaknya maksimum kolom yang saling bebas linier.
Definisi 2.22. Suatu matriks dikatakan mempunyai rank penuh jika
ranknya sama dengan banyaknya kolom
Hasil 2.7. Suatu matriks bujur sangkar akan nonsingular jika mem-
punyai rank penuh, sebaliknya akan singular jika tidak mempuyai rank
penuh.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
119 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Contoh 2.16.
Matriks A =
3 4 1
5 7 6
3 2 5
adalah matriks nonsingular dengan rank
penuh 3. Tetapi B =
3 4 1
18 7 6
15 2 5
tidak mempunyai rank penuh
karena kolom pertama merupakan 3× kolom ketiga dan karenanya
B adalah matriks singular dan tidak memiliki invers. Penyelesaian
konkrit dari kegergantungan ini dapat dihitung dengan membentuk
sistim persamaan homogen antara kolom-kolom matriks dan mencari
apakah sistem persamaan homogen tersebut mempunyai atau tidak
penyelesaian tidak nol.
Hasil 2.8. Jika matriks Anp bukan matriks bujur sangkar (n < p),
paling tidak ada (p− n) kolom yang dapat dinyatakan sebagai kombi-
nasi linier dari kolom lainnya. Dengan demikian maka A tidak akan
mempunyai rank penuh.
Contoh 2.17.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
120 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Matriks A =
3 4 1 1
5 7 6 1
3 2 5 1
mempunyai banyak kolom yang lebih be-
sar dari banyaknya baris, karena itu pasti salah satu dari kolom yang
ada dapat dinyatakan sebagai kombinasi linier dari yang lainnya. Se-
cara aljabar hal ini mengandung pengertian bahwa sistim persamaan
ak1 + b+ k2 + ck3 + dk4 = 0, dengan kj adalah kolom ke j, mempun-
yai penyelesaian dimana sekalar a, b, c, d tidak semuanya sama dengan
nol.
3a+ 4b+ c+ d = 0 (1)
5a+ 7b+ 6c+ d = 0 (2)
3a+ 2b+ 5c+ d = 0 (3)
Selanjutnya (1)-(3) dan (2)-(3) akan menghasilkan
2b+−4c = 0 (4)
2a+ 5b+ c = 0 (5)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
121 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Persamaan (4) menghasilkan hubungan b = 2c yang dapat disubsti-
tusikan ke (5)
2a+ 10c+ c7 = 0
2a+ 11c = 0
a = −11
2c (7)
Selanjutnya jika (7) disubstitusikan ke persamaan (1) akan meng-
hasilkan
−33
2c+ 8c+ c+ d = 0
d =33
2c− 9c =
15
2c
Jadi sistim persamaan ini mempunyai penyelesaian yang bersifat pa-
rametrik, salah satu diantaranya adalah untuk c = 2, maka diperoleh
b = 4, a = −11, d = 15.
Dalam statistika, jika X adalah matriks desain yang kolomnya
menunjukkan peubah-peubah penjelas dan barisnya merupakan sam-
pel, untuk menjamin agar X mempunyai rank penuh, maka banyaknya
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
122 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
sampel selalu diusahakan jauh lebih banyak dari banyaknya peubah
penjelas yang menjadi perhatian.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
123 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.5. Bentuk Kuadrat dan Diferensial Matriks
Definisi 2.23. Misalkan
x =
x1x2x3· · ·xn
dan A =
a11 a12 · · · an1a21 a22 · · · an2...
.... . .
...
an1 an2 · · · ann
,
maka Q = xTAx =
(n∑i=1
[n∑j=1
xjaij
]xi
); merupakan matriks 1 ×1
(skalar) yang disebut matriks bentuk kuadrat.
Matriks A pada umumnya merupakan matriks simetrik, misal-
nya matriks korelasi ataupun matriks ragam - koragamnya. Dalam
statistika
Definisi 2.24. Matriks bentuk kuadrat Q disebut definit positif apa-
bila Q > 0 untuk setiap x 6= 0 dan Q = 0 jika dan hanya jika x = 0.
Selanjutnya matriks A dari Q disebut matriks positif definit.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
124 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Definisi 2.25. Matriks bentuk kuadrat Q disebut semi definit positif
apabila Q ≥ 0 untuk setiap x 6= 0 dan Q = 0 paling tidak untuk
satu x 6= 0. Selanjutnya matriks A dariQ disebut matriks positif semi
definit.
sering diperlukan turunan suatu matriks terhadap sekelompok
peubah dalam satu vektor. Pada dasarnya turunan satu peubah ter-
hadap suatu vektor adalah adalah suatu vektor atau matriks yang
unsur-unsurnya adalah turunan peubah pertama terhadap peubah
unsur-unsur vektor penurun sedemikain sehingga posisi unsurnya se-
suai dengan posisi unsur yang diturukan dan unsur penurun.
Definisi 2.26. Misalkan
x =
x1x2x3...
xn
dan g =(g(x)
)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
125 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
maka
∂g
∂x=
∂g∂x1∂g∂x2∂g∂x3...∂g∂xn
dan
∂g
∂xT=
(∂g
∂x
)T=
∂g∂x1∂g∂x2∂g∂x3
· · ·∂g∂xn
Contoh 2.18.
Jika g = (2x1 + 5x2), dan x =
(x1x2
), maka
∂g
∂x=
(2
5
)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
126 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Contoh 2.19.
Jika
g =
g1g2g3...
gn
, dan x =
x1x2x3...
xp
,
maka yang dapat dilakukan adalah∂g
∂xTyang menghasilkan matriks
n× p atau∂gT
∂xyang menghasilkan matriks p× n.
∂g
∂xT=
dg1/dx1 dg1/dx2 · · · dg1/dxpdg2/dx1 dg2/dx2 · · · dg2/dxpdg3/dx1 dg3/dx2 · · · dg3/dxp
......
. . ....
dgn/dx1 dgn/dx2 · · · dgn/dxp
Contoh 2.20.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
127 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Misalkan x =
(x1x2
)dan A =
(1 2
2 1
)maka
1. Ax =
(x1 + 2x22x1 + x2
);
2. xTAx =(x1(x1 + 2x2) + x2(2x1 + x2)
)=(x21 + 4x1x2 + x22
)yang
merupakan bentuk kuadrat;
3.∂Ax
∂xT=
∂(x1 + 2x2)
∂x1
∂(x1 + 2x2)
∂x2∂(2x1 + x2)
∂x1
∂(2x1 + x2)
∂x2
=
(1 2
2 1
)= A;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
128 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4. Turunan xTAx terhadap x adalah
∂xTAx
∂x=
∂(x21 + 4x1x2 + x22)
∂x1∂(x21 + 4x1x2 + x22)
∂x2
=
(2x1 + 4x24x1 + 2x2
)= 2
(1 2
2 1
)(x1x2
)= 2Ax;
5. Karena xTAx pada dasarnya adalah suatu skalar, maka dapat
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
129 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
juga diturunkan terhadap xT .
∂xTAx
∂xT=
(∂(x21 + 4x1x2 + x22)
∂x1
∂(x21 + 4x1x2 + x22)
∂x2
)=(2x1 + 4x2 4x1 + 2x2
)= 2
(x1 x2
)(1 2
2 1
)= 2xTA;
6. berdasarkan hasil butir 3 dan 4 di atas maka, maka diperoleh
∂2[xTAx
]∂xT∂x
=∂2[xTAx
]∂x∂xT
= 2A.
Hasil 2.9. Misalkan A adalah matriks simetrik berordo n× n dan x
adalah vektor baris berordo n, maka
1.∂xTA
∂x=∂Ax
∂xT= A
2.∂xTAx
∂x= 2Ax
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
130 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.∂2[xTAx
]∂xT∂x
= 2A
Contoh 2.21.
Misalkan A =
(2 1
1 3
), x =
(x1x2
), sedangkan x1 = 2t1 + 3t2
dan x2 = 3t1 + t2, jika t =
(2 3
3 1
), maka:
1. x = Bt dan∂x
∂tT= B;
2. Ax =
(2x1 + x2x1 + 3x2
)=
(2(2t1 + 3t2) + 3t1 + t22t1 + 3t2 + 3(3t1 + t2)
), sehingga
∂Ax
∂xT=
A dan
3.∂Ax
∂tT=
(7 7
11 6
)=
(2 1
1 3
)(2 3
3 1
)= AB =
∂Ax
∂xT∂x
∂tT.
Hasil di atas dapat diperluas pada hasil berikut. Bukti umum
dari hasil berikut tidak dibahas dalam buku ini.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
131 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Hasil 2.10. Misalkan y adalah vektor peubah yang merupakan fungsi
dari x, yaitu merupakan hasil perkalian antara x dengan suatu matriks
simetrik dan F adalah matriks peubah yang merupakan fungsi dari y,
yaitu hasil kali y dengan suatu matriks simetrik, maka berlaku sifat
turunan rantai sebagai berikut:
∂F
∂x=
∂F
∂yT∂y
∂xatau
∂F
∂x=∂F
∂y
∂yT
∂x
Contoh 2.22. Misalkan X,Y dan β adalah matriks-matriks sedemi-
kian sehingga
Q = (Y −Xβ)T (Y −Xβ)
adalah suatu bentuk kuadrat (matriks 1× 1). Tentukan
1. ∂Q/∂β
2. ∂2Q/ (∂βT∂β)
Jawab:
Q = (Y −Xβ)T (Y −Xβ)
=(YT − βTXT
)(Y −Xβ)
= YTY − βTXTY −(βTXTY
)T+ βTXTXβ
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
132 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
mengingat βTXTY adalah matriks 1×1, maka identik dengan traspos-
nya dan persamaan di atas menjadi
Q = YTY − 2βTXTY + βTXTXβ.
Maka
∂Q
∂β= 0− 2XTY + 2XTXβ
= 2(XTXβ −XTY
)= −2
(XTY −XTXβ
)= −2XT (Y −Xβ) , dan
∂2Q
∂βT∂β= 2XTX.
Contoh 2.23. Misalkan X,Y dan β adalah matriks-matriks sedemi-
kian sehingga
Q = (Y −Xβ)T V−1 (Y −Xβ)
adalah suatu bentuk kuadrat (matriks 1×1), dengan V adalah matriks
simetrik.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
133 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tunjukkan bahwa
∂Q
∂β= −2XTV−1 (Y −Xβ) , dan
∂2Q
∂βT∂β= 2XTV−1X.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
134 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 2.1: Fungsi R terkait matriksNo perintah R Keterangan
1 matrix(c,b,k) menyusun matriks berordo b× k2 diag(M) menyusun matriks diagonal, atau
mengambildiagonal dari matriks bu-
jur sangkar
3 t(M) transpos matriks M
4 A*B perkalian unsur-unsur pada baris
dan kolom yang bersesuaian
5 A%*%B perkalian dua matriks yang kon-
formabel
6 solve(M) menghitung inverse matriks M
2.6. Aplikasi R untuk Operasi Matriks
Untuk aplikasi R tentang matriks dan operasinya, selain menggunakan
beberapa fungsi yang telah didefinisikan secara internal, pembaca da-
pat juga mencari paket/library yang berkaitan dengan matriks. Be-
berapafungsi R terkait matriks diberikan pada Tabel 2.1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
135 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.6.1. Mendefinisikan matriks
Matriks dapat didefinisikan dengan beberapa cara yaitu:
1. memberikan data elemen matriks (c(a11, a21, a31, ..., a21,
a22, ...) yang selanjutnya disusun dalam bentuk baris dan
kolom. Ingat bahwa R akan melengkapi seluruh baris kolom 1
baru melengkapi kolom 2 dan seterusnya.
>x<-seq(1,10,1)
>xmat<-matrix(x,2,5)
>ymat<-matrix(x,5,2)
>xmat
[,1] [,2] [,3] [,4] [,5]
[1,] 1 3 5 7 9
[2,] 2 4 6 8 10
> ymat
[,1] [,2]
[1,] 1 6
[2,] 2 7
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
136 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[3,] 3 8
[4,] 4 9
[5,] 5 10
2. menjadikan matriks data yang sudah tersusun dalam bentuk
baris dan kolom dengan perintah as.matrix(). Untuk matriks
berukuran besar, mungkin tidak praktis mencetak seluruh el-
emennya, tetapi kita bisa memeriksa dimensi/ordonya dengan
dim(). Pada contoh berikut data kecepatan dan jarak tempuh
mobil yang berupa tabel dengan 50 baris dan 2 kolom didefinisi-
kan menjadi matriks berordo 50 ×2.
>data(cars)
>x<-as.matrix(cars)
>dim(x)
[1] 50 2
>amat<-x%*%t(x)
>bmat<-t(x)%*%x
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
137 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
>dim(amat)
[1] 50 50
>dim(bmat)
[1] 2 2
3. beberapa matriks didefinisikan secara khusus diantaranya adalah
(a) matriks dengan elemen yang sama, misalnya k dengan ordo
m× n.
>matrix(0,2,3)
[,1] [,2] [,3]
[1,] 0 0 0
[2,] 0 0 0
>matrix(1,2,3)
[,1] [,2] [,3]
[1,] 1 1 1
[2,] 1 1 1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
138 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
>matrix(5,2,3)
[,1] [,2] [,3][1,] 5 5 5
[2,] 5 5 5
(b) matriks diagonal atau matriks identitas.
> diag(1,3)
[,1] [,2] [,3]
[1,] 1 0 0
[2,] 0 1 0
[3,] 0 0 1
> diag(2,3)
[,1] [,2] [,3]
[1,] 2 0 0
[2,] 0 2 0
[3,] 0 0 2
>diag(c(1,2,3,4,5))
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
139 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[,1] [,2] [,3] [,4] [,5][1,] 1 0 0 0 0
[2,] 0 2 0 0 0
[3,] 0 0 3 0 0
[4,] 0 0 0 4 0
[5,] 0 0 0 0 5
Sebaliknya jika diag() dilakukan pada matrik bujur sangkar,
maka fungsi ini akan mengekstrak diagonal matriks tersebut.
> diag(bmat)
speed dist
13228 124903
2.6.2. Operasi Matriks dengan R
Beberapa operasi matriks yang dapat dilakukan yang terkait dengan
kebutuhan statistika diantaranya adalah perkalian matriks, determi-
nan ((det()) invers dan transpose matriks.
xmat%*%ymat
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
140 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[,1] [,2]
[1,] 95 220
[2,] 110 260
> ymat%*%xmat
[,1] [,2] [,3] [,4] [,5]
[1,] 13 27 41 55 69
[2,] 16 34 52 70 88
[3,] 19 41 63 85 107
[4,] 22 48 74 100 126
[5,] 25 55 85 115 145
>det(xmat%*%ymat)
[1] 500
> solve(xmat%*%ymat)
[,1] [,2]
[1,] 0.52 -0.44
[2,] -0.22 0.19
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
141 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
> det(ymat%*%xmat)
[1] 0
> solve(ymat%*%xmat) #tes walau kita tahu det=0.
Error in ... system is exactly singular
Untukmatriks yang berordo sama, ada kalanya diperlukan hasil
perkalian dari unsur-unsur seletak. Pada R perkalian ini dinotasikan
dengan A*B. Berikut adalah contoh perkalian tersebut.
> A.mat<-matrix(c(2,3,4,1),2,2)
> B.mat<-matrix(c(1,3,2,5),2,2)
> A.mat
[,1] [,2]
[1,] 2 4
[2,] 3 1
> B.mat
[,1] [,2]
[1,] 1 2
[2,] 3 5
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
142 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
> A.mat*B.mat
[,1] [,2][1,] 2 8
[2,] 9 5
> B.mat*A.mat
[,1] [,2]
[1,] 2 8
[2,] 9 5
Jadi perkalian tersebut di atas bersifat komutatif (A* B=B*A).
Akan tetapi, tidak demikian halnya dengan perkalian umum matriks,
seperti pada contoh berikut, yang pada umumnya A%*% B 6= B%*% A
> B.mat%*%A.mat
[,1] [,2]
[1,] 8 6
[2,] 21 17
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
143 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
> A.mat%*%B.mat
[,1] [,2][1,] 14 24
[2,] 6 11
Berikut adalah matriks pada Contoh 2.15 yang dihitung dengan
R.
> A<-matrix(c(1,-1,2,2),2,2)
> print(A)
[,1] [,2]
[1,] 1 2
[2,] -1 2
> solve(A)
[,1] [,2]
[1,] 0.50 -0.50
[2,] 0.25 0.25
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
144 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.7. Bacaan Lebih Lanjut
Referensi umum mengenai matriks dapat dijumpai pada buku-buku
teks tentang matriks atau aljabar linier. Namun tidak banyak refer-
ensi yang membahas turunan matriks/ vektor terutama yang terkait
dengan statistika. Pembahasan dalam bab ini, terutama mengenai ap-
likasi matriks dalam statistika, dapat dijumpai pada Timm [36, Bab
1], Searle [32], Harville [13], dan Neter et al. [31].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
145 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.8. Ringkasan
Beberapa halpenting terkait matriks perlu dipahamidenganbaik di-
antaraya seperti berikut ini.
1. Matriks adalah kumpulan unsur yang disusun dalam baris dan
kolum sehingga membentuk persegi panjang.
2. Operasi matriks ada yang bersifat uner (negatif dan transpos)
dan bersifat biner(penjumlahan dan perkalian).
3. Matriks yang dapat dilakukan operasi tertentu dikatakan kon-
formabel untuk operasi tersebut.
4. Operasi penjumlahan bersifat asosiatif, memiliki identitas 0,
memiliki invers, dan komutatif.
5. Operasi perkalian secara umum memehuhi sifat asosiatif, ma-
triks bujur sangkar memiliki identitas, beberapa diantaranya
memiliki invers.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
146 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6. Suatu kolom dari matriks A dikatakan bergantung linier dengan
kolom-kolom lainnya jika dia dapat dinyatakan sebagai kombi-
nasi linier dari kolom-kolom lainnya tersebut.
7. suatu matriks bujur sangkar dikatakan memiliki rank penuh jika
semua kolomnya bebas(tidak bergantung) linier dengan kolom
lainnya.
8. Matriks bujursangkar yang memiliki invers disebut matriks non-
singuler, matriks ini memiliki rank penuh dan determinan tidak
nol.
9. Bentuk yTAy dengan y matriks peubah, dan A matriks kon-
stanta, disebut matriks bentuk kuadrat.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
147 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2.9. Latihan Soal-soal
Kerjakan soal-soal berikut secara sendiri atau berkelompok.
1. Sebutkan definisi matriks berikut dan beri masing- masing satu
(1) contoh.
(a) Matriks diagonal
(b) Matriks skalar
(c) Matriks simetrik
(d) Matriks nonsinguler.
2. Buatlah dua buah matriks (A,B), masing- masing berordo 2×2
, selanjutnya hitung
(a) AB
(b) BA
(c) A−1
3. Selidiki apakah matriks-matriks berikut mempunyai rank kolom
lengkap atau tidak.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
148 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(a) A =
1 2 4
3 3 6
2 4 1
5 5 3
6 2 −1
(b) B =
1 2 4 1
5 5 3 0
2 4 1 2
6 2 −1 −4
3 3 6 0
(c) C =
3 3 6 3 3 −1
1 2 4 1 1 1
5 5 3 0 0 1
6 2 −1 4 3 5
2 4 1 2 5 10
4. Diketahui
A =
1 2 4
2 3 6
4 6 1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
149 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dan
x =
xyz
Tentukan
(a) Q = XTAX
(b)∂Q
∂x
(c)∂2Q
∂xT∂x
baik dengan cara menurunkan unsur-unsurnya maupun dengan
cara keseluruhan dengan cara matriks.
5. Diketahui
A =
3 2 4
2 3 5
4 6 1
.
Definisikan A pada R, selanjutnya tentukan:
(a) AT
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
150 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(b) ATA
(c) AAT
(d)(AAT
)−1(e)
(ATA
)−1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
151 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
BAB 3
MODEL LINIER KLASIK
Regresi linier dengan respon bersifat kontinu merupakan bentuk pe-
modelan statistika yang paling sederhana dan model ini telah dipergu-
nakan selama beberapa dekade. Pada bab ini akan dibahas pemodelan
statistika dengan respon kontinu berdistribusi normal.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
152 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kompetensi
Pembaca diharapkan memahami prinsip model linier normal atau mo-
del linier klasik, merumuskan model, mengestimasi parameter dan me-
lakukan uji inferensi, terutama dengan menggunakan paket Statistika
R.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
153 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Materi
1. Bentuk dan Asumsi
2. Estimasi parameter
3. Uji inferensial
4. Pendekatan matriks untuk model linier peubah ganda
5. Model linier dengan peubah kualitatif
6. Ilustrasi dengan R
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
154 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.1. Bentuk dan Asumsi
Misalkan hubungan antara peubah respon (Yi) dengan peubah tetap
(Xi) untuk subjek i = 1, 2, ...n, ditentukan oleh
Y1 = β0 + β1X1 + ε1...
......
Yi = β0 + β1Xi + εi...
......
Yn = β0 + β1Xn + εn
(3.1)
dengan:
1. Xi adalah peubah tetap yang tidak bersifat acak (lebih lanjut
diasumsikan Xi diukur tanpa kesalahan);
2. εi, yaitu komponen kesalahannya, adalah berdistribusi identik
dan independen normal dengan nilai-tengah 0 dan varian kon-
stan (misalnya σ2);
3. kesalahan individu satu dengan lainnya saling bebas, yaitu untuk
i 6= i′, maka εi||εi′ atau korelasi εi dengan εi′ adalah 0.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
155 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dari asumsi dapat ditentukan bahwa ekspektasi dari setiap respon
adalah
E [Yi] = β0 + β1Xi (3.2)
yang merupakan sebuah garis lurus yang kita sebut garis regresi Po-
pulasi. Sedangkan sebaran setiap pasangan (Xi, Yi) akan berada pada
atau sekitar garis tersebut sesuai dengan besarnya εi.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
156 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.2. Estimasi Parameter
Dalam kenyataan, kita hanya memiliki pasangan-pasangan data (Xi, Yi)
untuk i = 1, 2, · · · , n. Dari data yang kita miliki kita ingin menges-
timasi regesi populasi maupun simpangan sebaran datanya. Maka
parameter yang menjadi kepentingan utama dalam regresi sederhana
di atas adalah komponen dari koefisien regresi β =
(β0β1
). Parameter
lain yang juga perlu diestimasi adalah komponen ragam σ2. Seba-
gaimana telah disebutkan sebelumnya ada dua metode yang akan di-
gunakan dalam mengestimasi parameter yaitu metode kuadrat terkecil
dan metode kecenderungan (likelihood) maksimum.
3.2.1. Estimasi dengan Metode Kuadrat Terkecil
Seperti telah diuraikan pada Bab 1, bahwa dengan metode kuadrat
terkecil, secara geometris kita mencari garis sedemikian sehingga ke-
salahan (selisih ordinat titik terhadap garis) menjadi minimum. Untuk
mengakomodasi tanda positif dan negatif, maka yang diminimumkan
adalah jumlah kuadrat selisih ordinat tadi. Untuk mengestimasi pa-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
157 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
rameter dengan menggunakan metode kuadrat terkecil maka ditem-
pun langkah-langkah berikut ini.
1. Karena yang akan diminimumkan adalah kuadrat galat, maka
langkah pertama yang harus dilakukan adalah mengubah model
linier menjadi eksplisit terhadap galat. Dari bentuk model pada
persamaan (3.1), diperoleh rumusan galat
εi = Yi − (β0 + β1Xi) (3.3)
2. Mengkuadratkan kesalahan yang diperoleh serta menjumlahkan-
nya untuk seluruh pasangan data. Dari bentuk tersebut diper-
oleh bentuk jumlah kuadrat kesalahan sebagai berikut
Q =n∑i=1
ε2i =n∑i]1
[Yi − (β0 + β1Xi)]2 =
n∑i=1
[Yi −
1∑j=0
βjXij
]2(3.4)
Dalam hal ini Xi0 = 1 dan Xi1 = Xi.
3. Menurunkan bentuk kuadrat yang diperoleh terhadap parame-
ter yang menjadi kepentingan. Estimasi dengan metode kua-
drat terkecil diproses dengan mencari minimum Q terhadap βj.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
158 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Minimum dari Q terhadap diperoleh dengan mencari turunan
pertama maupun ke dua
∂Q
∂β0= −2
n∑i=1
[Yi − (β0 + β1Xi)]
∂Q
∂β1= −2
n∑i=1
[Yi − (β0 + β1Xi)]Xi
4. Menyusun persamaan normal yang diperoleh dari sistem per-
samaan ∂Q/∂βj = 0. Dari hasil sebelumnya diperoleh per-
samaan normal
∑ni=1 [Yi − (β0 + β1Xi)] = 0∑ni=1 [Yi − (β0 + β1Xi)]Xi = 0
. (3.5)
Persamaan normal di atas selanjutnya dapat disederhanakan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
159 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
menjadi
n∑i=1
Yi − nβ0 − β1n∑i=1
Xi = 0 (3.6a)
n∑i=1
XiYi − β0n∑i=1
Xi − β1n∑i=1
X2i = 0 (3.6b)
5. Dari persamaan normal (3.6a) di atas diperoleh
β0 =1
n
n∑i=1
Yi − β11
n
n∑i=1
Xi (3.7a)
= Y − β1X (3.7b)
Hasil persamaan (3.7) ini selanjutnya disubstitusikan pada per-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
160 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
samaan normal (3.6b) sehingga diperoleh:
β1 =
∑XiYi −
∑Xi
∑Yi
n∑X2i −
(∑Xi)
2
n
(3.8a)
=n∑n
i=1XiYi − (∑n
i=1Xi) (∑n
i=1 Yi)
n∑X2i − (
∑Xi)
2 (3.8b)
=
∑XiYi − X
∑Yi∑
X2i − n
(X)2 . (3.8c)
Mengingat bahwa∑(
Xi − X)2
=∑X2i −
∑X2 =
∑X2i −
nX2, maka
β1 =
∑Yi(Xi − X)∑(Xi − X
)2 (3.8d)
Sebagaimana telah disampaikan bahwa metode kuadrat terke-
cil belum memanfaatkan informasi distribusi dari εi. Oleh karena itu
apabila σ2 tidak diketahui, tidak ada cara khusus dengan metode kua-
drat terkecil untuk mengestimasi σ2. Namun, σ2 biasa diestimasi dari
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
161 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
rata-rata kuadrat deviasi data terhadap garis regresi yang diperoleh
dari βj. Dalam hal ini derajat kebebasan yang dimiliki oleh deviasi
ini adalah n− k dengan k adalah banyaknya penduga βj. Jadi untuk
model dengan dua parameter β0 dan β1, maka
σ2 = s2e =1
n− 2
n∑i=1
[Yi − (β0 + β1Xi)
]2(3.9)
3.2.2. Estimasi dengan Metode Likelihood Maksimum
Sesuai dengan prinsip model linier normal, maka setiap peubah respon
Yi merupakan sampel dari peubah acak yang berdistribusi normal dan
saling independen dengan nilai-tengah E(Yi) = β0 + β1Xi dan ragam
σ2, yaitu Yi ∼ N(E(Yi), σ2). Dengan demikian kita peroleh seperti
berikut ini.
1. Likelihood Yi adalah
Li =1
σ√
2πexp
[−1
2
(Yi − β0 − β1Xi
σ
)2].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
162 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. Likelihood dari Y = (Y1, Y2, · · · , Yi, · · · , Yn)T yang komponen-
nya saling bebas adalah
L =n∏i=1
Li
=
[1
σ√
2π
]nexp
[−1
2
n∑i=1
(Yi − β0 − β1Xi
σ
)2].
Log-likelihood l = e logL = lnL, selanjutnya dalam banyak
buku teks statistika hanya ditulis logL, adalah
l = −n log(σ√
2π)− 1
2
n∑i=1
(Yi − β0 − β1Xi
σ
)2
= −n2
log(2πσ2
)− 1
2σ2
n∑i=1
(Yi − β0 − β1Xi)2 .
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
163 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Selanjutnya turunan l terhadap β0, β1 dan σ2 diperoleh sebagai
berikut
∂l
∂β0= − 1
2σ2(2)(−1)
n∑i=1
(Yi − β0 − β1Xi)
=1
σ2
n∑i=1
(Yi − β0 − β1Xi)
∂l
∂β1= − 1
2σ2(2)(−1)
n∑i=1
(Yi − β0 − β1Xi)Xi
∂l
∂β1=
1
σ2
n∑i=1
(Yi − β0 − β1Xi)Xi
∂l
∂σ2= − n
2σ2+
1
2σ4
n∑i=1
(Yi − β0 − β1Xi)2 .
Dari persamaan di atas diperoleh persamaan normal untuk β0 dan β1identik dengan persamaan normal (3.5). Selanjutnya dari ∂l/∂σ2 = 0
diperoleh
−nσ2 +n∑i=1
(Yi − β0 − β1Xi)2 = 0
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
164 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
sehingga penduga kemungkinan maksimum untuk σ2 adalah
σ2 =1
n
n∑i=1
(Yi − β0 − β1Xi)2 .
Sebenarnya estimasi σ2 di atas berlaku untuk kondisi β0, β1 atau µ
yang diketahui. Jika tidak diketahui, maka penduga di atas akan
menjadi bias. Untuk menghilangkan bias maka pembaginya (dera-
jat kebebasannya) harus dikurangi sebesar banyaknya parameter yang
harus diestimasi sebelumnya. Dalam kasus model sederhana yang kita
bahas, banyaknya parameter ada 2 yaitu (β0, β1). Dengan demikian
derajat kebebasannya menjadi n − 2 dan bentuk penduga σ untuk
penduga llikelihood seteleh disesuaikan manjadi
σ2 =1
n− 2
n∑i=1
(Yi − β0 − β1Xi
)2(3.10)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
165 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.3. Uji Inferensial dari βj
Sebagaimana dijelaskan dalam langkah-langkah pemodelan stokastik,
bahwa besaran yang diperoleh dari penyelesaian model, yang berupa
penduga, harus diuji secara statistik. Untuk keperluan ini, perlu dike-
tahui distribusi dari penduga yang diperoleh.
3.3.1. Distribusi βj
Setelah memperoleh estimasi dari parameter βj, maka selanjutya kita
perlu memperoleh sifat sebaran dari penduga- penduga tersebut. Da-
pat ditunjukkan (dianjurkan untuk membuktikan sendiri) bahwa penduga-
penduga yang diperoleh adalah penduga tak bias dalam arti
E[β0
]= β0 dan E
[β1
]= β1.
Sedangkan untuk ragam βj diperoleh hasil yang berbeda untuk kasus
σ2 diketahui dan σ2 tidak diketahui.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
166 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Distribusi βj bila σ2 diketahui
Ragam dari penduga-penduga βj dapat diturunkan dengan menggu-
nakan prinsip bahwa:
1. untuk suatu konstanta c, maka Var(cY ) = c2 Var (Y );
2. Bahwa Yi dan Yi′ adalah saling bebas karenanya Var[∑Yi]] =∑
[Var(Yi)] ;
3. Var(Yi) = σ2, sedang komponen yang lain berfungsi sebagai pe-
ubah tidak acak sehingga tidak memiliki ragam dan dalam kon-
teks ini dapat diaggap sebagai konstanta c.
Dari bentuk penduga β0, seperti pada persamaan (3.7) dan β1 pada
persamaan (3.8), dapat lihat bahwa βj merupakan kombinasi linier
dari Yi yang mempunyai ragam σ2. Dari kenyataan ini dapat dihitung
ragam βj seperti berikut ini.
Hasil 3.1. Jika σ2 diketahui, maka ragam dari penduga β0 dan β1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
167 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
masing masing adalah:
Var(β0) =
[1
n+
X2∑(Xi − X)2
]σ2 (3.11)
Var(β1) =σ2∑
(Xi − X)2(3.12)
Kita lihat bahwa sesungguhnya penduga βj merupakan kombi-
nasi linier dari Yi yang berdistribusi normal. Oleh karena itu jika
σ2 diketahui maka masing-masing penduga βj berdistribusi normal
dengan ragam seperti pada Hasil 3.1. Dengan demikian bisa kita sim-
pulkan hasil-hasil berikut
Hasil 3.2. Jika σ2 diketahui dan var (βj) dihitung seperti pada Hasil
3.1, maka
βj − βj√var(βj)
∼ N(0, 1) (3.13)
dengan N(0, 1) adalah distribusi Normal Baku.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
168 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Distribusi βj bila σ2 tidak diketahui
Dalam kenyataannya, σ2 lebih sering tidak diketahui dan harus dies-
timasi dari data yang ada seperti yang telah dilakukan sebelumnya
yaitu
s2e = σ2 =1
n− 2
n∑i=1
(Yi − β0 − β1Xi
)2Hasil 3.3. Apabila σ2 tidak lagi diketahui tetapi diganti dengan σ2 =
s2e, maka var(βj) dinotasikan dengan s2(βj); j = 0, 1 menjadi
s2(β0) =
[1
n+
X2∑(Xi − X)2
]s2e (3.14a)
=
[1
n+
(1/n∑Xi)
2∑X2i − 1/n (
∑Xi)
2
]s2e, (3.14b)
dan
s2(β1) =s2e∑
(Xi − X)2(3.15a)
=s2e∑
X2i − 1/n (
∑Xi)
2 . (3.15b)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
169 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Hasil 3.4. Apabila σ2 tidak lagi diketahui tetapi diganti dengan σ2 =
s2e, dan var(βj) diganti dengan s2(βj); j = 0, 1, terutatama jika ukuran
sampel tidak cukup besar, maka
βj − βj√s2(βj)
=βj − βjs(βj)
∼ tn−2, (3.16)
Hasil di atas dapat diperluas untuk banyaknya parameter lebih
dari dua misalnya k. Jika ukuran sampel cukup besar, maka sesuai
sifat distribusi t, distribusi t akan mendekati N(0,1). Dengan demikian
distribusinya identik dengan sebelumnya, ketika σ2 diketahui.
3.3.2. Estimasi selang dari βj
Sesuai dengan distribusi dari βj, maka estimasi selang diperoleh de-
ngan melihat nilai t atau z yang membatasi prosentase atau luas
daerah dari kurva fungsi kepadatannya. Pada umumnya kita menghi-
tung estimasi selang yang simetrik.
Hasil 3.5. Penduga selang βj untuk tarap kepercayaan (1−α)×100%
atau tarap signifikansi α×100%, jika σ diketahui atau n cukup besar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
170 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
adalah
βj − zα/2√var(βj) ≤ βj ≤ βj + zα/2
√var(βj) (3.17)
Hasil 3.6. Penduga selang βj untuk tarap kepercayaan (1−α)×100%)
atau tarap signifikansi α× 100%, dinotasikan I.K (1−α)× 100% jika
σ tidak diketahui dan n kecil adalah
βj − tα/2,n−2s(βj) ≤ βj ≤ βj + tα/2,n−2s(βj) (3.18)
3.3.3. Uji Hipotesis
Selain menghitung penduga interval (estimasi interval/selang keyaki-
nan) dari parameter regresi βj, sering juga dilakukan uji hipotesis un-
tuk mengetahui apakah koefisien regresi populasi dianggap signifikan
atau tidak. Dalam statistika dua macam hipotesis yang biasanya diuji,
yaitu hipotesis nul (H0) dan hipotesis alternatif (HA), untuk parame-
ter βj, dengan j = 0, 1, 2, · · · , p.H0 : βj = 0; yaitu βj tidak signifikan
HA : βj 6= 0; yaitu βj signifikanAdapun kriteria penerimaan atau penolakan H0 dapat dilakukan
dengan beberapa cara yaitu
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
171 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1. melihat I.K (1− α)× 100% dari βj yaitu
0 ∈ I.K. : H0 diterima
0 6∈ I.K. : H0 ditolak
2. dengan membandingkan nilai statistik yang diperoleh, yaitu
th =βj
s(βj)dengan tα/2,n−k
dan dengan kriteria
th < tα/2,n−k : H0 diterima
th ≥ tα/2,n−k : H0 ditolak
3. Dengan menghitung nilai probabilitas p, atau Nilai p yang di-
definisikan sebagai
p = 2P (T > th); dengan catatan T ∼ tn−k
Selanjutnya kriteria penerimaan hipotesis adalah
p > 5% : H0 diterima atau βj tidak signifikan
1% < p ≤ 5% : H0 ditolak dengan βj signifikan
p ≤ 1% : H0 ditolak dengan βj sangat signifikan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
172 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Jika βj tidak signifikan atau dapat dianggap 0, berarti tidak ada
hubungan atau pengaruh signifikan Xj terhadap Y . Dengan kata lain,
tidak ada kontribusi signifikan dari peubah Xj terhadap model yang
diperiksa.
3.3.4. Koefisien Determinasi R2
Selain dengan melihat signifikan tidaknya koefisien regresi, baik ti-
daknya model dapat juga dilihat dari koefisien determinasi, R2, yang
didefinisikan dengan
R2 =
N∑i=1
(yi − y)2 −N∑i=1
(yi − y)2
N∑i=1
(yi − y)2.
(Lihat Mendenhall [27]). Jadi R2 ekuivalen dengan rasio penurunan
jumlah kuadrat dari model yang digunakan terhadap jumlah kuadrat
deviasi terhadap rata-rata y. Semakin besar R2 berarti semakin kecil
simpangan data terhadap garis regresi model. Secara ekstrim R2 = 1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
173 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
menunjukkan bahwa simpangan nilai observasi dengan nilai estimasi
sama dengan 0 dan model menjadi sempurna yaitu tidak ada data
yang menyimpang dari (berada di luar) garis regresi. Dengan kata
lain semakin besar R2, semakin kecil selisih nilai observasi dengan
nilai rata-rata regresi yang berarti semakin besar manfaat garis regresi
dalam menjelaskan hubungan antara prediktor dan respon.
Contoh 3.1. Misalkan data untuk 10 pasangan (X, Y ) ditunjukkan
oleh tabel berikut.
No X Y
1 10 15
2 12 18
3 10 20
4 15 25
5 13 20
6 10 12
7 14 25
8 11 20
9 12 22
10 10 15
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
174 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dari data di atas kita akan melakukan hal-hal sebagai berikut:
1. menghitung koefisien regresi, beserta standar kesalahannya, an-
tara X dan Y dengan menggunakan metode kuadrat terkecil
atau maksimum laikelihood;
2. menentukan penduga selang dari koefisien regresi yang diper-
oleh;
3. menguji hipotesis
Estimasi parameter regresi β
Untuk persoalan ini, karena hanya ada satu macam peubah penjelas
X, maka model yang akan kita pakai adalah
Y = β0 + β1X + ε
Untuk menghitung bj = βj secara manual, maka kita perlu melengkapi
tabel di atas sebagai berikut:
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
175 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
No X Y X2 XY Y − β0 + β1X
1 10 15 100 150 0,8100
2 12 18 144 216 3,2400
3 10 20 100 200 16,8100
4 15 25 225 375 0,4225
5 13 20 169 260 3,0625
6 10 12 100 120 15,2100
7 14 25 196 350 1,6900
8 11 20 121 220 4,6225
9 12 22 144 264 4,8400
10 10 15 100 150 0,8100
Total 117 192 1399 2305 51,5175
Kolom terakhir sesungguhnya baru diisi setelah kita memperoleh β0dan β1. Isianini diperlukan guna menghitung σ2.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
176 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dengan demikian
β1 =n∑n
i=1XiYi − (∑n
i=1Xi) (∑n
i=1 Yi)
n∑X2i − (
∑Xi)
2
=10× 2305− 117× 192
10× 1399− 1172
= 1, 95.
Nilai β1 selanjutnya digunakan untuk menghitung a, yaitu
β0 =1
n
n∑i=1
Yi − β11
n
n∑i=1
Xi
= 192/10− 1, 95× 117/10 = 3, 60.
Untuk penduga ragam diperoleh
σ2 = 51, 5175/8 = 6, 44 atau σ = 2, 54.
Karena rumus akhir yang diperoleh dengan metode likelihood mak-
simum dan de-ngan metode kuadrat terkecil adalah ekuivalen, maka
apabila perhitungan dikerjakan dengan metode likelihood maksimum,
akan diperoleh penduga yang sama.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
177 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Selanjutnya kita bisa menghitung standar kesalahan dari penduga-
penduga di atas.
s2(β0) =
[1
n+
(1/n∑Xi)
2∑X2i − 1/n (
∑Xi)
2
]s2e
=
(1/10 +
(1/10‘× 117)2
1399− 1/10× 1172
)× 6, 44
=
(1/10 +
136, 89
1399− 1368, 9
)× 6, 44 = 29, 30
s(β0) = 5, 41.
s2(β1) =s2e∑
X2i − 1/n (
∑Xi)
2
=6, 44
1399− 1368, 9= 0, 2140
s(β1) = 0, 46.
Penduga selang dari β
Setelah mendapat standar kesalahan masing-masing penduga, maka
selanjutnya kita dapat menghitung penduga selang dari masing-masing
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
178 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
penduga tersebut untuk selang kepercayaan yang ditentukan, misal-
nya 95% atau taraf signifikansi (α) 5%. Karena ukuran sampel, 10,
tidak cukup besar dan σ2 tidak diketahui maka kita menggunakan
distribusi t8 sebagai distribusi penduga yang kita dapat. Untuk se-
lang simetrik, secara manual kita peroleh nilai t95%/2,8 adalah 2,31.
Selang kepercayaan 95% masing-masing penduga kita peroleh sebagai
berikut.
βj − t5%/2,8 × s(βj
)≤ βj ≤ βj + t5%/2,8 × s
(βj
)Setelah memasukkan angka-angka yang didapat sebelumnya maka diper-
oleh
1. untuk j = 0
(3, 60− 2, 31× 5, 41) ≤ β0 ≤ (3, 60 + 2, 31× 5, 41)
−8, 90 ≤ β0 ≤ 16, 10
2. Untuk j = 1
(1, 95− 2, 31× 0, 46) ≤ β1 ≤ (3, 60 + 1, 95× 0, 46)
0.89 ≤ β1 ≤ 3, 01
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
179 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Uji hipotesis dari β
Untuk uji hipotesis kita menggunakan statistik
t0βj =βj − 0
s/√n
=3, 61− 0
5, 41= 0, 665 untuk β0 dan
=1, 95− 0
0, 46= 4, 239 untuk β1
Niilai p untuk masing-masing penduga adalah: p = 0, 26 untuk
β0 dan p = 0, 001 untuk β1 oleh karena itu koefisien regresi signifikan
(sangat signifikan) tetapi konstanta tidak signifikan. Hal tersebut se-
suai juga dengan kenyataan bahwa 0 ∈ IKβ0tetapi 0 6∈ IKβ1
. Analisis
dengan R menghasilkan keluaran sebagai berikut (perbedaan pada
beberapa desimal disebabkan adanya pembulatan pada perhitungan
manual).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
180 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.4. Penggunaan Matriks untuk Regresi Peubah
Ganda
3.4.1. Perluasan hasil untuk Regresi Peubah Ganda
Apabila pada model linier ada lebih dari dua koefisien regresi, mi-
salnya βj, j = 0, 1, 2, . . . , p dengan k = (p + 1) > 2, maka model li-
nier (regresi) tersebut disebut regresi berganda. Hasil-hasil yang telah
diperoleh sebelumnya dapat digeneralisir dengan mudah untuk kasus
berganda(dengan peubah ganda), diantaranya adalah seperti berikut
ini.
1. Penduga σ2 adalah
s2e = σ2 =1
n− k
n∑i=1
(Yi −
k−1∑j=0
βjXij
)2
2. Kesalahan penduga adalah s(βj) =√vjj dengan v ∈ V dan V =
s2e(XTX)−1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
181 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3. Distribusi penduga βj adalah
βj − βjs(βj)
∼ tn−k,
4. Selang kepercayaan (1− α)× 100% untuk βj adalah
βj − tα/2,n−ks(βj) ≤ βj ≤ βj + tα/2,n−ks(βj)
Secara umum, terutama jika parameternya lebih dari 2, maka estimasi
parameter lebih praktis dilakukan dengan menggunakan pendekatan
matriks. Hubungan peubah pada persamaan (3.1) dapat juga dit-
uliskan dalam bentuk matriks dengan mendefinisikan matriks- matriks
berikut
Y =
Y1Y2...
Yi...
Yn
; X =
1 x12 · · · x1p1 x22 · · · x2p...
......
...
1 xn2 · · · xnp
; β =
β0β1...
βj...
βp
; ε =
ε1ε2...
εi...
εn
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
182 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Sistim persamaan (3.1) selanjutnya dapat dinyatakan dalam bentuk
matriks seperti berikut:
Y = Xβ + ε (3.19)
dengan ε dapat dianggap berdistribusi multivariat normal,
MVN(Xβ,V).
Ketidak saling bergantungan antara komponen dalam vektor kesa-
lahan digambarkan oleh bentuk matriks ragam-koragamnya yang berben-
tuk matriks skalar seperti pada persamaan (3.20)
V = σ2I =
σ2 0 · · · 0
0 σ2 · · · 0...
.... . .
...
0 0 · · · σ2
(3.20)
Apabila data yang dianalisis memiliki ragam seperti di atas, maka
datanya disebut berfifat homoskedastik, sebaliknya jika tidak, maka
disebut heteroskedastik. Bentuk matriks ragam yang bersifat het-
eroskedastisitsa dapat dilihat pada persamaan (3.21). Estimasi ben-
tuk matriks juga dapat dilakukan dengan metode kuadrat terkecil dan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
183 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
kemungkinan maksimum.
V =
σ21 0 · · · 0
0 σ22 · · · 0
......
. . ....
0 0 · · · σ2n
(3.21)
3.4.2. Pendekatan Matriks Metode Kuadrat Terkecil
Penggunaan matriks dalam menganalisis model linier dapat dilakukan
dengan melihat bentuk umum matriks, selanjutnya menurunkan ben-
tuk matriks yang diperoleh dengan menggunakan prinsip-prinsip difer-
ensial matriks. Langkah-langkah yang ditempuh dalam menurunkan
penduga β dengan kuadrat terkecil adalah seperti berikut ini.
1. mengubah model menjadi eksplisit terhadap matriks kesalahan,
yaitu ε = Y −Xβ
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
184 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. membentuk matriks bentuk kuadrat
Q = εT ε
= (Y −Xβ)T (Y −Xβ)
= YTY − 2βTXTY + βTXTXβ (3.22)
3. mencari turunan pertama dan kedua Q terhadap β (lihat Con-
toh 2.22 halaman 131).
∂Q
∂β= −2XTY + 2XTXβ
= −2(XTY −XTXβ
)(3.23)
∂2Q
∂βT∂β= 2XTX. (3.24)
4. menentukan persamaan iterasi Newton-Raphson atau skoring
Fisher untuk β, dengan mengambil nilai awal untuk β = b0
yaitu
b1 = b0 −(XTX
)−1 (XTXβ −XTY
)b1 = b0 +
(XTX
)−1XT(Y −Xb0) (3.25)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
185 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Apabila datanya bersifat heteroskedastik, maka bentuk kuadrat harus
dibobot dengan invers matriks ragam-koragam. Metode kuadrat terke-
cil yang telah dibobot disebut Weighted Least Square-WLS atau Gen-
eralized Least Square-GLS. Dengan menggunakan hasil pada Contoh
2.23 halaman 132, maka kita memperoleh persamaan berikut.
Q = (Y −Xβ)TV−1(Y −Xβ) (3.26)
b1 = b0 +(XTV−1X
)−1XTV−1(Y −Xb0) (3.27)
Untuk distribusi normal sesungguhnya solusi langsung tanpa menggu-
nakan iterasi Newton-Raphson dapat diperoleh dengan mencari solusi
−2(XTY −XTXβ
)= 0 atau − 2
(XTV−1Y −XTV−1Xβ
)= 0
yang menghasilkan
β =(XTX
)−1XTY (3.28)
untuk kondisi homoskedastik dan
β =(XTV−1X
)−1XTV−1Y (3.29)
untuk kondisi heteroskedastik. Sebenarnya penyelesaian untuk ka-
sus distribusi normal dapat dilakukan langsung tanpa iterasi. Namun
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
186 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
penurunan iterasi diberikan sebagai pendekatan yang berlaku umum.
Tanpa iterasi rumus yang diperoleh adalah
β = (XTX)−1XTYuntuk kasus homoskedastik atau (3.30)
= (XTV−1TX)−1XTV−1Y (3.31)
untuk kasus heteroskedastik.
3.4.3. Pendekatan Matriks untuk Metode Kemungkinan Mak-
simum
Hasil yang diperoleh pada sub di atas dapat, khususnya turunan like-
lihood terhadap β, dapat juga dilakukan secara serempak dengan
mengggunakan pendekatan ’multivariat’, dalam arti semua data re-
spon dapat dianggap merupakan satu kesatuan vektor respon dengan
multivariat normal dengan nilai-tengah µ = Xβ dan matriks ragam-
koragam V = σ2I. Fungsi kepadatan probabilitas dari Y yang berdis-
tribusi multivariat normal (MVN) adalah
f(Y,µ) =1√
(2π)n|V|exp
[−1
2(Y − µ)T V−1 (Y − µ)
](3.32)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
187 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Untuk menerapkan metode kemungkinan maksimum dengan pen-
dekatan matriks maka dapat ditempuh langkah-langkah berikut:
1. menganggap Y berdistribusi MVN (Xβ,V) sehingga mempun-
yai bentuk likelihood
L =1√
(2π)n|V|exp
[−1
2(Y −Xβ)TV−1(Y −Xβ)
]
2. menentukan fungsi log-likelihood inti l(β), yaitu
l(β) = −1
2(Y −Xβ)TV−1(Y −Xβ) = −1
2Q
3. menentukan turunan pertama dan kedua likelihood inti terhadap
β, yaitu
∂l(β)
∂β= −1
2
∂Q
∂β
∂2l(β)
∂βT∂β= −1
2
∂Q
∂βT∂β
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
188 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4. Sekali pun bentuk turunan pertama dan keduanya sedikit ber-
beda dengan hasil dari metode kuadrat terkecil, karena perka-
lian dengan konstanta −12, namun bentuk akhir dari persamaan
iterasi Newton-Raphsonnya adalah identik, karena invers atau
kebalikannya akan saling meniadakan, yaitu
b1 = b0 −[−1
2
∂Q
∂βT∂β
]−1 [−1
2
∂Q
∂β
]= b0 −
[∂Q
∂βT∂β
]−1 [∂Q
∂β
].
Dengan demikian persamaan di atas akan menghasilkan bentuk
iterasi Newton-Raphson yang identik dengan metode kuadrat
terkecil, yaitu
b1 = b0 +(XTV−1X
)−1XTV−1(Y −Xb0)
Hasil 3.7. Untuk model linier sederhana dengan V = σ2I, jika σ dike-
tahui, maka var(β) = σ2(XTX)−1. Jadi secara umum dapat dikatakan
bahwa jika σ2 diketahui, maka
β ∼MVN(β, σ2
[XTX
]−1)(3.33)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
189 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dari bentuk estimasi di sebelumnya dapat dilihat bahwa β meru-
pakan hasil transformasi dari peubah acak Y, dalam hal ini dapat
dianggap bahwa
β =(XTV−1X
)−1XTV−1(Y) + B.
Dengan menggunakan hasil bahwa var(AY + B) = AVAT, maka
Var(β) =[(
XTV−1X)−1
XTV−1]
V[(
XTV−1X)−1
XTV−1]T
=[(
XTV−1X)−1
XTV−1]
V[V−1X
(XTV−1X
)−1]=(XTV−1X
)−1= σ2
(XTX
)−1.
Hasil 3.8. Jika σ2 tidak diketahui, maka diganti dengan
σ2 = s2e =1
n− k
[YTY − βXTY
](3.34)
Bukti:
s2e =1
n− k
[(Y −Xβ)T (Y −Xβ)
]=
1
n− k
[YTY − βT
XTY −YTXβ + βTXTXβ
]
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
190 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dengan menggunakan hasil bahwa β =(XTX
)−1XTY dan kenya-
taan bahwa βTXTY = YTXβ, maka diperoleh
s2e =1
n− k
[YTY − βXTY
].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
191 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.5. Interval Keyakinan µ dan Prediksi Y
Ada dua macam prediksi yang bisa dibuat yaitu estimasi nilai-tengah
µ dan prediksi untuk nilai tunggal y pada suatu kombinasi nilai predik-
tor misalnya xo = (1, x1, x2, · · · , xp)T . Perhatikan bahwa
y = µ+ ε
dengan µi = x0T β dan var(ε) = σ2. Dengan demikian kita memiliki
dua macam ragam yaitu ragam untuk estimasi µ dan ragam untuk
prediksi y yang besarnya dapat ditentukan sebagai berikut:
1. Ragam µ pada titik x = x0 adalah
Vµ = σ2[x0
T (XTX)−1x0
]2. Ragam yi pada titik x = x0 adalah
Vy = σ2[1 + x0
T(XTX
−1)
x0
]Selanjutnya interval keyakinan (1−α)×100% pada suatu nilai predik-
tor x = x0 masing-masing adalah
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
192 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
µ = x0T β ± tn−k,α/2
√Vµi
untuk prediksi µ dan
y = x0T β ± tn−k,α/2
√Vyi
untuk prediksi nilai y.
Dengan demikian interval prediksi y selalu lebih lebar dari in-
terval keyakinan nilai-tengah pada setiap kombinasi nilai prediktor.
Untuk regresi linier sederhana dengan satu prediktor X, untuk suatu
nilai prediktor x0 < x < x1, interval-interval ini akan membentuk
sabuk keyakinan (confident belt) seperti pada Gambar 3.1.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
193 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
38.0 38.5 39.0 39.5 40.0
185
190
195
200
Sabuk Keyakinan 95% Prediksi Y dan Mu
x
y Y = a + b X
Gambar 3.1: Ilustrasi Garis regresi dan sabuk keyakinan nilai-tengah
µ dan sabuk prediksi y
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
194 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.6. Melaporkan Nilai Probabilitas p
Selain menghitung estimasi interval maupun melakukan uji hipotesis
dengan distribusi t maupun z, paket- paket statistik biasa melaporkan
nilai probabilitas yang disebut nilai p yaitu luas daerah yang berada
dibagian ujung yang dibatasi oleh statistik t∗. Dengan kata lain p
adalah peluang bahwa kesimpulan yang kita peroleh keliru. Untuk
hipotesis β = 0, nilai p dapat dihitug dengan
p = P (tn−1 ≥ |t∗|) dengan t∗ =β − βS(β)
.
Untuk hipotesis β = 0 dan uji dua arah yang simetris maka
p = 1− P (−t∗ ≤ tn−1 ≤ t∗)
= 2P (tn−1 < −|t∗|)
Dengan demikian semakin kecil nilai p akan semakin signifikan hasil-
nya dan semakin kuat penolakan H0. Dalam bahasa R perhitungan p
dapat dilakukan dengan
p<-2*(1-pt(abs(t),df)) ataup<-2*(pt(-abs(t),df))
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
195 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Hasil 3.9. Penolakan Hipotesis nol (Ho) dengan menggunakan p ada-
lah sebagai berikut: Ho ditolak pada taraf signifikansi alpha(α)(α ×100%) jika dan hanya jika p ≤ (α× 100%)
Secara individu, uji signifikansi koefisien βj dengan menggu-
nakan nilai p dapat dilakukan sebagai berikut:
1. βj sangat signifikan jika p ≤ 1%;
2. βj signifikan jika 1% < p ≤ 5%;
3. βj tidak signifikan jika p > 5%;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
196 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.7. Model Linier dengan Variabel Kualitatif
Misalkan beberapa peubah penjelas dalam model linier merupakan
peubah kualitatif (kelompok) dengan dua tingkat (misalnya L=Laki-
laki dan P=perempuan). Pertanyaan mendasar dari data seperti ini
adalah, apakah penyebaran data antara kelompok yang satu (L) ber-
beda dengan kelompok yang lain (P). Apakah garis regresi penduga
data cukup diwakili satu garis atau dua garis yang berbeda. Empat
kemungkinan sebaran data jika dipisahkan berdasarkan kelompok di-
ilustrasikan dengan Gambar 3.2. Pada gambar diilustrasikan ada 4
kemungkinan penyebaran datanya yaitu:
1. kedua kelompok menyebar sama sehingga tidak perlu dibedakan
antara kelompok satu dengan yang lain sehingga cenderung mem-
bentuk satu garis lurus;
2. kedua kelompok menyebar berbeda dengan kecenderungan memi-
liki kemiringan yang sama tetapi konstanta berbeda sehingga
membentuk dua garis lurus sejajar;
3. kedua kelompok menyebar berbeda dengan kecenderungan memi-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
197 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
liki kemiringan yang berbeda tetapi konstanta sama sehingga
membentuk dua berkas garis;
4. kedua kelompok menyebar berbeda dengan kecenderungan memi-
liki kemiringan maupun konstanta yang berbeda sehingga mem-
bentuk dua garis lurus berbeda;
3.7.1. Variabel Boneka dengan Model Berkonstanta
Untuk menangani data dengan variabel kualitatif, kita dapat menan-
ganinya dengan memperkenalkan varibel boneka (dummy variable).
Misalkan g adalah variabel kualitatif dengan gi = L atau gi = P .
Kita dapat mendefinisikan vektor D dengan
Di =
1 jika gi = L
0 untuk yang lain(3.35)
Dengan demikian bentuk model antara Yi dengan variabel-variabel
lainnya dapat dituliskan sebagai
Yi = β0 + β1X1 + β2Di + εi (3.36)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
198 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
oo
o
o o
ooo
o
o
oo
o
oo
o
oo
o
o
o
o
o
oo
o
o
oo
o
0 5 10 15
1020
3040
5060
70
data (x,y)
X
Y
**
*
**
* **
*
*
**
*
**
*
**
*
*
*
*
*
*
*
*
**
*
*
o
o
o
o
o
o
oo
o
o
o
oo
o
oo
o
o
oooo
o
o
o
o
o
o
o
o
0 2 4 6 8 10 12 14
010
3050
70
data (x,y)
X
Y
*
*
*
*
*
*
**
*
*
*
*
*
*
**
*
*
****
*
*
*
*
*
*
*
*
o
o
o
o oo
o
o
o o
o
o
o
o
oo
o
o
o
o
oo
o
o
o
oo
o
o
o
0 5 10 15
1020
3040
5060
70
data (x,y)
X
Y
*
*
** **
*
*
**
*
*
*
*
**
*
*
*
*
**
*
*
**
*
*
*
*o o
o
o
o
o
o
oo
o
oo
oo
o
o
o
oo
oo
o
oo o
oo
o
o
o
0 5 10 15
010
2030
4050
60
data (x,y)
X
Y
*
*
*
*
*
*
*
***
**
***
*
* **
**
***
*
**
**
*
Gambar 3.2: Sebaran data dilihat dari adanya kelompok atau peubah
kualitatif. Pada gambar terlihat empat model penye-
baran data untuk satu variabel kualitatif dengan dua kat-
egori (L,P).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
199 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Jika diteliti lebih jauh, maka model untuk kelompok L dan kelompok
P , masing masing adalah:
L : Yi = β0 + β1Xi + β2 + εi
= (β0 + β2) + β1X1 (3.37)
P : Yi = β0 + β1X1 + εi (3.38)
Dengan demikian pengenalan variabel boneka D di atas menunjukkan:
1. model yang diperiksa adalah model linier paralel yaitu model
dengan konstanta berbeda (β0 dan β0 + β2) tetapi gradien sama
(β1);
2. β2 adalah parameter yang menentukan apakah model untuk ke-
dua kelompok perlu dibedakan konstantanya
Secara formal uji hipotesis β2 adalah
H0: β2=0 (menunjukkan model untuk kedua kelompok sama)
HA: β2 6= 0 (menunjukkan model untuk kedua kelompok ber-
beda)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
200 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Secara geometris model yang dihasilkan jika β2 signifikan dapat diilus-
trasikan dengan Gambar 3.3.
Apabila kita ingin memeriksa apakah selain konstantanya gradi-
ennya juga berbeda, kita perlu memperkenalkan peubah boneka lain
yang mewakili adanya interaksi antara peubah X dengan g. Misalkan
kita definisikan vektor Dx dengan
Dxi = Di ∗Xi (3.39)
Dengan demikian bentuk model antara Yi dengan variabel-variabel
lainnya dapat dituliskan sebagai
Yi = β0 + β1X1 + β2Di + β3Dxi + εi (3.40)
Jika diteliti lebih jauh, maka sekarang model untuk kelompok L dan
kelompok P , masing masing adalah:
L : Yi = β0 + β1Xi + β2 + β3Xi + εi
= (β0 + β2) + (β1 + β3)X1 (3.41)
P : Yi = β0 + β1X1 + εi (3.42)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
201 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
β1
β1 β2
Gambar 3.3: Garis Regresi sejajar dengan selisih konstanta β2 dan gra-
dien sama (β1)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
202 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Jadi signifikan tidaknya β2 menentukan perlu tidaknya model de-
ngan konstanta berbeda, sedangkan signifikan tidaknya β3 menen-
tukan perlu tidaknya model dengan gradien berbeda untuk kedua
kelompok yang ada.
Secara geometris model yang dihasilkan jika β2 signifikan dapat
diilustrasikan dengan Gambar 3.4.
Di =
1 jika gi = L
0 untuk yang lain(3.43)
3.7.2. Variabel Boneka dengan Konstanta tidak Eksplisit
Dalam hal tertentu, kita merlukan model dengan konstanta implisit.
Paling tidak ada dua kondisi kenapa model ini bermanfaat yaitu:
1. secara teoritik pada saat nilai peubah penjelas nol, nilai respon
juga nol;
2. untuk model dengan peubah kualitatif (kelompok), model ini
memudahkan interpretasi konstanta masing- masing kelompok.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
203 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
β1+β3
β1 β2
Gambar 3.4: Garis Regresi berbeda dengan selisih konstanta β2 dan
selisih gradien β3
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
204 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Untuk model dengan variebel kualitatif dengan konstanta implisit,
definisi peubah boneka harus dibuat secara terpisah untuk masing-
masing kelompok seperti berikut:
1. diperlukan k variabel boneka untuk satu peubah kualitatif de-
ngan tingkat kelompok sebanyak k;
2. untuk peubah kualitatif g dengan dua tingkat P,L, maka perlu
didefinisikan dua peubah boneka misalnya DL dan DP dengan
DLi =
1 jika gi = L
0 untuk yang lain
DPi =
1 jika gi = P
0 untuk yang lain
Sedangkan bentuk modelnya akan menjadi
Yi = β1X1 + β2DLi + +β2DPi + εi (3.44)
Jika diteliti lebih jauh, maka model untuk kelompok L dan
kelompok P , masing- masing adalah:
L : Yi = β2 + β1Xi + εi
P : Yi = β3 + β1X1 + εi
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
205 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Jadi konstanta untuk kelompok L adalah β2 dan konstanta un-
tuk kelompok P adalah β3.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
206 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.8. Ilustrasi Model Linier Normal dengan R
3.8.1. Simulasi dengan R
Untuk lebih memahami konsep-konsep statistika, ilustrasi program
komputer dengan meggunakan data simulasi sangat bermanfaat. Un-
tuk keperluan memeriksa sifat-sifat prosedur analisis data yang telah
dibicarakan, maka ada beberapa hal yang harus diimplementasikan
dalam komputer diantaranya:
1. mensimulasi data yang memenuhi asumsi sebagaimana dihara-
pkan, misalnya Y ∼ N(Xβ, σ2). Ini berarti untuk mensimulasi
data kita harus menetapkan X dan β;
2. mengestimasi balik β dari data Y baik dengan cara langsung
mapun dengan melalui iterasi numerik Newton-Raphson;
3. mengulang-ulang proses 1. dan 2. untuk melihat sifat-sifat pen-
duga β secara umum;
4. mengimplementasikan program yang dibuat untuk data riil. Im-
plementasi data riil dalam buku ini selanjutnya dilakukan de-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
207 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ngan menggunakan library dan dataset yang sudah ada yaitu
lm().
Contoh 3.2. Misalkan kita akan mensimulasi data sederhana dengan
ukuran n = 60 dan X ∼ N(50, 25) (ingat bahwa berbeda dengan Y ,
tidak ada keharusan X untuk mengikuti distribusi tertentu). Misalkan
pula β = (3, 5)T dan varian kesalahan σ2 adalah 16, artinya Y ∼N(µ, σ2) dan µ = Xβ dan kita akan memeriksa model
Yi = 3 + 5xi + εi i = 1, . . . , 60
Untuk membangkitkan data Y, ada dua cara yang bisa ditem-
puh.
1. Sesuai dengan sifat bahwa, jika X ∼ (0, σ2), maka X + C ∼N(C, σ2). Jadi kita perlu membangkitkan ε ∼ N(0, σ2) lalu
mendefisikan Y = µ+ ε
n<-60
x<-rnorm(60,50,5)
sgm<-4
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
208 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
x<- rnorm(n,0,sgm)
eps<-rnorm(0,sgm)
mu<-3+5*xydat<-mu+eps
2. membangkitkan langsung Y ∼ N(µ, σ2)
ydat<-rnorm(n,mu,sgm)
Selanjutnya dari data yang ada (ydat), kita dapat mengestimasi
balik β. Untuk model dengan distribusi normal kita dapat menghi-
tungnya dengan dua cara yaitu dengan cara langsung melalui
β =(XTX
)−1XTY
atau secara umum (yang berlaku untuk semua distribusi) dengan it-
erasi Newton-Raphson
b1 = b0 +(XTX
)−1(Y −Xb0)
Ragam estimator/penduga, untuk kasus σ yang diketahui, dapat di-
hitung dengan
V ar(β) = σ2(XTX
)−1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
209 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Jika σ tidak diketahui, dapat diganti dengan penduganya yaitu:
σ =
√(Y −Xβ)T(Y −Xβ)
N − k
x.mat<-as.matrix(cbin(1,x))
b.hat<-solve(t(x.mat)%*%xmat)%*%t(x.mat)%*%ydat
print(b.hat)
Keluaran yang diperoleh dari program diatas adalah
>print(b.hat)
[,1]
2.831853
x 4.760870
print(sgm^2*solve(t(x.mat)%*%x.mat))
x
0.269456174 0.008044395
x 0.008044395 0.023198465
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
210 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Proses di atas dapat dilakukan berulang-ulang, misalnya 100
kali, selanjutnya dihitung nilai-tengah dan ragam estimator. Hasilya
sangat dekat dengan ragam yang diperoleh melalui pendugaan di atas.
Dalam contoh berikut hasil estimasi dari 100 kali pendugaan disimpan
dalam matriks mh.
>var(mh) # varian dari 100 kali pendugaan
[,1] [,2]
[1,] 0.301722464 0.006733643
[2,] 0.006733643 0.019071798
>mean(mh[,1])
[1] 2.963071
>mean(mh[,2])
[1] 4.985726
Jika diperlukan kita juga dapat membuat grafik penduga dari
100 ulangan simulasi yang masing-masing mengambil sampel beruku-
ran 60 (Gambar 3.5). Pengulangan juga dapat divariasi dengan meningkatkan
ukuran sampel pada setiap simulasi. Simulasi ini sangat baik un-
tuk mengilustrasikan hunbungan antara ukuran sampel dan ketelitian
pendugaan. Gambaran grafik yang diperoleh apabila dalam setiap
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
211 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
pengambilan sampel dilakukan penambahan jumlah sampel seperti
pada Gambar 3.6. Pada gambar tersebut terlihat bahwa semakin be-
sar ukuran sampel pendugaan semakin teliti, karena ragam pendugaan
semakin mengecil.
Gambar 3.5: Grafik Penduga β1 = α dari penarikan sampel 100 kali
masing-masing berukuran 60. Nilai parameter sebe-
narnya adalah α = 3.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
212 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Gambar 3.6: Grafik Penduga β1 = α dari beberapa penarikan sam-
pel dengan ukuran mulai 10 sampai dengan 1000. Nilai
parameter sebenarnya adalah α = 3.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
213 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.8.2. Menggunakan Fungsi lm()
lm() adalah fungsi yang ada pada R untuk menganalisis data dengan
model linier normal. Format perintahnya adalah:lm(formula, data,...)
Komponen parameter fungsi lm() dapat djelaskan sebagai ber-
ikut ini.
1. formula adalah peubah respon dan peubah- peubah penjelas
yang dinyatakan dalam bentuk y~x1+x2+. . .. Jika ingin meng-
gunakan persamaan regresi tanpa konstanta maka pada formula
ditulis y~x1+x2-1 atau y~0+x1+x2. Pada bagian ini juga dapat
dimasukkan data yang telah ditansformasi misalnya log(y)~x1+x2
dan sejenisnya.
2. data adalah nama data yang akan dianalisis, yaitu yang memuat
nama-mana peubah yang dimasukkan pada formula
Dari hasil analisis menggunakan fungsi lm(), ada beberapa in-
formasi yang dapat diekstrak dari objek yang dihasilkan diantaranya:
1. coef(objek) untuk mengekstrak koefisien regresi β.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
214 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. deviance(objek) untuk mengekstrak jumlah kuadrat sisa.
3. formula(objek) untuk mengekstrak rumusan model yang diper-
gunakan
4. plot(objek) untuk menghasilkan grafik yaitu seperti grafik sisa,
grafik fitted value dan beberapa disgnostik.
5. print(objek) untuk mencetak hasil singkat analisis.
6. step(objek) untuk memeriksa model yang paling cocok dengan
cara melihat angka (Akaike’s Information Criterion) yang paling
kecil(lihat sesi 4.5.
7. summary(objek)untuk mencetak lengkap hasil analisis.
Untuk mengetahui lebih jauh komponen-komponen yang tersedia dari
suatu objek dapat dilakukan dengan
>names(objek)
Contoh 3.3. Misalkan kita ingin mencari persamaan regresi (model
linier) dari peubah kecepatan/speed dan jarak tempuh distance kenda-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
215 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
raan pada data cars.Perintah dan hasil keluaran untuk mengetahui
ringkasan data adalah:
> data(cars)
> summary(cars)
speed dist
Min. : 4.0 Min. : 2.00
1st Qu.:12.0 1st Qu.: 26.00
Median :15.0 Median : 36.00
Mean :15.4 Mean : 42.98
3rd Qu.:19.0 3rd Qu.: 56.00
Max. :25.0 Max. :120.00
Setelah diketahui nama peubah- peubahnya, selanjutnya kita da-
pat menggambar diagram pencar (Gambar 3.7) serta menulis perintah
model linier seperti berikut:
>contoh.lm<-lm(dist~speed,data=cars)
>print(summary(contoh.lm))
Call: lm(formula = dist ~ speed, data = cars)
Residuals:
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
216 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5 10 15 20 25
020
4060
8010
012
0
DIAGRAM PENCAR SPEED VS. DISTANCE
speed
dist
Gambar 3.7: Histogram dengan Kurva Densitas untuk peubah Speed
dan Distance pada Data Cars
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
217 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Min 1Q Median 3Q Max
-29.069 -9.525 -2.272 9.215 43.201
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -17.5791 6.7584 -2.601 0.0123*
speed 3.9324 0.4155 9.464 1.49e-12 ***
---
Signif.codes:0`***'0.001`**'0.01`*'0.05 `.' 0.1` ' 1
Residual standard error: 15.38 on 48 degrees of freedom
Multiple R-Squared: 0.6511,
Adjusted R-squared: 0.6438
F-statistic: 89.57 on 1 and 48 DF,
p-value:1.490e-12
Dari hasil yang diperoleh dapat disimpulkan bahwa konstanta
α = β0 adalah signifikan (1% < p < 5%) dan koefisien speed adalah
sangat signifikan (p < 1%).
Untuk mengetahui komponen-komponen yang dapat diekstrak
dari objek contoh.lm dapat dilakukan dengan perintah berikut. Se-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
218 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dangkan untuk memanggil salah satu komponen objek dilakukan de-
ngan NamaObjek$komponen.
>names(contoh.lm)
[1] "coefficients" "residuals" "effects" "rank"
[5] "fitted.values" "assign" "qr" "df.residual"
[9] "xlevels" "call" "terms" "model"
>contoh.lm$coeff
(Intercept) speed
-17.579095 3.932409
3.8.3. Model dengan Variabel Kualitatif
Andaikan selain variabel penjelas X data juga mengandung variabel
kualitatif G, maka variabel kualitatif ini pun perlu diperiksa apakah
berpengaruh pada hubungan variabel X dan Y . Untuk menghadapi
data yang mengandung peubah kualitatif, secara umum dapat di-
lakukan lengkah-langkah berikut ini.
1. Lakukan eksplorasi secara grafis dengan menggambar Diagram
Pencar (Scattergram) data, untuk melihat secara intuitif apakah
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
219 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
regresi perlu dipisah atau dapat digabung.
2. Analisis data dengan memasukkan peubah kualitatif sesuai de-
ngan indikasi yang ditunjukkan oleh diagram pencar.
3. Lakukan uji signifikansi baik untuk peubah kualitatif maupun
kuantitatif
Ada beberapa cara (yang biasa disebut formula) untuk memasukkan
variabel kualitatif (misalnya grup) pada R seperti diuraikan berikut
ini.
1. Y ∼ X ∗ G. Dengan formula ini kita mencoba model paling
lengkap yaitu memeriksa kemungkinan bahwa setiap kelompok
memiliki model yang berbeda.
2. Y ∼ X +G. Formula ini adalah untuk memeriksa kemungkinan
model regresi sejajar (dengan gradien sama tetapi kemungkinan
konstanta berbeda).
3. Y ∼ G/X. Formula ini adalah untuk memeriksa signifikansi mo-
del masing-masing kelompok dengan memaksa model dengan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
220 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
gradien berbeda. Berbeda dengan pendekatan pertama yang
lebih melihat perlu tidaknya model dipisah, dengan formula ter-
akhir ini, kita memaksa untuk menggunakan model terpisah dan
selanjutnya melihat signifikansi masing, masing model. Model
dari ketiga kelompok bisa sama-sama signifikan, tetapi mungkin
saja ketiganya dapat digabung menjadi satu.
Berikut adalah beberapa contoh dengan berbagai kondisi peubah
kualitatif
Contoh 3.4.
Suatu data yang mengandung peubah kuantitatif X, Y dan peu-
bah kualitatif g sebarannya ditunjukkan oleh Gambar 3.8. Pada Gam-
bar terlihat bahwa data mengandung variabel kualitatif g tetapi kedua
subkelompok data terlihat cukup membaur dan tidak perlu dibedakan
antara kedua sub kelompok datatersebut.
Call:
lm(formula = y ~ g * x, data = sim.data.reg)
Coefficients:Estimate Std. Error t value Pr(>|t|)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
221 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
35 40 45 50 55 60 65 70
120
140
160
180
200
220
DIAGRAM PENCAR
X
Y
g
LP
Gambar 3.8: Diagram Pencar X dengan Y yang mengandung kelompok
yang dapat digabung
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
222 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(Intercept) 6.10606 0.79364 7.694 2.47e-10 ***
g[T.P] -0.34794 1.12238 -0.310 0.758
x 3.88663 0.08370 46.433 < 2e-16 ***
g[T.P]:x 0.01706 0.11837 0.144 0.886
---
Signif.codes: 0'***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1
Dengan formula di atas (Y ∼ G ∗X) kita ingin mendapat gam-
baran perlu tidaknya memisahkan konstanta dan gradien garis regresi
masing-masing kelompok. Dari hasil di atas diperoleh:
1. koefisien g[T.P] tidak signifikan, berarti selisih konstanta dua
kelompok tidak signifikan;
2. koefisien g[T.P]:x tidak signifikan, berarti selisih gradien dua
kelompok tidak signifikan.
Jadi untuk data ini tidak perlu dipisahkan model atau garis regresi
dari masing-masing kelompok.
Call:
lm(formula = y ~ g + x, data = sim.data.reg)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
223 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.03583 0.62101 9.719 1.06e-13 ***
g[T.P] -0.20747 0.55184 -0.376 0.708
x 3.89516 0.05868 66.383 < 2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Dengan formula ini (Y ∼ G+X) kita memaksa untuk menggu-
nakan gradien yang sama (regresi sejajar), tetapi hanya melihat kemu-
ngkinan perlu tidaknya memisahkan konstantanya. Hasil di atas me-
nunjukkan kita tidak perlu memisahkan konstanta dari masing-masing
kelompok.
Call:
lm(formula = y ~ g/x, data = sim.data.reg)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.1061 0.7936 7.694 2.47e-10 ***
g[T.P] -0.3479 1.1224 -0.310 0.758gL:x 3.8866 0.0837 46.433 < 2e-16 ***
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
224 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
gP:x 3.9037 0.0837 46.637 < 2e-16 ***
---
Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1
Dengan formula ini (Y ∼ G/X) kita memaksa memeriksa model
atau regressi terpisah untuk masing-masing kelompok. Hasil menun-
jukkan bahwa regresi masing-masing kelompok sama-sama signifikan,
tetapi tidak ada informasi apakah kedua model atau garis regresi itu
dapat digabung atau tidak. Karena model menggunakan model de-
ngan konstanta, kita masih bisa melihat bahwa selisih konstanta dari
kelompok L dan kelompok P tidak signifikan.
Secara keseluruhan bentuk model yang dapat dimasukan dalam
formula R dapat dirangkum dalam Tabel 3.1 (lihat juga Kuhnert &
Venables [18]). Pada notasi tersebut x menunjukkan variabel kuanti-
tatif sedangkan G menunjukan variabel kualitatif (faktor), sedangkan
y dapat berupa kualitatif atau faktor (pada regresi logistik yang akan
dibahas kemudian). Pada model G/(x1+x2) kelompok yang ada di-
paksa memiliki regresi yang berbeda, sedangkan pada y~G*(x1+x2)
kelompok dilihat semua kemungkinannya apakah perlu regresi ber-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
225 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
beda, sejajar atau bergabung (satu).
Tabel 3.1: Alternatif Penulisan Model dalam Formula R
No Bentuk Arti
1 y~x regresi sederhana
2 y~x-1 regresi tanpa konstanta
3 log(y)~x regresi dengan transformasi pada Y
4 y~log(x) regresi dengan transformasi pada X
5 y~x1+x2+... regresi multivariat
6 y~G+x1+x2 regresi paralel
7 y~G/(x1+x2) regresi berbeda
8 y~G*(x1+x2) regresi dengan interaksi
Contoh 3.5.
Data berikut mengandung peubah kuantitatif X, Y dan peu-
bah kualitatif G dengan kategori (L, P ), sebarannya ditunjukkan oleh
Gambar 3.9. Pada Gambar terlihat bahwa data mengandung vari-
abel kualitatif g dan kedua subkelompok data terlihat memiliki ke-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
226 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
cenderungan yang berbeda. Kita akan melakukan eksplorasi model
dan memilih model yang terbaik dengan mencoba (i) mengabaikan
adanya kelompok, (ii) mencoba model paralel, dan (ii) mencoba mo-
del terpisah..
1. Analisis dengan mengabaikan kelompok. Jika analisis regresi di-
lakukan dengan mengabaikan kelompok, (Y ∼ X), maka gabun-
gan kedua kelompok akan saling meniadakan kecenderungan masing-
masing sehingga menghasilkan hubungan yang tidak signifikan.
Call:
lm(formula = y ~ x, data = DataSimReg)
Residuals:
Min 1Q Median 3Q Max
-11.2012 -2.1944 0.1407 2.9430 11.2207
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -8.73271 3.53350 -2.471 0.0164 *
x 0.07325 0.06855 1.068 0.2897---
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
227 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
35 40 45 50 55 60 65 70
−15
−10
−5
05
DIAGRAM PENCARDENGAN KELOMPOK
X
Y
g
LP
Gambar 3.9: Diagram Pencar X dengan Y mengandung kelompok yang
perlu dipisah
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
228 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 '' 1
Residual standard error: 4.682 on 58 degrees of freedom
Multiple R-squared: 0.0193,Adjusted R-squared: 0.002394
F-statistic: 1.142 on 1 and 58 DF, p-value: 0.2897
Terlihat bahwa gradien atau koefisien regresi(koefisien X)tidak sig-
nifikan dan koefisien determinasinya juga sangat kecil (0,02).
2. Model paralel. Model berikutnya yang banyak umum dicoba orang
adalah model regresi paralel, (Y ∼ X + G), dengan model ini kita
memberi ruang perbedaan konstanta tetapi tidak pada gradien re-
gresi.
Call:
lm(formula = y ~ x + g, data = DataSimReg)
Residuals:
Min 1Q Median 3Q Max
-10.55982 -2.81816 -0.09043 2.73765 10.66159
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
229 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Coefficients:Estimate Std. Error t value Pr(>|t|)
(Intercept) -9.21175 3.56600 -2.583 0.0124 *
x 0.07079 0.06860 1.032 0.3065
g[T.P] 1.20796 1.20967 0.999 0.3222
---
Signif. codes:0'***'0.001'**'0.01'*'0.05 '.'0.1 ''1
Residual standard error: 4.682 on 57 degrees of freedom
Multiple R-squared: 0.03616,Adjusted R-squared: 0.002345
F-statistic: 1.069 on 2 and 57 DF, p-value: 0.35
Dari hasil terlihat bahwa gradien masih tetap tidak signifikan, demikian
juga selisih konstanta (g[T.P]) tidak signifikan, dan koefisien deter-
minasi hanya membaik sedikit menjadi 0,04.
3. Model terpisah. Diagram pencar mengindikasikan kelompok memi-
liki kecenderungan berbeda, karena itu sebenarnya yang paling ma-
suk akal adalah mencoba regresi berbeda dan sekaligus memisahkan
konstanta secara eksplisit, Y ∼ X/G− 1.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
230 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
lm(formula = y ~ g/x - 1, data = DataSimReg)
Residuals:
Min 1Q Median 3Q Max-4.91870 -1.46909 -0.06663 1.31627 4.12724
Coefficients:
Estimate Std. Error t value Pr(>|t|)
gL 15.39683 2.07712 7.413 7.20e-10 ***
gP -31.43454 2.04057 -15.405 < 2e-16 ***
gL:x -0.41683 0.04056 -10.276 1.69e-14 ***
gP:x 0.52931 0.03933 13.457 < 2e-16 ***
---
Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1''1
Residual standard error: 1.927 on 56 degrees of freedom
Multiple R-squared: 0.9258,Adjusted R-squared: 0.9205
F-statistic: 174.7 on 4 and 56 DF, p-value: < 2.2e-16
Hasil menunjukkan bahwa baik konstanta maupun gradien untuk
masing-masing kelompok semuanya signifikan. Sementara itu koe-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
231 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
fisien determinasi yang dihasilkan jauh lebih baik dari sebelumnya
yaitu 0,93.
Ilustrasi di atas menunjukkan bahwa jika data mengandung peubah
kualitatif, sangat perlu dilakukan eksplorasi data (dengan menggam-
bar grafik diagram pencarnya), selanjutnya memilih model yang ter-
baik melibatkan peubah kualitatif tadi. Jika tidak, akan diperoleh
hasil yang tidak sesuai dengan kondisi sebenarnya.
3.8.4. Analisis dengan Subset
Untuk data yang terdiri atas beberapa kelompok (mengandung peu-
bah kualitatif), analisis dapat dilakukan pada seluruh atau sebagian
data tersebut melalui pemanfaatan parameter subset, dengan
subset=nama.var.kualitatif=="simbol.sub.kelompok"
Pada Contoh 3.5, kita dapat juga menganalisis secara terpisah
data untuk masing-masing kelompok L dan P .
lm(formula = y ~ x, data = DataSimReg, subset = g == "P")
Residuals:
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
232 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Min 1Q Median 3Q Max
-4.91870 -1.19517 -0.04871 0.97073 4.12724
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -31.43454 2.04449 -15.38 3.51e-15 ***
x 0.52931 0.03941 13.43 9.99e-14 ***
---
Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''1
Residual standard error: 1.931 on 28 degrees of freedom
Multiple R-squared: 0.8656,Adjusted R-squared: 0.8608
F-statistic: 180.4 on 1 and 28 DF, p-value: 9.99e-14
Ternyata hasilnya identik dengan hasil sebelumnya yaitu:
1. Intersept (konstanta) = koefisien gP = - 31,43;
2. Koefisien X = koefisien gP:x= 0,53
Dengan cara yang sama kita dapatmelakukan analisis untuk subkelompok L
dengan membuat subset = g == "L". Hasilnya identik dengan konstanta
dan koefisien untuk g.L.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
233 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.9. Ringkasan
1. Untuk analisis regresi klasik, respon atau galat harus berdistribusi
normal dengan ragam konstan dan satu sama lain saling bebas.
2. Peubah penjelas Xj , dapat berupa peubah kualitatif maupun kuan-
titatif bersifat tetap,diukur tanpa sebaran.
3. Estimasi parameter regresi dapat dilakukan dengan metode kuadtar
terkecil dan metode likelihood maksimum, dan untuk regresi klasik,
keduanya identik.
4. sebelum melakukan analisis sebaiknya dilakukan eksplorasi data se-
cara grafis, terutama jika mengandung peubah kualitatif/faktor.
5. Untuk mengakomodasi peubah kualitatif, R memiliki beberapa al-
ternatif formula sesuai kondisi data (misalnya apakah regresi paralel
ataukah regresi terpisah).
6. R dapat menganalisis sebagian data dengan memanfaatkan parame-
ter subset sesuai kebutuhan.
7. Dalam mengeksplorasi model-model regresi, selain memeriksa sig-
nifikan tidaknya koefisien regresi,perlu diperhatikan nilai koefisien
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
234 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
determinasinya.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
235 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.10. Bacaan Lebih Lanjut
Pembahasan mengenai Model Linier Normal dapat dilihat pada Bowerman
et al.[3] dan Neter et al. [31]. Aplikasi R untuk Regresi yang cukup intensif
dapat dilihat pada Faraway [12]. Pembaca dapat juga membaca buku teks
untuk S-Plus oleh Crawley [8] dan Venables & Ripley [47].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
236 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3.11. Latihan Soal- Soal
1. Tuliskan bentuk akhir (dalam bentuk vektor), persamaan iterasi Sko-
ring Fisher untuk mengestimasi parameter regresi pada model linier
sederhana dengan metode kuadrat terkecil
2. Tuliskan bentuk akhir (dalam bentuk vektor), persamaan iterasi Sko-
ring Fisher untuk mengestimasi parameter regresi pada model linier
sederhana dengan metode likelihood maksimum
3. Jelaskan distribusi penduga likelihood, baik untuk sampel besar ma-
upun untuk sampel kecil.
4. Eksplorasi beberapa data pada R, lakukan beberapa alternatif ana-
lisis regresi, selanjutnya tentukan model terbaik menurut anda. de-
ngan
5. Diketahui keluaran hasil analsis regresi dengan dua peubah kuanti-
tatifX,Y dan satu peubah faktor g = (L,P ) sebagai berikut. Selidiki
apakah masih mungkin dilakukan perbaikan model dan model mana
yang dianjurkan? Jelaskan jawaban anda.
Coefficients:Estimate Std. Error t value Pr(>|t|)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
237 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(Intercept) 13.14713 2.14083 6.141 8.95e-08 ***
x1 3.03882 0.04181 72.686 < 2e-16 ***
g[T.P] -1.85228 3.00107 -0.617 0.540
x1:g[T.P] -0.05652 0.05824 -0.971 0.336
---
Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ''1
Residual standard error: 1.986 on 56 degrees of freedom
Multiple R-squared: 0.9948,Adjusted R-squared: 0.9945
F-statistic: 3575 on 3 and 56 DF, p-value: < 2.2e-16
6. Diketahui keluaran hasil analsis regresi dengan dua peubah kuanti-
tatifX,Y dan satu peubah faktor g = (L,P ) sebagai berikut. Selidiki
apakah masih mungkin dilakukan perbaikan model dan model mana
yang dianjurkan? Jelaskan jawaban anda.
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 52.84661 2.33328 22.649 <2e-16 ***
x 2.94982 0.04557 64.737 <2e-16 ***
g[T.P] -67.23481 3.27086 -20.556 <2e-16 ***x:g[T.P] 0.03452 0.06347 0.544 0.589
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
238 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
---
Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.'0.1 ''1
Residual standard error: 2.165 on 56 degrees of freedom
Multiple R-squared: 0.9974,Adjusted R-squared: 0.9973
F-statistic: 7233 on 3 and 56 DF, p-value: < 2.2e-16
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
239 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
BAB 4
DIAGNOSTIK DAN TRANSFORMASI
Dalam analisis regresi, sebagaimana telah dibahas padaawal buku ini, se-
lain perlu mengestimasi dan menguji koefisien regresi, perlu juga dilakukan
uji kecocokan model serta prosedur untuk memilih model yang lebih baik.
Dalam bab ini akan dibahas beberapa hal dan prosedur terkait dengan
pemeriksaan dan pemilihan model.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
240 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kompetensi
Diharapkan agar pembaca memahami teknik dan prosedur untuk memeriksa
kecocokan model serta dapat melakukan penanganan jika model yang telah
dipilih kurang sesuai sehingga menghasilkanmodel yang lebih baik.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
241 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Materi
1. Asumsi analisis regresi klasik
2. Memeriksa sebaran data melalui grafik
3. Memeriksa hubungan peubah melalui grafik
4. Beberapa uji terkait asumsi
5. Memeriksa model melalui AIC
6. Transformasi data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
242 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.1. Asumsi Analisis Regresi Klasik
Sebagaimana telah disebutkan pada bab sebelumnya bahwa bentuk model
linear dapat dituliskan dengan dengan Y = f(X,β) + ε. Ada beberapa
asumsi mendasar dari model linier ini diantaranya:
(i) fungsi f adalah fungsi linier;
(ii) nilai-tengah dari kesalahan εi yaitu E(εi) adalah 0
(iii) ragam kesalahan adalah konstan, yaitu σ2 dan
(iv) distribusi kesalahan adalah normal.
Pemeriksaan terhadap asumsi di atas dapat dilakukan baik melalui uji sta-
tistika maupun secara intuitif menggunakan grafik. Dalam buku ini hanya
dibahas pemeriksaan asumsi secara intuitif menggunakan grafik/ diagram.
Pada prinsipnya kegiatan ini hampir sama dengan eksplorasi data. Be-
danya adalah eksplorasi data dilakukan sebeum melakukan analisis, sedang-
kan diagnostik dilakukan setelah melakukan analisis. Dengan demikian,
jika sebelum melakukan analisis telah dilakukan eksplorasi data pekerjaan
mendiagnostik model menjadi lebih sederhana. Berikut adalah beberapa
tampilan grafik yang dapat dimanfaatkan untuk memeriksa asumsi yang
diperlukan dan memperoleh gambaran kasar secera intuitif.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
243 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.2. Memeriksa Sebaran Data melalui Grafik
Untuk memeriksa distribusi data, secara grafis dapat dilakukan dengan
membuat beberapa grafik dianrananya: grafik QQNorm, grafik densitas
dan Grafik Boxplot. QQNorm pada dasarnya adalah grafik yang menya-
jikan sebaran quantil normal teoritis, dengan quantil data. Apabila datanya
berdistribusi normal maka sebarannya akan mendekati garis lurus. Peny-
impangan yang sangat mencolok pada ujung-ujung grafik menunjukkan
datanya menyimpang dari distribusi normal. Pada Gambar 4.1 diberikan
grafik QQNorm dari data yang berdistribusi normal dan yang tidak berdis-
tribusi normal. Pada grafik untuk data ke dua, selain terlihat menyimpang
dari garis lurus di bagian ujung atas, yang berarti datanya cenderung tidak
simetris ke kanan. Penafsiran yang lebih rinci dari bentuk-bentuk grafik
QQ-Norm dapat dilihat pada Tirta [43].
Simetris tidaknya sebaran data juga dapat dilihat melalui plot densi-
tas. Gambar 4.2 menunjukkan grafik sebaran peluang dari masing-masing
data yang sebelumnya digambar dengan QQNorm. Dari grafik ini juga
terlihat data ke dua cenderung lebih tidak simetris.
Grafik Boxplot dapat digunakan untuk memperoleh gambaran se-
baran data terutama kesimetrisannya.Selain itu dengan boxlot dapat juga
dilacak adanya pencilan (outlier). Deskripsi komponen grafik boxplot
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
244 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Gambar 4.1: Grafik Quantile dari Data Berdistribusi Normal
(kiri) dan Data Cenderung Tidak Berdistribusi Normal
(Kanan)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
245 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Gambar 4.2: Grafik Sebaran Peluang dari Data Berdistribusi Normal
(lebih simetris, warna biru) dan Data Tidak Berdistribusi
Normal (tidak siumetris, warna merah)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
246 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dapat dilihat pada Faraway [12]dan Tirta [43]. Jika data mengandung
peubah kualitatif/ kelompok, boxplot dapat juga dibuat perkelompok,
seperti pada Gambar 4.3.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
247 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
L P
5010
015
020
025
0
BOXPLOT Y
g
Y
Gambar 4.3: Boxplot respon dengan kelompok. Terindikasi salah satu
kelompok (P) mengandung pencilan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
248 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.3. Pemeriksaan Hubungan Peubah melalui Gra-
fik
4.3.1. Diagram pencar data
Pemeriksaan terhadap asumsi kelineran dalam fungsi f dapat dilakukan
secara kasar dengan menggambar diagram percar dari data maupun
residu/ sisa. Dari pencaran data akan dapat diperoleh gambaran se-
cara kasar apakah hubungan antara X dan Y mengikuti hubungan
linear atau hubungan kuadratik atau yang lainnya.
Diagram pencar data, khususnya untuk satu peubah penjelas,
dengan berbagai jenis fungsi dan distribusi dapat dilihat pada berba-
gai gambar berikut:
1. Gambar 4.4 dan Gambar 4.5 adalah grafik dari data dengan hu-
bungan Y = f(X, β) = β0+β1X yang berupa fungsi linier. Dari
gambar-gamber tersebut terlihat bahwa pencaran data terletak
pada suatu garis lurus. Dekat tidaknya pencaran data dengan
suatu garis sangat bergantung pada besarnya ragam semakin be-
sar ragamnya semakin jauh datanya dari garis sehingga semakin
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
249 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tidak kelihatan kalau data tersebut membentuk suatu garis lu-
rus. Namun kedua grafk tersebut mempunyai perbedaan dari
kekonstanan ragam yang terkait dengan jenis distribusi datanya.
Gambar 4.4: Grafik Pencar Data dengan Hubungan Linear dan Ragam
Relatif Konstan
2. Gambar 4.6 adalah grafik dari data dengan hubungan Y =
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
250 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Gambar 4.5: Grafik Pencar Data dengan hubungan Linear tetapi Ra-
gam Relatif tidak Konstan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
251 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
f(X, β) = β0 + β1X2. dari Gambar terlihat bahwa pecaran da-
datnya berbetuk parabola yang mengindikasikan bahwa hubun-
gannya adalah hubungan kuadratik.
Gambar 4.6: Grafik Pencar Data dengan hubungan lebih cenderung
nonlinear
3. Gambar 4.7 adalah grafik dari data dengan hubungan Y =
f(X, β) = β0e(β1X). Dari diagram pencar terlihat sebaran data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
252 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
mengikuti grafik eksponensial.
Gambar 4.7: Grafik Pencar Data dengan Hubungan Eksponensial
4.3.2. Diagram Pencar Sisa
Sisa atau residu adalah selisih antara nilai observasi (observed value)
dengan nilai yang diperoleh melalui pengepasan garis regresi (fitted
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
253 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
value). Residu ini merupakan penduga dari kesalahan atau error.
Syarat kekonstanan ragam ditunjukkan oleh adanya sebaran merata
sehingga lebar sebaran dari kiri ke kanan relatif konstant (Gambar
4.8). Adanya ketidak konstanan ragam ditandai dengan lebar sebaran
yang tidak konstan dari kiri ke kanan (Gambar 4.9). Data yang mem-
punyai ragam konstan disebut bersifat homoskedastik sebaliknya
jika ragam tidak konstan disebut bersifat heteroskedastik.
4.3.3. Memeriksa Model Melalui Diagram
Pada dasarnya model statistika dikembangkan untuk mengakomodasi
jenis data dengan kondisi tertentu, misalnya adanya hubungan linier,
saling independen dan bersifat random. Cara yang paling sederhana
untuk memeriksa kondisi linieritas, dan kekonstanan koefisien variasi
adalah dengan menggunakan pendekatan intuitif melalui pemeriksaan
pencaran residu (sisa).
Dari sifat residu sebagai penduga dari kesalahan, maka dapat
disimpulkan bahwa secara geometris pencaran residu harus memenuhi
beberapa sifat yaitu:
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
254 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
100 150 200 250 300
−5
05
Nilai Pengepasan
Sis
a
Gambar 4.8: Grafik Pencar Sisa Data yang memenuhi syarat ho-
moskedastisitas.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
255 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
100 150 200 250 300
−2
02
4
Nilai Pengepasan
Sis
a
Gambar 4.9: Grafik Pencar Sisa Data yang tidak memenuhi syarat ho-
moskedastisitas.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
256 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1. sebaran mengikuti pola garis lurus;
2. menyebar secara acak dan seimbang di sekitar 0;
3. lebar sebaran dari kiri ke kanan relatif konstan.
Sebaran data dapat diperiksa dengan menggunakan grafik QQNorm
dengan ciri-ciri:
1. sebaran titik mengikuti garis lurus,
2. penyimpangan kentara terhadap garis lurus menunjukkan data
menyimpang dari sebaran normal dan salah satunya ditunjukkan
adanya ketidak simetrisan sebaran.
Paket/library lm() secara automatis menyediakan 4 macam gra-
fik yang dapat dipergunakan untuk mendiagnostik model diantaranya:
1. grafik QQNorm untuk memeriksa sebaran data;
2. grafik sisa untuk melihat kelinieran dan juga kekonstannan ra-
gam;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
257 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3. grafik residual baku dan nilai ekspektasi;
4. grafik Jarak Cook (Cook’s Distance) untuk memeriksa adanya
pencilan (Outlier/pencilan). Lihat Faraway [12, Bab 7] untuk
pembahasan dan diagnostik berhubungan dengan pencilan.
Berikut adalah contoh keluaran grafik yang digabung menjadi satu
tampilan yang dapat dibuat dengan perintah plot(NamaObjek).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
258 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Gambar 4.10: Grafik Diagnostik dari Objek yang Dihasilkan oleh
Fungsi lm(). Grafik menunjukkan data relatif
memenuhi asumsi Model Linier Normal
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
259 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Gambar 4.11: Grafik Diagnostik dari Objek yang Dihasilkan oleh
Fungsi lm(). Grafik menunjukkan data tidak memenuhi
asumsi Model Linier Normal, yang ditandai dengan ada-
nya hubungan tidak linier dan pencilan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
260 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.4. Uji Statistika Terkait Asumsi
Pemeriksaan melalui grafik cukup memberikan gambaran secara in-
tuitif apakah data yang dimiliki memenuhi asumsi atau tidak. Pe-
meriksaan yang lebih teliti (lebih eksak) dapat dilakukan melalui uji
statistika di antaranya adalah:
1. uji kenormalan shapiro-wilk;
2. uji homogenitas ragam Bartlett dan Levenge.
Dari Gambar 3.7 terlihat bahwa sebaran data tidak memiliki var-
iansi konstan, yang mengindikasikan tidak adanya homoskedastisitas
atau data tidak menyebar secara normal. Ternyata hasil uji statistika
(dengan Shapiro-Wilk)juga menunjukan bahwa data menyebar tidak
mengikuti sebaran normal, ditunjukkan oleh nilai p < 5%.
Shapiro-Wilk normality test
data: cars$dist
W = 0.9514, p-value = 0.0391
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
261 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.5. Memeriksa Model melalui AIC
Pemeriksaan dapat juga dilakukan dengan menggunakan kriteria in-
formasi Akaike (AIC, Akaike’s Information Criterion) yang menghi-
tung perimbangan antara besarnya likelihood dengan banyaknya vari-
abel dalam model. Besarnya AIC dihitung melalui rumus berikut
AIC = −2l(θ) + 2q, (4.1)
dengan l(θ) adalah nilai likelihood dari model yang dihadapi dan q
adalah banyaknya parameter dalam model. Secara umum, semakin ke-
cil nilai AIC model yang dipakai semakin cocok. Model yang dianggap
terbaik adalah model dengan nilai AIC minimum. Namun demikian,
dengan pertimbangan aspek lain, perbedaan AIC yang tidak terlalu
besar mungkin dapat diabaikan. Untuk pembahasan lebih mendalam
tentang AIC dapat dilihat pada Akaike [1], Chamber & Hastie [5] dan
Venables & Ripley [47] serta Hjorth [15].
Pada R, model terbaik menggunakan AIC diperoleh dengan mem-
berikan perintah step(objel.lm). Pada contoh berikut ditunjukkan
bahwa pada regresi
Y = β0 + β1X1 + β2X2 + β3X3 + β4X4
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
262 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
diperoleh hanya satu koefisien yang signifikan. Kita dapat saja lang-
sung memilih model hanya menyertakan satu variabel penjelas ini.
Melalui perintah step() dapat diketahui kombinasi yang terbaik di-
antara tiga variabel tadi.
lm(formula = y ~ x1 + x2 + x3 + x4)
Coefficients:Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.98333 9.91166 0.200 0.8434x1 1.97890 0.09044 21.881 1.93e-15 ***x2 0.02657 0.08598 0.309 0.7605x3 2.97230 0.07208 41.236 < 2e-16 ***x4 0.13376 0.07710 1.735 0.0981 .---Signif.codes:0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.098 on 20 degrees of freedomMultiple R-Squared: 0.9919, Adjusted R-squared: 0.9903F-statistic: 613.9 on 4 and 20 DF, p-value: < 2.2e-16
Nilai AIC dari model lengkap ini dapat diperoleh dengan per-
intah AIC(model). Untuk model ini diperoleh AIC=114,42. Lang-
kah selanjutnya adalah menelusuri model terbaik atau yang lebih baik
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
263 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
melalui perintah step(lm1).Start: AIC= 41.47y ~ x1 + x2 + x3 + x4
Df Sum of Sq RSS AIC- x2 1 0.4 88.5 39.6<none> 88.0 41.5- x4 1 13.2 101.3 43.0- x1 1 2107.4 2195.5 119.9- x3 1 7484.7 7572.7 150.8
Step: AIC= 39.59y ~ x1 + x3 + x4
Df Sum of Sq RSS AIC<none> 88.5 39.6- x4 1 13.2 101.6 41.1- x1 1 2205.1 2293.5 119.0- x3 1 7494.7 7583.2 148.9
Call:lm(formula = y ~ x1 + x3 + x4)
Model yang disarankan adalah
Y = β0 + β1X1 + β3X3 + β4X4
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
264 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
yang dianggap sudah cukup baik dengan nilai AIC = 39,59.
Selain menyediakan fasilitas pemeriksaan AIC, R melalui menu
RCommander juga menyediakan beberapa uji untuk mendiagnostik
model diantaranya: diantaranya FIV (Faktor Inflansi Variansi/Ragam)
untuk memeriksa adanya multi kolinieritas, Uji heteroskedastisitas
Brues Pagan, Uji autokorelasi Durbin-Watson, Uji Pencilan Berfer-
roni. Namun konsep yang mendasari masih diluar lingkup pemba-
hasan buku ini.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
265 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.6. Transformasi Data
Untuk data yang distribusinya, atau distribusi residunya menunjukkan
adanya penyimpangan dari syarat yang harus dipenuhi bagi penggu-
naan regresi linier klasik, maka harus dilakukan remidi sehingga per-
syaratan tersebut menjadi relatif terpenuhi. Remidi yang dilakukan
biasanya adalah dengan mentransformasikan data dengan suatu fungsi
yang sesuai. Selanjutnya data hasil transformasi ini yang dianalisis
dengan regresi klasik.
Bentuk grafik dan transformasi yang mungkin dilakukan untuk
mengatasi ketidak linieran diantaranya adalah seperti berikut ini.
1. Kurva naik dengan terbuka ke atas maka transformasi dilakukan
pada Y dan tranformasi yang bisa dicoba adalah Y1 = log(Y )
atau Y1 =√Y atau Y1 = 1/Y seperti terlihat pada Gambar 4.12
2. Kurva naik dan terbuka kebawah maka transformasi dilakukan
pada X dan trandformasi yang bisa dicoba adalah X1 = log(X)
atau X1 =√X atau X1 = 1/X seperti terlihat pada Gambar
4.13
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
266 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Gambar 4.12: Sebaran data asli (naik dan membuka ke atas) dan trans-
formasi yang bisa dilakukan. Beberapa transformasi meng-
hasilkan sebaran yang mengikuti garis lurus tetapi ragam
tidak konstan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
267 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3. Kurva menurun dan terbuka keatas maka transformasi dapat
dilakukan pada X atau Y dengan salah satu transformasi se-
belumnya.
Untuk menstabilkan ragam dapat dicoba beberapa transformasi
diantaranya Y1 = log(Y ), Y1√Y atau Y1 = 1/Y . Pada Gambar 4.14
terlihat bahwa transformasi tidak selalu dapat menstabilkan ragam.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
268 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Gambar 4.13: Sebaran data asli (naik dan terbuka ke bawah) dan trans-
formasi yang bisa dilakukan. Beberapa transformasi meng-
hasilkan sebaran yang mengikuti garis lurus tetapi ragam
tidak konstan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
269 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Gambar 4.14: Sebaran data asli (dengan ragam tidak stabil) dan trans-
formasi yang bisa dilakukan. Beberapa transformasi hanya
menghasilkan ragam yang sedikit lebih stabil
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
270 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.7. Ringkasan
1. Sebelum dan sesudah melakukan analisis regresi sangat perlu di-
adakan pemeriksaan terkait sebaran data dan sisa untuk mem-
peroleh gambaran terpenuhi tidaknya asumsi yang diperlukan;
pemeriksaan sebaran sisa sering disebut sebagai langkah mendi-
agnostik model;
2. diagnostik model dapat dilakukan secara intuitif melalui grafik
(misalnya untuk melihat sebaran dapat digunakan Normal-Plot,
Boxplot, atau plot densitas);
3. pemeriksaan sebaran dapat juga dilakukanj melalui uji statistika
(uji normalitas, atau uji homogenitas);
4. untuk data yang mengandung peubah kualitatif/faktor selain
grafik secara keseluruhan, perlu juga diperiksa grafik perkelom-
pok;
5. jika tidak terpenuhi asumsi yang diperlukan, dapat dicoba trans-
formasi yang sesuai sehingga asumsi yang diperlukan terpenuhi;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
271 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6. pemilihan modeldapat dilakukan dengan melihat nilai AIC atau
nilai koefisien determinasi. Makin kecil nilai AICnya, model
makin baik, sementara itu semakin besar nilai koefisien deter-
minasinya, model semakin baik.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
272 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.8. Bacaan Lebih Lanjut
Pembahasan mengenai Analisis Sisa pada Model Linier Normal dapat
dilihat pada Bowerman et al. [3] dan Neter et al. [31]. Referensi
terkait R dapat dilihat pada Crawley [8] dan Kuhnert & Venables
[18]. Khusus eksplorasi grafik dari R dapat dilihat pada Maindonald
[23], Vezalini [48], Zoonekyn [55], dan Murrel [29].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
273 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
4.9. Latihan Soal-soal
1. Jelaskan penggunaan (qqplot() dan plot(density())) untuk
memeriksa distribusi data
2. Jelaskan ciri-ciri ideal sebaran sisa/residu yang memenuhi asumsi
model linier normal
3. sebutkan uji statistika yang dapatdigunakan untuk menguji nor-
malitas data.
4. Sebutkan transformasi yang dapat dilakukan berdasarkan ciri-
ciri sebarab sisa maupun data
5. Sebutkan kriteria pemilihan model dengan menggunakan AIC
6. Suatu data mengandung peubah kualitatif/faktor dengan dua
kategori. Dari pemeriksaan grafik respon secara keseluruhan
diperoleh gambaran bahwa data memiliki dua puncak (bimodal).
Apakah ini berarti data tidak memenuhi sebaran normal, lang-
kah apa yang perlu dilakukan?
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
274 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
275 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
BAB 5
MODEL LINIER TERGENERALISIR
Model Linier telah digunakan selama bertahun-tahun dalam analisis
statistika, khususnya untuk menganalisis data kontinu (data dengan
distribusi kontinu). Tehnik ini berdasarkan pada asuumsi pada dis-
tribusi normal pada komponen acaknya dan adanya hubungan linier
antara nilai-tengah dengan komponen sistematik (peubah eksplana-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
276 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
torinya). Model linier ini selanjutnya mengalami perkembangan de-
ngan memberikan asumsi yang lebih longgar baik pada distribusinya
maupun pada hubungan antara nilai-tengah dengan komponen sis-
timetiknya. Distribusi data tidak lagi terbatas pada distribusi nor-
mal tetapi merupakan anggota dari distribusi Keluarga Eksponensial.
Pada bab ini akan dibicarakan distribusi keluarga eksponensial dengan
sifat-sifatnya serta beberapa distribusi penting, baik distribusi diskrit
maupun distribusi kontinu, yang termasuk dalam kelompok keluarga
eksponensial. Selanjutnya akan dibahas perluasan model (regresi) li-
nier berdasarkan distribusi keluarga eksponensial, yang dikenal de-
ngan sebutan Generalized Linear Model (GLM).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
277 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.1. Distribusi Keluarga Eksponensial
5.1.1. Bentuk umum
Kita mulai dengan definisi formal dari distribusi keluarga eksponen-
sial. Ada beberapa variasi mendefinisikan distribusi keluarga ekspoen-
sial dan dalam buku ini dipilih yag paling sederhana.
Definisi 5.1. Suatu peubah acak Y dengan fungsi kepadatan proba-
bilitas (f.k.p.) f dan parameter θ dikatakan menjadi anggota distribusi
keluarga eksponensial, jika f dapat dinyatakan sebagai:
f(y; θ) = exp[a(y)b(θ) + c(θ) + d(y)]. (5.1)
Pada (5.1) s(y) = exp(d(y)); t(θ) = exp(c(θ)). Dalam beberapa
kasus fungsi a, b, c dan d mungkin mengandung parameter lain yang
disebut parameter nuisan/ gangguan Dobson [11, pages 22-23] yang
pada tidak menjadi perhatian utama dan sering dianggap sebagai pa-
rameter yang telah diketahui (tidak perlu diestimasi). 1
1McCullagh dan Nelder dalam [24] mendefinisikan distribusi keluarga ekspo-
nensial dengan parameter gangguan yang eksplisit, φ.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
278 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dalam keadaan khusus a(y) = y, maka(5.1) menjadi:
f(y) = exp[yb(θ) + c(θ) + d(y)] (5.2)
dan (5.2) disebut bentuk kanonik dari distribusi keluarga eksponensial
dan b(θ) disebut parameter natural dari distribusinya.
5.1.2. Nilai-tengah dan Ragam dari a(Y )
Fungsi Skor [U] E[U ] danVar[U ]
Dobson [11, halaman 23-24] mendefinisikan fungsi skor dari f(y) ter-
hadap θ sebagai U = dl(y)/dθ, dengan l(y) = log f(y) = ln f(y).
Perhitungan E[U ] dan Var[U ] dibutuhkan untuk menurunkan nilai-
tengah dan ragam Y atau dalam bentuk yang lebih umum, E[a(Y )]
dan Var[a(Y )].
U =d l(y)
d θ, (5.3)
=1
f(y)
d f(y)
d θ. (5.4)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
279 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dengan demikian
E[U ] =
∫1
f(y)
d f(y)
d θf(y) dy,
=
∫d f(y)
d θdy,
=d
d θ
∫f(y) dy,
=d 1
d θ,
= 0. (5.5)
Persamaan (5.3) dan (5.4) juga menghasilkan:
d f(y)
d θ= f(y)
d l(y)
d θ. (5.6)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
280 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Selanjutnya kita perlu menunjukkan bahwa E[U ′] + E[U2] = 0.
E[U ′] = E
(dU
d θ
),
=d
d θE[U ], (5.7)
=d 0
d θ,
= 0. (5.8)
Tetapi dari (5.6), ruas kanan dari (5.7) menjadi dd θ
∫ d l(y)d θ
f(y) dy.
Jadi, bersama dengan (5.6), menghasilkan:
0 =d
d θ
∫d l(y)
d θf(y) dy,
=
∫d2l(y)
d θ2f(y) dy +
∫d l(y)
d θ
d f(y)
d θdy,
=
∫d2l(y)
d θ2f(y) dy +
∫ (d l(y)
d θ
)2
f(y) dy,
=
∫U ′ f(y) dy +
∫U2 f(y) dy
= E[U ′] + E[U2].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
281 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Jadi,
E[−U ′] = E[U2],
dan
Var[U ] = E[−U ′]. (5.9)
Untuk persamaan(5.1), U dan U ′ terhadap θ adalah:
U =d
d θ[a(y)b(θ) + c(θ) + d(y)],
= a(y)b′(θ) + c′(θ), (5.10)
dan
U ′ = a(y)b′′(θ) + c′′(θ). (5.11)
Nilai-tengah dan ragam distribusi keluarga eksponensial diberi-
kan dalam hasil berikut ini.
Hasil 5.1. Nilai-tengah dan ragam a(Y ) yang didefinisikan seperti
pada Definisi 5.1 mempunyai nilai-tengah dan ragam, masing-masing
E[a(Y )] = −c′(θ)
b′(θ). (5.12)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
282 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Var[a(Y )] =b′′(θ)c′(θ)− c′′(θ)b′(θ)
[b′(θ)]3. (5.13)
Nilai-tengah dan ragam dari a(Y ) diturunkan seperti berikut
ini. Dari persamaan (5.5) dan persamaan (5.10), diperoleh bahwa
E[a(Y ))b′(θ) + c′(θ)] = 0, karenanya
E[a(Y )] = −c′(θ)
b′(θ).
Dari persamaan (5.9) dan persamaan (5.11), dan menerapkan per-
samaan (5.12), diperoleh bahwa
Var[U ] = E[−U ′],= E [−a(Y )b′′(θ)− c′′(θ)] ,= −E[a(Y )]b′′(θ)− c′′(θ),
= −c′(θ)
b′(θ)b′′(θ)− c′′(θ). (5.14)
Tetapi dengan persamaan (5.10),
Var[U ] = [b′(θ)]2Var[a(Y )]. (5.15)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
283 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Akibatnya, persamaan (5.14) dan persamaan (5.15) menghasilkan
Var[a(Y )] =b′′(θ)c′(θ)− c′′(θ)b′(θ)
[b′(θ)]3.
5.1.3. Beberapa Bentuk Khusus
Berikut ini adalah beberapa distribusi yang menjadi anggota keluarga
eksponensial.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
284 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Distribusi Binomial dengan Parameter n, p
Distribusi Binomial juga termasuk anggota keluarga eksponensial. Dis-
tribusi Binomial dengan parameter n, p mempunyai fungsi kepadatan
f(y) =
(n
y
)py(1− p)n−y; y = 0, 1, 2, . . . , n
= exp
[y log p+ (n− y) log(1− p) + log
(n
y
)]= exp
[y log
(p
1− p
)+ n log(1− p) + log
(n
y
)]= exp
[ylogit p+ n log(1− p) + log
(n
y
)]Dengan
logit p = log
(p
1− p
)Jadi b(θ) = logit p; c(θ) = n log(1 − p). Dengan mencari turunan
pertama dan kedua masing-masing b(θ) dan c(θ) diperoleh
E(Y ) = np dan V ar(Y ) = np(1− p)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
285 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dalam prakteknya distribusi Binomial (n, p) sering dimodifikasi men-
jadi distribusi Binomial (1, µ) dengan mentransformasi x = y/n; x =
0, . . . , 1 sehingga mempunyai nilai-tengah µX = µ dan ragam Var(X) =
σ2X = µ(1− µ).
Distribusi Poisson dengan Parameter θ.
Peubah acak Y yang berdistribusi Poisson mempunyai fungsi kepa-
datan probabilitas
f(y) =θye−θ
y!, y = 0, 1, 2, 3, · · ·
= exp[y log θ − θ − log y!]. (5.16)
Pada persamaan (5.16) b(θ) = log θ, c(θ) = −θ, d(y) = − log y. De-
ngan demikian E[Y ] = θ dan Var[Y ] = θ.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
286 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Distribusi Normal dengan Parameter θ dan σ
Bentuk fungsi kepadatan probabilitas dari peubah acak Y yang berdis-
tribusi Normal adalah
f(y) =1√2πσ
exp
(−1
2
(y − θσ
)2), −∞ < y <∞,
= exp
(− y2
2σ2+yθ
σ2− θ2
2σ2− 1
2log(2πσ2)
). (5.17)
Pada persamaan (5.17) b(θ) = θ/σ2, d(y) = y2/(2σ2) dan c(θ) =
−θ2/(2σ2) − 12
log(2πσ2). Di sini σ adalah parameter nuisan. Jadi,
E[Y ] = θ dan Var[Y ] = σ2.
Distribusi Gamma dengan parameters θ dan skala φ.
Peubah acak Y yang berdistribusi Gamma mempunyai fungsi kepa-
datan probabilitas
f(y) =θ(yθ)φ−1e−yθ
Γ(φ), y > 0,
= exp[−yθ + (φ− 1) log y + φ log θ − log Γ(φ)]. (5.18)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
287 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Padapersamaan (5.18) b(θ) = −θ, a(y) = y, c(θ) = φ log θ−log Γ(φ), d(y) =
(φ− 1) log y. Maka, E[Y ] = φ/θ, Var[Y ] = φ/θ2. Di sini φ adalah pa-
rameter nuisan.
Distribusi lainnya
Beberapa distribusi lainnya yang termasuk keluarga eksponensial ada-
lah:
Distribusi Pareto
Distribusi Eksponensial
Distribusi Binomial Negatif
Distribusi Invers Gauss [24, page 22] dan [11, page 34]
Rangkuman beberapa distribusi khusus diberikan pada Tabel
5.1. Karakteristik lain masing-masing distribusi anggota keluarga eks-
ponensial yang penting dapat diragkum pada Tabel 5.2.
Sebagai ilustrasi pada Gambar 5.1 ditunjukkan densitas data de-
ngan distribusi Normal Standar dan Gamma Standar dengan berba-
gai nilai-tengah/mean. Gambar menunjukkan bahwa untuk distribusi
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
288 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 5.1: Rangkuman Distribusi Anggota Keluarga Eksponensial
Binomial Normal Poisson Gamma
Notasi Bin(1, µ) N(µ, σ2) P (µ) G(µ, ν)
φ 1 σ2 1 ν−1
b(θ) logit µ θ2/2 exp(θ) − log(−θ)µ(θ) = E(Y ; θ) θ exp(θ) −1/θ
link kanonik logit identitas log resiprokal
θ = η = logit µ θ = η = µ θ = η = logµ θ = η = 1/µ
Gamma seiring dengan kenaikan nilai-tengah, ragam ikut meningkat,
sedangkan untuk distribusi normal, ragamnya konstan. Pada Gambar
5.2 ditunjukkan sebaran data dengan hubungan antara X dan Y yang
sama tetapi yang satu berdistribusi Normal yang satu berdistribusi
Gamma. Terlihat untuk sebaran data Gamma, selain sebarannya lebih
lebar dari sebaran normal, semakin ke kanan semakin lebar sebaran
data.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
289 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Gambar 5.1: Plot Densitas dari sampel dengan berbagai nilai-tengah
dengan ukuran sampel 100
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
290 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Gambar 5.2: Sebaran Data dengan ukuran sampel 100 dengan dis-
tribusi Normal (b) dan Gamma (r)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
291 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 5.2: Ciri-ciri khas Distribusi Keluarga EksponensialNo Nama Jenis Ruang
Rentang
Hubungan
Ragam
dan Nilai-
tengah
lain-
lain
1 Binomial diskrit 0, 1, 2, · · · , n linier simetrik
2 Poisson diskrit 0, 1, 2, · · · linier tidak
simetrk
3 Gamma kontinue 0 < x <∞ kuadratik tidak
simetrik
4 Normal kontinue −∞ < x <∞ bebas simetrik
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
292 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.2. Konsep Dasar Model Linier Tergeneralisir
5.2.1. Sisi lain Model Linier Normal
Selama bertahun- tahun, model linier berikut telah digunakan secara
luas dalam analisis statistika terutama untuk data kontinu:
Y = Xβ + e (5.19)
dengan Y = (Y1, · · · , Yi, · · · , Yn)T , e = (e1, · · · , en)T , X = suatu
N×p matriks peubah eksplanatori atau sering disebut matriks desain
dan β = (β1, · · · , βp)T . Lihat Dobson [11, subbab 3.1] dan McCullagh
& Nelder [24, hal. 7].
Asumsi yang mendasari model ini adalah: ei ∼ NID(0,σ2), dan
karenanya Y ∼ N(E[Xβ], Iσ2). Asumsi-asumsi ini dapat diuraikan
secara lebih terinci seperti berikut ini.
(i) Yi berdistribusi normal dan saling bebas dengan ragam kon-
stan, yaitu Yi ∼ NID ( xiTβ, σ2), dengan xi
T adalah peubah
eksplanatori untuk Yi dan sama dengan baris ke-i dari matriks
X.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
293 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(ii) Ada suatu fungsi (misalkan η) dari peubah eksplanatori yang
disebut prediktor linier dari peubah respon Y . Pada kasus di
atas fungsi ini adalah ηi = xTi β.
(iii) Ada hubungan antara prediktor (ηi) dan komponen acak (µi).
Dalam kasus di atas ηi = µi (yaitu hubungan identitas).
Model linier persamaan (5.19) dengan asumsi di atas sering disebut
Model Linier Klasik. Model ini telah dibahas pada bab sebelumnya.
5.2.2. Generalisasi Model Linier Klasik ke Model Linier Ter-
generalisir
Dalam Model Linier Tergeneralisir (MLT) atau Generalized Lin-
ear Models (GLM), asumsi model lebih longgar dan digeneralisasikan
dengan cara berikut:
(i) Asumsi (i) diperluas untuk memungkinkan Yi mempunyai dis-
tribusi yang sama dan saling bebas dari distribusi keluarga
eksponensial.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
294 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(ii) Pada asumsi (iii) hubungan antara komponen prediktor (η) dan
komponen acak (µ) tidak mesti identitas, tetapi diperluas untuk
suatu fungsi monoton dan diferensiabel, g, yaitu ηi = g(µi).
Fungsi g disebut fungsi link. atau link function.
Jadi dalam model linier tergeneralisir ada tiga komponen yang penting
yaitu:
1. komponen distribusi, yaitu y berdistribusi keluarga eksponen-
sial;
2. komponen prediktor linier, yaitu η = xTβ;
3. fungsi link yaitu fungsi monoton dan diferensiabel g sehingga
g(µ) = η. Adanya fungsi link memungkinkan prediktor linier
memiliki daerah rentang seluruh bilangan riil (−∞ < x < ∞)
tetapi respon y memiliki rentang tertentu (misalnya 0 < y < 1
untuk binomial; dan bilangan cacah untuk respon hasil pencac-
ahan (count data).
Diantara fungsi- fungsi link yang dapat digunakan, ada yang
disebut fungsi link kanonik yaitu fungsi hubungan yang terjadi pada
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
295 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
saat b(θ) = η =∑p
j=0 βjxj. Untuk distribusi binomial, misalnya
fungsi yang bisa dipakai adalah:
(i) fungsi logit, yang nerupakan fungsi link kanonik yaitu
η = log
(µ
1− µ
);
(ii) fungsi probit, yaitu
η = Φ−1(µ);
dimana Φ adalah fungsi kumulatif dari distribusi Normal, yaitu
Φ(x) =
∫ x
−∞
1√2π
exp
[−1
2z2]dz;
dan
(iii) komplementari ln-ln, yaitu
η = log[− log(1− µ)].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
296 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
−6 −4 −2 0 2 4 6
0.0
0.2
0.4
0.6
0.8
1.0
Logit/Probit
prediktor
Pelua
ng
Gambar 5.3: Respon dengan Fungsi Hubungan Logit (kurva langsung)
dan Probit (kurva putus-putus).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
297 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Grafik respon mengunakan fungsi hubungan probit dan logit dapat
dilihat pada Gambar 5.3. Dalam prakteknya fungsi hubungan logit
lebih banyak dipilih dibanding dengan fungsi probit maupun komple-
menter. Penelusuran penurunan rumus fungsi logit jauh lebih mudah
dibanding fungsi probit.
Untuk distribusi Normal dan Poisson masing- masing mempun-
yai link kanonik identitas dan log. Rangkuman distribusi keluarga
eksponensial termasuk fungsi link kanonik untuk tiap-tiap distribusi
dapat dilihat pada Tabel 5.1 pada buku ini (Lihat juga McCullagh &
Nelder [24, hal. 23]). Rangkuman distribusi dan fungsi link kanonik
dan link lain yang dapat dipergunakan, pada program R akan dibahas
pada seksi 5.7 pada halaman 326.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
298 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.3. Estimasi pada Model Linier Tergeneralisir
Ada dua metode yang biasa digunakan untuk mengestimasi parameter
pada model linier. Metode tersebut adalah dan metode kuadrat
terkecil dan metode likelihood maksimum.
1. Metode kuadrat terkecil dalam mengestimasi parameter berkai-
tan dengan mencari nilai yang sedekat mungkin dengan nilai
harapannya[2, section 4.9]. Hal ini biasanya dilakukan dengan
meminimalkan jumlah kuadrat kesalahan (galat). Metode ini
sering disebut metode kuadrat terkecil. Sebagai contoh, mi-
salkan mencari penduga dari parameter β dari model persamaan
(5.19), dari Model Linier Normal. Langkah-langkah yang bisa
ditempuh, secara umum adalah
(a) Mula-mula model persamaan (5.19) disusun seperti
e = y −Xβ.
(b) Bentuk kuadrat dari kuadrat kesalahan didefinisikan seba-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
299 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
gai
Q =n∑i=1
e2i = eTe = (y −Xβ)T(y −Xβ).
Dalam bentuk ini informasi tentang distribusi ei sama sekali
belum diperhitungkan dalam perhitungan estimasi param-
eter.
(c) BiasanyaQ dibobot dengan invers dari matriks ragam - kor-
agam (misalkan V ). Penduga kuadrat terkecil terbobot
b dari β selanjutnya diperoleh dengan meminimalkan
Qw = (y −Xβ)TV−1(y −Xβ)
terhadap parameter β, yaitu, menyelesaikan persamaan (un-
tuk model linier klasik)
∂Qw
∂β= −2XTV−1(y −Xβ) = O, (5.20)
atau ekuivalen dengan menyelesaikan Persamaan Nor-
mal
XTV−1Xb = XTV−1y.
(Lihat juga [32, subbab 12.8]).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
300 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dengan metode kuadrat terkecil terbobot, maka sebagian infor-
masi tentang distribusi ei, yaitu ragamnya, telah diperhitungkan
dalam menghitung penduga parameter.
2. Metode likelihood maksimum likelihood digunakan khususnya
jika distribusi peubah acaknya diasumsian diketahui [6, Subbab
9.2]. Penduga likelihood maksimum (p.l.m.) dari suatu param-
eter θ biasanya dinotasikan dengan θ dan didefinisikan sebagai
nilai dari ruang rentang parameter (misalnya Ω) yang memaksi-
mumkan fungsi likelihood L(y, θ), yaitu:
θ ∈ Ω adalah p.l.m jika dan hanya jika L(θ) ≥ L(θ), ∀ θ ∈ Ω.
Penghitungan θ dapat dilakukan dalam beberapa langkah ber-
ikut:
(i) Langkah pertama adalah menentukan fungsi dari data y.
Ini merupakan fungsi kepadatan bersama dari y, hanya saja
dalam hal ini yang menjadi peubah yang tidak diketahui
adalah parameter θ, sedangkan y adalah data yang dike-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
301 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tahui. Jika datanya saling bebas maka
L(y, θ) =N∏i=1
f(yi, θ)
(ii) Langkah berikutnya adalah mencari maksimum dari l(y, θ) =
logL(y, θ) terhadap θ. Ini merupakan maksimum lokal dari
fungsi l terhadap θ. Maka θ adalah:
a. nilai θ sedemikian sehinga dl/dθ = 0 dan d2l/dθ2 < 0;
atau
b. Nilai batas dari ruang parameter jika Ω terbatas.
Persamaan dl/dθ = 0, umumnya tidak dapat diselesaikan secara
aljabar ata analitik, oleh karenanya metode iterasi, seperti metode
Newton-Raphson, sering diaplikasikan.
5.3.1. Metode Penduga Kuadrat Terkecil
Sebagaimana pada model linier klasik, metode kuadrat terkecil men-
cari penduga yang menyebban terjadinya kesalahan minimum. Untuk
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
302 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
itu persamaan (5.19) perlu diubah sehingga bentuk e menjadi eksplisit
selanjutnya diturunkan minimum dari eT e, seperti pada persamaan
(5.20). Tambahan komplikasi terjadi karena dalam MLT hubungan
antara prediktor linier dan komponen acak tidak mesti beupa identi-
tas, tetapi melalui suatu fungsi yang disebut fungsi link, g(). Dengan
demikian
∂Qw
∂β=
(∂µ
∂η
)T∂Qw
∂µ
= −2
(∂µ
∂η
)TXTV−1(y − µ),
= 0,
dimana
(∂ µ
∂η
)adalah matrik diagonal berordo N dengan unsur di-
agonal ke-i adalah
(∂µi∂ηi
)yang nilainya bergantung pada fungsi link
yang digunakan. Untuk mengaplikasikan metode iterasi Newton-Raphson,
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
303 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
diperluka bentuk turuann kedua yang dapat dinyatakan dengan
∂2Qw
∂βT∂β=
(∂µ
∂η
)∂Qw
∂µ
= 2
(∂µ
∂η
)TXTV−1X
(∂µ
∂η
).
Dengan demikian bentuk lengkap iterasi Newton Raphson dengan
Metode Kuadrat Terkecil Terbobot Weighted Least Square adalah
b1 = b0 +
[(∂µ
∂η
)TXTV−1X
(∂µ
∂η
)]−1 [(∂µ
∂η
)TXTV−1(y − µ)
],
(5.21)
dengan g(µ) = Xβ.
5.3.2. Metode Penduga Likelihood Maksimum
Penduga likelihood maksimum untuk model linier tergeneralisir dapat
diturunkan sebagai berikut (lihat [11, Lampiran 1]):
l(y) =n∑i=1
yib(θi) +n∑i=1
c(θi) +n∑i=1
c(θi) +n∑i=1
d(yi), (5.22)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
304 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dengan
E[Yi] = µi = −c′(θi)
b′(θi)berdasarkan persamaan (5.12), (5.23)
and
g(µi) = xTi β =
p∑j=1
xijβj = ηi. (5.24)
Untuk memperoleh β, kita gunakan persamaan:
Uj =n∑i=1
∂li∂βj
,
dengan
li = yib(θi) + c(θi) + d(yi) (5.25)
dan∂li∂βj
=∂li∂θi
∂θi∂µi
∂µi∂βj
.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
305 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dari persamaan (5.25) kita peroleh
∂li∂θi
= yib′(θi) + c′(θi),
= b′(θi)
[yi +
c′(θi)
b′(θi)
]= b′(θi)(yi − µi) by persamaan (5.12). (5.26)
Dari persamaan (5.23), kita peroleh
∂µi∂θi
=
(c′′(θi)b
′(θi)− b′′(θi)c′(θi)[b′(θi)]2
),
= b′(θi)Var[Yi] berdasar persamaan (5.13).
Oleh karena itu,∂θi∂µi
=1
b′(θi) Var[Yi]. (5.27)
Sekarang∂µi∂βj
=∂µi∂ηi
∂ηi∂βj
,
dan dari persamaan (5.24) kita peroleh
∂ηi∂βj
= xij,
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
306 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dan∂µi∂βj
= xij
(∂µi∂ηi
). (5.28)
Oleh karena itu
∂li∂βj
=b′(θi)(yi − µi)b′(θi) Var[Yi]
xij
(∂µi∂ηi
)berdasar (5.26),(5.27),(5.28),
=
((yi − µi)xij
Var(Yi)
)(∂µi∂ηi
), (5.29)
dan
Uj =n∑i=1
∂li∂βj
=n∑i=1
((yi − µi)xij
Var(Yi)
)(∂µi∂ηi
)(5.30)
for j = 1, 2, 3, · · · , p. Umumnya, metode iterasi seperti metode Newton-
Raphson , digunakan untuk menyelesaikan sistim persamaan U = O.
Pendekatan iterasi ke- m-th dari f(x) = 0 dengan Newton-Raphson
adalah:
x(m) = x(m−1) −(f(x(m−1))
f ′(x(m−1))
),
dengan x(m−1) adalah nilai pendekatan dari x setelah iterasi ke-(m−1).
Dengan cara yang sama untuk persamaan U = O, rumus iterasinya
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
307 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
adalah:
b(m) = b(m−1) −[U′
(m−1)]−1
U(m−1) (5.31)
dengan U(m−1) adalah vektor U yang dinilai pada β = b(m−1) dan
U′(m−1)
=
(∂2l
∂βj∂βk
)(m−1)
(5.32)
adalah matriks turunan kedua dari fungsi likelihood l yang dinilai
pada β = b(m−1). Pada prakteknya digunakan metode alternatif dise-
but metode skoring. Dalam metode skoring ini matriks persamaan
(5.32) diganti dengan suatu matriks nilai harapan
E
(∂2l
∂βj ∂βk
).
Matriks di atas sama dengan negatif dari mariks ragam - koragam atau
matriks informasidari Uj’s, I = E[UUT ] dengan unsur ke − (j, k)
adalah
Ijk = E
(∂l
∂βj
∂l
∂βk
),
= −E(
∂2l
∂βj ∂βk
)(5.33)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
308 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
untuk j, k = 1, 2, 3, · · · , p (lihat [11, Lampiran A] dan [32, hal.341]).
Oleh karena itu persamaan (5.31) menjadi
b(m) = b(m−1) + [I(m−1)]−1U(m−1).
Dengan mengalikan (perkalian kiri) kedua ruas dengan I(m−1) akan
menghasilkan
I(m−1)b(m) = I(m−1)b(m−1) + U(m−1). (5.34)
Dari persamaan (5.30) dan persamaan (5.33) dan mengetahui bahwa
E[Yi− µi]2 = Var[Yi], dapat dilihat bahwa unsur (j, k) dari I adalah
Ijk =n∑i=1
xijxikVar[Yi]
(∂µi∂ηi
)2
. (5.35)
Persamaan persamaan (5.35) menunjukkan bahwa I dapat dinyatakan
sebagai
I = XTW,
dengan W adalah matriks diagonal N ×N dengan unsur-unsur:
wii =1
Var[Yi]
(∂µi∂ηi
)2
. (5.36)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
309 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dengan menggunakan “bobot” yang sama, matriks W, per-
samaan (5.30) dapat dinyatakan dalam bentuk matriks seperti
∂l
∂β= XTW
(∂η
∂µ
)(y − µ) (5.37)
dengan
(∂η
∂µ
)is suatu matriks diagonal N×N dengan unsur diagonal
ke-i adalah
(∂ηi∂µi
).
Oleh karena itu bentuk umum dari persamaan penduga dengan
menggunakan iterasi Newton Raphson adalah
b(m) = b(m−1) + XTWX−1
XTW
(∂η
∂µ
)(5.38a)
atau dalam bentuknya yang asli
b(m) =b(m−1) +
(XT
(∂µ
∂η
)(1
var(Y)
)(∂µ
∂η
)TX
)−1(
XT
(1
var(Y)
)(∂µ
∂η
)(Y − µ)
)(5.38b)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
310 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Dapat ditunjukkan bahwa persamaan (5.38) identik dengan (5.21)
sehingga dikatakan penduga maksimum likelihood untuk GLM identik
dengan metode kuadrat terkecil terbobot.
Ada bentuk lain yang juga biasa dipakai dalam merumuskan
bentuk iterasi Newton-Raphson untuk GLM yang dapat diturunkan
seperti berikut ini. Berdasar persamaan (5.30) dan persamaan (5.35)
dapat diunjukkan bahwa ruas kanan dari persamaan persamaan (5.34)
adalah suatu vektor dengan unsur-unsur berbentuk:
p∑k=1
n∑i=1
xijxikVar[Yi]
(∂µi∂ηi
)2
b(m−1)k +
n∑i=1
(yi − µi)xijVar[Yi]
(∂µi∂ηi
).
yang sama dengan
n∑i=1
p∑k=1
xijwiixikb(m−1)k +
n∑i=1
xijwii(yi − µi)(∂µi∂ηi
)−1.
Ini berarti bahwa id dapat dinyatakan sebagai XTWz dengan unsur-
unsur vektor z adalah berbentuk:
zi =
p∑k=1
xikb(m−1)k + (yi − µi)
(∂µi∂ηi
)−1,
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
311 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dimana i = 1, 2, 3, · · · , N , dan, µi dan ∂µi/ ∂ηi dinilsi pada β = b(m−1).
Persamaan persamaan (5.34) menjadi
XTWXb(m)
= XTWz. (5.39)
Selanjutnya β diambil sama dengan b(m) untuk m yang terakhir. Per-
samaan (5.39) menunjukkan bahwa penduga likelihood maksimum
ekuivalen dengan penduga kuadrat terkecil terbobot [11, hal. 41].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
312 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.4. Inferensi pada Model Linier Tergeneralisir
Jika penduga θ konsisten, maka dia juga secara asimptotik tak
bias, yaitu
limN→∞
E[θ] = θ.
Hal- hal berikut merupakan konsekuensi.
(i) Untuk N besar, berdasar Teorema limit pusat:
θ − θ√Var[θ]
≈ N(0, 1).
(ii) Sama dengan(i),
(θ − θ)2
Var[θ]≈ χ2
1.
Dalam bentuk matriks dapat dinyatakan sebagai
(θ − θ)TV−(θ − θ) ≈ χ2q. (5.40)
Dengan q adalah rank matriks V, dan V− adalah:
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
313 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
– invers tergeneralisir dari matriks ragam - koragam V
jika V singular, atau
– invers dari matriks ragam - koragam V jika V adalah non-
singular.
Untuk MLT dengan p parameter dan skore terhadap βj = U ,
maka kita memiliki:
Uj =∂l
∂βjj = 1, 2, 3, · · · , p,
E[Uj] = 0 [lihat persamaan (5.5)],
dengan matriks ragam - koragam I=E[UUT]. Jadi analog dengan
persamaan (5.40) setidaknya secara asimtotik:
U ∼ N(0,I) or UTI−1U ∼ χ2p, (5.41)
dengan asumsi I adalah nonsingular Dobson [11].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
314 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.4.1. Distribusi dari Penduga Likelihood Maksimum
Pendekatan Taylor tingkat ke-n untuk fungsi f pada x = a adalah:
f(x) = f(a) + f ′(a)(x− a) +1
2f ′′(a)(x− a)2 + · · ·+ 1
n!fn(a)(x− a)n.
Dengan mengambil pendekatan Taylor tingkat pertama pada fungsi
skor U(β) pada β = b (sebagai penduga), kita peroleh:
U(β) ≈ U(b) +H(b)(β − b), (5.42)
dengan
U(b) =
U1
U2
...
Up
=
∂l∂β1∂l∂β2...∂l∂βp
βj=bj
,
and
H(b) =
∂2l∂β2
1
∂2l∂β1∂β2
· · · ∂2l∂β1∂βp
∂2l∂β2∂β1
∂2l∂β2
2· · · ∂2l
∂β2∂βp...
.... . .
...∂2l
∂βp∂β1∂2l
∂βp∂β2· · · ∂2l
∂β2p
βj=bj
.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
315 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Secara asimptotik H = E[H]. Berdasar persamaan (5.33) maka−I=E[H](Dobson
[11]. Oleh karena itu persamaan (5.42) menjadi:
U(β) ≈ U(b)− I(β − b). (5.43)
Tetapi, b adalah maksimum dari l, akibatnya U(b)=0. Oleh
karena itu persamaan (5.43) menjadi
U(β) ≈ −I(β − b)
dan
b− β ≈ I−1U(β). (5.44)
Dengan mengambil nilai harapan dari kedua ruas persamaan (5.44),
lalu menerapkan bahwa E[U]=0, dapat disimpilkan bahwa E[b] = β.
Akibatnya secara asimtotik b adalah takbias. Lebih lanjut, matriks
ragam - koragam dari b − β (sebut saja, V ) dapat dihitung sebagai
berikut:
E[(b− β)(b− β)T] = E[I−1U(I−1U)T ],
= E[I−1UUTI−1],
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
316 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Karena I adalah konstan dan simetrik, maka
E[(b− β)(b− β)T] = I−1E[UUT ]I−1
= I−1II−1 = I−1. (5.45)
Oleh karena itu
(b− β)TI(b− β) ≈ χ2p. (5.46)
Statistik persamaan (5.46) disebut statistik Wald. Statistik ini ekuiv-
alen dengan (b− β) ∼ N(0, I−1), yang membawa konsekuensi bahwa,
secara asimtotik, untuk N besar:
(i) standar kesalahan (s.k.) dari penduga masing-masing bj adalah
s.k.(bj) =√vjj,
dengan vjj adalah unsur ke-(j, j) dari I−1;
(ii) interval keyakinan dua sisi (1− α)× 100% untuk βj adalah
bj ± zα/2√vjj,
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
317 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dalam prakteknya, jika N kecil digunakan pendekatan distribusi
t, yaitu
bj ± tN−p,α/2√vjj;
dengan p menunjukkann banyaknya parameter βj yang akan
diduga.
(iii) korelasi antara penduga adalah:
corr(bjbk) =vjk√vjj√vkk
.
5.4.2. Kecocokan Model
Kecocokan model ditentukan dengan membandingkan model yang di-
ajukan dengan model lengkap atau model maksimal maximal model/
saturated model. Model maksimal didefinisikan sebagai:
(i) GLM/LMT yang mempunyai distribusi yang sama dengan mo-
del yang diajukan;
(ii) model menggunakan fungsi link yang sama dengan model yang
diajukan; dan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
318 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(iii) model yang mempunyai jumlah parameter sama dengan banyak-
nya pengamatan. Dengan kata lain “ia menyediakan informasi
lengkap dari data” (Lihat Dobson [11, hal. 56]).
Untuk menguji kecocokan model, dipergunakan statistik perbandin-
gan likelihood:
λ =L(bmax; y)
L(b; y),
atau
log λ = l(bmax; y)− l(b; y). (5.47)
Distribusi dari persamaan (5.47) dapat diturunkan dengan menggu-
nakan pendekatan Taylor ordo dua dari likelihood l ada titik penduga
β = b.
l(β; y) = l(b; y) + (β − b)U(b) + 12(β − b)TH(b)(β − b). (5.48)
Dengan argumen analog dengan persamaan (5.43), persamaan
(5.48) dapat disederhanakan menjadi:
l(b; y)− l(β; y) =1
2(b− β)TI(b− β). (5.49)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
319 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Ini berarti
2[l(b; y)− l(β; y)] ≈ χ2p, (5.50)
dengan syarat I matriks dengan rank penuh atau matriks nonsingular.
notasi χ2p menunjukkan sebaran chi-kuadrat dengan derajat kebebasan
p.
Devian dan Distribusinya
Statistik pada persamaan (5.47) dapat dimodifikasi dengan cara ber-
ikut sehingga pendekatan distribusinya dapat dikenali.
D = 2 log λ = 2[l(bmax; y)− l(b; y)]. (5.51)
D disebut devian (the deviance). Persamaan persamaan (5.51) dapat
disusun lagi menjadi:
D = 2[l(bmax; y)− l(βmax; y) (5.52a)
−(l(b; y)− l(β; y)) (5.52b)
+(l(βmax; y)− l(β; y))]. (5.52c)
Berdasar persamaan (5.50), bagian pertama dari ruas kanan,
persamaan, (5.52a) berdistribusi χ2n karena memiliki N parameter.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
320 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Bagian ketiga, (5.52c) mendekati 0 jika model yang ditentukan dengan
jumlah parameter p sama baiknya dengan model maksimal. Bagian
kedua, berdistribusi χ2p. Oleh karena itu jika bagian pertama saling
bebas dengan bagian kedua, D mendekati berdistribusi χ2N−p (lihat
juga [16, page 154]). Statistik persamaan (5.51) dapat juga diper-
gunakan untuk menguji apakah suatu model sama baiknya dengan
model yang lainnya (yang memiliki parameter berbeda, lihat [11, hal.
60-64]). Misalnya, untuk menentukan apakah model dengan jumlah
parameter p secara signifikan lebih baik dari model dengan jumlah
parameter q (dengan q < p), kita menggunakan statistik berikut:
4D = Dq −Dp (5.53a)
= 2[l(bmax; y)− l(bq; y)] (5.53b)
− 2[l(bmax; y)− l(bp; y)] (5.53c)
= 2[l(bp; y)− l(bq; y)]. (5.53d)
Berdasar persamaan (5.51) bagian pertama dari persamaan (5.53b)
adalah ∼ χ2N−q dan bagian kedua, (5.53c) adalah∼ χ2
N−p. Oleh karena
itu sepanjang kedua bagian ini saling bebas, maka persamaan (5.53d)
adalah ∼ χ2p−q.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
321 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Cara lain untuk memeriksa kecocokan model dan assumsinya
adalah dengan menggunakan kriteria AIC (seperti pada persamaan
(4.1)) dan analisis grafik dari sisa/residu. Penggunaan dari kedua
teknik ini telah diilustrasikan pada bab sebelumnya. Uraian detil da-
pat dilihat pada Dobson [11, Bab 5] dan Neter et al. [31, Bab 2 ].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
322 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.5. Model Logit, Probit dan Log-linier
Secara matematis, GLM menggabungkan analisis untuk beberapa je-
nis distribusi (diantaranya Normal, Binomial dan Poisson). Model
Linier dengan distribusi Binomial dan fungsi fungsi hubungan probit
dan logit biasa disebut regresi logistik atau lebih spesifik regresi pro-
bit dan logit. Yang termasuk dalam regresi ini adalah regresi biner
(dengan respon Y hanya dua kategori, misalnya 0-1, lulus-tidak lulus,
sukses(S)-gagal(G) dan sebagainya; atau respon dengan k kategori).
Untuk respon biner yang diukur adalah rasio peluang sukses dan tidak
sukses, yang biasa disebut odd. Log odd ini dianggap bergantung se-
cara linier pada beberapa veriabel penjelas.
logit(Yi = S) = log
(P (Yi = S)
P (Yi = G)
)=
p∑j=0
βjXij
atau
Probit(Yi = S) = Φ−1 (Yi = S) =
p∑j=0
βjXij
Odd =p
1− p
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
323 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Ada dua jenis data utama yang dapat dianalissi dengan model
logit yaitu data yang berasal dari tabel kontingensi dan dari data
yang langsung memiliki respon biner. Karena pada dasarya model
logit menggunakan data dalam bentuk persen, maka harus diketahui
dengan jelas jumlah sukses dan gagal pada tiap-tiap kelompok, ter-
utama jika jumlah subjek tiap-tiap kelompok tidak sama. (Lihat mo-
del Tabel 5.32).
Apabila respon bukan merupakan respon biner, tetapi meru-
pakan respon hasil pencacahan (count data), dengan jumlah maksi-
mum yang tidak bisa ditentukan, maka distribusi yang paling cocok
dengan respon ini adalah distribusi Poisson dengan fungsi hubungan
log. Model ini lebih dikenal dengan model atau regresi Log-linier.
2Banyaknya Total maupun G tidak perlu ditulis eksplisit dalam tabel jika total
masing-masing kelompok sama
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
324 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 5.3: Jumlah Sukses(S) dan Gagal dalam Berbagai Kelompok
FaktorPerlakuan
Faktor Kategori (Biner) P1 ... PkF1 S n11 ... n1p
Total N11 ... N1p
F2 S n21 ... n2p
Total N21 ... N2p
F3 S n31 ... n3p
Total N31 ... N3p
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
325 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.6. dispersi berlebih
Sebagaimana telah dibahas sebelumnya bahwa sebaran anggota kelu-
arga eksponensial memiliki fungsi variansi yang menggambarkan ke-
wajaran hubungan antara rerata dengan variansinya. Sebagai contoh
(i) untuk sebaran Poisson, secara umum besarnya rerata dan vari-
ansi dari sebaran Poisson adalah sama, sedangkan (ii) untuk sebaran
Binomial, besarnya variansi dinyatakan dengan np(1− p). Sering ter-
jadi kita menghadapi data dengan besarnya dispersi jauh melebihi
besarnya rerata. Kondisi ini disebut dispersi berlebih overdispersion.
Salah satu indikasi adanya dispersi berlebih ini adalah besarnya sisaan
deviansi jauh melebihi besarnya derajat kebebasannya [8].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
326 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.7. Ilustrasi GLM dengan R
Analisis GLM pada R dapat dimanfaatkan melalui dua cara yaitu lang-
sung memanggil fungsi glm() atau melalui menu dengan memanggil
paket RCommander. Pemeriksaan asumsi dapat dilihat dari grafik
diagnostik mendasar sedangkan pemilihan model terbaik dapat di-
lakukan dengan memeriksa nilai AIC dari model yang dicoba.
Pengaktifan menu glm pada RCommander dilakukan dengan
statistics => models => Generalized Linear Model
Sedangkan dengan menggunakan skrip, fungsi glm() dapat di-
pangil dengan mengunakan format berikut:
glm(formula, family = (link=), data, x = FALSE,
y = TRUE, contrasts =, ...)
1. formula. Seperti umumnya pada model linier, formula berben-
tuk y x1+x2 ....Pada dasarnya penulisan yang berlaku pada
fungsi lm(), misalnya penulisan formula untuk peubah faktor
(kualitatif), juga berlaku pada fungsi glm ().
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
327 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. family. Pilihan family yang tersedia adalah dengan link kanon-
iknya.binomial(link = "logit")
gaussian(link ="identity")
Gamma(link = "inverse")
inverse.gaussian(link = "1/mu^2")
poisson(link = "log")
quasi(link = "identity", variance = "constant")
quasibinomial(link = "logit")
quasipoisson(link = "log")
3. Objek glm. ADa beberapainformasi yang dapat diekstrak terkait
dengan objek yang dihasilkan melalui analisis glm, di antaranya:
(a) coef(objek) untuk mengekstrak koefisien regresi β.
(b) deviance(objek) untuk mengekstrak jumlah kuadrat sisa.
(c) formula(objek) untuk mengekstrak rumusan model yang
dipergunakan
(d) plot(objek) untuk menghasilkan grafik yaitu seperti gra-
fik sisa, grafik fitted value dan beberapa disgnostik.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
328 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(e) print(objek) untuk mencetak hasil singkat analisis.
(f) step(objek) untuk memeriksa model yang paling cocok
dengan cara melihat angka (Akaike’s Information Crite-
rion) yang paling besar.
(g) summary(objek)untuk mencetak lengkap hasil analisis.
Selain itu, objek glm memuat beberapa komponen penting diantara-
nya:
[1] "coefficients" "residuals" "fitted.values"
[4] "effects" "R" "rank"
[7] "qr" "family" "linear.predictors"
[10] "deviance" "aic" "null.deviance"
[13] "iter" "weights" "prior.weights"
[16] "df.residual" "df.null" "y"
[19] "converged" "boundary" "model"
[22] "call" "formula" "terms"
[25] "data" "offset" "control"
[28] "method" "contrasts" "xlevels"
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
329 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Rangkuman distribusi (family) dan link yang dapat dipilih di-
berikan pada Tabel 5.4. Tanda K menunjukkan link kanonik yang
sekaligus merupakan default link dari glm() pada R.
Tabel 5.4: Distribusi dan Link pada R
family(link) binomial Poisson normal Gamma
logit K × × ×probit X × × ×cloglog X × × ×identity × X K Xlog × K X Xinverse × X X K
Keterangan K: fungsi hubungan kanonik; X: fungsi yang dimungkinkan; ×fungsi yang tidak bisa dilakukan.
Regresi logistik, selain dapat diakses melalui fungsi glm() de-
ngan pilihan distribusi dan link yang sesuai, pada R juga dapat diak-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
330 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ses secara khusus melalui fungsi multinom() dan polr() pada paket
MASS (Lihat Venable & Ripley [47]). Ketiga metode cara mengakses
regresi logistik ini telah juga diakomodasi dalam menu RCommander
untuk R versi 2.1 ke atas.
5.7.1. Data dengan Sebaran Binomial
Analisis model linier tergereralisir dengan sebaran Binomial dapat di-
lakukan dengan dua macam pendekatan, yaitu
1. Data dalam bentuk tabel kontingensi yang menunjukkan ba-
nyaknya subjek dalam Sukses dan Gagal.
2. Data dengan respon yang langsung terkategori Sukses atau Ga-
gal.
Contoh 5.1. Berikut adalah contoh data fiktif yang dimodifikasi dari
Venables & Ripley [47]. Ada tujuh perlakuan yang dibedakan un-
tuk jenis kelamin laki-laki dan perempuan. Tiap tiap kelompok ada
30 subjek. Jumlah yang dicatat adalah jumlah subjek yang dinya-
takan lulus dari masing-masing kelompok. Data asli diberikan pada
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
331 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 5.5, sedangkan format data yang akan dianalisis dengan R di-
berikan dalam Tabel 5.6. Walaupun data yang tercatat merupakan
hasil pencacahan jumlah yang sukses, tetapi hasil pencacahan ini lebih
menggambarkan relatif terhadap jumlah individu dalam kelompok
yang berhingga dan diketahui. Oleh karena itu secara tidak langsung
data ini menggambarkan persentase keberhasilan dalam tiap kelom-
pok.
Tabel 5.5: Jumlah Kelulusan dalam Berbagai Kelompok Perlakuan
Perlakuan
J. Kelamin P1 P2 P3 P4 P5 P6 P7 P8
L 1 4 9 13 18 20 24 27
P 0 2 6 10 12 16 18 20
Jumlah peserta masing-masing kelompok adalah 30.
Selanjutnya data kelulusan dan kegagalan dikelompokkan men-
jadi 1 matriks respon berordo 16× 2 (cbind(Lulus, Gagal). Analisis
data selanjutnya dilakukan denganresp<-cbind(Lulus, Gagal)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
332 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 5.6: Format Data R Jumlah Kelulusan dan Kegagalan
J. Kelamin Perlakuan Lulus Gagal
L P1 1 29
L P2 4 26
L P3 9 21
... ... ... ...
L P8 27 3
P P1 0 30
P P2 2 8
... ... ... ...
P P8 20 10
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
333 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
logit1<-glm(resp~J.Kelamin*Perlakuan, family=binomial)
summary(logit1)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.07944 0.41892 -7.351 1.97e-13 ***
J.Kelamin[T.P] -0.13465 0.60694 -0.222 0.824
Perlakuan 0.66177 0.08431 7.850 4.17e-15 ***
J.Kelamin[T.P]:Perl -0.13109 0.11526 -1.137 0.255
---
Significant code `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 170.5715 on 15 degrees of freedom
Residual deviance: 9.3193 on 12 degrees of freedom
AIC: 68.881
Sepintas tidak begitu nampak signifikan adanya pengaruh je-
nis kelamin, tetapi ada baiknya jika grafik diagram pencar dipisahkan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
334 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
antara L dan P. Grafik diagram pencar prediksi dengan data asli dibe-
rikan pada Gambar 5.4. Dari diagram pencar masih dapat dibedakan
antara respon untuk kelompok L dan P pada berbagai kelompok per-
lakuan. Dari grafik tersebut dapat diperkirakan prosentase keberhasi-
lan pada perlakuan P5 adalah sekitar 36% untuk kelompok P dan
sekitar 56% untuk kelompok L. Pada analisis ini tidak ada indikasi
dispersi berlebih karena besarnya Residual devians= 9,13 lebih ke-
cil dari derajat kebebasdannya (12).
Ada kalanya kita dihadapkan pada data yang setiap subjeknya
sudah dikategorikan sebagai kondisi Sukses atau Gagal. Misalnya
muncul tidaknya gejala suatu penyakit pada individu. Dalam jenis
data ini respon sudah dalam kategori biner, misalnya Sukses atau Ga-
gal, ada atau tidak tidak ada gejala. Berikut adalah Contoh dari
data klasik yang ada pada R yaitu kyphosis. Data ini berisi tentang
muncul tidaknya penyakit kyphosis pada anak yang pernah mengalami
operasi. Untuk mengaktifkan data tersebut dapat dilakukan perintah
berikut:library(gam)
data(kyphosis)
print(summary(kyphosis))
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
335 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1 2 3 4 5 6 7 8
0.2
0.4
0.6
0.8
Prediksi dengan Logit
Perlakuan
Pro
b
L
L
L
L
L
L
L
L
P
P
P
P
P
P
P
P
Gambar 5.4: Diagram Pencar Prediksi dan Data Asli Peluang Keber-
hasilan Berbagai Kelompok
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
336 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Ringkasan data tersebut menunjukkan ada empat peubah satu
diantaranya merupakan kategori biner. Kita dapat memeriksa apakah
muncul tidaknya penyakit kyphosis ada hubungannya dengan peubah
yang lainnya (Age, Number dan Start).Hal ini dapat dilakukan melalui
GLM dengan memilih sebaran Binomial.
Kyphosis Age Number Start
absent :64 Min. : 1.00 Min. : 2.000 Min. : 1.00
present:17 1st Qu.: 26.00 1st Qu.: 3.000 1st Qu.: 9.00
Median : 87.00 Median : 4.000 Median :13.00
Mean : 83.65 Mean : 4.049 Mean :11.49
3rd Qu.:130.00 3rd Qu.: 5.000 3rd Qu.:16.00
Max. :206.00 Max. :10.000 Max. :18.00
call:
glm(formula = Kyphosis ~ Age + Number + Start, family = binomial(logit),
data = kyphosis)
Deviance Residuals:Min 1Q Median 3Q Max
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
337 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
-2.3124 -0.5484 -0.3632 -0.1659 2.1613
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.036934 1.449575 -1.405 0.15996
Age 0.010930 0.006446 1.696 0.08996 .
Number 0.410601 0.224861 1.826 0.06785 .
Start -0.206510 0.067699 -3.050 0.00229 **
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 83.234 on 80 degrees of freedom
Residual deviance: 61.380 on 77 degrees of freedom
AIC: 69.38
Number of Fisher Scoring iterations: 5
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
338 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Data dengan sebaran Poisson
Contoh 5.2. Contoh berikut diambil dari data warpbreaks pada
database R. Data ini adalah tentang banyaknya kerusakan yang ter-
jadi pada dua jenis wool (A dan B) yang diberi tiga macam tekanan
(rendah menengah dan tinggi). Karena data merupakan hasil pen-
cacahan maka distribusi yang paling cocok adalah Poisson dengan pi-
lihan alternatif fungsi hubungan log atau identitas (linier). Kita akan
mencoba kedua model dan memeriksa mana yang lebih baik dengan
menggunakan kriteria AIC.
Dengan model ini semua koefisien regresi signifikan yang berarti
ada beda signifikan dari jumlah kerusakan dilihat baik dari jenis wool
maupun tingkat tekanan. Model ini mempunyai nilai AIC 497,36
glm(formula = breaks ~ wool + tension,
family = poisson(link = identity), data = warpbreaks)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.8266 -1.5822 -0.4776 1.1656 4.5603
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
339 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 38.440 1.600 24.025 < 2e-16 ***
woolB -4.877 1.413 -3.452 0.000557 ***
tensionM -9.173 1.863 -4.925 8.44e-07 ***
tensionH -14.385 1.783 -8.070 7.03e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 297.37 on 53 degrees of freedom
Residual deviance: 214.70 on 50 degrees of freedom
AIC: 497.36
Distribusi Poisson dengan hubungan log
Model ini juga menunjukkan beda signifikan antara jumlah kerusakan
dilihat dari jenis wool dan tingkattekanan, tetapi model ini memi-
liki AIC yang sedikit lebih rendah 493,06. Ini berarti model dengan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
340 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
hubungan log sedikit lebih baik dari pada model dengan hubungan
identitas.
glm(formula = breaks ~ wool + tension,
family = poisson(link = log), data = warpbreaks)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.6871 -1.6503 -0.4269 1.1902 4.2616
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.69196 0.04541 81.302 < 2e-16 ***
woolB -0.20599 0.05157 -3.994 6.49e-05 ***
tensionM -0.32132 0.06027 -5.332 9.73e-08 ***
tensionH -0.51849 0.06396 -8.107 5.21e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
341 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Null deviance: 297.37 on 53 degrees of freedomResidual deviance: 210.39 on 50 degrees of freedom
AIC: 493.06
Contoh 5.3. Data berikut diambil dari data kyphosis dari data base
R pada paket gam tentang hasil operasi anak terkait dengan muncul
tidaknya penyakit paska operasi yang disebut khyposis. Data ini
merekam muncul tidaknya penyakit yang tersebut, dihubungkan de-
ngan usia anak (Age) dalam bulan, tingkat operasi mulai (Start) Lihat
Chamber & Hastie[5].
Respon muncul tidaknya Khyposis merupakan data biner yang
berdistribusi binomial. Kita dapat menggunakan Khyposis sebagai
respon dan variabel lainnya sebagai veriabel penjelas dengan menggu-
nakan fungsi hubungan logit. Kita dapat mulai dengan model yang
agak lengkap dan selanjutnya memerintahkan R untuk menghitung
model terbaik dengan kriteria AIC.
glm(formula = Kyphosis ~ Age + Number + Start,
family = binomial(link = logit), data = kyphosis)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
342 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Coefficients:Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.036934 1.449575 -1.405 0.15996
Age 0.010930 0.006446 1.696 0.08996 .
Number 0.410601 0.224861 1.826 0.06785 .
Start -0.206510 0.067699 -3.050 0.00229 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 83.234 on 80 degrees of freedom
Residual deviance: 61.380 on 77 degrees of freedom
AIC: 69.38
Model ini memiliki AIC 69,38 tetapi dari koefisien regresinya
terlihat hanya ada satu koefisienyang signifikan. Untuk itu kita akan
lakukan penelusuran alternatif model dengan menggunakan perintah
step(). Ternyata dari segi nilai AIC, alternatif model- model yang
lain tidak menyebabkan adanya oenurunan AIC yang berarti dan di-
anggap model lengkap ini sudah cukup baik.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
343 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.7.2. Prediksi pada GLM
Setelah model yang dianggap baik diperoleh, selanjutnya model terse-
but dapat dipakai untuk mempredikasi baik nilai link (kombinasi li-
nier) maupun responnya.
predict(object, newdata = NULL,
type = c("link", "response", "terms"),
se.fit = FALSE, dispersion = NULL, terms = NULL,
na.action = na.pass, ...)
Tipe yang merupakan default adalah ”link”, yaitu R menghi-
tung hasil kombinasi linier∑xijβj. Pada contoh di atas diperoleh
βj masing-masing adalah (-2,036934, 0,010930; 0.410601;-0,206510),
sehingga untuk x1 = 70, x2 = 3, x3 = 10 diperoleh η = −2, 105097.
Untuk prediksi respon yang ditafsirkan sebagai peluang munculnya
kyphosis ketika Age=70, Number=3, Start=10, diperoleh dengan memilih
type=”response” yang menghasilkan 0,1086024.
> predict(glm2,data.frame(Age=70,Number=3,Start=10)
[1] -2.105097
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
344 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
> predict(glm2,data.frame(Age=70,Number=3,Start=10),type="link")
[1] -2.105097
> predict(glm2,data.frame(Age=70,Number=3,Start=10),
type="response")
[1] 0.1086024
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
345 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.8. Ringkasan
1. Distribusi/ Sebaran keluarga eksponensial menggabungkan dis-
tribusi - distribusi yang telah banyak dikenal (misalnya Binom-
ial, Poisson, Normal, Gamma) menjadi satu kesatuan distribusi.
2. Masing-masing sebaran anggota keluarga eksponensial memiliki
ciri khas dilihat dari ruang rentang (diskrit kontinu, terbatas tak
terbatas), dan hubungan nilai-tengah dengan ragamnya (bebas,
linier atau kuadratik).
3. Ada tida komponen penting model linier tergeneralisir yaitu: (i)
komponen respon dengan sebaranpada anggota keluarga ekspo-
nensial, (ii) ada komponen kombinasi linier antara peubah pen-
jelas dengan parameter regresi, dan (iii) ada fungsi (kontinu dan
diferensiabel) yang menghubungkan antara nilai tengah dengan
kombinasi linier tadi.
4. Beberapa bentuk khusus regresi yang termasuk model linierter-
generalisir diantaranya adalah regresi logistik (logit, probit de-
ngan respon bersebaran Binomial), regresi log-linier (dengan re-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
346 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
spon bersebaran Poisson).
5. Pemilihan model terbaik dapat dilakukan dengan melihat nilai
AIC.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
347 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.9. Bacaan Lebih Lanjut
Referensi yang biasa dijadikan acuan utama mempelajari model linier
tergeneralisir ini adalah McCullagh dan Nelder [24], sedangkan seba-
gai pemula dapat menggunakan pengantar yang ditulis oleh Dobson
[11]. Khusus hubungannya dengan paket Splus atau R dapat dibaca
referensi Chamber & Hastie [5], Ripley & Venables [47]
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
348 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
5.10. Latihan Soal-soal
1. Tuliskan bentuk umum sebaran keluarga eksponensial. Jelaskan
kaitannya dengan beberapa bentuk khusus seperti Binomial, Pois-
son, Normal dan Gamma.
2. Sebutkan ciri-ciri khas dari sebaran Binomial,Poisson, Normal
dan Gamma dilihat dari ruang rentang, fungsi ragam dan link
kanonik.
3. Jelaskan manfaatdan fungsi dari fungsi link pada model linier
tergeneralisir (kaitkan dengan skala peubah penjelas dan peubah
respon).
4. Jelaskan apa yang dimaksud dengan regresi logistik dan log-
linier.
5. Suatu data dianalisis dengan model linier tergeneralisir dengan
sebaran Poisson dan fungsi link log. Dari hasil analisi diperoleh
β0, β1 dan β2. Tuliskan bentuk model (persamaan regresi) yang
diperoleh.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
349 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
BAB 6
MODEL UNTUK RESPON TIDAK SALING
BEBAS
Pada Bab 5 telah didiskusikan perluasan model linier untuk data
yang berdistribusi Keluarga Eksponensial dimana distribusi Normal
merupakan salah satu bentuk khususnya. Dalam perluasan tersebut
distribusi galat (error) masih saling bebas, hanya saja tidak harus
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
350 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
berdistribusi Normal. Dalam eksperimen yang melibatkan penguku-
ran berulang (repeated measurement) atau pengamatan waktu pan-
jang (longitudinal) umumnya respon yang dihasilkan adalah berupa
vektor data yang kemungkinan besar tidak saling bebas. Ada bebe-
rapa kondisi eksperimen yang menghasilkan data yang tidak saling
bebas diantaranya seperti berikut ini.
1. subjek penelitian mendapat beberapa perlakuan yang berbeda
atau memiliki beberapa respon yang berbeda, misalnya: (i) sub-
jek (sekelompok siswa) diberi beberapa tes (ujian) yang berbeda
dan skor untuk semua ujian dipeljari secara simultan; (ii) je-
nis benih tertentu diberi berbagai tingkat pemupukan atau per-
lakuan lainnya.
2. subjek diberi satu perlakuan tetapi respon diamati pada inter-
val waktu berbeda, misalnya respon terhadap suatu perlakuan
diamati setiap 6 jam selama 24 jam;
Respon yang dihasilkan dapat berupa: (i) hasil pengukuran yang
biasanya bersekala interval seperti skor tes, produksi pertanian; (ii)
hasil pencacahan (misalnya banyaknya salah sambung pada hubungan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
351 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tilpun, banyaknya kejadian pada tempat dan interval waktu tertentu)
atau (iii) berupa respon biner (misalnya banyaknya prosentase sukses
pada setiap interval waktu tertentu).
Ada dua pendekatan yang dipergunakan untuk menganalisis data
sejenis ini. Kedua pendekatan ini relatif baru yang diperkenalkan
satu-dua dekade lalu. Pendekatan pertama adalah model marjinal
yang diperkenalkan oleh Liang & Zeger tahun 1986, yang lebih dike-
nal dengan pendekatan GEE (Generalized Estimating Equation). Pen-
dekatan ini tidak didasarkan atas bentuk likelihood lengkap dari re-
spon, tetapi hanya berdasarkan hubungan antara nilai-tengah (momen
pertama) dan ragamnya (momen kedua) serta bentuk matriks kore-
lasinya. Pendekatan kedua adalah pendekatan Model Linier Tergen-
eralisir Hirarkis yang dipelopori oleh Lee & Nelder tahun 1996. Model
ini selain menggunakan likelihood lengkap, juga menggabungkan pen-
dekatan multiplikatif dan pendekatan aditif.
Walau sudah diperkenalkan dua dekade lalu, pendekatan GEE
belum banyak diimplemantasikan pada paket komputer. R sebagai
open source termasuk salah satu diantara sedikit paket yang telah
mengimplementasikannya. Ada dua paket fungsi yang mengimple-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
352 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
mentasikan GEE pada R yaitu gee dan geePackages. Namun kedua
paket fungsi ini belum bisa diakses melalui menu. Dalam bab ini akan
dibahas perluasan model (regresi) linier untuk data yang mungkin se-
lain tidak berdistribusi Normal juga tidak saling bebas.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
353 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kompetensi
Setelah menyimak materi pada bab ini, pembaca diharapkan:
1. dapat membedakan data dengan respon saling bebas dan data
dengan respon tidak saling bebas;
2. dapat menjelaskan beda dan generalisasi dari model linier klasik,
tergeneralisir (GLM), dan GEE;
3. dapat menganaisis dan menginterpretasikan hasil menggunakan
GEE
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
354 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Materi
1. Model marjinal
2. Quasi-likelihood dan GEE
3. Generalisasi dan bentuk GEE
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
355 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.1. Model Marjinal
Perhatikan bahwa model linier mempunyai bentuk umum yang telah
diuraikan pada bab sebelumnnya yaitu:
Y = Xβ + ε (6.1)
Dalam perkembangannya di lapangan, ada kemungkinan baik ε mau-
pun Y tidak lagi berdistribusi normal. Apabila data yang tidak berdis-
tribusi normal ini masih saling bebas, maka model linier yang mem-
pelajari hubungan peubah untuk jenis data ini disebut model linier
tergeneralisir (Generalized Linear Models, untuk selanjutnya disingkat
GLM). Pembahasan tentang GLM telah dibahas pada Bab 5.1 dan
Bab 5. Referensi yang membahas secara komprehensif tentang GLM
diberikan oleh McCullagh & Nelder [24]. Jika Yi tidak berdistribusi
normal, maka pada persamaan di atas terjadi perubahan asumsi yaitu:
1. hubungan yang ada antara ekspektasi/rataan dan prediktor li-
nier adalah
g(µ) = η
dengan g(.) adalah fungsi monoton dan diferensiabel yang dise-
but fungsi link;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
356 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. sedangkan ragamnya menjadi
V ar(Y ) = ψv(µ),
dengan ψ adalah parameter skala yang bukan menjadi perhatian
utama sehingga sering diasumsikan diketahui. Fungsi v() dise-
but fungsi ragam yang bentuk khususnya bergantung pada jenis
distribusinya, misalnya untuk distribusi Poisson, secara umum
berlaku v(µ) = ψµ, yaitu berlaku hubungan linier antara nilai-
tengah dan ragam pada distribusi Poisson.
Apabila data yang tidak berdistribusi normal tersebut juga tidak
saling bebas, dengan kata lain Yi bukanlah respon tunggal tetapi meru-
pakan vektor respon, yi = (Yi1, Yi2, YijYit)T . Diggle et al. [10] men-
guraikan beberapa metode analisis utuk jenis respon ini, salah satu
diantaranya, yang banyak digunakan adalah model marjinal. Dalam
sebuah model marjinal, regresi dari respon terhadap peubah eksplana-
tori dimodelkan secara terpisah dengan korelasi dalam unit/subjeknya.
Dalam regresi tersebut, ekspektasi marjinal E(Yij) dimodel sebagai
fungsi dari peubah bebas atau peubah eksplanatori (X). Ekspektasi
marjinal adalah rata- rata respon dari subpopulasi yang memiliki pe-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
357 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ubah eksplanatori yang sama. Model marjinal secara khusus memiliki
asumsi berikut.
1. Ekspektasi marjinal, E(Yij) = µij, bergantung pada vektor pe-
ubah eksplanatori xij dengan hubungan g(µij) = xijβ, dengan
g(.) adalah fungsi link yang diketahui seperti misalnya logit un-
tuk respon binomial, dan β adalah vektor parameter yang akan
diduga;
2. Ragam marjinal tergantung pada rataan atau ekspektasi marji-
nal menurut hubungan V ar(Yij) = φv(µij), dengan v(.) adalah
fungsi ragam yang diketahui dan φ adalah parameter skala yang
mungkin perlu diduga juga
3. Korelasi antara Yij dan Yik adalah sebuah fungsi dari rataan
marjinal dan mungkin juga parameter - parameter tambahan ,
yaitu Corr(Yij, Yik) = ψ(µij;µik;α) dimana ψ(.) adalah sebuah
fungsi yang disumsikan diketahui (Diggle et al. [10]).
Dalam kedua kasus di atas, menganalisis data asli (dalam ben-
tuk multivariat) dianggap lebih memberikan gambaran yang benar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
358 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Tabel 6.1: Respon Pengukuran berulangPengulangan Variabel Penjelas
No. Subjek T1 T2 ... Tt X ...
1 S1 y11 y12 ... y1t x12 S2 y21 y22 ... y2t x2... ... ... ... ... ... ...
n Sn yn1 yn2 ... ynt xn
dibandingkan dengan menganalis rata-rata respon. Dengan kata lain
menganalisis profil lebih tepat dari pada menganalisis rata-rata. Sub-
jek mungkin memiliki rata-rata saa tetapi profilnya berbeda. Secara
keseluruhan respon Y bukanlah sekedar vektor data tetapi matriks
data. Pada matriks data tersebut yj menunjukkan vektor data untuk
pengamatan ke-j. Sedangkan yijmenunjukkan respon untuk subjek
ke-i pada pengamatan ke-jMasing-masing subjek penelitian memiliki
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
359 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
respon multivariate berupa vektor dengan panjang p.
Y =
y1
T
y2T
· · ·yN
P
=
Y11 Y12 · · · Y1tY21 Y22 · · · Y2t...
.... . .
...
Yn1 Yn2 · · · Ynt
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
360 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.2. Quasi-Likelihood dan Generalized Estimat-
ing Equations (GEE)
Dalam model linier yang peubah responnya masih saling bebas, mes-
kipun tidak berdistribusi normal, fungsi likelihoodnya relatif mudah
dievaluasi dan dimaksimumkan. Metode yang menganalisis data yang
tidak berdistribusi normal tetapi masih saling bebas disebut GLM.
Untuk data yang tidak saling bebas, dengan model marjinal, kita
hanya menentukan bentuk nilai-tengah (sebagai momen pertama) dan
matriks ragam - koragam (sebagai momen kedua). Untuk distribusi
normal, kedua momen ini telah cukup menentukan fungsi likelihood-
nya, namun tidak demikian halnya dengan distribusi lainnya seperti
distribusi binomial, poisson dan gamma, misalnya. Untuk mengetahui
keseluruhan likelihood diperlukan asumsi-asumsi lainnya. Meskipun
dengan asumsi-asumsi tambahan, likelihood seringkali tetap sulit di-
tentukan dan melibatkan banyak paremeter gangguan (nuisance) se-
lain parameter regresi (β) dan parameter korelasi (misalnya,α) yang
harus diduga. Untuk alasan ini, pendekatan yang relatif mudah di-
pahami dan masuk akal dalam mengatasi kesulitan ini adalah dengan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
361 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
menggunakan Generalized Estimating Equations (untuk selanjutnya
disingkat GEE) yang pertama diperkenalkan oleh Liang dan Zeger
(yaitu Liang & Zeger [21], Zeger & Liang [52],[53], Liang et al. [22],
Zeger et al. [54]). GEE merupakan sebuah analogi atau generalisasi
multivariat dari quasi-likelihood untuk respon saling bebas(Diggle,
et al. [10]). Manakala tidak ada fungsi likelihood yang pasti un-
tuk dijadikan acuan, cukup beralasan untuk menduga/ mengestimasi
dengan menyelesaikan sebuah analogi multivariat dari metode quasi-
score yang diperkenalkan Wedderburn [51], yaitu:
S(β) =n∑i=1
(∂µi∂β
)TV ar (Yi)
−1 (Yi − µi) = 0 (6.2)
Karena secara umum berlaku g(µij) = xiβ , maka melalui fungsi
hungungan (link function) akan langsung dapat dicari turunan g(.)
terhadap η dan karenanya persamaan (6.2) dapat dimodifikasi menjadi
S(β) =n∑i=1
XiT
(∂µi∂ηi
)TV ar (Yi)
−1 (Yi − µi) = 0 (6.3)
dimana, Yi,µi dan ηi adalah vektor dan V ar(Yi) merupakan
matrik simetris. Dalam kasus multivariat, ada tambahan komplikasi
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
362 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
seperti Sβ yang sesungguhnya juga tergantung pada parameter β ma-
upun α, karena V ar(Yi) = φV ar(Yi;β;α). Pada bab ini akan diba-
has analisis model linier untuk respon yang tidak saja berdistribusi
tidak normal tetapi juga respon tersebut tidak saling bebas. Respon
seperti ini dihasilkan oleh pengamatan berulang (repeated meassure-
ment/longitudinal data), misalnya pengamatan yang dilakukan pada
tiap interval waktu tertentu. Tentu saja akan lebih baik jika data yang
dihasilkan oleh beberapa pengamatan ini diuji secara serempak, tidak
satu-persatu maupun diwakili oleh rata-ratanya.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
363 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.3. Generalisasi dan Bentuk GEE
Dibandingkan dengan persamaan untuk memperoleh penduga pada
model linier normal (NLM) seperti pada persamaan (3.1) pada hala-
man 154 dan pada model linier tergenaralisasi (GLM), GEE ini men-
galami generalisasi atau perbedaan dalam beberapa hal yaitu:
1. Dalam NLM dan GLM respon Yi, ekspektasi E(Yi) = µi meru-
pakan variabel univariat, sedangkan dalam GEE mereka berupa
vektor yang berhubungan dengan subjek ke-i, sebagai konseku-
ensinya maka model (3.1) harus digeneralisasi dengan memper-
timbangkan jumlah untuk seluruh individu/subjek Y;
2. Dalam NLM, nilai
(∂µi∂ηi
)adalah 1, pada GLM nilainya be-
rantung pada fungsi link g(.); sedangkan dalam GEE, karena
ekspektasi dan prediktor linier dua-duanya merupakan vektor
berukuran t, maka merupakan ia matrik diagonal berukuran t×t
dengan unsur diagonalnya adalah
(∂µij∂ηij
)yang nilainya riilnya
juga masih bergantung pada fungsi link g(.) yang digunakan;
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
364 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
3. Dalam NLM ragam dari respon, var(Yi) = φv(µi) adalah kon-
stan yaitu σ2, dalam GLM dia adalah tidak konstan tetapi berupa
matriks diagonal, sedangkan dalam GEE dia berupa matriks ra-
gam - koragam yang bersifat umum (simetris) yang tidak saja
bergantung pada µ atau β tetapi juga pada φ dan α, yang dapat
dinyatakan dalam bentuk
vi = φ√v(µiR(α)
√v(µi
dengan R(α) adalah matriks korelasi yang diasumsikan, mi-
salnya struktur korelasi seragam yang biasa disebut exchage-
able/uniform, model rangkaian waktu AR-1, dan lain- lain (Ken-
ward & Smith [17]). Dengan demikian secara keseluruhan V ar(Y)
untuk NLM adalah σ2I, untuk GLM adalah matriks diagonal de-
ngan unsur diagonal V ar(Yi), sedangan pada GEE dia adalah
matriks diagonal blok dengan blok ke-i adalah Vi. Untuk struk-
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
365 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tur korelasi seragam bentuknya matriks korelasinya adalah
R =
1 α · · · α
α 1 · · · α...
.... . .
...
α α · · · 1
.
Sedangkan model korelasi AR-1 yang biasa juga disebut model
korelasi serial adalah:
R =
1 α α2 · · · αp−1
α 1 α · · · αp−2
......
.... . .
...
αp−1 αp−2 αp−3 · · · 1
.
Dengan mencari turunan, terhadap β, dari ruas kiri pada per-
samaan (6.3), maka diperoleh persamaan dalam bentuk iterasi
Fisher Scoring, untuk penduga β dapat dinyatakan dengan per-
samaan berikut
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
366 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
b(1) =b(0) +
[n∑i=1
XiT
(∂µi∂ηi
)[var(Yi)]
−1(∂µi∂ηi
)Xi
]−1[
n∑i=1
XiT
(∂µi∂ηi
)[var(Yi)]
−1 (Yi − µi)
](6.4)
Dalam bentuk iterasi seperti persamaan (6.4), maka ragam ”bi-
asa” b, yang biasa disebut ragam naive dapat ditentukan dengan
Vn =
[n∑i=1
XiT
(∂µi∂ηi
)[var(Yi)]
−1(∂µi∂ηi
)Xi
]−1(6.5)
sedangkan ragam yang lebih tegar, biasa disebut sandwich/ ro-bust variance diperoleh dengan menerapkan hukum bahwa untukmatriks konstanta A, maka var(AY ) = ATvar(Y )A dengan
A =
[n∑i=1
XiT
(∂µi∂ηi
)[var(Yi)]
−1(∂µi∂ηi
)Xi
]−1[
n∑i=1
XiT
(∂µi∂ηi
)[var(Yi)]
−1
]
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
367 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Jika perkalian dengan invers dinotasikan dengan ’pecahan’ se-
perti notasi art:KenwardSmith95, maka A dapat dinotasikan de-
ngan:
A =
[n∑i=1
XiT
(∂µi∂ηi
)[var(Yi)]
−1
][
n∑i=1
XiT
(∂µi∂ηi
)[var(Yi)]
−1(∂µi∂ηi
)Xi
]
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
368 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.4. Ilustrasi GEE dengan R
Fasilitas GEE hanya dapat dimanfaatkan melalui skrip dengan men-
gaktifkan paket gee. Format fungsi gee() adalah:
gee(formula, id,
data, subset, na.action,
R = NA, b = NA,
tol = 0.001, maxiter = 25,
family = gaussian, corstr = "independence",
Mv = 1, silent = TRUE, contrasts = NULL,
scale.fix = FALSE, scale.value = 1, v4.4compat = FALSE)
id adalah variabel yang menunjukkan terjadinya pengukuran
berulang. Selain alternatif family dan link seperti pada glm(), de-
ngan gee() juga tersedia beberapa alternatif model korelasi di an-
taranya adalah:
1. "independence" yang berarti kita mengasumsikan respon saling
bebas. Jadi model ini identik dengan model glm()
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
369 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
2. "exchangeable" yang berarti kita mengasumsikan adanya ko-
relasi seragam atau yang lebih dikenal dengan compound sym-
metry,
3. "AR-M" jika kita mengasumsikan model deret waktu Auto Re-
gressive orde M,
4. "unstructured" untuk model korelasi tanpa struktur. Model
ini juga disebut model multivariate penuh.
Contoh 6.1. Pada data warpbreaks apabila dianggap bahwa fak-
tor wool yang sama mendapat tiga macam perlakuan tekanan, atau
faktor wool dianggap sebagai faktor acak, maka data tersebut dapat
dianalisis melalui gee() dengan wool sebagai id. Berikut adalah hasil
yang diperoleh dengan menggunakan model korelasi seragam dan deret
waktu AR-1 dengan distribusi Poisson
Model:
Link: Logarithm
Variance to Mean Relation: Poisson
Correlation Structure: Exchangeable
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
370 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Call:
gee(formula = breaks ~ tension, id = wool, data = warpbreaks,
family = poisson(link = log), corstr = "exchangeable")
Coefficients:
Estimate Naive S.E. Naive z Robust S.E. Robust z
(Intercept)3.5942635 0.09055356 39.692126 0.15869419 22.648992
tensionM -0.3213204 0.12808197 -2.508709 0.22270597 -1.442801
tensionH -0.5184885 0.13619100 -3.807069 0.06441329 -8.049403
Estimated Scale Parameter: 4.601903
Number of Iterations: 1
Koefisien korelasi model di atas adalah r = 0, 02088982. Untuk ko-
relasi dengan asumsi AR-1 diperileh hasil berikut:
Model:
Link: Logarithm
Variance to Mean Relation: Poisson
Correlation Structure: AR-M , M = 1
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
371 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Call:gee(formula = breaks ~ tension, id = wool, data = warpbreaks,
family = poisson(link = log), corstr = "AR-M", Mv = 1)
Summary of Residuals:
Min 1Q Median 3Q Max
-22.415091 -8.095630 -2.695504 6.304496 33.584909
Coefficients:
Estimate Naive S.E. Naive z Robust S.E. Robust z
(Intercept)3.5949833 0.08689454 41.371797 0.15918021 22.584360
tensionM -0.3245601 0.13381637 -2.425414 0.22496947 -1.442685
tensionH -0.5178782 0.14221001 -3.641644 0.06567149 -7.885892
Estimated Scale Parameter: 4.601424
Number of Iterations: 2
Working Correlation
[,1] [,2] [,3] [,4]
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
372 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[1,] 1.000000e+00 4.125981e-02 1.702372e-03 7.023956e-05
[2,] 4.125981e-02 1.000000e+
Contoh 6.2.
Data Orange merupakan data tentang usia dan keliling batang pohon
jeruk untuk berbagai jenis pohon jeruk. Dapat dianggap bahwa satu jenis
pohon jeruk diamati secara berulang untuk tingkat umur yang berbeda.
Dalam konteks model marjinal, jenis pohon menjadi pertimbangan dalam
estimasi hubungan antara usia dan keliling pohon, tetapi tidak secara ek-
splisit masuk kedalam model. Karena pengamatan berulangnya berdasar-
kan waktu, maka model korelasi yang dianggap lebih cocok adalah model
AR-1, bukan seragam.
Model:
Link: Logarithm
Variance to Mean Relation: Gamma
Correlation Structure: AR-M , M = 1
Call:
gee(formula = circumference ~ age, id = Tree, data = Orange,family = Gamma(link = log), corstr = "AR-M", Mv = 1)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
373 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Summary of Residuals:
Min 1Q Median 3Q Max
-55.95909 -3.67571 10.05171 24.64189 69.23206
Coefficients:
Estimate Naive S.E. Naive z Robust S.E. Robust z
(Intercept)3.374827865 0.14418605 23.40606 2.215775e-02 152.3092
age 0.001202957 0.00010245 11.74185 3.813379e-05 31.5457
Estimated Scale Parameter: 0.095224
Correlation parameter = 0.8461830
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
374 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.5. Gamma-HGLM dan Model Lainnya
Pada bagian ini diuraikan secara ringkas bentuk Model Linier Tergeneral-
isir Bertingkat (HGLM=Hierarchical Generalized Linear Model), khususnya
Gamma-HGLM yang menggunakan asumsi distribusi Gamma. Pada bab
ini juga diuraikan hasil-hasil matematika yang dapat diturunkan berkai-
tan dengan estimasi parameter untuk model sekawan (Gamma-Inverse-
Gamma) melalui pendekatan likelihood bersama (joint likelihood) yang bi-
asa juga disebut dengan pendekatan khusus subjek (Subject Specific Model).
Secara khusus model likelihood bersama untuk model sekawan, dalam buku
ini disebut JGIG.
Model yang dibahas termasuk model bertingkat/hierarkis, yaitu Hi-
erarchical Generalized Linear Models dengan distribusi Gamma, yang se-
lanjutnya disebut JGIG. Model ini termasuk perkembangan model terbaru
dari model linier yang mulai diperkenalkan oleh Lee & Nelder [20] (kurang
lebih satu dekade setelah diperkenalkannya GEE). Sampai saat ini, mo-
del ini belum terimplementasi ke dalam paket komputer yang banyak ber-
edar (termasuk R). Program terbatas telah ditulis dan tersedia bagi yang
berminat. Gamma-HGLM yang dibahas baru terbatas pada pendekatan
likelihood bersama yang merupakan akumulasi riset penulis sejak tahun
1999.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
375 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.5.1. Gamma-HGLMs
Model yang dibahas termasuk bagian dari HGLM. Bersama dengan fungsi
hubungan yang dipilih, HGLM, mempersatukan pendekatan model aditif
dan multiplikatif yang sekaligus juga memperluas distribusi efek acak yang
dimungkinkan memiliki distribusi tidak normal. Model ini dapat diang-
gap sebagai pengembangan dari model GLMM (Generalized Linear Mixed
Models, yaitu Model Linier Tergeneralisasi Campuran yang mensyaratkan
efek acak harus berdistribusi normal.
Dalam HGLM, nilai-tengah bersyarat yij |Ui didefinisikan sebagai fungsi
dari efek tetap µi atau β, dan efek acak Ui, yaitu E(yi|Ui) = ψ(µi, Ui). Un-
tuk meminimalkan bias, nilai-tengah efek acak U disyaratkan sedemikian
sehingga nilai-tengah tak bersyarat E(yij) sama dengan µij . Jadi, jika
menggunakan model aditif (misalnya pada GLMM) syaratnya E(yi|Ui) =
µi + ZiUi = µi,yaitu syaratnya E(Ui)=0. Jika menggunakan model multi-
plicatif syaratnya E(yi|Ui) = µiUi = µi, yaitu E(Ui)=1.
Pada model Gamma-HGLM yi|Ui diasumsikan berdistribusi Gamma
sedangkan Ui berdistribusi Inverse-Gamma, untuk model sekawan (lihat
Tirta [40]) atau Lognormal, untuk model taksekawan lihat Tirta [41]) de-
ngan nilai-tengah satu. Model Gamma-Inverse-Gamma dapat dirangkum
sebagai berikut ini. Misalkan bahwa, untuk individu atau strata kei dari
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
376 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
jumlah m, sebanyak ni respon teramati,sedemikain sehingga secara keselu-
ruhan ada respon sebanyak N =∑m
i=1 ni. Misalkan
yi = [yi1, · · · , yij , · · · , yini ]T
merupakan vektor data berukuran ni untuk individu atau strata ke i dengan
i = 1, . . . ,m. Definisi Gamma Inverse Gamma Model (GIGM), mengikuti
HGLMs (Lee & Nelder [20]), seperti berikut.
1. Untuk i = 1, . . . ,m, ada efek acak γi, berkaitan dengan individu atau
strata ke i yang saling bebas dan berdistribusi inverse gamma dengan
likelihood
f2(γi, α) =(α− 1)α
Γ(α)γ−(α+1) exp
(−α− 1
γi
), (6.6)
dan
E(γi) = µγ = 1, var(γi) = σ2γ =1
α− 2, dengan α > 2. (6.7)
Selanjutnya ini dinotasikan γi ∼ IG(1, α).
2. Bersyarat dengan efek acak γi, respon yij , untuk i = 1, . . . ,m and j =
1, . . . , ni, mengikuti GLMs dengan distribusi gamma dan memiliki
nilai-tengah µ′ij = µijγi dan parameter bentuk ν, yang berarti:
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
377 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
(a) untuk j = 1, . . . , ni, yij |γi, berdistribusi gamma dan saling be-
bas, G(µijγi, ν), dengan densitas
f1(yij , µij , ν|γi) =1
Γ(ν)
(νyijµijγi
)νy−1ij exp
(− νyijµijγi
), (6.8)
yang memiliki nilai-tengah bersyarat
E(yij |γi) = µ′ij = µijγi, (6.9a)
dan bersyarat
var(yij |γi) =µ′ 2ijν
=µ2ijγ
2i
ν; (6.9b)
(b) untuk matriks desain xij dan parameter regresi yang diketahui
β hubungan berikut berlaku
g(µ′ij) = η′
dengan g adalah fungsi-link. Secara khusus, untuk hubungan-
log (log-link)
log(µ′ij) = η′ = xijTβ + ln(γi), (6.10)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
378 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dan hubungan antara matriks desain, efek tetap dan efek acak
dapat dinyatakan dalam bentuk matriks seperti:
yi = g−1 (Xiβ + Zivi) + εi, (6.11)
dengan g(x) = ln(x) and vi = ln(γi).
Dapat ditunjukkan (Tirta [40]) dan Tirta [41]) bahwa model HGLM
yang diajukan mempunyai korelasi berbentuk seragam. Jadi dengan model
GIG yang diajukan, tidak ada kebebasan memilih bentuk korelasi.
6.5.2. Likelihood Bersama: Model JGIG
Model sekawan Gamma-Inverse Gamma Model (selanjutnya disingkat Mo-
del GIG) telah didefinisikan pada Tirta [38]. Distribusi bersama merupakan
hasil kali distribusi bersyarat y|γ dengan distribusi efek acak γ. Sedangkan
log-likelihood bersama merupakan jumlah log-likelihood bersyarat dengan
log-likelihood dari efek acak.
Data dimodel dalam bentuk efek tetap (β) dan log dari efek acak
log(U) = v, dengan y = g−1(Xβ + Zv) + ε, dengan g(x), adalah fungsi
hubungan. Matriks y adalah matriks data dan X matrix desain. Matriks
ZT = [ZT1 ZT
2 . . . ZTi . . .ZT
m], dengan Zi adalah matriks ni × m dengan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
379 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
unsur 0 dan 1 mengindikasikan setiap efek acak yang diaplikasikan. Unsur
zij,k, (yaitu baris ke j dan kolom ke k dari matriks Zi) untuk i, k = 1, . . . ,m
dan j = 1, . . . , ni, dengan z(ij,k) = 1 untuk i = k, dan 0 untuk i 6= k.
Likelihood bersama antara y dan efek acak γ adalah:
f(y,γ) =
m∏i=1
ni∏j=1
(yν−1ij
Γ(ν)
(ν
µij
)ν)γ−niνi exp
−
(ν
ni∑t=1
yitµit
)γ−1i
×
(α− 1)α
Γ(α)γ−(α+1)i exp
(−α− 1
γi
). (6.12)
Sedangkan log-Likelihood inti dari y dan v = log(γ) untuk y ∼ GIG(µ, ν, α),
adalah:
h(µ,v, ν, α) =
m∑i=1
ni∑j=1
l1(yij , µij , ν|vi) +
m∑i=1
l2(vi, α) (6.13)
Dalam persamaan di atas, l1(yij , µij , ν|vi) adalah log-likelihood untuk y|γyaitu
l1(yij , µij , ν|γi) = − ln
Γ(ν)
+ νln(νyij)− ln(µ′ij) − ln(yij)−νyijµ′ij
,
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
380 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dengan µ′ij = µij exp(vi). Sedangkan l2(vi, α) adalah log-likelihood dari log
effect acak, v = ln(γ), yaitu
l2(vi, α) = α ln(α− 1)− ln
Γ(α)−viα+
α− 1
exp(vi)
. (6.14)
Bentuk likelihood bersama ini selanjutnya dijadikan dasar untuk mengesti-
masi parameter (β,v, ν dan α) dengan menggunakan pendekatan likelihood
maksimum.
6.5.3. Estimasi Parameter β dan v
Estimasi Parameter β dan v dapat dilakukan dengan dua cara yaitu de-
ngan cara bergantian (alternate algorithm) dan secara simultan (simulta-
neous/multivariate algorithm)
Estimasi Bergantian β dan v
Dengan cara ini, β dan v diestimasi secara bergantian sampai syarat kon-
vergensi secara keseluruhan terpenuhi.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
381 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Turunan dan Persamaan score β
Turunan fungsi log-likelihood bersama seperti persamaan (6.13), terhadap
β dan v, dicari dengan memperhatikan bahwa:
1. bersyarat terhadap random effect v, respon yij adalah saling inde-
penden dengan nilai-tengah µ′ij = µijui. Ui adalah random efek/efek
acak dan bila berdistribusi inverse gama biasa dinotasikann dengan
γi;
2. distribusi yij adalah gamma dengan rataan µ′ij .
3. β hanya ada pada bagian likelihood bersyarat, jadi estimasi β|v atau
β|u dapat mengikuti atau prosedur GLM yang dapat dirumuskan
secara umum
bs = bs−1 +
(m∑i=1
XTi WiXi
)−1 m∑i=1
XTi Wi∆i(yi−µ′i)
∣∣∣∣∣∣s−1
.
(6.15)
dengan
(a) ∆i =adalah matriks diagonal dengan(∂η′ijµ′ij
)yang bergantung
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
382 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
pada fungsi hubungan/link yang dipakai. Untuk link-log,
∆i =
diag(
1µ′ij
)(b) Wi adalah matriks diagonal dengan unsur diberikan oleh:
wij =
(∂µ′ij∂η′ij
)21
V (µ′ij). (6.16)
V (.) adalah fungsi ragam yang bergantung pada jenis distribusi
yang dipakai. Untuk distribusi gamma V (µ′ij =(µ′ij
)2sehingga
menghasilkan Wi = In. Untuk distribusi lain misalnya Poisson
dengan link-log, maka V (µ′ij =(µ′ij
)sehingga Wi=diag
(µ′ij
)(lihat pada Dobson [11] dan McCullagh & Nelder [24]).
Dengan demikian hasil yang diperoleh untuk Gamma-HGLM dapat diper-
luas untuk distribusi lainnya dengan sedikit melakukan modifikasi pada
fungsi link dan fungsi ragamnya.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
383 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Turunan log-likelihood terhadap v
Turunan pertama h(y,µ,v) terhadap v bersyarat β adalah
Dv =∂h(y,µ,v)
∂v,
Dv adalah vektor dengan ukuran m dengan unsur ke i, di,
di =∂h(y,µ,v)
∂vi=∂l1(y,µ|v)
∂vi+∂l2(v, α)
∂vi.
Untuk i 6= i′, vi dan vi′ adalah saling independen, maka
∂h(y,µ,v)
∂vi=∂l1(y,µ|vi)
∂vi+∂l2(vi, α)
∂vi
=
ni∑j=1
∂l1(yij , µ′ij |vi)
∂vi+∂l2(vi, α)
∂vi.
φ∂h(y,µ,v)
∂vi=
ni∑j=1
(νyijµ′ij− ν
)− α+
α− 1
exp(vi)
=ν
ni∑j=1
yijµij exp(vi)
− niν − α+α− 1
exp(vi). (6.17)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
384 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Persamaan di atas kebetulan memiliki penyelesaian analitik sehingga unsur
ke-i dari v, vi, dapat dihitung langsung tanpa iterasi dengan
vi = ln(γi) = ln
ν∑ni
j=1
yijµij
+ α− 1
niν + α
. (6.18)
Algorithma estimasi bergantian dari β dan v adalah:
1. tentukan nilai awal untuk |beta,v dan parameter dispersinya;
2. ulangi langkahberikut sampai konvergen
(a) hitung nilai β dengan prpsedur GLM;
(b) perbarui nilai v dengan persamaan (6.18).
Mengingat kita bisa memanfaatkan pustaka GLM yang talah ada, imple-
mentasi algoritma ini ke program komputer sangat sederhana (strightfor-
ward).
Estimasi Simultan β dan v
Pendugaan β and v dilakukan dengan metode Newton-Raphson. Untuk
itu dibutuhkan turunan fungsi log-likelihood terhadap β dan v yang dapat
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
385 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dirangkum seperti berikut ini.
∂l(µ|v)
∂β=φ−1
m∑i=1
(∂η′i∂β
)SiV
−1i (yi − µi′), (6.19)
atau
∂l(µ|v)
∂β=φ−1
m∑i=1
(∂η′i∂β
)Wi∆i(yi − µi′), (6.20)
dengan
Si−1 =∆i =
∂η′i∂µi
′ = diag
(∂η′ij∂µ′ij
). (6.21)
Pada persamaan di atas Wi = diag(wij) = SiV−1i Si = ∆−1i V−1i ∆−1i yaitu
Wi∆i = SiV−1i , dengan Vi matriks diagonal yang unsurnya adalah fungsi
.
Turunan pertama dari likelihood bersama terhadap v, diturunkan
dari (6.13) yang menghasilkan bentuk matriks
∂h(µ,v)
∂v= φ−1
m∑i=1
ZTi Wi∆i(yi−µ′i) + d
, (6.22)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
386 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dengan d = ∂l(v, α)/∂v adalah vektor dengan panjang m dan unsur ke i
adalah di = φ∂l(v, α)
∂vi, i = 1, 2, . . . ,m.
Matriks informasi bersama antara β dan v
Nilai harapan turunan kedua dari fungsi likelihood bersama terhadap v
adalah
E
(∂2h(µ,v)
∂v ∂vT
)= −φ−1
(m∑i=1
ZTi WiZi −
∂d
∂vT
).
Jadi
Iv = φ−1
(m∑i=1
ZTi WiZi + U
)(6.23)
untuk U = diag
−φ∂
2l(α, v)
∂v2i
= diag
α− 1
ν exp(vi)
; i ∈ 1, 2, . . . ,m.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
387 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Turunan silang
−E∂2h(µ,v)
∂β ∂vT
=φ−1
m∑i=1
XTi WiZi, dan
−E∂2h(µ,v)
∂v ∂βT
=φ−1
m∑i=1
ZTi WiXi.
Jadi, matriks informasi bersama terhadap β dan v adalah I = φ−1H
, dengan
H =
[ ∑XT
i WiXi∑
XTi WiZi∑
ZTi WiXi
∑ZTi WiZi + U
].
Persamaan Skor untuk pendugaan β dan v
Langkah ke s dari persamaan skor untuk pendugaan β dan v pada suatu
nilai ν dan α, adalah[b
v
]s
=
[b
v
]s−1
+ H−1
[ ∑XT
i Wi∆i(yi − µ′)∑ZTi Wi∆i(yi − µ′) + d
]∣∣∣∣∣s−1
, (6.24)
dengan subskrip (s− 1) berarti rumus tersebut dinilai menggunakan hasil
pada langkah ke(s− 1).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
388 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.5.4. Pendugaan parameter dispersi ν dan α
Pendugaan parameter dispersi menggunakan likelihood yang disesuaikan
seperti disarankan oleh Cox & Reid [7], McCullagh & Tibshirani [25] dan
Lee & Nelder [20]. Penyesuaian menghasilkan h-log-likelihood yang disesu-
aikan untuk pendugaan ν and α pada HGLMs hA = h − 1
2ln |2πφH| =
h +1
2ln∣∣2πφH−1
∣∣ , dengan h adalah log-likelihood bersama (6.13) dan
φH−1 adalah matriks informasi untuk (β,v)T .
Pendugaan parameter dispersi dilakukan menggunakan metode it-
erasi Newton-Raphson, yaitu θs = θs−1 −H−1θθDθ|s−1, dengan θ = (ν, α)T
dan
Dθ =
∂hA∂ν
∂hA∂α
; HθθT =
∂2hA∂ν2
∂2hA∂α∂ν
∂2hA∂ν∂α
∂2hA∂α2
.
Unsur-unsur matriks adalah sebagai berikut ini.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
389 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
∂ha∂ν
=m∑i=1
ni∑j=1
digamma(nu) + ln
νyijµ′ij− yijµ′ij
+ 1
+
− 1
2
m+ rank(X)
ν+ trace
(KUν
). (6.25)
∂hA∂α
=m∑i=1
(−∂ ln
Γ(α)
∂α
+α
α− 1+ ln(α− 1)− vi −
1
exp(vi)
)
− 1
2trace
(KUα
). (6.26)
∂2hA∂ν2
= −N∞∑r=1
1
(ν + r − 1)2+N
ν+
1
2
(m+ rank(X)
ν2
−traceK(Uν,ν)
+ trace
(KUν)(KUν)
). (6.27)
∂2hA∂α2
=
m∑i=1
−∞∑r=1
1
(α+ r − 1)2− α
(α− 1)2+
2
α− 1
+1
2trace
(KUα)(KUα)
. (6.28)
∂2hA∂ν ∂α
= −1
2
trace(KUν,α)− trace(KUν)(KUα)
(6.29)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
390 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.5.4.1. Prosedur Pendugaan
Model yang diperoleh memiliki banyak parameter. Beberapa diantaranya
lebih mudah diduga dibanding yang lainnya. Jadi pendugaan secara serem-
pak menggunakan model multivariat penuh akan tidak efisien. Smyth ([33]
dan [34]) menyarankan untuk mengelompokkan parameter sesuai dengan
kemudahan pendugaannya dan selanjutnya memanfaatkan algoritma par-
tissi. Salah satu algoritma yang diajukan disebut prosedur coupled. Prose-
dur ini terdiri atas dua kelompok putaran yaitu putaran dalam dan putaran
luar. Pada putaran dalam beberapa parameter yang sejenis diestimasi de-
ngan metode Newton-Raphson atau metode Skor Fisher. Kriteria konver-
gensi secara keseluruhan dilakukan secara global yaitu apabila kriteria pada
masing-masing putaran dalam telah tepenuhi.
Secara ringkas prosedur tersebut dapat dirumuskan sebagai berikut.
1. Tentukan nilai awal β0,v0, α0, ν0.
2. Kondisional terhadap α0, ν0 lakukan pendugaan β dan v.
3. Kondisional terhadap nilai baru β dan v lakukan pendugaan ter-
hadap (α, ν).
4. Ulangi prosedur di atas sampai konvergensi global terpenuhi.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
391 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.5.5. Analisis HGLM dengan R
Sebagaimana disebutkan sebelumnya, secara umum metode HGLM belum
terimplemantasikan ke paket komputer yang banyak beredar. Namun,
khusus untuk metode JGIG, paket analisis telah dirintis. Penggunaannya
adalah sebagai berikut
hglm(formula, distribusi = Gamma(link=log),
data, cluster, subset=NULL, na.action, offset,
start.coef = NULL, start.sigma = NULL,
control = glm.control(epsilon = 1e-08, maxit =
100, trace = FALSE), n.points = 16)
formula : deskripsi simbolik dari model yang dicoba
(dinyatakan dalam bentuk y~x1+x2...)
distribusi : jenis distribusi dan fungsi link yang diasumsikan
untuk respon. Untuk sementara distribusi yang
berlaku hanya distribusi Gamma dengan fungsi
link=Log. Distribusi dan link ini sekaligus
menjadi nilai default.
data : data frame yang memuat variabel yang dipanggil
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
392 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
dalam formula.klaster : variabel yang berfungsi sebagai klaster yang
diperlakukan sebagai efek acak
offset : dapat dipergunakan untuk menentukan nilai komponen
yang telah diketahui yang mau diikutsertakan dalam
prediktor. Komponen ini dimodelkan dengan
koefisien1 (opsional)
Pada contoh berikut data adalah data tentang pohon jeruk (Orange)
yang berisi umur phon (age), lingkaran pohon (circumference) untuk berba-
gai jenis pohon (Tree). Dalam konteks HGLM dapat dianggap bahwa pen-
gukuran dihasilkan dari beberapa jenis pohon (Tree) yang dimati untuk
beberapa tingkat usia dan diukur besar lingkaran bantangnya. Dalam hal
ini Tree dapat diperlakukan sebagai peubah yang menunjukkan adanya
pengukuran berulang.
data(Orange)
attach(Orange)
hglm(circumference~age, distribusi=Gamma(link=log),
klaster=Tree,data=Orange)
Hasil yang diperoleh adalah sebagai berikut.Estimator dan SE parameter tetap dengan memperhitungkan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
393 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
efek acak
Komponen Penduga Kesalahan Nilai_t Nilai_P
baku
(Intercept) 3.542547344 8.607523e-02 41.15641 0.000000e+00
age 0.001174635 8.262093e-05 14.21716 1.232348e-14
Besarnya Parameter Dispersi Respon = 0.05615005
Besarnya Parameter Dispersi Efek Acak = 2.082785
Banyaknya klaster sebagai efek acak 5
dengan frekwensi dari 7 sampai 7
Penduga efek acak dengan asumsi inverse gamma
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.8187 0.8764 0.9243 0.9845 1.1440 1.1590
Sebagai perbandingan, jika analisis menggunakan gee() dengan struk-
tur korelasi seragam, diperoleh hasil yang hampir sama, yaitu:
Model:Link: Logarithm
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
394 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Variance to Mean Relation: Gamma
Correlation Structure: Exchangeable
Call:
gee(formula = circumference ~ age, id = Tree, data = Orange,
family = Gamma(link = log), corstr = "exchangeable")
Summary of Residuals:
Min 1Q Median 3Q Max
-81.517777 -10.244679 -3.616427 12.901823 55.383573
Coefficients:
Estimate Naive S.E. Naive z Robust S.E. Robust z
(Intercept)3.5244517 9.203927e-02 38.29291 4.409318e-02 79.93190
age 0.0011859 7.020315e-05 16.89202 4.072747e-05 29.11728
Estimated Scale Parameter: 0.05615
Number of Iterations: 1
Perbedaan antara gee() dengan JGIG yang diajukan di atas adalah:
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
395 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
1. gee() hanya didasarkan hubungan bentuk momen, Gamma-HGLM,
khususnya JGIG, menggunakan likelihood penuh, untuk JGIG diper-
gunakan likelihood bersama (joint likelihood);
2. dengan gee() kita dapat memilih alternatif struktur korelasi, tetapi
dengan Gamma-HGLM hanya menggunakan struktur korelasi ser-
agam;
3. dengan gee() model yang diperoleh adalah model rata-rata populasi
(marjinal), tetapi dengan JGIG model yang diperoleh adalah mo-
del individu (efek acak diestimasi secara eksplisit, sehingga prediksi
individu lebih akurat).
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
396 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.6. Bacaan Lebih Lanjut
Referensi model linier dengan pendekatan GEE dalam bentuk buku teks
masih sangat jarang, diantaranya adalah Diggle et al. [10]. Sedangkan
dalam bentuk jurnal cukup banyak diantarnya adalah yang ditulis langsung
oleh Liang dengan kawan-kawannya seperti: Liang & Zeger [21], Zeger &
Liang [52], Waclawiw & Liang [50], Liang et al. [22], Zeger & Liang [53], dan
Zeger et al. [54]. Model linier dengan pendekatann HGLM termasuk model
linier yang relatif baru dan masih sedang dikembangkan (lihat misalnya Lee
dan Nelder [20] dan Tirta [37]). Publikasi HGLM terkait dengan aplikasi
program R dapat dibaca pada Tirta et.al [45] dan Tirta et.al [44].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
397 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.7. Ringkasan
1. Analisis regresi dengan data yang mengandung respon multivariat,
misalnya data yang dikukur secara berulang baik diukur dengan ku-
run waktu berbeda maupun dengan perlakuan berbeda, dapat di-
lakukan dengan beberapa alternatif seperti GEE, GLMM, dan HGLM.
2. GEE tidak menggunakan metodelekelihood lengkap, tetapi menggu-
nakan pendekatan marjinal dengan menetapkan bentuk momen per-
tama (nilai tengah) dan momen keduanya (ragam-koragam).
3. Paket GEE pada R menyediakan berbagai alernatif bentuk distribusi
seperti halnyapada GLM dan berbagai bentuk korelasi (seperti ser-
agam, AR-M, saling bebas).
4. HGLM menggunakan pendekatan likelihood murni dengan model
bertingkat sehingga menghasilkan bentuk likelihood marjinal yang
dapat dilacak, atau menggunakan pendekatan lain (misalnya Lap-
place dan Markov Chained Monte Carlo). Dalam buku ini hanya
dibatasi pada bentuk sekawan yaitu Gamma-Inverse-Gamma dan
Poisson-Gamma. Model ini menghasilkan bentuk korelasi seragam.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
398 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
6.8. Latihan Soal-soal
1. Berikan tiga contoh pengamatan yang menghasilkan data dengan re-
spon multivariat.
2. Secara teoritis, jelaskan bilamana penggunaan model korelasi ex-
changeable sesuai.
3. Secara teoritis, jelaskan bilamana penggunaan model korelasi se-
rial/auto regressive-1 sesuai.
4. Dalam menggunakan paket gee,apa yang sesungguhnya dilakukan
apabila kita memilih alternatif berikut:
(a) bentuk korelasi="independence", dengan berbagai bentuk dis-
tribusi/ family dan link.
(b) bentuk korelasi="independence", dengan bentuk bentuk dis-
tribusi/ family=="gaussian" dan link="identity".
5. Lakukan eksplorasi pada fungsi geese pada paket geepack. Band-
ingkan struktur dan hasilnya dengan paket gee.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
399 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
GLOSARIUM
A
AIC Akaike’s Information Criterion adalah salah satu kriteria yang
dijadikan patokan memilih model yang baik dengan menghi-
tung perimbangan besarnya maksimum likelihood dan banyak-
nya variabel yang dipergunakan dalam model.
alpha(α) Taraf signifikansi = peluang kesalahan tipe I, peluang secara
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
400 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
keliru menolak hipotesis null yang benar.
B
Boxplot tampilah grafis dari kuantil data yang dinyatakan dalam bentuk
kotak. Pada Boxplot digambarkan posisi median (Q2), kuantil
1(Q1) dan kuantil 3(Q3). Boxplot juga memberi gambaran ada
tidaknya pencilan (outlier).
C
CLI Command Line Interface adalah program yang menjembatani
komunikasi antara komputer dengan pengguna dengan meng-
gunakan perintah-perintah yang ditulis dalam baris perintah,
tidak menggunakan grafis ataupun maouse. CLI merupakan
interface utama dari R.
D
derajat kebebasan Angka yang menunjukkan banyaknya informasi yang
saling bebas setelah mengestimasi beberapa parameter.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
401 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Diagram Pencar (Scattergram) Diagram pencar adalah representasi gra-
fik dari distribusi dua peubah acak yang disajikan dalam ben-
tuk titik-titik dengan koordinat ditentukan oleh nilai observasi
pasangan peubah acak tadi.
distribusi diskrit sebaran yang memiliki fungsi kepadatan dengan daerah
asal (domain) berupa himpunan titik-titik yang tercacah (mi-
salnya sebagian himpunan bilangan cacah, sebagian himpunan
bilangan asli).
distribusi kontinu sebaran yang memiliki fungsi kepadatan dengan daerah
asal (domain) berupa himpunan interval (misalnya seluruh bi-
langan real, bilangan real nonnegatif, a < x < b.).
distribusi Normal Baku Distribusi Normal dengan nilai-tengah 0 dan ra-
gam 1.
E
estimasi interval/selang keyakinan Interval/Selang Keyakinan adalah se-
lang yang diyakini memuat nilai parameter populasi dengan
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
402 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tingkat peluang tertentu. Tingkat peluang yang banyak di-
pakai adalah 95% dan 99%.
estimasi titik Nilai tertentu yang merupakan penduga suatu parameter.
G
GLM GLM Generalized Linear Models atau Model Linear Tergeneral-
isir/ Terampat adalah analisis regresi untuk respon-respon yang
tidak harus berdistribusi normal, tetapi masih dalam distribusi
keluarga eksponensial (misalnya Poisson, Binomial, Gamma).
Dalam GLM hubungan antara mean/ nilai-tengah respon dan
peubah penjelas bisa berupa fungsi log, resiprokal atau fungsi
lainnya.
GUI Graphical User Interface adalah program yang menjembatani
komunikasi antara komputer dengan pengguna dengan meng-
gunakan tampilan grafis seperti menu atau ikon, yang biasanya
siap diklik dengan mouse. Program GUI untuk R biasa disebut
RGUI.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
403 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
H
hipotesis alternatif Disebut juga hipotesis kerja yaitu hipotesis yang diru-
muskan sesuai dengan hasil kajjian teori yang melandasi peneli-
tian.
hipotesis nul Disebut juga hipotesis nihil, yaitu hipotesis yang diuji pada
prosedur statistika, yang menyatakan kenetralan (tidak ada
beda signifikan, tidak ada hubungan signifikan dan sebagainya).
histogram Grafik yang menggunakan segiempat sebagai representasi frekuensi
atau peluang dari observasi pada setiap interval.
J
Jarak Cook Suatu ukuran yang menunjukkan pengaruh suatu nilai penga-
matan pada regresi berganda.
K
Keluarga Eksponensial Keluarga Eksponensial adalah distribusi yang meru-
pakan kesatuan (unifikasi) distribusi-distribusi penting yang
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
404 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
banyak dipakai seperti antara lain Normal, Gamma, Binom-
ial, Poisson dalam satu bentuk distribusi.
kolinieritas Kondisi yang ditunjukkan oleh adanya peubah penjelas saling
berkorelasi satu sama lain.
Konformabel Dua matrik dikatakan komformabel apabila kepada kedu-
anya dapat dilakukan operasi matriks biner. Untuk operasi
penjumlahan disebut konformabel terhadap penjumlahan. Ma-
triks yang komformabel terhadap penjumlahan berordo sama.
Untuk operasi perkalian disebut konformabel terhadap per-
kalian. Matriks yang konformabel terhadap perkalian adalah
sedemikain hingga banyaknya kolom matriks terkali sama de-
ngan banyaknya baris matriks pengali.
M
matriks bentuk kuadrat quadratic form adalah matrika yang berbentuk
yTAy dengan vektor peubah, dan A matriks simetrik. Pada
dasarnya matriks ini berordo 1× 1.
Matriks Diagram Pencar Matriks Diagram Pencar (Scatter Plot Matrix)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
405 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
adalah matriks yang menggambarkan diagram pencar lebih dari
dua variabel. Pada diagonal biasanya disajikan densitas, his-
togram atau diagram kuantil, sedangkan pada off diagonal dis-
ajikan diagram pencar masing-masing pasangan variabel.
matriks ragam-koragam adalah matriks simetris yang unsur diagonaluta-
manya merupakan ragam dari peubah-peubah, sedangkan un-
sur di luar diagonal utama merupakan koragam dari peubah
yang bersesuaian, misalnya mii = σ2i ,mij = σij .
model Istilah lain untuk regresi peubah ganda, terdiri atas model li-
nier, model linier terampat/tegreneralisir, model nonlinier, mo-
del linier campuran dan lain-lain.
N
Nilai p Termasuk peluang kesalahan tipe I, yaitu peluang yang menun-
jukkan bahwa hasil yang dicapai merupakan hal yang kebetulan
jika ternyata Ho benar.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
406 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
O
Open Sources Open Source adalah program komputer yang dikembangkan
dengan kode (source code) terbuka yang dapat diakses dan di-
modifikasi orang lain.
ordo matriks adalah bilangan yang menunjukkan banyaknya baris dan
banyaknya kolom suatu matriks Am×n menunjukkan matriks
terdiri atas m baris n kolom.
Outlier/pencilan Pencilan adalah data yang besarnya menyimpang dari
kelompoknya melebihi batas kewajaran distribusi data.
P
Parameter Parameter (statistika) adalah ukuran deskriptif numerik dari
populasi.
Populasi Populasi adalah kumpulan seluruh data yang menjadi perha-
tian dalam penelitian. Jadi populasi adalah seluruh subjek
penelitian beserta karakteristiknya yang menjadi kepentingan.
Pustaka Pustaka (library), khususnya dalam program S-Plus dan R,
adalah kumpulan paket- paket program yang dibuat khusus
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
407 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
untuk keperluan tertentu yang merupakan pengayaan dari pro-
gram utama/inti R atau SPlus.
Q
QQPlot QQplot atau Plot Kuantil adalah diagram yang menggambarkan
hubungan antara quantil teoritis suatu distribusi dengan kuan-
til riil suatu data. Khusus untuk distribusi normal grafiknya
disebut QQnorm.
S
sampel Sampel adalah sebagian dari populasi yang secara representatif
mewakili populasi.
sisa/residu Selisih antara nilai observasi Y dengan nilai prediksinya ( Y ).
skrip Skrip adalah naskah yang berisi berbagai perintah yang harus
dilaksanakan oleh komputer melalui suatu bahasa atau pro-
gram tertentu.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
408 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
409 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
DAFTAR PUSTAKA
[1] H. Akaike. Information theory and extension of maximum likelihood
theory. In B.N. Petrov and F. Csahi, editors, 2nd Symposium on
Information Theory, pages 267–281. Buddapest, 1972.
[2] G.P. Beaumont. Intermediate Mathematical Statistics. Chapman and
Hall, London, 1st edition, 1980.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
410 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[3] Bowerman,B.L. R.T. Cornell and D.A. Dickey. Linear Statistical Mod-
els, an Appplied Approach. Duxbury Press, Boston, 1986.
[4] P.J. Burns. S Poetry. http://www.r-project.org, 1998.
[5] J.M. Chamber and T.J. Hastie. Statistical Model in S. Chapman and
Hall, London, 1992.
[6] D.R. Cox and D.V. Hinkley. Theoretical Statistics. Chapman and Hall,
London, 1st edition, 1974.
[7] D.R. Cox and N. Reid. Parameter orthogonality and approximate
conditional inference. J. R. Statist. Soc., 49:1–39, 1987.
[8] Crawley. Statistical Computing: An Introduction to Data Analysis
using S-Plus. Wiley, England, 2004.
[9] M. Davidian and D.M. Giltinan. Nonlinear Models for Repeated Mea-
surement Data. Chapman and Hall, London, 1995.
[10] Diggle P.J., K-Y. Liang and S.L. Zeger. Analysis of Longitudinal Data.
Oxford Science Publications, London, 1st edition, 1994.
[11] A.J. Dobson. An Introduction to Generalized Linear Models. Chapman
and Hall, London, 1990.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
411 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[12] J.J. Faraway. Practical Regression and Anova Using R.
http://www.stat. Isa.umic.edu/∼faraway/book/, 2002.
[13] D.A. Harville. Matrix Algebra From a Statistician’s Perspective.
Springer, New York, 1997.
[14] T.J. Hastie & R.J. Tibshirani. Generalized Additive Models. Chapman
& Hall, London, 5th edition, 1990.
[15] J.S.U. Hjortn. Computer Intensive Statistical Methods: Validation,
Model Selection and Bootstap. Chapman & Hall, London, 1994.
[16] R.V. Hogg and A.T. Craig. Introduction to Mathematical Statistics.
Prentice-Hall, Englewood Cliffs, 5th edition, 1995.
[17] M.G. Kenward and D.M. Smith. Computing the generalized estimating
equation for repeated measurements. Genstat Newsletter, 32:50–62,
1995.
[18] P. Kuhnert and B. Venables. An Introduction to R: Software
for Statistical Modelling & Computing. CSIRO, http://cran.r-
project.org/doc/contrib/Kuhnert+Venables-R Course Notes.zip,
2005. [17 April 2006].
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
412 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[19] N.M. Laird and J.H. Ware. Random effects models for longitudinal
data. Biometrics, 38:963–974, 1982.
[20] Y. Lee and J.A. Nelder. Hierarchical generalized linear models. J.R.
Statist. Soc., 58:619–678, 1996.
[21] K-Y Liang and S.L. Zeger. Longitudinal data analysis using general-
ized linear models. Biometrika, 73:13–22, 1986.
[22] Liang,K-Y, S.L. Zeger and B. Qaqish. Multivariate regression analyses
for categorical data (with discussion). J.R. Statist. Soc., 54:3–40, 1992.
[23] J.H. Maindonald. Using R for Data Analysis and Graphics An Intro-
duction. ANU-Australia, June 2001.
[24] P. McCullagh and J.A. Nelder. Generalized Linear Models. Chapman
and Hall, London, 2nd edition, 1989.
[25] P. McCullagh and R. Tibshirani. A simple method for the adjustment
of profile likelihoods. J. R. Statist. Soc., 52:325–344, 1990.
[26] W. Mendenhall. Introduction to Probability and Statistics. Duxbury,
Belmont USA, 5th edition, 1979.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
413 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[27] W. Mendenhall. Beginning Statistics A to Z. Duxbury, Belmont USA,
1993.
[28] P.L. Meyer. Introductory Probability and Statistical Applications.
Addison-Wisley Pub. Co., Massachusets, 2nd edition, 1970.
[29] P Murrell. R Graphics. Chapman& Hall/CRC, 2006.
[30] J.A. Nelder and R.W.M. Wedderburn. Generalized linear models.
J.R.Statist.Soc., 57:359–407, 1972.
[31] Neter J., W. Wasserman and M.H. Kutner. Applied Linear Statistical
Models. Irwin, Illinois, 2nd edition, 1985.
[32] S.R. Searle. Matrix Algebra Useful for Statistics. John Wiley and Sons,
New York, 1st edition, 1982.
[33] G.K. Smyth. Generalized linear models with varying dispersion. J.R.
Statist. Soc, 51:47–60, 1989.
[34] G.K. Smyth. Partitioned algorithms for maximum likelihood and other
nonlinear estimation. Statistics and Computing, 6:201–216, 1996.
[35] StatSoft. Electronic Statistics Textbook. http://www.statsoftinc.com/
textbook/ stathome.html, 2006.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
414 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[36] N.H. Timm. Multivariate Analysis with Applications in Education and
Psychology. Brooks/Cole, California, 1975.
[37] I M. Tirta. Analysis of Gamma Data with Random Effects. PhD thesis,
Department of Mathematics Statistics and Computing Sciences, The
University of New England, Armidale, NSW Australia, 1999.
[38] I M. Tirta. The conjugate model for gamma data with random effects.
A paper submitted for MIHMI (Majalah Ilmiah Himpunan Matema-
tika Indonesia), 1999.
[39] I M. Tirta. Marginal likelihood appraoch in Gamma-Inverse-Gamma
model. Proceeding of The SEAMS (South East Asian Mathematical
Society)-GMU(Gadjah Mada University, 26-29 July 1999, pages 454–
462, 1999.
[40] I M. Tirta. The conjugate model in Gamma data with random ef-
fetcs. MIHMI (Journal of Indonesian Mathematical Society), 6(1):57–
78, 2000.
[41] I M. Tirta. A nonconjugate model for Gamma data with random
effects. Jurnal Ilmu Dasar (Journal of Basic Sciences), 1(1):46–58,
2000.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
415 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[42] I M. Tirta. Buku Panduan Program Statistika R. Penerbit Universitas
Jember, Jember, 2005. ISBN 979-8176-37-5.
[43] I M. Tirta. Analisis Data dengan Aplikasi R. Andi Offset, Yogya,
2008. Naskah Buku Teks disetujui DIKTI dan sedang diajukan ke
Percetakan Andi Offset.
[44] Tirta I M. Lestari B. & Dewi Y. S. Estimasi efek tetap dan acak pada
model multiplikatif dengan likelihood bersama. Jurnal Ilmu Dasar,
7(1), 2006.
[45] Tirta I M. Lestari B. & Dewi Y. S. Estimasi efek tetap dan efek acak
pada model multiplikatif dengan aplikasi open source software (oss)-r.
Jurnal Teknologi. ACADEMIA ISTA, 11(2):195–202, 2007.
[46] W.N. Venables and B.D. Ripley. Modern Applied Statistics with S-plus.
Springer, New York, 1994.
[47] W.N. Venables and B.D. Ripley. Modern Applied Statistics with S-plus.
Springer, New York, 3rd edition, 1996.
[48] J. Vezalini. Using R for Introductory Statistics. http://www.r-
project.org, 2002.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
416 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
[49] Wackerly D.D., Mendenhall W. &Scheafer R. L. . Mathematical Statis-
tics with Application. Duxbury, Belmont USA, 5th edition, 1996.
[50] M.A. Waclawiw and K-Y Liang. Prediction of random effects in the
generalized linear model. J. Amer. Statist. Assoc., 88:171–178, 1993.
[51] R.W.M. Wedderburn. Quasi-likelihood functions, generalized linear
models, and the Gauss-Newton method. Biometrika, 61:439–447, 1974.
[52] S.L. Zeger and K-Y. Liang. Longitudinal data analysis for discrete and
continuous outcomes. Biometrics, 42:121–130, 1986.
[53] S.L. Zeger and K-Y. Liang. An overview of methods for the analysis
of longitudinal data. Statistics in Medicine, 11:1825–1839, 1992.
[54] S.L. Zeger, K-Y. Liang and P.S. Albert. Models for longitudinal data:
A generalized estimating equation approach. Biometrics, 44:1049–
1060, 1988.
[55] V. Zoonekyn. Statistics with R. http://zoonek2.free.fr/
UNIX/48 R/all.html, 2005.
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
417 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
LAMPIRAN A
BEBERAPA FUNGSI TERKAIT REGRESI
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
418 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.1. Fungsi dari Paket stats
AIC(object, ..., k = 2)
glm(formula, family = gaussian, data, weights, subset,
na.action, start = NULL, etastart, mustart,
offset, control = glm.control(...), model = TRUE,
method = "glm.fit", x = FALSE, y = TRUE, contrasts = NULL, ...)
lm(formula, data, subset, weights, na.action,
method = "qr", model = TRUE, x = FALSE, y = FALSE,
qr = TRUE, singular.ok = TRUE, contrasts = NULL,
offset, ...)
nlm(f, p, ..., hessian = FALSE, typsize = rep(1, length(p)),
fscale = 1, print.level = 0, ndigit = 12, gradtol = 1e-6,
stepmax = max(1000 * sqrt(sum((p/typsize)^2)), 1000),
steptol = 1e-6, iterlim = 100, check.analyticals = TRUE)
predict (object, ...)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
419 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.2. Fungsi dari Paket cars
qq.plot(x, ...)
scatterplot(x, ...)
scatterplot.matrix(x, ...)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
420 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.3. Fungsi dari Paket gam
gam(formula, family = gaussian, data, weights, subset,
na.action, start, etastart, mustart, control =
gam.control(...),model=FALSE, method, x=FALSE, y=TRUE, ...)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
421 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.4. Fungsi dari Paket graphics
boxplot(x, ...)
contour(x, ...)
abline(a, b, untf = FALSE, ...)
abline(h=, untf = FALSE, ...)
abline(v=, untf = FALSE, ...)
abline(coef=, untf = FALSE, ...)
abline(reg=, untf = FALSE, ...)
hist(x, ...)
persp(x, ...)
plot(x, y, ...)
segments(x0, y0, x1, y1,
col = par("fg"), lty = par("lty"), lwd = par("lwd"), ...)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
422 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.5. Fungsi dari Paket gee
gee(formula, id,
data, subset, na.action,
R = NULL, b = NULL,
tol = 0.001, maxiter = 25,
family = gaussian, corstr = "independence",
Mv = 1, silent = TRUE, contrasts = NULL,
scale.fix = FALSE, scale.value = 1, v4.4compat = FALSE)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
423 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.6. Fungsi dari Paket lme4
lmer(formula, data, family, method, control, start,
subset, weights, na.action, offset, contrasts,
model, ...)
nlmer(formula, data, control, start, verbose,
subset, weights, na.action, contrasts,
model, ...)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
424 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.7. Fungsi dari Paket hglm
hglm(formula, distribusi = Gamma(link=log), data, klaster,
subset=NULL, na.action, offset, start.coef = NULL,
start.sigma = NULL, control = glm.control(epsilon
= 1e-08, maxit = 100, trace = FALSE), n.points = 16,
gee=FALSE, plot=FALSE)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
425 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.8. Fungsi dari Paket glmmML
glmmML(formula, family = binomial, data, cluster, weights,
cluster.weights, subset, na.action,
offset, prior = c("gaussian", "logistic", "cauchy"),
start.coef = NULL, start.sigma = NULL, fix.sigma = FALSE,
control = list(epsilon = 1e-08, maxit = 200, trace = FALSE),
method = c("Laplace", "ghq"), n.points = 8, boot = 0)
glmmboot(formula, family = binomial, data, cluster, weights, subset,
na.action, offset, start.coef = NULL,
control = list(epsilon = 1e-08, maxit = 200, trace = FALSE), boot = 0)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
426 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.9. Skrip Manipulasi Grafik
plot(x,y, main="DIAGRAM BESAR DENGAN GRAFIK MINI")
abline(lm(y~x), col="blue")
op <- par(fig=c(.02,.5,.55,.98), new=TRUE)
hist(x, probability=T,
col="light blue", xlab="HistY", ylab="", main="", axes=F)
lines(density(x), col="red", lwd=2)
box()
op1 <- par(fig=c(.46,.98,.02,.45), new=TRUE)
qq.plot(x, main="QQNorm", dist="norm")
box()
par(op)
par(op1)
split.screen(c(1,2))
split.screen(c(2,1), screen = 2)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
427 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
screen(1)plot(x,y,main="Diagram Pencar (X,Y)")
abline(lm(y~x))
screen(3)
hist(y, probability=T,
main="Histogram Y")
lines(density(y), col="red", lwd=2)
screen(4)
qq.plot(x,main="QQ.norm X")
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
428 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
A.10. Skrip Membangkitkan Data Regresi dengan
Peubah Kelompok
#simulasi data regresi dengan kelompok
require
n<-60 #genap
ns<-.5*n
sd<-20
g<-rep(c("L","P"),each=ns)
x1<-round(rnorm(n,50,8))
x2<-round(rnorm(n,50,8))
y1a<-10+x1[1:ns]*3.1+4*x2[1:ns]+rnorm(ns,0,sd)
y1b<-10+x1[(ns+1):n]*3+4*x2[(ns+1):n]+rnorm(ns,0,sd)
y1<-c(y1a,y1b)
y2a<-50+x1[1:ns]*3+4*x2[1:ns]+rnorm(ns,0,sd)
y2b<--50+x1[(ns+1):n]*3+4*x2[(ns+1):n]+rnorm(ns,0,sd)
y2<-c(y2a,y2b)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
429 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
y3a<-60-.5*x1[1:ns]-.5*x2[1:ns]+rnorm(ns,0,sd)y3b<--70+.5*x1[(ns+1):n]+x2[(ns+1):n]+rnorm(ns,0,sd)
y3<-c(y3a,y3b)
DataSimReg<-data.frame(y1,y2,y3,g,x1,x2)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
430 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
431 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
LAMPIRAN B
DATA UNTUK ILUSTRASI
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
432 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.1. Data dari Paket actuardental Individual dental claims data set
gdental Grouped dental claims data set
hachemeister Hachemeister data set
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
433 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.2. Data dari Paket ade4
abouheif.eg Phylogenies and quantitative traits from
Abouheif
acacia Spatial pattern analysis in plant communities
aminoacyl Codon usage
apis108 Allelic frequencies in ten honeybees
populations at eight microsatellites loci
ardeche Fauna Table with double (row and column)
partitioning
arrival Arrivals at an intensive care unit
atlas Small Ecological Dataset
atya Genetic variability of Cacadors
avijons Bird species distribution
avimedi Fauna Table for Constrained Ordinations
aviurba Ecological Tables Triplet
bacteria Genomes of 43 Bacteria
banque Table of Factors
baran95 African Estuary Fishes
bf88 Cubic Ecological Data
bordeaux Wine Tasting
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
434 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
bsetal97 Ecological and Biological Traitsbuech Buech basin
butterfly Genetics-Ecology-Environment Triple
capitales Road Distances
carni19 Phylogeny and quantative trait of carnivora
carni70 Phylogeny and quantitative traits of carnivora
carniherbi49 Taxonomy, phylogenies and quantitative traits
of carnivora and herbivora
casitas Enzymatic polymorphism in Mus musculus
chatcat Qualitative Weighted Variables
chats Pair of Variables
chazeb Charolais-Zebus
chevaine Enzymatic polymorphism in Leuciscus cephalus
clementines Fruit Production
cnc2003 Frequenting movie theaters in France in 2003
coleo Table of Fuzzy Biological Traits
corvus Corvus morphology
deug Exam marks for some students
doubs Pair of Ecological Tables
dunedata Dune Meadow Data
ecg Electrocardiogram data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
435 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ecomor Ecomorphological Convergence
elec88 Electoral Data
escopage K-tables of wine-tasting
euro123 Triangular Data
fission Fission pattern and heritable morphological
traits
friday87 Faunistic K-tables
fruits Pair of Tables
ggtortoises Microsatellites of Galapagos tortoises
populations
granulo Granulometric Curves
hdpg Genetic Variation In Human Populations
housetasks Contingency Table
humDNAm human mitochondrial DNA restriction data
ichtyo Point sampling of fish community
irishdata Geary's Irish Data
julliot Seed dispersal
jv73 K-tables Multi-Regions
kcponds Ponds in a nature reserve
lascaux Genetic/Environment and types of variables
lizards Phylogeny and quantitative traits of lizards
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
436 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
macaca Landmarks
macon Wine Tasting
mafragh Phyto-Ecological Survey
maples Phylogeny and quantitative traits of flowers
mariages Correspondence Analysis Table
meau Ecological Data : sites-variables,
sites-species, where and when
meaudret Ecological Data : sites-variables,
sites-species, where and when
microsatt Genetic Relationships between cattle breeds
with microsatellites
mjrochet Phylogeny and quantitative traits of teleos
fishes
mollusc Faunistic Communities and Sampling Experiment
monde84 Global State of the World in 1984
morphosport Athletes' Morphology
newick.eg Phylogenetic trees in Newick format
njplot Phylogeny and trait of bacteria
olympic Olympic Decathlon
oribatid Oribatid mite
ours A table of Qualitative Variables
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
437 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
palm Phylogenetic and quantitative traits of
amazonian palm trees
pap Taxonomy and quantitative traits of carnivora
perthi02 Contingency Table with a partition in Molecular
Biology
presid2002 Results of the French presidential elections of
2002
procella Phylogeny and quantitative traits of birds
rankrock Ordination Table
rhone Physico-Chemistry Data
rpjdl Avifauna and Vegetation
santacatalina Indirect Ordination
sarcelles Array of Recapture of Rings
seconde Students and Subjects
skulls Morphometric Evolution
steppe Transect in the Vegetation
syndicats Two Questions asked on a Sample of 1000
Respondents
t3012 Average temperatures of 30 French cities
tarentaise Mountain Avifauna
taxo.eg Examples of taxonomy
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
438 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
tintoodiel Tinto and Odiel estuary geochemistry
tithonia Phylogeny and quantitative traits of flowers
tortues Morphological Study of the Painted Turtle
toxicity Homogeneous Table
trichometeo Pair of Ecological Data
ungulates Phylogeny and quantitative traits of ungulates.
vegtf Vegetation in Trois-Fontaines
veuvage Example for Centring in PCA
westafrica Freshwater fish zoogeography in west Africa
worksurv French Worker Survey (1970)
yanomama Distance Matrices
zealand Road distances in New-Zealand
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
439 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.3. Data dari Paket agricolae
CIC Data for AMMI Analysis
ComasOxapampa Data AUDPC Comas - Oxapampa
Glycoalkaloids Data Glycoalkaloids
LxT Data Line by tester
RioChillon Data and analysis Mother and baby trials
carolina1 Data Carolina I
carolina2 Data Carolina II
carolina3 Data Carolina III
clay Data of Ralstonia population in clay soil
corn Data of corn
cotton Data of cotton
disease Data evaluation of the disease overtime
genxenv Data of potato yield in a different environment
grass Data for Friedman test
growth Data growth of trees
haynes Data of yield for nonparametrical stability
analysis
homog1 Data of frijol
huasahuasi Data of yield in Huasahuasi
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
440 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ltrv Data clones from the LTVR populationmarkers Data of molecular markers
melon Data of yield of melon in a Latin square
experiment
natives Data of native potato
pamCIP Data Potato Wild
paracsho Data of Paracsho biodiversity
plots Data for an analysis in split-plot
potato Data of cutting
ralstonia Data of population bacterial Wilt: AUDPC
rice Data of Grain yield of rice variety IR8
sinRepAmmi Data for AMMI without repetition
soil Data of soil analysis for 13 localities
sweetpotato Data of sweetpotato yield
trees Data of species trees. Pucallpa
wilt Data of Bacterial Wilt (AUDPC) and soil
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
441 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.4. Data dari Paket asuR
BtheB Beat the Blues Data
BtheBlong Beat the Blues Data
budworm budworm data
cathedral Medieval cathedrals in England
flowers Flower
gala Species diversity on the Galapagos Islands
growth Weight Gain of two Species at different
Nitrogen Concentrations
houseflies Housfly Development
mytrees Simulated tree data
oring O-ring data
pea Pea data
plants Plant height
schoolclass Schools and Classes
unemployment data on long / short term unemployment
weight Weight Gain
wellplate wellplate
wellplate2 wellplate
wellplate3 wellplate
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
442 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
443 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.5. Data dari Paket car
Adler Experimenter Expectations
Angell Moral Integration of American Cities
Anscombe U. S. State Public-School Expenditures
Baumann Methods of Teaching Reading Comprehension
Bfox Canadian Women's Labour-Force Participation
Blackmoor Exercise Histories of Eating-Disordered and
Control Subjects
Burt Fraudulent Data on IQs of Twins Raised Apart
Can.pop Canadian Population Data
Chile Voting Intentions in the 1988 Chilean
Plebiscite
Chirot The 1907 Romanian Peasant Rebellion
Cowles Cowles and Davis's Data on Volunteering
Davis Self-Reports of Height and Weight
DavisThin Davis's Data on Drive for Thinness
Duncan Duncan's Occupational Prestige Data
Ericksen The 1980 U.S. Census Undercount
Florida Florida County Voting
Freedman Crowding and Crime in U. S. Metropolitan Areas
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
444 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Friendly Format Effects on RecallGinzberg Data on Depression
Greene Refugee Appeals
Guyer Anonymity and Cooperation
Hartnagel Canadian Crime-Rates Time Series
Leinhardt Data on Infant-Mortality
Mandel Contrived Collinear Data
Migration Canadian Interprovincial Migration Data
Moore Status, Authoritarianism, and Conformity
Mroz U.S. Women's Labor-Force Participation
OBrienKaiser O'Brien and Kaiser's Repeated-Measures Data
Ornstein Interlocking Directorates Among Major Canadian
Firms
Pottery Chemical Composition of Pottery
Prestige Prestige of Canadian Occupations
Quartet Four Regression Datasets
Robey Fertility and Contraception
SLID Survey of Labour and Income Dynamics
Sahlins Agricultural Production in Mazulu Village
Soils Soil Compositions of Physical and Chemical
Characteristics
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
445 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
States Education and Related Statistics for the U.S.
States
UN GDP and Infant Mortality
US.pop Population of the United States
Vocab Vocabulary and Education
Womenlf Canadian Women's Labour-Force Participation
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
446 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.6. Data dari Paket DAAG
ACF1 Aberrant Crypt Foci in Rat Colons
Cars93.summary A Summary of the Cars93 Data set
DAAGxdb List, each of whose elements hold rows
of a file, in character format
Lottario Ontario Lottery Data
Manitoba.lakes The Nine Largest Lakes in Manitoba
SP500W90 Closing Numbers for S and P 500 Index - First
100 Days of 1990
SP500close Closing Numbers for S and P 500 Index
ais Australian athletes data set
allbacks Measurements on a Selection of Books
anesthetic Anesthetic Effectiveness
ant111b Averages by block of corn yields, for treatment
111 only
antigua Averages by block of yields for the Antigua
Corn data
appletaste Tasting experiment that compared four apple
varieties
austpop Population figures for Australian States and
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
447 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Territoriesbiomass Biomass Data
bomsoi Southern Oscillation Index Data
bomsoi2001 Southern Oscillation Index Data
bostonc Boston Housing Data -- Corrected
carprice US Car Price Data
cerealsugar Percentage of Sugar in Breakfast Cereal
cfseal Cape Fur Seal Data
cities Populations of Major Canadian Cities (1992-96)
codling Dose-mortality data, for fumigation of codling
moth with methyl bromide
cottonworkers Occupation and wage profiles of British cotton
workers
cuckoohosts Comparison of cuckoo eggs with host eggs
cuckoos Cuckoo Eggs Data
dengue Dengue prevalence, by administrative region
dewpoint Dewpoint Data
droughts Periods Between Rain Events
elastic1 Elastic Band Data Replicated
elastic2 Elastic Band Data Replicated Again
elasticband Elastic Band Data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
448 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
fossilfuel Fossil Fuel Data
fossum Female Possum Measurements
frogs Frogs Data
frostedflakes Frosted Flakes data
fruitohms Electrical Resistance of Kiwi Fruit
geophones Seismic Timing Data
head.injury Minor Head Injury (Simulated) Data
headInjury Minor Head Injury (Simulated) Data
hills Scottish Hill Races Data
hills2000 Scottish Hill Races Data - 2000
houseprices Aranda House Prices
humanpower1 Oxygen uptake versus mechanical power, for
humans
humanpower2 Oxygen uptake versus mechanical power, for
humans
ironslag Iron Content Measurements
jobs Canadian Labour Force Summary Data (1995-96)
kiwishade Kiwi Shading Data
leafshape Full Leaf Shape Data Set
leafshape17 Subset of Leaf Shape Data Set
leaftemp Leaf and Air Temperature Data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
449 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
leaftemp.all Full Leaf and Air Temperature Data Set
litters Mouse Litters
lung Cape Fur Seal Lung Measurements
measles Deaths in London from measles
medExpenses Family Medical Expenses
mifem Mortality Outcomes for Females Suffering
Myocardial Infarction
mignonette Darwin's Wild Mignonette Data
milk Milk Sweetness Study
modelcars Model Car Data
monica WHO Monica Data
moths Moths Data
nsw74demo Labour Training Evaluation Data
nsw74psid1 Labour Training Evaluation Data
nsw74psid3 Labour Training Evaluation Data
nsw74psidA A Subset of the nsw74psid1 Data Set
oddbooks Measurements on 12 books
orings Challenger O-rings Data
ozone Ozone Data
pair65 Heated Elastic Bands
possum Possum Measurements
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
450 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
possumsites Possum Sites
poxetc Deaths from various causes, in London from
1629 till 1881, with gaps
primates Primate Body and Brain Weights
races2000 Scottish Hill Races Data - 2000
rainforest Rainforest Data
rareplants Rare and Endangered Plant Species
rice Genetically Modified and Wild Type Rice Data
roller Lawn Roller Data
science School Science Survey Data
seedrates Barley Seeding Rate Data
socsupport Social Support Data
softbacks Measurements on a Selection of Paperback Books
sorption sorption data set
spam7 Spam E-mail Data
stVincent Averages by block of yields for the St. Vincent
Corn data
sugar Sugar Data
tinting Car Window Tinting Experiment Data
toycars Toy Cars Data
two65 Unpaired Heated Elastic Bands
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
451 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
vince111b Averages by block of corn yields, for treatment
111 only
vlt Video Lottery Terminal Data
wages1833 Wages of Lancashire Cotton Factory Workers in
1833
whoops Deaths from whooping cough, in London
zzDAAGxdb List, each of whose elements hold rows of a
file, in character format
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
452 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.7. Data dari Paket dataset
AirPassengers Monthly Airline Passenger Numbers 1949-1960
BJsales Sales Data with Leading Indicator
BJsales.lead (BJsales)
Sales Data with Leading Indicator
BOD Biochemical Oxygen Demand
CO2 Carbon Dioxide uptake in grass plants
ChickWeight Weight versus age of chicks on different diets
DNase Elisa assay of DNase
EuStockMarkets Daily Closing Prices of Major European Stock
Indices, 1991-1998
Formaldehyde Determination of Formaldehyde
HairEyeColor Hair and Eye Color of Statistics Students
Harman23.cor Harman Example 2.3
Harman74.cor Harman Example 7.4
Indometh Pharmacokinetics of Indomethicin
InsectSprays Effectiveness of Insect Sprays
JohnsonJohnson Quarterly Earnings per Johnson & Johnson Share
LakeHuron Level of Lake Huron 1875-1972
LifeCycleSavings Intercountry Life-Cycle Savings Data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
453 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Loblolly Growth of Loblolly pine treesNile Flow of the River Nile
Orange Growth of Orange Trees
OrchardSprays Potency of Orchard Sprays
PlantGrowth Results from an Experiment on Plant Growth
Puromycin Reaction velocity of an enzymatic reaction
Seatbelts Road Casualties in Great Britain 1969-84
Theoph Pharmacokinetics of theophylline
Titanic Survival of passengers on the Titanic
ToothGrowth The Effect of Vitamin C on Tooth Growth in
Guinea Pigs
UCBAdmissions Student Admissions at UC Berkeley
UKDriverDeaths Road Casualties in Great Britain 1969-84
UKgas UK Quarterly Gas Consumption
USAccDeaths Accidental Deaths in the US 1973-1978
USArrests Violent Crime Rates by US State
USJudgeRatings Lawyers' Ratings of State Judges in the US
Superior Court
USPersonalExpenditure Personal Expenditure Data
VADeaths Death Rates in Virginia (1940)
WWWusage Internet Usage per Minute
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
454 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
WorldPhones The World's Telephones
ability.cov Ability and Intelligence Tests
airmiles Passenger Miles on Commercial US Airlines,
1937-1960
airquality New York Air Quality Measurements
anscombe Anscombe's Quartet of "Identical" Simple Linear
Regressions
attenu The Joyner-Boore Attenuation Data
attitude The Chatterjee-Price Attitude Data
austres Quarterly Time Series of the Number of
Australian Residents
beaver1 (beavers) Body Temperature Series of Two Beavers
beaver2 (beavers) Body Temperature Series of Two Beavers
cars Speed and Stopping Distances of Cars
chickwts Chicken Weights by Feed Type
co2 Mauna Loa Atmospheric CO2 Concentration
crimtab Student's 3000 Criminals Data
discoveries Yearly Numbers of Important Discoveries
esoph Smoking, Alcohol and (O)esophageal Cancer
euro Conversion Rates of Euro Currencies
euro.cross (euro) Conversion Rates of Euro Currencies
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
455 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
eurodist Distances Between European Cities
faithful Old Faithful Geyser Data
fdeaths (UKLungDeaths)
Monthly Deaths from Lung Diseases in the UK
freeny Freeny's Revenue Data
freeny.x (freeny) Freeny's Revenue Data
freeny.y (freeny) Freeny's Revenue Data
infert Infertility after Spontaneous and Induced
Abortion
iris Edgar Anderson's Iris Data
iris3 Edgar Anderson's Iris Data
islands Areas of the World's Major Landmasses
ldeaths (UKLungDeaths)
Monthly Deaths from Lung Diseases in the UK
lh Luteinizing Hormone in Blood Samples
longley Longley's Economic Regression Data
lynx Annual Canadian Lynx trappings 1821-1934
mdeaths (UKLungDeaths)
Monthly Deaths from Lung Diseases in the UK
morley Michaelson-Morley Speed of Light Data
mtcars Motor Trend Car Road Tests
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
456 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
nhtemp Average Yearly Temperatures in New Haven
nottem Average Monthly Temperatures at Nottingham,
1920-1939
precip Annual Precipitation in US Cities
presidents Quarterly Approval Ratings of US Presidents
pressure Vapor Pressure of Mercury as a Function of
Temperature
quakes Locations of Earthquakes off Fiji
randu Random Numbers from Congruential Generator
RANDU
rivers Lengths of Major North American Rivers
rock Measurements on Petroleum Rock Samples
sleep Student's Sleep Data
stack.loss (stackloss)
Brownlee's Stack Loss Plant Data
stack.x (stackloss) Brownlee's Stack Loss Plant Data
stackloss Brownlee's Stack Loss Plant Data
state.abb (state) US State Facts and Figures
state.area (state) US State Facts and Figures
state.center (state) US State Facts and Figures
state.division (state)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
457 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
US State Facts and Figures
state.name (state) US State Facts and Figures
state.region (state) US State Facts and Figures
state.x77 (state) US State Facts and Figures
sunspot.month Monthly Sunspot Data, 1749-1997
sunspot.year Yearly Sunspot Data, 1700-1988
sunspots Monthly Sunspot Numbers, 1749-1983
swiss Swiss Fertility and Socioeconomic Indicators
(1888) Data
treering Yearly Treering Data, -6000-1979
trees Girth, Height and Volume for Black Cherry Trees
uspop Populations Recorded by the US Census
volcano Topographic Information on Auckland's Maunga
Whau Volcano
warpbreaks The Number of Breaks in Yarn during Weaving
women Average Heights and Weights for American Women
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
458 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.8. Data dari Paket demogR
Data sets in package demogR:
goodman Demographic data from Venezuela, Madagascar and
the United States in the late 1960s
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
459 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.9. Data dari Paket faraway
aatemp Annual mean temperatures in Ann Arbor, Michigan
abrasion Wear on materials according to type, run and
position
aflatoxin aflatoxin dosage and liver cancer in lab
animals
africa miltary coups and politics in sub-Saharan
Africa
alfalfa Effects of seed inoculum, irrigation and shade
on alfalfa yield
amlxray Match pair study for AML and Xray link
babyfood Respiratory disease rates of babies fed in
different ways
beetle Beetles exposed to fumigant
bliss Bliss insecticide data
breaking Breaking strength of materials
broccoli Broccoli weight variation
cathedral Cathedral nave heights and lengths in England
chicago Chicago insurance redlining
chiczip Chicago zip codes north-south
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
460 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
chmiss Chicago insurance redliningchoccake Chocolate cake experiment with split plot
design
chredlin Chicago insurance redlining
clot Blood clotting times
cmob Social class mobility from 1971 to 1981 in the
UK
cns Malformations of the central nervous system
coagulation Blood coagulation times by diet
composite Strength of a thermoplastic composite
depending on two factors
cornnit Corn yields from nitrogen application
corrosion Corrosion loss in Cu-Ni alloys
cpd Projected and actual sales of 20 consumer
products
ctsib Effects of surface and vision on balance
death Death penalty in Florida 1977
debt psychology of debt
diabetes Diabetes and obesity, cardiovascular risk
factors
dicentric Radiation dose effects on chromosomal
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
461 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
abnormality
divusa Divorce in the USA 1920-1996
drugpsy Choice of drug treatment for psychiatry
patients
dvisits Doctor visits in Australia
eco Ecological regression example
eggprod Treatment and block effects on egg production
eggs Laboratory testing of dried egg fat content
epilepsy Seizure rates of epileptics under treatment
esdcomp Complaints about emergency room doctors
exa Non parametric regression test data A
exb Non parametric regression test data B
eyegrade grading of eye pairs for distance vision
fat Percentage of Body Fat and Body Measurements
femsmoke Mortality due to smoking according age group in
women
fpe 1981 French Presidential Election
fruitfly Longevity of fruiflies depending on sexual
activity and thorax length
gala Species diversity on the Galapagos Islands
gavote Undercounted votes in Georgia in 2000
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
462 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
presidential election
haireye Hair and eye color
happy love, work and happiness
hormone Hormones and Sexual Orientation
hprice Housing prices in US cities 86-94
hsb Career choice of high school students
infmort Infant mortality according to income and region
irrigation Agricultural experiment with irrigation
jsp Junior Schools Project
kanga Historic Kangaroos
lawn Cut-off times of lawnmowers
leafblotch Leaf blotch on barley
mammalsleep Sleep in Mammals: Ecological and Constitutional
Correlates
meatspec Meat spectrometry to determine fat content
melanoma Melanoma by type and location
motorins Third party motor insurance claims in Sweden in
1977
neighbor Questionnaire study of neighborly help
nels88 Subset of National Education Longitudinal Study
1988
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
463 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
nepali Nepali child heath study
nes96 US 1996 national election study
oatvar Yields of oat varieties planted in blocks
odor Odor of chemical by production settings
ohio Ohio Children Wheeze Status
orings Spache Shuttle Challenger O-rings
ozone Ozone readings in LA
parstum Marijuana and parent alcohol and drug use
peanut Carbon dioxide effects on peanut oil extraction
penicillin Penicillin yields by block and treatment
pima Diabetes survey on Pima Indians
pipeline NIST data on ultrasonic measurements of defects
in the Alaska pipeline
pneumo Pneumonoconiosis in coal miners
potuse Marijuana usage by youth
prostate Prostate cancer surgery
psid Panel Study of Income Dynamics subset
pulp Brightness of paper pulp depending on shift
operator
pvc Production of PVC by operator and resin railcar
rabbit Rabbit weight gain by diet and litter
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
464 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
ratdrink Rat growth weights affected by additives
rats Effect of toxic agents on rats
resceram Shape and plate effects on current noise in
resistors
salmonella Salmonella reverse mutagenicity assay
sat School expenditure and test scores from USA in
1994-95
savings Savings rates in 50 countries
seatpos Car seat position depending driver size
semicond Semiconductor split-plot experiment
sexab Post traumatic stress disorder in abused adult
females
sexfun Marital sex ratings
solder Solder skips in circuit board manufacture
sono Sonoluminescence
soybean Germination failures for soybean seeds
spector Teaching methods in Economics
speedo Speedometer cable shrinkage
star Star light intensities and temperatures
stat500 Scores for students in Stat500 class
strongx Strong interaction experiment data
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
465 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
suicide Suicide method data from the UK
teengamb Study of teenage gambling in Britain
toenail Toenail infection treatment study
troutegg Survival of trout eggs depending on time and
location
truck Truck leaf spring experiment
turtle Incubation temperature and the sex of turtles
twins Twin IQs from Burt
uncviet UNC student opinions about the Vietnam War
uswages Weekly wages of US male workers in 1988
vision Vision acuity tests
wafer resitivity of wafer in semiconductor experiment
wavesolder Defects in a wave soldering process
wbca Wisconsin breast cancer database
weldstrength welding strength DOE
wheat Insect damage to wheat varieties
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
466 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.10. Data dari Paket gam
gam.data Simulated dataset for gam
gam.newdata Simulated dataset for gam
kyphosis A classic example dataset for GAMs
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
467 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.11. Data dari Paket ISwR
IgM Immunoglobulin G
alkfos Alkaline phosphatase data
ashina Ashina's crossover trial
bcmort Breast cancer mortality
bp.obese Obesity and blood pressure
caesar.shoe (caesarean)
Caesarean section and maternal shoe size
coking Coking data
cystfibr Cystic fibrosis lung function data
eba1977 Lung cancer incidence in four Danish cities
1968-1971
energy Energy expenditure
ewrates Rates of lung and nasal cancer mortality, and
total mortality.
fake.trypsin Trypsin by age groups
graft.vs.host Graft versus host disease
heart.rate Heart rates after enalaprilat
hellung Growth of Tetrahymena cells
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
468 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
intake Energy intakejuul Juul's IGF data
juul2 Juul's IGF data, extended version
kfm Breast-feeding data
lung Methods for determining lung volume
malaria Malaria antibody data
melanom Survival after malignant melanoma
nickel Nickel smelters in South Wales
nickel.expand Nickel smelters in South Wales, expanded
philion Dose response data
react Tuberculin reactions
red.cell.folate Red cell folate data
rmr Resting metabolic rate
secher Birth weight and ultrasonography
secretin Secretin-induced blood glucose changes
stroke Estonian stroke data
tb.dilute Tuberculin dilution assay
thuesen Ventricular shortening velocity
tlc Total lung capacity
vitcap Vital capacity
vitcap2 Vital capacity, full data set
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
469 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
wright Comparison of Wright peak-flow meters
zelazo Age at walking
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
470 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.12. Data dari Paket lmtest
ChickEgg Chickens, Eggs, and Causality
Mandible Mandible Data
USDistLag US Macroecnomic Data
bondyield Bond Yield
currencysubstitution Currency Substitution
ftemp Femal Temperature Data
fyff U.S. Macroeconomic Time Series
gmdc U.S. Macroeconomic Time Series
growthofmoney Growth of Money Supply
ip U.S. Macroeconomic Time Series
jocci U.S. Macroeconomic Time Series
lhur U.S. Macroeconomic Time Series
moneydemand Money Demand
pw561 U.S. Macroeconomic Time Series
unemployment Unemployment Data
valueofstocks Value of Stocks
wages Wages
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
471 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.13. Data dari Paket MASS
Aids2 Australian AIDS Survival Data
Animals Brain and Body Weights for 28 Species
Boston Housing Values in Suburbs of Boston
Cars93 Data from 93 Cars on Sale in the USA in 1993
Cushings Diagnostic Tests on Patients with Cushing's
Syndrome
DDT DDT in Kale
GAGurine Level of GAG in Urine of Children
Insurance Numbers of Car Insurance claims
Melanoma Survival from Malignant Melanoma
OME Tests of Auditory Perception in Children with
OME
Pima.te Diabetes in Pima Indian Women
Pima.tr Diabetes in Pima Indian Women
Pima.tr2 Diabetes in Pima Indian Women
Rabbit Blood Pressure in Rabbits
Rubber Accelerated Testing of Tyre Rubber
SP500 Returns of the Standard and Poors 500
Sitka Growth Curves for Sitka Spruce Trees in 1988
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
472 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Sitka89 Growth Curves for Sitka Spruce Trees in 1989Skye AFM Compositions of Aphyric Skye Lavas
Traffic Effect of Swedish Speed Limits on Accidents
UScereal Nutritional and Marketing Information on US
Cereals
UScrime The Effect of Punishment Regimes on Crime Rates
VA Veteran's Administration Lung Cancer Trial
abbey Determinations of Nickel Content
accdeaths Accidental Deaths in the US 1973-1978
anorexia Anorexia Data on Weight Change
bacteria Presence of Bacteria after Drug Treatments
beav1 Body Temperature Series of Beaver 1
beav2 Body Temperature Series of Beaver 2
biopsy Biopsy Data on Breast Cancer Patients
birthwt Risk Factors Associated with Low Infant Birth
Weight
cabbages Data from a cabbage field trial
caith Colours of Eyes and Hair of People in Caithness
cats Anatomical Data from Domestic Cats
cement Heat Evolved by Setting Cements
chem Copper in Wholemeal Flour
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
473 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
coop Co-operative Trial in Analytical Chemistry
cpus Performance of Computer CPUs
crabs Morphological Measurements on Leptograpsus
Crabs
deaths Monthly Deaths from Lung Diseases in the UK
drivers Deaths of Car Drivers in Great Britain 1969-84
eagles Foraging Ecology of Bald Eagles
epil Seizure Counts for Epileptics
farms Ecological Factors in Farm Management
fgl Measurements of Forensic Glass Fragments
forbes Forbes' Data on Boiling Points in the Alps
galaxies Velocities for 82 Galaxies
gehan Remission Times of Leukaemia Patients
genotype Rat Genotype Data
geyser Old Faithful Geyser Data
gilgais Line Transect of Soil in Gilgai Territory
hills Record Times in Scottish Hill Races
housing Frequency Table from a Copenhagen Housing
Conditions Survey
immer Yields from a Barley Field Trial
leuk Survival Times and White Blood Counts for
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
474 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Leukaemia Patients
mammals Brain and Body Weights for 62 Species of Land
Mammals
mcycle Data from a Simulated Motorcycle Accident
menarche Age of Menarche data
michelson Michelson's Speed of Light Data
minn38 Minnesota High School Graduates of 1938
motors Accelerated Life Testing of Motorettes
muscle Effect of Calcium Chloride on Muscle
Contraction in Rat Hearts
newcomb Newcomb's Measurements of the Passage Time of
Light
nlschools Eighth-Grade Pupils in the Netherlands
npk Classical N, P, K Factorial Experiment
npr1 US Naval Petroleum Reserve No. 1 data
oats Data from an Oats Field Trial
painters The Painter's Data of de Piles
petrol N. L. Prater's Petrol Refinery Data
phones Belgium Phone Calls 1950-1973
quine Absenteeism from School in Rural New South
Wales
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
475 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
road Road Accident Deaths in US States
rotifer Numbers of Rotifers by Fluid Density
ships Ships Damage Data
shoes Shoe wear data of Box, Hunter and Hunter
shrimp Percentage of Shrimp in Shrimp Cocktail
shuttle Space Shuttle Autolander Problem
snails Snail Mortality Data
steam The Saturated Steam Pressure Data
stormer The Stormer Viscometer Data
survey Student Survey Data
synth.te Synthetic Classification Problem
synth.tr Synthetic Classification Problem
topo Spatial Topographic Data
waders Counts of Waders at 15 Sites in South Africa
whiteside House Insulation: Whiteside's Data
wtloss Weight Loss Data from an Obese Patient
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
476 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
B.14. Data dari Paket UsingR
BushApproval U.S. President George Bush approval ratings
HUMMER Deliveries of new HUMMER vehicles
KSI Data set on automobile deaths and injuries in
Great Britain
MLBattend Major league baseball attendance data
OBP On base percentage for 2002 major league
baseball season
age.universe Best estimate of the age of the universe
aid monthly payment for federal program
alaska.pipeline Comparison of in-field and laboratory
measurement of defects
alltime.movies Top movies of all time
aosat Artic Oscillation data based on SAT data
arctic.oscillations Measurement of sea-level pressure at
the arctic
babies Mothers and their babies data
babyboom Babyboom: data for 44 babies born in one
24-hour period.
batting Batting statistics for 2002 baseball season
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
477 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
baycheck Population estimate of type of Bay Checkerspotbutterfly
best.times Best track and field times by age and distance
blood blood pressure readings
breakdown Time of insulating fluid to breakdown
bright.stars List of bright stars with Hipparcos catalog
number
brightness Brightness of 966 stars
bumpers Bumper repair costs for various automobiles
bycatch Number of Albatrosses accidentaly caught during
a fishing haul
cabinet Estimated tax savings for US President Bush's
cabinet
camp Mount Campito Yearly Treering Data, -3435-1969.
cancer cancer survival times
carbon Carbon Monoxide levels at different sites
carsafety Fatality information in U.S. for several
popular cars
central.park Weather in Central Park NY in May 2003
central.park.cloud Type of day in Central Park, NY May 2003
cfb Bootstrap sample from the Survey of Consumer
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
478 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Finances
chicken weight gain of chickens fed 3 different rations
chips Measurements of chip wafers
co2emiss Carbon Dioxide Emissions from the U.S.A. from
fossil fuel
coins The coins in my change bin
coldvermont Daily minimum temperature in Woodstock Vermont
corn Comparison of corn for new and standard variety
crime violent crime rates in 50 states of US
deflection Deflection under load
diamond Price by size for diamond rings
divorce Time until divorce for divorced women (by age)
do ~~function to do ... ~~
dottodot Dot-to-dot puzzle
dowdata The Dow Jones average from Jan 1999 to October
2000
dvdsales Monthly DVD player sales since introduction to
May 2004
emissions CO2 emissions data and gross domestic product
for 26 countries
ewr Taxi in and taxi out times at EWR (Newark)
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
479 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
airport for 1999-2001
exec.pay Direct compensation for 199 United States CEOs
in the year 2000
fat Body measurements to predict percentage of body
fat in males
father.son Pearson's data set on heights of fathers and
their sons
female.inc Income distribution for females in 2001
firstchi Age of mother at birth of first child
five.yr.temperature Five years of weather in New York City
florida County-by-county results of year 2000 US
presidential election in Florida
galileo Galileo data on falling bodies
galton Galton's height data for parents and children
gap Sales data for the Gap
gasprices Monthly average gasoline prices in the United
States
goalspergame Goals per game in NHL
google Google stock values during 2005-02-07 to
2005-07-07
grades Current and previous grades
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
480 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
grip Effects of cross-country ski-pole grip
hall.fame Data frame containing baseball statistics
including Hall of Fame membership
healthy Healthy or not?
heartrate Simulated data of age vs. max heart rate
home Maplewood NJ homedata
homedata Maplewood NJ assessed values for years 1970 and
2000
homeprice Sale price of homes in New Jersey in the year
2001
homework Homework averages for Private and Public
schools
iq IQ scores
kid.weights Weight and height measurement for a sample of
U.S. children
last.tie Last tie in 100 coin tosses
lawsuits Law suit settlements
malpract malpractice settlements
mandms Proportions of colors in various M and M's
varieties
math Standardized math scores
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
481 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
maydow Dow Jones industrial average and May maximum
temperature
midsize Price of new and used of three mid-sized cars
mw.ages Age distribution in year 2000 in Maplewood New
Jersey
nba.draft NBA draft lottery odds for 2002
normtemp Body temperature and heart rate of 130 health
individuals
npdb National Practioner Data Bank
nym.2002 Random sample of 2002 New York City Marathon
finishers
oral.lesion Oral lesion location by town
ozonemonthly Monthly mean ozone values at Halley Bay
Antartica
paradise Annual snowfall at Paradise Ranger Station,
Mount Ranier
pi2000 first 2000 digits of pi
primes Primes numbers less than 2003
puerto Incomes for Puerto Rican immigrants to Miami
rat Survival times of 20 rats exposed to radiation
reaction.time Reaction time with cell phone usage
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
482 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
reddrum Growth of red drum
salmon.rate Simulated Data on Rate of Recruitment for
Salmon
salmonharvest Salmon harvest in Alaska from 1980 to 1998
samhda Substance Abuse and Mental Health Data for
teens
scatter.with.hist Scatterplot with histograms
scrabble Distribution of Scrabble pieces
simple.sim Simplify the process of simulation
skateranks Judges scores for disputed ice skating
competition
slc Sodium-Lithium countertransport
smokyph Water pH levels at 75 water samples in the
Great Smoky Mountains
south Murder rates for 30 Southern US cities
southernosc Southern Oscillations
sp500.excess Excess returns of S&P 500
squareplot Create a squareplot alternative to a segmented
barplot
stud.recs Student records
student.expenses Some simulated data on student expenses
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
483 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
superbarplot super segmented barplot
tastesgreat Does new goo taste great?
tcm1y One-year treasury security values
tempsalinity Temperature/Salinity measurements along a
moving Eddy
too.young What age is too young for a male to data a
female?
twins Burt's IQ data for twins
u2 Song and lengths for U2 albums
urchin.growth Data on growth of sea urchins
vacation vacation days
watertemp Temperature measurement of water at 85m depth
yellowfin Yellow fin tuna catch rate in Tropical Indian
Ocean
/
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
484 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
INDEKS PENULIS
Akaike, 261
Bowerman, 56, 235, 272
Burns, 78
Chamber, 70, 261, 341, 347
Cleveland, 70
Crawley, 235, 272, 325
Davidian, 60
Diggle, 356, 357
Dobson, 63, 277, 313, 315, 347
Faraway, 235, 257
Giltinan, 60
Harville, 144
Hastie, 70, 261
Hjorth, 261
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
485 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Kenward, 364
Kuhnert, 272
Kutner, 272
Laird, 60
Liang, 361
Maindonald, 272
McCullagh, 277, 355
Mendenhall, 44
Meyer, 31
Murrel, 272
Nelder, 277, 347, 355
Neter, 56, 144, 235, 272
Ripley, 235, 261, 347
Searle, 144
Smith, 364
Smyth, 51
Tibshirani, 70
Timm, 144
Tirta, 65, 73, 78, 91, 243, 246, 396
Venables, 70, 235, 261, 272
Vezalini, 272
Wackery, 44
Ware, 60
Wasserman, 272
Wedderburn, 361
Zeger, 361
Zoonekyn, 272
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
486 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
INDEKS SUBJEK
seragam, 364
algoritma
lengkap, 50
penuh, 51
terpartisi, 50, 51
AR-1, 364
boneka, 197
CLI, 72
distribusi
Binomial, 284
Binomial Negatif, 287
eksponensial, 287
Gamma, 286
Inverse Gauss, 287
Normal, 286
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
487 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
Pareto, 287
Poisson, 285
eksplanatori, 275
eleminsi, 29
fungsi hubungan
kanonik, 63
natural, 63
Gamma-HGLM, 374
GEE, 351, 363, 364
GLM, 363
GLS, 185
GUI, 72
heteroskedastik, 182, 185
homoskedastik, 182, 185
invariant, 52
JGIG, 374, 394
kanonik, 278
keluarga eksponensial, 62, 276, 277
korelasi
serial, 59
uniform, 58
log komplementer, 297
logistik, 322
logit, 90, 297, 322
longitudinal, 60, 350
matriks
determinan, 115
ordo, 113
positif definit, 123
positif semi definit, 124
singuler, 115
teras, 116
model linier
bertingkat, 59
GEE, 65
GLM, 61
GLMM, 64
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
488 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
HGLM, 64
hirarkis tergeneralisir, 64
klasik, 53
LMM, 57
NLM, 55
normal, 53
tergeneralisir, 62
multikolinieritas, 67
Newton-Raphson, 50, 184
pemodelan, 30
deterministik, 33
stokastik, 35
probit, 297, 322
regresi
Ridge, 67
repeated
measurement, 60
measurements, 350
measures, 350
sampel, 44, 45
sekawan, 374, 375
sistematis, 275
skoring
Fisher, 50
skoring Fisher, 184
skrip, 72
WLS, 185
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
489 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
INDEKS FUNGSI R
?NamaPaket, 75
abline(), 79
barplot(), 79
boxplot(), 79
contour(), 79
example(), 75
gee(), 90, 368, 369
glm(), 89, 326, 368
glmML(), 90
help(), 75
hist(), 79
library(), 74
lm(), 88, 213
FMIPA-UNEJ
Daftar Isi
Judul
JJ J I II
490 dari 490
Cari Halaman
Kembali
Layar Penuh
Tutup
Keluar
lmer(), 89
lmm(), 89
lrm(), 90
nls(), 90
pairs(), 79
persp(), 79
plot(), 79, 257
qq.plot(), 79
reg.line(), 79
require(), 74
rug(), 79
scatterplot(), 79
scatterplot.matrix(), 79
sp(), 79
split.screen(), 81
spm(), 79