Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf ·...
Transcript of Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf ·...
PERINGATAN !!! Bismillaahirrahmaanirraahiim
Assalamu’alaikum warahmatullaahi wabarakaatuh
1. Skripsi digital ini hanya digunakan sebagai bahan referensi
2. Cantumkanlah sumber referensi secara lengkap bila Anda mengutip dari Dokumen ini
3. Plagiarisme dalam bentuk apapun merupakan pelanggaran keras terhadap etika moral penyusunan karya ilmiah
4. Patuhilah etika penulisan karya ilmiah
Selamat membaca !!!
Wassalamu’alaikum warahmatullaahi wabarakaatuh
UPT PERPUSTAKAAN UNISBA
PENAKSIRAN PARAMETER DARI MODEL REGRESI BETAUNTUK DATA PROPORSI DENGAN MENGGUNAKAN
METODE KEMUNGKINAN MAKSIMUM
Oleh :
BETA PUTRI WIJAYANPM: 10060108003
PROGRAM STUDI STATISTIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM BANDUNG2012 M / 1433 H
SKRIPSI
PENAKSIRAN PARAMETER DARI MODEL REGRESI BETAUNTUK DATA PROPORSI DENGAN MENGGUNAKAN
METODE KEMUNGKINAN MAKSIMUM
Diajukan untuk memenuhi salah satu persyaratan gunaMemperoleh Gelar Sarjana Sains pada Program Studi Statistika
Fakultas Matematika dan Ilmu Pengetahuan AlamUniversitas Islam Bandung
Oleh:
BETA PUTRI WIJAYANPM: 10060108003
PROGRAM STUDI STATISTIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM BANDUNG2012 M / 1433 H
SKRIPSI
SURAT PERNYATAAN
Yang bertanda tangan di bawah ini :
Nama : Beta Putri Wijaya
NPM : 10060108003
Status : Mahasiswa Semester Delapan Program Studi Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Islam Bandung
Judul Skripsi : PENAKSIRAN PARAMETER DARIMODEL REGRESI BETA UNTUKDATA PROPORSI DENGAN MENGGUNAKANMETODE KEMUNGKINAN MAKSIMUM
Menyatakan dengan sesungguhnya bahwa skripsi atau karya tulis ilmiah
ini benar-benar hasil karya sendiri bukan jiplakan dari hasil karya orang lain.
Demikian pernyataan ini saya buat dengan sebenar-benarnya, dengan harapan
yang berkepentingan menjadi maklum adanya.
Bandung, September 2012
Yang Membuat Pernyataan
Beta Putri Wijaya
Setelah membaca skripsi ini secara seksama,menurut pertimbangan kami telah memenuhi
persyaratan ilmiah sebagai skripsi
Pembimbing I
Nusar Hajarisman., M.Si.
NIK.D.94.0.200
Pembimbing II
Siti Sunendiari.,Dra.,M.Si.
NIK.D.88.0.0.76
Mengetahui,
Dekan
F-MIPA Unisba
M. Yusuf Fajar, Drs., M.Si.
NIP.195610261986021001
Ketua Jurusan Statistika
F-MIPA Unisba
Suliadi, M.Si., Ph.D
NIK. D.97.0.267
Tanggal Lulus : 6 September 2012
JUDUL : PENAKSIRAN PARAMETER DARI MODEL REGRESIBETA UNTUK DATA PROPORSI DENGANMENGGUNAKAN METODE KEMUNGKINANMAKSIMUM
NAMA : BETA PUTRI WIJAYA
NPM : 10060108003
ABSTRAK
Beta Putri Wijaya, 10060108003. Penaksiran Parameter Dari Model RegresiBeta Untuk Data Proporsi Dengan Metode Kemungkinan Maksimum.Di bawah bimbingan Nusar Hajarisman.,M.Si dan Siti Sunendiari.,M.Si.
Skripsi ini menyajikan suatu variabel respons yang berbentuk proporsi yangnilainya berada dalam selang terbuka (0, 1) dapat dihubungkan dengan sejumlahvariabel prediktor melalui model regresi beta. Model ini merupakan bagian darigeneralized linear model (GLM) dimana variabel respons megikuti distribusi betayang merupakan anggota dari keluarga eksponensial. Parameter regresi dari modelregresi beta diinterpretasikan dalam bentuk rata-rata dari respons, dan saatmenggunakan fungsi hubung logit, parameter regresi ini diinterpretasikan sebagaiodds rasio. Penaksiran parameter model menggunakan metode kemungkinanmaksimum, dimana proses penaksirannya harus diselesaikan secara numerik.Dalam skripsi ini penaksiran parameter model regresi beta dilakukan melaluimetode penskoran Fisher berdasarkan pada vektor skor dan matriks informasiFisher untuk menaksir perilaku kelulusan mahasiswa dalam mengikuti TingkatPersiapan Bersama di Institut Pertanian Bogor tahun akademik 1997/1998,dimana hanya jenis kelamin dan nilai ebtanas murni yang dapat mempengaruhiperilaku kelulusan mahasiswa tersebut.
Kata Kunci: distribusi beta, model linear umum, metode kemungkinanmaksimum, odds rasio, dan fungsi logit.
MOTTO DAN PERSEMBAHAN
Motto
Artinya :
“Bahwa tiada yang orang dapatkan, kecuali yang ia usahakan, Dan bahwa
usahanya akan kelihatan nantinya.”
(Q.S. An Najm ayat 39-40)
Persembahan
Dengan rasa syukur yang mendalam skripsi ini kupersembahkan untuk Kedua orang
tuaku tercinta Papa dan Mama, ini anakmu mencoba memberikan yang terbaik
untukmu. Betapa diri ini ingin melihat kalian bangga padaku. Betapa tak ternilai kasih
sayang dan pengorbanan kalian padaku, Maaf bila selama ini anakmu nakal dan tidak
mau mendengar apa kata orang tuanya. Dalam hati ini aku sayang kalian.
Kakakku Eka dan Winda terimakasih atas dukungan kalian yang selalu siap
membantuku, selalu peduli dan terus mendukungku.
Sahabat-sahabatku tersayang,teman seperjuanganku dikampus, Rizky, Sarah, Fitri,
dan Riris terimakash untuk motivasi dan dukunganya
Dan yang terkasih dan tersayang, Ardi terimakasih untuk segala dukungan, motivasi
dan pengertiannya
i
KATA PENGANTAR
Bismillahirahmanirrahiim.
Puji dan syukur penulis panjatkan kehadirat Allah SWT, atas nikmat, rahmat
serta hidayah-Nya, tidak lupa shalawat serta salam tercurah pada Nabi Muhammad
SAW, dengan karunia-Nya sehingga penulis dapat menyelesaikan kuliah di Program
Studi Statistika Universitas Islam Bandung serta menyusun dan menyelesaikan
skripsi yang merupakan salah satu syarat untuk memenuhi kelulusan kuliah pada
Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam di
Universitas Islam Bandung.
Penulis menyadari skripsi ini belum dikatakan sempurna, hal ini dikarenakan
keterbatasan pengetahuan, pengalaman, maupun kemampuan yang dimiliki, Oleh
karena itu penulis mengharapkan semua pihak dapat memberikan saran-saran
penyempurnaan yang berguna bagi penulis khususnya dan bagi pembaca pada
umumnya.
Dengan seluruh kerendahan hati dan penuh rasa hormat penulis mengucapkan
terima kasih dan penghargaan sebesar-besarnya kepada :
1. Bapak Nusar Hajarisman.,M.Si., selaku dosen pembimbing I yang telah
memberikan sumbangan pikiran, pengetahuan, ilmu dan kesempatan serta
kemudahan bagi penulis untuk dapat menyelesaikan skripsi ini.
ii
2. Ibu Siti Sunendiari.,Dra.,M.Si., selaku dosen pembimbing II yang telah
memberikan sumbangan pikiran, pengetahuan, ilmu dan kesempatan serta
kemudahan bagi penulis untuk dapat menyelesaikan skripsi ini.
3. Bapak M. Yusuf Fajar, Drs., M.Si., selaku Dekan FMIPA Universitas Islam
Bandung.
4. Bapak R. Dachlan Muchlis, Drs., M.T., selaku wakil dekan FMIPA Universitas
Islam Bandung.
5. Bapak Suliadi, M.Si., Ph.D., selaku Ketua Program Studi Statistika FMIPA
Universitas Islam Bandung.
6. Bapak Dr. Suwanda, MS., selaku dosen wali Statistika Universitas Islam Bandung
angkatan 2008 yang telah meluangkan waktu dan kesabarannya dalam memberi
pengarahan, ilmu, serta bimbingan selama ini.
7. Dosen-Dosen Program Studi Statistika, yang telah memberikan banyak bekal
ilmu pengetahuan selama perkuliahan.
8. Bapak Mastur, Ibu Tineu, dan bagian administrasi FMIPA yang selalu membantu
penulis dalam proses administrasi perkuliahan dan sidang skripsi.
9. Akang dan Teteh Asisten Lab Statistika terima kasih atas segala bantuan,
dukungan dan waktu luang dalam membantu skripsi ini.
10. Teman-teman Program Studi Statistika angkatan 2005, 2006, 2007, 2008, 2009,
2010 dan 2011 Universitas Islam Bandung, terima kasih untuk suka duka,
bantuan, kebersamaan dan persahabatan kita.
11. Dan semua pihak yang telah membantu dalam penyusunan skripsi ini.
iii
Semoga Allah SWT senantiasa memberikan rahmat dan karunia untuk
memberi balasan atas semua bantuan fikiran yang telah diberikan kepada penulis.
Besar harapan bahwa skripsi ini dapat memberikan manfaat bagi pembaca.
Akhir kata dengan ketulusan dan kerendahan hati, penulis panjatkan dan
semoga Allah SWT membalas budi baik serta melimpahkan rahmat-Nya kepada
semua pihak yang telah memberikan bantuannya, Amin.
Jazakumullaahu khairun katsira
Billahitaufiqwalhidayah. Wassalamu’alaikum Wr. Wb.
Bandung, September 2012
Penulis
iv
DAFTAR ISI
Halaman
KATA PENGANTAR ................................................................................ i
DAFTAR ISI ............................................................................................... iv
DAFTAR TABEL ................................................................................... vi
DAFTAR GAMBAR .................................................................................. vii
DAFTAR LAMPIRAN............................................................................... viii
BAB I PENDAHULUAN
1.1 Latar Belakang Masalah....................................................... 1
1.2 Tujuan dan Manfaat Penelitian.......................................... 3
1.3 Kerangka Penulisan.............................................................. 4
BAB II PENAKSIR MODEL REGRESI BETA
2.1 Pendahuluan.......................................................................... 5
2.2 Generalized Linear Model (GLM)...................................... 6
2.2.1 Distribusi Keluarga Eksponensial............................. 7
2.2.2 Unsur-unsur dalam GLM .......................................... 8
2.3 Prosedur Penaksiran Parameter dalam GLM...................... 9
2.4 Distribusi Beta ...................................................................... 10
2.5 Model Regresi Beta.............................................................. 11
2.6 Penaksir Kemungkinan Maksimum Untuk Regresi Beta .. 14
2.7 Regresi Logistik .................................................................. 17
2.7.1 Uji Kecocokan Model ............................................... 18
2.7.2 Uji Signifikansi Parameter Model ............................. 20
BAB III METODOLOGI PENELITIAN
3.1 Data dan Sumber Data ......................................................... 22
3.2 Tahapan Penelitian ............................................................... 25
v
3.3 Algoritma Penskoran Fisher ................................................ 26
BAB IV HASIL DAN PEMBAHASAN
4.1 Pendahuluan.......................................................................... 29
4.2 Deskriptif Data ...................................................................... 30
4.3 Hasil- hasil Pada Model Regresi Logistik ........................... 34
4.4 Hasil- hasil Pada Model Regresi Beta.................................. 37
4.5 Pembahasan Hasil- hasil dari Kedua Model Regresi .......... 40
BAB V KESIMPULAN DAN SARAN
5.1 Kesimpulan ............................................................................ 43
5.2 Saran....................................................................................... 45
DAFTAR PUSTAKA ................................................................................. 46
LAMPIRAN ................................................................................................ 47
vi
DAFTAR TABEL
No.Tabel Halaman
Tabel 3.1 Daftar Nama Variabel dan Kategori dari Variabel....... 23
Tabel 3.2 Daftar Proporsi Kelulusan Mahasiswa …………........ 24
Tabel 4.1 Model Regresi Logistik Variabel Tunggal.................... 35
Tabel 4.2 Penaksir Koefisien, Standar Error, dan Statistik Chi-kuadrat Berdasarkan Hasil Pada Tabel 4.1................... 36
Tabel 4.3 Penaksir Koefisien, Standar Error, dan Statistik Chi-kuadrat Berdasarkan Hasil Pada Tabel 4.2................... 36
Tabel 4.4 Model Regresi Beta Variabel Tunggal……………..... 38
Tabel 4.5 Penaksir Koefisien, Standar Error, dan Uji t
Berdasarkan Hasil Pada Tabel 4.4.............................. 39
Tabel 4.6 Penaksir Koefisien, Standar Error, dan Uji t
Berdasarkan Hasil Pada Tabel 4.5.............................. 39
vii
DAFTAR GAMBAR
No. Gambar Halaman
Gambar 3.1 Diagram Alir Penskoran Fisher.................................... 28
Gambar 4.1 Diagram Lingkaran Jenis Kelamin............................... 31
Gambar 4.2 Diagram Lingkaran Cara Lolos Seleksi ke IPB............ 31
Gambar 4.3 Box Plot Nilai Rata-rata Ijazah…………………......... 32
Gambar 4.4 Box Plot Nilai Ebtanas Murni………………………... 32
Gambar 4.5 Diagram Lingkaran Daerah Asal Sekolah..................... 33
Gambar 4.6 Diagram Lingkaran Status Asal sekolah….................... 33
viii
DAFTAR LAMPIRAN
No. Lampiran Halaman
Lampiran 1. Notasi ……………………………………….................... 47
Lampiran 2. Data Proporsi Kelulusan Mahasiswa …………......…..…. 48
Lampiran 3. Hasil Output SAS Model Regresi Beta.…………….......... 49
Lampiran 4. Hasil Output SAS Model Regresi Logistik……………….. 52
1
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah
Analisis regresi adalah metode statistika yang digunakan untuk
menyelidiki atau memodelkan hubungan antar variabel bebas dan variabel tak
bebas. Analisis regresi telah banyak diterapkan dalam ilmu sosial dan eksak.
Apabila kita dihadapkan pada suatu masalah penaksir atau peramalan nilai
variabel, katakanlah variabel itu Y dan variabel satunya X, dengan pengambilan
suatu sampel acak berukuran n dari populasi [(xi,yi), untuk i =1,2,..,n], maka data
yang diperoleh dapat diplotkan untuk menghasilkan diagram pencar. Apabila titik-
titik dalam diagram pencar itu mengikuti garis lurus, hal ini menunjukan bahwa
kedua variabel tersebut berhubungan secara linier, dengan secara matematik
hubungan linier yang terbentuk dalam persamaan garis lurus disebut garis regresi
linier.
Persamaaan tersebut dinyatakan oleh:
=ݕ ߚ + +ݔଵߚ ߝ ;= 1,2, . . , ...(1.1)
dimana ߚ menyatakan intersep atau perpotongan dengan sumbu tegak, ଵߚ adalah
kemiringan (slope) atau gradiennya, y adalah variabel tak bebas atau sering juga
disebut sebagai variabel respon, x adalah variabel bebas atau prediktor, dan εi
merupakan variabel acak yang memperhitungkan kegagalan model untuk
kecocokan data secara tepat.
2
Tujuan utama analisis regresi adalah melihat hubungan antara variabel
respon dengan satu atau lebih variabel prediktor. Bentuk hubungan antara kedua
variabel tersebut yang dinyatakan dalam model regresi digunakan utamanya untuk
melihat bagaimana pengaruh dari satu atau lebih variabel prediktor terhadap
variabel respon.
Jika diasumsikan bahwa εi mengikuti distribusi normal dengan rata-rata 0
dan variansi 2 ditulis ߝ ∼ (ܫଶߪ,0) di dalam metode kuadrat terkecil. Ketika
asumsi terpenuhi, maka penaksir kuadrat terkecil mempunyai sifat-sifat kualitas
penaksir yang baik, artinya penaksir tak bias dan bervariansi minimum, maka
penaksir kuadrat terkecil ini akan sama dengan hasil dari metode kemungkinan
maksimum.
Apabila dihadapkan dengan variabel respons yang berbentuk proporsi,
tentu saja penggunaan metode kuadrat terkecil biasa (ordinary least square)
bukan merupakan solusi yang tepat untuk memodelkan data yang variabel
responsnya (y*) berbentuk proporsi. Hal ini bisa terjadi karena dua alasan,
masalah non-linearitas, dimana model regresi linear biasa akan memberikan nilai
taksiran y* di luar wilayah (0, 1), serta masalah heteroskedastisitas, dimana
varians y* adalah tidak konstan.
Untuk mengatasi masalah tersebut biasanya diselesaikan dengan cara
menggunakan pendekatan kemungkinan maksimum berdasarkan pada fungsi
kemungkinan dari distribusi binomial sebagai dasar pada pemodelan regresi
logistik. Namun selain menggunakan pendekatan pemodelan regresi logistik,
pendekatan lain yang dapat digunakan adalah melalui pemodelan regresi beta.
Model yang diusulkan dalam skripsi ini tentu saja berdasarkan asumsi bahwa
3
variabel respons mengikuti distribusi beta. karena model regresi beta merupakan
model yang memberikan penaksir parameter yang akurat dan efisien
dibandingkan dengan metode kuadrat terkecil biasa, ketika variabel respons yang
diamati distribusinya tidak simetris, atau pada saat terjadi masalah
heteroskedastisitas.
Distribusi beta sangat fleksibel dan berbagai fenomena ketidakpastian
dapat dimodelkan dengan menggunakan distribusi beta ini. Fleksibilitas ini
mendorong berkembangnya penggunaan distribusi beta secara empiris dalam
berbagai bidang aplikasi. Distribusi beta dicirikan oleh dua buah parameter
bentuk, dimana melalui transformasi aljabar sederhana dari kedua parameter dapat
ditunjukkan bahwa parameter dalam distribusi beta merupakan parameter rata-rata
dan parameter presisi. Dengan cara tersebut, model regresi beta dapat memberikan
penaksir parameter yang berhubungan dengan perubahan dalam rata-rata dan
dispersi dari variabel respons.
Dari uraian diatas maka dalam skripsi ini akan dibahas mengenai bentuk
pemodelan regresi beta, penaksiran parameter dalam model regresi beta dengan
menggunakan metode pendekatan kemungkinan maksimum.
1.2 Tujuan dan Manfaat Penelitian
Tujuan umum dari penulisan skripsi ini ialah untuk menggambarkan
hubungan fungsional antara variabel respon dengan variabel prediktor, dimana
variabel responnya berbentuk proporsi yang mengikuti distribusi beta. Oleh
karena variabel responnya berbentuk proporsi maka pada umumnya variabel
respon tersebut dimodelkan dengan model regresi logistik, tetapi dalam skripsi ini
4
juga variabel tersebut dapat dimodelkan dengan model regresi beta dengan
demikian tujuan khusus dari skripsi ini yaitu :
Menaksir parameter yang ada dalam model dengan regresi logistik
Menaksir parameter yang ada dalam model dengan regresi beta
Membandingkan hasil-hasil yang diperoleh model regresi logistik
dan model regresi beta.
Solusi dari hasil penelitian ini diharapkan mampu bermanfaat bagi
perkembangan ilmu statistika dan penerapannya di berbagai bidang, khususnya
mereka yang tertarik untuk memodelkan data berbentuk proporsi.
1.3 Kerangka Penulisan
Untuk mempermudah pemahaman mengenai pembahasan skripsi ini maka
dibuatlah kerangka penulisan sebagai berikut : Bab I Pendahuluan, pada bab ini
menjelaskan tentang latar belakang masalah, tujuan beserta manfaat penelitian,
dan kerangka penulisan. Bab II dari skripsi ini berisikan penjelasan tentang
tinjauan pustaka yang dipakai dalam penelitian yang diuraikan dalam teori-teori
mengenai pengertian GLM, distribusi beta, model regresi beta, penaksir
kemungkinan maksimum untuk beta. Bab III Metoda Penelitian, pada bab III ini
diuraikan mengenai data dan sumber data yang digunakan, dan langkah-langkah
penelitian. Bab IV Pembahasan, bab ini menguraikan tentang hasil perhitungan
yang dilakukan berdasarkan data yang diperoleh dengan menggunakan metode-
metode yang sudah dibahas pada bab sebelumnya, dilanjutkan dengan
pembahasan terhadap hasil tersebut. Bab V Kesimpulan saran, bab ini merupakan
bab penutup dari skripsi ini yang berisikan tentang kesimpulan dan saran.
5
BAB II
PENAKSIRAN MODEL REGRESI BETA
2.1 Pendahuluan
Model linier pada umunya berbentuk
���������������������������������������������������������������� = ࢼ + …�������������������������������������������������������������� (2.1)
dengan asumsi bahwa unsur-unsur dari e adalah berdistribusi normal identik dan
saling bebas, ,(ଶߪ,0)ܦܫ~ merupakan basis dari kebanyakan analisis untuk
data-data kontinu.
Dengan adanya berbagai kelebihan dalam teori statistik dan perangkat lunak
komputer, kita dapat menggunakan metoda analog dengan pengembangan model
linear dalam beberapa situasi sebagai berikut:
Variabel respons mempunyai distribusi selain distribusi normal – mereka
mungkin dapat berbentuk kategori daripada kontinu.
Hubungan antara variabel respons dengan penjelasnya tidak perlu
berbentuk linear sederhana seperti dalam (2.1).
Salah satu dari kelebihannya yang telah banyak dikenal juga sebagai sifat-
sifat yang ‘baik’ dari distribusi normal dibagi ke dalam kelas yang lebih luas dari
suatu distribusi yang disebut juga sebagai distribusi dari keluarga eksponensial.
Kelebihan yang kedua adalah perluasan dari metoda numerik untuk
penaksiran parameter, dari kombinasi linear seperti Xβ dalam (2.1) kepada fungsi
dari kombinasi linear seperti ψ(Xβ). Dalam teori prosedur penaksirannya adalah
langsung. Dalam prakteknya prosedur penaksiran ini melibatkan suatu komputasi
tertentu sehingga tidak hanya menjadi lebih mudah dengan perkembangan
6
program komputer untuk optimisasi numerik dari fungsi non-linear. Prosedur
seperti ini sudah ada dalam paket-paket statistik seperti GLIM (Baker dan Nelder,
1978).
2.2 Generalized Model Linear (GLM)
Istilah model linear umum atau generalized linear model (GLM) biasanya
merujuk pada model regresi biasa untuk variabel respons kontinu pada variabel
prediktor kontinu dan/atau kategorik. Model ini juga termasuk model regresi
multipel maupun model ANOVA atau ANCOVA (hanya untuk efek tetap).
Bentuknya adalah
ݔ)~ݕ���������������������������������������������������������(ଶߪ,ߚ … (2.2)
dimana xi berisi kovariat yang diketahui dan β adalah koefisien yang akan ditaksir.
Model ini dapat ditaksir dengan menggunakan metode kuadrat terkecil dan
metode kuadrat terkecil diboboti.
Istilah GLM merujuk pada kelas model yang lebih besar yang
dipopulerkan oleh McCullagh dan Nelder (1989). Dalam model ini, variabel
respons yi diasumsikan mengikuti distribusi dari keluarga eksponensial dengan
rata-rata µi, yang biasanya diasumsikan sebagai suatu fungsi (seringkali
bentuknya nonlinear) dari ݔ.ߚ Beberapa penulis mengatakan bentuknya adalah
nonlinear karena µi seringkali merupakan fungsi nonlinear dari kovariat, tetapi
McCullagh dan Nelder (1983) mempertimbangkan fungsi tersebut sebagai bentuk
yang linear, karena kovariat ini mempengaruhi distribusi dari yi hanya melalui
kombinasi linear dari ݔ.ߚ Perangkat lunak yang pertama kali dikembangkan
untuk mencocokan model ini disebut GLIM, akan tetapi saat ini sudah tersedia
7
paket komputer yang dapat digunakan, termasuk didalamnya adalah melalui
SAS/IML.
Selain distribusi normal, model yang mungkin untuk variabel respons
dalam GLM diantaranya adalah binomial, Poisson, Gamma, ataupun Inverse
Gaussian. Dalam skripsi ini akan difokuskan pembahasannya pada distribusi beta.
2.2.1 Distribusi Keluarga Eksponensial
Perhatikan bila satu buah variabel acak Y yang mempunyai fungsi (massa)
peluang, maka variabel ini disebut diskrit, atau bila satu buah variabel acak Y
yang mempunyai fungsi densitas peluang, maka variabel ini disebut kontinu, yang
bergantung pada satu buah parameter θ. Suatu distribusi merupakan anggota dari
keluarga eksponensial apabila mempunyai bentuk sebagai berikut:
(ߠ,ݕ) = ቊݔ−ߠݕ (ߠ)
()+ ቋ(,ݕ)
= −ቊݔ(ߠ)
()ቋ ൜ݔ
ߠ
()ൠݕ (ߠ,ݕ) … (2.3)
dimana θ disebut juga sebagai parameter kanonik dan φ disebut juga sebagai
parameter dispersi. Rata-rata E(y) = µ merupakan fungsi dari θ itu sendiri,
sehingga θ merupakan parameter yang diamati, sedangkan φ biasanya dianggap
sebagai suatu gangguan. Kemudian a(·), b(·), dan c(·) merupakan suatu fungsi
yang diketahui dan masing-masing mencirikan anggota distribusi dari keluarga
eksponensial. Perlu diketahui bahwa nilai harrapan y, E(y), hanya bergantung pada
parameter θ dan bukan pada parameter φ.
8
2.2.2 Unsur – unsur dalam GLM
Seluruh model linear umum akan mempunyai tiga buah komponen, yaitu :
a. Komponen acak. Komponen ini menggambarkan distribusi dari variabel
respons yang diamati. Variabel respon y1, y2, …, yn merupakan sampel acak
yang distribusinya berasal dari keluarga eksponensial, seperti normal,
binomial, Poisson, gamma, dan banyak lainnya. Distribusi keluarga
eksponensial seluruhnya bergantung pada vektor parameter θ dimana fungsi
loglikelihoodnya dapat ditulis kembali dalam bentuk seperti berikut :
(ߠ)ܮ��������������������� = −(ߠ)
(߶)+
ݕߠ
(߶)+ log[ [(ݕ,߶) … (2.4)
dimana θ adalah parameter kanonik atau natural, φ adalah parameter skala,
serta a(·), b(·), dan c(·) masing-masing mencirikan anggota distribusi dari
keluarga eksponensial.
b. Komponen sistematik. Komponen ini menggambarkan bagaimana kovariat
dimasukan ke dalam model sebagai nilai harapan dari y, µ= E(y). Di dalam
model linear umum ini nilai dari µ akan bervariasi menurut taraf dari variabel
penjelasnya. Komponen sistematik dapat dituliskan dalam bentuk seperti
berikut:
=ߟ��� ߚ = ߚ + +ଵݔଵߚ +⋯+ଶݔଶߚ =ݔߚ ൦
ଵߟଶߟ⋮ߟ
൪ … (2.5)
Kombinasi linear dari variabel penjelas ini disebut juga sebagai prediktor
linear. Beberapa {xj} dapat berbentuk lainnya di dalam model, misalnya x3 =
x1x2 untuk menyatakan bentuk interaksi antara variabel x1 dan x2 dalam
9
memberikan efek pada y, atau mungkin dapat berbentuk x2 = x12 untuk
menyatakan adanya bentuk kurva dari variabel x1.
c. Fungsi hubung. Komponen ini menyatakan, bagaimana µ= E(y) berhubungan
dengan variabel penjelas (X) di dalam prediktor linear. Kita dapat memodelan
rata-rata µ secara langsung atau memodelkan suatu fungsi monoton g(µi).
Persamaan model menyatakan bahwa :
�������������������������������������������������� (ߤ) = =ߟ …��������������������������������������������ߚ (2.6)
Untuk beberapa fungsi g monoton, yang biasa disebut sebagai fungsi
penghubung (link function).
2.3 Prosedur Penaksiran Model dalam GLM
Dalam regresi linier sederhana, metode yang paling banyak digunakan
untuk menaksir parameter itu adalah metode kuadrat terkecil. Pada metode
tersebut kita pilih suatu nilai β0 dan β1 tertentu yang akan meminimumkan jumlah
kuadrat error dari nilai pengamatan Y dari nilai taksirannya berdasarkan model
tertentu. Di bawah asumsi yang biasa untuk regresi linier, metode kuadrat terkecil
menghasilkan penaksir dengan sejumlah persyaratan secara statistik tertentu. Jika
metode ini diterapkan pada model dengan variabel biner, maka penaksir tersebut
tidak akan mempunyai sifat yang sama.
Metode umum penaksiran yang membawa kepada fungsi kuadrat terkecil
di bawah model regresi linier (jika bentuk galatnya menyebar normal) disebut
dengan kemungkinan maksimum. Metode ini akan memberikan landasan pada
suatu pendekatan pada penaksiran dengan model regresi logistik. Metode
kemungkinan maksimum akan memberikan nilai-nilai untuk parameter-parameter
10
yang tidak diketahui yang mana akan memaksimumkan peluang yang diperoleh
melalui sekumpulan data pengamatan. Untuk dapat menerapkan metode ini, maka
kita perlu membentuk suatu fungsi yang disebut dengan fungsi kemungkinan
(likelihood function). Fungsi ini menyatakan peluang dari data pengamatan
sebagai fungsi dari parameter yang tidak diketahui tersebut. Penaksir
kemungkinan maksimum dari parameter-parameter itu dipilih sedemikian rupa
sehingga dapat memaksimumkan fungsi tersebut.
Metode penskoran Fisher merupakan salah satu metode yang paling
banyak digunakan untuk menyelesaikan persamaan non linear. Metode ini juga
dapat digunakan untuk menentukan titik maksimum dari suatu fungsi,
sebagaimana permasalahan dalam menentukan penaksir kemungkinan maksimum.
Prosedur penaksiran parameter melalui prosedur ini memerlukan turunan parsial
pertama dan kedua dari fungsi kemungkinan, dimana turunan pertama dan kedua
dari fungsi kemungkinan masing-masing disebut sebagai statistik skor (score
statistics) dan matriks informasi (I).
Statistik skor adalah suatu ukuran untuk menguji keberartian parameter,
dimana statistik ini berbentuk kuadratik yang berdasarkan pada vektor turunan
pertama parsial dari fungsi log kemungkinan terhadap β, yang dievaluasi pada saat
H0: β = β0. Sedangkan matriks informasi merupakan nilai harapan yang berharga
negatif dari matriks turunan kedua parsial dari fungsi log kemungkinan.
2.4 Distribusi Beta
Dalam teori probabilitas dan statistik, distribusi beta adalah distribusi
probabilitas yang didefinisikan pada interval (0, 1) oleh dua parameter positif,
bentuk parameter biasanya dilambangkan dengan a dan b. Fungsi densitas dari
11
suatu variabel acak Y yang berdistribusi Beta, dengan parameter a dan b, dapat
ditulis sebagai berikut :
(ݕ) = ቐ
Γ(+ )
Γ( )Γ( )ଵ(1ݕ − ଵ(ݕ ; 0 < >ݕ 1,> 0,> 0
0 �ݕ; �ݕ
… (2.7)
dimana Г(.) merupakan fungsi gamma. Rata-rata dan variansi dari distribusi Beta
dengan parameter a dan b masing-masing adalah :
()ܧ������������������������������ =
+ … (2.8)
dan
ݒ���������������� ()�ݎ =
(+ )ଶ(+ + 1)… (2.9)
2.5 Model Regresi Beta
Pada bagian ini dibahas mengenai suatu model regresi untuk respons yang
mengikuti distribusi beta. Fungsi densitas dari distribusi beta diberikan dalam
Pers. (2.7), dengan parameter a dan b. Akan tetapi untuk keperluan pemodelan,
maka biasanya akan sangat berguna apabila memodelkan rata-rata dari variabel
respons. Selain itu pula biasanya perlu mendefinisikan model sedemikian rupa
sehingga model ini berisi suatu parameter dispersi. Untuk membentuk model
regresi beta dengan menyertakan rata-rata respons bersamaan dengan parameter
dispersinya, maka perlu dilakukan reparameterisasi dari fungsi densitas beta.
Misalkan =ߤ
(ା)dan =ߢ (+ ), sehingga diperoleh bahwa = ߢߤ dan
= (1 − .ߢ(ߤ Dengan demikian, berdasarkan Pers. (2.8) dan (2.9) diketahui
bahwa :
()ܧ������������������������������������� = …����������������������������������������������������������������ߤ (2.10)
12
dan
ݒ��������������������������������� ()�ݎ =1)ߤ − (ߤ
+ߢ 1… (2.11)
dimana µ adalah rata-rata dari variabel respons dan κ dapat diinterpretasikan
sebagai parameter dispersi, dalam arti bahwa untuk µ tertentu, maka nilai dari κ
lebih besar akan memberikan varians bagi variabel respons yang lebih kecil.
Setelah dilakukan reparameterisasi tersebut, maka fungsi untuk variabel
acak Y yang mengikuti distribusi beta menjadi :
������� (ݕ) =Γ(ߢ)
Γ(ߢߤ)Γ((1 − (ߢ(ߤఓଵ(1ݕ − ଵ(ଵఓ)(ݕ ; 0 < >ݕ 1 … (2.12)
Parameterisasi semacam ini menyatakan bahwa 0 < >ߤ� 1 dan <�ߢ 0, dan juga
dapat dengan mudah ditunjukkan bahwa��= <�ߢߤ 0 dan �= 1)ߢ� (ߤ– > 0.
Untuk membentuk model regresi beta dilakukan pendekatan GLM dengan
menggunakan dua fungsi hubung yaitu, satu fungsi hubung digunakan untuk
parameter lokasi ߤ dan fungsi hubung yang lainnya digunakan untuk parameter
dispersi .ߢ Menurut Smithson dan Verkuilen (2005) bahwa fungsi ini merupakan
fungsi non linear, halus (smooth), dan monoton yang memetakan dari ruang yang
tidak berbatas (unbounded) dari prediktor linear ke dalam ruang sampel yang
diamati, dalam hal ini terbatas pada interval terbuka (0, 1). Misalkan X dan Z
adalah matriks kovariat (mungkin bisa identik), dengan xi dan zi merupakan
vektor baris ke-i dari kedua matriks tersebut. Dimisalkan pula ࢼ dan masing-
masing adalah vektor koefisien regresi beta. GLM untuk parameter lokasi
biasanya adalah
�������������������������������������������������� (ߤ) = …����������������������������������������������������������ࢼ (2.13)
13
dimana (. )adalah fungsi hubung monoton, suatu fungsi yang mempunyai
turunan. Fungsi hubung yang digunakan oleh Pers (2.13) adalah menggunakan
fungsi hubung logit. Bentuk umum dari hubungan antara rata-rata dan varians
adalah
ߪ��������������������������������������������ଶ = (ߢ)ݑ(ߤ)ߥ … (2.14)
dimana v dan u adalah fungsi yang bersifat non-negatif. Parameter dispersi ߢ
diasumsikan sebagai suatu bentuk yang dapat dimodelkan sebagai
ℎ(ߢ) = ࢠ…������������������������������������������������������� (2.15)
dimana h merupakan fungsi hubung yang lain, yaitu dalam hal ini menggunakan
fungsi hubung log dimana variabel zi yang dinyatakan dalam Pers (2.15) berupa
vektor satu.
Untuk variabel respons yang berdistribusi beta, maka rata-ratanya harus
berada dalam selang terbuka, sehingga diperlukan suatu fungsi hubung yang dapat
memenuhi kondisi tersebut. Salah satu pilihan fungsi hubung yang dapat
digunakan adalah fungsi hubung logit, karena fungsi hubung ini mampu
memetakan ߤ ∈ (0, 1) ke dalam ruang sampel yang sesuai dengan distribusinya.
Fungsi hubung logit ini juga biasa digunakan sebagai fungsi hubung dalam model
regresi logistik. Dengan demikian, model regresi beta dapat dikatakan sebagai
bentuk umum dari model regresi logistik ketika variabel respon yang diamati
berbentuk proporsi.
Parameter dispersi κ harus bernilai positif karena setelah
direpatameterisasi parameter µ dan κ bernilai positif. Fungsi hubung log yang
dapat memenuhi sifat tersebut, yaitu
log (ߢ) = ࢠ−…���������������������������������������������� (2.16)
14
sehingga nilai taksiran untuk parameter dispersinya dimodelkan dalam bentuk
=ߢ���������������������������������������� exp൫−ࢠ൯ … (2.17)
disini digunakan tanda negatif untuk membuat interpretasi mengenai koefisien ߜ
menjadi lebih mudah. Oleh karena merupakanߢ parameter dispersi, maka suatu ߜ
yang bernilai positif mengindikasikan variansi yang lebih kecil, dan hal ini tentu
saja menjadi sulit dalam interpretasinya.
2.6 Penaksir Kemungkinan Maksimum Untuk Regresi Beta
Misalkan Yi, …, Yn adalah variabel acak saling bebas, dimana untuk setiap
Yi, untuk i = 1, …, n mengikuti densitas yang diberikan dalam Pers. (2.12)
dengan rata-rata ߤ dan parameter dispersi ߢ yang tidak diketahui. Model
diperoleh dengan cara mengasumsikan bahwa rata-rata yt dapat ditulis sebagai
berikut
������������������������������� (ߤ) = ߚݔ
ୀଵ
…���������������������������������������������������������������������������ߟ���= (2.18)
dimana ࢼ = ,ଵߚ) (ߚ… adalah vektor dari parameter regresi, dan xi1, …, xip
merupakan data pengamatan pada k buah kovariat, untuk < , yang
diasumsikan tetap (fixed) dan diketahui bahwa varians dari respons y merupakan
fungsi dari ,ߤ dan akibatnya juga merupakan fungsi dari nilai kovariatnya. Dengan
demikian, varians yang tidak konstan secara tidak langsung akan diakomodasikan
ke dalam model. Disini terlihat parameter rata-rata dibatasi pada selang terbuka
(0, 1), sehingga diperlukan suatu fungsi hubung yang akan memetakan parameter
dari interval ke dalam ruang bilangan nyata. Fungsi hubung logit merupakan
fungsi hubung kanonik dan akan mengembalikan penaksir parameter ke dalam
bentuk log odds rasio.
15
Fungsi hubung logit (ߤ) didefinisikan sebagai :
(ߤ) = (ߤ)ݐ = log൬ߤ
1 − ߤ൰=
ࢼ → =ߤexp൫
൯ࢼ
1 + exp((ࢼ
… (2.19)
Dalam hal ini, parameter regresi mempunyai interpretasi yang penting.
Misalkan bahwa nilai dari prediktor ke-i meningkat sebesar c unit, dan variabel
prediktor lainnya dianggap tidak berubah, serta ∗ߤ merupakan rata-rata dari
variabel y di bawah suatu nilai kovariat yang baru, sedangkan ߤ menyatakan rata-
rata y di bawah nilai kovariat yang asli, maka dapat ditunjukkan bahwa :
exp൫ ൯ߚ =∗ߤ /(1 − ∗ߤ )
1)/ߤ − (ߤ… (2.20)
Artinya, exp൫ ൯ߚ adalah sama dengan odds rasio, sama dengan interpretasi
dalam model regresi logistik. Fungsi log-likelihood untuk ruang sampel model
regresi beta memiliki bentuk :
(ߜ,ߚ)�������������������������������������� = ߢ,ߤ)
ୀଵ
) … (2.21)
dimana
(ߢ,ߤ) = Γ(ߢ) − logΓ(ߤߢ) − Γ{(1 − {ߢ(ߤ + −ߢߤ) 1) ݕ
+ {(1 − −ߢ(ߤ 1} log(1 − (ݕ … (2.22)
Atau dapat dituliskan dalam bentuk persamaan seperti berikut :
(ࢠ,:ߜ,ߚ) = log Γ൫ ఋ൯ࢠ
− logΓቆఋࢠࢼ
1 + ௫ࢼቇ− logΓቆ
ఋࢠ
1 + ࢼቇ+ቆ
ఋࢠࢼ
1 + ௫ࢼ− 1ቇ logݕ
+ ቆఋࢠࢼ
1 + ௫ࢼ− 1ቇlogݕ+ቆ
ఋࢠ
1 + ࢼ− 1ቇ log(1 − (ݕ … (2.23)
16
Misalkan =ݏ � /ݕ} (1 {(ݕ�− dan ߤ∗ = (ߢߤ) − ((1 − .(ߢ(ߤ Kemudian,
vektor skor yang merupakan turunan pertama dari fungsi log-likelihood terhadap
parameter ࢼ dan , diberikan oleh :
������� (ߜ,ߚ) =(ߢ,ߤ)
ߠ
⎝
⎛
(ߢ,ߤ)
ߚ
(ߢ,ߤ)
ߜ ⎠
⎞
= ൮
−ݏ)ߢ ߤ∗)
൛ߤ௧(ݏ− ߤ∗) + log(1 − (ݕ − ൫(1 − +൯ߢ(ߤ ψ(ߢ)ൟ
ୀଵ
൲��… (2.24)
dimana X adalah matriks data dari variabel prediktor berukuran �× dengan
unsur baris ke-t adalah ݔ dan = �ቂ
ଵ
`,(ଵߤ) … ,
ଵ
`ቃ(ߤ) dan vektor
parameter = .(ߜ,ߚ)
Tahap selanjutnya adalah menentukan matriks informasi. Misalkan diketahui
= ,ଵݓ} … ,{ݓ, dengan
=ݓ�� (ߢߤ)`}ߢ + � `(1 − {(ߢ(ߤ1
ଶ{(ߤ)`}
� = ( ଵ, … , ) dengan = −ߤ(ߢߤ)`}ߢ `(1 − 1)(ߢ(ߤ ,{(ߤ�− dimana
`(. ) merupakan fungsi trigamma. Dimisalkan pula = { ଵ, . . . , },
dengan
= ߤ(ߢߤ)`ଶ + `((1 − 1)(ߢ(ߤ − (ߤ
ଶ− .(ߢ)`
Dengan demikian matriks informasi Fisher, yang merupakan turunan
kedua dari minus ekspetasi fungsi log-likelihood yang diberikan dalam Pers (2.22)
terhadap parameter (ߜ,ߚ) diberikan oleh
17
(ߜ,ߚ)ܫ������������������� = ܧ−
⎣⎢⎢⎢⎡ଶ (ߜ,ߚ)
ଶߚଶ (ߜ,ߚ)
ߜߚ
ଶ (ߜ,ߚ)
ߜ ߚ
ଶ (ߜ,ߚ)
ଶߜ ⎦⎥⎥⎥⎤
… (2.25)
dimanaడమ(ఉ,ఋ)
డఉమ= ߢ ,
డమ(ఉ,ఋ)
డఉడఋ= , dan
డమ(ఉ,ఋ)
డఋమ= ,() Namun di sini
bahwa parameter ߚ dan ߜ bersifat tidak orthogonal.
Pada saat ukuran sampel besar, maka vektor penaksir parameter
ߠ = (መߜ,መߚ) akan mengikuti akan mengikuti pendekatan distribusi normal
multivariat, atau dapat dinyatakan sebagai ቆቀ~ߠߚߜቁ, ,ଵቇ[(ߜ,ߚ)ܫ] dimana መߚ
dan መߜ masing-masing adalah penaksir kemungkinan maksimum. Perlu
ditambahkan juga bahwa ଵ[(ߜ,ߚ)ܫ] dapat digunakan untuk memperoleh galat
baku asimptotik bagi penaksir kemungkinan maksimum
Penaksir kemungkinan maksimum bagi β dan ߜ yang diperoleh dari
U(ߜ,ߚ) = 0 bukan merupakan persamaan tertutup. Dengan demikian solusinya
harus diselesaikan secara numerik dengan menggunakan algoritma optimisasi
nonlinear, seperti metode penskoran Fisher.
2.7 Regresi Logistik
Regresi logistik adalah salah satu bagian dari analisis regresi, yang
digunakan untuk memprediksi peluang kejadian suatu peristiwa dengan
mencocokan data pada fungsi logit. Metode ini merupakan model linier umum
yang digunakan untuk regresi binomial. Seperti analisis regresi pada umunya,
metode ini menggunakan beberapa variabel bebas berupa data berskala interval
dan atau kategorik. Regresi logistik tidak memerlukan asumsi normalitas,
18
heteroskedastitsitas dan autokorelasi, dikarenakan variabel tak bebas yang
terdapat pada regresi logistik merupakan variabel biner (0 dan 1).
Bentuk umum model peluang regresi logistik diformulasikan sebagai berikut :
(ݔ)ߨ������������������������������������ =exp൫
൯ࢼ
1 + exp((ࢼ
… (2.26)
dimana ,1≥(ݔ)ߨ�≥ adalah peluang kejadian sukses dengan nilai peluang 0 (ݔ)ߨ
dan β adalah koefisien parameter.
(ݔ)ߨ merupakan fungsi yang non linier, sehingga perlu dilakukan transformasi
kedalam bentuk logit untuk memperoleh fungsi yang linier. Dengan melakukan
transformasi dari logit ,(ݔ)ߨ maka didapat persamaan yang lebih sederhana,yaitu :
����������������������������� (x) = logగ(௫)
൫ଵగ(௫)൯=
…������������������������������������������������������ࢼ (2.27)
Langkah-langkah yang ada dalam penggunaan analisis regresi logistik yaitu
statistik kecocokan model dan uji signifikansi parameter model.
2.7.1 Uji Kecocokan Model (Goodness Of Fit )
Suatu alat statistik yang digunakan untuk pengujian kecocokan model
berguna untuk memilih sebuah model yang hasilnya paling cocok untuk data yang
diperoleh. Nilai p-value yang tinggi berarti, model merupakan model yang
terbaik. Metode yang digunakan untuk goodness of fit pada data kategorik adalah
statistik chi-kuadrat Pearson, dan statistik chi-kuadrat Deviance dengan hipotesis
uji sebagai berikut:
H0 : Model cocok dengan data
H1 : Model tidak cocok dengan data
19
dimana statistik chi-kuadrat Pearson :
�������������������� ଶ = −ݕ) Ƹ)
Ƹ(1 − (Ƹ
ୀଵ
. . . (2.28)
dan statistik chi-kuadrat Devians :
ܦ������������� = 2 ൜ݕlog��൬ݕොݕ൰+ (− (ݕ log൬
1 − ݕ1 − ොݕ
൰ൠ
ୀଵ
… (2.29)
Baik statistik chi-kuadrat Pearson dan statistik chi-kuadrat Devians
keduanya mengikuti distribusi chi kuadrat. Dengan demikian kriteria uji untuk
menguji dapat dirumuskan seperti berikut :
Jika nilai statistik chi kuadrat Pearson pada Pers (2.28) dibandingkan
dengan nilai chi kuadrat pada derajat bebas (− ( tertentu atau nilai
signifikansi dibandingkan dengan α, dimana apabila nilai chi kuadrat
pearson lebih kecil daripada nilai chi-kuadrat, atau nilai signifikansi lebih
besar dari α, maka hipotesis dari hal ini berarti H0 diterima, yang berati
model cocok dengan data. Dan apabila sebaliknya nilai chi kuadrat
Pearson lebih besar sama dengan nilai chi-kuadrat, atau nilai signifikansi
lebih kecil sama dengan α, maka hipotesis H0 ditolak, yang berarti model
tidak cocok dengan data.
Jika nilai statistik chi kuadrat Devians pada Pers (2.29) dibandingkan
dengan nilai chi kuadrat pada derajat bebas (− ( tertentu atau nilai
signifikansi dibandingkan dengan α, dimana apabila nilai chi kuadrat
Devians lebih kecil daripada nilai chi-kuadrat, atau nilai signifikansi lebih
besar dari α, maka hipotesis dari hal ini berarti H0 diterima, yang berati
20
model cocok dengan data. Dan apabila sebaliknya nilai chi kuadrat
Devians lebih besar sama dengan nilai chi-kuadrat, atau nilai signifikansi
lebih kecil sama dengan α, maka hipotesis H0 ditolak, yang berarti model
tidak cocok dengan data.
2.7.2 Uji Signifikansi Parameter Model
Untuk memeriksa peranan variabel-variabel penjelas (X) dalam model,
dilakukan penguiian terhadap parameter model (β). Penguiian secara simultan
dilakukan menggunakan uji G, sedangkan secara parsial menggunakan statistik uji
T2. Statistik uji G adalah uji rasio kemungkinan ( likelihood ratio test) yang
digunakan untuk menguji peranan variabel penjelas di dalam model secara
bersama-sama. Rumus umum statistik uji G untuk menguii hipotesis :
H0 : β1 = β2 = . . . = βk = 0
H1 : minimal ada satu β yang tidak sama dengan 0
Melalui uji statistik seperti berikut :
ܩ��������������������������������������������� = −2 lnܮܮ
. . . (2.30)
dimana :
Lo = maksimum likelihood dari model reduksi atau model yang terdiri darikonstatnta saja
Lp = maksimum likelihood dari model penuh (full) atau dengan semua variabelbebas.
Statistik G ini secara teoritis mengikuti sebaran chi-kuadrat dengan derajat
bebas k. Kriteria keputusan yang diambil yaitu menolak H0 bila nilai statistik G
lebih besar dari chi-kuadrat. Sementara itu, uji T2 digunakan untuk menguji
parameter βj secara parsial. Hipotesis yang diuji adalah :
21
H0 : βj = 0 (variabel bebas ke-j tidak mempunyai pengaruh secara signifikansi
terhadap model)
H1 : βj ≠ 0 (variabel bebas ke-j tidak mempunyai pengaruh secara signifikansi
terhadap model)
Formula untuk statistik uji T2 adalah :
����������������������� ଶ = �ቆߚ
መ൯ߚ൫ܧቇ
ଶ
… (2.31)
Secara teori statistik uji T2 ini mengikuti sebaran normal baku jika H0 benar.
Kriteria keputusan adalah H0 ditolak jika statistik uji | T2| > zα/2.
22
BAB III
METODOLOGI PENELITIAN
3.1 Data dan Sumber Data
Data yang digunakan dalam skripsi ini merupakan data skunder yang
berasal dari sebuah tesis yang berjudul “Kajian Perbandingan Model Regresi
Beta-binomial dengan Model Regresi Logistik dan Penerapannya untuk Menduga
Pola Kelulusan Mahasiswa IPB-TPB tahun akademik 1997/1998”. Populasi
dalam penelitian adalah mahasiswa – mahasiswa pada program tingkat persiapan
bersama di Institut Pertanian Bogor (IPB). Mahasiswa – mahasiswa yang
dimaksud adalah mahasiswa program strata satu (S1) yang telah diterima di IPB
pada tahun akademik 1997/1998, baik yang diterima melalui saringan ujian masuk
perguruan tinggi negeri (UMPTN) maupun jalur penelusuran minat dan bakat
(atau dikenal pula dengan jalur PMDK). Data akan diambil dari Program Tingkat
Persiapan Bersama IPB dengan banyak pengamatan 2216 pengamatan.
Data yang diperlukan untuk menganalisis pola kelulusan mahasiswa dalam
mengikuti sejumlah mata kuliah yang diselenggarakan pada tingkat persiapan
bersama di Institut Pertanian Bogor (IPB), yaitu semua mata kuliah yang diambil
oleh mahasiswa pada semester satu dan dua.
23
Tabel 3.1. Daftar Nama Variabel dan Kategori dari Variabel
No Nama Variabel Kategori Notasi1 ID
2 Jenis Kelamin (JK)0 = Perempuan1 = Laki - laki
X1
3 Cara lolos seleksi ke IPB (Jalur)0 = PMDK1 = UMPTN
X2
4 Nilai rata-rata ijazah X35 Nilai ebtanas murni/NEM X4
6 Daerah asal sekolah0 = Kabupaten1 = Kotamadya
X5
7 Status sekolah0 = Swasta1 = Negeri
X6
8 Banyaknya mata kuliah yang lulus R9 Banyaknya mata kuliah yang diambil N
10Proporsi banyaknya mata kuliah yanglulus
y*
Nusar Hajarisman (1998). Kajian Perbandingan Model Regresi Beta-Binomial denganModel regresi Logistik dan Penerapannya untuk Menduga Pola Kelulusan MahasiswaIPB-TPB tahun 1997/1998
Variabel ID merupakan nomor induk mahasiswa IPB, baik yang berjenis
kelamin laki-laki ataupun perempuan. Variabel Cara lolos seleksi ke IPB (jalur)
dapat melalui dua tes yaitu PMDK dan UMPTN, dimana Variabel nilai rata-rata
ijazah dan Variabel nilai ebtanas murni (NEM) harus sesuai dengan persyaratan
yang ditentukan oleh pihak kampus yaitu IPB. Variabel Daerah asal sekolah ialah
tempat asal SMU calon mahasiswa itu berada di wilayah kabupaten atau
kotamadya, dengan Variabel status sekolah swasta atau negeri.
Pada dasarnya mahasiswa hanya mengambil banyaknya mata kuliah yang
ada pada semester 1 dan 2, yang bertujuan untuk mengetahui berapa banyaknya
mata kuliah yang lulus dari semester tersebut setelah mengikuti program tingkat
persiapan bersama di Institut Pertanian Bogor (IPB).
Dari hasil program tersebut akan didapat hasil proporsi kelulusan dari
banyaknya mata kuliah yang diambil oleh peserta dimana data proporsi kelulusan
tersebut disajikan pada Tabel 3.2
24
Tabel 3.2 Data proporsi kelulusan Mahasiswa dalam mengambil sejumlah matakuliah yang diselenggarakan pada Tingkat Persiapan Bersama di Institut PertanianBogor pada tahun 1997/1998
Obs ID JK Jalur Ijasah NEMAsal
SekolahStatus
Sekolah
MataKuliah
Yang lulus
MataKuliahyang
diambil
Proporsimata
kuliahyang lulus
1 A00497001 0 1 7.30 43.75 1 0 15 15 1.00
2 A00497002 0 1 8.50 50.86 1 0 15 15 1.00
3 A00497003 0 1 8.70 54.89 1 0 15 15 1.00
4 A00497004 1 1 8.20 51.81 1 0 15 15 1.005 A00497005 0 1 7.31 41.13 1 1 15 15 1.00
6 A00497006 0 0 8.00 52.04 1 0 15 15 1.00
7 A00497007 0 1 7.60 41.78 1 0 15 15 1.00
8 A00497008 0 1 7.50 48.38 1 0 15 15 1.00
9 A00497009 0 1 7.70 55.81 1 0 15 15 1.00
10 A00497010 0 1 7.60 46.82 1 0 15 15 1.00
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2209 G07497028 1 1 7.40 40.92 1 1 3 15 0.20
2210 G07497029 1 1 6.70 34.68 1 1 1 15 0.07
2211 G07497030 1 1 7.60 40.10 1 1 7 15 0.47
2212 G07497031 1 1 7.90 46.70 0 0 6 15 0.40
2213 G07497032 1 1 6.70 40.64 0 0 4 15 0.27
2214 G07497033 1 1 6.40 41.60 0 0 8 15 0.53
2215 G07497034 1 1 7.18 41.39 0 1 1 15 0.07
2216 G07497035 1 1 7.30 52.18 0 0 10 15 0.67
Dari Tabel 3.2 terlihat bahwa nilai dari proporsi mencakup nilai 0 dan 1,
yang mana didalam model regresi beta berada dalam selang (0,1) yaitu tidak
mencakup nilai 0 dan 1. Maka untuk mengatasi permasalahan tersebut dengan
menggunakan persamaan seperti berikut, y’’ = [y(n – 1) + s]/n, dimana s adalah
konstan antara 0 dan 1 yaitu 0.5 menurut Smithson dan Verkuilen (2005). Dari
hasil persamaan berikut maka didapat nilai proporsi yang baru tidak mencakup 0
dan 1, yang disajikan pada Tabel dilampiran 2 .
25
3.2 Tahapan Penelitian
Tahapan yang digunakan dalam menentukan model regresi beta pada data
proporsi yaitu :
1. Mendeskripsikan data penelitian
2. Memodelkan data penelitian dengan regresi logistik, dengan tahapan
sebagai berikut :
a. Mengidentifikasi variabel yang signifikan melalui statistik uji T2
untuk masing-masing variabel prediktor. Proses ini disebut juga
sebagai analisis variabel tunggal dengan mengambil taraf
signifikansi sebesar 30% (Hosmer dan Lemeshow, 1989)
b. Variabel yang dianggap signifikan pada tahap pertama, kemudian
dianalisis secara simultan (proses ini disebut sebagai analisis
variabel ganda). Pada proses ini menggunakan statistik uji chi-
kuadrat pada taraf signifikansi sebesar 10%.
c. Sebelum membuat kesimpulan akhir, untuk setiap variabel yang
dianggap tidak signifikan pada tahap kedua akan diperiksa kembali
signifikansi variabel tersebut terhadap model dengan menggunakan
uji rasio kemungkinan.
3. Memodelkan data penelitian dengan regresi beta, melalui Pers (2.13) dan
(2.17) dimana metode numerik yang digunakan penskoran Fisher, dengan
tahapan sebagai berikut :
a. Mengidentifikasi variabel yang signifikan melalui statistik uji T2
untuk masing-masing variabel prediktor. Proses ini disebut juga
26
sebagai analisis variabel tunggal dengan mengambil taraf
signifikansi sebesar 30% (Hosmer dan Lemeshow, 1989)
b. Variabel yang dianggap signifikan pada tahap pertama, kemudian
dianalisis secara simultan (proses ini disebut sebagai analisis
variabel ganda). Pada proses ini menggunakan statistik uji chi-
kuadrat pada taraf signifikansi sebesar 10%.
c. Sebelum membuat kesimpulan akhir, untuk setiap variabel yang
dianggap tidak signifikan pada tahap kedua akan diperiksa kembali
signifikansi variabel tersebut terhadap model dengan menggunakan
uji rasio kemungkinan.
3.3 Algoritma Penskoran Fisher
Salah satu metode penaksiran model adalah dengan menggunakan
penskoran Fisher, dimana model ini untuk menyelesaikan persamaan non-
linier. Metode ini dapat digunakan untuk menentukan titik maksimum dari
suatu fungsi, sebagaimana permasalahan dalam menentukan penaksir
parameter dengan metode kemungkinana maksimum. Berikut ini prosedur
penskoran Fisher untuk menentukan penaksir β yang dapat memaksimumkan
fungsi kemungkinan, yang sebut saja fungsi u(β*).
Pertama-tama perhatikan bahwa n buah pengamatan akan digunakan
untuk menaksir nilai-nilai dari p buah parameter, β1, β2,..., βp , serta bentuk
fungsi kemungkinan L(β). Turunan sebanyak p buah dari fungsi log
kemungkinan terhadap β1, β2,..., βp, disebut sebagai statistik skor atau disebut
juga sebagai skor efisien (efficient score), dan dapat dipasangkan untuk
memberikan vektor statistik skor p x 1, dimana komponen ke-j adalah
27
,ߚ/(ߚ)ܮ untuk j = 1, 2,..., p. Vektor ini dinotasikan sebagai u(β).
Misalkan I(β) adalah matriks berukuran p x p pada turunan kedua dari log
L(β), dimana unsur-unsur ke-(j, k) dari matriks tersebut adalah:−ܧ൜డమ(ఉ)
డఉೕడఉೖൠ
, untuk j = 1, 2, ..., p dan k = 1, 2, ..., p. Matriks I(β) ini kadang-kadang disebut
juga sebagai matriks Informasi.
Perhatikan u(β), yaitu vektor skor statistik yang dievaluasi pada
penaksir kemungkinan maksimum β, β. Dengan menggunakan deret Taylor,
dimana harga β* diperkirakan akan mendekati β, akan diperoleh:
(ߚ)ݑ��������������������������� ≈ (∗ߚ)ݑ + −ߚ)(∗ߚ)ܫ (∗ߚ … (3.1)
Penaksir kemungkinan maksimum bagi β akan memenuhi persamaan berikut:
(ߚ)ܮ
ߚቤఉ
= 0 … (3.2)
untuk j = 1, 2, ..., p, sehingga u(β) = 0. Dari Pers (3.1) dapat diketahui bahwa:
ߚ ≈ ∗ߚ + (∗ߚ)ݑ(∗ߚ)ଵܫ . Penentuan β yang dicapai melalui proses iterasi
ditentukan oleh:
(௧ାଵ)ߚ���������������������������� = (௧)ߚ + ൯(௧)ߚ൫ݑ൯(௧)ߚଵ൫ܫ … (3.3)
Proses iterasi selesai jika selisih antar iterasi sudah ‘sangat kecil’. Agresti (1990)
menyebutkan salah satu kriteria kekonvergenan (௧)ߚ ke β, yaitu:
ቚߚ(௧ାଵ)
− ≥መቚߚ ቚߚ(௧)− መቚߚ
ଶ
, untuk setiap j, c > 0 ...(3.4)
28
Untuk lebih mudah dapat dilihat pada Gambar 3.1 dibawah ini.
Evaluasi apakah หߠ(௧ାଵ) − >(௧)หߠ
Dimana c=0.0001
(௧ାଵ)ߠ = (௧)ߠ + −ܧ൭
2൫ߤ ൯ߢ,
ߠ൱൩
−1
ቆ൫ߤ ൯ߢ,
ߠቇ
Hitung
Hitung vector skor dan
Matriks informasi
Tentukan nilai awal ߠ
Mulai
TIDAK
Konvergen
en?
YA
Berhenti
Gambar 3.1 Diagram Alir Penskoran Fisher
29
BAB IV
HASIL DAN PEMBAHASAN
4.1 Pendahuluan
Pada bab ini akan dibahas penerapan model regresi beta untuk menduga
pola kelulusan mahasiswa dalam mengambil sejumlah mata kuliah. Dalam
penelitian ini akan diamati proporsi lulus tidaknya seorang mahasiswa dalam
mengikuti sejumlah mata kuliah. Pengamatan seperti ini perlu dicarikan suatu
metode untuk menganalisis hubungan antara proporsi tingkat kelulusan
mahasiswa dengan sejumlah variabel prediktor yang dianggap mampu
menjelaskan proporsi tingkat kelulusan mahasiswa tersebut. Sehingga dalam
penelitian ini digunakan dua tahapan yaitu yang pertama, data yang diperoleh
akan dianalisis melalui metoda baku, dalam hal ini adalah dengan menggunakan
metoda regresi logistik biasa Pada tahap kedua, baru akan dilakukan analisis
dengan menggunakan metoda atau model regresi beta.
Pada masing-masing tahap analisis, sebelumnya kita harus
mendeskripsikan mengenai variabel-variabel yang ada, setelah itu ada dua hal
yang dapat dilakukan sehubungan dengan pemilihan model yang dianggap baik.
Hal-hal yang akan dilakukan itu penaksiran model (termasuk didalamnya
penaksiran parameter di dalam model, serta pengujian keberartian parameter di
dalam model). Metoda penaksiran yang digunakan baik dalam model regresi
logistik maupun dalam model regresi beta adalah dengan menggunakan metoda
kemungkinan maksimum, melalui metoda iterasi seperti metoda Penskoran Fisher.
30
Pada proses pengujian keberartian parameter yang berada di dalam model
biasanya menyangkut perumusan hipotesis statistik untuk menentukan apakah
variabel-variabel prediktor yang digunakan secara berarti berhubungan dengan
variabel responnya. Perbandingan antara nilai pengamatan dari variabel respon
terhadap nilai taksiran yang diperoleh dari model dengan atau tanpa variabel yang
diamati dan berdasarkan pada fungsi log-likelihood merupakan suatu ukuran
untuk menguji keberatian parameter dalam model. Perbandingan parameter yang
berdasarkan pada dua buah log-likelihood ini disebut juga sebagai uji rasio
likelihood (Hosmer dan Lemeshow, 1989). Sedangkan McCullagh dan Nelder
(1983) menyebut statistik ini sebagai devians, yang menyebar secara chi-kuadrat
dengan derajat bebas (n - p).
Adapun ukuran lain yang digunakan untuk menguji keberartian parameter
ini, yaitu dengan menggunakan uji chi-kuadrat untuk regresi logistik dan
menggunakan uji t yang pada dasarnya menunjukkan seberapa jauh pengaruh
satu variabel bebas secara individual dalam menerangkan variasi variabel respon.
Tujuan dari uji t adalah untuk menguji koefisien regresi secara individual pada
regresi beta. Statistik-statistik tersebut nantinya akan digunakan pada proses
pemilihan variabel yang akan masuk ke dalam model.
4.2 Deskripsi Data
Dalam deskripsi data ini penulis mendeskripsikan variabel - variabel
prediktor yang terdapat pada data proporsi kelulusan banyaknya mata kuliah yang
diambil oleh mahasiswa pada tahun akademik 1997/1998. Untuk lebih singkat
deskripsi data akan di visualisasikan melalui Gambar 4.1:
31
Gambar 4.1 Diagram Lingkaran Jenis Kelamin
Dari Gambar 4.1 terlihat bahwa perbandingan persentase perempuan dan
laki-laki yang masuk ke IPB pada tahun akademik 1997/1998 relatif seimbang,
yaitu: 54.51% dan 45.49% .
Gambar 4.2 Diagram Lingkaran Cara Lolos Seleksi ke IPB
Dari Gambar 4.2 terlihat di Institut Pertanian Bogor merupakan salah satu
perguruan tinggi negeri di Indonesia yang menyelenggarakan penyaringan
mahasiswanya melalui dua jalur, yaitu jalur Ujian Masuk Perguruan Tinggi
Negeri (UMPTN) dan jalur Penelusuran Minat dan Bakat IPB (PMDK), dimana
hampir 91,47% diantara mahasiswa yang masuk ke IPB adalah yang melalui jalur
UMPTN.
32
Gambar 4.3 Box Plot Nilai Rata-rata Ijazah
Dari Gambar 4.3 terlihat latar belakang prestasi pendidikan mahasiswa
selama mereka masih duduk di bangku SLTA ditunjukkan oleh nilai rata-rata
ijazah, dimana nilai rata-rata ijazah adalah sebesar 7.45 dengan simpangan baku
sebesar 0.45472, yang mempunyai nilai minimal sebesar 6.00 dan nilai maksimal
sebesar 9.00. Angka-angka tersebut menunjukkan bahwa mahasiswa TPB-IPB
tahun akademik 1997/1998 mempunyai latar belakang prestasi akademik yang
cukup baik.
Gambar 4.4 Box Plot Nilai Ebtanas Murni
33
Dari Gambar 4.4 terlihat latar belakang prestasi pendidikan mahasiswa
selama mereka masih duduk di bangku SLTA ditunjukkan oleh Nilai Ebtanas
Murni (NEM), dimana Nilai Ebtanas Murni (NEM) adalah sebesar 44.31 dengan
simpangan baku sebesar 6.041, yang mempunyai nilai minimal sebesar 23.93 dan
nilai maksimal sebesar 62.29. Angka-angka tersebut menunjukkan bahwa
mahasiswa TPB-IPB tahun akademik 1997/1998 mempunyai latar belakang
prestasi akademik yang cukup baik.
Gambar 4.5 Diagram Lingkaran Daerah Asal Sekolah
Dari Gambar 4.5 terlihat bahwa sebagian besar mahasiswa IPB pada tahun
akademik 1997/1998 masih didominasi oleh para siswa yang berasal dari daerah
kotamadya dibandingkan dengan kabupaten yaitu sebesar 70.31%, dan 29.69%.
Gambar 4.6 Diagram Lingkaran Status Asal sekolah
34
Dari Gambar 4.6 perlu diketahui bahwa perbandingan persentase status
sekolah negeri dan swasta yang masuk ke IPB pada tahun akademik 1997/1998
relatif seimbang, yaitu: 49.05% dan 50.95%
4.3 Hasil - hasil Pada Model Regresi Logistik
Berdasarkan uraian singkat tentang data pada Tabel 3.1, data pengamatan
yang akan diteliti yaitu data proporsi kelulusan mahasiswa dalam mengikuti
sejumlah mata kuliah yang diselenggarakan pada tingkat persiapan bersama di
Institut Pertanian Bogor (IPB), dimana semua mata kuliah yang diambil oleh
mahasiswa pada semester satu dan dua. Dalam kasus ini yang dijadikan sebagai
variabel prediktor yaitu JK (X1), jalur (X2), ijazah (X3), NEM (X4), daerah asal
sekolah (X5), dan status sekolah (X6), yang akan dicocokan dalam model regresi
logistik seperti berikut :
logߤ
1 − ߤ൨= ߚ + ଵݔଵߚ + ଶݔଶߚ + ଷݔଷߚ + ସݔସߚ + ହݔହߚ + ݔߚ
dengan melalui dua tahapan yaitu melalui tahapan analisis variabel tunggal
(univariate), kemudian tahapan analisis variabel ganda (multivariate). Satu hal
yang harus diperhatikan pada saat tahapan analisis variabel tunggal dilakukan
adalah tentang variabel yang berskala ordinal, maka variabel itu dapat dimodelkan
sebagai variabel kontinu. Sedangkan untuk variabel kontinu analisis variabel
tunggal yang paling diperlukan adalah mendapatkan penaksir koefisien, standar
error, dan uji rasio likelihood untuk menguji keberartian koefisien.
35
Tabel 4.1 Model Regresi Logistik Variabel Tunggal
Parameter KoefisienStandard
ErrorUji Chi-Square
P-value
β1 -0.065 0.044 2.180 0.140
β2 -0.046 0.079 0.340 0.559
β3 -0.003 0.059 0.000 0.965
β4 0.092 0.028 11.080 0.001
β5 -0.050 0.052 0.930 0.336
β6 0.081 0.044 3.400 0.065
Log likelihood = -5800.6295
Dari Tabel 4.1 dapat dilihat bahwa variabel-variabel yang dapat dilihat
bahwa variabel-variabel yang dapat dianalisis selanjutnya dengan taraf
signifikansi 30% (Hosmer dan Lemeshow, 1989), yaitu ada tiga variabel
diantaranya jenis kelamin (X1), nilai ebtanas murni (X4), dan status sekolah (X6).
Sedangkan untuk variabel-variabel cara lolos seleksi ke IPB (X2), nilai rata-rata
ijazah (X3), dan daerah asal sekolah (X5) merupakan variabel-variabel yang tidak
nyata bagi model taksiran karena menghasilkan p-value yang cukup besar. Oleh
karena itu, variabel-variabel tersebut tidak diikutsertakan lagi dalam analisis
berikutnya. Perlu diketahui bahwa konstanta tidak ditampilkan ke dalam tabel.
Setelah analisis variabel tunggal dilakukan, maka langkah selanjutnya adalah
memilih variabel untuk keperluan analisis variabel ganda.
Mengikuti penaksiran model variabel ganda ini, untuk kepentingan dari
masing-masing variabel yang dilibatkan ke dalam model, maka harus diuji
terlebih dahulu. Langkah ini termasuk didalamnya adalah penentuan statistik uji
chi-kuadrat untuk masing-masing variabel, serta perbandingan koefisien taksiran
dengan koefisien-koefisien dari model tunggal yang berisi variabel tersebut saja.
Variabel - variabel yang memberikan kontribusi terhadap model berdasarkan
kriteria ini dapat dihapus dan selanjutnya menaksir model yang baru. Model yang
36
baru kemudian akan dibandingkan dengan model sebelumnya melalui uji rasio
likelihood. Selain itu koefisien taksiran juga akan dibandingkan untuk variabel -
variabel lainnya terhadap model lengkap.
Tabel 4.2 Penaksir Koefisien, Standar Error, dan Statistik Chi-kuadratBerdasarkan Hasil Pada Tabel 4.1
Variabel KoefisienStandarError
Uji Chi-Kuadrat
P-value
β0 -0,363 0,157 4,340 0,037
β1 -0,061 0,044 1,900 0,168
β4 0,087 0,024 12,840 0,000
β6 0,078 0,044 3,150 0,076
log likelihood (λ(β))=-5805.9900
Berdasarkan hasil yang didapat dalam Tabel 4.2 dengan nilai taraf
signifikansi 10% dapat dilihat bahwa variabel X4 dan X6 mempunyai p-value <
0.10, sedangkan variabel X1 (JK) p-value > 0.10, didapat pula nilai
(ߚ)ߣ = (ߚ,ସߚ,ଵߚ,ߚ)ߣ = −5805.9900 dalam model. Untuk selanjutnya
variabel X1 tidak dilibatkan lagi pada model berikutnya. Dengan mengabaikan
variabel X1 dibuat model baru yang disajikan pada Tabel 4.3 berikut
Tabel 4.3 Penaksir Koefisien, Standar Error, dan Statistik Chi-kuadratBerdasarkan Hasil Pada Tabel 4.2
Variabel Koefisien StandarError
Uji Chi-Kuadrat
P-value
β0 -0,3510 0,1557 5,0800 0,0242
β4 0,0869 0,0244 12,7400 0,0004
β6 0,0757 0,0439 2,9800 0,0845
log likelihood (λ(β)) = -5807.1176
Dari tabel tersebut dapat dilihat bahwa penaksir koefisien dan standar error
memberikan nilai-nilai yang tidak jauh berbeda dengan nilai yang diperoleh pada
model sebelumnya, seperti pada nilai (ߚ)ߣ = (ߚ,ସߚ,ߚ)ߣ = −5807.1176 . Hal
ini menunjukkan bahwa variabel jenis kelamin (X1) tidak memberikan pengaruh
37
yang berarti terhadap model. Pernyatan ini didukung oleh nilai chi-kuadrat untuk
kedua model itu memberikan hasil yang tidak jauh berbeda.
Lebih jauh lagi, untuk melihat bagaimana pengaruh variabel-variabel yang
dianggap tidak nyata terhadap model dilakukan melalui uji rasio likelihood ,(ߚ)ߣ
yang menyatakan perbedaan antara model yang dalam Tabel 4.2 dan Tabel 4.3
(untuk menguji keberartian variabel X1) menghasilkan suatu nilai sebagai berikut:
(ߚ,ସߚ,ߚ|ଵߚ)ߣ = −(ߚ,ସߚ,ߚ)ߣ]2− [(ࢼ)
= −2(−5807.1176+ 5805.9900) = 2.2552
Dengan membandingkan hasil tersebut dengan sebaran (ଵ)ଶ pada taraf
nyata 5% memberikan hasil yang tidak nyata (p-value = 0.1332). Artinya, variabel
X1 tidak cukup berarti untuk menaksir pola kelulusan mahasiswa. Dengan
demikian dapat dikatakan bahwa faktor-faktor yang mempengaruhi pola kelulusan
mahasiswa TPB menurut regresi logistik adalah nilai ebtanas murni (X4) dan
status sekolah (X6).
Berdasarkan hasil pengujian koefisen regresi diatas yang signifikan adalah
nilai rata-rata ijazah dan status sekolah dengan model regresi logistik seperti
berikut :
logߤ
1 − ߤ൨= −0.3510 + ସݔ0.0869 + ݔ0.0757
4.4 Hasil - hasil Pada Model Regresi Beta
Langkah-langkah yang akan ditempuh pada pembentukan model dalam
model regresi beta hampir sama dengan langkah-langkah yang ada dalam
pemodelan regresi logistik, begitu juga pada model regresinya seperti berikut :
logߤ
1 − ߤ൨= ߚ + ଵݔଵߚ + ଶݔଶߚ + ଷݔଷߚ + ସݔସߚ + ହݔହߚ + ݔߚ
38
tetapi dimana model ini diasumsikan bahwa varians dari variabel respons adalah
konstan, sehingga mempunyai parameter dispersi yang dimodelkan dalam bentuk
=ߢ� exp(−ࢠ) .
Proses pembentukan model dimulai dengan analisis variabel tunggal, yang
dilanjutkan dengan analisis variabel ganda. Demikian juga halnya dengan kriteria
pemilihan variabel ke dalam model yang digunakan adalah log likelihood, akan
tetapi disini menggunakan uji t.
Tabel 4.4 Model Regresi Beta Variabel Tunggal
Parameter KoefisienStandard
ErrorStatistik
Uji tP-value
β1 -0.084 0.042 -1.990 0.047
β2 -0.049 0.075 -0.650 0.513
β3 0.012 0.057 0.210 0.831
β4 0.089 0.026 3.370 0.001
β5 -0.061 0.050 -1.220 0.224
β6 0.048 0.042 1.140 0.253
Δ -1.070 0.026 -40.600 <.0001
Log likelihood = -291.2
Dari Tabel 4.4 dapat dilihat bahwa variabel - variabel yang dapat dianalisis
selanjutnya dengan taraf signifikansi 30% (Hosmer dan Lemeshow, 1989) yaitu
ada empat variabel jenis kelamin (X1), nilai ebtanas murni (X4), daerah asal
sekolah (X5), status sekolah (X6). Sedangkan untuk variabel - variabel cara lolos
seleksi ke IPB (X2), nilai rata-rata ijazah (X3) merupakan variabel-variabel yang
tidak nyata bagi model taksiran karena menghasilkan p-value yang cukup besar.
Oleh karena itu, variabel-variabel tersebut tidak diikutsertakan lagi dalam analisis
berikutnya. Perlu diketahui bahwa konstanta tidak ditampilkan ke dalam tabel.
Setelah analisis variabel tunggal dilakukan, maka langkah selanjutnya adalah
39
memilih variabel untuk keperluan analisis variabel ganda, dimana hasilnya dapat
dilihat pada Tabel 4.5.
Tabel 4.5 Penaksir Koefisien, Standar Error, dan Statistik Uji tBerdasarkan Hasil Pada Tabel 4.4
Variabel KoefisienStandarError
StatistikUji-t P-value
β0 -0,2573 0,1503 -1,71 0,0871
β1 -0,08248 0,04222 -1,95 0,0509
β4 0,09061 0,02349 3,86 0,0001
β5 -0,05766 0,04648 -1,24 0,2148
β6 0,04822 0,04211 1,15 0,2523
Δ -1,0698 0,02635 -40,59 <.0001
log-likelihood (λ(β'))= -290.7
Pada Tabel 4.5 dapat dilihat bahwa menurut model beta variabel-variabel
yang dianggap nyata dalam menduga pola kelulusan mahasiswa dengan taraf
signifikansi 10% hanya ada dua variabel, yaitu: jenis kelamin (X1), dan nilai
ebtanas murni (X4), dan mempunyai nilai (′ߚ)ߣ = =൯ߚ,ହߚ,ସߚ,ଵߚ,ߚ൫ߣ −290.7.
Tabel 4.6 Penaksir Koefisien, Standar Error, dan Statistik Uji tBerdasarkan Hasil Pada Tabel 4.5
Variabel KoefisienStandarError
StatistikUji-t
P-value
β0 -0,2583 0,1493 -1,73 0,0837
β1 -0,0778 0,0421 -1,85 0,0650
β4 0,0879 0,0233 3,78 0,0002
Δ -1,0685 0,0264 -40,55 <.0001
log-likelihood (λ(β'))= -288.0
Dari hasil Tabel 4.6 dapat dilihat bahwa penaksir koefisien dan standar
error memberikan nilai – nilai yang tidak jauh berbeda dengan nilai yang
diperoleh pada model sebelumnya, seperti pada nilai
(′ߚ)ߣ = =ସ൯ߚ,ଵߚ,ߚ൫ߣ −288.0.
40
Hal ini menunjukkan bahwa variabel-variabel daerah asal sekolah (X5) dan
status sekolah (X6) tidak memberikan pengaruh yang berarti terhadap model.
Pernyatan ini didukung oleh nilai devians untuk kedua model itu memberikan
hasil yang tidak jauh berbeda.
Lebih jauh lagi, untuk melihat bagaimana pengaruh variabel-variabel yang
dianggap tidak nyata terhadap model dilakukan melalui uji rasio likelihood ,(ߚ)ߣ
yang menyatakan perbedaan antara model yang dalam Tabel 4.5 dan Tabel 4.6
(untuk menguji keberartian variabel X5 dan X6) menghasilkan suatu nilai sebagai
berikut:
(ସߚ,ଵߚ,ߚ|ߚ,ହߚ)ߣ = (ସߚ,ଵߚ,ߚ)ߣ]2− − [(′ࢼ)
= −2(288 − 290.7) = −5.4
Dengan membandingkan hasil tersebut dengan sebaran (ଶ)ଶ pada taraf
nyata 5% memberikan hasil yang nyata (p-value = 0.06720). Artinya, variabel X5
dan X6 tidak cukup berarti untuk menaksir pola kelulusan mahasiswa, sehingga
dapat dikatakan bahwa faktor-faktor yang mempengaruhi pola kelulusan
mahasiswa TPB menurut regresi beta adalah jenis kelmin (X1) dan nilai ebtanas
murni (X4).
4.5 Pembahasan Hasil – hasil dari Kedua Model Regresi
Dari hasil model regresi logistik dan regresi beta dapat disimpulkan bahwa
variabel-variabel yang dianggap berarti dalam kedua model tersebut berbeda dan
perbedaannya terlihat pula pada nilai-nilai yang dihasilkan untuk penaksir
koefisien, standar error, dan log-likelihood. Nilai yang cukup nyata yang
menunjukkan perbedaan diantara kedua model ini ditunjukkan pada nilai log-
likelihoodnya, dimana nilai log-likelihood untuk model beta berada disekitar nilai
41
-291.2 sedangkan untuk model regresi logistik berada di sekitar nilai -5800.6295.
Perbedaan nilai log-likelihood ini menunjukkan bahwa model regresi beta
merupakan model yang lebih baik dibandingkan dengan model regresi logistik,
karena mempunyai nilai log-likelihood yang besar, dimana nilai log-likelihood
besar merupakan nilai log-likelihood yang paling maksimum.
Hasil dari pemodelan regresi beta ini dapat dituliskan sebagai berikut :
logߤ
1 − ߤ൨= −0.2867 − −ଵݔ0.0841 ଶݔ0.0493 + ଷݔ0.0121
ସݔ0.0887+ − ହݔ0.0609 + ݔ0.0483
Nilai taksiran untuk parameter dispersinya adalah :
=Ƹߢ 1−)ݔ × −1.0700) = 2.92
Hasil yang ditunjukan dari model regresi beta dengan taraf signifikan
(α=10%) bahwa variabel cara lolos seleksi (X2), nilai rata-rata ijazah (X3), daerah
asal sekolah (X5), dan status sekolah (X6) merupakan variabel yang secara statistik
tidak berpengaruh pada proporsi kelulusan banyak mata kuliah yang diambil oleh
mahasiswa, sedangkan jenis kelamin (X1) dan nilai ebtanas murni (X4) merupakan
variabel yang secara statistik berpengaruh pada proporsi kelulusan banyak mata
kuliah yang diambil oleh mahasiswa.
Dari hasil diatas penulis membuat pemodelan ulang dari regresi beta yang
hanya melibatkan variabel-variabel yang signifikan saja, dan mengabaikan
variabel-variabel yang tidak signifikan. Sehingga model akhir dari regresi beta
berdasarkan variabel yang signifikan pada taraf signifikansi (α=10%) dapat ditulis
sebagai berikut :
logߤ
1 − ߤ൨= −0.2583 − ଵݔ0.0778 + ସݔ0.0879
42
Sedangkan nilai taksiran untuk parameter dispersinya menjadi :
=Ƹߢ 1−)ݔ × −1.0685) = 2.911
Jadi nilai koefisien 1ࢼ (koefisien regresi beta untuk variabel JK) dan
4ࢼ (koefisien regresi beta untuk variabel NEM) yaitu ଵࢼ = −0.0778 dan
ସࢼ = 0.0879. Dengan mengambil nilai exp(1ࢼ) = 0.93 untuk perempuan dan
exp(ࢼସ) = 1.1, maka model regresi beta ini dapat diinterpretasikan bahwa bagi
mahasiswa perempuan yang mempunyai nilai ebtanas murni (NEM) lebih tinggi,
maka kesempatan mahasiswa tersebut untuk lulus dalam banyak mata kuliah yang
diambil adalah 1.1 kali lipat lebih besar dibandingkan dengan mahasiswa
perempuan yang nilai ebtanas murni (NEM) lebih rendah.
Untuk melihat pengaruh jenis kelamin mana yang mempunyai pengaruh
besar terhadap lulusnya dalam banyak mata kuliah yang diambil oleh mahasiswa
tersebut, dapat dinterpretasikan sebagai berikut :
Rata-rata untuk jenis kelamin perempuan dengan NEM yang ditentukan sebesar
6.33 yaitu:
=exp ൫−0.2583 − 0.0778(0) + 0.0879(6.33)൯
1 + exp ൫−0.2583 − 0.0778(0) + 0.0879(6.33)൯= 0.5739
Rata-rata untuk jenis kelamin laki-laki dengan NEM yang ditentukan sebesar 6.33
yaitu
=exp൫−0.2583 − 0.0778(1) + 0.0879(6.33)൯
1 + exp൫−0.2583 − 0.0778(1) + 0.0879(6.33)൯= 0.5547
Maka dapat disimpulkan bahwa rata-rata mahasiswa perempuan yang lulus
dalam banyak mata kuliah yang diambil relatif sama dengan mahasiswa laki-laki
Dimana nilai rata-rata untuk mahasiswa perempuan adalah 0.5739 dan mahasiswa
laki-laki 0.5547.
43
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Secara umum dalam penelitian ini telah ditunjukan mengenai hubungan
fungsional antara variabel bebas dan variabel tak bebas dimana variabel tak bebas
disini berbentuk proporsi, yang pada umumnya dimodelkan dengan model regresi
logistik, karena variabel tak bebas tersebut mengikuti distribusi beta maka dapat
pula dimodelkan dengan model regresi beta. Dimana hubungan fungsional dari
masing-masing model regresi dapat dimodelkan dengan enam variabel bebas yaitu
variabel jenis kelamin (JK), cara seleksi masuk IPB (jalur), nilai rata-rata ijazah
(ijazah), nilai ebtanas murni (NEM), asal sekolah, dan status sekolah seperti
berikut:
Hubungan fungsional dari variabel tak bebas berbentuk proporsi dengan variabel
bebas yang dimodelkan melalui regresi logistik ialah
logߤ
1 − ߤ൨= −0.2592 − −(ܭܬ)0.0652 0.0461( (ݎݑ + ݖ)0.0026 ℎ)
ܯܧ)0.0920+ ) − ݏ)0.0504 ݏ� ℎ) + ݐݏ)0.0813 ݏ�ݏݑݐ ℎ)
dan hubungan fungsional dari variabel tak bebas berbentuk proporsi dengan
variabel bebas yang dimodelkan melalui regresi beta ialah
logߤ
1 − ߤ൨= −0.2867 − −(ܭܬ)0.0841 0.0493( (ݎݑ + ݖ)0.0121 ℎ)
ܯܧ)0.0887+ ) − ݏ)0.0609 ݏ� ℎ) + ݐݏ)0.0483 ݏ�ݏݑݐ ℎ)
Secara khusus dalam penelitian ini telah ditunjukkan kegunaan dari model
regresi beta untuk menaksir perilaku kelulusan mahasiswa dalam mengikuti
44
program Tingkat Persiapan Bersama di Institut Pertanian Bogor, dan dalam
penelitian ini telah ditunjukkan perbedaan mengenai kesesuaian taksiran dari
model regresi beta dengan apa yang diperoleh dalam model regresi logistik.
Berdasarkan hasil dari pemodelan tersebut pada pola kelulusan mahasiswa
dalam mengikuti Tingkat Persiapan Bersama di Institut Pertanian Bogor yang
dipengaruhi oleh jenis kelamin (JK), cara seleksi masuk IPB (jalur), nilai rata-rata
ijazah (ijazah), nilai ebtanas murni (NEM), asal sekolah, dan status sekolah dapat
disimpulkan bahwa :
Untuk model regresi logistik dengan berbagai alat statistik yang digunakan
dalam penaksiran parameter yang mengidentifikasi variabel tersebut
signifikan atau tidak signifikan dalam model dimana variabel yang
signifikan yaitu variabel nilai ebtanas murni (NEM) dan status sekolah,
sedangkan variabel yang tidak signifikan yaitu variabel jenis kelamin (JK),
cara lolos masuk IPB (Jalur), nilai rata-rata ijazah (Ijazah), dan asal
sekolah.
Untuk model regresi beta dengan berbagai alat statistik yang digunakan
dalam penaksiran parameter yang mengidentifikasi variabel tersebut
signifikan atau tidak signifikan dalam model dimana variabel yang
signifikan yaitu varibel jenis kelamin (JK) dan nilai ebtanas murni (NEM),
sedangkan variabel yang tidak signifikan yaitu variabel cara lolos masuk
IPB (Jalur), nilai rata-rata ijazah (Ijazah), asal sekolah, dan status sekolah.
Dari masing-masing model bila dilihat dari hasil ukuran statistikanya
maka model regresi beta yang terbaik karena memberikan nilai penaksir
45
yang sangat maksimum dan mampu memetakan data proporsi pada selang
terbuka (0, 1).
Dengan demikian, penggunaan model regresi logistik menjadi tidak tepat
untuk menaksir pola kelulusan mahasiswa dalam mengikuti program Tingkat
Persiapan Bersama di Institut Pertanian Bogor. Dalam hal ini, model regresi beta
dapat memberikan hasil yang relatif lebih baik dalam menaksir pola kelulusan
mahasiswa dalam mengikuti program Tingkat Persiapan Bersama di Institut
Pertanian Bogor.
Jadi, model regresi beta merupakan suatu alat yang tepat dalam menangani
masalah penaksiran yang terdapat pada data proporsi. Penaksiran parameter
beserta uji-uji keberartiannya dapat dihubungkan atau diinterpretasikan
sebagaimana dalam model regresi logistik.
5.2 Saran-saran
Dalam penelitian ini model regresi beta merupakan pemodelan alternatif
untuk memodelkan data dengan variabel respon yang berbentuk proporsi. Model
regresi beta disini merupakan model yang sangat mendasar artinya model ini
masih mengasumsikan bahwa varians dari variabel prediktornya adalah konstan,
dengan kata lain tidak ada heteroskedatisitas dalam data. Maka masih terbuka
untuk melakukan penelitian bagaimana mengenai masalah heteroskedatisitas ke
dalam model.
46
DAFTAR PUSTAKA
Baker, R.J., and J.A. Nelder (1978). Generalized Linear Interactive Modeling
(GLIM). Release 3. Oxford: Numerical Algorithhms Group.
Ferrari, S. L. P. and Cribari-Neto, F. (2004). “Beta Regression for Modeling
Rates and Proportions”,Journal of Applied Statistics. Volume 10 Page
15-16.
Hajarisman, N (1998). Kajian Perbandingan Model Regresi Beta-Binomial
dengan Model regresi Logistik dan Penerapannya untuk Menduga Pola
Kelulusan Mahasiswa IPB- TPB tahun 1997/1998. Tesis tidak untuk
dipublikasikan. Bogor. Program Pasca Sarjana
Hajarisman, N (2010). Analisis Data Kategorik. Bandung. Pustaka Ceria. Hal
60-65
Hajarisman, N (2010). “Pengantar ke Analisis Regresi Lanjut”.Catatan Buku
Bab 1.Hal 2-9
Hajarisman, N (2011). ”Penaksiran Parameter Model Regresi Beta untuk
Memodelkan Data Proporsi”. Jurnal Media Statistika. Volume 11 hal 1-
6.
Herrhyanto, N dan Gantini, T. (2009) Pengantar Statistika Matematis,
Bandung. CV. YRAMA WIDYA. Hal 347.
Hosmer, D.W. and Lemeshow, S., 1989. Applied Logistic Regression. John
Wiley and Sons, Inc. USA.
McCullagh, P., and J.A. Nedler (1983). Generalized Linear Models.2nd Ed.
New York : Chapman and Hall.
McCullagh, P., and J.A. Nedler (1989). Generalized Linear Models.2nd Ed.
London : Chapman and Hall.
Smithson M, and Verkuilen J. (2005). Fuzzy set inclusion:Linking fuzzy set
meth-ods with mainstream techniques. Sociologi Methods and Research.
Volume 33, 431-461
Smithson M, and Verkuilen J. (2006). “A better lemon squeezer? Maximum-
likelihood regression with beta-distributed dependent variables”,
Psychological Methods. Volume 11 Page 57-60.
LAMPIRAN
47
LAMPIRAN 1
Notasi-notasi yang ada di Regresi Beta
a = parameter lokasi untuk distribusi beta original
b = parameter presisi untuk distribusi beta original
g (µi) = fungsi hubung logit untuk µi
h (κi) = fungsi hubung log untuk κi
x = matrik kovariat untuk β
y = variabel acak berdistribusi beta
z = matrik kovariat untuk δ
β = koefisien regresi untuk µ dan x
δ = koefisien regresi untuk κ dan z
µ = parameter lokasi setelah direparameterisasi
κ = parameter disperse setelah direparameterisasi
η = fungsi hubung
ψ = fungsi digama
ψ` = fungsi tri gama
48
LAMPIRAN 2
DATA PROPORSI POLA KELULUSAN MAHASISWA DALAMMENGIKUTI MATA KULIAH DI TPB IPB
NO ID X1 X2 X3 X4 X5 X6 r N
1 A00497001 0 1 7.30 43.75 1 0 14.5 15
2 A00497002 0 1 8.50 50.86 1 0 14.5 15
3 A00497003 0 1 8.70 54.89 1 0 14.5 15
4 A00497004 1 1 8.20 51.81 1 0 14.5 15
5 A00497005 0 1 7.31 41.13 1 1 14.5 15
6 A00497006 0 0 8.00 52.04 1 0 14.5 15
7 A00497007 0 1 7.60 41.78 1 0 14.5 15
8 A00497008 0 1 7.50 48.38 1 0 14.5 15
9 A00497009 0 1 7.70 55.81 1 0 14.5 15
10 A00497010 0 1 7.60 46.82 1 0 14.5 15
11 A00497011 0 1 7.80 50.50 1 1 14.5 15
12 A00497012 0 1 7.30 41.85 1 0 14.5 15
13 A00497014 0 1 7.60 47.51 1 0 14.5 15
14 A00497015 0 0 7.30 39.33 1 1 14.5 15
15 A00497016 0 1 7.70 52.57 1 0 14.5 15
16 A00497017 0 1 7.30 38.98 1 1 14.5 15.....
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2207 G07497026 1 1 7.10 51.44 1 1 3 15
2208 G07497027 0 1 6.70 45.71 1 0 10 15
2209 G07497028 1 1 7.40 40.92 1 1 3 15
2210 G07497029 1 1 6.70 34.68 1 1 1 15
2211 G07497030 1 1 7.60 40.10 1 1 7 15
2212 G07497031 1 1 7.90 46.70 0 0 6 15
2213 G07497032 1 1 6.70 40.64 0 0 4 15
2214 G07497033 1 1 6.40 41.60 0 0 8 15
2215 G07497034 1 1 7.18 41.39 0 1 1 15
2216 G07497035 1 1 7.30 52.18 0 0 10 15
49
LAMPIRAN 3
Hasil Output Model Regresi Beta dari SAS
(THE NLMIXED)
Specifications
Data Set WORK.IPB
Dependent Variable p
Distribution for Dependent Variable General
Optimization Technique Dual Quasi-Newton
Integration Method None
Dimensions
Observations Used 2216
Observations Not Used 0
Total Observations 2216
Parameters 8
Parameters
b0 b1 b2 b3 b4 b5 b6 kappa NegLogLike
1 1 1 1 1 1 1 1 37212.476
Iteration History
Iter Calls NegLogLike Diff MaxGrad Slope
1 4 7088.79073 30123.69 15560.14 -4847890
2 6 4424.38113 2664.41 16468.68 -41130.7
3 7 517.977269 3906.404 3940.241 -51146.6
50
Iteration History
Iter Calls NegLogLike Diff MaxGrad Slope
4 9 147.805578 370.1717 5526.205 -2166.44
5 11 -22.614523 170.4201 1125.398 -927.912
6 13 -68.314969 45.70045 389.0067 -276.173
7 14 -129.01466 60.69969 223.1221 -164.45
8 16 -138.93288 9.918222 36.66598 -40.0469
9 18 -142.23893 3.306051 108.3201 -17.5936
10 20 -142.5258 0.286867 11.96877 -1.05742
11 22 -143.18786 0.662064 208.7328 -1.74938
12 24 -144.91196 1.724098 126.8056 -1.18923
13 26 -145.55272 0.640759 48.13625 -1.12573
14 28 -145.57986 0.027142 15.11033 -0.07003
15 30 -145.58173 0.001873 0.951875 -0.00402
16 32 -145.58176 0.000027 0.031386 -0.00006
17 34 -145.58176 6.061E-7 0.010463 -1.24E-6
NOTE: GCONV convergence criterion satisfied.
Fit Statistics
-2 Log Likelihood -291.2
AIC (smaller is better) -275.2
AICC (smaller is better) -275.1
BIC (smaller is better) -229.5
51
Parameter Estimates
Parameter Estimate StandardError
DF tValue
Pr > |t| Alpa Lower Upper Gradien
b0 -0.2867 0.3678 2216 -0.78 0.4357 0.05 -1.0080 0.4346 0.001392
b1 -0.08414 0.04231 2216 -1.99 0.0469 0.05 -0.1671 -0.0011
7
0.000646
b2 -0.04928 0.07537 2216 -0.65 0.5133 0.05 -0.1971 0.09852
0.001436
b3 0.01207 0.05655 2216 0.21 0.8310 0.05 -0.0988
3
0.1230 0.010463
b4 0.08864 0.02634 2216 3.37 0.0008 0.05 0.03699
0.1403 0.00733
b5 -0.06094 0.05012 2216 -1.22 0.2241 0.05 -0.1592 0.03734
0.001211
b6 0.04830 0.04219 2216 1.14 0.2525 0.05 -0.0344
5
0.1310 0.000509
Kappa -1.0700 0.02635 2216 -40.60 <.0001 0.05 -1.1217 -1.0183
0.000471
52
LAMPIRAN 4
Hasil Output Model Regresi Logistik dari SAS
(The GENMOD)
Model Information
Data Set WORK.IPB
Distribution Binomial
Link Function Logit
Response Variable (Events) y
Response Variable (Trials) n
Number of Observations Read 2216
Number of Observations Used 2216
Number of Events 18575.5
Number of Trials 33240
Criteria For Assessing Goodness Of Fit
Criterion DF Value Value/DF
Deviance 2209 9739.4187 4.4090
Scaled Deviance 2209 2481.0308 1.1231
Pearson Chi-Square 2209 8671.5471 3.9256
Scaled Pearson X2 2209 2209.0000 1.0000
Log Likelihood -5800.6295
Algorithm converged.
53
Analysis Of Parameter Estimates
Parameter DF Estimate StandardError
Likelihood Ratio95%
Confidence Limits
Chi-Square
Pr > ChiSq
Intercept 1 -0.2592 0.3838 -1.0117 0.4930 0.46 0.4995
x1 1 -0.0652 0.0442 -0.1518 0.0214 2.18 0.1402
x2 1 -0.0461 0.0789 -0.2012 0.1081 0.34 0.5587
x3 1 -0.0026 0.0591 -0.1184 0.1133 0.00 0.9649
Nem 1 0.0920 0.0276 0.0379 0.1462 11.08 0.0009
x5 1 -0.0504 0.0524 -0.1532 0.0522 0.93 0.3358
x6 1 0.0813 0.0441 -0.0051 0.1677 3.40 0.0652
Scale 0 1.9813 0.0000 1.9813 1.9813
Note: The scale parameter was estimated by the square root of Pearson's Chi-Square/DOF.
DAFTAR RIWAYAT HIDUP
Nama : Beta Putri Wijaya
Tempat/Tanggal Lahir : Bandung / 20 November 1990
NPM : 10060108003
Jenis Kelamin : Perempuan
Agama : Islam
Anak ke : 2 dari 2 bersaudara
Nama Bapak : Dadan Dustriyanda
Pekerjaan : BUMN
Nama Ibu : Lilis Warlina
Pekerjaan : Ibu Rumah Tangga
Alamat : Jl. Sukarasa No 80/143E Rt 04 Rw 09 Cicadas
Bandung.
Telp : (022) 72728501
Pendidikan Formal yang Pernah Ditempuh
1. SD Negeri Panyileukan 03 Bandung, lulus tahun 2002.
2. SMP Negeri 4 Bandung, lulus tahun 2005.
3. SMA Kartika Siliwangi 1 Bandung, lulus tahun 2008.
4. Universitas Islam Bandung di Program Studi Statistika, lulus tahun 2012.
Pengalaman Organisasi :
1. Ketua Bidang Keilmuan Organisasi Himpunan Mahasiswa Statistika
(HIMASTA) Universitas Islam Bandung Periode 2010-2011.
2. Panitia Musyawarah Kerja Nasional Ikatan Himpunan Mahasiswa Statistika
Indonesia (IHMSI) Tahun 2010.
3. Sekretaris Bidang Keilmuan Organisasi Himpunan Mahasiswa Statistika
(HIMASTA) Universitas Islam Bandung Periode 2009-2010.
4. Panitia Musyawarah Kerja Wilayah II Ikatan Himpunan Mahasiswa Statistika
Indonesia (IHMSI) Tahun 2009.
Pengalaman Kerja :
1. Kuliah Praktek di PLN, Bagian Niaga.
2. Asisten Dosen di Laboratorium Statistika UNISBA Periode 2011-2012.