Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf ·...

71
PERINGATAN !!! Bismillaahirrahmaanirraahiim Assalamu’alaikum warahmatullaahi wabarakaatuh 1. Skripsi digital ini hanya digunakan sebagai bahan referensi 2. Cantumkanlah sumber referensi secara lengkap bila Anda mengutip dari Dokumen ini 3. Plagiarisme dalam bentuk apapun merupakan pelanggaran keras terhadap etika moral penyusunan karya ilmiah 4. Patuhilah etika penulisan karya ilmiah Selamat membaca !!! Wassalamu’alaikum warahmatullaahi wabarakaatuh UPT PERPUSTAKAAN UNISBA

Transcript of Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf ·...

Page 1: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

PERINGATAN !!! Bismillaahirrahmaanirraahiim

Assalamu’alaikum warahmatullaahi wabarakaatuh

1. Skripsi digital ini hanya digunakan sebagai bahan referensi

2. Cantumkanlah sumber referensi secara lengkap bila Anda mengutip dari Dokumen ini

3. Plagiarisme dalam bentuk apapun merupakan pelanggaran keras terhadap etika moral penyusunan karya ilmiah

4. Patuhilah etika penulisan karya ilmiah

Selamat membaca !!!

Wassalamu’alaikum warahmatullaahi wabarakaatuh

UPT PERPUSTAKAAN UNISBA

Page 2: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

PENAKSIRAN PARAMETER DARI MODEL REGRESI BETAUNTUK DATA PROPORSI DENGAN MENGGUNAKAN

METODE KEMUNGKINAN MAKSIMUM

Oleh :

BETA PUTRI WIJAYANPM: 10060108003

PROGRAM STUDI STATISTIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS ISLAM BANDUNG2012 M / 1433 H

SKRIPSI

Page 3: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

PENAKSIRAN PARAMETER DARI MODEL REGRESI BETAUNTUK DATA PROPORSI DENGAN MENGGUNAKAN

METODE KEMUNGKINAN MAKSIMUM

Diajukan untuk memenuhi salah satu persyaratan gunaMemperoleh Gelar Sarjana Sains pada Program Studi Statistika

Fakultas Matematika dan Ilmu Pengetahuan AlamUniversitas Islam Bandung

Oleh:

BETA PUTRI WIJAYANPM: 10060108003

PROGRAM STUDI STATISTIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS ISLAM BANDUNG2012 M / 1433 H

SKRIPSI

Page 4: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

SURAT PERNYATAAN

Yang bertanda tangan di bawah ini :

Nama : Beta Putri Wijaya

NPM : 10060108003

Status : Mahasiswa Semester Delapan Program Studi Statistika

Fakultas Matematika dan Ilmu Pengetahuan Alam

Universitas Islam Bandung

Judul Skripsi : PENAKSIRAN PARAMETER DARIMODEL REGRESI BETA UNTUKDATA PROPORSI DENGAN MENGGUNAKANMETODE KEMUNGKINAN MAKSIMUM

Menyatakan dengan sesungguhnya bahwa skripsi atau karya tulis ilmiah

ini benar-benar hasil karya sendiri bukan jiplakan dari hasil karya orang lain.

Demikian pernyataan ini saya buat dengan sebenar-benarnya, dengan harapan

yang berkepentingan menjadi maklum adanya.

Bandung, September 2012

Yang Membuat Pernyataan

Beta Putri Wijaya

Page 5: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

Setelah membaca skripsi ini secara seksama,menurut pertimbangan kami telah memenuhi

persyaratan ilmiah sebagai skripsi

Pembimbing I

Nusar Hajarisman., M.Si.

NIK.D.94.0.200

Pembimbing II

Siti Sunendiari.,Dra.,M.Si.

NIK.D.88.0.0.76

Mengetahui,

Dekan

F-MIPA Unisba

M. Yusuf Fajar, Drs., M.Si.

NIP.195610261986021001

Ketua Jurusan Statistika

F-MIPA Unisba

Suliadi, M.Si., Ph.D

NIK. D.97.0.267

Tanggal Lulus : 6 September 2012

JUDUL : PENAKSIRAN PARAMETER DARI MODEL REGRESIBETA UNTUK DATA PROPORSI DENGANMENGGUNAKAN METODE KEMUNGKINANMAKSIMUM

NAMA : BETA PUTRI WIJAYA

NPM : 10060108003

Page 6: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

ABSTRAK

Beta Putri Wijaya, 10060108003. Penaksiran Parameter Dari Model RegresiBeta Untuk Data Proporsi Dengan Metode Kemungkinan Maksimum.Di bawah bimbingan Nusar Hajarisman.,M.Si dan Siti Sunendiari.,M.Si.

Skripsi ini menyajikan suatu variabel respons yang berbentuk proporsi yangnilainya berada dalam selang terbuka (0, 1) dapat dihubungkan dengan sejumlahvariabel prediktor melalui model regresi beta. Model ini merupakan bagian darigeneralized linear model (GLM) dimana variabel respons megikuti distribusi betayang merupakan anggota dari keluarga eksponensial. Parameter regresi dari modelregresi beta diinterpretasikan dalam bentuk rata-rata dari respons, dan saatmenggunakan fungsi hubung logit, parameter regresi ini diinterpretasikan sebagaiodds rasio. Penaksiran parameter model menggunakan metode kemungkinanmaksimum, dimana proses penaksirannya harus diselesaikan secara numerik.Dalam skripsi ini penaksiran parameter model regresi beta dilakukan melaluimetode penskoran Fisher berdasarkan pada vektor skor dan matriks informasiFisher untuk menaksir perilaku kelulusan mahasiswa dalam mengikuti TingkatPersiapan Bersama di Institut Pertanian Bogor tahun akademik 1997/1998,dimana hanya jenis kelamin dan nilai ebtanas murni yang dapat mempengaruhiperilaku kelulusan mahasiswa tersebut.

Kata Kunci: distribusi beta, model linear umum, metode kemungkinanmaksimum, odds rasio, dan fungsi logit.

Page 7: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

MOTTO DAN PERSEMBAHAN

Motto

Artinya :

“Bahwa tiada yang orang dapatkan, kecuali yang ia usahakan, Dan bahwa

usahanya akan kelihatan nantinya.”

(Q.S. An Najm ayat 39-40)

Persembahan

Dengan rasa syukur yang mendalam skripsi ini kupersembahkan untuk Kedua orang

tuaku tercinta Papa dan Mama, ini anakmu mencoba memberikan yang terbaik

untukmu. Betapa diri ini ingin melihat kalian bangga padaku. Betapa tak ternilai kasih

sayang dan pengorbanan kalian padaku, Maaf bila selama ini anakmu nakal dan tidak

mau mendengar apa kata orang tuanya. Dalam hati ini aku sayang kalian.

Kakakku Eka dan Winda terimakasih atas dukungan kalian yang selalu siap

membantuku, selalu peduli dan terus mendukungku.

Sahabat-sahabatku tersayang,teman seperjuanganku dikampus, Rizky, Sarah, Fitri,

dan Riris terimakash untuk motivasi dan dukunganya

Dan yang terkasih dan tersayang, Ardi terimakasih untuk segala dukungan, motivasi

dan pengertiannya

Page 8: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

i

KATA PENGANTAR

Bismillahirahmanirrahiim.

Puji dan syukur penulis panjatkan kehadirat Allah SWT, atas nikmat, rahmat

serta hidayah-Nya, tidak lupa shalawat serta salam tercurah pada Nabi Muhammad

SAW, dengan karunia-Nya sehingga penulis dapat menyelesaikan kuliah di Program

Studi Statistika Universitas Islam Bandung serta menyusun dan menyelesaikan

skripsi yang merupakan salah satu syarat untuk memenuhi kelulusan kuliah pada

Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam di

Universitas Islam Bandung.

Penulis menyadari skripsi ini belum dikatakan sempurna, hal ini dikarenakan

keterbatasan pengetahuan, pengalaman, maupun kemampuan yang dimiliki, Oleh

karena itu penulis mengharapkan semua pihak dapat memberikan saran-saran

penyempurnaan yang berguna bagi penulis khususnya dan bagi pembaca pada

umumnya.

Dengan seluruh kerendahan hati dan penuh rasa hormat penulis mengucapkan

terima kasih dan penghargaan sebesar-besarnya kepada :

1. Bapak Nusar Hajarisman.,M.Si., selaku dosen pembimbing I yang telah

memberikan sumbangan pikiran, pengetahuan, ilmu dan kesempatan serta

kemudahan bagi penulis untuk dapat menyelesaikan skripsi ini.

Page 9: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

ii

2. Ibu Siti Sunendiari.,Dra.,M.Si., selaku dosen pembimbing II yang telah

memberikan sumbangan pikiran, pengetahuan, ilmu dan kesempatan serta

kemudahan bagi penulis untuk dapat menyelesaikan skripsi ini.

3. Bapak M. Yusuf Fajar, Drs., M.Si., selaku Dekan FMIPA Universitas Islam

Bandung.

4. Bapak R. Dachlan Muchlis, Drs., M.T., selaku wakil dekan FMIPA Universitas

Islam Bandung.

5. Bapak Suliadi, M.Si., Ph.D., selaku Ketua Program Studi Statistika FMIPA

Universitas Islam Bandung.

6. Bapak Dr. Suwanda, MS., selaku dosen wali Statistika Universitas Islam Bandung

angkatan 2008 yang telah meluangkan waktu dan kesabarannya dalam memberi

pengarahan, ilmu, serta bimbingan selama ini.

7. Dosen-Dosen Program Studi Statistika, yang telah memberikan banyak bekal

ilmu pengetahuan selama perkuliahan.

8. Bapak Mastur, Ibu Tineu, dan bagian administrasi FMIPA yang selalu membantu

penulis dalam proses administrasi perkuliahan dan sidang skripsi.

9. Akang dan Teteh Asisten Lab Statistika terima kasih atas segala bantuan,

dukungan dan waktu luang dalam membantu skripsi ini.

10. Teman-teman Program Studi Statistika angkatan 2005, 2006, 2007, 2008, 2009,

2010 dan 2011 Universitas Islam Bandung, terima kasih untuk suka duka,

bantuan, kebersamaan dan persahabatan kita.

11. Dan semua pihak yang telah membantu dalam penyusunan skripsi ini.

Page 10: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

iii

Semoga Allah SWT senantiasa memberikan rahmat dan karunia untuk

memberi balasan atas semua bantuan fikiran yang telah diberikan kepada penulis.

Besar harapan bahwa skripsi ini dapat memberikan manfaat bagi pembaca.

Akhir kata dengan ketulusan dan kerendahan hati, penulis panjatkan dan

semoga Allah SWT membalas budi baik serta melimpahkan rahmat-Nya kepada

semua pihak yang telah memberikan bantuannya, Amin.

Jazakumullaahu khairun katsira

Billahitaufiqwalhidayah. Wassalamu’alaikum Wr. Wb.

Bandung, September 2012

Penulis

Page 11: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

iv

DAFTAR ISI

Halaman

KATA PENGANTAR ................................................................................ i

DAFTAR ISI ............................................................................................... iv

DAFTAR TABEL ................................................................................... vi

DAFTAR GAMBAR .................................................................................. vii

DAFTAR LAMPIRAN............................................................................... viii

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah....................................................... 1

1.2 Tujuan dan Manfaat Penelitian.......................................... 3

1.3 Kerangka Penulisan.............................................................. 4

BAB II PENAKSIR MODEL REGRESI BETA

2.1 Pendahuluan.......................................................................... 5

2.2 Generalized Linear Model (GLM)...................................... 6

2.2.1 Distribusi Keluarga Eksponensial............................. 7

2.2.2 Unsur-unsur dalam GLM .......................................... 8

2.3 Prosedur Penaksiran Parameter dalam GLM...................... 9

2.4 Distribusi Beta ...................................................................... 10

2.5 Model Regresi Beta.............................................................. 11

2.6 Penaksir Kemungkinan Maksimum Untuk Regresi Beta .. 14

2.7 Regresi Logistik .................................................................. 17

2.7.1 Uji Kecocokan Model ............................................... 18

2.7.2 Uji Signifikansi Parameter Model ............................. 20

BAB III METODOLOGI PENELITIAN

3.1 Data dan Sumber Data ......................................................... 22

3.2 Tahapan Penelitian ............................................................... 25

Page 12: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

v

3.3 Algoritma Penskoran Fisher ................................................ 26

BAB IV HASIL DAN PEMBAHASAN

4.1 Pendahuluan.......................................................................... 29

4.2 Deskriptif Data ...................................................................... 30

4.3 Hasil- hasil Pada Model Regresi Logistik ........................... 34

4.4 Hasil- hasil Pada Model Regresi Beta.................................. 37

4.5 Pembahasan Hasil- hasil dari Kedua Model Regresi .......... 40

BAB V KESIMPULAN DAN SARAN

5.1 Kesimpulan ............................................................................ 43

5.2 Saran....................................................................................... 45

DAFTAR PUSTAKA ................................................................................. 46

LAMPIRAN ................................................................................................ 47

Page 13: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

vi

DAFTAR TABEL

No.Tabel Halaman

Tabel 3.1 Daftar Nama Variabel dan Kategori dari Variabel....... 23

Tabel 3.2 Daftar Proporsi Kelulusan Mahasiswa …………........ 24

Tabel 4.1 Model Regresi Logistik Variabel Tunggal.................... 35

Tabel 4.2 Penaksir Koefisien, Standar Error, dan Statistik Chi-kuadrat Berdasarkan Hasil Pada Tabel 4.1................... 36

Tabel 4.3 Penaksir Koefisien, Standar Error, dan Statistik Chi-kuadrat Berdasarkan Hasil Pada Tabel 4.2................... 36

Tabel 4.4 Model Regresi Beta Variabel Tunggal……………..... 38

Tabel 4.5 Penaksir Koefisien, Standar Error, dan Uji t

Berdasarkan Hasil Pada Tabel 4.4.............................. 39

Tabel 4.6 Penaksir Koefisien, Standar Error, dan Uji t

Berdasarkan Hasil Pada Tabel 4.5.............................. 39

Page 14: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

vii

DAFTAR GAMBAR

No. Gambar Halaman

Gambar 3.1 Diagram Alir Penskoran Fisher.................................... 28

Gambar 4.1 Diagram Lingkaran Jenis Kelamin............................... 31

Gambar 4.2 Diagram Lingkaran Cara Lolos Seleksi ke IPB............ 31

Gambar 4.3 Box Plot Nilai Rata-rata Ijazah…………………......... 32

Gambar 4.4 Box Plot Nilai Ebtanas Murni………………………... 32

Gambar 4.5 Diagram Lingkaran Daerah Asal Sekolah..................... 33

Gambar 4.6 Diagram Lingkaran Status Asal sekolah….................... 33

Page 15: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

viii

DAFTAR LAMPIRAN

No. Lampiran Halaman

Lampiran 1. Notasi ……………………………………….................... 47

Lampiran 2. Data Proporsi Kelulusan Mahasiswa …………......…..…. 48

Lampiran 3. Hasil Output SAS Model Regresi Beta.…………….......... 49

Lampiran 4. Hasil Output SAS Model Regresi Logistik……………….. 52

Page 16: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

1

BAB I

PENDAHULUAN

1.1 Latar Belakang Masalah

Analisis regresi adalah metode statistika yang digunakan untuk

menyelidiki atau memodelkan hubungan antar variabel bebas dan variabel tak

bebas. Analisis regresi telah banyak diterapkan dalam ilmu sosial dan eksak.

Apabila kita dihadapkan pada suatu masalah penaksir atau peramalan nilai

variabel, katakanlah variabel itu Y dan variabel satunya X, dengan pengambilan

suatu sampel acak berukuran n dari populasi [(xi,yi), untuk i =1,2,..,n], maka data

yang diperoleh dapat diplotkan untuk menghasilkan diagram pencar. Apabila titik-

titik dalam diagram pencar itu mengikuti garis lurus, hal ini menunjukan bahwa

kedua variabel tersebut berhubungan secara linier, dengan secara matematik

hubungan linier yang terbentuk dalam persamaan garis lurus disebut garis regresi

linier.

Persamaaan tersebut dinyatakan oleh:

=ݕ ߚ + +ݔଵߚ ߝ ;= 1,2, . . , ...(1.1)

dimana ߚ menyatakan intersep atau perpotongan dengan sumbu tegak, ଵߚ adalah

kemiringan (slope) atau gradiennya, y adalah variabel tak bebas atau sering juga

disebut sebagai variabel respon, x adalah variabel bebas atau prediktor, dan εi

merupakan variabel acak yang memperhitungkan kegagalan model untuk

kecocokan data secara tepat.

Page 17: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

2

Tujuan utama analisis regresi adalah melihat hubungan antara variabel

respon dengan satu atau lebih variabel prediktor. Bentuk hubungan antara kedua

variabel tersebut yang dinyatakan dalam model regresi digunakan utamanya untuk

melihat bagaimana pengaruh dari satu atau lebih variabel prediktor terhadap

variabel respon.

Jika diasumsikan bahwa εi mengikuti distribusi normal dengan rata-rata 0

dan variansi 2 ditulis ߝ ∼ (ܫଶߪ,0) di dalam metode kuadrat terkecil. Ketika

asumsi terpenuhi, maka penaksir kuadrat terkecil mempunyai sifat-sifat kualitas

penaksir yang baik, artinya penaksir tak bias dan bervariansi minimum, maka

penaksir kuadrat terkecil ini akan sama dengan hasil dari metode kemungkinan

maksimum.

Apabila dihadapkan dengan variabel respons yang berbentuk proporsi,

tentu saja penggunaan metode kuadrat terkecil biasa (ordinary least square)

bukan merupakan solusi yang tepat untuk memodelkan data yang variabel

responsnya (y*) berbentuk proporsi. Hal ini bisa terjadi karena dua alasan,

masalah non-linearitas, dimana model regresi linear biasa akan memberikan nilai

taksiran y* di luar wilayah (0, 1), serta masalah heteroskedastisitas, dimana

varians y* adalah tidak konstan.

Untuk mengatasi masalah tersebut biasanya diselesaikan dengan cara

menggunakan pendekatan kemungkinan maksimum berdasarkan pada fungsi

kemungkinan dari distribusi binomial sebagai dasar pada pemodelan regresi

logistik. Namun selain menggunakan pendekatan pemodelan regresi logistik,

pendekatan lain yang dapat digunakan adalah melalui pemodelan regresi beta.

Model yang diusulkan dalam skripsi ini tentu saja berdasarkan asumsi bahwa

Page 18: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

3

variabel respons mengikuti distribusi beta. karena model regresi beta merupakan

model yang memberikan penaksir parameter yang akurat dan efisien

dibandingkan dengan metode kuadrat terkecil biasa, ketika variabel respons yang

diamati distribusinya tidak simetris, atau pada saat terjadi masalah

heteroskedastisitas.

Distribusi beta sangat fleksibel dan berbagai fenomena ketidakpastian

dapat dimodelkan dengan menggunakan distribusi beta ini. Fleksibilitas ini

mendorong berkembangnya penggunaan distribusi beta secara empiris dalam

berbagai bidang aplikasi. Distribusi beta dicirikan oleh dua buah parameter

bentuk, dimana melalui transformasi aljabar sederhana dari kedua parameter dapat

ditunjukkan bahwa parameter dalam distribusi beta merupakan parameter rata-rata

dan parameter presisi. Dengan cara tersebut, model regresi beta dapat memberikan

penaksir parameter yang berhubungan dengan perubahan dalam rata-rata dan

dispersi dari variabel respons.

Dari uraian diatas maka dalam skripsi ini akan dibahas mengenai bentuk

pemodelan regresi beta, penaksiran parameter dalam model regresi beta dengan

menggunakan metode pendekatan kemungkinan maksimum.

1.2 Tujuan dan Manfaat Penelitian

Tujuan umum dari penulisan skripsi ini ialah untuk menggambarkan

hubungan fungsional antara variabel respon dengan variabel prediktor, dimana

variabel responnya berbentuk proporsi yang mengikuti distribusi beta. Oleh

karena variabel responnya berbentuk proporsi maka pada umumnya variabel

respon tersebut dimodelkan dengan model regresi logistik, tetapi dalam skripsi ini

Page 19: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

4

juga variabel tersebut dapat dimodelkan dengan model regresi beta dengan

demikian tujuan khusus dari skripsi ini yaitu :

Menaksir parameter yang ada dalam model dengan regresi logistik

Menaksir parameter yang ada dalam model dengan regresi beta

Membandingkan hasil-hasil yang diperoleh model regresi logistik

dan model regresi beta.

Solusi dari hasil penelitian ini diharapkan mampu bermanfaat bagi

perkembangan ilmu statistika dan penerapannya di berbagai bidang, khususnya

mereka yang tertarik untuk memodelkan data berbentuk proporsi.

1.3 Kerangka Penulisan

Untuk mempermudah pemahaman mengenai pembahasan skripsi ini maka

dibuatlah kerangka penulisan sebagai berikut : Bab I Pendahuluan, pada bab ini

menjelaskan tentang latar belakang masalah, tujuan beserta manfaat penelitian,

dan kerangka penulisan. Bab II dari skripsi ini berisikan penjelasan tentang

tinjauan pustaka yang dipakai dalam penelitian yang diuraikan dalam teori-teori

mengenai pengertian GLM, distribusi beta, model regresi beta, penaksir

kemungkinan maksimum untuk beta. Bab III Metoda Penelitian, pada bab III ini

diuraikan mengenai data dan sumber data yang digunakan, dan langkah-langkah

penelitian. Bab IV Pembahasan, bab ini menguraikan tentang hasil perhitungan

yang dilakukan berdasarkan data yang diperoleh dengan menggunakan metode-

metode yang sudah dibahas pada bab sebelumnya, dilanjutkan dengan

pembahasan terhadap hasil tersebut. Bab V Kesimpulan saran, bab ini merupakan

bab penutup dari skripsi ini yang berisikan tentang kesimpulan dan saran.

Page 20: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

5

BAB II

PENAKSIRAN MODEL REGRESI BETA

2.1 Pendahuluan

Model linier pada umunya berbentuk

���������������������������������������������������������������� = ࢼ + …�������������������������������������������������������������� (2.1)

dengan asumsi bahwa unsur-unsur dari e adalah berdistribusi normal identik dan

saling bebas, ,(ଶߪ,0)ܦܫ~ merupakan basis dari kebanyakan analisis untuk

data-data kontinu.

Dengan adanya berbagai kelebihan dalam teori statistik dan perangkat lunak

komputer, kita dapat menggunakan metoda analog dengan pengembangan model

linear dalam beberapa situasi sebagai berikut:

Variabel respons mempunyai distribusi selain distribusi normal – mereka

mungkin dapat berbentuk kategori daripada kontinu.

Hubungan antara variabel respons dengan penjelasnya tidak perlu

berbentuk linear sederhana seperti dalam (2.1).

Salah satu dari kelebihannya yang telah banyak dikenal juga sebagai sifat-

sifat yang ‘baik’ dari distribusi normal dibagi ke dalam kelas yang lebih luas dari

suatu distribusi yang disebut juga sebagai distribusi dari keluarga eksponensial.

Kelebihan yang kedua adalah perluasan dari metoda numerik untuk

penaksiran parameter, dari kombinasi linear seperti Xβ dalam (2.1) kepada fungsi

dari kombinasi linear seperti ψ(Xβ). Dalam teori prosedur penaksirannya adalah

langsung. Dalam prakteknya prosedur penaksiran ini melibatkan suatu komputasi

tertentu sehingga tidak hanya menjadi lebih mudah dengan perkembangan

Page 21: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

6

program komputer untuk optimisasi numerik dari fungsi non-linear. Prosedur

seperti ini sudah ada dalam paket-paket statistik seperti GLIM (Baker dan Nelder,

1978).

2.2 Generalized Model Linear (GLM)

Istilah model linear umum atau generalized linear model (GLM) biasanya

merujuk pada model regresi biasa untuk variabel respons kontinu pada variabel

prediktor kontinu dan/atau kategorik. Model ini juga termasuk model regresi

multipel maupun model ANOVA atau ANCOVA (hanya untuk efek tetap).

Bentuknya adalah

ݔ)~ݕ���������������������������������������������������������(ଶߪ,ߚ … (2.2)

dimana xi berisi kovariat yang diketahui dan β adalah koefisien yang akan ditaksir.

Model ini dapat ditaksir dengan menggunakan metode kuadrat terkecil dan

metode kuadrat terkecil diboboti.

Istilah GLM merujuk pada kelas model yang lebih besar yang

dipopulerkan oleh McCullagh dan Nelder (1989). Dalam model ini, variabel

respons yi diasumsikan mengikuti distribusi dari keluarga eksponensial dengan

rata-rata µi, yang biasanya diasumsikan sebagai suatu fungsi (seringkali

bentuknya nonlinear) dari ݔ.ߚ Beberapa penulis mengatakan bentuknya adalah

nonlinear karena µi seringkali merupakan fungsi nonlinear dari kovariat, tetapi

McCullagh dan Nelder (1983) mempertimbangkan fungsi tersebut sebagai bentuk

yang linear, karena kovariat ini mempengaruhi distribusi dari yi hanya melalui

kombinasi linear dari ݔ.ߚ Perangkat lunak yang pertama kali dikembangkan

untuk mencocokan model ini disebut GLIM, akan tetapi saat ini sudah tersedia

Page 22: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

7

paket komputer yang dapat digunakan, termasuk didalamnya adalah melalui

SAS/IML.

Selain distribusi normal, model yang mungkin untuk variabel respons

dalam GLM diantaranya adalah binomial, Poisson, Gamma, ataupun Inverse

Gaussian. Dalam skripsi ini akan difokuskan pembahasannya pada distribusi beta.

2.2.1 Distribusi Keluarga Eksponensial

Perhatikan bila satu buah variabel acak Y yang mempunyai fungsi (massa)

peluang, maka variabel ini disebut diskrit, atau bila satu buah variabel acak Y

yang mempunyai fungsi densitas peluang, maka variabel ini disebut kontinu, yang

bergantung pada satu buah parameter θ. Suatu distribusi merupakan anggota dari

keluarga eksponensial apabila mempunyai bentuk sebagai berikut:

(ߠ,ݕ) = ቊݔ−ߠݕ (ߠ)

()+ ቋ(,ݕ)

= −ቊݔ(ߠ)

()ቋ ൜ݔ

ߠ

()ൠݕ (ߠ,ݕ) … (2.3)

dimana θ disebut juga sebagai parameter kanonik dan φ disebut juga sebagai

parameter dispersi. Rata-rata E(y) = µ merupakan fungsi dari θ itu sendiri,

sehingga θ merupakan parameter yang diamati, sedangkan φ biasanya dianggap

sebagai suatu gangguan. Kemudian a(·), b(·), dan c(·) merupakan suatu fungsi

yang diketahui dan masing-masing mencirikan anggota distribusi dari keluarga

eksponensial. Perlu diketahui bahwa nilai harrapan y, E(y), hanya bergantung pada

parameter θ dan bukan pada parameter φ.

Page 23: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

8

2.2.2 Unsur – unsur dalam GLM

Seluruh model linear umum akan mempunyai tiga buah komponen, yaitu :

a. Komponen acak. Komponen ini menggambarkan distribusi dari variabel

respons yang diamati. Variabel respon y1, y2, …, yn merupakan sampel acak

yang distribusinya berasal dari keluarga eksponensial, seperti normal,

binomial, Poisson, gamma, dan banyak lainnya. Distribusi keluarga

eksponensial seluruhnya bergantung pada vektor parameter θ dimana fungsi

loglikelihoodnya dapat ditulis kembali dalam bentuk seperti berikut :

(ߠ)ܮ��������������������� = −(ߠ)

(߶)+

ݕߠ

(߶)+ log[ [(ݕ,߶) … (2.4)

dimana θ adalah parameter kanonik atau natural, φ adalah parameter skala,

serta a(·), b(·), dan c(·) masing-masing mencirikan anggota distribusi dari

keluarga eksponensial.

b. Komponen sistematik. Komponen ini menggambarkan bagaimana kovariat

dimasukan ke dalam model sebagai nilai harapan dari y, µ= E(y). Di dalam

model linear umum ini nilai dari µ akan bervariasi menurut taraf dari variabel

penjelasnya. Komponen sistematik dapat dituliskan dalam bentuk seperti

berikut:

=ߟ��� ߚ = ߚ + +ଵݔଵߚ +⋯+ଶݔଶߚ =ݔߚ ൦

ଵߟଶߟ⋮ߟ

൪ … (2.5)

Kombinasi linear dari variabel penjelas ini disebut juga sebagai prediktor

linear. Beberapa {xj} dapat berbentuk lainnya di dalam model, misalnya x3 =

x1x2 untuk menyatakan bentuk interaksi antara variabel x1 dan x2 dalam

Page 24: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

9

memberikan efek pada y, atau mungkin dapat berbentuk x2 = x12 untuk

menyatakan adanya bentuk kurva dari variabel x1.

c. Fungsi hubung. Komponen ini menyatakan, bagaimana µ= E(y) berhubungan

dengan variabel penjelas (X) di dalam prediktor linear. Kita dapat memodelan

rata-rata µ secara langsung atau memodelkan suatu fungsi monoton g(µi).

Persamaan model menyatakan bahwa :

�������������������������������������������������� (ߤ) = =ߟ …��������������������������������������������ߚ (2.6)

Untuk beberapa fungsi g monoton, yang biasa disebut sebagai fungsi

penghubung (link function).

2.3 Prosedur Penaksiran Model dalam GLM

Dalam regresi linier sederhana, metode yang paling banyak digunakan

untuk menaksir parameter itu adalah metode kuadrat terkecil. Pada metode

tersebut kita pilih suatu nilai β0 dan β1 tertentu yang akan meminimumkan jumlah

kuadrat error dari nilai pengamatan Y dari nilai taksirannya berdasarkan model

tertentu. Di bawah asumsi yang biasa untuk regresi linier, metode kuadrat terkecil

menghasilkan penaksir dengan sejumlah persyaratan secara statistik tertentu. Jika

metode ini diterapkan pada model dengan variabel biner, maka penaksir tersebut

tidak akan mempunyai sifat yang sama.

Metode umum penaksiran yang membawa kepada fungsi kuadrat terkecil

di bawah model regresi linier (jika bentuk galatnya menyebar normal) disebut

dengan kemungkinan maksimum. Metode ini akan memberikan landasan pada

suatu pendekatan pada penaksiran dengan model regresi logistik. Metode

kemungkinan maksimum akan memberikan nilai-nilai untuk parameter-parameter

Page 25: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

10

yang tidak diketahui yang mana akan memaksimumkan peluang yang diperoleh

melalui sekumpulan data pengamatan. Untuk dapat menerapkan metode ini, maka

kita perlu membentuk suatu fungsi yang disebut dengan fungsi kemungkinan

(likelihood function). Fungsi ini menyatakan peluang dari data pengamatan

sebagai fungsi dari parameter yang tidak diketahui tersebut. Penaksir

kemungkinan maksimum dari parameter-parameter itu dipilih sedemikian rupa

sehingga dapat memaksimumkan fungsi tersebut.

Metode penskoran Fisher merupakan salah satu metode yang paling

banyak digunakan untuk menyelesaikan persamaan non linear. Metode ini juga

dapat digunakan untuk menentukan titik maksimum dari suatu fungsi,

sebagaimana permasalahan dalam menentukan penaksir kemungkinan maksimum.

Prosedur penaksiran parameter melalui prosedur ini memerlukan turunan parsial

pertama dan kedua dari fungsi kemungkinan, dimana turunan pertama dan kedua

dari fungsi kemungkinan masing-masing disebut sebagai statistik skor (score

statistics) dan matriks informasi (I).

Statistik skor adalah suatu ukuran untuk menguji keberartian parameter,

dimana statistik ini berbentuk kuadratik yang berdasarkan pada vektor turunan

pertama parsial dari fungsi log kemungkinan terhadap β, yang dievaluasi pada saat

H0: β = β0. Sedangkan matriks informasi merupakan nilai harapan yang berharga

negatif dari matriks turunan kedua parsial dari fungsi log kemungkinan.

2.4 Distribusi Beta

Dalam teori probabilitas dan statistik, distribusi beta adalah distribusi

probabilitas yang didefinisikan pada interval (0, 1) oleh dua parameter positif,

bentuk parameter biasanya dilambangkan dengan a dan b. Fungsi densitas dari

Page 26: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

11

suatu variabel acak Y yang berdistribusi Beta, dengan parameter a dan b, dapat

ditulis sebagai berikut :

(ݕ) = ቐ

Γ(+ )

Γ( )Γ( )ଵ(1ݕ − ଵ(ݕ ; 0 < >ݕ 1,> 0,> 0

0 �ݕ; �ݕ

… (2.7)

dimana Г(.) merupakan fungsi gamma. Rata-rata dan variansi dari distribusi Beta

dengan parameter a dan b masing-masing adalah :

()ܧ������������������������������ =

+ … (2.8)

dan

ݒ���������������� ()�ݎ =

(+ )ଶ(+ + 1)… (2.9)

2.5 Model Regresi Beta

Pada bagian ini dibahas mengenai suatu model regresi untuk respons yang

mengikuti distribusi beta. Fungsi densitas dari distribusi beta diberikan dalam

Pers. (2.7), dengan parameter a dan b. Akan tetapi untuk keperluan pemodelan,

maka biasanya akan sangat berguna apabila memodelkan rata-rata dari variabel

respons. Selain itu pula biasanya perlu mendefinisikan model sedemikian rupa

sehingga model ini berisi suatu parameter dispersi. Untuk membentuk model

regresi beta dengan menyertakan rata-rata respons bersamaan dengan parameter

dispersinya, maka perlu dilakukan reparameterisasi dari fungsi densitas beta.

Misalkan =ߤ

(ା)dan =ߢ (+ ), sehingga diperoleh bahwa = ߢߤ dan

= (1 − .ߢ(ߤ Dengan demikian, berdasarkan Pers. (2.8) dan (2.9) diketahui

bahwa :

()ܧ������������������������������������� = …����������������������������������������������������������������ߤ (2.10)

Page 27: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

12

dan

ݒ��������������������������������� ()�ݎ =1)ߤ − (ߤ

+ߢ 1… (2.11)

dimana µ adalah rata-rata dari variabel respons dan κ dapat diinterpretasikan

sebagai parameter dispersi, dalam arti bahwa untuk µ tertentu, maka nilai dari κ

lebih besar akan memberikan varians bagi variabel respons yang lebih kecil.

Setelah dilakukan reparameterisasi tersebut, maka fungsi untuk variabel

acak Y yang mengikuti distribusi beta menjadi :

������� (ݕ) =Γ(ߢ)

Γ(ߢߤ)Γ((1 − (ߢ(ߤఓଵ(1ݕ − ଵ(ଵఓ)(ݕ ; 0 < >ݕ 1 … (2.12)

Parameterisasi semacam ini menyatakan bahwa 0 < >ߤ� 1 dan <�ߢ 0, dan juga

dapat dengan mudah ditunjukkan bahwa��= <�ߢߤ 0 dan �= 1)ߢ� (ߤ– > 0.

Untuk membentuk model regresi beta dilakukan pendekatan GLM dengan

menggunakan dua fungsi hubung yaitu, satu fungsi hubung digunakan untuk

parameter lokasi ߤ dan fungsi hubung yang lainnya digunakan untuk parameter

dispersi .ߢ Menurut Smithson dan Verkuilen (2005) bahwa fungsi ini merupakan

fungsi non linear, halus (smooth), dan monoton yang memetakan dari ruang yang

tidak berbatas (unbounded) dari prediktor linear ke dalam ruang sampel yang

diamati, dalam hal ini terbatas pada interval terbuka (0, 1). Misalkan X dan Z

adalah matriks kovariat (mungkin bisa identik), dengan xi dan zi merupakan

vektor baris ke-i dari kedua matriks tersebut. Dimisalkan pula ࢼ dan masing-

masing adalah vektor koefisien regresi beta. GLM untuk parameter lokasi

biasanya adalah

�������������������������������������������������� (ߤ) = …����������������������������������������������������������ࢼ (2.13)

Page 28: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

13

dimana (. )adalah fungsi hubung monoton, suatu fungsi yang mempunyai

turunan. Fungsi hubung yang digunakan oleh Pers (2.13) adalah menggunakan

fungsi hubung logit. Bentuk umum dari hubungan antara rata-rata dan varians

adalah

ߪ��������������������������������������������ଶ = (ߢ)ݑ(ߤ)ߥ … (2.14)

dimana v dan u adalah fungsi yang bersifat non-negatif. Parameter dispersi ߢ

diasumsikan sebagai suatu bentuk yang dapat dimodelkan sebagai

ℎ(ߢ) = ࢠ…������������������������������������������������������� (2.15)

dimana h merupakan fungsi hubung yang lain, yaitu dalam hal ini menggunakan

fungsi hubung log dimana variabel zi yang dinyatakan dalam Pers (2.15) berupa

vektor satu.

Untuk variabel respons yang berdistribusi beta, maka rata-ratanya harus

berada dalam selang terbuka, sehingga diperlukan suatu fungsi hubung yang dapat

memenuhi kondisi tersebut. Salah satu pilihan fungsi hubung yang dapat

digunakan adalah fungsi hubung logit, karena fungsi hubung ini mampu

memetakan ߤ ∈ (0, 1) ke dalam ruang sampel yang sesuai dengan distribusinya.

Fungsi hubung logit ini juga biasa digunakan sebagai fungsi hubung dalam model

regresi logistik. Dengan demikian, model regresi beta dapat dikatakan sebagai

bentuk umum dari model regresi logistik ketika variabel respon yang diamati

berbentuk proporsi.

Parameter dispersi κ harus bernilai positif karena setelah

direpatameterisasi parameter µ dan κ bernilai positif. Fungsi hubung log yang

dapat memenuhi sifat tersebut, yaitu

log (ߢ) = ࢠ−…���������������������������������������������� (2.16)

Page 29: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

14

sehingga nilai taksiran untuk parameter dispersinya dimodelkan dalam bentuk

=ߢ���������������������������������������� exp൫−ࢠ൯ … (2.17)

disini digunakan tanda negatif untuk membuat interpretasi mengenai koefisien ߜ

menjadi lebih mudah. Oleh karena merupakanߢ parameter dispersi, maka suatu ߜ

yang bernilai positif mengindikasikan variansi yang lebih kecil, dan hal ini tentu

saja menjadi sulit dalam interpretasinya.

2.6 Penaksir Kemungkinan Maksimum Untuk Regresi Beta

Misalkan Yi, …, Yn adalah variabel acak saling bebas, dimana untuk setiap

Yi, untuk i = 1, …, n mengikuti densitas yang diberikan dalam Pers. (2.12)

dengan rata-rata ߤ dan parameter dispersi ߢ yang tidak diketahui. Model

diperoleh dengan cara mengasumsikan bahwa rata-rata yt dapat ditulis sebagai

berikut

������������������������������� (ߤ) = ߚݔ

ୀଵ

…���������������������������������������������������������������������������ߟ���= (2.18)

dimana ࢼ = ,ଵߚ) (ߚ… adalah vektor dari parameter regresi, dan xi1, …, xip

merupakan data pengamatan pada k buah kovariat, untuk < , yang

diasumsikan tetap (fixed) dan diketahui bahwa varians dari respons y merupakan

fungsi dari ,ߤ dan akibatnya juga merupakan fungsi dari nilai kovariatnya. Dengan

demikian, varians yang tidak konstan secara tidak langsung akan diakomodasikan

ke dalam model. Disini terlihat parameter rata-rata dibatasi pada selang terbuka

(0, 1), sehingga diperlukan suatu fungsi hubung yang akan memetakan parameter

dari interval ke dalam ruang bilangan nyata. Fungsi hubung logit merupakan

fungsi hubung kanonik dan akan mengembalikan penaksir parameter ke dalam

bentuk log odds rasio.

Page 30: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

15

Fungsi hubung logit (ߤ) didefinisikan sebagai :

(ߤ) = (ߤ)ݐ = log൬ߤ

1 − ߤ൰=

ࢼ → =ߤexp൫

൯ࢼ

1 + exp((ࢼ

… (2.19)

Dalam hal ini, parameter regresi mempunyai interpretasi yang penting.

Misalkan bahwa nilai dari prediktor ke-i meningkat sebesar c unit, dan variabel

prediktor lainnya dianggap tidak berubah, serta ∗ߤ merupakan rata-rata dari

variabel y di bawah suatu nilai kovariat yang baru, sedangkan ߤ menyatakan rata-

rata y di bawah nilai kovariat yang asli, maka dapat ditunjukkan bahwa :

exp൫ ൯ߚ =∗ߤ /(1 − ∗ߤ )

1)/ߤ − (ߤ… (2.20)

Artinya, exp൫ ൯ߚ adalah sama dengan odds rasio, sama dengan interpretasi

dalam model regresi logistik. Fungsi log-likelihood untuk ruang sampel model

regresi beta memiliki bentuk :

(ߜ,ߚ)�������������������������������������� = ߢ,ߤ)

ୀଵ

) … (2.21)

dimana

(ߢ,ߤ) = Γ(ߢ) − logΓ(ߤߢ) − Γ{(1 − {ߢ(ߤ + −ߢߤ) 1) ݕ

+ {(1 − −ߢ(ߤ 1} log(1 − (ݕ … (2.22)

Atau dapat dituliskan dalam bentuk persamaan seperti berikut :

(ࢠ,:ߜ,ߚ) = log Γ൫ ఋ൯ࢠ

− logΓቆఋࢠࢼ

1 + ௫ࢼቇ− logΓቆ

ఋࢠ

1 + ࢼቇ+ቆ

ఋࢠࢼ

1 + ௫ࢼ− 1ቇ logݕ

+ ቆఋࢠࢼ

1 + ௫ࢼ− 1ቇlogݕ+ቆ

ఋࢠ

1 + ࢼ− 1ቇ log(1 − (ݕ … (2.23)

Page 31: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

16

Misalkan =ݏ � /ݕ} (1 {(ݕ�− dan ߤ∗ = (ߢߤ) − ((1 − .(ߢ(ߤ Kemudian,

vektor skor yang merupakan turunan pertama dari fungsi log-likelihood terhadap

parameter ࢼ dan , diberikan oleh :

������� (ߜ,ߚ) =(ߢ,ߤ)

ߠ

(ߢ,ߤ)

ߚ

(ߢ,ߤ)

ߜ ⎠

= ൮

−ݏ)ߢ ߤ∗)

൛ߤ௧(ݏ− ߤ∗) + log(1 − (ݕ − ൫(1 − +൯ߢ(ߤ ψ(ߢ)ൟ

ୀଵ

൲��… (2.24)

dimana X adalah matriks data dari variabel prediktor berukuran �× dengan

unsur baris ke-t adalah ݔ dan = �ቂ

`,(ଵߤ) … ,

`ቃ(ߤ) dan vektor

parameter = .(ߜ,ߚ)

Tahap selanjutnya adalah menentukan matriks informasi. Misalkan diketahui

= ,ଵݓ} … ,{ݓ, dengan

=ݓ�� (ߢߤ)`}ߢ + � `(1 − {(ߢ(ߤ1

ଶ{(ߤ)`}

� = ( ଵ, … , ) dengan = −ߤ(ߢߤ)`}ߢ `(1 − 1)(ߢ(ߤ ,{(ߤ�− dimana

`(. ) merupakan fungsi trigamma. Dimisalkan pula = { ଵ, . . . , },

dengan

= ߤ(ߢߤ)`ଶ + `((1 − 1)(ߢ(ߤ − (ߤ

ଶ− .(ߢ)`

Dengan demikian matriks informasi Fisher, yang merupakan turunan

kedua dari minus ekspetasi fungsi log-likelihood yang diberikan dalam Pers (2.22)

terhadap parameter (ߜ,ߚ) diberikan oleh

Page 32: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

17

(ߜ,ߚ)ܫ������������������� = ܧ−

⎣⎢⎢⎢⎡ଶ (ߜ,ߚ)

ଶߚଶ (ߜ,ߚ)

ߜߚ

ଶ (ߜ,ߚ)

ߜ ߚ

ଶ (ߜ,ߚ)

ଶߜ ⎦⎥⎥⎥⎤

… (2.25)

dimanaడమ(ఉ,ఋ)

డఉమ= ߢ ,

డమ(ఉ,ఋ)

డఉడఋ= , dan

డమ(ఉ,ఋ)

డఋమ= ,() Namun di sini

bahwa parameter ߚ dan ߜ bersifat tidak orthogonal.

Pada saat ukuran sampel besar, maka vektor penaksir parameter

ߠ = (መߜ,መߚ) akan mengikuti akan mengikuti pendekatan distribusi normal

multivariat, atau dapat dinyatakan sebagai ቆቀ~ߠߚߜቁ, ,ଵቇ[(ߜ,ߚ)ܫ] dimana መߚ

dan መߜ masing-masing adalah penaksir kemungkinan maksimum. Perlu

ditambahkan juga bahwa ଵ[(ߜ,ߚ)ܫ] dapat digunakan untuk memperoleh galat

baku asimptotik bagi penaksir kemungkinan maksimum

Penaksir kemungkinan maksimum bagi β dan ߜ yang diperoleh dari

U(ߜ,ߚ) = 0 bukan merupakan persamaan tertutup. Dengan demikian solusinya

harus diselesaikan secara numerik dengan menggunakan algoritma optimisasi

nonlinear, seperti metode penskoran Fisher.

2.7 Regresi Logistik

Regresi logistik adalah salah satu bagian dari analisis regresi, yang

digunakan untuk memprediksi peluang kejadian suatu peristiwa dengan

mencocokan data pada fungsi logit. Metode ini merupakan model linier umum

yang digunakan untuk regresi binomial. Seperti analisis regresi pada umunya,

metode ini menggunakan beberapa variabel bebas berupa data berskala interval

dan atau kategorik. Regresi logistik tidak memerlukan asumsi normalitas,

Page 33: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

18

heteroskedastitsitas dan autokorelasi, dikarenakan variabel tak bebas yang

terdapat pada regresi logistik merupakan variabel biner (0 dan 1).

Bentuk umum model peluang regresi logistik diformulasikan sebagai berikut :

(ݔ)ߨ������������������������������������ =exp൫

൯ࢼ

1 + exp((ࢼ

… (2.26)

dimana ,1≥(ݔ)ߨ�≥ adalah peluang kejadian sukses dengan nilai peluang 0 (ݔ)ߨ

dan β adalah koefisien parameter.

(ݔ)ߨ merupakan fungsi yang non linier, sehingga perlu dilakukan transformasi

kedalam bentuk logit untuk memperoleh fungsi yang linier. Dengan melakukan

transformasi dari logit ,(ݔ)ߨ maka didapat persamaan yang lebih sederhana,yaitu :

����������������������������� (x) = logగ(௫)

൫ଵగ(௫)൯=

…������������������������������������������������������ࢼ (2.27)

Langkah-langkah yang ada dalam penggunaan analisis regresi logistik yaitu

statistik kecocokan model dan uji signifikansi parameter model.

2.7.1 Uji Kecocokan Model (Goodness Of Fit )

Suatu alat statistik yang digunakan untuk pengujian kecocokan model

berguna untuk memilih sebuah model yang hasilnya paling cocok untuk data yang

diperoleh. Nilai p-value yang tinggi berarti, model merupakan model yang

terbaik. Metode yang digunakan untuk goodness of fit pada data kategorik adalah

statistik chi-kuadrat Pearson, dan statistik chi-kuadrat Deviance dengan hipotesis

uji sebagai berikut:

H0 : Model cocok dengan data

H1 : Model tidak cocok dengan data

Page 34: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

19

dimana statistik chi-kuadrat Pearson :

�������������������� ଶ = −ݕ) Ƹ)

Ƹ(1 − (Ƹ

ୀଵ

. . . (2.28)

dan statistik chi-kuadrat Devians :

ܦ������������� = 2 ൜ݕlog��൬ݕොݕ൰+ (− (ݕ log൬

1 − ݕ1 − ොݕ

൰ൠ

ୀଵ

… (2.29)

Baik statistik chi-kuadrat Pearson dan statistik chi-kuadrat Devians

keduanya mengikuti distribusi chi kuadrat. Dengan demikian kriteria uji untuk

menguji dapat dirumuskan seperti berikut :

Jika nilai statistik chi kuadrat Pearson pada Pers (2.28) dibandingkan

dengan nilai chi kuadrat pada derajat bebas (− ( tertentu atau nilai

signifikansi dibandingkan dengan α, dimana apabila nilai chi kuadrat

pearson lebih kecil daripada nilai chi-kuadrat, atau nilai signifikansi lebih

besar dari α, maka hipotesis dari hal ini berarti H0 diterima, yang berati

model cocok dengan data. Dan apabila sebaliknya nilai chi kuadrat

Pearson lebih besar sama dengan nilai chi-kuadrat, atau nilai signifikansi

lebih kecil sama dengan α, maka hipotesis H0 ditolak, yang berarti model

tidak cocok dengan data.

Jika nilai statistik chi kuadrat Devians pada Pers (2.29) dibandingkan

dengan nilai chi kuadrat pada derajat bebas (− ( tertentu atau nilai

signifikansi dibandingkan dengan α, dimana apabila nilai chi kuadrat

Devians lebih kecil daripada nilai chi-kuadrat, atau nilai signifikansi lebih

besar dari α, maka hipotesis dari hal ini berarti H0 diterima, yang berati

Page 35: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

20

model cocok dengan data. Dan apabila sebaliknya nilai chi kuadrat

Devians lebih besar sama dengan nilai chi-kuadrat, atau nilai signifikansi

lebih kecil sama dengan α, maka hipotesis H0 ditolak, yang berarti model

tidak cocok dengan data.

2.7.2 Uji Signifikansi Parameter Model

Untuk memeriksa peranan variabel-variabel penjelas (X) dalam model,

dilakukan penguiian terhadap parameter model (β). Penguiian secara simultan

dilakukan menggunakan uji G, sedangkan secara parsial menggunakan statistik uji

T2. Statistik uji G adalah uji rasio kemungkinan ( likelihood ratio test) yang

digunakan untuk menguji peranan variabel penjelas di dalam model secara

bersama-sama. Rumus umum statistik uji G untuk menguii hipotesis :

H0 : β1 = β2 = . . . = βk = 0

H1 : minimal ada satu β yang tidak sama dengan 0

Melalui uji statistik seperti berikut :

ܩ��������������������������������������������� = −2 lnܮܮ

. . . (2.30)

dimana :

Lo = maksimum likelihood dari model reduksi atau model yang terdiri darikonstatnta saja

Lp = maksimum likelihood dari model penuh (full) atau dengan semua variabelbebas.

Statistik G ini secara teoritis mengikuti sebaran chi-kuadrat dengan derajat

bebas k. Kriteria keputusan yang diambil yaitu menolak H0 bila nilai statistik G

lebih besar dari chi-kuadrat. Sementara itu, uji T2 digunakan untuk menguji

parameter βj secara parsial. Hipotesis yang diuji adalah :

Page 36: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

21

H0 : βj = 0 (variabel bebas ke-j tidak mempunyai pengaruh secara signifikansi

terhadap model)

H1 : βj ≠ 0 (variabel bebas ke-j tidak mempunyai pengaruh secara signifikansi

terhadap model)

Formula untuk statistik uji T2 adalah :

����������������������� ଶ = �ቆߚ

መ൯ߚ൫ܧቇ

… (2.31)

Secara teori statistik uji T2 ini mengikuti sebaran normal baku jika H0 benar.

Kriteria keputusan adalah H0 ditolak jika statistik uji | T2| > zα/2.

Page 37: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

22

BAB III

METODOLOGI PENELITIAN

3.1 Data dan Sumber Data

Data yang digunakan dalam skripsi ini merupakan data skunder yang

berasal dari sebuah tesis yang berjudul “Kajian Perbandingan Model Regresi

Beta-binomial dengan Model Regresi Logistik dan Penerapannya untuk Menduga

Pola Kelulusan Mahasiswa IPB-TPB tahun akademik 1997/1998”. Populasi

dalam penelitian adalah mahasiswa – mahasiswa pada program tingkat persiapan

bersama di Institut Pertanian Bogor (IPB). Mahasiswa – mahasiswa yang

dimaksud adalah mahasiswa program strata satu (S1) yang telah diterima di IPB

pada tahun akademik 1997/1998, baik yang diterima melalui saringan ujian masuk

perguruan tinggi negeri (UMPTN) maupun jalur penelusuran minat dan bakat

(atau dikenal pula dengan jalur PMDK). Data akan diambil dari Program Tingkat

Persiapan Bersama IPB dengan banyak pengamatan 2216 pengamatan.

Data yang diperlukan untuk menganalisis pola kelulusan mahasiswa dalam

mengikuti sejumlah mata kuliah yang diselenggarakan pada tingkat persiapan

bersama di Institut Pertanian Bogor (IPB), yaitu semua mata kuliah yang diambil

oleh mahasiswa pada semester satu dan dua.

Page 38: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

23

Tabel 3.1. Daftar Nama Variabel dan Kategori dari Variabel

No Nama Variabel Kategori Notasi1 ID

2 Jenis Kelamin (JK)0 = Perempuan1 = Laki - laki

X1

3 Cara lolos seleksi ke IPB (Jalur)0 = PMDK1 = UMPTN

X2

4 Nilai rata-rata ijazah X35 Nilai ebtanas murni/NEM X4

6 Daerah asal sekolah0 = Kabupaten1 = Kotamadya

X5

7 Status sekolah0 = Swasta1 = Negeri

X6

8 Banyaknya mata kuliah yang lulus R9 Banyaknya mata kuliah yang diambil N

10Proporsi banyaknya mata kuliah yanglulus

y*

Nusar Hajarisman (1998). Kajian Perbandingan Model Regresi Beta-Binomial denganModel regresi Logistik dan Penerapannya untuk Menduga Pola Kelulusan MahasiswaIPB-TPB tahun 1997/1998

Variabel ID merupakan nomor induk mahasiswa IPB, baik yang berjenis

kelamin laki-laki ataupun perempuan. Variabel Cara lolos seleksi ke IPB (jalur)

dapat melalui dua tes yaitu PMDK dan UMPTN, dimana Variabel nilai rata-rata

ijazah dan Variabel nilai ebtanas murni (NEM) harus sesuai dengan persyaratan

yang ditentukan oleh pihak kampus yaitu IPB. Variabel Daerah asal sekolah ialah

tempat asal SMU calon mahasiswa itu berada di wilayah kabupaten atau

kotamadya, dengan Variabel status sekolah swasta atau negeri.

Pada dasarnya mahasiswa hanya mengambil banyaknya mata kuliah yang

ada pada semester 1 dan 2, yang bertujuan untuk mengetahui berapa banyaknya

mata kuliah yang lulus dari semester tersebut setelah mengikuti program tingkat

persiapan bersama di Institut Pertanian Bogor (IPB).

Dari hasil program tersebut akan didapat hasil proporsi kelulusan dari

banyaknya mata kuliah yang diambil oleh peserta dimana data proporsi kelulusan

tersebut disajikan pada Tabel 3.2

Page 39: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

24

Tabel 3.2 Data proporsi kelulusan Mahasiswa dalam mengambil sejumlah matakuliah yang diselenggarakan pada Tingkat Persiapan Bersama di Institut PertanianBogor pada tahun 1997/1998

Obs ID JK Jalur Ijasah NEMAsal

SekolahStatus

Sekolah

MataKuliah

Yang lulus

MataKuliahyang

diambil

Proporsimata

kuliahyang lulus

1 A00497001 0 1 7.30 43.75 1 0 15 15 1.00

2 A00497002 0 1 8.50 50.86 1 0 15 15 1.00

3 A00497003 0 1 8.70 54.89 1 0 15 15 1.00

4 A00497004 1 1 8.20 51.81 1 0 15 15 1.005 A00497005 0 1 7.31 41.13 1 1 15 15 1.00

6 A00497006 0 0 8.00 52.04 1 0 15 15 1.00

7 A00497007 0 1 7.60 41.78 1 0 15 15 1.00

8 A00497008 0 1 7.50 48.38 1 0 15 15 1.00

9 A00497009 0 1 7.70 55.81 1 0 15 15 1.00

10 A00497010 0 1 7.60 46.82 1 0 15 15 1.00

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

2209 G07497028 1 1 7.40 40.92 1 1 3 15 0.20

2210 G07497029 1 1 6.70 34.68 1 1 1 15 0.07

2211 G07497030 1 1 7.60 40.10 1 1 7 15 0.47

2212 G07497031 1 1 7.90 46.70 0 0 6 15 0.40

2213 G07497032 1 1 6.70 40.64 0 0 4 15 0.27

2214 G07497033 1 1 6.40 41.60 0 0 8 15 0.53

2215 G07497034 1 1 7.18 41.39 0 1 1 15 0.07

2216 G07497035 1 1 7.30 52.18 0 0 10 15 0.67

Dari Tabel 3.2 terlihat bahwa nilai dari proporsi mencakup nilai 0 dan 1,

yang mana didalam model regresi beta berada dalam selang (0,1) yaitu tidak

mencakup nilai 0 dan 1. Maka untuk mengatasi permasalahan tersebut dengan

menggunakan persamaan seperti berikut, y’’ = [y(n – 1) + s]/n, dimana s adalah

konstan antara 0 dan 1 yaitu 0.5 menurut Smithson dan Verkuilen (2005). Dari

hasil persamaan berikut maka didapat nilai proporsi yang baru tidak mencakup 0

dan 1, yang disajikan pada Tabel dilampiran 2 .

Page 40: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

25

3.2 Tahapan Penelitian

Tahapan yang digunakan dalam menentukan model regresi beta pada data

proporsi yaitu :

1. Mendeskripsikan data penelitian

2. Memodelkan data penelitian dengan regresi logistik, dengan tahapan

sebagai berikut :

a. Mengidentifikasi variabel yang signifikan melalui statistik uji T2

untuk masing-masing variabel prediktor. Proses ini disebut juga

sebagai analisis variabel tunggal dengan mengambil taraf

signifikansi sebesar 30% (Hosmer dan Lemeshow, 1989)

b. Variabel yang dianggap signifikan pada tahap pertama, kemudian

dianalisis secara simultan (proses ini disebut sebagai analisis

variabel ganda). Pada proses ini menggunakan statistik uji chi-

kuadrat pada taraf signifikansi sebesar 10%.

c. Sebelum membuat kesimpulan akhir, untuk setiap variabel yang

dianggap tidak signifikan pada tahap kedua akan diperiksa kembali

signifikansi variabel tersebut terhadap model dengan menggunakan

uji rasio kemungkinan.

3. Memodelkan data penelitian dengan regresi beta, melalui Pers (2.13) dan

(2.17) dimana metode numerik yang digunakan penskoran Fisher, dengan

tahapan sebagai berikut :

a. Mengidentifikasi variabel yang signifikan melalui statistik uji T2

untuk masing-masing variabel prediktor. Proses ini disebut juga

Page 41: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

26

sebagai analisis variabel tunggal dengan mengambil taraf

signifikansi sebesar 30% (Hosmer dan Lemeshow, 1989)

b. Variabel yang dianggap signifikan pada tahap pertama, kemudian

dianalisis secara simultan (proses ini disebut sebagai analisis

variabel ganda). Pada proses ini menggunakan statistik uji chi-

kuadrat pada taraf signifikansi sebesar 10%.

c. Sebelum membuat kesimpulan akhir, untuk setiap variabel yang

dianggap tidak signifikan pada tahap kedua akan diperiksa kembali

signifikansi variabel tersebut terhadap model dengan menggunakan

uji rasio kemungkinan.

3.3 Algoritma Penskoran Fisher

Salah satu metode penaksiran model adalah dengan menggunakan

penskoran Fisher, dimana model ini untuk menyelesaikan persamaan non-

linier. Metode ini dapat digunakan untuk menentukan titik maksimum dari

suatu fungsi, sebagaimana permasalahan dalam menentukan penaksir

parameter dengan metode kemungkinana maksimum. Berikut ini prosedur

penskoran Fisher untuk menentukan penaksir β yang dapat memaksimumkan

fungsi kemungkinan, yang sebut saja fungsi u(β*).

Pertama-tama perhatikan bahwa n buah pengamatan akan digunakan

untuk menaksir nilai-nilai dari p buah parameter, β1, β2,..., βp , serta bentuk

fungsi kemungkinan L(β). Turunan sebanyak p buah dari fungsi log

kemungkinan terhadap β1, β2,..., βp, disebut sebagai statistik skor atau disebut

juga sebagai skor efisien (efficient score), dan dapat dipasangkan untuk

memberikan vektor statistik skor p x 1, dimana komponen ke-j adalah

Page 42: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

27

,ߚ/(ߚ)ܮ untuk j = 1, 2,..., p. Vektor ini dinotasikan sebagai u(β).

Misalkan I(β) adalah matriks berukuran p x p pada turunan kedua dari log

L(β), dimana unsur-unsur ke-(j, k) dari matriks tersebut adalah:−ܧ൜డమ(ఉ)

డఉೕడఉೖൠ

, untuk j = 1, 2, ..., p dan k = 1, 2, ..., p. Matriks I(β) ini kadang-kadang disebut

juga sebagai matriks Informasi.

Perhatikan u(β), yaitu vektor skor statistik yang dievaluasi pada

penaksir kemungkinan maksimum β, β. Dengan menggunakan deret Taylor,

dimana harga β* diperkirakan akan mendekati β, akan diperoleh:

(ߚ)ݑ��������������������������� ≈ (∗ߚ)ݑ + −ߚ)(∗ߚ)ܫ (∗ߚ … (3.1)

Penaksir kemungkinan maksimum bagi β akan memenuhi persamaan berikut:

(ߚ)ܮ

ߚቤఉ

= 0 … (3.2)

untuk j = 1, 2, ..., p, sehingga u(β) = 0. Dari Pers (3.1) dapat diketahui bahwa:

ߚ ≈ ∗ߚ + (∗ߚ)ݑ(∗ߚ)ଵܫ . Penentuan β yang dicapai melalui proses iterasi

ditentukan oleh:

(௧ାଵ)ߚ���������������������������� = (௧)ߚ + ൯(௧)ߚ൫ݑ൯(௧)ߚଵ൫ܫ … (3.3)

Proses iterasi selesai jika selisih antar iterasi sudah ‘sangat kecil’. Agresti (1990)

menyebutkan salah satu kriteria kekonvergenan (௧)ߚ ke β, yaitu:

ቚߚ(௧ାଵ)

− ≥መቚߚ ቚߚ(௧)− መቚߚ

, untuk setiap j, c > 0 ...(3.4)

Page 43: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

28

Untuk lebih mudah dapat dilihat pada Gambar 3.1 dibawah ini.

Evaluasi apakah หߠ(௧ାଵ) − >(௧)หߠ

Dimana c=0.0001

(௧ାଵ)ߠ = (௧)ߠ + −ܧ൭

2൫ߤ ൯ߢ,

ߠ൱൩

−1

ቆ൫ߤ ൯ߢ,

ߠቇ

Hitung

Hitung vector skor dan

Matriks informasi

Tentukan nilai awal ߠ

Mulai

TIDAK

Konvergen

en?

YA

Berhenti

Gambar 3.1 Diagram Alir Penskoran Fisher

Page 44: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

29

BAB IV

HASIL DAN PEMBAHASAN

4.1 Pendahuluan

Pada bab ini akan dibahas penerapan model regresi beta untuk menduga

pola kelulusan mahasiswa dalam mengambil sejumlah mata kuliah. Dalam

penelitian ini akan diamati proporsi lulus tidaknya seorang mahasiswa dalam

mengikuti sejumlah mata kuliah. Pengamatan seperti ini perlu dicarikan suatu

metode untuk menganalisis hubungan antara proporsi tingkat kelulusan

mahasiswa dengan sejumlah variabel prediktor yang dianggap mampu

menjelaskan proporsi tingkat kelulusan mahasiswa tersebut. Sehingga dalam

penelitian ini digunakan dua tahapan yaitu yang pertama, data yang diperoleh

akan dianalisis melalui metoda baku, dalam hal ini adalah dengan menggunakan

metoda regresi logistik biasa Pada tahap kedua, baru akan dilakukan analisis

dengan menggunakan metoda atau model regresi beta.

Pada masing-masing tahap analisis, sebelumnya kita harus

mendeskripsikan mengenai variabel-variabel yang ada, setelah itu ada dua hal

yang dapat dilakukan sehubungan dengan pemilihan model yang dianggap baik.

Hal-hal yang akan dilakukan itu penaksiran model (termasuk didalamnya

penaksiran parameter di dalam model, serta pengujian keberartian parameter di

dalam model). Metoda penaksiran yang digunakan baik dalam model regresi

logistik maupun dalam model regresi beta adalah dengan menggunakan metoda

kemungkinan maksimum, melalui metoda iterasi seperti metoda Penskoran Fisher.

Page 45: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

30

Pada proses pengujian keberartian parameter yang berada di dalam model

biasanya menyangkut perumusan hipotesis statistik untuk menentukan apakah

variabel-variabel prediktor yang digunakan secara berarti berhubungan dengan

variabel responnya. Perbandingan antara nilai pengamatan dari variabel respon

terhadap nilai taksiran yang diperoleh dari model dengan atau tanpa variabel yang

diamati dan berdasarkan pada fungsi log-likelihood merupakan suatu ukuran

untuk menguji keberatian parameter dalam model. Perbandingan parameter yang

berdasarkan pada dua buah log-likelihood ini disebut juga sebagai uji rasio

likelihood (Hosmer dan Lemeshow, 1989). Sedangkan McCullagh dan Nelder

(1983) menyebut statistik ini sebagai devians, yang menyebar secara chi-kuadrat

dengan derajat bebas (n - p).

Adapun ukuran lain yang digunakan untuk menguji keberartian parameter

ini, yaitu dengan menggunakan uji chi-kuadrat untuk regresi logistik dan

menggunakan uji t yang pada dasarnya menunjukkan seberapa jauh pengaruh

satu variabel bebas secara individual dalam menerangkan variasi variabel respon.

Tujuan dari uji t adalah untuk menguji koefisien regresi secara individual pada

regresi beta. Statistik-statistik tersebut nantinya akan digunakan pada proses

pemilihan variabel yang akan masuk ke dalam model.

4.2 Deskripsi Data

Dalam deskripsi data ini penulis mendeskripsikan variabel - variabel

prediktor yang terdapat pada data proporsi kelulusan banyaknya mata kuliah yang

diambil oleh mahasiswa pada tahun akademik 1997/1998. Untuk lebih singkat

deskripsi data akan di visualisasikan melalui Gambar 4.1:

Page 46: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

31

Gambar 4.1 Diagram Lingkaran Jenis Kelamin

Dari Gambar 4.1 terlihat bahwa perbandingan persentase perempuan dan

laki-laki yang masuk ke IPB pada tahun akademik 1997/1998 relatif seimbang,

yaitu: 54.51% dan 45.49% .

Gambar 4.2 Diagram Lingkaran Cara Lolos Seleksi ke IPB

Dari Gambar 4.2 terlihat di Institut Pertanian Bogor merupakan salah satu

perguruan tinggi negeri di Indonesia yang menyelenggarakan penyaringan

mahasiswanya melalui dua jalur, yaitu jalur Ujian Masuk Perguruan Tinggi

Negeri (UMPTN) dan jalur Penelusuran Minat dan Bakat IPB (PMDK), dimana

hampir 91,47% diantara mahasiswa yang masuk ke IPB adalah yang melalui jalur

UMPTN.

Page 47: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

32

Gambar 4.3 Box Plot Nilai Rata-rata Ijazah

Dari Gambar 4.3 terlihat latar belakang prestasi pendidikan mahasiswa

selama mereka masih duduk di bangku SLTA ditunjukkan oleh nilai rata-rata

ijazah, dimana nilai rata-rata ijazah adalah sebesar 7.45 dengan simpangan baku

sebesar 0.45472, yang mempunyai nilai minimal sebesar 6.00 dan nilai maksimal

sebesar 9.00. Angka-angka tersebut menunjukkan bahwa mahasiswa TPB-IPB

tahun akademik 1997/1998 mempunyai latar belakang prestasi akademik yang

cukup baik.

Gambar 4.4 Box Plot Nilai Ebtanas Murni

Page 48: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

33

Dari Gambar 4.4 terlihat latar belakang prestasi pendidikan mahasiswa

selama mereka masih duduk di bangku SLTA ditunjukkan oleh Nilai Ebtanas

Murni (NEM), dimana Nilai Ebtanas Murni (NEM) adalah sebesar 44.31 dengan

simpangan baku sebesar 6.041, yang mempunyai nilai minimal sebesar 23.93 dan

nilai maksimal sebesar 62.29. Angka-angka tersebut menunjukkan bahwa

mahasiswa TPB-IPB tahun akademik 1997/1998 mempunyai latar belakang

prestasi akademik yang cukup baik.

Gambar 4.5 Diagram Lingkaran Daerah Asal Sekolah

Dari Gambar 4.5 terlihat bahwa sebagian besar mahasiswa IPB pada tahun

akademik 1997/1998 masih didominasi oleh para siswa yang berasal dari daerah

kotamadya dibandingkan dengan kabupaten yaitu sebesar 70.31%, dan 29.69%.

Gambar 4.6 Diagram Lingkaran Status Asal sekolah

Page 49: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

34

Dari Gambar 4.6 perlu diketahui bahwa perbandingan persentase status

sekolah negeri dan swasta yang masuk ke IPB pada tahun akademik 1997/1998

relatif seimbang, yaitu: 49.05% dan 50.95%

4.3 Hasil - hasil Pada Model Regresi Logistik

Berdasarkan uraian singkat tentang data pada Tabel 3.1, data pengamatan

yang akan diteliti yaitu data proporsi kelulusan mahasiswa dalam mengikuti

sejumlah mata kuliah yang diselenggarakan pada tingkat persiapan bersama di

Institut Pertanian Bogor (IPB), dimana semua mata kuliah yang diambil oleh

mahasiswa pada semester satu dan dua. Dalam kasus ini yang dijadikan sebagai

variabel prediktor yaitu JK (X1), jalur (X2), ijazah (X3), NEM (X4), daerah asal

sekolah (X5), dan status sekolah (X6), yang akan dicocokan dalam model regresi

logistik seperti berikut :

logߤ

1 − ߤ൨= ߚ + ଵݔଵߚ + ଶݔଶߚ + ଷݔଷߚ + ସݔସߚ + ହݔହߚ + ݔߚ

dengan melalui dua tahapan yaitu melalui tahapan analisis variabel tunggal

(univariate), kemudian tahapan analisis variabel ganda (multivariate). Satu hal

yang harus diperhatikan pada saat tahapan analisis variabel tunggal dilakukan

adalah tentang variabel yang berskala ordinal, maka variabel itu dapat dimodelkan

sebagai variabel kontinu. Sedangkan untuk variabel kontinu analisis variabel

tunggal yang paling diperlukan adalah mendapatkan penaksir koefisien, standar

error, dan uji rasio likelihood untuk menguji keberartian koefisien.

Page 50: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

35

Tabel 4.1 Model Regresi Logistik Variabel Tunggal

Parameter KoefisienStandard

ErrorUji Chi-Square

P-value

β1 -0.065 0.044 2.180 0.140

β2 -0.046 0.079 0.340 0.559

β3 -0.003 0.059 0.000 0.965

β4 0.092 0.028 11.080 0.001

β5 -0.050 0.052 0.930 0.336

β6 0.081 0.044 3.400 0.065

Log likelihood = -5800.6295

Dari Tabel 4.1 dapat dilihat bahwa variabel-variabel yang dapat dilihat

bahwa variabel-variabel yang dapat dianalisis selanjutnya dengan taraf

signifikansi 30% (Hosmer dan Lemeshow, 1989), yaitu ada tiga variabel

diantaranya jenis kelamin (X1), nilai ebtanas murni (X4), dan status sekolah (X6).

Sedangkan untuk variabel-variabel cara lolos seleksi ke IPB (X2), nilai rata-rata

ijazah (X3), dan daerah asal sekolah (X5) merupakan variabel-variabel yang tidak

nyata bagi model taksiran karena menghasilkan p-value yang cukup besar. Oleh

karena itu, variabel-variabel tersebut tidak diikutsertakan lagi dalam analisis

berikutnya. Perlu diketahui bahwa konstanta tidak ditampilkan ke dalam tabel.

Setelah analisis variabel tunggal dilakukan, maka langkah selanjutnya adalah

memilih variabel untuk keperluan analisis variabel ganda.

Mengikuti penaksiran model variabel ganda ini, untuk kepentingan dari

masing-masing variabel yang dilibatkan ke dalam model, maka harus diuji

terlebih dahulu. Langkah ini termasuk didalamnya adalah penentuan statistik uji

chi-kuadrat untuk masing-masing variabel, serta perbandingan koefisien taksiran

dengan koefisien-koefisien dari model tunggal yang berisi variabel tersebut saja.

Variabel - variabel yang memberikan kontribusi terhadap model berdasarkan

kriteria ini dapat dihapus dan selanjutnya menaksir model yang baru. Model yang

Page 51: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

36

baru kemudian akan dibandingkan dengan model sebelumnya melalui uji rasio

likelihood. Selain itu koefisien taksiran juga akan dibandingkan untuk variabel -

variabel lainnya terhadap model lengkap.

Tabel 4.2 Penaksir Koefisien, Standar Error, dan Statistik Chi-kuadratBerdasarkan Hasil Pada Tabel 4.1

Variabel KoefisienStandarError

Uji Chi-Kuadrat

P-value

β0 -0,363 0,157 4,340 0,037

β1 -0,061 0,044 1,900 0,168

β4 0,087 0,024 12,840 0,000

β6 0,078 0,044 3,150 0,076

log likelihood (λ(β))=-5805.9900

Berdasarkan hasil yang didapat dalam Tabel 4.2 dengan nilai taraf

signifikansi 10% dapat dilihat bahwa variabel X4 dan X6 mempunyai p-value <

0.10, sedangkan variabel X1 (JK) p-value > 0.10, didapat pula nilai

(ߚ)ߣ = (ߚ,ସߚ,ଵߚ,ߚ)ߣ = −5805.9900 dalam model. Untuk selanjutnya

variabel X1 tidak dilibatkan lagi pada model berikutnya. Dengan mengabaikan

variabel X1 dibuat model baru yang disajikan pada Tabel 4.3 berikut

Tabel 4.3 Penaksir Koefisien, Standar Error, dan Statistik Chi-kuadratBerdasarkan Hasil Pada Tabel 4.2

Variabel Koefisien StandarError

Uji Chi-Kuadrat

P-value

β0 -0,3510 0,1557 5,0800 0,0242

β4 0,0869 0,0244 12,7400 0,0004

β6 0,0757 0,0439 2,9800 0,0845

log likelihood (λ(β)) = -5807.1176

Dari tabel tersebut dapat dilihat bahwa penaksir koefisien dan standar error

memberikan nilai-nilai yang tidak jauh berbeda dengan nilai yang diperoleh pada

model sebelumnya, seperti pada nilai (ߚ)ߣ = (ߚ,ସߚ,ߚ)ߣ = −5807.1176 . Hal

ini menunjukkan bahwa variabel jenis kelamin (X1) tidak memberikan pengaruh

Page 52: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

37

yang berarti terhadap model. Pernyatan ini didukung oleh nilai chi-kuadrat untuk

kedua model itu memberikan hasil yang tidak jauh berbeda.

Lebih jauh lagi, untuk melihat bagaimana pengaruh variabel-variabel yang

dianggap tidak nyata terhadap model dilakukan melalui uji rasio likelihood ,(ߚ)ߣ

yang menyatakan perbedaan antara model yang dalam Tabel 4.2 dan Tabel 4.3

(untuk menguji keberartian variabel X1) menghasilkan suatu nilai sebagai berikut:

(ߚ,ସߚ,ߚ|ଵߚ)ߣ = −(ߚ,ସߚ,ߚ)ߣ]2− [(ࢼ)

= −2(−5807.1176+ 5805.9900) = 2.2552

Dengan membandingkan hasil tersebut dengan sebaran (ଵ)ଶ pada taraf

nyata 5% memberikan hasil yang tidak nyata (p-value = 0.1332). Artinya, variabel

X1 tidak cukup berarti untuk menaksir pola kelulusan mahasiswa. Dengan

demikian dapat dikatakan bahwa faktor-faktor yang mempengaruhi pola kelulusan

mahasiswa TPB menurut regresi logistik adalah nilai ebtanas murni (X4) dan

status sekolah (X6).

Berdasarkan hasil pengujian koefisen regresi diatas yang signifikan adalah

nilai rata-rata ijazah dan status sekolah dengan model regresi logistik seperti

berikut :

logߤ

1 − ߤ൨= −0.3510 + ସݔ0.0869 + ݔ0.0757

4.4 Hasil - hasil Pada Model Regresi Beta

Langkah-langkah yang akan ditempuh pada pembentukan model dalam

model regresi beta hampir sama dengan langkah-langkah yang ada dalam

pemodelan regresi logistik, begitu juga pada model regresinya seperti berikut :

logߤ

1 − ߤ൨= ߚ + ଵݔଵߚ + ଶݔଶߚ + ଷݔଷߚ + ସݔସߚ + ହݔହߚ + ݔߚ

Page 53: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

38

tetapi dimana model ini diasumsikan bahwa varians dari variabel respons adalah

konstan, sehingga mempunyai parameter dispersi yang dimodelkan dalam bentuk

=ߢ� exp(−ࢠ) .

Proses pembentukan model dimulai dengan analisis variabel tunggal, yang

dilanjutkan dengan analisis variabel ganda. Demikian juga halnya dengan kriteria

pemilihan variabel ke dalam model yang digunakan adalah log likelihood, akan

tetapi disini menggunakan uji t.

Tabel 4.4 Model Regresi Beta Variabel Tunggal

Parameter KoefisienStandard

ErrorStatistik

Uji tP-value

β1 -0.084 0.042 -1.990 0.047

β2 -0.049 0.075 -0.650 0.513

β3 0.012 0.057 0.210 0.831

β4 0.089 0.026 3.370 0.001

β5 -0.061 0.050 -1.220 0.224

β6 0.048 0.042 1.140 0.253

Δ -1.070 0.026 -40.600 <.0001

Log likelihood = -291.2

Dari Tabel 4.4 dapat dilihat bahwa variabel - variabel yang dapat dianalisis

selanjutnya dengan taraf signifikansi 30% (Hosmer dan Lemeshow, 1989) yaitu

ada empat variabel jenis kelamin (X1), nilai ebtanas murni (X4), daerah asal

sekolah (X5), status sekolah (X6). Sedangkan untuk variabel - variabel cara lolos

seleksi ke IPB (X2), nilai rata-rata ijazah (X3) merupakan variabel-variabel yang

tidak nyata bagi model taksiran karena menghasilkan p-value yang cukup besar.

Oleh karena itu, variabel-variabel tersebut tidak diikutsertakan lagi dalam analisis

berikutnya. Perlu diketahui bahwa konstanta tidak ditampilkan ke dalam tabel.

Setelah analisis variabel tunggal dilakukan, maka langkah selanjutnya adalah

Page 54: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

39

memilih variabel untuk keperluan analisis variabel ganda, dimana hasilnya dapat

dilihat pada Tabel 4.5.

Tabel 4.5 Penaksir Koefisien, Standar Error, dan Statistik Uji tBerdasarkan Hasil Pada Tabel 4.4

Variabel KoefisienStandarError

StatistikUji-t P-value

β0 -0,2573 0,1503 -1,71 0,0871

β1 -0,08248 0,04222 -1,95 0,0509

β4 0,09061 0,02349 3,86 0,0001

β5 -0,05766 0,04648 -1,24 0,2148

β6 0,04822 0,04211 1,15 0,2523

Δ -1,0698 0,02635 -40,59 <.0001

log-likelihood (λ(β'))= -290.7

Pada Tabel 4.5 dapat dilihat bahwa menurut model beta variabel-variabel

yang dianggap nyata dalam menduga pola kelulusan mahasiswa dengan taraf

signifikansi 10% hanya ada dua variabel, yaitu: jenis kelamin (X1), dan nilai

ebtanas murni (X4), dan mempunyai nilai (′ߚ)ߣ = =൯ߚ,ହߚ,ସߚ,ଵߚ,ߚ൫ߣ −290.7.

Tabel 4.6 Penaksir Koefisien, Standar Error, dan Statistik Uji tBerdasarkan Hasil Pada Tabel 4.5

Variabel KoefisienStandarError

StatistikUji-t

P-value

β0 -0,2583 0,1493 -1,73 0,0837

β1 -0,0778 0,0421 -1,85 0,0650

β4 0,0879 0,0233 3,78 0,0002

Δ -1,0685 0,0264 -40,55 <.0001

log-likelihood (λ(β'))= -288.0

Dari hasil Tabel 4.6 dapat dilihat bahwa penaksir koefisien dan standar

error memberikan nilai – nilai yang tidak jauh berbeda dengan nilai yang

diperoleh pada model sebelumnya, seperti pada nilai

(′ߚ)ߣ = =ସ൯ߚ,ଵߚ,ߚ൫ߣ −288.0.

Page 55: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

40

Hal ini menunjukkan bahwa variabel-variabel daerah asal sekolah (X5) dan

status sekolah (X6) tidak memberikan pengaruh yang berarti terhadap model.

Pernyatan ini didukung oleh nilai devians untuk kedua model itu memberikan

hasil yang tidak jauh berbeda.

Lebih jauh lagi, untuk melihat bagaimana pengaruh variabel-variabel yang

dianggap tidak nyata terhadap model dilakukan melalui uji rasio likelihood ,(ߚ)ߣ

yang menyatakan perbedaan antara model yang dalam Tabel 4.5 dan Tabel 4.6

(untuk menguji keberartian variabel X5 dan X6) menghasilkan suatu nilai sebagai

berikut:

(ସߚ,ଵߚ,ߚ|ߚ,ହߚ)ߣ = (ସߚ,ଵߚ,ߚ)ߣ]2− − [(′ࢼ)

= −2(288 − 290.7) = −5.4

Dengan membandingkan hasil tersebut dengan sebaran (ଶ)ଶ pada taraf

nyata 5% memberikan hasil yang nyata (p-value = 0.06720). Artinya, variabel X5

dan X6 tidak cukup berarti untuk menaksir pola kelulusan mahasiswa, sehingga

dapat dikatakan bahwa faktor-faktor yang mempengaruhi pola kelulusan

mahasiswa TPB menurut regresi beta adalah jenis kelmin (X1) dan nilai ebtanas

murni (X4).

4.5 Pembahasan Hasil – hasil dari Kedua Model Regresi

Dari hasil model regresi logistik dan regresi beta dapat disimpulkan bahwa

variabel-variabel yang dianggap berarti dalam kedua model tersebut berbeda dan

perbedaannya terlihat pula pada nilai-nilai yang dihasilkan untuk penaksir

koefisien, standar error, dan log-likelihood. Nilai yang cukup nyata yang

menunjukkan perbedaan diantara kedua model ini ditunjukkan pada nilai log-

likelihoodnya, dimana nilai log-likelihood untuk model beta berada disekitar nilai

Page 56: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

41

-291.2 sedangkan untuk model regresi logistik berada di sekitar nilai -5800.6295.

Perbedaan nilai log-likelihood ini menunjukkan bahwa model regresi beta

merupakan model yang lebih baik dibandingkan dengan model regresi logistik,

karena mempunyai nilai log-likelihood yang besar, dimana nilai log-likelihood

besar merupakan nilai log-likelihood yang paling maksimum.

Hasil dari pemodelan regresi beta ini dapat dituliskan sebagai berikut :

logߤ

1 − ߤ൨= −0.2867 − −ଵݔ0.0841 ଶݔ0.0493 + ଷݔ0.0121

ସݔ0.0887+ − ହݔ0.0609 + ݔ0.0483

Nilai taksiran untuk parameter dispersinya adalah :

=Ƹߢ 1−)ݔ × −1.0700) = 2.92

Hasil yang ditunjukan dari model regresi beta dengan taraf signifikan

(α=10%) bahwa variabel cara lolos seleksi (X2), nilai rata-rata ijazah (X3), daerah

asal sekolah (X5), dan status sekolah (X6) merupakan variabel yang secara statistik

tidak berpengaruh pada proporsi kelulusan banyak mata kuliah yang diambil oleh

mahasiswa, sedangkan jenis kelamin (X1) dan nilai ebtanas murni (X4) merupakan

variabel yang secara statistik berpengaruh pada proporsi kelulusan banyak mata

kuliah yang diambil oleh mahasiswa.

Dari hasil diatas penulis membuat pemodelan ulang dari regresi beta yang

hanya melibatkan variabel-variabel yang signifikan saja, dan mengabaikan

variabel-variabel yang tidak signifikan. Sehingga model akhir dari regresi beta

berdasarkan variabel yang signifikan pada taraf signifikansi (α=10%) dapat ditulis

sebagai berikut :

logߤ

1 − ߤ൨= −0.2583 − ଵݔ0.0778 + ସݔ0.0879

Page 57: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

42

Sedangkan nilai taksiran untuk parameter dispersinya menjadi :

=Ƹߢ 1−)ݔ × −1.0685) = 2.911

Jadi nilai koefisien 1ࢼ (koefisien regresi beta untuk variabel JK) dan

4ࢼ (koefisien regresi beta untuk variabel NEM) yaitu ଵࢼ = −0.0778 dan

ସࢼ = 0.0879. Dengan mengambil nilai exp(1ࢼ) = 0.93 untuk perempuan dan

exp(ࢼସ) = 1.1, maka model regresi beta ini dapat diinterpretasikan bahwa bagi

mahasiswa perempuan yang mempunyai nilai ebtanas murni (NEM) lebih tinggi,

maka kesempatan mahasiswa tersebut untuk lulus dalam banyak mata kuliah yang

diambil adalah 1.1 kali lipat lebih besar dibandingkan dengan mahasiswa

perempuan yang nilai ebtanas murni (NEM) lebih rendah.

Untuk melihat pengaruh jenis kelamin mana yang mempunyai pengaruh

besar terhadap lulusnya dalam banyak mata kuliah yang diambil oleh mahasiswa

tersebut, dapat dinterpretasikan sebagai berikut :

Rata-rata untuk jenis kelamin perempuan dengan NEM yang ditentukan sebesar

6.33 yaitu:

=exp ൫−0.2583 − 0.0778(0) + 0.0879(6.33)൯

1 + exp ൫−0.2583 − 0.0778(0) + 0.0879(6.33)൯= 0.5739

Rata-rata untuk jenis kelamin laki-laki dengan NEM yang ditentukan sebesar 6.33

yaitu

=exp൫−0.2583 − 0.0778(1) + 0.0879(6.33)൯

1 + exp൫−0.2583 − 0.0778(1) + 0.0879(6.33)൯= 0.5547

Maka dapat disimpulkan bahwa rata-rata mahasiswa perempuan yang lulus

dalam banyak mata kuliah yang diambil relatif sama dengan mahasiswa laki-laki

Dimana nilai rata-rata untuk mahasiswa perempuan adalah 0.5739 dan mahasiswa

laki-laki 0.5547.

Page 58: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

43

BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Secara umum dalam penelitian ini telah ditunjukan mengenai hubungan

fungsional antara variabel bebas dan variabel tak bebas dimana variabel tak bebas

disini berbentuk proporsi, yang pada umumnya dimodelkan dengan model regresi

logistik, karena variabel tak bebas tersebut mengikuti distribusi beta maka dapat

pula dimodelkan dengan model regresi beta. Dimana hubungan fungsional dari

masing-masing model regresi dapat dimodelkan dengan enam variabel bebas yaitu

variabel jenis kelamin (JK), cara seleksi masuk IPB (jalur), nilai rata-rata ijazah

(ijazah), nilai ebtanas murni (NEM), asal sekolah, dan status sekolah seperti

berikut:

Hubungan fungsional dari variabel tak bebas berbentuk proporsi dengan variabel

bebas yang dimodelkan melalui regresi logistik ialah

logߤ

1 − ߤ൨= −0.2592 − −(ܭܬ)0.0652 0.0461( (ݎݑ + ݖ)0.0026 ℎ)

ܯܧ)0.0920+ ) − ݏ)0.0504 ݏ� ℎ) + ݐݏ)0.0813 ݏ�ݏݑݐ ℎ)

dan hubungan fungsional dari variabel tak bebas berbentuk proporsi dengan

variabel bebas yang dimodelkan melalui regresi beta ialah

logߤ

1 − ߤ൨= −0.2867 − −(ܭܬ)0.0841 0.0493( (ݎݑ + ݖ)0.0121 ℎ)

ܯܧ)0.0887+ ) − ݏ)0.0609 ݏ� ℎ) + ݐݏ)0.0483 ݏ�ݏݑݐ ℎ)

Secara khusus dalam penelitian ini telah ditunjukkan kegunaan dari model

regresi beta untuk menaksir perilaku kelulusan mahasiswa dalam mengikuti

Page 59: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

44

program Tingkat Persiapan Bersama di Institut Pertanian Bogor, dan dalam

penelitian ini telah ditunjukkan perbedaan mengenai kesesuaian taksiran dari

model regresi beta dengan apa yang diperoleh dalam model regresi logistik.

Berdasarkan hasil dari pemodelan tersebut pada pola kelulusan mahasiswa

dalam mengikuti Tingkat Persiapan Bersama di Institut Pertanian Bogor yang

dipengaruhi oleh jenis kelamin (JK), cara seleksi masuk IPB (jalur), nilai rata-rata

ijazah (ijazah), nilai ebtanas murni (NEM), asal sekolah, dan status sekolah dapat

disimpulkan bahwa :

Untuk model regresi logistik dengan berbagai alat statistik yang digunakan

dalam penaksiran parameter yang mengidentifikasi variabel tersebut

signifikan atau tidak signifikan dalam model dimana variabel yang

signifikan yaitu variabel nilai ebtanas murni (NEM) dan status sekolah,

sedangkan variabel yang tidak signifikan yaitu variabel jenis kelamin (JK),

cara lolos masuk IPB (Jalur), nilai rata-rata ijazah (Ijazah), dan asal

sekolah.

Untuk model regresi beta dengan berbagai alat statistik yang digunakan

dalam penaksiran parameter yang mengidentifikasi variabel tersebut

signifikan atau tidak signifikan dalam model dimana variabel yang

signifikan yaitu varibel jenis kelamin (JK) dan nilai ebtanas murni (NEM),

sedangkan variabel yang tidak signifikan yaitu variabel cara lolos masuk

IPB (Jalur), nilai rata-rata ijazah (Ijazah), asal sekolah, dan status sekolah.

Dari masing-masing model bila dilihat dari hasil ukuran statistikanya

maka model regresi beta yang terbaik karena memberikan nilai penaksir

Page 60: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

45

yang sangat maksimum dan mampu memetakan data proporsi pada selang

terbuka (0, 1).

Dengan demikian, penggunaan model regresi logistik menjadi tidak tepat

untuk menaksir pola kelulusan mahasiswa dalam mengikuti program Tingkat

Persiapan Bersama di Institut Pertanian Bogor. Dalam hal ini, model regresi beta

dapat memberikan hasil yang relatif lebih baik dalam menaksir pola kelulusan

mahasiswa dalam mengikuti program Tingkat Persiapan Bersama di Institut

Pertanian Bogor.

Jadi, model regresi beta merupakan suatu alat yang tepat dalam menangani

masalah penaksiran yang terdapat pada data proporsi. Penaksiran parameter

beserta uji-uji keberartiannya dapat dihubungkan atau diinterpretasikan

sebagaimana dalam model regresi logistik.

5.2 Saran-saran

Dalam penelitian ini model regresi beta merupakan pemodelan alternatif

untuk memodelkan data dengan variabel respon yang berbentuk proporsi. Model

regresi beta disini merupakan model yang sangat mendasar artinya model ini

masih mengasumsikan bahwa varians dari variabel prediktornya adalah konstan,

dengan kata lain tidak ada heteroskedatisitas dalam data. Maka masih terbuka

untuk melakukan penelitian bagaimana mengenai masalah heteroskedatisitas ke

dalam model.

Page 61: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

46

DAFTAR PUSTAKA

Baker, R.J., and J.A. Nelder (1978). Generalized Linear Interactive Modeling

(GLIM). Release 3. Oxford: Numerical Algorithhms Group.

Ferrari, S. L. P. and Cribari-Neto, F. (2004). “Beta Regression for Modeling

Rates and Proportions”,Journal of Applied Statistics. Volume 10 Page

15-16.

Hajarisman, N (1998). Kajian Perbandingan Model Regresi Beta-Binomial

dengan Model regresi Logistik dan Penerapannya untuk Menduga Pola

Kelulusan Mahasiswa IPB- TPB tahun 1997/1998. Tesis tidak untuk

dipublikasikan. Bogor. Program Pasca Sarjana

Hajarisman, N (2010). Analisis Data Kategorik. Bandung. Pustaka Ceria. Hal

60-65

Hajarisman, N (2010). “Pengantar ke Analisis Regresi Lanjut”.Catatan Buku

Bab 1.Hal 2-9

Hajarisman, N (2011). ”Penaksiran Parameter Model Regresi Beta untuk

Memodelkan Data Proporsi”. Jurnal Media Statistika. Volume 11 hal 1-

6.

Herrhyanto, N dan Gantini, T. (2009) Pengantar Statistika Matematis,

Bandung. CV. YRAMA WIDYA. Hal 347.

Hosmer, D.W. and Lemeshow, S., 1989. Applied Logistic Regression. John

Wiley and Sons, Inc. USA.

McCullagh, P., and J.A. Nedler (1983). Generalized Linear Models.2nd Ed.

New York : Chapman and Hall.

McCullagh, P., and J.A. Nedler (1989). Generalized Linear Models.2nd Ed.

London : Chapman and Hall.

Smithson M, and Verkuilen J. (2005). Fuzzy set inclusion:Linking fuzzy set

meth-ods with mainstream techniques. Sociologi Methods and Research.

Volume 33, 431-461

Smithson M, and Verkuilen J. (2006). “A better lemon squeezer? Maximum-

likelihood regression with beta-distributed dependent variables”,

Psychological Methods. Volume 11 Page 57-60.

Page 62: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

LAMPIRAN

Page 63: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

47

LAMPIRAN 1

Notasi-notasi yang ada di Regresi Beta

a = parameter lokasi untuk distribusi beta original

b = parameter presisi untuk distribusi beta original

g (µi) = fungsi hubung logit untuk µi

h (κi) = fungsi hubung log untuk κi

x = matrik kovariat untuk β

y = variabel acak berdistribusi beta

z = matrik kovariat untuk δ

β = koefisien regresi untuk µ dan x

δ = koefisien regresi untuk κ dan z

µ = parameter lokasi setelah direparameterisasi

κ = parameter disperse setelah direparameterisasi

η = fungsi hubung

ψ = fungsi digama

ψ` = fungsi tri gama

Page 64: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

48

LAMPIRAN 2

DATA PROPORSI POLA KELULUSAN MAHASISWA DALAMMENGIKUTI MATA KULIAH DI TPB IPB

NO ID X1 X2 X3 X4 X5 X6 r N

1 A00497001 0 1 7.30 43.75 1 0 14.5 15

2 A00497002 0 1 8.50 50.86 1 0 14.5 15

3 A00497003 0 1 8.70 54.89 1 0 14.5 15

4 A00497004 1 1 8.20 51.81 1 0 14.5 15

5 A00497005 0 1 7.31 41.13 1 1 14.5 15

6 A00497006 0 0 8.00 52.04 1 0 14.5 15

7 A00497007 0 1 7.60 41.78 1 0 14.5 15

8 A00497008 0 1 7.50 48.38 1 0 14.5 15

9 A00497009 0 1 7.70 55.81 1 0 14.5 15

10 A00497010 0 1 7.60 46.82 1 0 14.5 15

11 A00497011 0 1 7.80 50.50 1 1 14.5 15

12 A00497012 0 1 7.30 41.85 1 0 14.5 15

13 A00497014 0 1 7.60 47.51 1 0 14.5 15

14 A00497015 0 0 7.30 39.33 1 1 14.5 15

15 A00497016 0 1 7.70 52.57 1 0 14.5 15

16 A00497017 0 1 7.30 38.98 1 1 14.5 15.....

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

2207 G07497026 1 1 7.10 51.44 1 1 3 15

2208 G07497027 0 1 6.70 45.71 1 0 10 15

2209 G07497028 1 1 7.40 40.92 1 1 3 15

2210 G07497029 1 1 6.70 34.68 1 1 1 15

2211 G07497030 1 1 7.60 40.10 1 1 7 15

2212 G07497031 1 1 7.90 46.70 0 0 6 15

2213 G07497032 1 1 6.70 40.64 0 0 4 15

2214 G07497033 1 1 6.40 41.60 0 0 8 15

2215 G07497034 1 1 7.18 41.39 0 1 1 15

2216 G07497035 1 1 7.30 52.18 0 0 10 15

Page 65: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

49

LAMPIRAN 3

Hasil Output Model Regresi Beta dari SAS

(THE NLMIXED)

Specifications

Data Set WORK.IPB

Dependent Variable p

Distribution for Dependent Variable General

Optimization Technique Dual Quasi-Newton

Integration Method None

Dimensions

Observations Used 2216

Observations Not Used 0

Total Observations 2216

Parameters 8

Parameters

b0 b1 b2 b3 b4 b5 b6 kappa NegLogLike

1 1 1 1 1 1 1 1 37212.476

Iteration History

Iter Calls NegLogLike Diff MaxGrad Slope

1 4 7088.79073 30123.69 15560.14 -4847890

2 6 4424.38113 2664.41 16468.68 -41130.7

3 7 517.977269 3906.404 3940.241 -51146.6

Page 66: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

50

Iteration History

Iter Calls NegLogLike Diff MaxGrad Slope

4 9 147.805578 370.1717 5526.205 -2166.44

5 11 -22.614523 170.4201 1125.398 -927.912

6 13 -68.314969 45.70045 389.0067 -276.173

7 14 -129.01466 60.69969 223.1221 -164.45

8 16 -138.93288 9.918222 36.66598 -40.0469

9 18 -142.23893 3.306051 108.3201 -17.5936

10 20 -142.5258 0.286867 11.96877 -1.05742

11 22 -143.18786 0.662064 208.7328 -1.74938

12 24 -144.91196 1.724098 126.8056 -1.18923

13 26 -145.55272 0.640759 48.13625 -1.12573

14 28 -145.57986 0.027142 15.11033 -0.07003

15 30 -145.58173 0.001873 0.951875 -0.00402

16 32 -145.58176 0.000027 0.031386 -0.00006

17 34 -145.58176 6.061E-7 0.010463 -1.24E-6

NOTE: GCONV convergence criterion satisfied.

Fit Statistics

-2 Log Likelihood -291.2

AIC (smaller is better) -275.2

AICC (smaller is better) -275.1

BIC (smaller is better) -229.5

Page 67: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

51

Parameter Estimates

Parameter Estimate StandardError

DF tValue

Pr > |t| Alpa Lower Upper Gradien

b0 -0.2867 0.3678 2216 -0.78 0.4357 0.05 -1.0080 0.4346 0.001392

b1 -0.08414 0.04231 2216 -1.99 0.0469 0.05 -0.1671 -0.0011

7

0.000646

b2 -0.04928 0.07537 2216 -0.65 0.5133 0.05 -0.1971 0.09852

0.001436

b3 0.01207 0.05655 2216 0.21 0.8310 0.05 -0.0988

3

0.1230 0.010463

b4 0.08864 0.02634 2216 3.37 0.0008 0.05 0.03699

0.1403 0.00733

b5 -0.06094 0.05012 2216 -1.22 0.2241 0.05 -0.1592 0.03734

0.001211

b6 0.04830 0.04219 2216 1.14 0.2525 0.05 -0.0344

5

0.1310 0.000509

Kappa -1.0700 0.02635 2216 -40.60 <.0001 0.05 -1.1217 -1.0183

0.000471

Page 68: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

52

LAMPIRAN 4

Hasil Output Model Regresi Logistik dari SAS

(The GENMOD)

Model Information

Data Set WORK.IPB

Distribution Binomial

Link Function Logit

Response Variable (Events) y

Response Variable (Trials) n

Number of Observations Read 2216

Number of Observations Used 2216

Number of Events 18575.5

Number of Trials 33240

Criteria For Assessing Goodness Of Fit

Criterion DF Value Value/DF

Deviance 2209 9739.4187 4.4090

Scaled Deviance 2209 2481.0308 1.1231

Pearson Chi-Square 2209 8671.5471 3.9256

Scaled Pearson X2 2209 2209.0000 1.0000

Log Likelihood -5800.6295

Algorithm converged.

Page 69: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

53

Analysis Of Parameter Estimates

Parameter DF Estimate StandardError

Likelihood Ratio95%

Confidence Limits

Chi-Square

Pr > ChiSq

Intercept 1 -0.2592 0.3838 -1.0117 0.4930 0.46 0.4995

x1 1 -0.0652 0.0442 -0.1518 0.0214 2.18 0.1402

x2 1 -0.0461 0.0789 -0.2012 0.1081 0.34 0.5587

x3 1 -0.0026 0.0591 -0.1184 0.1133 0.00 0.9649

Nem 1 0.0920 0.0276 0.0379 0.1462 11.08 0.0009

x5 1 -0.0504 0.0524 -0.1532 0.0522 0.93 0.3358

x6 1 0.0813 0.0441 -0.0051 0.1677 3.40 0.0652

Scale 0 1.9813 0.0000 1.9813 1.9813

Note: The scale parameter was estimated by the square root of Pearson's Chi-Square/DOF.

Page 70: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

DAFTAR RIWAYAT HIDUP

Nama : Beta Putri Wijaya

Tempat/Tanggal Lahir : Bandung / 20 November 1990

NPM : 10060108003

Jenis Kelamin : Perempuan

Agama : Islam

Anak ke : 2 dari 2 bersaudara

Nama Bapak : Dadan Dustriyanda

Pekerjaan : BUMN

Nama Ibu : Lilis Warlina

Pekerjaan : Ibu Rumah Tangga

Alamat : Jl. Sukarasa No 80/143E Rt 04 Rw 09 Cicadas

Bandung.

Telp : (022) 72728501

Pendidikan Formal yang Pernah Ditempuh

1. SD Negeri Panyileukan 03 Bandung, lulus tahun 2002.

2. SMP Negeri 4 Bandung, lulus tahun 2005.

3. SMA Kartika Siliwangi 1 Bandung, lulus tahun 2008.

4. Universitas Islam Bandung di Program Studi Statistika, lulus tahun 2012.

Page 71: Cover12 pernyataan pengesahan abstrak - …elibrary.unisba.ac.id/files2/Skr.12.61.08003.pdf · Selamat membaca !!! ... (GLM) dimana variabel respons megikuti distribusi beta ... Hasil

Pengalaman Organisasi :

1. Ketua Bidang Keilmuan Organisasi Himpunan Mahasiswa Statistika

(HIMASTA) Universitas Islam Bandung Periode 2010-2011.

2. Panitia Musyawarah Kerja Nasional Ikatan Himpunan Mahasiswa Statistika

Indonesia (IHMSI) Tahun 2010.

3. Sekretaris Bidang Keilmuan Organisasi Himpunan Mahasiswa Statistika

(HIMASTA) Universitas Islam Bandung Periode 2009-2010.

4. Panitia Musyawarah Kerja Wilayah II Ikatan Himpunan Mahasiswa Statistika

Indonesia (IHMSI) Tahun 2009.

Pengalaman Kerja :

1. Kuliah Praktek di PLN, Bagian Niaga.

2. Asisten Dosen di Laboratorium Statistika UNISBA Periode 2011-2012.