APLIKASI COX PROPORTIONAL HAZARD...
Transcript of APLIKASI COX PROPORTIONAL HAZARD...
APLIKASI COX PROPORTIONAL HAZARD MODEL
DI ASURANSI JIWA
(Studi Kasus pada AJB Bumiputera)
AFIEF ARYADHANI
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI
SYARIF HIDAYATULLAH
JAKARTA
2011 M/1432 H
i
APLIKASI COX PROPORTIONAL HAZARD MODEL
DI ASURANSI JIWA
(Studi Kasus pada AJB Bumiputera)
Skripsi
Sebagai Salah Satu Syarat Untuk Memperoleh
Gelar Sarjana Sains
Fakultas Sains dan Teknologi
Universitas Islam Negeri Syarif Hidayatullah Jakarta
Oleh:
Afief Aryadhani
107094000260
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI
SYARIF HIDAYATULLAH
JAKARTA
2011 M/1432 H
ii
LEMBAR PENGESAHAN
Skripsi berjudul “Aplikasi Cox Proportional Hazard Model di Asuransi Jiwa” yang
ditulis oleh Afief Aryadhani, NIM 107094000260 telah diuji dan dinyatakan lulus
dalam Sidang Munaqosyah Fakultas Sains dan Teknologi Universitas Islam Negeri
Syarif Hidayatullah Jakarta pada tanggal 7 Juni 2011, skripsi ini telah diterima
sebagai salah satu syarat untuk memperoleh gelar sarjana strata satu (S1) Program
Studi Matematika.
Menyetujui,
Penguji 1 Penguji 2
Taufik Edy Sutanto, M.Sc.Tech Yanne Irene, M.Si
NIP. 19790530 200604 1 002 NIP. 19741231 200501 2 018
Pembimbing 1 Pembimbing 2
Hermawan Setiawan, M.TI Suma’inna, M.Si
NIP. 19740623 199312 2 001 NIP. 150408699
Mengetahui,
Dekan Fakultas Sains dan Teknologi Ketua Prodi Matematika
Dr. Syopiansyah Jaya Putra, M.Sis Yanne Irene, M.Si
NIP. 19680117 200112 1 001 NIP. 19741231 200501 2 018
iii
PERNYATAAN
DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-BENAR
HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI
SKRIPSI PADA PERGURUAN TINGGI ATAU LEMBAGA MANAPUN.
Jakarta, Juni 2011
Afief Aryadhani
107094000260
iv
PERSEMBAHAN
Sebuah persembahan satu langkah menuju kesuksesan teruntuk
kedua orang tuaku tercinta yang telah bekerja keras, memberikan semangat dan dukungan, serta
doa agar anak-anaknya mencapai kesuksesan.
MOTO
Setiap individu mempunyai lama waktu yang sama dalam seharinya
Sama-sama mempunyai kedua orang tua dengan kasih sayangnya
Menuntut ilmu dengan karakteristik yang sama di dalamnya
Sekolah dengan fasilitas yang sama,
Guru/Dosen dengan tujuan yang sama, serta
Buku yang digunakan pun sama
Tentunya hasil yang didapat toh harus sama
Namun …
Terdapat perbedaan hasil yang didapatkannya dengan segudang persamaan
Untuk itu jadikanlah semua itu motivasi
Karena jika individu lain bisa
Maka kita pun sebagai individu akan bisa meraih hasil yang sama
v
ABSTRAK
Asuransi merupakan suatu istilah untuk pengalihan resiko. Fungsi utama
asuransi adalah sebagai pengalihan resiko yang diderita tertanggung kepada
penanggungnya. Karena fungsi tersebut, perusahaan asuransi diharuskan untuk
mengetahui faktor-faktor yang mempengaruhinya dan mengetahui probabilitas
dimana pada waktu tertentu tertanggung akan banyak mengajukan klaim asuransi.
Analisis yang tepat untuk permasalahan ini adalah analisis survival dengan
metode Cox Proportional Hazard Model, karena analisis ini berhubungan dengan
keadaan survive seseorang dan waktu sebagai faktor utamanya. Faktor-faktor yang
digunakan dalam Cox Proportional Hazard Model, yaitu Survival Time merupakan
waktu tertanggung dari start point sampai terjadi event atau end point, Status
merupakan keadaan tertanggung apakah tertanggung terjadi event atau sampai end
point tidak terjadi event, Age merupakan umur tertanggung, Sex merupakan jenis
kelamin tertanggung, Smoking merupakan kebiasaan merokok tertanggung, dan
Medical Test merupakan keadaan kesehatan tertanggung.
Cox Proportional Hazard Model pada akhirnya akan memberikan informasi
tentang faktor-faktor yang berpengaruh secara statistika, yaitu variabel Age, Smoking
dan Medical Test. Perbandingan probabilitas survival faktor yang sama antar
karakteristik yang berbeda yang dihasilkan adalah resiko terjadi event tertanggung
dengan usia t+1 adalah 1.168 kali dari tertanggung yang dengan usia t. Resiko terjadi
event tertanggung yang merokok adalah 2.407 kali dari tertanggung yang tidak
merokok. Resiko terjadi event tertanggung dengan hasil medical test standard adalah
0.038 kali dari tertanggung dengan hasil medical test penyakit berat, resiko terjadi
event tertanggung dengan hasil medical test penyakit ringan adalah 0.122 kali dari
tertanggung dengan hasil medical test penyakit berat, dan resiko terjadi event
tertanggung dengan hasil medical test penyakit sedang adalah 0.123 kali dari
tertanggung dengan hasil medical test penyakit berat. Serta informasi tentang waktu-
waktu di mana tertanggung akan banyak mengajukan klaim asuransi adalah pada
waktu 2 6t bulan pertama.
Kata kunci: Asuransi Jiwa, Cox Proportional Hazard Model, Survival Analysis.
vi
ABSTRACT
Insurance is one of term for the transfer of risk. The main function of
insurance is as a transfer of risk from the insured to the insurer. Because that function,
insurance company are required to determine the factors influencing and know the
probability where at a certain time the insured will be many taking insurance claim.
The right analysis for this problem is survival analysis by Cox Proportional
Hazard Model method, because this analysis relates to someone survival situation and
the time as main factor. Another factors are used in the Cox Proportional Hazard
Model, that is Survival time is the time of the insured from start point until an event
occurs or an end point, Status is insured condition whether the insured event occurs
or until end point is not an event occurs, Age is age of the insured, Sex is sex of the
insured, Smoking is smoking habits of the insured, and Medical Test is insured’s
health condition.
Eventually, Cox Proportional Hazard Model will provide information about
the factors that influence the survival time statistically, that is Age, Smoking, and
Medical Test variable. Comparison of survival probabilities between the different
characteristics in the same factors that produced are, the risk of the insured event
occurs by age t+1 is 1.168 times from the insured by age t. The risk of the insured
event occurs by smoking habits is 2.407 times from the insured by not smoking
habits. The risk of the insured event occurs by standard medical test result is 0.038
times from the insured by severe disease medical test result, the risk of the insured
event ocuurs by lightly disease medical test result is 0.122 times from the insured by
severe disease medical test result, and the risk of the insured event occurs by medium
disease medical test result is 0.123 from the insured by severe disease medical test
result. As well as information about the times where the insured will be many taking
insurance claims are filed at the time 2 6t of the first month.
Keywords: Cox Proportional Hazard Model, Life Insurance, Survival Analysis.
vii
KATA PENGANTAR
بسم اهلل الر حمن الر حيم
Seraya memanjatkan puji serta syukur hanya bagi Allah SWT. Tuhan semesta
alam, yang mana dengan nikmat dan karunianya kita semua bisa merasakan nikmat
dan indahnya kehidupan ini. Shalawat serta salam semoga selalu tercurahkan kepada
junjungan kita, yaitu Nabi Muhammad SAW, beserta keluarga, sahabat, serta segenap
pengikutnya sampai akhir zaman. Alhamdulillah hirobbil a’lamin penulis ucapkan
karena berkat rahmat dan karunia-Nya penulis dapat menyelesaikan skripsi ini
sebagai salah satu syarat untuk memperoleh gelar sarjana sains yang berjudul,
“Aplikasi Cox Proportional Hazard Model di Asuransi Jiwa”.
Dengan segala kerendahan hati, penulis menyadari bahwa dalam penulisan
skripsi ini masih terdapat banyak kekurangan, dan penulis mencoba berikhtiar
senantiasa memberikan semaksimal mungkin dengan harapan skripsi ini dapat
memperoleh hasil yang lebih baik.
Dalam kesempatan yang baik ini, perkenankan penulis menghaturkan ucapan
Terima Kasih kepada:
1. Dr.Syopiansyah Jaya Putra, M.Sis. selaku Dekan Fakultas Sains dan Teknologi
Universitas Islam Negeri Syarif Hidayatullah Jakarta.
2. Yanne Irene, M.Si. selaku Ketua Program Studi Matematika Fakultas Sains dan
Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta dan selaku
penguji II.
3. Hermawan Setiawan, M.TI. selaku dosen pembimbing I yang telah menyediakan
waktu dan senantiasa membimbing penulis dengan penuh kesabaran dalam
mengambil tema, dan menjelaskan dasar-dasar teori sampai selesainya skripsi ini.
4. Suma’inna, M.Si. selaku dosen pembimbing II yang telah membimbing dalam
penulisan skripsi ini dan memberikan banyak waktunya dalam menjelaskan
berbagai penurunan rumus.
viii
5. Sarini Abdullah, M.Stat. yang telah memberikan waktu di tengah kesibukannya
untuk membimbing penulis dalam mempelajari dasar teori Survival Analysis.
Mohon maaf jika penulis banyak merepotkan ibu dan semoga ilmu ibu
bermanfaat.
6. Taufik Edy Sutanto, M.Sc.Tech. selaku penguji I.
7. Seluruh staff AJB Bumiputera, khususnya mas Audi dan mas Didik yang telah
membantu penulis dalam memperoleh data.
8. Seluruh dosen dan staff Program Studi Matematika Fakultas Sains dan Teknologi
UIN Syarif Hidayatullah Jakarta, khususnya ka’ Bambang Ruswandi, M.Stat.
yang telah banyak membantu dalam proses penyelesaian skripsi ini.
9. Kedua orang tuaku dan adik-adikku tercinta, yang senantiasa memberikan
bantuan, dukungan dan doanya sehingga terselesaikannya skripsi ini.
10. Gadis ungilku, Anggraini yang telah banyak membantu, memberi dukungan dan
mendoakan penulis. Susah, senang, panas, dan hujan kita lewati bersama agar
terselesaikannya skripsi ini. Je t’aime.
11. Dan Seluruh teman-teman matematika, khsusunya matematika angakatan 2007,
yang telah memberikan dukungan dan menerima saya selama 4 tahun ini sebagai
teman kalian. Sukses semua.
Kritik dan saran konstruktif sangat penulis harapkan berkaitan dengan
penyusunan skripsi ini yang masih jauh dari kesempurnaan. Semoga kita semua
senantiasa diridhoi dan mendapatkan rahmat dan hidayah-Nya serta selalu berada di
jalan yang lurus. Amin.
Jakarta, Juni 2011
Penulis
ix
DAFTAR ISI
HALAMAN JUDUL ………………………………………………... i
LEMBAR PENGESAHAN …………………………………………... ii
PERNYATAAN ………………………………………………………. iii
PERSEMBAHAN DAN MOTO ……………………………………... iv
ABSTRAK ……………………………………………………………. v
ABSTRACT …………………………………………………………… vi
KATA PENGANTAR ………………………………………………... v ii
DAFTAR ISI ………………………………………………………….. ix
DAFTAR TABEL .…………………………………………………….. xi
DAFTAR GAMBAR .………………………………………………….. xii
DAFTAR LAMPIRAN ……………………………………………….. xiii
BAB I. PENDAHULUAN
1.1. Latar Belakang ………..…………………………………… 1
1.2. Permasalahan ………………………………………………. 3
1.3. Pembatasan Masalah .…………….………………………... 3
1.4. Tujuan Penulisan ………...………………………………… 4
1.5. Manfaat Penulisan ……...………………………………….. 4
BAB II. LANDASAN TEORI
2.1. Definisi Asuransi .………….………….…………………….. 5
2.2. Dasar Teori Analysis Survival .………………………………. 6
x
2.3. Survival Analysis .…………………………………………… 10
2.4. Cluster Analysis .…………………………………………….. 15
2.5. Penentuan Variabel ………………………………………….. 16
BAB III. METODE PENELITIAN
3.1. Metode Pengumpulan Data ………………………………… 17
3.2. Metode Pengolahan Data …………………………………... 19
3.3. Metode Analisis Data .……………………………………... 20
3.4. Alur Penelitian ………………………………………………. 25
BAB IV. HASIL DAN PEMBAHASAN
4.1. Deskripsi ………………….……………………………….. 26
4.2. Pembuatan Persamaan ……………………………………... 28
4.3. Pengujian Kontribusi Peubah ………………………………. 28
4.4. Model Terbaik ……………………………………………… 31
4.5. Estimasi Fungsi Survival …………………………………… 33
4.6. Pengelompokkan Data………………………………………. 35
BAB V. KESIMPULAN DAN SARAN
5.1. Kesimpulan ………………………………………………… 38
5.2. Saran ……………………….……………………………….. 39
DAFTAR PUSTAKA
LAMPIRAN
xi
DAFTAR TABEL
Tabel 3.1. Nilai variabel dummy pada variabel Medical Test ……..……. 19
Tabel 4.1. Penyebaran pengamatan tiap karakteristik variabel …...…….. 26
Tabel 4.2. Penyebaran pengamatan yang tersensor tiap karakteristik
variabel …………………………...………………………….. 27
Tabel 4.3. Proses pemilihan variabel dalam uji peubah ganda
menggunakan metode backward LR ...………………………. 29
Tabel 4.4. Nilai penduga parameter cox proportional hazard model …… 31
xii
DAFTAR GAMBAR
Gambar 2.1. Contoh data sensor kanan …………..………………...…… 12
Gambar 3.1. Alur Penelitian ………………..……………………...……. 25
Gambar 4.1. Estimasi fungsi survival berdasarkan variabel kebiasaan
merokok ...…………………………………………...…….. 33
Gambar 4.2. Estimasi fungsi survival berdasarkan variabel medical test.. 34
xiii
DAFTAR LAMPIRAN
Lampiran 1. Iterasi Newton-Raphson .…………………………………. 41
Lampiran 2. Contoh Sebagian Data Analisis ..…………………………. 42
Lampiran 3. Deskripsi Variabel Usia ………………………………….. 43
Lampiran 4. Output Uji Kontribusi Peubah ……………………………. 44
Lampiran 5. Estimasi Fungsi Survival dan Cumulative Hazard ………... 45
Lampiran 6. Dendogram ……………………………………………….. 46
Lampiran 7. Anggota Masing-masing Cluster ………………………… 47
Lampiran 8. Estimasi Fungsi Survival pada Data Cluster ……………… 53
1
BAB I
PENDAHULUAN
1.1. Latar Belakang
Asuransi merupakan suatu istilah yang dikenal sebagai pengalihan resiko.
Sedangkan perusahaan asuransi merupakan suatu perusahaan yang bergerak
dalam bidang mengatur pengelolaan resiko. Fungsi utama asuransi adalah sebagai
pengalihan resiko yang diderita tertanggung kepada penanggungnya, tapi bukan
berarti penanggung menanggung semua resiko tertanggung, melainkan sebagai
imbalannya tertanggung harus membayarkan sejumlah uang yang disebut premi
untuk biaya proteksi resiko yang mungkin akan menimpanya. Besar premi
ditentukan pada saat perjanjian asuransi atau polis. Jenis-jenis asuransi beraneka
ragam, salah satunya adalah asuransi jiwa, asuransi berkendaraan, asuransi
kesehatan dan lain-lain. Walaupun banyak macam-macam asuransi, tetapi hanya
terdapat sedikit perbedaan dalam jenis-jenis asuransi tersebut, tujuannya tetap satu
yaitu sebagai pengalihan resiko.
Dalam kasus ini yang akan dilibatkan dalam permasalahan penelitian
hanyalah asuransi jiwa karena asuransi jiwa merupakan jenis asuransi untuk
memproteksi jiwa seseorang dan berhubungan dengan ketahanan tubuh seseorang.
Dalam memperhitungkan proteksi jiwa tersebut atau dengan kata lain
memperhitungkan kapan seseorang akan meninggal diperlukan suatu analisis yang
berhubungan dengan waktu, serta mampu mengetahui faktor-faktor yang
mempengaruhi kematian tersebut.
2
Aktuaria merupakan salah satu bidang ilmu yang biasa memperhitungkan
faktor-faktor dalam perhitungan asuransi, tetapi aktuaria tidak bisa
memperkirakan seberapa besar resiko yang akan ditanggung perusahaan tersebut
di masa yang akan datang, aktuaria hanya sebatas memperhitungkan faktor-faktor
untuk menentukan berapa besar jumlah premi yang akan dibayarkan tertanggung.
Analisis yang dapat memprediksi waktu kedepannya diperlukan untuk
menjawab pertanyaan ini. Terdapat beberapa analisis yang dapat digunakan untuk
memprediksi, yaitu regresi dan time series. Time series memang analisis yang
berhubungan dengan waktu, tetapi time series tidak menggunakan waktu sebagai
faktor utamanya. Jadi regresi yang paling tepat digunakan untuk permasalahan ini,
tetapi bukan regresi linier biasa yang digunakan, tetapi regresi yang menjadikan
waktu sebagai faktor utamanya, yaitu Regresi Cox atau yang lebih dikenal dengan
Cox Proportional Hazard Model.
Cox Proportional Hazard Model banyak digunakan dalam survival
analysis karena memiliki keuntungan bersifat semiparametrik, sehingga tidak
dibutuhkan asumsi-asumsi tertentu dalam melakukan analisis tersebut.
Keuntungan lainnya Cox Proportional Hazard Model tidak membutuhkan secara
pasti dalam menentukan bentuk fungsi baseline hazard.
Cox Proportional Hazard Model sangat sensitif terhadap waktu, sehingga
harus jelas dalam penentuan waktunya. Terdapat tiga kategori dalam penentuan
waktu, pertama adalah waktu mulai penelitian (start point), kedua adalah waktu
berakhir penelitian (end point) dan waktu kejadian/meninggal tertanggung (event).
Start point dalam penelitian ini adalah waktu tertanggung melakukan polis,
3
sedangkan event adalah saat tertanggung meninggal (mengajukan klaim) dan end
point adalah waktu selesai penelitian.
Faktor-faktor yang digunakan dalam Cox Proportional Hazard Model,
yaitu survival time merupakan waktu tertanggung dari start point sampai terjadi
event atau end point, status merupakan keadaan tertanggung apakah tertanggung
terjadi event atau sampai end point tidak terjadi event, age merupakan umur
tertanggung, sex merupakan jenis kelamin tertanggung, smoking merupakan
kebiasaan merokok tertanggung, dan medical test merupakan keadaan kesehatan
tertanggung.
1.2. Permasalahan
Permasalahan yang diambil dalam penelitian ini adalah:
1. Faktor-faktor apa saja yang berpengaruh terhadap pengajuan klaim
asuransi?
2. Berapakah perbandingan hazard terjadi pengajuan klaim antara variabel
yang sama dengan kategori yang berbeda?
3. Pada selang waktu berapakah tertanggung-tertanggung akan mempunyai
resiko terjadi pengajuan klaim paling besar?
1.3. Pembatasan Masalah
Penelitian ini hanya akan membahas kasus asuransi jiwa kategori medical
tahun 2009. Data yang digunakan penelitian ini berasal dari perusahaan Asuransi
Bumiputera, datanya berupa data klaim, usia, jenis kelamin, kebiasaan merokok,
dan tes kesehatan (medical test).
4
1.4. Tujuan Penelitian
Tujuan penelitian adalah untuk mengetahui faktor-faktor apa saja yang
berpengaruh dalam penentuan pengajuan klaim asuransi. Mulanya semua faktor
yang dianggap penting dimasukkan dalam analisis, kemudian nantinya akan
terlihat faktor-faktor apa saja yang berpengaruh secara statistik dalam penentuan
klaim asuransi.
Tujuan kedua adalah untuk merumuskan perhitungan secara matematika
untuk memprediksi waktu kritis perusahaan dengan kata lain perusahaan akan
menanggung banyak tanggungan karena tertanggung mengalami event, dan
mengetahui pada waktu yang akan datang sebanyak apa probabilitas perusahaan
akan memberikan kewajibannya menanggung resiko tertanggungnya.
1.5. Manfaat Penelitian
Secara praktis, manfaat yang diperoleh dalam penelitian ini adalah jika
terdapat seseorang yang baru melakukan polis, perusahaan asuransi dapat
mengetahui termasuk kelompok tertanggung yang mana berdasarkan faktor-faktor
tersebut dan dapat mengetahui waktu di mana perusahaan akan banyak
tertanggung yang mengajukan klaim asuransi.
Secara teori, manfaat yang diperoleh adalah survival analysis dapat
diaplikasikan dalam bidang asuransi untuk mengetahui probabilitas waktu
pengajuan klaim berdasarkan faktor-faktor yang mempengaruhi tertanggung satu
dengan tertanggung lainnya.
5
BAB II
LANDASAN TEORI
2.1. Definisi Asuransi
Definisi asuransi menurut Pasal 246 Kitab Undang-undang Hukum
Dagang (KUHD) Republik Indonesia, “Asuransi atau pertanggungan adalah suatu
perjanjian, dengan mana seorang penanggung mengikatkan diri pada tertanggung
dengan menerima suatu premi, untuk memberikan penggantian kepadanya karena
suatu kerugian, kerusakan atau kehilangan keuntungan yang diharapkan, yang
mungkin akan dideritanya karena suatu peristiwa yang tak tertentu.”
Berdasarkan definisi tersebut, maka dalam asuransi terkandung 4 unsur,
yaitu:
Pihak tertanggung (insured) yang berjanji untuk membayar uang premi
kepada pihak penanggung, sekaligus atau pun bisa juga secara berangsur-
angsur
Pihak penanggung (insure) yang berjanji akan membayar sejumlah uang
(santunan) kepada pihak tertanggung, sekaligus atau secara berangsur-
angsur apabila terjadi sesuatu yang mengandung unsur tak tertentu
(meninggal)
Suatu peristiwa (accident) yang tak tertentu (tidak diketahui
sebelumnya/tidak disengaja)
Kepentingan (interest) yang mungkin akan mengalami kerugian karena
peristiwa yang tak tertentu [1].
6
2.2. Dasar Teori Analysis Survival
2.2.1. probability density function (pdf) dan cumulative density function (cdf)
Misal variabel acak kontinu T didefinisikan sebagai waktu survival dan
misalkan ( )f t merupakan probability density function (pdf), didefinisikan sebagai
[2]:
1. ( ) 0f t , t R .
2. ( ) 1f t dt
.
3. ( ) ( )
b
a
p a t b f t dt .
sehingga diberikan ( )F t merupakan cdf dari persamaan tersebut:
0
( ) ( ) ( )
t
F t P T t f u du . (2.1)
2.2.2. Fungsi Survival (Survival Function)
Fungsi survival menyatakan sebagai suatu peluang ketahanan observasi
yang diamati selama waktu t. Misal ( )S t adalah fungsi survival, didefinisikan
sebagai berikut [4]:
( ) ( )S t P T t . (2.2)
dari persamaan (2.2) di atas diperoleh:
( ) 1 ( )S t P T t 1 ( )F t (2.3)
dan diperoleh hubungan:
( )
( ) '( )dS t
f t S tdt
. (2.4)
7
hal ini dapat ditunjukkan sebagai berikut [3]:
0
( ) ( ) ( )( ) lim
t
dF t F t t F tf t
dt t
0 0
( ) ( ) [1 ( )] [1 ( )]lim limt t
P T t t P T t S t t S t
t t
0
[ ( ) ( )] ( )lim '( )t
S t t S t dS tS t
t dt
.
2.2.3. Fungsi Hazard (Hazard Function)
Fungsi hazard menyatakan sebagai perbandingan rasio peluang
kematian/kegagalan pada selang waktu antara t dan ( )t t . Misal ( )h t adalah
Fungsi hazard yang didefinisikan sebagai berikut [4]:
0
( )( ) lim
t
P t T t t T th t
t
0
( ) 1lim .
( )t
P t T t t T t
t P T t
0
1 ( ). lim
( ) t
P t T t t
P T t t
0
1 ( ) ( ). lim
( ) t
P T t t P T t
P T t t
1 ( ) ( )
.( ) ( )
dF t f t
S t dt S t . (2.5)
berdasarkan persamaan (2.5) dan (2.4) diperoleh hubungan:
'( )
( )( )
S th t
S t
( ln ( ))d S t
dt
. (2.6)
8
sehingga mempunyai fungsi cumulative hazard ( )H t :
0
( ) ( )
t
H t h u du
0
( ln ( ))ln ( )
td S u
du S tdu
. (2.7)
jika persamaan (2.7) ditransformasi dalam bentuk exponensial diperoleh:
( ) exp( ( ))S t H t . (2.8)
2.2.4. Maximum Likelihood Estimation (MLE)
Untuk menduga parameter model digunakan prosedur maximum likelihood
estimation berdasarkan atas kemungkinan bersyarat dikenal dengan nama partial
likelihood.
Misal Li adalah likelihood dari kegagalan pada suatu waktu dalam
himpunan iR , di mana himpunan resiko pada waktu
it berisi individu-individu
yang bertahan hidup hingga waktu it disebut { ( )}i iR R t dengan i adalah
spesifikasi waktu kegagalan sebanyak k waktu kegagalan. Perkalian peluang
untuk setiap observasi waktu yang terjadi event membentuk persamaan
kemungkinan ( )L yang hanya bergantung pada , sehingga didefinisikan
sebagai berikut [5]:
1 2
1
( ) . . ... .k
k i
i
L L L L L
dengan 0
0
( )exp( )
( )exp( )i
i ii
i l
l R
h t XL
h t X
, sehingga diperoleh:
0
1 0
( )exp( )( )
( )exp( )i
ki i
i i l
l R
h t XL
h t X
. (2.9)
9
Persamaan (2.9) disebut partial likelihood. Persamaan ini tidak bergantung
pada 0 ( )h t , karena untuk menduga parameter-parameter
i di dalam model
regresi cox tidak perlu mengetahui 0 ( )h t , sehingga diperoleh:
1
exp( )( )
exp( )i
ki i
i i l
l R
XL
X
. (2.10)
Untuk mempermudah pencarian penduga kemungkinan maksimum ( )L ,
maka persamaan tersebut ditransformasi dalam bentuk ln menjadi ( ( ))ln L .
Memaksimumkan ( ( ))ln L dengan cara menurunkannya terhadap , yaitu:
( ) 0d
lnLd
. (2.11)
Untuk kasus sederhana, perhitungan dapat dilakukan secara eksak, namun
jika kasus sudah meliputi multivariable dan mempunyai data dalam cakupan
besar, maka dilakukan perhitungan secara numerik dengan bantuan software
dengan metode pemaksimuman yang digunakan adalah prosedur iterasi Newton-
Raphson yang dapat dilihat pada lampiran 1.
2.2.5. Pengujian Kontribusi Peubah
A. Uji peubah tunggal
Uji peubah tunggal merupakan suatu uji yang dilakukan untuk mengetahui
variabel-variabel apa saja yang berpengaruh terhadap model secara masing-
masing terhadap model. Dengan mengasumsikan data berdistribusi normal baku
atau Z-score, maka digunakan Uji Wald sebagai uji peubah tunggal dengan [5]:
( )W
SE
. (2.12)
10
di mana: = koefisien penduga parameter
( )SE = standard error penduga parameter .
B. Uji peubah ganda
Pengujian peubah ganda berkebalikkan dengan uji peubah tunggal, dalam
pengujian peubah ganda dilakukan pengajuan kontribusi peubah secara bersama-
sama. Uji statistik yang digunakan adalah likelihood ratio (LR) dengan
menggunakan log likelihood statistik. LR dikenal juga dengan nama uji Chi-
Square 2( ) didefinisikan sebagai berikut [5]:
2 2 ( 2 )m r mlnL lnL
2( )m r mlnL lnL . (2.13)
dengan: mL = log likelihood statistik dengan m variabel
m rL
= log likelihood statistik dengan m variabel dan disisihkan sebanyak r
variabel.
2.3. Survival Analysis
2.3.1. Definisi Survival Analysis
Survival analysis adalah suatu metode yang berhubungan dengan waktu,
mulai dari time origin atau start point sampai dengan terjadinya suatu kejadian
khusus atau end point. Dengan kata lain, survival analysis memerlukan data yang
merupakan waktu survival dari suatu individu. Dalam bidang asuransi jiwa data
ini diperoleh dari suatu pengamatan terhadap sekelompok atau beberapa
kelompok individu dan dalam hal ini adalah tertanggung pengguna jasa asuransi
jiwa, yang diamati dan dicatat waktu terjadinya kegagalan (event) dari setiap
11
individu. Kegagalan yang dimaksudkan antara lain adalah ketika tertanggung
meninggal atau mengajukan klaim dikarenakan tertanggung terkena suatu
musibah, seperti sakit, kecelakaan atau terkena bencana alam, sehingga pihak
perusahaan asuransi harus menanggung biaya klaim yang diajukan itu. Maka
waktu survival yang dicatat antara lain sebagai berikut [4]:
a. Selisih waktu mulai dilakukannya pengamatan sampai terjadinya pengajuan
klaim, dengan kata lain tertanggung meninggal (event) dan data tersebut
termasuk data tidak tersensor,
b. Jika waktu pengajuan klaim tidak diketahui (tertanggung survive), maka
memakai selisih waktu mulai dilakukannya pengamatan sampai waktu terakhir
penelitian dan data tersebut termasuk data tersensor (censored data).
Data tersensor merupakan data yang mendapatkan penyensoran karena
sebab-sebab tertentu. Umumnya terdapat tiga alasan mengapa terjadi
penyensoran, yaitu:
1.) Seseorang yang tidak terjadi event (meninggal) sampai end point,
2.) Seseorang yang informasinya tidak dapat diketahui kelanjutannya selama
masa penelitian,
3.) Seseorang yang meninggal yang kematiannya karena alasan tertentu, karena
narkoba, bunuh diri atau yang lainnya yang disengaja [5].
Data tersensor terbagi menjadi dua jenis, yaitu data tersensor kanan dan
kiri. Data tersensor kanan merupakan tipe data umum dalam survival analysis.
Penyensoran dilakukan ketika diketahui bahwa survival time melebihi suatu nilai
tertentu atau akhir masa penelitian, dengan kata lain sampai akhir masa penelitian
12
tertanggung tidak mengalami event. Dalam penelitian ini data termasuk data
tersensor kanan, penyensoran pada data tersensor kanan dilakukan karena
tertanggung diketahui sampai batas waktu penelitian tidak mengalami event.
Gambar 2.1. Contoh data sensor kanan
Sedangkan yang dinamakan data tersensor kiri adalah data yang
mengalami penyensoran saat waktu kejadian kurang dari suatu nilai tertentu.
Contohnya adalah penelitian balita yang mampu berjalan pada usia satu tahun,
maka data tersensornya adalah balita yang mampu berjalan sebelum usia satu
tahun [3].
2.3.2. Cox Proportional Hazard Model
Ada beberapa teori yang pernah membahas tentang survival analysis yaitu
di antaranya adalah Kaplan-meier dan Cox. Pada mulanya permodelan dari teori
ini digunakan pada cabang ilmu kedokteran, di mana mereka menganalisis
kematian atau harapan hidup seseorang, namun permodelan ini semakin
berkembang dan digunakan dalam bidang-bidang lain.
Setiap pengamatan dalam analisis ketahanan hidup dapat dituliskan
( , , )i i it w X , dengan 1,2,3,...,i n dimana n adalah banyaknya pengamatan
13
(0,it ~) adalah waktu seorang individu dapat bertahan dari penyakit hingga
kejadian, sedangkan wi bernilai 1 apabila individu tersebut mengalami event
(meninggal) sehingga mengajukan klaim pada waktu it dan bernilai 0 apabila
individu tersebut tersensor pada it ,
iX merupakan variabel dari individu ke-i
dimana 1 2[ ... ]i ipX X X X dengan
ipX berupa variabel dummy yang memiliki
nilai 0 atau 1.
Fungsi hazard yang bergantung pada variabel dapat ditulis sebagai berikut
[5]:
0
1
( , ) ( ).exp( . )p
i i
i
h t X h t X
(2.14)
dengan: ( , )h t X = resiko kematian individu pada waktu t dengan karakteristik X
0 ( )h t = fungsi hazard baku
i = parameter variabel
iX
Jika variabel 1 2 ... 0pX X X , maka fungsi hazard tersebut
merupakan fungsi baseline hazard atau hazard baku yang hanya bergantung pada
waktu, sehingga diperoleh [5]:
0( , ) ( ).exp(0)h t X h t
0 ( )h t
Membandingkan persamaan hazard (2.14) dengan variabel sama dan
kategori berbeda yang bebas terhadap waktu t, maka diperoleh hazard ratio.
Hazard ratio didefinisikan sebagai hazard untuk satu individu dibagi dengan
hazard untuk satu individu lain [5]:
14
0
1
0
1
( ) exp( *)( , *)
( , )( ) exp( )
p
i i
i
p
i i
i
h t Xh t X
HRh t X
h t X
1
exp( ( * ))p
i i i
i
X X
(2.15)
2.3.3. Estimasi Fungsi Survival
Fungsi survival yang bergantung pada variabel adalah sebagai berikut [5]:
1
exp( . )
0( , ) ( )
p
i i
i
X
S t X S t
(2.16)
dengan: ( , )S t X = kemungkinan survive individu pada waktu t dengan
karakteristik X
0 ( )S t = fungsi survival
i = parameter variabel
iX
Umumnya estimasi fungsi survival menggunakan estimasi Kaplan-Meier
yang disebut Product-Limit Estimator. Estimasi ini didefinisikan untuk semua
nilai t pada data adalah sebagai berikut [6]:
1
01
,
, .( ) { i
i
it ti
d
Y
it t
t tS t
(2.17)
dengan: ti = waktu terjadi event
di = jumlah kematian pada waktu ti
Yi = jumlah tertanggung yang beresiko terjadi event pada waktu ti.
Estimasi kumulatif hazard menggunakan estimasi Nelson-Aalen
didefinisikan sebagai berikut [6]:
1
0,
, .( ) { i
ii
it ti
d
Y
t t
t tH t
(2.18)
15
2.4. Cluster Analysis
Cluster analysis adalah suatu teknik untuk menggabungkan observasi-
observasi ke dalam beberapa grup atau kelompok dengan:
1. Setiap grup atau kelompok merupakan kelompok yang homogen atau
padat dengan karakter yang sama,
2. Setiap grup atau kelompok akan dibedakan dari grup lainnya dengan
karakternya masing-masing [7].
Penelitian ini menggunakan algoritma K-Means Cluster dengan
menggunakan bantuan hierarchical clustering terlebih dahulu untuk mengetahui
jumlah pengelompokkan yang sesuai dengan datanya. Langkah-langkah algoritma
K-Means Cluster adalah seperti dibawah ini [8]:
1) Tentukan q sebagai jumlah cluster yang ingin dibentuk
2) Bangkitkan q centroids sebagai titik pusat cluster awal secara acak
3) Hitung jarak setiap data ke centroids dengan jarak Euclidean seperti
dibawah ini:
2
, 1 1
( )p n
ij ik jk
i j k
D d d
(2.19)
dengan: ijD = jarak antara observasi i dan j
ikd = observasi i pada variabel k
jkd = observasi j pada variabel k
4) Kelompokkan data berdasarkan jaraknya terhadap centroids
16
5) Tentukan posisi centroids baru dengan cara menghitung nilai rata-rata dari
data yang mempunyai jarak centroids yang sama dengan:
1 1
1( )
p n
q ik
i kq
C dn
(2.20)
dengan: qn = jumlah data cluster ke-q
2.5. Penentuan variabel
Umumnya faktor-faktor yang berperan dalam ilmu asuransi adalah [5]:
1. Usia
Usia seseorang mempunyai kaitan langsung terhadap kesehatan, semakin tua
tertanggung, maka akan semakin tinggi resiko terkena penyakit.
2. Jenis kelamin
Jenis kelamin juga mempengaruhi kesehatan, karena pengalaman
menunjukan, secara rata-rata kehidupan wanita lebih lama lima atau enam
tahun dari pada kehidupan pria.
3. Kebiasaan
Kebiasaan hidup seseorang juga mempengaruhi kesehatannya. Misal
kebiasaan merokok, makan berlebihan atau minum beralkohol akan
mempunyai pengaruh besar terhadap kesehatan.
Faktor-faktor di atas memang faktor pada umumnya yang berperan dalam
asuransi, namun setiap perusahaan asuransi mempunyai faktor-faktor lain yang
dianggap berperan terhadap perhitungan asuransi, salah satunya adalah medical
test. Medical test adalah salah satu cara untuk mengetahui kesehatan tertanggung
dengan menguji kesehatan tertanggung dengan cara medical.
17
BAB III
METODE PENELITIAN
3.1. Metode Pengumpulan Data
Jenis data yang digunakan dalam penelitian ini adalah data sekunder tahun
2009 yang diperoleh dari Perusahaan Asuransi Bumiputera. Data yang
dikumpulkan berupa hal-hal yang diperlukan dalam melakukan analisis, yaitu
waktu klaim, umur, jenis kelamin, kebiasaan merokok, dan medical test.
Pendefinisian masing-masing variabel adalah sebagai berikut:
1. Waktu klaim
Data waktu klaim dihitung dalam skala bulan yang merupakan
pengurangan antara waktu end point dengan waktu start point. Start point untuk
data tersensor maupun event adalah waktu tertanggung terdaftar menjadi anggota
asuransi, sedangkan untuk end point terdapat perbedaan antara data tersensor dan
event. Untuk data tersensor waktu end point adalah waktu selesai penelitian
dengan kata lain sampai berakhir masa penelitian tertanggung tidak terjadi
event/meninggal, sebaliknya untuk data event waktu end point adalah waktu
tertanggung terjadi event/meninggal.
2. Penyensoran
Data penyensoran dapat diperoleh dengan melihat waktu pengajuan klaim.
Jika tidak terdapat waktu pengajuan klaim diberi nilai 0, menyatakan bahwa data
tersebut tersensor yang berarti tertanggung tidak mengajukan klaim, sebaliknya
18
jika terdapat waktu pengajuan klaim diberi nilai 1, menyatakan bahwa data
tersebut terjadi event, dengan kata lain tertanggung meninggal.
3. Usia
Data usia diukur dalam satuan tahun, dan diperoleh berdasarkan usia
tertanggung pada saat masuk menjadi konsumen asuransi pada perusahaan
tersebut.
4. Jenis kelamin
Data jenis kelamin diperoleh dengan memberikan nilai 0 untuk
tertanggung berjenis kelamin perempuan, dan diberi nilai 1 untuk tertanggung
berjenis kelamin laki-laki.
5. Kebiasaan merokok
Data kebiasaan merokok diperoleh dengan memberi nilai 0 jika
tertanggung mempunyai kebiasaan tidak merokok dan diberi nilai 1 jika
tertanggung mempunyai kebiasaan merokok.
6. Medical test
Data medical test diperoleh dengan membentuk variabel dummy dengan
variabel pembanding adalah tertanggung dengan kategori penyakit berat (SS5 &
SS6). Kriterianya sebagai berikut, untuk dummy 1 bernilai 1 untuk kategori
standard (STD) dan diberi nilai 0 untuk kategori penyakit ringan (SS1 & SS2),
penyakit sedang (SS3 & SS4) maupun penyakit berat (SS5 & SS6). Dummy 2
bernilai 1 untuk kategori penyakit ringan (SS1 & SS2) dan diberi nilai 0 untuk
kategori standard (STD), penyakit sedang (SS3 & SS4) maupun penyakit berat
(SS5 & SS6). Dummy 3 bernilai 1 untuk kategori penyakit sedang (SS3 & SS4)
19
dan bernilai 0 untuk kategori standard (STD), penyakit ringan (SS1 & SS2),
maupun penyakit berat (SS5 & SS6). Untuk jelasnya dapat dilihat pada tabel 3.1.
di bawah ini:
Tabel 3.1. Nilai variabel dummy pada variabel Medical_Test
MEDICAL_TEST
Variabel dummy
dummy 1 dummy 2 dummy 3
Standard 1 0 0
Penyakit Ringan 0 1 0
Penyakit Sedang 0 0 1
Penyakit Berat 0 0 0
3.2. Metode Pengolahan Data
Pengolahan data dalam penelitian ini menggunakan bantuan software
dengan variabel dependen adalah Waktu klaim (Survt(Y)), penyensoran (Status),
dan variabel-variabel independennya adalah usia (Age(1X )), jenis kelamin
(Sex(2X )), kebiasaan merokok (Smoking(
3X )), dummy 1 (4.1X ), dummy 2 (
4.2X ),
dan dummy 3 ( 4.3X ).
Uraian penelitian berupa, identifikasi variabel, pembuatan persamaan
dengan mengasumsikan semua variabel berpengaruh terhadap model, uji
kontribusi peubah untuk mengetahui variabel apa daja yang berpengaruh terhadap
model dengan uji Wald dan uji Chi-Square, pembuatan model terbaik, estimasi
fungsi survival dengan estimasi Kaplan-Meier dan fungsi kumulatif hazard
dengan estimasi Nelson-Aalen, dan terakhir adalah pengelompokkan dengan
cluster analysis untuk mempermudah interpretasi.
20
3.3. Metode Analisis Data
Analisis data yang digunakan dalam penelitian ini adalah:
1. Deskripsi data
Mendeskripsikan data bertujuan untuk menampilkan jumlah keseluruhan
data, jumlah data tersensor untuk semua variabel maupun berdasarkan masing-
masing variabel dan mengertahui persentase data tersensor.
2. Pembuatan persamaan
Bentuk dasar cox proportional hazard model pada persamaan (2.14)
adalah sebagai berikut:
1 1 2 2. . ... .
0( , ) ( ). p pX X Xh t X h t e
dengan menganggap semua variabel berpengaruh terhadap model, maka semua
variabel dimasukkan ke dalam model, sehingga estimasi model menjadi:
1 2 3 4.1 4.2 4.3. . . . 1 . 2 . 3
0( , ) ( ).AGE SEX SMOKING dummy dummy dummy
h t X h t e
3. Pengujian kontribusi peubah
Pengujian di sini berguna untuk mencari variabel yang berpengaruh
terhadap model yang akan dibuat. Dalam hal ini terdapat dua analisis yang
digunakan, yaitu analisis peubah tunggal dan analisis peubah ganda.
Mula-mula semua variabel diuji secara bersama-sama dengan
menggunakan likelihood ratio (LR) atau dikenal dengan nama uji Chi-Square
2( ) . Tujuannya untuk mengetahui apakah semua variabel berpengaruh secara
21
bersama-sama terhadap model. Hipotesis dari pengujian tersebut adalah sebagai
berikut [9]:
H0: 1 2 43... 0
H1: 0,i 1,2,3,4.1,4.2,4.3i
dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai
signifikan > 0.05, maka terima H0, kesimpulannya semua variabel tidak
berpengaruh signifikan secara bersama-sama terhadap model. Dan jika nilai
signifikan <0.05, maka tolak H0, kesimpulannya semua variabel berpengaruh
signifikan secara bersama-sama terhadap model.
Jika diketahui bahwa variabel-variabel tersebut tidak berpengaruh
signifikan terhadap model, maka variabel-variabel tersebut tidak layak untuk
dibentuk dalam model karena akan menghasilkan error yang besar dan tidak
sesuai dengan keadaan data sebenarnya. Sebaliknya jika diketahui bahwa
variabel-variabel tersebut berpengaruh signifikan terhadap model, maka variabel-
variabel tersebut dilanjutkan dengan uji peubah tunggal. Analisis peubah tunggal
menggunakan uji Wald dengan hipotesis sebagai berikut [9]:
a. Usia/Age ( 1X )
H0: 1 0 (variabel usia tidak berpengaruh signifikan terhadap model)
H1: 1 0 (variabel usia berpengaruh signifikan terhadap model)
dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai
signifikan > 0.05, maka terima H0, kesimpulannya variabel usia tidak berpengaruh
signifikan terhadap model. Sebaliknya jika nilai signifikan > 0.05, maka tolak H0,
kesimpulannya variabel usia berpengaruh signifikan terhadap model.
22
b. Jenis kelamin/Sex (2X )
H0: 2 0 (variabel jenis kelamin tidak berpengaruh signifikan terhadap model)
H1: 2 0 (variabel jenis kelamin berpengaruh signifikan terhadap model)
Dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai
signifikan > 0.05, maka terima H0, kesimpulannya variabel jenis kelamin tidak
berpengaruh signifikan terhadap model. Sebaliknya jika nilai signifikan > 0.05,
maka tolak H0, kesimpulannya variabel jenis kelamin berpengaruh signifikan
terhadap pembentukkan model.
c. Kebiasaan merokok/Smoking (3X )
H0: 3 0 (variabel merokok tidak berpengaruh signifikan terhadap model)
H1: 3 0 (variabel merokok berpengaruh signifikan terhadap model)
Dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai
signifikan > 0.05, maka terima H0, kesimpulannya variabel kebiasaan merokok
tidak berpengaruh signifikan terhadap model. Sebaliknya jika signifikan > 0.05,
maka tolak H0, kesimpulannya variabel kebiasaan merokok berpengaruh
signifikan terhadap model.
d. Dummy1 ( 4.1X )
H0: 4.1 0 (variabel dummy 1 tidak berpengaruh signifikan terhadap model)
H1: 4.1 0 (variabel dummy 1 berpengaruh signifikan terhadap model)
Dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai
signifikan > 0.05, maka terima H0, kesimpulannya variabel dummy 1 tidak
berpengaruh signifikan terhadap model. Sebaliknya jika nilai signifikan > 0.05,
23
maka tolak H0, kesimpulannya variabel dummy 1 berpengaruh signifikan terhadap
model.
e. Dummy2 (4.2X )
H0: 4.2 0 (variabel dummy 2 tidak berpengaruh signifikan terhadap model)
H1: 4.2 0 (variabel dummy 2 berpengaruh signifikan terhadap model)
Dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai
signifikan > 0.05, maka terima H0, kesimpulannya variabel dummy 2 tidak
berpengaruh signifikan terhadap model. Sebaliknya jika nilai signifikan > 0.05,
maka tolak H0, kesimpulannya variabel dummy 2 berpengaruh signifikan terhadap
model.
f. Dummy3 (4.3X )
H0: 4.3 0 (variabel dummy 3 tidak berpengaruh signifikan terhadap model)
H1: 4.3 0 (variabel dummy 3 berpengaruh signifikan terhadap model)
Dengan taraf nyata α = 5%, dan berdasarkan nilai signifikan, maka jika nilai
signifikan > 0.05, maka terima H0, kesimpulannya variabel dummy 3 tidak
berpengaruh signifikan terhadap model. Sebaliknya jika nilai signifikan > 0.05,
maka tolak H0, kesimpulannya variabel dummy 3 berpengaruh signifikan terhadap
model.
Variabel yang berpengaruh signifikan secara masing-masing terhadap
model, maka akan dimasukkan kedalam model. Sedangkan variabel yang tidak
berpengaruh secara masing-masing terhadap model, maka akan diabaikan.
24
4. Pembuatan model terbaik
Pembuatan model terbaik dapat dilakukan setelah pengujian kontribusi
peubah dilakukan. Hasil pengujian kontribusi peubah akan dapat memperlihatkan
variabel apa saja yang berpengaruh signifikan dan tidak berpengaruh signifikan
terhadap model.
Dengan memasukkan variabel 1,..., pX X ke dalam model, di mana
1,..., pX X merupakan variabel yang signifikan terhadap model. Dan membuang
variabel yang tidak signifikan terhadap model, sehingga diperoleh cox
proportional hazard model terbaik.
5. Estimasi Fungsi Survival
Estimasi fungsi Survival tertanggung sampai waktu t dengan variabel X
adalah [5]:
0
exp( . )
0( , ) ( )
p
i i
i
X
S t X S t
(3.1)
Dari persamaan (3.1) terlihat bahwa untuk menduga ( , )S t X , maka 0 ( )S t
harus diduga terlebih dahulu dengan Product-Limit Estimator pada persamaan
(2.17).
6. Pengelompokkan data
Cluster analysis berperan untuk mengelompokkan semua probabilitas
estimasi nilai survival untuk setiap kombinasi variabel yang digunakan. Jika
semua variabel dimasukkan, maka akan menghasilkan kombinasi probabilitas
estimasi nilai survival yang relatif banyak. Sehingga digunakan cluster analysis
untuk mengelompokkan semua kombinasi tersebut ke dalam beberapa kelompok.
25
3.4. Alur Penelitian
Tahapan analisis di atas untuk lebih jelasnya dapat dilihat pada alur
dibawah ini:
Pengumpulan
Data
Variabel Berpengaruh
Terhadap Model
Pembuatan
Cox Proportional
Hazard Model Terbaik
Interpretasi
Identifikasi Variabel
Pembuatan Cox
Proportional Hazard
Model
Pengelompokkan Data
Ya
Tidak
Pengujian Kontribusi
Variabel
Gambar 3.1. Alur Penelitian
26
BAB IV
HASIL DAN PEMBAHASAN
4.1. Deskripsi
Dari 2200 data tertanggung yang diperoleh, terdapat sebanyak 1.2% atau
26 tertanggung yang mengalami kematian dalam rentang waktu bulan Januari
2009 sampai bulan Februari 2011, dan terdapat 98.8% atau 2174 tertanggung
yang masih menjadi tanggungan perusahaan tersebut. Dari data tersebut
dideskripsikan berdasarkan karakteristiknya, untuk lebih jelas penyebaran pada
tiap-tiap variabel dapat dilihat pada tabel 4.1. berikut ini:
Tabel 4.1. Penyebaran pengamatan tiap karakteristik variabel
Variabel Karakteristik Jumlah Persentase
Jenis kelamin
Laki-laki 1217 55.32%
Wanita 983 44.68%
Merokok
Ya 86 3.91%
Tidak 2114 96.09%
Medical test
Standard 1495 67.95%
Penyakit Ringan 599 27.23%
Penyakit Sedang 90 4.09%
Penyakit Berat 16 0.73%
Ket: Variabel lainnya terdapat pada lampiran 3
Tabel 4.1. di atas menggambarkan observasi yang telah dilakukan. Sebanyak
55.32% tertanggung yang berjenis kelamin laki-laki dan sisanya 44.68% adalah
tertanggung yang berjenis kelamin perempuan. Tertanggung yang mempunyai
kebiasaan merokok adalah sebanyak 3.91% dan sebanyak 96.09% tertanggung
27
yang mempunyai kebiasaan tidak merokok. Tertanggung yang tidak mempunyai
penyakit sebelumnya (Standard) adalah sebanyak 67.95%, tertanggung yang
mempunyai penyakit kategori Penyakit Ringan sebanyak 27.23%, tertanggung
yang mempunyai penyakit kategori Penyakit Sedang sebanyak 4.09% dan sisanya
adalah tertanggung yang mempunyai penyakit Penyakit Berat sebanyak 0.73%.
Untuk mengetahui penyebaran data tersensor, pada tabel 4.2. berikut ini
menjelaskan berdasarkan karakteristik variabelnya:
Tabel 4.2. Penyebaran pengamatan yang tersensor tiap karakteristik variabel
Variabel Karakteristik
Status
Failur Sensor
nf %* %** ns %* %**
Jenis kelamin
Laki-laki 15 57.69% 1.23% 1202 55.29% 98.77%
Wanita 11 42.31% 1.12% 972 44.71% 98.88%
Merokok
Ya 2 7.69% 2.33% 84 3.86% 97.67%
Tidak 24 92.31% 1.14% 2090 96.14% 98.86%
Medical test
Standard 17 65.38% 1.14% 1478 67.99% 98.86%
Penyakit Ringan 7 26.92% 1.17% 592 27.23% 98.83%
Penyakit Sedang 1 3.85% 1.11% 89 4.09% 98.89%
Penyakit Berat 1 3.85% 6.25% 15 0.69% 93.75%
Ket: *: Persentase dalam variabel dan status yang sama berdasarkan karakteristik yang berbeda
**: Persentase dalam variabel dan karakteristik yang sama berdasarkan status yang berbeda
Tabel 4.2. memperlihat penyebaran data tersensor untuk masing-masing variabel
dan karakteristiknya. Terlihat bahwa persentase kematian laki-laki (57.69%) lebih
tinggi dibandingkan persentase kematian perempuan (42.31%), hal ini berarti
resiko kematian tertanggung berjenis kelamin laki-laki lebih besar dari pada
28
resiko tertanggung berjenis kelamin wanita. Untuk variabel medical test, jika
dilihat dalam bentuk persentase per karakteristik memang tidak menarik
perhatian, tetapi jika dilihat dalam bentuk persentase antara failure dan sensor,
maka akan terlihat bahwa tertanggung yang mempunyai kategori penyakit berat
dan tertanggung yang merokok mempunyai persentase yang lebih besar
dibandingkan yang lainnya, yaitu berturut-turut sebesar 6.25% dan 2.33%,
sedangkan yang lainnya hanya sekitar 1%.
4.2. Pembuatan Persamaan
Pertama-tama dengan menganggap semua variabel berpengaruh terhadap
model, maka semua variabel dimasukkan ke dalam persamaan (2.14), sehingga
diperoleh estimasi cox proportional hazard model sebagai berikut:
0.155* 0.012* 0.875* 2.219* 1 2.1* 2 2.024 30( ; ) ( ). AGE SEX SMOKING dummy dummy dummyh t X h t e
persamaan tersebut mempunyai nilai sign 0.078 dan berdasarkan
likelihood ratio (LR) menghasilkan -2 log likelihood sebesar 377.668. Model ini
mempunyai nilai signifikan > 0.05, berarti model ini tidak digunakan karena
mempunyai nilai error lebih dari 5%.
4.3. Pengujian Kontribusi Peubah
Uji peubah ganda merupakan langkah awal pengujian kontribusi peubah,
selanjutnya jika terdapat variabel-variabel yang berpengaruh signifikan dalam
pembentukkan model, maka langkah selanjutnya adalah melakukan pengujian
variabel secara masing-masing dengan uji peubah tunggal.
29
Tabel 4.3. di bawah ini memperlihatkan proses pemilihan variabel dalam
uji peubah ganda:
Tabel 4.3. Proses pemilihan variabel dalam uji peubah ganda menggunakan metode backward LR
Age Sex Smoking Dummy 1 Dummy 2 Dummy 3 Sign -2 Log Likelihood Ket
Step 1 √ √ √ √ √ √ 0.078 377.668 Model 1
Step 2 √ √ √ √ √ 0.045 377.669 Model 2
Step 3 √ √ 0.033 380.239 Model 3
Step 4 √ 0.027 381.809 Model 4
Step 5 √ √ √ √ 0.048 378.73 Model 5
Step 6 √ 0.027 381.809 Model 4
Ket: √ variabel yang masuk model
Terdapat enam langkah dalam menentukan pengujian variabel secara
bersama-sama. Metode yang digunakan adalah backward LR, mulanya semua
variabel dimasukkan menghasilkan model 1 dengan nilai sign 0.078. Pada langkah
ke-2 variabel jenis kelamin dikeluarkan dari model, sehingga menghasilkan model
2 dengan nilai sign 0.045. Pada langkah ke-3 variabel medical test dikeluarkan
dari model, menghasilkan model 3 dengan nilai sign 0.033. Pada langkah ke-4
variabel kebiasaan merokok dikeluarkan dari model, menghasilkan model 4
dengan nilai sign 0.027. Pada langkah ke-5 memasukkan kembali variabel
medical test ke dalam model, menghasilkan model 5 dengan nilai sign 0.048. dan
langkah terakhir kembali mengeluarkan variabel medical test dari model,
menghasilkan model yang sama seperti langkah ke-4.
Terdapat 4 model dalam uji peubah ganda yang mempunyai nilai
signifikan > 0.05, sehingga empat model tersebut mempunyai variabel yang
berpengaruh secara bersama-sama terhadap model. Ke empat model itu adalah
30
model 2 dengan tiga variabel di dalamnya yang berpengaruh bersama-sama
terhadap model, model 3 dengan dua variabel yang berpengaruh bersama-sama
terhadap model, model 4 dengan satu variabel yang berpengaruh bersama-sama
terhadap model, dan model 5 dengan dua variabel yang berpengaruh bersama-
sama terhadap model. Model yang paling signifikan dalam uji peubah ganda
adalah model 4, tetapi hanya terdapat satu variabel yang berarti model ini hanya
mewakili sebagian kecil variansi dari populasi data, dengan kata lain model ini
banyak kehilangan informasi dari populasi data tersebut. Sedangkan model yang
signifikan dan dianggap mewakili variansi populasi data adalah model 2 dengan
tiga variabelnya, yaitu umur, kebiasaan merokok, dan medical test yang terdiri
dari tiga variabel dummy menghasilkan -2 log likelihood 377.669.
Terdapat tiga variabel dalam model 2 yang berpengaruh bersama-sama
terhadap model secara statistika. Untuk mengetahui variabel tersebut berpengaruh
secara masing-masing, maka variabel-variabel tersebut diuji dengan uji peubah
tunggal menggunakan uji Wald. Pada lampiran 4 memperlihatkan bahwa variabel
Age mempunyai nilai sign 0.023, Smoking mempunyai nilai sign 0.252, dummy 1
mempunyai nilai sign 0.038, dummy 2 mempunyai nilai sign 0.055, dan dummy 3
mempunyai nilai sign 0.158. Sehingga diketahui hanya terdapat dua variabel yang
mempunyai nilai signifikan > 0.05, yaitu variabel Age dan dummy 1, yang berarti
kedua variabel ini memang berpengaruh signifikan secara masing-masing
terhadap pembentukkan model. Sisanya variabel Smoking, dummy 1, dan dummy
2 mempunyai signifikan > 0.05, dengan demikian ketiga variabel tersebut tidak
berpengaruh signifikan secara masing-masing terhadap pembentukkan model.
31
4.4. Pembuatan Model Terbaik
Terdapat 5 model yang dibentuk dalam uji peubah ganda dan terdapat 4
model yang signifikan. Model yang paling signifikan dalam uji peubah ganda
adalah model 4, tetapi hanya terdapat satu variabel yang berpengaruh signifikan
terhadap model, mengakibatkan model banyak kehilangan variansi dari populasi
data, sehingga dipilih model 2 dengan tiga variabel yang berpengaruh signifikan
terhadap model. Namun, setelah diuji secara masing-masing dengan uji peubah
tunggal, hanya dua dari tiga variabel yang berpengaruh signifikan terhadap model,
sisanya tidak berpengaruh signifikan terhadap model. Untuk lebih jelasnya dapat
dilihat pada tabel 4.4. di bawah ini:
Tabel 4.4. Nilai penduga parameter cox proportional hazard model
Variabel β exp(β) Sign
Age 0.155 1.168 0.023
Smoking 0.878 2.407 0.252
Dummy 1 -2.221 0.108 0.038
Dummy 2 -2.102 0.122 0.055
Dummy 3 -2.024 0.132 0.158
Model 2 tetap dipilih sebagai model terbaik yang mewakili populasi data,
sehingga diperoleh cox proportional hazard model:
0.155* 0.878* 2.221* 1 2.102* 2 2.024* 3
0( ; ) ( ). AGE SMOKING dummy dummy dummyh t X h t e
dengan variabel Age adalah umur, Smoking adalah kebiasaan merokok, dummy 1,
dummy 2, dan dummy 3 adalah variabel dummy dari medical test.
32
Nilai dugaan koefisien diperoleh variabel umur bernilai positif yang
berarti tertanggung dengan usia t+1 akan mempunyai resiko terjadi event yang
lebih besar dibandingkan tertanggung dengan usia t. Demikian juga untuk variabel
merokok yang bernilai positif, tertanggung yang merokok mempunyai resiko
terjadi event lebih besar dibandingkan tertanggung yang tidak merokok. Untuk
tiga variabel terakhir, yaitu variabel dummy 1, 2 dan 3 mempunyai nilai dugaan
koefisien negatif yang berarti jika tertanggung dengan hasil medical test
standard, tertanggung kategori penyakit ringan dan tertanggung kategori penyakit
sedang mempunyai resiko terjadi event lebih rendah dibandingkan tertanggung
kategori penyakit berat.
Hal ini dipertegas dengan menginterpretasikan nilai exp( ) . Resiko
terjadi event tertanggung dengan usia t+1 adalah 1.168 kali dari tertanggung yang
dengan usia t, sesuai dengan tabel mortalita yang menyatakan bahwa usia t+1
mempunyai kemungkinan kematian yang lebih besar dibandingkan dengan usia t.
Untuk resiko terjadi event tertanggung yang merokok adalah 2.407 kali
dari tertanggung yang tidak merokok, hal ini sesuai dengan yang kita ketahui
bahwa merokok dapat merusak kesehatan paru-paru, jantung, dan penyakit
lainnya.
Sedangkan resiko terjadi event variabel dummy 1 adalah 0.038 kali dari
variabel pembandingnya, resiko terjadi event variabel dummy 2 adalah 0.122 kali
dari variabel pembandingnya, dan resiko terjadi event variabel dummy 3 adalah
0.123 kali dari variabel pembandingnya. Variabel pembandingnya adalah
tertanggung kategori penyakit berat, terbukti dengan orang-orang yang
33
mempunyai penyakit kategori penyakit berat akan mempunyai kemungkinan
meninggal lebih cepat dibandingkan tertanggung yang sehat atau berpenyakit
kategori penyakit ringan.
4.5. Estimasi Fungsi Survival
Estimasi fungsi survival menggunakan persamaan (2.17), sehingga
diperoleh fungsi survival:
exp(0.155* 0.878* 2.221* 1 2.102* 2 2.024* 3)0( , ) ( ) AGE SMOKING dummy dummy dummyS t X S t
dengan 0 ( )S t adalah estimasi fungsi survival dasar yang hanya dipengaruhi waktu
dengan estimasi Kaplan-Meier, sehingga diperoleh estimasi ( , )S t X . Dibawah ini
merupakan gambar estimasi fungsi survival berdasarkan kebiasaan merokok
tertanggung dapat dilihat pada gambar di bawah ini:
302520151050
SURVT
1.000
0.995
0.990
0.985
0.980
0.975
Cu
m S
urv
ival
Smoked
Unsmoked
SMOKING
Survival Function
Gambar 4.1. Estimasi fungsi survival berdasarkan variabel kebiasaan merokok
Gambar 4.1. di atas merupakan estimasi fungsi survival yang dilihat
berdasarkan kebiasaan merokok. Terlihat bahwa pada umumnya kemungkinan
tertanggung yang tidak merokok untuk survive adalah relatif stabil, dibandingkan
34
tertanggung yang merokok. Hal ini memperkuat pernyataan sebelumnya bahwa
kemungkinan terjadi event tertanggung yang merokok adalah 2.407 kali dari
tertanggung yang tidak merokok. Untuk melihat estimasi fungsi survival
berdasarkan medical test tertanggung dapat dilihat pada gambar di bawah ini:
302520151050
SURVT
1.00
0.98
0.96
0.94
0.92
0.90
0.88
0.86
Cu
m S
urv
iva
l
SS5&SS6
SS3&SS4
SS1&SS2
STD
MEDICAL_TEST
Survival Function
Gambar 4.2. Estimasi fungsi survival berdasarkan variabel medical test
Gambar 4.2. memperlihatkan bahwa kemungkinan tertanggung yang
mempunyai hasil medical test tergolong kategori standard dan kategori penyakit
ringan untuk survive adalah relatif stabil, dibandingkan tertanggung yang
mempunyai hasil medical test tergolong kategori penyakit sedang dan kategori
penyakit berat. Untuk tertanggung dengan kategori penyakit sedang perlu
diperhatikan saat tertanggung memasuki waktu t = 25, sedangkan tertanggung
dengan kategori penyakit berat perlu diperhatikan pada saat t = 10, hal ini
dikarenakan pada titik-titik tersebut kemungkinan survive tertanggung menurun
tajam, sehingga kemungkinan tertanggung untuk terjadi event pun meningkat.
35
4.5. Pengelompokkan Data
Terdapat 384 (2x4x48) kombinasi estimasi nilai probabilitas survival
karena terdapat 3 variabel yang mempengaruhinya, yaitu variabel age dengan
kategori usia antara 15-62 tahun, variabel smoking dengan kategori merokok dan
tidak merokok, dan terakhir adalah variabel medical test dengan kategori
tertanggung dengan hasil medical test penyakit ringan, penyakit sedang dan
penyakit berat. Sehingga diperlukan pengelompokkan data untuk mempermudah
interpretasi data.
Pertama-tama dilakukan hierarchical clustering untuk memperoleh
pengelompokkan yang sesuai dengan data, pada dendogram lampiran 6
menunjukkan bahwa pengelompokkan 2 cluster merupakan pengelompokkan
terbaik karena mempunyai jarak pengelompokkan terjauh dibandingkan kelompok
cluster lainnya, jarak terjauh kedua adalah pada pengelompokkan 3 cluster.
Sehingga dibentuk pengelompokkan 2 cluster dengan metode K-Means Cluster,
namun setelah dibentuk 2 cluster terdapat kesulitan untuk memberi nama cluster
karena dilihat dari cluster membership pengelompokkan yang dihasilkan masih
belum spesifik. Sehingga dilakukan percobaan kedua dengan membentuk
pengelompokkan menjadi 3 cluster, diperoleh pengelompokkan data dengan
spesifikasi yang lebih jelas dibandingkan 2 cluster. Pada akhirnya dibentuklah 3
cluster dengan cluster 1 adalah tertanggung dengan nilai survival rata-rata yang
tertinggi kedua pada setiap t, cluster 2 adalah tertanggung dengan nilai survival
rata-rata yang tertinggi pada setiap t dan cluster 3 adalah tertanggung dengan
nilai survival rata-rata yang terendah pada setiap t.
36
Cluster 1 diberi nama kelompok dengan pengajuan waktu klaim sedang,
cluster 2 diberi nama kelompok tertanggung dengan pengajuan waktu klaim
terpanjang, dan cluster 3 diberi nama kelompok tertanggung dengan pengajuan
waktu klaim terpendek. Keanggotaan masing-masing cluster dapat dilihat pada
lampiran 7.
Kelompok tertanggung dengan pengajuan waktu klaim terpanjang
mempunyai nilai probabilitas survival 90.32% untuk waktu satu tahun pertama,
artinya sampai waktu satu tahun pertama terdapat kemungkinan 9.68% dari
jumlah tertanggung yang terjadi event, sehingga jika terdapat 100 tertanggung,
hanya 10 tertanggung yang berkemungkinan mengajukkan klaim asuransi. Dan
sampai waktu dua tahun pertama terdapat 85.26% tertanggung yang survive atau
tidak terjadi event. Sehingga jika pada tahun pertama sudah terjadi 10 tertanggung
yang terjadi event, tahun ke dua hanya terdapat 5 tertanggung yang
berkemungkinan terjadi event.
Kelompok tertanggung dengan pengajuan waktu klaim sedang mempunyai
nilai probabilitas survival 51.17% untuk waktu delapan bulan pertama, artinya
sampai waktu delapan bulan pertama terdapat kemungkinan hampir 50% atau
tepatnya 48.83% dari tertanggung yang ada akan mengajukan klaim, sehingga jika
terdapat 100 tertanggung, ada 49 tertanggung yang berkemungkinan mengajukkan
klaim asuransi. Dan sampai waktu dua tahun pertama terdapat kemungkinan
26.88% tertanggung yang survive atau tidak terjadi event. Sehingga jika pada
tahun pertama sudah terjadi 49 tertanggung yang mengajukan klaim, pada tahun
ke dua terdapat 24 tertanggung yang berkemungkinan mengajukan klaim.
37
Dan untuk kelompok tertanggung dengan pengajuan waktu klaim
terpendek mempunyai nilai probabilitas survival 50.35% dalam waktu tiga bulan
pertama, artinya sampai waktu tiga bulan pertama sudah terdapat kemungkinan
50% atau tepatnya 49.65% dari jumlah tertanggung yang akan mengajukan klaim,
sehingga jika terdapat 100 tertanggung, ada 50 tertanggung yang berkemungkinan
mengajukkan klaim asuransi. Dan sampai waktu satu tahun pertama hanya
mencapai kemungkinan sekitar 1% tertanggung yang survive atau tidak terjadi
event. Sehingga pada tahun pertama saja kelompok tertanggung yang
dikhawatirkan hanya mempunyai 1 tertanggung yang survive atau tidak
mengajukan klaim (Lampiran 8).
38
BAB V
KESIMPULAN DAN SARAN
5.1. Kesimpulan
Terdapat tiga faktor yang berpengaruh signifikan terhadap model dengan
taraf nyata 5%, yaitu usia, kebiasaan merokok dan tiga variabel dummy medical
test, yaitu dummy 1 Standard, dummy 2 adalah penyakit ringan, dan dummy 3
adalah penyakit sedang.
Perbandingan hazard faktor-faktor antar karakteristik yang berbeda yang
dihasilkan adalah sebagai berikut:
1. Usia t+1 adalah 1.168 kali usia t,
2. Smoking adalah 2.407 kali unsmoking,
3. a. dummy 1 (Standard) adalah 0.038 kali penyakit berat,
b. dummy 2 (penyakti ringan) adalah 0.122 kali penyakit berat, dan
c. dummy 3 (penyakti ringan) adalah 0.123 kali penyakit berat.
Pada grafik fungsi survival pada lampiran 8 terlihat bahwa ke tiga cluster
mengalami penurunan relatif drastis pada waktu 2 6t bulan pertama
dibanding pada waktu t lainnya. Sehingga perlu diperhatikan lagi untuk konsumen
yang baru akan mengajukan perjanjian asuransi dengan karakteristiknya apakah
akan termasuk tertanggung dengan pengajuan waktu klaim terpendek, sedang atau
termasuk tertanggung dengan pengajuan waktu klaim terpanjang. Hal ini berguna
agar perusahaan tidak mengalami kemunduran karena banyaknya tertanggung
yang mengajukan klaim di awal-awal waktu.
39
5.2. Saran
Penelitian selanjutnya dapat menambahkan faktor-faktor lain yang diduga
berpengaruh terhadap terjadinya pengajuan klaim tertanggung, misalnya jenis
pekerjaan, pembagian wilayah (urban, suburban dan plural) dan lainnya, serta
dapat membahas analisis residual untuk membuktikan ketepatan estimasi dari
model tersebut.
40
DAFTAR PUSTAKA
[1] Morton, G. Principles of Life and Health Insurance. LOMA. 1999.
[2] Walpole, R. E. Pengantar Statistik. Jakarta: Gramedia Pustaka Utama.
1995.
[3] Muthma’inna. Perbandingan Model Cox Proportional Hazard
Berdasarkan Analisis Residual (Studi Kasus pada Data Kanker Paru-paru
yang Diperoleh dari Contoh Data pada Software S-PLUS 2000 dan
Stimulasi untuk Distribusi Eksponensial dan Weibull). Jakarta: Skripsi
UIN Syarif Hidayatullah Jakarta. 2007.
[4] Dobson, Annette. J. An introduction to generalized linear models. CRC.
New York. 2002.
[5] Kleinbaum, D. G. dan Klein, M. Survival analysis a self-learning text.
Spinger. New York. 2005.
[6] Klein, J. P. dan Moeschberger, M. L. Survival Analysis Techniques for
Censored and Truncated Data. Spinger. New York. 1997.
[7] Sharma Subhash. Applied Multivariate Techniques. John Wiley & Sons,
Inc. USA. 1996.
[8] Richard, A. Johnson. Applied Multivariate Statistical Analysis. New
Jersey.
[9] Agresti, A. An Introduction to Categorical Data Analysis. John Wiley &
Sons, Inc. New York. 1996.
[10] Mathews, H. John. Numerical Methods for Mathetatics Science, and
Engineering. Prentice Hall, Inc. New Jersey. 1992.
-----------------------------------------------------------
Nama : Afief Aryadhani
NIM : 107094000260
Tempat Tanggal Lahir : Jakarta, 30 Maret 1989
Alamat Rumah : Jl. K.H. Dewantoro. Komp Depkes Blok C2/2.
Ciputat. Tangsel
Hp : 081514170930
Email : [email protected]
Jenis Kelamin : Laki-laki
-----------------------------------------------------------
1. S1 : Program Studi Matematika Fakultas Sains dan Teknologi
Universitas Islam Negeri Syarif Hidayatullah Jakarta, Tahun 2007-
2011
2. SMA : SMA Negeri 1 Ciputat, Tahun 2004-2007
3. SMP : SMP Negeri 2 Ciputat, Tahun 2001-2004
4. SD : SD Negeri 4 Ciputat, Tahun 1995-2001
5. TK : TK An-Nur, Tahun 1994-1995
Data Pribadi
Riwayat Pendidikan
DAFTAR RIWAYAT HIDUP
41
Lampiran 1
Iterasi Newton-Raphson
Untuk fungsi kemungkinan 1 2( , ,..., ) ( )iL L , di mana ( )L atau log ( )L
mencapai maksimum dan memenuhi persamaan:
log ( )
( ) 0i
i
LU
, 1,2,...,i k
Misal ( )U merupakan turunan pertama dari fungsi log-likelihood untuk menduga
parameter . Misalkan 0 merupakan dugaan untuk , kemudian dilakukan
ekspansi deret Taylor pada 0 , menghasilkan:
0 0 0( ) ( ) ( )( )U U G
Dengan ( )G merupakan turunan kedua dari fungsi log-likelihood, yaitu:
2 log ( )
( )ij
i j
LG
Karena memenuhi ( ) 0U , sehingga parameter pada iterasi ke (i+1) adalah:
1
1 ( ) ( )i i i iG u
, 1,2,...,i k
Prosedur iterasi dimulai dengan memperoleh dugaan awal 0 0 , kemudian
menghitung 0( )U dan 0( )G untuk memperoleh dugaan 1 dari
1
1 0 0 0( ) ( )G u , dan berhenti ketika perubahan fungsi log-likelihood relatif
kecil atau ketika ( )iU mendekati 0 [10].
42
Lampiran 2
Contoh Sebagian Data Analisis
No Usia Th 2009 Jumlah Rokok/Hari Jenis Kelamin Cek Medical Polis Data Klaim
1 15 0 L STD 5/12/2009 -
2 16 0 L STD 11/11/2009 -
3 16 0 L STD 8/19/2009 -
4 16 0 L STD 2/24/2009 -
5 17 0 L SS1 5/29/2009 -
6 17 0 P STD 1/30/2009 -
7 18 0 L STD 5/25/2009 -
8 18 0 L SS2 7/31/2009 -
9 19 0 P STD 3/6/2009 -
10 19 0 L STD 1/12/2009 -
11 19 0 P STD 6/18/2009 -
12 19 0 L STD 10/23/2009 -
13 19 0 L STD 8/31/2009 -
14 20 0 L STD 12/22/2009 -
15 20 0 L STD 1/5/2009 -
16 21 0 L STD 3/31/2009 -
17 21 8 L SS1 5/26/2009 -
18 21 0 L STD 1/21/2009 -
19 21 0 P STD 3/30/2009 -
20 21 0 P STD 3/30/2009 -
21 22 0 L SS1 5/24/2009 -
22 22 0 P STD 4/15/2009 -
23 22 0 L SS1 9/10/2009 -
24 23 0 P SS1 4/1/2009 -
25 23 0 P STD 7/27/2009 -
26 23 0 L SS1 6/29/2009 -
27 23 0 P STD 5/1/2009 -
28 23 0 P STD 5/1/2009 -
29 23 0 P STD 1/23/2009 -
30 23 0 P SS1 12/16/2009 -
31 23 0 L STD 1/5/2009 -
32 24 0 L SS1 6/26/2009 -
33 24 0 P STD 11/17/2009 -
34 24 0 P STD 3/25/2009 -
35 24 0 P STD 7/30/2009 -
36 24 0 P STD 12/7/2009 -
37 24 0 L STD 11/26/2009 -
38 24 0 P STD 4/30/2009 -
39 24 0 L STD 7/27/2009 -
40 … … … … … …
43
Lampiran 3
Deskripsi Variabel Usia
Case Processing Summary
1 0 1 100.0%
3 0 3 100.0%
2 0 2 100.0%
2 0 2 100.0%
5 0 5 100.0%
2 0 2 100.0%
5 0 5 100.0%
3 0 3 100.0%
8 0 8 100.0%
9 0 9 100.0%
3 0 3 100.0%
4 0 4 100.0%
10 0 10 100.0%
4 0 4 100.0%
9 0 9 100.0%
8 0 8 100.0%
7 0 7 100.0%
11 0 11 100.0%
7 0 7 100.0%
12 0 12 100.0%
16 0 16 100.0%
14 0 14 100.0%
17 0 17 100.0%
15 0 15 100.0%
14 0 14 100.0%
28 0 28 100.0%
24 0 24 100.0%
11 0 11 100.0%
17 0 17 100.0%
24 0 24 100.0%
8 0 8 100.0%
15 0 15 100.0%
13 0 13 100.0%
10 0 10 100.0%
5 0 5 100.0%
6 0 6 100.0%
40 0 40 100.0%
29 2 27 93.1%
51 0 51 100.0%
420 7 413 98.3%
455 2 453 99.6%
293 3 290 99.0%
219 5 214 97.7%
137 3 134 97.8%
102 1 101 99.0%
79 3 76 96.2%
15 0 15 100.0%
8 0 8 100.0%
2200 26 2174 98.8%
AGE_TH
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
Overall
Total N N of Events N Percent
Censored
44
Lampiran 4
Output Uji Kontribusi Peubah
Omnibus Tests of Model Coefficientsg,h
377.668 11.342 6 .078 12.750 6 .047 12.750 6 .047
377.669 11.342 5 .045 .001 1 .977 12.749 5 .026
380.239 6.823 2 .033 2.571 3 .463 10.178 2 .006
381.809 4.861 1 .027 1.570 1 .210 8.609 1 .003
378.730 9.589 4 .048 3.079 3 .380 11.688 4 .020
381.809 4.861 1 .027 3.079 3 .380 8.609 1 .003
Step
1a
2b
3c
4d
5e
6f
-2 Log
Likelihood Chi-square df Sig.
Overall (score)
Chi-square df Sig.
Change From Previous Step
Chi-square df Sig.
Change From Previous Block
Variable(s) Entered at Step Number 1: X1 X2 X3 X4a.
Variable Removed at Step Number 2: X2b.
Variable Removed at Step Number 3: X4c.
Variable Removed at Step Number 4: X3d.
Variable(s) Entered at Step Number 5: X4e.
Variable Removed at Step Number 6: X4f.
Beginning Block Number 0, initial Log Likelihood function: -2 Log likelihood: 390.418g.
Beginning Block Number 1. Method = Backward Stepwise (Likelihood Ratio)h.
Variables in the Equation
.155 .068 5.193 1 .023 1.168
.012 .405 .001 1 .977 1.012
.875 .773 1.284 1 .257 2.400
4.271 3 .234
-2.219 1.074 4.266 1 .039 .109
-2.100 1.098 3.657 1 .056 .122
-2.024 1.434 1.992 1 .158 .132
.155 .068 5.193 1 .023 1.168
.878 .766 1.314 1 .252 2.407
4.310 3 .230
-2.221 1.071 4.303 1 .038 .108
-2.102 1.096 3.678 1 .055 .122
-2.024 1.434 1.992 1 .158 .132
.148 .068 4.785 1 .029 1.159
1.068 .740 2.084 1 .149 2.911
.146 .068 4.613 1 .032 1.157
.157 .069 5.215 1 .022 1.170
5.547 3 .136
-2.454 1.043 5.541 1 .019 .086
-2.294 1.079 4.522 1 .033 .101
-2.228 1.418 2.467 1 .116 .108
.146 .068 4.613 1 .032 1.157
X1
X2
X3
X4
X4(1)
X4(2)
X4(3)
Step 1
X1
X3
X4
X4(1)
X4(2)
X4(3)
Step 2
X1
X3
Step 3
X1Step 4
X1
X4
X4(1)
X4(2)
X4(3)
Step 5
X1Step 6
B SE Wald df Sig. Exp(B)
45
Lampiran 5
Estimasi Fungsi Survival dan Cumulative Hazard
Time (t) Ŝ(t) Ĥ(t)
0≤t<2 1.00000 0.00000
2≤t<3 0.99955 0.00045
3≤t<4 0.99864 0.00136
4≤t<6 0.99773 0.00227
6≤t<7 0.99455 0.00546
7≤t<8 0.99409 0.00592
8≤t<10 0.99273 0.00729
10≤t<11 0.99227 0.00775
11≤t<14 0.99182 0.00821
14≤t<15 0.99136 0.00867
15≤t<16 0.99088 0.00915
16≤t<17 0.99036 0.00968
17≤t<18 0.98980 0.01025
18≤t<21 0.98919 0.01086
21≤t<22 0.98819 0.01187
22≤t<25 0.98696 0.01311
2520151050
SURVT
0.000
-0.005
-0.010
-0.015
-0.020
Lo
g S
urv
iva
l
Censored
Survival Function
Log Survival Function
2520151050
SURVT
0.020
0.015
0.010
0.005
0.000
Cu
m H
azard
Censored
Survival Function
Hazard Function
46
Lampiran 6
Dendogram
* * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
373
366
356
355
241
323
270
291
97
174
211
190
227
129
85
145
252
215
243
177
275
222
259
1
20
84
107
41
163
195
47
Lampiran 7
No. Cluster 3
No. Cluster 2
No. Cluster 1
Age Smoking Medical Test Age Smoking Medical Test Age Smoking Medical Test
1 32 Ya P.Berat 1 15 Tidak P.Berat 1 18 Ya P.Berat
2 33 Ya P.Berat 2 15 Tidak Standar 2 19 Ya P.Berat
3 34 Ya P.Berat 3 15 Tidak P.Ringan 3 20 Ya P.Berat
4 35 Ya P.Berat 4 15 Tidak P.Sedang 4 21 Ya P.Berat
5 36 Ya P.Berat 5 15 Ya P.Berat 5 22 Ya P.Berat
6 37 Tidak P.Berat 6 15 Ya Standar 6 23 Ya P.Berat
7 37 Ya P.Berat 7 15 Ya P.Ringan 7 24 Tidak P.Berat
8 38 Tidak P.Berat 8 15 Ya P.Sedang 8 24 Ya P.Berat
9 38 Ya P.Berat 9 16 Tidak P.Berat 9 25 Tidak P.Berat
10 39 Tidak P.Berat 10 16 Tidak Standar 10 25 Ya P.Berat
11 39 Ya P.Berat 11 16 Tidak P.Ringan 11 26 Tidak P.Berat
12 40 Tidak P.Berat 12 16 Tidak P.Sedang 12 26 Ya P.Berat
13 40 Ya P.Berat 13 16 Ya P.Berat 13 27 Tidak P.Berat
14 41 Tidak P.Berat 14 16 Ya Standar 14 27 Ya P.Berat
15 41 Ya P.Berat 15 16 Ya P.Ringan 15 28 Tidak P.Berat
16 42 Tidak P.Berat 16 16 Ya P.Sedang 16 28 Ya P.Berat
17 42 Ya P.Berat 17 17 Tidak P.Berat 17 29 Tidak P.Berat
18 43 Tidak P.Berat 18 17 Tidak Standar 18 29 Ya P.Berat
19 43 Ya P.Berat 19 17 Tidak P.Ringan 19 30 Tidak P.Berat
20 44 Tidak P.Berat 20 17 Tidak P.Sedang 20 30 Ya P.Berat
21 44 Ya P.Berat 21 17 Ya P.Berat 21 31 Tidak P.Berat
22 45 Tidak P.Berat 22 17 Ya Standar 22 31 Ya P.Berat
23 45 Ya P.Berat 23 17 Ya P.Ringan 23 31 Ya P.Sedang
48
No. Cluster 3
No. Cluster 2
No. Cluster 1
Age Smoking Medical Test Age Smoking Medical Test Age Smoking Medical Test
24 45 Ya P.Ringan 24 17 Ya P.Sedang 24 32 Tidak P.Berat
25 45 Ya P.Sedang 25 18 Tidak P.Berat 25 32 Ya P.Ringan
26 46 Tidak P.Berat 26 18 Tidak Standar 26 32 Ya P.Sedang
27 46 Ya P.Berat 27 18 Tidak P.Ringan 27 33 Tidak P.Berat
28 46 Ya Standar 28 18 Tidak P.Sedang 28 33 Ya Standar
29 46 Ya P.Ringan 29 18 Ya Standar 29 33 Ya P.Ringan
30 46 Ya P.Sedang 30 18 Ya P.Ringan 30 33 Ya P.Sedang
31 47 Tidak P.Berat 31 18 Ya P.Sedang 31 34 Tidak P.Berat
32 47 Ya P.Berat 32 19 Tidak P.Berat 32 34 Ya Standar
33 47 Ya Standar 33 19 Tidak Standar 33 34 Ya P.Ringan
34 47 Ya P.Ringan 34 19 Tidak P.Ringan 34 34 Ya P.Sedang
35 47 Ya P.Sedang 35 19 Tidak P.Sedang 35 35 Tidak P.Berat
36 48 Tidak P.Berat 36 19 Ya Standar 36 35 Ya Standar
37 48 Ya P.Berat 37 19 Ya P.Ringan 37 35 Ya P.Ringan
38 48 Ya Standar 38 19 Ya P.Sedang 38 35 Ya P.Sedang
39 48 Ya P.Ringan 39 20 Tidak P.Berat 39 36 Tidak P.Berat
40 48 Ya P.Sedang 40 20 Tidak Standar 40 36 Ya Standar
41 49 Tidak P.Berat 41 20 Tidak P.Ringan 41 36 Ya P.Ringan
42 49 Ya P.Berat 42 20 Tidak P.Sedang 42 36 Ya P.Sedang
43 49 Ya Standar 43 20 Ya Standar 43 37 Tidak P.Sedang
44 49 Ya P.Ringan 44 20 Ya P.Ringan 44 37 Ya Standar
45 49 Ya P.Sedang 45 20 Ya P.Sedang 45 37 Ya P.Ringan
46 50 Tidak P.Berat 46 21 Tidak P.Berat 46 37 Ya P.Sedang
47 50 Tidak P.Sedang 47 21 Tidak Standar 47 38 Tidak Standar
48 50 Ya P.Berat 48 21 Tidak P.Ringan 48 38 Tidak P.Ringan
49
No. Cluster 3
No. Cluster 2
No. Cluster 1
Age Smoking Medical Test Age Smoking Medical Test Age Smoking Medical Test
49 50 Ya Standar 49 21 Tidak P.Sedang 49 38 Tidak P.Sedang
50 50 Ya P.Ringan 50 21 Ya Standar 50 38 Ya Standar
51 50 Ya P.Sedang 51 21 Ya P.Ringan 51 38 Ya P.Ringan
52 51 Tidak P.Berat 52 21 Ya P.Sedang 52 38 Ya P.Sedang
53 51 Tidak P.Ringan 53 22 Tidak P.Berat 53 39 Tidak Standar
54 51 Tidak P.Sedang 54 22 Tidak Standar 54 39 Tidak P.Ringan
55 51 Ya P.Berat 55 22 Tidak P.Ringan 55 39 Tidak P.Sedang
56 51 Ya Standar 56 22 Tidak P.Sedang 56 39 Ya Standar
57 51 Ya P.Ringan 57 22 Ya Standar 57 39 Ya P.Ringan
58 51 Ya P.Sedang 58 22 Ya P.Ringan 58 39 Ya P.Sedang
59 52 Tidak P.Berat 59 22 Ya P.Sedang 59 40 Tidak Standar
60 52 Tidak Standar 60 23 Tidak P.Berat 60 40 Tidak P.Ringan
61 52 Tidak P.Ringan 61 23 Tidak Standar 61 40 Tidak P.Sedang
62 52 Tidak P.Sedang 62 23 Tidak P.Ringan 62 40 Ya Standar
63 52 Ya P.Berat 63 23 Tidak P.Sedang 63 40 Ya P.Ringan
64 52 Ya Standar 64 23 Ya Standar 64 40 Ya P.Sedang
65 52 Ya P.Ringan 65 23 Ya P.Ringan 65 41 Tidak Standar
66 52 Ya P.Sedang 66 23 Ya P.Sedang 66 41 Tidak P.Ringan
67 53 Tidak P.Berat 67 24 Tidak Standar 67 41 Tidak P.Sedang
68 53 Tidak Standar 68 24 Tidak P.Ringan 68 41 Ya Standar
69 53 Tidak P.Ringan 69 24 Tidak P.Sedang 69 41 Ya P.Ringan
70 53 Tidak P.Sedang 70 24 Ya Standar 70 41 Ya P.Sedang
71 53 Ya P.Berat 71 24 Ya P.Ringan 71 42 Tidak Standar
72 53 Ya Standar 72 24 Ya P.Sedang 72 42 Tidak P.Ringan
73 53 Ya P.Ringan 73 25 Tidak Standar 73 42 Tidak P.Sedang
50
No. Cluster 3
No. Cluster 2
No. Cluster 1
Age Smoking Medical Test Age Smoking Medical Test Age Smoking Medical Test
74 53 Ya P.Sedang 74 25 Tidak P.Ringan 74 42 Ya Standar
75 54 Tidak P.Berat 75 25 Tidak P.Sedang 75 42 Ya P.Ringan
76 54 Tidak Standar 76 25 Ya Standar 76 42 Ya P.Sedang
77 54 Tidak P.Ringan 77 25 Ya P.Ringan 77 43 Tidak Standar
78 54 Tidak P.Sedang 78 25 Ya P.Sedang 78 43 Tidak P.Ringan
79 54 Ya P.Berat 79 26 Tidak Standar 79 43 Tidak P.Sedang
80 54 Ya Standar 80 26 Tidak P.Ringan 80 43 Ya Standar
81 54 Ya P.Ringan 81 26 Tidak P.Sedang 81 43 Ya P.Ringan
82 54 Ya P.Sedang 82 26 Ya Standar 82 43 Ya P.Sedang
83 55 Tidak P.Berat 83 26 Ya P.Ringan 83 44 Tidak Standar
84 55 Tidak Standar 84 26 Ya P.Sedang 84 44 Tidak P.Ringan
85 55 Tidak P.Ringan 85 27 Tidak Standar 85 44 Tidak P.Sedang
86 55 Tidak P.Sedang 86 27 Tidak P.Ringan 86 44 Ya Standar
87 55 Ya P.Berat 87 27 Tidak P.Sedang 87 44 Ya P.Ringan
88 55 Ya Standar 88 27 Ya Standar 88 44 Ya P.Sedang
89 55 Ya P.Ringan 89 27 Ya P.Ringan 89 45 Tidak Standar
90 55 Ya P.Sedang 90 27 Ya P.Sedang 90 45 Tidak P.Ringan
91 56 Tidak P.Berat 91 28 Tidak Standar 91 45 Tidak P.Sedang
92 56 Tidak Standar 92 28 Tidak P.Ringan 92 45 Ya Standar
93 56 Tidak P.Ringan 93 28 Tidak P.Sedang 93 46 Tidak Standar
94 56 Tidak P.Sedang 94 28 Ya Standar 94 46 Tidak P.Ringan
95 56 Ya P.Berat 95 28 Ya P.Ringan 95 46 Tidak P.Sedang
96 56 Ya Standar 96 28 Ya P.Sedang 96 47 Tidak Standar
97 56 Ya P.Ringan 97 29 Tidak Standar 97 47 Tidak P.Ringan
98 56 Ya P.Sedang 98 29 Tidak P.Ringan 98 47 Tidak P.Sedang
51
No. Cluster 3
No. Cluster 2
No. Cluster 1
Age Smoking Medical Test Age Smoking Medical Test Age Smoking Medical Test
99 57 Tidak P.Berat 99 29 Tidak P.Sedang 99 48 Tidak Standar
100 57 Tidak Standar 100 29 Ya Standar 100 48 Tidak P.Ringan
101 57 Tidak P.Ringan 101 29 Ya P.Ringan 101 48 Tidak P.Sedang
102 57 Tidak P.Sedang 102 29 Ya P.Sedang 102 49 Tidak Standar
103 57 Ya P.Berat 103 30 Tidak Standar 103 49 Tidak P.Ringan
104 57 Ya Standar 104 30 Tidak P.Ringan 104 49 Tidak P.Sedang
105 57 Ya P.Ringan 105 30 Tidak P.Sedang 105 50 Tidak Standar
106 57 Ya P.Sedang 106 30 Ya Standar 106 50 Tidak P.Ringan
107 58 Tidak P.Berat 107 30 Ya P.Ringan 107 51 Tidak Standar
108 58 Tidak Standar 108 30 Ya P.Sedang
109 58 Tidak P.Ringan 109 31 Tidak Standar
110 58 Tidak P.Sedang 110 31 Tidak P.Ringan
111 58 Ya P.Berat 111 31 Tidak P.Sedang
112 58 Ya Standar 112 31 Ya Standar
113 58 Ya P.Ringan 113 31 Ya P.Ringan
114 58 Ya P.Sedang 114 32 Tidak Standar
115 59 Tidak P.Berat 115 32 Tidak P.Ringan
116 59 Tidak Standar 116 32 Tidak P.Sedang
117 59 Tidak P.Ringan 117 32 Ya Standar
118 59 Tidak P.Sedang 118 33 Tidak Standar
119 59 Ya P.Berat 119 33 Tidak P.Ringan
120 59 Ya Standar 120 33 Tidak P.Sedang
121 59 Ya P.Ringan 121 34 Tidak Standar
122 59 Ya P.Sedang 122 34 Tidak P.Ringan
123 60 Tidak P.Berat 123 34 Tidak P.Sedang
52
No. Cluster 3
No. Cluster 2
No. Cluster 1
Age Smoking Medical Test Age Smoking Medical Test Age Smoking Medical Test
124 60 Tidak Standar 124 35 Tidak Standar
125 60 Tidak P.Ringan 125 35 Tidak P.Ringan
126 60 Tidak P.Sedang 126 35 Tidak P.Sedang
127 60 Ya P.Berat 127 36 Tidak Standar
128 60 Ya Standar 128 36 Tidak P.Ringan
129 60 Ya P.Ringan 129 36 Tidak P.Sedang
130 60 Ya P.Sedang 130 37 Tidak Standar
131 61 Tidak P.Berat 131 37 Tidak P.Ringan
132 61 Tidak Standar
133 61 Tidak P.Ringan
134 61 Tidak P.Sedang
135 61 Ya P.Berat
136 61 Ya Standar
137 61 Ya P.Ringan
138 61 Ya P.Sedang
139 62 Tidak P.Berat
140 62 Tidak Standar
141 62 Tidak P.Ringan
142 62 Tidak P.Sedang
143 62 Ya P.Berat
144 62 Ya Standar
145 62 Ya P.Ringan
146 62 Ya P.Sedang
53
Lampiran 8
Estimasi Fungsi Survival pada Data Cluster