Cox Muthmainnah Fst

download Cox Muthmainnah Fst

of 90

description

regresi cox

Transcript of Cox Muthmainnah Fst

  • PERBANDINGAN MODEL COX PROPORTIONAL HAZARD

    DAN MODEL PARAMETRIK BERDASARKAN ANALISIS RESIDUAL

    (Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data

    pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan

    Weibull )

    Muthmainnah

    PROGRAM STUDI MATEMATIKA

    FAKULTAS SAINS DAN TEKNOLOGI

    UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

    JAKARTA

    2007 M/1428 H

    PERBANDINGAN MODEL COX PROPORTIONAL HAZARD

  • DAN MODEL PARAMETRIK BERDASARKAN ANALISIS RESIDUAL

    (Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data

    pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan

    Weibull )

    Skripsi

    Sebagai Salah Satu Syarat Untuk Memperoleh Gelar

    Sarjana Sains

    Fakultas Sains dan Teknologi

    Universitas Islam Negeri Syarif Hidayatullah Jakarta

    Oleh :

    MUTHMAINNAH

    103094029740

    PROGRAM STUDI MATEMATIKA

    FAKULTAS SAINS DAN TEKNOLOGI

    UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

    JAKARTA

    2007 M/1428 H

  • PERBANDINGAN MODEL COX PROPORTIONAL HAZARD

    DAN MODEL PARAMETRIK BERDASARKAN ANALISIS RESIDUAL

    (Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data pada

    Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan Weibull )

    Skripsi

    Sebagai Salah Satu Syarat Untuk Memperoleh Gelar

    Sarjana Sains

    Pada Fakultas Sains dan Teknologi

    Universitas Islam Negeri Syarif Hidayatullah Jakarta

    Oleh :

    Muthmainnah

    103094029740

    Menyetujui,

    Pembimbing I Pembimbing II

    Sarini Abdullah, M.Stats Sumainna, M.Si

    Mengetahui,

    Ketua Program Studi Matematika

    Nur Inayah, M.Si

    NIP. 150 326 911

  • PROGRAM STUDI MATEMATIKA

    FAKULTAS SAINS DAN TEKNOLOGI

    UIN SYARIF HIDAYATULLAH JAKARTA

    Dengan ini menyatakan bahwa skripsi yang ditulis oleh :

    Nama : Muthmainnah

    NIM : 103094029740

    Program Studi : Matematika

    Judul Skripsi : Perbandingan Model Cox Proportional Hazard dan Model

    Parametrik Berdasarkan Analisis Residual

    (Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari

    Contoh Data pada Software S-Plus 2000 dan Simulasi untuk

    Distribusi Eksponensial dan Weibull )

    Dapat diterima sebagai syarat kelulusan untuk memperoleh gelar Sarjana Sains pada

    Program Studi Matematika, Fakultas Sains dan Teknologi UIN Syarif Hidayatullah

    Jakarta.

    Jakarta, Agustus 2007

    Menyetujui,

    Pembimbing I Pembimbing II

    Sarini Abdullah, M.Stats Sumainna, M.Si

    Mengetahui,

    Dekan Fakultas Sains dan Teknologi Ketua Program Studi Matematika

    Dr. Syopiansyah Jaya Putra, M. Sis Nur Inayah, M.Si

    NIP. 150 317 956 NIP. 150 326 911

  • PENGESAHAN UJIAN

    Skripsi yang berjudul Perbandingan Model Cox Proportional Hazard dan Model

    Parametrik Berdasarkan Analisis Residual (Studi Kasus pada Data Kanker Paru-

    Paru yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi

    untuk Distribusi Eksponensial dan Weibull ) telah diuji dan dinyatakan lulus dalam

    sidang Munaqosah Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif

    Hidayatullah Jakarta pada hari Rabu, 29 Agustus 2007. Skripsi ini telah diterima

    sebagai salah satu syarat untuk memperoleh gelar sarjana strata satu (S1) pada Program

    Studi Matematika.

    Jakarta, Agustus 2007

    Tim Penguji,

    Penguji I Penguji II

    Hermawan Setiawan, M.Si Nur Inayah, M.Si

    NIP. 250 000 505 NIP. 150 326 911

    Mengetahui,

    Dekan Fakultas Sains dan Teknologi

    Dr. Syopiansyah Jaya Putra, M. Sis

    NIP. 150 317 956

  • PERNYATAAN

    DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-BENAR

    HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI

    SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI ATAU

    LEMBAGA MANAPUN.

    Jakarta, Agustus 2007

    Muthmainnah

    103094029740

  • Sesungguhnya dalam penciptaan langit dan bumi, dan silih bergantinya malam dan

    siang, terdapat tanda-tanda bagi orang-orang yang berakal.

    (Ali Imran : 190)

  • ABSTRACT

    Muthmainnah, Comparation Of Cox Propotional Hazard Model and Parametric Model Based On Residual Analyzes (Case Study : Lungs cancer data from S-Plus 2000 software example data and simulation for exponensial and weibull distribution) (Supervised by Sarini Abdullah, M.Stats dan Sumainna, M.Si) The Cox Propotional Hazard Model widely used in survival analyzes. It has more advantage than parametric model because it doesnt need functional form specification from baseline hazard function, and assumptions checked about distribution form that must be done in parametric model. Even tough it has easiness like mention above, but it doesnt mean that The Cox Proportional Hazard Model always better than parametric model. If the survival times distributions are known, than parametric model gives better result. It happens because from parametric models result some quantity calculation can be done, such as hazard or survival value for some observation with some characteristics. In this Final Project, Cox Proportional Hazard Model was compared with parametric model based on Cox-Snell, Martingale, deviance, normal deviate and log-odds residual types. Both models was compared using lungs cancer data that processed by S-Plus 2000 software. Simulation was used because getting conclusion cant be done using just one data set. Generally, if the distributions are known, than parametric model gives better result. For residual analyzes, normal-deviate and log-odds residual can be used to choosing matched model for some data. Key Words : Cox Proportional Hazard Model, Parametric Model, Residual

  • ABSTRAK

    Muthmainnah, Perbandingan Model Cox Proportional Hazard dan Model Parametrik Berdasarkan Analisis Residual (Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan Weibull) (Dibawah bimbingan Sarini Abdullah, M.Stats dan Sumainnah M.si)

    Model Cox proportional hazard dipergunakan secara luas dalam analisis survival. Model Cox proportional hazard ini mempunyai keuntungan lebih dari model parametrik karena tidak memerlukan spesifikasi bentuk fungsional dari fungsi baseline hazard dan juga tidak memerlukan pengecekan asumsi-asumsi mengenai kelayakan bentuk distribusi yang diharuskan pada model parametrik. Walaupun memiliki beberapa kemudahan seperti yang disebutkan di atas, akan tetapi model Cox proportional hazard tidak selalu lebih baik daripada model parametrik. Jika distribusi dari survival time diketahui, maka model parametrik memberikan hasil yang lebih baik. Hal ini karena dari hasil model parametrik dapat dilakukan perhitungan-perhitungan kuantitas tertentu, misalnya nilai hazard maupun survival untuk suatu observasi dengan karakteristik tertentu. Dalam Skripsi ini dilakukan perbandingan antara model Cox proportional hazard dan model parametrik berdasarkan beberapa tipe residual (Cox-Snell, Martingale, dan deviance), serta dua residual baru yaitu, normal-deviate dan log-odds. Perbandingan kedua model dilakukan dengan menggunakan data kanker paru-paru yang diolah dengan menggunakan software S-Plus 2000. Karena pengambilan kesimpulan tidak cukup hanya dengan menggunakan satu set data, maka dalam skripsi ini dilakukan simulasi. Secara umum, jika distribusinya diketahui maka model parametrik memberikan hasil yang lebih baik. Untuk analisis residualnya, residual normal-deviate dan residual log-odds odds dapat digunakan untuk pemilihan model yang cocok untuk suatu data.

    Kata kunci: Model Cox proportional hazard, model parametrik, residual

  • KATA PENGANTAR

    Segala puji dan syukur penulis haturkan ke hadirat Allah swt yang telah

    melimpahkan rahmat dan hidayah-Nya kepada penulis sehingga dapat menyelesaikan

    skripsi yang berjudul Perbandingan Model Cox Proportional Hazard dan Model

    Parametrik Berdasarkan Analisis Residual (Studi Kasus pada Data Kanker Paru-

    Paru yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi

    untuk Distribusi Eksponensial dan Weibull) dengan baik.

    Penulisan skripsi ini merupakan salah satu syarat kelulusan memperoleh gelar

    Sarjana Sains di Program Studi Matematika, Fakultas Sains dan Teknologi, Universitas

    Islam Negeri Syarif Hidayatullah Jakarta.

    Pada kesempatan ini penulis ingin mengucapkan terima kasih yang tak terhingga

    dan memberikan penghargaan yang sebesar-besarnya kepada:

    1. Bapak Dr. Syopiansyah Jaya Putra, M.Sis, Dekan Fakultas Sains dan Teknologi.

    2. Ibu Nur Inayah, M.Si, Ketua Program Studi Matematika. Terima kasih atas nasehat

    dan bimbingan selama penulis kuliah di Fakultas Sains dan Teknologi Program

    Studi Matematika.

    3. Ibu Sarini Abdullah, M.Stats selaku pembimbing I dan ibu Sumainna, M.Si selaku

    pembimbing II. Terima kasih atas bimbingan, pengertian, ilmu yang sangat

    bermanfaat dan waktu yang telah disisihkan demi selesainya skripsi ini.

    4. Seluruh dosen yang telah mengajarkan ilmu-ilmu yang bermanfaat bagi penulis.

  • 5. Bapak dan mama tercinta yang tak henti-hentinya memberikan doa dan semangat.

    Mas Ruri dan adik-adikku ( Arif dan Khatim ), Mbah kakung dan Mbah putri,

    Yayuk Susun, semua Om dan Tente. Sahabat-sahabatku yang paling setia dalam

    suka dan duka (cewek-cewek dan cowok-cowok centil: Dini Anggraini, Rina

    Yuanita, Yosy witasary, Zulfa Saida, Dennis Sugianto, Muhammad Iqbal, Rochdian

    Sandhi). Kake (Aji Kalimasada) yang selalu setia mendengarkan keluh kesah

    penulis. Teman-teman kos-kosan: (Mba Yenny, Mba Fahrah, Farrah, Dila, Ai, Gina,

    Rara, Nurul dan Arma). Teman-teman seperjuangan: (Citra anisa, Farida Yasmin,

    Mahmud Dzuldzalali, Muhammad Riyadi, Retno Rondiyahwati, Suparno, dan

    Zamzamiah). Teman-teman mahasiswa Matematika angkatan 2002, 2004-2006,

    serta seluruh pihak yang telah membantu terselesainya panulisan skripsi ini yang

    tidak dapat penulis sebutkan satu persatu.

    Penulis menyadari bahwa masih selalu ada langit di atas langit, dan begitu juga

    dengan skripsi ini yang penulis yakin masih bisa untuk disempurnakan dan

    dikembangkan lagi. Oleh karena itu, penulis membuka diri untuk saran dan kritik yang

    membangun. Dan akhir kata, penulis berharap mudah-mudahan skripsi ini memberikan

    manfaat bagi kita semua. Amin!

    Jakarta, Agustus 2007

    Penulis

  • DAFTAR ISI

    HALAMAN JUDUL

    LEMBAR PENGESAHAN

    ABSTRAK ...................................................................................................... i

    ABSTRACT .................................................................................................. ii

    KATA PENGANTAR .................................................................................... iii

    DAFTAR ISI .................................................................................................. v

    DAFTAR GAMBAR ...................................................................................... vii

    BAB I PENDAHULUAN ........................................................................... 1

    1.1 Latar Belakang .......................................................................... 1

    1.2 Perumusan Masalah .................................................................. 3

    1.3 Pembatasan Masalah ................................................................ 3

    1.4 Tujuan Penelitian ...................................................................... 3

    BAB II LANDASAN TEORI ...................................................................... 5

    2.1 Definisi Survival Time ............................................................... 5

    2.2 Jenis Data pada Analisis Survival .............................................. 8

    2.2.1 Data Tersensor .................................................................. 8

    2.2.2 Data Terpancung .............................................................. 9

    2.3 Model Cox proportional hazard ................................................ 10

    2.4 Model Parametrik ...................................................................... 12

    2.4.1 Distribusi Eksponensial .................................................... 13

  • 2.4.2 Distribusi Weibull ............................................................ 15

    2.5 Residual ..................................................................................... 16

    2.5.1 Residual Cox-Snell )( Cir .................................................. 16

    2.5.2 Residual Martingale )( Mir ............................................... 19

    2.5.3 Residual Deviance )( Dir ................................................... 20

    2.5.4 Residual Baru ................................................................... 20

    BAB III METODOLOGI ............................................................................... 28

    3.1 Pengumpulan Data ..................................................................... 28

    3.2 Pengolahan Data ........................................................................ 28

    3.3 Analisis Data ............................................................................. 29

    BAB IV ANALISIS HASIL ........................................................................... 31

    4.1 Data Kanker Paru-Paru .............................................................. 31

    4.2 Simulasi ..................................................................................... 42

    BAB V KESIMPULAN DAN SARAN ......................................................... 48

    5.1 Kesimpulan ................................................................................ 48

    5.2 Saran .......................................................................................... 49

    DAFTAR PUSTAKA ..................................................................................... 50

    LAMPIRAN ................................................................................................... 52

  • DAFTAR GAMBAR

    Gambar 3.1 Tahapan Pengolahan Data ................................................... 28

    Gambar 3.2 Tahapan Simulasi ................................................................ 29

    Gambar 4.1 Plot Residual Cox-Snell dan Residual Martingale Data Kanker

    Paru-Paru untuk Model Cox proportional hazard ................

    ...............................................................................................31

    Gambar 4.2 Plot Residual Deviance, Normal-deviate, dan Log-odds Data

    Kanker Paru-Paru untuk Model Cox proportional hazard ...

    ...............................................................................................32

    Gambar 4.3 Histogram Residual Cox-Snell dan Martingale Data Kanker

    Paru-Paru untuk Model Cox proportional hazard ................

    ...............................................................................................33

    Gambar 4.4 Histogram Residual Deviance, Normal-deviate, dan Log-odds

    Data Kanker Paru-Paru untuk Model Cox proportional hazard

    ...............................................................................................

    ...............................................................................................34

    Gambar 4.5 Plot Residual Cox-Snell, Martingale dan Deviance Data Kanker

    Paru-Paru untuk Model Parametrik ......................................

    ...............................................................................................35

  • Gambar 4.6 Plot Residual Log-odds dan Normal-deviante Data Kanker Paru-

    Paru untuk Model Parametrik................................................

    ...............................................................................................36

    Gambar 4.7 Histogram Residual Cox-Snell Model Eksponensial (atas) dan

    Model Weibull (bawah) Data Kanker Paru-Paru .................

    ...............................................................................................37

    Gambar 4.8 Histogram Residual Martingale Model Eksponensial (bawah)

    dan Model Weibull (atas) Data Kanker Paru-Paru ...............

    ...............................................................................................38

    Gambar 4.9 Histogram Residual Deviance Model Eksponensial (atas) dan

    Model Weibull (bawah) Data Kanker Paru-Paru .................

    ...............................................................................................39

    Gambar 4.10 Histogram Residual Normal-deviate Model Eksponensial (atas)

    dan Model Weibull (bawah) Data Kanker Paru-Paru ...........

    ...............................................................................................40

    Gambar 4.11 Histogram Residual Log-odds Model Eksponensial (atas) dan

    Model Weibull (bawah) Data Kanker Paru-Paru .................

    ...............................................................................................41

    Gambar 4.12 Histogram dan QQ-Plot Residual Normal-deviate (atas) dan

    Residual Log-odds (bawah) Model Cox Proportional hazard dari

    Data yang Berdistribusi Eksponensial ..................................

    ...............................................................................................44

  • Gambar 4.13 Histogram dan QQ-Plot Residual Normal-deviate Model

    Eksponensial (atas) dan Model Weibull (bawah) dari Data yang

    Berdistribusi Eksponensial ...................................................

    ...............................................................................................45

    Gambar 4.14 Histogram dan QQ-Plot Residual Log-odds Model Eksponensial

    (atas) dan Model Weibull (bawah) dari Data yang Berdistribusi

    Eksponensial .........................................................................

    ...............................................................................................46

    Gambar 4.15 Histogram Model Eksponensial dan Model Weibull dari Data

    yang Berdistribusi Weibull dengan 40% Data Tersensor Kanan

    ...............................................................................................

    ...............................................................................................47

  • BAB I

    PENDAHULUAN

    1.1 Latar Belakang

    Model Cox proportional hazard digunakan secara luas dalam analisis survival.

    Model Cox proportional hazard ini mempunyai keuntungan lebih dari model

    parametrik karena tidak memerlukan spesifikasi bentuk fungsional dari fungsi

    baseline hazard dan juga tidak memerlukan pengecekan asumsi-asumsi mengenai

    kelayakan bentuk distribusi yang diharuskan pada model parametrik.

    Walaupun memiliki beberapa kemudahan seperti yang disebutkan di atas, akan

    tetapi model Cox proportional hazard tidak selalu lebih baik daripada model

    parametrik. Jika distribusi dari survival time diketahui, maka model parametrik

    memberikan hasil yang lebih baik. Hal ini karena dari hasil model parametrik dapat

    dilakukan perhitungan-perhitungan kuantitas tertentu, misalnya nilai hazard maupun

    survival untuk suatu observasi dengan karakteristik tertentu.

    Berdasarkan pemaparan di atas, maka muncul suatu pertanyaan yaitu, model

    mana yang lebih baik (Cox proportional hazard dan parametrik) digunakan untuk

    memodelkan suatu data tertentu. Oleh karena itu pada skripsi ini akan dilakukan

    perbandingan model Cox proportional hazard dengan model parametrik.

    Perbandingan dilakukan pada suatu contoh data untuk melihat pada kondisi

    atau tipe data seperti apa model Cox proportional hazard lebih baik daripada model

    parametrik, dan sebaliknya.

  • Pengecekan residual sangat penting dalam penentuan ketepatan kecocokan

    model. Oleh karena itu, pada skripsi ini akan dibahas beberapa tipe residual untuk

    perbandingan. Dalam hal ini digunakan residual Cox-Snell, Martingale, deviance

    dan perhitungan residualnya. Selain itu akan digunakan residual baru yang

    diperkenalkan oleh Nardi dan Schemper, yaitu residual log-odds dan residual

    normal-deviate.

    Untuk menentukan residual yang terbaik dalam penentuan kecocokan model,

    maka beberapa tipe residual tersebut akan diterapkan pada suatu data. Akan tetapi

    satu set data tidak cukup untuk membuat kesimpulan atau menggeneralisasi hasil

    perbandingan model Cox proportional hazard dengan model parametrik. Hal ini

    karena setiap set data bergantung pada sifat dasar penelitian yang dilakukan. Oleh

    karena itu, diperlukan suatu simulasi dengan menggunakan data yang dihasilkan

    dari pembangkit angka acak pada Software S-plus 2000 dan dilakukan perbandingan

    model untuk angka acak tersebut. Harapan dari simulasi ini adalah kejelasan

    perbedaan antara model Cox proportional hazard dan model parametrik dapat

    tercapai.

    1.2 Perumusan Masalah

    Perumusan masalah dalam penulisan skripsi ini adalah :

  • a. Bagaimana perbandingan antara model Cox proportional hazard dengan

    model parametrik?

    b. Bagaimana simulasi dalam pembentukan model Cox proportional hazard dan

    parametrik?

    c. Residual apa yang terbaik dalam menentukan model yang cocok untuk suatu

    data?

    1.3 Pembatasan Masalah

    Dalam skripsi ini model yang dianalisis adalah model Cox proportional

    hazard dan model parametrik. Untuk model parametrik dibatasi, yaitu hanya model

    eksponensial dan model Weibull.

    Jenis data pada skripsi ini pun dibatasi, yaitu hanya data tersensor tipe I (data

    tersensor kanan).

    1.4 Tujuan Penelitian

    Adapun tujuan dari penulisan skripsi ini adalah

    a. Membandingkan model Cox proportional hazard dengan model parametrik

    berdasarkan beberapa jenis residual (residual Cox-Snell, Martingale, deviance,

    normal-deviate, dan log-odds).

    b. Melakukan simulasi dalam pembentukan model Cox proportional hazard dan

    parametrik.

  • c. Menentukan jenis residual yang terbaik dalam menentukan model yang cocok

    untuk suatu data berdasarkan hasil simulasi.

  • BAB II

    LANDASAN TEORI

    2.1 Definisi Survival Time

    Survival time adalah waktu untuk kejadian pada suatu peristiwa yang telah

    dirumuskan dengan baik [1]. Metode ini adalah dasar pengembangan dalam ilmu-

    ilmu kedokteran dan biologi. Metode ini juga digunakan secara luas dalam ilmu-

    ilmu sosial dan ekonomi. Selain itu metode ini juga dapat diterapkan dengan baik

    dalam bidang teknik (analisis reliability dan failure time).

    Secara umum, aplikasi survival time dalam suatu pengamatan dapat dijelaskan

    melalui disrtibusi dari survival time.

    Misalkan T > 0 adalah peubah acak yang menggambarkan survival time, dan t

    menggambarkan suatu titik waktu dalam range T, maka ada beberapa cara untuk

    menentukan distribusi peluang dari T. Di antaranya yang berguna dalam aplikasi

    survival time adalah :

    a. Fungsi Kepadatan Peluang ( pdf )

    Fungsi f disebut fungsi kepadatan peluang bagi peubah acak kontinu X

    bila memenuhi sifat-sifat berikut ini:

    1) 0)( xf untuk semua Rx

    2)

    = 1)( dxxf

    3) =

  • Sedangkan fungsi distribusi kumulatif dari T adalah:

    == t duuft0

    )()P(TF(T) , untuk T peubah acak.

    b. Fungsi Survival

    Fungsi survival S(t) didefinisikan sebagai berikut :

    )()( tTPtS >= . (2.1) Fungsi ini menyatakan bahwa suatu pengamatan dilakukan terhadap individu

    yang masih bertahan hingga waktu t [11].

    Berdasarkan definisi (2.1) dan juga bahwa

    )()( tTPtF = , (2.2) maka didapat hubungan

    )(1)(1)( tFtTPtS == . (2.3) Selain itu dapat diperoleh hubungan

    )(')()( tSdt

    tdStf == . (2.4)

    Hal ini dapat ditunjukkan sebagai berikut :

    ttTPttTP

    ttFttF

    dttdFtf

    tt +=

    +== )()(lim)()(lim)()(

    00

    ttSttS

    ttSttS

    tt +=

    += )]()([lim)](1[)](1[lim

    00

    )(')( tSdt

    tdS == . (2.5)

    c. Fungsi Hazard

  • Fungsi Hazard h(t) didefinisikan sebagai :

    )(th = t

    tTttTtPt

    +

  • 2.2.1 Data Tersensor

    Data tersensor adalah data yang telah mengalami penyensoran.

    Penyensoran terjadi jika tidak dapat diketahui secara pasti waktu terjadinya

    suatu kejadian. Ada beberapa hal yang menyebabkan penyensoran terjadi,

    antara lain jika kejadian yang hendak diamati tersebut belum berlangsung

    hingga batas waktu pengamatan berakhir.

    Data tersensor terdiri dari dua jenis, yaitu :

    a. Data Tersensor Tipe I

    Data tersensor tipe I ini disebut juga data tersensor kanan karena

    failure time ke kanan missing.

    Data tersensor kanan adalah tipe data yang umum dalam analisis

    survival. Penyensoran dilakukan ketika hanya diketahui bahwa survival

    time melebihi sebuah nilai tertentu [11]. Sebagai contoh, penelitian

    kematian karena kanker selama lima tahun. Survival time akan melakukan

    penyensoran kanan pada pasien yang:

    Masih hidup pada akhir periode lima tahun. Mengalami penurunan atau menjadi hilang untuk tindakan selanjutnya

    selama penelitian.

    Meninggal karena beberapa penyebab lain selama penelitian.

    b. Data Tersensor Tipe II

    Data tersensor tipe II ini disebut juga data tersensor kiri . Data

    tersensor kiri adalah data yang mengalami penyensoran pada waktu

  • sekarang ketika kejadian yang diamati telah terjadi pada saat seseorang

    masuk dalam penelitian [11]. Karena itu hanya diketahui bahwa waktu

    kejadian adalah kurang dari suatu nilai tertentu. Sebagai contoh, pada

    penelitian balita yang mampu berjalan pada usia satu tahun. Maka balita

    yang telah mampu berjalan sebelum usia satu tahunlah yang masuk dalam

    penelitian.

    2.2.2 Data Terpancung

    Data tepancung adalah data yang telah mengalami pemancungan.

    Pemancungan merupakan suatu cara dalam menentukan apakah seseorang

    akan diikutsertakan atau tidak dalam pengamatan.

    Data terpancung terdiri dari dua jenis, yaitu :

    a. Data Terpancung kiri

    Pada data terpancung kiri, pemancungan terjadi ketika seseorang

    yang belum mengalami kejadian yang diamati termasuk dalam penelitian

    (atau secara bersamaan, ketika seseorang yang telah mengalami kejadian

    telah keluar pada awal penelitian) [11].

    Sebagai contoh, pada suatu penelitian angka kematian berdasarkan

    observasi pada suatu populasi dengan batas waktu tertentu. Hanya orang-

    orang yang hidup pada awal penelitianlah yang masuk dalam penelitian,

    karena penelitian angka kematian bergantung pada peserta yang masih

    hidup pada awal penelitian.

  • b. Data Terpancung kanan

    Pada data terpancung kanan, pemancungan terjadi ketika seseorang

    yang telah mengalami kejadian yang diamati masuk dalam penelitian (atau

    secara bersamaan, ketika seseorang yang belum mengalami kejadian telah

    keluar dengan berakhirnya penelitian) [11].

    Sebagai contoh, pada penelitian angka kematian berdasarkan riwayat

    kematian. Hanya orang-orang yang meninggal, dengan berakhirnya

    penelitian yang akan masuk.

    Dari beberapa jenis data yang ada pada analisis survival di atas, dalam skripsi

    ini data yang digunakan adalah data tersensor tipe I (penyensoran kanan) karena tipe

    ini yang paling sederhana dan tidak rumit.

    2.3 Model Cox proportional hazard

    Model Cox proportional hazard digunakan secara luas dalam analisis survival.

    Model Cox proportional hazard ini mempunyai keuntungan lebih dari model

    parametrik karena tidak memerlukan spesifikasi bentuk fungsional dari fungsi

    baseline hazard dan juga tidak memerlukan pengecekan asumsi-asumsi mengenai

    kelayakan bentuk distribusi yang diharuskan pada model parametrik.

    Model proportional hazard dapat ditulis:

    pp XXXX ethethXth +++== ...00_

    2211'

    _

    )()(),( (2.9)

    dengan ),...,,( 21_

    pXXXX = adalah vektor yang berisi p kovariat.

  • ),...,,( 21 p = adalah vektor pada parameter regresi.

    h0(t) adalah sebuah peubah baseline hazard yang menggambarkan model hazard

    ketika semua kovariatnya nol.

    Model Cox dikatakan proporsional karena tidak bergantung pada waktu, hanya

    bergantung pada kovariat-kovariatnya.

    Berdasarkan persamaan (2.8), maka fungsi survival dari model Cox

    proportional hazard adalah:

    )),(exp(),( xtHxtS = (2.10)

    dengan

    = t duuhxtH0

    )(),( ,

    maka

    ))'exp()(exp(),(0

    _

    0=t

    duxuhxtS . (2.11)

    Berdasarkan persamaan (2.6), maka :

    ),(),(),( xtSxthxtf = . (2.12) Fungsi survival dapat digambarkan dalam cara yang lain. Berdasarkan

    persamaan (2.11), karena variabelnya adalah u maka )'exp( x dapat dikeluarkan. Sehingga menjadi :

    S(t,x) = exp)'exp(

    00

    00

    _

    _

    )(exp)()'exp(

    xtt

    duuhduuhx

    =

    (2.13)

    dengan

  • = t duuhxtS0

    00 )(exp),( ,

    maka

    )'exp(0

    _

    ),(),( xxtSxtS = (2.14)

    dengan S 0 (t,x) adalah sebuah fungsi survival saat semua kovariat bernilai nol.

    2.4 Model Parametrik

    Walaupun model parametrik tidak mempunyai kemudahan seperti pada model

    Cox proportional hazard karena memerlukan pengecekan terhadap asumsi-asumsi,

    akan tetapi hasil yang diperoleh dari model paremetrik lebih baik.

    Pada beberapa keadaan, Efron dan Oakes menunjukan bahwa nilai parameter

    pada model parametrik lebih tepatguna daripada hasil model Cox proportional

    hazard [6].

    Dalam skripsi ini dilakukan perbandingan antara model Cox proportional

    hazard dengan dua model parametrik, yaitu model eksponensial dan model

    Weibull..

    2.4.1 Distribusi Eksponensial

    Dalam teori peluang dan statistik, distribusi eksponensial termasuk

    distribusi yang kontinu. Distribusi eksponensial sering digunakan untuk model

    waktu antara kejadian-kejadian bebas yang terjadi pada nilai rata-rata konstan

    [10].

    Distribusi eksponensial mempunyai satu parameter dan fungsi hazardnya selalu konstan.

  • 1lim

    0

    2

    = u

    t

    udtet

    .1

    110lim

    1lim

    lim

    1lim

    0

    0

    0

    0

    =

    =

    =

    +=

    +=

    ee

    ete

    dtete

    dteet

    u

    u

    utt

    u

    utt

    u

    utt

    u

    Fungsi kepadatan peluang (pdf) dari distribusi eksponensial adalah:

    0,0,)( >= tetf t . (2.15) Sifat-sifat distribusi eksponensial:

    1) E(T) = =u

    t

    udtet

    0

    1lim .

    Bukti:

    dtetdtetTE tu u

    u

    t

    u

    ==0 0

    limlim)(

    2) Var(T) = E(T 2 ) (E(T)) 2 = 21 .

    Bukti:

    == u

    t

    udtetTETETVar

    02

    222 1lim))(()()(

    121lim

    0

    2

    +=

    utt

    utdteet

    12lim

    0

    2

    +=

    utt

    udtteet

  • = u

    tt

    ue

    1lim

    u

    tt

    ue

    = lim

    tu

    uee += lim

    te =

    )()()()(

    tTPtSee

    e tt

    tt

    >==== +

    .1120

    12lim

    222

    222

    =+=

    += t

    uet

    3) tu

    t

    t

    uedtetS == lim)( .

    Bukti:

    dtedtetSu

    t

    t

    u

    u

    t

    t

    u == limlim)(

    .

    4) ===

    t

    t

    ee

    tStfth)()()( , nilai hazard konstan.

    5) P(T > t + )()| tTPtTt >=> , sifat ini disebut memoryless property. Bukti:

    P(T>t+)(

    )()(

    )()(

    ),()|tS

    ttStTP

    ttTPtTP

    tTttTPtTt +=>+>=>

    >+>=>

    .

    2.4.2 Distribusi Weibull

    Distribusi Weibull adalah generalisasi dari distribusi eksponensial. Pada

    distribusi eksponensial nilai hazardnya adalah konstan. Hal ini sering kali

  • tidak sesuai dengan keadaan sebenarnya. Akan tetapi pada distribusi Weibull

    nilai hazardnya tidak konstan. Oleh karena itu distribusi Weibull lebih

    mendekati pada keadaan sebenarnya.

    Distribusi Weibull mempunyai dua parameter, yaitu dan . Fungsi kepadatan peluang (pdf) dari distribusi Weibull adalah:

    =)(tf ( ])(exp[) 1 tt ; ,0,0,0 >>> t (2.16) dan fungsi survival dari distribusi Weibull adalah:

    ])(exp[)( ttS = . (2.17) Fungsi hazard dari distribusi Weibull adalah:

    1)()( = tth . (2.18) Jika 1> maka )(th monoton naik, 1= maka )(th konstan dan jika 1 , konstan seperti halnya pada distribusi eksponensial jika 1= , dan menurun pada 1

  • )()'exp( 0^^

    ii tHx=

    )(^

    iiCi tHr = . (2.19)

    Residual ini sangat luas penggunaannya dalam analisis data survival.

    Residual Cox-Snell mempunyai beberapa sifat, yaitu :

    a. Tidak simetri.

    b. berdistribusi mendekati nol.

    c. tidak bernilai negatif.

    d. Mempunyai distribusi dengan kemiringan yang tinggi, karena residual

    Cox-snell berdistribusi eksponensial ketika pencocokan model benar dan

    juga mean dan variansnya satu.

    Misalkan dibentuk fungsi hazard dengan subjek i, i=1, 2,,n seperti di

    bawah ini:

    ^^'exp()( =thi xi) )(0^ th (2.20)

    dengan

    ^' ix =

    ^

    1 +ix1^

    2 +ix2 ^

    p pix ,

    dan hazard kumulatif :

    === ttt iii duuhxduuhxduuhtH0

    0

    ^

    1

    ^

    0

    ^

    10

    ^

    0

    ^^)()'exp()()'exp()()(

    . (2.21)

    Berdasarkan (2.19) dan (2.20) diperoleh residual Cox-Snell pada model Cox

    Proportional hazard untuk subjek ke-i dan waktu it adalah :

    exp=Cir^'( xi) )(0^ itH (2.22)

  • dengan )(0^

    itH adalah estimasi dari baseline fungsi hazard kumulatif pada

    waktu it .

    Pada analisis parametrik, model failure time lebih dikenal sebagai

    accelerated model. Accelerated model untuk iT adalah:

    ipipiii xxxT +++++= ...log 2211 ; ni ,...,2,1= , (2.23) dengan

    n = jumlah data

    i = peubah acak dengan distribusi probabilitas yang sama

    iTlog = variabel dependen

    , , j = parameter tidak diketahui dengan pj ,...,2,1= Tpiii xxx ),...,( 1= =

    variabel penjelas.

    Untuk model parametrik, residual Cox-Snell didefinisikan sama dengan

    residual Cox-snell pada model Cox proportional hazard, yaitu:

    )(log)(^^

    iiiiCi tStHr == , (2.24)

    dengan

    +== ^^

    2

    ^

    21

    ^

    1

    ^^^^ ...log

    )()(

    pipiiisiii

    xxxtSrStS .

    Keterangan:

    )(iS = fungsi survival dari i pada model parametrik

    ^

    j = koefisien estimasi dari jix

  • ^^, = nilai estimasi dari dan .

    Pada model Weibull, fungsi survival adalah :

    )exp()()( sii

    rsii erStS == . (2.25)

    Untuk model eksponensial, fungsi survival sama seperti pada model

    Weibull dengan skala parameter ditentukan 1. Jika model yang digunakan sesuai dengan data, maka residual Cox-

    Snell akan berdistribusi eksponensial dengan mean satu. Dengan demikian,

    maka residual Cox-Snell dapat digunakan untuk mengecek keberhasilan model

    dengan memeriksa plot dari Cir dengan hazard kumulatif dari Cir . Jika model

    yang digunakan sesuai, maka plot akan menjadi garis lurus melewati titik asal

    serta melandai.

    2.5.2 Residual Martingale )( Mir

    Residual Martingale didefinisikan sebagai:

    CiiMi rr = , (2.26) dengan

    =

    tersensordatauntuktersensortidakdatauntuk

    i 01

    ni ,....,2,1= dan Cir adalah residual Cox-Snell.

    Range residual Martingale antara dan satu, dan negatif pada data yang tersensor. Residual Martingale dapat menjadi gambaran mengenai

    perbedaan antara hasil pengamatan )( i dengan angka prediksi pada kejadian-

  • kejadian )( Cir . Ketika perbedaan antara hasil pengamatan dengan angka

    prediksi untuk subjek ke-i cukup besar, itu menunjukan bahwa subjek ke-i

    tidak akan cocok dengan model dan mengakibatkan suatu nilai yang besar

    pada Mir . Karena range dari Cir adalah (0, ), dan i hanya bernilai 0 atau 1, itu menerangkan bahwa residual Martingale bernilai ( )1, dan kesimetrisan dari distribusi residual martingale mendekati nol.

    Sifat-sifat residual Martingale adalah:

    1) 0)( =MirE .

    2) Cov 0),( =MjMi rr pada sampel besar.

    2.5.3 Residual Deviance )( Dir

    Residual deviance adalah modifikasi dari residual Martingale. Residual

    deviance didefinisiskan sebagai berikut :

    { }[ ]21)log(2)sgn( MiiiMiMiDi rrrr += , (2.27) dengan )sgn( Mir adalah tanda dari residual Martingale dan i adalah variabel indicator.

    Residual Martingale dikenal sebagai suatu usaha untuk mendapatkan

    residual Martingale yang simetris mendekati nol dengan menyusutkan residual

    Martingale kedalam range )0,( terhadap nol dan memperluasnya kedalam range (0, 1) terhadap + .

  • 2.5.4 Residual Baru

    Menurut Nardi dan Schemper, prediksi survival model cox pada subjek i

    = 1,2,,n dikatakan sempurna jika 5,0)(^ =ii tS dan terprediksi benar jika

    m

    ii tt^ , dengan it adalah pengamatan failuire time dan

    m

    it^

    sebuah estimasi

    median survival time [5]. Untuk mengukur residual dapat dilakukan dengan

    salah satu cara berikut:

    a) Menghitung perbedaan antara it dan m

    it^

    . Tetapi ini tidak dapat dilakukan

    pada kasus pengamatan yang tersensor karena pengamatan survival time it

    tidak dapat dihitung.

    b) Bandingkan )(^

    ii tS dengan 0,5.

    Oleh karena itu, hitung pusat residual pada median survival time m

    it^

    ,

    apakah pada m

    it^

    subjek ke-i akan gagal atau tidak. Jika survival melebihi

    m

    it^

    dapat dianggap sebagai variabel biner dan juga berdistribusi binomial

    dengan parameter ))(,1(^

    ii tS . Dengan transformasi logit atau probit, dapat

    didefinisikan dua tipe residual yaitu, residual log-odds dan residual normal-

    deviate.

  • Residual log-odds dan residual normal-deviate mempunyai sifat yang

    serupa dengan sifat-sifat residual pada umumnya, seperti :

    a) Residual akan menjadi nol untuk prediksi yang sempurna, jika )(^

    ii tS =0,5

    maka )( ii tL dan )( ii tN bernilai nol.

    b) Permulaan dari prediksi sempurna akan menunjukkan residual menjadi

    lebih besar pada nilai mutlak. Ini benar untuk )( ii tL dan )( ii tN yang

    mendekati )( ii tL , ketika 1)(^ ii tS dan ketika 0)(

    ^ ii tS .

    1) Residual Log-odds )( iL

    Residual log-odds didefinisikan sebagai :

    )(1)(

    log)(ii

    iiii tS

    tStL = (2.28)

    Anggap fungsi survival )(tS diketahui benar, iL diperkirakan

    berdistribusi logistik dengan mean nol dan varians 3

    2 .

    Bukti:

    Jika T peubah acak kontinu, maka )(1)( TStF = akan berdistribusi uniform pada interval (0, 1)

    Jika dimisalkan

    UTF =)( , maka

  • menjadi pdf dari U.

    Jika dimisalkan

    VTS =)( , maka

    UV = 1 .

    Jika dimisalkan }10{

  • ,1

    111

    1 11

    0 +==

    += +

    l

    e

    lS eds

    eG

    l

  • Pada kasus tersensor, salah satu )(^

    ii tS dapat diganti dengan nilai

    median atau mean. Jika digunakan median 2

    )(^

    cii tS maka iL mempunyai

    bentuk :

    )(2

    )(log ^

    ^

    cii

    ciim

    i

    tS

    tSl

    = . (2.31)

    Jika digunakan mean, maka iL berbentuk :

    ( )eiei

    ei

    ll

    lc

    ie

    i ee

    ell ++= 1log1 . (2.32)

    Bentuk mean didapatkan dengan penjelasan sebagai berikut:

    ( ) ( ) ( )( )cix

    y

    y

    lciii lF

    dye

    eyllLxLP

    ci

    +=

    2, 1)(

    | ,

    maka

    ( ) ( ) ( ) ( ) ( )

    ++=+==ci

    ci

    ci

    cil

    ll

    lcic

    ix

    x

    ci

    ciii

    ci e

    eel

    lFdx

    eex

    lFlLLEl 1log

    11

    11| 2

    ( )cici

    ci

    ll

    lci e

    eel ++= 1log1 .

    2) Residual Normal-deviate )( iN

    Residual normal-deviate didefinisikan sebagai :

  • = )(^1 iii tSN , (2.33)

    dengan adalah standar distribusi normal kumulatif. Anggap fungsi survival )(TS benar, iN diperkirakan sebuah standar

    distribusi normal.

    Bukti :

    Jika dimisalkan }10{

  • ( ) ( ) ( ) ( )

    ==x x

    cii

    y

    nciii

    ciii nNP

    dyeyldxnNxNfnNxNP

    ci

    2,

    2

    21)(

    ||

    ( ) ( )

    =x y

    nci

    dyeyln

    ci

    2,

    2

    21)(1

    Misalkan

    ( )( ) ( ) ( )cinx

    cii

    ciii

    nNN nxle

    nNfnNNfxf c

    iciii =

    =

    1)(

    21,)(

    ,2

    |

    2

    ;

    maka,

    ( ) ( )

    ===

    ci

    ciii

    nx

    ci

    nNNciii

    ci dxen

    xdxxxfnNNEn 2|

    2

    21)(|

    ( ) 2^22

    )(2

    12

    1 cici n

    cii

    n

    ci

    etS

    en

    ==

  • BAB III

    METODOLOGI

    3.1 Pengumpulan Data

    Dalam skripsi ini digunakan satu set data, yaitu data mengenai penderita

    kanker paru-paru yang diambil dari contoh data pada software S-plus 2000. Data

    tersebut dapat dilihat pada lampiran 1.

    3.2 Pengolahan Data

    Pengolahan data pada skripsi ini menggunakan software S-Plus 2000. Adapun

    tahapan pengolahan datanya adalah seperti pada gambar 3.1 dan tahapan

    simulasinya dapat dilihat pada gambar 3.2.

    Gambar 3.1 Tahapan Pengolahan Data

    Cox- PHEksponensialWeibull

    Model

    Evaluasi Model

    Plot Histogram

    Model terbaik

    Data

  • Gambar 3.2 Tahapan Simulasi

    3.3 Analisis Data

    Berdasarkan survival study dilakukan pencocokan antara model Cox

    proportional hazard dengan model parametrik (eksponensial dan Weibull) dengan

    menggunakan suatu set data yang telah diambil (data kanker paru-paru). Setelah itu

    dilakukan evaluasi model dengan beberapa residual, yaitu Cox-Snell, Martingale,

    deviance dan dua tipe residual baru, residual log-odds dan normal-deviate.

    Membangkitkan angka acak yang berdistribusi eksponensial dan Weibull

    Model Model

    Cox- PH Cox- PH Eksponensial Eksponensial Weibull Weibull

    Evaluasi Model

    Plot Histogram

    Model Terbaik

    Residual terbaik untuk pengecekan model

    Angka acak yang berdistribusi eksponensial

    Angka acak yang berdistribusi Weibull dengan 40% tersensor

  • Pengecekan residual ini sangat penting dalam menentukan ketepatan pada

    pencocokan model.

    Suatu model dikatakan cocok untuk suatu data dan jenis residual mana yang

    terbaik, jika distribusi dari suatu residualnya tertutup pada distribusi modelnya.

    Satu set data yang digunakan tidak cukup untuk membuat kesimpulan atau

    menggeneralisasi hasil perbandingan model Cox proportional hazard dan model

    parametrik, karena setiap set data bergantung pada sifat dasar hasil yang ingin

    didapat dari suatu penelitian. Karena itu dicoba melakukan simulasi dengan sampel

    random dari distribusi eksponensial dan weibull. Setelah itu model yang dibentuk

    dari sampel random tersebut dibandingkan, dan diharapkan diperoleh perbedaan

    yang jelas antara model Cox proportional hazard dan model parametrik.

  • BAB IV

    ANALISIS HASIL

    4.1 Data Kanker Paru-paru

    Data yang digunakan adalah data kanker paru-paru, yang terdiri dari 228

    pengamatan. Ada 19 pengamatan dengan missing value dan 209 pengamatan tanpa

    missing value. Pengamatan tanpa missing value inilah yang digunakan dalam

    analisis. Dari 209 pengamatan terdapat 62,7% tersensor kanan. Terdapat 6 variabel

    untuk membentuk model Cox proportional hazard dari data kanker paru-paru, yaitu

    ph.ecog (perkiraan para dokter mengenai nilai pemeriksaan ECOG), sex (umur), inst

    (kode untuk lembaga yang merawat pasien), wt.loss (Berkurangnya berat badan

    pada 6 bulan terakhir), ph.karno (perkiraan para dokter mengenai nilai Karnofsky),

    pat.karno (perkiraan pasien mengenai nilai Karnofskynya).

    Gambar 4.1 Plot Residual Cox-Snell dan Residual Martingale Data Kanker Paru-Paru untuk Model Cox proportional hazard

    Pada plot-plot pembentukan model Cox proportional hazard dengan

    menggunakan 6 variabel yang telah disebutkan di atas, terlihat bahwa pada gambar

  • 4.1 residual Cox-Snell dan Martingale menunjukan hasil yang tidak bagus.

    Seharusnya jika model yang digunakan sesuai dengan data, maka plot residual Cox-

    Snell akan menjadi garis lurus melewati titik asal serta melandai, sedangkan pada

    gambar 4.1 tidak demikian. Begitupun untuk residual Martingale, seharusnya

    residual Martingale bernilai ( )1, dan kesimetrisan dari distribusi residual martingale mendekati nol, namun pada gambar 4.1 tidak demikian.

    Gambar 4.2 Plot Residual Deviance, Normal-deviate, dan Log-odds Data Kanker Paru-Paru untuk Model Cox Proportional hazard

    Pada gambar 4.2, residual normal-deviate dan residual log-odds menunjukkan

    hasil yang baik. Hal ini ditunjukkan dengan penyebaran plot yang tidak berpola

    dan memusat sekitar nol, walaupun terlihat ada outlier.

  • Gambar 4.3 Histogram Residual Cox-Snell dan Martingale Data Kanker Paru-Paru untuk Model Cox Proportional hazard

    Kurva tebal pada histogram menunjukan density secara teori. Sedangkan kurva

    halus menunjukan density dari hasil pengamatan (data kenker paru-paru). Pada

    gambar 4.3 kedua kurva pada residual Cox-Snell dan Martingale tidak berimpit, ini

    menunjukan bahwa model tidak cocok sama seperti hasil dari plot.

  • Gambar 4.4 Histogram Residual Deviance, Normal-deviate dan Log-odds Data Kanker Paru-Paru untuk Model Cox Proportional hazard

    Dari gambar 4.4 semakin memperkuat hasil dari plot, bahwa untuk data kanker

    paru-paru cocok menggunakan model Cox proportional hazard dengan analisis

    residual menggunakan residual log-odds dan normal-deviate. Kedua kurva pada

    histogram residual log-odds dan normal-deviate saling berimpit, namun residual

    log-odds lah yang lebih berimpit.

  • Seperti halnya dalam pembentukan model Cox proportional hazard untuk

    data kenker paru-paru, pembentukkan model parametrik untuk data kanker paru-

    paru juga dilakukan dengan menggunakan 6 variabel.

    Gambar 4.5 Plot Residual Cox-Snell, Martingale dan Deviance Data Kanker

    Paru-Paru unruk Model Parametrik

    Dari gambar 4.5, sulit ditentukan mana yang lebih baik antara model

    eksponensial atau model Weibull, karena hasil plot hampir sama.

  • Gambar 4.6 Plot Residual Log-odds dan Normal-deviante Data Kanker Paru-Paru unruk Model Parametrik

    Gambar 4.6 pun sama seperti gambar 4.5, yaitu sulit untuk menentukan model

    mana yang lebih baik. Namun pada histogram lebih bisa terlihat perbedaannya,

    seperti yang akan dijelaskan pada gambar 4.7, 4.8, 4.9, 4.10, dan 4.11.

  • Gambar 4.7 Histogram Residual Cox-Snell Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru

    Pada gambar 4.7 terlihat bahwa, untuk residual Cox-Snell hasil yang diperoleh

    tidak baik. Namun jika dibandingkan antara model eksponensial dan model Weibull,

    maka model eksponensial yang lebih baik karena kedua kurva pada model

    eksponensial yang lebih berimpit.

  • Gambar 4.8 Histogram Residual Martingale Model Eksponensial (bawah) dan Model Weibull (atas) Data Kanker Paru-Paru

    Pada gambar 4.8 terlihat bahwa, untuk residual Martingale hasil yang

    diperoleh juga tidak baik. Namun jika dibandingkan antara model eksponensial dan

    model Weibull, maka model Weibull yang lebih baik karena kedua kurva pada

    model Weibull yang lebih berimpit.

  • Gambar 4.9 Histogram Residual Deviance Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru

    Sama seperti pada residual Cox-Snell dan Martingale, gambar 4.9 menunjukan

    bahwa hasil yang diperoleh dari residual deviance tidak terlalu baik. Namun jika

    dibandingkan antara model eksponensial dan model Weibul, maka model

    eksponensial yang lebih baik karena kedua kurva pada model eksponensial yang

    lebih berimpit.

  • Gambar 4.10 Histogram Residual Normal-deviante Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru

    Pada gambar 4.10, jika dibandingkan antara model eksponensial dengan model

    weibull, maka model eksponensial yang lebih baik. Tetapi ini masih belum

    menunjukan hasil yang baik

  • Gambar 4.11 Histogram Residual Log-odds Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru

    Pada gambar 4.10, residual log-odds model Weibul sudah menunjukan hasil

    yang baik. Namun hasil yang diperoleh tidak sebaik hasil dari model Cox

    Proportional hazard.

    Hasil dari Cox proportional hazard dan model parametrik terangkum pada

    tabel 4.1. Dari tabel terlihat bahwa dari keenam variabel yang digunakan pada

    pembentukan model Cox proportional hazard semua variabelnya signifikan, pada

    model eksponensial tidak ada satupun variabel yang signifikan dan pada model

    Weibull hanya log (scale) yang signifikan.

    Kesignifikanan z-value pada log (scale) dalam model Weibull menunjukkan

    bahwa model eksponensial diperbaiki oleh model Weibull. Tetapi hasil yang

    diperoleh dari kedua model parametrik tersebut tidak terlalu berbeda, dan

  • berdasarkan prinsip parsimony pilih model yang lebih sederhana maka pilihannya

    adalah model eksponensial.

    Tabel 4.1 Analisis Data Kanker Paru-Paru

    Cox-PH Eksponensial Weibull Faktor z-value

    (p-value) rr z-value

    (p-value) Estimate

    Accelerationsz-value

    (p-value) Estimate

    Accelerations

    ph.ecog 3.76 (0.00017)* 2.22 -3.12

    (0.090) -0.64 -3.91

    (0.061 ) -0.55

    sex -3.38 (0.00073 )* 0.55 3.02

    (0.127) 0.53 3.34

    (0.155) 0.41

    inst -2.12 (0.03400)* 0.98 1.93

    (0.717) 0.02 2.13

    (0.452) 0.01

    wt.loss -2.04 (0.04100)* 0.99 1.63

    (0.382) 0.01 2.03

    (0.572) 0.01

    ph.karno 2.00 (0.04600)* 1.02 -1.45

    (0.537) -0.01 -2.19

    (0.390) -0.01

    pat.karno -1.98 (0.04800)* 0.99 1.52

    (0.475) 0.01 2.03

    (0.572) 0.01

    log(scale) -5.83 (0.007)* -0.38

    rr : relative risk

    Dari hasil tersebut, terlihat bahwa model Cox proportional hazard jauh lebih

    baik digunakan untuk memodelkan data kanker paru-paru dibandingkan dengan

    model parametrik.

    4.2 Simulasi

    Satu set data yang digunakan seperti analisis di atas tidak cukup untuk

    menggeneralisasi pengujian sifat-sifat residual, karena setiap set data bergantung

    pada sifat dasar penelitian yang dilakukan. Selain itu kita juga tidak dapat

    mengontrol setiap kasus dengan missing value atau penelitian dengan angka

    penyensoran yang besar.

    Oleh karena itu, kita hasilkan sampel random dari distribusi eksponensial dan

    distribusi Weibull untuk pembentukan model Cox proportional hazard dan model

  • accelerated failure time. Residual normal-deviate dan residual log-odds

    dibandingkan antar model untuk menghasilkan model yang terbaik.

    Sampel dengan ukuran 200 dihasilkan menggunakan pembangkit angka acak

    pada software S-plus. Sebuah kovariat dan grup diasumsikan mengikuti distribusi

    binomial dengan peluang untuk grup 1 atau grup 0. Rata-rata dari subjek yang

    dimasukkan dalam penelitian adalah konstan dengan waktu diasumsikan mengikuti

    distribusi uniform pada interval (0,1).

    Untuk distribusi eksponensial survival time T dibangkitkan dengan hazard h(t |

    grup = 0) = 1 dan h(t | grup = 1) = 1/2. Sampel random tanpa penyensoran yang

    dihasilkan digunakan dalam analisis.

    Untuk distribusi Weibull survival time T dibangkitkan dengan parameter shape

    () = 2 dan scale () = 0,5 untuk grup 0 dan shape () = 2 dan scale () = 2

    untuk grup 1. Sampel random dengan 40% penyensoran kanan yang dihasilkan

    digunakan dalam analisis.

    Setelah pembentukan model Cox proportional hazard dan model parametrik

    (eksponensial dan Weibull), residual normal-deviate dan residual log-odds

    dibandingkan. Hanya kedua jenis residual ini yang digunakan karena pada hasil dari

    data kanker paru-paru, kedua jenis residual inilah yang dapat mengidentifikasikan

    kecocokan model dengan baik. Hal ini diperoleh dari hasil analisis statistik yang

    biasa digunakan untuk melihat kecocokan mode, yaitu uji parsial parameter dalam

    model. Hasil dari penelitian tanpa penyensoran yang tadi telah diperoleh

    ditunjukkan seperti gambar 4.5 dan 4.6 dan 4.7.

  • Gambar 4.12 Histogram dan QQ-Plot Residual Normal-deviate (atas) dan Residual Log-odds (bawah) Model Cox proportional hazard dari Data yang Berdistribusi Eksponensial

    Dari gambar 4.12 terlihat bahwa berdasarkan residual normal-deviate dan

    residual log-odds, model Cox proportional hazard cukup baik untuk diterapkan

    pada data. Hal ini ditunjukkan dari berimpitnya kurva density yang diperoleh dari

    model Cox proportional hazard dengan kurva density yang seharusnya (distribusi

    normal untuk residual normal-deviate dan distribusi logistik untuk residual log-

    odds).

  • Gambar 4.13 Histogram dan QQ-Plot Residual Normal-deviate Model Eksponensial (atas) dan Model Weibull (bawah) dari Data yang Berdistribusi Eksponensial

    Akan tetapi, berdasarkan gambar 4.13 density dari residual normal-deviate

    untuk model eksponensial lebih berimpit dengan density secara teoritis.

  • Gambar 4.14 Histogram dan QQ-Plot Residual Log-odds Model Eksponensial (atas) dan Model Weibull (bawah) dari Data yang Berdistribusi Eksponensial

    Gambar 4.14 pun memberikan indikasi yang serupa, walaupun tidak terlalu

    jelas perbedaan antara hasil dari model eksponensial dan model Weibull. Model

    eksponensial lebih bagus dibandingkan dengan model Weibull, sesuai dengan yang

    diharapkan.

  • Gambar 4.15 Histogram Model Eksponensial dan Model Weibul dari Data yang Berdistribusi Weibull dengan 40% Data Tersensor Kanan

    Dari gambar 4.8 terlihat bahwa density dari residual normal-deviate model

    Weibull yang lebih mendekati density secara teoritis dibandingkan model

    eksponensial. Namun hasil yang diperoleh tidak terlalu bagus. Hal ini disebabkan

    karena sebanyak 40% data tersensor kanan.

  • BAB V

    KESIMPULAN DAN SARAN

    5.1 Kesimpulan

    1) Dari hasil contoh data kanker paru-paru dapat disimpulkan, jika distribusi dari

    survival time tidak diketahui, maka model Cox proportional hazard lebih baik

    dibandingkan dengan model parametrik.

    2) Dari hasil simulasi :

    a. Jika distribusi diketahui maka model parametrik (dengan distribusi yang

    sesuai) memberikan hasil yang lebih baik dibandingkan model Cox

    proportional hazard.

    b. Walaupun tidak lebih baik daripada model parametrik, tetapi model Cox

    proportional hazard tetap cocok untuk memodelkan data.

    c. Untuk data yang tersensor sama seperti pada poin a dan b di atas, namun

    hasil yang diperoleh tidak terlalu baik.

    3) Residual normal deviate dan log-odds dapat digunakan untuk pemilihan model

    yang cocok untuk suatu data.

  • 5.2 Saran

    Model Cox proportional hazard lebih baik diterapkan jika tidak diketahui

    dengan pasti distribusi dari survival time. Akan tetapi ini hanya berdasarkan satu set

    data (yaitu data penderita kanker paru-paru) dan simulasi pada dua distribusi

    (eksponensial dan Weibull). Untuk data dengan distribusi lainnya belum diperiksa.

    Selain itu simulasi untuk data yang berdistribusi eksponensial hanya dicoba dengan

    1= untuk grup 1 dan 21= untuk grup 2. Sedangkan untuk data yang berdistribusi

    Weibull hanya dicoba dengan 2= , 21= untuk grup 1 dan 2= , 2= untuk

    grup 2. Untuk nilai yang lain belum dicoba oleh karena itu cobalah untuk penelitian

    lebih lanjut.

  • DAFTAR PUSTAKA

    [1] Abdullah, Sarini, New residuals and Their Application in Model Selection,

    Thesis The University of New South Wales Departement of Statistics, New

    South Wales, 2004.

    [2] Hanke, John E., Business Forcasting, Prentice Hall, New Jersey, 1998

    [3] Kalbfleisch, J. D. dan Prentice, R. L. The Statistical analysis of Failure Time

    Data, John Wiley and Sons, 1980.

    [4] Klein, John P., Moeschberger, Melvin L. Survival Analysis Techniques for

    Censored and Truncated Data, Spinger, New York, 1997.

    [5] Nardi, A. dan Schemper, M., New Residual for Cox Regression and Their

    Application to Outlier screening, Biometrics,1999.

    [6] Nardi, A. dan Schemper, M., Comparing Cox and Parametric Models in

    Clinical Studies, Springer: New York, 2000.

    [7] Therneau, T. M. dan Grambsch, P. M., Modelling Survival Data. Extending

    The Cox Model, Spinger:New York, 2000.

    [8] Walpole, R. E., Pengantar Statistik,. Gramedia Pustaka Utama. Jakarta, 1995.

  • [9] Weibull, W., A statistical distribution function of wide applicability, J.

    Appl.Mech.-Trans. ASME 18(3), 293-297, 1951.

    [10] http://en.wikipedia.org/wiki/Exponential Distribution, 27 Maret 2007

    [11] http://en.wikipedia.org/wiki/Survival Analysis, 31 Maret 2007

    [12] http://en.wikipedia.org/wiki/Probability_density_function, 2 April 2007

    [13] http://en.wikipedia.org/wiki/Survival or Failure Time, 11 April 2007

    [14] http://en.wikipedia.org/wiki/Weibull_distribution, 11 April 2007

  • LAMPIRAN

    1. Data Penderita Kanker Paru-Paru

    1 inst sex ph.ecog ph.karno pat,karno wt.loss2 3.00 1.00 1.00 90.00 100.00 NA

  • 3 3.00 1.00 0.00 90.00 90.00 15.00 4 3.00 1.00 0.00 90.00 90.00 15.00 5 5.00 1.00 1.00 90.00 60.00 11.00 6 1.00 1.00 0.00 100.00 90.00 0.00 7 12.00 1.00 1.00 50.00 80.00 0.00 8 7.00 2.00 2.00 70.00 60.00 10.00 9 11.00 2.00 2.00 60.00 80.00 1.00

    10 1.00 1.00 1.00 70.00 80.00 16.00 11 7.00 1.00 2.00 70.00 70.00 34.00 12 6.00 1.00 1.00 80.00 80.00 27.00 13 16.00 2.00 2.00 70.00 70.00 23.00 14 11.00 2.00 1.00 90.00 90.00 5.00 15 21.00 1.00 NA 60.00 70.00 32.00 16 12.00 1.00 1.00 80.00 70.00 60.00 17 1.00 1.00 1.00 80.00 90.00 15.00 18 22.00 1.00 1.00 90.00 100.00 -5.00 19 16.00 1.00 2.00 50.00 70.00 22.00 20 1.00 2.00 2.00 60.00 60.00 10.00 21 21.00 1.00 1.00 90.00 80.00 NA 22 11.00 1.00 1.00 80.00 80.00 17.00 23 6.00 2.00 0.00 100.00 70.00 -8.00 24 11.00 1.00 1.00 70.00 80.00 16.00 25 15.00 1.00 0.00 90.00 100.00 13.00 26 12.00 1.00 0.00 90.00 80.00 0.00 27 12.00 2.00 1.00 90.00 80.00 6.00 28 4.00 1.00 0.00 100.00 100.00 -13.00 29 13.00 1.00 3.00 60.00 70.00 20.00 30 13.00 1.00 1.00 80.00 70.00 -7.00 31 1.00 1.00 2.00 70.00 50.00 20.00 32 12.00 2.00 1.00 90.00 90.00 -1.00 33 1.00 1.00 2.00 60.00 70.00 20.00 34 7.00 1.00 2.00 60.00 80.00 -11.00 35 16.00 2.00 2.00 50.00 60.00 -15.00 36 12.00 1.00 2.00 70.00 100.00 10.00 37 1.00 2.00 2.00 50.00 50.00 NA 38 22.00 1.00 2.00 70.00 60.00 28.00 39 15.00 2.00 1.00 70.00 90.00 4.00 40 1.00 1.00 2.00 50.00 40.00 24.00

    Data Penderita Kanker Paru-Paru (Lanjutan)

    41 1.00 2.00 1.00 80.00 100.00 15.00 42 5.00 1.00 1.00 80.00 60.00 10.00

  • 43 11.00 2.00 2.00 60.00 70.00 11.00 44 10.00 2.00 0.00 90.00 90.00 27.00 45 12.00 2.00 2.00 70.00 60.00 NA 46 7.00 1.00 1.00 60.00 70.00 7.00 47 7.00 2.00 2.00 60.00 60.00 -24.00 48 1.00 1.00 0.00 90.00 70.00 30.00 49 3.00 1.00 1.00 80.00 70.00 10.00 50 13.00 1.00 0.00 90.00 90.00 2.00 51 22.00 2.00 1.00 90.00 100.00 4.00 52 3.00 2.00 1.00 90.00 90.00 9.00 53 12.00 1.00 0.00 80.00 70.00 0.00 54 21.00 1.00 0.00 90.00 100.00 0.00 55 1.00 1.00 0.00 100.00 90.00 7.00 56 6.00 1.00 1.00 90.00 80.00 15.00 57 1.00 1.00 0.00 90.00 80.00 NA 58 5.00 2.00 0.00 100.00 80.00 5.00 59 22.00 1.00 2.00 70.00 60.00 18.00 60 3.00 2.00 1.00 80.00 80.00 10.00 61 1.00 2.00 1.00 90.00 80.00 -3.00 62 22.00 2.00 2.00 70.00 70.00 8.00 63 12.00 1.00 1.00 90.00 80.00 68.00 64 21.00 1.00 1.00 80.00 100.00 NA 65 11.00 2.00 1.00 90.00 80.00 0.00 66 3.00 1.00 1.00 80.00 60.00 0.00 67 3.00 1.00 2.00 70.00 50.00 8.00 68 16.00 2.00 2.00 70.00 NA 2.00 69 5.00 2.00 0.00 90.00 70.00 3.00 70 22.00 1.00 0.00 100.00 80.00 0.00 71 6.00 1.00 1.00 80.00 100.00 23.00 72 13.00 1.00 0.00 90.00 90.00 -1.00 73 3.00 2.00 1.00 80.00 90.00 29.00 74 5.00 1.00 2.00 70.00 100.00 0.00 75 2.00 1.00 1.00 80.00 80.00 3.00 76 21.00 2.00 1.00 90.00 80.00 3.00 77 12.00 2.00 1.00 90.00 90.00 19.00 78 1.00 2.00 0.00 100.00 80.00 0.00 79 6.00 2.00 1.00 80.00 70.00 -2.00 80 3.00 1.00 0.00 90.00 NA 15.00 81 1.00 1.00 0.00 90.00 70.00 30.00 82 4.00 1.00 0.00 100.00 80.00 5.00 83 13.00 1.00 1.00 70.00 90.00 15.00 84 11.00 1.00 1.00 80.00 80.00 8.00 85 21.00 2.00 1.00 80.00 90.00 -1.00

    Data Penderita Kanker Paru-Paru (Lanjutan)

    86 16.00 1.00 1.00 80.00 80.00 1.00 87 6.00 1.00 1.00 80.00 90.00 14.00

  • 88 22.00 2.00 1.00 80.00 80.00 1.00 89 21.00 1.00 0.00 100.00 90.00 4.00 90 13.00 2.00 1.00 90.00 80.00 39.00 91 1.00 1.00 2.00 70.00 70.00 2.00 92 11.00 1.00 0.00 100.00 90.00 -1.00 93 22.00 1.00 1.00 80.00 100.00 23.00 94 5.00 1.00 1.00 90.00 80.00 8.00 95 10.00 2.00 1.00 80.00 60.00 14.00 96 1.00 2.00 0.00 100.00 90.00 13.00 97 12.00 1.00 2.00 80.00 60.00 7.00 98 3.00 1.00 1.00 80.00 80.00 25.00 99 12.00 1.00 1.00 90.00 100.00 0.00

    100 11.00 1.00 1.00 90.00 100.00 0.00 101 3.00 2.00 0.00 90.00 70.00 10.00 102 1.00 2.00 0.00 100.00 100.00 15.00 103 6.00 2.00 1.00 80.00 90.00 3.00 104 13.00 1.00 1.00 70.00 80.00 4.00 105 6.00 1.00 1.00 90.00 70.00 0.00 106 13.00 1.00 2.00 50.00 NA 32.00 107 12.00 1.00 1.00 80.00 90.00 14.00 108 26.00 2.00 1.00 80.00 100.00 -3.00 109 1.00 1.00 1.00 90.00 90.00 NA 110 21.00 1.00 1.00 100.00 80.00 5.00 111 3.00 2.00 2.00 60.00 50.00 11.00 112 13.00 1.00 0.00 90.00 70.00 10.00 113 1.00 1.00 1.00 80.00 90.00 5.00 114 10.00 1.00 1.00 80.00 100.00 6.00 115 3.00 2.00 0.00 90.00 100.00 1.00 116 6.00 2.00 1.00 80.00 100.00 15.00 117 1.00 1.00 2.00 70.00 70.00 20.00 118 3.00 1.00 2.00 70.00 60.00 20.00 119 1.00 1.00 2.00 60.00 70.00 30.00 120 16.00 1.00 2.00 70.00 60.00 24.00 121 15.00 1.00 1.00 80.00 90.00 11.00 122 22.00 1.00 0.00 90.00 90.00 0.00 123 26.00 2.00 2.00 70.00 80.00 10.00 124 3.00 2.00 1.00 70.00 80.00 0.00 125 11.00 1.00 2.00 60.00 60.00 -3.00 126 1.00 1.00 0.00 90.00 90.00 17.00 127 22.00 1.00 1.00 80.00 80.00 20.00 128 7.00 1.00 1.00 80.00 60.00 13.00 129 12.00 1.00 1.00 80.00 90.00 0.00 130 16.00 2.00 2.00 80.00 60.00 28.00 131 12.00 2.00 0.00 90.00 60.00 4.00

    Data Penderita Kanker Paru-Paru (Lanjutan)

    132 4.00 2.00 1.00 80.00 80.00 52.00 133 16.00 1.00 1.00 80.00 80.00 20.00

  • 134 6.00 1.00 0.00 100.00 90.00 5.00 135 13.00 2.00 1.00 80.00 70.00 49.00 136 1.00 1.00 0.00 90.00 70.00 6.00 137 22.00 2.00 2.00 60.00 40.00 37.00 138 12.00 2.00 1.00 80.00 70.00 0.00 139 13.00 1.00 2.00 80.00 60.00 NA 140 1.00 1.00 1.00 90.00 90.00 -5.00 141 5.00 1.00 0.00 100.00 100.00 15.00 142 21.00 2.00 2.00 70.00 60.00 -16.00 143 3.00 1.00 1.00 80.00 70.00 38.00 144 26.00 1.00 2.00 70.00 70.00 8.00 145 1.00 2.00 1.00 80.00 90.00 0.00 146 11.00 1.00 1.00 80.00 100.00 30.00 147 26.00 2.00 1.00 90.00 90.00 2.00 148 16.00 1.00 0.00 100.00 80.00 2.00 149 16.00 1.00 1.00 90.00 80.00 13.00 150 12.00 1.00 0.00 100.00 90.00 27.00 151 13.00 2.00 0.00 100.00 90.00 0.00 152 13.00 1.00 1.00 70.00 60.00 -2.00 153 22.00 1.00 0.00 90.00 100.00 7.00 154 5.00 2.00 0.00 90.00 90.00 0.00 155 16.00 2.00 1.00 80.00 60.00 4.00 156 32.00 1.00 2.00 70.00 30.00 10.00 157 NA 1.00 2.00 70.00 80.00 20.00 158 26.00 2.00 1.00 90.00 90.00 7.00 159 4.00 1.00 2.00 70.00 60.00 27.00 160 12.00 1.00 1.00 80.00 70.00 -2.00 161 1.00 2.00 1.00 80.00 90.00 17.00 162 32.00 2.00 0.00 90.00 90.00 8.00 163 10.00 2.00 1.00 90.00 100.00 2.00 164 11.00 1.00 2.00 60.00 70.00 36.00 165 6.00 1.00 1.00 90.00 80.00 2.00 166 7.00 1.00 1.00 80.00 70.00 16.00 167 16.00 2.00 0.00 90.00 90.00 3.00 168 11.00 2.00 1.00 80.00 60.00 33.00 169 21.00 1.00 0.00 100.00 100.00 4.00 170 6.00 1.00 1.00 90.00 90.00 0.00 171 12.00 1.00 0.00 100.00 90.00 0.00 172 13.00 1.00 1.00 90.00 100.00 2.00 173 2.00 2.00 0.00 90.00 80.00 10.00 174 2.00 1.00 1.00 90.00 60.00 37.00 175 16.00 2.00 0.00 100.00 90.00 6.00 176 1.00 1.00 1.00 90.00 80.00 12.00 177 13.00 2.00 1.00 80.00 100.00 0.00

    Data Penderita Kanker Paru-Paru (Lanjutan)

    178 1.00 1.00 2.00 60.00 80.00 -2.00 179 13.00 2.00 1.00 80.00 70.00 NA

  • 180 1.00 2.00 1.00 80.00 90.00 13.00 181 7.00 2.00 0.00 100.00 100.00 0.00 182 13.00 1.00 0.00 100.00 100.00 5.00 183 1.00 1.00 0.00 100.00 90.00 -5.00 184 16.00 2.00 0.00 90.00 100.00 NA 185 32.00 2.00 1.00 80.00 90.00 -1.00 186 12.00 2.00 0.00 90.00 80.00 0.00 187 12.00 2.00 0.00 90.00 100.00 5.00 188 2.00 2.00 2.00 70.00 90.00 20.00 189 3.00 1.00 0.00 90.00 80.00 8.00 190 15.00 1.00 1.00 80.00 60.00 12.00 191 22.00 1.00 0.00 90.00 90.00 8.00 192 16.00 1.00 1.00 80.00 90.00 14.00 193 16.00 1.00 2.00 60.00 70.00 NA 194 12.00 1.00 1.00 90.00 80.00 NA 195 1.00 1.00 1.00 90.00 80.00 33.00 196 22.00 1.00 1.00 90.00 90.00 -2.00 197 12.00 1.00 0.00 100.00 100.00 6.00 198 32.00 2.00 1.00 80.00 90.00 0.00 199 21.00 1.00 1.00 90.00 90.00 4.00 200 1.00 2.00 0.00 100.00 80.00 0.00 201 32.00 1.00 1.00 90.00 70.00 0.00 202 15.00 2.00 1.00 90.00 90.00 37.00 203 22.00 1.00 1.00 60.00 60.00 5.00 204 32.00 2.00 0.00 90.00 100.00 0.00 205 3.00 2.00 0.00 100.00 100.00 1.00 206 26.00 2.00 0.00 100.00 90.00 0.00 207 33.00 1.00 2.00 NA 70.00 NA 208 5.00 2.00 0.00 80.00 90.00 23.00 209 13.00 2.00 2.00 60.00 60.00 -3.00 210 21.00 1.00 1.00 80.00 70.00 NA 211 33.00 2.00 1.00 90.00 80.00 10.00 212 1.00 2.00 0.00 100.00 90.00 -2.00 213 6.00 1.00 1.00 80.00 70.00 23.00 214 15.00 1.00 1.00 90.00 70.00 0.00 215 11.00 2.00 2.00 70.00 100.00 31.00 216 11.00 1.00 1.00 80.00 90.00 10.00 217 11.00 1.00 1.00 90.00 70.00 18.00 218 13.00 2.00 1.00 90.00 80.00 -10.00 219 21.00 1.00 2.00 80.00 60.00 7.00 220 11.00 2.00 2.00 70.00 30.00 3.00 221 2.00 2.00 0.00 80.00 80.00 11.00 222 22.00 1.00 1.00 80.00 90.00 2.00 223 11.00 2.00 1.00 80.00 90.00 0.00

    Data Penderita Kanker Paru-Paru (Lanjutan)

    224 1.00 1.00 1.00 80.00 80.00 0.00 225 1.00 1.00 1.00 80.00 60.00 3.00

  • 226 13.00 1.00 0.00 90.00 90.00 -5.00 227 32.00 2.00 2.00 60.00 70.00 5.00 228 6.00 1.00 1.00 90.00 100.00 1.00 229 22.00 2.00 1.00 80.00 90.00 0.00

    2. Program S-Plus 2000 Model Cox Proportional Hazard Data Penderita Kanker Paru-

    Paru #Cox-Ph model untuk data kanker paru #Status=indikator kematian (2) atau pensensoran (1)

  • #Mencocokkan model Cox-Ph dan mendapatkan model cox-Ph terbaik inst
  • base.havg
  • xlim=c(min(xtb),max(xtb)),ylim=c(min(rmi1),max(rmi1)),xlab="linear predictor",ylab="residual")

    points(xtb[status1==0],rmi1[status1==0],type="p",pch="*") title(main="Residual Martingale Model Cox-PH",cex=.6) abline(mu) mu2

  • qqline(rmi1) #Histogram Residual Deviance hist(rdi1,xlab="Residual Deviance Model Cox-PH") den.rdi1
  • age
  • rcimod.exp
  • xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(rci.weib),max(rci.weib)),xlab="linear predictor",ylab="residual")

    points(pre.weib[status1==0],rci.weib[status1==0],type="p",pch="*") title(main="Residual Cox-Snell Model Weibull",cex=.6) plot(pre.exp[status1==1],rmi1.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(rmi1.exp),max(rmi1.exp)),xlab="li

    near predictor",ylab="residual") points(pre.exp[status1==0],rmi1.exp[status1==0],type="p",pch="*") title(main="Residual Martingale Model Eksponensial ",cex=.6) plot(pre.weib[status1==1],rmi1.weib[status1==1],type="p",pch=".", xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(rmi1.weib),max(rmi1.weib)),xlab

    ="linear predictor",ylab="residual") points(pre.weib[status1==0],rmi1.weib[status1==0],type="p",pch="*") title(main="Residual Martingale Model Weibull ",cex=.6) plot(pre.exp[status1==1],rdi1.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(rdi1.exp),max(rdi1.exp)),xlab="li

    near predictor",ylab="residual") points(pre.exp[status1==0],rdi1[status1==0],type="p",pch="*") title(main="Residual Deviance model Eksponensial",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.weib[status1==1],rdi1.weib[status1==1],type="p",pch=".", xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(rdi1.weib),max(rdi1.weib)),xlab

    ="linear predictor",ylab="residual") points(pre.weib[status1==0],rdi1[status1==0],type="p",pch="*") title(main="Residuals Deviance Model Weibull",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.exp[status1==1],nmi.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(nmi.exp),max(nmi.exp)),xlab="line

    ar predictor",ylab="residual") points(pre.exp[status1==0],nmi.exp[status1==0],type="p",pch="*") title(main="Residual Normal Deviate Model Eksponensial",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.weib[status1==1],nmi.weib[status1==1],type="p",pch=".", xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(nmi.weib),max(nmi.weib)),xlab="

    linear predictor",ylab="residual") points(pre.weib[status1==0],nmi.weib[status1==0],type="p",pch="*") title(main="Residual Normal Deviate Model Weibull",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.exp[status1==1],lmi.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(lmi.exp),max(lmi.exp)),xlab="line

    ar predictor",ylab="residual") points(pre.exp[status1==0],lmi.exp[status1==0],type="p",pch="*") title(main="Residual Log-Odds Model Eksponensial",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.weib[status1==1],lmi.weib[status1==1],type="p",pch=".", xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(lmi.weib),max(lmi.weib)),xlab="

    linear predictor",ylab="residual") points(pre.weib[status1==0],lmi.weib[status1==0],type="p",pch="*") title(main="Residual Log-Odds Model Weibull",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) #Histogram Residual Cox-Snell Model Eksponensial hist(rci.exp,xlab="Residual Cox-Snell Model Eksponensial")

  • den.rci.exp
  • hist(rdi1.exp,xlab="Residual Deviance Model Eksponensial") den.rdi1.exp
  • qqline(nmi.weib) #Histogram Residual Log-Odds Model Eksponensial hist(lmi.exp,xlab="Residual Log-Odds Model Eksponensial") den.lmi.exp
  • stimes
  • den.ni
  • xs
  • etims
  • #Residual Normal Deviate Scap
  • #Residual Log-Odds pada Model Parametrik li1