Survival Analysis and Cox regression model

YAŞAM ANALİZLERİ VE

COX REGRESYON MODELİ* M. Emin YAYLA

ÖZET

Yaşam analizi yapılacak çalışmalarda genellikle başarısızlık olarak adlandırılan ve

genellikle bozulma veya ölüm gibi adlandırlamalarla karşımıza çıkan olayların meydana

gelmesine kadar geçen süre olarak elde edilen verilerin analizidir. Yaşam analizi başta

tıp olmak üzere sosyal bilimler ve aktüerya gibi alanlarda kullanılmaktadır ve bu

bilimler için oldukça önemlidir. Bu çalışmada Yaşam Fonksiyonu, Hazard Fonksiyonu,

Kaplan-Maier tahmin edicisi, iki yaşam testinin kıyaslanması başlıkları ve Cox

regresyon yöntemi açıklanmıştır. Bununla birlikte aralarındaki ilişki de çalışmada

açıklanmıştır.

Kasım 2013,

Anahtar kelimeler: Yaşam analizi, Kaplan-Maier, Hazard, Cox modeli

*Türkçe Çevirisi/Versiyonudur. Her hakkı saklıdır.

- 1 -

SURVIVAL ANALYSIS AND COX REGRESSION MODEL

M. Emin YAYLA

ABSTRACT

The survival analysis is the analysis of data that are called as a failure within the studies

that will be done, and, the data obtained as elapsed time which could be seen until the

formulation of events such as break, dead and putrefaction. The survival analysis is used

in the areas of social science, actuaria and the medicine and it is very important area for

these sciences. Within the framework of this study the basic concepts of Survival

analysis, Hazard function, Kaplan-Maier estimator, Comparison of the binary survival

tests and Cox regression model will be detailed.

November 2013,

Key Words: Survival analysis, Kaplan-Maier, Hazard, Cox model

- 2 -

İçindekiler 1.1. BAZI KAVRAMLAR .......................................................................................................... - 4 -

1.2. YAŞAM ANALİZİNDE YAŞAM TABLOSU YÖNTEMİ (CUTLER-EDERER METODU) ................ - 4 -

2.1. Sürekli Modeller ............................................................................................................ - 6 -

2.2. Kesikli Modeller ............................................................................................................. - 7 -

4.1. SANSÜRLEME ...............................................................................................................- 12 -

4.1.1. Sağdan Sansürleme ...............................................................................................- 12 -

4.1.1.a. I. Tür Sansürleme ............................................................................................- 13 -

4.1.1.b. II. Tür Sansürleme ...........................................................................................- 14 -

4.1.1.c. Bağımsız Rastgele Sansürleme .........................................................................- 14 -

4.1.1.d. İlerletilmiş İkinci Tür sansürleme .....................................................................- 15 -

4.1.2. Soldan Sansürleme ................................................................................................- 15 -

4.1.3. Aralık Sansürlemesi ...............................................................................................- 16 -

4.1.4. İkili Sansürleme .....................................................................................................- 16 -

5.1. Kaplan-Meier İçin Yaşam Fonksiyonunun Hesaplanması ...............................................- 18 -

6.1. Breslow-Wilcoxon Testi ................................................................................................- 20 -

6.2. Log-Rank Testi ..............................................................................................................- 21 -

6.3. Tarone-Ware Testi........................................................................................................- 23 -

6.4. Testlerin Karşılaştırılması ..............................................................................................- 24 -

7.1. Çoklu Cox Modelinde b Katsayılarının Hesaplanması ....................................................- 26 -

- 3 -

1. YAŞAM ANALİZİ

Yaşam analizi belli bir hastalığa maruz kalan bir bireyin tanısından sonra uygulanan bir

girişimden (tıbbi tedavi, operasyon, kemoterapi vs.) daha ne kadar yaşayabileceğini ya

da hastalığın ne kadar sürede nüksedebileceğini tahmin etmek, tedavi tiplerinin ve diğer

faktörlerin yaşam üzerindeki etkilerini incelemek amacıyla geliştirilmiş yöntemler

bütünüdür.

Yaşam analizi T zaman süresinde n sayıda izlenen hasta biriminden elde edilen yaşam

sürelerinin (izlem süreleri, araştırma periyodu) dağılımını açıklayarak, yaşam sürelerini

etkileyen ve etkilemesi olası değişkenleri içeren modeller kurarak bu modellere göre

parametre tahminleri yapmayı amaçlamaktadır.

Belli bir girişime tabi tutulan hastaların T süresi içinde bir kısmı iyileşirken, bir kısmı

ölebilir, çeşitli nedenlerle takip dışında kalabilir. Yine bir kısım hasta gözlemleme

yapılırken kısa sürede ölebilir veya uzun süre hayatta kalabilir. Araştırma süresi sona

erdiği için izlendikleri halde hayatta kalan hastalar olabilir. Bu nedenle izlem süreleri

tamamlanmış ya da tamamlanmamış süre olarak iki şekilde adlandırılır.

Bir hastalığa yakalanan kişinin aldığı tedavi türünün ve bazı prognostik değişkenlerin

(hastanın zamana bağlı olarak durumunda değişmelere sebep olan faktörler) yaşam

süresi üzerindeki etkilerini ortaya koymak için yaşam analizi yöntemlerinden

yararlanılır.

Hastalık olgularında hastaların herhangi bir medikal veya cerrahi girişimden sonraki

yaşamlarının izlem zamanları; izlem süresi, yaşam süresi, lezyonsuz geçen süre,

remisyon zamanı gibi isimlerle adlandırılır. Bu süreler izleme zamanına ilişkin gün, ay,

yıl gibi süreleri içerir. Yaşam analizi yöntemleri izlem sürelerini ve diğer faktörleri

içeren veri setlerinde yaşam sürelerini ele alarak yaşam olasılıkları, ölüm olasılıkları,

ortalama yaşam süresi, ortanca yaşam süresi gibi tahminler yapmayı amaçlayan

yöntemlerdir. (Özdamar, 2003)

Yaşam analizi tıp bilimlerinde çokça kullanılsa da mühendislik, sosyal bilimler ve

aktüerya alanlarında da kullanılır ve oldukça önemlidir. Üretim aşamasında ve

sonrasında ürünlerin dayanıklılığı, kullanılma süreleri, bozulma, çürüme gibi unsurlar

tıp biliminde olduğu mantıkla değerlendirerek analizler yapılır.

Yaşam analizinde en önemli unsur yaşam süresidir. Yaşam modellerinin temel

kavramlarından biri de sansürlemedir. Sansürlenmiş verilerin varlığı, yaşam analizini

diğer istatistik modellerinden ayıran en belirgin özelliktir. Sansürleme kavramından

bahsedilirken, sansürleme çeşitleri verilip sansürleme çeşitlerine göre olasılık yoğunluk

fonksiyonları verilecektir.

Parametrik olmayan istatistiksel yöntemler belli bir dağılım varsayımı

gerektirmediğinden pratikte daha kullanışlıdır. Ancak, parametrik yöntemler daha

profesyonel sonuçlar vereceğinden, yaşam analizinde kullanılan önemli dağılımlarla

çalışmak daha çok tercih edilen bir yoldur. (Tamam, 2008)

- 4 -

Yaşam analizi, bazı uygulamalarda güvenilirlik analizi veya sağ kalım analizi olarak da

isimlendirilmektedir. Yaşam analizinde kullanılan “başarısızlık” terimi, incelenen

konunun denekte görülmesi durumudur. Canlılar için genelde ölüm veya hastalık,

mekanik aletler için ise bozulma anlamına gelir (Nelson, 1982)

1.1. BAZI KAVRAMLAR

Yasam analizi, başarısızlık olarak adlandırılan bir olayın meydana gelmesine kadar

geçen sürede elde edilen verilerin analizidir.

Yaşam analizinde geçen bazı kavram ve gösterimler aşağıda kısaca açıklanmıştır

(Özdamar, 2003).

Yaşam süresi, bir bireyin belirli girişime ya da etkene maruz kaldıktan sonra

iyileşmesine, hastalığın tekrarlamasına ya da ölüme kadar geçen süreye denilmekte ve

ti ile gösterilmektedir.

Yaşam fonksiyonu, yaşam sürelerinin olasılık dağılımına denilmektedir. Fonksiyon,

yaşamsal verilerin genel eğilimini matematiksel bir modelle ifade eder. Yaşam

fonksiyonu bir olasılıktır ve S(t) ile gösterilmektedir.

Ani ölüm olasılığı (Hazard fonksiyonu), sağ olan bir kişinin, belirli bir zamanda (anda)

ölüm olasılığı, taşıdığı ölüm riskidir ve h(t) ile gösterilir.

Birikimli ölüm fonksiyonu (birikimli Hazard fonksiyonu), T zamanı içinde belirli bir t

zamanı (anı) için hesaplanmış olan ölüm olasılıklarının birikimli fonksiyonudur ve Λ(t)

ile gösterilir.

1.2. YAŞAM ANALİZİNDE YAŞAM TABLOSU YÖNTEMİ (CUTLER-

EDERER METODU)

Yaşam tablosu yöntemi yaşam süresi verilerini eşit zaman aralıklarına göre frekans

tablosuna dönüştürerek analiz eden ve her bir zaman aralığında yaşam fonksiyonlarını

hesaplamayı amaçlayan bir yöntemdir. Bu yöntem, ölüm düzeylerinin ölçülmesi ve

belirli bir yılda doğan kuşağın (kohort) herhangi bir yaşta beklenen yaşam sürelerini

tahmin etmek için geliştirilmiştir. Sonraları uygulama alanı genişleyen bu yöntem,

nüfus yapısı ve özellikleri, 0 yaşta beklenen yaşam ümidi, sağlıklı ve hastalıklı yaşam

süresi, tedaviden sonra hastanın kaç yıl yaşayacağı gibi konularda tahmin ve kestirim

aracı olarak kullanılmaya başlanmıştır.

YT yöntemi, yaşam sürelerinin k sayıda (k>6) eşit aralıklı sınıfa ayırdığı, tekrarlanan

zaman sürelerinin fazla olduğu, birim sayısının 100’ün üzerinde (n>100) olduğu veri

setlerinde X etkenine maruz kalan birimlerin yaşam ve ölüm olasılıklarının, ortalama

yaşam süresinin hesaplanmasını sağlayan yöntemdir. Burada yönteme kısaca

değinilecektir.

- 5 -

YT yönteminde her sınıftaki birimlerin eşit ölüm riskine sahip olduğu varsayılır. i’inci

aralıkta ölen hastalar dışındaki hastalar i+1’inci sınıfa eşit ölüm riski/yaşam olasılığı ile

geçerler. i’inci aralıktaki hasta sayısı ri;

(1)

Şeklinde hesaplanır. Burada ni; i’inci aralığa sağ olarak giren hasta sayısını, ci; i’inci

aralıkta yaşayan hasta sayısını (takipten çıkanlar dâhil) belirtir. YT yönteminde her

aralıktaki hastaların bulundukları aralığa eşit olarak dağıldığı (uniformly distributed)

varsayılır. Bu varsayıma göre, yaşayan kişilerin sınıf değerinde (sınıf orta noktasında)

riske maruz kaldıkları varsayılır. i’inci aralıktaki kişilerin taşıdıkları ölüm riski qi;

(2)

Şeklinde hesaplanır. Burada di; i’inci aralıkta ölen kişilerin sayısını ifade eder. Yaşam

olasılığı pi;

(3)

Şeklinde hesaplanır. i’inci aralıktaki yığılımlı yaşam olasılığu Yi ise;

(4)

Şeklinde hesaplanır. i’inci aralıkta yaşayanların (i+1)’inci aralığa canlı olarak geçeceği

varsayılır ve izlem periyodunda araştırmaya dâhil olacakları varsayılır. Burada Y1=1

alınır. Yi’nin standart hatası ise;

(5)

Şeklinde hesaplanır. Ölüm olasılık yoğunluk fonksiyonu;

(6)

Şeklinde hesaplanır. Burada fi; i’inci aralığın sınıf orta noktasındaki ölüm olasılığını

vermektedir ve hi sınıf aralığıdır. Ölüm olasılığının standart hatası ise aşağıdaki gibidir.

(7)

Yaşam tablosuyla SPSS uygulaması konuların sonunda verilmiştir.

- 6 -

2. YAŞAM FONKSİYONU

Yaşam süresi dağılımları sürekli ve kesikli modeller olmak üzere ikiye ayrılır.

2.1. Sürekli Modeller

Yaşam süresinin negatif olamayacağı kabulü göz önüne alınarak, bir kitledeki canlıların

yaşam süresi, negatif olmayan sürekli bir T rastgele değişkeni ile gösterilsin.

Herhangi bir canlının t zamanından önce ölmesi olasılığı,

(8)

Olarak tanımlanan “dağılım fonksiyonu” yardımıyla bulunur. Burada f(t) ise T rastgele

değişkeninin olasılık yoğunluk fonksiyonudur.

Yukarıda tanımlanan T rastgele değişkeni için herhangi bir canlının t zamanına kadar yaşadığı

biliniyor olsun. Bu canlının t zamanından sonra yaşaması olasılığı,

(9)

Şeklinde tanımlanan fonksiyon yardımıyla bulunur. Bu fonksiyona yaşam fonksiyonu adı

verilir.

Yaşam fonksiyonu ile dağılım fonksiyonu arasında,

Şeklinde bir ilişki vardır. (Miller 1991)

Dağılım fonksiyonu F(t) azalmayan bir fonksiyon,

dir. Burada,

- 7 -

(10)

Olması sebebiyle yaşam fonksiyonu S(t)’nin yukarıdaki özellikleri taşıyan azalan bir fonksiyon

olduğu söylenir.

2.2. Kesikli Modeller Yaşam süreleri bazen kesikli olarak ifade edilmiş olabilir. T rastgele değişkeni 0 ≤ t1 ≤ t2 ≤…

değerlerini alıyorsa T rastgele değişkeninin olasılık fonksiyonu,

ilgili yaşam fonksiyonu,

(11)

şeklindedir.

3. HAZARD FONKSİYONU

Başlık 2.1’de belirtilen T rastgele değişkeninin olasılık fonksiyonu, küçük bir zaman

aralığında bir bireyin başarısız olma olasılığının limitidir.

Bu fonksiyon,

(12)

Şeklinde yazılır.

t zamanından sonra yasadığı bilinen bir bireyin, t zamanındaki ani başarısızlık ya da

ölüm oranı,

(13)

biçiminde tanımlanan Hazard Fonksiyonu ile belirlenir.

Hazard fonksiyonu T yaşam süresinin t ≥ 0 ve pozitif küçük bir Δt değeri için [t, t+Δt)

aralığında yaşamın koşulu dağılımıdır. λ(t) veya r(t) olarak da gösterilir.

- 8 -

Yaşam fonksiyonu, yaşama olasılığını incelerken; Hazard fonksiyonu başarısızlığı

(ölümü) inceler ve zamana bağlı ölüm riskini belirler. Hazard fonksiyonunun grafiği,

yapılan çalışma için model oluşturmada önemli ipuçları verir. Bu sebeple, yaşam

fonksiyonu gibi, Hazard fonksiyonu da, yaşam modellerinin önemli bir karakteristiğidir.

Ayrıca;

(14)

dir. Başka bir deyişle h(t) fonksiyonu,

(15)

olarak ifade edilebilir. (Cross and Clark 1975)

Bu eşitlikte her iki tarafın integrali alınırsa;

(16)

Sonucuna ulaşılır.

Burada Λt “Birikimli Hazard Fonksiyonu” olarak adlandırılır ve

(17)

- 9 -

şeklinde ifade edilir.

Kümülatif Hazard fonksiyonu aşağıdaki özellikleri taşır:

(i) Λ(t)=0’dır. Çünkü

(18)

Veya S(0) = 1 olduğundan Λ(0) = 0 olduğu görülür.

(ii) Λ(∞)=∞’dur. Çünkü;

(19)

Veya S(∞) = 1 olduğundan Λ(∞) = ∞ olduğu görülür.

x anından sonra yaşadığı bilinen canlının (x, x+t) yaşam aralığında (t zaman sonra)

ölmesi olasılığı ise;

- 10 -

(20)

dir. Sonuç olarak da yaşam fonksiyonu, dağılım fonksiyonu ve Hazard fonksiyonu arasındaki ilişki

şöyle ifade edilir: (Le, 1997)

(21)

Kesikli modellerde yaşam fonksiyonunun

olduğunu söylemiştik.

Buradan Hazard Fonksiyonu;

(22) şeklinde tanımlanır.

Ayrıca;

(23)

olduğundan;

- 11 -

(24)

eşitliği yazılır. (Lawless, 2003)

4. YAŞAM ANALİZİNDE VERİ YAPISI

Yaşam analizindeki en önemli değişken yaşam süresidir. Yaşam süresi de çoğu kez

sansürlü olmaktadır. Yani, bireyin yaşam süresi hakkında her zaman tam bir bilgiye

ulaşılamayabilir. Veri yapısındaki bu farklılık, yaşam analizini diğer istatistiksel analiz

yöntemlerinden ayıran en önemli özelliktir.

Tam örneklem durumunda, her bir bireyin yaşamı, çalışmanın periyodu içerisinde son

bulmuştur. Veriler her bir bireyin ölüm zamanını kapsar. Ancak sansürlü örneklem

durumunda çalışma tamamlandığında bireyler hala yasıyor veya çalışma süresinin

sonuna gelinmiş olmasına rağmen bireylerin yaşam durumu bilinmiyor olabilir. Ya da

birey çalışma süresi içerisinde çeşitli nedenlerle kayıp gözlem durumuna düşmüş,

herhangi bir nedenden dolayı çalışmadan çıkmış olabilir. Yani, tam örneklem

durumunda bireylerin başarısızlık zamanı kesin belli iken, sansürlü örneklem

durumunda ise başarısızlık zamanı hakkında kesin bir bilgiye ulaşılamaz. (Tamam,

2008)

Sansürsüz veri ile sansürlü verilerin grafiklerini birer örnekle vererek sansür üzerinde

duralım.

Şekil 1: Sansürsüz veri

Birey

Zaman

1

2

3

t1

t2

t3

- 12 -

4.1. SANSÜRLEME

Sansürleme; zaman ve maliyet gibi birtakım sınırlamalar nedeniyle, kesin olarak

bilinmeyen, herhangi bir sebeple gözlenemeyen verilerin göz ardı edilmesidir. Bir

çalışmada, ilgilenilen olay bir bireyin yaşam süresi olduğunda, her bir bireyin

çalışmanın başlangıcından sonuna kadar gözlem altında bulundurulması çeşitli

nedenlerden dolayı olanaksızdır. Bu durumda veri “sansürlüdür” denir.

Gözlemlenen birey;

- Tedavi gördüğü süre içerisinde trafik kazası gibi farklı bir sebepten ölmüş,

- Kalp yetmezliği, kan değerlerinin artması v.b. gibi sebeplerle tedaviye ara vermek

zorunda kalmış,

- Başka bir hastanede veya başka bir şehirde tedaviye devam etmek zorunda kalmış,

- Tedaviye cevap vermemiş,

- Tedavi süresi içerisinde başka bir hastalığa yakalanmış,

- Tedaviden vazgeçmiş olabilir. Bu gibi durumlarda yaşam süresi kesin olarak

bilinemeyeceğinden sansürlüdür.

Yaşam modelinde meydana gelebilecek 3 durumdan söz edilebilir (Kleinbaum, 1996).

(a) Birey gözlem esnasında ölebilir.

(b) Birey gözlemden geri çekilebilir. İlgilenilen olay dışında bir başka nedenden dolayı

ölebilir veya uygulanan yöntemlerden beklenmeyen bir sonuç alınabilir.

(c) Birey gözlemin sonunda hala yasıyor olabilir.

(a) durumunda bireyin yaşam süresi bilindiğinden sansürlü değildir. (b) durumunda

bireyin yaşam süresi, gözlemden çekilme zamanından itibaren sansürlüdür. (c)

durumunda ise, bireyin yaşam süresi çalışmanın sonlandırılma zamanına kadar

bilinmesine rağmen, gözlem sonrası hakkında bir bilgi olmadığından bu bireyin yaşam

süresi de sansürlüdür (Kleinbaum, 1996).

Sansürleme, sağdan sansürleme ve soldan sansürleme olarak iki ana gruba ayrılır.

Ayrıca, sağdan ve soldan sansürlemeler kullanılarak elde edilen aralık sansürlemesi ve

ikili sansürleme de genelleştirilmiş sansürleme çeşitleri olarak incelenebilir.

Bu çalışmada, soldan sansürleme sık karşılaşılan bir sansürleme çeşidi olmadığından, en

çok karşılaşılan sansürleme çeşidi olması sebebiyle, sağdan sansürleme üzerinde

durulacaktır.

4.1.1. Sağdan Sansürleme

Başarısızlık olarak adlandırılan (ölüm, bozulma, çürüme v.b.) olay, çalışması için

belirlenen bir durma zamanına kadar gerçekleşmezse, bireyin yaşam süresinin uzunluğu

çalışmanın durma zamanının sağ tarafına geçer. Böyle bir durumda, bu bireyin yaşam

süresi kesin olarak bilinmeyecek ve birey gözleme alınmayacaktır. Yani, bireyin yaşam

süresi sansürlenecektir. Bu tip sansürlemeye “sağdan sansürleme” denir.

- 13 -

Li sansürleme zamanı, Ti bireyin yaşam süresi olmak üzere; Ti > Li olduğunda bu

bireyin yaşam süresinin sağdan sansürlenmiş olduğu söylenir.

(25)

Eğer ise birey sansürlenmiş, ise gözlenmiştir. (Nelson

1982)

Sağdan sansürleme kendi içinde bazı alt gruplara ayrılır:

a. I. Tür sansürleme

b. II. Tür sansürleme

c. Bağımsız rastgele sansürleme

d. İlerletilmiş II. Tür sansürleme

4.1.1.a. I. Tür Sansürleme

I. tür sansürlemede, her bireyin bir sansürleme zamanının olduğu düşünülür (Li > 0).

Bireyler sürece herhangi bir zamanda dahil olurlar ve belirlenmiş durma zamanına

kadar gözlenirler. Ti bireyin çalışma süresince gözlenebildiği süre, Li sansürleme

zamanı ise çalışmanın başlama zamanı ile bitiş zamanı arasında bir zamandır. Bu

durumda, Li sansürleme zamanı sabit bir sayıdır.

I. Tür sansürleme için genel gösterim ti = min(Ti, Li) ve olmak üzere;

için olasılık yoğunluk fonksiyonu;

(26)

olarak tanımlanır.

ve

Eşitlikleriyle;

(27)

Olarak elde edilir. (Lawless, 2003)

- 14 -

4.1.1.b. II. Tür Sansürleme

II. tür sansürlemede, başlangıçta belirlenen bir başarısızlık sayısı vardır. n birey aynı

anda gözlenmeye başlanır ve çalışmanın basında belirlenen sabit bir r tane başarısızlık

gözlendiği anda çalışmaya son verilir. Çalışmanın toplam süresi, r-inci başarısızlık

zamanı olan t(r) ’ ye eşittir. Bu zaman, çalışmanın başında bilinmemektedir.

rastgele örneklem olmak üzere;

‘nin ortak olasılık yoğunluk fonksiyonu,

(28)

biçiminde tanımlanır. Bu ifade sıralı istatistiklerin genel biçimidir. (Lawless, 2003)

4.1.1.c. Bağımsız Rastgele Sansürleme

Bağımsız rastgele sansür modelinde birçok durumda sansürleme süreci, başarısızlık

zamanı (failure time) ile ilişkilidir. Sonlandırma zamanı rastgele olup çalışmadan önce

belli değildir, daha sonradan seçilir. Fakat bu seçim, sonlandırma sürecine kadar

çalışmanın sonuçlarından etkilenir.

T, her bireyin yaşam süresi iken L de sansürleme zamanıdır. T ile L rastgele

değişkenleri bağımsız sürekli rastgele değişkenlerdir.

Ayrıca; S(t) , T rastgele değişkeninin, G(t) de L rastgele değişkeninin yaşam fonksiyonu

iken f(ti), T rastgele değişkeninin ve g(ti) de L rastgele değişkeninin olasılık yoğunluk

fonksiyonudur.

ti = min(Ti, Li) ve olmak üzere;

(29)

Eşitliğinden çifti için olasılık yoğunluk fonksiyonu;

(30)

olarak elde edilir. (Lawless, 2003)

- 15 -

4.1.1.d. İlerletilmiş İkinci Tür sansürleme

İlerletilmiş II. tür sansürleme, II. tür sansürlemenin genelleştirilmiş halidir. Bu sansürleme

çeşidinde, söz konusu olayda yer alan n tane bireyden, başarısız olan r1 tane birey gözlenir. Geriye kalan n − r1 tane bireyden n1 tanesi çalışmadan uzaklaştırılır. Böylece, n-r1-n1 birey

çalışmada kalmış olur. Daha sonra, başarısız olan r2 tane birey gözlenir. Geriye n − r1 − n1 − r2

birey kalır. Kalan bireylerden n2 tanesi çalışmadan alınarak geriye kalan bireyler ile

çalışmaya devam edilir. İşleyiş bu şekilde devam ettirilir.

Olmak üzere verilerin dağılımı;

(31)

şeklindedir. Bölüm 4.1.1.b (denklem 28) ‘de verilen;

Eşitliğinden;

(denk. 31) İfadesinin ilk terimi aşağıdaki gibi yazılır.

(32)

4.1.2. Soldan Sansürleme

Li sansürleme zamanı Ti bireyin yaşam süresi olmak üzere; Ti < Li olduğunda bu bireyin

yaşam süresinin soldan sansürlenmiş olduğu söylenir.

(33)

Eğer ise birey sansürlenmiş ise gözlenmiştir.

(Lawless 2003)

(34)

- 16 -

4.1.3. Aralık Sansürlemesi

Aralık sansürlemesi, genelleştirilmiş bir sansürleme çeşididir. Genellikle takip

gerektiren olaylarda kullanılır. Çalışmaya konu olan olayın meydana gelme süresi, bir

aralıkta ifade edilir. Yaşam süresi (Li, Ri] aralığında yer alır. Eğer aralık sansürlemesi,

sağdan sansürlemenin genelleştirilmiş biçimi olarak ifade ediliyorsa, sol sınır noktasının

0, sağ sınır noktasının ise Li olarak alındığı söylenir.

Soldan sansürlemenin genelleştirilmiş biçimi olarak ifade ediliyorsa da, sol sınır

noktasının Li, sağ sınır noktasının ise (∞) olarak alındığı söylenir. Yani, aralık

sansürlemesi, sağdan sansürlemenin ve soldan sansürlemenin genelleştirilmiş şeklidir.

(Nelson, 1982)

4.1.4. İkili Sansürleme

Bazı çalışmalarda soldan sansürlemenin meydana geldiği durumlarda, sağdan

sansürleme de aynı zamanda ortaya çıkabilir. Böyle durumlarda, yasam sürelerinin ikili

sansürlendiği ifade edilir.

Burada, Li ele alınan olayın birey için gerçekleşmesinden önceki zaman iken, Lj ele

alınan olayın birey için gerçekleşmesinden sonraki zamandır.

Eğer, ya da ise bireyin yaşam süresi kesin olarak biliniyor demektir

(Nelson, 1982)

5. KAPLAN-MEIER TAHMİN EDİCİSİ

Kaplan-Meier tahmin edicisi kullanılan yöntemde hayatta kalma süresinin tahmini

yaşam tablosu ile benzerdir. Fakat Kaplan-Meier yönteminde hesaplamalar frekans

dağılım tablosu üzerinden değil tek tek veriler üzerinden yapılır. Kaplan-Meier

tahmininin bu özelliği az sayıda birey içeren örnekler için kullanılmasına izin verir. Bu

yöntemde hayat kalma süresi her bir ölüm gerçekleştiğinde hesaplandığı için tedaviden

geri çekilen hastalar dikkate alınmaz. (Özdamar, 2003) Bir K-M grafik örneği;

- 17 -

Şekil 2: Kaplan-Meier örneği

Kaplan Meier yöntemi yaşam sürelerine ilişkin, verilerin zaman aralığını bölmeden

yaşam ve ölüm fonksiyonlarının hesaplanmasını sağlayan bir yöntemdir. (Altman,

1991) Genel Kaplan-Meier formülü yani product limit formülü;

(35)

Yaşam tablosu ve Kaplan-Meier yöntemleri yaşam ve ölüm fonksiyonlarını

hesaplamada benzerlikler ve farklılıklar içermektedir. Bu farklılıklar aşağıdaki gibi

özetlenebilir. (Özdamar, 2003)

KM yönteminde az sayıda bireyle çalışılabilir. YT yönteminde aralıklara düşen

birim sayısının azalması tahminleri etkiler. Çok sayıda birey olduğunda YT ve

KM benzer sonuçlar vermektedir. YT yöntemi çok sayıda izlenen birim

olduğunda tercih edilmelidir. KM yönteminde, izleme süresini belirli zaman

gruplarına ayırmaya gerek duyulmamaktadır.

KM yönteminde tekrarlı ölçüm zamanlarına ilişkin olasılıklar hesaplanamaz.

İzlem zamanlarının küçükten büyüğe doğru dizildiği serilerde tekrarlı ölçüm az

ise KM, YT’ ye tercih edilir.

- 18 -

KM yönteminde kayıplar, eksik veriler dikkate alınmaz, sadece ölümler

üzerinden yaşam olasılığı hesaplanır. Yaşam olasılığı ise ölüm olayının

gerçekleştiği ana ilişkin olarak hesaplanır.

KM yönteminde kesin ölüm tarihi kullanıldığı için nokta yaşam olasılığı

bulunur, YT yöntemi ise yaklaşık bir olasılık verir, çünkü izleme aralığı gruplara

ayrılmaktadır.

5.1. Kaplan-Meier İçin Yaşam Fonksiyonunun Hesaplanması

N birimin gözlenen yaşam süreleri t1<t2<t3<…<tN şeklinde sıralanmış olsun. N bireyin

yaşam fonksiyonu;

(36)

Şeklinde hesaplanır. Bu formülde;

Şeklinde belirlenir. Y(t)’nin standart hatası;

(37)

Biçiminde hesaplanır.

Y(t) her cevap zamanı için değişebilen aşamalı bir fonksiyondur. t zamanı değiştikçe

Y(t) fonksiyonu da kademeli olarak değişim gösterir. Benzer izlem zamanına sahip

gözlemler (tieb observations) bulunması durumunda, hesaplanan değer, dizideki canlı

gözlemleri ifade edem sıradaki bir önceki ölümü belirten birime ilişkin olarak

hesaplanır.

Kümülâtif Ölüm Fonksiyonu (Λ(t))

Yığılımlı ölüm fonksiyonu, tahmin edilen P(t) yaşam fonksiyonunun eksi işaretli doğal

logaritması olarak hesaplanır ve Peterson tahmin edicisi olarak bilinir ve;

(38)

Biçiminde hesaplanır. (Özdamar, 2003)

- 19 -

Ortalama Yaşam Süresi

İzlenen n birimin ortalama yaşam süresini belirtir. Örneğin izlenen hastalardan ölenlerin

sayısı D tane ve bunların ölüm zamanları da t1<t2<t3<…<tD olarak sıraya dizilmiş olsun.

Bu dizide ortalama yaşam sürelerinin tahmini (µ);

(39)

Şeklinde belirlenir. Yukarıdaki Y(ti), ti’deki tüm verilere dayalı olarak hesaplanan

Kaplan-Meier yaşam olasılığıdır. µ’nün varyansı Var(µ);

(40)

Formülü ile elde edilir. Burada sj;

(41)

Biçiminde hesaplanan değerdir. (Tamam, 2008)

Çeyrek Değerler (Quantils)

Product-limit yöntemine göre yapılan hesaplamalarda t(q) q’nuncu çeyrek değerlerin

tahminini belirtir. q=0.5 medyan değeri q=0.25 1’inci çeyrek değeri q=0.75 ise 3’üncü

çeyrek değeri ifade eder. Ti zamanındaki yaşam fonksiyonu tahmini P(ti) olarak

alındığında çeyrek değerler;

ve

(42)

Alınarak t(q)’daki olasılık yoğunluk fonksiyonu tahmini hesaplanabilir.

Eğer u(q+0.05)=t(q-0.05) ise, olasılık yoğunluk fonksiyonu hesaplanabilir.

(43)

Olarak ve varyansı;

(44)

Olarak hesaplanır.

- 20 -

Bazı durumlarda aynı hastalığa yakalanan bireyler iki yada daha fazla gruba ayrılarak

her gruba farklı bir tedavi yöntemi uygulanabilir. (Örneğin farklı ilaç, farklı ameliyat

gibi) Farklı yöntemlerle tedavi edilen hastalar için birden fazla yaşam fonksiyonu

hesaplanabilir. Bu yaşam fonksiyonlarının birbiriyle olan farklılıkları test edilebilir.

Farklı gruplara göre elde edilen yaşam fonksiyonlarının karşılaştırmasını yapmak için

yaygın olarak kullanılan testlerden Log-Rank testi, Breslow-Wilcoxon testi ve Tarone-

Ware testleri sayılabilir. (Le, 1997)

6. İKİ YAŞAM TESTİNİN KIYASLANMASI

Aynı hastalığın iki farklı türü için, androjen grubundan aplastik anemi ve

immunospuresif tedavi gruplarının sağkalım analizleriyle ilgilendiğimizi varsayalım.

Bu grup içinde Yaşam Tablosu ya da Kaplan-Meier yöntemleriyle sağkalım oranları

hesaplanıp sağkalım eğrileri çizilebilir. Peki, iki tedavi arasında sağkalım açısından fark

var mıdır? Tedavilerden biri diğerinden üstün müdür?

Sağkalım oranları açısından yalnızca farklı tedavi grupları değil, prognoza etki eden

etkenler açısından farklı hasta gruplarının da karşılaştırılması sıklıkla gerekir. Örneğin

tümör evresi açısından dört farklı gruba ayrılan hastaların sağkalım oranlarının farklı

olup olmadığının bilinmesi çok yararlıdır. Eğer tüm hastalar çalışma bitmeden önce

ölmüş olsalardı, izlem süreleri sansürsüz olacağı için iki grup için Mann-Whitney U

testi, ikiden çok grup için Kruskal-Wallis testi ile bu sorun çözülebilirdi. (İzlem süreleri

hemen hemen her zaman logaritmik dağılım gösterdikleri için nonparametrik testler

örnek olarak verilmiştir). Ancak izlem sürelerinin bir kısmı sansürlü olacağı için bu

yöntemler uygun değildir. Bu nedenle sansürlü değişkenlerin karşılaştırılması için

yöntemler geliştirilmiştir. Bunların çoğunda zahmetli tablolar ve uzun hesaplamalar

olduğu için elle yapılması zaman alıcıdır. Bunlar; Log-Rank testi, Breslow-Wilcoxon

testi ve Tarone-Ware testleri olarak sayılabilir. (Özdemir, 2012)

6.1. Breslow-Wilcoxon Testi

Gehan testi, Breslow testi, ikiden çok grup olduğunda genelleştirilmiş Kruskal-Wallis

testi olarak da bilinir. Wilcoxon işaret testinin sansürlü gözlemler için geliştirilmiş

şeklidir. Bu yöntemde iki grupta yer alan denekler ikişer ikişer karşılaştırılır.

Androjen grubundan aplastik anemi ve immunosupresif tedavi gruplarının sağkalım

analizleriyle ilgilendiğimizi varsaymıştık. İki grupta 30’ar hasta olduğunu varsayalım.

Toplam ikili karşılaştırma sayısı 30x30=900 olacaktır. Örneğin androjen grubundaki

birinci hasta ile immunosupresif grubundaki birinci hastanın sağkalım eğrileri

karşılaştırıldığında, eğer birinci gruptaki hastanın yaşam süresi diğerinden uzunsa +1,

kısaysa -1 olarak kodlanır. Sansürlü gözlemler sebebiyle hangisinin yaşam süresinin

daha uzun olduğu bilinemiyorsa 0 olarak kodlanır. 900 ikili hasta eşi hesaplandıktan

sonra hesaplanan W değerine Breslow-Wilcoxon test istatistiği denir. Z tablosundan W

- 21 -

değerine karşılık gelen p değeri <0.05 ise iki sağkalım eğrisinin birbirinden farklı

olduğu sonucuna varılır. (Özdemir, 2012)

Testin uygulanışı

H0: İki grup arasındaki medyan farkı sıfırdır.

H1: İki grup arasındaki medyan farkı sıfır değildir.

i=1…N için |X2,2 - X1,i| ve sgn(X2,2 - X1,i ) hesaplanır. (sgn işaret fonksiyonu)

+1, -1 ve 0 kodlamaları buna göre yapılır.

Mutlak farklar Nt eşit alınan sıralamalar için Ri gösterilsin; W şöyle hesaplanır.

(45)

N arttıkça W örnekleminin dağılımı normal dağılıma yakınlaşır, Bu durumda;

(46)

z > zkritik ise H0 red.

Nt >10 ise W kritik değeri bir tablo değeriyle karşılaştırılır.

ise H0 red. (Altman, 1991)

6.2. Log-Rank Testi

İki sağkalım eğrisinin karşılaştırılmasında sık olarak kullanılan diğer bir test ise logrank

testidir. Literatürde Mantel logrank istatistiği, Cox-Mantel logrank istatistiği ya da

kısaca logrank istatistiği olarak adlandırılmıştır. (McNolley, 2013) Peto-Peto logrank

testi ile de aynı sonuca ulaşılır. Logrank testinin mantığı, iki oranın karşılaştırıldığı ki-

kare testinin mantığına benzer. Her bir zaman aralığı için gruplardaki gözlenen ölüm

sayıları, beklenen ölüm sayıları ile karşılaştırılarak hesaplanan ki-kare değeri, eğer tablo

ki-kare değerinden büyükse (bu durumda p<0.05 olacaktır), iki sağkalım eğrisinin

birbirinden farklı olduğu sonucuna varılır. Ancak iki sağkalım eğrisinin ne kadarlık bir

izlem süresi sonunda birbirinden ayrıldığını logrank testi belirtmez.

İkiden fazla grup karşılaştırılıyorsa, ikişerli karşılaştırmaların da yapılması gerekir. Bu

durumda karşılaştırılan iki grubun sağkalım eğrilerinin farklı olduğu sonucuna varmak

için yanılma payını 0.05’den daha aşağıya çekmek gerekir. Örneğin tümör evresine göre

4 farklı gruba ayrılan hastaların sağkalım eğrilerinin logrank testi ile farklı olarak

saptandığını varsayalım. Evre I-II, evre II-III ve evre III-IV arasında sağkalım

- 22 -

eğrilerinin farklı olup olmadığı test edilirken, üç ayrı ikişerli karşılaştırma yapıldığı için

p<0.05 yerine p<0.017 (0.05/3) ise iki grup arasında fark olduğu söylenebilir. P

değerleri Evre I-II için 0.13, evre III için 0.03 ve evre III-IV için 0.001 ise, yalnızca

evre III ile evre IV için sağkalım eğrilerinin farklı olduğu söylenebilir. Evre II ile III’ün

karşılaştırılmasında p>0.017 olduğu için bu iki grup arasında fark olduğu söylenemez.

İkinci bir değişkene göre kategorize edilmiş alt grupların sağkalım eğrileri de

karşılaştırılabilir. Örneğin tümör evrelerine göre sağkalım eğrileri farklı olabilir, ama

erkek ve kadınlarda durumun aynı olması gerekmez. Erkeklerde evre III’de, evre II’ye

göre sağkalım süresi daha kısa iken, kadınlarda durum farklı olabilir. Bu nedenle

evreye göre belirlenmiş dört farklı sağkalım eğrisinin analizinde cinsiyete göre

tabakalandırma gerekebilir. Tabakalandırılmış sağkalım analizi, sağkalım süresine etkisi

araştırılan asıl değişkenin (örneğin tümör evresi) etkisinden tabakalandırıcı değişkenin

(örneğin cinsiyetin) etkilerinin arıtılmasını sağlar. Tabakalandırılmış sağkalım

analizinde kullanılan yöntemlerden biri olan Mantel-Haenszel ki-kare testi, logrank

testinin genelleştirilmiş bir şeklidir. (Lawless, 2003)

Logrank testine ek olarak birden çok kategorik değişkenin farklı düzeyleri arasında

sağkalım eğrileri açısından fark olup olmadığı incelenebilir. Örneğin aplastik anemide

iki farklı tedavinin sağkalım süresi üzerindeki etkileri erkek ve kadınlarda farklı ise,

tedavi gruplarının sağkalım sürelerindeki farklılığın nedeninin cinsiyetle ilişkili olup

olmadığı bu yöntemle saptanabilir. Bu anlamda, logrank testi, varyans analizine,

Mantel-Haenzsel ki-kare testi ise kovaryans analizine benzetilebilir. İlk kez 50’li

yıllarda tanımlanan Kaplan-Meier yönteminden sonraki yıllar içinde çeşitli zamanlarda

tanımlanan sağkalım analizleri yaklaşık olarak aynı sonuçları vermektedir. Bu nedenle

tıp literatüründe çeşitli adlarla belirtilen sağkalım analiz yöntemlerinin hangisinin

kullanıldığının pek önemi yoktur. Yalnız logrank grubu testler, Gehan testinden anlamı

ve uygulanabilirliği açısından ayrılır. Gehan testinde testin sonucunu erken dönemdeki

ölümler geç dönemdeki ölümlere göre daha fazla etkilerken, logrank testinde tüm

zamanlar için ölümlerin ortaya çıkışı eşit aşırlıktadır. Öte yandan, logrank testinde farklı

gruplardaki deneklerin risk hızları (hazard rate) oranının, tüm zamanlarda aynı olduğu

varsayılır. Örneğin androjen tedavisi verilenlerde erken dönem ölümleri azalırken,

immünosupresif tedavi verilenlerde geç dönem ölümleri azalıyorsa, bu koşul

sağlanamadığı için logrank testi yerine Gehan testi uygulanmalıdır. Risk hızlarının

oransal olduğu durumlarda Cox oransal risk modeli (Cox proportional hazard model)

uygulanabilir.

Logrank test istatistiği her gözlenen olay anda iki grup tehlike fonksiyonları tahminleri

karşılaştırır. (Özdemir, 2012)

Log-Rank Test istatistiğini şöyle açıklayabiliriz:

j=1…J her bir gruptaki gözlenen olayların farklı süreleri olsun. Her bir süre j, N1j ve

N2j peryodun başındaki risk altındaki (henüz sansürlenmemiş) deneklerin sayıları

olsun.

olsun. O1j ve O2j, j süresinde gerçekleşen olayların sayıları ve

olsun. Bunlarda beklenen değer;

(47)

- 23 -

Ve varyans;

(48)

Şeklindedir. Bu durumda yokluk hipotezi de;

(49)

Şeklindedir. (McNolley, 2013)

6.3. Tarone-Ware Testi

Tarone-Ware testi iki yaşam testinin arasındaki kıyaslama testleri içerisinde ağırlıklı

testler kısmında değerlendirilir. Ağırlıklı testleri oluşturmak için temel alınan esaslar,

asimptotik olarak etkin testler veren dönüşüm fonksiyonu kavramını kullanan Peto-Peto

(1972) ve Radhakrishna’nın metodolojisine (asimptotik etkinliği maksimize eder)

dayanan Tarone-Ware (1977) tarafından tanımlanmıştır. Ağırlıklı testler, her bir

durdurulmamış gözlem süresi için tanımlanan wj ağırlıklarına dayanır. Bu testler,

gözlenen değerler (d1j) ile beklenen değerler (e1j) arasındaki farklara dayanır ve

aşağıdaki gibi ifade edilebilir: (Le, 1997)

(50)

(51)

(52)

(53)

Bazı yazarlar, gözlenen ve beklenen frekanslar arasındaki farkları ağırlıklandırma

yerine, iki gruptaki oranlar arasındaki farkları w*j ile ağırlıklandırmayı tercih

etmektedirler. w*j aşağıdaki gibi tanımlanır:

(54)

- 24 -

U ve V(U) ifadeleri ile yeniden yazılırsa,

(55)

(56)

Biçiminde olur. (Karasoy & Tilki, 2013)

Tablo 1: Ağırlıklı testler (U) için kullanılan ağırlıklar

Test U wj

Gehan UG nj

Peto-Peto UPP

Prentice UPREN

LR Altshuler ULRALT 1

Tarone-Ware UTW

Flemington-Harrington UFH

6.4. Testlerin Karşılaştırılması

Yaşam eğrilerini karşılaştırmada kullanılan testi doğru seçmek oldukça önemlidir.

Farklı test, farklı sonuca götürebilmektedir.

Skor testlerinden log-rank testindeki S istatistiği değeri Cox-Mantel testindeki değerle

hemen hemen aynıdır. Yuvarlamadan dolayı küçük farklılıklar olabilmektedir.

Örneklem büyüklükleri küçük olduğunda (n1, n2 ≤ 50) ve eğer örneklem dağılımları

üstel ya da weibull ise Cox’un F testinin Gehan testinden daha güçlü olduğu

belirtilmektedir.

Örneklemler üstel dağılımdan örneklemler ise Cox-Mantel ve log-rank testlerinin Gehan

ve Peto- Peto testlerinden daha güçlü ve daha etkili olduğu belirtilmektedir.

Hazard oranı sabit olmadığında (orantılı hazard varsayımı sağlanmadığında) Gehan ve

Peto-Peto testlerinin diğer testlerden daha güçlü olduğu, log-rank testinin ise böyle

durumlarda uygun olmadığı, tersi durumda ise log-rank testinin en yüksek güce sahip

olduğu ifade edilmektedir.

Log-rank testi tüm başarısızlıklara eşit ağırlık verirken Gehan ve Peto-Peto testleri

erken görülen başarısızlıklara daha fazla ağırlık vermektedir. Bu nedenle, Gehan ve

Peto-Peto testlerinin iki yaşam dağılımlarındaki erken farklılıkları belirlemesi daha olası

iken, log-rank testi sağ kuyruktaki farklılıklar için daha duyarlı olmaktadır.

- 25 -

İki dağılım farklı, fakat onların tehlike ya da yaşam fonksiyonları çakışıyorsa log-rank

ve Gehan çok güçlü değildir. Bu durumda Tarone-Ware gibi diğer testleri incelemek

gerekmektedir.

Peto-Peto ağırlığı olan ile Prentice ağırlığı olan

’in çok benzer sonuçlar

verdiği belirtilmektedir.

Flemington-Harrington testi, p ve q değerlerinden dolayı oldukça esnek bir testtir. p=0,

q=0 olduğunda log-rank teste, p=1, q=0 olduğunda ise Peto-Peto testine dönüşmektedir.

Bu test, q=0, p>0 olduğunda, p=0.5, q=0.5 olduğunda erken meydana gelen

başarısızlıklara, p=0, q>0 olduğunda, p=1, q=1 olduğunda, p=0.5, q=2 olduğunda geç

meydana gelen başarısızlıklara daha çok ağırlık vermektedir. (Karasoy & Tilki, 2013)

7. COX REGRESYON MODELİ

Bir izlem araştırmasında incelenen bağımlı değişken (yaşam süresi) bir hastalığa

yakalanan bireylerin ölüm zamanlarına kadar geçen izlem süreleri ise; açıklayıcı

değişkenler, bu değişken üzerinde etkide bulunan faktör değişkenler (yaş, cinsiyet,

tedavi türü vs.) olur. Tamamlanmamış izlem verilerinde, bağımlı değişken ile bağımsız

değişkenler arasındaki neden-sonuç bağlantısını ortaya koymak için yararlanılan

regresyon yöntemine Cox regresyon yöntemi adı verilir. (Özdamar, 2003)

Regresyon analizine ilişkin açıklayıcı değişkenler arasındaki neden sonuç ilişkisi

kurulurken bu değişkenlerin uyması gereken koşullar vardır. (bağımlı değişkenler

normal dağılmalıdır, bağımsız değişkenler ardışık bağımlı olmamalıdır vs.) Yaşamsal

verilerde prognostik değişkenler normal dağılım göstermemekte, birbirleriyle

korelasyon göstermekte ve yaşamsal verilerin neden-sonuç ilişkilerini analizde çoklu

regresyon analizi uygulanamamaktadır. Yaşamsal verilerin nedensellik analizlerinde

Cox regresyon yöntemi kullanılır. (Tamam, 2008)

Cox’un (1972) Orantısal Ölüm Riski Bağıntı Modeli (Propotional Hazard Regression

Model) ölüm hızlarının bu değişken değerlerinin loglinear fonksiyonu olduğu

varsayımından yola çıkarak geliştirilmiştir. Yaşamsal verilerde prognostik değişkenler

arasında orantısal bir etki söz konusudur.

Cox yönteminde bir riske maruz kalan kişinin izlendiği T zaman süresinin herhangi bir

ti zamanında ölümle karşılaşacağı varsayılır. Böylece ister hastalıktan isterse prognostik

faktörlerden dolayı bireylerin t0 zamanındaki yaşam süreleri logaritmik olarak azalan bir

fonksiyona sahip olur.

Eğer Zi kadar prognostik değişken yaşam süresinin loglinear bir fonksiyonu olarak ele

alınarak loglinear modellerde incelemeye alınabiliyorsa, Cox’un Propotional Hazard

Regression yönteminden yararlanılarak her bir prognostik değişkenin yaşam süresi

üzerindeki etkisi izlenebilir.

- 26 -

Zi prognostik değişkenler vektörü z ve yaşam süresi t olsun. Bir bireyin Zi ortak

değişkenine göre ölüm fonksiyonu h(t;z) olarak alınabilir. Buna göre orantısal ölüm

modeli (Propotional Hazard Regression Model veya z açıklayıcı değişkenine göre

regresyon modeli);

(57)

Bu modelde regresyon katsayıları vektörü; olduğunda temel (baseline)

ölüm fonksiyonudur.

Cox regresyon modelinde iki temel varsayım vardır. Bunlar;

Prognostik değişkenlerin ölüm fonksiyonu üzerindeki etkileri loglineerdir.

Prognostik değişkenlerin loglineer fonksiyonu ile ölüm fonksiyonu arasında

çarpımsal bir ilişki vardır.

Bu varsayımlara göre, farklı prognostik değişken setlerine sahip olan iki birimin ölüm

fonksiyonları oranı zamana bağlı değildir, ölüm riskleri orantısaldır.

Yaşamsal verilerde neden-sonuç ilişkilerinin ortaya konmasında Cox tarafından

önerilen regresyon modeli kullanılır.

z ortak değişken matrisinin tek yada çok değişkenli olmasına göre regresyon katsayıları

aşağıdaki modellere göre tahmin edilir.

Tek değişkenli cox regresyon modeli;

(58)

Çoklu Cox regresyon modeli;

(59)

biçiminde yazılır. (Özdamar, 2003)

Bu eşitlikte X1, X2,…,Xp ortak değişkenlerdir. Ortak değişkenler yaşam süresine

etkide bulunan yaş, kan basıncı, sıcaklık gibi, sürekli değişkenler ise hastalık evresi,

histolojik evreler gibi kategorik değişkenler olabilir. Eğer ortak değişkenler setinde

kategorik değişkenler varsa bunların orijinal kategorileri göz önüne alınıp yeni değişken

veri setleri oluşturularak transforme edilmeleri gerekir. Kategorik değişkeni ifade eden

yeni transform değişkenin kategori sayısı, orijinal kategori sayısından az olmalıdır.

7.1. Çoklu Cox Modelinde b Katsayılarının Hesaplanması

Gözlenen n tane yaşam süresi arasından k tanesi sıralanmış olarak (t1<t2<…<tk) ölüm

sonucu olan verileri göstersin. Bir Ri setinde ti zamanında değerleri saptanan zi ortak

- 27 -

değişken vektörü belirlenmiş olsun. Bir prognostik değişkenin yaşam süresi üzerinde

etkide bulunan tüm değişkenler dikkate alınarak belirlenecek genel risk içindeki oranı

riskler oranı biçiminde belirlenir.

(60)

k farklı ölüm zamanlarının bu oranla çarpımı kısmi benzerlik fonksiyonunu verir.

Regresyon katsayıları bu kısmi benzerlik fonksiyonu yardımı ile tahmin edilirler.

Kısmi benzerlik fonksiyonu L(β);

(61)

Biçiminde hesaplanır. β katsayılarının en büyük benzerlik tahminleri logaritmik

benzerlik fonksiyonunu en büyükleyerek aşağıdaki gibi hesaplanır.

(62)

Burada;

Di: ti zamanında ölen kişilerin seti

mi: ti zamanındaki cevapların sayısı

Ri: ti zamanında canlı olan kişilerin setini belirtmektedir.

ZI(ti): ti zamanında i’inci birey için ortak değişken vektörü

log lineer riskini belirtmektedir.

β katsayılarının hesaplanmasında Newton-Raphson algoritması kullanılır ve ardışık

tekrarlanan çözümlemeler ile β’nın tahminleri yapılır.

Veri setinde benzer süre gözlemleri olduğunda L(β)’nın maksimizasyonu Breslow

(1974) tarafından ileri sürülen yaklaşım;

(63)

İle hesaplanır. β katsayılarının önemliliği için H0: β=0 hipotezi test edilir. Bu amaçla üç

yöntem vardır, bunlar Wald testi, Benzerlik Oranı testi ve score testidir. (Özdamar,

2003)

- 28 -

Sonuç:

Yaşam analizlerinin temel kavramları ve ilişkili konular detaylandırılmış, veri tipine ve

ihtiyaca göre hangi tekniğin kullanılacağı anlatılmış, ilgili konuların irdelenmiş ve

detaylandırılmıştır. Yaşam analizlerinde çalışmalar yapan uzmanlara faydalı olması

umulmaktadır.

8. Kaynakça Altman, D. G. (1991). Practical Statistics for Medical Research. Monographs on Statistics and

Applied Probability (first ed.). Londra: Chapman & Hall.

Karasoy, B., & Tilki, B. (2013). Yaşam eğrilerini karşılaştırmak için kullanılan skor ve.

İstatistikçiler Dergisi: İstatistik ve aktüerya Sayı 6 , 1-13.

Kleinbaum, D. G. (1996). Survival Analysis a Self Learning Text. New York: Springer.

Lawless, J. F. (2003). Statistical Models and Methods for Lifetime Data. New York: John Wiley.

Le, C. (1997). Applied Survival Analysis. New York: John Wiley.

McNolley, W. W. (2013, Mart 10). Long-Rank Test. Ocak 10, 2014 tarihinde Wikipedia:

http://en.wikipedia.org/wiki/Logrank_test adresinden alındı

Nelson, W. (1982). Applied Life Data Analysis. Kanada: John Wiley & Sons.

Özdamar, K. (2003). Spss ile Biyoistatistik. Eskişehir: Kaan Kitapevi.

Özdemir, O. (2012). Sağkalım Analiz Yöntemleri-1. IKU , 21-33.

Tamam, D. (2008). Tam ve sansürlü örneklem durumlarında weibull dağılımı için bazı istatistiki

sonuç çıkarımları. 8-12.

Survival Analysis and Cox regression model

Documents

Transcript of Survival Analysis and Cox regression model