Survival Analysis and Cox regression model
Transcript of Survival Analysis and Cox regression model
YAŞAM ANALİZLERİ VE
COX REGRESYON MODELİ* M. Emin YAYLA
ÖZET
Yaşam analizi yapılacak çalışmalarda genellikle başarısızlık olarak adlandırılan ve
genellikle bozulma veya ölüm gibi adlandırlamalarla karşımıza çıkan olayların meydana
gelmesine kadar geçen süre olarak elde edilen verilerin analizidir. Yaşam analizi başta
tıp olmak üzere sosyal bilimler ve aktüerya gibi alanlarda kullanılmaktadır ve bu
bilimler için oldukça önemlidir. Bu çalışmada Yaşam Fonksiyonu, Hazard Fonksiyonu,
Kaplan-Maier tahmin edicisi, iki yaşam testinin kıyaslanması başlıkları ve Cox
regresyon yöntemi açıklanmıştır. Bununla birlikte aralarındaki ilişki de çalışmada
açıklanmıştır.
Kasım 2013,
Anahtar kelimeler: Yaşam analizi, Kaplan-Maier, Hazard, Cox modeli
*Türkçe Çevirisi/Versiyonudur. Her hakkı saklıdır.
- 1 -
SURVIVAL ANALYSIS AND COX REGRESSION MODEL
M. Emin YAYLA
ABSTRACT
The survival analysis is the analysis of data that are called as a failure within the studies
that will be done, and, the data obtained as elapsed time which could be seen until the
formulation of events such as break, dead and putrefaction. The survival analysis is used
in the areas of social science, actuaria and the medicine and it is very important area for
these sciences. Within the framework of this study the basic concepts of Survival
analysis, Hazard function, Kaplan-Maier estimator, Comparison of the binary survival
tests and Cox regression model will be detailed.
November 2013,
Key Words: Survival analysis, Kaplan-Maier, Hazard, Cox model
- 2 -
İçindekiler 1.1. BAZI KAVRAMLAR .......................................................................................................... - 4 -
1.2. YAŞAM ANALİZİNDE YAŞAM TABLOSU YÖNTEMİ (CUTLER-EDERER METODU) ................ - 4 -
2.1. Sürekli Modeller ............................................................................................................ - 6 -
2.2. Kesikli Modeller ............................................................................................................. - 7 -
4.1. SANSÜRLEME ...............................................................................................................- 12 -
4.1.1. Sağdan Sansürleme ...............................................................................................- 12 -
4.1.1.a. I. Tür Sansürleme ............................................................................................- 13 -
4.1.1.b. II. Tür Sansürleme ...........................................................................................- 14 -
4.1.1.c. Bağımsız Rastgele Sansürleme .........................................................................- 14 -
4.1.1.d. İlerletilmiş İkinci Tür sansürleme .....................................................................- 15 -
4.1.2. Soldan Sansürleme ................................................................................................- 15 -
4.1.3. Aralık Sansürlemesi ...............................................................................................- 16 -
4.1.4. İkili Sansürleme .....................................................................................................- 16 -
5.1. Kaplan-Meier İçin Yaşam Fonksiyonunun Hesaplanması ...............................................- 18 -
6.1. Breslow-Wilcoxon Testi ................................................................................................- 20 -
6.2. Log-Rank Testi ..............................................................................................................- 21 -
6.3. Tarone-Ware Testi........................................................................................................- 23 -
6.4. Testlerin Karşılaştırılması ..............................................................................................- 24 -
7.1. Çoklu Cox Modelinde b Katsayılarının Hesaplanması ....................................................- 26 -
- 3 -
1. YAŞAM ANALİZİ
Yaşam analizi belli bir hastalığa maruz kalan bir bireyin tanısından sonra uygulanan bir
girişimden (tıbbi tedavi, operasyon, kemoterapi vs.) daha ne kadar yaşayabileceğini ya
da hastalığın ne kadar sürede nüksedebileceğini tahmin etmek, tedavi tiplerinin ve diğer
faktörlerin yaşam üzerindeki etkilerini incelemek amacıyla geliştirilmiş yöntemler
bütünüdür.
Yaşam analizi T zaman süresinde n sayıda izlenen hasta biriminden elde edilen yaşam
sürelerinin (izlem süreleri, araştırma periyodu) dağılımını açıklayarak, yaşam sürelerini
etkileyen ve etkilemesi olası değişkenleri içeren modeller kurarak bu modellere göre
parametre tahminleri yapmayı amaçlamaktadır.
Belli bir girişime tabi tutulan hastaların T süresi içinde bir kısmı iyileşirken, bir kısmı
ölebilir, çeşitli nedenlerle takip dışında kalabilir. Yine bir kısım hasta gözlemleme
yapılırken kısa sürede ölebilir veya uzun süre hayatta kalabilir. Araştırma süresi sona
erdiği için izlendikleri halde hayatta kalan hastalar olabilir. Bu nedenle izlem süreleri
tamamlanmış ya da tamamlanmamış süre olarak iki şekilde adlandırılır.
Bir hastalığa yakalanan kişinin aldığı tedavi türünün ve bazı prognostik değişkenlerin
(hastanın zamana bağlı olarak durumunda değişmelere sebep olan faktörler) yaşam
süresi üzerindeki etkilerini ortaya koymak için yaşam analizi yöntemlerinden
yararlanılır.
Hastalık olgularında hastaların herhangi bir medikal veya cerrahi girişimden sonraki
yaşamlarının izlem zamanları; izlem süresi, yaşam süresi, lezyonsuz geçen süre,
remisyon zamanı gibi isimlerle adlandırılır. Bu süreler izleme zamanına ilişkin gün, ay,
yıl gibi süreleri içerir. Yaşam analizi yöntemleri izlem sürelerini ve diğer faktörleri
içeren veri setlerinde yaşam sürelerini ele alarak yaşam olasılıkları, ölüm olasılıkları,
ortalama yaşam süresi, ortanca yaşam süresi gibi tahminler yapmayı amaçlayan
yöntemlerdir. (Özdamar, 2003)
Yaşam analizi tıp bilimlerinde çokça kullanılsa da mühendislik, sosyal bilimler ve
aktüerya alanlarında da kullanılır ve oldukça önemlidir. Üretim aşamasında ve
sonrasında ürünlerin dayanıklılığı, kullanılma süreleri, bozulma, çürüme gibi unsurlar
tıp biliminde olduğu mantıkla değerlendirerek analizler yapılır.
Yaşam analizinde en önemli unsur yaşam süresidir. Yaşam modellerinin temel
kavramlarından biri de sansürlemedir. Sansürlenmiş verilerin varlığı, yaşam analizini
diğer istatistik modellerinden ayıran en belirgin özelliktir. Sansürleme kavramından
bahsedilirken, sansürleme çeşitleri verilip sansürleme çeşitlerine göre olasılık yoğunluk
fonksiyonları verilecektir.
Parametrik olmayan istatistiksel yöntemler belli bir dağılım varsayımı
gerektirmediğinden pratikte daha kullanışlıdır. Ancak, parametrik yöntemler daha
profesyonel sonuçlar vereceğinden, yaşam analizinde kullanılan önemli dağılımlarla
çalışmak daha çok tercih edilen bir yoldur. (Tamam, 2008)
- 4 -
Yaşam analizi, bazı uygulamalarda güvenilirlik analizi veya sağ kalım analizi olarak da
isimlendirilmektedir. Yaşam analizinde kullanılan “başarısızlık” terimi, incelenen
konunun denekte görülmesi durumudur. Canlılar için genelde ölüm veya hastalık,
mekanik aletler için ise bozulma anlamına gelir (Nelson, 1982)
1.1. BAZI KAVRAMLAR
Yasam analizi, başarısızlık olarak adlandırılan bir olayın meydana gelmesine kadar
geçen sürede elde edilen verilerin analizidir.
Yaşam analizinde geçen bazı kavram ve gösterimler aşağıda kısaca açıklanmıştır
(Özdamar, 2003).
Yaşam süresi, bir bireyin belirli girişime ya da etkene maruz kaldıktan sonra
iyileşmesine, hastalığın tekrarlamasına ya da ölüme kadar geçen süreye denilmekte ve
ti ile gösterilmektedir.
Yaşam fonksiyonu, yaşam sürelerinin olasılık dağılımına denilmektedir. Fonksiyon,
yaşamsal verilerin genel eğilimini matematiksel bir modelle ifade eder. Yaşam
fonksiyonu bir olasılıktır ve S(t) ile gösterilmektedir.
Ani ölüm olasılığı (Hazard fonksiyonu), sağ olan bir kişinin, belirli bir zamanda (anda)
ölüm olasılığı, taşıdığı ölüm riskidir ve h(t) ile gösterilir.
Birikimli ölüm fonksiyonu (birikimli Hazard fonksiyonu), T zamanı içinde belirli bir t
zamanı (anı) için hesaplanmış olan ölüm olasılıklarının birikimli fonksiyonudur ve Λ(t)
ile gösterilir.
1.2. YAŞAM ANALİZİNDE YAŞAM TABLOSU YÖNTEMİ (CUTLER-
EDERER METODU)
Yaşam tablosu yöntemi yaşam süresi verilerini eşit zaman aralıklarına göre frekans
tablosuna dönüştürerek analiz eden ve her bir zaman aralığında yaşam fonksiyonlarını
hesaplamayı amaçlayan bir yöntemdir. Bu yöntem, ölüm düzeylerinin ölçülmesi ve
belirli bir yılda doğan kuşağın (kohort) herhangi bir yaşta beklenen yaşam sürelerini
tahmin etmek için geliştirilmiştir. Sonraları uygulama alanı genişleyen bu yöntem,
nüfus yapısı ve özellikleri, 0 yaşta beklenen yaşam ümidi, sağlıklı ve hastalıklı yaşam
süresi, tedaviden sonra hastanın kaç yıl yaşayacağı gibi konularda tahmin ve kestirim
aracı olarak kullanılmaya başlanmıştır.
YT yöntemi, yaşam sürelerinin k sayıda (k>6) eşit aralıklı sınıfa ayırdığı, tekrarlanan
zaman sürelerinin fazla olduğu, birim sayısının 100’ün üzerinde (n>100) olduğu veri
setlerinde X etkenine maruz kalan birimlerin yaşam ve ölüm olasılıklarının, ortalama
yaşam süresinin hesaplanmasını sağlayan yöntemdir. Burada yönteme kısaca
değinilecektir.
- 5 -
YT yönteminde her sınıftaki birimlerin eşit ölüm riskine sahip olduğu varsayılır. i’inci
aralıkta ölen hastalar dışındaki hastalar i+1’inci sınıfa eşit ölüm riski/yaşam olasılığı ile
geçerler. i’inci aralıktaki hasta sayısı ri;
(1)
Şeklinde hesaplanır. Burada ni; i’inci aralığa sağ olarak giren hasta sayısını, ci; i’inci
aralıkta yaşayan hasta sayısını (takipten çıkanlar dâhil) belirtir. YT yönteminde her
aralıktaki hastaların bulundukları aralığa eşit olarak dağıldığı (uniformly distributed)
varsayılır. Bu varsayıma göre, yaşayan kişilerin sınıf değerinde (sınıf orta noktasında)
riske maruz kaldıkları varsayılır. i’inci aralıktaki kişilerin taşıdıkları ölüm riski qi;
(2)
Şeklinde hesaplanır. Burada di; i’inci aralıkta ölen kişilerin sayısını ifade eder. Yaşam
olasılığı pi;
(3)
Şeklinde hesaplanır. i’inci aralıktaki yığılımlı yaşam olasılığu Yi ise;
(4)
Şeklinde hesaplanır. i’inci aralıkta yaşayanların (i+1)’inci aralığa canlı olarak geçeceği
varsayılır ve izlem periyodunda araştırmaya dâhil olacakları varsayılır. Burada Y1=1
alınır. Yi’nin standart hatası ise;
(5)
Şeklinde hesaplanır. Ölüm olasılık yoğunluk fonksiyonu;
(6)
Şeklinde hesaplanır. Burada fi; i’inci aralığın sınıf orta noktasındaki ölüm olasılığını
vermektedir ve hi sınıf aralığıdır. Ölüm olasılığının standart hatası ise aşağıdaki gibidir.
(7)
Yaşam tablosuyla SPSS uygulaması konuların sonunda verilmiştir.
- 6 -
2. YAŞAM FONKSİYONU
Yaşam süresi dağılımları sürekli ve kesikli modeller olmak üzere ikiye ayrılır.
2.1. Sürekli Modeller
Yaşam süresinin negatif olamayacağı kabulü göz önüne alınarak, bir kitledeki canlıların
yaşam süresi, negatif olmayan sürekli bir T rastgele değişkeni ile gösterilsin.
Herhangi bir canlının t zamanından önce ölmesi olasılığı,
(8)
Olarak tanımlanan “dağılım fonksiyonu” yardımıyla bulunur. Burada f(t) ise T rastgele
değişkeninin olasılık yoğunluk fonksiyonudur.
Yukarıda tanımlanan T rastgele değişkeni için herhangi bir canlının t zamanına kadar yaşadığı
biliniyor olsun. Bu canlının t zamanından sonra yaşaması olasılığı,
(9)
Şeklinde tanımlanan fonksiyon yardımıyla bulunur. Bu fonksiyona yaşam fonksiyonu adı
verilir.
Yaşam fonksiyonu ile dağılım fonksiyonu arasında,
Şeklinde bir ilişki vardır. (Miller 1991)
Dağılım fonksiyonu F(t) azalmayan bir fonksiyon,
dir. Burada,
- 7 -
(10)
Olması sebebiyle yaşam fonksiyonu S(t)’nin yukarıdaki özellikleri taşıyan azalan bir fonksiyon
olduğu söylenir.
2.2. Kesikli Modeller Yaşam süreleri bazen kesikli olarak ifade edilmiş olabilir. T rastgele değişkeni 0 ≤ t1 ≤ t2 ≤…
değerlerini alıyorsa T rastgele değişkeninin olasılık fonksiyonu,
ilgili yaşam fonksiyonu,
(11)
şeklindedir.
3. HAZARD FONKSİYONU
Başlık 2.1’de belirtilen T rastgele değişkeninin olasılık fonksiyonu, küçük bir zaman
aralığında bir bireyin başarısız olma olasılığının limitidir.
Bu fonksiyon,
(12)
Şeklinde yazılır.
t zamanından sonra yasadığı bilinen bir bireyin, t zamanındaki ani başarısızlık ya da
ölüm oranı,
(13)
biçiminde tanımlanan Hazard Fonksiyonu ile belirlenir.
Hazard fonksiyonu T yaşam süresinin t ≥ 0 ve pozitif küçük bir Δt değeri için [t, t+Δt)
aralığında yaşamın koşulu dağılımıdır. λ(t) veya r(t) olarak da gösterilir.
- 8 -
Yaşam fonksiyonu, yaşama olasılığını incelerken; Hazard fonksiyonu başarısızlığı
(ölümü) inceler ve zamana bağlı ölüm riskini belirler. Hazard fonksiyonunun grafiği,
yapılan çalışma için model oluşturmada önemli ipuçları verir. Bu sebeple, yaşam
fonksiyonu gibi, Hazard fonksiyonu da, yaşam modellerinin önemli bir karakteristiğidir.
Ayrıca;
(14)
dir. Başka bir deyişle h(t) fonksiyonu,
(15)
olarak ifade edilebilir. (Cross and Clark 1975)
Bu eşitlikte her iki tarafın integrali alınırsa;
(16)
Sonucuna ulaşılır.
Burada Λt “Birikimli Hazard Fonksiyonu” olarak adlandırılır ve
(17)
- 9 -
şeklinde ifade edilir.
Kümülatif Hazard fonksiyonu aşağıdaki özellikleri taşır:
(i) Λ(t)=0’dır. Çünkü
(18)
Veya S(0) = 1 olduğundan Λ(0) = 0 olduğu görülür.
(ii) Λ(∞)=∞’dur. Çünkü;
(19)
Veya S(∞) = 1 olduğundan Λ(∞) = ∞ olduğu görülür.
x anından sonra yaşadığı bilinen canlının (x, x+t) yaşam aralığında (t zaman sonra)
ölmesi olasılığı ise;
- 10 -
(20)
dir. Sonuç olarak da yaşam fonksiyonu, dağılım fonksiyonu ve Hazard fonksiyonu arasındaki ilişki
şöyle ifade edilir: (Le, 1997)
(21)
Kesikli modellerde yaşam fonksiyonunun
olduğunu söylemiştik.
Buradan Hazard Fonksiyonu;
(22) şeklinde tanımlanır.
Ayrıca;
(23)
olduğundan;
- 11 -
(24)
eşitliği yazılır. (Lawless, 2003)
4. YAŞAM ANALİZİNDE VERİ YAPISI
Yaşam analizindeki en önemli değişken yaşam süresidir. Yaşam süresi de çoğu kez
sansürlü olmaktadır. Yani, bireyin yaşam süresi hakkında her zaman tam bir bilgiye
ulaşılamayabilir. Veri yapısındaki bu farklılık, yaşam analizini diğer istatistiksel analiz
yöntemlerinden ayıran en önemli özelliktir.
Tam örneklem durumunda, her bir bireyin yaşamı, çalışmanın periyodu içerisinde son
bulmuştur. Veriler her bir bireyin ölüm zamanını kapsar. Ancak sansürlü örneklem
durumunda çalışma tamamlandığında bireyler hala yasıyor veya çalışma süresinin
sonuna gelinmiş olmasına rağmen bireylerin yaşam durumu bilinmiyor olabilir. Ya da
birey çalışma süresi içerisinde çeşitli nedenlerle kayıp gözlem durumuna düşmüş,
herhangi bir nedenden dolayı çalışmadan çıkmış olabilir. Yani, tam örneklem
durumunda bireylerin başarısızlık zamanı kesin belli iken, sansürlü örneklem
durumunda ise başarısızlık zamanı hakkında kesin bir bilgiye ulaşılamaz. (Tamam,
2008)
Sansürsüz veri ile sansürlü verilerin grafiklerini birer örnekle vererek sansür üzerinde
duralım.
Şekil 1: Sansürsüz veri
Birey
Zaman
1
2
3
t1
t2
t3
- 12 -
4.1. SANSÜRLEME
Sansürleme; zaman ve maliyet gibi birtakım sınırlamalar nedeniyle, kesin olarak
bilinmeyen, herhangi bir sebeple gözlenemeyen verilerin göz ardı edilmesidir. Bir
çalışmada, ilgilenilen olay bir bireyin yaşam süresi olduğunda, her bir bireyin
çalışmanın başlangıcından sonuna kadar gözlem altında bulundurulması çeşitli
nedenlerden dolayı olanaksızdır. Bu durumda veri “sansürlüdür” denir.
Gözlemlenen birey;
- Tedavi gördüğü süre içerisinde trafik kazası gibi farklı bir sebepten ölmüş,
- Kalp yetmezliği, kan değerlerinin artması v.b. gibi sebeplerle tedaviye ara vermek
zorunda kalmış,
- Başka bir hastanede veya başka bir şehirde tedaviye devam etmek zorunda kalmış,
- Tedaviye cevap vermemiş,
- Tedavi süresi içerisinde başka bir hastalığa yakalanmış,
- Tedaviden vazgeçmiş olabilir. Bu gibi durumlarda yaşam süresi kesin olarak
bilinemeyeceğinden sansürlüdür.
Yaşam modelinde meydana gelebilecek 3 durumdan söz edilebilir (Kleinbaum, 1996).
(a) Birey gözlem esnasında ölebilir.
(b) Birey gözlemden geri çekilebilir. İlgilenilen olay dışında bir başka nedenden dolayı
ölebilir veya uygulanan yöntemlerden beklenmeyen bir sonuç alınabilir.
(c) Birey gözlemin sonunda hala yasıyor olabilir.
(a) durumunda bireyin yaşam süresi bilindiğinden sansürlü değildir. (b) durumunda
bireyin yaşam süresi, gözlemden çekilme zamanından itibaren sansürlüdür. (c)
durumunda ise, bireyin yaşam süresi çalışmanın sonlandırılma zamanına kadar
bilinmesine rağmen, gözlem sonrası hakkında bir bilgi olmadığından bu bireyin yaşam
süresi de sansürlüdür (Kleinbaum, 1996).
Sansürleme, sağdan sansürleme ve soldan sansürleme olarak iki ana gruba ayrılır.
Ayrıca, sağdan ve soldan sansürlemeler kullanılarak elde edilen aralık sansürlemesi ve
ikili sansürleme de genelleştirilmiş sansürleme çeşitleri olarak incelenebilir.
Bu çalışmada, soldan sansürleme sık karşılaşılan bir sansürleme çeşidi olmadığından, en
çok karşılaşılan sansürleme çeşidi olması sebebiyle, sağdan sansürleme üzerinde
durulacaktır.
4.1.1. Sağdan Sansürleme
Başarısızlık olarak adlandırılan (ölüm, bozulma, çürüme v.b.) olay, çalışması için
belirlenen bir durma zamanına kadar gerçekleşmezse, bireyin yaşam süresinin uzunluğu
çalışmanın durma zamanının sağ tarafına geçer. Böyle bir durumda, bu bireyin yaşam
süresi kesin olarak bilinmeyecek ve birey gözleme alınmayacaktır. Yani, bireyin yaşam
süresi sansürlenecektir. Bu tip sansürlemeye “sağdan sansürleme” denir.
- 13 -
Li sansürleme zamanı, Ti bireyin yaşam süresi olmak üzere; Ti > Li olduğunda bu
bireyin yaşam süresinin sağdan sansürlenmiş olduğu söylenir.
(25)
Eğer ise birey sansürlenmiş, ise gözlenmiştir. (Nelson
1982)
Sağdan sansürleme kendi içinde bazı alt gruplara ayrılır:
a. I. Tür sansürleme
b. II. Tür sansürleme
c. Bağımsız rastgele sansürleme
d. İlerletilmiş II. Tür sansürleme
4.1.1.a. I. Tür Sansürleme
I. tür sansürlemede, her bireyin bir sansürleme zamanının olduğu düşünülür (Li > 0).
Bireyler sürece herhangi bir zamanda dahil olurlar ve belirlenmiş durma zamanına
kadar gözlenirler. Ti bireyin çalışma süresince gözlenebildiği süre, Li sansürleme
zamanı ise çalışmanın başlama zamanı ile bitiş zamanı arasında bir zamandır. Bu
durumda, Li sansürleme zamanı sabit bir sayıdır.
I. Tür sansürleme için genel gösterim ti = min(Ti, Li) ve olmak üzere;
için olasılık yoğunluk fonksiyonu;
(26)
olarak tanımlanır.
ve
Eşitlikleriyle;
(27)
Olarak elde edilir. (Lawless, 2003)
- 14 -
4.1.1.b. II. Tür Sansürleme
II. tür sansürlemede, başlangıçta belirlenen bir başarısızlık sayısı vardır. n birey aynı
anda gözlenmeye başlanır ve çalışmanın basında belirlenen sabit bir r tane başarısızlık
gözlendiği anda çalışmaya son verilir. Çalışmanın toplam süresi, r-inci başarısızlık
zamanı olan t(r) ’ ye eşittir. Bu zaman, çalışmanın başında bilinmemektedir.
rastgele örneklem olmak üzere;
‘nin ortak olasılık yoğunluk fonksiyonu,
(28)
biçiminde tanımlanır. Bu ifade sıralı istatistiklerin genel biçimidir. (Lawless, 2003)
4.1.1.c. Bağımsız Rastgele Sansürleme
Bağımsız rastgele sansür modelinde birçok durumda sansürleme süreci, başarısızlık
zamanı (failure time) ile ilişkilidir. Sonlandırma zamanı rastgele olup çalışmadan önce
belli değildir, daha sonradan seçilir. Fakat bu seçim, sonlandırma sürecine kadar
çalışmanın sonuçlarından etkilenir.
T, her bireyin yaşam süresi iken L de sansürleme zamanıdır. T ile L rastgele
değişkenleri bağımsız sürekli rastgele değişkenlerdir.
Ayrıca; S(t) , T rastgele değişkeninin, G(t) de L rastgele değişkeninin yaşam fonksiyonu
iken f(ti), T rastgele değişkeninin ve g(ti) de L rastgele değişkeninin olasılık yoğunluk
fonksiyonudur.
ti = min(Ti, Li) ve olmak üzere;
(29)
Eşitliğinden çifti için olasılık yoğunluk fonksiyonu;
(30)
olarak elde edilir. (Lawless, 2003)
- 15 -
4.1.1.d. İlerletilmiş İkinci Tür sansürleme
İlerletilmiş II. tür sansürleme, II. tür sansürlemenin genelleştirilmiş halidir. Bu sansürleme
çeşidinde, söz konusu olayda yer alan n tane bireyden, başarısız olan r1 tane birey gözlenir. Geriye kalan n − r1 tane bireyden n1 tanesi çalışmadan uzaklaştırılır. Böylece, n-r1-n1 birey
çalışmada kalmış olur. Daha sonra, başarısız olan r2 tane birey gözlenir. Geriye n − r1 − n1 − r2
birey kalır. Kalan bireylerden n2 tanesi çalışmadan alınarak geriye kalan bireyler ile
çalışmaya devam edilir. İşleyiş bu şekilde devam ettirilir.
Olmak üzere verilerin dağılımı;
(31)
şeklindedir. Bölüm 4.1.1.b (denklem 28) ‘de verilen;
Eşitliğinden;
(denk. 31) İfadesinin ilk terimi aşağıdaki gibi yazılır.
(32)
4.1.2. Soldan Sansürleme
Li sansürleme zamanı Ti bireyin yaşam süresi olmak üzere; Ti < Li olduğunda bu bireyin
yaşam süresinin soldan sansürlenmiş olduğu söylenir.
(33)
Eğer ise birey sansürlenmiş ise gözlenmiştir.
(Lawless 2003)
(34)
- 16 -
4.1.3. Aralık Sansürlemesi
Aralık sansürlemesi, genelleştirilmiş bir sansürleme çeşididir. Genellikle takip
gerektiren olaylarda kullanılır. Çalışmaya konu olan olayın meydana gelme süresi, bir
aralıkta ifade edilir. Yaşam süresi (Li, Ri] aralığında yer alır. Eğer aralık sansürlemesi,
sağdan sansürlemenin genelleştirilmiş biçimi olarak ifade ediliyorsa, sol sınır noktasının
0, sağ sınır noktasının ise Li olarak alındığı söylenir.
Soldan sansürlemenin genelleştirilmiş biçimi olarak ifade ediliyorsa da, sol sınır
noktasının Li, sağ sınır noktasının ise (∞) olarak alındığı söylenir. Yani, aralık
sansürlemesi, sağdan sansürlemenin ve soldan sansürlemenin genelleştirilmiş şeklidir.
(Nelson, 1982)
4.1.4. İkili Sansürleme
Bazı çalışmalarda soldan sansürlemenin meydana geldiği durumlarda, sağdan
sansürleme de aynı zamanda ortaya çıkabilir. Böyle durumlarda, yasam sürelerinin ikili
sansürlendiği ifade edilir.
Burada, Li ele alınan olayın birey için gerçekleşmesinden önceki zaman iken, Lj ele
alınan olayın birey için gerçekleşmesinden sonraki zamandır.
Eğer, ya da ise bireyin yaşam süresi kesin olarak biliniyor demektir
(Nelson, 1982)
5. KAPLAN-MEIER TAHMİN EDİCİSİ
Kaplan-Meier tahmin edicisi kullanılan yöntemde hayatta kalma süresinin tahmini
yaşam tablosu ile benzerdir. Fakat Kaplan-Meier yönteminde hesaplamalar frekans
dağılım tablosu üzerinden değil tek tek veriler üzerinden yapılır. Kaplan-Meier
tahmininin bu özelliği az sayıda birey içeren örnekler için kullanılmasına izin verir. Bu
yöntemde hayat kalma süresi her bir ölüm gerçekleştiğinde hesaplandığı için tedaviden
geri çekilen hastalar dikkate alınmaz. (Özdamar, 2003) Bir K-M grafik örneği;
- 17 -
Şekil 2: Kaplan-Meier örneği
Kaplan Meier yöntemi yaşam sürelerine ilişkin, verilerin zaman aralığını bölmeden
yaşam ve ölüm fonksiyonlarının hesaplanmasını sağlayan bir yöntemdir. (Altman,
1991) Genel Kaplan-Meier formülü yani product limit formülü;
(35)
Yaşam tablosu ve Kaplan-Meier yöntemleri yaşam ve ölüm fonksiyonlarını
hesaplamada benzerlikler ve farklılıklar içermektedir. Bu farklılıklar aşağıdaki gibi
özetlenebilir. (Özdamar, 2003)
KM yönteminde az sayıda bireyle çalışılabilir. YT yönteminde aralıklara düşen
birim sayısının azalması tahminleri etkiler. Çok sayıda birey olduğunda YT ve
KM benzer sonuçlar vermektedir. YT yöntemi çok sayıda izlenen birim
olduğunda tercih edilmelidir. KM yönteminde, izleme süresini belirli zaman
gruplarına ayırmaya gerek duyulmamaktadır.
KM yönteminde tekrarlı ölçüm zamanlarına ilişkin olasılıklar hesaplanamaz.
İzlem zamanlarının küçükten büyüğe doğru dizildiği serilerde tekrarlı ölçüm az
ise KM, YT’ ye tercih edilir.
- 18 -
KM yönteminde kayıplar, eksik veriler dikkate alınmaz, sadece ölümler
üzerinden yaşam olasılığı hesaplanır. Yaşam olasılığı ise ölüm olayının
gerçekleştiği ana ilişkin olarak hesaplanır.
KM yönteminde kesin ölüm tarihi kullanıldığı için nokta yaşam olasılığı
bulunur, YT yöntemi ise yaklaşık bir olasılık verir, çünkü izleme aralığı gruplara
ayrılmaktadır.
5.1. Kaplan-Meier İçin Yaşam Fonksiyonunun Hesaplanması
N birimin gözlenen yaşam süreleri t1<t2<t3<…<tN şeklinde sıralanmış olsun. N bireyin
yaşam fonksiyonu;
(36)
Şeklinde hesaplanır. Bu formülde;
Şeklinde belirlenir. Y(t)’nin standart hatası;
(37)
Biçiminde hesaplanır.
Y(t) her cevap zamanı için değişebilen aşamalı bir fonksiyondur. t zamanı değiştikçe
Y(t) fonksiyonu da kademeli olarak değişim gösterir. Benzer izlem zamanına sahip
gözlemler (tieb observations) bulunması durumunda, hesaplanan değer, dizideki canlı
gözlemleri ifade edem sıradaki bir önceki ölümü belirten birime ilişkin olarak
hesaplanır.
Kümülâtif Ölüm Fonksiyonu (Λ(t))
Yığılımlı ölüm fonksiyonu, tahmin edilen P(t) yaşam fonksiyonunun eksi işaretli doğal
logaritması olarak hesaplanır ve Peterson tahmin edicisi olarak bilinir ve;
(38)
Biçiminde hesaplanır. (Özdamar, 2003)
- 19 -
Ortalama Yaşam Süresi
İzlenen n birimin ortalama yaşam süresini belirtir. Örneğin izlenen hastalardan ölenlerin
sayısı D tane ve bunların ölüm zamanları da t1<t2<t3<…<tD olarak sıraya dizilmiş olsun.
Bu dizide ortalama yaşam sürelerinin tahmini (µ);
(39)
Şeklinde belirlenir. Yukarıdaki Y(ti), ti’deki tüm verilere dayalı olarak hesaplanan
Kaplan-Meier yaşam olasılığıdır. µ’nün varyansı Var(µ);
(40)
Formülü ile elde edilir. Burada sj;
(41)
Biçiminde hesaplanan değerdir. (Tamam, 2008)
Çeyrek Değerler (Quantils)
Product-limit yöntemine göre yapılan hesaplamalarda t(q) q’nuncu çeyrek değerlerin
tahminini belirtir. q=0.5 medyan değeri q=0.25 1’inci çeyrek değeri q=0.75 ise 3’üncü
çeyrek değeri ifade eder. Ti zamanındaki yaşam fonksiyonu tahmini P(ti) olarak
alındığında çeyrek değerler;
ve
(42)
Alınarak t(q)’daki olasılık yoğunluk fonksiyonu tahmini hesaplanabilir.
Eğer u(q+0.05)=t(q-0.05) ise, olasılık yoğunluk fonksiyonu hesaplanabilir.
(43)
Olarak ve varyansı;
(44)
Olarak hesaplanır.
- 20 -
Bazı durumlarda aynı hastalığa yakalanan bireyler iki yada daha fazla gruba ayrılarak
her gruba farklı bir tedavi yöntemi uygulanabilir. (Örneğin farklı ilaç, farklı ameliyat
gibi) Farklı yöntemlerle tedavi edilen hastalar için birden fazla yaşam fonksiyonu
hesaplanabilir. Bu yaşam fonksiyonlarının birbiriyle olan farklılıkları test edilebilir.
Farklı gruplara göre elde edilen yaşam fonksiyonlarının karşılaştırmasını yapmak için
yaygın olarak kullanılan testlerden Log-Rank testi, Breslow-Wilcoxon testi ve Tarone-
Ware testleri sayılabilir. (Le, 1997)
6. İKİ YAŞAM TESTİNİN KIYASLANMASI
Aynı hastalığın iki farklı türü için, androjen grubundan aplastik anemi ve
immunospuresif tedavi gruplarının sağkalım analizleriyle ilgilendiğimizi varsayalım.
Bu grup içinde Yaşam Tablosu ya da Kaplan-Meier yöntemleriyle sağkalım oranları
hesaplanıp sağkalım eğrileri çizilebilir. Peki, iki tedavi arasında sağkalım açısından fark
var mıdır? Tedavilerden biri diğerinden üstün müdür?
Sağkalım oranları açısından yalnızca farklı tedavi grupları değil, prognoza etki eden
etkenler açısından farklı hasta gruplarının da karşılaştırılması sıklıkla gerekir. Örneğin
tümör evresi açısından dört farklı gruba ayrılan hastaların sağkalım oranlarının farklı
olup olmadığının bilinmesi çok yararlıdır. Eğer tüm hastalar çalışma bitmeden önce
ölmüş olsalardı, izlem süreleri sansürsüz olacağı için iki grup için Mann-Whitney U
testi, ikiden çok grup için Kruskal-Wallis testi ile bu sorun çözülebilirdi. (İzlem süreleri
hemen hemen her zaman logaritmik dağılım gösterdikleri için nonparametrik testler
örnek olarak verilmiştir). Ancak izlem sürelerinin bir kısmı sansürlü olacağı için bu
yöntemler uygun değildir. Bu nedenle sansürlü değişkenlerin karşılaştırılması için
yöntemler geliştirilmiştir. Bunların çoğunda zahmetli tablolar ve uzun hesaplamalar
olduğu için elle yapılması zaman alıcıdır. Bunlar; Log-Rank testi, Breslow-Wilcoxon
testi ve Tarone-Ware testleri olarak sayılabilir. (Özdemir, 2012)
6.1. Breslow-Wilcoxon Testi
Gehan testi, Breslow testi, ikiden çok grup olduğunda genelleştirilmiş Kruskal-Wallis
testi olarak da bilinir. Wilcoxon işaret testinin sansürlü gözlemler için geliştirilmiş
şeklidir. Bu yöntemde iki grupta yer alan denekler ikişer ikişer karşılaştırılır.
Androjen grubundan aplastik anemi ve immunosupresif tedavi gruplarının sağkalım
analizleriyle ilgilendiğimizi varsaymıştık. İki grupta 30’ar hasta olduğunu varsayalım.
Toplam ikili karşılaştırma sayısı 30x30=900 olacaktır. Örneğin androjen grubundaki
birinci hasta ile immunosupresif grubundaki birinci hastanın sağkalım eğrileri
karşılaştırıldığında, eğer birinci gruptaki hastanın yaşam süresi diğerinden uzunsa +1,
kısaysa -1 olarak kodlanır. Sansürlü gözlemler sebebiyle hangisinin yaşam süresinin
daha uzun olduğu bilinemiyorsa 0 olarak kodlanır. 900 ikili hasta eşi hesaplandıktan
sonra hesaplanan W değerine Breslow-Wilcoxon test istatistiği denir. Z tablosundan W
- 21 -
değerine karşılık gelen p değeri <0.05 ise iki sağkalım eğrisinin birbirinden farklı
olduğu sonucuna varılır. (Özdemir, 2012)
Testin uygulanışı
H0: İki grup arasındaki medyan farkı sıfırdır.
H1: İki grup arasındaki medyan farkı sıfır değildir.
i=1…N için |X2,2 - X1,i| ve sgn(X2,2 - X1,i ) hesaplanır. (sgn işaret fonksiyonu)
+1, -1 ve 0 kodlamaları buna göre yapılır.
Mutlak farklar Nt eşit alınan sıralamalar için Ri gösterilsin; W şöyle hesaplanır.
(45)
N arttıkça W örnekleminin dağılımı normal dağılıma yakınlaşır, Bu durumda;
(46)
z > zkritik ise H0 red.
Nt >10 ise W kritik değeri bir tablo değeriyle karşılaştırılır.
ise H0 red. (Altman, 1991)
6.2. Log-Rank Testi
İki sağkalım eğrisinin karşılaştırılmasında sık olarak kullanılan diğer bir test ise logrank
testidir. Literatürde Mantel logrank istatistiği, Cox-Mantel logrank istatistiği ya da
kısaca logrank istatistiği olarak adlandırılmıştır. (McNolley, 2013) Peto-Peto logrank
testi ile de aynı sonuca ulaşılır. Logrank testinin mantığı, iki oranın karşılaştırıldığı ki-
kare testinin mantığına benzer. Her bir zaman aralığı için gruplardaki gözlenen ölüm
sayıları, beklenen ölüm sayıları ile karşılaştırılarak hesaplanan ki-kare değeri, eğer tablo
ki-kare değerinden büyükse (bu durumda p<0.05 olacaktır), iki sağkalım eğrisinin
birbirinden farklı olduğu sonucuna varılır. Ancak iki sağkalım eğrisinin ne kadarlık bir
izlem süresi sonunda birbirinden ayrıldığını logrank testi belirtmez.
İkiden fazla grup karşılaştırılıyorsa, ikişerli karşılaştırmaların da yapılması gerekir. Bu
durumda karşılaştırılan iki grubun sağkalım eğrilerinin farklı olduğu sonucuna varmak
için yanılma payını 0.05’den daha aşağıya çekmek gerekir. Örneğin tümör evresine göre
4 farklı gruba ayrılan hastaların sağkalım eğrilerinin logrank testi ile farklı olarak
saptandığını varsayalım. Evre I-II, evre II-III ve evre III-IV arasında sağkalım
- 22 -
eğrilerinin farklı olup olmadığı test edilirken, üç ayrı ikişerli karşılaştırma yapıldığı için
p<0.05 yerine p<0.017 (0.05/3) ise iki grup arasında fark olduğu söylenebilir. P
değerleri Evre I-II için 0.13, evre III için 0.03 ve evre III-IV için 0.001 ise, yalnızca
evre III ile evre IV için sağkalım eğrilerinin farklı olduğu söylenebilir. Evre II ile III’ün
karşılaştırılmasında p>0.017 olduğu için bu iki grup arasında fark olduğu söylenemez.
İkinci bir değişkene göre kategorize edilmiş alt grupların sağkalım eğrileri de
karşılaştırılabilir. Örneğin tümör evrelerine göre sağkalım eğrileri farklı olabilir, ama
erkek ve kadınlarda durumun aynı olması gerekmez. Erkeklerde evre III’de, evre II’ye
göre sağkalım süresi daha kısa iken, kadınlarda durum farklı olabilir. Bu nedenle
evreye göre belirlenmiş dört farklı sağkalım eğrisinin analizinde cinsiyete göre
tabakalandırma gerekebilir. Tabakalandırılmış sağkalım analizi, sağkalım süresine etkisi
araştırılan asıl değişkenin (örneğin tümör evresi) etkisinden tabakalandırıcı değişkenin
(örneğin cinsiyetin) etkilerinin arıtılmasını sağlar. Tabakalandırılmış sağkalım
analizinde kullanılan yöntemlerden biri olan Mantel-Haenszel ki-kare testi, logrank
testinin genelleştirilmiş bir şeklidir. (Lawless, 2003)
Logrank testine ek olarak birden çok kategorik değişkenin farklı düzeyleri arasında
sağkalım eğrileri açısından fark olup olmadığı incelenebilir. Örneğin aplastik anemide
iki farklı tedavinin sağkalım süresi üzerindeki etkileri erkek ve kadınlarda farklı ise,
tedavi gruplarının sağkalım sürelerindeki farklılığın nedeninin cinsiyetle ilişkili olup
olmadığı bu yöntemle saptanabilir. Bu anlamda, logrank testi, varyans analizine,
Mantel-Haenzsel ki-kare testi ise kovaryans analizine benzetilebilir. İlk kez 50’li
yıllarda tanımlanan Kaplan-Meier yönteminden sonraki yıllar içinde çeşitli zamanlarda
tanımlanan sağkalım analizleri yaklaşık olarak aynı sonuçları vermektedir. Bu nedenle
tıp literatüründe çeşitli adlarla belirtilen sağkalım analiz yöntemlerinin hangisinin
kullanıldığının pek önemi yoktur. Yalnız logrank grubu testler, Gehan testinden anlamı
ve uygulanabilirliği açısından ayrılır. Gehan testinde testin sonucunu erken dönemdeki
ölümler geç dönemdeki ölümlere göre daha fazla etkilerken, logrank testinde tüm
zamanlar için ölümlerin ortaya çıkışı eşit aşırlıktadır. Öte yandan, logrank testinde farklı
gruplardaki deneklerin risk hızları (hazard rate) oranının, tüm zamanlarda aynı olduğu
varsayılır. Örneğin androjen tedavisi verilenlerde erken dönem ölümleri azalırken,
immünosupresif tedavi verilenlerde geç dönem ölümleri azalıyorsa, bu koşul
sağlanamadığı için logrank testi yerine Gehan testi uygulanmalıdır. Risk hızlarının
oransal olduğu durumlarda Cox oransal risk modeli (Cox proportional hazard model)
uygulanabilir.
Logrank test istatistiği her gözlenen olay anda iki grup tehlike fonksiyonları tahminleri
karşılaştırır. (Özdemir, 2012)
Log-Rank Test istatistiğini şöyle açıklayabiliriz:
j=1…J her bir gruptaki gözlenen olayların farklı süreleri olsun. Her bir süre j, N1j ve
N2j peryodun başındaki risk altındaki (henüz sansürlenmemiş) deneklerin sayıları
olsun.
olsun. O1j ve O2j, j süresinde gerçekleşen olayların sayıları ve
olsun. Bunlarda beklenen değer;
(47)
- 23 -
Ve varyans;
(48)
Şeklindedir. Bu durumda yokluk hipotezi de;
(49)
Şeklindedir. (McNolley, 2013)
6.3. Tarone-Ware Testi
Tarone-Ware testi iki yaşam testinin arasındaki kıyaslama testleri içerisinde ağırlıklı
testler kısmında değerlendirilir. Ağırlıklı testleri oluşturmak için temel alınan esaslar,
asimptotik olarak etkin testler veren dönüşüm fonksiyonu kavramını kullanan Peto-Peto
(1972) ve Radhakrishna’nın metodolojisine (asimptotik etkinliği maksimize eder)
dayanan Tarone-Ware (1977) tarafından tanımlanmıştır. Ağırlıklı testler, her bir
durdurulmamış gözlem süresi için tanımlanan wj ağırlıklarına dayanır. Bu testler,
gözlenen değerler (d1j) ile beklenen değerler (e1j) arasındaki farklara dayanır ve
aşağıdaki gibi ifade edilebilir: (Le, 1997)
(50)
(51)
(52)
(53)
Bazı yazarlar, gözlenen ve beklenen frekanslar arasındaki farkları ağırlıklandırma
yerine, iki gruptaki oranlar arasındaki farkları w*j ile ağırlıklandırmayı tercih
etmektedirler. w*j aşağıdaki gibi tanımlanır:
(54)
- 24 -
U ve V(U) ifadeleri ile yeniden yazılırsa,
(55)
(56)
Biçiminde olur. (Karasoy & Tilki, 2013)
Tablo 1: Ağırlıklı testler (U) için kullanılan ağırlıklar
Test U wj
Gehan UG nj
Peto-Peto UPP
Prentice UPREN
LR Altshuler ULRALT 1
Tarone-Ware UTW
Flemington-Harrington UFH
6.4. Testlerin Karşılaştırılması
Yaşam eğrilerini karşılaştırmada kullanılan testi doğru seçmek oldukça önemlidir.
Farklı test, farklı sonuca götürebilmektedir.
Skor testlerinden log-rank testindeki S istatistiği değeri Cox-Mantel testindeki değerle
hemen hemen aynıdır. Yuvarlamadan dolayı küçük farklılıklar olabilmektedir.
Örneklem büyüklükleri küçük olduğunda (n1, n2 ≤ 50) ve eğer örneklem dağılımları
üstel ya da weibull ise Cox’un F testinin Gehan testinden daha güçlü olduğu
belirtilmektedir.
Örneklemler üstel dağılımdan örneklemler ise Cox-Mantel ve log-rank testlerinin Gehan
ve Peto- Peto testlerinden daha güçlü ve daha etkili olduğu belirtilmektedir.
Hazard oranı sabit olmadığında (orantılı hazard varsayımı sağlanmadığında) Gehan ve
Peto-Peto testlerinin diğer testlerden daha güçlü olduğu, log-rank testinin ise böyle
durumlarda uygun olmadığı, tersi durumda ise log-rank testinin en yüksek güce sahip
olduğu ifade edilmektedir.
Log-rank testi tüm başarısızlıklara eşit ağırlık verirken Gehan ve Peto-Peto testleri
erken görülen başarısızlıklara daha fazla ağırlık vermektedir. Bu nedenle, Gehan ve
Peto-Peto testlerinin iki yaşam dağılımlarındaki erken farklılıkları belirlemesi daha olası
iken, log-rank testi sağ kuyruktaki farklılıklar için daha duyarlı olmaktadır.
- 25 -
İki dağılım farklı, fakat onların tehlike ya da yaşam fonksiyonları çakışıyorsa log-rank
ve Gehan çok güçlü değildir. Bu durumda Tarone-Ware gibi diğer testleri incelemek
gerekmektedir.
Peto-Peto ağırlığı olan ile Prentice ağırlığı olan
’in çok benzer sonuçlar
verdiği belirtilmektedir.
Flemington-Harrington testi, p ve q değerlerinden dolayı oldukça esnek bir testtir. p=0,
q=0 olduğunda log-rank teste, p=1, q=0 olduğunda ise Peto-Peto testine dönüşmektedir.
Bu test, q=0, p>0 olduğunda, p=0.5, q=0.5 olduğunda erken meydana gelen
başarısızlıklara, p=0, q>0 olduğunda, p=1, q=1 olduğunda, p=0.5, q=2 olduğunda geç
meydana gelen başarısızlıklara daha çok ağırlık vermektedir. (Karasoy & Tilki, 2013)
7. COX REGRESYON MODELİ
Bir izlem araştırmasında incelenen bağımlı değişken (yaşam süresi) bir hastalığa
yakalanan bireylerin ölüm zamanlarına kadar geçen izlem süreleri ise; açıklayıcı
değişkenler, bu değişken üzerinde etkide bulunan faktör değişkenler (yaş, cinsiyet,
tedavi türü vs.) olur. Tamamlanmamış izlem verilerinde, bağımlı değişken ile bağımsız
değişkenler arasındaki neden-sonuç bağlantısını ortaya koymak için yararlanılan
regresyon yöntemine Cox regresyon yöntemi adı verilir. (Özdamar, 2003)
Regresyon analizine ilişkin açıklayıcı değişkenler arasındaki neden sonuç ilişkisi
kurulurken bu değişkenlerin uyması gereken koşullar vardır. (bağımlı değişkenler
normal dağılmalıdır, bağımsız değişkenler ardışık bağımlı olmamalıdır vs.) Yaşamsal
verilerde prognostik değişkenler normal dağılım göstermemekte, birbirleriyle
korelasyon göstermekte ve yaşamsal verilerin neden-sonuç ilişkilerini analizde çoklu
regresyon analizi uygulanamamaktadır. Yaşamsal verilerin nedensellik analizlerinde
Cox regresyon yöntemi kullanılır. (Tamam, 2008)
Cox’un (1972) Orantısal Ölüm Riski Bağıntı Modeli (Propotional Hazard Regression
Model) ölüm hızlarının bu değişken değerlerinin loglinear fonksiyonu olduğu
varsayımından yola çıkarak geliştirilmiştir. Yaşamsal verilerde prognostik değişkenler
arasında orantısal bir etki söz konusudur.
Cox yönteminde bir riske maruz kalan kişinin izlendiği T zaman süresinin herhangi bir
ti zamanında ölümle karşılaşacağı varsayılır. Böylece ister hastalıktan isterse prognostik
faktörlerden dolayı bireylerin t0 zamanındaki yaşam süreleri logaritmik olarak azalan bir
fonksiyona sahip olur.
Eğer Zi kadar prognostik değişken yaşam süresinin loglinear bir fonksiyonu olarak ele
alınarak loglinear modellerde incelemeye alınabiliyorsa, Cox’un Propotional Hazard
Regression yönteminden yararlanılarak her bir prognostik değişkenin yaşam süresi
üzerindeki etkisi izlenebilir.
- 26 -
Zi prognostik değişkenler vektörü z ve yaşam süresi t olsun. Bir bireyin Zi ortak
değişkenine göre ölüm fonksiyonu h(t;z) olarak alınabilir. Buna göre orantısal ölüm
modeli (Propotional Hazard Regression Model veya z açıklayıcı değişkenine göre
regresyon modeli);
(57)
Bu modelde regresyon katsayıları vektörü; olduğunda temel (baseline)
ölüm fonksiyonudur.
Cox regresyon modelinde iki temel varsayım vardır. Bunlar;
Prognostik değişkenlerin ölüm fonksiyonu üzerindeki etkileri loglineerdir.
Prognostik değişkenlerin loglineer fonksiyonu ile ölüm fonksiyonu arasında
çarpımsal bir ilişki vardır.
Bu varsayımlara göre, farklı prognostik değişken setlerine sahip olan iki birimin ölüm
fonksiyonları oranı zamana bağlı değildir, ölüm riskleri orantısaldır.
Yaşamsal verilerde neden-sonuç ilişkilerinin ortaya konmasında Cox tarafından
önerilen regresyon modeli kullanılır.
z ortak değişken matrisinin tek yada çok değişkenli olmasına göre regresyon katsayıları
aşağıdaki modellere göre tahmin edilir.
Tek değişkenli cox regresyon modeli;
(58)
Çoklu Cox regresyon modeli;
(59)
biçiminde yazılır. (Özdamar, 2003)
Bu eşitlikte X1, X2,…,Xp ortak değişkenlerdir. Ortak değişkenler yaşam süresine
etkide bulunan yaş, kan basıncı, sıcaklık gibi, sürekli değişkenler ise hastalık evresi,
histolojik evreler gibi kategorik değişkenler olabilir. Eğer ortak değişkenler setinde
kategorik değişkenler varsa bunların orijinal kategorileri göz önüne alınıp yeni değişken
veri setleri oluşturularak transforme edilmeleri gerekir. Kategorik değişkeni ifade eden
yeni transform değişkenin kategori sayısı, orijinal kategori sayısından az olmalıdır.
7.1. Çoklu Cox Modelinde b Katsayılarının Hesaplanması
Gözlenen n tane yaşam süresi arasından k tanesi sıralanmış olarak (t1<t2<…<tk) ölüm
sonucu olan verileri göstersin. Bir Ri setinde ti zamanında değerleri saptanan zi ortak
- 27 -
değişken vektörü belirlenmiş olsun. Bir prognostik değişkenin yaşam süresi üzerinde
etkide bulunan tüm değişkenler dikkate alınarak belirlenecek genel risk içindeki oranı
riskler oranı biçiminde belirlenir.
(60)
k farklı ölüm zamanlarının bu oranla çarpımı kısmi benzerlik fonksiyonunu verir.
Regresyon katsayıları bu kısmi benzerlik fonksiyonu yardımı ile tahmin edilirler.
Kısmi benzerlik fonksiyonu L(β);
(61)
Biçiminde hesaplanır. β katsayılarının en büyük benzerlik tahminleri logaritmik
benzerlik fonksiyonunu en büyükleyerek aşağıdaki gibi hesaplanır.
(62)
Burada;
Di: ti zamanında ölen kişilerin seti
mi: ti zamanındaki cevapların sayısı
Ri: ti zamanında canlı olan kişilerin setini belirtmektedir.
ZI(ti): ti zamanında i’inci birey için ortak değişken vektörü
log lineer riskini belirtmektedir.
β katsayılarının hesaplanmasında Newton-Raphson algoritması kullanılır ve ardışık
tekrarlanan çözümlemeler ile β’nın tahminleri yapılır.
Veri setinde benzer süre gözlemleri olduğunda L(β)’nın maksimizasyonu Breslow
(1974) tarafından ileri sürülen yaklaşım;
(63)
İle hesaplanır. β katsayılarının önemliliği için H0: β=0 hipotezi test edilir. Bu amaçla üç
yöntem vardır, bunlar Wald testi, Benzerlik Oranı testi ve score testidir. (Özdamar,
2003)
- 28 -
Sonuç:
Yaşam analizlerinin temel kavramları ve ilişkili konular detaylandırılmış, veri tipine ve
ihtiyaca göre hangi tekniğin kullanılacağı anlatılmış, ilgili konuların irdelenmiş ve
detaylandırılmıştır. Yaşam analizlerinde çalışmalar yapan uzmanlara faydalı olması
umulmaktadır.
8. Kaynakça Altman, D. G. (1991). Practical Statistics for Medical Research. Monographs on Statistics and
Applied Probability (first ed.). Londra: Chapman & Hall.
Karasoy, B., & Tilki, B. (2013). Yaşam eğrilerini karşılaştırmak için kullanılan skor ve.
İstatistikçiler Dergisi: İstatistik ve aktüerya Sayı 6 , 1-13.
Kleinbaum, D. G. (1996). Survival Analysis a Self Learning Text. New York: Springer.
Lawless, J. F. (2003). Statistical Models and Methods for Lifetime Data. New York: John Wiley.
Le, C. (1997). Applied Survival Analysis. New York: John Wiley.
McNolley, W. W. (2013, Mart 10). Long-Rank Test. Ocak 10, 2014 tarihinde Wikipedia:
http://en.wikipedia.org/wiki/Logrank_test adresinden alındı
Nelson, W. (1982). Applied Life Data Analysis. Kanada: John Wiley & Sons.
Özdamar, K. (2003). Spss ile Biyoistatistik. Eskişehir: Kaan Kitapevi.
Özdemir, O. (2012). Sağkalım Analiz Yöntemleri-1. IKU , 21-33.
Tamam, D. (2008). Tam ve sansürlü örneklem durumlarında weibull dağılımı için bazı istatistiki
sonuç çıkarımları. 8-12.