IT 22 - EBM 2 - AZ

17
Uji diagnostik Pendahuluan Uji Diagnostik ialah prosedur yang dilakukan untuk konfirmasi atau menentukan ada/tidaknya penyakit pada individu simptomatik . Uji saring ialah uji medis yang digunakan untuk deteksi atau prediksi ada/tidaknya penyakit pada individu asimptomatik /dengan resiko penyakit. Tujuan uji, ialah identifikasi penyakit sejak awal, sehingga memungkinkan intervensi dan penatalaksanaan awal, dengan harapan menurunkan kesakitan dan mortalitas. Prinsip dasar Uji diagnostik yang ideal akan selalu memberikan jawab yang benar (hasil positif bagi setiap individu yang berpenyakit dan hasil negatif bagi yang tidak berpenyakit), dan uji tersebut cepat, aman, simpel, murah, dan reliabel. Struktur uji diagnostik Struktur uji diagnostik, seperti halnya studi observasional lain, mempunyai variabel prediktor (hasil uji) dan variabel outcome/ keluaran (ada atau tidaknya penyakit). 1. Variabel prediktor dapat berskala dikotom (+/-), kategori (+1, +2, +3, +4), atau kontinu (10 mg/dl, 15 mg/dl, 17 mg/dl). 2. Variabel outcome dinyatakan sebagai-ada/tidaknya penyakit, yang ditentukan dengan baku emas. Baku emas selalu

description

IT 22 - EBM 2 - AZ

Transcript of IT 22 - EBM 2 - AZ

Uji diagnostik

Uji diagnostik

Pendahuluan

Uji Diagnostik ialah prosedur yang dilakukan untuk konfirmasi atau menentukan ada/tidaknya penyakit pada individu simptomatik. Uji saring ialah uji medis yang digunakan untuk deteksi atau prediksi ada/tidaknya penyakit pada individu asimptomatik/dengan resiko penyakit. Tujuan uji, ialah identifikasi penyakit sejak awal, sehingga memungkinkan intervensi dan penatalaksanaan awal, dengan harapan menurunkan kesakitan dan mortalitas.

Prinsip dasar

Uji diagnostik yang ideal akan selalu memberikan jawab yang benar (hasil positif bagi setiap individu yang berpenyakit dan hasil negatif bagi yang tidak berpenyakit), dan uji tersebut cepat, aman, simpel, murah, dan reliabel.

Struktur uji diagnostik

Struktur uji diagnostik, seperti halnya studi observasional lain, mempunyai variabel prediktor (hasil uji) dan variabel outcome/ keluaran (ada atau tidaknya penyakit).

1. Variabel prediktor dapat berskala dikotom (+/-), kategori (+1, +2, +3, +4), atau kontinu (10 mg/dl, 15 mg/dl, 17 mg/dl). 2. Variabel outcome dinyatakan sebagai-ada/tidaknya penyakit, yang ditentukan dengan baku emas. Baku emas selalu memberikan hasil positif bagi individu dengan penyakit, dan hasil negatif bagi yang tidak sakit.

Karakteristik uji diagnostik

Walaupun struktur uji diagnostik mirip dengan studi observasional yang lain, terdapat perbedaan penting dalam hal bagaimana hasil dianalisis. Sebagian besar studi observasional dirancang untuk mendapatkan informasi mengenai etiologi penyakit, dengan menunjukkan adanya asosiasi antara variabel prediktor dan variabel outcome. Uji diagnostik, sebaliknya, dirancang untuk menentukan seberapa baik uji dapat membedakan antara individu sakit dan yang tidak sakit. Utk mengetahui keandalan suatu tes baru utk diagnosis peny. bila dibandingkan dgn baku emas (gold standard).

Evaluasi uji diagnostik

Pada evaluasi uji diagnostik, dapat dijumpai 4 kondisi, (a) hasil true positive (TP): uji positif dan individu sakit; (b) hasil false positive (FP): uji positif tetapi individu tidak sakit; (c) hasil false negative (FN): uji negatif tetapi individu sakit; dan (d) hasil true negative (TN): uji negatif dan individu memang tidak sakit. Uji diagnostik yang terbaik ialah uji dengan sesedikit mungkin FP dan FN. Baku emas

+-

Prosedur

Yang diuji +True Positive (TP)

aFalse Positive (FP)

b

- c

False Negative (FN)d

True Negative (TN)

Sensitivitas (Sn) dan spesifisitas (Sp)

Sensitivitas (Sn): proporsi individu dengan penyakit yang memberikan hasil uji positif. Formula: Sn = Tabel 2 x 2

Tabel 2 x 2 ialah cara mudah mengkalkulasi dan menyimpulkan semua informasi mengenai uji diagnostik.

Tabel 1.

Breast cancer (dgn baku emas)

+ -

Prosedur

yg diuji +TP

65

a FP

30

bTP+FP

95

a + bPPV: TP/ (TP+FP)

- c

35

FNd

70

TN c + d

105

FN+TNNPV: TN/ (TN+FN)

TP+FN

100

a + cFP+TN

100

b + dTP+FP+FN+TN

200

a + b + c + d

Sn:

TP/(TP+FN)Sp: TN/ (TN+FP)ACCURACY:

(TP+TN)/

(TP+TN+FP+FN)

LR+: Sn/

(1-Sp)LR-: (1-Sn)/ Sp

Pretest prob.:

(TP+FN)/(TP+FN+FP+TN)

Sensitivitas uji diagnostik pada tabel di atas ialah =

Spesifisitas (Sp): ialah proporsi individu tidak sakit yang menghasilkan uji negatif.Sp =

Pada contoh tabel di atas, Sp = 70%.

Angka di atas hanya estimasi untuk Sn dan Sp karena angka tersebut didasarkan hanya pada subset subyek dari populasi yang dipilih. Bila subset subyek yang lain yang diuji, atau subyek yang sama diuji pada waktu yang lain, maka estimasi angka Sn dan Sp mungkin akan berbeda. Interval kepercayaan (Confidence interval) dan significance levels akan menghitung ketidak pastian statistik dalam estimasi tersebut.

Cutoff point dan trade off

Pada uji diagnostik dengan variabel prediktor berskala kontinu, keputusan harus diambil untuk menentukan batas nilai yang positif dari yang negatif, nilai yang disebut cutoff point. Menaikkan cutoff point akan meningkatkan Sp dan akan menurunkan Sn; sebaliknya, menurunkan cutoff akan meningkatkan Sn dan menurunkan Sp (trade off).

Pertimbangan merubah cutoff (dinaikkan/diturunkan) dalam klinis kadang perlu dilakukan sesuai dengan sifat penyakit yang dihadapi. Contoh, prosedur operasi berbahaya, keputusan tindakan memerlukan nilai FP sekecil mungkin, maka cutoff harus dinaikkan sehingga Sp maksimal. Pada kondisi untuk menyapi neonatus dengan fenilketouria, maka yang dibutuhkan adalah menurunkan cutoff (Sn akan maksimal).

Cutoff

Sn (95% C.I.) Sp (95% C.I.)

> 9 88,2 ( 63,5- 98,2) 43,5 ( 31,0- 56,7)

> 10 76,5 ( 50,1- 93,0) 53,2 ( 40,1- 66,0)

> 11 76,5 ( 50,1- 93,0) 61,3 ( 48,1- 73,4)

> 12 * 76,5 ( 50,1- 93,0) 74,2 ( 61,5- 84,5)

> 13 64,7 ( 38,4- 85,7) 80,6 ( 68,6- 89,6)

> 14 58,8 ( 33,0- 81,5) 88,7 ( 78,1- 95,3)

> 15 41,2 ( 18,5- 67,0) 91,9 ( 82,2- 97,3)

Receiver Operating Characteristic (ROC) curvesCara lain menentukan cutoff point ialah memakai ROC curves dengan bantuan piranti lunak, seperti SPSS dan MedCalc. ROC curves terutama bermanfaat pada variabel prediktor berskala kategorik atau kontinu. Keuntungan pemakaian ROC curves, selain mendapatkan nilai cutoff, didapatkan pula nilai Sn dan Sp pada masing-masing cutoff, dan performa ROC curves ditunjukkan pula oleh nilai Area under the ROC curves, dengan menempatkan Sn pada sumbu Y dan 1-Sp pada sumbu X.

"Reciever Operating Characteristic" ialah bagian dari bidang yang dinamai "Signal Dectection Therory" yang dikembangkan selama Perang Dunia II untuk analisis bayangan radar. Operator radar harus memutuskan apakah sinyal (blip) pada layar suatu target musuh, kapal perang kawan, atau hanya sekedar gangguan (noise). Kemampuan membedakan sinyal di atas dinamai the Receiver Operating Characteristics. Setelah 1970, ROC curves mulai dipakai dalam bidang medis.

Selain itu, ROC Curves digunakan untuk mengukur akurasi tes diagnostik.

A rough guide for classifying the accuracy of a diagnostic test is the traditional academic point system:

0.9 sampai 1Excelent (A)

0.8 sampai 0.9Good (B)

0.7 sampai 0.8Fair (C)

0.6 sampai 0.7Poor (D)

0.5 sampai 0.6Fail (E)

Prevalen, prior (pretest) probability and ( positive/negative) predictive valueNilai uji diagnostik tidak tergantung hanya pada Sn dan Sp, tetapi juga pada prevalen penyakit dalam populasi yang diteliti. Makin rendah prevalen (makin jarang) penyakit, makin besar kemungkinan uji diagnostik memperoleh false positive. Agar uji diagnostik bagi kasus di atas bermakna, maka uji diagnostik harus memiliki Sp yang tinggi. Hal sebaliknya untuk kasus penyakit yang umum dijumpai.

prior probability, yaitu probabilitas seseorang menderita sakit yang diperkirakan berdasarkan karakteristik klinis dan bukan berdasarkan hasil uji diagnostik. Artinya, ramalan sebelum uji diagnostik.

Prior probability dapat dihitung secara lebih akurat memakai tabel 1, dengan formula:

Predictive value (Nilai prediktif), disebut juga posterior probability karena nilainya ditentukan setelah uji diagnostik diperoleh. PV: seberapa besar orang dengan tes +/- akan mendapat penyakit/ tidak sakit.

1. Positive predictive value (Nilai prediksi positif): seberapa besar individu dengan tes positif akan mendapat penyakit. PPV = . Pada contoh Tabel 1., PPV = 68.42%

2. Negative predictive value (Nilai prediksi negatif): seberapa besar individu dengan tes negatif tidak akan mendapat penyakit.

NPV = 66.66%Catatan: Do not calculate the positive predictive value AND/OR negative predictive value on a sample where the prevalence of the disease was artificially controlled. Likelihood ratios (LR)1. (+LR): berapa besar kemungkinan hasil tes + lebih banyak ditemukan pada orang sakit dibandingkan pada orang tidak sakit, atau seberapa besar odds dari penyakit akan meningkat apabila hasil uji positif. +LR =

2. -LR: Seberapa besar kemungkinan hsl tes negatif ditemukan pd orang tdk sakit dibandingkan pd orang sakit, atau seberapa besar odds penyakit akan menurun bila hasil uji negatif. LR =

Kriteria penilaian nilai LR

LRPerubahan pretest ke posttest probability

+LR: >10 atau LR: < 0.1Menghasilkan perubahan besar dari pre ke posttest probability (excelent)

+LR: 5 10 atau LR: 0.1 0.2 Menghasilkan perubahan moderat (very good)

+LR: 2 5 atau LR: 0.2 0.5 Menghasilkan perubahan kecil (fair)

+LR: 1 2 atau LR: 0.5 1 Perubahan kecil/ tidak ada perubahan (useless)

Posttest probability

Likelihood ratio (mis. 20.43) dapat dipakai menghitung posttest probability (berdasarkan Bayes' theorem)Kalkulasi post-test probabilities memakai likelihood ratios Pretest probability = p1, mis. = 10% atau 0.1

pretest odds = p1/(1-p1) = 0.1/0.9 = 0.11

post-test odds = o2 = pretest odds +LR = 0.1120.43 = 2.27

Post-test probability = o2/(1+ o2) = 2.27/3.37 = 0.69 atau 69%

Nomogram Fagan

Cara penghitungan posttest probability di atas cukup rumit.Pada tahun 1975, Fagan mempublikasikan nomogram untuk kalkulasi Bayes theorem. Nomogram hanya memerlukan menarik garis lurus dari titik nilai pretest probability ke titik nilai +LR, sampai memotong garis posttest probability. Titik potong garis tersebut pada garis posttest probability ialah nilai posttest probability.

Figure 3 Bayes nomogram (adapted from Fagan).Fagan TJ. Nomogram for Bayes theorem [Letter]. N Engl J Med 1975;293:275.

Kappa1. Secara konvensional, kappa coefficient dipakai untuk menilai derajat kesesuaian pembacaan hasil pemeriksaan tertentu oleh 2 orang pemeriksa, dengan memperhitungkan kesesuaian yang terjadi secara kebetulan (by chance).

2. Dari konteks epidemiologi, kappa coefficient dipakai menilai derajat kesesuaian antara 2 uji diagnostik untuk mendeteksi penyakit tertentu, bila tidak satupun dari kedua uji tersebut dapat dianggap sebagai baku emas.

Contoh

Misal 2 pemeriksa melakukan anamnesis tentang berapa kali mengalami sunburn terhadap 593 kasus.

Observed agreement (OA):

= 0.096 + 0.526 + 0.1247 = 0.747

Expected agreement by chance (EA):

= (0.165 x 0.152) + (0.637 x 0.656) + (0.197 x 0.192) = 0.481

Kappa () : (OA EA) / (1 EA)

= (0.747 0.481) / (1 0.0.481) = 0.512The K value can be interpreted as follows (Altman, 1991):

Value of KStrength of agreement

< 0.20Poor

0.21 - 0.40Fair

0.41 - 0.60Moderate

0.61 - 0.80Good/substantial

0.81 - 1.00Very good/almost perfect

Istilah/Terminologi

Reliability (keandalan): How good is a procedure when applied by different users.Validity (kesahihan): Defined as the ability of a test to distinguish between those with disease and those without disease.

Accuracy (keseksamaan): The proportion of test results that are correct.

Bayes theorem

Bayes theorem menyatakan bahwa nilai prediksi suatu uji bergantung pada prevalen penyakit. Bagi penyakit dengan prevalen tinggi, maka PPV akan tinggi; dan bila prevalen rendah, maka PPV akan merendah. Sedangkan NPV akan bergerak sebaliknya. Bayes' theorem: Posttest Odds = Pretest Odds X Likelihood RatioGold Standards / reference standard / baku emas: dianggap metode terbaik yang ada, untuk menentukan ada atau tidaknya target condition/ penyakit.Umumnya, baku emas mahal, beresiko, atau terlalu lama mendapatkan hasil sehingga suskar dipakai dalam clinical setting.

Critical Appraisal (telaah kritis) uji diagnostik

The two areas under the curves may be compared as a measure of overall inter-rater reliability. This comparison is made by applying the following formula:

droc = (1- |Area1- Area2|)

By subtracting the difference in areas by one, droc is on a similar scale as K, ranging from 0 to 1.

If both raters correctly classify the objects at the same rate, their sensitivities and specificities will be equal, resulting in a droc of 1.

If one rater correctly classifies all the objects, and the second rater misclassifies all the objects, droc will equal 0.

Statistics for Figure 1(N=20):

Rater One:

% Correct = 80 %

sensitivity = 0.80

specificity = 0.80

Area under ROC = 0.80

Rater Two:

% Correct = 55 %

sensitivity = 0.60

specificity = 0.533

Area under ROC = 0.567

droc = 1- (0.8 0.567) = 0.767

1.0 > droc > 0.95

excellent reliability

0.8 < droc < 0.95

good reliability

0 < droc < 0.8

marginal reliability

_1298053648.unknown

_1299181882.unknown

_1299183452.unknown

_1299183507.unknown

_1299182005.unknown

_1299181770.unknown

_1298034139.unknown

_1298034398.unknown

_1298032517.unknown