Knee X

Jurnal Reading

METODE ANALISIS FOTO XRAY LUTUT UNTUK DETEKSI

AUTOMATIS OSTEOARTHRITIS

DITERJEMAHKAN DARI:

KNEE X-RAY IMAGE ANALYSIS METHOD FOR AUTOMATED

DETECTION OF OSTEOARTHRITIS

Lior Shamir_, Shari M. Ling, William W. Scott, Angelo Bos, Nikita Orlov Member, IEEE, Tomasz Macura Student Member, IEEE, D. Mark Eckley, Luigi Ferrucci, and Ilya G. Goldberg

Member, IEEE

Oleh :

Adriyani Hartayanti (0502005046)A.A. Yunda Prabundari (0502005057)A.A. Intan Pramesti (0502005130)

PEMBIMBING :

dr. Firman P. Sitanggang, Sp.Rad (K)

DALAM RANGKA MENGIKUTI KEPANITERAAN KLINIK MADYA

BAGIAN/SMF RADIOLOGI FAKULTAS KEDOKTERAN UNUD

RSUP SANGLAH DENPASAR

2012

METODE ANALISIS FOTO XRAY LUTUT UNTUK DETEKSI

AUTOMATIS OSTEOARTHRITIS

Lior Shamir_, Shari M. Ling, William W. Scott, Angelo Bos, Nikita Orlov Member, IEEE,Tomasz Macura Student Member, IEEE, D. Mark Eckley, LuigiFerrucci, and Ilya G. Goldberg Member,

IEEE

Abstrak-Kami menjelaskan sebuah metode untuk deteksi Osteoarthritis (OA) pada

gambar X-ray lutut. Deteksi didasarkan pada nilai klasifikasi Kellgren-Lawrence,

yang sesuai dengan berbagai tahap keparahan OA. Klasifikasi ini dibentuk

berdasarkan X-ray yang diklasifikasikan secara manual yang mewakili empat nilai

KL (normal, diragukan, minimal dan berat).

Analisis foto dilakukan dengan mengidentifikasi seperangkat deskriptor

konten foto dan mengubah foto yang informatif untuk mendeteksi OA dalam X-

ray, dan penilaian gambar ini menggunakan skor Fisher. Kemudian, aturan

tetangga terdekat sederhana tertimbang digunakan untuk memprediksi nilai KL

dimana tes X-ray yang diberikan pada suatu sampel. Dataset yang digunakan

dalam percobaan berisi 350 gambar X-ray diklasifikasikan secara manual dengan

nilai KL mereka. Hasil penelitian menunjukkan bahwa OA sedang (KL kelas 3)

dan OA minimal (KL kelas 2) dapat dibedakan dari kasus normal dengan akurasi

91,5% dan 80,4% masing-masing. OA Diragukan (KL kelas 1) terdeteksi secara

otomatis dengan akurasi yang jauh lebih rendah dari 57%. Kode sumber

dikembangkan dan digunakan dalam penelitian ini yang tersedia untuk download

gratis di www.openmicroscopy.org.

Indeks__Syarat-Osteoarthritis, klasifikasi citra, deteksi otomatis, X-ray,

Kellgren-Lawrence klasifikasi.

I. PENDAHULUAN

Radiografipertama kali diperkenalkan dalam dunia medispada tahun 1985.

Sejaksaat itu,perkembangannya mengalami peningkatan. Pada saat itu

masihdigunakanfilm yang mengandungperak,namun saat iniyang dipakai adalah

teknik radiografi yang digital, dimana ada yang disebut tidak langsung

(menggunakan piring photostimulable) atau langsung(menggunakandetektorpanel

2

http://www.openmicroscopy.org/

datar). Pemeriksaanradiografiharus dilakukandengan hati-hati, dan hasil yang

optimalseringdicapai dengan menggunakanfluoroskopivideo.2

Osteoarthritis (OA) adalah suatu kondisi kronis yang sangat umum yang

menyebabkan cacat substansial dalam kehidupan lanjut. Diperkirakan ~80%

penduduk berusia di atas 65 memiliki bukti radiografi Osteoarthritis, dan harapan

hidup yang berkepanjangan di Amerika Serikat dan penuaan dari kelompok "baby

boomer", dan prevalensi osteoarthritis diperkirakan terus meningkat.

Radiologi merupakan hal yang penting untuk memeriksa ruang sendi.

Semua ruang dibandingkan dengan lutut kontralateral. Hal tersebut dapat diukur

sebagai bagian dari pemeriksaan cartilage dengan lup secara bertahap atau secara

langsung dengan menggunakan gambaran radiografik dengan ukuran yang

sebenarnya. Mengukur ruang sendi merupakan alat untuk mengakses ketebalan

cartilage. Sebagaimana dikatakan oleh Dacre dkk, menunjukkan ruang sendi

tibiofemoral menurun secara fisiologis seiring umur. Ukuran rata –rata ruang

sendi pada laki-laki berumur 35 tahun adalah 7,03 mm, dimana pada umur 65

tahun, hanya 4,9 mm.

Padaosteoarthritis, rata-rataberkurangnyaruang sendi tibio-femoral adalah

0,3mm per tahun: kecepatan dalam penyempitan ruang sendi ini memungkinkan

kitauntuk membedakanantara adanya prosesosteoarthritis tipe lambat atau

progresif cepat.Selainpenyempitanruang sendi, tiga tandalainnyayang

sangatmenunjukkanosteoarthritisperludiselidiki, seperti keadaan klinis dibawah

ini :

Subkondral sklerosis, hasil dari perkembangantrabekulapada

tulangcancellous, yang mengalami tekanan trauma mekanik.

Kista Subkondral, yang sering mengakibatkan adanya hubungan antara

rongga sendi dan tulang subkondral karena adanya lubang pada kartilage

dan lempeng subkondral.

Osteofit, tanda klasik dariosteoarthritis, yang biasanya terdapatdi

daerahterluar dariepiphyses.2

3

gambar 1. Gambaranradiografidariperpanjanganlututkanan.Osteoarthritis tibio-

femoral medial denganpenyempitanruangsendidanosteofitosisringan. Genu varum

gambar 2. Gambaranradiografipadalututkanan yang diflexikansebesar 30º

padapasien yang sama

Meskipun metode baru, seperti MRI, menawarkan penilaian hingga

periarticular serta struktur artikular, adanya radiografi polos membuat mereka

menjadi alat yang paling umum digunakan dalam evaluasi sendi OA, meskipun

keterbatasannya dalam mendeteksi dini penyakit dan perubahan halus dikenal dari

waktu ke waktu. Sementara beberapa metode telah diusulkan, sistem Kellgren-

Lawrence (KL) adalah metode divalidasi yang mengklasifikasi sendi individu

menjadi salah satu dari lima nilai, dengan 0 mewakili normal dan 4 menjadi

penyakit radiografi paling parah. Klasifikasi ini didasarkan pada fitur dari

ostephytes (pertumbuhan tulang yang berdekatan dengan ruang sendi),

penyempitan sebagian atau seluruh ruang sendi tibialis-femoral, dan sclerosis

tulang subkondral. Klasifikasi Kellgren-Lawrence (KL) dibagi menjadi :

Grade 0: radiografi tampak normal

Grade 1: terdapat penyempitan ruang sendi dengan atau tanpa osteofit

Grade 2: terdapat osteofit, penyempitan ruang sendi yang normal atau

masih dipertanyakan

4

Grade 3: terdapat osteofit berukuran sedang, penyempitan sedang pada

ruang sendi, terdapat kista atau subkondral sklerosis, kemungkinan

adanya deformitas

Grade 4: terdapat osteofit yang berukuran besar, penyempitan ruang

sendi yang sangat menonjol, adanya sklerosis yang parah, adanya

deformitas.2

Klasifikasi ini didasarkan pada fitur dari ostephytes (pertumbuhan tulang

yang berdekatan dengan ruang sendi), penyempitan sebagian atau seluruh ruang

sendi tibialis-femoral, dan sclerosis tulang subkondral. Berdasarkan ketiga

indikator, klasifikasi KL dianggap lebih informatif daripada salah satu dari tiga

elemen individual. Karena parameter yang digunakan untuk klasifikasi OA adalah

kontinu, orang ahli mungkin berbeda dalam penilaian OA, hingga mencapai

kesimpulan yang berbeda mengenai keberadaan dan tingkat keparahan. Ini

menandakan tingkat subjektivitas yang tinggi untuk diagnosis, dan membutuhkan

cukup banyak pengetahuan dan pengalaman untuk membuat diagnosis OA yang

valid.

Karena tingginya prevalensi OA, diperlukannya alat klinis dan ilmiah yang

dipercaya bisa mendeteksi keberadaan OA dan tingkat keparahannya. Boniatis

dkk. mengusulkan sebuah metode yang menggunakan computer dalam penilaian

osteoarthritis pinggul berdasarkan deskriptor tekstur dan bentuk radiografi ruang

sendi pinggul, yang menunjukkan akurasi 95,7% dalam deteksi dari OA pinggul

dari 64 X-ray pinggul (18 normal dan 46 OA).

Cherukuri dkk. menjelaskan metode berdasarkan convex hull untuk

mendeteksi taji tulang anterior (osteofit) dengan akurasi ~90% menggunakan 714

gambar X-ray tulang belakang lumbal. Browne dkk. mengusulkan sebuah sistem

yang memantau perubahan dalam sendi jari berdasarkan satu set radiografi yang

diambil pada waktu yang berbeda, yang dapat mendeteksi perubahan dalam

jumlah dan ukuran dari osteofit, dan Mengko dkk. mengembangkan metode

otomatis untuk mengukur penyempitan ruang sendi di lutut OA.

Meskipun tingginya prevalensi OA lutut, alat untuk mendeteksi

berdasarkan komputer dengan gambar tunggal X-ray belum tersedia baik untuk

tujuan klinis atau penelitian. Di sini kita menjelaskan sebuah metode untuk

5

deteksi otomatis OA dengan menggunakan analisis gambar X-ray lutut berbasis

komputer. Sementara pada saat ini kami tidak menyarankan bahwa metode yang

diusulkan dapat sepenuhnya menggantikan seorang pembaca manusia, ini dapat

berfungsi sebagai alat penunjang diagnosis, dan juga dapat diterapkan terhadap

klasifikasi sejumlah besar X-ray untuk percobaan penelitian klinis. Dalam Bagian

II kami menjelaskan data yang digunakan untuk pelatihan dan menguji metode

yang diusulkan, dalam Bagian III kami menyajikan deteksi sendi dalam X-ray,

bagian IV kami menjelaskan klasifikasi otomatis dari lutut X-ray, dan dalam

bagian V pembahasan hasil eksperimen.

II. DATA

Data yang digunakan untuk percobaan adalah gambar X-ray lutut diambil dalam

perjalanan dua tahun berturut-turut, sebagai bagian dari studi Aging Longitudinal

Baltimore (BLSA), yang merupakan studi penuaan normatif longitudinal. Gambar

X-ray diperoleh di semua peserta, terlepas dari gejala atau keterbatasan

fungsional, sehingga memberikan representasi tanpa bias X-ray lutut dalam

sampel penuaan.

X-ray Lutut fleksi tetap diperoleh dengan sudut cahaya di 10 derajat,

berfokus pada fossa poplitea menggunakan Siremobile Compact C-arm (Siemens

Medical Solutions, Malvern, PA). Gambar asli adalah 8-bit 1000 × 945 grayscale

gambar DICOM, dikonversi ke dalam format TIFF. Gambar lutut kiri dibalik

secara horizontal untuk menghindari varians yang tidak perlu dalam data.

Setiap gambar lutut diklasifikasikan menurut Kellgren-Lawrence (0-4)

seperti yang dijelaskan dalam buku Atlas Radiografi Standar oleh dua pembaca

yang berbeda, dengan nilai sumbang diputuskan oleh pembaca ketiga. Dalam

79,8% kasus dua pembaca menunjukkan kelas KL sama, dan gambar sisanya

diputuskan oleh pembaca ketiga.

Pembaca X-ray adalah ahli radiologi dengan setidaknya 25 tahun

pengalaman membaca, dan membaca dari 50 hingga 100 muskuloskeletal X-ray

per hari. Untuk memaksimalkan komparabilitas antara pembaca, semua pembaca

menerima pelatihan menggunakan satu set "standar emas" X-ray. Setiap gambar

lutut juga dinilai osteofit, penyempitan ruang sendi dan sclerosis dari

6

kompartemen medial dan lateral, dan penajaman spina tibialis. Jumlah gambar X-

ray lutut yang digunakan adalah 350, dibagi dalam empat tingkat KL seperti yang

dijelaskan dalam Tabel I.

TABEL I

DISTRIBUSI FOTO XRAY BERDASARKAN NILAI KL

KL

gradeKL description

No.

of images

0

1

2

3

No osteophytes, normal joint space

Doubtful narrowing, possible osteophytes

Minimal but definite osteophytes, joint space

Definite and moderate osteophytes

joint space narrow, some subchondralsclerosis

154

102

39

55

Dalam klasifikasi yang diusulkan masing-masing nilai KL dianggap

sebuah kelas, sehingga deteksi kelas KL lengkap otomatis adalah

pengklasifikasian empat arah. Nilai KL 4 (OA berat) dan 5 (lutut diganti) tetap

berada di luar lingkup penelitian ini karena gejala nyeri berat yang menyertai nilai

OA ini, membuat deteksi berbasis komputer kurang efektif pada KL kelas 4, dan

tidak relevan di KL kelas 5.

Gambar 1 menunjukkan empat X-ray lutut dari nilai KL 0 (normal), 1

(diragukan), 2 (minimal) dan 3 (sedang). Seperti dapat dilihat pada gambar,

sebagian besar gambar X-ray adalah latar belakang atau bagian tidak relevan dari

tulang, sementara hanya daerah sekitar sendi berisi informasi yang berguna untuk

tujuan deteksi OA. X-ray juga mengandung beberapa meta-data dalam bentuk

huruf R dan L. Huruf-huruf ini adalah efek pelat logam berbentuk huruf kecil

yang ditempatkan di dekat lutut ketika X-ray akan diambil, mencegah

kemungkinan kebingungan antara lutut kiri dan kanan.

Sampel Gambar 1 menunjukkan bagaimana nilai KL yang berbeda

mungkin terlihat cukup mirip dengan mata yang tak terlatih. Bahkan para ahli

yang berpengalaman dan terlatih dapat menemukan kesulitan untuk menetapkan

kelas KL dan menilai keparahan OA, dan analisis kedua (dan kadang-kadang juga

7

hingga tiga) analisis seringkali diperlukan untuk mendapatkan diagnosis yang

handal dan akurat.

Meskipun menyediakan pendekatan untuk menilai status lutut, klasifikasi

KL manual tidak dapat dianggap sebagai standar emas untuk tingkat keparahan

OA. Alasan untuk itu adalah bahwa klasifikasi KL didasarkan pada seperangkat

elemen radiografi visual yang telah diamati berkorelasi dengan OA, namun tidak

ada bukti bahwa serangkaian elemen ini lengkap. Oleh karena itu, seserorang bisa

mendiagnosis OA, dengan lebih banyak unsur dan tanda-tanda yang jelas, atau

tanda-tanda tersebut tidak terlihat jelas oleh mata telanjang. Ketidaklengkapan

himpunan elemen KL dapat terlihat oleh korelasi parsial antara gejala nyeri dan

klasifikasi KL.

Bagian penting lainnya adalah kejadian OA terus berlanjut, sementara

nilai KL masih belum jelas. Artinya, X-ray lutut yang diklasifikasikan sebagai KL

kelas 1 dapat berada di suatu tempat antara kelas 0 dan 1, tapi karena nilai KL

adalah kelas diskrit, kasus di-antara ini akan diklasifikasikan sebagai KL murni

kelas 1. Transisi dari variabel kontinu ini ke variabel diskrit dapat dipengaruhi

oleh banyak kasus.

III. DETEKSI SENDI

Meskipun upaya untuk membuat X-ray sekonsisten mungkin, gerakan alamiah

dari pasien manusia, terutama pada usia tua, membuatnya hampir mustahil untuk

mengulangi prosedur dengan cara yang sama persis karena perbedaan dalam

fleksibilitas dari pasien dan kemampuan mereka untuk menempatkan lutut mereka

pada posisi yang tepat, serta kemampuan mereka untuk mempertahankan posisi

tersebut hingga X-ray diambil. Akibatnya, posisi sendi dalam gambar X-ray dapat

bervariasi secara signifikan.

Karena dalam setiap gambar X-ray sendi dapat muncul pada koordinat

gambar yang berbeda, algoritma deteksi sendi diperlukan untuk menemukan sendi

dan memisahkannya dari keseluruhan gambar. Hal ini dilakukan dengan

menggunakan seperangkat tetap 20 gambar dipilih sebelumnya, sehingga setiap

gambar adalah 150 × 150 window dari pusat sendi. Sebagai contoh, Gambar 2

8

adalah pusat sendi dari X-ray dari panel pada Gambar 1. Gambar-gambar ini

kemudian di downscaled dengan faktor gambar 10 ke 15 × 15.

Gambar. 2. Sebuah window dari pusat sendi digunakan untuk menemukan

pusat sendi dalam Xray

Mencari sendi lutut yang diberikan dalam gambar X-ray dilakukan dengan

terlebih dahulu downscaling gambar dengan faktor 10, dan kemudian pemindaian

gambar dengan 15 × 15 shifted window. Untuk setiap posisi, jarak Euclidean

antara 15 × 15 piksel dari window bergeser dan masing-masing 20 15 × 15

gambar sendi yang telah ditetapkan dihitung dengan menggunakan Persamaan 1,

d i , w=√∑y=1

15

∑x=1

15

( I x , y−W x, y )2

Dimana W x,y adalah intensitas pixel x, y di window bergeser W, Ix, y

adalah intensitas pixel x, y pada gambar sendi I, dan di, w adalah jarak Euclidean

antara gambar sendi I dan 15 × 15 shifted window W.

Sejak pelaksanaan diusulkan menggunakan 20 gambar sendi, 20 jarak yang

berbeda dihitung untuk setiap posisi yang mungkin dari shifted window, tetapi

hanya dari 20 jarak terpendek dicatat.

9

Setelah memindai seluruh (lebar/10-15) × (tinggi/10-15) posisi yang

mungkin, window yang mencatat jarak Euclidean terkecil ditentukan sebagai

pusat sendi, dan 250 × 200 piksel sekitar pusat ini membentuk sebuah gambar

yang digunakan untuk analisis otomatis. Gambar 3 menunjukkan contoh dari

250 × 200 area sendi. Karena setiap gambar berisi tepat satu sendi, dan karena

varians rotasi lutut cukup minim, metode sederhana dan cepat mampu berhasil

menemukan pusat bersama di semua gambar dalam dataset.

Gambar. 3. Daerah sendi dari Xray lutut

Dengan menggunakan gambar yang lebih kecil untuk klasifikasi otomatis

membuat mereka bersih dari fitur berbagai latar belakang, dan membuat gambar

invarian ke posisi sendi dalam X-ray asli. Tidak ada usaha yang dibuat untuk

memperbaiki varians rotasi gambar, karena varians kecil ini diperkirakan tidak

akan mempengaruhi analisis gambar dijelaskan dalam Bagian IV.

IV. KLASIFIKASI GAMBAR

Instrumen radiografi modern banyak yang lebih sensitif daripada mata manusia

untuk mengamati gambar yang dihasilkan. Oleh karena itu, dapat secara wajar

diasumsikan bahwa OA dapat dideteksi oleh elemen-elemen lain, selain yang

diusulkan oleh Kellgren-Lawrence, tetapi tidak digunakan untuk klasifikasi karena

ketidakmampuan dari mata manusia untuk merasakan mereka. Sejak komputer

10

secara substansial lebih sensitif terhadap variasi intensitas kecil, penggunaan yang

efektif dari kekuatan deteksi berbasis komputer akan didasarkan pada klasifikasi

data-driven, bukan upaya untuk mengikuti masing-masing elemen dari klasifikasi

manual yang digunakan oleh Kellgren & Lawrence.

Metode ini bekerja dengan terlebih dahulu mengekstraksi satu set besar fitur

gambar, kemudian dipilih fitur yang paling informative. Sejak transformasi

gambar sering dapat memberikan informasi tambahan yang sulit untuk

disimpulkan ketika menganalisis piksel baku, fitur gambar dihitung tidak hanya

pada piksel baku, tetapi juga pada transformasi beberapa gambar, dan juga pada

transformasi dari transformasi. Deskriptor konten gambar ini diambil dari

transformasi dan transformasi senyawa telah ditemukan sangat efektif dalam

pengukuran klasifikasi dan kesamaan dataset gambar biologis dan biometrik.

Untuk ekstraksi fitur gambar kita menggunakan algoritma berikut,

dijelaskan lebih lengkap di:

1. Fitur Zernike adalah nilai-nilai absolut dari koefisien aproksimasi

polinomial Zernike dari gambar seperti yang dijelaskan, memberikan 72

konten gambar deskriptor.

2. Multi-skala Histogram dihitung menggunakan nomor dari berbagai

tempat (3, 5, 7, dan 9), seperti yang diusulkan, memberikan 3 +5 +7 +9

= 24 deskriptor konten gambar.

3. Empat momen mean Pertama, standar deviasi, skewness, dan

kurtosis dihitung pada "garis" gambar di empat arah yang berbeda (0, 45,

90, 135 derajat). Setiap set garis-garis ini kemudian sampel ke dalam

histogram 3-bin, menyediakan 4 × 4 × 3 = 48 deskriptor gambar.

4. Fitur Tekstur Tamura kontras, direksiobalitas dan kekasaran,

sehingga deskriptor kekasaran adalah jumlahnya dan 3-bin histogram,

memberikan 1 +1 +1 +3 = 6 fitur gambar.

5. Fitur Haralick dihitung pada matriks kejadian gambar seperti yang

dijelaskan, dan menyumbangkan nilai-nilai gambar 28 deskriptor.

6. Chebyshev Statistik - Sebuah histogram 32-bin dari 1 × 400 vektor

yang dihasilkan oleh Chebyshev transform gambar dengan urutan N =

20.

11

Pengubah gambar yang digunakan oleh metode yang diusulkan adalah

Transformasi Wavelet yang umum digunakan (Symlet 5, tingkat 1), Transformasi

Fourier dan Transformasi Chebyshev. Selain itu, tiga transformasi gabungan juga

digunakan, yang diikuti olehtransformasi Chebyshev, transformasiFourier,

transformasi wavelet diikuti dengan transformasi Fourier, dan transformasi

Fourier diikuti olehtransformasi Chebyshev. Karena intuisi manusia dan analisis

fitur gambar diambil dari transformasi dan transformasi gabungan terbatas,

transformasi gabungan tersebut dipilih secara empiris dengan menguji semua

permutasi 2-tingkat dari tiga transformasi dasar (Wavelet, Fourier dan

Chebyshev), dan menilai kontribusi konten yang dihasilkan deskriptor untuk

akurasi klasifikasi.

Mengekstrak seperangkat deskriptor 210 konten gambar dari 7 transformasi

gambar yang berbeda (termasuk piksel mentah) menghasilkan vektor fitur dari

dimensi dari 1470. Namun, tidak semua fitur gambar sama-sama informatif, dan

beberapa fitur tersebut diharapkan untuk mewakili kebisingan. Untuk memilih

fitur gambar paling informatif dan menolak fitur bising, setiap deskriptor konten

gambar ditugaskan dengan skor Fisher, dijelaskan oleh Persamaan 2,

W f=1N∑c=1

N (T f −T f , c)2

σ f ,c2

dimana Wf adalah Skor Fisher dari fitur f, N adalah

jumlah total kelas, T f adalah rata-rata nilai dari fitur f antara gambar dialokasikan

untuk pelatihan, dan T f , cdan σ f , c2 adalah mean dan varians dari nilai-nilai dari fiturf

antara semua gambar pelatihan kelas c. Skor Fisher dapat dikonseptualisasikan

sebagai rasio varians dari mean kelas dikumpulkan untuk rata-rata varians dalam

kelas. Semua varians digunakan dalam persamaan dihitung setelah nilai dari f fitur

dinormalisasi terhadap interval. Nilai Skor Fisher memperingkatkan fitur gambar

dengan keinformatifan mereka, dan ditugaskan ke semua fitur 1470 dihitung

dengan mengekstraksi deskripsi gambar konten 210 dari 7 transformasi gambar

yang berbeda (termasuk gambar asli).

Setelah masing-masing dari 1470 fitur gambar ditugaskan dengan skor

Fisher, 90% terlemah dari fitur (dengan skor Fisher terendah) ditolak,

mengakibatkan ruang fitur dari 147 gambar deskriptor konten. Sebagaimana

dijelaskan dalam Bagian V, pengaturan ini memberikan kinerja terbaik dalam hal

12

akurasi klasifikasi. Distribusi dari berbagai jenis fitur gambar dan transformasi

citra dijelaskan dalam Tabel II.

TABEL II

DISTRIBUSI TIPE DARI FITUR DENGAN ALGORITME DAN

TRANSFORMASI GAMBAR

Transform Zernike polynomial

s

Haralick textures

Tamura textures

First four

moments

Multi-scale

histogram

Chebyshev statistic

Total

Raw pixels

10 8 1 0 0 6 25

Wavelet 22 1 4 3 0 0 30Chebyshev 26 0 2 1 2 4 35

Fourier 0 2 2 2 0 0 6Fourier +

Chebyshev0 10 0 5 7 0 22

Fourier + Wavelet

9 0 1 0 0 4 14

Chebyshev + Fourier

0 10 00 4 1 0 15

Total 67 31 10 15 10 14 147

Seperti tabel tunjukkan, deskriptor konten gambar paling informatif adalah

polinomial Zernike, dan keduanya Haralick dan fitur tekstur Tamura. Sifat radial

Zernike polinomial memungkinkan fitur ini untuk mencerminkan perbedaan

dalam unit disk, sehingga fitur ini diharapkan peka terhadap ruang sendi di

gambar Xray. Seperti yang diamati dan secara teliti dibahas oleh Boniatis dkk.,

pola variasi intensitas piksel secara matematis digambarkan oleh fitur tekstur

berkorelasi dengan perubahan biokimia, biomekanik dan struktural kartilago

artikular dan jaringan tulang subchondral. Proses ini telah dikaitkan dengan

degenerasi kartilago pada OA, dan karena itu diharapkan mempengaruhi jaringan

sendi dalam mode yang dapat dirasakan oleh tekstur radiografi.

Karena tidak semua elemen radiografi OA telah diisolasi dan ditandai

dengan baik, tidak semua fitur gambar diskriminatif diharapkan sesuai dengan

elemen OA dikenal. Oleh karena itu, sebagian kecil dari nilai-nilai diskriminatif

seperti distribusi statistik dari nilai-nilai pixel dari transformasi Fourier transform

13

diikuti dengan Chebyshev sulit untuk mengasosiasikan dengan elemen radiografi

OA yang dikenal.

Algoritma tambahan untuk fitur gambar ekstraksi telah diuji, tetapi

ditemukan kurang informatif untuk klasifikasi nilai KL. Deskriptor konten gambar

Ini termasuk fitur transformasi Radon, yang diharapkan berkorelasi dengan ruang

sendi, tetapi diungguli oleh polinomial Zernike. Filter Gabor menangkap

informasi tekstural yang juga dapat berguna untuk analisis, tetapi ditemukan

kurang informatif daripada tekstur Haralick dan Tamura. Karena bidang yang

diminati memiliki variasi intensitas relatif rendah, fitur kontras tinggi seperti tepi

dan statistik objek seperti yang dijelaskan tidak memberikan informasi yang

bermanfaat.

Setelah menghitung nilai-nilai fitur semua gambar tes yang diberikan, vektor

fitur yang dihasilkan diklasifikasikan menggunakan aturan Weighted Nearest

Neighbor, yang merupakan salah satu rutinitas yang paling efektif untuk

klasifikasi non-parametrik. Bobot, dalam hal ini, adalah skor Fisher dihitung

dengan Persamaan 2. Hasil klasifikasi ini bisa menjadi kelas nilai KL ditentukan

oleh sampel pelatihan dengan jarak terpendek untuk sampel uji yang diberikan,

tetapi juga dapat menjadi nilai interpolasi berdasarkan dua sampel pelatihan

terdekat yang tidak dimiliki oleh kelas yang sama, seperti dijelaskan oleh

Persamaan 3,

KL=( K1

d1

+K2

d2) /( 1

d1

+ 1d2

)Di mana KL adalah nilai interpolasi KL yang dihasilkan, dan d1, d2 adalah

jarak dari dua sampel terdekat yang merupakann milik nilai KL berbeda K1 dan

K2, masing-masing.

Keuntungan utama dari interpolasi ini adalah bahwa hal itu berpotensi dapat

memberikan estimasi resolusi yang lebih tinggi dengan menentukan tingkat

keparahan OA dalam kelas (misalnya, KL kelas 1,6 untuk kasus keparahan OA

antara KL kelas 0 dan 1). Ini, bagaimanapun, adalah lebih sulit untuk

mengevaluasi akurasi karena data yang digunakan sebagai kebenaran dasar hanya

menentukan tingkat keparahan OA dalam resolusi nilai KL.

14

V. HASIL EKSPERIMENTAL

Metode yang diusulkan diuji dengan menggunakan dataset yang dijelaskan dalam

Bagian II, di mana kebenaran dasar adalah klasifikasi manual dari Xray. Dalam

percobaan pertama, metode yang diusulkan diuji dengan secara otomatis

mengelompokkan OA sedang (KL kelas 3) dan lutut normal (KL kelas 0).

Percobaan dilakukan dengan menggunakan 55 gambar Xray dari setiap tingkatan,

seperti bahwa 20 gambar dari setiap kelas digunakan untuk pelatihan dan 35 untuk

pengujian.

Tes ini diulang 20 kali, di mana masing-masing berjalan menggunakan split

acak yang berbeda dari gambar pelatihan dan tes. Sejak dataset memiliki lebih

gambar kelas 0 dari kelas 3, masing-masing berjalan menggunakan set gambar

yang berbeda dari 55 kelas 0, yang dipilih secara acak dari dataset. Ketepatan

klasifikasi adalah 91,5% (P <0,000001), seperti dapat dipelajari dari matriks

kebingungan Tabel III.

TABEL III

MATRIX CONFUSION OA SEDANG DAN NORMAL

Sebagaimana ditunjukkan matriks confusion, spesifisitas deteksi OA

moderat adalah ~86.5%, dan sensitivitas adalah 95%. Hal ini dapat menjadi

penting untuk penggunaan praktis potensial dari classifier yang dijelaskan, karena

mungkin terlalu protektif dalam beberapa kasus, tetapi kurang mungkin untuk

memberhentikan Xray positif seperti biasa. Perlu dicatat bahwa sementara

pembaca manusia memiliki tingkat konsensus ~80%, ketidaksepakatan biasanya

antara nilai KL tetangga, dan tidak ada kasus yang memiliki satu pembaca

mengklasifikasikan lutut normal sementara yang lain mengklasifikasikan sebagai

moderat. Oleh karena itu, pembaca yang berpengalaman dan berpengetahuan

15

harus dapat memberitahu OA lutut moderat dari normal dengan akurasi praktis

100%.

Sebuah percobaan yang sama menguji akurasi klasifikasi kelas KL 2 (OA

minimal). Sejak masalah klasifikasi ini lebih sulit, lima gambar pelatihan lebih

banyak yang digunakan untuk masing-masing kelas sehingga training set terdiri

dari 25 gambar dari kelas 0 dan 25 gambar dari kelas 2. Penggunaan set pelatihan

yang lebih besar meningkatkan akurasi klasifikasi, sementara meningkatkan

pelatihan diatur dalam deteksi kelas 3 tidak berkontribusi terhadap kinerja,

sebagaimana akan dibahas nanti dalam bagian ini. Ketepatan klasifikasi adalah

~80.4% (P <0,0001), dan matriks confusion diberikan dalam Tabel IV.

TABEL IV

MATRIX CONFUSION OA MINIMAL DAN NORMAL

Seperti yang bisa dipelajari dari tabel, spesifisitas deteksi adalah ~79.3%,

dengan sensitivitas ~81.4%. Angka-angka ini menunjukkan bahwa deteksi KL

kelas 2 kurang efektif dibandingkan dengan deteksi otomatis KL kelas 3. Hal ini

dapat dijelaskan oleh fakta bahwa kemajuan OA adalah terus menerus, sehingga

KL kelas 2 diharapkan secara visual lebih mirip dengan nilai KL 0 daripada 3.

Kami juga mencoba untuk mengklasifikasikan KL kelas 1 (OA ragu-ragu)

dari 0, yang memberikan akurasi klasifikasi sebesar 54% bila menggunakan 25

gambar per kelas untuk pelatihan dan 14 gambar untuk pengujian.

Meningkatkan ukuran set pelatihan untuk 70 sampel per kelas (dan 32

sampel untuk pengujian) sedikit membantu peningkatan kinerja sampai 57%. Hal

ini dapat dijelaskan oleh fakta bahwa kedua nilai secara visual sangat mirip, dan

bahkan pembaca manusia berpengalaman sering harus berjuang untuk

membedakan antara keduanya. Juga, karena nilai KL adalah diskrit sementara

16

kemajuan OA sebenarnya terus menerus, sangat banyak kasus antara dapat secara

signifikan berkontribusi pada kebingungan.

Tabel V menunjukkan akurasi klasifikasi ketika mengklasifikasikan

sepasang nilai KL. Dalam semua kasus, 25 gambar digunakan untuk pelatihan, 14

gambar untuk pengujian, dan keakuratan klasifikasi dihitung dengan rata-rata

akurasi 20 split acak untuk set gambar pelatihan dan tes. Perbedaan maksimum

dari rata-rata (di antara 20 giliran) juga ditentukan dalam tabel.

TABEL V

AKURASI KLASIFIKASI 2-JALURDARI SELURUH PASANGAN

NILAI KL

Seperti yang ditunjukkan tabel, klasifikasi antara dua nilai KL terdekat

kurang akurat dibandingkan klasifikasi nilai yang tidak dekat. Kita juga dapat

melihat bahwa dua nilai KL terdekat 2 dan 3 dapat dibedakan dengan akurasi

65%, sedangkan klasifikasi kelas 1, 2 dan nilai 0, 1 memberikan akurasi sebesar

60% dan 54% masing-masing. Ini mungkin menunjukkan bahwa nilai KL

tetangga secara visual lebih mirip satu sama lain pada tahap awal OA. Hal ini juga

terlihat bahwa akurasi klasifikasi meningkat sebagaimana perbedaan antara nilai

KL akan lebih besar. Misalnya, akurasi klasifikasi nilai KL 3 dan 0 adalah lebih

baik dari akurasi klasifikasi nilai KL 3 dan 1. Hasil ini sesuai dengan sifat

kontinyu dari OA.

Menguji akurasi klasifikasi ketika mengklasifikasikan semua 4 nilai KL

dilakukan dengan secara acak memilih 25 gambar dari setiap kelas untuk

pelatihan, dan kemudian memilih 14 gambar yang tersisa dari setiap kelas untuk

pengujian. Percobaan ini diulang 20 kali, sehingga dalam menjalankan setiap set

pelatihan dan uji ditentukan secara acak. Ketepatan klasifikasi keseluruhan dari

17

classifier ini adalah 47%, seperti yang dijelaskan oleh matriks confusion dari

Tabel VI.

Akurasi Klasifikasi 47% tidak dapat dianggap kuat, dan itu secara signifikan

lebih rendah dari 79,8% dari kesepakatan antara dua ahli manusia. Namun,

matriks confusion menunjukkan bahwa dari semua kasus KL kelas 3, hanya ~4%

digolongkan sebagai non-OA (KL kelas 0), dan ~13% sebagai diragukan (KL

kelas 1). Meneliti positif palsu, matriks confusion menunjukkan bahwa ~7% dari

Xray secara manual diklasifikasikan sebagai kelas 0 KL yang salah

diklasifikasikan oleh metode yang diusulkan sebagai KL kelas 3 (sedang), dan

juga ~11% dari KL kelas 1 keliru diklasifikasikan sebagai KL kelas 3.

TABEL VI

MATRIX CONFUSION PENGKLASIFIKASI 4-JALUR DARI SELURUH NILAI KL

Karena kemajuan OA sebenarnya adalah variabel kontinu, ada banyak di

antara kasus yang dapat digolongkan ke salah satu dari dua kelas terdekat dari

kasus yang diberikan. Misalnya, kemajuan OA antara KL kelas 1 dan kelas 2

dapat diklasifikasikan baik 1 dan 2. Seperti dijelaskan pada akhir Bagian IV, nilai

yang dihasilkan dari klasifikasi gambar juga dapat menjadi interpolasi dari dua

nilai KL terdekat, daripada kelas kelas KL tunggal. Efektivitas interpolasi ini

dapat ditunjukkan dengan menghitung koefisien korelasi Pearson antara nilai KL

diprediksi dan aktual (bila menggunakan semua 4 grade KL seperti yang

dijelaskan pada Tabel VI). Bila menggunakan nilai interpolasi sebagai kelas yang

diprediksi, Pearson korelasi adalah 0,73, dibandingkan dengan 0,49 ketika kelas

KL yang diprediksi hanya kelas yang terdekat dengan sampel pelatihan.

Lutut diklasifikasikan sebagai positif OA jika sudah diklasifikasikan sebagai

KL grade 2 atau lebih tinggi. Dengan menggabungkan gambar dari nilai KL 2 dan

3, kami memperkenalkan sebuah kelas baru yang disebut OA positif yang berisi

18

78 gambar (39 dari masing-masing kelas). Percobaan dilakukan dengan

membangun classifier 2-arah menggunakan kelas yang baru didefinisikan dan KL

kelas 0, seperti bahwa 60 gambar dari setiap kelas digunakan untuk pelatihan dan

18 untuk pengujian. Tujuan penelitian ini adalah untuk mengklasifikasikan Xray

positif OA dari negatif OA. Ketepatan klasifikasi classifier ini adalah ~86.1%,

dengan sensitivitas dan spesifisitas ~88.7% dan ~83.5%, masing-masing.

Hal ini juga penting untuk menyebutkan bahwa Xray diambil dari subyek

manusia yang dipilih secara acak yang berpartisipasi dalam studi BLSA, dan tidak

harus dari pasien yang melaporkan gejala rasa sakit atau didiagnosis sebagai

positif OA di salah satu sendi lain mereka. Kebijakan ini memberikan representasi

yang seragam dari populasi lanjut usia, dan karena itu dapat diasumsikan bahwa

hasil yang disajikan di sini dapat digeneralisasi pada populasi lansia secara

keseluruhan.

Ketepatan klasifikasi dapat dipengaruhi oleh ukuran training set sedemikian

rupa sehingga diharapkan meningkat sejalan dengan jumlah sampel pelatihan

yang semakin tinggi. Gambar 4 menunjukkan akurasi klasifikasi dari klasifikasi

nilai KL 2 dan 3 dari kelas KL 0 sebagai fungsi dari ukuran training set. Seperti

dapat dipelajari dari grafik, untuk KL kelas 3akurasi klasifikasi meningkat

sebagaimana ukuran dari set pelatihan semakin besar, tetapi stabil pada _14

gambar pelatihan per kelas. keakuratan Klasifikasi KL kelas 2 juga meningkat

dengan jumlah gambar pelatihan, tetapi dataset kami tidak cukup besar untuk

menentukan apakah mencapai puncak akurasi.

19

Gambar. 4. akurasi Klasifikasi (%) dari nilai KL 2 dan 3 sebagai fungsi dari ukuran training set

Seperti dijelaskan dalam Bagian IV, 10% dari fitur gambar dengan skor

Fisher tertinggi digunakan untuk klasifikasi, sedangkan sisanya dari deskriptor

konten gambar diabaikan. Gambar 5 menunjukkan bagaimana jumlah fitur yang

digunakan untuk klasifikasi mempengaruhi akurasi klasifikasi KL kelas 3.

Menurut grafik, kinerja terbaik dicapai bila menggunakan antara 7,5% sampai

12,5% dari jumlah total fitur gambar (1470).

Gambar. 5. Klasifikasi akurasi (%) dari nilai KL 2 dan 3 sebagai fungsi dari

jumlah fitur gambar yang digunakan

Dalam hal kompleksitas komputasi, mengklasifikasi satu gambar Xray

membutuhkan 105 detik, dengan menggunakan sistem dengan 2GHz Intel

prosesor dan 1MB RAM. Sementara waktu yang diperlukan untuk deteksi

bersama yang dijelaskan dalam Bagian III diabaikan, hampir semua waktu CPU

dikorbankan untuk mengubah gambar dan mengekstraksi fitur gambar. Faktor

utama kompleksitas ini adalah fitur Zernike 2-dimensi, yang dikenal mahal.

Kelemahan dari classifier ini membuatnya tidak cocok untuk aplikasi realtime

atau tugas lain di mana kecepatan adalah perhatian utama, tetapi mungkin cukup

cepat untuk klasifikasi tunggal gambar Xray, terutama mengingat kenyataan

20

bahwa seluruh prosedur menggunakanXray dapat membutuhkan waktu lebih lama

lagi.

Peningkatan waktu respon dari classifier dapat dicapai dengan paralelisasi dari

algoritma ekstraksi fitur. Karena sebagian besar fitur gambar tidak tergantung

pada satu sama lain, algoritma menjadi sepele untuk memparalelkan sehingga

banyak fitur gambar dapat dihitung secara bersamaan oleh prosesor yang berbeda.

Sebagai contoh, sementara satu prosesor dapat menghitung fitur Haralick pada

Transformasi Chebyshev, prosesor lain dapat mengekstrak fitur Haralick dari

Transformasi Fourier, atau fitur Zernike dari transformasi Chebyshev. Untuk

mengambil keuntungan penuh dari paralelisasi, algoritma juga telah

diimplementasikan dengan menggunakan Open Microscopy Environment (OME)

software suite (Ome), yang merupakan platform untuk penyimpanan dan

pengolahan gambar mikroskop, dan dirancang untuk mengoptimalkan

pelaksanaan dan aliran data dari modul eksekusi ganda. Penjelasan rinci dari

paralelisasi transformasi gambar dan gambar fitur ekstraksi di Ome dapat

ditemukan.

VI. KESIMPULAN

Dalam tulisan ini kita menjelaskan pendekatan otomatis untuk mendeteksi OA

lutut dengan menggunakan X-ray. Dengan tidak adanya metode diagnosis OA

yang akurat, kelas KL yang secara manual diklasifikasikan digunakan di sini

sebagai "gold standar", walaupun diketahui bahwa metode ini kurang sempurna.

Klasifikasi ini tidak dilakukan dengan cara yang mencoba untuk meniru

klasifikasi manusia, tetapi didasarkan pada pendekatan diarahkan data

menggunakan X-ray yang secara manual diklasifikasikan dari nilai KL yang

berbeda, yang mewakili berbagai tahap keparahan OA.

Hasil penelitian menunjukkan bahwa lebih dari 95% kasus OA moderat

dibedakan secara akurat dari kasus normal, dengan tingkat positif palsu ~12.5%.

Klasifikasi akurasi membedakan OA minimal dari kasus normal ~80%, dan

deteksi kasus OA meragukan adalah jauh kurang meyakinkan. Upaya di kemudian

hari meningkatkan akurasi deteksi OA diragukan akan mencakup integrasi

informasi klinis yang relevan seperti riwayat cedera lutut, berat badan, dan sudut

21

alignment lutut, dan juga akan menggunakan lebih banyak sampel X-ray yang

telah tersedia. Namun, karena sifat subjektif dari "gold standar", adalah mungkin

bahwa korelasi 100% antara klasifikasi berbasis komputer dan manual tidak dapat

dicapai. KL nilai 4 (OA berat) dan 5 (lutut diganti) tetap berada di luar lingkup

penelitian ini karena gejala berat yang menyertai tahap ini, dan deteksi relatif

mudah OA di tahap ini. Sedangkan akurasi klasifikasi nilai KL 1 dan 2 tidak dapat

dianggap kuat, penting untuk dicatat bahwa pembaca radiograf sering ditantang

dalam upaya untuk membedakan nilai nilai ini, dan oleh karena itu kebingungan

dari deteksi otomatis antara kedua nilai tidak dapat dianggap mengejutkan.

Kami mengakui bahwa peralatan yang digunakan untuk mendapatkan

gambar lutut tidak memungkinkan untuk resolusi maksimal struktur sendi. Kami

berspekulasi gambar radiografi konvensional diperkirakan akan memungkinkan

untuk deliniasi yang lebih baik dari nilai OA, terutama pada kasus dengan

penyakit kurang parah. Tentu radiografi konvensional mampu menggambarkan

struktur sendi lebih mudah, tetapi mencapai hal ini dengan paparan radiasi lebih

besar. Penerapan perangkat lunak pencitraan untuk interpretasi gambar X-ray

terjadi tanpa bias yang melekat dalam interpretasi klinis. Akhirnya, studi ini

dilakukan dalam konteks studi penuaan longitudinal yang akan memungkinkan

perbandingan data pencitraan untuk fitur OA klinis sebagai rasa sakit, tetapi juga

untuk langkah-langkah fisiologis relevan dengan penuaan sistem tubuh yang

mungkin berkontribusi terhadap keparahan OA.

Rencana masa depan termasuk pengujian teknik otomatis ini dalam

evaluasi gambar lutut longitudinal diperoleh dari waktu ke waktu, untuk

memeriksa apakah OA dapat dideteksi sebelum bukti radiografis terlihat oleh

seorang pembaca. Kami juga berencana untuk mengembangkan teknik yang mirip

untuk mengklasifikasikan X-ray tangan dengan memperhatikan sendi sinyal yang

cenderung untuk pengembangan OA.

Kode sumber lengkap yang digunakan untuk percobaan tersedia untuk

download gratis di bawah lisensi GNU standar publik melalui CVS di

www.openmicroscopy.org. Para ilmuwan dan insinyur didorong untuk men-

download, mengkompilasi dan menggunakan kode ini untuk kebutuhan mereka.

22

Knee X

Documents

Transcript of Knee X