Knee X
Transcript of Knee X
Jurnal Reading
METODE ANALISIS FOTO XRAY LUTUT UNTUK DETEKSI
AUTOMATIS OSTEOARTHRITIS
DITERJEMAHKAN DARI:
KNEE X-RAY IMAGE ANALYSIS METHOD FOR AUTOMATED
DETECTION OF OSTEOARTHRITIS
Lior Shamir_, Shari M. Ling, William W. Scott, Angelo Bos, Nikita Orlov Member, IEEE, Tomasz Macura Student Member, IEEE, D. Mark Eckley, Luigi Ferrucci, and Ilya G. Goldberg
Member, IEEE
Oleh :
Adriyani Hartayanti (0502005046)A.A. Yunda Prabundari (0502005057)A.A. Intan Pramesti (0502005130)
PEMBIMBING :
dr. Firman P. Sitanggang, Sp.Rad (K)
DALAM RANGKA MENGIKUTI KEPANITERAAN KLINIK MADYA
BAGIAN/SMF RADIOLOGI FAKULTAS KEDOKTERAN UNUD
RSUP SANGLAH DENPASAR
2012
METODE ANALISIS FOTO XRAY LUTUT UNTUK DETEKSI
AUTOMATIS OSTEOARTHRITIS
Lior Shamir_, Shari M. Ling, William W. Scott, Angelo Bos, Nikita Orlov Member, IEEE,Tomasz Macura Student Member, IEEE, D. Mark Eckley, LuigiFerrucci, and Ilya G. Goldberg Member,
IEEE
Abstrak-Kami menjelaskan sebuah metode untuk deteksi Osteoarthritis (OA) pada
gambar X-ray lutut. Deteksi didasarkan pada nilai klasifikasi Kellgren-Lawrence,
yang sesuai dengan berbagai tahap keparahan OA. Klasifikasi ini dibentuk
berdasarkan X-ray yang diklasifikasikan secara manual yang mewakili empat nilai
KL (normal, diragukan, minimal dan berat).
Analisis foto dilakukan dengan mengidentifikasi seperangkat deskriptor
konten foto dan mengubah foto yang informatif untuk mendeteksi OA dalam X-
ray, dan penilaian gambar ini menggunakan skor Fisher. Kemudian, aturan
tetangga terdekat sederhana tertimbang digunakan untuk memprediksi nilai KL
dimana tes X-ray yang diberikan pada suatu sampel. Dataset yang digunakan
dalam percobaan berisi 350 gambar X-ray diklasifikasikan secara manual dengan
nilai KL mereka. Hasil penelitian menunjukkan bahwa OA sedang (KL kelas 3)
dan OA minimal (KL kelas 2) dapat dibedakan dari kasus normal dengan akurasi
91,5% dan 80,4% masing-masing. OA Diragukan (KL kelas 1) terdeteksi secara
otomatis dengan akurasi yang jauh lebih rendah dari 57%. Kode sumber
dikembangkan dan digunakan dalam penelitian ini yang tersedia untuk download
gratis di www.openmicroscopy.org.
Indeks__Syarat-Osteoarthritis, klasifikasi citra, deteksi otomatis, X-ray,
Kellgren-Lawrence klasifikasi.
I. PENDAHULUAN
Radiografipertama kali diperkenalkan dalam dunia medispada tahun 1985.
Sejaksaat itu,perkembangannya mengalami peningkatan. Pada saat itu
masihdigunakanfilm yang mengandungperak,namun saat iniyang dipakai adalah
teknik radiografi yang digital, dimana ada yang disebut tidak langsung
(menggunakan piring photostimulable) atau langsung(menggunakandetektorpanel
2
datar). Pemeriksaanradiografiharus dilakukandengan hati-hati, dan hasil yang
optimalseringdicapai dengan menggunakanfluoroskopivideo.2
Osteoarthritis (OA) adalah suatu kondisi kronis yang sangat umum yang
menyebabkan cacat substansial dalam kehidupan lanjut. Diperkirakan ~80%
penduduk berusia di atas 65 memiliki bukti radiografi Osteoarthritis, dan harapan
hidup yang berkepanjangan di Amerika Serikat dan penuaan dari kelompok "baby
boomer", dan prevalensi osteoarthritis diperkirakan terus meningkat.
Radiologi merupakan hal yang penting untuk memeriksa ruang sendi.
Semua ruang dibandingkan dengan lutut kontralateral. Hal tersebut dapat diukur
sebagai bagian dari pemeriksaan cartilage dengan lup secara bertahap atau secara
langsung dengan menggunakan gambaran radiografik dengan ukuran yang
sebenarnya. Mengukur ruang sendi merupakan alat untuk mengakses ketebalan
cartilage. Sebagaimana dikatakan oleh Dacre dkk, menunjukkan ruang sendi
tibiofemoral menurun secara fisiologis seiring umur. Ukuran rata –rata ruang
sendi pada laki-laki berumur 35 tahun adalah 7,03 mm, dimana pada umur 65
tahun, hanya 4,9 mm.
Padaosteoarthritis, rata-rataberkurangnyaruang sendi tibio-femoral adalah
0,3mm per tahun: kecepatan dalam penyempitan ruang sendi ini memungkinkan
kitauntuk membedakanantara adanya prosesosteoarthritis tipe lambat atau
progresif cepat.Selainpenyempitanruang sendi, tiga tandalainnyayang
sangatmenunjukkanosteoarthritisperludiselidiki, seperti keadaan klinis dibawah
ini :
Subkondral sklerosis, hasil dari perkembangantrabekulapada
tulangcancellous, yang mengalami tekanan trauma mekanik.
Kista Subkondral, yang sering mengakibatkan adanya hubungan antara
rongga sendi dan tulang subkondral karena adanya lubang pada kartilage
dan lempeng subkondral.
Osteofit, tanda klasik dariosteoarthritis, yang biasanya terdapatdi
daerahterluar dariepiphyses.2
3
gambar 1. Gambaranradiografidariperpanjanganlututkanan.Osteoarthritis tibio-
femoral medial denganpenyempitanruangsendidanosteofitosisringan. Genu varum
gambar 2. Gambaranradiografipadalututkanan yang diflexikansebesar 30º
padapasien yang sama
Meskipun metode baru, seperti MRI, menawarkan penilaian hingga
periarticular serta struktur artikular, adanya radiografi polos membuat mereka
menjadi alat yang paling umum digunakan dalam evaluasi sendi OA, meskipun
keterbatasannya dalam mendeteksi dini penyakit dan perubahan halus dikenal dari
waktu ke waktu. Sementara beberapa metode telah diusulkan, sistem Kellgren-
Lawrence (KL) adalah metode divalidasi yang mengklasifikasi sendi individu
menjadi salah satu dari lima nilai, dengan 0 mewakili normal dan 4 menjadi
penyakit radiografi paling parah. Klasifikasi ini didasarkan pada fitur dari
ostephytes (pertumbuhan tulang yang berdekatan dengan ruang sendi),
penyempitan sebagian atau seluruh ruang sendi tibialis-femoral, dan sclerosis
tulang subkondral. Klasifikasi Kellgren-Lawrence (KL) dibagi menjadi :
Grade 0: radiografi tampak normal
Grade 1: terdapat penyempitan ruang sendi dengan atau tanpa osteofit
Grade 2: terdapat osteofit, penyempitan ruang sendi yang normal atau
masih dipertanyakan
4
Grade 3: terdapat osteofit berukuran sedang, penyempitan sedang pada
ruang sendi, terdapat kista atau subkondral sklerosis, kemungkinan
adanya deformitas
Grade 4: terdapat osteofit yang berukuran besar, penyempitan ruang
sendi yang sangat menonjol, adanya sklerosis yang parah, adanya
deformitas.2
Klasifikasi ini didasarkan pada fitur dari ostephytes (pertumbuhan tulang
yang berdekatan dengan ruang sendi), penyempitan sebagian atau seluruh ruang
sendi tibialis-femoral, dan sclerosis tulang subkondral. Berdasarkan ketiga
indikator, klasifikasi KL dianggap lebih informatif daripada salah satu dari tiga
elemen individual. Karena parameter yang digunakan untuk klasifikasi OA adalah
kontinu, orang ahli mungkin berbeda dalam penilaian OA, hingga mencapai
kesimpulan yang berbeda mengenai keberadaan dan tingkat keparahan. Ini
menandakan tingkat subjektivitas yang tinggi untuk diagnosis, dan membutuhkan
cukup banyak pengetahuan dan pengalaman untuk membuat diagnosis OA yang
valid.
Karena tingginya prevalensi OA, diperlukannya alat klinis dan ilmiah yang
dipercaya bisa mendeteksi keberadaan OA dan tingkat keparahannya. Boniatis
dkk. mengusulkan sebuah metode yang menggunakan computer dalam penilaian
osteoarthritis pinggul berdasarkan deskriptor tekstur dan bentuk radiografi ruang
sendi pinggul, yang menunjukkan akurasi 95,7% dalam deteksi dari OA pinggul
dari 64 X-ray pinggul (18 normal dan 46 OA).
Cherukuri dkk. menjelaskan metode berdasarkan convex hull untuk
mendeteksi taji tulang anterior (osteofit) dengan akurasi ~90% menggunakan 714
gambar X-ray tulang belakang lumbal. Browne dkk. mengusulkan sebuah sistem
yang memantau perubahan dalam sendi jari berdasarkan satu set radiografi yang
diambil pada waktu yang berbeda, yang dapat mendeteksi perubahan dalam
jumlah dan ukuran dari osteofit, dan Mengko dkk. mengembangkan metode
otomatis untuk mengukur penyempitan ruang sendi di lutut OA.
Meskipun tingginya prevalensi OA lutut, alat untuk mendeteksi
berdasarkan komputer dengan gambar tunggal X-ray belum tersedia baik untuk
tujuan klinis atau penelitian. Di sini kita menjelaskan sebuah metode untuk
5
deteksi otomatis OA dengan menggunakan analisis gambar X-ray lutut berbasis
komputer. Sementara pada saat ini kami tidak menyarankan bahwa metode yang
diusulkan dapat sepenuhnya menggantikan seorang pembaca manusia, ini dapat
berfungsi sebagai alat penunjang diagnosis, dan juga dapat diterapkan terhadap
klasifikasi sejumlah besar X-ray untuk percobaan penelitian klinis. Dalam Bagian
II kami menjelaskan data yang digunakan untuk pelatihan dan menguji metode
yang diusulkan, dalam Bagian III kami menyajikan deteksi sendi dalam X-ray,
bagian IV kami menjelaskan klasifikasi otomatis dari lutut X-ray, dan dalam
bagian V pembahasan hasil eksperimen.
II. DATA
Data yang digunakan untuk percobaan adalah gambar X-ray lutut diambil dalam
perjalanan dua tahun berturut-turut, sebagai bagian dari studi Aging Longitudinal
Baltimore (BLSA), yang merupakan studi penuaan normatif longitudinal. Gambar
X-ray diperoleh di semua peserta, terlepas dari gejala atau keterbatasan
fungsional, sehingga memberikan representasi tanpa bias X-ray lutut dalam
sampel penuaan.
X-ray Lutut fleksi tetap diperoleh dengan sudut cahaya di 10 derajat,
berfokus pada fossa poplitea menggunakan Siremobile Compact C-arm (Siemens
Medical Solutions, Malvern, PA). Gambar asli adalah 8-bit 1000 × 945 grayscale
gambar DICOM, dikonversi ke dalam format TIFF. Gambar lutut kiri dibalik
secara horizontal untuk menghindari varians yang tidak perlu dalam data.
Setiap gambar lutut diklasifikasikan menurut Kellgren-Lawrence (0-4)
seperti yang dijelaskan dalam buku Atlas Radiografi Standar oleh dua pembaca
yang berbeda, dengan nilai sumbang diputuskan oleh pembaca ketiga. Dalam
79,8% kasus dua pembaca menunjukkan kelas KL sama, dan gambar sisanya
diputuskan oleh pembaca ketiga.
Pembaca X-ray adalah ahli radiologi dengan setidaknya 25 tahun
pengalaman membaca, dan membaca dari 50 hingga 100 muskuloskeletal X-ray
per hari. Untuk memaksimalkan komparabilitas antara pembaca, semua pembaca
menerima pelatihan menggunakan satu set "standar emas" X-ray. Setiap gambar
lutut juga dinilai osteofit, penyempitan ruang sendi dan sclerosis dari
6
kompartemen medial dan lateral, dan penajaman spina tibialis. Jumlah gambar X-
ray lutut yang digunakan adalah 350, dibagi dalam empat tingkat KL seperti yang
dijelaskan dalam Tabel I.
TABEL I
DISTRIBUSI FOTO XRAY BERDASARKAN NILAI KL
KL
gradeKL description
No.
of images
0
1
2
3
No osteophytes, normal joint space
Doubtful narrowing, possible osteophytes
Minimal but definite osteophytes, joint space
Definite and moderate osteophytes
joint space narrow, some subchondralsclerosis
154
102
39
55
Dalam klasifikasi yang diusulkan masing-masing nilai KL dianggap
sebuah kelas, sehingga deteksi kelas KL lengkap otomatis adalah
pengklasifikasian empat arah. Nilai KL 4 (OA berat) dan 5 (lutut diganti) tetap
berada di luar lingkup penelitian ini karena gejala nyeri berat yang menyertai nilai
OA ini, membuat deteksi berbasis komputer kurang efektif pada KL kelas 4, dan
tidak relevan di KL kelas 5.
Gambar 1 menunjukkan empat X-ray lutut dari nilai KL 0 (normal), 1
(diragukan), 2 (minimal) dan 3 (sedang). Seperti dapat dilihat pada gambar,
sebagian besar gambar X-ray adalah latar belakang atau bagian tidak relevan dari
tulang, sementara hanya daerah sekitar sendi berisi informasi yang berguna untuk
tujuan deteksi OA. X-ray juga mengandung beberapa meta-data dalam bentuk
huruf R dan L. Huruf-huruf ini adalah efek pelat logam berbentuk huruf kecil
yang ditempatkan di dekat lutut ketika X-ray akan diambil, mencegah
kemungkinan kebingungan antara lutut kiri dan kanan.
Sampel Gambar 1 menunjukkan bagaimana nilai KL yang berbeda
mungkin terlihat cukup mirip dengan mata yang tak terlatih. Bahkan para ahli
yang berpengalaman dan terlatih dapat menemukan kesulitan untuk menetapkan
kelas KL dan menilai keparahan OA, dan analisis kedua (dan kadang-kadang juga
7
hingga tiga) analisis seringkali diperlukan untuk mendapatkan diagnosis yang
handal dan akurat.
Meskipun menyediakan pendekatan untuk menilai status lutut, klasifikasi
KL manual tidak dapat dianggap sebagai standar emas untuk tingkat keparahan
OA. Alasan untuk itu adalah bahwa klasifikasi KL didasarkan pada seperangkat
elemen radiografi visual yang telah diamati berkorelasi dengan OA, namun tidak
ada bukti bahwa serangkaian elemen ini lengkap. Oleh karena itu, seserorang bisa
mendiagnosis OA, dengan lebih banyak unsur dan tanda-tanda yang jelas, atau
tanda-tanda tersebut tidak terlihat jelas oleh mata telanjang. Ketidaklengkapan
himpunan elemen KL dapat terlihat oleh korelasi parsial antara gejala nyeri dan
klasifikasi KL.
Bagian penting lainnya adalah kejadian OA terus berlanjut, sementara
nilai KL masih belum jelas. Artinya, X-ray lutut yang diklasifikasikan sebagai KL
kelas 1 dapat berada di suatu tempat antara kelas 0 dan 1, tapi karena nilai KL
adalah kelas diskrit, kasus di-antara ini akan diklasifikasikan sebagai KL murni
kelas 1. Transisi dari variabel kontinu ini ke variabel diskrit dapat dipengaruhi
oleh banyak kasus.
III. DETEKSI SENDI
Meskipun upaya untuk membuat X-ray sekonsisten mungkin, gerakan alamiah
dari pasien manusia, terutama pada usia tua, membuatnya hampir mustahil untuk
mengulangi prosedur dengan cara yang sama persis karena perbedaan dalam
fleksibilitas dari pasien dan kemampuan mereka untuk menempatkan lutut mereka
pada posisi yang tepat, serta kemampuan mereka untuk mempertahankan posisi
tersebut hingga X-ray diambil. Akibatnya, posisi sendi dalam gambar X-ray dapat
bervariasi secara signifikan.
Karena dalam setiap gambar X-ray sendi dapat muncul pada koordinat
gambar yang berbeda, algoritma deteksi sendi diperlukan untuk menemukan sendi
dan memisahkannya dari keseluruhan gambar. Hal ini dilakukan dengan
menggunakan seperangkat tetap 20 gambar dipilih sebelumnya, sehingga setiap
gambar adalah 150 × 150 window dari pusat sendi. Sebagai contoh, Gambar 2
8
adalah pusat sendi dari X-ray dari panel pada Gambar 1. Gambar-gambar ini
kemudian di downscaled dengan faktor gambar 10 ke 15 × 15.
Gambar. 2. Sebuah window dari pusat sendi digunakan untuk menemukan
pusat sendi dalam Xray
Mencari sendi lutut yang diberikan dalam gambar X-ray dilakukan dengan
terlebih dahulu downscaling gambar dengan faktor 10, dan kemudian pemindaian
gambar dengan 15 × 15 shifted window. Untuk setiap posisi, jarak Euclidean
antara 15 × 15 piksel dari window bergeser dan masing-masing 20 15 × 15
gambar sendi yang telah ditetapkan dihitung dengan menggunakan Persamaan 1,
d i , w=√∑y=1
15
∑x=1
15
( I x , y−W x, y )2
Dimana W x,y adalah intensitas pixel x, y di window bergeser W, Ix, y
adalah intensitas pixel x, y pada gambar sendi I, dan di, w adalah jarak Euclidean
antara gambar sendi I dan 15 × 15 shifted window W.
Sejak pelaksanaan diusulkan menggunakan 20 gambar sendi, 20 jarak yang
berbeda dihitung untuk setiap posisi yang mungkin dari shifted window, tetapi
hanya dari 20 jarak terpendek dicatat.
9
Setelah memindai seluruh (lebar/10-15) × (tinggi/10-15) posisi yang
mungkin, window yang mencatat jarak Euclidean terkecil ditentukan sebagai
pusat sendi, dan 250 × 200 piksel sekitar pusat ini membentuk sebuah gambar
yang digunakan untuk analisis otomatis. Gambar 3 menunjukkan contoh dari
250 × 200 area sendi. Karena setiap gambar berisi tepat satu sendi, dan karena
varians rotasi lutut cukup minim, metode sederhana dan cepat mampu berhasil
menemukan pusat bersama di semua gambar dalam dataset.
Gambar. 3. Daerah sendi dari Xray lutut
Dengan menggunakan gambar yang lebih kecil untuk klasifikasi otomatis
membuat mereka bersih dari fitur berbagai latar belakang, dan membuat gambar
invarian ke posisi sendi dalam X-ray asli. Tidak ada usaha yang dibuat untuk
memperbaiki varians rotasi gambar, karena varians kecil ini diperkirakan tidak
akan mempengaruhi analisis gambar dijelaskan dalam Bagian IV.
IV. KLASIFIKASI GAMBAR
Instrumen radiografi modern banyak yang lebih sensitif daripada mata manusia
untuk mengamati gambar yang dihasilkan. Oleh karena itu, dapat secara wajar
diasumsikan bahwa OA dapat dideteksi oleh elemen-elemen lain, selain yang
diusulkan oleh Kellgren-Lawrence, tetapi tidak digunakan untuk klasifikasi karena
ketidakmampuan dari mata manusia untuk merasakan mereka. Sejak komputer
10
secara substansial lebih sensitif terhadap variasi intensitas kecil, penggunaan yang
efektif dari kekuatan deteksi berbasis komputer akan didasarkan pada klasifikasi
data-driven, bukan upaya untuk mengikuti masing-masing elemen dari klasifikasi
manual yang digunakan oleh Kellgren & Lawrence.
Metode ini bekerja dengan terlebih dahulu mengekstraksi satu set besar fitur
gambar, kemudian dipilih fitur yang paling informative. Sejak transformasi
gambar sering dapat memberikan informasi tambahan yang sulit untuk
disimpulkan ketika menganalisis piksel baku, fitur gambar dihitung tidak hanya
pada piksel baku, tetapi juga pada transformasi beberapa gambar, dan juga pada
transformasi dari transformasi. Deskriptor konten gambar ini diambil dari
transformasi dan transformasi senyawa telah ditemukan sangat efektif dalam
pengukuran klasifikasi dan kesamaan dataset gambar biologis dan biometrik.
Untuk ekstraksi fitur gambar kita menggunakan algoritma berikut,
dijelaskan lebih lengkap di:
1. Fitur Zernike adalah nilai-nilai absolut dari koefisien aproksimasi
polinomial Zernike dari gambar seperti yang dijelaskan, memberikan 72
konten gambar deskriptor.
2. Multi-skala Histogram dihitung menggunakan nomor dari berbagai
tempat (3, 5, 7, dan 9), seperti yang diusulkan, memberikan 3 +5 +7 +9
= 24 deskriptor konten gambar.
3. Empat momen mean Pertama, standar deviasi, skewness, dan
kurtosis dihitung pada "garis" gambar di empat arah yang berbeda (0, 45,
90, 135 derajat). Setiap set garis-garis ini kemudian sampel ke dalam
histogram 3-bin, menyediakan 4 × 4 × 3 = 48 deskriptor gambar.
4. Fitur Tekstur Tamura kontras, direksiobalitas dan kekasaran,
sehingga deskriptor kekasaran adalah jumlahnya dan 3-bin histogram,
memberikan 1 +1 +1 +3 = 6 fitur gambar.
5. Fitur Haralick dihitung pada matriks kejadian gambar seperti yang
dijelaskan, dan menyumbangkan nilai-nilai gambar 28 deskriptor.
6. Chebyshev Statistik - Sebuah histogram 32-bin dari 1 × 400 vektor
yang dihasilkan oleh Chebyshev transform gambar dengan urutan N =
20.
11
Pengubah gambar yang digunakan oleh metode yang diusulkan adalah
Transformasi Wavelet yang umum digunakan (Symlet 5, tingkat 1), Transformasi
Fourier dan Transformasi Chebyshev. Selain itu, tiga transformasi gabungan juga
digunakan, yang diikuti olehtransformasi Chebyshev, transformasiFourier,
transformasi wavelet diikuti dengan transformasi Fourier, dan transformasi
Fourier diikuti olehtransformasi Chebyshev. Karena intuisi manusia dan analisis
fitur gambar diambil dari transformasi dan transformasi gabungan terbatas,
transformasi gabungan tersebut dipilih secara empiris dengan menguji semua
permutasi 2-tingkat dari tiga transformasi dasar (Wavelet, Fourier dan
Chebyshev), dan menilai kontribusi konten yang dihasilkan deskriptor untuk
akurasi klasifikasi.
Mengekstrak seperangkat deskriptor 210 konten gambar dari 7 transformasi
gambar yang berbeda (termasuk piksel mentah) menghasilkan vektor fitur dari
dimensi dari 1470. Namun, tidak semua fitur gambar sama-sama informatif, dan
beberapa fitur tersebut diharapkan untuk mewakili kebisingan. Untuk memilih
fitur gambar paling informatif dan menolak fitur bising, setiap deskriptor konten
gambar ditugaskan dengan skor Fisher, dijelaskan oleh Persamaan 2,
W f=1N∑c=1
N (T f −T f , c)2
σ f ,c2
dimana Wf adalah Skor Fisher dari fitur f, N adalah
jumlah total kelas, T f adalah rata-rata nilai dari fitur f antara gambar dialokasikan
untuk pelatihan, dan T f , cdan σ f , c2 adalah mean dan varians dari nilai-nilai dari fiturf
antara semua gambar pelatihan kelas c. Skor Fisher dapat dikonseptualisasikan
sebagai rasio varians dari mean kelas dikumpulkan untuk rata-rata varians dalam
kelas. Semua varians digunakan dalam persamaan dihitung setelah nilai dari f fitur
dinormalisasi terhadap interval. Nilai Skor Fisher memperingkatkan fitur gambar
dengan keinformatifan mereka, dan ditugaskan ke semua fitur 1470 dihitung
dengan mengekstraksi deskripsi gambar konten 210 dari 7 transformasi gambar
yang berbeda (termasuk gambar asli).
Setelah masing-masing dari 1470 fitur gambar ditugaskan dengan skor
Fisher, 90% terlemah dari fitur (dengan skor Fisher terendah) ditolak,
mengakibatkan ruang fitur dari 147 gambar deskriptor konten. Sebagaimana
dijelaskan dalam Bagian V, pengaturan ini memberikan kinerja terbaik dalam hal
12
akurasi klasifikasi. Distribusi dari berbagai jenis fitur gambar dan transformasi
citra dijelaskan dalam Tabel II.
TABEL II
DISTRIBUSI TIPE DARI FITUR DENGAN ALGORITME DAN
TRANSFORMASI GAMBAR
Transform Zernike polynomial
s
Haralick textures
Tamura textures
First four
moments
Multi-scale
histogram
Chebyshev statistic
Total
Raw pixels
10 8 1 0 0 6 25
Wavelet 22 1 4 3 0 0 30Chebyshev 26 0 2 1 2 4 35
Fourier 0 2 2 2 0 0 6Fourier +
Chebyshev0 10 0 5 7 0 22
Fourier + Wavelet
9 0 1 0 0 4 14
Chebyshev + Fourier
0 10 00 4 1 0 15
Total 67 31 10 15 10 14 147
Seperti tabel tunjukkan, deskriptor konten gambar paling informatif adalah
polinomial Zernike, dan keduanya Haralick dan fitur tekstur Tamura. Sifat radial
Zernike polinomial memungkinkan fitur ini untuk mencerminkan perbedaan
dalam unit disk, sehingga fitur ini diharapkan peka terhadap ruang sendi di
gambar Xray. Seperti yang diamati dan secara teliti dibahas oleh Boniatis dkk.,
pola variasi intensitas piksel secara matematis digambarkan oleh fitur tekstur
berkorelasi dengan perubahan biokimia, biomekanik dan struktural kartilago
artikular dan jaringan tulang subchondral. Proses ini telah dikaitkan dengan
degenerasi kartilago pada OA, dan karena itu diharapkan mempengaruhi jaringan
sendi dalam mode yang dapat dirasakan oleh tekstur radiografi.
Karena tidak semua elemen radiografi OA telah diisolasi dan ditandai
dengan baik, tidak semua fitur gambar diskriminatif diharapkan sesuai dengan
elemen OA dikenal. Oleh karena itu, sebagian kecil dari nilai-nilai diskriminatif
seperti distribusi statistik dari nilai-nilai pixel dari transformasi Fourier transform
13
diikuti dengan Chebyshev sulit untuk mengasosiasikan dengan elemen radiografi
OA yang dikenal.
Algoritma tambahan untuk fitur gambar ekstraksi telah diuji, tetapi
ditemukan kurang informatif untuk klasifikasi nilai KL. Deskriptor konten gambar
Ini termasuk fitur transformasi Radon, yang diharapkan berkorelasi dengan ruang
sendi, tetapi diungguli oleh polinomial Zernike. Filter Gabor menangkap
informasi tekstural yang juga dapat berguna untuk analisis, tetapi ditemukan
kurang informatif daripada tekstur Haralick dan Tamura. Karena bidang yang
diminati memiliki variasi intensitas relatif rendah, fitur kontras tinggi seperti tepi
dan statistik objek seperti yang dijelaskan tidak memberikan informasi yang
bermanfaat.
Setelah menghitung nilai-nilai fitur semua gambar tes yang diberikan, vektor
fitur yang dihasilkan diklasifikasikan menggunakan aturan Weighted Nearest
Neighbor, yang merupakan salah satu rutinitas yang paling efektif untuk
klasifikasi non-parametrik. Bobot, dalam hal ini, adalah skor Fisher dihitung
dengan Persamaan 2. Hasil klasifikasi ini bisa menjadi kelas nilai KL ditentukan
oleh sampel pelatihan dengan jarak terpendek untuk sampel uji yang diberikan,
tetapi juga dapat menjadi nilai interpolasi berdasarkan dua sampel pelatihan
terdekat yang tidak dimiliki oleh kelas yang sama, seperti dijelaskan oleh
Persamaan 3,
KL=( K1
d1
+K2
d2) /( 1
d1
+ 1d2
)Di mana KL adalah nilai interpolasi KL yang dihasilkan, dan d1, d2 adalah
jarak dari dua sampel terdekat yang merupakann milik nilai KL berbeda K1 dan
K2, masing-masing.
Keuntungan utama dari interpolasi ini adalah bahwa hal itu berpotensi dapat
memberikan estimasi resolusi yang lebih tinggi dengan menentukan tingkat
keparahan OA dalam kelas (misalnya, KL kelas 1,6 untuk kasus keparahan OA
antara KL kelas 0 dan 1). Ini, bagaimanapun, adalah lebih sulit untuk
mengevaluasi akurasi karena data yang digunakan sebagai kebenaran dasar hanya
menentukan tingkat keparahan OA dalam resolusi nilai KL.
14
V. HASIL EKSPERIMENTAL
Metode yang diusulkan diuji dengan menggunakan dataset yang dijelaskan dalam
Bagian II, di mana kebenaran dasar adalah klasifikasi manual dari Xray. Dalam
percobaan pertama, metode yang diusulkan diuji dengan secara otomatis
mengelompokkan OA sedang (KL kelas 3) dan lutut normal (KL kelas 0).
Percobaan dilakukan dengan menggunakan 55 gambar Xray dari setiap tingkatan,
seperti bahwa 20 gambar dari setiap kelas digunakan untuk pelatihan dan 35 untuk
pengujian.
Tes ini diulang 20 kali, di mana masing-masing berjalan menggunakan split
acak yang berbeda dari gambar pelatihan dan tes. Sejak dataset memiliki lebih
gambar kelas 0 dari kelas 3, masing-masing berjalan menggunakan set gambar
yang berbeda dari 55 kelas 0, yang dipilih secara acak dari dataset. Ketepatan
klasifikasi adalah 91,5% (P <0,000001), seperti dapat dipelajari dari matriks
kebingungan Tabel III.
TABEL III
MATRIX CONFUSION OA SEDANG DAN NORMAL
Sebagaimana ditunjukkan matriks confusion, spesifisitas deteksi OA
moderat adalah ~86.5%, dan sensitivitas adalah 95%. Hal ini dapat menjadi
penting untuk penggunaan praktis potensial dari classifier yang dijelaskan, karena
mungkin terlalu protektif dalam beberapa kasus, tetapi kurang mungkin untuk
memberhentikan Xray positif seperti biasa. Perlu dicatat bahwa sementara
pembaca manusia memiliki tingkat konsensus ~80%, ketidaksepakatan biasanya
antara nilai KL tetangga, dan tidak ada kasus yang memiliki satu pembaca
mengklasifikasikan lutut normal sementara yang lain mengklasifikasikan sebagai
moderat. Oleh karena itu, pembaca yang berpengalaman dan berpengetahuan
15
harus dapat memberitahu OA lutut moderat dari normal dengan akurasi praktis
100%.
Sebuah percobaan yang sama menguji akurasi klasifikasi kelas KL 2 (OA
minimal). Sejak masalah klasifikasi ini lebih sulit, lima gambar pelatihan lebih
banyak yang digunakan untuk masing-masing kelas sehingga training set terdiri
dari 25 gambar dari kelas 0 dan 25 gambar dari kelas 2. Penggunaan set pelatihan
yang lebih besar meningkatkan akurasi klasifikasi, sementara meningkatkan
pelatihan diatur dalam deteksi kelas 3 tidak berkontribusi terhadap kinerja,
sebagaimana akan dibahas nanti dalam bagian ini. Ketepatan klasifikasi adalah
~80.4% (P <0,0001), dan matriks confusion diberikan dalam Tabel IV.
TABEL IV
MATRIX CONFUSION OA MINIMAL DAN NORMAL
Seperti yang bisa dipelajari dari tabel, spesifisitas deteksi adalah ~79.3%,
dengan sensitivitas ~81.4%. Angka-angka ini menunjukkan bahwa deteksi KL
kelas 2 kurang efektif dibandingkan dengan deteksi otomatis KL kelas 3. Hal ini
dapat dijelaskan oleh fakta bahwa kemajuan OA adalah terus menerus, sehingga
KL kelas 2 diharapkan secara visual lebih mirip dengan nilai KL 0 daripada 3.
Kami juga mencoba untuk mengklasifikasikan KL kelas 1 (OA ragu-ragu)
dari 0, yang memberikan akurasi klasifikasi sebesar 54% bila menggunakan 25
gambar per kelas untuk pelatihan dan 14 gambar untuk pengujian.
Meningkatkan ukuran set pelatihan untuk 70 sampel per kelas (dan 32
sampel untuk pengujian) sedikit membantu peningkatan kinerja sampai 57%. Hal
ini dapat dijelaskan oleh fakta bahwa kedua nilai secara visual sangat mirip, dan
bahkan pembaca manusia berpengalaman sering harus berjuang untuk
membedakan antara keduanya. Juga, karena nilai KL adalah diskrit sementara
16
kemajuan OA sebenarnya terus menerus, sangat banyak kasus antara dapat secara
signifikan berkontribusi pada kebingungan.
Tabel V menunjukkan akurasi klasifikasi ketika mengklasifikasikan
sepasang nilai KL. Dalam semua kasus, 25 gambar digunakan untuk pelatihan, 14
gambar untuk pengujian, dan keakuratan klasifikasi dihitung dengan rata-rata
akurasi 20 split acak untuk set gambar pelatihan dan tes. Perbedaan maksimum
dari rata-rata (di antara 20 giliran) juga ditentukan dalam tabel.
TABEL V
AKURASI KLASIFIKASI 2-JALURDARI SELURUH PASANGAN
NILAI KL
Seperti yang ditunjukkan tabel, klasifikasi antara dua nilai KL terdekat
kurang akurat dibandingkan klasifikasi nilai yang tidak dekat. Kita juga dapat
melihat bahwa dua nilai KL terdekat 2 dan 3 dapat dibedakan dengan akurasi
65%, sedangkan klasifikasi kelas 1, 2 dan nilai 0, 1 memberikan akurasi sebesar
60% dan 54% masing-masing. Ini mungkin menunjukkan bahwa nilai KL
tetangga secara visual lebih mirip satu sama lain pada tahap awal OA. Hal ini juga
terlihat bahwa akurasi klasifikasi meningkat sebagaimana perbedaan antara nilai
KL akan lebih besar. Misalnya, akurasi klasifikasi nilai KL 3 dan 0 adalah lebih
baik dari akurasi klasifikasi nilai KL 3 dan 1. Hasil ini sesuai dengan sifat
kontinyu dari OA.
Menguji akurasi klasifikasi ketika mengklasifikasikan semua 4 nilai KL
dilakukan dengan secara acak memilih 25 gambar dari setiap kelas untuk
pelatihan, dan kemudian memilih 14 gambar yang tersisa dari setiap kelas untuk
pengujian. Percobaan ini diulang 20 kali, sehingga dalam menjalankan setiap set
pelatihan dan uji ditentukan secara acak. Ketepatan klasifikasi keseluruhan dari
17
classifier ini adalah 47%, seperti yang dijelaskan oleh matriks confusion dari
Tabel VI.
Akurasi Klasifikasi 47% tidak dapat dianggap kuat, dan itu secara signifikan
lebih rendah dari 79,8% dari kesepakatan antara dua ahli manusia. Namun,
matriks confusion menunjukkan bahwa dari semua kasus KL kelas 3, hanya ~4%
digolongkan sebagai non-OA (KL kelas 0), dan ~13% sebagai diragukan (KL
kelas 1). Meneliti positif palsu, matriks confusion menunjukkan bahwa ~7% dari
Xray secara manual diklasifikasikan sebagai kelas 0 KL yang salah
diklasifikasikan oleh metode yang diusulkan sebagai KL kelas 3 (sedang), dan
juga ~11% dari KL kelas 1 keliru diklasifikasikan sebagai KL kelas 3.
TABEL VI
MATRIX CONFUSION PENGKLASIFIKASI 4-JALUR DARI SELURUH NILAI KL
Karena kemajuan OA sebenarnya adalah variabel kontinu, ada banyak di
antara kasus yang dapat digolongkan ke salah satu dari dua kelas terdekat dari
kasus yang diberikan. Misalnya, kemajuan OA antara KL kelas 1 dan kelas 2
dapat diklasifikasikan baik 1 dan 2. Seperti dijelaskan pada akhir Bagian IV, nilai
yang dihasilkan dari klasifikasi gambar juga dapat menjadi interpolasi dari dua
nilai KL terdekat, daripada kelas kelas KL tunggal. Efektivitas interpolasi ini
dapat ditunjukkan dengan menghitung koefisien korelasi Pearson antara nilai KL
diprediksi dan aktual (bila menggunakan semua 4 grade KL seperti yang
dijelaskan pada Tabel VI). Bila menggunakan nilai interpolasi sebagai kelas yang
diprediksi, Pearson korelasi adalah 0,73, dibandingkan dengan 0,49 ketika kelas
KL yang diprediksi hanya kelas yang terdekat dengan sampel pelatihan.
Lutut diklasifikasikan sebagai positif OA jika sudah diklasifikasikan sebagai
KL grade 2 atau lebih tinggi. Dengan menggabungkan gambar dari nilai KL 2 dan
3, kami memperkenalkan sebuah kelas baru yang disebut OA positif yang berisi
18
78 gambar (39 dari masing-masing kelas). Percobaan dilakukan dengan
membangun classifier 2-arah menggunakan kelas yang baru didefinisikan dan KL
kelas 0, seperti bahwa 60 gambar dari setiap kelas digunakan untuk pelatihan dan
18 untuk pengujian. Tujuan penelitian ini adalah untuk mengklasifikasikan Xray
positif OA dari negatif OA. Ketepatan klasifikasi classifier ini adalah ~86.1%,
dengan sensitivitas dan spesifisitas ~88.7% dan ~83.5%, masing-masing.
Hal ini juga penting untuk menyebutkan bahwa Xray diambil dari subyek
manusia yang dipilih secara acak yang berpartisipasi dalam studi BLSA, dan tidak
harus dari pasien yang melaporkan gejala rasa sakit atau didiagnosis sebagai
positif OA di salah satu sendi lain mereka. Kebijakan ini memberikan representasi
yang seragam dari populasi lanjut usia, dan karena itu dapat diasumsikan bahwa
hasil yang disajikan di sini dapat digeneralisasi pada populasi lansia secara
keseluruhan.
Ketepatan klasifikasi dapat dipengaruhi oleh ukuran training set sedemikian
rupa sehingga diharapkan meningkat sejalan dengan jumlah sampel pelatihan
yang semakin tinggi. Gambar 4 menunjukkan akurasi klasifikasi dari klasifikasi
nilai KL 2 dan 3 dari kelas KL 0 sebagai fungsi dari ukuran training set. Seperti
dapat dipelajari dari grafik, untuk KL kelas 3akurasi klasifikasi meningkat
sebagaimana ukuran dari set pelatihan semakin besar, tetapi stabil pada _14
gambar pelatihan per kelas. keakuratan Klasifikasi KL kelas 2 juga meningkat
dengan jumlah gambar pelatihan, tetapi dataset kami tidak cukup besar untuk
menentukan apakah mencapai puncak akurasi.
19
Gambar. 4. akurasi Klasifikasi (%) dari nilai KL 2 dan 3 sebagai fungsi dari ukuran training set
Seperti dijelaskan dalam Bagian IV, 10% dari fitur gambar dengan skor
Fisher tertinggi digunakan untuk klasifikasi, sedangkan sisanya dari deskriptor
konten gambar diabaikan. Gambar 5 menunjukkan bagaimana jumlah fitur yang
digunakan untuk klasifikasi mempengaruhi akurasi klasifikasi KL kelas 3.
Menurut grafik, kinerja terbaik dicapai bila menggunakan antara 7,5% sampai
12,5% dari jumlah total fitur gambar (1470).
Gambar. 5. Klasifikasi akurasi (%) dari nilai KL 2 dan 3 sebagai fungsi dari
jumlah fitur gambar yang digunakan
Dalam hal kompleksitas komputasi, mengklasifikasi satu gambar Xray
membutuhkan 105 detik, dengan menggunakan sistem dengan 2GHz Intel
prosesor dan 1MB RAM. Sementara waktu yang diperlukan untuk deteksi
bersama yang dijelaskan dalam Bagian III diabaikan, hampir semua waktu CPU
dikorbankan untuk mengubah gambar dan mengekstraksi fitur gambar. Faktor
utama kompleksitas ini adalah fitur Zernike 2-dimensi, yang dikenal mahal.
Kelemahan dari classifier ini membuatnya tidak cocok untuk aplikasi realtime
atau tugas lain di mana kecepatan adalah perhatian utama, tetapi mungkin cukup
cepat untuk klasifikasi tunggal gambar Xray, terutama mengingat kenyataan
20
bahwa seluruh prosedur menggunakanXray dapat membutuhkan waktu lebih lama
lagi.
Peningkatan waktu respon dari classifier dapat dicapai dengan paralelisasi dari
algoritma ekstraksi fitur. Karena sebagian besar fitur gambar tidak tergantung
pada satu sama lain, algoritma menjadi sepele untuk memparalelkan sehingga
banyak fitur gambar dapat dihitung secara bersamaan oleh prosesor yang berbeda.
Sebagai contoh, sementara satu prosesor dapat menghitung fitur Haralick pada
Transformasi Chebyshev, prosesor lain dapat mengekstrak fitur Haralick dari
Transformasi Fourier, atau fitur Zernike dari transformasi Chebyshev. Untuk
mengambil keuntungan penuh dari paralelisasi, algoritma juga telah
diimplementasikan dengan menggunakan Open Microscopy Environment (OME)
software suite (Ome), yang merupakan platform untuk penyimpanan dan
pengolahan gambar mikroskop, dan dirancang untuk mengoptimalkan
pelaksanaan dan aliran data dari modul eksekusi ganda. Penjelasan rinci dari
paralelisasi transformasi gambar dan gambar fitur ekstraksi di Ome dapat
ditemukan.
VI. KESIMPULAN
Dalam tulisan ini kita menjelaskan pendekatan otomatis untuk mendeteksi OA
lutut dengan menggunakan X-ray. Dengan tidak adanya metode diagnosis OA
yang akurat, kelas KL yang secara manual diklasifikasikan digunakan di sini
sebagai "gold standar", walaupun diketahui bahwa metode ini kurang sempurna.
Klasifikasi ini tidak dilakukan dengan cara yang mencoba untuk meniru
klasifikasi manusia, tetapi didasarkan pada pendekatan diarahkan data
menggunakan X-ray yang secara manual diklasifikasikan dari nilai KL yang
berbeda, yang mewakili berbagai tahap keparahan OA.
Hasil penelitian menunjukkan bahwa lebih dari 95% kasus OA moderat
dibedakan secara akurat dari kasus normal, dengan tingkat positif palsu ~12.5%.
Klasifikasi akurasi membedakan OA minimal dari kasus normal ~80%, dan
deteksi kasus OA meragukan adalah jauh kurang meyakinkan. Upaya di kemudian
hari meningkatkan akurasi deteksi OA diragukan akan mencakup integrasi
informasi klinis yang relevan seperti riwayat cedera lutut, berat badan, dan sudut
21
alignment lutut, dan juga akan menggunakan lebih banyak sampel X-ray yang
telah tersedia. Namun, karena sifat subjektif dari "gold standar", adalah mungkin
bahwa korelasi 100% antara klasifikasi berbasis komputer dan manual tidak dapat
dicapai. KL nilai 4 (OA berat) dan 5 (lutut diganti) tetap berada di luar lingkup
penelitian ini karena gejala berat yang menyertai tahap ini, dan deteksi relatif
mudah OA di tahap ini. Sedangkan akurasi klasifikasi nilai KL 1 dan 2 tidak dapat
dianggap kuat, penting untuk dicatat bahwa pembaca radiograf sering ditantang
dalam upaya untuk membedakan nilai nilai ini, dan oleh karena itu kebingungan
dari deteksi otomatis antara kedua nilai tidak dapat dianggap mengejutkan.
Kami mengakui bahwa peralatan yang digunakan untuk mendapatkan
gambar lutut tidak memungkinkan untuk resolusi maksimal struktur sendi. Kami
berspekulasi gambar radiografi konvensional diperkirakan akan memungkinkan
untuk deliniasi yang lebih baik dari nilai OA, terutama pada kasus dengan
penyakit kurang parah. Tentu radiografi konvensional mampu menggambarkan
struktur sendi lebih mudah, tetapi mencapai hal ini dengan paparan radiasi lebih
besar. Penerapan perangkat lunak pencitraan untuk interpretasi gambar X-ray
terjadi tanpa bias yang melekat dalam interpretasi klinis. Akhirnya, studi ini
dilakukan dalam konteks studi penuaan longitudinal yang akan memungkinkan
perbandingan data pencitraan untuk fitur OA klinis sebagai rasa sakit, tetapi juga
untuk langkah-langkah fisiologis relevan dengan penuaan sistem tubuh yang
mungkin berkontribusi terhadap keparahan OA.
Rencana masa depan termasuk pengujian teknik otomatis ini dalam
evaluasi gambar lutut longitudinal diperoleh dari waktu ke waktu, untuk
memeriksa apakah OA dapat dideteksi sebelum bukti radiografis terlihat oleh
seorang pembaca. Kami juga berencana untuk mengembangkan teknik yang mirip
untuk mengklasifikasikan X-ray tangan dengan memperhatikan sendi sinyal yang
cenderung untuk pengembangan OA.
Kode sumber lengkap yang digunakan untuk percobaan tersedia untuk
download gratis di bawah lisensi GNU standar publik melalui CVS di
www.openmicroscopy.org. Para ilmuwan dan insinyur didorong untuk men-
download, mengkompilasi dan menggunakan kode ini untuk kebutuhan mereka.
22