Progress Resume Shinta Pramesti 5110100186

6
Progress_resume materi TA Shinta Pramesti / 5110100186 “Identifikasi Parameter Optimal Metode RPS pada Domain Frekuensi: Studi kasus Ekstraksi Fitur data Sleep Apnea” Assalamu’alaikum, Wr. Wb, Bapak, saya akan mencoba menjelaskan TA saya yaa Pak.. Ide dasar dari TA ini yaitu saya ingin mengidentifikasi parameter optimal yang diperlukan untuk merekonstruksi ruang fase berdasarkan metode embedding delay, dengan data set sinyal ECG - apnea. Nilai parameter dihitung pada domain frekuensi. Setelah ruang fase terbentuk, dilakukan ekstraksi fitur nonlinier berdasarkan titik-titik data yang ada di ruang fase. Kira-kira bapak setuju tidak dengan ide ini? Atau ide saya masih ada yang kurang tepat ya Pak? Berdasarkan teori Takens, koordinat titik di ruang fase dibentuk menggunakan time delay berdasarkan persamaan berikut: [1] [2] () = ((), ( + ), ( + 2), … , ( + ( − 1)) v(t) = koordinat titik ke-t pada ruang fase. x(t) = koordinat titik ke-t pada data input. τ = time delay. d = dimensi ruang fase yang direkonstruksi. Jika proses rekonstruksi dilakukan dengan benar, titik-titik data yang dipetakan di ruang fase hasil rekonstruksi mempunyai bentuk topologi yang sama dengan ruang fase aslinya (embedding). Ada dua parameter harus diestimasi, yaitu: 1. Dimensi (d) Menyatakan jumlah dimensi optimum ruang fase yang direkonstruksi. Dimensi embedding didapatkan ketika d>2D. (D = dimensi ruang fase sebenarnya) 2. Delay/ lag Digunakan untuk membentuk koordinat setiap titik di ruang fase. jika dataset sinyal yang digunakan bebas dari noise, delay berapapun dapat dipakai untuk merekonstruksi ruang fase, tetapi karena sinyal ecg tidak noise free, nilai delay harus diestimasi karena delay menentukan akurasi lintasan yang terbentuk di ruang fase terekonstruksi. Langkah-langkah pada TA ini kurang lebih kalau digambarkan seperti ini, Bapak ESTIMASI PARAMETER Saya ada kendala di proses estimasi parameter ini, Bapak. Kalau berdasarkan judul TA saya, berarti parameter RPS nya diestimasi di domain frekuensi yaa Pak? Nah, kalau benar begitu, saya belum menemukan referensi paper yang membahas metode untuk estimasi parameter Estimasi Parameter Time delay Dimensi embedding 0 50 100 150 200 250 300 -1 -0.5 0 0.5 1 1.5 Sinyal ECG -1 0 1 2 -1 0 1 2 -1 -0.5 0 0.5 1 1.5 2 Rekonstruksi ruang fase Ekstraksi Fitur

description

resume tugas akhir

Transcript of Progress Resume Shinta Pramesti 5110100186

  • Progress_resume materi TA Shinta Pramesti / 5110100186

    Identifikasi Parameter Optimal Metode RPS pada Domain Frekuensi: Studi kasus Ekstraksi

    Fitur data Sleep Apnea

    Assalamualaikum, Wr. Wb,

    Bapak, saya akan mencoba menjelaskan TA saya yaa Pak..

    Ide dasar dari TA ini yaitu saya ingin mengidentifikasi parameter optimal yang diperlukan

    untuk merekonstruksi ruang fase berdasarkan metode embedding delay, dengan data set

    sinyal ECG - apnea. Nilai parameter dihitung pada domain frekuensi. Setelah ruang fase

    terbentuk, dilakukan ekstraksi fitur nonlinier berdasarkan titik-titik data yang ada di ruang

    fase. Kira-kira bapak setuju tidak dengan ide ini? Atau ide saya masih ada yang kurang tepat

    ya Pak?

    Berdasarkan teori Takens, koordinat titik di ruang fase dibentuk menggunakan time

    delay berdasarkan persamaan berikut: [1] [2]

    () = ((), ( + ), ( + 2), , ( + ( 1))

    v(t) = koordinat titik ke-t pada ruang fase.

    x(t) = koordinat titik ke-t pada data input.

    = time delay.

    d = dimensi ruang fase yang direkonstruksi.

    Jika proses rekonstruksi dilakukan dengan benar, titik-titik data yang dipetakan di

    ruang fase hasil rekonstruksi mempunyai bentuk topologi yang sama dengan ruang fase

    aslinya (embedding). Ada dua parameter harus diestimasi, yaitu:

    1. Dimensi (d)

    Menyatakan jumlah dimensi optimum ruang fase yang direkonstruksi. Dimensi embedding

    didapatkan ketika d>2D. (D = dimensi ruang fase sebenarnya)

    2. Delay/ lag

    Digunakan untuk membentuk koordinat setiap titik di ruang fase. jika dataset sinyal yang

    digunakan bebas dari noise, delay berapapun dapat dipakai untuk merekonstruksi ruang

    fase, tetapi karena sinyal ecg tidak noise free, nilai delay harus diestimasi karena delay

    menentukan akurasi lintasan yang terbentuk di ruang fase terekonstruksi.

    Langkah-langkah pada TA ini kurang lebih kalau digambarkan seperti ini, Bapak

    ESTIMASI PARAMETER

    Saya ada kendala di proses estimasi parameter ini, Bapak. Kalau berdasarkan judul TA saya,

    berarti parameter RPS nya diestimasi di domain frekuensi yaa Pak? Nah, kalau benar begitu,

    saya belum menemukan referensi paper yang membahas metode untuk estimasi parameter

    Estimasi Parameter

    Time

    delay

    Dimensi

    embedding

    0 50 100 150 200 250 300-1

    -0.5

    0

    0.5

    1

    1.5

    Sinyal ECG

    -1

    0

    1

    2

    -1

    0

    1

    2-1

    -0.5

    0

    0.5

    1

    1.5

    2

    Rekonstruksi

    ruang fase Ekstraksi

    Fitur

  • Progress_resume materi TA Shinta Pramesti / 5110100186

    yang diimplementasikan di domain frekuensi. Dari beberapa paper referensi yang membahas

    RPS [1] [2] [3] [4] [5] [6] [7], mereka menggunakan metode mutual information untuk

    menghitung delay dan FNN untuk menghitung dimensi. Saya coba resume yang saya pelajari

    ya, Pak..

    Estimasi Delay menggunakan Mutual information

    Mutual information menyatakan banyaknya informasi yang dimiliki oleh kedua data (korelasi

    antar data). Mutual information bernilai 0 1. Dengan menggunakan metode MI, delay

    optimum didapatkan ketika MI bernilai minimum untuk pertama kalinya. Mutual Information

    dihitung berdasarkan rumus berikut:

    () = ((), ( + ))2 [((), ( + ))

    (())(( + ))]

    =1

    P(x(n), x(n+)) = probabilitas gabungan

    P(x(n)) = probabilitas marginal data asli

    P(x(n+) = probabilitas marginal data versi delay

    Langkah-langkah untuk mendapatkan delay optimal menggunakan metode MI:

    1. Menentukan delay dan data versi delay yang akan digunakan untuk menghitung MI

    2. Menghitung probabilitas marginal data asli dan data versi delay

    3. Menghitung probabilitas gabungan kedua data

    4. Menghitung nilai Mutual Information berdasarkan rumus MI diatas.

    5. Mengulangi langkah 1 s.d 4 untuk delay+1 hingga delay maksimum yang ingin diketahui

    nilai MI nya

    6. Dari semua nilai MI yang telah dihitung, cari MI yang bernilai minimum untuk pertama

    kalinya. Delay pada first minimum MI tersebut yang digunakan sebagai delay optimum.

    7. Mengulangi langkah 1 s.d 6 untuk setiap data yang digunakan sebagai data training

    (total ada 35 data training). Dari delay optimum yang didapatkan disetiap data, modus

    dari delay tsb digunakan sebagai parameter delay untuk merekonstruksi ruang fase.

    Estimasi Dimensi Embedding menggunakan metode False Nearest Neighbor

    Metode False Nearest Neighbors (FNN) mengestimasi embedding dimension berdasarkan

    ketetanggaan antar titik pada ruang fase terekonstruksi.

    Langkah-langkah yang dilakukan pada algoritma false nearest neighbors yaitu:

    1. Mencari tetangga terdekat tiap titik di dimensi d menggunakan jarak Euklidean.

    Tetangga terdekat tiap titik dihitung menggunakan rumus:

    2(, ) = [( + ) ( + )]21=0

    2. Membandingkan jarak antar titik di dimensi ruang d dengan jarak antar titik pada

    dimensi d+1.

    2+1(,)2(,)

    2(,)

    Jarak euklidean titik di dimensi d+1 dicari menggunakan rumus:

    2+1(, ) = 2

    (, ) + [( + ) ( + )]2

  • Progress_resume materi TA Shinta Pramesti / 5110100186

    Sehingga, perbandingan tetangga terdekat di dimensi d dan d+1 dapat dituliskan sesuai dengan persamaan berikut:

    2(,)+[(+)(+)]22(,)

    2(,)=

    |(+)(+)|

    (,)

    Bila nilai absolut dari perbedaan jarak tersebut melebihi batas (threshold), kedua vektor diasumsikan sebagai false nearest neighbours.

    |(+)(+)|

    (,)>

    Rthreshold adalah nilai batas dimensi maksimum yang ditentukan melalui eksperimen numerik, biasanya berkisar 10-20.

    3. Mendeteksi noise sebagai false nearest neighbours.

    Ada kalanya ketika mencari tetangga terdekat titik v(n) dengan titik vk(n) akan ditemukan sebuah titik yang paling dekat daripada titik-titik lainnya, tetapi sebenarnya titik ini memiliki jarak cukup jauh dengan titik v(n). Bila nilai Rd(n,k) adalah dari ukuran attractor (RA), pada dimensi d+1 nilai Rd+1(n,k) maksimum adalah 2RA. Apabila nilainya lebih dari 2RA, titik tersebut dilabelkan menjadi false nearest neighbours.

    +1()

    >

    Athreshold adalah batas nilai Rd+1(n) maksimum untuk disebut true nearest neighbour. Athreshold = 2.0. Nilai RA (ukuran atraktor) dihitung menggunakan persamaan berikut:

    = 1

    [() ]2=1

    Dimana =1

    ()=1

    4. Mencatat jumlah FNN untuk setiap dimensi pada langkah 2 dan 3, lalu memilih dimensi

    dengan nilai FNN yang mendekati 0 atau sangat kecil sebagai dimensi terpilih.

    5. Mengulangi langkah 1 s.d untuk semua data training. Setelah semua dimensi dihitung,

    catat nilai rata-rata dan varian dari semua dimensi terpilih. Dimensi optimum untuk

    merekonstruksi ruang fase didapatkan dengan rumus: d = rata-rata + 2*varian

    EKSTRAKSI FITUR

    Setelah ruang fase direkonstruksi menggunakan parameter delay dan dimensi yang

    sudah diestimasi, beberapa karakteristik dinamis dari titik-titik di ruang fase terekonstruksi

    yang dapat dijadikan fitur antara lain:

    1. Detrended Fluctuation Analysis (DFA)

    Digunakan untuk mengukur autokorelasi jangka panjang dari sinyal non-stasioner

    berdasarkan karakteristik fraktal. Pada sinyal ECG, metode DFA digunakan untuk

    mengkuantifikasi karakteristik fraktal dari R-R interval. [8]

    Langkah-langkah menghitung DFA:

    1. Mengintegrasikan sinyal untuk mengetahui kejadian self-similarity. Perhitungan

    dilakukan berdasarkan persamaan berikut.

    () = (() )

    =1

  • Progress_resume materi TA Shinta Pramesti / 5110100186

    () adalah koordinat titik ke i (i=1,2,3,...,N) dari sinyal pada ruang fase

    terekonstruksi di dimensi 1. adalah rata-rata data sinyal y.

    2. Menghitung tren setiap titik

    Pada langkah ini, data yang telah diintegrasikan dibagi kedalam bin berukuran n.

    Pada setiap bin berukuran n tersebut kemudian dicari garis kuadrat terkecil (least

    square fit line) yang menjadi trend pada bin tersebut. Koordinat garis tersebut

    dinotasikan sebagai I_bin (k).

    3. Menghitung fluktuasi rata-rata (F(bin)) dari sinyal di sekitar trend berasarkan

    Persamaan berikut

    () = 1

    [() ()]2

    =1

    Mengulangi langkah 2 s.d 4 sebanyak bin yang digunakan. Secara general, nilai F

    akan meningkat sesuai dengan ukuran bin.

    4. Membuat plot grafik log-log (log F(n) vs log n),

    Nilai DFA didapatkan dari hasil perhitungan slope grafik yang terbentuk.

    2. Spectral Entropy (SE)

    Spectral Entropy digunakan untuk menghitung kompleksitas spektrum time series.

    Aplikasi dari Shanons Channel Entropy digunakan untuk mengestimasi spectral

    entropy berdasarkan Persamaan berikut.

    = (1

    )

    Pk adalah fungsi kepadatan probabilitas (probability density function / PDF) dari sinyal

    x pada frekuensi ke k. Nilai E berada pada rentang 0 s.d. 1.

    Langkah-langkah untuk mengestimasi spectral entropy dijelaskan sebagai berikut.

    1. Mengubah sinyal dari domain waktu ke domain frekuensi

    Sinyal ECG (x(n)) ditransformasikan pada domain frekuensi menggunakan FFT

    dengan memakai hanya frekuensi sampling agar tidak terjadi redundansi pada

    proses estimasi PSD. Sinyal yang telah ditransformasikan dinotasikan sebagai X(f).

    2. Menghitung Power Spectral Density (PSD)

    Nilai PSD dihitung dengan cara mengambil nilai absolut dari hasil FFT, kemudian

    mengkuadratkannya sbb:

    () = |()|2

    3. Normalisasi Power Spectral Density (PSD)

    Proses normalisasi PSD dilakukan agar hasil perhitungan PSD dapat dijadikan

    sebagai power density function (PDF). PSD yang telah dinormalisasi dinotasikan

    sebagai PSDn sesuai persamaan berikut

    () =()

    ()=

    2

    = 2

  • Progress_resume materi TA Shinta Pramesti / 5110100186

    4. Menghitung Spectral Entropy

    Setelah PDF dihitung, spectral entropy pada Persamaan diatas dapat dihitung

    menggunakan Persamaan berikut.

    = ()

    = 2

    = 2

    (1

    ())

    3. Correlation Dimension (CD)

    Digunakan untuk mengukur perubahan kepadatan (density) ruang fase yang terbentuk

    dilihat dari jarak ketetanggaan antar titik. Correlation Dimension dihitung dari nilai

    probabilitas correlation integral (CI). Correlation integral (CI) didefinisikan sebagai

    jumlahan perbedaan jarak antar titik yang masih berada dibawah ambang batas jarak

    yang ditentukan (r), dihitung pada dimensi m berdasarkan rumus berikut: [9]

    (, ) = 1

    ( 1) (

    =+1

    =1

    )

    Xi dan Xj adalah titik-titik hasil pemetaan pada phase space, r adalah jarak radial antara

    kedua titik X, m adalah dimensi yang digunakan untuk merekonstruksi ruang fase, k

    adalah jumlah titik data pada phase space (k = N-(m-1)) dan H adalah heavyside

    function (H(x) = 1 jika x 0, H(x) = 0 jika x < 0). Setelah CI didapatkan, correlation

    dimension dapat dihitung dengan persamaan berikut:

    = lim0

    log (, )

    log

    Cara termudah untuk mendapatkan correlation dimension adalah dengan

    menggambarkan hasil log C(m,r) dan log r pada sebuah grafik, dengan nilai r bervariasi,

    kemudian nilai CD didapat dari slope grafik tersebut.

    4. Largest Lyapunov Exponent (LLE)

    Digunakan untuk mengukur perubahan eksponensial lintasan terdekat di ruang fase.

    Jika nilai terbesar dari lyapunov exponent adalah bilangan positif (LLE > 0), berarti

    jarak kedua lintasan tersebut berubah drastis seiring berubahnya waktu. Kondisi ini

    mengindikasikan bahwa sistem tersebut bersifat chaos. [10] [11]

    Langkah-langkah menghitung LLE:

    1. Menemukan semua titik X(k) yang memiliki jarak ke titik X(i) di rung fase

    terekonstruksi kurang dari batas

    2. Menghitung rata-rata jarak dari semua titik tetangga yang telah ditemukan di

    langkah 1, sebagai fungsi waktu relatif (n) berdasarkan persamaan berikut:

    () =1

    |(+(1) + ) (+(1) + )|

    =1

    r menyatakan jumlah tetangga yang memenuhi syarat X(k)-X(i) < .

  • Progress_resume materi TA Shinta Pramesti / 5110100186

    3. Menghitung kecepatan ekspansi

    Kecepatan ekpansi lintasan dihitung dengan cara menghitung Di(n) untuk titik

    X(i) lainnya, lalu merata-rata log Di(n) berdasarkan persamaan berikut:

    () = 1

    ln [()]

    =1

    c menyatakan jumlah titik X(i) berbeda yang digunakan untuk perhitungan.

    4. Mengulangi langkah 1 s.d 3 untuk nilai n yang lain

    5. Membuat plot grafik hubungan antara n dengan S(n). Slope / kemiringan garis

    dari grafik menyatakan nilai terbesar lyapunov exponent pada dimensi tersebut.

    6. Mengulangi langkah 1 s.d 5 untuk menghitung LLE pada dimensi lainnya

    7. Melakukan uji DFA untuk semua nilai LLE yang telah dihitung. Pilih 3 nilai LLE

    terbesar untuk dijadikan fitur.

    References

    [1] Isar Nejadgholi, Mohammad Hasan Moradi, Fatemeh Abdolali, "Using phase space reconstruction for patient independent heartbeat classification in comparison with some benchmark methods," Computers in Biology and Medicine, vol. 41, pp. 411-419, 2011.

    [2] A. Jafari, "Sleep apnoea detection from ECG using features extracted from reconstructed phase space and frequency domain," Biomedical Signal Processing and Control, vol. 8, pp. 551-558, 2013.

    [3] Richard J. Povinelli, et all, "Time Series Classification Using Gaussian Mixture Models of Reconstructed Phase Spaces," IEEE Transactions On Knowledge And Data Engineering, vol. 16, no. 6, June 2004.

    [4] Ng Sook Kien, "Reconstructed Phase Space".

    [5] J. Fell, et all, "Nonlinear analysis of continuous ECG during sleep II. Dynamical measures," Biological Cybernetics, vol. 82, pp. 485-491, 2000.

    [6] Conte, E., Todarello, O., Conte, S., Mendolicchio, L., Mendolicchio, L. & Federici, A., "Methods and Applications of Non-Linear Analysis in Neurology and Psycho-physiology," Journal of Consciousness Exploration & Research, vol. 1, no. 9, pp. 1070-1138 , December 2000.

    [7] "Time series embedding and reconstruction," in Applied Nonlinear Time Series Analysis: Applications in Physics, Physiology and Finance, 2005, pp. 1-46.

    [8] A. K. Goliska, "Detrended Fluctuation Analysis (DFA) in biomedical signal processing: selected examples," Studies In Logic, Grammar And Rhetoric, vol. 29, no. 42, pp. 107-115, 2012.

    [9] J. Theiler, "Estimating the Fractal Dimension of Chaotic Time Series," The Lincoln Laboratory Journal, vol. 3, 1990.

    [10] Saad Ali, Arslan Basharat, Mubarak Shah, "Chaotic Invariants for Human Action Recognition," IEEE 11th International Conference on Computer Vision (ICCV), pp. 1-8, 2007.

    [11] M. Perc, "The dynamics of human gait," Europena Jurnal of Physic, vol. 26, pp. 525-534, 2005.