Review

download Review

of 3

description

Review mengenai Paper Penelitian di Bidang Bioinformatika

Transcript of Review

ReviewMining for Genotype-Phenotype relations in Saccharomyces using Partial Least SquareMuhammad Syahid PebriadiG651140511

Abstrak

Perkembangan data Genom begitu pesat sehingga memunculkan banyaknya penelitian mengenai data ini. Penelitian menggunakan data Genom dilakukan untuk melihat asosiasi Genotif dan Fenotif dari suatu organisme. Pendekatan yang sering digunakan untuk penelitian ini bersifat univariat yang masih banyak batasan. Oleh karena itu dilakukan pendekatan multivariat yang memberikan keuntungan lebih dibandingkan dengan pendekatan univariat. Pada penelitian ini diusulkan suatu metodologi berbasis BLAST untuk ekstraksi informasi dari sekuens Genom dan Soft Thresholding Partial Least Square (ST-PLS) untuk pemetaan asosiasi Genoti-Fenotif. Penerapan dari metodologi ini menunjukkan kurang dari 1% dari 5791 gen set reference dapat menjelaskan variasi Fenotif. Gen yang mempengaruhi fenotif ini berkembang 20% lebih cepat daripada yang tidak mempengaruhi dan terdistribusi tidak merata atas fungsi seluler. Sehingga dari hasil ini dapat disimpulkan bahwa BLAST dan PLS berbasis pendekatan multivariat dapat digunakan untuk menganalisa asosiasi Genotif dan Fenotif dari suatu organisme. Namun, penelitian lanjutan perlu dilakukan untuk meningkatkan penghitungan sinyal Genotif dan prosedur seleksi variabel dalam PLS.

Kata Kunci : Data Genom, Multivariat, ST-PLS

Pendahuluan

Pesatnya perkembangan data genom menyebabkan kebutuhan akan suatu metode baru dan perkembangan dari metode sebelumnya meningkat. Metode ini digunakan untuk mengeksplorasi asosiasi antara Genotif dan Fenotif dari suatu organisme. Kompleksitas dari interaksi jaringan seluler suatu organisme membuat polymorphisme-nya berasosiasi lemah dengan variasi sifat-sifat umumnya. Namun, asosiasi Genotif-Fenotif masih dapat dilihat melalui co-occurrence dari multi gen dan multi fenotif pada suatu individu melalui metode statistik dan filogenetik. Salah satu organisme yang banyak digunakan untuk penelitian adalah ragi Saccharomyces cerevisiae. Hal ini dikarenakan, ragi dalam beberapa penelitian berhasil menjembatani jarak antara genotif dan fenotif. Beberapa metode pendekatan yang dilakukan untuk meneliti ini antara lain berbasis pada linkage analysis, population genetic analysis, correlation analysis, gene knockout genetic interaction networks, dan probabilistic model. Namun, pendekatan-pendekatan tersebut sangat terbatas, karena tidak melihat hubungan multivariat antara Genotif dan Fenotif. Serta, tidak memberikan secara serentak efek yang ditimbulkan lebih dari satu gen pada lebih dari satu fenotif.Pendekatan multivariat diharapkan memberikan keuntungan dibandingkan dengan analisa univariat. Misalnya, meningkatkan sensitifitas untuk mengidentifikasi efek genetik yang penting dan mendeteksi kontribusi dari variasi genetik. Pendekatan ini dilakukan sebagai berikut : 1) Menghitung fitur dari sekuens genom dengan memberikan tingkat kemiripan pada suatu kumpulan sekuens reference, 2) Membandingkan setiap genom dengan genom reference menggunakan pair-wise alignment. 3) Mendapatkan normalisasi skor setiap reference yang menunjukkan penambahan apa saja yang ditemukan dalam genom tersebut.Penghitungan fitur menggunakan metode Partial Least Square (PLS). Pada dasarnya, PLS mengidentifikasi sub-ruang relevan dalam ruang Genotif yang menjelaskan maksimum variansi dalam ruang Fenotif. Namun, PLS dalam bentuk aslinya tidak menyertakan implementasi seleksi fitur. Oleh karena itu, metode ini digabungkan dengan tahapan Soft Thresholding menjadi algoritma ST-PLS yang mana dapat melakukan pencocokkan model dan seleksi fitur sekaligus. Pada penelitian ini, dicontohkan penerapan ST-PLS yang digunakan pada saat dalam penyatuan ruang Genotif berdimensi tinggi dan ruang fenotif untuk mengungkap asosiasi untuk penelitian selanjutnya. MetodeDataData yang digunakan dalam penelitian ini terdiri atas data sekuens genom dan data Fenotif. Data sekuens genom diperoleh dari Saccharomyces Genome Resequencing Project (SGRP) yang dapat diakses pada Sanger http://www.sanger.ac.uk/Teams/Team118/sgrp/. Data genom lain yang digunakan adalah reference ragi jenis S288C. Total sebanyak 5791 gen digunakan dalam penelitian ini.Data Fenotif diperoleh melalui budidaya mikro dari populasi ragi selama paparan 10 perlakuan berbeda, mewakili keragaman alami dan variasi lingkungan buatan. Sepuluh lingkungan ini dipilih karena sesuai dengan lingkungan ekologi Ragi dan data rasio pertumbuhan serta efisiensi pertumbuhan diperoleh dari pertumbuhan ragi di lingkungan ini. Nilai fenotif yang hilang dihitung menggunakan K-nearest neighbor untuk pola fenotif keseluruhan. Sehingga diperoleh, v = 20 ukuran fenotif yang berbeda untuk n = 36 genom.

Hubungan Genotif-FenotifMatrix X dengan n x p dibuat dengan n = 36 baris dan p = 5791 kolom. Baris menyatakan banyaknya fenotif dan kolom menyatakan genom reference. Pada dasarnya, konsep ini ingin mencari kombinasi dari kolom X yang mampu menjelaskan variasi dalam setiap y.

Integrasi Fitur Genotif Eksternal Ontologi gen dari genom S288C di peroleh dari GO Slim Mapper http://www.yeastgenome.org/cgi-bin/GO/goSlimMapper.pl yang mana memberikan informasi fungsi terstruktur mengenai asosiasi Genotif-Fenotif. Ontologi gen ini berbentuk 3 anotasi fungsi yang berbeda : proses biologi utama dalam gen yang terlibat (45 kategori); aktifitas molekul/biokimia (25 kategori); dan komponen seluler dengan protein sesuai (25 kategori). Sebuah gen tunggal mungkin dipetakan ke dalam beberapa istilah Ontologi gen. Selanjutnya dilakukan intrepetasi dari asosiasi Genotif-Fenotif. Hasil & Pembahasan

Pemetaan Genotif dan Fenotif lebih banyak ditemukan pada saat menggunakan lebih dari 6 komponen. Ini menunjukkan bahwa beberapa gen berasosiasi dengan Fenotif tertentu dan gen-gen yang berkontribusi untuk informasi berbeda mengenai Fenotif hanya dapat dijelaskan dengan mengkombinasikan enam atau lebih arah dalam ruang Genotif. Kemudian tingkat penyusutan tidak pernah lebih dari 0,8. Hal ini dikarenakan batasan yang dibuat hanya memerlukan 25 gen terpilih, dan ini juga memberitahukan bahwa gen-gen yang berasosiasi dapat diidentifikasi tanpa menggunakan level penyusutan yang tinggi. Banyaknya gen-gen yang berpengaruh meningkat seiring kompleksitas model dan menurun seiring dengan level penyusutan.Selanjutnya, untuk mengetahui jenis gen dan variasi genetik apa yang mendefinisikan struktur utama dari variasi dalam sifat yang berbeda dalam suatu spesies dilakukan analisa mendalam pada dua ciri lingkungan yang sangat bervariasi antara strain dan memiliki struktur yang kompleks, yaitu NaCL1_E (NaCl 0,85 M efisiensi) dan Hea1_R(Heat 37C Rate). Variasi dari efisiensi pertumbuhan selama paparan 0,85 M NaCl dalam strain S. cerevisiae sebagian besar dikendalikan 47 gen terkait yang sering dikaitkan dengan Fenotif. Sehingga model ST-PLS yang digunakan sebanyak 10 komponen yang menunjukkan hubungan yang kompleks antara Genotif dan Fenotif ini.Variasi laju pertumbuhan dalam S. cerevisiae selama paparan panas 37C sebagian besar ditentukan oleh 33 gen yang sering dikaitkan dengan Fenotif alami ragi. Sebanyak 7 komponen model digunakan untuk menjelaskan Fenotifnya. Gen-gen yang mendefinisikan toleransi panas yang rendah dari NCYC110 diperkaya untuk variasi Frame Shift dan gen-gen yang berhubungan dengan variasi toleransi panas dalam DB-VPG6044 diperkaya untuk paralog dan variasi jumlah salinan.

Kesimpulan

Pendekatan multivariat berbasiskan BLAST dan PLS memberikan hasil yang sesuai dengan filogeni ragi yang diketahui. Sehingga disimpulkan pendekatan ini sangat layak digunakan untuk analisa asosiasi Genotif-Fenotif. Namun, penelitian lanjutan perlu dilakukan untuk meningkatkan perhitungan sinyal Genotif dan prosedur seleksi variabel dalam bingkai kerja PLS.