Pensejajaran Sekuen Virus H1N1 dengan Blast
-
Upload
m-ivan-ariful-fathoni -
Category
Documents
-
view
134 -
download
0
description
Transcript of Pensejajaran Sekuen Virus H1N1 dengan Blast
MAKALAH BIOINFORMATIKA
ANALISIS PERBANDINGAN SEQUENCE DNA VIRUS
H1N1 dengan SOFTWARE BLAST
M. IVAN ARIFUL FATHONI 1213201009
RENI UMILASARI 1213201011
DOSEN PENGAMPU
Dr. IMAM MUKHLAS, MT.
PROGRAM MAGISTER
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA
2013
BAB 1. PENDAHULUAN
1.1 Latar Belakang
Komparasi sekuens merupakan metode modern untuk mempelajari interaksi
evolusi antar gen. Komparasi sekuens biologi bertujuan untuk mengidentifikasi
kemiripan (similarity) dan perbedaan antara sekuens-sekuens biologi. Pendekatan untuk
menyelesaikan masalah ini biasanya dilakukan dengan mensejajarkan sekuens tersebut.
Pensejajaran sekuens adalah proses penyusunan atau pengaturan dua atau lebih sekuens
sehingga persamaan antar sekuens tersebut nampak nyata. Informasi tingkat kemiripan
atau ketidakmiripan (dissimilarity) antara sekuens ini digunakan untuk mempelajari
proses evolusi suatu sekuens biologi. Berkaitan dengan hal ini, dengan pensejajaran
sekuens maka dapat ditunjukkan posisi yang dipertahankan (conserved) dan tidak
dipertahankan (unconserved) selama evolusi. Posisi yang dipertahankan merupakan
posisi yang penting dalam struktur atau fungsi dari sekuens tersebut. Sedangkan posisi
unconserved adalah posisi yang mengalami perubahan baik oleh mutasi yang
ditunjukkan dengan adanya subsitusi ataupun adanya penambahan gap yang ditunjukkan
dengan insersi atau delesi.
Pensejajaran sekuens juga digunakan untuk mencari sekuens yang mirip atau sama
dalam pangkalan data sekuens. Berdasarkan informasi tingkat kemiripan ini dapat
digunakan untuk analisis homologi, jika dua sekuens juga memiliki struktur dan fungsi
yang sama. Sehingga pensejajaran sekuens adalah topik yang fundamental dalam
bioinformatika. Oleh karen itu, dalam makalah ini akan dibahas mengenai sequence
alignment untuk beberapa contoh sequence DNA virus H1N1 dengan software BLAST.
1.2 Rumusan masalah
Bagaimana tingkat kesamaan sequence alignment dari beberapa sequence DNA
virus H1N1 dengan menggunakan software BLAST?
1.3 Tujuan Penelitian
Untuk mengetahui tingkat kesamaan sequence alignment dari beberapa sequence
DNA virus H1N1 dengan menggunakan software BLAST.
BAB 2. TINJAUAN PUSTAKA
2.1. NCBI
Database biologi merupakan kumpulan dari semua informasi biologis yang tersedia
dalam bentuk format database. Keberadaan database tersebut adalah syarat utama dari
analisis bioinformatika. Bioinformatika muncul sebagai desakan ledakan kebutuhan untuk
mengumpulkan, menyimpan, dan menganalisa data-data biologi berupa database DNA, RNA
maupun protein. informasi tersebut banyak diakses oleh para ahli biologi maupun pengguna
umum secara luas yang dikelola dalam situs NCBI.
Gambar 1. National Center For Biotechnology Information Office
NCBI (National Center For Biotechnology Information) atau Pusat informasi
Bioteknologi Nasional adalah sebuah lembaga maya yang dididirikan tahun 1988, sebagai
bagian dari NLM (National Library of Medicine) dan bekerjasama dengan NIH (National
Institute of Health). NCBI menyediakan database, mengembangkan alat bantu sofware,
sekaligus tempat menelusuri informasi serta menyebar luaskan dalam rangka penelitian dan
pengembangan kesehatan manusia.
Cara yang paling banyak digunakan untuk pengambilan informasi dari database
biologi adalah sistem entrez NCBI. Entrez adalah sebuah sistem untuk pencarian dan
menemukan kembali informasi secara terpadu tentang sekuen nukleotida, sekuen protein,
struktur makromolekul seluruh genom, pemetaannya serta literatur ilmiah.
Database yang tersedia di NCBI :
Bank Gen sekuen DNA yang mengandung lebih dari 7 juta sekuen yang meliputi
hampir 9 milyar sekuen nukleotida dan beberapa miliar sekuen asam amino. database
sekuen DNA/nukleotida dan data base protein/sekuen asam amino.
Data Base Model Molekuler (MMDB) : database struktur dan visualisasi molekuler
yang terdiri dari struktur tiga dimensi protein sebagai alat bantu visualisasi dan
analisis perbandingan, dimana kita diperkenalkan dengan konsep dasar tentang
struktur protein.
Data Base Taxonomy : menjelejahi garis keturunan dan mengenalkan urutan data dari
berbagai spesies berbeda yang ada di bumi yang meliputi organisme punah seperti
manusia neanderthal.
Database pola pewarisan mendel pada manusia (OMIM)
Database paper pada pubmed di Medline : perpustakaan obat nasional yang
menyediakan pubmed.
Kelebihan sistem entrez NCBI, bahwa dengan menggunakan sistem ini memungkinkan
kita dapat mengakses dengan mudah semua database yang tersedia yang saling berhubungan
satu dengan yang lainnya, semuanya dapat dilakukan hanya dengan mengklik satu tombol.
Ruang informasi entrez meliputi :
Kutipan pubmed.
Data sekuen protein dan nukleotida.
Informasi struktur tiga dimensi.
Informasi pemetaan genom.
NCBI(the US National Center for Biotechnology Information) saat ini merupakan salah
satu implementasi dari BLAST (Basic Local Alignment Search Tool)
2.2. BLAST dan FAST
Metode pensejajaran yang berbasis heuristik diantaranya FASTA (Fast-All) dan BLAST
(Basic local Alignment Search Tools). FASTA diperkenalkan pada tahun 1988 oleh W.
Pearson dan D. Lipman. FASTA merupakan metode pertama yang mencari pensejajaran local
non-gap kemudian meningkatkan hasilnya dengan menghitung pensejajaran SW pada daerah
pensejajaran non-gap. Untuk pensejajaran sekuens DNA dan Protein masing masing
menggunakan FAST-N dan FAST-P. BLAST (Basic Local Alignment Search Tool) yaitu
sebuah metode yang digunakan secara luas untuk menilai sekuens asam nukleat atau protein
dalam database.kesamaan yang signifikan terhadap sekuen query. BLAST diperkenalkan
pada tahun 1990 oleh Eugene Myers, Stephen Altschul, Warren Gish, David J. Lipman, and
Webb Miller. BLAST juga termasuk pensejajaran non-gap dan gap dalam metode ini baru
dibawa kedalam catatan. Metode-metode berbasis heuristik ini memangkas ruang pencarian
dengan menggunakan metode aproksimasi yang sangat cepat untuk memilih sekuens pada
database yang agak mirip dengan sekuens query dan untuk mencari daerah kemiripan
didalamnya. FASTA dan BLAST lebih cepat (50-100 kali) dari kedua metode sebelumnya.
Bagaimanapun, sejumlah konteks ilmiah penting melibatkan komparasi hanya dari dua
sekuens dan tidak memerlukan suatu pencarian pada database yang cukup besar dan
memakan waktu. Untuk memenuhi kebutuhan ini, banyak tools penting untuk pencarian
database yang besar. Seperti yang dijelaskan dalam penelitian Tatiana dan Thomas pada
tahun 1999 mengenai tools EMBOSS (European Molecular Biology Open Software Suite)
dan BLAST (dalam WBLAST2) yang berkembang cukup pesat untuk mendapatkan
pensejajaran global dari sekuens DNA dan protein. Kedua tools ini menyediakan profil global
dari tingkat kemiripan.
2.3. DNA
Penemuan teknik sekuensing DNA yang lebih cepat pada pertengahan 1970-an
menjadi landasan terjadinya ledakan jumlah sekuens DNA yang berhasil diungkapkan pada
1980-an dan 1990-an, menjadi salah satu pembuka jalan bagi proyek-proyek pengungkapan
genom, meningkatkan kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya
menyebabkan lahirnya bioinformatika. Bioinformatika merupakan ilmu yang mempelajari
penerapan teknik komputasional untuk mengelola dan menganalisis informasi biologi.
Bidang ini mencakup penerapan metode matematika, statistika, dan informatika untuk
memecahkan masalah biologi. Terutama yang terkait dengan penggunaan sekuens DNA
(Deoxyribonucleic acid), RNA (Ribonucleic acid) dan asam amino.
Bioinformatika, sebagai suatu kajian multidisiplin, merupakan sebuah terobosan baru
dalam dunia biomedis. Berbagai penyakit, seperti flu babi, kanker, AIDS, dan lainnya
memiliki potensi untuk diatasi dengan bantuannya. Contoh topik utama dalam bioinformatika
meliputi pangkalan data untuk mengelola informasi biologi, pensejajaran sekuens (sequences
alignment), prediksi struktur untuk meramalkan struktur protein atau pun struktur sekunder
RNA, analisis filogenetik, dan analisis ekspresi gen. Sekuens biologi dalam hal ini meliputi
sekuens DNA, RNA dan protein. Rantai DNA yang menyandi protein disebut gen. Gen
ditranskripsikan menjadi ribonucleic acid messenger (mRNA). Kemudian mRNA
ditranslasikan menjadi protein. DNA merupakan polimer yang terdiri dari tiga komponen
utama yaitu gugus fosfat, gula dioksiribosa dan basa nitrogen. DNA tersusun dari empat jenis
monomer nukleotida yang diwakili oleh empat abjad yaitu adenin (‘A’), timin (‘T’), guanin
(‘G’), dan citosin (‘C’). Adenin berikatan dengan Timin, dan Sitosin berikatan dengan
Guanin. Urutan basa nitrogen dalam setiap organisme selalu berbeda, data inilah yang
digunakan dalam pensejajaran sekuens.
DNA dapat melakukan replikasi, di mana ketika replikasi DNA ini dilakukan,
terbentuklah DNA baru yang memiliki informasi genetik yang serupa dengan induknya. RNA
dibentuk dengan transkripsi dari DNA, sehingga informasi yang dikandung RNA juga
terdapat di dalam DNA cetakannya sehingga sekuens DNA cetakan tersebut sudah cukup
untuk membaca informasi pada RNA (kecuali pada eukariota). Oleh karena itu, pensejajaran
sekuens lebih banyak dilakukan ditingkat sekuens DNA dan protein. Berdasarkan banyaknya
sekuens yang disejajarkan maka, pensejajaran sekuens dikelompokkan menjadi dua yaitu:
pensejajaran yang hanya melibatkan sepasang sekuens (disebut pairwise alignment) dan
pensejajaran yang melibatkan lebih dari dua sekuens (disebut multiple alignment).
2.4. Virus H1N1
H1N1 ( flu babi) adalah infeksi flu yang disebabkan oleh strain baru virus influenza A.
Virus flu babi H1N1 ini merupakan kombinasi dari virus influenza pada manusia, babi, dan
burung (avian). Flu babi H1N1 dapat menyebar dengan mudah dari orang ke orang, sama
seperti virus flu biasanya. Seseorang tidak dapat terkena flu babi H1N1 akibat memakan
daging babi, dan hampir tidak pernah juga dari kontak dengan babi.
Gejala yang timbul seperti flu biasa, yaitu berupa demam, batuk, sakit tenggorokan,
sakit di badan, sakit kepala, menggigil, hidung berair, dan kelelahan. Selain itu, mual,
muntah, dan diare juga sering terjadi.
Gambar 2. Penyebaran virus H1N1
Pada kebanyakan orang, gejala tampaknya mulai muncul 1-5 hari setelah terpapar virus
dan berlangsung sampai sekitar 1 minggu. Penderita dapat menularkan infeksi sampai sekitar
8 hari, yaitu sejak satu hari sebelum gejala muncul sampai gejala hilang. Gejala-gejala yang
muncul biasanya ringan, tetapi dapat juga menjadi berat, terjadi infeksi paru (pneumonia) dan
gagal nafas.
Infeksi flu babi H1N1 dapat menyebabkan penyakit kronis menjadi lebih buruk
(misalnya penyakit jantung dan paru, serta diabetes). Infeksi juga dapat menyebabkan
komplikasi pada kehamilan (misalnya keguguran atau kelahiran prematur). Risiko tinggi
terjadi pada orang-orang dengan gangguan ginjal atau hati, atau pada orang-orang dengan
sistem kekebalan tubuh yang lemah, akibat obat atau penyakit (misalnya AIDS). Komplikasi
yang berat dapat terjadi dan berkembang dengan cepat.
BAB 3. HASIL DAN PEMBAHASAN
Langkah 1
Buka menu BLAST pada alamat berikut: http://blast.ncbi.nlm.nih.gov/Blast.cgi
Langkah 2
Pilih nucleotide untuk mencari sequence DNA virus H1N1, ketik H1N1 pada kolom search,
lalu klik search. Setelah muncul beberapa pilihan sequence alignment, centang salah satu
sequence yang diinginkan, kemudian pilih genbank untuk melihat kode gennya.
Langkah 3
Copy kode GenBank yang muncul, lalu dengan cara yang sama (Langkah 2 dan 3) dapatkan
kode GenBank untuk sequence kedua.
Berikut ini hasil rincian serta barisan dua sequence DNA virus H1N1 yang digunakan :
Influenza A virus (A/Weiss/43 (H1N1)) neuraminidase (NA) gene, complete cds
GenBank: AF250365.2
FASTA Graphics
Go to:
LOCUS AF250365 1410 bp mRNA linear VRL 09-MAR-
2001
DEFINITION Influenza A virus (A/Weiss/43 (H1N1)) neuraminidase (NA) gene,
complete cds.
ACCESSION AF250365
VERSION AF250365.2 GI:13260589
KEYWORDS .
SOURCE Influenza A virus (A/Weiss/1943(H1N1))
ORGANISM Influenza A virus (A/Weiss/1943(H1N1))
Viruses; ssRNA negative-strand viruses; Orthomyxoviridae;
Influenzavirus A.
REFERENCE 1 (bases 1 to 1410)
AUTHORS Reid,A.H., Fanning,T.G., Janczewski,T.A. and Taubenberger,J.K.
TITLE Characterization of the 1918 'Spanish' influenza virus
neuraminidase gene
JOURNAL Proc. Natl. Acad. Sci. U.S.A. 97 (12), 6785-6790 (2000)
PUBMED 10823895
REFERENCE 2 (bases 1 to 1410)
AUTHORS Reid,A.H., Fanning,T.G., Janczewski,T.A. and Taubenberger,J.K.
TITLE Direct Submission
JOURNAL Submitted (29-MAR-2000) Division of Molecular Pathology,
Department
of Cellular Pathology, Armed Forces Institute of Pathology,
14th
Street and Alaska Avenue, N.W., Washington, DC 20306-6000, USA
COMMENT On Mar 9, 2001 this sequence version replaced gi:8572186.
FEATURES Location/Qualifiers
source 1..1410
/organism="Influenza A virus (A/Weiss/1943(H1N1))"
/mol_type="mRNA"
/strain="A/Weiss/43 (H1N1); ATCC VR-96"
/db_xref="ATCC:VR-96"
/db_xref="taxon:191090"
gene 1..1410
/gene="NA"
CDS 1..1410
/gene="NA"
/codon_start=1
/product="neuraminidase"
/protein_id="AAF77045.1"
/db_xref="GI:8572187"
/translation="MNPNQKIITIGSICMVVGIISLILQIGNIISIWISHSIQTGSQN
HTGICNQSIITYKNSTWVNQTYVNISNTNVVAGKGTTSVILAGNSSLCPIRGWAIYSK
DNGIRIGSKGDVFVIREPFISCSHLECRTFFLTQGALLNDKHSNGTVKDRSPYRALMS
CPVGEAPSPYNSRFESVAWSASACHDGMGWLTIGISGPDDEAVAVLKYNGIITETIKS
WRKKILRTQESECVCVNGSCFTIMTDGPSDGQASYKIFKIEKGKVTKSIELDAPNSHY
EECSCYPDTGKVMCVCRDNWHGSNRPWVSFDQNLDYQIGYICSGVFGDNPRSKDGKGS
CGPVYVDGANGVKGFSYRYGNGVWIGRTKSDSSRQGFEMIWDPNGWTETDSNFFVKQD
IVAMTDWSGYSGSFVQHPELTGLDCMRPCFWVELIRGRPKEKTIWTSGSSISFCGVNS
DTVDWSWPDGAELPFTIDK"
ORIGIN
1 atgaatccaa atcagaaaat aataaccatt ggatcaatct gtatggtagt cggaataatt
61 agcctaatat tgcaaatagg gaatattatc tcaatatgga ttagccattc aattcaaact
121 ggaagtcaaa accatactgg aatatgcaac caaagcatca ttacctataa aaatagcacc
181 tgggtaaatc aaacatatgt taatattagc aacactaacg ttgttgctgg aaaaggcaca
241 acttcagtga tattagccgg caattcatct ctttgtccta tccgtgggtg ggctatatac
301 agcaaagata acggcataag aattggttcc aaaggagatg tttttgtcat aagagagcct
361 tttatttcat gttctcactt ggaatgcagg actttttttc tgacccaagg cgccctgttg
421 aatgacaagc attcaaatgg gaccgttaag gacagaagcc cttatagggc cttgatgagc
481 tgccctgtcg gtgaagctcc gtccccgtac aattcaaggt ttgaatcggt tgcttggtca
541 gcaagtgcat gtcatgatgg catgggctgg ctaacaatcg gaatttctgg tccagatgat
601 gaagcagtgg ctgtgttaaa atacaacggc ataataactg aaaccataaa aagttggagg
661 aagaaaatat tgagaacaca agagtctgaa tgtgtctgtg taaatggttc atgttttact
721 ataatgaccg acggcccgag tgatggccag gcctcgtaca aaattttcaa gatcgagaag
781 gggaaggtta ctaaatcaat agagttggat gcacctaatt ctcactacga ggaatgttcc
841 tgttaccctg ataccggcaa ggtgatgtgt gtgtgcagag acaattggca cggttcgaac
901 cgaccatggg tgtctttcga tcaaaatctg gattatcaaa taggatacat ctgcagtggg
961 gttttcggtg acaatccgcg ttccaaagat ggaaaaggca gctgtggtcc ggtgtatgtt
1021 gatggagcaa acggagtaaa gggattttca tacaggtatg gtaatggtgt ttggatagga
1081 aggactaaaa gtgacagttc cagacagggg tttgagatga tttgggatcc taatgggtgg
1141 acagagactg atagtaattt ctttgtgaaa caagatatag tggctatgac tgattggtca
1201 gggtacagcg gaagtttcgt tcaacatcct gagctaacag ggctggactg tatgaggcct
1261 tgcttctggg ttgaattaat caggggacga cctaaagaaa aaacaatctg gactagtggg
1321 agcagcattt ctttttgtgg cgtgaatagt gatactgtag actggtcttg gccagacggt
1381 gccgaattgc cattcaccat tgacaagtag
//
Influenza A virus (A/Iowa/1943(H1N1)) segment 6, complete sequence
GenBank: CY020463.1
FASTA Graphics
LOCUS CY020463 1411 bp cRNA linear VRL 19-MAR-
2007
DEFINITION Influenza A virus (A/Iowa/1943(H1N1)) segment 6, complete
sequence.
ACCESSION CY020463
VERSION CY020463.1 GI:133754174
KEYWORDS .
SOURCE Influenza A virus (A/Iowa/1943(H1N1))
ORGANISM Influenza A virus (A/Iowa/1943(H1N1))
Viruses; ssRNA negative-strand viruses; Orthomyxoviridae;
Influenzavirus A.
REFERENCE 1 (bases 1 to 1411)
AUTHORS Ghedin,E., Spiro,D., Miller,N., Zaborsky,J., Feldblyum,T.,
Subbu,V., Shumway,M., Sparenborg,J., Groveman,L., Halpin,R.,
Sitz,J., Koo,H., Salzberg,S.L., Webster,R.G., Hoffmann,E.,
Krauss,S., Naeve,C., Bao,Y., Bolotov,P., Dernovoy,D.,
Kiryutin,B.,
Lipman,D.J. and Tatusova,T.
TITLE The NIAID Influenza Genome Sequencing Project
JOURNAL Unpublished
REFERENCE 2 (bases 1 to 1411)
CONSRTM The NIAID Influenza Genome Sequencing Consortium
TITLE Direct Submission
JOURNAL Submitted (19-MAR-2007) on behalf of TIGR/St. Jude Children's
Research Hospital/NCBI, National Center for Biotechnology
Information, NIH, Bethesda, MD 20894, USA
FEATURES Location/Qualifiers
source 1..1411
/organism="Influenza A virus (A/Iowa/1943(H1N1))"
/mol_type="viral cRNA"
/strain="A/Iowa/1943"
/serotype="H1N1"
/host="Human"
/db_xref="taxon:425563"
/segment="6"
/lab_host="E57 passage(s)"
/country="USA: Iowa"
/collection_date="1943"
gene 1..1410
/gene="NA"
CDS 1..1410
/gene="NA"
/codon_start=1
/product="neuraminidase"
/protein_id="ABO38376.1"
/db_xref="GI:133754175"
/translation="MNPNQKIITIGSICMVVGIISLILQIGNIISIWISHSIQTGSQN
HTGTCNQSIITYKNSTWVNQTYVNISNTNVVAGKDTTSVILAGNSSLCPIRGWAIYSK
DNGVRIGSKGDVFVIREPFISCSHLECRTFFLTQGALLNDKHSNGTVKDRSPYRALMS
CPVGEAPSPYNSRFESVAWSASACHDGMGWLTIGISGPDDGAVAVLKYNGIITETIKS
WRKEILRTQESECACVNGSCFTIMTDGPSGGPASYKIFKIEKGKVTKSIELDAPNSHY
EECSCYPDTGKVMCVCRDNWHGSNRPWVSFDQNLDYQMGYICSGVFGDNPRPKDGKGN
CGPVYVDGANGVKGFSYRYGNGVWIGRTKSNSSRQGFEMIWDPNGWTETDSNFFVKQD
VVAVTDWSGYSGSFVQHPELTGLDCMRPCFWVELIRGRPKEKTIWTSGSSISFCGVNS
DTVDWSWPDGAELPFTIDK"
ORIGIN
1 atgaatccaa atcagaaaat aataaccatt ggatcaatct gtatggtagt cggaataatt
61 agcctaatat tgcaaatagg gaatattatc tcaatatgga tcagccattc aattcaaact
121 ggaagtcaaa accatactgg aacttgcaac caaagcatca ttacctataa aaatagcacc
181 tgggtaaatc aaacatatgt taatattagc aacactaacg ttgttgctgg aaaggataca
241 acttcagtga tattagccgg caattcatct ctttgtccta tccgtgggtg ggctatatac
301 agcaaagata atggcgtaag aattggttcc aaaggagatg tttttgtcat aagagaaccc
361 tttatttcat gttctcactt ggaatgcagg accttttttc tgacccaagg cgccctgttg
421 aatgacaagc attcaaatgg gaccgttaag gacagaagcc cttatagggc cttaatgagc
481 tgccctgtcg gtgaagctcc gtccccgtac aattcaaggt ttgaatcggt tgcttggtca
541 gcaagtgcat gtcatgatgg catgggctgg ctaacaatcg gaatttctgg tccagatgat
601 ggagcagtgg ctgtgttaaa atacaacggt ataataactg aaaccataaa aagttggagg
661 aaggaaatat tgagaacaca agagtctgaa tgtgcctgcg taaatggttc atgtttcact
721 ataatgaccg acggcccgag tggtgggccg gcctcgtaca aaattttcaa gatcgagaag
781 gggaaggtta ctaaatcaat agaattggat gcacctaatt ctcactatga ggaatgttcc
841 tgttaccctg ataccggcaa ggtgatgtgt gtgtgcagag acaattggca cggttcgaac
901 cgaccatggg tgtctttcga tcaaaatctg gattatcaaa tgggctacat ctgcagtggg
961 gttttcggtg acaatccgcg tcccaaagat ggaaaaggca actgtggtcc agtgtatgtt
1021 gatggagcaa acggagtaaa gggattttca tacaggtatg gtaatggtgt ttggatagga
1081 aggactaaaa gtaacagttc cagacagggg tttgagatga tttgggatcc caatgggtgg
1141 acagagactg atagtaattt ctttgtgaaa caagatgtag tggcagtgac tgattggtca
1201 gggtacagcg gaagtttcgt tcaacatcct gagttaacag ggctggactg tatgaggcct
1261 tgcttctggg ttgaattaat caggggacgg cctaaagaaa aaacaatctg gaccagtggg
1321 agcagcattt ctttttgtgg cgtgaatagt gatactgtag attggtcttg gccagacggt
1381 gccgagttgc cattcaccat tgacaagtag t
//
Langkah 4
Pilih nucleotide blast untuk merunning kedua sequence tersebut
Setelah muncul tampilan berikut, masukkan kedua kode GenBank pada dua kolom berikut
lalu klik pilihan BLAST yang ada di pojok kiri bawah.
Langkah 5
Berikut interpretasi dari perbandingan dua sequence DNA virus H1N1 yang diperoleh :
1. Graphic Summary
Grafik ini menunjukkan kecocokan sequence, di dalamnya terdapat color key for alignment
scores yang terdiri dari lima bagian warna yaitu hitam, biru, hijau, ungu, dan merah dengan
interval tertentu yang telah diberikan. Berdasarkan grafik tersebut tampak bahwa kecocokan
antara dua sequence DNA tersebut mencapai 200 karakter. Interval (>=200) menunjukkan
suatutingkat kemiripan (similarity) yang tertinggi, sedangkan warna hitam dengan interval
(<40) menunjukkan suatu tingkat kemiripan (similarity) yang terendah.
Sehinggadenganmenggunakan color key ini, maka dapat dilihat tingkat kemiripan
(similarity) antaraquery sequence dan subject sequence.
2. Dot Matrix
Grafik ini menunjukkan pasangan dua sequence DNA H1N1. Sumbu horisontal
menunjukkan sequence pertama dengan jumlah karakter sebanyak 1410 dan sequence
kedua ditunjukkan pada sumbu vertikal dengan karakter yang sama jumlahnya.
3. Description
Description menunjukkan persentase kesamaan antara dua sequence alignment DNA
virus H1N1 sebesar 97% serta maximal dan total scorenya senilai 2394 dengan Query
cover mencapai 100%.
4. Alignment
Alignment menunjukkan pasangan pensejajarannya, antara dua sequence alignment
DNA virus H1N1 dan dapat dilihat dalam tabel berikut ini:
ScoreExpectIdentities GapsStrandScore Expect Identities Gaps Strand
2394 bits(1296) 0.0 1372/1410(97%) 0/1410(0%) Plus/Plus
Query 1 ATGAATCCAAATCAGAAAATAATAACCATTGGATCAATCTGTATGGTAGTCGGAATAATT 60 ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct 1 ATGAATCCAAATCAGAAAATAATAACCATTGGATCAATCTGTATGGTAGTCGGAATAATT 60
Query 61 AGCCTAATATTGCAAATAGGGAATATTATCTCAATATGGATTAGCCATTCAATTCAAACT 120 ||||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||Sbjct 61 AGCCTAATATTGCAAATAGGGAATATTATCTCAATATGGATCAGCCATTCAATTCAAACT 120
Query 121 GGAAGTCAAAACCATACTGGAATATGCAACCAAAGCATCATTACCTATAAAAATAGCACC 180 |||||||||||||||||||||| ||||||||||||||||||||||||||||||||||||Sbjct 121 GGAAGTCAAAACCATACTGGAACTTGCAACCAAAGCATCATTACCTATAAAAATAGCACC 180
Query 181 TGGGTAAATCAAACATATGTTAATATTAGCAACACTAACGTTGTTGCTGGAAAAGGCACA 240 ||||||||||||||||||||||||||||||||||||||||||||||||||||| | |||Sbjct 181 TGGGTAAATCAAACATATGTTAATATTAGCAACACTAACGTTGTTGCTGGAAAGGATACA 240
Query 241 ACTTCAGTGATATTAGCCGGCAATTCATCTCTTTGTCCTATCCGTGGGTGGGCTATATAC 300 ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct 241 ACTTCAGTGATATTAGCCGGCAATTCATCTCTTTGTCCTATCCGTGGGTGGGCTATATAC 300
Query 301 AGCAAAGATAACGGCATAAGAATTGGTTCCAAAGGAGATGTTTTTGTCATAAGAGAGCCT 360 ||||||||||| ||| |||||||||||||||||||||||||||||||||||||||| ||Sbjct 301 AGCAAAGATAATGGCGTAAGAATTGGTTCCAAAGGAGATGTTTTTGTCATAAGAGAACCC 360
Query 361 TTTATTTCATGTTCTCACTTGGAATGCAGGACtttttttCTGACCCAAGGCGCCCTGTTG 420 |||||||||||||||||||||||||||||||| |||||||||||||||||||||||||||Sbjct 361 TTTATTTCATGTTCTCACTTGGAATGCAGGACCTTTTTTCTGACCCAAGGCGCCCTGTTG 420
Query 421 AATGACAAGCATTCAAATGGGACCGTTAAGGACAGAAGCCCTTATAGGGCCTTGATGAGC 480 ||||||||||||||||||||||||||||||||||||||||||||||||||||| ||||||Sbjct 421 AATGACAAGCATTCAAATGGGACCGTTAAGGACAGAAGCCCTTATAGGGCCTTAATGAGC 480
Query 481 TGCCCTGTCGGTGAAGCTCCGTCCCCGTACAATTCAAGGTTTGAATCGGTTGCTTGGTCA 540 ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct 481 TGCCCTGTCGGTGAAGCTCCGTCCCCGTACAATTCAAGGTTTGAATCGGTTGCTTGGTCA 540
Query 541 GCAAGTGCATGTCATGATGGCATGGGCTGGCTAACAATCGGAATTTCTGGTCCAGATGAT 600 ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct 541 GCAAGTGCATGTCATGATGGCATGGGCTGGCTAACAATCGGAATTTCTGGTCCAGATGAT 600
Query 601 GAAGCAGTGGCTGTGTTAAAATACAACGGCATAATAACTGAAACCATAAAAAGTTGGAGG 660 | ||||||||||||||||||||||||||| ||||||||||||||||||||||||||||||Sbjct 601 GGAGCAGTGGCTGTGTTAAAATACAACGGTATAATAACTGAAACCATAAAAAGTTGGAGG 660
Query 661 AAGAAAATATTGAGAACACAAGAGTCTGAATGTGTCTGTGTAAATGGTTCATGTTTTACT 720 ||| |||||||||||||||||||||||||||||| ||| ||||||||||||||||| |||Sbjct 661 AAGGAAATATTGAGAACACAAGAGTCTGAATGTGCCTGCGTAAATGGTTCATGTTTCACT 720
Query 721 ATAATGACCGACGGCCCGAGTGATGGCCAGGCCTCGTACAAAATTTTCAAGATCGAGAAG 780 |||||||||||||||||||||| ||| | |||||||||||||||||||||||||||||||Sbjct 721 ATAATGACCGACGGCCCGAGTGGTGGGCCGGCCTCGTACAAAATTTTCAAGATCGAGAAG 780
Query 781 GGGAAGGTTACTAAATCAATAGAGTTGGATGCACCTAATTCTCACTACGAGGAATGTTCC 840 ||||||||||||||||||||||| ||||||||||||||||||||||| ||||||||||||Sbjct 781 GGGAAGGTTACTAAATCAATAGAATTGGATGCACCTAATTCTCACTATGAGGAATGTTCC 840
Query 841 TGTTACCCTGATACCGGCAAGGTGATGTGTGTGTGCAGAGACAATTGGCACGGTTCGAAC 900 ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct 841 TGTTACCCTGATACCGGCAAGGTGATGTGTGTGTGCAGAGACAATTGGCACGGTTCGAAC 900
Query 901 CGACCATGGGTGTCTTTCGATCAAAATCTGGATTATCAAATAGGATACATCTGCAGTGGG 960 ||||||||||||||||||||||||||||||||||||||||| || |||||||||||||||Sbjct 901 CGACCATGGGTGTCTTTCGATCAAAATCTGGATTATCAAATGGGCTACATCTGCAGTGGG 960
Query 961 GTTTTCGGTGACAATCCGCGTTCCAAAGATGGAAAAGGCAGCTGTGGTCCGGTGTATGTT 1020 ||||||||||||||||||||| |||||||||||||||||| ||||||||| |||||||||Sbjct 961 GTTTTCGGTGACAATCCGCGTCCCAAAGATGGAAAAGGCAACTGTGGTCCAGTGTATGTT 1020
Query 1021 GATGGAGCAAACGGAGTAAAGGGATTTTCATACAGGTATGGTAATGGTGTTTGGATAGGA 1080 ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct 1021 GATGGAGCAAACGGAGTAAAGGGATTTTCATACAGGTATGGTAATGGTGTTTGGATAGGA 1080
Query 1081 AGGACTAAAAGTGACAGTTCCAGACAGGGGTTTGAGATGATTTGGGATCCTAATGGGTGG 1140 |||||||||||| ||||||||||||||||||||||||||||||||||||| |||||||||Sbjct 1081 AGGACTAAAAGTAACAGTTCCAGACAGGGGTTTGAGATGATTTGGGATCCCAATGGGTGG 1140
Query 1141 ACAGAGACTGATAGTAATTTCTTTGTGAAACAAGATATAGTGGCTATGACTGATTGGTCA 1200 |||||||||||||||||||||||||||||||||||| ||||||| ||||||||||||||Sbjct 1141 ACAGAGACTGATAGTAATTTCTTTGTGAAACAAGATGTAGTGGCAGTGACTGATTGGTCA 1200
Query 1201 GGGTACAGCGGAAGTTTCGTTCAACATCCTGAGCTAACAGGGCTGGACTGTATGAGGCCT 1260 ||||||||||||||||||||||||||||||||| ||||||||||||||||||||||||||Sbjct 1201 GGGTACAGCGGAAGTTTCGTTCAACATCCTGAGTTAACAGGGCTGGACTGTATGAGGCCT 1260
Query 1261 TGCTTCTGGGTTGAATTAATCAGGGGACGACCTAAAGAAAAAACAATCTGGACTAGTGGG 1320 ||||||||||||||||||||||||||||| ||||||||||||||||||||||| ||||||Sbjct 1261 TGCTTCTGGGTTGAATTAATCAGGGGACGGCCTAAAGAAAAAACAATCTGGACCAGTGGG 1320
Query 1321 AGCAGCATTTCTTTTTGTGGCGTGAATAGTGATACTGTAGACTGGTCTTGGCCAGACGGT 1380 ||||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||Sbjct 1321 AGCAGCATTTCTTTTTGTGGCGTGAATAGTGATACTGTAGATTGGTCTTGGCCAGACGGT 1380
Query 1381 GCCGAATTGCCATTCACCATTGACAAGTAG 1410 ||||| ||||||||||||||||||||||||Sbjct 1381 GCCGAGTTGCCATTCACCATTGACAAGTAG 1410
DAFTAR PUSTAKA
.
http://www.ncbi.nlm.nih.gov/Blast.cgi. [11 Januari 2014]
http://ghr.nlm.nih.gov/handbook/basics/dna. [11 Januari 2014]
Yusrotis Z, Alfi .2011. Analisis Sequence DNA virus H1N1Menggunakan Metode Super pairwise alignment. Thesis FMIPA ITS.