Pensejajaran Sekuen Virus H1N1 dengan Blast

MAKALAH BIOINFORMATIKA

ANALISIS PERBANDINGAN SEQUENCE DNA VIRUS

H1N1 dengan SOFTWARE BLAST

M. IVAN ARIFUL FATHONI 1213201009

RENI UMILASARI 1213201011

DOSEN PENGAMPU

Dr. IMAM MUKHLAS, MT.

PROGRAM MAGISTER

JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT TEKNOLOGI SEPULUH NOPEMBER

SURABAYA

2013

BAB 1. PENDAHULUAN

1.1 Latar Belakang

Komparasi sekuens merupakan metode modern untuk mempelajari interaksi

evolusi antar gen. Komparasi sekuens biologi bertujuan untuk mengidentifikasi

kemiripan (similarity) dan perbedaan antara sekuens-sekuens biologi. Pendekatan untuk

menyelesaikan masalah ini biasanya dilakukan dengan mensejajarkan sekuens tersebut.

Pensejajaran sekuens adalah proses penyusunan atau pengaturan dua atau lebih sekuens

sehingga persamaan antar sekuens tersebut nampak nyata. Informasi tingkat kemiripan

atau ketidakmiripan (dissimilarity) antara sekuens ini digunakan untuk mempelajari

proses evolusi suatu sekuens biologi. Berkaitan dengan hal ini, dengan pensejajaran

sekuens maka dapat ditunjukkan posisi yang dipertahankan (conserved) dan tidak

dipertahankan (unconserved) selama evolusi. Posisi yang dipertahankan merupakan

posisi yang penting dalam struktur atau fungsi dari sekuens tersebut. Sedangkan posisi

unconserved adalah posisi yang mengalami perubahan baik oleh mutasi yang

ditunjukkan dengan adanya subsitusi ataupun adanya penambahan gap yang ditunjukkan

dengan insersi atau delesi.

Pensejajaran sekuens juga digunakan untuk mencari sekuens yang mirip atau sama

dalam pangkalan data sekuens. Berdasarkan informasi tingkat kemiripan ini dapat

digunakan untuk analisis homologi, jika dua sekuens juga memiliki struktur dan fungsi

yang sama. Sehingga pensejajaran sekuens adalah topik yang fundamental dalam

bioinformatika. Oleh karen itu, dalam makalah ini akan dibahas mengenai sequence

alignment untuk beberapa contoh sequence DNA virus H1N1 dengan software BLAST.

1.2 Rumusan masalah

Bagaimana tingkat kesamaan sequence alignment dari beberapa sequence DNA

virus H1N1 dengan menggunakan software BLAST?

1.3 Tujuan Penelitian

Untuk mengetahui tingkat kesamaan sequence alignment dari beberapa sequence

DNA virus H1N1 dengan menggunakan software BLAST.

BAB 2. TINJAUAN PUSTAKA

2.1. NCBI

Database biologi merupakan kumpulan dari semua informasi biologis yang tersedia

dalam bentuk format database. Keberadaan database tersebut adalah syarat utama dari

analisis bioinformatika. Bioinformatika muncul sebagai desakan ledakan kebutuhan untuk

mengumpulkan, menyimpan, dan menganalisa data-data biologi berupa database DNA, RNA

maupun protein. informasi tersebut banyak diakses oleh para ahli biologi maupun pengguna

umum secara luas yang dikelola dalam situs NCBI.

Gambar 1. National Center For Biotechnology Information Office

NCBI (National Center For Biotechnology Information) atau Pusat informasi

Bioteknologi Nasional adalah sebuah lembaga maya yang dididirikan tahun 1988, sebagai

bagian dari NLM (National Library of Medicine) dan bekerjasama dengan NIH (National

Institute of Health). NCBI menyediakan database, mengembangkan alat bantu sofware,

sekaligus tempat menelusuri informasi serta menyebar luaskan dalam rangka penelitian dan

pengembangan kesehatan manusia.

Cara yang paling banyak digunakan untuk pengambilan informasi dari database

biologi adalah sistem entrez NCBI. Entrez adalah sebuah sistem untuk pencarian dan

menemukan kembali informasi secara terpadu tentang sekuen nukleotida, sekuen protein,

struktur makromolekul seluruh genom, pemetaannya serta literatur ilmiah.

Database yang tersedia di NCBI :

Bank Gen sekuen DNA yang mengandung lebih dari 7 juta sekuen yang meliputi

hampir 9 milyar sekuen nukleotida dan beberapa miliar sekuen asam amino. database

sekuen DNA/nukleotida dan data base protein/sekuen asam amino.

Data Base Model Molekuler (MMDB) : database struktur dan visualisasi molekuler

yang terdiri dari struktur tiga dimensi protein sebagai alat bantu visualisasi dan

analisis perbandingan, dimana kita diperkenalkan dengan konsep dasar tentang

struktur protein.

Data Base Taxonomy : menjelejahi garis keturunan dan mengenalkan urutan data dari

berbagai spesies berbeda yang ada di bumi yang meliputi organisme punah seperti

manusia neanderthal.

Database pola pewarisan mendel pada manusia (OMIM)

Database paper pada pubmed di Medline : perpustakaan obat nasional yang

menyediakan pubmed.

Kelebihan sistem entrez NCBI, bahwa dengan menggunakan sistem ini memungkinkan

kita dapat mengakses dengan mudah semua database yang tersedia yang saling berhubungan

satu dengan yang lainnya, semuanya dapat dilakukan hanya dengan mengklik satu tombol.

Ruang informasi entrez meliputi :

Kutipan pubmed.

Data sekuen protein dan nukleotida.

Informasi struktur tiga dimensi.

Informasi pemetaan genom.

NCBI(the US National Center for Biotechnology Information) saat ini merupakan salah

satu implementasi dari BLAST (Basic Local Alignment Search Tool)

2.2. BLAST dan FAST

Metode pensejajaran yang berbasis heuristik diantaranya FASTA (Fast-All) dan BLAST

(Basic local Alignment Search Tools). FASTA diperkenalkan pada tahun 1988 oleh W.

Pearson dan D. Lipman. FASTA merupakan metode pertama yang mencari pensejajaran local

non-gap kemudian meningkatkan hasilnya dengan menghitung pensejajaran SW pada daerah

pensejajaran non-gap. Untuk pensejajaran sekuens DNA dan Protein masing masing

menggunakan FAST-N dan FAST-P. BLAST (Basic Local Alignment Search Tool) yaitu

sebuah metode yang digunakan secara luas untuk menilai sekuens asam nukleat atau protein

dalam database.kesamaan yang signifikan terhadap sekuen query. BLAST diperkenalkan

pada tahun 1990 oleh Eugene Myers, Stephen Altschul, Warren Gish, David J. Lipman, and

Webb Miller. BLAST juga termasuk pensejajaran non-gap dan gap dalam metode ini baru

dibawa kedalam catatan. Metode-metode berbasis heuristik ini memangkas ruang pencarian

dengan menggunakan metode aproksimasi yang sangat cepat untuk memilih sekuens pada

database yang agak mirip dengan sekuens query dan untuk mencari daerah kemiripan

didalamnya. FASTA dan BLAST lebih cepat (50-100 kali) dari kedua metode sebelumnya.

Bagaimanapun, sejumlah konteks ilmiah penting melibatkan komparasi hanya dari dua

sekuens dan tidak memerlukan suatu pencarian pada database yang cukup besar dan

memakan waktu. Untuk memenuhi kebutuhan ini, banyak tools penting untuk pencarian

database yang besar. Seperti yang dijelaskan dalam penelitian Tatiana dan Thomas pada

tahun 1999 mengenai tools EMBOSS (European Molecular Biology Open Software Suite)

dan BLAST (dalam WBLAST2) yang berkembang cukup pesat untuk mendapatkan

pensejajaran global dari sekuens DNA dan protein. Kedua tools ini menyediakan profil global

dari tingkat kemiripan.

2.3. DNA

Penemuan teknik sekuensing DNA yang lebih cepat pada pertengahan 1970-an

menjadi landasan terjadinya ledakan jumlah sekuens DNA yang berhasil diungkapkan pada

1980-an dan 1990-an, menjadi salah satu pembuka jalan bagi proyek-proyek pengungkapan

genom, meningkatkan kebutuhan akan pengelolaan dan analisis sekuens, dan pada akhirnya

menyebabkan lahirnya bioinformatika. Bioinformatika merupakan ilmu yang mempelajari

penerapan teknik komputasional untuk mengelola dan menganalisis informasi biologi.

Bidang ini mencakup penerapan metode matematika, statistika, dan informatika untuk

memecahkan masalah biologi. Terutama yang terkait dengan penggunaan sekuens DNA

(Deoxyribonucleic acid), RNA (Ribonucleic acid) dan asam amino.

Bioinformatika, sebagai suatu kajian multidisiplin, merupakan sebuah terobosan baru

dalam dunia biomedis. Berbagai penyakit, seperti flu babi, kanker, AIDS, dan lainnya

memiliki potensi untuk diatasi dengan bantuannya. Contoh topik utama dalam bioinformatika

meliputi pangkalan data untuk mengelola informasi biologi, pensejajaran sekuens (sequences

alignment), prediksi struktur untuk meramalkan struktur protein atau pun struktur sekunder

RNA, analisis filogenetik, dan analisis ekspresi gen. Sekuens biologi dalam hal ini meliputi

sekuens DNA, RNA dan protein. Rantai DNA yang menyandi protein disebut gen. Gen

ditranskripsikan menjadi ribonucleic acid messenger (mRNA). Kemudian mRNA

ditranslasikan menjadi protein. DNA merupakan polimer yang terdiri dari tiga komponen

utama yaitu gugus fosfat, gula dioksiribosa dan basa nitrogen. DNA tersusun dari empat jenis

monomer nukleotida yang diwakili oleh empat abjad yaitu adenin (‘A’), timin (‘T’), guanin

(‘G’), dan citosin (‘C’). Adenin berikatan dengan Timin, dan Sitosin berikatan dengan

Guanin. Urutan basa nitrogen dalam setiap organisme selalu berbeda, data inilah yang

digunakan dalam pensejajaran sekuens.

DNA dapat melakukan replikasi, di mana ketika replikasi DNA ini dilakukan,

terbentuklah DNA baru yang memiliki informasi genetik yang serupa dengan induknya. RNA

dibentuk dengan transkripsi dari DNA, sehingga informasi yang dikandung RNA juga

terdapat di dalam DNA cetakannya sehingga sekuens DNA cetakan tersebut sudah cukup

untuk membaca informasi pada RNA (kecuali pada eukariota). Oleh karena itu, pensejajaran

sekuens lebih banyak dilakukan ditingkat sekuens DNA dan protein. Berdasarkan banyaknya

sekuens yang disejajarkan maka, pensejajaran sekuens dikelompokkan menjadi dua yaitu:

pensejajaran yang hanya melibatkan sepasang sekuens (disebut pairwise alignment) dan

pensejajaran yang melibatkan lebih dari dua sekuens (disebut multiple alignment).

2.4. Virus H1N1

H1N1 ( flu babi) adalah infeksi flu yang disebabkan oleh strain baru virus influenza A.

Virus flu babi H1N1 ini merupakan kombinasi dari virus influenza pada manusia, babi, dan

burung (avian). Flu babi H1N1 dapat menyebar dengan mudah dari orang ke orang, sama

seperti virus flu biasanya. Seseorang tidak dapat terkena flu babi H1N1 akibat memakan

daging babi, dan hampir tidak pernah juga dari kontak dengan babi.

Gejala yang timbul seperti flu biasa, yaitu berupa demam, batuk, sakit tenggorokan,

sakit di badan, sakit kepala, menggigil, hidung berair, dan kelelahan. Selain itu, mual,

muntah, dan diare juga sering terjadi.

Gambar 2. Penyebaran virus H1N1

Pada kebanyakan orang, gejala tampaknya mulai muncul 1-5 hari setelah terpapar virus

dan berlangsung sampai sekitar 1 minggu. Penderita dapat menularkan infeksi sampai sekitar

8 hari, yaitu sejak satu hari sebelum gejala muncul sampai gejala hilang. Gejala-gejala yang

muncul biasanya ringan, tetapi dapat juga menjadi berat, terjadi infeksi paru (pneumonia) dan

gagal nafas.

Infeksi flu babi H1N1 dapat menyebabkan penyakit kronis menjadi lebih buruk

(misalnya penyakit jantung dan paru, serta diabetes). Infeksi juga dapat menyebabkan

komplikasi pada kehamilan (misalnya keguguran atau kelahiran prematur). Risiko tinggi

terjadi pada orang-orang dengan gangguan ginjal atau hati, atau pada orang-orang dengan

sistem kekebalan tubuh yang lemah, akibat obat atau penyakit (misalnya AIDS). Komplikasi

yang berat dapat terjadi dan berkembang dengan cepat.

BAB 3. HASIL DAN PEMBAHASAN

Langkah 1

Buka menu BLAST pada alamat berikut: http://blast.ncbi.nlm.nih.gov/Blast.cgi

Langkah 2

Pilih nucleotide untuk mencari sequence DNA virus H1N1, ketik H1N1 pada kolom search,

lalu klik search. Setelah muncul beberapa pilihan sequence alignment, centang salah satu

sequence yang diinginkan, kemudian pilih genbank untuk melihat kode gennya.

Langkah 3

Copy kode GenBank yang muncul, lalu dengan cara yang sama (Langkah 2 dan 3) dapatkan

kode GenBank untuk sequence kedua.

Berikut ini hasil rincian serta barisan dua sequence DNA virus H1N1 yang digunakan :

Influenza A virus (A/Weiss/43 (H1N1)) neuraminidase (NA) gene, complete cds

GenBank: AF250365.2

FASTA Graphics

Go to:

LOCUS AF250365 1410 bp mRNA linear VRL 09-MAR-

2001

DEFINITION Influenza A virus (A/Weiss/43 (H1N1)) neuraminidase (NA) gene,

complete cds.

ACCESSION AF250365

VERSION AF250365.2 GI:13260589

KEYWORDS .

SOURCE Influenza A virus (A/Weiss/1943(H1N1))

ORGANISM Influenza A virus (A/Weiss/1943(H1N1))

Viruses; ssRNA negative-strand viruses; Orthomyxoviridae;

Influenzavirus A.

REFERENCE 1 (bases 1 to 1410)

AUTHORS Reid,A.H., Fanning,T.G., Janczewski,T.A. and Taubenberger,J.K.

TITLE Characterization of the 1918 'Spanish' influenza virus

neuraminidase gene

JOURNAL Proc. Natl. Acad. Sci. U.S.A. 97 (12), 6785-6790 (2000)

PUBMED 10823895


AUTHORS Reid,A.H., Fanning,T.G., Janczewski,T.A. and Taubenberger,J.K.

TITLE Direct Submission

JOURNAL Submitted (29-MAR-2000) Division of Molecular Pathology,

Department

of Cellular Pathology, Armed Forces Institute of Pathology,

14th

Street and Alaska Avenue, N.W., Washington, DC 20306-6000, USA

COMMENT On Mar 9, 2001 this sequence version replaced gi:8572186.

FEATURES Location/Qualifiers

source 1..1410

/organism="Influenza A virus (A/Weiss/1943(H1N1))"

/mol_type="mRNA"

/strain="A/Weiss/43 (H1N1); ATCC VR-96"

/db_xref="ATCC:VR-96"

/db_xref="taxon:191090"

gene 1..1410

/gene="NA"

CDS 1..1410

/gene="NA"

/codon_start=1

/product="neuraminidase"

/protein_id="AAF77045.1"

/db_xref="GI:8572187"

/translation="MNPNQKIITIGSICMVVGIISLILQIGNIISIWISHSIQTGSQN

HTGICNQSIITYKNSTWVNQTYVNISNTNVVAGKGTTSVILAGNSSLCPIRGWAIYSK

DNGIRIGSKGDVFVIREPFISCSHLECRTFFLTQGALLNDKHSNGTVKDRSPYRALMS

CPVGEAPSPYNSRFESVAWSASACHDGMGWLTIGISGPDDEAVAVLKYNGIITETIKS

WRKKILRTQESECVCVNGSCFTIMTDGPSDGQASYKIFKIEKGKVTKSIELDAPNSHY

EECSCYPDTGKVMCVCRDNWHGSNRPWVSFDQNLDYQIGYICSGVFGDNPRSKDGKGS

CGPVYVDGANGVKGFSYRYGNGVWIGRTKSDSSRQGFEMIWDPNGWTETDSNFFVKQD

IVAMTDWSGYSGSFVQHPELTGLDCMRPCFWVELIRGRPKEKTIWTSGSSISFCGVNS

DTVDWSWPDGAELPFTIDK"

ORIGIN

1 atgaatccaa atcagaaaat aataaccatt ggatcaatct gtatggtagt cggaataatt

61 agcctaatat tgcaaatagg gaatattatc tcaatatgga ttagccattc aattcaaact

121 ggaagtcaaa accatactgg aatatgcaac caaagcatca ttacctataa aaatagcacc

181 tgggtaaatc aaacatatgt taatattagc aacactaacg ttgttgctgg aaaaggcaca

241 acttcagtga tattagccgg caattcatct ctttgtccta tccgtgggtg ggctatatac

301 agcaaagata acggcataag aattggttcc aaaggagatg tttttgtcat aagagagcct

361 tttatttcat gttctcactt ggaatgcagg actttttttc tgacccaagg cgccctgttg

421 aatgacaagc attcaaatgg gaccgttaag gacagaagcc cttatagggc cttgatgagc

481 tgccctgtcg gtgaagctcc gtccccgtac aattcaaggt ttgaatcggt tgcttggtca

541 gcaagtgcat gtcatgatgg catgggctgg ctaacaatcg gaatttctgg tccagatgat

601 gaagcagtgg ctgtgttaaa atacaacggc ataataactg aaaccataaa aagttggagg

661 aagaaaatat tgagaacaca agagtctgaa tgtgtctgtg taaatggttc atgttttact

721 ataatgaccg acggcccgag tgatggccag gcctcgtaca aaattttcaa gatcgagaag

781 gggaaggtta ctaaatcaat agagttggat gcacctaatt ctcactacga ggaatgttcc

841 tgttaccctg ataccggcaa ggtgatgtgt gtgtgcagag acaattggca cggttcgaac

901 cgaccatggg tgtctttcga tcaaaatctg gattatcaaa taggatacat ctgcagtggg

961 gttttcggtg acaatccgcg ttccaaagat ggaaaaggca gctgtggtcc ggtgtatgtt

1021 gatggagcaa acggagtaaa gggattttca tacaggtatg gtaatggtgt ttggatagga

1081 aggactaaaa gtgacagttc cagacagggg tttgagatga tttgggatcc taatgggtgg

1141 acagagactg atagtaattt ctttgtgaaa caagatatag tggctatgac tgattggtca

1201 gggtacagcg gaagtttcgt tcaacatcct gagctaacag ggctggactg tatgaggcct

1261 tgcttctggg ttgaattaat caggggacga cctaaagaaa aaacaatctg gactagtggg

1321 agcagcattt ctttttgtgg cgtgaatagt gatactgtag actggtcttg gccagacggt

1381 gccgaattgc cattcaccat tgacaagtag

//

Influenza A virus (A/Iowa/1943(H1N1)) segment 6, complete sequence

GenBank: CY020463.1

FASTA Graphics

LOCUS CY020463 1411 bp cRNA linear VRL 19-MAR-

2007

DEFINITION Influenza A virus (A/Iowa/1943(H1N1)) segment 6, complete

sequence.

ACCESSION CY020463

VERSION CY020463.1 GI:133754174

KEYWORDS .

SOURCE Influenza A virus (A/Iowa/1943(H1N1))

ORGANISM Influenza A virus (A/Iowa/1943(H1N1))

Viruses; ssRNA negative-strand viruses; Orthomyxoviridae;

Influenzavirus A.


AUTHORS Ghedin,E., Spiro,D., Miller,N., Zaborsky,J., Feldblyum,T.,

Subbu,V., Shumway,M., Sparenborg,J., Groveman,L., Halpin,R.,

Sitz,J., Koo,H., Salzberg,S.L., Webster,R.G., Hoffmann,E.,

Krauss,S., Naeve,C., Bao,Y., Bolotov,P., Dernovoy,D.,

Kiryutin,B.,

Lipman,D.J. and Tatusova,T.

TITLE The NIAID Influenza Genome Sequencing Project

JOURNAL Unpublished


CONSRTM The NIAID Influenza Genome Sequencing Consortium

TITLE Direct Submission

JOURNAL Submitted (19-MAR-2007) on behalf of TIGR/St. Jude Children's

Research Hospital/NCBI, National Center for Biotechnology

Information, NIH, Bethesda, MD 20894, USA

FEATURES Location/Qualifiers

source 1..1411

/organism="Influenza A virus (A/Iowa/1943(H1N1))"

/mol_type="viral cRNA"

/strain="A/Iowa/1943"

/serotype="H1N1"

/host="Human"

/db_xref="taxon:425563"

/segment="6"

/lab_host="E57 passage(s)"

/country="USA: Iowa"

/collection_date="1943"

gene 1..1410

/gene="NA"

CDS 1..1410

/gene="NA"

/codon_start=1

/product="neuraminidase"

/protein_id="ABO38376.1"

/db_xref="GI:133754175"

/translation="MNPNQKIITIGSICMVVGIISLILQIGNIISIWISHSIQTGSQN

HTGTCNQSIITYKNSTWVNQTYVNISNTNVVAGKDTTSVILAGNSSLCPIRGWAIYSK

DNGVRIGSKGDVFVIREPFISCSHLECRTFFLTQGALLNDKHSNGTVKDRSPYRALMS

CPVGEAPSPYNSRFESVAWSASACHDGMGWLTIGISGPDDGAVAVLKYNGIITETIKS

WRKEILRTQESECACVNGSCFTIMTDGPSGGPASYKIFKIEKGKVTKSIELDAPNSHY

EECSCYPDTGKVMCVCRDNWHGSNRPWVSFDQNLDYQMGYICSGVFGDNPRPKDGKGN

CGPVYVDGANGVKGFSYRYGNGVWIGRTKSNSSRQGFEMIWDPNGWTETDSNFFVKQD

VVAVTDWSGYSGSFVQHPELTGLDCMRPCFWVELIRGRPKEKTIWTSGSSISFCGVNS

DTVDWSWPDGAELPFTIDK"

ORIGIN

1 atgaatccaa atcagaaaat aataaccatt ggatcaatct gtatggtagt cggaataatt

61 agcctaatat tgcaaatagg gaatattatc tcaatatgga tcagccattc aattcaaact

121 ggaagtcaaa accatactgg aacttgcaac caaagcatca ttacctataa aaatagcacc

181 tgggtaaatc aaacatatgt taatattagc aacactaacg ttgttgctgg aaaggataca

241 acttcagtga tattagccgg caattcatct ctttgtccta tccgtgggtg ggctatatac

301 agcaaagata atggcgtaag aattggttcc aaaggagatg tttttgtcat aagagaaccc

361 tttatttcat gttctcactt ggaatgcagg accttttttc tgacccaagg cgccctgttg

421 aatgacaagc attcaaatgg gaccgttaag gacagaagcc cttatagggc cttaatgagc

481 tgccctgtcg gtgaagctcc gtccccgtac aattcaaggt ttgaatcggt tgcttggtca

541 gcaagtgcat gtcatgatgg catgggctgg ctaacaatcg gaatttctgg tccagatgat

601 ggagcagtgg ctgtgttaaa atacaacggt ataataactg aaaccataaa aagttggagg

661 aaggaaatat tgagaacaca agagtctgaa tgtgcctgcg taaatggttc atgtttcact

721 ataatgaccg acggcccgag tggtgggccg gcctcgtaca aaattttcaa gatcgagaag

781 gggaaggtta ctaaatcaat agaattggat gcacctaatt ctcactatga ggaatgttcc

841 tgttaccctg ataccggcaa ggtgatgtgt gtgtgcagag acaattggca cggttcgaac

901 cgaccatggg tgtctttcga tcaaaatctg gattatcaaa tgggctacat ctgcagtggg

961 gttttcggtg acaatccgcg tcccaaagat ggaaaaggca actgtggtcc agtgtatgtt

1021 gatggagcaa acggagtaaa gggattttca tacaggtatg gtaatggtgt ttggatagga

1081 aggactaaaa gtaacagttc cagacagggg tttgagatga tttgggatcc caatgggtgg

1141 acagagactg atagtaattt ctttgtgaaa caagatgtag tggcagtgac tgattggtca

1201 gggtacagcg gaagtttcgt tcaacatcct gagttaacag ggctggactg tatgaggcct

1261 tgcttctggg ttgaattaat caggggacgg cctaaagaaa aaacaatctg gaccagtggg

1321 agcagcattt ctttttgtgg cgtgaatagt gatactgtag attggtcttg gccagacggt

1381 gccgagttgc cattcaccat tgacaagtag t

//

Langkah 4

Pilih nucleotide blast untuk merunning kedua sequence tersebut

Setelah muncul tampilan berikut, masukkan kedua kode GenBank pada dua kolom berikut

lalu klik pilihan BLAST yang ada di pojok kiri bawah.

Langkah 5

Berikut interpretasi dari perbandingan dua sequence DNA virus H1N1 yang diperoleh :

1. Graphic Summary

Grafik ini menunjukkan kecocokan sequence, di dalamnya terdapat color key for alignment

scores yang terdiri dari lima bagian warna yaitu hitam, biru, hijau, ungu, dan merah dengan

interval tertentu yang telah diberikan. Berdasarkan grafik tersebut tampak bahwa kecocokan

antara dua sequence DNA tersebut mencapai 200 karakter. Interval (>=200) menunjukkan

suatutingkat kemiripan (similarity) yang tertinggi, sedangkan warna hitam dengan interval

(<40) menunjukkan suatu tingkat kemiripan (similarity) yang terendah.

Sehinggadenganmenggunakan color key ini, maka dapat dilihat tingkat kemiripan

(similarity) antaraquery sequence dan subject sequence.

2. Dot Matrix

Grafik ini menunjukkan pasangan dua sequence DNA H1N1. Sumbu horisontal

menunjukkan sequence pertama dengan jumlah karakter sebanyak 1410 dan sequence

kedua ditunjukkan pada sumbu vertikal dengan karakter yang sama jumlahnya.

3. Description

Description menunjukkan persentase kesamaan antara dua sequence alignment DNA

virus H1N1 sebesar 97% serta maximal dan total scorenya senilai 2394 dengan Query

cover mencapai 100%.

4. Alignment

Alignment menunjukkan pasangan pensejajarannya, antara dua sequence alignment

DNA virus H1N1 dan dapat dilihat dalam tabel berikut ini:

ScoreExpectIdentities GapsStrandScore Expect Identities Gaps Strand

2394 bits(1296) 0.0 1372/1410(97%) 0/1410(0%) Plus/Plus

Query 1 ATGAATCCAAATCAGAAAATAATAACCATTGGATCAATCTGTATGGTAGTCGGAATAATT 60 ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct 1 ATGAATCCAAATCAGAAAATAATAACCATTGGATCAATCTGTATGGTAGTCGGAATAATT 60

Query 61 AGCCTAATATTGCAAATAGGGAATATTATCTCAATATGGATTAGCCATTCAATTCAAACT 120 ||||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||Sbjct 61 AGCCTAATATTGCAAATAGGGAATATTATCTCAATATGGATCAGCCATTCAATTCAAACT 120

Query 121 GGAAGTCAAAACCATACTGGAATATGCAACCAAAGCATCATTACCTATAAAAATAGCACC 180 |||||||||||||||||||||| ||||||||||||||||||||||||||||||||||||Sbjct 121 GGAAGTCAAAACCATACTGGAACTTGCAACCAAAGCATCATTACCTATAAAAATAGCACC 180

Query 181 TGGGTAAATCAAACATATGTTAATATTAGCAACACTAACGTTGTTGCTGGAAAAGGCACA 240 ||||||||||||||||||||||||||||||||||||||||||||||||||||| | |||Sbjct 181 TGGGTAAATCAAACATATGTTAATATTAGCAACACTAACGTTGTTGCTGGAAAGGATACA 240

Query 241 ACTTCAGTGATATTAGCCGGCAATTCATCTCTTTGTCCTATCCGTGGGTGGGCTATATAC 300 ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct 241 ACTTCAGTGATATTAGCCGGCAATTCATCTCTTTGTCCTATCCGTGGGTGGGCTATATAC 300

Query 301 AGCAAAGATAACGGCATAAGAATTGGTTCCAAAGGAGATGTTTTTGTCATAAGAGAGCCT 360 ||||||||||| ||| |||||||||||||||||||||||||||||||||||||||| ||Sbjct 301 AGCAAAGATAATGGCGTAAGAATTGGTTCCAAAGGAGATGTTTTTGTCATAAGAGAACCC 360

Query 361 TTTATTTCATGTTCTCACTTGGAATGCAGGACtttttttCTGACCCAAGGCGCCCTGTTG 420 |||||||||||||||||||||||||||||||| |||||||||||||||||||||||||||Sbjct 361 TTTATTTCATGTTCTCACTTGGAATGCAGGACCTTTTTTCTGACCCAAGGCGCCCTGTTG 420

Query 421 AATGACAAGCATTCAAATGGGACCGTTAAGGACAGAAGCCCTTATAGGGCCTTGATGAGC 480 ||||||||||||||||||||||||||||||||||||||||||||||||||||| ||||||Sbjct 421 AATGACAAGCATTCAAATGGGACCGTTAAGGACAGAAGCCCTTATAGGGCCTTAATGAGC 480

Query 481 TGCCCTGTCGGTGAAGCTCCGTCCCCGTACAATTCAAGGTTTGAATCGGTTGCTTGGTCA 540 ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct 481 TGCCCTGTCGGTGAAGCTCCGTCCCCGTACAATTCAAGGTTTGAATCGGTTGCTTGGTCA 540

Query 541 GCAAGTGCATGTCATGATGGCATGGGCTGGCTAACAATCGGAATTTCTGGTCCAGATGAT 600 ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct 541 GCAAGTGCATGTCATGATGGCATGGGCTGGCTAACAATCGGAATTTCTGGTCCAGATGAT 600

Query 601 GAAGCAGTGGCTGTGTTAAAATACAACGGCATAATAACTGAAACCATAAAAAGTTGGAGG 660 | ||||||||||||||||||||||||||| ||||||||||||||||||||||||||||||Sbjct 601 GGAGCAGTGGCTGTGTTAAAATACAACGGTATAATAACTGAAACCATAAAAAGTTGGAGG 660

Query 661 AAGAAAATATTGAGAACACAAGAGTCTGAATGTGTCTGTGTAAATGGTTCATGTTTTACT 720 ||| |||||||||||||||||||||||||||||| ||| ||||||||||||||||| |||Sbjct 661 AAGGAAATATTGAGAACACAAGAGTCTGAATGTGCCTGCGTAAATGGTTCATGTTTCACT 720

Query 721 ATAATGACCGACGGCCCGAGTGATGGCCAGGCCTCGTACAAAATTTTCAAGATCGAGAAG 780 |||||||||||||||||||||| ||| | |||||||||||||||||||||||||||||||Sbjct 721 ATAATGACCGACGGCCCGAGTGGTGGGCCGGCCTCGTACAAAATTTTCAAGATCGAGAAG 780

Query 781 GGGAAGGTTACTAAATCAATAGAGTTGGATGCACCTAATTCTCACTACGAGGAATGTTCC 840 ||||||||||||||||||||||| ||||||||||||||||||||||| ||||||||||||Sbjct 781 GGGAAGGTTACTAAATCAATAGAATTGGATGCACCTAATTCTCACTATGAGGAATGTTCC 840

Query 841 TGTTACCCTGATACCGGCAAGGTGATGTGTGTGTGCAGAGACAATTGGCACGGTTCGAAC 900 ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct 841 TGTTACCCTGATACCGGCAAGGTGATGTGTGTGTGCAGAGACAATTGGCACGGTTCGAAC 900

Query 901 CGACCATGGGTGTCTTTCGATCAAAATCTGGATTATCAAATAGGATACATCTGCAGTGGG 960 ||||||||||||||||||||||||||||||||||||||||| || |||||||||||||||Sbjct 901 CGACCATGGGTGTCTTTCGATCAAAATCTGGATTATCAAATGGGCTACATCTGCAGTGGG 960

Query 961 GTTTTCGGTGACAATCCGCGTTCCAAAGATGGAAAAGGCAGCTGTGGTCCGGTGTATGTT 1020 ||||||||||||||||||||| |||||||||||||||||| ||||||||| |||||||||Sbjct 961 GTTTTCGGTGACAATCCGCGTCCCAAAGATGGAAAAGGCAACTGTGGTCCAGTGTATGTT 1020

Query 1021 GATGGAGCAAACGGAGTAAAGGGATTTTCATACAGGTATGGTAATGGTGTTTGGATAGGA 1080 ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct 1021 GATGGAGCAAACGGAGTAAAGGGATTTTCATACAGGTATGGTAATGGTGTTTGGATAGGA 1080

Query 1081 AGGACTAAAAGTGACAGTTCCAGACAGGGGTTTGAGATGATTTGGGATCCTAATGGGTGG 1140 |||||||||||| ||||||||||||||||||||||||||||||||||||| |||||||||Sbjct 1081 AGGACTAAAAGTAACAGTTCCAGACAGGGGTTTGAGATGATTTGGGATCCCAATGGGTGG 1140

Query 1141 ACAGAGACTGATAGTAATTTCTTTGTGAAACAAGATATAGTGGCTATGACTGATTGGTCA 1200 |||||||||||||||||||||||||||||||||||| ||||||| ||||||||||||||Sbjct 1141 ACAGAGACTGATAGTAATTTCTTTGTGAAACAAGATGTAGTGGCAGTGACTGATTGGTCA 1200

Query 1201 GGGTACAGCGGAAGTTTCGTTCAACATCCTGAGCTAACAGGGCTGGACTGTATGAGGCCT 1260 ||||||||||||||||||||||||||||||||| ||||||||||||||||||||||||||Sbjct 1201 GGGTACAGCGGAAGTTTCGTTCAACATCCTGAGTTAACAGGGCTGGACTGTATGAGGCCT 1260

Query 1261 TGCTTCTGGGTTGAATTAATCAGGGGACGACCTAAAGAAAAAACAATCTGGACTAGTGGG 1320 ||||||||||||||||||||||||||||| ||||||||||||||||||||||| ||||||Sbjct 1261 TGCTTCTGGGTTGAATTAATCAGGGGACGGCCTAAAGAAAAAACAATCTGGACCAGTGGG 1320

Query 1321 AGCAGCATTTCTTTTTGTGGCGTGAATAGTGATACTGTAGACTGGTCTTGGCCAGACGGT 1380 ||||||||||||||||||||||||||||||||||||||||| ||||||||||||||||||Sbjct 1321 AGCAGCATTTCTTTTTGTGGCGTGAATAGTGATACTGTAGATTGGTCTTGGCCAGACGGT 1380

Query 1381 GCCGAATTGCCATTCACCATTGACAAGTAG 1410 ||||| ||||||||||||||||||||||||Sbjct 1381 GCCGAGTTGCCATTCACCATTGACAAGTAG 1410

DAFTAR PUSTAKA

.

http://www.ncbi.nlm.nih.gov/Blast.cgi. [11 Januari 2014]

http://ghr.nlm.nih.gov/handbook/basics/dna. [11 Januari 2014]

Yusrotis Z, Alfi .2011. Analisis Sequence DNA virus H1N1Menggunakan Metode Super pairwise alignment. Thesis FMIPA ITS.

http://ghr.nlm.nih.gov/handbook/basics/dna

http://www.ncbi.nlm.nih.gov/Blast.cgi

Pensejajaran Sekuen Virus H1N1 dengan Blast

Documents

Transcript of Pensejajaran Sekuen Virus H1N1 dengan Blast