Ini adalah perintah exonerate yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
exonerate - alat umum untuk perbandingan urutan
RINGKASAN
membebaskan [ Pilihan ] <permintaan jalan> <target jalan>
DESKRIPSI
membebaskan adalah alat umum untuk perbandingan urutan.
Ini menggunakan C4 perpustakaan pemrograman dinamis. Ini dirancang untuk menjadi umum dan cepat.
Hal ini dapat menghasilkan keberpihakan baik gapped atau ungapped, sesuai dengan berbagai berbeda
model keselarasan. Pustaka C4 memungkinkan penyelarasan urutan menggunakan ruang yang dikurangi penuh
implementasi pemrograman dinamis, tetapi juga memungkinkan pembuatan heuristik otomatis
dari model keselarasan, menggunakan pemrograman dinamis jarang terbatas, sehingga ini:
keberpihakan juga dapat dihasilkan dengan cepat. Penjajaran yang dihasilkan menggunakan heuristik ini
akan mewakili jalur yang valid melalui model penyelarasan, namun (tidak seperti yang lengkap
keberpihakan), hasilnya tidak dijamin optimal.
KONVENSI
Sejumlah konvensi (dan keanehan) digunakan dalam eksonerasi. Sebuah pemahaman
dari mereka memfasilitasi interpretasi output.
Koordinat
Sistem koordinat di antara digunakan, di mana posisi dihitung antara
simbol, bukan pada simbol. Skema penomoran ini dimulai dari nol.
Penomoran ini ditunjukkan di bawah ini untuk urutan "ACGT":
ACGT
0 1 2 3 4
Oleh karena itu, "CG" berikutnya akan memiliki start=1, end=3, dan length=2. Ini
sistem koordinat digunakan secara internal di exonerate, dan untuk semua format output
diproduksi dengan pengecualian tampilan penyelarasan "dapat dibaca manusia" dan GFF
output di mana konvensi dan standar menentukan sebaliknya.
Membalikkan Komplemen
Ketika keselarasan dilaporkan pada komplemen terbalik dari suatu urutan,
koordinat hanya diberikan pada salinan komplemen terbalik dari urutan. Karenanya
posisi pada barisan tidak pernah negatif. Umumnya, untai maju adalah
ditunjukkan dengan '+', untai terbalik dengan '-', dan tidak diketahui atau tidak dapat diterapkan
untai (seperti dalam kasus urutan protein) ditandai dengan '.'
Strategi Musik
Saat ini, hanya skor keselarasan mentah yang ditampilkan. Skor ini hanyalah jumlah
skor transisi yang digunakan dalam pemrograman dinamis. Misalnya, dalam kasus
keselarasan Smith-Waterman, ini akan menjadi jumlah dari skor matriks substitusi
dan penalti celah.
UMUM PILIHAN
Sebagian besar argumen memiliki bentuk pendek dan panjang. Bentuk panjang
lebih cenderung stabil dari waktu ke waktu, dan karenanya harus digunakan dalam skrip yang
panggilan membebaskan.
-h | --bantuan singkat
Menunjukkan bantuan. Ini akan menampilkan ringkasan singkat dari opsi yang tersedia, default
dan nilai yang saat ini ditetapkan.
--membantu
Ini menunjukkan semua opsi bantuan termasuk default, nilai yang saat ini ditetapkan,
dan variabel lingkungan yang dapat digunakan untuk mengatur setiap parameter. Akan ada
menjadi indikasi opsi mana yang wajib. Opsi wajib tidak memiliki
default, dan harus memiliki nilai yang diberikan agar exonerate dapat dijalankan. Jika opsi wajib
digunakan secara berurutan, bendera mereka dapat dilewati dari baris perintah (lihat contoh
di bawah). Tidak seperti halaman manual ini, informasi dari opsi ini akan selalu up
sampai saat ini dengan versi terbaru dari program.
-v | --Versi: kapan
Menampilkan nomor versi. Juga menampilkan informasi lain seperti tanggal pembuatan
dan versi glib yang digunakan.
URUTAN INPUT PILIHAN
Perbandingan berpasangan akan dilakukan antara semua urutan kueri dan semua target
urutan. Umumnya, untuk performa terbaik, urutan yang lebih pendek (mis. EST, shotgun
dibaca, protein) harus digunakan sebagai urutan kueri, dan urutan yang lebih panjang (mis
urutan) harus digunakan sebagai urutan target.
-q | --pertanyaan
Tentukan urutan kueri yang diperlukan. Ini harus dalam format file FASTA.
Urutan kueri tunggal atau ganda dapat diberikan. Selain itu banyak salinan
dari file fasta dapat diberikan mengikuti tanda --query, atau dengan menggunakan dengan
beberapa --query flag.
-t | --target
Tentukan urutan target yang diperlukan. Juga, harus dalam format file FASTA. Sebagai
dengan urutan kueri, urutan dan file target tunggal atau ganda mungkin
disediakan. NEW: nama file target dapat diganti dengan nama server dan nomor port
dalam bentuk nama host: port saat menggunakan server-pembebasan. Lihat halaman manual untuk
server-pembebasan untuk informasi lebih lanjut tentang menjalankan exonerate di klien: mode server.
-Q | --jenis kueri <dna | protein>
Tentukan jenis kueri yang akan digunakan. Jika ini tidak diberikan, jenis kueri diasumsikan
menjadi DNA ketika urutan pertama dalam file mengandung lebih dari 85% basa [ACGTN].
Jika tidak, itu dianggap peptida. Opsi ini memaksa jenis kueri sebagai beberapa
urutan nukleotida dan peptida dapat jatuh di kedua sisi ambang batas ini.
-T | --tipe target <dna | protein>
Tentukan jenis target yang akan digunakan. Sama seperti --jenis kueri (di atas), kecuali itu
berlaku untuk sasaran. Menentukan jenis urutan akan menghindari overhead dari
harus membaca urutan pertama dalam database dua kali (yang mungkin signifikan
dengan sekuens berukuran kromosom)
--querychunkid
--querychunktotal
--targetchunkid
--target potongantotal
Opsi ini untuk memfasilitasi menjalankan exonerate di peternakan komputasi, dan menghindari keharusan
membagi database urutan menjadi potongan-potongan kecil untuk dijalankan pada node yang berbeda. Jika, untuk
contoh, Anda ingin membagi database target menjadi tiga bagian, Anda akan menjalankan
tiga pekerjaan membebaskan pada node yang berbeda termasuk opsi:
--targetchunkid 1 --targetchunktotal 3
--targetchunkid 2 --targetchunktotal 3
--targetchunkid 3 --targetchunktotal 3
catatan Granularitas yang ditawarkan oleh opsi ini hanya turun ke satu urutan, jadi
ketika ada lebih banyak potongan daripada urutan dalam database, beberapa proses akan melakukannya
apa-apa.
-V | --bertele-tele
Bertele-tele - tampilkan informasi tentang apa yang terjadi selama analisis. NS
defaultnya adalah 1 (sedikit informasi), semakin tinggi angka yang diberikan, semakin banyak
informasi dicetak. Untuk membungkam semua output default dari exonerate, gunakan
--verbose 0 --showalignment tidak --showvulgar no
ANALISIS PILIHAN
-E | --lengkap
Tentukan apakah penyelarasan lengkap harus digunakan atau tidak. Secara default, ini adalah
FALSE, dan heuristik keselarasan akan digunakan. Jika disetel ke TRUE, sebuah kalimat lengkap
keselarasan akan dihitung. Ini membutuhkan waktu kuadrat, dan akan banyak, banyak
lebih lambat, tetapi akan memberikan hasil yang optimal untuk model yang diberikan.
-B | --seq besar
Lakukan penyelarasan urutan besar (multi-megabase). Ini sangat kenangan
efisien dan cepat ketika kedua sekuens berukuran kromosom, tetapi saat ini tidak
saat ini mengizinkan penggunaan kata tetangga (mis. hanya benih yang sama persis).
--forcescan <tidak ada | pertanyaan | sasaran>
Paksa FSM untuk memindai urutan kueri daripada target. Pilihan ini adalah
berguna, misalnya, jika Anda memiliki satu bagian dari urutan genom dan Anda dengan
bandingkan dengan seluruh dbEST. Dengan memindai database, bukan kueri,
analisis akan diselesaikan jauh lebih cepat, karena overhead dari beberapa
kueri konstruksi FSM, beberapa pembacaan target, dan prediksi situs sambatan akan
DIHAPUS. Secara default, exonerate akan menebak strategi optimal berdasarkan database
ukuran urutan.
--ambang batas jenuh
Jika disetel ke nol, opsi ini tidak melakukan apa pun. Jika tidak, sekali lebih dari angka ini
kata (selain jumlah kata yang diharapkan secara kebetulan) telah cocok dengan
posisi pada kueri, posisi pada kueri akan 'mati rasa' (abaikan lebih lanjut
cocok) untuk perbandingan berpasangan saat ini.
--server khusus
NEW: Saat menggunakan exonerate dalam mode client:server dengan server non-standar, ini
perintah memungkinkan Anda untuk mengirim perintah khusus ke server. Perintah ini dikirim oleh
klien (membebaskan) sebelum perintah lain, dan disediakan sebagai cara untuk
melewati parameter atau perintah lain khusus untuk server kustom. Lihat
server-pembebasan halaman manual untuk informasi lebih lanjut tentang menjalankan exonerate di
klien: mode server.
CEPAT DATABASE PILIHAN
--fastasuffix
Jika salah satu input diberikan dengan --pertanyaan or --target adalah direktori, lalu bebaskan
akan secara rekursif menurunkan direktori ini, membaca semua file yang diakhiri dengan ini
akhiran sebagai input format fasta.
TERGANGGU PENJAJARAN PILIHAN
-m | --model <penyelarasan model>
Tentukan model perataan yang akan digunakan. Model yang saat ini didukung adalah:
terbuka
Jenis model paling sederhana, digunakan secara default. Model yang sesuai dengan be
dipilih secara otomatis untuk jenis urutan input yang disediakan.
terbuka: trans
Model ungapped ini mencakup terjemahan dari semua frame dari query dan
urutan sasaran. Ini mirip dengan pencarian tipe tblastx yang tidak terbuka.
affine: global
Ini melakukan penyelarasan global gap, mirip dengan Needleman-Wunsch
algoritma, kecuali dengan affine gap. Keselarasan global mengharuskan kedua
urutan secara keseluruhan termasuk dalam keselarasan.
affine: paling cocok
Ini melakukan penyelarasan lokasi paling cocok atau terbaik dari kueri ke
urutan sasaran. Seluruh urutan kueri akan disertakan dalam
keselarasan, tetapi hanya lokasi terbaik untuk penyelarasannya pada target
urutan.
affine: lokal
Ini adalah keselarasan lokal dengan kesenjangan affine, mirip dengan Smith-Waterman-
Algoritma Gotoh. Algoritme penyelarasan tujuan umum. Karena ini lokal
keselarasan, setiap urutan kueri dan urutan target dapat muncul di
keselarasan.
affine: tumpang tindih
Jenis perataan ini menemukan tumpang tindih terbaik antara kueri dan target.
Perataan tumpang tindih harus menyertakan awal kueri atau target dan
akhir kueri atau urutan target, untuk menyelaraskan urutan yang tumpang tindih di
ujungnya, atau di bagian tengah dari urutan yang lebih panjang.. Ini adalah jenis
keselarasan sering digunakan dalam algoritma perakitan.
est2genom
Model ini mirip dengan model affine:local, tetapi juga termasuk intron
pemodelan pada urutan target untuk memungkinkan penyelarasan disambung ke tidak disambung
urutan pengkodean untuk gen maju dan mundur. Ini mirip dengan
model keselarasan yang digunakan dalam program seperti EST_GENOME dan sim4.
ner NER adalah wilayah yang tidak setara - wilayah besar di kueri dan
sasaran yang tidak selaras. Model ini dapat digunakan untuk penyelarasan protein
di mana wilayah heliks yang sangat terkonservasi akan disejajarkan, tetapi dilestarikan dengan lemah
daerah loop tidak. Demikian pula, model ini dapat digunakan untuk mencari
daerah yang dikonservasi secara linier dibandingkan dengan urutan genom.
protein2dna
Model ini membandingkan urutan protein dengan urutan DNA, menggabungkan semua
kesenjangan yang sesuai dan frameshifts.
protein2dna: paling cocok
NEW: Ini adalah versi paling cocok dari model protein2dna, yang dengannya
seluruh protein termasuk dalam keselarasan. Saat ini hanya tersedia
saat menggunakan keselarasan lengkap.
protein2genom
Model ini memungkinkan penyelarasan urutan protein ke DNA genom. Ini adalah
mirip dengan model protein2dna, dengan penambahan pemodelan intron
dan fase intron. Model ini mirip dengan yang digunakan oleh genewise.
protein2genom: paling cocok
NEW: Ini adalah versi paling cocok dari model protein2genome, yang dengannya
seluruh protein termasuk dalam keselarasan. Saat ini hanya tersedia
saat menggunakan keselarasan lengkap.
coding2coding
Model ini mirip dengan model ungapped:trans, kecuali gap dan
frameshifts diperbolehkan. Ini mirip dengan pencarian tblastx gapped.
pengkodean2genom
Ini mirip dengan model est2genome, kecuali bahwa urutan kuerinya adalah
diterjemahkan selama perbandingan, memungkinkan perbandingan yang lebih sensitif.
cdna2genom
Ini menggabungkan properti model est2genome dan coding2genome, untuk
memungkinkan pemodelan seluruh cDNA di mana wilayah pengkodean pusat dapat diapit
oleh UTR non-coding. Ketika awal dan akhir CDS diketahui, itu dapat ditentukan
menggunakan opsi --annotation (lihat di bawah) untuk mengizinkan hanya pengkodean yang benar
wilayah untuk muncul di alignemnt.
genom2genom
Model ini mirip dengan model coding2coding, kecuali intron adalah
dimodelkan pada kedua urutan. (belum bekerja dengan baik)
Nama pendek u, u:t, a:g, a:b, a:l, a:o, e2g, ner,
p2d, p2d:b p2g, p2g:b, c2c, c2g cd2g dan g2g juga dapat digunakan untuk menentukan
model.
-s | --skor
Ini adalah ambang batas skor keseluruhan. Penjajaran tidak akan dilaporkan di bawah ini
ambang. Untuk keselarasan heuristik, semakin tinggi ambang ini, semakin sedikit waktu
analisis akan mengambil.
--persen
Laporkan hanya keberpihakan yang mencetak setidaknya persentase skor maksimal ini untuk
setiap kueri. misalnya. menggunakan --persen 90 untuk melaporkan keberpihakan dengan 90% dari maksimal
skor dapat diperoleh untuk kueri itu. Opsi ini berguna bukan hanya karena mengurangi
kecocokan palsu dalam output, tetapi karena menghasilkan permintaan khusus
ambang batas (tidak seperti --skor ) untuk sekumpulan kueri dengan panjang yang berbeda, dan akan
juga mempercepat pencarian jauh. catatan dengan opsi ini, dimungkinkan untuk
memiliki cDNA yang sama persis dengan gen yang sesuai, namun skornya masih kurang dari 100%,
karena penambahan skor penalti intron, maka opsi ini harus digunakan
dengan hati-hati.
--penyelarasan pertunjukan
Tampilkan perataan dalam bentuk yang dapat dibaca manusia.
--menunjukkan gula
Tampilkan output "gula" untuk perataan yang tidak terbuka. Gula adalah Penyelarasan Sederhana Tanpa Gap
Laporan, yang menampilkan perataan tanpa celah satu per baris. Garis gula dimulai
dengan string "gula:" untuk ekstraksi mudah dari output, dan diikuti oleh
berikut 9 bidang dalam urutan di bawah ini:
kueri_id Pengidentifikasi kueri
kueri_mulai Posisi kueri saat penyelarasan dimulai
permintaan_akhir Penyelarasan posisi kueri berakhir
query_strand Untaian kueri cocok
target_id |
target_mulai | 4 bidang yang sama
target_akhir | untuk urutan sasaran
target_untai |
skor Skor keselarasan mentah
--tunjukkan cerutu
Tampilkan keberpihakan dalam format "cerutu". Cerutu adalah Kompak Idiosyncratic Gapped
Alignment Report, yang menampilkan perataan gapped satu per baris. Formatnya dimulai
dengan 9 bidang yang sama dengan keluaran gula (lihat di atas), dan diikuti oleh serangkaian
pasang di mana operasi adalah salah satu pertandingan, masukkan atau hapus, dan
panjangnya menggambarkan berapa kali operasi ini diulang.
--menunjukkan vulgar
Menampilkan perataan dalam format "vulgar". Vulgar adalah Verbose Berguna Berlabel Gapped
Laporan Perataan, Format ini juga dimulai dengan 9 bidang yang sama dengan keluaran gula
(lihat di atas), dan diikuti oleh serangkaian
kembar tiga. Labelnya mungkin salah satu dari berikut ini:
M Cocok
C kodon
G Celah
N Daerah yang tidak setara
5 situs sambungan 5'
3 situs sambungan 3'
I intron
S Kodon terpisah
F Pergeseran bingkai
--showquerygff
Laporkan keluaran GFF untuk fitur pada urutan kueri. Lihat
http://www.sanger.ac.uk/Software/formats/GFF for more information.
--tunjukkantargetgff
Laporkan keluaran GFF untuk fitur pada urutan target.
--ryo
Gulung format output Anda sendiri. Ini memungkinkan spesifikasi format printf-esque
baris yang digunakan untuk menentukan informasi mana yang akan disertakan dalam output, dan bagaimana
itu untuk ditampilkan. Bidang format dapat berisi bidang berikut:
%[qt][idlsSt]
Untuk {query,target}, laporkan
{id,definition,length,sequence,Strand,type} Urutan dilaporkan dalam a
format fasta seperti blok (tanpa header).
%[qt]a[bel]
Untuk wilayah {query,target} yang terjadi in itu penyelarasan, laporkan
{mulai, akhir, panjang, urutan}
%[qt]c[bel]
Untuk wilayah {query,target} yang terjadi di coding urutan dalam
keselarasan, laporkan {begin,end,length,sequence}
%s Skor mentah
%r Peringkat (dalam hasil dari pencarian terbaik)
%m Nama model
%e[tisme]
Setara {total,id,similarity,mismatches} (mis. %em == (%et - %ei))
%p[adalah] Persen {id,similarity} di atas bagian kesejajaran yang setara.
(mis. %pi == 100*(%ei / %et))
%g Orientasi gen ('+' = maju, '-' = mundur, '.' = tidak diketahui)
%S Blok gula (9 bidang yang digunakan dalam produksi gula (lihat di atas)
%C Blok cerutu (bidang garis cerutu setelah bagian gula)
%V Blok vulgar (bidang garis vulgar setelah bagian gula)
%% Perluas ke tanda persentase (%)
\n Garis baru
\t Tab
\\ Memperluas menjadi garis miring terbalik (\)
\{ Buka kurung kurawal
\} Tutup kurung kurawal
{ Mulai bagian keluaran per transisi
} Akhiri bagian keluaran per transisi
%P[qt][sabe]
Output per transisi untuk {query,target} {sequence,advance,begin,end}
%P[nsl]
Output per transisi untuk {name,score,label}
Opsi ini sangat berguna dan fleksibel. Misalnya, untuk melaporkan semua bagian kueri
urutan yang menampilkan keberpihakan dalam format fasta, gunakan:
--ryo ">%qi %qd\n%qas\n"
Untuk menampilkan semua simbol dan skor dalam keselarasan, coba sesuatu seperti:
--ryo "%V{%Pqs % Poin %Ps\n}"
-n | --terbaik
Laporkan hasil N terbaik untuk setiap kueri. (Hanya hasil yang mencetak lebih baik daripada
ambang skor
akan dilaporkan). Opsi mengurangi jumlah output yang dihasilkan, dan juga
memungkinkan exonerate untuk mempercepat pencarian.
-S | --subopt
Opsi ini memungkinkan pelaporan (gaya Waterman-Eggert) kurang optimal
keberpihakan. (Ini diaktifkan secara default.) Semua suboptimal (mis. tidak berpotongan)
keberpihakan akan dilaporkan untuk setiap pasangan urutan yang mencetak setidaknya
ambang batas yang disediakan oleh --skor.
Ketika opsi ini digunakan dengan penyelarasan lengkap, beberapa waktu kuadrat penuh
akan diperlukan, sehingga waktu berjalan akan sangat meningkat.
-g | --gappedekstensi
Menyebabkan tahap ekstensi gapped dilakukan yaitu. pemrograman dinamis diterapkan
di daerah berbentuk sewenang-wenang dan berukuran dinamis di sekitar benih HSP. NS
ambang batas ekstensi dikendalikan oleh opsi --extensionthreshold.
Meskipun terkadang lebih lambat dari BSDP, ekstensi gapped meningkatkan sensitivitas dengan
keberpihakan yang lemah dan kaya celah seperti selama perbandingan lintas spesies.
catatan Kredensial mikro Option is sekarang itu standar. set it untuk palsu untuk membalikkan ke tipe BSDP lama
keberpihakan. Opsi ini mungkin lebih lambat dari BSDP untuk beberapa analisis skala besar dengan
model pelurusan sederhana.
--menyaring
Paksa eksonerasi untuk memperbaiki keberpihakan yang dihasilkan oleh heuristik menggunakan dynamic
pemrograman di wilayah yang lebih besar. Ini membutuhkan lebih banyak waktu, tetapi meningkatkan kualitas
keselarasan akhir.
Strategi yang tersedia untuk perbaikan adalah:
tak satupun Default - tidak ada perbaikan yang digunakan.
penuh Sebuah keselarasan lengkap dihitung dari pasangan urutan dalam mereka
keseluruhan.
wilayah DP diterapkan hanya ke wilayah urutan yang dicakup oleh heuristik
penjajaran.
--batas halus
Tentukan batas tambahan untuk dimasukkan ke dalam wilayah yang akan diselaraskan selama
penyempurnaan menurut wilayah.
VITERBI ALGORITMA PILIHAN
-D | --dpmemori
Rutinitas traceback penyelarasan yang lengkap menggunakan memori yang dikurangi gaya Hughey
teknik. Opsi ini menentukan berapa banyak memori yang akan digunakan untuk ini.
Umumnya, semakin banyak memori yang diizinkan di sini, semakin cepat penyelarasannya
diproduksi.
KODE GENERASI PILIHAN
-C | --dikompilasi
Opsi ini memungkinkan penonaktifan kode yang dihasilkan untuk pemrograman dinamis. Dia
terutama digunakan selama pengembangan exonerate. Ketika diatur ke FALSE, sebuah "ditafsirkan"
versi implementasi pemrograman dinamis digunakan, yang jauh lebih lambat.
HEURISTIS PILIHAN
--terminalrangeint
--terminalrangeext
--bergabung dalam jangkauan
--joinrangeext
--spanrangeint
--spanrangeext
Opsi ini digunakan untuk menentukan ukuran wilayah sub-selaras tempat DP
diterapkan di sekitar ujung HSP. Ini bisa di ujung HSP (terminal
range), antara HSP (join range), atau antara HSP yang dapat dihubungkan oleh a
wilayah besar seperti wilayah intron atau non-ekuivalen (rentang rentang). Ini
rentang dapat ditentukan untuk sejumlah kecocokan kembali ke HSP (rentang internal)
atau keluar dari HSP (jangkauan eksternal).
Gunakan exonerate online menggunakan layanan onworks.net