Ini ialah arahan hmmscan yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
hmmscan - cari jujukan protein terhadap pangkalan data profil protein
SINOPSIS
hmmscan [pilihan]
DESCRIPTION
hmmscan digunakan untuk mencari jujukan protein terhadap koleksi profil protein. Untuk
setiap urutan dalam , gunakan urutan pertanyaan itu untuk mencari pangkalan data sasaran
profil dalam , dan senarai kedudukan keluaran bagi profil yang paling penting
sepadan dengan urutan.
. mungkin mengandungi lebih daripada satu urutan pertanyaan. Ia boleh dalam format FASTA, atau
beberapa format fail jujukan biasa lain (genbank, embl, dan uniprot, antara lain), atau
dalam format fail penjajaran (stockholm, fasta sejajar dan lain-lain). Lihat --qformat pilihan
untuk senarai lengkap.
. perlu ditekan menggunakan hmmpress sebelum ia boleh dicari dengan hmmscan.
Ini mencipta empat fail binari, diakhiri dengan .h3{fimp}.
Pertanyaan itu mungkin '-' (aksara sengkang), dalam hal ini urutan pertanyaan adalah
dibaca daripada a paip bukannya daripada fail. The tidak boleh dibaca daripada a
stream, kerana ia perlu mempunyai empat fail perduaan tambahan yang dijana oleh
hmmpress.
Format output direka bentuk supaya boleh dibaca oleh manusia, tetapi selalunya sangat besar
membacanya tidak praktikal, dan menghuraikannya adalah sakit. The --tblout and --domtblout pilihan
simpan output dalam format jadual ringkas yang ringkas dan lebih mudah untuk dihuraikan. The -o pilihan
membenarkan pengalihan keluaran utama, termasuk membuangnya dalam /dev/null.
PILIHAN
-h Bantuan; cetak peringatan ringkas tentang penggunaan baris arahan dan semua pilihan yang tersedia.
PILIHAN UNTUK MENGAWAL OUTPUT
-o Arahkan output utama yang boleh dibaca manusia ke fail bukannya stdout lalai.
--tblout
Simpan fail jadual ringkas (terbatas ruang) yang meringkaskan output setiap sasaran,
dengan satu talian data bagi setiap model sasaran homolog ditemui.
--domtblout
Simpan fail jadual ringkas (terhad ruang) yang meringkaskan output setiap domain,
dengan satu talian data bagi setiap domain homolog dikesan dalam urutan pertanyaan untuk setiap domain
model homolog.
--pfamtblout
Simpan fail jadual ringkas (terbatas ruang) yang meringkaskan per-
output sasaran, dengan satu talian data bagi setiap model sasaran homolog ditemui.
--ak Gunakan aksesi dan bukannya nama dalam output utama, jika tersedia untuk profil
dan/atau urutan.
--noali
Abaikan bahagian penjajaran daripada keluaran utama. Ini boleh mengurangkan pengeluaran
kelantangan.
--notextw
Nyahhadkan panjang setiap baris dalam keluaran utama. Lalai ialah had 120
aksara setiap baris, yang membantu dalam memaparkan output dengan bersih pada terminal dan
dalam editor, tetapi boleh memotong baris penerangan profil sasaran.
--teksw
Tetapkan had panjang baris keluaran utama kepada aksara setiap baris. Lalainya ialah
120.
PILIHAN UNTUK PELAPORAN TERAS
Melaporkan ambang mengawal hits yang dilaporkan dalam fail output (output utama,
--tblout, dan --domtblout).
-E Dalam output setiap sasaran, laporkan profil sasaran dengan nilai E <= . Yang
lalai ialah 10.0, bermakna secara purata, kira-kira 10 positif palsu akan dilaporkan
setiap pertanyaan, supaya anda boleh melihat bahagian atas bunyi dan memutuskan sendiri sama ada ia
bising sungguh.
-T Daripada mengehadkan keluaran setiap profil pada nilai E, sebaliknya laporkan sasaran
profil dengan sedikit markah >= .
--domE
Dalam keluaran setiap domain, untuk profil sasaran yang telah memenuhi per-
ambang pelaporan profil, laporkan domain individu dengan nilai E bersyarat
daripada <= . Lalai ialah 10.0. Nilai E bersyarat bermaksud nombor yang dijangkakan
domain positif palsu tambahan dalam ruang carian yang lebih kecil daripada domain tersebut
perbandingan yang sudah memenuhi ambang pelaporan setiap profil (dan dengan itu
mesti mempunyai sekurang-kurangnya satu domain homolog).
--domT
Daripada mengehadkan keluaran setiap domain pada nilai E, sebaliknya laporkan domain dengan a
sedikit markah >= .
PILIHAN UNTUK KESIMPULAN TERAS
Ambang kemasukan adalah lebih ketat daripada ambang pelaporan. Kawalan ambang kemasukan
hits mana yang dianggap cukup dipercayai untuk disertakan dalam penjajaran output atau a
pusingan carian seterusnya. Dalam hmmscan, yang tidak mempunyai sebarang output penjajaran (seperti
hmmsearch or phmmer) mahupun sebarang langkah carian berulang (seperti jackhmmer), ambang kemasukan
mempunyai sedikit kesan. Ia hanya mempengaruhi domain yang ditandakan sebagai penting (!) atau
dipersoalkan (?) dalam output domain.
--incE
Gunakan nilai E <= sebagai ambang kemasukan setiap sasaran. Lalainya ialah
0.01, bermakna secara purata, kira-kira 1 positif palsu dijangka dalam setiap
100 carian dengan urutan pertanyaan yang berbeza.
--incT
Daripada menggunakan E-nilai untuk menetapkan ambang kemasukan, sebaliknya gunakan sedikit
markah >= sebagai ambang kemasukan setiap sasaran. Ia akan menjadi luar biasa untuk digunakan
ambang skor bit dengan hmmscan, kerana anda tidak mengharapkan satu markah pun
ambang untuk berfungsi untuk profil yang berbeza; profil yang berbeza mempunyai sedikit
taburan skor jangkaan yang berbeza.
--incdomE
Gunakan nilai E bersyarat <= sebagai ambang kemasukan setiap domain, dalam
sasaran yang telah pun memenuhi keseluruhan ambang kemasukan setiap sasaran.
Lalai adalah 0.01.
--incdomT
Daripada menggunakan nilai-E, sebaliknya gunakan sedikit skor >= sebagai per-domain
ambang kemasukan. Seperti dengan --incT di atas, adalah luar biasa untuk menggunakan satu bit
ambang markah masuk hmmscan.
PILIHAN UNTUK MODEL-KHUSUS SCORE Ambang
Pangkalan data profil yang dipilih susun boleh menentukan ambang skor bit tertentu untuk setiap profil,
menggantikan sebarang ambang berdasarkan kepentingan statistik sahaja.
Untuk menggunakan pilihan ini, profil mesti mengandungi yang sesuai (GA, TC dan/atau NC)
anotasi ambang skor pilihan; ini diambil oleh hmmbuild daripada format Stockholm
fail penjajaran. Setiap pilihan ambang mempunyai dua markah: ambang setiap jujukan
dan ambang setiap domain Ini bertindak seolah-olah -T --incT --domT
--incdomT telah digunakan secara khusus menggunakan setiap ambang dipilih susun model.
--cut_ga
Gunakan skor bit GA (pengumpulan) dalam model untuk menetapkan setiap jujukan (GA1) dan per-
pelaporan domain (GA2) dan ambang kemasukan. Ambang GA secara amnya
dianggap sebagai ambang pilihan yang boleh dipercayai yang menentukan keahlian keluarga; untuk
contoh, dalam Pfam, ambang ini menentukan perkara yang disertakan dalam Pfam Full
penjajaran berdasarkan carian dengan model Pfam Seed.
--cut_nc
Gunakan ambang skor bit NC (noise cutoff) dalam model untuk menetapkan setiap jujukan
(NC1) dan setiap domain (NC2) pelaporan dan ambang kemasukan. Ambang NC ialah
secara amnya dianggap sebagai skor positif palsu yang diketahui mendapat markah tertinggi.
--cut_tc
Gunakan ambang skor bit NC (potongan dipercayai) dalam model untuk menetapkan setiap jujukan
(TC1) dan setiap domain (TC2) pelaporan dan ambang kemasukan. Ambang TC ialah
secara amnya dianggap sebagai skor pemarkahan terendah yang diketahui positif benar itu
adalah di atas semua positif palsu yang diketahui.
KAWALAN OF THE PECUTAN TALIAN PAIP
Carian HMMER3 dipercepatkan dalam saluran paip penapis tiga langkah: penapis MSV, penapis
Penapis Viterbi, dan penapis Hadapan. Penapis pertama adalah yang terpantas dan paling banyak
anggaran; yang terakhir ialah algoritma pemarkahan Hadapan penuh. Terdapat juga penapis bias
langkah antara MSV dan Viterbi. Sasaran yang melepasi semua langkah dalam saluran paip pecutan
kemudiannya tertakluk kepada pemprosesan pasca -- pengenalpastian domain dan pemarkahan menggunakan
Algoritma Maju/Mundur.
Menukar ambang penapis hanya mengalih keluar atau memasukkan sasaran daripada pertimbangan; berubah-ubah
ambang penapis tidak mengubah skor bit, nilai-E atau penjajaran, yang kesemuanya adalah
ditentukan semata-mata dalam pasca pemprosesan.
--maks Matikan semua penapis, termasuk penapis berat sebelah, dan jalankan penuh Ke Hadapan/Ke Belakang
pasca pemprosesan pada setiap sasaran. Ini sedikit sebanyak meningkatkan sensitiviti
kos dalam kelajuan.
--F1
Tetapkan ambang nilai P untuk langkah penapis MSV. Lalai ialah 0.02, bermakna
bahawa kira-kira 2% daripada sasaran bukan homolog pemarkahan tertinggi dijangka lulus
penapis.
--F2
Tetapkan ambang nilai P untuk langkah penapis Viterbi. Lalai ialah 0.001.
--F3
Tetapkan ambang nilai P untuk langkah penapis ke hadapan. Lalai ialah 1e-5.
--nobias
Matikan penapis bias. Ini sedikit sebanyak meningkatkan sensitiviti, tetapi boleh datang pada a
kos tinggi dalam kelajuan, terutamanya jika pertanyaan mempunyai komposisi sisa yang berat sebelah (seperti
rantau jujukan berulang, atau jika ia adalah protein membran dengan kawasan besar
hidrofobisiti). Tanpa penapis bias, terlalu banyak jujukan boleh melepasi penapis
dengan pertanyaan berat sebelah, membawa kepada prestasi yang lebih perlahan daripada jangkaan sebagai
algoritma Hadapan/Undur intensif pengiraan memikul beban yang luar biasa
beban.
LAIN PILIHAN
--nonull2
Matikan pembetulan skor null2 untuk gubahan berat sebelah.
-Z Tegaskan bahawa jumlah bilangan sasaran dalam carian anda adalah , untuk tujuan
pengiraan nilai E setiap jujukan, bukannya bilangan sasaran sebenar
dilihat.
--domZ
Tegaskan bahawa jumlah bilangan sasaran dalam carian anda adalah , untuk tujuan
pengiraan nilai E bersyarat setiap domain, bukannya bilangan sasaran
yang melepasi ambang pelaporan.
--benih
Tetapkan benih nombor rawak kepada . Beberapa langkah dalam pasca pemprosesan memerlukan Monte
simulasi Carlo. Lalai adalah menggunakan benih tetap (42), supaya hasilnya
betul-betul boleh dihasilkan semula. Mana-mana integer positif lain akan memberikan yang berbeza (tetapi juga
boleh dihasilkan semula) hasil. Pilihan 0 menggunakan benih yang dipilih secara sewenang-wenangnya.
--qformat
Tegaskan bahawa fail jujukan pertanyaan adalah dalam format . Format yang diterima termasuk
puasa, embl, genbank, ddbj, uniprot, Stockholm, pfam, a2m, dan afa.
--CPU
Tetapkan bilangan benang pekerja selari kepada . Secara lalai, HMMER menetapkan ini kepada
bilangan teras CPU yang dikesan dalam mesin anda - iaitu, ia cuba memaksimumkan
penggunaan teras pemproses anda yang tersedia. Tetapan lebih tinggi daripada bilangan
teras yang tersedia adalah sedikit jika ada nilai, tetapi anda mungkin mahu menetapkannya kepada sesuatu
kurang. Anda juga boleh mengawal nombor ini dengan menetapkan pembolehubah persekitaran,
HMMER_NCPU.
Pilihan ini hanya tersedia jika HMMER telah disusun dengan sokongan urutan POSIX.
Ini ialah lalai, tetapi ia mungkin telah dimatikan untuk tapak atau mesin anda
sebab tertentu.
--gerai
Untuk menyahpepijat versi induk/pekerja MPI: jeda selepas mula, untuk mendayakan
pembangun untuk melampirkan penyahpepijat pada proses induk dan pekerja yang sedang berjalan. Hantar
Isyarat SIGCONT untuk melepaskan jeda. (Di bawah gdb: (Gdb) isyarat TANDATANGAN)
(Hanya tersedia jika sokongan MPI pilihan didayakan pada masa penyusunan.)
--mpi Jalankan dalam mod induk/pekerja MPI, menggunakan mpirun.
(Hanya tersedia jika sokongan MPI pilihan didayakan pada masa penyusunan.)
Gunakan hmmscan dalam talian menggunakan perkhidmatan onworks.net