hmmscan - Online în cloud

Rulați hmmscan în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda hmmscan care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Rulați în Ubuntu Rulați în Fedora Rulați în Windows Sim Rulați în MACOS Sim

PROGRAM:

NUME

hmmscan - caută secvențe de proteine în baza de date a profilului de proteine

REZUMAT

hmmscan [Opțiuni]

DESCRIERE

hmmscan este utilizat pentru a căuta secvențe de proteine față de colecții de profiluri de proteine. Pentru
fiecare secvență în , utilizați acea secvență de interogare pentru a căuta în baza de date țintă a
profiluri în , și scoateți liste clasificate ale profilurilor cu cele mai semnificative
se potrivește cu secvența.

poate conține mai mult de o secvență de interogare. Poate fi în format FASTA sau
alte câteva formate comune de fișiere de secvență (genbank, embl și uniprot, printre altele) sau
în formate de fișiere de aliniere (stockholm, fasta aliniat și altele). Vezi --qformat opțiune
pentru o listă completă.

trebuie apăsat folosind hmmpress înainte de a putea fi căutat cu hmmscan.
Acest lucru creează patru fișiere binare, cu sufixul .h3{fimp}.

Interogarea poate fi „-” (un caracter liniuță), caz în care secvențele de interogare sunt
citeste din a pipe în loc de dintr-un fișier. The nu poate fi citit din a
stream, deoarece trebuie să aibă acele patru fișiere binare auxiliare generate de
hmmpress.

Formatul de ieșire este conceput pentru a fi citit de om, dar este adesea atât de voluminos încât
citirea lui este nepractică, iar analizarea lui este o durere. The --tblout si --domtblout Opțiuni
salvați rezultatul în formate tabelare simple, care sunt concise și mai ușor de analizat. The -o opțiune
permite redirecționarea ieșirii principale, inclusiv aruncarea acesteia în /dev/null.

OPŢIUNI

-h Ajutor; imprimați un scurt memento cu privire la utilizarea liniei de comandă și toate opțiunile disponibile.

OPŢIUNI PENTRU CONTROLUL REZULTATE

-o Direcționați principala ieșire care poate fi citită de om către un fișier în loc de stdout implicit.

--tblout
Salvați un fișier tabelar simplu (delimitat de spațiu) care rezumă rezultatul per-țintă,
cu o linie de date pentru fiecare model țintă omolog găsit.

--domtblout
Salvați un fișier tabelar simplu (delimitat de spațiu) care rezumă ieșirea pe domeniu,
cu o linie de date per domeniu omolog detectată într-o secvență de interogare pentru fiecare
model omolog.

--pfamtblout
Salvați un fișier tabelar (delimitat de spațiu) deosebit de succint, care rezumă per-
ieșire țintă, cu o linie de date pentru fiecare model țintă omolog găsită.

--acc Utilizați accesări în loc de nume în rezultatul principal, acolo unde este disponibil pentru profiluri
și/sau secvențe.

--noali
Omiteți secțiunea de aliniere din ieșirea principală. Acest lucru poate reduce foarte mult producția
volum.

--notextw
Nelimitați lungimea fiecărei linii din ieșirea principală. Valoarea implicită este o limită de 120
caractere pe linie, ceea ce ajută la afișarea curată a rezultatelor pe terminale și
în editori, dar poate trunchia liniile de descriere a profilului țintă.

--textw
Setați limita de lungime a liniei de ieșire principală la caractere pe linie. Valoarea implicită este
120.

OPŢIUNI PENTRU RAPORTAREA PRAȘE

Pragurile de raportare controlează ce accesări sunt raportate în fișierele de ieșire (ieșirea principală,
--tblout și --domtblout).

-E În rezultatul pentru fiecare țintă, raportați profilurile țintă cu o valoare E de <= .
implicit este 10.0, ceea ce înseamnă că, în medie, vor fi raportate aproximativ 10 fals pozitive
pe interogare, astfel încât să puteți vedea partea de sus a zgomotului și să decideți singur dacă este
cu adevărat zgomot.

-T În loc să limitați rezultatul per profil pe E-value, raportați în schimb ținta
profiluri cu un scor bit de >= .

--dom
În rezultatul per-domeniu, pentru profilurile țintă care au satisfăcut deja per-
prag de raportare a profilului, raportați domenii individuale cu o valoare E condiționată
de <= . Valoarea implicită este 10.0. O valoare E condiționată înseamnă numărul așteptat
de domenii fals pozitive suplimentare în spațiul de căutare mai mic al acestora
comparații care au satisfăcut deja pragul de raportare per profil (și astfel
trebuie să aibă deja cel puțin un domeniu omolog).

--domT
În loc să limitați rezultatul pe domeniu pe E-value, raportați domeniile cu a
scorul de biți de >= .

OPŢIUNI PENTRU INCLUDERE PRAȘE

Pragurile de includere sunt mai stricte decât pragurile de raportare. Controlul pragurilor de includere
care hit-uri sunt considerate a fi suficient de fiabile pentru a fi incluse într-o aliniere de ieșire sau a
runda de căutare ulterioară. În hmmscan, care nu are nicio ieșire de aliniere (cum ar fi
hmm căutare or phmmer) și nici pași de căutare iterativă (cum ar fi jackhmmer), pragurile de includere
au un efect redus. Acestea afectează doar domeniile marcate ca semnificative (!) sau
îndoielnic (?) în ieșirea domeniului.

--incE
Utilizați o valoare E de <= ca prag de includere pe țintă. Valoarea implicită este
0.01, ceea ce înseamnă că, în medie, ar fi de așteptat aproximativ 1 fals pozitiv în fiecare
100 de căutări cu diferite secvențe de interogări.

--incT
În loc să utilizați valori E pentru setarea pragului de includere, folosiți un pic
scor >= ca prag de includere pe țintă. Ar fi neobișnuit de folosit
praguri de scor biți cu hmmscan, pentru că nu te aștepți la un singur scor
prag de lucru pentru diferite profiluri; profiluri diferite au ușor
distribuții diferite de scor așteptat.

--incdomE
Utilizați o valoare E condiționată de <= ca prag de includere pe domeniu, în
ținte care au îndeplinit deja pragul general de includere pe țintă.
Valoarea implicită este 0.01.

--incdomT
În loc să utilizați valori E, folosiți un scor de biți >= ca per-domeniu
pragul de includere. Ca și în cazul --incT mai sus, ar fi neobișnuit să folosiți un singur bit
pragul de scor în hmmscan.

OPŢIUNI PENTRU SPECIFICE DE MODEL SCOR PRAGAREA

Bazele de date de profil organizate pot defini praguri de scor de biți specifice pentru fiecare profil,
depășind orice prag bazat numai pe semnificația statistică.

Pentru a utiliza aceste opțiuni, profilul trebuie să conțină elementele adecvate (GA, TC și/sau NC)
adnotare opțională a pragului de scor; aceasta este preluată de hmmbuild din formatul Stockholm
fișiere de aliniere. Fiecare opțiune de prag are două scoruri: pragul pe secvență
și pragul per-domeniu Acestea acționează ca și cum -T --incT --domT
--incdomT a fost aplicat în mod specific utilizând pragurile stabilite pentru fiecare model.

--cut_ga
Utilizați scorurile de biți GA (adunare) din model pentru a seta per-secvență (GA1) și per-
raportarea domeniului (GA2) și pragurile de includere. Pragurile GA sunt în general
considerate a fi pragurile stabilite de încredere care definesc apartenența la familie; pentru
De exemplu, în Pfam, aceste praguri definesc ceea ce este inclus în Pfam Full
aliniamente bazate pe căutări cu modele Pfam Seed.

--cut_nc
Utilizați pragurile de scor biți NC (decuplare a zgomotului) din model pentru a seta per-secvență
(NC1) și pragurile de raportare și includere pe domeniu (NC2). Pragurile NC sunt
în general considerat a fi scorul fals pozitiv cunoscut cu cel mai mare scor.

--cut_tc
Utilizați pragurile scorului de biți NC (cutoff de încredere) din model pentru a seta per-secvență
(TC1) și pragurile de includere și raportare pe domeniu (TC2). Pragurile TC sunt
în general considerat a fi scorul celui mai mic scor pozitiv adevărat cunoscut că
este mai presus de toate false pozitive cunoscute.

CONTROL OF THE ACCELERARE ȚINUTĂ

Căutările HMMER3 sunt accelerate într-o conductă de filtru în trei pași: filtrul MSV, filtrul
filtrul Viterbi și filtrul Forward. Primul filtru este cel mai rapid și cel mai
aproximativ; ultimul este algoritmul complet de scor Forward. Există și un filtru de părtinire
pas intre MSV si Viterbi. Ținte care trec toți pașii din conducta de accelerație
sunt apoi supuse postprocesării -- identificarea domeniului și scoring folosind
Algoritm înainte/înapoi.

Modificarea pragurilor de filtrare numai elimină sau include ținte din considerare; schimbându-se
pragurile de filtrare nu modifică scorurile de biți, valorile E sau aliniamentele, toate acestea fiind
determinate exclusiv în postprocesare.

--max Dezactivați toate filtrele, inclusiv filtrul de părtinire, și rulați complet înainte/înapoi
postprocesare pe fiecare țintă. Acest lucru crește oarecum sensibilitatea, în mare măsură
costă în viteză.

--F1
Setați pragul valorii P pentru pasul de filtru MSV. Valoarea implicită este 0.02, adică
că se așteaptă să treacă aproximativ 2% dintre țintele neomologe cu cel mai mare scor
filtrul.

--F2
Setați pragul valorii P pentru pasul de filtru Viterbi. Valoarea implicită este 0.001.

--F3
Setați pragul valorii P pentru pasul de filtru înainte. Valoarea implicită este 1e-5.

--nobias
Opriți filtrul de polarizare. Acest lucru crește oarecum sensibilitatea, dar poate veni la a
cost ridicat în viteză, mai ales dacă interogarea are o compoziție părtinitoare a reziduurilor (cum ar fi
o regiune de secvență repetitivă sau dacă este o proteină membranară cu regiuni mari de
hidrofobicitate). Fără filtrul de polarizare, prea multe secvențe pot trece prin filtru
cu interogări părtinitoare, ceea ce duce la o performanță mai lentă decât se aștepta, ca
Algoritmii Forward/Backward cu calcul intensiv umăr sunt anormal de grei
încărcați.

ALTE OPŢIUNI

--nonull2
Dezactivați corecțiile scorului null2 pentru compoziția părtinitoare.

-Z Afirmați că numărul total de ținte din căutările dvs. este , în scopurile
de calcule de valoare E pe secvență, mai degrabă decât numărul real de ținte
văzut.

--domZ
Afirmați că numărul total de ținte din căutările dvs. este , în scopurile
de calcule de valoare E condiționată pe domeniu, mai degrabă decât numărul de ținte
care au depășit pragurile de raportare.

--samanta
Setați sămânța numărului aleatoriu la . Unii pași în postprocesare necesită Monte
simulare Carlo. Implicit este să utilizați o sămânță fixă (42), astfel încât rezultatele să fie
exact reproductibil. Orice alt întreg pozitiv va da diferit (dar și
reproductibile) rezultate. O alegere de 0 folosește o sămânță aleasă în mod arbitrar.

--qformat
Afirmați că fișierul secvenței de interogare este în format . Formatele acceptate includ
fasta, embl, Genbank, ddbj, uniprot, Stockholm, pfam, a2m și bunic.

--CPU
Setați numărul de fire de lucru paralele la . În mod implicit, HMMER setează acest lucru la
numărul de nuclee CPU pe care le detectează în mașina dvs. - adică încearcă să maximizeze
utilizarea nucleelor de procesor disponibile. Setare mai mare decât numărul de
nucleele disponibile are o valoare mică sau deloc, dar poate doriți să le setați la ceva
Mai puțin. De asemenea, puteți controla acest număr setând o variabilă de mediu,
HMMER_NCPU.

Această opțiune este disponibilă numai dacă HMMER a fost compilat cu suport pentru fire POSIX.
Aceasta este valoarea implicită, dar este posibil să fi fost dezactivată pentru site-ul sau computerul dvs
vreun motiv.

--stand
Pentru depanarea versiunii MPI master/worker: întrerupeți după pornire, pentru a activa
dezvoltator să atașeze dispozitive de depanare la procesele master și worker(i) care rulează. Trimite
Semnal SIGCONT pentru a elibera pauza. (Sub gdb: (gdb) semnal NEXTCONT)

(Disponibil numai dacă suportul opțional MPI a fost activat la compilare.)

--mpi Rulați în modul MPI master/worker, folosind mpirun.

(Disponibil numai dacă suportul opțional MPI a fost activat la compilare.)

Utilizați hmmscan online folosind serviciile onworks.net