Questo è il comando hmm2build che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
hmm2build: crea un profilo HMM da un allineamento
SINOSSI
hmm2build [opzioni] mmfile allineare
DESCRIZIONE
hmm2build legge un file di allineamento di sequenze multiple allineare , costruisce un nuovo profilo HMM,
e salva l'HMM in mmfile.
allineare può essere in ClustalW, GCG MSF, SELEX, Stockholm o allineato con FASTA
formato. Il formato viene rilevato automaticamente.
Per impostazione predefinita, il modello è configurato per trovare uno o più allineamenti non sovrapposti al
modello completo: più allineamenti globali rispetto al modello e locali con
rispetto alla sequenza. Questo è analogo al comportamento del mmm programma di HMMER
1. Per configurare il modello per più locale allineamenti rispetto al modello e
locale rispetto alla sequenza, come il vecchio programma hmmf, Usa il -f (frammento)
opzione. Più raramente, potresti voler configurare il modello per un singolo allineamento globale
(globale rispetto sia al modello che alla sequenza), utilizzando il -g opzione; o per configurare il
modello per un singolo allineamento locale/locale (a la standard Smith/Waterman, o il vecchio hmmw
programma), utilizzare il -s opzione.
VERSIONI
-f Configura il modello per trovare più domini per sequenza, dove ogni dominio
può essere un allineamento locale (frammentario). Questo è analogo al vecchio mmmf Programma
di HMMER 1.
-g Configurare il modello per trovare un singolo allineamento globale a una sequenza di destinazione,
analogo al vecchio hmm programma di HMMER 1.
-h Stampa breve guida; include il numero di versione e il riepilogo di tutte le opzioni, incluso
opzioni per esperti.
-n Dai un nome a questo HMM . puòessere qualsiasi stringa di caratteri non di spaziatura (ad esempio uno
"parola"). Non c'è limite di lunghezza (almeno non imposto da HMMER; la tua shell
si lamenterà prima della lunghezza della riga di comando).
-o Salva nuovamente l'allineamento iniziale in , in formato Stoccolma. Le colonne che erano
assegnati agli stati di corrispondenza saranno contrassegnati con x in una riga di annotazione #=RF. Se
sia la --mano or --veloce sono state scelte le opzioni di costruzione, l'allineamento può
sono stati leggermente modificati per essere compatibili con le transizioni Plan 7, quindi salvare il
l'allineamento finale e il confronto con l'allineamento iniziale possono consentirti di visualizzarli
alterazioni. Consulta la Guida dell'utente per ulteriori informazioni su questo arcano effetto collaterale.
-s Configurare il modello per trovare un singolo allineamento locale per sequenza di destinazione. Questo
è analogo all'algoritmo standard di Smith/Waterman o al hmmw programma di HMMER
1.
-A Aggiungi questo modello a un esistente mmfile piuttosto che creare mmfile. Utile per
costruire librerie HMM (come Pfam).
-F Forza la sovrascrittura di un esistente mmfile. Altrimenti HMMER si rifiuterà di fare a botte
i tuoi file HMM esistenti, per motivi di sicurezza.
EXPERT VERSIONI
--ammino
Forza l'allineamento della sequenza da interpretare come sequenze di amminoacidi. Normalmente
HMMER rileva automaticamente se l'allineamento è proteina o DNA, ma a volte gli allineamenti
sono così piccoli che il rilevamento automatico è ambiguo. Vedere --nucleico.
--archpri
Imposta l'"architettura precedente" utilizzata dalla costruzione dell'architettura MAP su , where
è una probabilità compresa tra 0 e 1. Questo parametro governa un priore geometrico
distribuzione sulle lunghezze del modello. Come aumenta, i modelli più lunghi sono preferiti a
priori. Come diminuisce, ci vuole più conservazione del residuo in una colonna per fare a
colonna una colonna di corrispondenza "consenso" nell'architettura del modello. Il valore predefinito di 0.85 ha
stato scelto empiricamente come contesto ragionevole.
--binario
Scrivi l'HMM a mmfile in formato binario HMMER invece del testo leggibile ASCII.
--cfile
Salvare l'emissione osservata e i conteggi delle transizioni su dopo che l'architettura ha
stato determinato (ad es. dopo che i residui/lacune sono stati assegnati per abbinare, eliminare e
inserire stati). Questa opzione viene utilizzata nello sviluppo HMMER per la generazione di file di dati
utile per addestrare i nuovi priori di Dirichlet. Il formato dei file di conteggio è documentato
nella Guida dell'utente.
--veloce Determinare in modo rapido ed euristico l'architettura del modello assegnando all
colonne sarà più di una certa frazione di caratteri gap per inserire gli stati. Di
di default questa frazione è 0.5 e può essere modificata usando il --gapmax opzione. Il
l'algoritmo di costruzione predefinito è un algoritmo massimo a posteriori (MAP), che è
Più lentamente.
--gapmax
Controlla il --veloce algoritmo di costruzione del modello, ma se --veloce non viene utilizzato,
non ha effetto. Se una colonna ha più di una frazione di simboli di spazio in esso, it
viene assegnato a una colonna di inserimento. è una frequenza da 0 a 1 e per impostazione predefinita
è impostato su 0.5. Valori più alti di significa che più colonne vengono assegnate al consenso,
e i modelli si allungano; valori più piccoli di significa che vengono assegnate meno colonne a
consenso e i modelli diventano più piccoli.
--mano Specificare manualmente l'architettura del modello: il file di allineamento deve essere in SELEX
o Stoccolma, e la riga di annotazione di riferimento (#=RF in SELEX, #=GC RF in
Stoccolma) viene utilizzato per specificare l'architettura. Qualsiasi colonna contrassegnata con un non-gap
simbolo (come una 'x', per esempio) è assegnato come colonna di consenso (corrispondenza) in
il modello.
--idlevel
Controlla sia la determinazione del numero di sequenza effettivo che il comportamento di
, il --wblosum opzione di ponderazione. L'allineamento della sequenza è raggruppato per percentuale
identità e il numero di cluster a una soglia di cutoff di è utilizzato per
determinare il numero di sequenza effettivo. Valori più alti di dare più cluster
e numeri di sequenza più efficaci; valori inferiori di dare meno cluster e
numeri di sequenza effettivi inferiori. è una frazione da 0 a 1 e per impostazione predefinita è
impostato a 0.62 (corrispondente al livello di clustering utilizzato nella costruzione del
BLOSUM62 matrice di sostituzione).
--informati
Affermare che l'input file seq è in formato ; non eseguire il formato Babelfish
autodefinizione. Ciò aumenta in qualche modo l'affidabilità del programma, perché il
Babelfish può commettere errori; particolarmente indicato per incustoditi, ad alta
esecuzioni di rendimento di HMMER. Le stringhe di formato valide includono FASTA, GENBANK, EMBL, GCG,
PIR, STOCCOLMA, SELEX, MSF, CLUSTAL e PHYLIP. Vedere la Guida per l'utente per a
elenco completo.
--noeff
Disattiva il calcolo del numero di sequenza effettivo e usa il vero numero di
sequenze invece. Questo di solito ridurrà la sensibilità del modello finale (quindi
non farlo senza una buona ragione!)
--nucleico
Forza l'allineamento da interpretare come sequenza di acido nucleico, RNA o DNA.
Normalmente HMMER rileva automaticamente se l'allineamento è proteico o DNA, ma a volte
gli allineamenti sono così piccoli che il rilevamento automatico è ambiguo. Vedere --ammino.
--nullo
Leggi un modello nullo da . L'impostazione predefinita per le proteine è utilizzare l'amminoacido medio
frequenze da Swissprot 34 e p1 = 350/351; per l'acido nucleico, l'impostazione predefinita è
usa 0.25 per ogni base e p1 = 1000/1001. Per la documentazione del formato del
file modello null e ulteriori spiegazioni su come viene utilizzato il modello null, vedere il
Guida dell'utente.
--pam
Applicare un PAM euristico (matrice di sostituzione) basato prima sull'emissione della corrispondenza
probabilità invece della miscela predefinita Dirichlet. La matrice di sostituzione è
leggi da . See --pamwgt.
La transizione di stato di Dirichlet predefinita e la priorità di emissione dell'inserto sono
inalterato. Quindi in linea di principio potresti combinare --prima con --pam ma questo
non è raccomandato, in quanto non è stato testato. ( --pam di per sé non è stato testato
tanto!)
--pamwgt
Controlla il peso su un precedente basato su PAM. Ha effetto solo se --pam l'opzione è anche
in uso. è un numero reale positivo, 20.0 per impostazione predefinita. è il numero di
"pseudoconti" contribuito dal priore euristico. Valori molto alti di può
forzare un sistema di punteggio che è interamente guidato dalla matrice di sostituzione, rendendo
HMMER profili di Gribskov alquanto approssimativi.
--pbswitch
Per allineamenti con un numero molto elevato di sequenze, GSC, BLOSUM e Voronoi
gli schemi di ponderazione sono lenti; sono O(N^2) per N sequenze. Henikoff basato sulla posizione
i pesi (pesi PB) sono più efficienti. In corrispondenza o al di sopra di una determinata sequenza di soglia
numero hmm2build passerà dai pesi GSC, BLOSUM o Voronoi a PB
pesi. Per disabilitare questo comportamento di commutazione (al costo del tempo di calcolo, impostare
essere qualcosa di più grande del numero di sequenze nel tuo allineamento. è un
intero positivo; il valore predefinito è 1000.
--prima
Leggi un Dirichlet prima di , sostituendo la miscela predefinita Dirichlet. Il
formato dei file precedenti è documentato nella Guida per l'utente e un esempio è fornito in
la directory Demos della distribuzione HMMER.
--Swentry
Controlla la probabilità totale distribuita alle voci locali nel modello,
rispetto all'inizio dall'inizio del modello come in un allineamento globale. è un
probabilità da 0 a 1 e per impostazione predefinita è impostata su 0.5. Valori più alti di significare
che i colpi che sono frammenti sul lato sinistro (N o 5'-terminale) saranno
penalizzati di meno, ma gli allineamenti globali completi saranno penalizzati di più. Inferiore
valori di significa che i frammenti a sinistra saranno maggiormente penalizzati e globali
saranno favoriti gli allineamenti su questo lato. Questa opzione ha effetto solo su
configurazioni che consentono allineamenti locali, ad es -s e -F; a meno che uno di questi
opzioni è anche attivata, questa opzione non ha effetto. Hai un controllo indipendente
sul comportamento di allineamento locale/globale per i terminali N/C (5'/3') del tuo obiettivo
sequenze usando --Swentry e --swexit.
--swexit
Controlla la probabilità totale distribuita alle uscite locali dal modello,
rispetto alla fine di un allineamento alla fine del modello come in un allineamento globale.
è una probabilità da 0 a 1 e per impostazione predefinita è impostata su 0.5. Valori più alti di
significa che i colpi che sono frammenti sul lato destro (C o 3'-terminale) saranno
penalizzati di meno, ma gli allineamenti globali completi saranno penalizzati di più. Inferiore
valori di significa che i frammenti a destra saranno maggiormente penalizzati e globali
saranno favoriti gli allineamenti su questo lato. Questa opzione ha effetto solo su
configurazioni che consentono allineamenti locali, ad es -s e -F; a meno che uno di questi
opzioni è anche attivata, questa opzione non ha effetto. Hai un controllo indipendente
sul comportamento di allineamento locale/globale per i terminali N/C (5'/3') del tuo obiettivo
sequenze usando --Swentry e --swexit.
--verboso
Stampa più cose possibilmente utili, come i punteggi individuali per ogni sequenza
nell'allineamento.
--wblosum
Utilizzare l'algoritmo di filtraggio BLOSUM per pesare le sequenze, invece del valore predefinito.
Raggruppa le sequenze a una data identità percentuale (vedi --idlevel); assegnare ciascuno
cluster un peso totale di 1.0, distribuito equamente tra i membri di quello
grappolo.
--wgsc Utilizzare l'algoritmo di ponderazione della sequenza ad hoc di Gerstein/Sonnhammer/Chothia. Questo è
già l'impostazione predefinita, quindi questa opzione non ha effetto (a meno che non segua un'altra opzione
nella famiglia -\-w, nel qual caso lo sovrascrive).
--wme Usa l'algoritmo di massima entropia di Krogh/Mitchison per "pesare" le sequenze. Questo
sostituisce l'algoritmo di discriminazione massima Eddy/Mitchison/Durbin, che dà
pesi quasi identici ma è meno robusto. La ponderazione ME sembra dare un margine marginale
aumento della sensibilità rispetto ai pesi GSC predefiniti, ma richiede una discreta quantità di
tempo.
--wnone
Disattiva tutta la ponderazione della sequenza.
--wpb Utilizzare lo schema di ponderazione basato sulla posizione di Henikoff.
--wvoronoi
Utilizzare l'algoritmo di ponderazione della sequenza di Sibbald/Argos Voronoi al posto di quello predefinito
ponderazione dell'SGC.
Usa hmm2build online utilizzando i servizi onworks.net