Questo è il comando sreformat che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
sreformat - converte il file di sequenza in un formato diverso
SINOSSI
riformattare [opzioni] formato file seq
DESCRIZIONE
riformattare legge il file di sequenza file seq in qualsiasi formato supportato, lo riformatta in un nuovo
formato specificato da formato, quindi stampa il testo riformattato.
I formati di input supportati includono (ma non sono limitati a) i formati non allineati FASTA,
Genbank, EMBL, SWISS-PROT, PIR e GCG e i formati allineati Stockholm, Clustal, GCG
MSF e Philip.
I codici di formato file di output non allineati disponibili includono veloce (formato FASTA); emblema
(formato EMBL/SWISSPROT); banca gen (formato Genbank); gcc (formato sequenza singola GCG);
gcgdata (formato database flatfile GCG); pir (formato flatfile PIR/CODATA); crudo (crudo
sequenza, nessun'altra informazione).
I codici di formato file di output allineati disponibili includono Stoccolma (formato PFAM/Stoccolma);
msf (formato GCG MSF); a2m (un formato FASTA allineato); FILIPPO (formato PHYLIP di Felsenstein);
e cluster (Formato Clustal V/W/X); e sesso (il vecchio SELEX/HMMER/Pfam annotava
formato di allineamento);
Tutti e tre i codici vengono interpretati senza distinzione tra maiuscole e minuscole (ad es. MSF, Msf o msf funzionano tutti).
I file di formato non allineato non possono essere riformattati in formati allineati. Tuttavia, formati allineati
possono essere riformattati in formati non allineati: i caratteri gap vengono semplicemente eliminati.
Questo programma è stato originariamente chiamato riformattare, ma quel nome cozza con un programma GCG di
lo stesso nome.
VERSIONI
-d DNA; convertire U in T, per assicurarsi che una sequenza di acido nucleico sia mostrata come DNA not
RNA. Vedere -R.
-h Stampa breve guida; include il numero di versione e il riepilogo di tutte le opzioni, incluso
opzioni per esperti.
-l Minuscolo; convertire tutti i residui di sequenza in minuscolo. Vedere -In.
-n Per le sequenze DNA/RNA, converte qualsiasi carattere che non sia RNA/DNA non ambiguo (es
ACGTU/acgtu) in una N. Utilizzato per convertire i codici di ambiguità IUPAC in N, per il software
che non può gestire tutti i codici IUPAC (ad esempio alcuni codici pieghevoli dell'RNA pubblico). Se
il file è un allineamento, anche i caratteri gap vengono lasciati invariati. Se le sequenze sono
non sequenze di acidi nucleici, questa opzione corromperà i dati in modo prevedibile
moda.
-r RNA; convertire T in U, per assicurarsi che una sequenza di acido nucleico sia mostrata come RNA not
DNA. Vedere -D.
-u Maiuscolo; convertire tutti i residui di sequenza in maiuscolo. Vedere -l.
-x Per le sequenze di DNA, convertire i caratteri non IUPAC (come X) in N. Questo è per
compatibilità con le persone ottenebrate che insistono nell'usare X invece di IUPAC
carattere di ambiguità N. (X sta per ambiguità in un residuo amminoacidico).
Attenzione: come il -n opzione, il codice non verifica che lo stai effettivamente dando
DNA. Semplicemente converte letteralmente i simboli del DNA non IUPAC in N. Quindi, se tu
dargli accidentalmente una sequenza proteica, convertirà felicemente la maggior parte di ogni amino
residuo acido ad un N.
EXPERT VERSIONI
--gapsym
Converti tutti i caratteri gap in . Utilizzato per preparare file di allineamento per i programmi
con requisiti rigorosi per i simboli di gap. Ha senso solo se l'input file seq is
un allineamento.
--informati
Specificare che il file di sequenza è in formato , invece di consentire il programma
per rilevare automaticamente il formato del file. Esempi comuni includono Genbank, EMBL, GCG, PIR,
Stoccolma, Clustal, MSF o PHYLIP; vedere la documentazione stampata per una completa
elenco di nomi di formati accettati.
--mingap
If file seq è un allineamento, rimuovere tutte le colonne che contengono caratteri di spazio al 100%,
minimizzando la lunghezza complessiva dell'allineamento. (Spesso utile se hai estratto
un sottoinsieme di sequenze allineate da un allineamento più ampio.)
--nogap
Rimuovi tutte le colonne allineate che contengono simboli di spazio vuoto. Utile come preludio
alle analisi filogenetiche, dove si desidera analizzare solo colonne contenenti il 100%
residui, quindi si desidera eliminare tutte le colonne con spazi vuoti. Ha solo senso
se il file è un file di allineamento.
--pfam Solo per il formato di output dell'allineamento SELEX, inserisci l'intero allineamento in un blocco
(non avvolgere in più blocchi). Questo è vicino al formato utilizzato internamente da
Pfam a Stoccolma e Cambridge.
--sam Prova a convertire i caratteri gap nello stile UC Santa Cruz SAM, dove un . significa una lacuna in
una colonna di inserimento e un - indica una cancellazione in una colonna consenso/corrispondenza. Solo questo
funziona per convertire formati di file allineati e solo se l'allineamento è già presente
aderisce alla convenzione SAM delle maiuscole per i residui in consenso/corrispondenza
colonne e minuscole per i residui nelle colonne di inserimento. Questo è vero, ad esempio,
di tutti gli allineamenti prodotti dalle vecchie versioni di HMMER. (HMMER2 produce allineamenti
che aderiscono alle convenzioni di SAM anche nella scelta del carattere gap.) Questa opzione era
aggiunto per consentire la riformattazione degli allineamenti Pfam in qualcosa di più adatto per
costruzione del profilo HMM utilizzando il software UCSC SAM.
--samfrac
Prova a convertire i caratteri del gap di allineamento e i casi residui in UC Santa Cruz SAM
stile, dove a. indica uno spazio vuoto in una colonna di inserimento e a - indica una cancellazione in a
colonna consenso/corrispondenza e maiuscole significa residui di corrispondenza/consenso e inferiore
caso significa residui inseriti. Funziona solo per convertire file allineati
formati, ma a differenza del --sam opzione, funzionerà indipendentemente dal fatto che il file
aderisce alla convenzione del residuo maiuscolo/minuscolo. Invece, qualsiasi colonna contenente
più di una frazione di caratteri gap viene interpretato come una colonna di inserimento e
tutte le altre colonne vengono interpretate come colonne di corrispondenza. Questa opzione è stata aggiunta per consentire
Allineamenti Pfam da riformattare in qualcosa di più adatto al profilo HMM
costruzione utilizzando il software UCSC SAM.
--wussificare
Converti le stringhe di annotazione della struttura secondaria dell'RNA (sia di consenso che individuali)
dal vecchio formato "KHS", ><, alla nuova notazione WUSS, <>. Se la notazione è già
in formato WUSS, questa opzione lo rovinerà, senza preavviso. Solo SELEX e
I file in formato Stoccolma hanno attualmente un markup di struttura secondaria.
--rugiada
Converti le stringhe di annotazione della struttura secondaria dell'RNA dalla nuova notazione WUSS, <>,
torna al vecchio formato KHS, ><. Se l'annotazione è già in KHS, questa opzione
lo corromperà, senza preavviso. Solo i file in formato SELEX e Stockholm hanno
marcatura della struttura secondaria.
Usa sreformat online utilizzando i servizi onworks.net