EnglishFranceseSpagnolo

Favicon di OnWorks

sigma - Online nel cloud

Esegui sigma nel provider di hosting gratuito OnWorks su Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

Questo è il comando sigma che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

PROGRAMMA:

NOME


sigma - Semplice allineamento multiplo greedy di sequenze di DNA non codificanti

SINOSSI


sigma [opzioni] [file di input.fasta] [inputfile2.fasta ...]

Ogni file fasta può contenere una singola sequenza o più sequenze; tutte le sequenze saranno
allineati insieme.

DESCRIZIONE


Sigma ("Semplice allineamento multiplo avido") è un programma di allineamento con un nuovo algoritmo
e schema di punteggio progettato specificamente per la sequenza di DNA non codificante. Usa una strategia
di cercare i migliori allineamenti locali gapless possibili, ad ogni passo facendo il meglio
possibile allineamento coerente con gli allineamenti esistenti e valuta il significato del
allineamento in base alle lunghezze dei frammenti allineati e un modello di sfondo che può
essere fornito o stimato da un file ausiliario di DNA intergenico. Con dati reali, mentre
la "correttezza" non può essere quantificata direttamente per l'allineamento, eseguendo il motivo PhyloGibbs
finder sulla sequenza pre-allineata suggerisce che gli allineamenti di Sigma sono superiori.

VERSIONI


-A --aligned_output
Output allineato e ben stampato (confronta con -F opzione) (predefinito: solo questo). Guarda anche
-C.

-b --bgprobfile Nome del file
File ausiliario (in formato fasta) da cui leggere le sequenze di sfondo (sovrascritte da
-B). In genere questo è un file contenente grandi quantità di non codifica simili
sequenza, da cui possono essere le probabilità di fondo di singoli e di-nucleotidi
stimato.

-B --bgseqfile Nome del file
File contenente le probabilità di fondo. Il formato è descritto più avanti.

-C --solo_caps
Utilizzare solo lettere maiuscole nella sequenza di output, per compatibilità con l'output di alcuni
altri programmi come ClustalW e MLagan. Per impostazione predefinita, l'output è misto (come in
Diallinea) e le basi minuscole vengono considerate non allineate.

-F --fast_output
Uscita multi-fasta (può usare entrambi -A e a -F in entrambi gli ordini). Guarda anche -C.

-n --non corretto numero
Correlazione in background (impostazione predefinita 2=dinucleotide; 1=conteggi di base di un singolo sito, 0=0.25 per
base).

-x, --significato numero
Imposta il limite per la probabilità che la corrispondenza sia casuale (predefinito 0.002, più piccolo=più
stringente).

-h, --Aiuto
Visualizza questo elenco di opzioni.

ALTRO AIUTO


Il parametro "significativo" (-x) determina se gli allineamenti locali sono accettati o
respinto. L'impostazione predefinita al momento è 0.002. Esperimenti su dati sintetici (descritti nel
paper) suggeriscono che 0.002 è circa la soglia in cui sigma non riesce ad allinearsi
dati filogeneticamente non correlati che hanno una correlazione dinucleotidica moderata (simile al lievito).

L'utilizzo di un "modello di sfondo" appropriato alle sequenze da allineare riduce notevolmente
allineamenti spuri su dati sintetici (e, si spera, anche su dati reali). Il modo più semplice
per garantire questo è quello di fornire, tramite il -b parametro, un file in formato FASTA contenente grandi
quantità di dati di sequenza simili (ad esempio, se si stanno allineando sequenze di lievito, fornire un file
contenente tutta la sequenza intergenica del lievito).

Invece, se le frequenze del singolo sito e dei dinucleotidi sono già note, esse
può essere fornito in un file tramite il -B opzione. Il formato del file dovrebbe essere: una voce per
linea, con il mononucleotide o dinucleotide (insensibile alle maiuscole) seguito dal
frequenza. (ad esempio, "A 0.3", "AT 0.16", ecc. su righe successive.) Un file di esempio si trova nel
Sottodirectory "Background" della distribuzione dei sorgenti (su sistemi Debian, questo file può essere
trovato nel /usr/share/doc/sigma-align/Sfondo rubrica). Un file come
"yeast.nc.3.freq" nella sottodirectory "tests" della distribuzione dei sorgenti MEME funziona bene
(i conteggi dei trinucleotidi vengono ignorati).

RIFERIMENTO


Si prega di citare Sigma: Rahul Siddharthan (2006) Allineamento multiplo di debolmente conservati
sequenza di DNA non codificante BMC Bioinformatics 2006, 7:143 doi:10.1186/1471-2105-7-143
Pubblicato il 16 marzo 2006, disponibile online su http://www.biomedcentral.com/1471-2105/7/143/

AUTORI


Rahul Siddharta <[email protected]>
Ha scritto sigma. Se stai usando Sigma per ricerche vere, per favore informa l'autore così
che può avvisarti di bugfix o nuove versioni.

Charles Plessy <[email protected]>
Ha scritto la manpage in DocBook XML per la distribuzione Debian.

COPYRIGHT


Copyright © 2006-2007 Rahul Siddharthan
Copyright © 2006-2007 Charles Plessy

Sigma è un software gratuito. Puoi ridistribuirlo e/o modificarlo secondo i termini del
GNU General Public License come pubblicato dalla Free Software Foundation.

Sui sistemi Debian, il testo completo della GNU General Public License può essere trovato in
/usr/share/licenze-comuni/GPL.

Usa sigma online utilizzando i servizi onworks.net


Server e workstation gratuiti

Scarica app per Windows e Linux

Comandi Linux

Ad