Este es el comando sigma que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
sigma: alineación múltiple simple y codiciosa de secuencias de ADN no codificantes
SINOPSIS
sigma [opciones] [archivo de entrada.fasta] [archivo de entrada2.fasta ...]
Cada archivo fasta puede contener una sola secuencia o múltiples secuencias; todas las secuencias serán
alineados juntos.
DESCRIPCIÓN
Sigma ("Alineación múltiple codiciosa simple") es un programa de alineación con un nuevo algoritmo
y esquema de puntuación diseñado específicamente para secuencias de ADN no codificantes. Usa una estrategia
de buscar las mejores alineaciones locales sin espacios posibles, en cada paso haciendo el mejor
posible alineación consistente con alineaciones existentes, y puntúa la importancia de la
alineación basada en las longitudes de los fragmentos alineados y un modelo de fondo que puede
suministrarse o estimarse a partir de un archivo auxiliar de ADN intergénico. Con datos reales, mientras
la "corrección" no se puede cuantificar directamente para la alineación, ejecutando el motivo PhyloGibbs
El buscador en la secuencia prealineada sugiere que las alineaciones de Sigma son superiores.
OPCIONES
-A --salida_alineada
Salida alineada, bonita impresa (comparar con -F opción) (predeterminado: solo esto). Ver también
-C.
-b --bgprofile nombre de archivo
Archivo auxiliar (en formato fasta) desde el cual leer secuencias de fondo (anulado por
-B). Por lo general, este es un archivo que contiene grandes cantidades de archivos no codificados similares.
secuencia, a partir de la cual las probabilidades de fondo de nucleótidos simples y di-nucleótidos pueden ser
estimado.
-B --bgseqfile nombre de archivo
Archivo que contiene probabilidades de fondo. El formato se describe más adelante.
-C --caps_only
Utilice solo letras mayúsculas en la secuencia de salida, para compatibilidad con la salida de algunos
otros programas como ClustalW y MLagan. De forma predeterminada, la salida es de mayúsculas y minúsculas (como en
Dialign) y las bases en minúsculas se tratan como no alineadas.
-F --fasta_salida
Salida multi-fasta (puede usar ambos -A y -F en cualquier orden). Ver también -C.
-n --ncorrel número
Correlación de fondo (predeterminado 2= dinucleótido; 1= recuentos base de un solo sitio, 0= 0.25 por
base).
-x, --significado número
Establezca un límite de probabilidad de coincidencia por azar (predeterminado 0.002, menor = más
riguroso).
-h, --ayuda
Muestra esta lista de opciones.
MÁS AYUDA
El parámetro "significado" (-x) determina si se aceptan alineaciones locales o
rechazado. El valor predeterminado en la actualidad es 0.002. Experimentos con datos sintéticos (descritos en el
paper) sugieren que 0.002 es aproximadamente el umbral donde sigma no se alinea
Datos no relacionados filogenéticamente que tienen una correlación de dinucleótidos moderada (similar a una levadura).
El uso de un "modelo de fondo" apropiado para las secuencias que se alinean reduce en gran medida
alineaciones espurias en datos sintéticos (y, se espera, también en datos reales). La forma mas sencilla
para asegurar que esto es para suministrar, a través de la -b parámetro, un archivo en formato FASTA que contiene grandes
cantidades de datos de secuencia similares (por ejemplo, si uno está alineando secuencias de levadura, proporcione un archivo
que contiene toda la secuencia de levadura intergénica).
En lugar de esto, si ya se conocen las frecuencias de un solo sitio y de dinucleótidos,
puede suministrarse en un archivo a través del -B opción. El formato de archivo debe ser: una entrada por
línea, con el mononucleótido o dinucleótido (no distingue entre mayúsculas y minúsculas) seguido de la
frecuencia. (por ejemplo, "A 0.3", "AT 0.16", etc. en líneas sucesivas). Hay un archivo de muestra en el
Subdirectorio "Fondo" de la distribución fuente (en los sistemas Debian, este archivo puede ser
encontrado en / usr / share / doc / sigma-align / Fondo directorio). Un archivo como
"yeast.nc.3.freq" en el subdirectorio "tests" de la distribución fuente de MEME funciona bien
(se ignoran los recuentos de trinucleótidos).
REFERENCIA
Por favor, cite Sigma: Rahul Siddharthan (2006) Alineación múltiple de débilmente conservados
secuencia de ADN no codificante BMC Bioinformatics 2006, 7: 143 doi: 10.1186 / 1471-2105-7-143
Publicado el 16 de marzo de 2006, disponible en línea en http://www.biomedcentral.com/1471-2105/7/143/
AUTORES
Rahul Siddhartha <[email protected]>
Escribió sigma. Si está utilizando Sigma para una investigación real, infórmeselo al autor.
que puede avisarle de correcciones de errores o nuevas versiones.
Charles Plessy <[email protected]>
Escribí la página de manual en DocBook XML para la distribución Debian.
DERECHOS DE AUTOR
Copyright © 2006-2007 Rahul Siddharthan
Copyright © 2006-2007 Carlos Plessy
Sigma es software gratuito. Puede redistribuirlo y / o modificarlo bajo los términos de la
Licencia pública general GNU publicada por la Free Software Foundation.
En los sistemas Debian, el texto completo de la Licencia Pública General GNU se puede encontrar en
/ usr / share / common-license / GPL.
Utilice sigma en línea utilizando los servicios de onworks.net