InglésFrancésEspañol

icono de página de OnWorks

sreformat - Online en la nube

Ejecute sreformat en el proveedor de alojamiento gratuito de OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el sreformat de comando que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


sreformat: convierte el archivo de secuencia a un formato diferente

SINOPSIS


reformatear [opciones] formato archivoseq

DESCRIPCIÓN


reformatear lee el archivo de secuencia archivoseq en cualquier formato compatible, lo reformatea en un nuevo
formato especificado por formato, luego imprime el texto reformateado.

Los formatos de entrada admitidos incluyen (pero no se limitan a) los formatos no alineados FASTA,
Genbank, EMBL, SWISS-PROT, PIR y GCG, y los formatos alineados Stockholm, Clustal, GCG
MSF y Phylip.

Los códigos de formato de archivo de salida no alineados disponibles incluyen rápido (Formato FASTA); emblema
(Formato EMBL / SWISSPROT); banco de gen (Formato Genbank); gcg (Formato de secuencia única GCG);
gcgdatos (Formato de base de datos de archivo plano GCG); pir (Formato de archivo plano PIR / CODATA); crudo (crudo
secuencia, ninguna otra información).

Los códigos de formato de archivo de salida alineados disponibles incluyen Estocolmo (Formato PFAM / Estocolmo);
msf (Formato GCG MSF); a2m (un formato FASTA alineado); FELIPE (Formato PHYLIP de Felsenstein);
y grupo (Formato Clustal V / W / X); y selex (el antiguo SELEX / HMMER / Pfam anotado
formato de alineación);

Todos los códigos se interpretan sin distinción entre mayúsculas y minúsculas (por ejemplo, MSF, Msf o msf funcionan todos).

Los archivos de formato no alineado no se pueden reformatear a formatos alineados. Sin embargo, los formatos alineados
se puede reformatear a formatos no alineados; los caracteres de espacio simplemente se eliminan.

Este programa se llamó originalmente reformatear, pero ese nombre choca con un programa de GCG de
el mismo nombre.

OPCIONES


-d ADN; convertir U en T, para asegurarse de que una secuencia de ácido nucleico se muestra como ADN no
ARN. Ver -r.

-h Imprimir ayuda breve; incluye el número de versión y un resumen de todas las opciones, incluyendo
opciones de expertos.

-l Minúscula convertir todos los residuos de secuencia a minúsculas. Ver en.

-n Para las secuencias de ADN / ARN, convierte cualquier carácter que no sea inequívoco ARN / ADN (p. Ej.
ACGTU / acgtu) a N.Se utiliza para convertir códigos de ambigüedad IUPAC en N, para software
que no puede manejar todos los códigos IUPAC (algunos códigos plegables públicos de ARN, por ejemplo). Si
el archivo es una alineación, los caracteres de espacio tampoco se modifican. Si las secuencias son
no secuencias de ácido nucleico, esta opción corromperá los datos de una manera predecible
la moda.

-r ARN; convertir T en U, para asegurarse de que una secuencia de ácido nucleico se muestra como ARN no
ADN. Ver -D.

-u Mayúsculas; convertir todos los residuos de secuencia a mayúsculas. Ver -l.

-x Para las secuencias de ADN, convierta los caracteres que no pertenecen a la IUPAC (como las X) en N. Esto es para
compatibilidad con personas ignorantes que insisten en usar X en lugar de la IUPAC
carácter de ambigüedad N. (X es para ambigüedad en un residuo de aminoácido).

Advertencia: como el -n opción, el código no comprueba si realmente la estás dando
ADN. Simplemente, literalmente, convierte los símbolos de ADN que no son de IUPAC en N.
accidentalmente le da una secuencia de proteínas, felizmente convertirá la mayoría de los aminoácidos
residuo ácido a N.

EXPERTO OPCIONES


--gapsym
Convierta todos los caracteres de espacio a . Se utiliza para preparar archivos de alineación para programas.
con requisitos estrictos para los símbolos de espacios. Solo tiene sentido si la entrada archivoseq is
una alineación.

--informato
Especifique que el archivo de secuencia está en formato , en lugar de permitir que el programa
para detectar automáticamente el formato de archivo. Los ejemplos comunes incluyen Genbank, EMBL, GCG, PIR,
Estocolmo, Clustal, MSF o PHYLIP; consulte la documentación impresa para obtener una
lista de nombres de formato aceptados.

--mingap
If archivoseq es una alineación, elimine las columnas que contengan un 100% de espacios en blanco,
minimizando la longitud total de la alineación. (Suele ser útil si ha extraído
un subconjunto de secuencias alineadas de una alineación más grande).

--ningún espacio
Elimine cualquier columna alineada que contenga algún símbolo de espacio. Útil como preludio
a análisis filogenéticos, donde solo desea analizar columnas que contienen 100%
residuos, por lo que desea eliminar las columnas con espacios en blanco. Solo tiene sentido
si el archivo es un archivo de alineación.

--pfam Solo para el formato de salida de alineación SELEX, coloque toda la alineación en un bloque
(no envuelva en varios bloques). Esto se acerca al formato utilizado internamente por
Pfam en Estocolmo y Cambridge.

--sam Intente convertir caracteres de espacio al estilo UC Santa Cruz SAM, donde a. significa una brecha en
una columna de inserción, y un - significa una eliminación en una columna de consenso / coincidencia. Solo esto
funciona para convertir formatos de archivo alineados, y solo si la alineación ya
se adhiere a la convención SAM de mayúsculas para residuos en consenso / coincidencia
columnas y minúsculas para residuos en columnas de inserción. Esto es cierto, por ejemplo,
de todas las alineaciones producidas por versiones antiguas de HMMER. (HMMER2 produce alineaciones
que se adhieren a las convenciones de SAM incluso en la elección de caracteres de espacio.) Esta opción fue
agregado para permitir que las alineaciones de Pfam se vuelvan a formatear en algo más adecuado para
construcción de perfiles HMM utilizando el software UCSC SAM.

--samfrac
Intente convertir los caracteres de la brecha de alineación y los casos de residuos a UC Santa Cruz SAM
estilo, donde a. significa un espacio en una columna de inserción y un - significa una eliminación en un
columna de consenso / coincidencia, y mayúsculas significa coincidencia / residuos de consenso y minúsculas
caso significa insertado resiudes. Esto solo funcionará para convertir archivos alineados
formatos, pero a diferencia del --sam opción, funcionará independientemente de si el archivo
se adhiere a la convención de residuos de mayúsculas / minúsculas. En cambio, cualquier columna que contenga
más de una fracción de caracteres de espacio se interpreta como una columna de inserción, y
todas las demás columnas se interpretan como columnas coincidentes. Esta opción se agregó para permitir
Las alineaciones de Pfam se reformatearán en algo más adecuado para el perfil HMM
construcción utilizando el software UCSC SAM.

--wussificar
Convertir cadenas de anotaciones de estructura secundaria de ARN (tanto de consenso como individuales)
del antiguo formato "KHS",> <, a la nueva notación WUSS, <>. Si la notación ya está
en formato WUSS, esta opción lo estropeará sin previo aviso. Solo SELEX y
Los archivos de formato de Estocolmo tienen un marcado de estructura secundaria en la actualidad.

--dewuss
Convierta cadenas de anotaciones de estructura secundaria de ARN de la nueva notación WUSS, <>,
de nuevo al antiguo formato KHS,> <. Si la anotación ya está en KHS, esta opción
lo corromperá, sin previo aviso. Solo los archivos de formato SELEX y Stockholm tienen
marcado de estructura secundaria.

Use sreformat en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad