Este é o comando formatdb que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
formatdb - formato de banco de dados de proteínas ou nucleotídeos para BLAST
SINOPSE
formatodb [-] [-B nome do arquivo] [-F nome do arquivo] [-L nome do arquivo] [-T nome do arquivo] [-V] [-a] [-b] [-e]
[-i nome do arquivo] [-l nome do arquivo] [-n str] [-o] [-p F] [-s] [-t str] [-v N]
DESCRIÇÃO
formatodb deve ser usado para formatar bancos de dados de fonte de proteína ou nucleotídeo antes
esses bancos de dados podem ser pesquisados por blastall, blastpgp ou MegaBLAST. O banco de dados de origem
pode estar no formato FASTA ou ASN.1. Embora o formato FASTA seja mais frequentemente usado como
entrada para formatodb, o uso de ASN.1 é vantajoso para aqueles que estão usando ASN.1 como o
fonte comum para outros formatos, como o relatório do GenBank. Uma vez que um arquivo de banco de dados de origem
foi formatado por formatodb não é necessário para o BLAST. Por favor, note que se você for
vai aplicar atualizações periódicas em seus bancos de dados BLAST usando fundir(1), você precisará
mantenha o arquivo de banco de dados de origem.
OPÇÕES
Um resumo das opções está incluído abaixo.
- Imprimir mensagem de uso
-B nome do arquivo
Gifile binário produzido a partir do Gifile especificado por -F. Esta opção especifica o
nome de um arquivo de lista GI binário. Esta opção deve ser usada com o -F opção. UMA
lista GI de texto pode ser especificada com o -F opção e -B opção irá produzir
essa lista GI em formato binário. O arquivo binário é menor e o BLAST não precisa
para convertê-lo, para que possa ser lido mais rapidamente.
-F nome do arquivo
Gifile (arquivo contendo lista de gi's) para uso com -B or -L
-L nome do arquivo
Crie um arquivo de alias chamado nome do arquivo, limitando as sequências pesquisadas àquelas
especificado por -F.
-T nome do arquivo
Defina os IDs de taxonomia nas definições ASN.1 de acordo com a tabela em nome do arquivo.
-V Detalhado: verifique se há ids de string não exclusivos no banco de dados
-a O arquivo de entrada é o banco de dados no formato ASN.1 (caso contrário, FASTA é esperado)
-b O banco de dados ASN.1 é binário (em oposição ao texto ASCII)
-e A entrada é uma entrada Seq. Um banco de dados ASN.1 de origem (texto ascii ou binário) pode
conter um conjunto Bioseq ou apenas um Bioseq. No último caso -e deve ser fornecido.
-i nome do arquivo
Arquivo (s) de entrada para formatação
-l nome do arquivo
Nome do arquivo de log (padrão = formatodb.log)
-n str Nome de base para arquivos BLAST (o padrão é o nome do arquivo FASTA original)
-o Analise SeqID e crie índices. Se o banco de dados de origem estiver no formato FASTA, o
identificadores de banco de dados na linha de definição FASTA devem seguir as convenções de
o FASTA Defline Format.
-p F A entrada é um nucleotídeo, não uma proteína.
-s Indexar apenas por acesso, não por locus. Isso é especialmente útil para conjuntos de sequência
como os ESTs em que os nomes de acesso e locus são idênticos. Formatdb roda
mais rápido e produz arquivos temporários menores se esta opção for usada. É fortemente
recomendado para EST's, STS's, GSS's e HTGS's.
-t str Título para o arquivo de banco de dados [String]
-v N Divida grandes arquivos FASTA em `volumes 'de tamanho N milhões de cartas (4000 por
predefinição). Como parte da criação de um volume, formatodb escreve um novo tipo de BLAST
arquivo de banco de dados, chamado de arquivo alias, com a extensão `nal 'ou` pal'.
Use formatdb online usando serviços onworks.net