Este é o comando anfo-tool que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
anfo-tool - processa arquivos binários ANFO nativos
SINOPSE
anfo-ferramenta [ opção | de cinto de segurança ... ]
DESCRIÇÃO
anfo-ferramenta é usado para filtrar, processar e converter os arquivos criados por anfo. Cada padrão
na linha de comando é expandido como curinga, então para cada arquivo de entrada (ou o padrão
entrada, se nenhum padrão for fornecido), anfo-ferramenta constrói uma cadeia de filtros de entrada e depois mescla
esses fluxos de entrada de várias maneiras, divide o resultado em vários fluxos de saída
fluxos, cada um dos quais pode ter uma cadeia de filtro de saída aplicada.
OPÇÕES
Geral Opções
Estas opções aplicam-se globalmente e modificam o comportamento de todo o programa. Eles podem ser
colocado em qualquer lugar na linha de comando.
-V, --versão
Imprime o número da versão e sai.
-q, --quieto
Suprima todas as saídas, exceto mensagens de erro fatal.
-v, --verboso
Produzir mais resultados, incluindo indicadores de progresso para a maioria das operações.
--depurar
Produza saída de depuração além de informações de progresso.
-n, --execução a seco
Analise a linha de comando, opcionalmente imprima uma descrição das operações pretendidas e, em seguida,
Saída.
--vmemX
Limite a memória virtual a X megabytes. Se a memória acabar, anfo-ferramenta tenta libertar
acumule memória esquecendo arquivos grandes, por ex. genomas. Utilize esta opção para evitar
condições de troca ou falta de memória quando as operações envolvem grandes ou múltiplas
genomas.
Configuração parâmetros
Um parâmetro pode ser definido diversas vezes na linha de comando e substituirá os parâmetros anteriores.
configurações. Qualquer opção de filtro que necessite de um parâmetro pega a última definição que
apareceu antes da opção de filtro.
--set-inclinação S
Defina o parâmetro de inclinação como S. O declive é usado junto com o interceptar onde
filtros se aplicam às pontuações de alinhamento; alinhamentos com pontuação não pior do que declive * (comprimento
- interceptar) são considerados bons. O padrão é 7.5.
--set-intercept L
Defina o parâmetro de interceptação como L. O interceptar é usado junto com o declive
onde os filtros se aplicam às pontuações de alinhamento; alinhamentos com pontuação não pior do que declive *
(comprimento - interceptar) são considerados bons. O padrão é 20.
--set-contexto C
Defina o parâmetro de contexto como C. O contexto é o número de bases vizinhas de
a referência incluída ao imprimir alinhamentos em formato de texto. O padrão é 0.
--set-genoma G
Defina o parâmetro genoma como G. Muitos filtros considerarão apenas os melhores alinhamentos
para este genoma específico se estiver definido. Se nenhum genoma for definido, o melhor
alinhamento é usado.
--clear-genoma
Limpe o parâmetro genoma. Os filtros se aplicam ao melhor alinhamento global
depois.
filtros Opções
Os filtros podem ser aplicados antes de mesclar as entradas ou após dividir o backup.
-s, --sort-pos=n
Classifique por posição de alinhamento enquanto armazena em buffer não mais que n MiB na memória. Se um
genoma é definido, alinhamentos para esse genoma são usados.
-S, --sort-nome=n
Classifique por nome de leitura enquanto armazena em buffer não mais que n MiB na memória.
-l, --comprimento do filtro=L
Retenha os alinhamentos apenas para leituras de pelo menos L comprimento das bases. As próprias leituras
são mantidos.
-f, --filter-pontuação
Retenha os alinhamentos apenas se a pontuação deles for boa o suficiente. Usodecliveeinterceptar.
--filter-mapq=Q
Remova alinhamentos com qualidade de mapeamento abaixo Q.
-h, --filter-hit=SEQ
Mantenha apenas leituras que tenham uma ocorrência em uma sequência chamada SEQ. Se SEQ está vazio, lê
são mantidos caso tenham algum acerto. Se o genoma parâmetro está definido, apenas atinge esse
contagem do genoma.
--delete-hit=SEQ
Excluir alinhamentos para SEQ. Se SEQ estiver vazio, todos os alinhamentos serão excluídos. Se o
genoma parâmetro é definido, apenas os alinhamentos para esse genoma são excluídos.
--filtro-qual=Q
Mascare bases com qualidade abaixo Q. Essa base é substituída pela N ambiguidade
código.
--multiplicidade=N
Mantenha apenas leituras de moléculas que foram sequenciadas pelo menos N vezes. As leituras são
considerados provenientes da mesma molécula original se suas coordenadas alinhadas forem
idêntico.
--subamostra=F
Subamostrar uma fração F dos resultados. Cada leitura é independente e aleatória
escolhido para ser mantido ou não.
--inside-regions=ARQUIVO
Leia uma lista de regiões de ARQUIVO, então mantenha apenas os alinhamentos que se sobrepõem a um
região anotada.
--outside-regions=ARQUIVO
Leia uma lista de regiões de ARQUIVO, então mantenha apenas alinhamentos que não se sobreponham a um
região anotada.
Destaque Filtros
-d, --rmdup=Q
Remova duplicatas de PCR, fixe os índices de qualidade para Q. Duas leituras são consideradas
duplicatas, se suas coordenadas alinhadas forem idênticas. Se um genoma está definido, o
o melhor alinhamento com esse genoma é usado, caso contrário, o melhor alinhamento global. Ambos
os alinhamentos devem ser bons, conforme determinado por decliveeinterceptar. Para um conjunto de
duplicatas, um consenso é chamado, geralmente aumentando os índices de qualidade. Se um
o índice de qualidade resultante excede Q, está definido para Q. Este filtro requer a entrada
para ser classificado por coordenada de alinhamento no selecionado genoma.
--duct-tape=NOME Alinhamentos sobrepostos com fita adesiva em contigs e chamada de consenso
para eles. Se um genoma é definido, alinhamentos para esse genoma são usados, caso contrário, o
melhores alinhamentos globalmente. Este filtro requer que a entrada seja classificada por alinhamento
coordenadas no genoma. A saída é um conjunto de contigs, cada posição é atribuída
uma base de consenso, um índice de qualidade e probabilidades para cada dialelo possível. (Isto
é chamada de fita adesiva porque parece uma montagem, mas não é nem de longe
como sólido.)
--edit-header=ED
Invocar o editor ED na representação de texto do cabeçalho do stream. Isso pode ser
usado para limpar cabeçalhos que acumularam muito lixo.
Mesclando Filtros
Exatamente um filtro de mesclagem deve ser fornecido na linha de comando, todas as opções de filtro
que ocorrem antes disso fazem parte das cadeias de filtros de entrada, todos os filtros adicionais se tornam
cadeias de saída. Se nenhum filtro de mesclagem for fornecido, --concatenar é assumido, e todos os filtros são
filtros de entrada.
-c, --concat
Concatene todos os fluxos de entrada na ordem em que aparecem na linha de comando.
-m, --mesclar
Mesclar fluxos de entrada classificados, produzindo um resultado classificado. Todas as entradas devem ser classificadas
do mesmo jeito.
-j, --juntar
Junte fluxos de entrada e retenha os melhores resultados de cada genoma. Cada entrada
stream deve conter um registro para cada leitura, as leituras são armazenadas em buffer na memória até que todas
de seus sucessos são coletados. Dessa forma, a união funciona bem se todas as entradas estiverem quase
na mesma ordem. Se faltarem leituras em alguns fluxos, juntá-los será um desperdício
memória.
--mega-mesclar
Mesclar muitos fluxos, como aqueles produzidos pela execução anfo-sge. Transmite isso
operados nas mesmas leituras são unidas e tudo é mesclado.
saída Opções
Se uma opção de saída for fornecida na linha de comando, a cadeia de filtro de saída atual será encerrada
e um novo é iniciado. Se nenhuma opção de saída for fornecida, uma representação textual do
o fluxo final é gravado em stdout. Todas as opções de saída aceitam - para escrever em stdout.
-o, --arquivo de saída
Escreva o fluxo binário nativo (uma mensagem protobuf compactada) para ARQUIVO. Escrevendo um
fluxo binário e lê-lo novamente sem perdas.
--arquivo de texto de saída
Escreva o fluxo de texto protobuf para ARQUIVO. Se os genomas necessários estiverem disponíveis, um
a representação textual dos alinhamentos está incluída. Se o contexto parâmetro é
conjunto, que muitas bases adicionais da referência a montante e a jusante do
alinhamento estão incluídos.
--output-sam=ARQUIVO
Escreva alinhamentos no formato SAM para ARQUIVO.
--output-glz ARQUIVO
Escreva contigs no formato GLZ 0.9 para ARQUIVO. A geração do GLZ só funciona depois
aplicação --fita adesiva, todo contigs se torna um registro GLZ.
--output-3aln ARQUIVO
Escreva contigs em um formato baseado em tabela para ARQUIVO. O formato ainda está sujeito a
alteração, consulte o código-fonte para obter documentação detalhada.
--output-fasta ARQUIVO
Escreva alinhamentos(!) no formato FastA para ARQUIVO. Os alinhamentos são escritos como pares de
sequência de referência e consulta, as coordenadas alinhadas são indicadas na descrição
da sequência de consulta. Se o contexto parâmetro está definido, que muitas bases adicionais
da referência a montante e a jusante do alinhamento estão incluídos. Esse
formato não é sugerido para uso sério, ele existe para suportar legado
aplicações.
--output-fastq ARQUIVO
Escreva sequências (!) no formato FastQ para ARQUIVO. Escrevendo FastQ de forma eficaz
reconstitui a entrada para ANFO se nenhuma filtragem foi feita nos resultados.
--arquivo de tabela de saída
Escreva estatísticas por alinhamento para ARQUIVO. O arquivo possui três colunas: sequência
comprimento, pontuação de alinhamento, diferença para o próximo melhor alinhamento. É útil principalmente para
analisar/visualizar a distribuição das pontuações de alinhamento.
--stats ARQUIVO
Escreva estatísticas simples para ARQUIVO. Isso resulta em algumas estatísticas resumidas simples de
um fluxo inteiro: número de sequências alinhadas, comprimento médio, conteúdo de GC.
MEIO AMBIENTE
ANFO_PATH
Lista separada por dois pontos de diretórios pesquisados por genoma e arquivos de índice.
ANFO_TEMP
Espaço temporário usado para classificação de arquivos grandes.
Use a ferramenta anfo online usando os serviços onworks.net