Este é o comando hmmsearch que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS
PROGRAMA:
NOME
hmmsearch - pesquisa de perfil (s) em um banco de dados de sequência
SINOPSE
hummsearch [opções]
DESCRIÇÃO
hummsearch é usado para pesquisar um ou mais perfis em um banco de dados de sequência. Para cada
perfil em , use esse perfil de consulta para pesquisar o banco de dados de sequências de destino em
, e produzir listas classificadas das sequências com as correspondências mais significativas para o
perfil. Para construir perfis a partir de alinhamentos múltiplos, consulte hmm construir.
Ou a consulta ou o alvo pode ser '-' (um caractere de traço), no qual
caso o perfil de consulta ou a entrada do banco de dados de destino serão lidos de um cano ao invés
de um arquivo. Apenas uma fonte de entrada pode passar , não ambos. Uma exceção é
que se o contém mais de uma consulta de perfil, então não pode vir de
, porque não podemos retroceder o banco de dados de destino de streaming para pesquisá-lo com outro
perfil.
O formato de saída é projetado para ser legível por humanos, mas muitas vezes é tão volumoso que
lê-lo é impraticável e analisá-lo é uma dor. o --tbout e --domtblout opções
salve a saída em formatos tabulares simples que são concisos e fáceis de analisar. o -o opção
permite redirecionar a saída principal, incluindo descartá-la em / dev / null.
OPÇÕES
-h Ajuda; imprimir um breve lembrete do uso da linha de comando e todas as opções disponíveis.
OPÇÕES PARA CONTROLANDO SAÍDA
-o Direcione a principal saída legível para um arquivo em vez do stdout padrão.
-A Salve um alinhamento múltiplo de todos os acertos significativos (aqueles que satisfaçam inclusão
limiares) para o arquivo .
--tbout
Salve um arquivo tabular simples (delimitado por espaço) resumindo a saída por destino,
com uma linha de dados por sequência alvo homóloga encontrada.
--domtblout
Salve um arquivo tabular simples (delimitado por espaço) resumindo a saída por domínio,
com uma linha de dados por domínio homólogo detectado em uma sequência de consulta para cada
modelo homólogo.
--acc Use acessos em vez de nomes na saída principal, quando disponível para perfis
e / ou sequências.
--noali
Omita a seção de alinhamento da saída principal. Isso pode reduzir bastante a produção
volume.
--notextw
Ilimite o comprimento de cada linha na saída principal. O padrão é um limite de 120
caracteres por linha, o que ajuda a exibir a saída limpa em terminais e
nos editores, mas pode truncar as linhas de descrição do perfil de destino.
--texto
Defina o limite de comprimento da linha da saída principal para caracteres por linha. O padrão é
120.
OPÇÕES CONTROLANDO RELATÓRIOS LIMIARES
Os limites de relatório controlam quais ocorrências são relatadas nos arquivos de saída (a saída principal,
--tbout e --domtblout) Acessos de sequência e de domínio são classificados por estatísticas
significância (valor E) e a saída é gerada em duas seções chamadas por alvo e por
saída de domínio. Na saída por alvo, por padrão, todos os hits de sequência com um valor E <= 10
são relatados. Na saída por domínio, para cada alvo que passou por alvo
limites de relatório, todos os domínios que atendem aos limites de relatório por domínio são relatados.
Por padrão, esses são domínios com valores E condicionais de <= 10. As seguintes opções
permitem que você altere os limites de relatório de valor E padrão ou use a pontuação de bits
limiares em vez disso.
-E Na saída por destino, relatar sequências de destino com um valor E de <= . O
o padrão é 10.0, o que significa que, em média, cerca de 10 falsos positivos serão relatados
por consulta, para que você possa ver o topo do ruído e decidir por si mesmo se é
muito barulho.
-T Em vez de limitar a saída por perfil no valor E, em vez de relatar a meta
sequências com uma pontuação de bits de> = .
--cúpula
Na saída por domínio, para sequências alvo que já satisfizeram a
limite de relatório de perfil, relatórios de domínios individuais com um valor E condicional
de <= . O padrão é 10.0. Um valor E condicional significa o número esperado
de domínios falsos positivos adicionais no espaço de pesquisa menor daqueles
comparações que já atendiam ao limite de relatório por meta (e, portanto,
deve ter pelo menos um domínio homólogo já).
--domT
Em vez de limitar a saída por domínio no valor E, relate os domínios com um
pontuação de bits de> = .
OPÇÕES PARA INCLUSÃO LIMIARES
Os limites de inclusão são mais rígidos do que os limites de relatório. Controle de limites de inclusão
quais hits são considerados confiáveis o suficiente para serem incluídos em um alinhamento de saída ou um
rodada de pesquisa subsequente ou marcada como significativa ("!") em oposição a questionável ("?")
na saída do domínio.
--incE
Use um valor E de <= como o limite de inclusão por alvo. O padrão é
0.01, o que significa que, em média, cerca de 1 falso positivo seria esperado em cada
100 pesquisas com diferentes sequências de consulta.
--incT
Em vez de usar valores E para definir o limite de inclusão, use um pouco
pontuação de> = como o limite de inclusão por alvo. Por padrão, esta opção é
não definido.
--incdomE
Use um valor E condicional de <= como o limite de inclusão por domínio, em
metas que já satisfizeram o limite geral de inclusão por meta.
O padrão é 0.01.
--incdomT
Em vez de usar valores E, use uma pontuação de bits de> = como a inclusão por domínio
limite.
OPÇÕES PARA ESPECÍFICO DE MODELO PONTO LIMIANDO
Bancos de dados de perfis selecionados podem definir limites de pontuação de bits específicos para cada perfil,
substituindo qualquer limite com base apenas na significância estatística.
Para usar essas opções, o perfil deve conter o apropriado (GA, TC e / ou NC)
anotação opcional de limite de pontuação; isso é pego por hmm construir do formato de Estocolmo
arquivos de alinhamento. Cada opção de limite tem duas pontuações: o limite por sequência
e o limite por domínio Estes agem como se -T --incT --domT
--incdomT foi aplicado especificamente usando os limites selecionados de cada modelo.
--cut_ga
Use as pontuações de bits GA (coleta) no modelo para definir por sequência (GA1) e por
relatório de domínio (GA2) e limites de inclusão. Limiares de GA são geralmente
considerados os limites com curadoria confiáveis que definem a filiação à família; para
Por exemplo, no Pfam, esses limites definem o que é incluído no Pfam Full
alinhamentos baseados em pesquisas com modelos Pfam Seed.
--cut_nc
Use os limites de pontuação de bits NC (corte de ruído) no modelo para definir por sequência
(NC1) e por domínio (NC2) relatórios e limites de inclusão. Limiares NC são
geralmente considerada como a pontuação do falso positivo conhecido de maior pontuação.
--cut_tc
Use os limites de pontuação de bits TC (corte confiável) no modelo para definir por sequência
(TC1) e por domínio (TC2) e limites de inclusão. Limiares de TC são
geralmente considerada como a pontuação da pontuação mais baixa conhecida como verdadeiro positivo que
são, acima de tudo, falsos positivos conhecidos.
OPÇÕES CONTROLANDO A ACELERAÇÃO TUBULAÇÃO
As pesquisas HMMER3 são aceleradas em um pipeline de filtro de três etapas: o filtro MSV, o
Filtro Viterbi e o filtro Forward. O primeiro filtro é o mais rápido e mais
aproximado; o último é o algoritmo de pontuação avançado completo. Também existe um filtro de polarização
passo entre MSV e Viterbi. Metas que passam em todas as etapas do pipeline de aceleração
são então submetidos a pós-processamento - identificação de domínio e pontuação usando o
Algoritmo para frente / para trás.
Alterar os limites do filtro apenas remove ou inclui os alvos da consideração; mudando
os limites do filtro não alteram as pontuações de bits, valores E ou alinhamentos, todos os quais são
determinado unicamente no pós-processamento.
--máx. Desligue todos os filtros, incluindo o filtro de polarização, e execute totalmente para frente / para trás
pós-processamento em cada destino. Isso aumenta um pouco a sensibilidade, em geral
custo em velocidade.
--F1
Defina o limite do valor P para a etapa do filtro MSV. O padrão é 0.02, o que significa
que cerca de 2% dos alvos não homólogos de maior pontuação devem passar
o filtro.
--F2
Defina o limite do valor P para a etapa do filtro Viterbi. O padrão é 0.001.
--F3
Defina o limite do valor P para a etapa do filtro Avançar. O padrão é 1e-5.
--nobias
Desligue o filtro de polarização. Isso aumenta um pouco a sensibilidade, mas pode chegar a um
alto custo em velocidade, especialmente se a consulta tiver composição de resíduo tendenciosa (como
uma região de sequência repetitiva, ou se for uma proteína de membrana com grandes regiões de
hidrofobicidade). Sem o filtro de polarização, muitas sequências podem passar pelo filtro
com consultas tendenciosas, levando a um desempenho mais lento do que o esperado, pois o
algoritmos de avanço / retrocesso de computação intensiva suportam uma carga anormalmente pesada
carregar.
OUTROS OPÇÕES
--nonnull2
Desative as correções de pontuação null2 para composição tendenciosa.
-Z Afirme que o número total de alvos em suas pesquisas é , para os propósitos
de cálculos de valor E por sequência, em vez do número real de alvos
visto.
--domZ
Afirme que o número total de alvos em suas pesquisas é , para os propósitos
de cálculos de valor E condicional por domínio, em vez do número de alvos
que ultrapassou os limites de relatório.
--semente
Defina a semente do número aleatório para . Algumas etapas de pós-processamento requerem Monte
Simulação de Carlo. O padrão é usar uma semente fixa (42), para que os resultados sejam
exatamente reproduzível. Qualquer outro número inteiro positivo dará diferente (mas também
reproduzíveis). Uma escolha de 0 usa uma semente escolhida aleatoriamente.
--tformato
Assegure que o arquivo de banco de dados de sequência de destino está em formato . Formatos aceitos
incluir rápido, emblema, Genbank, ddbj, uniprot, Estocolmo, pfam, a2m e afa. O
o padrão é detectar automaticamente o formato do arquivo.
--CPU
Defina o número de threads de trabalho paralelos para . Por padrão, HMMER define isso para
o número de núcleos de CPU que detecta em sua máquina - ou seja, tenta maximizar
o uso de seus núcleos de processador disponíveis. Configuração maior do que o número de
núcleos disponíveis tem pouco ou nenhum valor, mas você pode querer configurá-lo para algo
menos. Você também pode controlar esse número definindo uma variável de ambiente,
HMMER_NCPU.
Esta opção está disponível apenas se HMMER foi compilado com suporte a threads POSIX.
Este é o padrão, mas pode ter sido desativado em tempo de compilação para o seu site
ou máquina por algum motivo.
--parar
Para depurar a versão MPI master / worker: pause after start, para habilitar o
desenvolvedor para anexar depuradores aos processos mestre e de trabalho em execução. Mandar
Sinal SIGCONT para liberar a pausa. (Em gdb: (gdb) sinal PRÓXIMO CONTEÚDO) (Somente
disponível se o suporte MPI opcional foi habilitado no tempo de compilação.)
--mpi Executar no modo mestre / trabalhador MPI, usando mpirun. (Disponível apenas se MPI opcional
o suporte foi habilitado em tempo de compilação.)
Use hmmsearch online usando serviços onworks.net