Il s'agit de la commande hhblits qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
hhblits - méthode de détection d'homologie rapide pour rechercher de manière itérative une base de données HMM
SYNOPSIS
hhblits -i question [Options]
DESCRIPTION
HHblits version 2.0.16 (janvier 2013) : séquence itérative ultra-rapide basée sur HMM-HMM
search HHblits est un outil de recherche de séquences sensible, général et itératif qui
représente à la fois les requêtes et les séquences de base de données par les HMM. Vous pouvez rechercher les bases de données HHblits
commençant par une séquence de requête unique, un alignement de séquences multiples (MSA) ou un HMM.
HHblits imprime une liste classée des HMM/MSA de la base de données et peut également générer un MSA en
fusionner les HMM/MSA de base de données significatifs sur le MSA de requête.
Remmert M., Biegert A., Hauser A. et Soding J. HHblits : itératif ultra-rapide
recherche de séquences protéiques par alignement HMM-HMM. Nat. Méthodes 9:173-175 (2011) (C)
Johannes Soeding, Michael Remmert, Andreas Biegert, Andreas Hauser
-i
entrée/requête : séquence unique ou alignement de séquences multiples (MSA) dans a3m, a2m ou
Format FASTA, ou HMM au format hhm
peut être 'stdin' ou 'stdout' partout.
OPTIONS
-d
nom de la base de données (par exemple uniprot20_29Feb2012) (default=)
-n [1,8] nombre d'itérations (par défaut=2)
-e [0,1] Seuil de valeur E pour l'inclusion dans l'alignement des résultats (def = 0.001)
Entrée alignement Format:
-M a2m utilise A2M/A3M (par défaut) : majuscule = Correspondance ; minuscule = Insérer ;
' -' = Supprimer ; '.' = espaces alignés sur les inserts (peut être omis)
-M premier
utiliser FASTA : les colonnes avec des résidus dans la 1ère séquence sont des états de correspondance
-M
utiliser FASTA : les colonnes avec moins de X % d'écarts sont des états de correspondance
Sortie options:
-o
écrire les résultats au format standard dans un fichier (par défaut = )
-oa3m
écrire le résultat MSA avec des correspondances significatives au format a3m
-opsi
écrire le résultat MSA des correspondances significatives au format PSI-BLAST
-ohhh
écrire le fichier HHM pour le résultat MSA des correspondances significatives
-oalis
écrire les MSA au format A3M après chaque itération
-Ofas
écrire des alignements par paires de correspondances significatives au format FASTA Analogue pour
sortie au format a3m et a2m (par ex. -Oa3m)
-qhhm
écrire le fichier HHM d'entrée de la requête de la dernière itération (par défaut = désactivé)
-séq
max. nombre de séquences de requêtes/modèles affichées (par défaut=1)
-aliw
nombre de colonnes par ligne dans la liste d'alignement (par défaut=80)
-p
probabilité minimale dans la liste récapitulative et d'alignement (par défaut = 20)
-E [0,inf[
valeur E maximale dans la liste récapitulative et d'alignement (par défaut=1E+06)
-Z
nombre maximal de lignes dans la liste des résultats récapitulatifs (par défaut = 500)
-z
nombre minimum de lignes dans la liste des résultats récapitulatifs (par défaut = 10)
-B
nombre maximum d'alignements dans la liste d'alignements (par défaut=500)
-b
nombre minimum d'alignements dans la liste d'alignements (par défaut = 10)
Options de préfiltre
-pas de préfilt
désactiver toutes les étapes de filtrage
-noaddfilter
désactiver toutes les étapes de filtrage (sauf pour le préfiltrage rapide)
-nodbfilter
désactiver le filtrage supplémentaire des HMM préfiltrés
-pas de filtre de bloc recherche matrice complète à Viterbi
-maxfilt
nombre maximum de hits autorisés à passer le 2ème préfiltre (par défaut = 20000)
Options de filtre appliquées au MSA de requête, aux MSA de base de données et au MSA de résultat
-tout montrer toutes les séquences dans le résultat MSA ; ne pas filtrer le résultat MSA
-identifiant [0,100] identité de séquence par paire maximale (def=90)
-diff [0,inf[
filtrer les MSA en sélectionnant l'ensemble de séquences le plus diversifié, en gardant au moins ce nombre
seqs dans chaque bloc MSA de longueur 50 (def=1000)
-cov [0,100] couverture minimale avec séquence maître (%) (def=0)
-qid [0,100] identité de séquence minimale avec la séquence maître (%) (def=0)
-qsc [0,100] score minimum par colonne avec séquence maître (par défaut=-20.0)
-neff [1,inf]
diversité cible de l'alignement de séquences multiples (par défaut = désactivé)
HMM-HMM alignement options:
-noréaligner
NE PAS réaligner les hits affichés avec l'algorithme MAC (def=realign)
-mact [0,1[
seuil de probabilité a posteriori pour le réalignement MAC (def=0.350) Contrôles des paramètres
gourmandise d'alignement : 0:global >0.1:local
-glob/-loc
utiliser le mode d'alignement global/local pour la recherche/le classement (def=local)
-réaligner_max
réaligner max. hits (par défaut=1000)
-alt
afficher ces nombreux alignements alternatifs significatifs (def=2)
-préfusion fusionner hits pour interroger MSA avant d'aligner les hits restants (def=3)
-décalage [-1,1 XNUMX]
décalage de score profil-profil (def=-0.03)
-ssm {0,..,4}
0 : pas de score ss 1,2 : score ss après ou pendant l'alignement [par défaut=2] 3,4 : ss
score après ou pendant l'alignement, prédit vs prédit
-ssw
poids du score SS (def=0.11)
Gap sables moins coûteux options:
-écart [0,inf[
Mélange de pseudo-compte de transition (def=1.00)
-gapd [0,inf[
Mélange de pseudo-compte de transition pour l'espace ouvert (par défaut = 0.15)
-bâiller
Mélange de pseudo-compte de transition pour étendre l'écart (def = 1.00)
-écart ]0,inf]
facteur pour augmenter/réduire la pénalité d'ouverture d'écart pour les suppressions (def=0.60)
-gapg ]0,inf]
facteur pour augmenter/réduire la pénalité d'ouverture d'écart pour les inserts (def=0.60)
-gaph ]0,inf]
facteur pour augmenter/réduire l'écart étendre la pénalité pour les suppressions (def = 0.60)
-gapi ]0,inf]
facteur pour augmenter/réduire l'écart étendre la pénalité pour les insertions (def=0.60)
-egq [0,inf[ pénalité (bits) pour les écarts de fin alignés sur les résidus de requête (def=0.00)
-egt [0,inf[ pénalité (bits) pour les espaces de fin alignés sur les résidus de modèle (def=0.00)
Pseudocompte (ordinateur) options:
-pcm {0,..,2}
dépendance de la position du mélange pc 'tau' (mode pc, par défaut=2) 0 : pas de pseudo-comptes :
tau = 0 1 : tau constant = a 2 : dépendant de la diversité : tau = a/(1 +
((Neff[i]-1)/b)^c) (Neff[i] : nombre de séquences effectives dans le MSA local autour de la colonne i)
-pca [0,1] mélange de pseudo-compte global (def=1.0)
-PCB [1,inf[ Valeur seuil Neff pour -pcm 2 (déf=1.5)
-pcc [0,3] exposant d'extinction c pour -pcm 2 (déf=1.0)
-pre_pca
Mélange de pseudo-compte PREFILTER (def=0.8)
-pre_pcb [1,inf[ Seuil PREFILTER pour Neff (def=1.8)
Spécifique au contexte pseudo-comptes :
-nocontxt
utiliser la matrice de substitution au lieu de pseudocomptes spécifiques au contexte
-contexte fichier de contexte pour le calcul de pseudocomptes spécifiques au contexte
(par défaut=./data/context_data.lib)
-cslib
fichier d'état de colonne pour un préfiltrage rapide de la base de données (default=./data/cs219.lib)
Prédire la structure secondaire
-ajoute ajouter la structure secondaire prédite avec PSIPRED au résultat MSA
-psipred répertoire avec les exécutables PSIPRED (par défaut=)
-psipred_data
répertoire avec les données PSIPRED (défaut=)
Autres options:
-v
mode verbeux : 0 : pas de sortie d'écran 1 : uniquement les avertissements 2 : verbose (def=2)
-neffmax ]1,20] ignore les itérations de recherche supplémentaires lorsque la diversité Neff de la requête MSA
devient plus grand que neffmax (par défaut = 10.0)
-CPU
nombre de CPU à utiliser (pour les SMP de mémoire partagée) (par défaut=2)
-scores écrire les scores pour toutes les comparaisons par paires dans un fichier
-un onglet écrire tous les alignements sous forme de tableau dans un fichier
-maxres
nombre maximum de colonnes HMM (def=15002)
-maxmem [1,inf[ mémoire disponible max en Go (def=3.0)
EXEMPLES
hhblits -i requête.fas -o requête.hhr -d ./uniprot20
hhblits -i requête.fas -o requête.hhr -oa3m requête.a3m -n 1 -d ./uniprot20
Télécharger les bases de données deftp://toolkit.genzentrum.lmu.de/pub/HH-suite/databases/>.
Utilisez hhblits en ligne en utilisant les services onworks.net