Il s'agit de la commande proda qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
proda - alignement multiple de séquences protéiques avec répétitions et réarrangements
SYNOPSIS
produit [option] [fichier mfa] [> sortie]
DESCRIPTION
Cette page de manuel documente brièvement les produit commander.
produit (Protein Domain Aligner) est un logiciel du domaine public permettant de générer plusieurs
alignements de séquences protéiques avec répétitions et réarrangements, p.ex. protéines avec
plusieurs domaines.
Étant donné un ensemble de séquences de protéines en entrée, ProDA trouve d'abord des alignements locaux par paires
entre toutes les paires de séquences, forme alors des blocs de fragments de séquences alignables, et
génère enfin plusieurs alignements des blocs. ProDA s'appuie sur de nombreuses techniques utilisées
in problèmes (<http://probcons.stanford.edu>), un aligneur multiple récent qui montre
précision dans un certain nombre de références populaires.
CONTRIBUTION Format
Proda accepte les fichiers d'entrée au format MFA. Le format MFA est spécifié ci-dessous :
· le format MFA se compose de plusieurs séquences ;
· chaque séquence au format MFA commence par une description sur une seule ligne, suivie de
des lignes de données de séquence ;
· la ligne de description se distingue des données de séquence par un supérieur à (">")
symbole dans la première colonne.
SORTIE Format
Pour un ensemble de séquences d'entrée, Proda sort généralement plusieurs blocs à tour de rôle, chacun se compose
de fragments de séquence alignables. Chaque bloc est suivi de son alignement multiple.
Un bloc est spécifié en listant ses fragments de séquence. Chaque fragment est sorti comme
nom_séquence(début-fin), où nom_séquence est le nom de la séquence d'origine et
start et end sont les positions auxquelles le fragment commence et se termine respectivement.
Proda produit des alignements de blocs au format ClustalW (ALN) décrit ci-dessous :
· le format ClustalW se compose d'une seule ligne d'en-tête suivie de données de séquence dans
blocs de 50 positions d'alignement;
· chaque bloc se compose de :
· une ligne de données pour chacune des séquences de l'alignement - en particulier, le
nom de la séquence ;
· 50 caractères de l'alignement ;
· une ligne d'annotation indiquant entièrement conservé (*), fortement conservé (:), ou
colonnes faiblement conservées (.);
· la ligne de description se distingue des données de séquence par un supérieur à (">")
symbole dans la première colonne.
RAPIDE le format pour sortie
Si l'option -fasta est spécifiée, alors, en plus de la sortie normale, ProDA produit un
fichier contenant des alignements de blocs au format FASTA. Le fichier de sortie a le même nom que
le premier fichier d'entrée et l'extension ".fasta". Deux alignements de blocs consécutifs sont
séparés par une ligne contenant le caractère ´#´.
Le format FASTA est décrit ci-dessous :
· le format FASTA est constitué de toutes les séquences données dans les fichiers d'entrée ;
· chaque séquence au format FASTA commence par une description sur une seule ligne, suivie de
des lignes de données de séquence ;
· la ligne de description se distingue des données de séquence par un supérieur à (">")
symbole dans la première colonne ;
· les résidus alignés sont en majuscules, les résidus non alignés sont en minuscules.
Étant donné qu'un alignement final ne contient chaque séquence qu'une seule fois, cette option ne doit être utilisée que
si les séquences d'entrée ne contiennent pas de répétitions.
OPTIONS
-L [Longueur minimale]
Définissez une longueur d'alignement minimale égale à [min_length].
ProDA trouve des alignements de longueur supérieure ou égale à un seuil L. Par
par défaut, L = 30. Cette option définit le seuil sur [min_length].
-postérieur
Utilisez le décodage postérieur lors du calcul des alignements locaux par paires.
ProDA calcule les alignements locaux par paires entre deux séquences à l'aide d'un HMM de paire
et soit le décodage de Viterbi, soit le décodage postérieur. L'option par défaut utilise
Décodage Viterbi qui est plus rapide que le décodage postérieur mais peut être moins précis.
L'activation de cette option indique à l'aligneur d'utiliser le décodage postérieur à la place. Dans
Dans l'exemple ci-dessus, la sortie a été générée avec l'option -postérieure activée.
-silencieux
Ne signalez pas les progrès lors de l'alignement.
L'activation de cette option indique à l'aligneur de ne pas signaler la progression pendant
alignement. Par défaut, ProDA rapporte la progression de tous les alignements par paires, bloque
génération, et sur l'alignement des blocs. Étant donné que certaines étapes de l'algorithme, en particulier
alignement par paires, peut prendre beaucoup de temps, signaler les progrès donne l'impression que le programme
vivant en courant.
-tran
Utilisez la transitivité lors de la formation de blocs de fragments de séquence alignables.
Deux fragments de séquence sont directement alignables s'ils font partie d'un
alignement par paires. Par défaut, deux fragments sont considérés comme alignables si et seulement
s'ils sont directement alignables. L'activation de cette option indique à l'aligneur de
considérer deux fragments alignables lorsqu'ils sont directement alignables ou lorsque les deux
elles sont directement alignables sur un troisième fragment.
-fasta
Utilisez le format de sortie FASTA en plus du format ClustalW.
Lorsque cette option est activée, l'aligneur génère une sortie au format FASTA
et stocke dans un fichier avec le même nom que le premier fichier d'entrée et l'extension
".fasta", en plus de la sortie normale vers stdout. Cette option doit être utilisée
uniquement si les séquences d'entrée ne contiennent pas de répétitions.
Utiliser proda en ligne en utilisant les services onworks.net