Il s'agit de la commande alistat qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
alistat - affiche les statistiques d'un fichier d'alignement multiple
SYNOPSIS
Alistat [choix] aligner le fichier
DESCRIPTION
Alistat lit un alignement de séquences multiples à partir du fichier aligner le fichier dans tout supporté
format (y compris SELEX, GCG MSF et CLUSTAL) et affiche un certain nombre de statistiques simples
à propos de ça. Ces statistiques comprennent le nom du format, le nombre de séquences, le
nombre total de résidus, la moyenne et la plage des longueurs de séquence, l'alignement
longueur (par exemple, y compris les caractères d'espacement).
Quelques pourcentages d'identités sont également indiqués. Un pourcentage d'identité d'alignement par paire est défini
as (identificateurs / MIN(len1, lentille2)) où identifiants est le nombre d'identités exactes et len1,
len2 sont les longueurs non alignées des deux séquences. Le "pourcentage moyen d'identité", "le plus
paire liée" et "la paire la moins liée" de l'alignement sont la moyenne, le maximum et
minimum de toutes les (N)(N-1)/2 paires, respectivement. La "séquence la plus éloignée" est calculée par
trouver l'identité par paires maximale (meilleur parent) pour toutes les séquences N, puis trouver
le minimum de ces N nombres (donc la séquence la plus éloignée).
OPTIONS
-a Afficher des informations détaillées supplémentaires : un tableau avec une ligne par séquence montrant
nom, longueur et son identité par paires la plus élevée et la plus faible. Ces lignes sont
préfixé d'un caractère * pour activer facilement grep'les sortir et les trier.
Par exemple, Alistat -a foo.slx | grep * | sort -n +3 donne une liste classée des
séquences les plus éloignées de l'alignement. Incompatible avec le -f option.
-f Rapide; utiliser une méthode d'échantillonnage pour estimer le %id moyen. Lorsque cette option est
choisi, Alistat ne montre pas les trois autres numéros d'identité par paire. Cette
L'option est utile pour les très grands alignements, pour lesquels le calcul complet (N)(N-1)
de toutes les paires serait prohibitif (par exemple l'alignement GP120 de Pfam, avec plus de 10,000 XNUMX
séquences). Incompatible avec le -a option.
-h Imprimer une brève aide ; inclut le numéro de version et un résumé de toutes les options, y compris
options d'experts.
-q be quiet - supprime l'en-tête verbeux (nom du programme, numéro de version et date, le
paramètres et options en vigueur).
-B (Babelfish). Détection automatique et lecture d'un format de fichier de séquence autre que celui par défaut
(FASTA). Presque tous les formats de fichiers de séquence courants sont reconnus (y compris Genbank,
Formats de séquences non alignées EMBL, SWISS-PROT, PIR et GCG, et Stockholm, GCG MSF,
et les formats d'alignement clustal). Voir la documentation imprimée pour une liste complète
des formats pris en charge.
EXPERT OPTIONS
--informat
Précisez que le fichier séquence est au format , plutôt que le FASTA par défaut
format. Les exemples courants incluent Genbank, EMBL, GCG, PIR, Stockholm, Clustal, MSF,
ou PHYLIP; voir la documentation imprimée pour une liste complète des formats acceptés
noms. Cette option remplace le format par défaut (FASTA) et le -B poisson babel
option de détection automatique.
Utilisez alistat en ligne en utilisant les services onworks.net