Dies ist die Befehls-Alimask, die beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
alimask – Maskenlinie zu einem Alignment mit mehreren Sequenzen hinzufügen
ZUSAMMENFASSUNG
Alimask [Optionen]
BESCHREIBUNG
Alimask wird verwendet, um eine Maskenlinie auf eine Ausrichtung mit mehreren Sequenzen anzuwenden, basierend auf den bereitgestellten Informationen
Ausrichtung oder Modellkoordinaten. Wann hmmbau erhält als Eingabe eine maskierte Ausrichtung, it
erzeugt ein Profilmodell, in dem die Emissionswahrscheinlichkeiten an maskierten Positionen festgelegt werden
um mit der Hintergrundfrequenz übereinzustimmen, anstatt auf der Grundlage der beobachteten Frequenzen in eingestellt zu werden
die Ausrichtung. Positionsspezifische Einfüge- und Löschraten werden auch in nicht verändert
maskierte Regionen. Alimask Erkennt das Eingabeformat automatisch und erzeugt maskierte Ausrichtungen in
Stockholmer Format. darf nur ein Sequenzalignment enthalten.
Eine häufige Motivation für das Maskieren einer Region in einer Ausrichtung besteht darin, dass die Region eine enthält
Eine einfache Tandem-Wiederholung führt nachweislich zu einer unannehmbar hohen Rate falsch positiver Ergebnisse
Treffer.
Im einfachsten Fall wird ein Maskenbereich in Koordinaten relativ zur Eingabe angegeben
Ausrichtung, Verwendung --alirange . Allerdings kommt es häufiger vor, dass die Region betroffen ist
maskiert wurde in Koordinaten relativ zum Profilmodell identifiziert (z. B. basierend auf
Erkennen eines einfachen Wiederholungsmusters in falschen Trefferausrichtungen oder im HMM-Logo). Nicht alle
Ausrichtungsspalten werden so konvertiert, dass sie mit den Statuspositionen im Profil übereinstimmen (siehe --symfrac
Flagge für hmmbau zur Diskussion), daher stimmen die Modellpositionen nicht unbedingt mit überein
Ausrichtungsspaltenpositionen. Um die Belastung durch die Konvertierung von Modellpositionen zu beseitigen
Ausrichtungspositionen, Alimask akzeptiert die Eingabe des Maskenbereichs auch in Modellkoordinaten,
Verwendung von --modelrange . Wenn Sie dieses Flag verwenden, Alimask bestimmt welche Ausrichtung
Positionen würden durch identifiziert werden hmmbau als Übereinstimmungsstatus, ein Prozess, der dies erfordert
alle hmmbau Flags, die sich auf diese Entscheidung auswirken, werden bereitgestellt Alimask. Aus diesem Grund
so viele der hmmbau Flags werden auch von verwendet Alimask.
OPTIONAL
-h Hilfe; Drucken Sie eine kurze Erinnerung an die Verwendung der Befehlszeile und alle verfügbaren Optionen.
-o Leiten Sie die Zusammenfassungsausgabe in eine Datei um , anstatt zu stdout.
OPTIONAL FÜR SPEZIFIKATION MASKE REICHWEITE
Ein einzelner Maskenbereich wird beispielsweise als durch einen Strich getrenntes Paar angegeben --modelrange 10 20 und
Mehrere Bereiche können als durch Kommas getrennte Liste übermittelt werden. --modelrange 10-20,30-42.
--modelrange
Geben Sie die angegebenen Bereiche in Modellkoordinaten an.
--alirange
Geben Sie die angegebenen Bereiche in Ausrichtungskoordinaten an.
--apendmask
Zur vorhandenen Maske hinzufügen, die mit der Ausrichtung gefunden wurde. Standardmäßig werden alle überschrieben
vorhandene Maske.
--model2ali
Anstatt die maskierte Ausrichtung tatsächlich zu erstellen, drucken Sie einfach die Modellreihe(n) aus.
entsprechend den Eingabeausrichtungsbereichen.
--ali2model
Anstatt die maskierte Ausrichtung tatsächlich zu erstellen, drucken Sie einfach Ausrichtungsbereiche aus.
entsprechend der Eingangsmodellreihe(n).
OPTIONAL FÜR SPEZIFIKATION ALPHABET
Der Alphabettyp (Amino, DNA oder RNA) wird standardmäßig automatisch erkannt, indem man sich das ansieht
Zusammensetzung der msafile. Die automatische Erkennung ist normalerweise recht zuverlässig, gelegentlich jedoch auch
Der Alphabettyp ist möglicherweise nicht eindeutig und die automatische Erkennung kann fehlschlagen (z. B. bei einem winzigen Spielzeug).
Ausrichtungen von nur wenigen Resten). Um dies zu vermeiden oder die Robustheit automatisiert zu erhöhen
Analysepipelines können Sie den Alphabettyp angeben msafile mit diesen Optionen.
--amino
Geben Sie an, dass alle Sequenzen in msafile sind Proteine.
--DNA Geben Sie an, dass alle Sequenzen in msafile sind DNAs.
--rna Geben Sie an, dass alle Sequenzen in msafile sind RNAs.
OPTIONAL STEUERN PROFIL AUFBAU
Diese Optionen steuern, wie Konsensspalten in einem Alignment definiert werden.
--schnell Konsensspalten als solche mit einem Bruch >= . definieren symfrak von Rückständen wie
gegen Lücken. (Siehe unten für die --symfrac Option.) Dies ist die Standardeinstellung.
--Hand Definieren Sie Konsensspalten im nächsten Profil mit Referenzanmerkung zum Multiple
Ausrichtung. Dadurch können Sie beliebige Konsensspalten definieren.
--symfrac
Definieren Sie den Schwellenwert für die Rückstandsfraktion, der erforderlich ist, um eine Konsensspalte zu definieren, wenn
Verwendung der --schnell Möglichkeit. Der Standardwert ist 0.5. Der Symbolbruch in jeder Spalte ist
berechnet unter Berücksichtigung der relativen Sequenzgewichtung und Ignorieren der Lücke
Zeichen, die den Enden von Sequenzfragmenten entsprechen (im Gegensatz zu internen
Einfügungen/Löschungen). Wenn Sie dies auf 0.0 setzen, bedeutet dies, dass jede Ausrichtungsspalte
als Konsens vergeben werden, was in manchen Fällen sinnvoll sein kann. Auf 1.0 einstellen
bedeutet, dass nur Spalten, die 0 Lücken enthalten (interne Einfügungen/Löschungen) werden
als Konsens vergeben.
--fragthresh
Wir wollen terminale Lücken nur dann als Deletionen zählen, wenn die ausgerichtete Sequenz bekannt ist
in voller Länge sein, nicht wenn es ein Fragment ist (zum Beispiel weil nur ein Teil davon
wurde sequenziert). HMMER verwendet eine einfache Regel, um auf Fragmente zu schließen: Wenn die Sequenzlänge
L ist kleiner oder gleich einem Bruch mal die Ausrichtungslänge in Spalten,
dann wird die Sequenz als Fragment behandelt. Der Standardwert ist 0.5. Einstellung
--fragthresh0 definiert keine (nicht leere) Sequenz als Fragment; vielleicht willst du
Tun Sie dies, wenn Sie wissen, dass Sie eine sorgfältig kuratierte Ausrichtung in voller Länge haben
Sequenzen. Einstellung --fragthresh1 definiert alle Sequenzen als Fragmente; du könntest
möchten Sie dies tun, wenn Sie wissen, dass Ihre Ausrichtung ausschließlich aus Fragmenten besteht, wie z
als übersetzte Short Reads in metagenomische Schrotflintendaten.
OPTIONAL STEUERN RELATIV WEIGHTS
HMMER verwendet einen Ad-hoc-Sequenzgewichtungsalgorithmus, um eng verwandte Sequenzen herabzugewichten
und hochgewichtige, entfernt verwandte. Dies hat zur Folge, dass die Modelle weniger voreingenommen sind
ungleichmäßige phylogenetische Darstellung. Typischerweise wären es beispielsweise zwei identische Sequenzen
Jeder erhält die Hälfte des Gewichts, das eine Sequenz erhalten würde. Diese Optionen steuern welche
Algorithmus verwendet wird.
--wpb Verwenden Sie das positionsbasierte Sequenzgewichtungsschema von Henikoff [Henikoff und Henikoff,
J.Mol. Biol. 243: 574, 1994]. Dies ist die Standardeinstellung.
--wgsc Verwenden Sie den Gerstein/Sonnhammer/Chothia-Gewichtungsalgorithmus [Gerstein et al., J. Mol.
Biol. 235: 1067, 1994].
--wblosum
Verwenden Sie dasselbe Clustering-Schema, das verwendet wurde, um Daten bei der Berechnung von BLOSUM . zu gewichten
Substitutionsmatrizen [Henikoff und Henikoff, Proc. Natl. Akad. Sci 89:10915, 1992].
Sequenzen sind Single-Linkage-Cluster bei einem Identitätsschwellenwert (Standard 0.62; siehe
--breit) und innerhalb jedes Clusters von c Sequenzen erhält jede Sequenz ein relatives Gewicht
1/c.
--wnone
Keine relativen Gewichte. Allen Sequenzen wird ein einheitliches Gewicht zugewiesen.
--breit
Legt den Identitätsschwellenwert fest, der von Single-Linkage-Clustering verwendet wird, wenn verwendet wird --wblosum.
Ungültig mit jedem anderen Gewichtungsschema. Der Standardwert ist 0.62.
anderes OPTIONAL
--informatieren
Erklären Sie, dass die Eingabe msafile ist im Format . Derzeit das akzeptierte Vielfache
Zu den Alignment-Sequenzdateiformaten gehören Stockholm, Aligned FASTA, Clustal und NCBI
PSI-BLAST, PHYLIP, Selex und UCSC SAM A2M. Standardmäßig wird das Format automatisch erkannt
die Datei.
--Samen
Setzen Sie den Zufallszahlengenerator mit , eine ganze Zahl >= 0. Wenn ist ungleich Null, beliebig
stochastische Simulationen werden reproduzierbar sein; der gleiche Befehl wird das gleiche geben
Ergebnisse. Wenn 0 ist, wird der Zufallszahlengenerator willkürlich gesetzt, und
Stochastische Simulationen variieren von Ausführung zu Ausführung desselben Befehls. Der Standard
Samen ist 42.
Verwenden Sie Alimask online über die Dienste von onworks.net