2ndscore - Online in der Cloud

Dies ist der Befehl 2ndscore, der im kostenlosen OnWorks-Hosting-Provider mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


2ndscore - finde die beste Haarnadelkurve, die an jeder Position verankert ist.

ZUSAMMENFASSUNG


2. Punktzahl in.fasta > out.hairpins

BESCHREIBUNG


Für jede Position in der Sequenz wird eine Zeile ausgegeben:

-0.6 52 .. 62 TTCCTAAAGGTTCCA GCG CAAAA TGC CATAAGCACCACATT
(Score) (Anfang .. Ende) (Linker Kontext) (Haarnadel) (Rechter Inhalt)

Für Positionen nahe den Enden der Sequenzen kann der Kontext mit 'x' aufgefüllt werden
Zeichen. Wenn keine Haarnadelkurve gefunden werden kann, lautet die Punktzahl 'Keine'.

Es können mehrere Fasta-Dateien angegeben werden und in jeder Fasta-Datei können mehrere Sequenzen enthalten sein. Die
Die Ausgabe für jede Sequenz wird durch eine Zeile getrennt, die mit '>' beginnt und die
FASTA-Beschreibung der Sequenz.

Da sich die Hairpin-Scores von Plus- und Minus-Strang unterscheiden können (aufgrund von GU
Bindung in RNA), gibt 2ndscore standardmäßig zwei Sätze von Haarnadeln für jede Sequenz aus: die
FORWARD-Haarnadeln und die RÜCKWÄRTS-Haarnadeln. Alle Vorwärts-Haarnadeln werden zuerst ausgegeben, und
werden durch das Wort 'FORWARD' am Ende der '>'-Zeile vor ihnen identifiziert.
Ebenso werden die REVERSE-Haarnadeln nach einer '>'-Zeile aufgelistet, die mit 'REVERSE' endet. wenn du
nur den einen oder anderen Strang durchsuchen möchten, können Sie Folgendes verwenden:

--no-fwd Die FORWARD-Haarnadeln nicht drucken
--no-rvs Drucken Sie nicht die RÜCKWÄRTS-Haarnadeln

Die verwendete Energiefunktion kann wie bei transterm mit --gc, --au, --gu,
--mm, --gap-Optionen. Die Optionen --min-loop, --max-loop und --max-len werden ebenfalls unterstützt.

FORMAT OF .TASCHE DATEIEN
Die Spalten für die .bag-Dateien sind in der folgenden Reihenfolge:

1. Genname
2. terminator_start
3. Terminator_Ende
4. hairpin_score
5. tail_score
6. terminator_sequence

7. terminator_confidence: eine Kombination aus Hairpin- und Tail-Score, die
berücksichtigt, wie wahrscheinlich solche Scores in einer zufälligen Reihenfolge sind. Dies
ist die Haupt-"Punktzahl" für den Terminator und wird wie in beschrieben berechnet
das Papier.

8. APPROXIMATE_distance_from_end_of_gene: Die *ungefähre* Anzahl der Basis
Paare zwischen dem Ende des Gens und dem Anfang des Terminators. Dies
ist in mehrfacher Hinsicht ungefähr: Erstens (und am wichtigsten) TransTermHP
verwendet nicht immer die echten Genenden. Abhängig von den Optionen, die Sie geben
es kann einige Enden von Genen abschneiden, um Terminatoren zu handhaben, die
teilweise mit Genen überlappen. Zweitens, wo der Terminator "beginnt"
ist nicht so gut definiert. Dieses Feld ist nur für eine Plausibilitätsprüfung vorgesehen
(Terminatoren, von denen berichtet wird, dass sie die besten in der Nähe der Enden von Genen sind, sollten nicht sein
_zu weit_ vom Ende des Gens).

VERWENDUNG ÜBERTRAGUNG OHNE GENOM ANMERKUNGEN
TransTermHP verwendet bekannte Geninformationen nur für 3 Dinge: (1) Markieren des mutmaßlichen
Terminatoren entweder als "innere Gene" oder "intergenetisch" (2), wobei die Hintergrund-GC-
Inhaltsprozentsatz, um die Scores zu berechnen, da Gene oft unterschiedliche GC-Gehalte haben
als die intergenischen Regionen und (3) eine etwas lesbarere Ausgabe. Artikel (1)
und (3) sind nicht wirklich notwendig und (2) hat keine Wirkung, wenn Ihre Gene ungefähr gleich sind
GC-Inhalt als Ihre intergenischen Regionen.

Leider hat TransTermHP noch keine einfache Option, um ohne Annotation zu laufen
Datei (entweder .ptt oder .coords) und erfordert, dass mindestens 2 Gene vorhanden sind. Die Lösung
besteht darin, gefälschte, kleine Gene zu erzeugen, die jedes Chromosom flankieren. Erstellen Sie dazu eine fake.coords
Datei, die nur diese beiden Zeilen enthält:

fakegene1 1 2 chome_id
fakegene2 L-1 L chrom_id

wobei L die Länge der Eingabesequenz ist und L-1 1 kleiner als die Länge der Eingabe ist
Reihenfolge. "chrom_id" sollte das Wort sein, das direkt auf das ">" in der .fasta-Datei folgt
enthält Ihre Sequenz. (Wenn Ihre .fasta-Datei beispielsweise mit ">seq1" begann, dann
chrom_id = seq1).

Dies erzeugt eine "falsche" Annotation mit zwei 1 Base langen Genen, die die Sequenz in a . flankieren
Schwanz-an-Schwanz-Anordnung: --> <--. TransTermHP kann dann ausgeführt werden mit:

transterm -p expterm.dat sequence.fasta fake.coords

Wenn der G/C-Gehalt Ihrer intergenischen Regionen ungefähr dem Ihrer Gene entspricht, dann ist dies
hat keinen allzu großen Einfluss auf die Punktzahlen, die Terminatoren erhalten. Auf der anderen Seite,
diese Verwendung von TransTermHP wurde noch nicht viel getestet, daher ist es schwer, dafür zu bürgen
Genauigkeit.

Verwenden Sie 2ndscore online mit den onworks.net-Diensten



Neueste Linux- und Windows-Online-Programme