Dies ist der Befehl cd-hit-para, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
cd-hit-para.pl – Teilen Sie einen großen Clustering-Job in Teile, um cd-hit- oder cd-hit-est-Jobs auszuführen
ZUSAMMENFASSUNG
cd-hit-para.pl Optionen
BESCHREIBUNG
Dieses Skript unterteilt einen großen Clustering-Auftrag in Teile und sendet Aufträge an die Remote-Einheit
Computer über ein Netzwerk zu verbinden, um es parallel zu machen. Nachdem alle Arbeiten abgeschlossen sind, wird die
Das Skript führt die Clustering-Ergebnisse zusammen, als ob Sie nur einen einzelnen CD-Hit oder ausführen würden
cd-hit-est.
Sie können es auch verwenden, um große Aufgaben auf einem einzelnen Computer aufzuteilen, wenn Ihr Computer dies tut
nicht genügend RAM (mit -L Möglichkeit).
Anforderungen:
1 Wenn Sie dieses Skript über ein Netzwerk ausführen, wird das Verzeichnis angezeigt, in dem Sie sich befinden
Führen Sie die Skripte aus und die Eingabedateien müssen auf allen Remote-Hosts verfügbar sein
identischer Weg.
2 Wenn Sie „ssh“ zum Senden von Jobs wählen, müssen Sie Folgendes tun
Passwortloses SSH zu einem beliebigen Remote-Host. Informationen zur Einrichtung finden Sie im SSH-Handbuch
Passwortloses SSH.
3 Ich schlage vor, das Warteschlangensystem anstelle von SSH zu verwenden.
Ich unterstütze derzeit PBS und SGE
4 cd-hit cd-hit-2d cd-hit-est cd-hit-est-2d
cd-hit-div cd-hit-div.pl muss sich im selben Verzeichnis befinden, in dem sich dieses Skript befindet.
Optionen
-i Dateinamen im Fasta-Format eingeben, erforderlich
-o Ausgabedateiname, erforderlich
--P Programm, „cd-hit“ oder „cd-hit-est“, Standard „cd-hit“
--B Dateiname der Hostliste,
erforderlich, es sei denn -Q or -L Option ist im Lieferumfang enthalten
--L Anzahl der CPUs auf dem lokalen Computer, Standard 0
Wenn Sie es nicht über einen Cluster ausführen, können Sie diese Option verwenden, um einen großen Cluster aufzuteilen
Um Jobs in kleine Teile zu gruppieren, schlage ich vor, dass Sie einfach „--L 1“ verwenden, es sei denn, Sie haben dies getan
Genug RAM für jede CPU
--S Anzahl der Segmente, in die die Eingabe-DB aufgeteilt werden soll, Standard 64
--Q Anzahl der Jobs, die an das Warteschlangensystem übermittelt werden sollen, Standardwert 0
Standardmäßig verwendet das Programm den SSH-Modus, um Remote-Jobs zu senden
--T Art des Warteschlangensystems, „PBS“, „SGE“ werden unterstützt, Standard-PBS
--R Neustartdatei, wird nach einem Absturz von run verwendet
-h diese Hilfe ausdrucken
Weitere cd-hit/cd-hit-est-Optionen können in der Befehlszeile angegeben werden
Bei Fragen, Fehlern wenden Sie sich bitte an Weizhong Li unter [E-Mail geschützt]
Verwenden Sie cd-hit-para online über die Dienste von onworks.net