Il s'agit de la commande cd-hit-2d-para qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
cd-hit-2d-para.pl - divise un gros travail de clustering en morceaux pour exécuter cd-hit-2d ou cd-hit-
emplois est-2d
SYNOPSIS
cd-hit-2d-para.pl Options
DESCRIPTION
Ce script divise un gros travail de clustering en morceaux et soumet les travaux à distance
ordinateurs sur un réseau pour le rendre parallèle. Une fois tous les travaux terminés, le
le script fusionne les résultats du clustering comme si vous exécutiez simplement un seul cd-hit-2d ou
cd-hit-est-2d.
Vous pouvez également l'utiliser pour diviser de gros travaux sur un seul ordinateur si votre ordinateur le fait.
pas assez de RAM (avec -L option).
Exigences :
1 Lorsque vous exécutez ce script sur un réseau, le répertoire dans lequel vous
exécuter les scripts et les fichiers d'entrée doivent être disponibles sur tous les hôtes distants avec
chemin identique.
2 Si vous choisissez "ssh" pour soumettre des travaux, vous devez avoir
ssh sans mot de passe à n'importe quel hôte distant, voir le manuel ssh pour savoir comment configurer
ssh sans mot de passe.
3 Je suggère d'utiliser le système de file d'attente au lieu de ssh,
Je supporte actuellement PBS et SGE
4 cd-hit-2d cd-hit-est-2d cd-hit-div cd-hit-div.pl doit être
dans le même répertoire où se trouve ce script.
Options
-i nom de fichier d'entrée pour la 1ère db au format fasta, requis
-i2 nom de fichier d'entrée pour la 2e base de données au format fasta, requis
-o nom du fichier de sortie, requis
--P programme, "cd-hit-2d" ou "cd-hit-est-2d", par défaut "cd-hit-2d"
--B nom de fichier de la liste des hôtes, requis sauf si -Q or -L l'option est fournie
--L nombre de processeurs sur l'ordinateur local, 0 par défaut lorsque vous ne l'exécutez pas sur un
cluster, vous pouvez utiliser cette option pour diviser un gros travail de clustering en petits morceaux,
Je vous suggère d'utiliser simplement "--L 1" à moins que vous n'ayez suffisamment de RAM pour chaque processeur
--S Nombre de segments dans lesquels diviser la 1ère base de données, par défaut 2
--S2 Nombre de segments dans lesquels diviser la 2e base de données, par défaut 8
--Q nombre de travaux à soumettre au système de mise en file d'attente, 0 par défaut par défaut, le programme
utiliser le mode ssh pour soumettre des travaux à distance
--T type de système de file d'attente, "PBS", "SGE" sont pris en charge, PBS par défaut
--R fichier de redémarrage, utilisé après un crash de run
-h imprimer cette aide
Plus d'options cd-hit-2d/cd-hit-est-2d peuvent être spécifiées dans la ligne de commande
Questions, bugs, contactez Weizhong Li à [email protected]
Utilisez cd-hit-2d-para en ligne en utilisant les services onworks.net