这是 cd-hit-2d-para 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
cd-hit-2d-para.pl - 将一个大的集群作业分成几部分来运行 cd-hit-2d 或 cd-hit-
est-2d 工作
概要
cd-hit-2d-para.pl 选项
商品描述
这个脚本将一个大的集群作业分成几部分并将作业提交到远程
计算机通过网络使其并行。 所有工作完成后,
脚本合并聚类结果,就像您只运行一个 cd-hit-2d 或
cd-hit-est-2d。
如果您的计算机这样做,您也可以使用它在一台计算机上划分大型作业
没有足够的内存(与 -L 选项)。
要求:
1 通过网络运行此脚本时,您所在的目录
运行脚本,输入文件必须在所有远程主机上可用
相同的路径。
2 如果您选择“ssh”提交作业,您必须拥有
无密码 ssh 到任何远程主机,请参阅 ssh 手册了解如何设置
无密码 ssh。
3 我建议使用排队系统而不是 ssh,
我目前支持 PBS 和 SGE
4 cd-hit-2d cd-hit-est-2d cd-hit-div cd-hit-div.pl 必须是
在此脚本所在的同一目录中。
附加选项
-i fasta 格式的第一个数据库的输入文件名,必需
-i2 fasta 格式的第二个数据库的输入文件名,必需
-o 输出文件名,必填
--P 程序,“cd-hit-2d”或“cd-hit-est-2d”,默认为“cd-hit-2d”
--乙 主机列表的文件名,除非是必需的 -Q or -L 提供选项
--L 本地计算机上的 CPU 数量,当您不在本地计算机上运行时默认为 0
集群,您可以使用此选项将一个大的集群作业分成小块,
我建议你只使用“--L 1”,除非你有足够的内存供每个 CPU 使用
--S 将第一个 db 拆分成的段数,默认为 1
--S2 将第二个 db 拆分成的段数,默认为 2
--问 提交到队列排队系统的作业数,默认为0,程序
使用 ssh 模式提交远程作业
--T 排队系统类型,支持“PBS”、“SGE”,默认PBS
--R 重启文件,在运行崩溃后使用
-h 打印此帮助
可以在命令行中指定更多 cd-hit-2d/cd-hit-est-2d 选项
问题、错误,请联系 Weizhong Li [电子邮件保护]
使用 onworks.net 服务在线使用 cd-hit-2d-para