这是命令 hmmpgmd,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
hmmpgmd - 用于在蛋白质数据库中搜索蛋白质查询的守护进程
概要
哈哈 [选项]
商品描述
这款 哈哈 程序是我们在内部为 hmmer.org 网络服务器使用的守护进程,以及
基本上站在蛋白质搜索程序的前面 普默, 嗯搜索及 扫一扫.
使用 哈哈,首先必须启动一个实例作为 主 服务器,并提供
至少其中之一 序列 数据库 (使用 --seqdb 标志)和/或 HMM 数据库 (使用
此 --hmmdb 旗帜)。 序列数据库必须是 hmmpgmd 格式,可以是
使用生产 esl-重新格式化. HMM 数据库的形式为 构建。 该
输入数据库将由主服务器加载到内存中。 当主人完成
加载数据库时,它会打印以下行:“数据已加载到内存中。Master 已准备就绪。”
只有在 master 准备就绪后,才能启动一个或多个 hmmpgmd 实例作为 worker。
这些 worker 可能(并且通常是)在与 master 不同的机器上,但必须
可以访问提供给 master 的相同数据库文件,具有相同的路径。 作为
与 master 一起,每个 worker 将数据库加载到内存中,并指示完成
通过打印:“数据加载到内存中。工作人员已准备就绪。”
预计主服务器和工作人员将继续运行。 一个或多个客户然后
连接到 master 并提交可能很多查询。 主分配工作
工人之间的查询,收集结果,并在响应之前合并它们
客户。 HMMER3.1 src 目录中包含两个示例客户端程序 - C
程序 嗯嗯2 和 perl 脚本 hmmpgmd_client_example.pl. 这些旨在作为
仅示例,并应根据需要进行扩展以满足您的需求。
查询作为字符串从客户端提交给主站。 查询可能是
通常会被处理的排序 普默 (蛋白质序列与蛋白质数据库),
嗯搜索 (蛋白质 HMM 查询与蛋白质数据库),或 扫一扫 (蛋白质查询与蛋白质
HMM 数据库)。
客户端查询的一般形式是从形式的单行开始 @[选项],
后跟表示查询 HMM 或 fasta 格式的多行文本
序列。 每个查询的最后一行是分隔符 //.
例如,要执行一个 普默 针对序列数据库对序列进行类型搜索
文件,第一行的形式 @--seqdb 1,然后是 fasta 格式的查询序列
从标题行开始 > 序列名称,后跟一行或多行序列,
最后是闭幕 //.
要执行 嗯搜索 类型搜索,查询序列被替换为一个的全文
HMMER 格式的查询 HMM。
要执行 扫一扫 键入搜索,文本匹配 普默 类型搜索,除了
第一行更改为 @--嗯数据库 1.
在 hmmpgmd 格式的序列数据库文件中,每个序列可以关联一个
或多个子数据库。 这 --seqdb 标志指示这些子数据库中的哪个将是
询问。 HMM 数据库格式不支持子数据库。
每个查询的结果都是二进制格式的未记录数据结构。 在将来
数据将以适当的序列化结构返回,但现在,它需要
在客户端内进行细致的拆包。 示例客户端展示了这是如何完成的。
配置
-h 帮助; 打印命令行用法和所有可用选项的简短提醒。
专家 配置
- 掌握
作为主服务器运行。
- 工人
作为工作者运行,连接到在 IP 地址上运行的主服务器 .
--守护进程
使用配置文件作为守护进程运行:/etc/hmmpgmd.conf
--端口
用于客户端和主服务器之间通信的端口。 默认的
是51371。
--wport
用于工作程序和主服务器之间通信的端口。 默认的
是51372。
--cccnts
要接受的最大客户端连接数。 默认值为 16。
--wcncts
要接受的最大工作连接数。 默认值为 32。
--pid
将写入进程 ID 的文件的名称。
--seqdb
包含蛋白质序列的文件的名称(以 hmmpgmd 格式)。 的内容
该文件将被缓存以供搜索。
--hmmdb
包含蛋白质 HMM 的文件的名称。 该文件的内容将被缓存
用于搜索。
- 中央处理器
要使用的并行线程数(对于 - 工人 ).
使用 onworks.net 服务在线使用 hmmpgmd