这是 cdhit-est 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
cdhit-est - 在 RNA/DNA 序列上运行 CD-HIT 算法
概要
cdhit 测试 [附加选项]
商品描述
====== CD-HIT 4.6 版(构建于 23 年 2016 月 XNUMX 日)======
附加选项
-i fasta 格式的输入文件名,必需
-o 输出文件名,必填
-c 序列标识阈值,默认 0.9 这是默认的 cd-hit 的“全局
序列同一性”计算为:比对中相同氨基酸的数量
除以较短序列的全长
-G 使用全局序列标识,如果设置为 1,则默认为 0,则使用本地序列
同一性,计算为:比对中相同氨基酸的数量除以
对齐的长度注意!!! 不要使用 -G 0 除非你使用对齐
覆盖控制见选项 -aL, -AL, -作为, -作为
-b 对齐带宽,默认 20
-M 程序的内存限制(以 MB 为单位),默认为 800; 0 为无限;
-T 线程数,默认1; 为 0,将使用所有 CPU
-n word_length,默认为10,选择请看用户指南
-l throw_away_sequences 的长度,默认 10
-d .clstr 文件中的描述长度,默认为 20,如果设置为 0,则采用 fasta
defline 并在第一个空格处停止
-s 长度差截断,默认为 0.0 如果设置为 0.9,较短的序列需要
至少是集群代表的 90% 的长度
-S 氨基酸长度差异截止,默认为 999999 如果设置为 60,长度
较短的序列和聚类的代表之间的差异可以
不大于 60
-aL 较长序列的对齐覆盖率,如果设置为 0.0,则默认为 0.9,
比对必须覆盖 90% 的序列
-AL 较长序列的对齐覆盖控制,如果设置为 99999999,则默认为 60,
并且序列的长度为400,那么比对必须>= 340 (400-60)
残留物
-作为 较短序列的对齐覆盖率,如果设置为 0.0,则默认为 0.9,
比对必须覆盖 90% 的序列
-作为 较短序列的对齐覆盖控制,如果设置为 99999999,则默认为 60,
并且序列的长度为400,那么比对必须>= 340 (400-60)
残留物
-A 两个序列的最小比对覆盖控制,默认 0 比对必须
覆盖 >= 两个序列的这个值
-uL 较长序列的最大不匹配百分比,如果设置为 1.0,则默认为 0.1,
不匹配区域(不包括前后间隙)不得超过 10%
序列的
-我们 较短序列的最大不匹配百分比,如果设置为 1.0,则默认为 0.1,
不匹配区域(不包括前后间隙)不得超过 10%
序列的
-U 最大未匹配长度,默认为 99999999 如果设置为 10,则为未匹配区域
(不包括首尾空格)不得超过 10 个碱基
-B 1 或 0,默认为 0,默认情况下,如果设置为 1,则序列存储在 RAM 中,序列
存储在硬盘上,建议使用 -B 1 用于大型数据库
-p 1 或 0,如果设置为 0,则默认为 1,在 .clstr 文件中打印对齐重叠
-g 1 或 0,默认 0 通过 cd-hit 的默认算法,一个序列被聚类到
第一个满足阈值的集群(快速集群)。 如果设置为 1,程序将
将其聚类到满足阈值的最相似的聚类中(准确但速度较慢
模式)但 1 或 0 不会改变最终集群的代表
-r 1 或 0,默认为 1,如果设置为 0,则默认同时进行 +/+ 和 +/- 对齐,仅 +/+
链对齐
-面具 掩蔽字母(例如 -面具 NX,同时屏蔽“N”和“X”)
-比赛 匹配分数,默认为 2(TU 和 NN 为 1)
-不匹配
失配分数,默认 -2
-差距 差距开局得分,默认 -6
-间隙扩展
差距扩展分数,默认 -1
-巴克 写入备份集群文件(1 或 0,默认为 0)
-h 打印此帮助
问题,错误,请联系 Limin Fu [电子邮件保护], 或李伟中 [电子邮件保护]
有关更新版本和信息,请访问: http://cd-hit.org
cd-hit web 服务器也可以从 http://cd-hit.org
如果您觉得 cd-hit 有用,请引用:
“高度同源序列的聚类以减少大蛋白质的大小
数据库”, Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Bioinformatics, (2001)
17:282-283 "Cd-hit:一个用于聚类和比较大集合的快速程序
蛋白质或核苷酸序列”, Weizhong Li & Adam Godzik. Bioinformatics, (2006)
22:1658-1659
使用 onworks.net 服务在线使用 cdhit-est