英语法语西班牙文

OnWorks 网站图标

cdhit-est - 云端在线

在 OnWorks 免费托管服务提供商中通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器运行 cdhit-est

这是 cdhit-est 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


cdhit-est - 在 RNA/DNA 序列上运行 CD-HIT 算法

概要


cdhit 测试 [附加选项]

商品描述


====== CD-HIT 4.6 版(构建于 23 年 2016 月 XNUMX 日)======

附加选项

-i fasta 格式的输入文件名,必需

-o 输出文件名,必填

-c 序列标识阈值,默认 0.9 这是默认的 cd-hit 的“全局
序列同一性”计算为:比对中相同氨基酸的数量
除以较短序列的全长

-G 使用全局序列标识,如果设置为 1,则默认为 0,则使用本地序列
同一性,计算为:比对中相同氨基酸的数量除以
对齐的长度注意!!! 不要使用 -G 0 除非你使用对齐
覆盖控制见选项 -aL, -AL, -作为, -作为

-b 对齐带宽,默认 20

-M 程序的内存限制(以 MB 为单位),默认为 800; 0 为无限;

-T 线程数,默认1; 为 0,将使用所有 CPU

-n word_length,默认为10,选择请看用户指南

-l throw_away_sequences 的长度,默认 10

-d .clstr 文件中的描述长度,默认为 20,如果设置为 0,则采用 fasta
defline 并在第一个空格处停止

-s 长度差截断,默认为 0.0 如果设置为 0.9,较短的序列需要
至少是集群代表的 90% 的长度

-S 氨基酸长度差异截止,默认为 999999 如果设置为 60,长度
较短的序列和聚类的代表之间的差异可以
不大于 60

-aL 较长序列的对齐覆盖率,如果设置为 0.0,则默认为 0.9,
比对必须覆盖 90% 的序列

-AL 较长序列的对齐覆盖控制,如果设置为 99999999,则默认为 60,
并且序列的长度为400,那么比对必须>= 340 (400-60)
残留物

-作为 较短序列的对齐覆盖率,如果设置为 0.0,则默认为 0.9,
比对必须覆盖 90% 的序列

-作为 较短序列的对齐覆盖控制,如果设置为 99999999,则默认为 60,
并且序列的长度为400,那么比对必须>= 340 (400-60)
残留物

-A 两个序列的最小比对覆盖控制,默认 0 比对必须
覆盖 >= 两个序列的这个值

-uL 较长序列的最大不匹配百分比,如果设置为 1.0,则默认为 0.1,
不匹配区域(不包括前后间隙)不得超过 10%
序列的

-我们 较短序列的最大不匹配百分比,如果设置为 1.0,则默认为 0.1,
不匹配区域(不包括前后间隙)不得超过 10%
序列的

-U 最大未匹配长度,默认为 99999999 如果设置为 10,则为未匹配区域
(不包括首尾空格)不得超过 10 个碱基

-B 1 或 0,默认为 0,默认情况下,如果设置为 1,则序列存储在 RAM 中,序列
存储在硬盘上,建议使用 -B 1 用于大型数据库

-p 1 或 0,如果设置为 0,则默认为 1,在 .clstr 文件中打印对齐重叠

-g 1 或 0,默认 0 通过 cd-hit 的默认算法,一个序列被聚类到
第一个满足阈值的集群(快速集群)。 如果设置为 1,程序将
将其聚类到满足阈值的最相似的聚类中(准确但速度较慢
模式)但 1 或 0 不会改变最终集群的代表

-r 1 或 0,默认为 1,如果设置为 0,则默认同时进行 +/+ 和 +/- 对齐,仅 +/+
链对齐

-面具 掩蔽字母(例如 -面具 NX,同时屏蔽“N”和“X”)

-比赛 匹配分数,默认为 2(TU 和 NN 为 1)

-不匹配
失配分数,默认 -2

-差距 差距开局得分,默认 -6

-间隙扩展
差距扩展分数,默认 -1

-巴克 写入备份集群文件(1 或 0,默认为 0)

-h 打印此帮助

问题,错误,请联系 Limin Fu [电子邮件保护], 或李伟中 [电子邮件保护]
有关更新版本和信息,请访问: http://cd-hit.org

cd-hit web 服务器也可以从 http://cd-hit.org

如果您觉得 cd-hit 有用,请引用:

“高度同源序列的聚类以减少大蛋白质的大小
数据库”, Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Bioinformatics, (2001)
17:282-283 "Cd-hit:一个用于聚类和比较大集合的快速程序
蛋白质或核苷酸序列”, Weizhong Li & Adam Godzik. Bioinformatics, (2006)
22:1658-1659

使用 onworks.net 服务在线使用 cdhit-est


免费服务器和工作站

下载 Windows 和 Linux 应用程序

  • 1
    电源管理员
    电源管理员
    Poweradmin 是一个基于 Web 的 DNS
    PowerDNS 服务器的管理工具。
    该界面完全支持大多数
    PowerDNS 的特点。 它有完整的
    支持...
    下载Poweradmin
  • 2
    Gin 网络框架
    Gin 网络框架
    Gin 是一个非常快的 Web 框架
    用 Golang 编写,最多可以执行
    快了 40 倍,这要归功于它的
    类似马提尼的 API 和自定义版本
    http路由...
    下载 Gin Web 框架
  • 3
    CEREUS Linux
    CEREUS Linux
    CEREUS LINUX 和 MX LINUX 控制器
    各种不同的写入方式。 这是
    也可以获取的应用程序

    https://sourceforge.net/projects/cereu...
    下载CEREUS LINUX
  • 4
    任务教练
    任务教练
    任务教练 - 你的友好任务
    经理。 任务教练是免费开放的
    源待办事项管理器。 它长出了
    对其他程序的挫败感
    处理复合...
    下载任务教练
  • 5
    HyperSQL数据库引擎(HSQLDB)
    HyperSQL数据库引擎(HSQLDB)
    HSQLDB是一个关系数据库引擎
    用 Java 编写,带有 JDBC 驱动程序,
    符合 ANSI SQL:2016。 一个小的,
    快速、多线程引擎和服务器
    与记忆...
    下载 HyperSQL 数据库引擎 (HSQLDB)
  • 6
    蜡染恢复
    蜡染恢复
    由 Batik 开发的 Project Recovery
    来自印度尼西亚的恢复团队合作,这
    蜡染恢复是蜡染的衍生物
    官方 TWRP 已由
    开发...
    下载蜡染恢复
  • 更多 ”

Linux 命令

Ad