这是 rabema_evaluate 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
rabema_evaluate - RABEMA 评估
概要
rabema_evaluate [选项] - 参考 参考文献fa --in-gsi 输入文件 --in-sam 映射文件
rabema_evaluate [选项] - 参考 参考文献fa --in-gsi 输入文件 --in-bam 映射文件
商品描述
将任何读取映射器的 SAM/bam 输出 MAPPING.sam/MAPPING.bam 与
以前使用 rabema_build_gold_standard 构建的 RABEMA 黄金标准。 输入是
参考 FASTA 文件、黄金标准间隔 (GSI) 文件和 SAM/BAM 输入
评估。
输入 SAM/BAM 文件必须按查询名称排序。 该程序将创建一个 FASTA
索引文件 REF.fa.fai 用于快速随机访问参考。
-h, - 帮帮我
显示此帮助消息。
- 版
显示版本信息
-v, --详细
启用详细输出。
-vv, --非常详细
启用更详细的输出。
输入/输出:
-r, - 参考 FASTA
从中加载引用 FASTA 的路径。 有效的文件类型是:fa 和 fasta。
-g, --in-gsi GSI
从中加载黄金标准间隔的路径。 如果使用 gzip 压缩,文件将
即时解压。 有效的文件类型为:gsi 和 gsi.gz。
-s, --in-sam SAM
加载读取映射器 SAM 输出的路径。 有效的文件类型是:sam。
-b, --in-bam BAM的
加载读取映射器 BAM 输出的路径。 有效的文件类型是:bam。
--out-tsv TSV
将统计信息写入为 TSV 的路径。 有效的文件类型是:tsv。
基准参数:
--oracle 模式
启用预言机模式。 当输入 GSI 文件给出时,这用于模拟数据
恰好一个位置被认为是真正的样本位置。 对于模拟
数据。
--仅唯一读取
考虑仅读取映射结果文件中的单个对齐。 有用的
精确计算。
--匹配-N
设置后,N 匹配所有字符而不会受到惩罚。
--距离度量 公制
设置距离度量。 有效值:汉明、编辑。 默认:编辑。 汉明和
编辑。 默认:编辑。
-e, --最大错误 率
以百分比为单位建立黄金标准的最大错误率。 这个参数是一个
整数和相对于读取长度。 oracle模式下错误率被忽略,
此处获取样本位置处的读取距离,分别为
每次阅读。 默认值:0 默认值:0。
-c, --基准类别 喵星人
设置基准类别。 {all, all-best, any-best之一。 默认值:所有之一,
最好的,任何最好的。 默认值:全部。
--信任-NM
设置后,我们信任与 SAM/BAM 文件的对齐和距离,无需重新对齐
被执行。 默认关闭。
--忽略配对标志
设置后,我们将忽略与配对相关的所有 SAM/BAM 标志。 这是必要的,当
从 SOAP 的 soap2sam.pl 脚本分析 SAM。
--不要恐慌
如果发现额外的命中表明
黄金标准是不正确的。
正在记录:
--显示错过的时间间隔
显示 GSI 中每个错过的间隔的详细信息。
--显示无效点击数
显示无效命中的详细信息(错误率太高)。
--显示额外点击数
显示额外命中的详细信息(错误率足够低,但不符合黄金标准。
--显示命中
显示命中间隔的详细信息。
--显示-尝试-命中
在 SAM/BAM 输入中显示每个对齐的详细信息。
在读取映射器的输出中出现“无效”命中不是错误。 如果
还有额外的命中,但是,这表明黄金标准存在错误。
返回值
返回值 0 表示成功,任何其他值表示错误。
内存要求
从 1.1 版开始,我们非常小心地将内存要求保持在较低的水平
尽可能。
评估步骤需要将整个参考序列存储在内存中,但
多一点记忆。 所以,对于人类基因组,记忆需求低于4
GB,与 GSI 或 SAM/BAM 文件的大小无关。
参考文献:
M. Holtgrewe, A.-K. Emde、D. Weese 和 K. Reinert。 一个新的和定义明确的
第二代读取映射的基准方法,BMC 生物信息学 2011,
12:210。
http://www.seqan.de/rabema
拉贝玛主页
http://www.seqan.de/mason
梅森主页
VERSION
rabema_evaluate 版本:1.2.0 最后更新 14 年 2013 月 XNUMX 日
使用 onworks.net 服务在线使用 rabema_evaluate