这是 rabema_build_gold_standard 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
rabema_build_gold_standard - RABEMA 黄金标准生成器
概要
rabema_build_gold_standard [选项] --out-gsi 输出文件 - 参考 参考文献fa --in-sam
PERFECT.sam rabema_build_gold_standard [选项] --out-gsi 输出文件 - 参考
参考文献fa --in-bam 完美.bam
商品描述
该程序允许建立 RABEMA 黄金标准。 输入是参考FASTA
文件和完美的 SAM/BAM 映射(例如使用 RazerS 3 以全灵敏度创建
模式)。
输入的 SAM/BAM 文件必须按坐标排序。 该程序将创建一个
FASTA 索引文件 REF.fa.fai 用于快速随机访问参考。
-h, - 帮帮我
显示此帮助消息。
- 版
显示版本信息
-v, --详细
启用详细输出。
-vv, --非常详细
启用更详细的输出。
输入/输出:
-o, --out-gsi GSI
将生成的 GSI 文件写入的路径。 有效的文件类型为:gsi 和 gsi.gz。
-r, - 参考 FASTA
从中加载引用 FASTA 的路径。 有效的文件类型是:fa 和 fasta。
-s, --in-sam SAM
从中加载“完美”SAM 文件的路径。 有效的文件类型是:sam。
-b, --in-bam BAM的
从中加载“完美”BAM 文件的路径。 有效的文件类型是:bam。
黄金标准参数:
--oracle 模式
启用预言机模式。 当输入 SAM/BAM 文件时,这用于模拟数据
正好给出一个被认为是真实样本位置的位置。
--匹配-N
设置后,N 匹配所有字符而不会受到惩罚。
--距离度量 公制
设置距离度量。 有效值:汉明、编辑。 默认:编辑。 汉明和
编辑。 默认:编辑。
-e, --最大错误 率
以百分比为单位建立黄金标准的最大错误率。 这个参数是一个
整数和相对于读取长度。 在oracle模式的情况下,错误率
使用采样位置的读数,并将 RATE 用作截止阈值。
默认值:0
返回值
返回值 0 表示成功,任何其他值表示错误。
示例
rabema_build_gold_standard -e 4 -o 输出文件 -s 山姆 -r 参考文献fa
从包含所有映射位置和 FASTA 的 SAM 文件 IN.sam 构建黄金标准
将 REF.fa 引用到 GSI 文件 OUT.gsi,最大错误率为 4。
rabema_build_gold_standard --距离度量 编辑 -e 4 -o 输出文件 -b 巴姆 -r
参考文献fa
同上,但使用汉明而不是编辑距离和 BAM 作为输入。
rabema_build_gold_standard --oracle 模式 -o 输出文件 -s 山姆 -r 参考文献fa
从具有原始样本位置的 SAM 文件 IN.sam 构建黄金标准,例如
由读取模拟器 Mason 导出。
内存要求
从 1.1 版开始,我们非常小心地将内存要求保持在较低的水平
尽可能。 需要的内存是最大染色体大小的两倍
为每场比赛加上一些恒定的记忆。
例如,以 100% 的错误率读取 5bp 人类基因组的内存使用量为
1.7GB。 其中,大约 400GB 来自染色体,1.3GB 来自匹配。
参考文献:
M. Holtgrewe, A.-K. Emde、D. Weese 和 K. Reinert。 一个新的和定义明确的
第二代读取映射的基准方法,BMC 生物信息学 2011,
12:210。
http://www.seqan.de/rabema
拉贝玛主页
http://www.seqan.de/mason
梅森主页
VERSION
rabema_build_gold_standard 版本:1.2.0 最后更新 14 年 2013 月 XNUMX 日
使用 onworks.net 服务在线使用 rabema_build_gold_standard