这是命令 convert_project 可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
convert_project - 转换程序集和排序文件类型
商品描述
该程序是 MIRA 汇编程序包的一部分。 它用于转换项目文件
类型转换成其他类型。 请查看下面的文档以获取更详细的信息
关于 convert_project 的信息。
概要
转换项目
[-F ] [-t [-t ...]] [-aChimMsuZ] [-AcflnNoqrtvxXyz
{...}] {输入文件} {输出文件} [ ...]
配置
-f
加载这种类型的项目文件,其中 fromtype 是:
caf 来自 CAF 的完整组装或单个序列
maf 来自 CAF 的完整程序集或单个序列
来自 FASTA 文件的 fasta 序列
来自 FASTQ 文件的 fastq 序列
来自 GBF 文件的 gbf 序列
来自 PHD 文件的 phd 序列
福夫内普
来自文件名文件的 EXP 文件中的序列
-t
将序列/程序集写入此类型(多次提及 -t 被允许):
ace 序列或完全组装到 ACE
caf 序列或完全组装到 CAF
maf 序列或完全组装到 MAF
SAM 完整组装到 SAM
samnbb 像上面一样,但在映射程序集中省略了引用(主干)
gbf 序列或与 GBF 一致
gff3 对 GFF3 的共识
假发组件覆盖信息到摆动文件
gcwig 组装 gc 内容信息到摆动文件
fasta 序列或共识到 FASTA 文件(质量到
.qual)
fastq 序列或共识到 FASTQ 文件
exp 序列或完整的汇编到 EXP 文件中
目录。 完整的装配体适用于作为定向装配体的 gap4 导入。
注意:虽然建议使用 caf2gap 导入到 gap4
文本完成组装到文本对齐(仅当 -f is
caf、maf 或 gbf)
html 完整的汇编到 HTML(仅当 -f 是 caf、maf 或
GBF)
tcs 完成组装到 tcs
hsnp 围绕 SNP 标签(SROc、SAOc、SIOc)到 HTML(仅当 -f 是 caf、maf 或
GBF)
SNP 标签的 asnp 分析(仅当 -f 是 caf、maf 或 gbf)
来自 MIRA 的 cstats contig 统计文件(仅当源包含 contigs 时)
crlist contig 从 MIRA 读取列表文件(仅当源包含 contigs 时)
蒙面法斯塔
将测序载体被屏蔽(用 X)读取到 FASTA 文件(质量为
.qual)
scaf 序列或完全组装成单个序列 CAF
-a 附加到目标文件而不是重写
-A
带有要解析的 MIRA 参数的字符串 在设置影响参数时很有用
共识呼唤 -一氧化碳:mrpg 等。例如: -a "454_设置 -一氧化碳:mrpg=3"
-b 盲数据用“c”替换读取/重叠群中的所有碱基
-C 执行硬剪辑读取读取定义剪辑点的格式时,将
仅将未剪辑的部分保存到结果文件中。
仅适用于不包含
重叠群。
-d 仅删除间隙列 当输出为 contigs 时:删除列
完全空白(例如在 gap4 或类似的编辑过程中删除读取之后)
当输出为读取时:删除读取间隙
-F 过滤读取组 特殊用例,尚未使用。
-m 制作重叠群(仅适用于 -t = caf 或 maf) 将单个读取作为 contig singlets 封装到
CAF/MAF 文件。
-n
给定时,仅选择该文件中按名称给出的读取或重叠群。
-i ,尤其是 -n 使用,反转选择
-o fastq 质量偏移(仅适用于 -f = 'fastq') FASTQ 中质量值的偏移
文件。 默认值 0 尝试自动识别。
-Q
为没有质量值的文件类型中的碱基设置默认质量此外,请执行
如果缺少预期的质量文件(例如“.fasta”),则不会停止
-R
使用计数器所在的给定名称字符串重命名 contigs/singlets/reads
附加。 已知错误:如果输入将创建重复名称
包含 contigs/singlets 以及 free read,即reads not in contigs or
单线态。
-S
(名称)重命名读取的方案,对双端很重要只有“solexa”是
目前支持。
这款 以下 开关 工作 仅由 ,尤其是 输入 (CAF or 马夫) 包含 重叠群。
注意:CAF 和 MAf 也可以只包含读取。
-M 不要提取重叠群(或它们的共识),而是提取它们的读取序列
由...组成的。
-N
喜欢 -n, 但根据文件中给定的顺序对输出进行排序。
-r [cCqf]
重新计算共识和/或共识质量值和/或 SNP 特征标签。
'c' 重新计算优缺点(使用 IUPAC) 'C' 重新计算优缺点
(强制非 IUPAC)“q”重新计算共识质量仅“f”重新计算 SNP 特征
注意:只有 cCq 的最后一个是相关的,f 用作
switch 并且可以与 cQq 结合使用(例如“-r C -r F”)
注意:如果 CAF/MAF 包含多个菌株,则重新计算 cons & cons
品质是被迫的,你
只能影响是否使用 IUPAC。
-s 将输出拆分为多个文件而不是创建单个文件
-u 'fillUp 菌株基因组' 填充一个菌株(N 或 @)基因组中的空洞
来自其他菌株的共有序列 仅与 -r 和 -t gbf 或
FASTA/Q 中的 fasta/q:填充的碱基在 GBF 中是小写的:填充的碱基是
大写
-q
定义菌株的共识基础必须具有的最低质量,共识基础
下面这将是 'N' 默认值:0 仅用于 -r及 -f 是 caf/maf 和 -t is
(法斯塔
或 gbf)
-v 打印版本号并退出
-x
最小重叠群或读取长度加载时,丢弃所有重叠群/读取
长度小于这个值。 默认值:0(=关闭) 注意:不适用于读取
在重叠群中!
-X
像 -x 但仅适用于读取,然后适用于剪切长度。
-y
最小平均重叠群覆盖率加载时,丢弃所有平均重叠群
覆盖率小于此值。 默认值:1
-z
contig 中的最小读取数加载时,丢弃所有带有数字的 contig
读取数小于此值。 默认值:0(=关闭)
-l
当输出为文本或 HTML 时:一条对齐线中显示的碱基数。 默认:
60.
-c
当输出为文本或 HTML 时:用于填充端隙的字符。 默认值:“ ”(空白)
别名:caf2html、exp2fasta、...等。“的任意组合2 ”
可以用作程序名称(也使用链接),以便自动转换项目
套 -f 和 -t 因此。
示例
转换项目 source.maf dest.sam
convert_project source.caf dest.fasta 假发王牌
convert_project -x 2000 -y 10 源.caf 目标.caf
caf2html -l 100 -c 。 源.caf dest
使用 onworks.net 服务在线使用 convert_project