这是 tigr-glimmer3 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
tigr-glimmer — 使用概率模型在基因组文件中查找/评分潜在基因
icm 文件
概要
老虎闪光3 [基因组文件] [icm 文件] [[选项]]
商品描述
老虎微光 是一种在微生物 DNA 中寻找基因的系统,尤其是
细菌和古细菌。 老虎微光 (Gene Locator and Interpolated Markov Modeler) 使用
内插马尔可夫模型 (IMM) 以识别编码区域并将它们与
非编码 DNA。 IMM 方法,在我们的核酸研究论文中描述 老虎-
微光 1.0 和我们随后的论文中 老虎微光 2.0,使用马尔可夫的组合
从一阶到八阶的模型,根据其预测能力对每个模型进行加权。
老虎微光 1.0 和 2.0 在它们的 IMM 中使用 3-周期非齐次 Markov 模型。
老虎微光 是 TIGR 的主要微生物基因发现者,并已被用于注释
B. burgdorferi (Fraser et al., Nature, Dec. 1997), T. pallidum 的完整基因组
(Fraser 等人,Science,1998 年 XNUMX 月)、T. maritima、D. radiodurans、M.tuberculosis 和
非 TIGR 项目,包括沙眼衣原体、肺炎衣原体等。 其分析
其中一些基因组和其他基因组可在 TIGR 微生物数据库站点上找到。
一个特殊版本 老虎微光 专为小型真核生物而设计的 GlimmerM,用于
在疟原虫 P. falciparum 的 2 号染色体中找到基因。 GlimmerM 是
在 SL Salzberg、M. Pertea、AL Delcher、MJ Gardner 和 H. Tettelin 中描述,
“用于真核基因发现的内插马尔可夫模型”,基因组学 59(1999),24-31。
点击这里 (http://www.tigr.org/software/glimmerm/) 访问 GlimmerM 站点,其中
包括有关如何下载 GlimmerM 系统的信息。
这款 老虎微光 系统由两个主要程序组成。 其中第一个是训练
程序,构建-imm。 该程序采用一组输入序列并构建和输出
他们的 IMM。 这些序列可以是完整的基因或只是部分 orfs。 对于一个新
基因组,该训练数据可以由那些具有强大数据库命中的基因以及
非常长的开放阅读框,在统计上几乎可以肯定是基因。 这
第二个程序是 glimmer,它使用这个 IMM 来识别整个
基因组。 老虎微光 通过自动解决大多数重叠基因之间的冲突
选择其中之一。 它还识别被怀疑真正重叠的基因,并且
标记这些以供用户仔细检查。 这些“可疑”基因候选者已经
迄今为止分析的所有基因组总数的很小一部分。 老虎微光
是一个程序...
配置
-C n 使用 n 作为独立模型的 GC 百分比
注意:n 应为百分比,例如 -C 45.2
-f 使用核糖体结合能选择起始密码子
+f 使用 orf 中的第一个密码子作为起始密码子
-g n 将最小基因长度设置为 n
-i 文件名
使用 VHDL 语言编写 文件名 至 选择 地区 of 基础 这 旨在 折扣 限制, so 这 没有 基础
中 这 区 将 be 检查
-l 假设是线性基因组而不是环状基因组,即没有环绕
-L 文件名
使用 filename 指定应该单独评分的 orfs 列表,没有
重叠规则
-M 输入是要单独评分的单独基因的 multifasta 文件,没有
重叠规则
-o n 将最小重叠长度设置为 n。 比这短的重叠将被忽略。
-p n 将最小重叠百分比设置为 n%。 重叠短于这个百分比
*两个* 字符串都被忽略。
-q n 设置可以被拒绝的最大长度 orf
概率得分列到 (n - 1)
-r 不要使用独立概率得分列
+r 使用独立概率得分列
-r 不要使用独立概率得分列
-s s 使用字符串 s 作为核糖体结合模式来查找起始密码子。
+S 使用更严格的独立基因间模型,不会给出概率
框内终止密码子。 (选项已过时,因为这是现在唯一的行为
-t n 将作为基因调用的阈值分数设置为 n。 如果帧内得分 >= n,则
该区域被赋予一个编号,并被认为是一个潜在的基因。
-w n 对 n 或更长的暂定基因使用“弱”分数。 弱分数忽略
独立概率得分。
使用 onworks.net 服务在线使用 tigr-glimmer3