这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的 sigma 命令,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
sigma - 非编码 DNA 序列的简单贪婪多重比对
概要
西格玛 [选项] [输入文件.fasta[输入文件2.fasta ...]
每个 fasta 文件可能包含单个序列或多个序列; 所有序列都将是
对齐在一起。
商品描述
西格玛 ("Simple greedy multiple alignment") 是一个新算法的对齐程序
和专门为非编码 DNA 序列设计的评分方案。 它使用一种策略
寻求最好的无间隙局部对齐,在每一步都做出最好的
可能的对齐方式与现有的对齐方式一致,并对结果的重要性进行评分
基于对齐片段的长度和背景模型进行对齐
由基因间 DNA 的辅助文件提供或估计。 使用真实数据,同时
“正确性”不能直接量化比对,运行 PhyloGibbs 主题
预比对序列上的 finder 表明 Sigma 的比对更胜一筹。
配置
-A --对齐输出
对齐的、漂亮的打印输出(与 -F 选项)(默认值:仅此)。 也可以看看
-C.
-b --bgprob文件 文件名
从中读取背景序列的辅助文件(fasta 格式)(由
-B)。 通常这是一个包含大量类似非编码的文件
序列,从中可以得出单核苷酸和双核苷酸的背景概率
估计。
-B --bgseq文件 文件名
包含背景概率的文件。 下面进一步描述该格式。
-C --仅大写字母
在输出序列中只使用大写字母,以兼容某些输出
其他程序,如 ClustalW 和 MLagan。 默认情况下,输出是大小写混合的(如
Dialign),并且小写的基数被视为未对齐。
-F --fasta_输出
多 fasta 输出(可以同时使用 -A 和 -F 以任一顺序)。 也可以看看 -C.
-n --n相关性 数
背景相关性(默认 2=二核苷酸; 1=单站点基数, 0=0.25 每
根据)。
-x, - 意义 数
设置匹配概率的限制(默认 0.002,更小=更多
严格)。
-h, - 帮帮我
显示此选项列表。
了解更多 帮助
“重要性”参数(-x) 确定是否接受局部对齐或
拒绝了。 目前的默认值为 0.002。 合成数据的实验(在
论文)建议 0.002 是 sigma 无法对齐的阈值
具有中等(酵母样)二核苷酸相关性的系统发育无关数据。
使用适合被比对的序列的“背景模型”可以大大减少
合成数据上的虚假对齐(有人希望,真实数据也是如此)。 最简单的方法
为确保供应,通过 -b 参数,一个包含大的 FASTA 格式的文件
大量相似序列数据(例如,如果比对酵母序列,请提供一个文件
包含所有基因间酵母序列)。
取而代之的是,如果单点频率和二核苷酸频率已知,则它们
可以通过文件提供 -B 选项。 文件格式应为:每个条目一个
行,单核苷酸或二核苷酸(不区分大小写)后跟
频率。 (例如,连续行中的“A 0.3”、“AT 0.16”等。)示例文件位于
源代码分发的“背景”子目录(在 Debian 系统上,这个文件可以是
发现于 /usr/share/doc/sigma-align/背景 目录)。 像这样的文件
MEME 源代码分发的“tests”子目录中的“yeast.nc.3.freq”工作正常
(三核苷酸计数被忽略)。
参考
请引用 Sigma: Rahul Siddharthan (2006) 弱保守的多重对齐
非编码 DNA 序列 BMC Bioinformatics 2006, 7:143 doi:10.1186/1471-2105-7-143
16 年 2006 月 XNUMX 日发布,可在线获取: http://www.biomedcentral.com/1471-2105/7/143/
作者
拉胡尔 悉达多 <[电子邮件保护]>
写西格玛。 如果您使用 Sigma 进行实际研究,请告知作者
他可以提醒您有关错误修正或新版本的信息。
查尔斯 普莱西 <[电子邮件保护]>
用 DocBook XML 为 Debian 发行版编写了联机帮助页。
版权
版权所有 © 2006-2007 Rahul Siddharthan
版权所有 © 2006-2007 Charles Plessy
Sigma 是免费软件。 您可以根据以下条款重新分发和/或修改它
由自由软件基金会发布的 GNU 通用公共许可证。
在 Debian 系统上,可以在以下位置找到 GNU 通用公共许可证的完整文本
/usr/share/common-licenses/GPL。
使用 onworks.net 服务在线使用 sigma