这是可以使用我们的多个免费在线工作站之一(例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器)在 OnWorks 免费托管服务提供商中运行的命令 phytime
程序:
您的姓名
phytime - 来自大序列比对的发散时间的贝叶斯估计
商品描述
来自分子序列的发散时间的贝叶斯估计依赖于复杂的
马尔可夫链蒙特卡罗技术和 Metropolis-Hastings (MH) 采样器
在该上下文中成功使用。 这种方法涉及沉重的计算负担,
可能会阻碍对大型系统基因组数据集的分析。 可靠的散度估计
对于序列比对,时间也可能非常耗时,如果不是不可能的话
传达微弱或相互矛盾的系统发育信号,强调需要更多
有效的抽样方法。 本文介绍了一种估计
替代率和节点时间的后验密度。 利率的先验分布
考虑了它们沿谱系的潜在自相关性,而节点年龄的先验
以均匀密度建模。 此外,似然函数近似为
多元正态密度。 这些组件的组合导致方便
数学简化,允许速率和时间的后验分布
使用 Gibbs 采样算法估计。 四个真实世界数据集的分析
表明该采样器优于标准 MH 方法并证明了
这种新方法适用于分析大型和/或困难的数据集。
概要
物理时间 [命令参数]
配置
除了“-i”、“-u”和“--calibration”之外,下面的所有选项都是可选的。
命令选项:
-i(或 - 输入) seq_文件名
seq_file_name 是 PHYLIP 中核苷酸或氨基酸序列文件的名称
格式。
-d (或 - 数据类型) 数据类型
data_type 是 'nt' 表示核苷酸(默认),'aa' 表示氨基酸序列,或
'generic',(在此处使用 NEXUS 文件格式和 'symbols' 参数)。
-q (或 --顺序)
将交错格式(默认)更改为顺序格式。
-m (或 - 模型) 模型
模型:替代模型名称。 - 基于核苷酸的模型:HKY85(默认)|
JC69 | K80 | F81 | F84 | TN93 | GTR | custom (*) (*) : 对于自定义选项,一个
六位数的字符串标识模型。 例如,000000
对应于 F81(或 JC69,前提是核苷酸频率的分布为
制服)。 012345 对应于 GTR。 此选项可用于编码任何
嵌套在 GTR 中的模型。
- 基于氨基酸的模型:LG(默认)| WAG | JTT | MtREV | 戴霍夫 | DCMut |
RtREV | CPREV | VT
Blosum62 | 妈妈 | 艺术 | 艾滋病毒 |
艾滋病病毒 | 风俗
--aa_rate_file 文件名
filename 是提供氨基酸替换率的文件名
PAML 格式的矩阵。 分析氨基时必须使用此选项
带有“自定义”模型的酸序列。
- 校准 文件名
文件名是提供先验定义的校准文件的名称
节点年龄的边界。 请阅读手册以获取更多关于
此文件的格式。
-t (或 --ts/tv) ts/tv_ratio
ts/tv_ratio : 转换/转换比。 仅 DNA 序列。 可以是固定的
正值(例如:4.0)或 e 以获得最大似然估计。
-v (或 --pinv) prop_invar
prop_invar :不变位点的比例。 可以是[0,1]中的一个固定值
range 或 e 以获得最大似然估计。
-c (或 --n类) nb_subst_cat
nb_subst_cat :相对替代率类别的数量。 默认 :
nb_subst_cat=4。 必须是正整数。
-a (或 - α) 伽玛
伽马:伽马分布形状参数的分布。 可以是固定的
正值或 e 以获得最大似然估计。
-u (或 --输入树) 用户树文件
user_tree_file : 起始树文件名。 树必须是 Newick 格式。
--r_种子 NUM
num 是用于启动随机数生成器的种子。 必须是整数。
--运行ID ID_字符串
在每个 PhyML 输出文件的末尾附加字符串 ID_string。 此选项可能
在运行涉及 PhyML 的模拟时很有用。
- 安静的
没有交互式问题(以批处理模式运行)和安静的输出。
--无内存检查
没有关于内存使用的交互式问题(以批处理模式运行)。 正常输出
除此以外。
--链长度 NUM
num 是马尔可夫链蒙特卡罗的代数或运行数。 设置
默认为 1E+6。 必须是整数。
--样本频率 NUM
每 num 代对链进行采样。 默认设置为 1E+3。 必须是
整数。
- 没有数据
使用此选项仅从先验中采样(而不是从后关节
模型参数的密度)。
--fastlk
对似然使用多元正态近似并加速
计算
使用 onworks.net 服务在线使用 phytime