这是命令 fasttreeMP,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
fasttreeMP - 根据核苷酸或蛋白质序列的比对创建系统发育树
(openMP 版本)
商品描述
fasttreeMP 从比对中推断出近似最大似然的系统发育树
核苷酸或蛋白质序列。 它处理多达一百万个序列的比对
在合理的时间和内存中。
fasttreeMP 比具有默认设置的 PhyML 3 更准确,并且更准确
与传统上用于大型对齐的距离矩阵方法相比。
fasttreeMP 使用 Jukes-Cantor 或核苷酸的广义时间可逆 (GTR) 模型
进化和 JTT (Jones-Taylor-Thornton 1992) 氨基酸进化模型。 到
考虑到跨站点的不同进化速率,fasttreeMP 使用单一速率
每个站点(“CAT”近似值)。 快速估计每个拆分的可靠性
树,fasttreeMP 使用 Shimodaira-Hasegawa 测试计算本地支持值
(这些与 PhyML 3 的“类似 SH 的本地支持”相同)。
概要
快树MP 蛋白质比对 > 树
快树MP -nt 核苷酸对齐 > 树
快树MP -nt -gtr <核苷酸对齐>树
fasttreeMP 接受 fasta 或 phylip 交错格式的对齐
相当常见 选项 (必须 be before 此 对准 文件):
-安静的 压制报告信息
-没有公关 抑制进度指示器
-日志 日志文件 -- 保存中间树、设置和模型细节
-最快的 -- 加快邻居加入阶段并减少内存使用
(推荐用于 >50,000 个序列)
-n 分析多个对齐方式(仅限 phylip 格式)
(用于全局引导,使用 seqboot 和 CompareToBootstrap.pl)
-没有支持 不计算支持值
-树 newick_file 设置起始树
-intree1 newick_file 将此起始树用于所有对齐
(为了在巨大的对齐上更快地进行全局引导)
-伪 使用伪计数(推荐用于高度缺口序列)
-gtr -- 广义时间可逆模型(仅限核苷酸比对)
-摇摆 -- Whelan-And-Goldman 2001 模型(仅氨基酸比对)
-引用 -- 允许空格和其他受限制的字符(但不是 ' 字符)
输出树中的序列名称和引号名称(仅限 fasta 输入;fasttreeMP
将无法重新读取这些树
-标称 关闭最大似然
-名称 关闭最小进化 NNI 和 SPR
(推荐在运行额外的 ML NNI 时使用 -树)
-名称 -米伦 - -树 优化固定拓扑的分支长度
-猫 # 指定站点的费率类别数(默认为 20)
or -nocat 使用固定利率
-伽马 -- 在CAT近似下优化树后,
重新调整长度以优化 Gamma20 可能性
-约束 约束对齐来约束拓扑搜索
约束对齐应该有 1 或 0 来表示分裂
-专家 -- 查看更多选项
专属 用法 快树MP 2.1.4 上证三:
fasttreeMP [-nt] [-n 100] [-引用] [-伪 | -伪 1.0]
[-启动 1000 | -没有支持] [-intreestarting_trees_file | -intree1
起始树文件] [-安静 | -没有公关] [-nni 10] [-spr 2] [-名称 | -米伦 | -mnni
10] [-mlacc 2] [-cat 20 | XNUMX] [-mlacc XNUMX] [-cat XNUMX | XNUMX] [-mlacc XNUMX] [-cat XNUMX | -nocat] [-gamma] [-慢 | -最快的] [-第二 | -no2]
[-slownni] [-种子 1253] [-顶部| -诺托普] [-topm 1.0 [-关闭 0.75] [-刷新 0.8]]
[-matrix 矩阵 | - 矩阵] [-nj | -比奥尼] [-wag] [-nt] [-gtr] [-gtrrates ac ag 在
cg ct gt] [-gtrfreq ACGT] [ -约束 约束对齐 [ -约束权重
100.0 ] ] [-log 日志文件]
[对齐文件]
> newick_tree
or
fasttreeMP [-nt] [-matrix 矩阵 | - 矩阵] [-rawdist] -makematrix [结盟]
[-n 100] > phylip_distance_matrix
fasttreeMP 默认支持 fasta 或 phylip 交错对齐
期望蛋白质比对,使用 -nt 核苷酸 fasttreeMP 读取标准
如果没有给出对齐文件,则输入
输入输出 opţiuni:
-n -- 读入多个对齐中。这只
使用 phylip 交错格式。 例如,您可以将它与输出一起使用
来自 phylip 的 seqboot。 如果你使用 -n, fasttreeMP 将每行写入 1 棵树到
标准输出。
-树 新文件 -- 从 newickfile 读取起始树。
起始树中的任何分支长度都将被忽略。
-树 - -n 将为每个对齐读取一个单独的起始树。
-intree1 新文件 -- 为每个对齐读取相同的起始树
-安静的 -- 在正常操作期间不要写入标准错误(没有进展
指标、无选项摘要、无似然值等)
-没有公关 -- 不要将进度指示器写入 stderr
-日志 日志文件 -- 保存中间树,以便您可以提取
树并在它们崩溃时重新启动长时间运行的作业 -日志 还报告了
每个站点的费率(1 表示最慢的类别)
-引用 -- 在输出中引用序列名称并允许空格、逗号、
括号和冒号,但不是 ' 字符(仅限 fasta 文件)
距离:
默认:对于蛋白质序列,对数校正距离和
源自 BLOSUM45 的氨基酸差异矩阵
或对于核苷酸序列,Jukes-Cantor distances 指定不同的矩阵,
使用 -矩阵 文件前缀或 - 矩阵 使用 VHDL 语言编写 -rawdist 关闭对数校正或
使用 %different 而不是 Jukes-Cantor
-伪 [重量] -- 使用伪计数来估计之间的距离
很少或没有重叠的序列。 (默认关闭。)如果分析
比对具有很少或没有重叠的序列。 如果没有指定重量,
它是 1.0
拓扑 细化:
默认情况下,fasttreeMP 尝试使用最多 4*log2(N) 轮改进树
最小演化最近邻交换 (NNI),其中 N 是
独特的序列,2 轮子树修剪再移植 (SPR) 移动(也是最小进化),
最多 2*log(N) 轮最大似然 NNI。 用 -nni 设置数字
分钟的轮次埃沃。 NNI 和 -spr 设置 SPR 的轮次。 用 -标称 转
关闭 min-evo NNI 和 SPR(如果精炼很有用
具有更多 NNI 的近似最大似然树)
使用 VHDL 语言编写 -spr长度 设置 SPR 移动的最大长度(默认 10) 使用 -mnni 设置
最大似然 NNI 使用的轮数 -mlacc 2或 -mlacc 3 永远
优化每个 NNI 的所有 5 个分支,
并在 5 或 2 轮中优化所有 3 个分支
使用 VHDL 语言编写 -米伦 在没有 ML NNI 的情况下优化分支长度 使用 -米伦 -名称 - -树
优化固定拓扑上的分支长度 使用 -slownni 关闭启发式
避免恒定的子树(影响两者
ML 和 ME NNI)
最大 可能性 模型 opţiuni:
-摇摆 -- Whelan-And-Goldman 2001 模型而不是(默认)Jones-Taylor-Thorton 1992 模型
(仅限 aa)
-gtr -- 广义时间可逆而不是(默认)Jukes-Cantor(仅nt)
-猫 # -- 指定站点的费率类别数(默认 20)
-nocat -- 没有 CAT 模型(只有 1 个类别)
-伽马 -- 在最后一轮使用 CAT 模型优化分支长度后,
报告具有相同数量的离散伽马模型下的似然
类别。 fasttreeMP 使用相同的分支长度,但优化了伽马形状
参数和长度的比例。 最终的树将重新调整长度。
用于 -日志,这也会生成与 CONSEL 一起使用的每个站点的可能性,请参阅
GammaLogToPaup.pl 和 fasttreeMP 网站上的文档。
客户支持 折扣值 opţiuni:
默认情况下,fasttreeMP 通过重新采样站点来计算本地支持值
可能性 1,000 次和 Shimodaira Hasegawa 测试。 如果您指定 -名称,但
将计算最小进化引导支持而不是在任何一种情况下,
支持值是从 0 到 1 的比例
使用 VHDL 语言编写 -没有支持 关闭支持值或 -启动 100 只使用 100 个重采样
使用 VHDL 语言编写 -种子 初始化随机数生成器
搜索 此 世界上最好的 加入:
默认情况下,fasttreeMP 将快速邻居加入的“可见集”与
本地爬山就像轻松的邻居加入
-慢 -- 详尽搜索(如 NJ 或 BIONJ,但不同的间隙处理)
-慢 8 种蛋白质需要半小时而不是 1,250 秒
-最快的 -- 仅搜索可见集(每个节点的最高命中)
与原来的快速邻居加入不同, -最快的 更新可见(C)之后
如果 join(AB,C) 比 join(C,visible(C)) 更好,则加入 A 和 B -最快的 还
以非常懒惰的方式更新远距离, -最快的 套 -2 同样,使用
-最快的 -第二号 为了避免这种情况
热门 启发式:
默认情况下,fasttreeMP 使用 top-hit 列表来加速搜索使用 -诺托普 (或 -慢)
关闭此功能
并将所有叶子相互比较,并将所有新加入的节点相互比较
-topm 1.0 -- 将热门列表大小设置为参数*sqrt(N)
fasttreeMP 从“关闭”的前 2*m 次命中中估计叶子的前 m 次命中
邻居,其中关闭定义为 d(seed,close) < 0.75 * d(seed, hit of rank
2*m),并在连接进行时更新热门
-close 0.75 -- 修改关闭启发式,越低越保守
-刷新 0.8 -- 将加入的节点与所有其他节点进行比较,如果它
热门列表小于所需长度的 80%,或者如果热门列表的年龄
清单是 日志2(m) 或更大
-2 or -第二号 打开或关闭 2nd-level top hits heuristic
这减少了内存使用和运行时间,但可能会导致边际减少
树木质量。 (默认情况下, -最快的 打开 -2.)
加入 opţiuni:
-nj:常规(未加权)邻居加入(默认)
-比奥尼: BIONJ 中的加权连接
fasttreeMP 还将在 NNI 期间加权连接
约束 拓扑 搜索、 opţiuni:
-约束 对齐文件 -- 与值 0、1 和 - 的对齐
并非所有序列都需要存在。 一列 0 和 1 定义了一个受约束的
分裂。 可能会违反某些约束(请参阅标准中的“违反约束:”
错误)。
-约束权重 -- 对约束进行加权的强度。 值为 1
表示违反约束的树长度惩罚为 1 默认值:100.0
欲了解更多信息,请参阅 http://www.microbesonline.org/fasttree/
或源代码中的注释
fasttreeMP protein_alignment > 树 fasttreeMP -nt 核苷酸对齐 > 树
快树MP -nt -gtr <核苷酸对齐>树
fasttreeMP 接受 fasta 或 phylip 交错格式的对齐
相当常见 选项 (必须 be before 此 对准 文件):
-安静的 压制报告信息
-没有公关 抑制进度指示器
-日志 日志文件 -- 保存中间树、设置和模型细节
-最快的 -- 加快邻居加入阶段并减少内存使用
(推荐用于 >50,000 个序列)
-n 分析多个对齐方式(仅限 phylip 格式)
(用于全局引导,使用 seqboot 和 CompareToBootstrap.pl)
-没有支持 不计算支持值
-树 newick_file 设置起始树
-intree1 newick_file 将此起始树用于所有对齐
(为了在巨大的对齐上更快地进行全局引导)
-伪 使用伪计数(推荐用于高度缺口序列)
-gtr -- 广义时间可逆模型(仅限核苷酸比对)
-摇摆 -- Whelan-And-Goldman 2001 模型(仅氨基酸比对)
-引用 -- 允许空格和其他受限制的字符(但不是 ' 字符)
输出树中的序列名称和引号名称(仅限 fasta 输入;fasttreeMP
将无法重新读取这些树
-标称 关闭最大似然
-名称 关闭最小进化 NNI 和 SPR
(推荐在运行额外的 ML NNI 时使用 -树)
-名称 -米伦 - -树 优化固定拓扑的分支长度
-猫 # 指定站点的费率类别数(默认为 20)
or -nocat 使用固定利率
-伽马 -- 在CAT近似下优化树后,
重新调整长度以优化 Gamma20 可能性
-约束 约束对齐来约束拓扑搜索
约束对齐应该有 1 或 0 来表示分裂
-专家 -- 查看更多选项
欲了解更多信息,请参阅 http://www.microbesonline.org/fasttree/
使用 onworks.net 服务在线使用 fasttreeMP