これは、Ubuntu Online、Fedora Online、Windowsオンラインエミュレーター、MACOSオンラインエミュレーターなどの複数の無料オンラインワークステーションのXNUMXつを使用してOnWorks無料ホスティングプロバイダーで実行できるコマンドfasttreeです。
プログラム:
NAME
fasttree-ヌクレオチドまたはタンパク質配列のアラインメントから系統樹を作成します
DESCRIPTION
fasttreeは、のアラインメントからほぼ最尤系統樹を推測します。
ヌクレオチドまたはタンパク質配列。 最大XNUMX万のシーケンスとのアラインメントを処理します
妥当な時間とメモリで。
fasttreeは、デフォルト設定のPhyML 3よりも正確であり、
大規模な線形に従来から使用されている距離行列法。 fasttree
ヌクレオチド進化のJukes-Cantorまたは一般化された時間可逆(GTR)モデルを使用します
アミノ酸進化のJTT(Jones-Taylor-Thornton 1992)モデル。 を説明するために
サイト間で進化の速度が異なる場合、fasttreeはサイトごとに単一の速度を使用します(
「CAT」近似)。 ツリー内の各分割の信頼性をすばやく見積もるには、
fasttreeは、下平長谷川テストを使用してローカルサポート値を計算します(これらは
PhyML 3の「SHのようなローカルサポート」と同じです)。
SYNOPSIS
ファストツリー プロテインアライメント > ツリー
ファストツリー -nt ヌクレオチドアラインメント>ツリー
ファストツリー -nt -gtr <ヌクレオチドアラインメント>ツリー
fasttreeは、fastaまたはphylipインターリーブ形式のアライメントを受け入れます
コマンドと オプション (しなければならない be アラインメント ファイル):
-静かな 報告情報を抑制する
-nopr 進行状況インジケーターを抑制する
-ログ ログファイル -- 中間ツリー、設定、およびモデルの詳細を保存します
-最速 -- 近隣結合フェーズを高速化し、メモリ使用量を削減します
(50,000を超えるシーケンスに推奨)
-n マルチプルアラインメントを分析する(フィリップフォーマットのみ)
(seqbootおよびCompareToBootstrap.plを使用したグローバルブートストラップに使用)
-サポートなし サポート値を計算しない
-インツリー newick_fileを使用して、開始ツリーを設定します
-intree1 newick_fileは、この開始ツリーをすべての配置に使用します
(巨大なアライメントでのグローバルブートストラップを高速化するため)
-擬似 疑似カウントを使用する(ギャップの大きいシーケンスに推奨)
-gtr -- 一般化された時間可逆モデル(ヌクレオチドアラインメントのみ)
-振る -- Whelan-And-Goldman 2001モデル(アミノ酸アラインメントのみ)
-見積もり -- スペースおよびその他の制限された文字(ただし、 '文字は許可しない)を許可する
出力ツリーのシーケンス名と引用符名(fasta入力のみ。fasttreeは
これらの木を読み戻すことはできません
-noml 最尤法をオフにする
-ノーム 最小進化NNIとSPRをオフにする
(追加のMLNNIを実行する場合に推奨されます -インツリー)
-ノーム -ミレン -インツリー 固定トポロジのブランチ長を最適化する
-ネコ #サイトのレートカテゴリの数を指定します(デフォルトは20)
or -ノキャット 一定のレートを使用するには
-ガンマ -- CAT近似の下でツリーを最適化した後、
Gamma20の可能性を最適化するために、長さを再スケーリングします
-制約 トポロジー検索を制約するconstraintAlignment
分割を示すには、constraintAlignmentに1または0を指定する必要があります
-エキスパート -- その他のオプションを見る
詳しい 使用 for ファストツリー 2.1.4 SSE3:
fasttree [-nt] [-n 100] [-引用符] [-pseudo | -擬似 1.0]
[-ブート1000| -サポートなし] [-intreestarting_trees_file | -intree1
start_tree_file] [-quiet | -nopr] [-nni 10] [-spr 2] [-noml | -ミレン | -ミリニ
10] [-mlacc 2] [-猫 20 | -ノキャット] [-ガンマ] [-遅い| -最速] [-2番目| -no2nd]
[-slownni] [-seed 1253] [-トップ | -ノートップ] [-topm 1.0 [-close 0.75] [-refresh 0.8]]
[-行列マトリックス| -ノマトリックス] [-nj | -ビオンジ] [-wag] [-nt] [-gtr] [-gtrrates ac ag at
cg ct gt] [-gtrfreq ACGT] [ -制約 制約Alignment [ -constraintWeight
100.0]] [-ログログファイル]
[alignment_file]
> newick_tree
or
fasttree [-nt] [-matrix マトリックス | -ノマトリックス] [-rawdist] -メイクマトリックス 【アライメント】
[-n 100]> phylip_distance_matrix
fasttreeはfastaまたはphylipインターリーブアライメントをサポートしますデフォルトではfasttree
タンパク質のアラインメントを期待し、使用 -nt ヌクレオチドの場合、fasttreeは標準入力を読み取ります
アライメントファイルが指定されていない場合
入出力 オプション:
-n -- で複数のアラインメントを読み込みます。これのみ
phylipインターリーブ形式で動作します。 たとえば、出力で使用できます
phylipのseqbootから。 使用する場合 -n、fasttreeは1行にXNUMXつのツリーを書き込みます
標準出力。
-インツリー 新しいファイル -- newickfileから開始ツリーを読み込みます。
開始ツリーのブランチの長さはすべて無視されます。
-インツリー -n 配置ごとに個別の開始ツリーを読み取ります。
-intree1 新しいファイル -- 配置ごとに同じ開始ツリーを読み取ります
-静かな -- 通常の操作中に標準エラーに書き込まないでください(進行なし
インジケーター、オプションの要約なし、尤度値なしなど)
-nopr -- stderrに進行状況インジケーターを書き込まないでください
-ログ ログファイル -- 抽出できるように中間ツリーを保存します
ツリーがクラッシュした場合は、実行時間の長いジョブを再開します -ログ また、
サイトごとの料金(1は最も遅いカテゴリを意味します)
-見積もり -- 出力でシーケンス名を引用し、スペース、コンマ、
括弧、およびコロンは含まれますが、 '文字は含まれません(fastaファイルのみ)
距離:
デフォルト:タンパク質配列の場合、対数補正された距離と
BLOSUM45から派生したアミノ酸非類似度マトリックス
またはヌクレオチド配列の場合、Jukes-Cantor距離別の行列を指定するには、
つかいます -マトリックス FilePrefixまたは -ノマトリックス -rawdist ログ修正をオフにするか、
Jukes-Cantorの代わりに%differentを使用する
-擬似 [重さ] -- 疑似カウントを使用して、
オーバーラップがほとんどまたはまったくないシーケンス。 (デフォルトではオフです。)分析する場合に推奨されます
アラインメントには、オーバーラップがほとんどまたはまったくないシーケンスがあります。 重量が指定されていない場合は、
1.0です
トポロジー 洗練:
デフォルトでは、fasttreeは最大4 * log2(N)ラウンドのツリーを改善しようとします
最小進化最近傍インターチェンジ(NNI)、ここでNは
ユニークなシーケンス、2ラウンドのサブツリー-プルーン-再移植(SPR)の動き(最小の進化)、
最尤NNIの最大2 * log(N)ラウンド。 つかいます -んに 番号を設定するには
最小のラウンドの。 evo。 NNI、および -春 SPRのラウンドを設定します。 つかいます -noml 曲がる
min-evo NNIとSPRの両方をオフにします(洗練する場合に便利です
さらにNNIを含むほぼ最尤ツリー)
-スプリングレングス SPR移動の最大長を設定します(デフォルトは10)。 -ミリニ 設定します
最尤NNIが使用するラウンド数 -mlacc 2または -mlacc 常に3
各NNIで5つのブランチすべてを最適化します。
5または2ラウンドで3つのブランチすべてを最適化する
-ミレン MLNNIを使用せずにブランチの長さを最適化するには -ミレン -ノーム -インツリー
固定トポロジでブランチの長さを最適化するには -スローニ ヒューリスティックをオフにします
一定のサブツリーを回避するため(両方に影響します
MLおよびMENNI)
最大 尤度 オプション:
-振る -- (デフォルト)Jones-Taylor-Thorton2001モデルの代わりにWhelan-And-Goldman1992モデル
(aaのみ)
-gtr -- (デフォルト)Jukes-Cantorの代わりに一般化された時間可逆(ntのみ)
-ネコ # -- サイトのレートカテゴリの数を指定します(デフォルトは20)
-ノキャット -- CATモデルなし(1つのカテゴリのみ)
-ガンマ -- CATモデルを使用してブランチの長さを最適化する最終ラウンドの後、
同じ数の離散ガンマモデルの下での尤度を報告します
カテゴリ。 fasttreeは同じブランチ長を使用しますが、ガンマ形状を最適化します
パラメータと長さのスケール。 最終的なツリーの長さは再スケーリングされます。
と一緒に使用 -ログ、これにより、CONSELで使用するサイトごとの可能性も生成されます。を参照してください。
GammaLogToPaup.plおよびfasttreeWebサイトのドキュメント。
サポート 値 オプション:
デフォルトでは、fasttreeはサイトをリサンプリングすることによってローカルサポート値を計算します
尤度1,000回と下平長谷川テスト。 指定した場合 -ノーム、それ
代わりに最小進化ブートストラップサポートを計算しますどちらの場合でも、
サポート値は0から1の範囲の比率です
-サポートなし サポート値をオフにする、または -ブート 100リサンプルのみを使用するには100
-シード 乱数ジェネレーターを初期化する
検索 for 最良 加入:
デフォルトでは、fasttreeは高速近隣結合の「可視セット」と
リラックスした近隣結合のように地元の山登り法
-スロー -- 徹底的な検索(NJやBIONJと同様ですが、ギャップ処理が異なります)
-スロー 8のタンパク質の場合、1,250秒ではなくXNUMX分かかります
-最速 -- 表示されているセット(各ノードのトップヒット)のみを検索します
元の高速近隣結合とは異なり、 -最速 後にvisible(C)を更新
join(AB、C)がjoin(C、visible(C))よりも優れている場合にAとBを結合する -最速 また
非常に怠惰な方法で距離を更新します。 -最速 セット -2番目 同様に、使用
-最速 -no2nd これを避けるために
トップヒット 経験則:
デフォルトでは、fasttreeはトップヒットリストを使用して検索を高速化します。 -notop (または -スロー)
この機能をオフにするには
そして、すべての葉を互いに比較し、すべての新しく結合されたノードを互いに比較します
-トップ 1.0 -- トップヒットリストのサイズをparameter * sqrt(N)に設定します
fasttreeは、「閉じる」の上位2 * mヒットから葉の上位mヒットを推定します。
ネイバー、ここで、closeはd(シード、クローズ)<0.75 * d(シード、ランクのヒット)として定義されます
2 * m)、参加が進むにつれてトップヒットを更新します
-閉じる 0.75 -- 近いヒューリスティックを変更します。低いほど保守的です
- リフレッシュ 0.8 -- 参加しているノードを他のすべてのノードと比較する
トップヒットリストが目的の長さの80%未満である場合、またはトップヒットの年齢が
リストは log2(m)以上
-2番目 or -no2nd 第2レベルのトップヒットヒューリスティックをオンまたはオフにするには
これにより、メモリ使用量と実行時間が削減されますが、
木の品質。 (デフォルトでは、 -最速 オンになります -2番目.)
加入 オプション:
-nj:通常の(重み付けされていない)近隣結合(デフォルト)
-ビオンジ:BIONJのように加重結合
fasttreeは、NNI中の結合にも重みを付けます
制約付き トポロジー サーチ オプション:
-制約 アラインメントファイル -- 値が0、1、および-のアラインメント
すべてのシーケンスが存在する必要はありません。 0と1の列は、制約付きを定義します
スプリット。 一部の制約に違反している可能性があります(標準の「違反している制約:」を参照)
エラー)。
-constraintWeight -- 制約をどの程度強く重み付けするか。 値1
制約に違反した場合、ツリーの長さが1ペナルティになることを意味します。デフォルト:100.0
詳細については、を参照してください。 http://www.microbesonline.org/fasttree/
またはソースコードのコメント
fasttreeprotein_alignment>ツリーfasttree -nt ヌクレオチドアラインメント>ツリーファストツリー
-nt -gtr <ヌクレオチドアラインメント>ツリー
fasttreeは、fastaまたはphylipインターリーブ形式のアライメントを受け入れます
コマンドと オプション (しなければならない be アラインメント ファイル):
-静かな 報告情報を抑制する
-nopr 進行状況インジケーターを抑制する
-ログ ログファイル -- 中間ツリー、設定、およびモデルの詳細を保存します
-最速 -- 近隣結合フェーズを高速化し、メモリ使用量を削減します
(50,000を超えるシーケンスに推奨)
-n マルチプルアラインメントを分析する(フィリップフォーマットのみ)
(seqbootおよびCompareToBootstrap.plを使用したグローバルブートストラップに使用)
-サポートなし サポート値を計算しない
-インツリー newick_fileを使用して、開始ツリーを設定します
-intree1 newick_fileは、この開始ツリーをすべての配置に使用します
(巨大なアライメントでのグローバルブートストラップを高速化するため)
-擬似 疑似カウントを使用する(ギャップの大きいシーケンスに推奨)
-gtr -- 一般化された時間可逆モデル(ヌクレオチドアラインメントのみ)
-振る -- Whelan-And-Goldman 2001モデル(アミノ酸アラインメントのみ)
-見積もり -- スペースおよびその他の制限された文字(ただし、 '文字は許可しない)を許可する
出力ツリーのシーケンス名と引用符名(fasta入力のみ。fasttreeは
これらの木を読み戻すことはできません
-noml 最尤法をオフにする
-ノーム 最小進化NNIとSPRをオフにする
(追加のMLNNIを実行する場合に推奨されます -インツリー)
-ノーム -ミレン -インツリー 固定トポロジのブランチ長を最適化する
-ネコ #サイトのレートカテゴリの数を指定します(デフォルトは20)
or -ノキャット 一定のレートを使用するには
-ガンマ -- CAT近似の下でツリーを最適化した後、
Gamma20の可能性を最適化するために、長さを再スケーリングします
-制約 トポロジー検索を制約するconstraintAlignment
分割を示すには、constraintAlignmentに1または0を指定する必要があります
-エキスパート -- その他のオプションを見る
詳細については、を参照してください。 http://www.microbesonline.org/fasttree/
onworks.netサービスを使用してfasttreeをオンラインで使用する