Ini ialah arahan fasttreeMP yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
fasttreeMP - cipta pokok filogenetik daripada penjajaran jujukan nukleotida atau protein
(versi openMP)
DESCRIPTION
fasttreeMP membuat kesimpulan pokok filogenetik berkemungkinan maksimum daripada penjajaran
urutan nukleotida atau protein. Ia mengendalikan penjajaran dengan sehingga sejuta jujukan
dalam jumlah masa dan ingatan yang munasabah.
fasttreeMP lebih tepat daripada PhyML 3 dengan tetapan lalai dan lebih tepat
daripada kaedah matriks jarak yang digunakan secara tradisional untuk penjajaran besar.
fasttreeMP menggunakan model nukleotida Jukes-Cantor atau generalized time-reversible (GTR)
evolusi dan model evolusi asid amino JTT (Jones-Taylor-Thornton 1992). Kepada
mengambil kira kadar evolusi yang berbeza-beza merentas tapak, fasttreeMP menggunakan kadar tunggal untuk
setiap tapak (anggaran "CAT"). Untuk menganggarkan dengan cepat kebolehpercayaan setiap pecahan masuk
pokok, fasttreeMP mengira nilai sokongan tempatan dengan ujian Shimodaira-Hasegawa
(ini adalah sama seperti "sokongan tempatan seperti SH" PhyML 3).
SINOPSIS
fasttreeMP penjajaran_protein > pokok
fasttreeMP -nt penjajaran_nukleotida > pokok
fasttreeMP -nt -gtr < penjajaran_nukleotida > pokok
fasttreeMP menerima penjajaran dalam format interleaved fasta atau phylip
Common pilihan (mesti be sebelum yang penjajaran fail):
-senyap untuk menyekat maklumat pelaporan
-tiada PR untuk menyekat penunjuk kemajuan
-log fail log -- simpan pokok perantaraan, tetapan dan butiran model
-paling laju -- mempercepatkan fasa menyertai jiran & mengurangkan penggunaan memori
(disyorkan untuk >50,000 urutan)
-n untuk menganalisis berbilang penjajaran (format phylip sahaja)
(gunakan untuk bootstrap global, dengan seqboot dan CompareToBootstrap.pl)
-tiada sokongan untuk tidak mengira nilai sokongan
-intree newick_file untuk menetapkan pokok permulaan
-intree1 newick_file untuk menggunakan pokok permulaan ini untuk semua penjajaran
(untuk bootstrap global yang lebih pantas pada penjajaran besar)
-pseudo untuk menggunakan pseudocounts (disyorkan untuk urutan yang sangat jurang)
-gtr -- model umum boleh balik masa (penjajaran nukleotida sahaja)
-jangan -- Model Whelan-And-Goldman 2001 (penjajaran asid amino sahaja)
-petikan -- benarkan ruang dan aksara terhad lain (tetapi bukan aksara ') masuk
nama jujukan dan nama petikan dalam pepohon output (input fasta sahaja; fasttreeMP
tidak akan dapat membaca pokok ini kembali
-noml untuk mematikan kemungkinan maksimum
-nama untuk mematikan NNI dan SPR evolusi minimum
(disyorkan jika menjalankan ML NNI tambahan dengan -intree)
-nama -mllen bersama -intree untuk mengoptimumkan panjang cawangan untuk topologi tetap
-kucing # untuk menentukan bilangan kategori kadar tapak (lalai 20)
or -nocat untuk menggunakan kadar tetap
-gamma -- selepas mengoptimumkan pokok di bawah anggaran CAT,
skala semula panjang untuk mengoptimumkan kemungkinan Gamma20
-kekangan kekanganPenjajaran untuk mengekang carian topologi
constraintAlignment harus mempunyai 1s atau 0s untuk menunjukkan perpecahan
-pakar -- lihat lebih banyak pilihan
Terperinci penggunaan khususnya fasttreeMP 2.1.4 SSE3:
fasttreeMP [-nt] [-n 100] [-petikan] [-pseudo | -pseudo 1.0]
[-but 1000 | -tiada sokongan] [-intree starting_trees_file | -intree1
starting_tree_file] [-senyap | -tiada PR] [-nni 10] [-spr 2] [-noml | -mllen | -mlnni
10] [-mlacc 2] [-cat 20 | -nocat] [-gamma] [-perlahan | -paling laju] [-ke-2 | -no2nd]
[-slownni] [-biji 1253] [-atas | -notop] [-topm 1.0 [-close 0.75] [-refresh 0.8]]
[-matriks Matriks | -nomatriks] [-nj | -bionj] [-wag] [-nt] [-gtr] [-gtrrates ac ag at
cg ct gt] [-gtrfreq ACGT] [ -kekangan kekanganPenjajaran [ -kekanganBerat
100.0 ] ] [-fail log log]
[ alignment_file ]
> newick_tree
or
fasttreeMP [-nt] [-matriks Matriks | -nomatriks] [-rawdist] -makematrix [penjajaran]
[-n 100] > phylip_jarak_matriks
fasttreeMP menyokong penjajaran bersilang fasta atau phylip Secara lalai fasttreeMP
menjangkakan penjajaran protein, penggunaan -nt untuk nukleotida fasttreeMP membaca standard
input jika tiada fail penjajaran diberikan
Input / output pilihan yang berikut:
-n -- baca dalam berbilang penjajaran dalam. Ini sahaja
berfungsi dengan format berjalin philip. Sebagai contoh, anda boleh menggunakannya dengan output
daripada seqboot philip. Jika anda menggunakan -n, fasttreeMP akan menulis 1 pokok setiap baris ke
keluaran standard.
-intree newickfile -- baca pokok permulaan dari newickfile.
Sebarang panjang cawangan dalam pokok permulaan diabaikan.
-intree bersama -n akan membaca pokok permulaan yang berasingan untuk setiap penjajaran.
-intree1 newickfile -- baca pokok permulaan yang sama untuk setiap penjajaran
-senyap -- jangan tulis kepada ralat standard semasa operasi biasa (tiada kemajuan
penunjuk, tiada ringkasan pilihan, tiada nilai kemungkinan, dsb.)
-tiada PR -- jangan tulis penunjuk kemajuan ke stderr
-log fail log -- simpan pokok perantaraan supaya anda boleh mengekstrak
pokok-pokok dan mulakan semula kerja-kerja yang telah lama berjalan jika ia terhempas -log juga melaporkan
kadar setiap tapak (1 bermakna kategori paling perlahan)
-petikan -- petikan nama urutan dalam output dan benarkan ruang, koma,
kurungan, dan titik bertindih di dalamnya tetapi bukan aksara ' (fail fasta sahaja)
Jarak:
Lalai: Untuk jujukan protein, jarak yang dibetulkan log dan a
matriks ketidaksamaan asid amino yang diperoleh daripada BLOSUM45
atau untuk jujukan nukleotida, jarak Jukes-Cantor Untuk menentukan matriks yang berbeza,
penggunaan -matriks FilePrefix atau -nomatriks Penggunaan -rawdist untuk mematikan pembetulan log atau
untuk menggunakan %different dan bukannya Jukes-Cantor
-pseudo [berat] -- Gunakan pseudocounts untuk menganggar jarak antara
urutan dengan sedikit atau tiada pertindihan. (Dimatikan secara lalai.) Disyorkan jika menganalisis
penjajaran mempunyai jujukan dengan sedikit atau tiada pertindihan. Jika berat tidak dinyatakan,
ia adalah 1.0
Topologi penghalusan:
Secara lalai, fasttreeMP cuba menambah baik pepohon dengan sehingga 4*log2(N) pusingan
pertukaran minimum-evolusi jiran terdekat (NNI), dengan N ialah bilangan
jujukan unik, 2 pusingan pergerakan subtree-prune-regraf (SPR) (juga min. evo.),
dan sehingga 2*log(N) pusingan NNI berkemungkinan maksimum. guna -nni untuk menetapkan nombor
daripada pusingan min. evo. NNI, dan -spr untuk menetapkan pusingan SPR. guna -noml untuk berpaling
off kedua-dua NNI min-evo dan SPR (berguna jika menapis
pokok kemungkinan maksimum dengan NNI lanjut)
Penggunaan -panjang tetapkan panjang maksimum pergerakan SPR (lalai 10) Penggunaan -mlnni untuk menetapkan
bilangan pusingan penggunaan NNI berkemungkinan maksimum -mlacc 2 atau -mlacc 3 hingga selalu
mengoptimumkan kesemua 5 cawangan pada setiap NNI,
dan untuk mengoptimumkan semua 5 cawangan dalam 2 atau 3 pusingan
Penggunaan -mllen untuk mengoptimumkan panjang cawangan tanpa Penggunaan ML NNI -mllen -nama bersama -intree
untuk mengoptimumkan panjang cawangan pada topologi tetap Penggunaan -slownni untuk mematikan heuristik
untuk mengelakkan subpokok berterusan (menjejaskan kedua-duanya
ML dan ME NNI)
Maksimum kemungkinan model pilihan yang berikut:
-jangan -- Model Whelan-And-Goldman 2001 dan bukannya (lalai) model Jones-Taylor-Thorton 1992
(aa sahaja)
-gtr -- masa umum boleh balik dan bukannya (lalai) Jukes-Cantor (nt sahaja)
-kucing # -- nyatakan bilangan kategori kadar tapak (lalai 20)
-nocat -- tiada model CAT (hanya 1 kategori)
-gamma -- selepas pusingan akhir mengoptimumkan panjang cawangan dengan model CAT,
laporkan kemungkinan di bawah model gamma diskret dengan bilangan yang sama
kategori. fasttreeMP menggunakan panjang cawangan yang sama tetapi mengoptimumkan bentuk gamma
parameter dan skala panjang. Pokok terakhir akan mempunyai panjang berskala semula.
Digunakan dengan -log, ini juga menjana kemungkinan setiap tapak untuk digunakan dengan CONSEL, lihat
GammaLogToPaup.pl dan dokumentasi pada tapak web fasttreeMP.
Khidmat Bantuan nilai pilihan yang berikut:
Secara lalai, fasttreeMP mengira nilai sokongan setempat dengan mensampel semula tapak
kemungkinan 1,000 kali dan ujian Shimodaira Hasegawa. Jika anda nyatakan -nama, Ia
akan mengira sokongan bootstrap evolusi minimum sebaliknya Dalam kedua-dua kes, the
nilai sokongan ialah perkadaran antara 0 hingga 1
Penggunaan -tiada sokongan untuk mematikan nilai sokongan atau -but 100 untuk menggunakan hanya 100 sampel semula
Penggunaan -benih untuk memulakan penjana nombor rawak
Mencari khususnya yang terbaik sertai:
Secara lalai, fasttreeMP menggabungkan 'set yang boleh dilihat' untuk menyertai jiran pantas
mendaki bukit tempatan seperti dalam santai jiran-menyertai
-perlahan -- carian menyeluruh (seperti NJ atau BIONJ, tetapi pengendalian jurang yang berbeza)
-perlahan mengambil masa setengah jam dan bukannya 8 saat untuk 1,250 protein
-paling laju -- cari set yang boleh dilihat (hit atas untuk setiap nod) sahaja
Tidak seperti jiran cepat yang asal menyertai, -paling laju kemas kini kelihatan(C) selepas
menyertai A dan B jika bergabung(AB,C) adalah lebih baik daripada bergabung(C,terlihat(C)) -paling laju Juga
mengemas kini jarak jauh dengan cara yang sangat malas, -paling laju set -ke-2 pada juga, gunakan
-paling laju -no2 untuk mengelakkan ini
Top hit heuristik:
Secara lalai, fasttreeMP menggunakan senarai paling popular untuk mempercepatkan Penggunaan carian -notop (Atau -perlahan)
untuk mematikan ciri ini
dan bandingkan semua daun antara satu sama lain, dan semua nod bercantum baharu antara satu sama lain
-topm 1.0 -- tetapkan saiz senarai paling popular kepada parameter*sqrt(N)
fasttreeMP menganggarkan m hits atas daun daripada 2*m hits teratas 'tutup'
jiran, di mana dekat ditakrifkan sebagai d(benih, tutup) < 0.75 * d(benih, hit pangkat
2*m), dan mengemas kini lagu popular semasa penyertaan diteruskan
-close 0.75 -- ubah suai heuristik rapat, lebih rendah adalah lebih konservatif
-menyegarkan 0.8 -- bandingkan nod bercantum dengan semua nod lain jika ia
senarai top-hit kurang daripada 80% daripada panjang yang diingini, atau jika umur top-hit
senarai adalah log2(m) atau lebih besar
-ke-2 or -no2 untuk menghidupkan atau mematikan heuristik hits teratas peringkat ke-2
Ini mengurangkan penggunaan memori dan masa berjalan tetapi boleh menyebabkan pengurangan kecil dalam
kualiti pokok. (Secara lalai, -paling laju hidupkan -ke-2.)
Sertai pilihan yang berikut:
-nj: penyatuan jiran biasa (tidak bertimbang) (lalai)
-bionj: gandingan berwajaran seperti dalam BIONJ
fasttreeMP juga akan menambah berat semasa NNI
Dikekang topologi cari pilihan yang berikut:
-kekangan fail penjajaran -- penjajaran dengan nilai 0, 1 dan -
Tidak semua urutan perlu ada. Lajur 0s dan 1s mentakrifkan kekangan
berpecah. Sesetengah kekangan mungkin dilanggar (lihat 'melanggar kekangan:' dalam standard
ralat).
-kekanganBerat -- betapa kuatnya untuk menimbang kekangan. Nilai 1
bermakna penalti 1 dalam panjang pokok kerana melanggar kekangan Lalai: 100.0
Untuk maklumat lanjut, lihat http://www.microbesonline.org/fasttree/
atau komen dalam kod sumber
penjajaran_protein fasttreeMP > fasttreeMP pokok -nt penjajaran_nukleotida > pokok
fasttreeMP -nt -gtr < penjajaran_nukleotida > pokok
fasttreeMP menerima penjajaran dalam format interleaved fasta atau phylip
Common pilihan (mesti be sebelum yang penjajaran fail):
-senyap untuk menyekat maklumat pelaporan
-tiada PR untuk menyekat penunjuk kemajuan
-log fail log -- simpan pokok perantaraan, tetapan dan butiran model
-paling laju -- mempercepatkan fasa menyertai jiran & mengurangkan penggunaan memori
(disyorkan untuk >50,000 urutan)
-n untuk menganalisis berbilang penjajaran (format phylip sahaja)
(gunakan untuk bootstrap global, dengan seqboot dan CompareToBootstrap.pl)
-tiada sokongan untuk tidak mengira nilai sokongan
-intree newick_file untuk menetapkan pokok permulaan
-intree1 newick_file untuk menggunakan pokok permulaan ini untuk semua penjajaran
(untuk bootstrap global yang lebih pantas pada penjajaran besar)
-pseudo untuk menggunakan pseudocounts (disyorkan untuk urutan yang sangat jurang)
-gtr -- model umum boleh balik masa (penjajaran nukleotida sahaja)
-jangan -- Model Whelan-And-Goldman 2001 (penjajaran asid amino sahaja)
-petikan -- benarkan ruang dan aksara terhad lain (tetapi bukan aksara ') masuk
nama jujukan dan nama petikan dalam pepohon output (input fasta sahaja; fasttreeMP
tidak akan dapat membaca pokok ini kembali
-noml untuk mematikan kemungkinan maksimum
-nama untuk mematikan NNI dan SPR evolusi minimum
(disyorkan jika menjalankan ML NNI tambahan dengan -intree)
-nama -mllen bersama -intree untuk mengoptimumkan panjang cawangan untuk topologi tetap
-kucing # untuk menentukan bilangan kategori kadar tapak (lalai 20)
or -nocat untuk menggunakan kadar tetap
-gamma -- selepas mengoptimumkan pokok di bawah anggaran CAT,
skala semula panjang untuk mengoptimumkan kemungkinan Gamma20
-kekangan kekanganPenjajaran untuk mengekang carian topologi
constraintAlignment harus mempunyai 1s atau 0s untuk menunjukkan perpecahan
-pakar -- lihat lebih banyak pilihan
Untuk maklumat lanjut, lihat http://www.microbesonline.org/fasttree/
Gunakan fasttreeMP dalam talian menggunakan perkhidmatan onworks.net