Это команда fasttree, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
fasttree - создавать филогенетические деревья из выравнивания нуклеотидных или белковых последовательностей
ОПИСАНИЕ
fasttree выводит филогенетические деревья с максимальным правдоподобием из выравнивания
нуклеотидные или белковые последовательности. Он обрабатывает выравнивания до миллиона последовательностей.
в разумное количество времени и памяти.
fasttree более точен, чем PhyML 3 с настройками по умолчанию, и намного точнее, чем
методы матрицы расстояний, которые традиционно используются для больших выравниваний. Fasttree
использует модели эволюции нуклеотидов Джакса-Кантора или обобщенную модель с обратимой во времени (ОТО)
и модель эволюции аминокислот JTT (Jones-Taylor-Thornton 1992). Чтобы учесть
варьируя скорость развития сайтов, fasttree использует единую скорость для каждого сайта (
"CAT" приближение). Чтобы быстро оценить надежность каждого разбиения в дереве,
fasttree вычисляет значения локальной поддержки с помощью теста Симодаира-Хасегавы (это
то же, что и "SH-подобные локальные опоры" в PhyML 3).
СИНТАКСИС
Fasttree Protein_alignment > дерево
Fasttree -нт nucleotide_alignment> дерево
Fasttree -нт -гтп <nucleotide_alignment> дерево
fasttree принимает выравнивания в форматах fasta или phylip с чередованием
Общий кредита (должен be до выравнивание файл):
-тихо для подавления отчетной информации
-нет пр подавить индикатор прогресса
-журнал журнальный файл -- сохранять промежуточные деревья, настройки и детали модели
-самый быстрый -- ускорить фазу присоединения соседей и уменьшить использование памяти
(рекомендуется для> 50,000 XNUMX последовательностей)
-n для анализа нескольких выравниваний (только формат phylip)
(используйте для глобальной начальной загрузки с seqboot и CompareToBootstrap.pl)
-никакой поддержки не вычислять значения поддержки
-внутри newick_file, чтобы установить начальное дерево (а)
-intree1 newick_file, чтобы использовать это начальное дерево для всех выравниваний
(для более быстрой глобальной начальной загрузки при огромных выравниваниях)
-псевдо использовать псевдосчет (рекомендуется для последовательностей с большими интервалами)
-гтп -- обобщенная модель с обратимой во времени (только выравнивание нуклеотидов)
-ваг -- Модель Уилана-Энд-Гольдмана 2001 (только выравнивание аминокислот)
-Цитировать -- разрешить пробелы и другие запрещенные символы (но не символы ') в
имена последовательностей и имена кавычек в выходном дереве (только ввод fasta; fasttree будет
не смогу прочитать эти деревья в
-номл отключить максимальную вероятность
-ном отключить минимальные NNI и SPR
(рекомендуется при запуске дополнительных ML NNI с -внутри)
-ном -мллен -внутри для оптимизации длины ответвления для фиксированной топологии
-кошка # для указания количества рейтинговых категорий сайтов (по умолчанию 20)
or -нокат использовать постоянные ставки
-гамма -- после оптимизации дерева в приближении CAT,
изменить масштаб длины, чтобы оптимизировать вероятность Gamma20
-ограничения constraintAlignment для ограничения поиска топологии
constraintAlignment должен иметь 1 или 0 для обозначения разбиения
-эксперт -- увидеть больше вариантов
Детальные пользования для Fasttree 2.1.4 ССЕ3:
fasttree [-nt] [-n 100] [-quote] [-псевдо | -псевдо 1.0]
[-загрузка 1000 | -никакой поддержки] [-внутри начальный_дерево_файл | -intree1
начальный_файл_дерева] [-тихий | -нет пр] [-nni 10] [-spr 2] [-номл | -мллен | -млнни
10] [-mlacc 2] [-cat 20 | -нокат] [-гамма] [-медленно | -быстрый] [-2 | -нет2]
[-slownni] [-seed 1253] [-top | -нотоп] [-topm 1.0 [-закрыть 0.75] [-обновить 0.8]]
[-матрица Матрица | -номатрица] [-нж | -биондж] [-wag] [-nt] [-gtr] [-gtrrates ac ag at
cg ct gt] [-gtrfreq ACGT] [ -ограничения выравнивание ограничения [ -constraintWeight
100.0]] [-log файл журнала]
[alignment_file]
> newick_tree
or
fasttree [-nt] [-matrix Матрица | -номатрица] [-рассылка] -сделатьматрицу [выравнивание]
[-n 100]> phylip_distance_matrix
fasttree поддерживает выравнивание с чередованием fasta или phylip По умолчанию fasttree
ожидает выравнивания белков, используйте -нт для нуклеотидов fasttree читает стандартный ввод
если файл выравнивания не указан
Вход / выход опции:
-n -- читать в нескольких выравниваниях. Это только
работает с форматом phylip interleaved. Например, вы можете использовать его с выходом
из seqboot phylip. Если вы используете -n, fasttree будет записывать по одному дереву в каждой строке в
стандартный вывод.
-внутри Ньюикфайл -- прочтите стартовое дерево из newickfile.
Любые длины ветвей в начальных деревьях игнорируются.
-внутри -n будет читать отдельное стартовое дерево для каждого выравнивания.
-intree1 Ньюикфайл -- читать одно и то же стартовое дерево для каждого расклада
-тихо -- не записывать в стандартную ошибку во время нормальной работы (нет прогресса
индикатор, без сводки опций, без значений вероятности и т. д.)
-нет пр -- не записывать индикатор прогресса в stderr
-журнал журнальный файл -- сохранить промежуточные деревья, чтобы вы могли извлечь
деревья и перезапустите длительные задания, если они выйдут из строя -журнал также сообщает
расценки на сайт (1 означает самую медленную категорию)
-Цитировать -- заключать в кавычки имена последовательностей в выводе и разрешать пробелы, запятые,
круглые скобки и двоеточия в них, но не символы '(только файлы fasta)
Расстояния:
По умолчанию: для белковых последовательностей расстояния с поправкой на логарифм и
матрица аминокислотных различий, полученная из BLOSUM45
или для нуклеотидных последовательностей расстояния Джукса-Кантора. Чтобы указать другую матрицу,
использование -матрица FilePrefix или -номатрица Используйте -rawdist для выключения лог-коррекции или
использовать% different вместо Jukes-Cantor
-псевдо [вес] -- Используйте псевдосчетчики для оценки расстояний между
последовательности с небольшим перекрытием или без него. (По умолчанию выключено.) Рекомендуется при анализе
выравнивание имеет последовательности с небольшим перекрытием или без него. Если вес не указан,
это 1.0
Топология уточнение:
По умолчанию fasttree пытается улучшить дерево до 4 * log2 (N) раундов
обмены ближайших соседей с минимальной эволюцией (NNI), где N - количество
уникальные последовательности, 2 раунда движений subtree-prune-regraft (SPR) (также мин. evo.),
и до 2 * log (N) раундов NNI максимального правдоподобия. Использовать -нни установить номер
патронов мин. evo. NNI и -спр для установки раундов SPR. Использовать -номл превратить
отключены как NNI, так и SPR min-evo (полезно при уточнении
дерево приблизительно максимального правдоподобия с дополнительными NNI)
Используйте -длина пружины установить максимальную длину перемещения SPR (по умолчанию 10) Используйте -млнни установить
количество раундов использования NNI с максимальной вероятностью -млакк 2 или -млакк 3, чтобы всегда
оптимизировать все 5 филиалов в каждом NNI,
и оптимизировать все 5 веток за 2 или 3 раунда
Используйте -мллен для оптимизации длины ветки без ML NNI Используйте -мллен -ном -внутри
для оптимизации длины ответвления в фиксированной топологии Используйте -слоуни отключить эвристику
чтобы избежать постоянных поддеревьев (влияет на оба
ML и ME NNI)
Максимальный вероятность модель опции:
-ваг -- Модель Уилана-Энд-Голдмана 2001 года вместо (по умолчанию) модели Джонса-Тейлора-Тортона 1992 года
(только аа)
-гтп -- обобщенный обратимый во времени вместо (по умолчанию) Jukes-Cantor (только NT)
-кошка # -- укажите количество рейтинговых категорий сайтов (по умолчанию 20)
-нокат -- нет модели CAT (только 1 категория)
-гамма -- после последнего раунда оптимизации длин ветвей с помощью модели CAT,
сообщить вероятность по дискретной гамма-модели с тем же количеством
категории. fasttree использует те же длины ветвей, но оптимизирует форму гаммы
параметр и масштаб длин. Окончательное дерево будет иметь измененную длину.
Используется с -журнал, это также создает вероятность использования с CONSEL для каждого сайта, см.
GammaLogToPaup.pl и документация на сайте fasttree.
Поддержка ценностное опции:
По умолчанию fasttree вычисляет значения локальной поддержки путем повторной выборки сайта.
вероятность 1,000 раз и тест Симодаира Хасегава. Если вы укажете -ном, Он
вместо этого будет вычислять поддержку начальной загрузки с минимальной эволюцией. В любом случае
значения поддержки - это пропорции от 0 до 1
Используйте -никакой поддержки отключить значения поддержки или -загрузка 100, чтобы использовать всего 100 повторных выборок
Используйте -семена для инициализации генератора случайных чисел
Поиск для лучший присоединиться:
По умолчанию fasttree объединяет «видимый набор» быстрого присоединения к соседям с
местное восхождение на холмы, как в расслабленном присоединении к соседям
-медленный -- исчерпывающий поиск (например, NJ или BIONJ, но другая обработка пробелов)
-медленный занимает полчаса вместо 8 секунд для 1,250 белков
-самый быстрый -- искать только видимый набор (верхний удар для каждого узла)
В отличие от оригинального быстрого соединения соседей, -самый быстрый обновления видны (C) после
соединение A и B, если соединение (AB, C) лучше, чем соединение (C, visible (C)) -самый быстрый причислены
очень лениво обновляет удаленные расстояния, -самый быстрый Наборы -2-й также используйте
-самый быстрый -но2 чтобы избежать этого
Топ-хит эвристика:
По умолчанию fasttree использует список самых популярных для ускорения поиска. -нотоп (или -медленный)
чтобы отключить эту функцию
и сравните все листья друг с другом и все новые соединенные узлы друг с другом
-топм 1.0 -- установите размер списка с наибольшим успехом в параметр * sqrt (N)
fasttree оценивает верхние m совпадений листа из верхних 2 * m совпадений 'close'
сосед, где близость определяется как d (начальное число, закрытие) <0.75 * d (начальное число, попадание ранга
2 * m) и обновляет топ-хиты по мере присоединения
-Закрыть 0.75 -- изменить эвристику закрытия, ниже - более консервативно
-обновить 0.8 -- сравнить присоединенный узел со всеми другими узлами, если его
список самых популярных составляет менее 80% от желаемой длины, или если возраст самого популярного
список log2(м) или больше
-2-й or -но2 для включения или выключения эвристики 2-го уровня топ-хитов
Это сокращает использование памяти и время работы, но может привести к незначительному сокращению
качество дерева. (По умолчанию, -самый быстрый включается -2-й.)
Присоединяйся опции:
-Нью-Джерси: обычное (невзвешенное) присоединение к соседу (по умолчанию)
-биондж: взвешенные соединения, как в BIONJ
fasttree также будет взвешивать соединения во время NNI.
Условный топология по области применения опции:
-ограничения файл выравнивания -- выравнивание со значениями 0, 1 и -
Не все последовательности должны присутствовать. Столбец из нулей и единиц определяет ограниченный
расколоть. Некоторые ограничения могут быть нарушены (см. «Нарушение ограничений:» в стандарте
ошибка).
-constraintWeight -- насколько сильно взвесить ограничения. Значение 1
означает штраф 1 в длине дерева за нарушение ограничения По умолчанию: 100.0
Для получения дополнительной информации см. http://www.microbesonline.org/fasttree/
или комментарии в исходном коде
fasttree protein_alignment> дерево fasttree -нт nucleotide_alignment> дерево fasttree
-нт -гтп <nucleotide_alignment> дерево
fasttree принимает выравнивания в форматах fasta или phylip с чередованием
Общий кредита (должен be до выравнивание файл):
-тихо для подавления отчетной информации
-нет пр подавить индикатор прогресса
-журнал журнальный файл -- сохранять промежуточные деревья, настройки и детали модели
-самый быстрый -- ускорить фазу присоединения соседей и уменьшить использование памяти
(рекомендуется для> 50,000 XNUMX последовательностей)
-n для анализа нескольких выравниваний (только формат phylip)
(используйте для глобальной начальной загрузки с seqboot и CompareToBootstrap.pl)
-никакой поддержки не вычислять значения поддержки
-внутри newick_file, чтобы установить начальное дерево (а)
-intree1 newick_file, чтобы использовать это начальное дерево для всех выравниваний
(для более быстрой глобальной начальной загрузки при огромных выравниваниях)
-псевдо использовать псевдосчет (рекомендуется для последовательностей с большими интервалами)
-гтп -- обобщенная модель с обратимой во времени (только выравнивание нуклеотидов)
-ваг -- Модель Уилана-Энд-Гольдмана 2001 (только выравнивание аминокислот)
-Цитировать -- разрешить пробелы и другие запрещенные символы (но не символы ') в
имена последовательностей и имена кавычек в выходном дереве (только ввод fasta; fasttree будет
не смогу прочитать эти деревья в
-номл отключить максимальную вероятность
-ном отключить минимальные NNI и SPR
(рекомендуется при запуске дополнительных ML NNI с -внутри)
-ном -мллен -внутри для оптимизации длины ответвления для фиксированной топологии
-кошка # для указания количества рейтинговых категорий сайтов (по умолчанию 20)
or -нокат использовать постоянные ставки
-гамма -- после оптимизации дерева в приближении CAT,
изменить масштаб длины, чтобы оптимизировать вероятность Gamma20
-ограничения constraintAlignment для ограничения поиска топологии
constraintAlignment должен иметь 1 или 0 для обозначения разбиения
-эксперт -- увидеть больше вариантов
Для получения дополнительной информации см. http://www.microbesonline.org/fasttree/
Используйте fasttree онлайн с помощью сервисов onworks.net