Это команда sigma, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
sigma - Простое жадное множественное выравнивание некодирующих последовательностей ДНК
СИНТАКСИС
сигма [параметры] [входной файл.fasta] [входной файл2.fasta ...]
Каждый файл fasta может содержать одну или несколько последовательностей; все последовательности будут
выровнены вместе.
ОПИСАНИЕ
Сигма («Простое жадное множественное выравнивание») - это программа выравнивания с новым алгоритмом.
и схема подсчета очков, разработанная специально для некодирующей последовательности ДНК. Он использует стратегию
поиска наилучших возможных локальных выравниваний без зазоров, на каждом этапе делая все возможное
возможное согласование, соответствующее существующим согласованиям, и оценивает значимость
выравнивание на основе длин выровненных фрагментов и фоновой модели, которая может
поставляться или оцениваться из вспомогательного файла межгенной ДНК. С реальными данными, пока
«правильность» не может быть напрямую определена количественно для выравнивания, использующего мотив PhyloGibbs
Finder на предварительно выровненной последовательности предполагает, что выравнивания Sigma лучше.
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
-A --aligned_output
Выровненный, красиво напечатанный вывод (сравните с -F option) (по умолчанию: только это). Смотрите также
-C.
-b --bgprobfile имя файла
Вспомогательный файл (в формате fasta) для чтения фоновых последовательностей (заменен
-B). Обычно это файл, содержащий большое количество похожих некодированных
последовательность, из которой фоновые вероятности одно- и динуклеотидов могут быть
по оценкам.
-B --bgseqfile имя файла
Файл с вероятностями фона. Формат описан ниже.
-C --caps_only
Используйте только заглавные буквы в выходной последовательности для совместимости с выводом некоторых
другие программы, такие как ClustalW и MLagan. По умолчанию вывод осуществляется в смешанном регистре (как в
Dialign), а основания в нижнем регистре считаются невыровненными.
-F --fasta_output
Вывод мульти-фаста (можно использовать оба -A и -F в любом порядке). Смотрите также -C.
-n --ncorrel номер
Фоновая корреляция (по умолчанию 2= динуклеотид; 1= базовое количество для одного сайта, 0= 0.25 за
основание).
-x, --значение номер
Установите предел вероятности совпадения (по умолчанию 0.002, меньше = больше)
строгие).
-h, --Помогите
Отображает этот список опций.
ЕЩЁ ПОМОГИТЕ
Параметр «значимость» (-x) определяет, принимаются ли локальные выравнивания или
отклоненный. В настоящее время значение по умолчанию - 0.002. Эксперименты на синтетических данных (описанных в
paper) предполагают, что 0.002 - это порог, при котором сигма не может выровняться
филогенетически не связанные данные, которые имеют умеренную (дрожжевую) динуклеотидную корреляцию.
Использование «фоновой модели», подходящей для выравниваемых последовательностей, значительно снижает
ложное выравнивание синтетических данных (и, можно надеяться, реальных данных). Самый простой способ
чтобы гарантировать, что это будет поставлять через -b параметр, файл формата FASTA, содержащий большие
количество данных схожих последовательностей (например, если вы выравниваете последовательности дрожжей, предоставьте файл
содержащие всю последовательность межгенных дрожжей).
Вместо этого, если частоты одиночных сайтов и динуклеотидов уже известны, они
может быть предоставлен в файле через -B вариант. Формат файла должен быть: одна запись на
строка с мононуклеотидом или динуклеотидом (без учета регистра), за которым следует
частота. (например, «A 0.3», «AT 0.16» и т. д. в последовательных строках.) Образец файла находится в папке
Подкаталог "Background" исходного дистрибутива (в системах Debian этот файл может быть
найдено в / usr / share / doc / sigma-align / Фон каталог). Файл вроде
"yeast.nc.3.freq" в подкаталоге "tests" исходного дистрибутива MEME работает нормально.
(количество тринуклеотидов игнорируется).
СПРАВКА
Пожалуйста, процитируйте Sigma: Rahul Siddharthan (2006) Множественное выравнивание слабо сохраняющихся
некодирующая последовательность ДНК BMC Bioinformatics 2006, 7: 143 DOI: 10.1186 / 1471-2105-7-143
Опубликовано 16 марта 2006 г., доступно на сайте http://www.biomedcentral.com/1471-2105/7/143/
АВТОРЫ
Рахул Сиддхартхан <[электронная почта защищена]>
Написал сигму. Если вы используете Sigma для реальных исследований, сообщите об этом автору.
что он может предупредить вас об исправлениях или новых выпусках.
Чарльз Плесси <[электронная почта защищена]>
Написал справочную страницу в формате DocBook XML для дистрибутива Debian.
АВТОРСКИЕ ПРАВА
Авторские права © 2006-2007 Рахул Сиддхартхан
Авторские права © 2006-2007 Чарльз Плесси
Sigma - бесплатное программное обеспечение. Вы можете распространять и / или изменять его в соответствии с условиями
Стандартная общественная лицензия GNU, опубликованная Free Software Foundation.
В системах Debian полный текст Стандартной общественной лицензии GNU можно найти в
/ usr / share / common-licenses / GPL.
Используйте сигму онлайн с помощью сервисов onworks.net