Это команда dnadiff, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
mummer - пакет для выравнивания последовательностей нескольких геномов
СИНТАКСИС
ряженый-аннотировать
объединить
днадиф [опции]или [варианты]-d<дельтафайл>
точные тандемы
пробелы
карта [опции]<координатыфайл>[УТРкоординаты][СКДкоординаты]
карты [-д][-ф][-л][-с]
фигляр [кредита]
заговор [опции]<матчфайл>
Nucmer [опции]
nucmer2xfig
промер [опции]
повторное совпадение [опции]
беги-ряженый1 <фастассылка><фастазапрос>[-р]
беги-ряженый3 <фастассылка><мульти-фастазапрос>
шоу-выравнивает [опции]<ссылкаID><qryID>
Входными данными являются выходные данные .delta программы "nucmer" или "promer", переданной на
командная строка.
Вывод выводится на стандартный вывод и состоит из всех выравниваний между запросом и ссылкой.
последовательности, указанные в командной строке.
ПРИМЕЧАНИЕ. По умолчанию сортировка не выполняется, поэтому выравнивания будут упорядочены, как указано в
в Вход.
шоу-коорды [опции]
шоу-снп [опции]
демонстрация [опции]
ОПИСАНИЕ
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
Все инструменты (кроме пробелов) подчиняются параметрам -h, --help, -V и --version, как и обычно.
ожидать. Эта справка превосходна и делает эти справочные страницы практически устаревшими.
объединить Объединяет MUM в продлевая совпадения с концов и между MUM.
это фаст-файл эталонной последовательности. это мульти-
файл fasta последовательностей, сопоставленных со ссылкой
-D Выводить на стандартный вывод только разностные позиции
и персонажи
-n Разрешить совпадения только между нуклеотидами, то есть ACGT
-N num Break совпадает с или более последовательных не-ACGT
-q тег Используется для обозначения соответствия запросу
-r тег Используется для обозначения совпадения ссылки
-S Вывести все различия в строках
-t Запрос метки совпадает с заголовком запроса fasta
-v число Установить уровень подробности для дополнительного вывода
-W файл Сбросить имя выходного файла по умолчанию witherrors.gaps
-x Не выводить файлы .cover
-e Установить отсечку частоты ошибок на e (например, 0.02 - это два процента)
днадиф Проведите сравнительный анализ двух наборов последовательностей с использованием числового прибора и связанного с ним
утилиты с рекомендованными параметрами. См. Документацию MUMmer для более подробной информации.
описание вывода. Создает следующие выходные файлы:
.report - Сводка согласований, различий и SNP
.delta - стандартный вывод выравнивания числовых значений
.1delta - выравнивание 1 к 1 от дельта-фильтра -1
.mdelta - выравнивание M-to-M из delta-filter -m
.1coords - координаты 1 к 1 из show-coords -THrcl .1delta
.mcoords - координаты M-to-M из show-coords -THrcl .mdelta
.snps - SNP из show-snps -rlTHC .1delta
.rdiff - классифицированные точки останова ref из show-diff -rH .mdelta
.qdiff - классифицированные точки останова qry из show-diff -qH .mdelta
.unref - невыровненные идентификаторы и длина ссылок (если применимо)
.unqry - невыровненные идентификаторы и длина запросов (если применимо)
ОБЯЗАТЕЛЬНЫЙ:
ссылка Установка входной ссылки multi-FASTA filename
query Установить входной запрос multi-FASTA filename
or
файл delta Нефильтрованный файл выравнивания .delta от nucmer
ОПЦИИ:
-d | delta Предоставляет предварительно вычисленный файл дельты для анализа
-h
--help Показать справочную информацию и выйти
-p | prefix Установить префикс выходных файлов (по умолчанию "out")
-V
--version Показать информацию о версии и выйти
карта
-h
--help Показать справочную информацию и выйти
-m | mag Установить увеличение, при котором фигура отображается,
это опция для fig2dev, которая используется для генерации
файлы PDF и PS (по умолчанию 1.0)
-n | num Установить количество выходных файлов, используемых для разделения
вывод, это делается для того, чтобы не создавать файлы, которые слишком
большой для отображения (по умолчанию 10)
-p | prefix Установить префикс выходного файла
(по умолчанию "PROMER_graph или NUCMER_graph")
-v
--verbose Подробное ведение журнала обработанных файлов
-V
--version Показать информацию о версии и выйти
-x1 координата Устанавливает нижнюю координатную границу дисплея
-х2 координата Установить верхнюю координатную границу дисплея
-g | ref Если входной файл предоставлен 'mgaps', установите
идентификатор эталонной последовательности (как он указан в первом столбце
файла координат UTR / CDS)
-I Отображать имя последовательностей запросов
-Ir Отображать название эталонных генов
фигляр Найдите и выведите (в стандартный вывод) позиции и длину всех достаточно длинных
максимальное совпадение подстроки в а также
-mum вычислить максимальное совпадение, уникальное в обеих последовательностях
-mumcи то же, что и -mumreference
-mumreference вычислить максимальное количество совпадений, которые уникальны в
ссылочная последовательность, но не обязательно в последовательности запроса
(По умолчанию)
-maxmatch вычислить все максимальные совпадения независимо от их уникальности
-n соответствует только символам a, c, g или t
они могут быть в верхнем или нижнем регистре
-l установить минимальную длину матча
если не установлен, значение по умолчанию - 20
-b вычислять прямые и обратные совпадения дополнений
-r вычислять только совпадения с обратным дополнением
-s показать соответствующие подстроки
-c сообщить позицию запроса обратного соответствия дополнения
относительно исходной последовательности запроса
-F форсировать формат вывода 4 столбцов независимо от количества
входы эталонной последовательности
-L показать длину последовательности запросов в строке заголовка
нункмер
nucmer генерирует выравнивание нуклеотидов между двумя входами mutli-FASTA
файлы. Генерируются два выходных файла. Список выходного файла .cluster
кластеры совпадений между каждой последовательностью. В файле .delta перечислены
расстояние между вставками и удалениями, которые производят максимальную оценку
выравнивания между каждой последовательностью.
ОБЯЗАТЕЛЬНЫЙ:
Ссылка Установка входной ссылки multi-FASTA filename
Запрос Задайте имя файла с несколькими FASTA для входящего запроса.
--mum Использовать совпадения привязок, которые уникальны как в ссылке
и запрос
--mumcand То же, что и --mumreference
--mumreference Использовать совпадения привязки, уникальные в ссылке
но не обязательно уникально в запросе (поведение по умолчанию)
--maxmatch Использовать все совпадения привязок независимо от их уникальности
-b | breaklen Установить расстояние, на которое удлинитель выравнивания будет пытаться
расширяйте регионы с плохими показателями перед тем, как сдаться (по умолчанию 200)
-c | mincluster Устанавливает минимальную длину кластера совпадений (по умолчанию 65)
- [no] delta Переключить создание файла дельты (по умолчанию --delta)
--depend Распечатать информацию о зависимости и выйти
-d | diagfactor Установить коэффициент разделения диагональных разностей кластеризации
(по умолчанию 0.12)
- [no] extend Переключить шаг расширения кластера (по умолчанию --extend)
-f
--forward Использовать только прямую цепочку последовательностей запросов
-g | maxgap Установить максимальный промежуток между двумя соседними совпадениями в
кластер (по умолчанию 90)
-h
--help Показать справочную информацию и выйти
-l | minmatch Установить минимальную длину одного совпадения (по умолчанию 20)
-o
--coords Автоматически генерировать исходные координаты NUCmer1.1
выходной файл с помощью программы show-coords
- [no] optimize Включить оптимизацию оценки выравнивания, т. е. если выравнивание
расширение доходит до конца последовательности, выполняется возврат
для оптимизации оценки выравнивания вместо прекращения
выравнивание в конце последовательности (по умолчанию --optimize)
-p | prefix Установить префикс выходных файлов (по умолчанию "out")
-r
--reverse Использовать только обратное дополнение последовательностей запросов
- [нет] упрощать Упростить выравнивание, удалив затененные кластеры. Перемена
эта опция отключена, если последовательность выравнивается по самой себе, чтобы смотреть
для повторов (по умолчанию --simplify)
промер
промер генерирует выравнивание аминокислот между двумя входными ДНК Mutli-FASTA
файлы. Генерируются два выходных файла. Список выходного файла .cluster
кластеры совпадений между каждой последовательностью. В файле .delta перечислены
расстояние между вставками и удалениями, которые производят максимальную оценку
выравнивания между каждой последовательностью. Вход ДНК транслируется во все 6
рамки считывания для генерации вывода, но координаты вывода
ссылка на исходный вход ДНК.
ОБЯЗАТЕЛЬНЫЙ:
Ссылка Установите входной эталонный файл multi-FASTA DNA.
Запрос Установить файл мульти-FASTA DNA для входящего запроса
--mum Использовать совпадения привязок, которые уникальны как в ссылке
и запрос
--mumcand То же, что и --mumreference
--mumreference Использовать совпадения привязки, уникальные в ссылке
но не обязательно уникально в запросе (поведение по умолчанию)
--maxmatch Использовать все совпадения привязок независимо от их уникальности
-b | breaklen Установить расстояние, на которое удлинитель выравнивания будет пытаться
расширить регионы с плохими оценками, прежде чем сдаться, измеряется в
аминокислоты (по умолчанию 60)
-c | mincluster Устанавливает минимальную длину кластера совпадений, измеряемую в
аминокислоты (по умолчанию 20)
- [no] delta Переключить создание файла дельты (по умолчанию --delta)
--depend Распечатать информацию о зависимости и выйти
-d | diagfactor Установить коэффициент разделения диагональных разностей кластеризации
(по умолчанию .11)
- [no] extend Переключить шаг расширения кластера (по умолчанию --extend)
-g | maxgap Установить максимальный промежуток между двумя соседними совпадениями в
кластер, измеряемый в аминокислотах (по умолчанию 30)
-l | minmatch Устанавливает минимальную длину одного совпадения в амино
кислоты (по умолчанию 6)
-m | masklen Устанавливает максимальную длину маскировки форзаца, измеряемую в амино.
кислоты (по умолчанию 8)
-o
--coords Автоматически генерировать исходный PROmer1.1 ".coords"
выходной файл с помощью программы "show-coords"
- [no] optimize Включить оптимизацию оценки выравнивания, т. е. если выравнивание
расширение доходит до конца последовательности, выполняется возврат
для оптимизации оценки выравнивания вместо прекращения
выравнивание в конце последовательности (по умолчанию --optimize)
-p | prefix Установить префикс выходных файлов (по умолчанию "out")
-x | matrix Устанавливает номер матрицы выравнивания равным 1 [BLOSUM 45],
2 [BLOSUM 62] или 3 [BLOSUM 80] (по умолчанию 2)
повторное совпадение Найти все максимально точные совпадения в
-E Используйте исчерпывающий (медленный) поиск для поиска совпадений
-f Только прямая нить, не использовать обратное дополнение
-n # Установить минимальную длину точного совпадения на #
-t Выводить только тандемные повторы
-V # Установить уровень подробной (отладочной) печати на #
шоу-выравнивает
-h Показать справочную информацию
-q Сортировка выравниваний по начальной координате запроса
-r Сортировка выравниваний по начальной координате ссылки
-w int Установить ширину экрана - по умолчанию 60
-x int Установить тип матрицы - по умолчанию 2 (BLOSUM 62),
другие варианты включают 1 (BLOSUM 45) и 3 (BLOSUM 80)
примечание: влияет только на выравнивание аминокислот
шоу-коорды
-b Объединяет перекрывающиеся выравнивания независимо от каталога соответствия
или фрейм и не отображает никакой идентификационной информации.
-B Переключить вывод в формат btab
-c Включить информацию о процентном покрытии в вывод
-d Показать направление выравнивания в дополнительном
Столбцы FRM (по умолчанию для промеров)
-g Устаревший вариант. Пожалуйста, используйте вместо этого дельта-фильтр
-h Показать справочную информацию
-H Не печатать выходной заголовок
-I float Установить минимальный процент идентичности для отображения
-k Нокаут (не отображать) перекрывающиеся выравнивания
другое выравнивание в другом кадре более чем на 50%
их длины, И имеют меньшее процентное сходство
или меньше 75% от размера другого выравнивания
(только промер)
-l Включить информацию о длине последовательности в вывод
-L long Установить минимальную длину выравнивания для отображения
-o Аннотировать максимальное выравнивание между двумя последовательностями, т.е.
перекрытия между ссылочными и запросными последовательностями
-q Сортировать выходные строки по идентификаторам запроса и координатам
-r Сортировать выходные строки по идентификаторам ссылок и координатам
-T Переключить вывод в формат с разделителями табуляции
Входными данными являются выходные данные .delta программы "nucmer" или "promer", переданной на
командная строка.
Вывод выводится на стандартный вывод и состоит из списка координат, идентичности в процентах и прочего.
полезная информация о данных выравнивания, содержащихся в файле .delta, используемом в качестве
вход.
ПРИМЕЧАНИЕ. По умолчанию сортировка не выполняется, поэтому выравнивания будут упорядочены как найденные.
в Вход.
шоу-снп
-C Не сообщать об SNP из сопоставлений с неоднозначным
отображение, т. е. сообщать только те SNP, где [R] и [Q]
столбцы равны 0 и не выводят эти столбцы
-h Показать справочную информацию
-H Не печатать выходной заголовок
-Не сообщаю об инделах
-l Включить информацию о длине последовательности в вывод
-q Сортировать выходные строки по идентификаторам запросов и позициям SNP
-r Сортировать выходные строки по идентификаторам ссылок и позициям SNP
-S Укажите, какие выравнивания следует сообщать, передавая
строки 'show-coords' на стандартный ввод
-T Перейти к формату с разделителями табуляции
-x int Включить x символов окружающего контекста SNP в
вывод, по умолчанию 0
Входные данные - это выходные данные .delta программы nucmer или promer, переданной по команде.
линии.
Вывод выводится на стандартный вывод и состоит из списка SNP (или аминокислотных замен для
промер) с позициями и другой полезной информацией. По умолчанию вывод будет отсортирован с помощью -r
а столбец [BUFF] всегда будет ссылаться на последовательность, позиции которой были отсортированы.
Это значение указывает расстояние от этого SNP до ближайшего несоответствия (конец выравнивания,
indel, SNP и т. д.) в одном выравнивании, а в столбце [DIST] указано расстояние
от этого SNP до ближайшего конца последовательности. SNP, для которых столбцы [R] и [Q] являются
больше 0 следует оценивать с осторожностью, поскольку в этих столбцах указывается количество
другие выравнивания, которые перекрывают эту позицию. Используйте -C, чтобы гарантировать, что SNP сообщаются только из
уникальные регионы выравнивания.
демонстрация
-a Описать путь мозаики, напечатав разделенные табуляцией
координаты области выравнивания на стандартный вывод
-c Предположить, что ссылочные последовательности циклические, и разрешить
плиточные контиги для охвата начала координат
-g int Установить максимальный промежуток между кластерными выравниваниями [-1, INT_MAX]
Значение -1 будет представлять бесконечность.
(числовое значение по умолчанию = 1000)
(промер по умолчанию = -1)
-i float Установить минимальный процент идентичности для плитки [0.0, 100.0]
(числовое значение по умолчанию = 90.0)
(по умолчанию = 55.0)
-l int Установить минимальную длину контига для отчета [-1, INT_MAX]
Значение -1 будет представлять бесконечность.
(обычное значение по умолчанию = 1)
-p файл Вывести псевдомолекулу контигов запроса в 'файл'
-R Разбирайтесь с повторяющимися контигами, случайным образом размещая их
в одном из мест их копирования (подразумевается -V 0)
-t файл Вывести список контигов в стиле TIGR для каждой последовательности запросов.
который в достаточной мере соответствует ссылке (не круговой)
-u файл Выводить координаты области выравнивания, разделенные табуляцией.
непригодных контигов в файл
-v float Установить минимальное покрытие контигов на тайл [0.0, 100.0]
(числовое значение по умолчанию = 95.0) сумма индивидуальных выравниваний
(промер по умолчанию = 50.0) протяженность синтенической области
-V float Установить минимальную разницу охвата контигов [0.0, 100.0]
т.е. разница, необходимая для определения одного выравнивания
«лучше», чем другой расклад
(числовое значение по умолчанию = 10.0) сумма индивидуальных выравниваний
(промер по умолчанию = 30.0) протяженность синтенической области
-x Описать путь листов, распечатав контиг XML
связывание информации с stdout
Входные данные - это выход .delta программы nucmer, работающей с очень похожими данными последовательности, или
вывод .delta программы Promer запускается с данными расходящейся последовательности.
Вывод выводится на стандартный вывод и состоит из прогнозируемого местоположения каждого выравнивающего запроса.
contig, отображаемый в ссылочные последовательности. Эти координаты указывают на протяженность
весь контиг запроса, даже если на самом деле только определенный процент контига
выровнен (если не используется опция -a). Столбцы, начало в ссылке, конец в ссылке, расстояние до
следующий контиг, длина этого контига, покрытие выравнивания, идентичность, ориентация и идентификатор
соответственно.
Используйте dnadiff онлайн с помощью сервисов onworks.net