Это команда bp_flanksp, которую можно запустить в провайдере бесплатного хостинга OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
bp_flanks - поиск фланкирующих последовательностей для варианта в позиции последовательности
СИНТАКСИС
bp_flanks --position POS [-p POS ...] [--flanklen INT]
присоединение | имя файла
ОПИСАНИЕ
Этот сценарий позволяет извлекать подпоследовательность вокруг интересующей области из
существующая последовательность. Вывод, если запись последовательности в формате fasta, где строка заголовка
содержит дополнительную информацию о местоположении.
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
Сценарий принимает один безымянный аргумент, который может быть либо именем файла в локальной файловой системе.
или порядковый номер нуклеотидной последовательности.
-p Position использует простую таблицу функций нуклеотидной последовательности
- обозначение позиции для определения интересующей области, обычно
SNP или микросателлитный повтор, вокруг которого располагаются фланги.
определены.
Может быть несколько вариантов позиции или вы можете
укажите один вариант позиции в списке, разделенном запятыми.
Формат позиции:
[id:] int | диапазон | между [-]
Необязательный идентификатор - это имя, которое вы хотите назвать новым
последовательность. Если он не указан в, присоединяет порядковый номер к
имя записи с подчеркиванием.
Положение - это либо точка (например, 234), либо диапазон (например,
250..300) или точка вставки между нуклеотидами
(например, 234 ^ 235)
Если позиция не полностью в пределах источника
последовательность выходная последовательность будет усечена и
напечатает предупреждение.
Необязательный дефис [-] в конце позиции
указывает, что вы хотите, чтобы полученная последовательность была
в противоположной пряди.
-f По умолчанию 100. Это длина нуклеотидов.
--flanklen последовательность, полученная с обеих сторон от данной позиции.
Если исходный файл не содержит
ВЫВОД ФОРМАТ
Результатом является запись в формате fasta, где файл описания содержит пары тег = значение.
для получения информации о том, где в исходной последовательности была взята подпоследовательность.
ID записи fasta - это имя, указанное в командной строке, присоединенное дефисом к
имя файла или доступ к исходной последовательности. Если не указан идентификатор, серия последовательных
целые числа.
Пары тег = значение:
oripos = int
позиция в исходном файле
прядь = 1 | -1
цепь последовательности по сравнению с исходной последовательностью
allelepos = int
положение интересующей области в текущей записи. Тег тот же, что и использованный
автор: dbSNP @ NCBI
Последовательность выделяет положение варианта аллеля, показывая его заглавными буквами и остальными буквами.
последовательности строчными буквами.
ПРИМЕР
% bp_flanks ~ / seq / ar.embl
> 1_ / HOME / HEIKKI / SEQ / AR.EMBL oripos = 100 нитей = 1 аллелепоз = 100
taataactcagttcttattgcacctacttcagtggacactgaatttggaaggtggagga
ttttgttttttcttttaagatctgggcatctttgaatCtacccttcaagtattaagag
acagactgtgagcctagcagggcagatcttgtccaccgtgtgtcttcttctgcacgagac
tttgaggctgtcagagcgct
TODO
Предполагается, что входные файлы имеют формат EMBL, а последовательности извлекаются только из
база данных EMB. Сделайте это более общим и используйте реестр.
head1 ОБРАТНАЯ СВЯЗЬ
Рассылка Списки
Отзывы пользователей - неотъемлемая часть развития этого и других модулей Bioperl. послать
Ваши комментарии и предложения желательно направлять в списки рассылки Bioperl. Ваше участие
очень ценится.
[электронная почта защищена] - Обсуждение
http://bioperl.org/wiki/Mailing_lists - О списках рассылки
Отчетность ошибки
Сообщайте об ошибках в систему отслеживания ошибок Bioperl, чтобы мы могли отслеживать ошибки и их
разрешающая способность. Отчеты об ошибках можно отправлять через Интернет:
https://github.com/bioperl/bioperl-live/issues
АВТОР - Хейкки Леваслаихо
Эл. адрес:
Используйте bp_flanksp в Интернете с помощью сервисов onworks.net