Это команда fa2htgs, которую можно запустить в провайдере бесплатного хостинга OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
fa2htgs - форматтер для представления проектов высокопроизводительного секвенирования генома
СИНТАКСИС
fa2htgs [-] [-6 ул] [-7 ул] [-A имя файла] [-C ул] [-D] [-L имя файла] [-M ул] [-N]
[-O имя файла] [-P ул] [-Q имя файла] [-S ул] [-T имя файла] [-X] [-a ул] [-b N] [-c ул]
[-d ул] [-e имя файла] [-f] -g ул [-h ул] [-i имя файла] [-k ул] [-l N] [-m] [-n ул]
[-o имя файла] [-p N] [-q] [-r ул] -s ул [-t имя файла] [-u] [-v] [-w] [-x ул]
ОПИСАНИЕ
fa2htgs это программа, используемая для генерации Seq-представлений (файл представления последовательности ASN.1) для
проекты высокопроизводительного секвенирования генома.
fa2htgs будет читать файл FASTA (или файл Ace Contig со значениями качества последовательности Phrap),
файл шаблона отправки Sequin (чтобы получить контактную информацию и цитату для
отправка) и ряд аргументов командной строки (см. ниже). Затем эта программа
объединяет эту информацию, чтобы сделать заявку подходящей для GenBank. Как только у вас есть
сгенерировал ваш файл отправки, вам необходимо следовать протоколу отправки (см. README
присутствуют в вашей учетной записи FTP или отправлены по почте в ваш Центр).
fa2htgs предназначен для автоматизации скриптами для массовой отправки неаннотированных
последовательность генома. Его можно легко расширить с его нынешней простой формы, чтобы позволить больше
сложная обработка. Представление подготовлено с fa2htgs также можно прочитать в
Псеквин(1), а затем аннотировано более подробно.
Вопросы и опасения по поводу этого протокола обработки или того, как использовать этот инструмент, должны быть
отправлено[электронная почта защищена]>.
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
Сводка опций приведена ниже.
- Распечатать сообщение об использовании
-6 ул Клон SP6 (например, Contig1, слева)
-7 ул Клон T7 (например, Contig2, справа)
-A имя файла
Имя файла для ввода списка доступа (взаимоисключающее с -T и -i). Вход
файл содержит таблицу с разделителями табуляции с тремя-пятью столбцами, которые являются присоединением
номер, начальное положение, конечное положение и (необязательно) длина и прядь. Если
start> stop используется отрицательная цепочка в указанном образце. Разрыв
обозначается словом "пробел" вместо присоединения, 0 для начала и остановки
позиции и число для длины.
-C ул Имя библиотеки клонирования (будет отображаться как / clone-lib = "ул" на исходной функции)
-D Последовательность HTGS_DRAFT
-L имя файла
Прочитать phrap contig order from имя файла. Это файл с разделителями табуляции, который можно
используется для управления порядком контигов (обычно задается -P), так же как
с указанием окончания SP6 и T7. Его также можно использовать, когда известно, что контиги
в противоположной ориентации. Например:
Contig2 + 1 SP6 осталось
Контиг3 + 1
Contig1 - Т7 правый
Первый столбец - это имя контига, второй - ориентация, третий -
fragment_group, четвертый указывает конец SP6 или T7, а пятый говорит
с какой стороны конца SP6 или T7 вектор удален.
-M ул Название карты (будет отображаться как / map = "ул" на исходной функции)
-N Аннотировать assembly_fragments
-O имя файла
Читать комментарий от имя файла (Максимум 100 символов в строке; ~ это разрыв строки и `~
это буквальный ~. Вы можете проверить формат с помощью PS блесток(1)).
-P ул Используемые контиги, разделенные запятыми. Если -P не обозначен -T вариант,
тогда фрагменты будут размещены в том порядке, в котором они находятся в файле ace (который
подходит для записи фазы 1, но не для фазы 2 или 3). Если вам нужно установить
порядок сегментов файла ace, вам нужно установить его с помощью -P флаг,
как это: -P "Contig1,Contig4,Contig3,Contig2,Contig5"
-Q имя файла
Прочитать оценки качества из имя файла
-S ул Название штамма
-T имя файла
Имя файла для ввода phrap (взаимоисключающее с -A и -i)
-X Координаты во входном файле находятся в результирующей сегментированной последовательности. (Базы
1 через n каждого образца.) В противном случае координаты указаны на
отдельные образцы, которые не обязательно должны начинаться с базы 1 записи.
-a ул Присоединение GenBank; используйте тогда и только тогда, когда обновляете последовательность.
-b N Длина промежутка (по умолчанию = 100; допустимо любое значение от 0 до 1000000000)
-c ул Имя клона (будет отображаться как / clone в исходной функции; может быть таким же, как -s)
-d ул Название последовательности (появится в GenBank ОПРЕДЕЛЕНИЕ линия)
-e имя файла
Записывать ошибки в имя файла
-f htgs_fulltop ключевое слово
-g ул Тег Genome Center (вероятно, такой же, как ваше имя для входа на FTP-сервер NCBI)
-h ул Хромосома (будет отображаться как / хромосома в исходной функции)
-i имя файла
Имя файла для ввода fasta (по умолчанию stdin; взаимоисключающее с -A и -T)
-k ул Добавьте предоставленную строку как ключевое слово.
-l N Длина последовательности в битах (по умолчанию = 0). Длина сверяется с фактическим
количество баз получаем. Для последовательности фаз 1 и 2 он также используется для оценки разрыва.
длины. Для записей фаз 1 и 2 важно использовать число БОЛЬШЕ, чем
количество предоставленного нуклеотида, иначе это приведет к ложным "пробелам". Здесь
предполагается, что будет использоваться предполагаемая полная длина ВАС или космида. Там
между сегментами должно быть не менее 20-30 `n '(вы можете проверить их в
Sequin), так как это обеспечит правильное поведение при использовании этой последовательности с BLAST.
В противном случае "артефактные" несвязанные соседи сегмента могут оказаться рядом.
друг друга.
-m Взять комментарий из шаблона
-n ул Название организма (по умолчанию = Homo sapiens)
-o имя файла
Имя файла для вывода asn.1 (по умолчанию = stdout)
-p N Фаза HTGS:
1 Набор неупорядоченных контигов с пропусками неизвестной длины. Фаза 1
запись должна состоять как минимум из двух сегментов с одним пробелом. (дефолт)
2 Серия упорядоченных контигов, возможно, с известной длиной промежутка. Это должно быть
одиночная последовательность без пропусков, если в последовательности есть неоднозначности, которые необходимо разрешить.
3 Одна непрерывная последовательность. Эта последовательность закончена, но не
обязательно с аннотациями.
-q htgs_cancelled ключевое слово
-r ул Замечание об обновлении (краткий комментарий, описывающий характер обновления, например «новый
последовательность »,« новая цитата »или« обновленные функции »)
-s ул Название последовательности. Последовательность должна иметь имя, уникальное в пределах генома.
центр. Мы используем сочетание названия центра генома (-g аргумент) и
имя последовательности (-s), чтобы отследить эту последовательность и поговорить с вами об этом. Имя
может иметь любую форму, которая вам нравится, но должна быть уникальной в вашем центре.
-t имя файла
Имя файла для шаблона Seq-submit (по умолчанию = template.sub)
-u Биоисточник из шаблона
-v ключевое слово htgs_activefin
-w Флаг дробовика целого генома
-x ул Вторичные регистрационные номера, разделенные запятыми, st U10000, L11000.
В некоторых случаях большой сегмент заменяет другой или группу других присоединений.
числа (записи). Эти записи, которые больше не нужны в GenBank, должны быть
сделан вторичным. С помощью -x аргумент, вы можете указать номера доступа, которые вы хотите
сделать второстепенным. Это даст нам указание удалить инвентарный номер (а) из
GenBank, и больше не будет частью выпуска GenBank. Тем не менее они будут
быть доступным от Entrez.
GREAT УХОД следует принимать во внимание при использовании этого аргумента !!! Неправильное использование присоединения
цифры приведут к несоответствующему изъятию записей GenBank из
GenBank, EMBL и DDBJ. Мы предоставляем этот параметр для удобства отправки
центры, но, возможно, потребуется удалить его, если не использовать осторожно.
Используйте fa2htgs онлайн с помощью сервисов onworks.net