Это командная схватка, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
борьба - Преобразование между форматами файлов SAM, BAM и CRAM.
СИНТАКСИС
борьба [кредита] [входной_файл [выходной файл]]
ОПИСАНИЕ
борьба конвертирует между различными форматами файлов выравнивания секвенирования следующего поколения, включая
SAM, BAM и CRAM. Он может действовать как канал для чтения stdin и записи в stdout, или на
именованные файлы.
При работе в режиме конвейера типом ввода по умолчанию является SAM или BAM, что требует наличия -I впихивать
вариант, указывающий, что ввод находится в формате CRAM, является подходящим. По умолчанию выводится BAM, но
можно отрегулировать с помощью -O формат вариант. При заданных именах файлов тип файла
автоматически выбирается на основе суффикса имени файла.
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
-I формат
Выбирает формат ввода, где формат это один из Sam, Bam или Cram. Используйте это, когда
чтение через канал, чтобы избежать потребления входных байтов при попытке определить, если
ввод в формате SAM или BAM.
-O формат
Выбирает выходной формат, где формат это один из Sam, Bam или Cram.
-1 в -9
Устанавливает уровень сжатия от 1 (низкое сжатие, быстрое) до 9 (высокое сжатие,
медленно) при записи в формате BAM или CRAM. Это используется только во время записи.
-0 or -u
Записывает несжатые данные. В BAM по-прежнему используются контейнеры BGZF, но без
внутреннее сжатие. Вместо этого в CRAM он хранит блоки в формате RAW. Опция
не влияет на вывод SAM.
-j Только кодирование CRAM. Добавьте bzip2 в список потенциально используемых кодов сжатия
при создании CRAM.
-Z Только кодирование CRAM. Добавить lzma в список потенциально используемых кодов сжатия
при создании CRAM. Учитывая медленную скорость сжатия lzma, это может быть только
используется там, где он дает значительное преимущество перед zlib или bzip2, но с более высоким
уровни сжатия (-7) этот вес игнорируется, поскольку скорость декомпрессии LZMA равна
приемлемо, хотя и медленнее, чем zlib.
-m Только декодирование CRAM. Сгенерируйте вспомогательные поля MD: Z: и NM: I: на основе
сжатие на основе ссылок.
-M Только кодирование CRAM. Принудительно упаковать последовательности из нескольких ссылок в один и тот же
кусочек. Обычно CRAM начинает новый срез при переходе с одной ссылки на
другой, но по-прежнему будет автоматически переключаться на срезы с несколькими ссылками, если
количество последовательностей на срез становится слишком маленьким.
-R ассортимент
В настоящее время только для ввода CRAM, но ожидается поддержка SAM / BAM. Это указывает на
ссылочное имя последовательности и, возможно, начальное и конечное местоположение в пределах этого
ссылка, используя синтаксис ref_name or ref_name:Начало-конец. Для эффективной работы
файлу CRAM необходим индекс формата .crai (построенный с использованием Cram_index программа).
-r исх.фа
Только кодирование CRAM. Используйте это, чтобы указать ссылочный файл fasta. Обратите внимание, что если
входной файл SAM или BAM a файл: или URI на основе локальной файловой системы, указанный в
@SQ, тогда эта опция может не понадобиться.
-s номер
Только кодирование CRAM. Задает количество секвенций на срез. По умолчанию
10000.
-S номер
Только кодирование CRAM. Задает количество фрагментов в контейнере. По умолчанию 1.
-t Только BAM и CRAM. Задает количество потоков сжатия или распаковки,
адаптивно распределяется между кодированием и декодированием. По умолчанию 1 (нет
заправка).
-V версия_строка
Только кодирование CRAM. Устанавливает версию формата файла CRAM. Поддерживаемые значения: «2.0»,
«2.1» и «3.0».
-e Только кодирование CRAM. Встраивайте фрагменты эталонной последовательности в каждый фрагмент. Этот
означает, что файлы могут быть декодированы без необходимости указывать ссылочный файл fasta.
-x Только кодирование CRAM. Пропустите сжатие на основе ссылок и вместо этого сохраните сведения о
каждая база дословно.
-B Экспериментально, только кодирование. При сохранении значений качества разбейте на 8 дискретных
значения (плюс 0), которые обычно используются современными приборами Illumina. (Обратите внимание, что
интервалы могут не совпадать.)
-! Только декодирование CRAM v3.0 и выше. Не проверяйте CRC. Этот вариант должен быть только
используется при попытке восстановления после повреждения данных.
ПРИМЕРЫ
Чтобы преобразовать файл BAM из stdin в CRAM на stdout, используя ссылку MT.fa.
какая-то_команда | схватка -I bam -O cram -r MT.fa | какая-то_команда
Формат вывода CRAM по умолчанию - версия 3.0, поэтому при
преобразование из 2.1 в 3.0. Чтобы выполнить обратное использование:
scramble -V 2.1 дюйма
Используйте скремблирование онлайн с помощью сервисов onworks.net