Это команда bp_fast_load_gffp, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
bp_fast_load_gff.pl - Быстрая загрузка базы данных Bio :: DB :: GFF из файлов GFF.
СИНТАКСИС
% bp_fast_load_gff.pl -d testdb dna1.fa dna2.fa Features1.gff Features2.gff ...
ОПИСАНИЕ
Этот скрипт загружает базу данных Bio :: DB :: GFF с функциями, содержащимися в списке GFF.
файлы и / или файлы последовательности FASTA. Вы должны использовать точный вариант GFF, описанный в
Био :: DB :: GFF. Различные параметры командной строки позволяют вам контролировать, какую базу данных загружать.
и разрешить ли перезапись существующей базы данных.
Этот сценарий похож на load_gff.pl, но работает намного быстрее. Однако он жестко запрограммирован на
использовать MySQL и, вероятно, работает только на платформах Unix из-за зависимости от каналов. Видеть
bp_load_gff.pl для инкрементального загрузчика, который работает со всеми базами данных, поддерживаемыми
Bio :: DB :: GFF и bp_bulk_load_gff.pl для быстрого загрузчика MySQL, поддерживающего все платформы.
ПРИМЕЧАНИЯ
Если имя файла указано как «-», то ввод берется из стандартного ввода. Сжатый
файлы (.gz, .Z, .bz2) автоматически распаковываются.
Файлы формата FASTA отличаются от файлов GFF расширениями файлов. Файлы
оканчивающиеся на .fa, .fasta, .fast, .seq, .dna и их варианты в верхнем регистре обрабатываются как FASTA
файлы. Все остальное рассматривается как файл GFF. Если вы хотите загрузить файлы -fasta из
STDIN, затем используйте -f swith в командной строке с аргументом '-', как в
gunzip my_data.fa.gz | bp_fast_load_gff.pl -d тест -f -
Характер нагрузки требует, чтобы база данных находилась на локальном компьютере и чтобы
указанный пользователь имеет привилегию "файл" для загрузки таблиц и имеет достаточно места в
/ usr / tmp (или что-то еще, указанное в переменной среды \ $ TMPDIR) для хранения
таблицы временно. Если у вас MySQL версии 3.22.6 и был скомпилирован с использованием "load
local file ", то вы сможете загружать удаленные базы данных с локальными данными, используя
параметр --local.
О maxfeature: значение по умолчанию 100,000,000 баз. Если у вас есть функции, которые
близко или больше, чем 100 МБ, тогда значение maxfeature должно быть увеличено
до 1,000,000,000 10 XNUMX XNUMX. Это значение должно быть степенью XNUMX.
Если список файлов GFF или fasta превышает ограничение ядра на максимальное количество
для аргументов командной строки используйте параметр --long_list / path / to / files.
Используемый адаптер - dbi :: mysqlopt. В настоящее время нет возможности изменить это.
КОМАНДНАЯ СТРОКА ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
Параметры командной строки могут быть сокращены до однобуквенных параметров. eg -d вместо
--база данных.
--база данных Имя базы данных MySQL
--create Reinitialize / create data tables без запроса
--local Пытаться загрузить удаленную базу данных, используя локальные данные.
--user Имя пользователя для входа в систему как
--fasta Файл или каталог, содержащий файлы fasta для загрузки
--password Пароль для аутентификации
--long_list Каталог, содержащий очень большое количество
Файлы GFF и / или FASTA
--maxfeature Установить значение максимального размера функции (по умолчанию 100 МБ; должно быть степенью 10)
--group Список из одного или нескольких имен тегов (разделенных запятыми или пробелами)
будет использоваться для группировки в 9-м столбце.
--gff3_munge Активировать изменение имени GFF3 (см. Bio :: DB :: GFF)
--summary Создает сводную статистику для построения гистограмм покрытия.
Это можно запустить в ранее загруженной базе данных или во время
Загрузка.
--Временное расположение рабочего каталога с возможностью записи
Используйте bp_fast_load_gffp онлайн с помощью сервисов onworks.net