Это команда bp_bulk_load_gffp, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
bp_bulk_load_gff.pl - Массовая загрузка базы данных Bio :: DB :: GFF из файлов GFF.
СИНТАКСИС
% bp_bulk_load_gff.pl -d testdb dna1.fa dna2.fa Features1.gff Features2.gff ...
ОПИСАНИЕ
Этот скрипт загружает базу данных Bio :: DB :: GFF с функциями, содержащимися в списке GFF.
файлы и / или файлы последовательности FASTA. Вы должны использовать точный вариант GFF, описанный в
Био :: DB :: GFF. Различные параметры командной строки позволяют вам контролировать, какую базу данных загружать.
и разрешить ли перезапись существующей базы данных.
Этот сценарий отличается от bp_load_gff.pl тем, что он жестко запрограммирован для использования MySQL и не может
выполнять инкрементные нагрузки. См. Bp_load_gff.pl для инкрементального загрузчика, который работает с
все базы данных, поддерживаемые Bio :: DB :: GFF, и bp_fast_load_gff.pl для загрузчика MySQL, который
поддерживает быструю инкрементную загрузку.
ПРИМЕЧАНИЯ
Если имя файла указано как «-», то ввод берется из стандартного ввода. Сжатый
файлы (.gz, .Z, .bz2) автоматически распаковываются.
Файлы формата FASTA отличаются от файлов GFF расширениями файлов. Файлы
оканчивающиеся на .fa, .fasta, .fast, .seq, .dna и их варианты в верхнем регистре обрабатываются как FASTA
файлы. Все остальное рассматривается как файл GFF. Если вы хотите загрузить файлы -fasta из
STDIN, затем используйте -f swith в командной строке с аргументом '-', как в
gunzip my_data.fa.gz | bp_fast_load_gff.pl -d тест -f -
Характер массовой загрузки требует, чтобы база данных находилась на локальном компьютере и чтобы
указанный пользователь имеет привилегию «файл» для загрузки таблиц и имеет достаточно места в
/ usr / tmp (или что-то еще, указанное в переменной среды \ $ TMPDIR) для хранения
таблицы временно.
Теперь локальные данные могут быть загружены на удаленный сервер с помощью параметра --local в базе данных.
хост, указанный в dsn, например dbi: mysql: test: db_host
Используемый адаптер - dbi :: mysqlopt. В настоящее время нет возможности изменить это.
О maxfeature: значение по умолчанию 100,000,000 баз. Если у вас есть функции, которые
близко или больше, чем 100 МБ, тогда значение maxfeature должно быть увеличено
до 1,000,000,000 10 XNUMX XNUMX. Это значение должно быть степенью XNUMX.
Обратите внимание, что пользователи Windows должны использовать параметр --create.
Если список файлов GFF или fasta превышает ограничение ядра на максимальное количество
для аргументов командной строки используйте параметр --long_list / path / to / files.
КОМАНДНАЯ СТРОКА ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
Параметры командной строки могут быть сокращены до однобуквенных параметров. eg -d вместо
--база данных.
--база данных Имя базы данных (по умолчанию dbi: mysql: test)
--adaptor Имя адаптера (MySQL по умолчанию)
--create Reinitialize / create data tables без запроса
--user Имя пользователя для входа в систему как
--fasta Файл или каталог, содержащий файлы fasta для загрузки
--long_list Каталог, содержащий очень большое количество
Файлы GFF и / или FASTA
--password Пароль для аутентификации
(Не работает с Postgres, пароль должен быть
поставляется в интерактивном режиме или оставьте пустым для
идентификационная аутентификация)
--maxbin Установить значение максимального размера ячейки
--local Флаг, указывающий, что источник данных является локальным
--maxfeature Установить значение максимального размера объекта (степень 10)
--group Список из одного или нескольких имен тегов (разделенных запятыми или пробелами)
будет использоваться для группировки в 9-м столбце.
--gff3_munge Активировать изменение имени GFF3 (см. Bio :: DB :: GFF)
--summary Создает сводную статистику для построения гистограмм покрытия.
Это можно запустить в ранее загруженной базе данных или во время
Загрузка.
--Временное расположение рабочего каталога с возможностью записи
Используйте bp_bulk_load_gffp в Интернете с помощью сервисов onworks.net