Este es el comando bp_bulk_load_gffp que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
bp_bulk_load_gff.pl - Carga masiva una base de datos Bio :: DB :: GFF desde archivos GFF.
SINOPSIS
% bp_bulk_load_gff.pl -d testdb dna1.fa dna2.fa características1.gff características2.gff ...
DESCRIPCIÓN
Este script carga una base de datos Bio :: DB :: GFF con las características contenidas en una lista de GFF
archivos y / o archivos de secuencia FASTA. Debe utilizar la variante exacta de GFF descrita en
Bio :: DB :: GFF. Varias opciones de línea de comandos le permiten controlar qué base de datos cargar
y si permitir que se sobrescriba una base de datos existente.
Este script difiere de bp_load_gff.pl en que está codificado para usar MySQL y no puede
realizar cargas incrementales. Consulte bp_load_gff.pl para ver un cargador incremental que funciona con
todas las bases de datos compatibles con Bio :: DB :: GFF y bp_fast_load_gff.pl para un cargador MySQL que
admite cargas incrementales rápidas.
NOTAS
Si el nombre del archivo se da como "-", la entrada se toma de la entrada estándar. Comprimido
Los archivos (.gz, .Z, .bz2) se descomprimen automáticamente.
Los archivos con formato FASTA se distinguen de los archivos GFF por sus extensiones de nombre de archivo. Archivos
que terminan en .fa, .fasta, .fast, .seq, .dna y sus variantes en mayúsculas se tratan como FASTA
archivos. Todo lo demás se trata como un archivo GFF. Si desea cargar archivos -fasta desde
STDIN, luego use la línea de comando -f swith con un argumento de '-', como en
gunzip my_data.fa.gz | bp_fast_load_gff.pl -d prueba -f -
La naturaleza de la carga masiva requiere que la base de datos esté en la máquina local y que
el usuario indicado tiene el privilegio de "archivo" para cargar las tablas y tener suficiente espacio en
/ usr / tmp (o lo que sea especificado por la variable de entorno \ $ TMPDIR), para mantener el
tablas de forma transitoria.
Los datos locales ahora se pueden cargar a un servidor remoto a través de la opción --local con la base de datos
host especificado en el dsn, por ejemplo, dbi: mysql: test: db_host
El adaptador utilizado es dbi :: mysqlopt. Actualmente no hay forma de cambiar esto.
Acerca de maxfeature: el valor predeterminado es 100,000,000 bases. Si tiene funciones que son
cerca o más de 100 Mb de longitud, entonces el valor de maxfeature debe aumentarse
hasta 1,000,000,000. Este valor debe ser una potencia de 10.
Tenga en cuenta que los usuarios de Windows deben usar la opción --create.
Si la lista de archivos GFF o fasta excede el límite del kernel para el número máximo de
argumentos de la línea de comandos, use la opción --long_list / path / to / files.
LÍNEA DE COMANDO OPCIONES
Las opciones de la línea de comandos se pueden abreviar a opciones de una sola letra. por ejemplo, -d en lugar de
--base de datos.
--base de datos Nombre de la base de datos (predeterminado dbi: mysql: test)
--adaptor Adapter name (mysql predeterminado)
- crear Reinicializar / crear tablas de datos sin preguntar
--usuario Nombre de usuario para iniciar sesión como
--fasta Archivo o directorio que contiene archivos fasta para cargar
--long_list Directorio que contiene una gran cantidad de
Archivos GFF y / o FASTA
--password Contraseña que se utilizará para la autenticación
(No funciona con Postgres, la contraseña debe ser
suministrados de forma interactiva o dejarlos vacíos para
autenticación de identidad)
--maxbin Establece el valor del tamaño máximo del contenedor
- Bandera local para indicar que la fuente de datos es local
--maxfeature Establece el valor del tamaño máximo de función (potencia de 10)
--group Una lista de uno o más nombres de etiquetas (separados por comas o espacios)
que se utilizará para agrupar en la novena columna.
--gff3_munge Activa GFF3 name munging (ver Bio :: DB :: GFF)
--summary Genera estadísticas de resumen para dibujar histogramas de cobertura.
Esto se puede ejecutar en una base de datos previamente cargada o durante
la carga.
: Ubicación temporal de un directorio temporal grabable
Use bp_bulk_load_gffp en línea usando los servicios de onworks.net