这是 bp_fast_load_gffp 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
bp_fast_load_gff.pl - 从 GFF 文件快速加载 Bio::DB::GFF 数据库。
概要
% bp_fast_load_gff.pl -d testdb dna1.fa dna2.fa features1.gff features2.gff ...
商品描述
此脚本加载 Bio::DB::GFF 数据库,其中包含 GFF 列表中包含的功能
文件和/或 FASTA 序列文件。 您必须使用中描述的 GFF 的确切变体
生物::DB::GFF。 各种命令行选项允许您控制要加载的数据库
以及是否允许覆盖现有数据库。
此脚本类似于 load_gff.pl,但速度要快得多。 但是,它被硬编码为
使用 MySQL 并且可能只适用于 Unix 平台,因为它依赖于管道。 看
bp_load_gff.pl 用于增量加载器,适用于所有支持的数据库
Bio::DB::GFF 和 bp_bulk_load_gff.pl 用于支持所有平台的快速 MySQL 加载器。
附注
如果文件名指定为“-”,则输入取自标准输入。 压缩的
文件(.gz、.Z、.bz2)会自动解压缩。
FASTA 格式文件与 GFF 文件的区别在于它们的文件扩展名。 文件
以 .fa、.fasta、.fast、.seq、.dna 结尾及其大写变体被视为 FASTA
文件。 其他所有内容都被视为 GFF 文件。 如果您希望从以下位置加载 -fasta 文件
STDIN,然后使用带有“-”参数的 -f 命令行开关,如
gunzip my_data.fa.gz | bp_fast_load_gff.pl -d 测试 -f -
负载的性质要求数据库位于本地机器上,并且
指示的用户具有加载表的“文件”权限并有足够的空间
/usr/tmp(或由 \$TMPDIR 环境变量指定的任何内容),以保存
表暂时。 如果您的 MySQL 是 3.22.6 版本并且是使用“load
本地文件”选项,那么您可以使用本地数据加载远程数据库
--local 选项。
关于 maxfeature:默认值为 100,000,000 个碱基。 如果你有以下特点
长度接近或大于 100Mb,则应增加 maxfeature 的值
到 1,000,000,000。 该值必须是 10 的幂。
如果 GFF 或 fasta 文件列表超过内核限制的最大数量
命令行参数,使用 --long_list /path/to/files 选项。
使用的适配器是 dbi::mysqlopt。 目前没有办法改变这一点。
命令行 配置
命令行选项可以缩写为单字母选项。 例如 -d 而不是
- 数据库。
- 数据库Mysql 数据库名称
--create 无需询问即可重新初始化/创建数据表
--local 尝试使用本地数据加载远程数据库。
--user 用户名登录
--fasta 包含要加载的 fasta 文件的文件或目录
--password 用于身份验证的密码
--long_list 包含非常多的目录
GFF 和/或 FASTA 文件
--maxfeature 设置最大特征大小的值(默认100Mb;必须是10的幂)
--group 一个或多个标签名称的列表(逗号或空格分隔)
用于第 9 列中的分组。
--gff3_munge 激活 GFF3 名称修改(参见 Bio::DB::GFF)
--summary 生成绘制覆盖率直方图的汇总统计信息。
这可以在先前加载的数据库上运行或在
负载。
--可写临时目录的临时位置
使用 onworks.net 服务在线使用 bp_fast_load_gffp