这是 rpsblast 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
bl2seq、blast2、blastall、blastall_old、blastcl3、blastpgp、impala、megablast、rpsblast、
seedtop - 基本的本地对齐搜索工具
概要
BL2序列 [-[-A[-D N[-E N[-F STR[-G N[-I "开始 停止"] [-J "开始 停止"] [-M STR]
[-S N[-T[-U[-V[-W N[-X N[-Y X[-a 文件名[-d N[-e X[-g F] -i 文件名
-j 文件名 [-m[-o 文件名] -p STR [-q N[-r N[-t N]
爆炸2 [-[-B N[-D N[-C x[-E N[-F STR[-G N[-H[-I "开始 停止"]
[-J "开始 停止"] [-K N[-L[-M STR[-N[-P X[-Q N[-R[-S N[-T N[-W N[-X N]
[-Y X[-Z N[-a N[-b N[-c[-d STR[-e X[-f X[-g[-h N[-i 文件名]
[-j 文件名[-k STR[-m N[-n[-o 文件名] -p STR [-q N[-r N[-s] [-t N] [-u]
[-v N] [-w N] [-y N] [-z N]
爆破 [-[-A N[-B N[-C x[-D N[-E N[-F STR[-G N[-I[-J[-K N]
[-L 开始,停止[-M STR[-O 文件名[-P N[-Q N[-R 文件名[-S[-T[-U[-V]
[-W N[-X N[-Y X[-Z N[-a N[-b N[-d STR[-e X[-f X[-g F[-i 文件名]
[-l STR[-m N[-n[-o 文件名] -p STR [-q N[-r N[-s[-t N[-v N[-w N[-y X]
[-z X]
Blastall_old [-[-A N[-B N[-C x[-D N[-E N[-F STR[-G N[-I[-J[-K N]
[-L 开始,停止[-M STR[-O 文件名[-P N[-Q N[-R 文件名[-S[-T[-U[-W N]
[-X N[-Y X[-Z N[-a N[-b N[-d STR[-e X[-f X[-g F[-i 文件名[-l STR]
[-m N[-n[-o 文件名] -p STR [-q N[-r N[-s[-t N[-v N[-w N[-y X[-z X]
爆炸CL3 [-[-A N[-C x[-D N[-E N[-F STR[-G N[-I[-J[-K N[-L 开始,停止]
[-M STR[-O 文件名[-Q N[-R[-S[-T[-U[-W N[-X N[-Y X[-Z N[-a N]
[-b N[-d STR[-e X[-f X[-g F[-i 文件名[-m N[-n[-o 文件名] -p STR [-q N]
[-r N[-s[-t N[-u STR[-v N[-w N[-y X[-z X]
爆炸头 [-[-A N[-B 文件名[-C 文件名[-E N[-F T[-G N[-H N[-I[-J]
[-K N[-L N[-M STR[-N X[-O 文件名[-P N[-Q 文件名[-R 文件名[-S N[-T]
[-U[-W N[-X N[-Y X[-Z N[-a N[-b N[-c N[-d STR[-e X[-f N[-h X]
[-i 文件名[-j N[-k 文件名[-l STR[-m N[-o 文件名[-p STR[-q N[-s]
[-t N[u]][-u N[-v N[-y X[-z N]
黑斑羚 [-[-E N[-F STR[-G N[-H[-I[-J[-M STR[-O 文件名[-P 文件名]
[-a N[-b N[-c N[-d STR[-e X[-h X[-i 文件名[-j N[-m N[-o 文件名]
[-v N[-y X[-z N]
巨细胞 [-[-A N[-D N[-E N[-F STR[-G N[-H N[-I[-J[-L 开始,停止[-M N]
[-N N[-O 文件名[-P N[-Q 文件名[-R[-S N[-T[-U[-V[-W N[-X N[-Y X]
[-Z N[-a N[-b N[-d STR[-e X[-f[-g F[-i 文件名[-l STR[-m N[-n]
[-o 文件名[-p X[-q N[-r N[-t N[-s N[-v N[-y N[-z X]
爆炸声 [-[-F STR[-I[-J[-L 开始,停止[-N X[-O 文件名[-P N[-T[-U]
[-X N[-Y X[-Z N[-a N[-b N] -d 文件名 [-e X[-i 文件名[-l 文件名[-m N]
[-o 文件名[-p F[-v N[-y X[-z N]
种顶 [-[-C N[-D N[-E N[-F[-G N[-I[-J[-K N[-M STR[-O 文件名]
[-S N[-X N[-d STR[-e X[-f[-i 文件名[-k 文件名[-o 文件名[-p STR]
[-q N[-r N]
商品描述
本手册页简要记录了命令 BL2序列, 爆破, 爆破, 爆炸CL3,
爆炸头, 黑斑羚, 巨细胞, 爆炸声及 种顶. 这些命令被记录在案
因为他们有很多共同的选择。
BL2序列 使用blastn 或blastp 在两个序列之间进行比较
算法。 两个序列都必须是核苷酸或蛋白质。
爆炸2 将一个序列与本地数据库或第二个序列进行比较; 它
结合了两者的大部分功能 BL2序列 和 爆破,但使用半
实验性的新内部引擎。
爆破 和 Blastall_old 在本地数据库中找到序列的最佳匹配。
爆破 使用较新的引擎 Blastall_old 默认情况下,但支持使用旧的
引擎也是如此(当使用选项调用时 -V F).
爆炸CL3 访问最新的 NCBI BLAST 搜索引擎(2.0 版)。 背后的软件
BLAST 2.0 版是从头开始编写的,以允许 BLAST 应对新挑战
由未来几年的序列数据库构成。 此软件的更新将
在未来几年继续。
爆炸头 执行有间隙的blastp搜索,可用于执行迭代搜索
psi-blast 和 phi-blast 模式。
黑斑羚 搜索由准备的分数矩阵数据库 文案(1)、产生BLAST样
输出。
巨细胞 使用 Webb Miller 等人的贪心算法。 对于核苷酸序列
对齐搜索并连接许多查询以节省扫描数据库的时间。
该程序针对比对因以下原因而略有不同的序列进行了优化
排序或其他类似的“错误”。 它比更常见的快 10 倍
序列相似性程序,因此可用于快速比较两个大集合
相互对立的序列。
爆炸声 (反向 PSI-BLAST)针对配置文件数据库搜索查询序列。
这与 PSI-BLAST 相反,它根据序列数据库搜索配置文件,
因此是“反向”。 爆炸声 使用类似 BLAST 的算法,找到单字或双字
命中,然后对这些候选匹配执行无间隙扩展。 如果一个
产生足够高的无间隙对齐,进行有间隙的延伸
并且报告了那些期望值足够低的(有间隙的)比对。 这个
过程与 IMPALA 形成对比,IMPALA 在两个对象之间执行 Smith-Waterman 计算
查询和每个配置文件,而不是使用 word-hit 方法来识别匹配
应该延长。
种顶 回答两个相对简单的问题:
1.给定一个序列和一个模式数据库,哪些模式出现在序列中
在哪里?
2.给定一个模式和一个序列数据库,哪些序列包含模式和
哪里?
其中一些命令支持多种类型的比较,由 -p
(“程序”)标志:
blastp 将氨基酸查询序列与蛋白质序列数据库进行比较。
blastn 将核苷酸查询序列与核苷酸序列数据库进行比较。
blastx 比较核苷酸查询的六帧概念翻译产物
针对蛋白质序列数据库的序列(两条链)。 为了 BL2序列是,
核苷酸应该是给出的第一个序列。
pistblastn 将蛋白质查询序列与核苷酸序列数据库进行比较
使用一个动态翻译在所有六个阅读框架(两条链)中
由 PSI-BLAST 创建的位置特定矩阵。
tblastn 将蛋白质查询序列与核苷酸序列数据库进行比较
在所有六个阅读框架(两条链)中动态翻译。 为了 BL2序列,
核苷酸应该是给出的第二个序列。
tblastx 将核苷酸查询序列的六帧翻译与
核苷酸序列数据库的六帧翻译。
配置
下面是选项的摘要。
- 打印使用信息
-A (bl2seq)
accession.version 形式的输入序列
-A N (blastall、blastall_old、blastcl3、blastpgp、megablast)
多次点击窗口大小; 通常默认为 0(对于单击扩展),但
使用不连续模板时默认为 40。
-B N (爆炸2)
生成即时输出:
0 无(默认)
1 个偏移量和质量值表
2 添加序列数据
3 文本 ASN.1
4 二进制 ASN.1
-B N (blastall,blastall_old)
连接查询的数量,以blastn 或tblastn 模式
-B 文件名 (爆破pgp)
用于 PSI-BLAST 重启的输入对齐文件
-C X (blast2、blastall、blastall_old、blastcl3)
对blastp 或tblastn 使用基于组合的统计数据:
T、t、D 或 d
默认(相当于 1 爆炸2 和 Blastall_old 和 2 爆破
和 爆炸CL3)
0、F 或 f
没有基于成分的统计
1 基于成分的统计 NAR 29:2994-3005, 2001
2 基于作文的分数调整,如 生物信息学 21:902-911, 2005,
以序列属性为条件
3 基于作文的分数调整,如 生物信息学 21:902-911, 2005,
无条件
在blastall、blastall_old 或blastcl3 中启用统计信息时(即, 不是爆炸2),
附加 u (不区分大小写)模式允许使用统一的 p 值
仅在第 1 轮中结合对齐和组合 p 值。
-C 文件名 (爆破pgp)
PSI-BLAST 检查点的输出文件
-C N (种子顶部)
仅评分或不评分(默认值 = 1)
-D N (bl2seq)
输出格式:
0 传统(默认)
1个表格
-D N (blast2、blastall、blastall_old、blastcl3)
根据遗传密码翻译数据库中的序列 N in
/usr/share/ncbi/data/gc.prt(默认为 1;仅适用于 tblast*)
-D N (巨爆)
输出类型:
0 对齐端点和分数
1 所有无间隙段端点
2 传统 BLAST 输出(默认)
3 制表符分隔的一行格式
4 增量文本 ASN.1
5 增量二进制 ASN.1
-D N (种子顶部)
成本下降以对齐(默认值 = 99999)
-E N (bl2seq、blastcl3、megablast)
扩大差距成本 N (-1 调用默认行为)
-E N (blast2,blastall,blastall_old)
扩大差距成本 N (-1 调用默认行为:如果贪婪则非仿射,2
除此以外)
-E N (blastpgp、黑斑羚、种子顶)
扩大差距成本 N (默认值为1)
-F STR (bl2seq、blast2、blastall、blastall_old、blastpgp、
blastcl3、impala、megablast、rpsblast) DUST 或 SEG 的过滤器选项; 默认为
T 对于 bl2seq、blast2、blastall、blastall_old、blastcl3 和 megablast,以及 F
blastpgp、impala 和 rpsblast。
-F (种子顶部)
使用 SEG 过滤序列。
-G N (bl2seq、blastcl3、megablast)
拉开差距成本 N (-1 调用默认行为)
-G N (blast2,blastall,blastall_old)
拉开差距成本 N (-1 调用默认行为:如果贪婪则为非仿射,如果为 5
使用动态规划)
-G N (blastpgp、黑斑羚、种子顶)
拉开差距成本 N (默认值为11)
-H (爆炸2)
生成 HTML 输出
-H N (爆破pgp)
查询中所需区域的结束(-1 表示查询结束)
-H (黑斑羚)
打印帮助(不同于使用信息)
-H N (巨爆)
每个数据库序列要保存的最大 HSP 数量(默认为 0,无限制)
-I "开始 停止" (bl2seq,blast2)
第一个(查询)序列上的位置(仅当文件指定为 -i 包含
单个序列)
-I (blastall、blastall_old、blastcl3、blastpgp、impala、megablast、
rpsblast,seedtop) 在定义中显示 GI
-J "开始 停止" (bl2seq,blast2)
第二个(主题)序列上的位置(仅当文件指定为 -j
包含单个序列)
-J (blastall、blastall_old、blastcl3、blastpgp、impala、megablast、
rpsblast, seedtop) 相信查询定义
-K N (blast2、blastall、blastall_old、blastcl3、blastpgp)
要保留的区域的最佳命中数。 默认关闭。 如果使用值为 100
被推荐。 非常高的值 -v or -b 也建议。
-K N (种子顶部)
内部命中缓冲区大小乘数(wrt 查询长度;默认值 = 2)
-L (爆炸2)
使用宽度为 12 的(经典 Mega BLAST)查找表
-L 开始,停止 (blastall,blastall_old,blastcl3,megablast,
rpsblast) 查询序列上的位置(对于 rpsblast,仅在blastp 模式下有效)
-M STR (bl2seq、blast2、blastall、blastall_old、blastcl3、
blastpgp、impala、seedtop) 使用矩阵 STR (默认 = BLOSUM62)
-M N (巨爆)
单个搜索的最大查询总长度(默认值 = 5000000)
-N (爆炸2)
在表格输出中仅显示序列 ID 的加入
-N X (blastpgp,rpsblast)
触发间隙的位数(默认值 = 22.0)
-N N (巨爆)
不连续词模板的类型:
0 编码(默认)
1 最优
2 两个同时
-O 文件名 (blastall,blastall_old,blastcl3,
blastpgp、impala、megablast、rpsblast、seedtop)写入(ASN.1)序列比对
至 文件名; 仅对blastpgp、impala、rpsblast 和seedtop 有效 -J及
只对megablast有效 -D2.
-P X (爆炸2)
身份百分比截止
-P N (blastall、blastall_old、blastcl3、blastpgp、rpsblast)
设置为 1 表示单击模式或 0 表示多击模式(默认)。 不适用
爆炸。
-P 文件名 (黑斑羚)
从数据库中读取矩阵配置文件 文件名
-P N (巨爆)
哈希值的最大位置数(设置为 0 [默认] 以忽略)
-Q N (blast2、blastall、blastall_old、blastcl3)
根据遗传密码翻译查询 N 在 /usr/share/ncbi/data/gc.prt(默认
是 1)
-Q 文件名 (爆破pgp)
ASCII 格式的 PSI-BLAST 矩阵的输出文件
-Q 文件名 (巨爆)
屏蔽查询输出; 需要 -D 2
-R (爆炸2)
计算局部最优 Smith-Waterman 对齐。 (此选项仅适用于
对于有间隙的 tblastn。)
-R 文件名 (blastall,blastall_old)
读取 PSI-TBLASTN 检查点文件 文件名
-R (blastcl3)
RPS 爆炸搜索
-R 文件名 (爆破pgp)
PSI-BLAST 重启的输入文件
-R (巨爆)
输出结束时报告日志信息
-S N (bl2seq、blast2、blastall、blastall_old、blastcl3、
megablast) 查询链以在数据库中搜索blastn、blastx、tblastx:
1顶部
2底部
3 两者(默认)
-S N (爆破pgp)
查询中所需区域的开始(默认值 = 1)
-S N (种子顶部)
截止成本(默认值 = 30)
-T (bl2seq、blastall、blastall_old、blastcl3、blastpgp、megablast、
rpsblast) 生成 HTML 输出
-T N (爆炸2)
不连续词模板的类型:
0 编码(默认)
1 最优
2 两个同时
-U (bl2seq、blastall、blastall_old、blastcl3、blastpgp、megablast、
rpsblast) 对查询序列使用小写过滤
-V (bl2seq、blastall、megablast)
强制使用旧引擎
-V (爆炸2)
使用可变字长方法进行数据库扫描
-W N (bl2seq、blast2、blastall、blastall_old、blastcl3、
blastpgp, megablast, rpsblast) 使用大小词 N (最佳完美匹配的长度;
零调用默认行为,除了 megablast,默认为 28,和
blastpgp,默认为 3。其他命令的默认值不同
“程序”:11 表示blastn,28 表示megablast,3 表示其他所有内容。)
-X N (bl2seq、blast2、blastall、blastall_old、blastcl3、
blastpgp、megablast、rpsblast、seedtop) 间隙对齐的 X 衰减值(在
位)(零调用默认行为,除了 megablast,默认为 20,
以及 rpsblast 和 seedtop,默认为 15。其他的默认值
命令因“程序”而异:30 表示blastn,20 表示megablast,0 表示tblastx,以及
15 为其他一切。)
-Y X (bl2seq、blast2、blastall、blastall_old、blastcl3、
blastpgp, megablast, rpsblast) 搜索空间的有效长度(使用零表示
实际尺寸)
-Z N (blast2、blastall、blastall_old、blastcl3、blastpgp、
megablast, rpsblast) 最终 [动态编程?] 的 X 衰减值有间隙
以位为单位对齐(blastn 和 megablast 默认为 100,tblastx 为 0,tblastx 为 25
其他)
-a 文件名 (bl2seq)
将文本 ASN.1 输出写入 文件名
-a N (blast2、blastall、blastall_old、blastcl3、blastpgp、
impala, megablast, rpsblast) 要使用的线程数(默认为 XNUMX)
-b N (blast2、blastall、blastall_old、blastcl3、blastpgp、
impala, megablast, rpsblast) 显示比对的数据库序列数
(B)(默认为 250)
-c (爆炸2)
掩码小写
-c N (黑斑羚)
多通道版本的伪计数常数; 0(默认)使用熵方法;
否则建议使用接近 30 的值
-c N (黑斑羚)
多通道版本的伪计数常量(默认为 10)
-d N (bl2seq)
使用理论数据库大小 N (零代表实际尺寸)
-d STR (blast2、blastall、blastall_old、blastcl3、blastpgp、
impala、megablast、seedtop)要使用的数据库(所有可执行文件的默认值为 nr)
除了blast2,如果未设置,则需要第二个FASTA序列)
-d 文件名 (转播)
RPS BLAST 数据库
-e X 期望值 (E)(默认值 = 10.0)
-f X (blast2、blastall、blastall_old、blastcl3)
扩展命中的阈值,如果为零则默认为:0 表示blastn 和megablast,11 表示
blastp,12 个用于blastx,13 个用于tblasn 和tblastx。
-f N (爆破pgp)
扩展命中的阈值(默认 11)
-f (巨爆)
在输出中显示完整 ID(默认:仅 GI 或加入)
-f (种子顶部)
强制搜索模式,即使它们很可能
-g F (bl2seq、blastall、blastall_old、blastcl3)
不执行间隙对齐(tblastx 不适用)
-g (爆炸2)
对有间隙的扩展使用贪心算法
-g F (巨爆)
使不连续的 megablast 为数据库的每个碱基生成单词
(对于当前的 BLAST 引擎是必需的)
-h N (爆炸2)
帧外间隙的帧偏移惩罚(仅适用于blastx、tblastn;默认值为
零)
-h X (blastpgp, 黑斑羚)
包含在多通道模型中的 e 值阈值(blastpgp 的默认值 = 0.002,
黑斑羚为 0.005)
-i 文件名
读取(首先,查询)序列或从 文件名 (默认为标准输入;不需要
blastpgp(如果从 scoremat 重新启动)
-j 文件名 (bl2seq,blast2)
读取第二个(主题)序列或从 文件名
-j N (爆破pgp)
在多通道版本中使用的最大通道数(默认 = 1)
-k STR (爆炸2)
PHI-BLAST 的图案
-k 文件名 (blastpgp,种子顶部)
PHI-BLAST 的输入命中文件(默认 = hit_file)
-l STR (blastall、blastall_old、blastpgp、megablast)
将数据库搜索限制为 GI 列表 [String]
-l 文件名 (转播)
将消息记录到 文件名 而不是标准误。
-m (bl2seq)
使用 Mega Blast 进行搜索
-m N (blast2、blastall、blastall_old、blastcl3、blastpgp、
impala、megablast、rpsblast)对齐视图选项:
0 成对(默认)
1 查询锚定显示身份
2 查询锚定,无身份
3 平面查询锚定,显示身份
4 平面查询锚定,无身份
5 查询锚定,没有身份和钝端
6 平面查询锚定,没有身份和钝端
7 XML Blast 输出(不适用于impala)
8 表格(不适用于impala)
9 个带注释行的表格(不适用于impala)
10 ASN.1 文本(不适用于impala 或rpsblast)
11 ASN.1 二进制文件(不适用于 impala 或 rpsblast)
-n (爆炸2)
在序列 ID 中显示 GI
-n (blastall,blastall_old,blastcl3)
MegaBlast 搜索
-n (巨爆)
对仿射差距分数使用非贪婪(动态规划)扩展
-o 文件名
将最终校准报告写入 文件名 而不是标准输出
-p STR (bl2seq、blast2、blastall、blastall_old、blastcl3)
使用“程序”(比较类型) STR。 该 商品描述 部分涵盖了这一点
更详细的选项。
-p STR (爆破pgp)
PHI-BLAST 的程序选项(默认 =blastpgp)
-p X (巨爆)
身份百分比截止(默认值 = 0)
-p F (转播)
查询序列是核苷酸,不是蛋白质
-p STR (种子顶部)
程序名称:
patmatchp 指示序列中出现哪些模式
patternp 指示哪些序列包含模式
-q N (bl2seq、blast2、blastall、blastall_old、blastcl3、
megablast,seedtop)核苷酸不匹配的惩罚(仅限blastn)(默认= -10
对于种子顶部,-3 用于其他所有内容)
-q N (爆破pgp)
检查点数据的ASN.1 Scoremat输入:
0 无记分输入(默认)
1 从 ASCII scoremat 检查点文件重新启动
2 从二进制 scoremat 检查点文件重新启动
-r N (bl2seq、blast2、blastall、blastall_old、blastcl3、
megablast,seedtop)核苷酸匹配的奖励(仅限blastn)(默认= 10
种子顶部,-10 为其他所有)
-s (爆炸2)
无操作(以前要求为数据库的每个碱基生成单词)
-s (blastall、blastall_old、blastcl3、blastpgp)
计算局部最优 Smith-Waterman 对齐。 对于blastall、blastall_old 和
blastcl3,这仅在间隙 tblastn 模式下可用。
-s N (巨爆)
要报告的最小命中分数(默认行为为 0)
-t N (bl2seq、blast2、blastall、blastall_old、blastcl3)
不连续词模板的长度(翻译中允许的最大内含子)
连接多个不同分配时的核苷酸序列; 默认值 = 0;
负值禁用blastall、blastall_old 和blastcl3 的链接。)
-t N[u] (爆破pgp)
基于作文的分数调整。 第一个字符解释如下:
0、F 或 f
没有基于成分的统计
1 基于组合的统计数据 NAR 29:2994-3005, 2001
2、T 或 t
基于作文的分数调整,如 生物信息学 21:902-911, 2005,
以第 1 轮中的序列属性为条件(默认)
3 基于作文的分数调整如 生物信息学 21:902-911, 2005,
第一轮无条件
当使用基于组合的统计数据时,附加 u (不区分大小写)到
参数要求统一的 p 值结合对齐 p 值和组合 p-
仅在第 1 轮中的值。
-t N (巨爆)
不连续单词模板的长度(连续单词如果 0 [默认])
-u (爆炸2)
仅进行无间隙对齐(对于 tblastx 始终为 TRUE)
-u STR (blastcl3)
将数据库搜索限制为 Entrez2 查找结果
-u N (爆破pgp)
检查点数据的 ASN.1 Scoremat 输出:
0 没有 scoremat 输出(默认)
1 个输出 ASCII scoremat 检查点文件(需要 -J)
2 输出二进制 scoremat 检查点文件(需要 -J)
-v N (blast2、blastall、blastall_old、blastcl3、blastpgp、
impala, megablast, rpsblast) 要显示的单行描述数 (V)(默认值 =
500)
-w N (爆炸2)
窗口大小(一对初始命中之间的最大允许距离;0 调用
默认行为,-1 关闭多次点击)
-w N (blastall,blastall_old,blastcl3)
帧移位惩罚(blastx 的 OOF 算法)
-y X (blast2、blastall、blastall_old、blastcl3、blastpgp、
impala, rpsblast) 以位为单位的无间隙扩展的 X 衰减(0.0 调用默认值)
行为:20 为blastn,10 为megablast,7 为所有其他。)
-y N (巨爆)
无间隙扩展的 X 衰减值(默认为 10)
-z N (爆炸2)
不均匀间隙 HSP 连接的最长内含子长度(仅限 tblastn;默认值为 0)
-z N (blastall、blastall_old、blastcl3、blastpgp、impala、
megablast, rpsblast) 数据库的有效长度(实际大小使用零)
使用 onworks.net 服务在线使用 rpsblast