这是命令基因组音乐路径扫描,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
基因组音乐路径扫描 - 在给定列表的队列中查找显着突变的通路
体细胞突变。
VERSION
本文档介绍了基因组音乐路径扫描版本0.04 (2016-01-01 at 23:10:18)
概要
基因组音乐路径扫描 --gene-covg-dir=? --bam-list=? --pathway-file=? --maf-file=?
--输出文件=? [--bmr=?] [--genes-to-ignore=?] [--min-mut-genes-per-path=?]
[--skip-非编码] [--skip-silent]
...音乐路径扫描\
--bam-list 输入目录/bam_file_list \
--gene-covg-dir output_dir/gene_covgs/\
--maf 文件 input_dir/myMAF.tsv \
--输出文件 output_dir/sm_pathways \
--pathway-file input_dir/pathway_dbs/KEGG.txt \
--bmr 8.7E-07
所需 争论
基因-covg-dir 文本
包含每个基因覆盖文件的目录(使用音乐 bmr calc-covg 创建)
清单 文本
BAM 文件的制表符分隔列表 [sample_name, normal_bam,tumor_bam](见描述)
路径文件 文本
路径信息的制表符分隔文件(参见说明)
maf 文件 文本
使用 TCGA MAF 规范 v2.3 的突变列表
输出文件 文本
将列出重要途径及其 p 值的输出文件
不是必须的 争论
宝马 联系电话
目标区域的背景突变率
如果未指定,则为默认值 '1e-06'
忽略基因 文本
应忽略突变的以逗号分隔的基因列表
最小mut-genes-per-path 联系电话
具有比这更少的突变基因的通路将被忽略
如果未指定,则为默认值 '1'
跳过非编码 布尔
从提供的 MAF 文件中跳过非编码突变
如果未指定,则默认值 'true'
noskip 非编码 布尔
使跳过非编码为“假”
跳过静音 布尔
从提供的 MAF 文件中跳过无声突变
如果未指定,则默认值 'true'
noskip-静音 布尔
使跳过静音“假”
商品描述
仅使用 MAF 中的以下四列。 所有其他列可以留空。
第 1 列:Hugo_Symbol(不必是 HUGO,但必须与通路文件中使用的基因名称匹配)
第 2 列:Entrez_Gene_Id(匹配 Entrez ID 胜过通路文件和 MAF 之间的基因名称匹配)
第 9 栏:Variant_Classification
第 16 列:Tumor_Sample_Barcode(必须与样本列表中的名称匹配,或将其作为子字符串包含)
Entrez_Gene_Id 也可以留空(或设置为 0),但强烈建议,在
case 基因在 path 文件和 MAF 文件中的命名不同。
争论
--pathway-文件
这是从通路数据库(例如 KEGG)准备的制表符分隔文件,其中包含
列:[path_id、path_name、class、gene_line、疾病、药物、描述]
后三列是可选的(但在 KEGG 上可用)。 基因行包含
参与该途径的所有基因的“entrez_id:gene_name”,每个基因由一个
“|” 象征。
例如,路径文件中的一行如下所示:
hsa00061 脂肪酸生物合成 脂质代谢 31:ACACA|32:ACACB|27349:MCAT|2194:FASN|54995:OXSM|55301:OLAH
确保使用的基因名称和 entrez ID 与 MAF 中使用的匹配
文件。 Entrez ID 不是强制性的(如果 Entrez ID 未知,请使用 0)。 但是如果一个
MAF 中的基因名称与此文件中的任何基因名称都不匹配,entrez ID
用于查找匹配项(除非它是 0)。
--gene-covg-目录
这通常是您运行“music bmr calc-”时创建的gene_covgs 子目录
covg”。它应该包含每个样本的文件,报告每个基因覆盖的碱基
计数。
--bam 列表
提供一个包含每个样本名称和正常/肿瘤 BAM 位置的文件。 用
每行的制表符分隔格式 [sample_name normal_bamtumor_bam]。 仅此工具
需要 sample_name,因此可以跳过所有其他列。 sample_name 必须是
与 MAF 文件中使用的肿瘤样本名称相同(第 16 列,标题为
Tumor_Sample_Barcode)。
--bmr
整体背景突变率。 这可以使用“music bmr calc-
bmr”。
--忽略基因
要从 MAF 文件中忽略的以逗号分隔的基因列表。 这在有的时候很有用
是反复突变的基因,如 TP53,这可能会掩盖其他基因的重要性
基因。
作者
迈克尔·温德尔,博士
鸣谢
该模块使用来自京都基因百科全书和
基因组 (KEGG) 数据库:
* 凯格 - http://www.genome.jp/kegg/
使用 onworks.net 服务在线使用基因组音乐路径扫描