这是命令 fastqc,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
FastQC - 高通量序列 QC 分析工具
概要
fastqc seqfile1 seqfile2 .. seqfileN
fastqc [-o 输出目录] [--(no)extract] [-f fastq|bam|sam]
[-c 污染文件] seqfile1 .. seqfileN
商品描述
FastQC 读取一组序列文件并从每个文件中生成质量控制
报告由许多不同的模块组成,每个模块都有助于
识别数据中不同的潜在问题类型。
如果在命令行上没有指定要处理的文件,那么程序将
作为交互式图形应用程序开始。 如果文件提供在
命令行,则程序将运行而无需用户交互。 在这
模式,它适合包含在标准化的分析管道中。
程序的选项如下:
-h - 帮帮我
打印此帮助文件并退出
-v - 版
打印程序版本并退出
-o --outdir
在指定的输出目录中创建所有输出文件。 请注意,这
目录必须存在,因为程序不会创建它。 如果未设置此选项
然后在与序列文件相同的目录中创建每个序列文件的输出文件
处理的序列文件。
--木薯
文件来自原始木薯输出。 同一样本组中的文件(仅不同
按组号)将作为一个集合而不是单独进行分析。 序列
在标题中设置过滤器标志的将被排除在分析之外。 文件
必须与 casava 赋予它们相同的名称(包括被 gzipped 和
以 .gz 结尾),否则它们将无法正确组合在一起。
- 提炼
如果设置,则压缩后的输出文件将在同一目录中解压缩
它已被创建。 默认情况下,如果运行 fastqc,将设置此选项
非交互模式。
-j --java
提供要用于启动 fastqc 的 java 二进制文件的完整路径。 如果不
提供然后 java 被假定在您的路径中。
--无提取物
创建后不要解压缩输出文件。 如果出现以下情况,您应该设置此选项
在非交互模式下运行时,您不希望解压缩输出。
--无组
禁用读取 >50bp 的碱基分组。 所有报告将显示每个
以阅读为基础。 警告:使用此选项会导致 fastqc 崩溃和烧毁
如果你在非常长的阅读中使用它,你的情节最终可能会变得荒谬。
你被警告了!
-f - 格式
绕过正常的序列文件格式检测并强制程序使用
指定的格式。 有效格式为 bam、sam、bam_mapped、sam_mapped 和 fastq
-t --线程
指定可以同时处理的文件数。 每个线程
将分配 250MB 的内存,因此您不应该运行比您的线程更多的线程
可用内存将应付,并且在 6 位机器上不超过 32 个线程
-c 指定包含以下列表的非默认文件
--污染物
污染物来筛选过度表达的序列。 该文件必须包含
名称[tab]序列形式的一组命名污染物。 以 a 为前缀的行
哈希将被忽略。
-k --kmers
指定要在 Kmer 内容模块中查找的 Kmer 长度。 指定 Kmer
长度必须介于 2 和 10 之间。如果未指定,则默认长度为 5。
-q - 安静的
禁止 stdout 上的所有进度消息,只报告错误。
使用 onworks.net 服务在线使用 fastqc