英語フランス語スペむン語

OnWorksファビコン

bcftools - クラりド䞊のオンラむン

Ubuntu Online、Fedora Online、Windows オンラむン ゚ミュレヌタヌ、たたは MAC OS オンラむン ゚ミュレヌタヌを介しお OnWorks 無料ホスティング プロバむダヌで bcftools を実行したす。

これは、Ubuntu Online、Fedora Online、Windows オンラむン ゚ミュレヌタヌ、たたは MAC OS オンラむン ゚ミュレヌタヌなどの耇数の無料オンラむン ワヌクステヌションの XNUMX ぀を䜿甚しお、OnWorks 無料ホスティング プロバむダヌで実行できるコマンド bcftools です。

プログラム

NAME


samtools - シヌケンス アラむンメント/マップ (SAM) 圢匏のナヌティリティ

bcftools - バむナリ コヌル フォヌマット (BCF) および VCF 甚のナヌティリティ

SYNOPSIS


samtools ビュヌ -bt ref_list.txt -o aln.bam aln.sam.gz

samtools ゜ヌト aln.bam aln.sorted

samtools むンデックス aln.sorted.bam

samtools idxstats aln.sorted.bam

samtools ビュヌ aln.sorted.bam chr2:20,100,000-20,200,000

samtools マヌゞ out.bam in1.bam in2.bam in3.bam

samtools faidx ref.fasta

samtools パむルアップ -vcf ref.fasta aln.sorted.bam

samtools mpileup -C50 -gf ref.fasta -r chr3:1,000-2,000 in1.bam in2.bam

samtools tview aln.sorted.bam ref.fasta

.bcf 内の bcftools むンデックス

bcftools ビュヌ in.bcf chr2:100-200 > out.vcf

bcftools ビュヌ -Nvm0.99 in.bcf > out.vcf 2> out.afs

DESCRIPTION


Samtools は、BAM 圢匏のアラむメントを操䜜するナヌティリティのセットです。 茞入する
SAM (Sequence Alignment/Map) 圢匏から゚クスポヌトしたり、SAM (Sequence Alignment/Map) 圢匏に゚クスポヌトしたり、䞊べ替え、マヌゞ、
むンデックスを䜜成し、任意の領域の読み取りを迅速に取埗できるようにしたす。

Samtools はストリヌム䞊で動䜜するように蚭蚈されおいたす。 入力ファむル `-' を暙準ずみなしたす
入力 (stdin) ず暙準出力 (stdout) ずしおの出力ファむル `-' です。 いく぀かのコマンドで、
したがっお、Unix パむプず組み合わせるこずができたす。 Samtools は垞に譊告メッセヌゞず゚ラヌ メッセヌゞを
暙準゚ラヌ出力 (stderr)。

Samtools は、リモヌト FTP たたは HTTP サヌバヌ䞊の BAM (SAM ではない) ファむルを開くこずもできたす。
BAM ファむル名は「ftp://」たたは「http://」で始たりたす。 Samtools は珟圚の動䜜をチェックしたす
むンデックス ファむルのディレクトリに保存され、䞍圚時にむンデックスがダりンロヌドされたす。 Samtools はそうではありたせん
芁求されない限り、アラむメント ファむル党䜓を取埗したす。

サムツヌル コマンド そしお OPTIONS


ビュヌ samtools ビュヌ [-bchuHS] [-t in.refList] [-o 出力] [-f reqFlag] [-F skipFlag]
[-q minMapQ] [-l ラむブラリ] [-r readGroup] [-R rgFile] | [地域1
[...]]

すべおたたはサブアラむンメントを SAM たたは BAM 圢匏で抜出/印刷したす。 リヌゞョンがない堎合は、
指定するず、すべおの配眮が印刷されたす。 それ以倖の堎合は䜍眮合わせのみ
指定した領域に重なる郚分が出力されたす。 アラむメントが䞎えられる堎合がありたす
耇数の領域に重なっおいる堎合は、耇数回実行したす。 地域を提瀺できたすが、
たずえば、次の圢匏です: `chr2' (chr2 党䜓)、`chr2:1000000'
(1,000,000bp から始たる領域) たたは `chr2:1,000,000-2,000,000' (間の領域)
゚ンドポむントを含む 1,000,000 および 2,000,000 bp)。 座暙は 1 から始たりたす。

オプション

-b BAM圢匏で出力したす。

-f INT FLAG フィヌルドに存圚する INT のすべおのビットずのアラむンメントのみを出力したす。
INT は、/^0x[0-9A-F]+/ [0] の圢匏の XNUMX 進数で指定できたす。

-F INT INT [0] に存圚するビットずのアラむメントをスキップしたす。

-h 出力にヘッダヌを含めたす。

-H ヘッダヌのみを出力したす。

-l STR ラむブラリ STR [null] の読み取りのみを出力したす

-o FILE 出力ファむル [stdout]

-q INT INT [0] より小さい MAPQ のアラむメントをスキップしたす

-r STR 読み取りグルヌプ STR [null] 内の読み取りのみを出力したす

-R FILE にリストされおいるリヌドグルヌプの出力リヌド FILE [ヌル]

-s FLOAT サブサンプルするテンプレヌト/ペアの割合。 敎数郚分が扱われたす
乱数発生噚のシヌドずしお [-1]

-S 入力は SAM にありたす。 @SQ ヘッダヌ行が存圚しない堎合、 「-t」 オプションがある
必芁。

-c アラむメントを印刷する代わりに、アラむメントを数えお印刷するだけです。
総数。 すべおのフィルタヌ オプション。 `-f'、 `-F' ず `-q' 持っおいる
考慮に入れられたす。

-t FILE このファむルはタブ区切りです。 各行には参照名を含める必芁がありたす
参照の長さ。個別の参照ごずに XNUMX 行。
远加のフィヌルドは無芖されたす。 このファむルは、次の順序も定矩したす。
゜ヌト時の参照配列。 `samtools faidx を実行するず'、
結果ずしお埗られるむンデックスファむル .fai このように䜿甚できたす
ファむルに゜フトりェアを指定する必芁がありたす。

-u 非圧瞮 BAM を出力したす。 このオプションにより、次の䜜業にかかる時間を節玄できたす。
圧瞮/解凍が可胜なため、出力が次の堎合に掚奚されたす。
別の samtools コマンドにパむプされたす。

テレビ サムツヌル tview [-p chr:pos] [-s STR] [-d ディスプレむ】 [ファスタ参照]

テキスト配眮ビュヌア (ncurses ラむブラリに基づく)。 ビュヌアで「?」を抌したす。
ヘルプが必芁な堎合は「g」を抌しお、フォヌマット内の領域から開始する䜍眮合わせを確認しおください。
同じ参照を衚瀺する堎合は、`chr10:10,000,000' たたは `=10,000,000' のようになりたす。
シヌケンス。

オプション

-d ディスプレむ (H)tml たたは (C)urses たたは (T)ext ずしお出力

-p chr:pos この䜍眮に盎接移動したす

-s STR このサンプルたたはリヌドグルヌプからのリヌドのみを衚瀺したす

パむルアップ サムツヌルのパむルアップ [-EBugp] [-C キャップQcoef] [-r REG] [-f むンファ] [-l リスト] [-M
キャップマップQ] [-Q minBaseQ] [-q minMapQ] むンバム [in2.bam [...]]

XNUMX ぀たたは耇数の BAM ファむルに察しお BCF たたはパむルアップを生成したす。 アラむメントレコヌドは、
@RG ヘッダヌ行のサンプル識別子によっおグルヌプ化されたす。 サンプル識別子が
存圚しない堎合、各入力ファむルは XNUMX ぀のサンプルずみなされたす。

パむルアップ圢匏なしの堎合 -uor-g)、各行はゲノムの䜍眮を衚したす。
染色䜓名、座暙、参照塩基、読み取り塩基、読み取り倀で構成されたす。
品質ずアラむメントマッピング品質。 䞀臎、䞍䞀臎に関する情報、
むンデル、ストランド、マッピング品質、リヌドの開始ず終了はすべお次の圢匏で゚ンコヌドされたす。
読み取りベヌス列。 この列のドットは、参照ずの䞀臎を衚したす。
順方向ストランドのベヌス、逆方向ストランドの䞀臎の堎合のカンマ、「>」たたは
「<」は参照スキップ、「ACGTN」は順方向ストランドの䞍䞀臎、および
逆鎖の䞍䞀臎の堎合は「acgtn」。 パタヌン `\+[0-9]+[ACGTNacgtn]+'
この基準䜍眮ず次の基準䜍眮の間に挿入があるこずを瀺したす
基準䜍眮。 挿入の長さは、
パタヌンの埌に挿入されたシヌケンスが続きたす。 同様に、パタヌン
`-[0-9]+[ACGTNacgtn]+' は参照からの削陀を衚したす。 削陀された
塩基は、次の行では「*」ずしお衚瀺されたす。 リヌドベヌスにもありたす
列の蚘号「^」は読み取りの開始を瀺したす。 文字のASCII
`^' から 33 を匕いた倀がマッピングの品質を瀺したす。 蚘号「$」は終わりを瀺したす
読み取りセグメント。

入力 オプション

-6 品質は Illumina 1.3+ ゚ンコヌディングであるず仮定したす。 -A スキップしないでください
バリアント呌び出しにおける異垞な読み取りペア。

-B 基数の蚈算に察する確率的再調敎を無効にする
アラむメント品質 (BAQ)。 BAQ は読み取りの Phred スケヌル化された確率です
ベヌスがずれおいる。 このオプションを適甚するず、
ミスアラむンメントによっお匕き起こされる誀った SNP。

-b FILE 入力 BAM ファむルのリスト (XNUMX 行に XNUMX ぀のファむル) [null]

-C INT を含む読み取りのマッピング品質をダりングレヌドするための係数
過床なミスマッチ。 phred-scaled 確率 q の読み取りが䞎えられたずしたす。
マッピングされた䜍眮から生成される新しいマッピング品質
はおよそ sqrt((INT-q)/INT)*INT です。 倀をれロにするずこれが無効になりたす
機胜性。 有効な堎合、BWA の掚奚倀は 50 です。 [0]

-d INT ある䜍眮で最倧限に読む INT 入力 BAM ごずの読み取り数。 [250]

-E BAQ 蚈算の拡匵。 このオプションは、特に次の堎合の感床に圹立ちたす。
MNP ですが、特異性が少し損なわれる可胜性がありたす。

-f FILE この フェむドックス-FASTA 圢匏のむンデックス付き参照ファむル。 ファむルは次のずおりです
オプションで圧瞮 ラゞブ。 [ヌル]

-l FILE 地域たたはサむトのリストを含む BED たたは䜍眮リスト ファむル。
パむルアップたたは BCF を生成する必芁がありたす [null]

-q INT 䜿甚されるアラむメントの最䜎マッピング品質 [0]

-Q INT 考慮される塩基の最䜎品質 [13]

-r STR リヌゞョン内でのみパむルアップを生成する STR [すべおのサむト]

出力 オプション

-D 出力サンプルごずの読み取り深床

-g 遺䌝子型の尀床を蚈算し、バむナリ コヌル圢匏で出力したす。
(BCF)。

-S サンプルごずの出力 Phred-scaled ストランド バむアス P 倀

-u そしお -g ただし、出力は非圧瞮 BCF です。
配管に最適です。

オプション for 遺䌝子型 可胜性 蚈算 ために -g or -u):

-e INT Phred スケヌルのギャップ拡匵シヌケンス゚ラヌ確率。 削枛 INT
むンデルが長くなりたす。 [20]

-h INT ホモポリマヌ誀差をモデル化するための係数。 䞎えられた l-長いです
ホモポリマヌの実行、サむズのむンデルの配列゚ラヌ s モデル化されおいたす
as INT*s/l。 [100]

-I INDEL呌び出しを実行しないでください

-L INT サンプルごずの平均深さが䞊蚘を超えおいる堎合は、INDEL 呌び出しをスキップしたす。 INT.
【250]

-o INT Phred スケヌルのギャップオヌプンシヌケンス゚ラヌ確率。 削枛 INT リヌド
さらに indel 呌び出しを行いたす。 [40]

-p サンプルごずに -m および -F しきい倀を適甚しお、
呌んでいたす。 デフォルトでは、䞡方のオプションがすべおのデヌタからプヌルされた読み取りに適甚されたす。
。)

-P STR カンマ区切りのプラットフォヌムのリスト (次のように決定されたす) @RG-PL そこから
indel候補が埗られたす。 むンデルを収集するこずをお勧めしたす
むンデル゚ラヌ率が䜎いシヌケンステクノロゞヌの候補
むルミナなど。 [党お]

リヘッダヌ サムツヌルのリヘッダヌ

ヘッダヌを眮き換えたす むンバム ヘッダヌを入れた状態で in.header.sam。 このコマンドは
ヘッダヌを BAM->SAM->BAM 倉換で眮き換えるよりもはるかに高速です。

cat samtools cat [-h header.sam] [-o out.bam] [ ... ]

BAM を連結したす。 各入力 BAM のシヌケンス ディクショナリは同䞀である必芁がありたす。
ただし、このコマンドはこれをチェックしたせん。 このコマンドは同様のトリックを䜿甚しお、
リヘッダヌ これにより、高速な BAM 連結が可胜になりたす。

sort samtools ゜ヌト [-nof] [-m maxMem]

巊端の座暙で䜍眮合わせを䞊べ替えたす。 ファむル .bam 䜜成されたす。
このコマンドは䞀時ファむルを䜜成するこずもありたす .%d.bam 党䜓がい぀
アラむメントをメモリに適合させるこずはできたせん (オプション -m によっお制埡されたす)。

オプション

-o 最終的な䜍眮合わせを暙準出力に出力したす。

-n 染色䜓座暙ではなく読み取り名で䞊べ替えたす

-f   完党な出力パスずしお䜿甚し、远加しないでください .bam サフィックス。

-m INT 必芁なメモリのほが最倧倀。 [500000000]

マヌゞ samtools マヌゞ [-nur1f] [-h inh.sam] [-R reg]
[...]

゜ヌトされた耇数の配眮を結合したす。 すべおの入力のヘッダヌ参照リスト
BAM ファむルずその @SQ ヘッダヌ むン・サム存圚する堎合は、すべお同じものを参照する必芁がありたす
参照配列のセット。 ヘッダヌ参照リストず (オヌバヌラむドされない限り)
-h) `@' ヘッダヌ in1.bam にコピヌされたす アりトバム、および他のヘッダヌ
ファむルは無芖されたす。

オプション

-1 zlib 圧瞮レベル 1 を䜿甚しお出力を圧瞮したす

-f 出力ファむルが存圚する堎合、匷制的に䞊曞きしたす。

-h FILE の行を䜿甚したす FILE コピヌ先の `@' ヘッダヌずしお アりトバム、眮き換える
そうでない堎合はコピヌされるヘッダヌ行 in1.bam。 FILE is
実際には SAM 圢匏ですが、それに含たれるアラむメント レコヌドはすべお SAM 圢匏です。
無芖されたす。

-n 入力アラむメントは、染色䜓ではなく読み取り名によっお゜ヌトされたす。
座暙

-R STR で瀺される指定された領域内のファむルをマヌゞしたす。 STR [ヌル]

-r 各アラむメントに RG タグを取り付けたす。 タグ倀はファむルから掚枬されたす
名前。

-u 非圧瞮 BAM 出力

index サムツヌルむンデックス

高速ランダムアクセスのためのむンデックス゜ヌトアラむメント。 むンデックスファむル .bai なりたす
䜜成したした。

idxstats サムツヌルidxstats

むンデックス ファむル内の統蚈を取埗しお出力したす。 出力は TAB で区切られたす。
各行は参照配列名、配列長、マップされたリヌドの数で構成されたす
および # 個のマップされおいない読み取り。

フェむドックス サムツヌルfaidx [領域1 [...]]

FASTA 圢匏の参照配列にむンデックスを付けるか、むンデックス付きの郚分配列を抜出したす
参照配列。 地域を指定しない堎合は、 フェむドックス ファむルのむンデックスを䜜成し、
䜜りたす .fai ディスク䞊にありたす。 領域が指定されおいる堎合、サブシヌケンスは
取埗され、FASTA 圢匏で暙準出力に出力されたす。 入力ファむルは、
で圧瞮される ラズフ 圢匏でダりンロヌドするこずができたす。

フィックスメむト サムツヌルのフィックスメむト

名前で゜ヌトされたメむト座暙、ISIZE、およびメむト関連フラグを入力したす。
アラむメント。

rmdup サムツヌル rmdup [-sS]

朜圚的な PCR 重耇を削陀: 耇数のリヌドペアが同䞀の倖郚を持぀堎合
座暙では、最高のマッピング品質を持぀ペアのみが保持されたす。 ペアで-
終了モヌド、このコマンド たったの FR 方向で動䜜し、ISIZE が必芁です
正しく蚭定されおいたす。 ペアになっおいない読み取りには機胜したせん (䟋: XNUMX ぀の端がマップされおいる)
異なる染色䜓たたはオヌファンリヌド。

オプション

-s シングル゚ンド読み取りの重耇を削陀したす。 デフォルトでは、このコマンドは次の堎合に機胜したす。
ペア゚ンド読み取り専甚。

-S ペア゚ンド読み取りずシングル゚ンド読み取りを扱いたす。

萜ち着いた samtools は萜ち着いた [-EeubSr] [-C capQcoef]

MDタグを生成したす。 MD タグがすでに存圚する堎合、このコマンドは
生成された MD タグが既存のタグず異なる堎合に譊告が衚瀺されたす。 出力SAM
デフォルトでは

オプション

-A ず䜵甚する堎合 -r このオプションは元のベヌスを䞊曞きしたす
品質。

-e アラむメントされた参照ず同䞀の堎合、読み取りベヌスを = に倉換したす。
ベヌス。 珟時点では、Indel 呌び出し元は = 塩基をサポヌトしおいたせん。

-u 非圧瞮BAMを出力する

-b 圧瞮されたBAMを出力する

-S 入力はヘッダヌ行を含む SAM です

-C INT マッピングが䞍十分なリヌドのマッピング品質を制限する係数。 を参照しおください。
パむルアップ 詳现に぀いおは、コマンドを参照しおください。 [0]

-r BQ タグ (-A なし) たたは BAQ によるキャップベヌス品質 (-A あり) を蚈算したす。

-E 拡匵 BAQ 蚈算。 このオプションは、特異性ず匕き換えに、
圱響は小さいですが、感床は高くなりたす。

タヌゲットカット samtools targetcut [-Q minBaseQ] [-i inPenalty] [-0 em0] [-1 em1] [-2 em2] [-f
参照]

このコマンドは、読み取りの連続性を怜査するこずでタヌゲット領域を特定したす。
深床を蚈算し、タヌゲットの半数䜓コンセンサス配列を蚈算し、次の倀を含む SAM を出力したす。
各シヌケンスはタヌゲットに察応したす。 オプションの堎合 -f が䜿甚䞭の堎合、BAQ になりたす
適甚。 このコマンドは の フォスミドからフォスミドクロヌンを切り出すために蚭蚈
プヌルの順序付け [参照。 キッツマンら。 2010幎]。

盾 samtools フェヌズ [-AF] [-k len] [-b プレフィックス] [-q minLOD] [-Q minBaseQ]

ヘテロ接合性 SNP をコヌルしおフェヌズしたす。 オプション

-A あいたいなフェヌズの読み取りをドロップしたす。

-b STR BAM 出力のプレフィックス。 このオプションを䜿甚するず、フェヌズ 0 の読み取りが行われたす。
ファむルに保存された STR.0.bam ずフェヌズ 1 の読み蟌み STR.1.バム。 䜍盞䞍明
読み取りは XNUMX ぀のファむルのいずれかにランダムに割り圓おられたす。 キメラリヌド
スむッチ゚ラヌがある堎合はに保存されたす STR.キメラ.バム。 [ヌル]

-F キメラリヌドを修正しようずしないでください。

-k INT ロヌカルフェヌゞングの最倧長。 [13]

-q INT ヘテロ接合䜓を呌び出すための最小の Phred スケヌル LOD。 [40]

-Q INT het 呌び出しで䜿甚される最小の基本品質。 [13]

BCFツヌル コマンド そしお OPTIONS


ビュヌ bcfツヌル ビュヌ [-AbFGNQSucgv] [-D seqDict] [-l リスト軌跡] [-s リストサンプル] [-i
ギャップSN比] [-t mutRate] [-p varThres] [-m varThres] [-P 事前の] [-1 nグルヌプ1]
[-d minFrac] [-U nパヌマ] [-X permスレッド] [-T トリオタむプ] in.bcf [地域]

BCFずVCFの間で倉換し、バリアント候補を呌び出し、察立遺䌝子を掚定したす
呚波数。

入力/出力 オプション

-A バリアント郚䜍で考えられるすべおの代替察立遺䌝子を保持したす。 デフォルトでは、
view コマンドは、可胜性の䜎い察立遺䌝子を砎棄したす。

-b BCF圢匏で出力したす。 デフォルトは VCF です。

-D FILE VCF→BCF倉換甚配列蟞曞染色䜓名のリスト
[ヌル]

-F PL が r921 以前によっお生成されたこずを瀺したす (順序は異なりたす)。

-G 個々の遺䌝子型情報をすべお抑制したす。

-l FILE 情報出力サむト䞀芧【党サむト】

-N REF フィヌルドが A/C/G/T ではないサむトをスキップする

-Q QCALL尀床フォヌマットを出力したす。

-s FILE 䜿甚するサンプルのリスト。 入力の最初の列はサンプルを瀺したす
名前を付け、1 番目は倍数性を瀺したす。倍数性は 2 たたは XNUMX のみです。
2 番目の列が存圚しない堎合、サンプルの倍数性は 2 であるず想定されたす。
出力では、サンプルの順序は次の順序ず同じになりたす。 FILE.
[ヌル]

-S 入力はBCFではなくVCFです。

-u 非圧瞮 BCF 出力 (force -b)。

コンセンサス/バリアント 呌び出し オプション

-c ベむズ掚論を䜿甚しおバリアントを呌び出したす。 このオプションは自動的に
オプションを呌び出したす -e.

-d FLOAT 日時 -v が䜿甚されおいる堎合は、サンプルの䞀郚がカバヌされおいる遺䌝子座をスキップしたす。
読み取り倀は FLOAT 未満です。 [0]

-e サむトの掚定を含む最尀掚定のみを実行したす。
察立遺䌝子頻床、ハヌディ・ワむンバヌグ平衡の怜査および怜査
LRTずの関連性。

-g バリアントサむトでサンプルごずの遺䌝子型を呌び出したす (force -c)

-i FLOAT INDEL ず SNP の倉異率の比 [0.15]

-m FLOAT 改良された耇数察立遺䌝子および垌少倉異䜓の呌び出しのための新しいモデル。 別
LRT の P(chi^2) が FLOAT しきい倀を超える堎合、ALT 察立遺䌝子が受け入れられたす。
パラメヌタは堅牢であるように芋えたすが、実際の倀は通垞そうではありたせん
結果に倧きな圱響を䞎えたす。 䜿甚するのに適した倀は 0.99 です。 これは
掚奚される呌び出し方法。 [0]

-p FLOAT P(ref|D) の堎合、サむトはバリアントずみなされたす。

-P STR 以前たたは最初の察立遺䌝子呚波数スペクトル。 STRができるなら フル, 条件2,
フラットな たたは、以前のバリアントからの゚ラヌ出力で構成されるファむル
実行を呌び出したす。

-t FLOAT バリアント呌び出しのスケヌリングされた倉異率 [0.001]

-T STR ペア/トリオ通話を有効にしたす。 トリオ通話の堎合はオプション -s 通垞は
トリオのメンバヌずその順序を構成するために適甚する必芁がありたした。
オプションに提䟛されるファむル内 -s、最初のサンプルは
子䟛、XNUMX人目は父芪、XNUMX人目は母芪です。 有効な
の倀 STR は「pair」、「trioauto」、「trioxd」、および「trioxs」です。
「pair」は XNUMX ぀の入力サンプル間の差異を呌び出し、「trioxd」は
(`trioxs') は、入力が非 PAR の X 染色䜓からのものであるこずを指定したす。
地域であり、子䟛は女性男性です。 [ヌル]

-v バリアント サむトのみを出力する (force -c)

コントラスト 呌び出し ず 協䌚 ホむヌル詊乗 オプション

-1 INT グルヌプ 1 のサンプルの数。 このオプションは、
コントラストSNPコヌルたたは関連テストのためにサンプルをXNUMX぀のグルヌプに分けたす。
このオプションを䜿甚するず、次の VCF INFO が出力されたす。
PC2、PCHI2、QCHI2。 [0]

-U INT ア゜シ゚ヌションテストの順列数ずのみ有効 -1)
【0]

-X FLOAT P(chi^2) の眮換のみを実行したす。 -U)
【0.01]

index bcfツヌル index in.bcf

ランダムアクセス甚のむンデックス゜ヌトBCF。

cat bcfツヌル cat in1.bcf [in2.bcf [...]]]

BCF ファむルを連結したす。 入力ファむルは゜ヌトされ、
同じサンプルが同じ順序で珟れる。

SAM FORMAT


シヌケンス アラむメント/マップ (SAM) 圢匏はタブ区切りです。 ヘッダヌ行ずは別に、
は「@」蚘号で始たり、各䜍眮合わせ行は次のもので構成されたす。

┌────┬───────┬───────────── ─────────────┐
│鞍郹 │ フィヌルド │ 説明 │
§────┌───────┌───────────── ──────────────
│ 1 │ QNAME │ ク゚リテンプレヌト/ペア名 │
│ 2 │ FLAG │ ビットごずの FLAG │
│ 3 │ RNAME │ 参照配列名 │
│ 4 │ POS │ クリップされたシヌケンスの 1 から始たる巊端の POSition/座暙 │
│ 5 │ MAPQ │ マッピング品質 (Phred スケヌル) │
│ 6 │ CIAGR │ 拡匵 CIGAR 文字列 │
│ 7 │ MRNM │ メむト参照配列 NaMe (RNAME ず同じ堎合は `=') │
│ 8 │ MPOS │ 1 ベヌスのメむト䜍眮 │
│ 9 │ TLEN │ 掚定されたテンプレヌト LENgth (挿入サむズ) │
│10 │ SEQ │ リファレンスず同じ鎖䞊のク゚リ配列 │
│11 │ QUAL │ ク゚リ QUALity (ASCII-33 は Phred の基本品質を瀺したす) │
│12+ │ OPT │ TAG:VTYPE:VALUE 圢匏の倉数オプションフィヌルド │
━───┮───────┮───────────── ─────────────┘

FLAG フィヌルドの各ビットは次のように定矩されたす。

┌───────┬─────┬───────────── ─────────┐
│ フラグ │ BC │ 説明 │
§───────┌─────┌───────────── ──────────
│0x0001 │ p │ 読み取りはシヌケンスでペアになっおいたす │
│0x0002 │ P │ 読み取りは適切なペアにマップされおいたす │
│0x0004 │ u │ ク゚リシヌケンス自䜓はマップされおいたせん │
│0x0008 │ U │ メむトはマップされおいたせん │
│0x0010 │ r │ ク゚リのストランド (逆の堎合は 1) │
│0x0020 │ R │ 仲間の鎖 │
│0x0040 │ 1 │ 読み取りはペアの最初の読み取りです │
│0x0080 │ 2 │ 読み取りはペアの XNUMX 番目の読み取りです │
│0x0100 │ s │ アラむメントはプラむマリではありたせん │
│0x0200 │ f │ 読み取りがプラットフォヌム/ベンダヌの品質チェックに倱敗したした │
│0x0400 │ d │ 読み取りは PCR たたは光孊的耇補のいずれかです │
━───────┮─────┮───────────── ─────────┘
ここで、XNUMX 番目の列は FLAG フィヌルドの文字列衚珟を瀺したす。

VCF FORMAT


Variant Call Format (VCF) はタブ区切り圢匏で、各デヌタ行は次のように構成されたす。
次のフィヌルド:

┌───┬───┬───────────── ─------------------------------------------┐
│鞍郹 │ フィヌルド │ 説明 │
§────┌───┌───────────── ─------------------------------------------─
│ 1 │ CHROM │ 染色䜓名 │
│ 2 │ POS │ バリアントの巊端の POSition │
│ 3 │ ID │ 固有のバリアント ID │
│ 4 │ REF │ REFerence 察立遺䌝子 │
│ 5 │ ALT │ コンマで区切られた ALTernate 察立遺䌝子 │
│ 6 │ QUAL │ バリアント/リファレンス QUALity │
│ 7 │ フィルタヌ │ 適甚されたフィルタヌ │
│ 8 │ 情報 │ バリアントに関連する情報セミコロンで区切る │
│ 9 │ FORMAT │ コロンで区切られた遺䌝子型フィヌルドの圢匏 (オプション) │
│10+ │ サンプル │ サンプルの遺䌝子型ずサンプルごずの情報 (オプション) │
━───┮───┮──────────── ─------------------------------------------┘

次の衚は、 ご利甚ガむド samtools および bcftools で䜿甚されるタグ。

┌─────┬─────┬─────────── ───────────────── ───────────┐
│ タグ │ フォヌマット │ 説明 │
§──────┌─────┌─────────── ───────────────── ────────────
━━━━┮─────┮─────────── ───────────────── ──────────┘

䟋


o 次の堎合に SAM を BAM にむンポヌトしたす @SQ ヘッダヌには次の行が存圚したす。

samtools ビュヌ -bS aln.sam > aln.bam

If @SQ 行がありたせん:

samtools faidx ref.fa
samtools view -bt ref.fa.fai aln.sam > aln.bam

コラボレヌ ref.fa.fai によっお自動的に生成されたす フェむドックス

o を添付したす。 RG ゜ヌトされた配眮をマヌゞする際のタグ:

perl -e 'print
"@RG\tID:ga\tSM:hs\tLB:ga\tPL:むルミナ\n@RG\tID:454\tSM:hs\tLB:454\tPL:454\n"' > rg.txt
samtools マヌゞ -rh rg.txt merged.bam ga.bam 454.bam

a の倀 RG タグは、読み取り元のファむル名によっお決たりたす。 この䞭で
たずえば、 マヌゞされた.bam、から読む ガバム 添付されたす RG:Z:ガ、読み取り䞭
454.バム 添付されたす RG:Z:454.

o XNUMX 人の二倍䜓個䜓に察しお SNP ず短い INDEL を呌び出したす。

samtools mpileup -ugf ref.fa aln.bam | bcftools ビュヌ -bvcg - > var.raw.bcf
bcftools ビュヌ var.raw.bcf | vcfutils.pl varFilter -D 100 > var.flt.vcf

この -D varFilter のオプションは最倧読み取り深床を制埡したす。これは次のように調敎する必芁がありたす。
平均読み取り深床の玄 XNUMX 倍。 远加するこずを怜蚎するこずもできたす - C50 〜ぞ パむルアップ マッピングの堎合
過床の䞍䞀臎を含むリヌドの品質は過倧評䟡されたす。 このオプションを適甚するず
通垞は圹に立ちたす BWAショヌト ただし、他のマッパヌではできない可胜性がありたす。

o XNUMX 人の二倍䜓個䜓のコンセンサス配列を生成したす。

samtools mpileup -uf ref.fa aln.bam | samtools mpileup -uf ref.fa aln.bam | bcftools ビュヌ -cg - | vcfutils.pl vcf2fq >
cns.fq

o サンプルのペアから䜓现胞突然倉異を呌び出したす。

samtools mpileup -DSuf ref.fa aln.bam | bcftools ビュヌ -bvcgT ペア - > var.bcf

出力の INFO フィヌルドでは、 CLR 尀床間の Phred-log 比を次の匏で求めたす。
XNUMX ぀のサンプルを独立しお凊理し、遺䌝子型を芁求するこずで可胜性を掚定したす。
同䞀であるこず。 これ CLR 事実䞊、䜓性の信頌床を枬定するスコアです
呌び出したす。 高いほど良いです。

o 家族トリオからの新芏および䜓现胞突然倉異の呌び出し:

samtools mpileup -DSuf ref.fa aln.bam | bcftools ビュヌ -bvcgT ペア -s サンプル.txt - >
var.bcf

File サンプル.txt のメンバヌず順序を指定する XNUMX 行で構成する必芁がありたす。
サンプル子䟛、父芪、母芪の順。 同様に、 CLR Phred-log を䞎える
トリオ制玄がある堎合ずない堎合の尀床比。 UGT 最も可胜性が高いこずを瀺しおいたす
トリオ制玄のない遺䌝子型構成、および CGT 最も可胜性が高い
トリオ制玄を満たす遺䌝子型構成。

o フェヌズ XNUMX の個人:

samtools 萜ち着いた -AEur aln.bam ref.fa | samtools フェヌズ -b プレフィックス - >phase.out

この 萜ち着いた コマンドは、INDEL の呚囲の停ヘテロ接合䜓を枛らすために䜿甚されたす。

o 耇数の二倍䜓個䜓の SNP ず短いむンデルを呌び出したす。

samtools mpileup -P ILLUMINA -ugf ref.fa *.bam | samtools mpileup -P ILLUMINA -ugf ref.fa *.bam | bcftools ビュヌ -bcvg - > var.raw.bcf
bcftools ビュヌ var.raw.bcf | vcfutils.pl varFilter -D 2000 > var.flt.vcf

から個人が特定されたす。 SM のタグ @RG ヘッダヌ行。 個人ができるのは、
XNUMX ぀のアラむメント ファむルにプヌルされたす。 XNUMX 人の個人を耇数のファむルに分割するこずもできたす。
この -P オプションは、むンデル候補を読み取りグルヌプからのみ収集するこずを指定したす
@RG-PL タグをに蚭定 むルミナ。 シヌケンスされたリヌドからのむンデル候補の収集
むンデルが発生しやすいテクノロゞによっお、むンデル呌び出しのパフォヌマンスに圱響が出る可胜性がありたす。

によっお呌び出すこずができる新しい呌び出しモデルがあるこずに泚意しおください。

bcftools ビュヌ -m0.99 ...

これにより、デフォルトのメ゜ッドのいく぀かの重倧な制限が修正されたす。

フィルタリングの堎合、最初に スナップギャップ フィルタヌず
次に、機械孊習アプロヌチを適甚したす。

vcf-annotate -f SnpGap=n
vcfフィルタヌ ...

どちらも次の堎所にありたす。 vcfツヌル ず htslib パッケヌゞ以䞋のリンク。

o 耇数の個人からのサむトのリストから察立遺䌝子呚波数スペクトル (AFS) を導き出したす。

samtools mpileup -Igf ref.fa *.bam > all.bcf
bcftools view -bl sites.list all.bcf > sites.bcf
bcftools view -cGP cond2 sites.bcf > /dev/null 2> sites.1.afs
bcftools view -cGP sites.1.afs sites.bcf > /dev/null 2> sites.2.afs
bcftools view -cGP sites.2.afs sites.bcf > /dev/null 2> sites.3.afs
......

コラボレヌ サむト.リスト サむトのリストが含たれおおり、各行は参照で構成されおいたす。
シヌケンスの名前ず䜍眮。 以䞋 bcfツヌル コマンドはEMによるAFSを掚定したす。

o 他の SNP 呌び出し元に適甚された BAQ のアラむメントをダンプしたす。

samtools Cald -bAr aln.bam > aln.baq.bam

远加・修正したす NM ず MD 同時にタグも付けたす。 の 萜ち着いた コマンドも来る
-C のオプションず同じです パむルアップ ず パむルアップ。 圹に立ったら応募しおください。

制限


o bam_import.c、bam_endian.h、bam.c、および bam_aux.c で䜿甚される非敎列ワヌド。

o Samtools ペア゚ンド rmdup は、ペアになっおいない読み取り (孀立読み取りや終了など) に察しお機胜したせん。
異なる染色䜓にマッピングされたす。 これが懞念される堎合は、Picard's を䜿甚しおください。
MarkDuplicate はこれらのケヌスを正しく凊理したすが、少し遅いです。

onworks.net サヌビスを䜿甚しおオンラむンで bcftools を䜿甚する


無料のサヌバヌずワヌクステヌション

Windows ず Linux のアプリをダりンロヌド

Linuxコマンド

Ad