これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、MAC OS オンライン エミュレーターなど、複数の無料オンライン ワークステーションのいずれかを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド plink1.9 です。
プログラム:
NAME
PLINK - 全ゲノム SNP 解析
DESCRIPTION
PLINK v1.90b3.31 64 ビット (3 年 2016 月 2 日) https://www.cog-genomics.org/plinkXNUMX (C)
2005-2016 Shaun Purcell、Christopher Chang GNU General Public License v3
以下のコマンド ライン フラグの定義では、
* [角括弧] は必須パラメーターを示します。
括弧はその性質を説明しています。
* オプションの修飾子を示します (または、'|' が存在する場合、セット
相互に排他的なオプションの修飾子の)。
の正確なテキストを使用してください
'--dummy acgt' など。
* 山かっこ/正確なテキスト ルールには例外が XNUMX つあります。
ブラケット用語は「=[値]」で終わります。「[値]」は変数パラメータを指定します。
* {中括弧} はオプションのパラメーターを示します。
中括弧はその性質を説明しています。
* 省略記号 (...) は、複数のパラメータを入力できることを示します。
指定されたタイプ。
plink [入力フラグ...] {コマンドフラグ...} {その他のフラグ...} plink - 助けて {国旗
名前...}
ほとんどの PLINK 実行では、メインの入力ファイルセットが XNUMX つだけ必要です。 以下のフラグが利用可能です
そのフォームと場所を定義するため:
--bfile {prefix} : .bed + .bim + .fam プレフィックスを指定します (デフォルトは 'plink')。
- ベッド [filename] : .bed ファイルの完全な名前を指定します。
--ビム [ファイル名] : .bim ファイルの完全な名前を指定します。
--ファム [filename] : .fam ファイルの完全な名前を指定します。
--keep-autoconv
:With - ファイル/--tfile/--lfile/--vcf/--bcf/--data/--23file、削除しないでください
実行の最後に自動生成されたバイナリ ファイルセット。
- ファイル {プレフィックス}
: .ped + .map ファイル名プレフィックスを指定します (デフォルトは 'plink')。
--ペッド [filename] : .ped ファイルの完全な名前を指定します。
- 地図 [filename] : .map ファイルの完全な名前を指定します。
--ノーフィド
: .fam/.ped ファイルには列 1 (ファミリー ID) が含まれていません。
--親なし
: .fam/.ped ファイルには列 3 ~ 4 (親) が含まれていません。
-- ノーセックス
: .fam/.ped ファイルに列 5 (性別) が含まれていません。
--ノーフェノ
: .fam/.ped ファイルには列 6 (表現型) が含まれていません。
--tfile {prefix} : .tped + .tfam ファイル名プレフィックスを指定します (デフォルトは 'plink')。
--tped [名前]
: .tped ファイルの完全な名前を指定します。
--tfam [名前]
: .tfam ファイルの完全な名前を指定します。
--lfile {prefix} : .lgen + .map + .fam (長い形式のファイルセット) プレフィックスを指定します。
--lgen [名前]
: .lgen ファイルの完全な名前を指定します。
- リファレンス [fn] : .lgen 入力に付随するデフォルトの対立遺伝子ファイルを指定します。
--対立遺伝子数
:併用時 --lfile/--lgen + - リファレンス、.lgen ファイル
参照対立遺伝子数が含まれています。
--vcf [ファイル名] : .vcf または .vcf.gz ファイルのフルネームを指定します。
--bcf [filename] : BCF2 ファイルのフルネームを指定します。
- データ {プレフィックス}
: Oxford .gen + .sample プレフィックス (デフォルト 'plink') を指定します。
--gen [filename] : .gen または .gen.gz ファイルのフルネームを指定します。
--bgen [へ] : .bgen ファイルの完全な名前を指定します。
- サンプル [fname] : .sample ファイルのフルネームを指定します。
--23ファイル [fname] {FID} {IID} {sex} {pheno} {pat. ID} {マット。 ID} :
23andMe 入力ファイルを指定します。
--grm-gz {prfx}
: .grm.gz + .grm.id (GCTA rel. マトリックス) プレフィックスを指定します。
--grm-bin {prfx} : .grm.bin + .grm.N.bin + .grm.id (GCTA 三角形
二項関係行列) ファイル名のプレフィックス。
- ダミー [サンプル ct] [SNP ct] {遺伝子頻度の欠落} {表現型頻度の欠落}
これにより、指定された数のサンプルと SNP を持つ偽の入力データセットが生成されます。
デフォルトでは、欠落している遺伝子型と表現型の頻度はゼロであり、遺伝子型
As と B です (後者は 'acgt'/'1234'/'12' で変更します)。 「スカラーフェノ」
修飾子は、代わりに正規分布スカラー表現型を生成します。
バイナリのもの。
-シミュレート 【シミュレーションパラメータファイル】
--simulate-qt 【シミュレーションパラメータファイル】
-シミュレート 疾患関連の SNP を含む偽の入力データセットを生成し、
while --simulate-qt 量的形質遺伝子座を含むデータセットを生成します。
出力ファイルには、デフォルトで「plink.{extension}」という形式の名前が付いています。 を変更できます。
「plink」接頭辞
- アウト [接頭語]
: 出力ファイルのプレフィックスを指定します。
ほとんどの実行では、次のコマンドの少なくとも XNUMX つも必要です。
- ベッドを整えます
新しいバイナリ ファイルセットを作成します。
自動テキストからバイナリへの変換とは異なり
コンバーター(染色体フィルターのみに注意する)、これは PLINK のすべてをサポートします。
フィルタリング フラグ。
--make-just-bim
--メイクジャストファム
のバリアント - ベッドを整えます 新しい .bim または .fam ファイルのみを書き込みます。
することができます
.bim/.fam 入力のみで使用されます。 これらは慎重に使用してください。 とても簡単です
これらを使用する場合、バイナリ遺伝子型データと .bim/.fam インデックスを非同期化します
不適切に命令します。 疑問がある場合は、そのままにしてください - ベッドを整えます.
--recode <01 | 12> <23 | {-転置} | 広告 | 広告ビーグル {-nomap} | ビンバム{-1chr}
| | 複合遺伝子型 | fastphase{-1chr} | HV{-1chr} | lgen{-ref} | リスト | オックスフォード |
リスト | 構造 | 転置 | vcf | vcf-fid | vcf-iid>
| | ゲン-gz>
すべてのフィルタが適用された新しいテキスト ファイルセットを作成します。
デフォルトでは、
ファイルセットは .ped と .map ファイルで構成され、 - ファイル. *「12」
修飾子により、A1 (通常はマイナー) 対立遺伝子が「1」としてコード化されます
A2 対立遺伝子は「2」としてコード化され、「01」は A1 -> 0 および A2 -> 1 にマッピングされます。
* '23' 修飾子により、23andMe 形式のファイルが生成されます。
この
単一のサンプルのデータに対してのみ使用できます (- 保つ 便利かもしれません)。
* 'AD' 修飾子は、サンプル メジャーの加法 (0/1/2) + ドミナントを引き起こします。
(het = 1、それ以外の場合は 0) R からのロードに適したコンポーネント ファイル。
生成されます。 支配的なコンポーネントが必要ない場合は、代わりに 'A' を使用してください。 必要な場合
ヘッダー行で名前を付けるカウントされていない対立遺伝子は、'include-alt' 修飾子を追加します。
* 'A-transpose' 修飾子により、バリアント メジャーの追加コンポーネント ファイルが生成されます
生成されること。
* 'beagle' 修飾子により、段階的な常染色体ごとの .dat および .map ファイルが生成されます。
'beagle-nomap' が
単一の .beagle.dat ファイル。
* 「bimbam」修飾子により、BIMBAM 形式のファイルセットが生成されます。
入力データに染色体が 1 つしか含まれていない場合は、代わりに「bimbam-XNUMXchr」を使用できます
XNUMX 列の .pos.txt ファイルを書き込みます。
* 'compound-genotypes' 修飾子は、ペア間のスペースを削除します
.ped + .map ファイルセットを生成するときの同じバリアントの対立遺伝子コード。
* 「fastphase」修飾子により、染色体ごとの fastPHASE ファイルが
生成された。
入力データに染色体が XNUMX つしか含まれていない場合は、次を使用できます。
ファイル拡張子から染色体番号を除外するには、代わりに「fastphase-1chr」を使用します。
* 'HV' 修飾子により、Haploview 形式の .ped + .info ファイルセットが
染色体ごとに生成されます。
「HV-1chr」は「fastphase-1chr」に類似しています。
* 'lgen' 修飾子により、長いフォーマットのファイルセットが生成されます ( --lfile)
生成されますが、「lgen-ref」は(通常)より小さな長い形式のファイルセットを生成します
でロード可能 --lfile + - リファレンス.
* 'list' 修飾子は遺伝子型ベースのリストを作成し、'rlist' は作成します
まれな遺伝子型のファイルセット。
これらの形式では、「omit-nonmale-y」
修飾子により、Y 染色体上で男性以外の遺伝子型が省略されます。
* 'oxford' は、オックスフォード形式の .gen + .sample ファイルセットを生成します。
「gen-gz」修飾子も含めると、.gen ファイルは gzip されます。
* 「構造」修飾子により、構造形式のファイルが生成されます。 *
'transpose' は、転置されたテキスト ファイルセットを作成します ( --tfile)。 * 'vcf',
「vcf-fid」および「vcf-iid」により、VCFv4.2 ファイルが生成されます。
「vcf-fid」および「vcf-iid」により、それぞれファミリー ID またはファミリー内 ID が
最後のヘッダー行のサンプル ID に使用され、「vcf」は ID と ID の両方をマージします。
それらの間にアンダースコアを置きます。 「bgz」修飾子が追加されている場合、VCF ファイルは
ブロック圧縮。 A2対立遺伝子は参照として保存され、通常はそうではないというフラグが立てられます
実際の参照ゲノム ('PR' INFO フィールド値) に基づいています。 大事な時に
対立遺伝子を正確に参照するには、これも含める必要があります --a2-対立遺伝子 と
--real-ref-対立遺伝子 あなたの命令で。
* 'tab' 修飾子を使用すると、出力のほとんどがタブで区切られます。
ほとんどがスペース区切り。
'tabx' と 'spacex' はすべてのタブとすべてを強制します
スペース、それぞれ。
--フリップスキャン
(エイリアス: --フリップスキャン) ケース/コントロール ストランドの不一致に対する LD ベースのスキャン。
--write-covar
もし --コバール ファイルがロードされ、 - ベッドを整えます/--make-just-fam と --recode 自動的に
更新されたバージョンを生成します (すべてのフィルターが適用されます)。 ただし、そうしないと
新しい遺伝子型ファイルを同時に生成したい場合は、使用できます --write-covar 〜へ
剪定された共変量ファイルを生成するだけです。
--書き込みクラスター
クラスターが指定されている場合 - 内部/-- ファミリ、これにより新しいクラスタ ファイルが生成されます
(すべてのフィルタが適用された状態)。 「omit-unassigned」修飾子により、クラスター化されていない
ファイルから除外されるサンプル。 それ以外の場合、クラスターは「NA」です。
--書き込みセット
--セットテーブル
セットが定義されている場合、 --書き込みセット 'END' で終了するセット メンバーシップ リストをダンプします
{出力プレフィックス}.set に、その間 --セットテーブル バリアントごとのメンバーシップ テーブルを書き込みます
{出力プレフィックス}.set.tableに。
- マージ [.ped ファイル名] [.map ファイル名]
- マージ [テキスト ファイルセット プレフィックス]
--bmerge [.bed ファイル名] [.bim ファイル名] [.fam ファイル名]
--bmerge [バイナリ ファイルセット プレフィックス]
指定されたファイルセットを最初にロードされたファイルセットとマージし、結果を
{出力プレフィックス}.bed + .bim + .fam. (同時にする必要はなくなりました
指定する - ベッドを整えます.)
--マージリスト [ファイル名]
テキスト ファイルで指定されたすべてのファイルセットを参照ファイルセットとマージします (存在する場合)。
指定。 (ただし、これは参照*なしで*使用することもできます。その場合、
新しく作成されたファイルセットは、他のほとんどの PLINK によって参照として扱われます。
テキスト ファイルは次のように解釈されます。
の接頭辞と見なされます。
バイナリ ファイルセット。
* 行に XNUMX つの名前が含まれている場合、それらは完全な名前であると見なされます
テキスト ファイルセットのファイル名 (最初に .ped、次に .map)。
* XNUMX 行に XNUMX つの名前が含まれている場合、それらは完全な名前であると見なされます。
バイナリ ファイルセットのファイル名 (.bed、次に .bim、次に .fam)。
--write-snplist
--list-23-indels
--write-snplist すべてのバリアントの名前をリストする .snplist ファイルを書き込みます
指定したフィルタと包含しきい値を通過する一方、
--list-23-indels サブセットを 23andMe スタイルの indel 呼び出し (D/I アレル
コード)。
--list-duplicate-vars
--list-duplicate-vars のすべてのグループを記述する .dupvar ファイルを書き込みます
位置と対立遺伝子コードが一致するバリアント。 * デフォルトでは、A1/A2 アレル
割り当ては無視されます。 「require-same-ref」を使用
これをオーバーライドします。
※通常、レポートにはポジションコードとアレルコードが記載されています。
それらを削除するには
(そして、例えばで直接使用できるファイルを生成します - エキス/--除外)、「ids-only」を使用します。
報告された ID のいずれかが
ユニークではありません。
* 'suppress-first' により、各グループの最初のバリアント ID が省略されます
レポートから。
--頻度
--freqx
--頻度 基本的な対立遺伝子頻度を生成します(または「カウント」の場合はカウントします)
修飾子が存在する) レポート。
これと組み合わせることができます - 内部/ - 家族
代わりに、クラスター層別対立遺伝子頻度/カウント レポートを作成するか、または
ケースとコントロールの対立遺伝子頻度を別々に報告するための「case-control」修飾子。
--freqx で使用するために設計された、より詳細な遺伝子型カウント レポートを生成します。
-- 読み取り頻度.
- ない
サンプルおよびバリアント ベースの欠損データ レポートを生成します。
クラスタが
定義されている場合、バリアント ベースのレポートはクラスター層化されます。
「gz」は
gzip される出力ファイル。
-- テスト事故
欠落した呼び出しとハプロタイプに隣接する間の関連を確認します。
--丈夫な
Hardy-Weinberg の正確検定 p 値レポートを生成します。
(これはしません
同時に p 値をフィルタリングします。 使用する --ふぇ そのために。)
連絡先
'midp' 修飾子、テストは Graffelman で説明されている mid-p 調整を適用します
J, Moreno V (2013) Hardy-Weinberg Equilibrium の正確検定における中間 p 値。
--メンデル
メンデル エラー レポートを生成します。
「要約のみ」修飾子により、
スキップする .mendel ファイル (すべてのエラーを一覧表示)。
--ヘット
--ibc
近親交配係数を推定します。
--ヘット モーメント法を報告します
見積もり中 --ibc Yang J、Lee SH で説明されている XNUMX つの値すべてを計算し、
Goddard ME および Visscher PM (2011) GCTA: ゲノム全体の複雑な形質のためのツール
分析。 (その論文では、関係行列の計算についても説明しています。
* これらの関数には適切な MAF 見積もりが必要です。 非常にある場合
少数の
直接のファイルセットのサンプル、 -- 読み取り頻度 以来、実質的に必須です
その場合、帰属された MAF は非常に不正確です。
* 彼らはまた、マーカー セットがおおよその連鎖平衡にあることを前提としています。 * に
デフォルト、 --ヘット Nei の期待値の n/(n-1) 乗数を省略
同型接合式。
「小さなサンプル」修飾子により、
含め、強制しながら --ヘット 創設者から帰属された MAF を即座に使用する
データセット。
--チェックセックス {女性の最大 F} {男性の最小 F}
--チェックセックス ycount {女性の最大 F} {男性の最小 F} {女性の最大 Y obs}
{男性の最小 Y 観測値}
--チェックセックス y のみ {女性の最大 Y 観測値} {男性の最小 Y 観測値}
--imput-sex {女性の最大 F} {男性の最小 F}
--imput-sex ycount {女性の最大 F} {男性の最小 F} {女性の最大 Y obs}
{男性の最小 Y 観測値}
--imput-sex y のみ {女性の最大 Y 観測値} {男性の最小 Y 観測値}
--チェックセックス 通常、入力データセットの性別の割り当てを
X染色体近交係数から帰属されるもの。 * X であることを確認してください
染色体偽常染色体領域が分割されている
オフ(例 --split-x) これを使用する前に。
* 適切な MAF 推定値も必要です (そのため、サンプル数が非常に少ないため、
即時ファイルセット、使用 -- 読み取り頻度)、マーカーセットはおおよそのものでなければなりません
連鎖平衡。
* デフォルトでは、F 推定値が 0.2 未満の場合、雌コールが発生し、値が得られます。
0.8 よりも大きい場合、男性のコールが得られます。
数値パラメータを渡す場合
--チェックセックス、最初の XNUMX つはこれらのしきい値を制御します。
Y 染色体データを考慮する XNUMX つのモードが追加されました。 * 「ycount」モードでは、
性別は依然として X 染色体から推定されますが、
女性の呼び出しは、非欠損 Y が 0 を超えるたびにあいまいに格下げされます
遺伝子型が存在し、存在する遺伝子型が 0 未満の場合、男性の呼び出しは格下げされます。
(これらはレートではなくカウントであることに注意してください。) これらのしきい値は、
--チェックセックス ycount のオプションの 3 番目と 4 番目の数値パラメーター。
* 「y のみ」モードでは、性別は、欠損していない Y 遺伝子型カウントから推定されます。
この場合、男性の最小しきい値はデフォルトでゼロではなく 1 に設定されます。
--imput-sex 性別の割り当てを帰属値に変更し、
それ以外は同じ --チェックセックス.
とともに使用する必要があります
- ベッドを整えます/--recode/--write-covar。
--fst
(エイリアス: --ファースト) を使用して、各常染色体二倍体バリアントのライトの Fst を推定します。
Weir BS、Cockerham CC (1984) で導入された方法
によって定義された一連の部分母集団が与えられた場合の母集団構造の分析
- 内部. 生および重み付けされたグローバル平均も報告されます。 ※興味のある方は
グローバルな手段では、通常、実行するのが最善です
この計算は、おおよその連鎖平衡に設定されたマーカーで行われます。
* 部分母集団が XNUMX つしかない場合は、次のように表すことができます
ケース/コントロールのステータスを変更し、'case-control' 修飾子を使用します。
--indep 【ウィンドウサイズ】 [ステップ サイズ (バリアント ct)] [VIF しきい値]
--indep-ペアワイズ 【ウィンドウサイズ】 [ステップ サイズ (バリアント ct)] [r^2 しきい値]
--indep-ペアフェーズ 【ウィンドウサイズ】 [ステップ サイズ (バリアント ct)] [r^2 しきい値]
おおよその連鎖平衡でマーカーのリストを生成します。
'kb' 修飾子、ウィンドウ サイズはバリアント カウント単位ではなくキロベースです。
(「kb」の前のスペースはオプションです。つまり、「--indep-pairwise 500 kb 5 0.5」および
「--indep-pairwise 500kb 5 0.5」も同じ効果があります。) 再実行する必要があることに注意してください。
PLINK を使用して - エキス or -除外する .prune.in/.prune.out ファイルに適用して
別の計算にリストします。
--r
--r2
LD 統計レポート。
--r 生のバリアント間相関が得られますが、
--r2 彼らの正方形を報告します。
すべてのペアの結果をリクエストできます
行列形式 ('bin' または形状修飾子の XNUMX つを指定した場合)、すべてのペア
テーブル形式 ('inter-chr')、またはテーブル形式の制限されたウィンドウ (デフォルト)。 *
「gz」修飾子により、出力テキスト ファイルが gzip されます。 * 'bin' は出力を引き起こします
倍精度バイナリで書き込まれる行列
'bin4' は単精度バイナリを指定します。
マトリックスは
形状が明示的に指定されていない場合は正方形。
* デフォルトでは、テキスト マトリックスはタブ区切りです。 「スペース」はこれを切り替えます。 *
'in-phase' は、同相対立遺伝子ペアを含む列を表形式に追加します
レポート。
(これは、非常に長い対立遺伝子コードでは使用できません。)
* 'dprime' は、表形式のレポートに Lewontin の D-prime 統計を追加します。
r/r^2 と D-prime の両方が最尤解に基づくように強制します。
Gaunt T、Rodriguez S、Day I (2007) で説明されている XNUMX 次方程式
ペアワイズ ハプロタイプ頻度の推定のためのソリューション。
* 「with-freqs」は、表形式のレポートに MAF 列を追加します。 * 結果として
ファイルは簡単に巨大になる可能性があるため、追加する必要があります
フィルタリングされていない、分散されていないすべてのペアを要求するときの「yes-really」修飾子
400k 以上のバリアントの計算。
* これらの計算は、次のように細分化できます。 - 平行 (たとえ
'square' 修飾子がアクティブです)。
--ld [バリアント ID] [バリアント ID]
これは、バリアントの 2 つのペアのハプロタイプ頻度、r^XNUMX、および D' を表示します。
ハプロタイプ頻度の生物学的に可能な解が複数ある場合
XNUMX 次方程式、すべてが表示されます (最尤解だけではなく
によって識別される --r/--r2)、HWE の正確なテスト統計とともに。
--show-tags [ファイル名]
--show-tags を
* ファイルが指定されている場合、少なくとも XNUMX つのバリアントにタグを付けるすべてのバリアントを一覧表示します
ファイルに名前が付けられています。
(これは通常、オリジナルのスーパーセットになります。
バリアントはここで自分自身にタグを付けると見なされるためです。)
* 'all' モードが指定されている場合、バリアントごとに、*other* バリアントごとに
タグが報告されています。
-ブロック
ハプロビューによるブロック定義の解釈によるハプロタイプ ブロックの推定
Gabriel Sらによって提案されました。 (2002) ヒトにおけるハプロタイプブロックの構造
ゲノム。 * 通常、表現型が欠落しているサンプルは、これでは考慮されません
計算; 「no-pheno-req」修飾子はこの制限を解除します。
* 通常、サイズ 2 のブロックは 20kb を超えることはなく、サイズ 3 のブロックは
30kbに制限されています。
「no-small-max-span」修飾子はこれらを削除します
限界
.blocks ファイルは、PLINK 1.07 の有効な入力です。 --ハプ
しかしながら、
--ハプ... フラグのファミリは、PLINK 1.9 で再実装されていません。
他のソフトウェアと比較した位相精度。 今のところ、BEAGLE の使用をお勧めします
ケース/コントロール ハプロタイプ関連解析用の PLINK の代わりに。 (使用できます
データを BEAGLE 3.3 にエクスポートするには、'--recode beeagle' を使用します)。
のバリアントを開発する予定です。 --ハプ... 処理するフラグ
効果的に事前段階化されたデータ。
- 距離 <0-ibs>
(重み付けされた) ゲノム距離の下三角タブ区切りの表を
{output prefix}.dist への allele count units と、対応するサンプルのリスト
{出力プレフィックス}.dist.id への ID。 .dist ファイルの最初の行には、単一の
{genome 1-genome 2} の距離、1 行目には {genome 3-genome XNUMX} があり、
{genome 2-genome 3} の順で距離など * 通常は実行するのが最適です。
に設定されたマーカーでのこの計算
おおよその連鎖平衡。
* 'square' または 'square0' 修飾子が存在する場合、正方行列は
代わりに書かれています。 'square0' は、右上の三角形をゼロで埋めます。
* 'gz' 修飾子が存在する場合、圧縮された .dist.gz ファイルが書き込まれます
プレーンテキストファイルの代わりに。
* 'bin' 修飾子が存在する場合、バイナリ (正方) 行列
代わりに、R からのロードに適した倍精度浮動小数点値が使用されます。
{出力プレフィックス}.dist.bin に書き込まれます。 (「bin4」は単精度数を指定します
代わりに) 右上が必要な場合は、これを「square0」と組み合わせることができます。
ゼロにするか、右上をまったく埋めたくない場合は「三角形」にします。
* 'ibs' 修飾子が存在する場合、ID ごとの状態行列が書き込まれます
{出力プレフィックス}.mibs に。
「1-ibs」は、ゲノムとして表される距離を引き起こします
{output prefix}.mdist に書き込まれる比率 (つまり、1 - IBS)。 と組み合わせる
通常の .dist ファイルも生成したい場合は「allele-ct」。
* デフォルトでは、欠落しているジェノタイプ コールが存在する場合の距離の再スケーリング
対立遺伝子数の分布に敏感です: バリアント A が寄与する場合、平均して、
バリアント B の XNUMX 倍の他のペアワイズ距離、バリアント A でのミッシング コール
欠落補正が XNUMX 倍になります。 これをオフにするには
(たとえば、欠落している呼び出しは非常に非ランダムであるため)、「フラット欠落」を使用します
修飾子。
* 計算は次のように分割できます - 平行.
-- 距離行列
--ibs-マトリックス
これらの廃止されたコマンドは、「--distance 1-ibs flat-missing square」と同等です
および '--distance ibs flat-missing square' をそれぞれ生成します。
タブ区切りのテキストマトリックスの代わりにスペース。
--make-rel
下三角分散標準化実現関係行列を
{出力プレフィックス}.rel、および対応する ID を {出力プレフィックス}.rel.id. * です
通常、この計算は、
おおよその連鎖平衡。
* 'square'、'square0'、'triangle'、'gz'、'bin'、および 'bin4' は、それらと同じように機能します
on - 距離.
* 'cov' 修飾子は分散標準化ステップを削除し、
代わりに共分散行列が計算されます。
* デフォルトでは、関係マトリックスの対角要素は以下に基づいています
--ibcの Fhat1; 'ibc2' または 'ibc3' 修飾子を使用して、それらを Fhat2 に基づいて作成します。
または代わりにFhat3。
* 計算は次のように分割できます - 平行.
--make-grm-gz
--make-grm-bin
--make-grm-gz 関係を GCTA の元の gzip 圧縮リストに書き込みます
XNUMX 行に XNUMX つのペアを記述する形式。 --make-grm-bin それらをGCTAで書き込みます
1.1+ の単精度三角バイナリ形式。 これらの形式に注意してください
有効な観測値の数を明示的に報告します (どちらのサンプルにも
これは、一部のスクリプトにとって便利な入力です。 これらは
計算は次のように分割できます - 平行.
--rel-カットオフ {値}
(エイリアス: --grm-カットオフ) 関連性のあるサンプルの各ペアの XNUMX つのメンバーを除外する
指定されたカットオフ値 (デフォルト 0.025) より大きい。 後で操作しない場合
残りのサンプルのリストがディスクに書き込まれます。これにより、次の場所に保存されます。
{出力プレフィックス}.rel.id. 残りのサンプル サイズを最大化すると、
NP 困難な最大独立集合問題と同等であるため、貪欲な
最適性を保証する代わりにアルゴリズム。 (使用 --make-rel と
- 保つ/-- 改善したい場合は、フラグを削除してください。)
--ibs-テスト {順列数}
--groupdist {イター} {d}
ケース/コントロールの表現型データが与えられると、これらのコマンドは、
距離行列: 影響を受けるサンプルのペア、影響を受けるサンプルと影響を受けないペア、および影響を受けるサンプルのペア
影響を受けていないサンプル。 これらの各サブセットには、ペアワイズ ゲノムの分布があります。
距離; --ibs-テスト 順列を使用して p 値を推定します re: どのタイプの
ペアは最も似ていますが、 --groupdist 間の違いに焦点を当てています。
これらの分布の中心と、delete-d による標準誤差の推定
ジャックナイフ。
--回帰距離 {イター} {d}
ペアワイズ平均表現型に対するペアワイズゲノム距離の線形回帰および
逆に、標準エラーには delete-d jackknife を使用します。 スカラー表現型は
必要。 ※パラメータが0.6つ未満の場合、dは{人数}^XNUMXとなります
丸みを帯びました
ダウン。
パラメータなしで、100k 反復が実行されます。
--regress-rel {イター} {d}
ペアワイズ平均表現型でのペアワイズゲノム関係の線形回帰、
およびその逆。 iters と d のデフォルトは、 --回帰距離.
- ゲノム
身元別レポートを生成します。 * 通常はこれを実行するのが最善です
に設定されたマーカーの計算
おおよその連鎖平衡。
* 「rel-check」修飾子は、異なる FID を持つサンプルのペアを除外します
最終報告より。
* 'full' は生のペアワイズ比較データをレポートに追加します。 * P(IBD=0/1/2)
このコマンドで使用される推定器は、時々
範囲外の数値 [0,1]; デフォルトでは、これらはクリップされます。
この
'unbounded' 修飾子は、このクリッピングをオフにします。
* 次に、PI_HAT^2 < P(IBD=2) の場合、'nudge' は最終的な P(IBD=0/1/2) を調整します
理論的に可能な構成に見積もります。
* 計算は次のように分割できます - 平行.
--ホモジグ
--ホモジグ-snp [最小変数カウント]
--ホモジグ-kb [最小の長さ]
-- ホモジグ密度 [最大逆密度 (kb/var)]
--ホモジグギャップ [最大内部ギャップ kb 長]
--ホモジグヘット [最大ヘッツ]
--homozyg-window-snp 【スキャンウィンドウサイズ】
--homozyg-window-het [スキャン ウィンドウ ヒットの最大 hets]
--homozyg-window-missing [スキャン ウィンドウ ヒットでの最大不在着信数]
--homozyg-window-threshold [最小スキャン ウィンドウ ヒット率]
これらのコマンドは一連の一連のホモ接合性レポートを要求し、次のことを可能にします。
生成方法をカスタマイズします。 * すべてのデフォルトに満足している場合
以下に説明する設定、ちょうど
つかいます --ホモジグ 修飾子なし。
さもないと、 --ホモジグ を変更できます
いくつかのバイナリ設定: * 'group{-verbose}' は、重複する実行のプールに関するレポートを追加します
of
ホモ接合性。
(自動設定時 --ホモジグマッチ あります。)
* 'group{-verbose}' を使用すると、'consensus-match' によりペアワイズ セグメントが発生します
むしろ、プールのコンセンサス セグメントのバリアントに基づいて呼び出される一致
ペアワイズ交差のバリアントより。
* スキャン ウィンドウ アルゴリズムの仕組みにより、
は、ROHがいくつかのホモ接合変異体に隣接していると報告しました。
「延長」
修飾子は、それが原因ではない場合、報告された ROH にそれらを含めます。
の違反 -- ホモジグ密度 バウンド。
* デフォルトでは、セグメント bp の長さは [終了 bp 位置] として計算されます -
[開始 bp 位置] + 1。
したがって、レポートは通常、わずかに異なります
最後に1.07を追加しないPLINK 1から。
検査用の
'subtract-1-from-lengths' 修飾子を使用して、古い
式。
* デフォルトでは、少なくとも 100 のバリアントを含むホモ接合性の実行のみ、
および全長 >= 1000 キロベースであることが注記されています。
これらを変更できます
最小値 --ホモジグ-snp と --ホモジグ-kbそれぞれ。
* デフォルトでは、ROH には平均で 50 kb あたり少なくとも XNUMX つのバリアントが必要です。
この境界を次のように変更します -- ホモジグ密度.
* デフォルトでは、1000 つの連続したバリアントが XNUMX kb 以上離れている場合、それらは
同じ ROH に入れることはできません。 この境界を次のように変更します --ホモジグギャップ.
* デフォルトでは、ROH には無制限の数のヘテロ接合呼び出しを含めることができます。
で制限を課すことができます --ホモジグヘット.
* デフォルトでは、スキャン ウィンドウには 50 のバリアントが含まれています。 これを変更します
--homozyg-window-snp.
* デフォルトでは、スキャン ウィンドウ ヒットには最大で 1 つのヘテロ接合体を含めることができます。
通話と 5 回の不在着信。 これらの制限を変更します --homozyg-window-het と
--homozyg-window-missingそれぞれ。
* デフォルトでは、バリアントが ROH に含まれる資格がある場合、ヒット
バリアントを含むすべてのスキャン ウィンドウのレートは、少なくとも 0.05 である必要があります。 変化する
このしきい値と --homozyg-window-threshold.
- 集まる
ペアワイズ類似度統計 (通常は IBS) を使用してサンプルをクラスター化します。 *「cc」
修飾子は、すべてのクラスターに少なくとも XNUMX つのケースと XNUMX つを強制します
コントロール。
* 'group-avg' 修飾子により、クラスターは平均に基づいて結合されます
最小ペアワイズ類似度の代わりに。
* 'missing' 修飾子により、クラスタリングは以下に基づくようになります
状態による識別の代わりに欠落による識別を行い、スペースで区切られた
ディスクへの同一性による欠落行列。
* 'only2' 修飾子により、.cluster2 ファイルのみが生成されます (これは有効な入力です)。
for - 内部) 書く; それ以外の場合は、他に 2 つのファイルが生成されます。
※デフォルトでは、PLINK 1.07 と同様に IBS のタイは切れませんので、
最終的なクラスター ソリューションは異なる傾向があります。
これは一般に無害です。
ただし、テストを簡素化するために、「old-tiebreaks」修飾子を使用して強制することができます
古いアルゴリズムのエミュレーション。
--pca {カウント}
分散標準化関係行列を計算します (使用
--make-rel/--make-grm-gz/--make-grm-bin でダンプします)、トップ 20 を抽出します
主成分。 * 通常、この計算はマーカーで実行するのが最適です
に設定
おおよその連鎖平衡。
※数値パラメータを渡すことでPC台数を変更できます。 *「ヘッダー」
修飾子は、ヘッダー行を .eigenvec 出力ファイルに追加します。
(同名の GCTA フラグとの互換性のため、デフォルトはヘッダーなしです。
ライン。)
* 'tabs' 修飾子により、.eigenvec ファイルがタブ区切りになります。 *
「var-wts」修飾子は、PC を含む追加の .eigenvec.var ファイルを要求します
サンプルの重みではなくバリアントの重みとして表されます。
- 近所の人 [n1] [n2]
(エイリアス: - 近所の人) 各サンプルからその n1 番目までの IBS 距離を報告する
n2 番目に近い近傍、関連する Z スコア、およびそれらの近傍の ID。
外れ値の検出に役立ちます。
--asoc
--asoc
- モデル
基本的な関連分析レポート。 ケース/コントロールの表現型を考えると、 --asoc
1df カイ XNUMX 乗対立遺伝子検定を実行しますが、 - モデル として、他の 4 つのテストを実行します。
よく(1df優性遺伝子作用、1df劣性遺伝子作用、2df遺伝子型、
Cochran-Armitage 傾向)。 * 'fisher'/'fisher-midp' では、Fisher の正確検定は
生成するために使用
p値。
'fisher-midp' は、ランカスターの mid-p 調整も適用します。
* 'perm' により、適応置換テストが実行されます。 * 'perm=[値]'
指定された max(T) 順列テストを引き起こします
実行される複製の数。
* 'perm-count' により、順列テスト レポートに代わりにカウントが含まれるようになります
周波数の。
*「数」の原因 --asoc 頻度の代わりに対立遺伝子数を報告します。 *
「set-test」は、バリアント セットの有意性をテストします。 順列が必要です。
でカスタマイズできます --set-p/--set-r2/--set-max.
* 'dom'、'rec'、'gen'、および 'trend' は、対応するテストの使用を強制します
の基礎として - モデル 順列。
(デフォルトでは、最も重要な
対立遺伝子、優性、および劣性テストの結果が使用されます。)
* 'trend-only' は、トレンド テストのみを実行します。 定量的な
表現型、 --asoc 通常、Wald 検定を実行します。 * この場合、「qt-means」
修飾子は特性手段と標準を引き起こします
遺伝子型によって階層化された偏差も報告されます。
* 'lin' は、Lin 統計が計算されるようにし、それを
複数テストの修正と順列テスト。
他のいくつかのフラグ (最も注目すべきは、 --apem) を使用して、
順列テスト。
--うーん
(エイリアス: --cmh)
--bd
--mh2
--ホモグ
ケース/コントロールの表現型とクラスターのセットが与えられた場合、 --うーん 2x2xK を計算します
各バリアントの Cochran-Mantel-Haenszel 統計、 --bd も実行します
オッズ比の均一性に関する Breslow-Day 検定。 順列とバリアント セットのテスト
CMH (デフォルト) または Breslow-Day ('perm-bd' が存在する場合) 統計に基づいています。
サポートされています。 以下の同様の分析も利用できます: * --mh2 スワップ
ケース/コントロールのステータスとクラスターメンバーシップの役割、
関連付けに関する表現型層別 IxJxK Cochran-Mantel-Haenszel 検定の実行
クラスター割り当てと遺伝子型の間。
* --ホモグ に基づいて、Breslow-Day テストの代替を実行します。
カイ二乗統計量の分割。
--gxe {共変量指数}
定量的表現型とケース/コントロール共変量の両方がロードされた場合
--コバール XNUMX つのグループを定義し、 --gxe から導出された回帰係数を比較します。
から導出された回帰係数に XNUMX つのグループのメンバーのみを考慮する
他のメンバーのみを考慮します。 デフォルトでは、
--コバール ファイルはグループを定義します。 '--gxe 3' などを使用して、XNUMX 番目のベースにします。
代わりに共変量。
- 線形
--ロジスティック
定量的 (- 線形) またはケース/コントロール
(--ロジスティック) 表現型。 通常は一緒に使用 --コバール. ※「パーマ」は通常、
実行される適応順列テスト
'mperm=[value]' は max(T) 順列テストを開始します。
* 'perm-count' により、順列テスト レポートに代わりにカウントが含まれるようになります
周波数の。
* 'set-test' はバリアント セットの有意性をテストします。
順列が必要です。
でカスタマイズできます --set-p/--set-r2/--set-max.
* 「遺伝子型」修飾子は相加効果/優性偏差 2df を追加します
ジョイント テスト (0/1/2 および 0/1/0 コーディング)、'hethom' は 0/0/1 および 0/1/0 コーディングを使用
代わりは。 順列も要求されている場合、これらの修飾子により順列が
ジョイントテストに基づいています。
* 「優性」および「劣性」は、完全優性または劣性を想定したモデルを指定します。
それぞれ、A1対立遺伝子の劣性。
* 「no-snp」は、表現型と
ゲノムデータを参照せずに共変量。
順列も
要求すると、すべての共変量について結果が報告されます。
* 'hide-covar' は、レポートから共変量固有の行を削除します。 ※デフォルトでは性別
(男性 = 1、女性 = 0) として自動的に追加されます。
X染色体バリアントで共変量し、他のどこにもありません。
「性別」修飾子
「no-x-sex」はそれを除外しますが、どこにでも追加されます。
* 'interaction' は、遺伝子型 x 共変量の相互作用をモデルに追加します。
この
通常の置換テストでは使用できません。 使用する --テスト 定義する
代わりに順列検定統計量。
* 'intercept' を指定すると、メイン レポートにインターセプトが含まれます。 ※物流用
回帰、「ベータ」修飾子は回帰を引き起こします
オッズ比の代わりに係数が報告されます。
*と - 線形、「標準ベータ」修飾子は表現型を標準化します
回帰前にすべての予測子を平均と単位分散をゼロにします。
--投与量 【アレル投与量ファイル】
--投与量 [リストファイル] リスト
--書き込み量
バリアント メジャー アレル投与量データを含むテキスト ファイルを処理します (おそらく gzip 圧縮されます)。 これ
通常の入力ファイルセットでは使用できません。 代わりに、*のみ*指定する必要があります
.fam および場合によっては .map ファイルであり、他のコマンドを指定することはできません。 * PLINK
2.0 では、遺伝子型の確率が最高レベルでサポートされます。 アン
同等のデータ インポート フラグが提供されます。 --投与量 引退します。
* デフォルトでは、 --投与量 対立遺伝子投与量ファイルは XNUMX つだけであると仮定します。
ロードされました。
複数のファイルを指定するには、
1. XNUMX 行に XNUMX つのエントリを含むマスター リストを作成します。
通常はXNUMXつあります
このリストでサポートされている形式: XNUMX 行あたりのファイル名、またはバリアント バッチ番号
最初の列にファイル名、XNUMX 番目の列にファイル名。
2. そのリストの名前を最初に入力します --投与量 パラメータ。 3.追加
「リスト」修飾子。
* デフォルトでは、 --投与量 アレル投与量ファイルにヘッダーが含まれていると仮定します
i+1 列に「SNP」、i+j+1 列に「A2」、i+j+2 列に「A3」、
列 i+j+k+4 から始まるサンプル FID/IID。 (i/j/k は通常ゼロですが、
それぞれ 'skip0'、'skip1'、および 'skip2' で変更できます)。
* すべてのサンプルが、
.fam ファイル、
「noheader」修飾子を使用できます。
* それ以外の場合は、'sepheader' 修飾子を使用し、サンプル ID ファイル名を追加します
あなたの「リスト」ファイルのエントリに。
* 'format' 修飾子を使用すると、使用する値の数を指定できます
それぞれの投与量を表します。
「format=1」は通常、単一の 0..2 A1 を示します
期待されるカウント; 「dose1」は、これを 0..1 の頻度に変更します。
「フォーマット=2」
(デフォルト) 0..1 ホモ接合 A1 尤度とそれに続く 0..1 het を示します
一方、「format=3」は 0..1 hom A1、0..1 het、0..1 hom A2 を示します。
* 'Zout' により、出力ファイルが gzip されます。 ※通常はアソシエーション分析
は発表された。 「標準ベータ」および
「セックス」は、彼らが想定されているように振る舞う - 線形/--ロジスティック。
「case-control-freqs」により、ケースおよびコントロールの対立遺伝子頻度が報告されます
別々に。
* アソシエーション分析を引き起こす XNUMX つの代替モードがあります。
スキップされます。 * 'occur' は、単純なバリアント発生レポートを要求します。 *
--書き込み量 「フォーマット」に一致する単純なマージされたファイルを引き起こします
仕様 (「dose1」を含まない) が生成されます。
* - スコア 投与量に線形スコアリングシステムを適用します。
--なげなわ [h2推定値] {最小ラムダ}
LASSO 回帰を介してバリアント効果のサイズを推定します。
あなたは提供する必要があります
回帰を調整するための加法的遺伝率推定。 このメソッドに注意してください
効果を得るには、非常に大きなサンプル サイズ (数十万など) が必要になる場合があります。
複雑な多遺伝子形質について。
-- テストがありません
Fisher's
正確なテスト。 「midp」修飾子により、ランカスターの mid-p 調整が適用されます。
--make-perm-pheno [ct]
表現型順列を生成し、それらをディスクに書き込みます。
協会テスト。
--tdt
ケース/コントロールの表現型を考慮して、伝達不均衡テストの統計を報告する
そして血統情報。 * メインの前にメンデル エラー チェックが実行されます。
テスト; 気分を害する
遺伝子型は、この分析では欠落しているものとして扱われます。
* デフォルトでは、基本的な TDT p 値はカイ XNUMX 乗検定に基づいています。
「exact」または「exact-midp」を使用して正確な二項検定を要求します。
* 'perm'/'mperm=[value]' は、ファミリ ベースのアダプティブまたは max(T) を要求します。
順列テスト。
デフォルトでは、順列検定統計量は
基本的な TDT p 値; 「parentdt1」/「parentdt2」は、parenTDT または結合テストを引き起こします
代わりに、それぞれ p 値が考慮されます。
* 'set-test' はバリアント セットの有意性をテストします。
これは使えません
今のところ正確なテストで。
'poo' 修飾子を使用すると、代わりに親元の分析が実行されます。
ヘテロ接合体の父親とヘテロ接合体の母親からの伝達を考慮
別々に。 * 起点の分析は現在、正確な分析をサポートしていません。
テスト。 * デフォルトでは、順列検定統計量は絶対値です
親元テストの Z スコア。 'pat'/'mat' は、父方または母方の TDT を引き起こす
代わりに、それぞれカイ XNUMX 乗統計量が考慮されます。
--qfam
--qfam-親
--qfam-間
--qfam-合計
量的形質の QFAM 家族ベースの関連テスト。 * メンデル エラー チェック
メインテストの前に実行されます。 気分を害する
遺伝子型は、この分析では欠落しているものとして扱われます。
※この手続きには順列が必要です。
「perm」と「perm-count」には
通常の意味。
ただし、「mperm=[値]」は固定数を指定するだけです
順列の; このメソッドは、適切な max(T) テストをサポートしていません。
* 'emp-se' 修飾子は BETA と EMP_SE を追加します (経験的な標準誤差
beta) フィールドを .perm 出力ファイルに追加します。
-注釈を付ける 【PLINKレポート】
バリアント ベースの PLINK レポートに注釈を追加します。
これには、
注釈ソース: * 'attrib=[file]' は、(おそらく gzip された) 属性ファイルを指定します。
* 'ranges=[file]' は、遺伝子/範囲リスト ファイルを指定します。 (両方のソース タイプを
次のオプションもサポートされています。 *
'filter=[file]' は、ファイル内のいずれかの範囲内のバリアントのみを生成します
新しいレポートに含まれます。
* 'snps=[file]' により、ファイル内で名前が付けられたバリアントのみが含まれます
新しいレポート。
* 'NA' 修飾子により、注釈のないバリアントは '.' ではなく 'NA' になります。
新しいレポートの ANNOT 列では、'prune' 修飾子はそれらを除外します
完全に。
* 'block' 修飾子は、単一の ANNOT 列を 0/1 でコード化された列に置き換えます
可能性のある各注釈の列。
*「範囲」を使用すると、
* 'subset=[file]' は、サブセット ファイルで指定された間隔のみを
範囲ファイルからロードされます。
* 間隔の注釈には、通常、括弧で囲まれた符号付きの距離が付属しています
間隔の境界 (バリアントが間隔内にある場合は 0、これは
なしで常に真 - 国境)。 これらは、'minimal' 修飾子で除外できます。
* 'distance' 修飾子は、符号付きを説明する 'DIST' および 'SGN' 列を追加します
最も近い間隔までの距離。
* いつ --pフィルター が存在する場合、高い p 値は除外されます。
--クランプ [PLINK レポート ファイル名...]
「SNP」列と p 値列を使用して関連付け分析レポートを処理し、整理します
LD ベースのクランプによる結果。 複数のファイル名は、スペースまたはスペースで区切ることができます
カンマ。
--遺伝子レポート 【PLINKレポート】 【遺伝子範囲ファイル】
バリアント ベースのレポートから遺伝子ベースのレポートを生成します。 * いつ --pフィルター is
現在、高い p 値は除外されます。 * いつ - エキス (「範囲」なし) は
で名前が付けられたバリアントのみが存在します。
- エキス ファイルが考慮されます。
--メタ分析 [PLINK レポート ファイル名...]
--メタ分析 [PLINK レポート ファイル名...] +
「SNP」および「SE」を使用して、複数のバリアント ベースのレポートに対してメタ分析を実行します
田畑。 * 通常、「OR」オッズ比フィールドも各入力に存在する必要があります
ファイルにソフトウェアを指定する必要があります。
「logscale」、「BETA」対数オッズ値/回帰係数を使用
代わりに期待されますが、生成されたレポートには依然としてオッズ比が含まれます
見積り。 'qt' では、入力値と出力値の両方が回帰ベータです。
* 「CHR」、「BP」、および「A1」フィールドも通常は必須です。
「マップなし」の原因
それらはすべて無視されますが、「no-allele」では「A1」だけが無視されます。
* 「A2」フィールドが存在し、「no-map」も「no-allele」も存在しない場合
指定すると、A1/A2 アレル フリップが適切に処理されます。
そうでなければ、A1
ミスマッチは捨てます。
* 「研究」により、研究固有の効果推定値が照合されます
メタ分析レポート。
* 'report-all' は、単一の入力ファイルにのみ存在するバリアントを
メタ分析レポートに含まれています。
* 'weighted-z' は、重み付けされた Z スコアに基づく p 値を要求します (
Abecasis Lab の METAL ソフトウェア) に加えて、通常の逆分散ベースの
分析。 これには、P および有効サンプル サイズ フィールドが必要です。
* いつ - エキス (「範囲」なし) が存在し、
- エキス ファイルが考慮されます。
* 'no-map' が指定されていない限り、染色体フィルターも考慮されます。
--高速エピスタシス
--エピスタシス
エピスタティックな相互作用をスキャンします。
--高速エピスタシス 3x3 ジョイントを検査します
遺伝子型カウント表であり、ケース/コントロール表現型にのみ適用されますが、
--エピスタシス 線形回帰またはロジスティック回帰を実行します。 * デフォルトでは、 --高速エピスタシス
PLINK 1.07 対立遺伝子ベースのテストを使用します。 二
新しいテストがサポートされるようになりました: 'boost' は、導入された尤度比テストを呼び出します
Wan Xらによって。 (2010) BOOST: 遺伝子間相互作用を検出する高速アプローチ
ゲノムワイドな症例対照研究では、「関節効果」は関節を適用します
Ueki M, Cordell HJ (2012) で導入された効果テスト
ゲノムワイド相互作用解析。
* オリジナル --高速エピスタシス テストは通常、分散を適用し、
Ueki と Cordell の論文によって提案された空のセルの修正。
無効にする
それらには、'no-ueki' 修飾子を使用します。
* 'case-only' は、ケース/コントロール テストの代わりにケースのみを要求します。 * デフォルトでは、
ゲノム全体のバリアントのすべてのペアがテストされます。
XNUMX つのセット内のバリアントのペアをテストするには、'set-by-set' 修飾子を追加します
で正確にXNUMXつのセットをロードします - 設定/--メイクセット; ちょうど XNUMX つのセットがロードされた状態で、すべて
一方のセットのバリアントは、他方のすべてのバリアントに対してテストされます。 「すべてで設定」
代わりに、ゲノム全体に対して XNUMX つのセット内のすべてのバリアントをテストします。
* 'nop' は、メイン レポートから p 値を削除します。 * これらの計算は
で細分化 - 平行; でも...
--epistasis-summary-merge [共通ファイルプレフィックス] [ct]
時 --{fast-}エピスタシスの仕事は細分化されています - 平行、メイン レポートは
最後に通常の方法で Unix 'cat' を適用して組み立てますが、
.summary.1、.summary.2、... ファイルには特殊なマージが必要な場合があります。
--epistasis-summary-merge 後者を担当します。
--twolocus [バリアント ID] [バリアント ID]
XNUMX 遺伝子座関節遺伝子型カウント レポート。
- スコア [ファイル名] {i} {j} {k}
各サンプルに線形スコアリング システムを適用します。 入力ファイルは XNUMX 行である必要があります
得点されたバリアントごと。 バリアント ID は列 #i から読み取られ、アレル コードは読み取られます
列 #j から、スコアは列 #k から読み取られます。ここで、i はデフォルトで 1、j です。
のデフォルトは i+1、k のデフォルトは j+1 です。 * 'header' 修飾子により、最初の
入力ファイルの空でない行
無視されます。 それ以外は、 - スコア ヘッダー行がないことを前提としています。
* デフォルトでは、最終スコアは有効なバリアントごとのスコアの平均です。
'sum' 修飾子により、代わりに合計が報告されます。
(これはありえない
「平均代入なし」で使用されます。
下位互換性のために、「合計」は
'no-sum' が指定されていない限り、投与量データで自動的にオンになります。)
* デフォルトでは、名前のない対立遺伝子のコピーはスコアに寄与しませんが、
欠落している遺伝子型は、ロードされた量に比例する量に貢献します(経由 -- 読み取り頻度)
または帰属対立遺伝子頻度。 代わりに欠落している観測を破棄するには (減少
これが発生した場合の最終平均の分母)、
「無平均代入」修飾子。
* または、'center' 修飾子を使用して、すべてのスコアを
ゼロを意味します。
※このコマンドは投与量データで使用できます。
デフォルトでは、「CNT」列
この場合、出力ファイルから省略されます。 それを保持するには「include-cnt」を使用してください。 また、
スコアは、0..1 二倍体対立遺伝子カウントではなく、0..2 投与量で乗算されることに注意してください。
「二重投与量」修飾子が存在しない限り。
--write-var-ranges [ブロックct]
バリアントのセットを同じサイズのブロックに分割します。
(一緒に使えます
--snps ジョブを複数のマシンに分割します。)
次の他のフラグがサポートされています。 (操作の順序は、
https://www.cog-genomics.org/plink2/order .)
- 脚本 [fname] : ファイルからコマンド ライン オプションを含めます。
-再実行 {ログ}
: ログ (デフォルト 'plink.log') でコマンドを再実行します。
- バージョン
: 終了する前にバージョン番号のみを表示します。
- 静けさ
: コンソールへの出力を抑制します。
--gplink
: gPLINK との相互運用のために予約されています。
-- 行方不明の遺伝子型 [char] : 欠落している遺伝子型コードを設定します (通常は '0')。
--ダブル ID
: FID と IID の両方を VCF/BCF サンプル ID に設定します。
--const-fid {ID}
: すべての FID を指定された定数 (デフォルトは '0') に設定します。
--id-delim {d}
: サンプル ID を [FID][d][IID] として解析します (デフォルトの区切り記号 '_')。
--vcf-idspace-to [c] : サンプル ID のスペースを指定された文字に変換します。
--両アレルのみ : 2+ alt で VCF バリアントをスキップします。 対立遺伝子。
--vcf-min-qual [値]
: QUAL が少ない/不足している VCF バリアントをスキップします。
--vcf-フィルター {例外...}
: FILTER エラーのあるバリアントをスキップします。
--vcf-require-gt
: GT フィールドのないバリアントをスキップします。
--vcf-min-gq [値]
: GQ が指定されたしきい値を下回った場合、遺伝子型をノーコールします。
--vcf-min-gp [値]
: 0 ~ 1 のスケーリングされた GP が所定のしきい値を下回っている場合、遺伝子型を呼び出しません。
--vcf-ハーフコール [m]
: '0/.' の指定方法同様の VCF GT 値を処理する必要があります。 以下
XNUMX つのモードがサポートされています: * 'error'/'e' (デフォルト) エラーが発生し、行番号が報告されます。
* 'haploid'/'h' は、これらをハプロイド コールとして扱います。 * 'missing'/'m' はそれらを次のように扱います
不足しています。
--oxford-single-chr [chr nm] : 単一染色体の .gen ファイルを指定
無視できる最初の列。
--オックスフォード表現名 [col nm] : .sample ファイルから指定された表現型をインポートします。
--ハードコールしきい値 [値]
: Oxford 形式のファイルセットがロードされると、
--ハードコールしきい値 ランダム
不確実性レベルが 0.1 を超えるものは、通常、欠落として扱われます。 あなたはできる
数値パラメーターを指定してこのしきい値を調整するか、すべての呼び出しをランダム化します
'ランダム'。
-- 行方不明のコード {string list} : 不足している表現型のカンマ区切りのリスト
(エイリアス: --missing_code)
オックスフォード形式のファイルセットの値 (デフォルト 'NA')。
--simulate-ncases [数]
: セットする -シミュレート ケース数 (デフォルト 1000)。
--simulate-ncontrols [n]
: セットする -シミュレート 制御カウント (デフォルトは 1000)。
--simulate-有病率 [p] : セット -シミュレート 病気の有病率 (デフォルト 0.01)。
--simulate-n [数]
: セットする --simulate-qt サンプル数 (デフォルトは 1000)。
--simulate-label [プレフィックス] : 設定 -シミュレート{-qt} FID/IID 名のプレフィックス。
--simulate-missing [頻度] : 設定 -シミュレート{-qt} 欠落遺伝子型頻度。
--allow-extra-chr
: 認識されていない染色体コードを許可します。 「0」
(エイリアス: --aec)
修飾子は、それらがゼロに設定されているかのように扱われます。
--chr-set 【常染色体ct】 :
非ヒト染色体セットを指定します。
最初のパラメーターは、
陽性の場合は二倍体常染色体対、陰性の場合は一倍体染色体。 与えられた
二倍体常染色体、残りの修飾子は名前のないことを示します
非常染色体。
- 牛/--dog/--horse/--mouse/--rice/--sheep : これらの種のショートカット。
--常染色体数 [値]
: 「--chr-set [値] no-y no-xy no-mt」のエイリアス。
--cm-マップ [fname pattern] {chr} : SHAPEIT形式の組換えマップを使用して設定
センチモーガンの位置。 複数の染色体を処理するには、「@」を
クロムの最初のパラメータ。 番号が属する、例えば
'generic_map_chr@_combined_b37.txt'.
--zero-cms
: センチモーガンの位置をゼロにします。
--フェノ [名前]
: の値を使用する代わりに、指定されたファイルから表現型データを読み込みます。
メイン入力ファイルセット。
--オールフェノ
: 基本的な関連テストでは、すべての表現型をループします。 --フェノ ファイルにソフトウェアを指定する必要があります。
--mpheno [n]
: 列 (n+2) から表現型を読み込みます --フェノ ファイルにソフトウェアを指定する必要があります。
--表現名 [c] : もし --フェノ ファイルにヘッダー行がある場合、column を
名。
--フェノマージ
: メインの入力ファイルセットにサンプルの表現型値が含まれているが、
--フェノ ファイルがそうでない場合、表現型を次のように扱う代わりに元の値を使用します。
不足しています。
-- 行方不明の表現型 [v] : 欠落している表現型の値を設定 (通常は -9).
- 1 : ケース/コントロールの表現型は、0 = コントロール、1 = ケースとしてコード化されることを期待します。
通常の 0 = 行方不明、1 = コントロール、2 = ケース。
--make-フェノ [fn] [val] : 新しいケース/コントロール表現型を定義します。
val パラメーターが「*」の場合、指定されたファイルにリストされているすべてのサンプルがケースであり、
他のすべての人はコントロールです。 (一部のシェルでは、
* を引用符で囲みます。) それ以外の場合、XNUMX 列目のエントリを持つすべてのサンプルが等しい
val パラメーターまではケースであり、ファイルに記載されている他のすべてのサンプルは
コントロール。
--tail-フェノ [Lt] {Hbt} : スカラー表現型をケース/コントロールにダウンコードする
表現型。 表現型値が Hbt より大きいすべてのサンプルがケースであり、すべて
Lt 以下の値を持つコントロールはコントロールです。 Hbt が指定されていない場合、
Ltに等しい; それ以外の場合、中間の表現型の値は欠落に設定されます。
--コバール [ファイル名] : 共変量ファイルを指定します。
--covar-name [...]
: で共変量を指定します --コバール ファイル名で。 複数の名前を
スペースまたはカンマを使用し、ダッシュを使用して範囲を指定します。
--covar-番号 [...]
: で共変量を指定します --コバール インデックスによるファイル。
--no-const-covar
: 一定の共変量を除外します。
- 内部 [へ]
: 初期クラスター割り当てを指定します。
--分以内 [n]
: 列 n+2 からクラスター割り当てを読み込みます。
- 家族
: ファミリ ID ごとにクラスタを作成します。
--ループ関連 [へ]
: 指定されたケース/コントロール関連付けコマンドを、クラスター内の各クラスターに対して XNUMX 回実行します。
ファイル、クラスター メンバーシップを表現型として使用します。
- 設定 [ファイル名]
: .set ファイルからセットをロードします。
--セット名 [名前...]
: コマンド ラインで指定されたセットのみをロードします。 複数の名前を区切るにはスペースを使用します。
--サブセット [ファイル名]
: 指定されたテキスト ファイルで指定されたセットのみを読み込みます。
--set-collapse-all [セット名] : すべてのセットをマージします。
-- 補完セット
: すべてのセットを反転します。 (名前には「C_」接頭辞が付きます。)
--make-set-complement-all [s] : --set-collapse-all +反転。
--メイクセット [ファイル名]
: 名前付き bp 範囲のリストからセットを定義します。
--make-set-border [kbs]
: ストレッチ領域 --メイクセット ファイルにソフトウェアを指定する必要があります。
--make-set-collapse-group
: 内のセットではなく、グループからセットを定義します --メイクセット ファイルにソフトウェアを指定する必要があります。
- 保つ [ファイル名]
: ファイルで指定されていないすべてのサンプルを除外します。
- 削除する [ファイル名]
: ファイルで指定されたすべてのサンプルを除外します。
--キープファム [filename] : ファイルで指定されていないすべてのファミリを除外します。
--削除ファム [名前]
: ファイルで指定されているすべてのファミリを除外します。
- エキス [f] : ファイルで指定されていないすべてのバリアントを除外します。
-除外する [f] : ファイルで指定されたすべてのバリアントを除外します。
--keep-クラスター [ファイル名]
: これらは、個別に使用することも、組み合わせて使用することもできます。
--keep-クラスター名 [名前...]
保持するクラスターのリストを定義する組み合わせ。 クラスター内にないすべてのサンプル
そのリストは除外されます。 スペースを使用してクラスタ名を区切ります
--keep-クラスター名.
--クラスタの削除 [ファイル名]
: ファイルで指定されたすべてのクラスターを除外します。
--remove-cluster-names [name(s)...] : 名前付きクラスターを除外します。
- 遺伝子 [sets...] : コマンド ラインで指定されたセットにないバリアントを除外します。
(複数のセット名はスペースで区切ります。)
--gene-all
: どのセットにも属さないバリアントを除外します。 (PLINK 1.07 は自動的に
これは状況によっては可能です。)
-属性 [f] {att lst} : バリアントに属性を割り当てるファイルと、
--attrib-indiv [f] {a}
属性名のコンマ区切りリスト (空白なし)、削除
ファイルから欠落しているか、いずれも持っていないバリアント/サンプル
リストされた属性。 リスト内の一部の属性名の前に「-」が付いている場合、それらは
代わりに「否定的な一致条件」として扱われます: 少なくとも XNUMX つのバリアント
否定一致属性は削除されます。 リストの最初の文字を
'-'、コマンドライン解析の仕組みによる。 回避するために前にコンマを追加します
--chr [chrs...]
: 指定された染色体上にないすべてのバリアントを除外します。 人間にとって有効な選択肢
0 (未配置)、1 ~ 22、X、Y、XY、および MT です。 複数の染色体を
スペースおよび/またはカンマを使用し、ダッシュ (隣接するスペースは許可されません) を使用して
範囲、例えば「--chr 1-4, 22, xy」。
--not-chr [...]
:逆 --chr (リストされた染色体上のバリアントを除外します)。
-- 常染色体
: すべての非常染色体バリアントを除外します。
--常染色体-xy
: 染色体コード XY を除くすべての非常染色体バリアントを除外
(X の疑似常染色体領域)。
--snps のみ : 複数文字の対立遺伝子コードを持つバリアントを除外します。
- から [変数 ID]
: ID を使用して、ロードするバリアント範囲を指定します。 使用時
- に [var ID] 一緒に、両方のバリアントが同じ染色体上にある必要があります。
--snp [var ID] : ロードする単一のバリアントを指定します。
--exclude-snp [] : 除外する単一のバリアントを指定します。
- 窓
[kbs] : あり --snp or --exclude-snp、半分以内のすべてのバリアントをロード/除外します
指定されたものの指定された kb 距離。
--from-bp [位置]
: 物理的な位置を使用してバリアント範囲を定義します
--to-bp
[pos] 負荷。 --kb から/--to-kb/--from-mb/--to-mb XNUMX 進数を許可
--kb から [位置]
値。 また、単一の染色体を指定する必要があります (
--to-kb
[位置] 例 --chr) これらのフラグを使用する場合。
--from-mb [位置]
- 墓
[位置]
--snps [変数 ID...]
: ID を使用して、ロードするバリアント範囲を指定するか、
--exclude-snps [...]
除外します。 例: 「--snps rs1111-rs2222、rs3333、rs4444」。
- 薄い [p]
: バリアントをランダムに削除し、それぞれを確率で保持します。 p。
--シンカウント [n] : n 個のバリアントが残るまで、バリアントをランダムに削除します。
--bp-スペース [bps] : バリアントを削除して、各ペアが
所与の bp 距離。 (VCFtoolsに相当 - 薄い.)
--薄い個体 [p]
: サンプルをランダムに取り出し、確率で保持します。 p。
--thin-indiv-count [n]
: n 個のサンプルが残るまでランダムに削除します。
- フィルター [f] [val(s)...] : 3 列目のエントリがないすべてのサンプルを除外します
指定されたスペースで区切られた値の XNUMX つに一致する指定されたファイル。
--mフィルター [n]
: 代わりに (n+2) 列と照合します。
--ジェノ {値}
: 欠落している呼び出し頻度がしきい値を超えるバリアントを除外します (デフォルト
0.1)。 (デフォルトのしきい値は、次の場合にのみ適用されることに注意してください。 --ジェノ 呼び出されます。
パラメータなし; いつ --ジェノ は呼び出されず、バリアントごとの欠落した呼び出しはありません
周波数の上限はまったく適用されません。 その他の包含/除外の既定のしきい値
同じように作業します。)
- マインド {値}
: 欠損呼び出し頻度がしきい値を超えるサンプルを除外します (デフォルト
0.1)。
--oblig-missing [f1] [f2] : 不足しているジェノタイプ コールのブロックを指定します。
--ジェノ/--無視しても構いません。 最初のファイルには、最初にバリアント ID が含まれている必要があります。
XNUMX 番目のファイルには FID が含まれている必要があります。
最初の列、XNUMX 番目の列に IID、XNUMX 番目の列にブロック ID が表示されます。
- プルーン
: 表現型が欠落しているサンプルを削除します。
--maf {頻度}
: マイナー アレル頻度がしきい値よりも低いバリアントを除外します (デフォルト
0.01)。
--マックスマフ [頻度]
: しきい値を超える MAF を持つバリアントを除外します。
- マック [ct]
: マイナー アレル数が
(エイリアス: --min-ac)
与えられたしきい値。
--max-mac [ct]
: マイナー アレル数が を超えるバリアントを除外する
(エイリアス: --max-ac)
指定されたしきい値。
--maf-成功
: 継承 MAF 推定のルール (EIGENSOFT で使用)。 与えられた j 個の観測値
一方の対立遺伝子ともう一方の k >= j 観察、(j+1) / (j+k+2) の MAF を推測します。
デフォルトの j / (j+k) ではありません。
-- 読み取り頻度 [fn] : 指定された値から MAF とヘテロ接合体の頻度を推定します。
--頻度入力ファイルセットの代わりに {x} レポート。
--ふぇ [p] : Hardy-Weinberg でバリアントを除外
平衡正確検定の p 値がしきい値を下回っています。
- 自分 [t] [v] : メンデル エラーでトリオとバリアントを除外します
指定されたしきい値を超える率。
--me-exclude-XNUMX {比率} : 作る - 自分 トリオごとに XNUMX つのサンプルのみを除外します。
--クアルスコア [f] {qcol} {IDcol} {skip} : バリアントを除外する
範囲外の品質スコア。 デフォルトの範囲は [0, \infty ) になりました。
--qual-threshold [最低スコア]
: セットする --クアルスコア レンジフロア。
--qual-max-threshold 【最高得点】
: セットする --クアルスコア レンジ天井。
--セックス禁止
: あいまいな性別のサンプルを分析で表現型が欠落しているものとして扱わないでください
コマンド。 (自動 /w -- ノーセックス.)
--マスト・ハブ・セックス
: あいまいな性別の表現型を強制的に欠落させます
- ベッドを整えます/--make-just-fam/--recode/--write-covar。
--フィルターケース
: 現在の分析にケースのみを含めます。
--フィルターコントロール
: コントロールのみを含めます。
--filter-男性
:男性のみを含む。
--フィルター-女性
:女性のみを含む。
--フィルター創設者
: 発起人のみを含めます。
--filter-非創設者 : 非創設者のみを含めます。
--非創設者
: 対立遺伝子頻度/HWE 計算に非創始者を含めます。
--make-founders : それらのペアレンタル ID をクリアします。
親が1人以上行方不明。
--recode-対立遺伝子 [fn] : あり --recode A/A-transpose/AD、で指定された対立遺伝子を数えます
(それ以外の場合は、常に A1 対立遺伝子がカウントされます)。
--出力chr [MT code] : 出力ファイルに染色体コード体系を設定する
目的のヒト ミトコンドリア コードを提供します。 (オプションは「26」、「M」、「MT」、
「0M」、「chr26」、「chrM」、および「chrMT」)。
--出力欠落遺伝子型 [ch] : 行方不明を表すコードを設定
出力ファイルの遺伝子型 (通常、 -- 行方不明の遺伝子型 値)。
-- 出力欠損表現型 [s] : 行方不明を表すために使用する文字列を設定します
出力ファイルの表現型 (通常、 -- 行方不明の表現型 値)。
--ゼロクラスター [f] : との組み合わせ - 内部/-- ファミリ、ブロックのセット
行方不明への遺伝子型呼び出し。 入力ファイルには、最初にバリアント ID が含まれている必要があります。
XNUMX 番目の列とクラスター ID。 これで使用する必要があります - ベッドを整えます そしていいえ
その他の出力コマンド。
--set-hh-missing : 原因 - ベッドを整えます と --recode ヘテロ接合半数体を設定する
欠落する遺伝子型。
--split-x [bp1] [bp2] :すべてのX染色体の染色体コードを変更
--split-x [建てる]
bp 位置 <= bp1 または >= bp2 から XY までのバリアント。 以下のビルドコードは
省略表現としてサポート: * 'b36'/'hg18' = NCBI 36, 2709521/154584237 * 'b37'/'hg19'
= GRCh37, 2699520/154931044 * 'b38'/'hg38' = GRCh38, 2781479/155701383 デフォルトでは、
影響を受けるバリアントがない場合、PLINK エラーが発生します。 --split-x; 「ノーフェイル」
修飾子 (スクリプトで便利) はこれをオーバーライドします。
--マージ-x
: XY 染色体を X にマージします。
--set-me-missing
: 原因 - ベッドを整えます Mendel エラーを Missing に設定します。
--fill-missing-a2 : 原因 - ベッドを整えます 欠落しているすべての呼び出しを
ホモ接合型 A2 コール。
--set-missing-var-ids [t]
: 染色体コードが入る場所に '@' と '#' を持つテンプレート文字列が与えられた場合
bp座標が属する場所、 --set-missing-var-ids 割り当て
名前のないバリアントへの染色体および bp ベースの ID。 「$1」と「$2」を使用して、
テンプレート文字列で対立遺伝子名を参照し、実際にこれが不可欠になります
複数のバリアントが同じ座標を共有している場合。
--new-id-max-allele-len [n] : 最大先頭文字数を指定
対立遺伝子名から新しいバリアント ID に含める (デフォルトは 23)。
--missing-var-code [string] : 名前のないバリアント コードを変更します (デフォルトは '.')。
--更新-chr
[f] {chrcol} {IDcol} {skip} : バリアント染色体コードを更新します。
--更新-cm
[f] {cmcol} {IDcol} {skip} : センチモーガンの位置を更新します。
--更新マップ
[f] {bpcol} {IDcol} {skip} : バリアント bp 位置を更新します。
--更新名 [f] {newcol} {oldcol} {skip} : バリアント ID を更新します。
--更新対立遺伝子 [fname] : バリアント アレル コードを更新します。
--アレレ1234 : A/C/G/T 対立遺伝子を 1/2/3/4 として解釈/再コード化します。
'multichar' を使用すると、対立遺伝子名のすべての A/C/G/T を 1/2/3/4 に変換します。
--アレレACGT :逆 --アレレ1234.
--更新 ID [f]
: サンプル ID を更新します。
--更新-親 [f] : 保護者 ID を更新します。
--更新-セックス [f] {n} : 性別を更新します。
性別 (1 または M = 男性、2 または F = 女性、0 = 欠落) は列 n+2 から読み込まれます
(デフォルトの n は 1 です)。
-フリップ [ファイル名]
: ファイル内の SNP ID の対立遺伝子 (A<->T、C<->G) を反転します。
--フリップサブセット [fn]
:適用のみ -フリップ のサンプルに --フリップサブセット ファイルにソフトウェアを指定する必要があります。
--フリップスキャンウィンドウ [ct+1] : セット --フリップスキャン 最大バリアント ct 距離。 (定義 10)。
--フリップスキャンウィンドウ-kb [×] : セット --フリップスキャン 最大 kb 距離 (デフォルト 1000)。
--flip-scan-threshold [×] : セット --フリップスキャン 最小相関 (デフォルト 0.5)。
--対立遺伝子の順序を維持する
: .bim ファイルで定義された対立遺伝子の順序を維持します。
--real-ref-対立遺伝子
A2 を主要な対立遺伝子にする代わりに。 --real-ref-対立遺伝子 「PR」も削除します
によって発行された INFO 値から --recode vcf{-fid/-iid}。
--a1-対立遺伝子 [f] {a1col} {IDcol} {skip} : ファイル内の対立遺伝子を強制的に A1 にします。
--a2-対立遺伝子 [ファイル名] {a2col} {IDcol} {skip} :
ファイル内の対立遺伝子を A2 に強制します。
("--a2-allele [VCF ファイル名] 4 3 '#'",
これは、VCF ファイルから参照対立遺伝子の割り当てをスクレイピングするもので、特に便利です。)
--indiv-sort [m] {f} : FID/IID ソート順を指定します。
次の 0 つのモードがサポートされています。 * 'none'/'XNUMX' はサンプルを順番に保持します。
彼らはいた
ロードされました。
マージ以外の操作のデフォルト。
* 'natural'/'n' は 'natural sort' を呼び出します。
「id2」<「ID3」<「id10」。 マージ時のデフォルト。
* 'ascii'/'a' は ASCII 順でソートします。
'ID3' < 'id10' < 'id2'.
* 'file'/'f' は、指定されたファイル (名前が付けられたファイル) の順序を使用します。
XNUMX 番目のパラメーターで)。
今のところ、 - マージ/--bmerge/--merge-list および
- ベッドを整えます/--make-just-fam はこのフラグを尊重します。
--with-表現型 : より多くのサンプル情報を含める
新しい .cov ファイルで。
--ダミーコーディング {N} : カテゴリー変数の分割 (n カテゴリー、
2 < n <= N、デフォルト N は 49) を共変量の書き込み時に n-1 バイナリ ダミー変数に変換
ファイルにソフトウェアを指定する必要があります。
--マージモード [n]
:調整 --{b}マージ/--数値コードに基づくマージ リストの動作。 1 (デフォルト) =
欠落している呼び出しを無視し、それ以外の場合は違います
-> 行方不明
2 = 元々欠落していた呼び出しのみを上書きする 3 = 欠落していないときにのみ上書きする
新しいファイル 4/5 = 上書きしない、常に上書きする、それぞれ 6 = すべてを報告する
マージせずにミスマッチ コールを報告する 7 = マージせずにミスマッチの非ミスコールを報告する
マージ
--merge-equal-pos
:With - マージ/--bmerge/--merge-list、異なる名前のバリアントをマージしますが、
同一の位置。 (例外: 同じ位置の染色体コード 0 バリアントは、
合併しました。)
--メンデルデュオ
: メンデル エラー チェックで、データセットに親が XNUMX つしかないサンプルを考慮します。
--メンデル-マルチジェン
: メンデルのエラー チェックで、親の場合に (曾) 祖父母の遺伝子型を考慮するようにします。
遺伝子型データがありません。
--ld-ウィンドウ [ct+1] : セット --r/--r2 最大バリアント ct ペアワイズ距離 (usu. 10)。
--ld-ウィンドウ-kb [×] : セット --r/--r2 最大 kb ペアごとの距離 (通常は 1000)。
--ld-ウィンドウ-r2 [x] : しきい値を設定 --r2 レポートの包含 (通常は 0.2)。
--ld-snp [変数 ID]
: すべての最初のバリアントを設定します --r/--r2 ペア。
--ld-snps [vID...] : 最初に制限 --r/-- 指定された範囲への r2 バリアント。
--ld-snp-リスト [f]
: 最初に制限する --r/--r2変数。 ファイルで名前が付けられている人に。
-リスト-すべて
: 使用時に「すべて」モードのレポートを生成します --show-tags ファイルモードで。
--tag-kb [kbs]
: セットする --show-tags 最大タグ kb 距離 (デフォルト 250)。
--tag-r2 [値]
: セットする --show-tags min tag r-squared (デフォルト 0.8)
--タグモード2
: XNUMX 列を使用 --show-tags (ファイルモード) I/O フォーマット。
--ld-xchr [コード]
: Xchr モデルを設定 --indep{-ペアワイズ}、 --r/--r2、 --フリップスキャン, --show-tags。 1
(デフォルト) = 男性は 0/1、女性は 0/1/2 (A1 投与量) 2 = 男性は 0/2 にコード化 3 =
男性は 0/2 にコード化されましたが、女性は二重の重み付けが与えられました
--blocks-max-kb [kbs]
: セットする -ブロック 最大ハプロブロック スパン (デフォルト 200)。
--blocks-min-maf [切り落とす]
:調整 -ブロック MAF 最小 (デフォルト 0.05)。
--blocks-strong-lowci [X]
: セットする -ブロック 「強力な LD」CI しきい値 (デフォルト
--blocks-strong-highci [X]
0.70と0.98)
--blocks-recomb-highci [x] : 「組換え」CI しきい値を設定します (デフォルトは 0.90)。
--blocks-inform-frac [X]
: ハプロブロック [強力な LD ペア]:[有益なペアの合計] の比率を大きくする
この値より (デフォルト 0.95)。
--距離-wts exp=[x]
: ゲノム距離を計算するときは、各バリアントに (2q(1-q))^{-x} の重みを割り当てます。
ここで、q はロードされた、または推測された MAF です。
--read-dists [dist file] {id file} : 三角バイナリ距離行列を読み込みます
ゼロから再計算する代わりに。
--ppc ギャップ [値]
: マーカーの有益なペア間の塩基対の最小数 (千単位)
で使用される - ゲノム PPC テスト。 指定しない場合は 500。
-分 [切り落とす]
: 含める最小 PI_HAT を指定します。 - ゲノム レポート。
--最大 [切り落とす]
: 含める最大 PI_HAT を指定します。 - ゲノム レポート。
--ホモジグマッチ [] : 共同ホモ接合体全体の最小一致を設定します
ペアワイズ アレル マッチのバリアントを宣言します。
--プールサイズ [ct]
: 「--homozyg グループ」レポートでプールの最小サイズを設定します。
-- 読み取りゲノム [fn] : 負荷 - ゲノム のレポート - 集まる/-- 隣人、代わりに
IBS および PPC テストの p 値をゼロから再計算する方法。
--ppc [p値]
: クラスター内の PPC 検定の最小 p 値を指定します。
--mc 【最大サイズ】
: 最大クラスタ サイズを指定します。
--mcc [c1] [c2]
: クラスターごとのケースとコントロールの最大数を指定します。
--K [最小カウント]
: 最小クラスター数を指定します。
--ibm [値]
: 最小同一性による欠落を指定します。
- マッチ [f] {mv} : 共変量値を使用してクラスタリングを制限します。
無し --マッチタイプ、すべての共変量の場合、XNUMX つのサンプルは同じクラスターにのみ存在できます
マッチ。 オプションの XNUMX 番目のパラメーターは、共変量として扱う値を指定します。
不足しています。
--マッチタイプ [f] : の解釈を絞り込む - マッチ ファイルにソフトウェアを指定する必要があります。
この --マッチタイプ ファイルは、
- マッチ ファイルには共変量があります。 「0」エントリは「ネガティブ マッチ」を指定します (つまり、サンプル
共変量値が等しいものは同じクラスター内に存在できません)、'1' エントリは指定します
'正の一致' (デフォルト)、および '-1' により、対応する共変量が
無視されます。
--qmatch [f] {m} : クラスターのすべてのメンバーが同様のものを持つように強制します
--qt [名前]
量的共変量値。 の --qmatch ファイルには共変量の値が含まれています。
同時に --qt ファイルは、負でない公差 (および '-1' のマーキング) のリストです。
スキップする共変量)。
--pca-クラスター名 [...] : これらは個別に、または組み合わせて使用できます
--pca-クラスター [名前]
基本で使用するクラスターのリストを定義する --pca 計算。
(--pca-クラスター名 スペースで区切られたクラスター名のシーケンスが期待されますが、
--pca-クラスター XNUMX 行に XNUMX つのクラスタ名を持つファイルが必要です。) 外部のすべてのサンプル
これらのクラスターは、計算された PC に投影されます。
--mds-プロット [減光] :
多次元スケーリング分析。
必要 - 集まる.
- 細胞 【脱穀】
: 一部スキップ - モデル 分割表のエントリが指定された値よりも小さいかどうかをテストします
閾値。
- 調子 [変数 ID] : バリアントを XNUMX つ追加します。 - 線形
or --ロジスティック 共変量。
--条件リスト [へ] : ファイルで指定されたバリアントを追加します
as - 線形/--ロジスティック covs.
- パラメーター [...]
: 指定された共変量/交互作用のみを - 線形/--ロジスティックモデル、
1 から始まるインデックスおよび/またはそれらの範囲のリストによって識別されます。
--テスト {...} : 指定された用語に対して (結合) テストを実行します。
- 線形/-- 1 から始まるインデックスおよび/またはそれらの範囲によって識別されるロジスティック モデル。 もしも
順列が要求されましたが、これはこのテストに基づいています。 * 注意してください。
- パラメーター も存在し、
インデックスは、によって枝刈りされた後に残っている項を参照します
- パラメーター.
* 「--tests all」を使用して、すべての用語を含めることができます。
--vif [最大VIF]
: の VIF しきい値を設定します。 - 線形 多重共線性チェック (デフォルト 50)。
--xchr-モデル [code] : X染色体を設定 - 線形/--ロジスティック モデル。
0 = 性別と一倍体染色体をスキップする 1 (デフォルト) = X の共変量として性別を追加する
染色体 2 = 0/2 の代わりに 0/1 の男性の遺伝子型をコード化する 3 = 相互作用のテスト
遺伝子型と性別の間
--lasso-select-covars {cov(s)...} : 一部またはすべての共変量を LASSO の対象にします
モデル選択。
- 調整
: いくつかの複数テストの修正を報告します。
- ラムダ [値]
: ゲノム コントロール ラムダを設定します - 調整.
--ci [サイズ]
: オッズ比の信頼区間をレポートします。
--pフィルター [値]
: p 値が高いアソシエーション テストの結果を除外します。
--apem [最小パーマ - 1] {最大パーマ} {アルファ} {ベータ} {初期間隔} {傾き} :
適応順列テストを制御する最大 XNUMX つのパラメーターを設定します。 * 最初の二つ
順列の最小数と最大数を制御する
バリアントごとに実行できます。 デフォルト値は 5 と 1000000 です。
* 次の XNUMX つは、早期終了条件を制御します。
A
100% * (1 - beta/2T) 信頼区間は、各経験的 p 値に対して計算されます。
ここで、T はバリアントの総数です。 この信頼区間が
アルファが含まれている場合、バリアントはそれ以上の順列テストから除外されます。 デフォルト
値は 0 および 1e-4 です。
* 早期終了条件チェック時の最後の XNUMX つのコントロール。
If
チェックは順列 #p で発生し、次のチェックは [slope]p + [init] の後に発生します
interval] 以上の順列 (切り捨て)。 デフォルトの初期間隔は 1 で、
デフォルトの勾配は 0.001 です。
--mperm-save
: 最高の max(T) 置換テスト統計を保存します。
--mperm-save-all : すべての max(T) 置換テスト統計を保存します。
--set-p [p値]
: セット検定の有意なバリアント p 値の上限を調整します (既定値は 0.05)。
--set-r2 {v}
: セット テストの有意バリアント ペアごとの r^2 天井を調整します (既定値は 0.5)。 '書きます'
違反しているペアが {output prefix}.ldset にダンプされます。
--set-max [ct]
: セットごとに考慮される重要なバリアントのセット テストの最大数を調整します (既定値は 5)。
--set-test-ラムダ [v] : セットテストのゲノムコントロール補正を指定します。
- 国境 [kbs]
: 伸ばす -注釈を付ける 指定された # kbs ごとに間隔を設定します。
--annotate-snp-フィールド [nm] : 設定 -注釈を付ける バリアント ID フィールド名。
--clump-p1 [pval] : セット --クランプ インデックス変数p 値の上限 (デフォルトは 1e-4)。
--clump-p2 [pval] : セット --クランプ 二次 p 値のしきい値 (デフォルト 0.01)。
--clump-r2 [r^2]
: セットする --クランプ r^2 しきい値 (デフォルト 0.5)。
--clump-kb [kbs]
: セットする --クランプ kb 半径 (デフォルトは 250)。
--clump-snp-フィールド [に...]
: セットする --クランプ バリアント ID フィールド名 (デフォルト 'SNP')。 複数のフィールド名で、
以前の名前が後の名前よりも優先されます。
--クランプフィールド [名前...]
: セットする --クランプ p 値フィールド名 (デフォルト 'P')。
--clump-allow-overlap
:させて --クランプ 非インデックス変数。 複数の塊に参加します。
--clump-冗長
: リクエスト延長 --クランプ レポート。
--clump-annotate [hdr...] : 名前付きの追加フィールドを含める --clump-冗長 と
--clump-best 報告します。 (フィールド名は、スペースまたはコンマで区切ることができます。)
--クランプ範囲 [ファイル名]
: クランプと領域の間の重複を報告します。
--clump-range-border [kb] : ストレッチ領域 --クランプ範囲 ファイルにソフトウェアを指定する必要があります。
--clump-index-first
: エキス --クランプ インデックス変数。 最初のファイルのみから。
--clump-replicate
: XNUMX つのファイルのみからの二次結果を含むクランプを除外します。
--clump-best
: それぞれに最適なプロキシをレポートします --クランプ インデックス変数
--メタ分析-snp-フィールド [n...] : セット --メタ分析 バリアント ID、A1/A2
--メタ分析-a1-フィールド [に...]
対立遺伝子、p 値、および/または有効なサンプル
--メタ分析-a2-フィールド [に...]
サイズ フィールド名。 デフォルトは「SNP」です。
--メタ分析-p-フィールド [に...]
「A1」、「A2」、「P」、および「NMISS」、
--メタ分析-ess-フィールド [に...]
それぞれ。 これらのフラグに複数のパラメーターを指定すると、以前の名前
後のものより優先されます。 ケースとコントロールの数が
は等しくないため、有効なサンプル サイズは
4 / (1/[ケース数] + 1/[コントロール数])。
--メタ分析レポート-dups
: バリアントが同じファイルに複数回出現する場合は、それを報告してください。
--遺伝子リストボーダー [kbs]
: 伸ばす --遺伝子レポート 特定の kbs 数によるリージョン。
--遺伝子サブセット [ファイル名]
: 遺伝子名サブセットを指定 --遺伝子レポート.
--gene-report-snp-field [] : 設定 --遺伝子レポート バリアント ID フィールド名 (デフォルト
「SNP」)。 のみ関連 - エキス.
- ギャップ [kbs]
: '--fast-epistasis case-only' 分を設定します。 ギャップ (デフォルト 1000)。
--epi1 [p値] : セット --{fast-}エピスタシス レポートのしきい値 (デフォルト
「ブースト」の場合は 5e-6、それ以外の場合は 1e-4)。
--epi2 [p-value] : SIG_E カウントに寄与するしきい値を設定します (デフォルト 0.01)。
--je-セルミン [n] : 3x3x2 の偶発ごとに必要な観測数を設定します
結合効果検定のテーブル セル (デフォルト 5)。
--q-スコア範囲 [範囲ファイル] [データファイル] {i} {j} :
申し込む - スコア などに基づいて、プライマリ スコア リスト内のバリアントのサブセットに
p値の範囲。 * 最初のファイルには、最初の列に範囲ラベルが必要です。
p値
XNUMX 列目に下限、XNUMX 列目に上限。 ライン
エントリが少なすぎるか、XNUMX 列目または XNUMX 列目に数値以外の値があると、
無視されます。
* XNUMX 番目のファイルには、それぞれのバリアント ID と p 値が含まれている必要があります
空でない行 (場合によっては最初の行を除く)。
バリアント ID が読み取られます
列 #i と p 値は列 #j から読み取られます。ここで、i はデフォルトで 1 と j です。
デフォルトは i+1 です。 「ヘッダー」修飾子により、このファイルの最初の空でない行が発生します
スキップされます。
- 平行 [k] [n] : 出力行列を n 個に分割し、
k番目のピース。 一次出力ファイルには、そのファイルにピース番号が含まれます。
名前、例えば plink.rel.13 または plink.rel.13.gz (k が 13 の場合)。これらのファイルの連結
順番に、対象の完全な行列が得られます。 (はい、これは前に行うことができます
解凍します。) 注意: これは通常、対称を直接書き込むために使用することはできません。
正方行列。 代わりに、square0 または三角形の形状を選択し、次のように後処理します。
必要。
- メモリー [値]
: 最初のワークスペース malloc 試行のサイズ (MB 単位) を設定します。 (事実上必須
GNU 並列を使用する場合)。
-スレッド [値]
処置: 同時スレッドの最大数を設定してください。 これには既知の制限が XNUMX つあります。
BLAS/LAPACK 線形代数操作は、PLINK ができない方法でマルチスレッド化されます。
コントロール。 これが問題になる場合は、シングル スレッドに対して再コンパイルする必要があります。
ブラス/ラパック。
- NS [文字]
: バリアント/共変量の範囲区切り文字を変更します (通常は「-」)。
- シード [値...]
: 乱数シードを設定します。 各値は 0 から XNUMX の間の整数でなければなりません
4294967295を含む。
--perm-バッチサイズ [val] : 一部のバッチごとの順列の数を設定します
順列テスト。
--output-min-p [p] : レポートに書き込む最小 p 値を指定します。
- デバッグ
: 低速でクラッシュ耐性の高いロギング方法を使用してください。
主な方法論文: Chang CC、Chow CC、Teller LCAM、Vattikuti S、Purcell SM、Lee JJ
(2015) 第 XNUMX 世代の PLINK: より大規模で豊富なデータセットの課題に立ち向かう。
ギガサイエンス、4.
詳細なドキュメントとサポートについては、メインの Web ページを参照してください。
(https://www.cog-genomics.org/plink2 ) および/またはメーリング リスト
(https://groups.google.com/d/forum/plink2-users)。
onworks.net サービスを使用して plink1.9 をオンラインで使用する