Dies ist der Befehl plink1.9, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
PLINK – SNP-Analyse des gesamten Genoms
BESCHREIBUNG
PLINK v1.90b3.31 64-Bit (3. Februar 2016) https://www.cog-genomics.org/plink2 (C)
2005–2016 Shaun Purcell, Christopher Chang GNU General Public License v3
In den folgenden Befehlszeilen-Flag-Definitionen heißt es:
* [eckige Klammern] bezeichnen einen erforderlichen Parameter, wobei der Text zwischen dem
Klammern beschreiben seine Natur.
* bezeichnen einen optionalen Modifikator (oder, wenn '|' vorhanden ist, eine Menge).
von sich gegenseitig ausschließenden optionalen Modifikatoren).
Verwenden Sie den GENAUEN Text im
Definition, z. B. '--dummy acgt'.
* Es gibt eine Ausnahme von der Regel für spitze Klammern/exakten Text: wenn ein Winkel angegeben wird
Klammerbegriff endet mit „=[Wert]“, „[Wert]“ bezeichnet einen variablen Parameter.
* {geschweifte Klammern} bezeichnen einen optionalen Parameter, wobei der Text zwischen den
Klammern beschreiben ihre Natur.
* Ein Auslassungszeichen (...) zeigt an, dass Sie mehrere Parameter eingeben können
angegebenen Typ.
plink [Eingabeflag(s)...] {Befehlsflag(s)...} {andere Flag(s)...} plink --help {Flagge
Name(n)...}
Die meisten PLINK-Läufe erfordern genau einen Haupteingabedateisatz. Die folgenden Flags sind verfügbar
zur Definition seiner Form und Lage:
--bfile {Präfix}: Geben Sie das Präfix .bed + .bim + .fam an (Standard: „plink“).
--Bett [Dateiname]: Geben Sie den vollständigen Namen der .bed-Datei an.
--bim [Dateiname]: Geben Sie den vollständigen Namen der .bim-Datei an.
--fam [Dateiname]: Geben Sie den vollständigen Namen der .fam-Datei an.
--keep-autoconv
: Mit --Datei/--tfile/--lfile/--vcf/--bcf/--data/--23file, nicht löschen
Automatisch generierter Binärdateisatz am Ende der Ausführung.
--Datei {Präfix}
: Geben Sie das Dateinamenpräfix .ped + .map an (Standard: „plink“).
--ped [Dateiname]: Geben Sie den vollständigen Namen der .ped-Datei an.
--Karte [Dateiname]: Geben Sie den vollständigen Namen der .map-Datei an.
--no-fid
: .fam/.ped-Datei enthält Spalte 1 (Familien-ID) nicht.
--keine-Eltern
: Die .fam/.ped-Datei enthält keine Spalten 3–4 (übergeordnete Elemente).
--kein Sex
: .fam/.ped-Datei enthält keine Spalte 5 (Geschlecht).
--kein-Phäno
: Die Datei .fam/.ped enthält Spalte 6 (Phänotyp) nicht.
--tfile {Präfix}: Geben Sie das Präfix .tped + .tfam für den Dateinamen an (Standard: „plink“).
--tped [fname]
: Geben Sie den vollständigen Namen der .tped-Datei an.
--tfam [fname]
: Geben Sie den vollständigen Namen der .tfam-Datei an.
--lfile {Präfix}: Geben Sie das Präfix .lgen + .map + .fam (Langformat-Dateisatz) an.
--lgen [fname]
: Geben Sie den vollständigen Namen der .lgen-Datei an.
--Hinweis [fn]: Geben Sie die Standard-Alleldatei für die .lgen-Eingabe an.
--allel-count
: Bei Verwendung mit --lfile/--lgen + --Hinweis, gibt an, dass die .lgen-Datei
enthält Referenz-Allelzahlen.
--vcf [Dateiname]: Geben Sie den vollständigen Namen der .vcf- oder .vcf.gz-Datei an.
--bcf [Dateiname]: Geben Sie den vollständigen Namen der BCF2-Datei an.
--Daten {Präfix}
: Geben Sie das Präfix „Oxford .gen + .sample“ an (Standard „plink“).
--gen [Dateiname]: Geben Sie den vollständigen Namen der .gen- oder .gen.gz-Datei an.
--bgen [F] : Geben Sie den vollständigen Namen der .bgen-Datei an.
--Stichprobe [fname]: Geben Sie den vollständigen Namen der .sample-Datei an.
--23Datei [fname] {FID} {IID} {Geschlecht} {Phäno} {pat. ID} {mat. AUSWEIS} :
Geben Sie die 23andMe-Eingabedatei an.
--grm-gz {prfx}
: Geben Sie das Präfix .grm.gz + .grm.id (GCTA-Rel.-Matrix) an.
--grm-bin {prfx}: Geben Sie .grm.bin + .grm.N.bin + .grm.id (GCTA-Dreieck) an
binäre Beziehungsmatrix) Dateinamenpräfix.
--Dummy [Proben-CT] [SNP-CT] {fehlende Geno-Häufigkeit} {fehlende Phäno-Häufigkeit}
Dadurch wird ein gefälschter Eingabedatensatz mit der angegebenen Anzahl von Proben und SNPs generiert.
Standardmäßig sind die fehlenden Genotyp- und Phänotyphäufigkeiten Null und Genotypen
sind As und Bs (letzteres mit 'acgt'/'1234'/'12' ändern). Das „Skalar-Phänomen“
Der Modifikator bewirkt, dass stattdessen ein normalverteilter skalarer Phänotyp generiert wird
eine binäre.
--simulieren [Simulationsparameterdatei]
--simulate-qt [Simulationsparameterdatei]
--simulieren generiert einen gefälschten Eingabedatensatz mit krankheitsassoziierten SNPs,
während --simulate-qt generiert einen Datensatz mit quantitativen Merkmalsorten.
Ausgabedateien haben standardmäßig Namen in der Form „plink.{extension}“. Sie können das ändern
'plink'-Präfix mit
--aus [Präfix]
: Präfix für Ausgabedateien angeben.
Die meisten Ausführungen erfordern außerdem mindestens einen der folgenden Befehle:
--Bett machen
Erstellen Sie einen neuen Binärdateisatz.
Im Gegensatz zur automatischen Text-zu-Binär-Umwandlung
Konverter (die nur Chromosomenfilter berücksichtigen) unterstützt alle PLINKs
Filterflags.
--make-just-bim
--make-just-fam
Varianten von --Bett machen die nur eine neue .bim- oder .fam-Datei schreiben.
Kann sein
Wird nur mit .bim/.fam-Eingaben verwendet. VERWENDEN SIE DIESE VORSICHTIG. Es ist sehr einfach
Desynchronisieren Sie Ihre binären Genotypdaten und Ihre .bim/.fam-Indizes, wenn Sie diese verwenden
Befehle falsch. Wenn Sie irgendwelche Zweifel haben, bleiben Sie dabei --Bett machen.
--umcodieren <01 | 12> <23 | A{-transpose} | ANZEIGE | beagle{-nomap} | Bimbam{-1chr}
| zusammengesetzte Genotypen | fastphase{-1chr} | HV{-1chr} | lgen{-ref} | Liste | Oxford |
rlist | Struktur | transponieren | vcf | vcf-fid | vcf-iid>
| gen-gz>
Erstellen Sie einen neuen Textdateisatz mit allen angewendeten Filtern.
Standardmäßig ist die
Der Dateisatz besteht aus einer .ped- und einer .map-Datei, lesbar mit --Datei. * Die „12“
Der Modifikator bewirkt, dass A1-Allele (normalerweise Nebenallele) als „1“ kodiert werden.
und A2-Allele werden als „2“ kodiert, während „01“ A1 -> 0 und A2 -> 1 zuordnet.
* Der Modifikator „23“ bewirkt, dass eine 23andMe-formatierte Datei generiert wird.
Dieses
kann nur für die Daten einer einzelnen Probe verwendet werden (--halten kann praktisch sein).
* Der Modifikator „AD“ bewirkt einen Sample-Major-Additiv (0/1/2) + Dominant
(het = 1, sonst 0) Komponentendatei, geeignet zum Laden aus R, sein
generiert. Wenn Sie die dominante Komponente nicht möchten, verwenden Sie stattdessen „A“. Wenn Sie brauchen
Um nicht gezählte Allele in der Kopfzeile zu benennen, fügen Sie den Modifikator „include-alt“ hinzu.
* Der Modifikator „A-transpose“ führt zu einer additiven Komponentendatei mit Hauptvarianten
erzeugt werden.
* Der Modifikator „beagle“ führt zu unphasierten .dat- und .map-Dateien pro Autosome.
lesbar für frühe BEAGLE-Versionen, generiert werden, während 'beagle-nomap' generiert
eine einzelne .beagle.dat-Datei.
* Der Modifikator „bimbam“ bewirkt, dass ein BIMBAM-formatierter Dateisatz generiert wird.
Wenn Ihre Eingabedaten nur ein Chromosom enthalten, können Sie stattdessen „bimbam-1chr“ verwenden
um eine zweispaltige .pos.txt-Datei zu schreiben.
* Der Modifikator „compound-genotypes“ entfernt den Abstand zwischen Paaren von
Allelcodes für dieselbe Variante beim Generieren eines .ped + .map-Dateisatzes.
* Der Modifikator „fastphase“ bewirkt, dass fastPHASE-Dateien pro Chromosom erstellt werden
generiert.
Wenn Ihre Eingabedaten nur ein Chromosom enthalten, können Sie verwenden
Geben Sie stattdessen „fastphase-1chr“ ein, um die Chromosomennummer aus der Dateierweiterung auszuschließen.
* Der Modifikator „HV“ bewirkt, dass ein .ped + .info-Dateisatz im Haploview-Format erstellt wird
pro Chromosom erzeugt.
„HV-1chr“ ist analog zu „fastphase-1chr“.
* Der Modifikator „lgen“ bewirkt einen Dateisatz im Langformat (ladbar mit --lfile)
generiert werden soll, während „lgen-ref“ einen (normalerweise) kleineren Dateisatz im Langformat generiert
beladbar mit --lfile + --Hinweis.
* Der Modifikator „list“ erstellt eine genotypbasierte Liste, während „rlist“ eine Liste erstellt
ein Dateisatz mit seltenen Genotypen.
Bei diesen Formaten ist das „omit-nonmale-y“
Der Modifikator führt dazu, dass nichtmännliche Genotypen auf dem Y-Chromosom weggelassen werden.
* „oxford“ bewirkt, dass ein .gen + .sample-Dateisatz im Oxford-Format generiert wird.
Wenn Sie auch den Modifikator „gen-gz“ einschließen, wird die .gen-Datei gkomprimiert.
* Der Modifikator „structure“ bewirkt, dass eine Datei im Strukturformat generiert wird. *
'transpose' erstellt einen transponierten Textdateisatz (ladbar mit --tfile). * 'vcf',
„vcf-fid“ und „vcf-iid“ führen zur Erstellung einer VCFv4.2-Datei.
„vcf-fid“ und „vcf-iid“ bewirken, dass Familien-IDs bzw. familieninterne IDs erstellt werden
wird für die Beispiel-IDs in der letzten Kopfzeile verwendet, während „vcf“ beide IDs und zusammenführt
setzt einen Unterstrich dazwischen. Wenn der Modifikator „bgz“ hinzugefügt wird, ist die VCF-Datei
blockkomprimiert. Das A2-Allel wird als Referenz gespeichert und normalerweise als nicht gekennzeichnet
basierend auf einem echten Referenzgenom (Wert des INFO-Felds „PR“). Wenn es wichtig ist für
Um korrekt zu sein, sollten Sie auch alle Referenzallele einbeziehen --a2-Allel und
--real-ref-alleles in deinem Befehl.
* Der Modifikator „tab“ sorgt dafür, dass die Ausgabe größtenteils durch Tabulatoren getrennt wird
meist durch Leerzeichen getrennt.
'tabx' und 'spacex' erzwingen alle Tabulatoren und alle
Leerzeichen bzw.
--flip-scan
(alias: --flipscan) LD-basierter Scan auf Fall-/Kontrollstrang-Inkonsistenz.
--write-covar
Sollten Sie jetzt aufgefordert werden, ein --covar Datei wird geladen, --Bett machen/--make-just-fam und --umcodieren Im Prinzip so, wie Sie es von Google Maps kennen.
Generieren Sie eine aktualisierte Version (mit allen angewendeten Filtern). Wenn Sie dies jedoch nicht tun
Wenn Sie gleichzeitig eine neue Genotypdatei erstellen möchten, können Sie diese verwenden --write-covar zu
Erstellen Sie einfach eine beschnittene Kovariatendatei.
--write-cluster
Wenn Cluster mit angegeben sind --innerhalb/--family, dadurch wird eine neue Clusterdatei generiert
(mit allen angewendeten Filtern). Der Modifikator „omit-unassigned“ bewirkt, dass keine Cluster vorhanden sind
Proben, die aus der Datei weggelassen werden sollen; andernfalls ist ihr Cluster „NA“.
--write-set
--set-table
Wenn Sets definiert wurden, --write-set Gibt 'END'-terminierte Set-Mitgliederlisten aus
zu {Ausgabepräfix}.set, while --set-table schreibt eine Variante-für-Set-Mitgliedschaftstabelle
zu {Ausgabepräfix}.set.table.
--verschmelzen [.ped-Dateiname] [.map-Dateiname]
--verschmelzen [Textdateisatz-Präfix]
--bmerge [.bed-Dateiname] [.bim-Dateiname] [.fam-Dateiname]
--bmerge [Binärdateisatz-Präfix]
Führen Sie den angegebenen Dateisatz mit dem ursprünglich geladenen Dateisatz zusammen und schreiben Sie das Ergebnis in
{Ausgabepräfix}.bed + .bim + .fam. (Es ist nicht mehr notwendig, gleichzeitig
angeben --Bett machen.)
--merge-list [Dateiname]
Führen Sie alle in der Textdatei genannten Dateisätze mit dem Referenzdateisatz zusammen, sofern vorhanden
angegeben. (Dies kann jedoch auch *ohne* Referenz verwendet werden; in diesem Fall
Der neu erstellte Dateisatz wird dann von den meisten anderen PLINK als Referenz behandelt
Operationen.) Die Textdatei wird wie folgt interpretiert: * Wenn eine Zeile nur enthält
Bei einem Namen wird davon ausgegangen, dass er das Präfix für a ist
binärer Dateisatz.
* Wenn eine Zeile genau zwei Namen enthält, werden diese als vollständig angenommen
Dateinamen für einen Textdateisatz (zuerst .ped, dann .map).
* Wenn eine Zeile genau drei Namen enthält, werden diese als vollständig angenommen
Dateinamen für einen binären Dateisatz (.bed, dann .bim, dann .fam).
--write-snplist
--list-23-indels
--write-snplist schreibt eine .snplist-Datei, die die Namen aller Varianten auflistet
die die von Ihnen angegebenen Filter und Einschlussschwellenwerte erfüllen, while
--list-23-indels schreibt die Teilmenge mit Indel-Aufrufen im 23andMe-Stil (D/I-Allel).
Codes).
--list-duplicate-vars
--list-duplicate-vars schreibt eine .dupvar-Datei, die alle Gruppen beschreibt
Varianten mit passenden Positionen und Allelcodes. * Standardmäßig A1/A2-Allel
Zuweisungen werden ignoriert; Verwenden Sie „require-same-ref“
um dies außer Kraft zu setzen.
* Normalerweise enthält der Bericht Positions- und Allelcodes.
Um sie zu entfernen
(und eine Datei erstellen, die direkt mit z. B. verwendet werden kann --Extrakt/--exclude), verwenden Sie „ids-only“.
Beachten Sie, dass dieser Befehl im „Nur-IDs“-Modus fehlschlägt, wenn eine der gemeldeten IDs vorhanden ist
nicht einzigartig.
* 'suppress-first' bewirkt, dass die erste Varianten-ID in jeder Gruppe weggelassen wird
aus dem Bericht.
--Frequenz
--freqx
--Frequenz generiert eine grundlegende Allelfrequenz (oder Anzahl, wenn die „Zählungen“
Modifikator vorhanden ist) Bericht.
Dies ist kombinierbar mit --innerhalb/--Familie
stattdessen einen Cluster-geschichteten Allelhäufigkeits-/Anzahlbericht zu erstellen, oder die
„Case-Control“-Modifikator, um Fall- und Kontroll-Allelfrequenzen getrennt zu melden.
--freqx generiert einen detaillierteren Genotyp-Zählungsbericht, der für die Verwendung mit konzipiert ist
--read-freq.
--fehlen
Generieren Sie stichproben- und variantenbasierte Berichte über fehlende Daten.
Wenn es Cluster gibt
definiert, ist der variantenbasierte Bericht Cluster-stratifiziert.
'gz' verursacht das
Ausgabedateien, die gzippt werden sollen.
--test-mishap
Überprüfen Sie den Zusammenhang zwischen fehlenden Rufen und flankierenden Haplotypen.
--winterhart
Erstellen Sie einen exakten Hardy-Weinberg-Test-p-Wert-Bericht.
(Das tut nicht
gleichzeitig nach dem p-Wert filtern; verwenden --hwe dafür.)
Bei
Mit dem Modifikator „midp“ wendet der Test die in Graffelman beschriebene Mid-p-Anpassung an
J, Moreno V (2013) Der mittlere p-Wert in exakten Tests für das Hardy-Weinberg-Gleichgewicht.
--mendel
Generieren Sie einen Mendel-Fehlerbericht.
Der Modifikator „nur Zusammenfassungen“ bewirkt, dass
.mendel-Datei (die jeden einzelnen Fehler auflistet), die übersprungen werden soll.
--het
--ibc
Schätzen Sie die Inzuchtkoeffizienten.
--het Berichte method-of-moments
Schätzungen, während --ibc berechnet alle drei Werte, die in Yang J, Lee SH,
Goddard ME und Visscher PM (2011) GCTA: Ein Werkzeug für genomweite komplexe Merkmale
Analyse. (Dieses Papier beschreibt auch die Berechnung der Beziehungsmatrix, die wir durchführen
Neuimplementierung.) * Diese Funktionen erfordern angemessene MAF-Schätzungen. Wenn es sehr gibt
wenige
Beispiele in Ihrem unmittelbaren Dateisatz, --read-freq ist seitdem praktisch Pflicht
Unterstellte MAFs sind in diesem Fall völlig ungenau.
* Sie gehen außerdem davon aus, dass sich der Markersatz in einem ungefähren Verknüpfungsgleichgewicht befindet. * Von
Standard --het lässt den n/(n-1)-Multiplikator in Neis Erwartung weg
Homozygotieformel.
Der Modifikator „kleine Stichprobe“ bewirkt, dass dies der Fall ist
enthalten, während erzwungen wird --het von Gründern zugeschriebene MAFs unmittelbar zu nutzen
Datensatz.
--check-sex {weiblich max. F} {männlich min. F}
--check-sex ycount {weiblich max. F} {männlich min. F} {weiblich max. Y obs}
{männlich min Y obs}
--check-sex y-only {weiblich max. Y obs} {männlich min. Y obs}
--impute-sex {weiblich max. F} {männlich min. F}
--impute-sex ycount {weiblich max. F} {männlich min. F} {weiblich max. Y obs}
{männlich min Y obs}
--impute-sex y-only {weiblich max. Y obs} {männlich min. Y obs}
--check-sex vergleicht normalerweise Geschlechtszuordnungen im Eingabedatensatz mit
diejenigen, die aus den Inzuchtkoeffizienten des X-Chromosoms abgeleitet werden. * Stellen Sie sicher, dass das X
Die pseudoautosomale Region des Chromosoms wurde gespalten
aus (mit z.B --split-x), bevor Sie dies verwenden.
* Sie benötigen auch anständige MAF-Schätzungen (also mit sehr wenigen Proben in Ihrem).
Sofortiger Dateisatz, Verwendung --read-freq), und Ihr Markierungssatz sollte ungefähr sein
Verknüpfungsgleichgewicht.
* Standardmäßig schätzt F, dass weibliche Anrufe und Werte kleiner als 0.2 sind
größer als 0.8 ergeben männliche Rufe.
Wenn Sie numerische Parameter übergeben an
--check-sex, die ersten beiden steuern diese Schwellenwerte.
Es gibt jetzt zwei Modi, die Y-Chromosomendaten berücksichtigen. * Im „ycount“-Modus
Das Geschlecht wird immer noch dem X-Chromosom zugeschrieben, aber
weibliche Rufe werden auf mehrdeutig herabgestuft, wenn mehr als 0 nicht fehlende Y vorliegen
Genotypen sind vorhanden und männliche Rufe werden herabgestuft, wenn weniger als 0 vorhanden sind.
(Beachten Sie, dass es sich hierbei um Zählwerte und nicht um Raten handelt.) Diese Schwellenwerte können mit gesteuert werden
--check-sex Die optionalen dritten und vierten numerischen Parameter von ycount.
* Im Modus „Nur Y“ wird das Geschlecht aus der Anzahl der nicht fehlenden Y-Genotypen abgeleitet.
Der Mindestschwellenwert für Männer ist in diesem Fall standardmäßig 1 statt Null.
--impute-sex ändert Geschlechtszuordnungen zu den unterstellten Werten und ist
ansonsten identisch mit --check-sex.
Es muss mit verwendet werden
--Bett machen/--recode/--write-covar.
--fst
(alias: --Fst) Schätzen Sie Wrights Fst für jede autosomal diploide Variante mithilfe von
Methode eingeführt in Weir BS, Cockerham CC (1984) Estimating F-statistics for the
Analyse der Bevölkerungsstruktur anhand einer Reihe von Teilpopulationen, die über definiert sind
--innerhalb. Es werden auch rohe und gewichtete globale Mittelwerte angegeben. * Wenn Sie interessiert sind
Im globalen Maßstab ist es normalerweise die beste Leistung
Diese Berechnung erfolgt auf einem Marker, der im ungefähren Verknüpfungsgleichgewicht eingestellt ist.
* Wenn Sie nur zwei Teilpopulationen haben, können Sie diese mit darstellen
Fall-/Kontrollstatus und verwenden Sie den Modifikator „Fallkontrolle“.
--unabhängig [Fenstergröße] [Schrittgröße (Variante ct)] [VIF-Schwelle]
--indep-pairwise [Fenstergröße] [Schrittgröße (Variante ct)] [r^2-Schwelle]
--indep-pairphase [Fenstergröße] [Schrittgröße (Variante ct)] [r^2-Schwelle]
Erstellen Sie eine Liste von Markern im ungefähren Verknüpfungsgleichgewicht.
Mit der
'kb'-Modifikator, die Fenstergröße wird in Kilobase statt in Variantenanzahleinheiten angegeben.
(Der Speicherplatz vor „kb“ ist optional, z. B. „--indep-pairwise 500 kb 5 0.5“ und
('--indep-pairwise 500kb 5 0.5' hat den gleichen Effekt.) Beachten Sie, dass Sie es erneut ausführen müssen
PLINK verwenden --Extrakt or --ausschließen auf der Datei .prune.in/.prune.out, um die anzuwenden
Liste zu einer anderen Berechnung hinzufügen.
--R
--r2
LD-Statistikberichte.
--R liefert rohe intervariante Korrelationen, während
--r2 meldet ihre Quadrate.
Sie können Ergebnisse für alle Paare in anfordern
Matrixformat (wenn Sie „bin“ oder einen der Formmodifikatoren angeben), alle Paare in
Tabellenformat ('inter-chr') oder ein begrenztes Fenster im Tabellenformat (Standard). * Der
Der Modifikator „gz“ bewirkt, dass die Ausgabetextdatei gkomprimiert wird. * 'bin' bewirkt die Ausgabe
Matrix, die im Binärformat mit doppelter Genauigkeit geschrieben werden soll
Format, während „bin4“ eine Binärdatei mit einfacher Genauigkeit angibt.
Die Matrix ist
quadratisch, wenn keine Form explizit angegeben ist.
* Standardmäßig sind Textmatrizen durch Tabulatoren getrennt. 'Leerzeichen' schaltet dies um. *
„in-phase“ fügt der Tabelle eine Spalte mit In-Phase-Allelpaaren hinzu
Berichten.
(Dies kann nicht mit sehr langen Allelcodes verwendet werden.)
* 'dprime' fügt Lewontins D-Prime-Statistik zu tabellenformatierten Berichten hinzu,
und erzwingt, dass sowohl r/r^2 als auch D-prime auf der Maximum-Likelihood-Lösung basieren
die kubische Gleichung, die in Gaunt T, Rodriguez S, Day I (2007) Cubic Exact diskutiert wird
Lösungen zur Schätzung paarweiser Haplotyphäufigkeiten.
* „with-freqs“ fügt MAF-Spalten zu tabellenformatierten Berichten hinzu. * Da das Ergebnis
Da die Datei sehr groß sein kann, müssen Sie sie hinzufügen
Modifikator „Ja, wirklich“, wenn ungefilterte, nicht verteilte Paare aller Paare angefordert werden
Berechnung von mehr als 400 Varianten.
* Diese Berechnungen können unterteilt werden mit --parallel (auch wenn die
Der Modifikator „Quadrat“ ist aktiv).
--ld [Varianten-ID] [Varianten-ID]
Hier werden die Haplotyphäufigkeiten r^2 und D' für ein einzelnes Variantenpaar angezeigt.
Wenn es mehrere biologisch mögliche Lösungen für die Haplotyphäufigkeit gibt
kubische Gleichung werden alle angezeigt (anstelle nur der Maximum-Likelihood-Lösung).
identifiziert von --R/--r2) zusammen mit den genauen HWE-Teststatistiken.
--Tags anzeigen [Dateiname]
--Tags anzeigen alle
* Wenn eine Datei angegeben ist, werden alle Varianten aufgelistet, die mindestens eine Variante markieren
in der Datei benannt.
(Dies wird normalerweise eine Obermenge des Originals sein
Liste, da davon ausgegangen wird, dass sich eine Variante hier selbst markiert.)
* Wenn der Modus „Alle“ angegeben ist, gilt für jede Variante jede *andere* Variante welche
Tags es wird gemeldet.
--Blöcke
Schätzen Sie Haplotypblöcke mithilfe der Interpretation der Blockdefinition durch Haploview
vorgeschlagen von Gabriel S et al. (2002) Die Struktur von Haplotypblöcken beim Menschen
Genom. * Normalerweise werden Proben mit fehlenden Phänotypen dabei nicht berücksichtigt
Berechnung; Der Modifikator „no-pheno-req“ hebt diese Einschränkung auf.
* Normalerweise dürfen Blöcke der Größe 2 nicht mehr als 20 KB umfassen, und Blöcke der Größe 3
sind auf 30 KB begrenzt.
Der Modifikator „no-small-max-span“ entfernt diese
Grenzen.
Die .blocks-Datei ist eine gültige Eingabe für PLINK 1.07 --glück Befehl.
Aber,
--glück... Die Flaggenfamilie wurde aufgrund von Mängeln nicht in PLINK 1.9 erneut implementiert
Phasengenauigkeit im Vergleich zu anderer Software; Im Moment empfehlen wir die Verwendung von BEAGLE
anstelle von PLINK für die Fall-/Kontroll-Haplotyp-Assoziationsanalyse. (Sie können verwenden
„--recode beagle“, um Daten nach BEAGLE 3.3 zu exportieren.) Wir entschuldigen uns dafür
Unannehmlichkeiten und planen, Varianten davon zu entwickeln --glück... Flags, die behandeln
vorphasierte Daten effektiv nutzen.
--Distanz <0-ibs>
Schreiben Sie eine durch Tabulatoren getrennte Tabelle mit (gewichteten) Genomabständen im unteren Dreieck
Allele zählen Einheiten zu {Ausgabepräfix}.dist und eine Liste der entsprechenden Probe
IDs zu {Ausgabepräfix}.dist.id. Die erste Zeile der .dist-Datei enthält eine Single
{Genom 1-Genom 2} Abstand, die zweite Reihe hat den {Genom 1-Genom 3} und
{Genom 2-Genom 3}-Abstände in dieser Reihenfolge usw. * Dies ist normalerweise die beste Vorgehensweise
diese Berechnung auf einem Marker-Set in
ungefähres Verknüpfungsgleichgewicht.
* Wenn der Modifikator „square“ oder „square0“ vorhanden ist, handelt es sich um eine quadratische Matrix
stattdessen geschrieben; 'square0' füllt das obere rechte Dreieck mit Nullen.
* Wenn der Modifikator „gz“ vorhanden ist, wird eine komprimierte .dist.gz-Datei geschrieben
anstelle einer einfachen Textdatei.
* Wenn der Modifikator „bin“ vorhanden ist, eine binäre (quadratische) Matrix von
Stattdessen werden Gleitkommawerte mit doppelter Genauigkeit verwendet, die zum Laden aus R geeignet sind
geschrieben in {Ausgabepräfix}.dist.bin. ('bin4' gibt Zahlen mit einfacher Genauigkeit an
stattdessen.) Dies kann mit „square0“ kombiniert werden, wenn Sie weiterhin die obere rechte Seite haben möchten
auf Null gesetzt oder „Dreieck“, wenn Sie die obere rechte Seite überhaupt nicht auffüllen möchten.
* Wenn der Modifikator „ibs“ vorhanden ist, wird eine Identität-nach-Staat-Matrix geschrieben
zu {Ausgabepräfix}.mibs.
„1-ibs“ verursacht Entfernungen, die als genomisch ausgedrückt werden
Proportionen (z. B. 1 - IBS), die in {Ausgabepräfix}.mdist geschrieben werden sollen. Kombinieren mit
„allele-ct“, wenn Sie auch die übliche .dist-Datei generieren möchten.
* Standardmäßig Entfernungsneuskalierung bei fehlenden Genotypaufrufen
reagiert empfindlich auf Allelzahlverteilungen: Wenn Variante A im Durchschnitt dazu beiträgt,
doppelt so viel zu anderen paarweisen Distanzen wie Variante B, ein fehlender Call bei Variante A
führt zu einer doppelt so großen Korrektur des Fehlens. Um dies auszuschalten
(Da z. B. Ihre fehlenden Anrufe höchst unzufällig sind), verwenden Sie die Funktion „flat-missing“
Modifikator.
* Die Berechnung kann unterteilt werden mit --parallel.
--distance-matrix
--ibs-matrix
Diese veralteten Befehle entsprechen „--distance 1-ibs flat-missing quadrat“.
und '--distance ibs flat-missing quadrat', mit der Ausnahme, dass sie generiert werden
Leerzeichen statt tabulatorgetrennter Textmatrizen.
--make-rel
Schreiben Sie eine realisierte Beziehungsmatrix mit niedrigerer dreieckiger Varianz und Standardisierung
{Ausgabepräfix}.rel und entsprechende IDs zu {Ausgabepräfix}.rel.id. * Es ist
Normalerweise ist es am besten, diese Berechnung an einem in gesetzten Marker durchzuführen
ungefähres Verknüpfungsgleichgewicht.
* 'square', 'square0', 'triangle', 'gz', 'bin' und 'bin4' verhalten sich wie sie es tun
on --Distanz.
* Der Modifikator „cov“ entfernt den Varianzstandardisierungsschritt und verursacht a
Stattdessen soll die Kovarianzmatrix berechnet werden.
* Standardmäßig basieren die Diagonalelemente in der Beziehungsmatrix auf
--ibcist Fhat1; Verwenden Sie die Modifikatoren „ibc2“ oder „ibc3“, um sie auf Fhat2 zu basieren
oder stattdessen Fhat3.
* Die Berechnung kann unterteilt werden mit --parallel.
--make-grm-gz
--make-grm-bin
--make-grm-gz schreibt die Beziehungen in die ursprüngliche komprimierte Liste von GCTA
Format, das ein Paar pro Zeile beschreibt, while --make-grm-bin schreibt sie in GCTA
Das dreieckige Binärformat mit einfacher Genauigkeit von 1.1+. Beachten Sie, dass diese Formate
Geben Sie explizit die Anzahl der gültigen Beobachtungen an (wobei keine der Stichproben einen hat).
fehlender Aufruf) für jedes Paar, was für einige Skripte eine nützliche Eingabe ist. Diese
Berechnungen können unterteilt werden mit --parallel.
--rel-cutoff {val}
(alias: --grm-cutoff) Schließen Sie ein Mitglied jedes Stichprobenpaares mit Verwandtschaft aus
größer als der angegebene Grenzwert (Standard 0.025). Wenn keine spätere Operation erfolgt
Dadurch wird die Liste der verbleibenden Samples auf die Festplatte geschrieben und dort gespeichert
{Ausgabepräfix}.rel.id. Beachten Sie, dass die Maximierung der verbleibenden Stichprobengröße gilt
Äquivalent zum NP-harten Maximum-Independent-Set-Problem, daher verwenden wir ein Greedy
Algorithmus statt Optimalität zu garantieren. (Verwenden Sie die --make-rel und
--halten/--Flags entfernen, wenn Sie versuchen möchten, es besser zu machen.)
--ibs-test {Permutationsanzahl}
--groupdist {iters} {d}
Bei gegebenen Fall-/Kontrollphänotypdaten berücksichtigen diese Befehle drei Teilmengen davon
Distanzmatrix: Paare betroffener Proben, betroffene-nicht betroffene Paare und Paare von
nicht betroffene Proben. Jede dieser Untergruppen weist eine paarweise genomische Verteilung auf
Entfernungen; --ibs-test Verwendet Permutation, um p-Werte bezüglich der Arten von zu schätzen
Paare sind am ähnlichsten, während --groupdist konzentriert sich auf die Unterschiede zwischen den
Zentren dieser Verteilungen und schätzt Standardfehler über delete-d
Klappmesser.
--regress-distance {iters} {d}
Lineare Regression paarweiser genomischer Abstände auf paarweise durchschnittliche Phänotypen und
Umgekehrt verwenden Sie delete-d jackknife für Standardfehler. Ein skalarer Phänotyp ist
erforderlich. * Bei weniger als zwei Parametern wird d auf {Anzahl der Personen}^0.6 gesetzt
abgerundet
nach unten.
Ohne Parameter werden 100 Iterationen ausgeführt.
--regress-rel {iters} {d}
Lineare Regression paarweiser genomischer Beziehungen auf paarweise durchschnittliche Phänotypen,
und umgekehrt. Die Standardeinstellungen für Iter und d sind dieselben wie für --regress-distance.
--Genom
Erstellen Sie einen Bericht nach Identität nach Abstammung. * Normalerweise ist es am besten, dies durchzuführen
Berechnung auf einem in gesetzten Marker
ungefähres Verknüpfungsgleichgewicht.
* Der Modifikator „rel-check“ schließt Probenpaare mit unterschiedlichen FIDs aus
aus dem Abschlussbericht.
* „full“ fügt dem Bericht rohe paarweise Vergleichsdaten hinzu. * Das P(IBD=0/1/2)
Der von diesem Befehl verwendete Schätzer gibt manchmal nach
Zahlen außerhalb des Bereichs [0,1]; Standardmäßig sind diese abgeschnitten.
Das
Der Modifikator „unbounded“ deaktiviert diesen Ausschnitt.
* Dann, wenn PI_HAT^2 < P(IBD=2), passt „Nudge“ das endgültige P(IBD=0/1/2) an.
Schätzungen zu einer theoretisch möglichen Konfiguration.
* Die Berechnung kann unterteilt werden mit --parallel.
--homozyg
--homozyg-snp [min. Var-Anzahl]
--homozyg-kb [minimale Länge]
--homozyg-density [maximale inverse Dichte (kb/var)]
--homozyg-gap [maximale Länge der internen Lücke in KB]
--homozyg-het [maximale Anzahl]
--homozyg-window-snp [Größe des Scanfensters]
--homozyg-window-het [maximale Anzahl an Treffern im Scanfenster]
--homozyg-window-missing [maximale Anzahl fehlender Anrufe im Scanfenster]
--homozyg-window-threshold [Mindesttrefferquote im Scanfenster]
Diese Befehle fordern eine Reihe von Homozygotie-Laufberichten an und ermöglichen Ihnen dies
Passen Sie an, wie sie generiert werden. * Wenn Sie mit allen Standardeinstellungen zufrieden sind
Einstellungen unten beschrieben, einfach
- --homozyg ohne Modifikatoren.
Andernfalls --homozyg lässt Sie a ändern
einige Binäreinstellungen: * 'group{-verbose}' fügt einen Bericht über Pools überlappender Läufe hinzu
of
Homozygotie.
(Automatisch eingestellt, wenn --homozyg-match ist anwesend.)
* Bei „group{-verbose}“ bewirkt „consensus-match“ eine paarweise Segmentierung
Übereinstimmungen werden vielmehr basierend auf den Varianten im Konsenssegment des Pools aufgerufen
als die Varianten im paarweisen Schnitt.
* Aufgrund der Funktionsweise des Scanfensteralgorithmus ist es möglich, dass a
berichteten, dass ROH an einige homozygote Varianten angrenzt.
Die „Verlängerung“
Der Modifikator bewirkt, dass sie in den gemeldeten ROH einbezogen werden, wenn dies nicht zu einem führen würde
Verstoß gegen die --homozyg-density gebunden.
* Standardmäßig werden die Segment-BP-Längen als [End-BP-Position] berechnet –
[Start-BP-Position] + 1.
Daher weichen die Berichte in der Regel geringfügig voneinander ab
von PLINK 1.07, das am Ende keine 1 hinzufügt.
Zum Prüfen
Zu Zwecken können Sie den Modifikator „subtract-1-from-lengths“ verwenden, um das Alte anzuwenden
Formel.
* Standardmäßig werden nur Homozygotieläufe mit mindestens 100 Varianten verwendet.
und einer Gesamtlänge von >= 1000 Kilobasen, sind angegeben.
Sie können diese ändern
Minimum mit --homozyg-snp und --homozyg-kb, Bzw.
* Standardmäßig muss ein ROH im Durchschnitt mindestens eine Variante pro 50 kb haben;
ändere diese Grenze mit --homozyg-density.
* Wenn zwei aufeinanderfolgende Varianten mehr als 1000 KB voneinander entfernt sind, werden sie standardmäßig angezeigt
kann nicht im selben ROH sein; ändere diese Grenze mit --homozyg-gap.
* Standardmäßig kann ein ROH eine unbegrenzte Anzahl heterozygoter Aufrufe enthalten;
Sie können mit eine Grenze festlegen --homozyg-het.
* Standardmäßig enthält das Scanfenster 50 Varianten; ändere dies mit
--homozyg-window-snp.
* Standardmäßig kann ein Treffer im Scanfenster höchstens 1 heterozygoten Treffer enthalten
Anruf und 5 fehlende Anrufe; Ändern Sie diese Grenzwerte mit --homozyg-window-het und
--homozyg-window-missing, Bzw.
* Standardmäßig gilt für die Aufnahme einer Variante in ein ROH der Treffer
Rate aller Scanfenster, die die Variante enthalten, muss mindestens 0.05 betragen; ändern
diese Schwelle mit --homozyg-window-threshold.
- Cluster
Clustern Sie Stichproben mithilfe einer paarweisen Ähnlichkeitsstatistik (normalerweise IBS). * Das „cc“
Der Modifikator erzwingt, dass jeder Cluster mindestens einen Fall und einen hat
steuern.
* Der Modifikator „group-avg“ bewirkt, dass Cluster basierend auf dem Durchschnitt verbunden werden
statt minimaler paarweiser Ähnlichkeit.
* Der Modifikator „missing“ bewirkt, dass das Clustering auf basiert
Identity-by-Missingness anstelle von Identity-by-State und schreibt eine durch Leerzeichen getrennte Datei
Identity-by-Missness-Matrix auf die Festplatte übertragen.
* Der Modifikator „only2“ bewirkt nur eine .cluster2-Datei (was eine gültige Eingabe ist).
für den --innerhalb) geschrieben werden; andernfalls werden zwei weitere Dateien erstellt.
* Standardmäßig werden IBS-Verbindungen nicht auf die gleiche Weise wie bei PLINK 1.07 unterbrochen
Die endgültigen Clusterlösungen unterscheiden sich tendenziell.
Dies ist im Allgemeinen harmlos.
Um das Testen zu vereinfachen, können Sie jedoch den Modifikator „old-tiebreaks“ zum Erzwingen verwenden
Emulation des alten Algorithmus.
--pca {zählen}
Berechnet eine varianzstandardisierte Beziehungsmatrix (verwenden Sie
--make-rel/--make-grm-gz/--make-grm-bin, um es zu sichern) und extrahiert die oberen 20
Hauptbestandteile. * Normalerweise ist es am besten, diese Berechnung an einem Marker durchzuführen
setzen in
ungefähres Verknüpfungsgleichgewicht.
* Sie können die Anzahl der PCs ändern, indem Sie einen numerischen Parameter übergeben. * Die „Kopfzeile“
Der Modifikator fügt der .eigenvec-Ausgabedatei eine Kopfzeile hinzu.
(Aus Kompatibilitätsgründen mit dem gleichnamigen GCTA-Flag ist standardmäßig kein Header vorhanden
Linie.)
* Der Modifikator „tabs“ bewirkt, dass die .eigenvec-Datei(en) durch Tabulatoren getrennt werden. * Der
Der Modifikator „var-wts“ fordert eine zusätzliche .eigenvec.var-Datei bei PCs an
ausgedrückt als Variantengewichte anstelle von Stichprobengewichten.
--Nachbar [n1] [n2]
(alias: --Nachbar) Geben Sie die IBS-Abstände von jeder Probe bis zu ihrem 1. bis XNUMX. an
n2-nächste Nachbarn, zugehörige Z-Scores und die Identitäten dieser Nachbarn.
Nützlich für die Erkennung von Ausreißern.
--assoc
--assoc
--Modell
Grundlegender Assoziationsanalysebericht. Angesichts eines Fall-/Kontrollphänotyps, --assoc
führt einen 1df-Chi-Quadrat-Alleltest durch, während --Modell Führt 4 weitere Tests durch als
gut (1df dominante Genwirkung, 1df rezessive Genwirkung, 2df genotypisch,
Cochran-Armitage-Trend). * Mit „fisher“/„fisher-midp“ lautet Fishers genauer Test
verwendet, um zu generieren
p-Werte.
„fisher-midp“ wendet auch die Mid-P-Anpassung von Lancaster an.
* 'perm' bewirkt, dass ein adaptiver Permutationstest durchgeführt wird. * 'mperm=[Wert]'
bewirkt einen max(T)-Permutationstest mit dem angegebenen
Anzahl der auszuführenden Replikationen.
* 'perm-count' bewirkt, dass der Permutationstestbericht stattdessen Zählungen enthält
von Frequenzen.
* 'zählt' Ursachen --assoc Allelzahlen statt Häufigkeiten zu melden. *
'set-test' testet die Bedeutung von Variantenmengen. Erfordert Permutation;
kann mit individuell angepasst werden --set-p/--set-r2/--set-max.
* 'dom', 'rec', 'gen' und 'trend' erzwingen die Verwendung des entsprechenden Tests
als Basis für --Modell Permutation.
(Standardmäßig ist das Wichtigste
Es wird das Ergebnis zwischen den allelischen, dominanten und rezessiven Tests verwendet.)
* „nur Trend“ bewirkt, dass nur der Trendtest durchgeführt wird. Gegeben eine quantitative
Phänotyp, --assoc führt normalerweise einen Wald-Test durch. * In diesem Fall bedeutet 'qt-means'
Modifikator bewirkt Mittelwert und Standard des Merkmals
Abweichungen stratifiziert nach Genotyp sind ebenfalls zu melden.
* 'lin' bewirkt die Berechnung der Lin-Statistik und macht sie zur Grundlage für
Mehrfachtestkorrekturen und Permutationstests.
Mehrere andere Flaggen (insbesondere --aperm) kann zum Anpassen verwendet werden
Permutationstest.
--mh
(alias: --cmh)
--bd
--mh2
--homog
Angesichts eines Fall-/Kontrollphänotyps und einer Reihe von Clustern: --mh berechnet 2x2xK
Cochran-Mantel-Haenszel-Statistiken für jede Variante, während --bd führt auch die
Breslow-Day-Test zur Homogenität des Odds Ratios. Permutations- und Variantensatztests
basierend auf der CMH-Statistik (Standard) oder der Breslow-Day-Statistik (wenn „perm-bd“ vorhanden ist).
unterstützt. Die folgenden ähnlichen Analysen sind ebenfalls verfügbar: * --mh2 tauscht die
Rollen des Fall-/Kontrollstatus und der Clustermitgliedschaft,
Durchführung eines Phänotyp-stratifizierten IxJxK Cochran-Mantel-Haenszel-Assoziationstests
zwischen Clusterzuordnungen und Genotypen.
* --homog führt eine Alternative zum Breslow-Day-Test aus, basierend auf
Partitionierung der Chi-Quadrat-Statistik.
--gxe {Kovariatenindex}
Angesichts sowohl eines quantitativen Phänotyps als auch einer mit geladenen Fall-/Kontrollkovariate
--covar zwei Gruppen definieren, --gxe vergleicht den daraus abgeleiteten Regressionskoeffizienten
Berücksichtigung nur der Mitglieder einer Gruppe für den daraus abgeleiteten Regressionskoeffizienten
Berücksichtigung nur der Mitglieder des anderen. Standardmäßig ist die erste Kovariate im
--covar Datei definiert die Gruppen; Verwenden Sie beispielsweise „--gxe 3“, um sie auf dem dritten basieren zu lassen
Kovariate stattdessen.
--linear
--logistisch
Multikovariate Assoziationsanalyse auf einem quantitativen (--linear) oder Fall/Kontrolle
(--logistisch) Phänotyp. Wird normalerweise mit verwendet --covar. * 'perm' verursacht normalerweise eine
adaptiver Permutationstest, der durchgeführt werden soll
der Haupteffekt, während 'mperm=[value]' einen max(T)-Permutationstest startet.
* 'perm-count' bewirkt, dass der Permutationstestbericht stattdessen Zählungen enthält
von Frequenzen.
* 'set-test' testet die Signifikanz von Variantensätzen.
Erfordert Permutation;
kann mit individuell angepasst werden --set-p/--set-r2/--set-max.
* Der Modifikator „Genotyp“ fügt einen additiven Effekt/Dominanzabweichung 2df hinzu
Joint-Test (0/1/2- und 0/1/0-Kodierung), während „hethom“ 0/0/1- und 0/1/0-Kodierung verwendet
stattdessen. Wenn auch eine Permutation angefordert wird, bewirken diese Modifikatoren, dass eine Permutation erfolgt
basierend auf dem gemeinsamen Test.
* „dominant“ und „rezessiv“ geben ein Modell an, das eine vollständige Dominanz annimmt oder
Rezessivität für das A1-Allel.
* „no-snp“ bewirkt, dass die Regression nur für den Phänotyp und den durchgeführt wird
Kovariaten, ohne Bezug auf Genomdaten.
Wenn Permutation auch ist
Auf Wunsch werden die Ergebnisse für alle Kovariaten gemeldet.
* 'hide-covar' entfernt kovariatenspezifische Zeilen aus dem Bericht. * Standardmäßig Sex
(männlich = 1, weiblich = 0) wird automatisch als hinzugefügt
Kovariate auf X-Chromosomenvarianten und nirgendwo sonst.
Der Modifikator „Geschlecht“.
bewirkt, dass es überall hinzugefügt wird, während „no-x-sex“ es ausschließt.
* „Interaktion“ fügt dem Modell Genotyp-x-Kovariaten-Interaktionen hinzu.
Dieses
kann nicht mit den üblichen Permutationstests verwendet werden; verwenden --Tests zu definieren
stattdessen die Permutationsteststatistik.
* 'Intercept' bewirkt, dass Intercepts in den Hauptbericht aufgenommen werden. * Für die Logistik
Bei Regressionen verursacht der Modifikator „Beta“ eine Regression
Koeffizienten anstelle von Quotenverhältnissen zu melden.
* Mit --linear, der Modifikator „Standard-Beta“ standardisiert den Phänotyp
und alle Prädiktoren auf den Mittelwert Null und die Einheitsvarianz vor der Regression.
--Dosierung [Allel-Dosierungsdatei]
--Dosierung [Listendatei] Liste
--write-dosage
Verarbeiten Sie (möglicherweise gezippte) Textdateien mit Dosierungsdaten der Hauptallelvarianten. Das
kann nicht mit einem regulären Eingabedateisatz verwendet werden; Stattdessen müssen Sie *nur* a angeben
.fam und möglicherweise eine .map-Datei, und Sie können keine anderen Befehle angeben. * PLINK
2.0 wird erstklassige Unterstützung für Genotyp-Wahrscheinlichkeiten bieten. Ein
Dann wird ein entsprechendes Datenimportflag bereitgestellt und --Dosierung wird in Rente gehen.
* Standardmäßig, --Dosierung geht davon aus, dass nur eine Alleldosierungsdatei vorhanden sein sollte
geladen.
Um mehrere Dateien anzugeben,
1. Erstellen Sie eine Masterliste mit einem Eintrag pro Zeile.
Normalerweise sind es zwei
Unterstützte Formate für diese Liste: nur ein Dateiname pro Zeile oder Varianten-Stapelnummern
in der ersten Spalte und Dateinamen in der zweiten.
2. Geben Sie als erstes den Namen dieser Liste an --Dosierung Parameter. 3. Fügen Sie die hinzu
Modifikator „Liste“.
* Standardmäßig, --Dosierung geht davon aus, dass die Alleldosierungsdatei(en) einen Header enthalten
Zeile, die „SNP“ in Spalte i+1, „A1“ in Spalte i+j+2, „A2“ in Spalte i+j+3 enthält,
und Beispiel-FID/IIDs ab Spalte i+j+k+4. (i/j/k sind normalerweise Null, aber
kann mit „skip0“, „skip1“ bzw. „skip2“ geändert werden.) Wenn ein solcher Header
Zeile ist nicht vorhanden, * wenn alle Proben in der gleichen Reihenfolge wie in der erscheinen
.fam-Datei,
Sie können den Modiifer „noheader“ verwenden.
* Andernfalls verwenden Sie den Modifikator „sepheader“ und hängen Sie Beispiel-ID-Dateinamen an
zu Ihren „Listen“-Dateieinträgen.
* Mit dem Modifikator „Format“ können Sie die Anzahl der verwendeten Werte angeben
repräsentieren jede Dosierung.
'format=1' gibt normalerweise ein einzelnes 0..2 A1 an
erwartete Anzahl; „dose1“ ändert dies auf eine Frequenz von 0..1.
'format=2'
(Standardeinstellung) zeigt eine homozygote A0-Wahrscheinlichkeit von 1 an, gefolgt von einer Het-Wahrscheinlichkeit von 1
Wahrscheinlichkeit, während „format=3“ 0..1 hom A1, 0..1 het, 0..1 hom A2 angibt.
* 'Zout' bewirkt, dass die Ausgabedatei gkomprimiert wird. * Normalerweise eine Assoziationsanalyse
ist durchgeführt. 'Standard-Beta' und
„Sex“ verhalten sich so, wie sie es sollen --linear/--logistik.
„case-control-freqs“ bewirkt, dass Fall- und Kontroll-Allelfrequenzen gemeldet werden
separat.
* Es gibt drei alternative Modi, die die Assoziationsanalyse veranlassen
übersprungen werden. * 'occur' fordert einen einfachen Variantenvorkommensbericht an. *
--write-dosage verursacht eine einfache zusammengeführte Datei, die dem „Format“ entspricht.
Spezifikation (ohne „dose1“), die generiert werden soll.
* --Spielstand wendet ein lineares Bewertungssystem auf die Dosierungen an.
--Lasso [h2-Schätzung] {min. Lambda}
Schätzen Sie die Effektgrößen der Varianten mithilfe der LASSO-Regression.
Sie müssen eine
additive Heritabilitätsschätzung zur Kalibrierung der Regression. Beachten Sie, dass diese Methode
Möglicherweise ist eine sehr große Stichprobengröße (z. B. Hunderttausende) erforderlich, um wirksam zu sein
auf komplexen polygenen Merkmalen.
--test-missing
Überprüfen Sie mithilfe von Fisher den Zusammenhang zwischen Fehlen und Fall-/Kontrollstatus
genauer Test. Der Modifikator „midp“ bewirkt, dass die Mid-p-Anpassung von Lancaster angewendet wird.
--make-perm-pheno [kt]
Generieren Sie Phänotyp-Permutationen und schreiben Sie sie auf die Festplatte, ohne eine aufzurufen
Assoziationstest.
--tdt
Berichten Sie über Übertragungsungleichgewichtsteststatistiken anhand der gegebenen Fall-/Kontrollphänotypen
und Stammbauminformationen. * Vor der Hauptprüfung wird eine Mendel-Fehlerprüfung durchgeführt
Tests; beleidigend
Genotypen werden bei dieser Analyse als fehlend behandelt.
* Standardmäßig basiert der grundlegende TDT-p-Wert auf einem Chi-Quadrat-Test, sofern nicht
Sie fordern den exakten Binomialtest mit „exact“ oder „exact-midp“ an.
* 'perm'/'mperm=[value]' fordert eine familienbasierte adaptive oder max(T)
Permutationstest.
Standardmäßig lautet die Permutationsteststatistik
grundlegender TDT-p-Wert; 'parentdt1'/'parentdt2' verursachen parentTDT oder einen kombinierten Test
stattdessen sind jeweils p-Werte zu berücksichtigen.
* 'set-test' testet die Signifikanz von Variantensätzen.
Das kann nicht verwendet werden
mit genauen Tests vorerst.
Der Modifikator „poo“ bewirkt, dass stattdessen eine Analyse des übergeordneten Ursprungs durchgeführt wird, mit
Übertragungen von heterozygoten Vätern und heterozygoten Müttern berücksichtigt
separat. * Die Analyse des Ursprungs-Elternteils unterstützt derzeit keine exakte Analyse
Tests. * Standardmäßig ist die Permutationsteststatistik absolut
Z-Score des Herkunftselterntests; 'pat'/'mat' verursachen väterliche oder mütterliche TDT
Stattdessen sind Chi-Quadrat-Statistiken zu berücksichtigen.
--qfam
--qfam-parents
--qfam-between
--qfam-total
Familienbasierter QFAM-Assoziationstest für quantitative Merkmale. * Eine Mendel-Fehlerprüfung
wird vor den Haupttests durchgeführt; beleidigend
Genotypen werden bei dieser Analyse als fehlend behandelt.
* Dieses Verfahren erfordert eine Permutation.
'perm' und 'perm-count' haben das
übliche Bedeutungen.
Allerdings gibt „mperm=[value]“ lediglich eine feste Zahl an
von Permutationen; Die Methode unterstützt keinen ordnungsgemäßen max(T)-Test.
* Der Modifikator „emp-se“ fügt BETA und EMP_SE (empirischer Standardfehler für) hinzu
beta)-Felder in die .perm-Ausgabedatei.
--kommentieren [PLINK-Bericht]
Fügen Sie Anmerkungen zu einem variantenbasierten PLINK-Bericht hinzu.
Dies erfordert eine
Anmerkungsquelle: * 'attrib=[file]' gibt eine (möglicherweise komprimierte) Attributdatei an.
* 'ranges=[file]' gibt eine Gen-/Range-Listendatei an. (Beide Quelltypen können sein
gleichzeitig angegeben werden.) Die folgenden Optionen werden ebenfalls unterstützt: *
'filter=[file]' verursacht nur Varianten innerhalb eines der Bereiche in der Datei
in den neuen Bericht aufzunehmen.
* 'snps=[file]' bewirkt, dass nur in der Datei benannte Varianten einbezogen werden
der neue Bericht.
* Der Modifikator „NA“ führt dazu, dass nicht annotierte Varianten „NA“ anstelle von „“ haben.
in der ANNOT-Spalte des neuen Berichts, während der Modifikator „prune“ sie ausschließt
vollständig.
* Der Modifikator „block“ ersetzt die einzelne ANNOT-Spalte durch eine 0/1-codierte Spalte
Spalte für jede mögliche Anmerkung.
* Mit „Bereiche“,
* 'subset=[file]' bewirkt, dass nur die in der Subset-Datei genannten Intervalle angezeigt werden
aus der Ranges-Datei geladen.
* Intervallanmerkungen werden normalerweise mit einer vorzeichenbehafteten Distanz in Klammern versehen
zur Intervallgrenze (0, wenn die Variante innerhalb des Intervalls liegt; dies ist
immer wahr ohne --Grenze). Sie können mit dem Modifikator „minimal“ ausgeschlossen werden.
* Der Modifikator „Distanz“ fügt die Spalten „DIST“ und „SGN“ hinzu, die das Vorzeichen beschreiben
Abstand zum nächstgelegenen Intervall.
* Wann --pfilter vorhanden ist, werden hohe p-Werte herausgefiltert.
--Büschel [PLINK-Berichtsdateiname(n)...]
Bericht(e) zur Prozessassoziationsanalyse mit „SNP“- und p-Wert-Spalten, organisierend
Ergebnisse durch LD-basierte Klumpen. Mehrere Dateinamen können durch Leerzeichen oder getrennt werden
Kommas.
--gene-report [PLINK-Bericht] [Genbereichsdatei]
Generieren Sie einen genbasierten Bericht aus einem variantenbasierten Bericht. * Wann --pfilter is
Vorhandene, hohe p-Werte werden herausgefiltert. * Wann --Extrakt (ohne 'Bereich') ist
vorhanden, nur die in der genannten Varianten
--Extrakt Datei werden berücksichtigt.
--meta-analyse [PLINK-Berichtsdateinamen...]
--meta-analyse [PLINK-Berichtsdateinamen...] +
Führen Sie eine Metaanalyse für mehrere variantenbasierte Berichte mit „SNP“ und „SE“ durch.
Felder. * Normalerweise muss in jeder Eingabe auch ein „ODER“-Odds-Ratio-Feld vorhanden sein
Datei.
Mit 'logscale', 'BETA' Log-Odds-Werten/Regressionskoeffizienten
werden stattdessen erwartet, aber der generierte Bericht enthält weiterhin das Quotenverhältnis
Schätzungen. Bei „qt“ sind sowohl Eingabe- als auch Ausgabewerte Regressions-Betas.
* Die Felder „CHR“, „BP“ und „A1“ sind normalerweise ebenfalls erforderlich.
„No-Map“-Ursachen
Sie sollen alle ignoriert werden, während „kein Allel“ dazu führt, dass nur „A1“ ignoriert wird.
* Wenn „A2“-Felder vorhanden sind und weder „no-map“ noch „no-allele“ vorhanden waren
angegeben, werden A1/A2-Allel-Flips ordnungsgemäß gehandhabt.
Ansonsten A1
Nichtübereinstimmungen werden verworfen.
* „Studie“ bewirkt, dass studienspezifische Effektschätzungen im zusammengefasst werden
Metaanalysebericht.
* 'report-all' bewirkt, dass Varianten nur in einer einzigen Eingabedatei vorhanden sind
im Metaanalysebericht enthalten.
* „weighted-z“ fordert gewichtete Z-Score-basierte p-Werte an (wie von berechnet).
(METAL-Software von Abecasis Lab) zusätzlich zur üblichen inversen Varianz-basierten Methode
Analyse. Dies erfordert P- und effektive Stichprobengrößenfelder.
* Wann --Extrakt (ohne 'Bereich') ist vorhanden, nur die in der genannten Varianten
--Extrakt Datei werden berücksichtigt.
* Sofern nicht „no-map“ angegeben ist, werden auch Chromosomenfilter berücksichtigt.
--fast-epistasis
--Epistase
Suchen Sie nach epistatischen Interaktionen.
--fast-epistasis prüft 3x3-Verbindung
Genotyp-Zähltabellen und gilt nur für Fall-/Kontrollphänotypen, während
--Epistase führt eine lineare oder logistische Regression durch. * Standardmäßig, --fast-epistasis
verwendet den allelbasierten PLINK 1.07-Test. Zwei
Neuere Tests werden jetzt unterstützt: „boost“ ruft den eingeführten Likelihood-Ratio-Test auf
von Wan X et al. (2010) BOOST: Ein schneller Ansatz zur Erkennung von Gen-Gen-Interaktionen
in genomweiten Fall-Kontroll-Studien, während „Joint-Effects“ das Gelenk anwendet
Wirkungstest eingeführt in Ueki M, Cordell HJ (2012) Verbesserte Statistiken für
Genomweite Interaktionsanalyse.
* Das Original --fast-epistasis Der Test wendet normalerweise die Varianz und an
Korrekturen leerer Zellen, die in der Arbeit von Ueki und Cordell vorgeschlagen werden.
Etwas deaktivieren
Verwenden Sie für sie den Modifikator „no-ueki“.
* „nur Fall“ fordert einen reinen Falltest anstelle eines Fall-/Kontrolltests an. * Standardmäßig,
Es werden alle Variantenpaare im gesamten Genom getestet.
Um nur Variantenpaare innerhalb eines einzelnen Satzes zu testen, fügen Sie den Modifikator „set-by-set“ hinzu
und laden Sie genau einen Satz mit --einstellen/--make-set; mit genau zwei geladenen Sätzen, alle
Varianten in einem Satz werden gegen alle Varianten im anderen getestet. 'von allen festgelegt'
testet stattdessen alle Varianten in einem Satz gegen das gesamte Genom.
* 'nop' entfernt p-Werte aus dem Hauptbericht. * Diese Berechnungen können sein
unterteilt mit --parallel; Jedoch...
--epistasis-summary-merge [gemeinsames Dateipräfix] [ct]
Wenn eine --{fast-}Epistase-Job ist unterteilt in --parallel, der Hauptbericht kann sein
am Ende durch Anwenden von Unix 'cat' auf die übliche Weise zusammengesetzt, aber die
.summary.1, .summary.2, ... Dateien erfordern möglicherweise eine spezielle Zusammenführung.
--epistasis-summary-merge kümmert sich um Letzteres.
--twolocus [Varianten-ID] [Varianten-ID]
Bericht zur Zählung des gemeinsamen Genotyps an zwei Standorten.
--Spielstand [Dateiname] {i} {j} {k}
Wenden Sie auf jede Probe ein lineares Bewertungssystem an. Die Eingabedatei sollte eine Zeile haben
pro bewerteter Variante. Varianten-IDs werden aus Spalte #i gelesen, Allelcodes werden gelesen
aus Spalte #j, und die Bewertungen werden aus Spalte #k gelesen, wobei i standardmäßig 1, j ist
ist standardmäßig i+1 und k standardmäßig j+1. * Der Modifikator „header“ bewirkt den ersten
nicht leere Zeile der Eingabedatei an
ignoriert werden; ansonsten, --Spielstand geht davon aus, dass es keine Kopfzeile gibt.
* Standardmäßig handelt es sich bei den Endergebnissen um Durchschnittswerte der gültigen Bewertungen pro Variante.
Der Modifikator „sum“ bewirkt, dass stattdessen Summen gemeldet werden.
(Das kann nicht sein
wird mit „No-Mean-Imputation“ verwendet.
Und aus Gründen der Abwärtskompatibilität lautet „sum“.
automatisch mit Dosierungsdaten eingeschaltet, es sei denn, „No-Summe“ ist angegeben.)
* Standardmäßig tragen Kopien des unbenannten Allels null zur Wertung bei, während
Fehlende Genotypen tragen einen Anteil bei, der proportional zur geladenen Menge ist (via). --read-freq)
oder unterstellte Allelfrequenz. Stattdessen fehlende Beobachtungen verwerfen (abnehmend).
der Nenner im endgültigen Durchschnitt, wenn dies geschieht), verwenden Sie die
Modifikator „no-mean-imputation“.
* Alternativ können Sie den Modifikator „Mitte“ verwenden, um alle Ergebnisse dorthin zu verschieben
bedeuten Null.
* Dieser Befehl kann mit Dosierungsdaten verwendet werden.
Standardmäßig die Spalte „CNT“.
wird in diesem Fall in der Ausgabedatei weggelassen; Verwenden Sie „include-cnt“, um es beizubehalten. Auch,
Beachten Sie, dass die Werte mit 0 Dosierungen multipliziert werden, nicht mit 1 diploiden Allelzahlen.
es sei denn, der Modifikator „doppelte Dosierung“ ist vorhanden.
--write-var-ranges [block ct]
Teilen Sie die Variantenmenge in gleich große Blöcke auf.
(Kann verwendet werden mit
--snps um einen Job auf mehrere Maschinen aufzuteilen.)
Die folgenden anderen Flags werden unterstützt. (Die Reihenfolge der Vorgänge ist unter beschrieben
https://www.cog-genomics.org/plink2/order .)
--Skript [fname]: Befehlszeilenoptionen aus der Datei einschließen.
--Wiederholung {Protokoll}
: Befehle im Protokoll erneut ausführen (Standard „plink.log“).
--Version
: Vor dem Beenden nur die Versionsnummer anzeigen.
--Leise
: Ausgabe an die Konsole unterdrücken.
--gplink
: Reserviert für die Zusammenarbeit mit gPLINK.
--missing-genotype [char]: Fehlenden Genotypcode festlegen (normalerweise „0“).
--double-id
: Stellen Sie sowohl FIDs als auch IIDs auf die VCF/BCF-Proben-ID ein.
--const-fid {ICH WÜRDE}
: Alle FIDs auf die angegebene Konstante setzen (Standard '0').
--id-delim {D}
: Proben-IDs als [FID][d][IID] analysieren (Standardtrennzeichen „_“).
--vcf-idspace-to [c]: Leerzeichen in Beispiel-IDs in das angegebene Zeichen umwandeln.
--biallelic-only : VCF-Varianten mit 2+ alt überspringen. Allele.
--vcf-min-qual [Wert]
: VCF-Varianten mit niedriger/fehlender QUAL überspringen.
--vcf-filter {Ausnahme(n)...}
: Varianten mit FILTER-Fehlern überspringen.
--vcf-require-gt
: Varianten ohne GT-Feld überspringen.
--vcf-min-gq [Wert]
: No-Call eines Genotyps, wenn GQ unter dem angegebenen Schwellenwert liegt.
--vcf-min-gp [Wert]
: No-Call eines Genotyps, wenn der 0-1 skalierte GP unter dem angegebenen Schwellenwert liegt.
--vcf-half-call [M]
: Geben Sie an, wie '0/.' und ähnliche VCF-GT-Werte sollten behandelt werden. Die folgende
Drei Modi werden unterstützt: * 'error'/'e' (Standard) gibt Fehler aus und meldet Zeilennummer.
* 'haploid'/'h' behandelt sie als haploide Aufrufe. * 'missing'/'m' behandelt sie als
fehlt.
--oxford-single-chr [chr nm]: Geben Sie die Einzelchromosom-.gen-Datei mit an
vernachlässigbare erste Spalte.
--oxford-pheno-name [col nm]: Benannten Phänotyp aus der .sample-Datei importieren.
--hard-call-threshold [Wert]
: Wenn ein Dateisatz im Oxford-Format geladen wird, werden Aufrufe ausgeführt
--hard-call-threshold zufällig
mit einem Unsicherheitsgrad von mehr als 0.1 werden normalerweise als fehlend behandelt. Du kannst
Passen Sie diesen Schwellenwert an, indem Sie einen numerischen Parameter angeben, oder randomisieren Sie alle Anrufe mit
'zufällig'.
--missing-code {string list}: Durch Kommas getrennte Liste fehlender Phänotypen
(alias: --missing_code)
Werte für Dateisätze im Oxford-Format (def. „NA“).
--simulate-ncases [Anzahl]
: Einstellen --simulieren Fallanzahl (Standard 1000).
--simulate-ncontrols [Nein]
: Einstellen --simulieren Kontrollanzahl (Standard 1000).
--simulate-prevalence [p]: Eingestellt --simulieren Krankheitsprävalenz (Standard 0.01).
--simulate-n [Anzahl]
: Einstellen --simulate-qt Beispielanzahl (Standard 1000).
--simulate-label [Präfix]: Festgelegt --simulieren{-qt} FID/IID-Namenspräfix.
--simulate-missing [freq]: Eingestellt --simulieren{-qt} fehlende Genotyphäufigkeit.
--allow-extra-chr
: Nicht erkannte Chromosomencodes zulassen. Die '0'
(alias: --aec)
Der Modifikator bewirkt, dass sie so behandelt werden, als wären sie auf Null gesetzt worden.
--chr-set [autosome ct] :
Geben Sie einen nichtmenschlichen Chromosomensatz an.
Der erste Parameter legt die Anzahl fest
diploide Autosomenpaare, wenn positiv, oder haploide Chromosomen, wenn negativ. Gegeben
diploide Autosomen, die übrigen Modifikatoren weisen auf das Fehlen der genannten hin
nicht-autosomale Chromosomen.
--Kuh/--dog/--horse/--mouse/--rice/--sheep : Abkürzungen für diese Arten.
--autosome-num [Wert]
: Alias für „--chr-set [Wert] no-y no-xy no-mt“.
--cm-map [fname-Muster] {chr}: Verwenden Sie zum Festlegen Rekombinationskarten im SHAPEIT-Format
Centimorgan-Positionen. Um mehr als ein Chromosom zu verarbeiten, fügen Sie ein „@“ in das ein
erster Parameter, bei dem der Chrom. Nummer gehört, z.B
'genetische_map_chr@_combined_b37.txt'.
--zero-cms
: Centimorgan-Positionen auf Null setzen.
--pheno [fname]
: Phänotypdaten aus der angegebenen Datei laden, anstatt die Werte in zu verwenden
Haupteingabedateisatz.
--all-pheno
: Für grundlegende Assoziationstests durchlaufen Sie alle Phänotypen in --pheno Datei.
--mpheno [Nein]
: Phänotyp aus Spalte (n+2) laden --pheno Datei.
--pheno-name [c]: Wenn --pheno Datei hat eine Kopfzeile, verwenden Sie die Spalte mit
Vorname.
--pheno-merge
: Wenn der Haupteingabedateisatz einen Phänotypwert für eine Probe enthält, der
--pheno Wenn die Datei dies nicht tut, verwenden Sie den ursprünglichen Wert, anstatt den Phänotyp als zu behandeln
fehlt.
--missing-phenotype [v]: Fehlenden Phänotypwert festlegen (normalerweise). -9).
- 1 : Erwarten Sie, dass Fall-/Kontrollphänotypen als 0 = Kontrolle, 1 = Fall statt kodiert werden
die übliche 0 = fehlt, 1 = Kontrolle, 2 = Fall.
--make-pheno [fn] [val]: Definieren Sie einen neuen Fall-/Kontrollphänotyp.
Wenn der val-Parameter „*“ ist, sind alle in der angegebenen Datei aufgeführten Beispiele Fälle und
jeder andere ist eine Kontrolle. (Beachten Sie, dass dies in einigen Shells erforderlich ist
Setzen Sie das * in Anführungszeichen. Ansonsten sind alle Stichproben mit Eintrag in der dritten Spalte gleich
zum val-Parameter gehören Fälle, und alle anderen in der Datei erwähnten Beispiele sind es
Kontrollen.
--tail-pheno [Lt] {Hbt}: Einen skalaren Phänotyp auf einen Fall/eine Kontrolle herunterkodieren
Phänotyp. Alle Proben mit Phänotypwerten größer als Hbt sind Fälle, und zwar alle
mit Werten kleiner oder gleich Lt sind Kontrollen. Wenn Hbt nicht spezifiziert ist, ist dies der Fall
gleich Lt; andernfalls werden die dazwischen liegenden Phänotypwerte auf „fehlend“ gesetzt.
--covar [Dateiname] : Kovariatendatei angeben.
--covar-name [...]
: Kovariate(n) angeben in --covar Datei nach Namen. Trennen Sie mehrere Namen mit
Geben Sie Leerzeichen oder Kommas ein und verwenden Sie Bindestriche, um Bereiche zu kennzeichnen.
--covar-nummer [...]
: Kovariate(n) angeben in --covar Datei nach Index.
--no-const-covar
: Konstante Kovariaten ausschließen.
--innerhalb [F]
: Geben Sie anfängliche Clusterzuweisungen an.
--mwithin [Nein]
: Clusterzuweisungen aus Spalte n+2 laden.
--Familie
: Erstellen Sie einen Cluster für jede Familien-ID.
--loop-assoc [F]
: Führen Sie die angegebenen Fall-/Kontrollzuordnungsbefehle einmal für jeden Cluster im aus
Datei, wobei die Clustermitgliedschaft als Phänotyp verwendet wird.
--einstellen [Dateiname]
: Sätze aus einer .set-Datei laden.
--set-names [Name(n)...]
: Nur in der Befehlszeile benannte Sätze laden. Verwenden Sie Leerzeichen, um mehrere Namen zu trennen.
--Teilmenge [Dateiname]
: Nur Sätze laden, die in der angegebenen Textdatei benannt sind.
--set-collapse-all [Name des Sets]: Alle Sets zusammenführen.
--complement-sets
: Alle Sätze invertieren. (Namen erhalten das Präfix „C_“.)
--make-set-complement-all [S] : --set-collapse-all + Umkehrung.
--make-set [Dateiname]
: Definieren Sie Sätze aus einer Liste benannter BP-Bereiche.
--make-set-border [KB]
: Regionen hineinstrecken --make-set Datei.
--make-set-collapse-group
: Definieren Sie Sätze aus Gruppen anstelle von Sätzen in --make-set Datei.
--halten [Dateiname]
: Alle nicht in der Datei genannten Proben ausschließen.
--Löschen [Dateiname]
: Alle in der Datei genannten Proben ausschließen.
--keep-fam [Dateiname]: Alle Familien ausschließen, die nicht in der Datei genannt werden.
--remove-fam [fname]
: Alle in der Datei genannten Familien ausschließen.
--Extrakt [f]: Alle Varianten ausschließen, die nicht in der Datei genannt sind.
--ausschließen [f]: Alle in der Datei genannten Varianten ausschließen.
--keep-clusters [Dateiname]
: Diese können einzeln oder in verwendet werden
--keep-cluster-names [Name(n)...]
Kombination, um eine Liste der zu behaltenden Cluster zu definieren; alle Proben, die nicht in einem Cluster sind
aus dieser Liste werden dann ausgeschlossen. Verwenden Sie Leerzeichen, um Clusternamen zu trennen
--keep-cluster-names.
--remove-clusters [Dateiname]
: Alle in der Datei genannten Cluster ausschließen.
--remove-cluster-names [Name(s)...]: Die benannten Cluster ausschließen.
--Gen [sets...]: Varianten ausschließen, die nicht in einem in der Befehlszeile genannten Satz enthalten sind.
(Trennen Sie mehrere Satznamen durch Leerzeichen.)
--gene-all
: Varianten ausschließen, die keinem Satz angehören. (PLINK 1.07 hat das automatisch getan
dies unter bestimmten Umständen.)
--Attribut [f] {att lst}: Gegeben sei eine Datei, die Varianten Attribute zuweist, und a
--attrib-indiv [f] {a}
Durch Kommas getrennte Liste (ohne Leerzeichen) von Attributnamen, entfernen
Varianten/Beispiele, die entweder in der Datei fehlen oder keine davon haben
aufgeführten Attribute. Wenn einigen Attributnamen in der Liste ein „-“ vorangestellt ist, sind sie
werden stattdessen als „negative Übereinstimmungsbedingungen“ behandelt: Varianten mit mindestens einer
negative Übereinstimmungsattribute werden entfernt. Das erste Zeichen in der Liste darf kein a sein
'-', aufgrund der Funktionsweise der Befehlszeilenanalyse; Fügen Sie zur Umgehung ein Komma voran
Dies.
--chr [chrs...]
: Alle Varianten ausschließen, die nicht auf dem/den angegebenen Chromosom(en) liegen. Gültige Entscheidungen für Menschen
sind 0 (unplatziert), 1-22, X, Y, XY und MT. Trennen Sie mehrere Chromosomen mit
Leerzeichen und/oder Kommas und verwenden Sie einen Bindestrich (keine angrenzenden Leerzeichen zulässig), um a zu kennzeichnen
Bereich, z. B. '--chr 1-4, 22, xy'.
--not-chr [...]
: Umkehrung von --chr (Varianten auf den aufgeführten Chromosomen ausschließen).
--autosome
: Alle nicht-autosomalen Varianten ausschließen.
--autosome-xy
: Alle nicht-autosomalen Varianten ausschließen, mit Ausnahme derjenigen mit dem Chromosomencode XY
(pseudoautosomale Region von X).
--snps-only : Varianten mit mehrstelligen Allelcodes ausschließen.
--aus [Var-ID]
: Verwenden Sie ID(s), um einen zu ladenden Variantenbereich anzugeben. Wenn benutzt
--zu [Var-ID] zusammen, beide Varianten müssen auf demselben Chromosom liegen.
--snp [var ID]: Geben Sie eine einzelne Variante zum Laden an.
--exclude-snp []: Geben Sie eine einzelne Variante an, die ausgeschlossen werden soll.
--Fenster
[kbs]: Mit --snp or --exclude-snp, lädt/schließt alle Varianten innerhalb der Hälfte aus
angegebener kb-Abstand des genannten.
--from-bp [pos]
: Verwenden Sie physische Positionen, um einen Variantenbereich zu definieren
--to-bp
[pos] laden. --from-kb/--to-kb/--from-mb/--to-mb Dezimalzahl zulassen
--from-kb [pos]
Werte. Sie müssen auch ein einzelnes Chromosom angeben (mit
--to-kb
[pos] zB --chr), wenn Sie diese Flags verwenden.
--from-mb [pos]
--Grab
[pos]
--snps [Var-IDs...]
: Verwenden Sie IDs, um Variantenbereiche anzugeben, die geladen werden sollen, oder
--exclude-snps [...]
ausschließen. Beispiel: „--snps rs1111-rs2222, rs3333, rs4444“.
--dünn [p]
: Varianten nach dem Zufallsprinzip entfernen und jede mit prob beibehalten. P.
--thin-count [n]: Varianten nach dem Zufallsprinzip entfernen, bis n davon übrig sind.
--bp-space [bps]: Varianten entfernen, sodass jedes Paar nicht näher als das ist
gegebener BP-Abstand. (Entspricht VCFtools --dünn.)
--thin-indiv [p]
: Proben nach dem Zufallsprinzip entfernen und mit prob aufbewahren. P.
--thin-indiv-count [Nein]
: Proben nach dem Zufallsprinzip entfernen, bis n davon übrig sind.
--Filter [f] [val(s)...]: Alle Proben ohne Eintrag in der dritten Spalte ausschließen
Die angegebene Datei entspricht einem der angegebenen durch Leerzeichen getrennten Werte.
--mfilter [Nein]
: Stattdessen mit der (n+2)ten Spalte abgleichen.
--geno {val}
: Varianten mit fehlenden Anrufhäufigkeiten über einem Schwellenwert ausschließen (Standard).
0.1). (Beachten Sie, dass der Standardschwellenwert nur angewendet wird, wenn --geno aufgerufen
ohne Parameter; Wann --geno wird nicht aufgerufen, es fehlt kein Aufruf pro Variante
Frequenzobergrenze wird überhaupt durchgesetzt. Andere Standardschwellenwerte für Einschluss/Ausschluss
funktionieren genauso.)
--Geist {val}
: Stichproben mit fehlenden Anrufhäufigkeiten ausschließen, die über einem Schwellenwert liegen (Standard).
0.1).
--oblig-missing [f1] [f2]: Geben Sie Blöcke fehlender Genotypaufrufe an
--geno/--denken Sie daran, es zu ignorieren. Die erste Datei sollte Varianten-IDs enthalten
Spalten- und Block-IDs in der zweiten, während die zweite Datei FIDs in der haben sollte
erste Spalte, IIDs in der zweiten und Block-IDs in der dritten.
--Pflaume
: Proben mit fehlenden Phänotypen entfernen.
--maf {Häufigkeit}
: Varianten mit geringer Allelfrequenz unter einem Schwellenwert ausschließen (Standard).
0.01).
--max-maf [Häufigkeit]
: Varianten mit MAF über dem Schwellenwert ausschließen.
--Mac [kt]
: Varianten mit geringerer Allelzahl ausschließen, die unter der liegt
(alias: --min-ac)
gegebener Schwellenwert.
--max-mac [kt]
: Varianten mit einer kleineren Allelzahl größer als ausschließen
(alias: --max-ac)
die angegebene Schwelle.
--maf-succ
: Regel der Nachfolge-MAF-Schätzung (verwendet in EIGENSOFT). Angesichts j Beobachtungen von
ein Allel und k >= j Beobachtungen des anderen, schließen daraus einen MAF von (j+1) / (j+k+2),
anstelle des Standardwerts j / (j+k).
--read-freq [fn]: Schätzen Sie MAFs und Heterozygotenhäufigkeiten anhand der Angaben
--Frequenz{x}-Bericht anstelle des Eingabedateisatzes.
--hwe [P] : Varianten mit Hardy-Weinberg ausschließen
Gleichgewichtstest-p-Werte unter einem Schwellenwert.
--mich [Fernseher] : Trios und Varianten mit Mendel-Fehler herausfiltern
Raten, die die angegebenen Schwellenwerte überschreiten.
--me-exclude-one {Verhältnis}: Machen --mich Schließen Sie nur eine Probe pro Trio aus.
--qual-scores [f] {qcol} {IDcol} {skip} : Varianten herausfiltern mit
Qualitätswerte außerhalb des zulässigen Bereichs. Der Standardbereich ist jetzt [0, \infty ).
--qual-threshold [Mindestqualifikationspunktzahl]
: Einstellen --qual-scores Range-Boden.
--qual-max-threshold [maximale Qualifikationspunktzahl]
: Einstellen --qual-scores Bereichsdecke.
--erlaube-keinen-Sex
: Behandeln Sie Proben mit mehrdeutigem Geschlecht nicht so, als ob bei der Analyse Phänotypen fehlen würden
Befehle. (Automatisch /w --kein Sex.)
--muss-Sex haben
: Erzwingen Sie das Fehlen mehrdeutiger Geschlechtsphänotypen
--Bett machen/--make-just-fam/--recode/--write-covar.
--filter-cases
: Nur Fälle in die aktuelle Analyse einbeziehen.
--filter-controls
: Nur Steuerelemente einbeziehen.
--filter-males
: Nur Männer einbeziehen.
--filter-females
: Berücksichtigen Sie nur Frauen.
--filter-founders
: Nur Gründer einbeziehen.
--filter-nonfounders : Nur Nichtgründer einbeziehen.
--Nichtgründer
: Nichtgründer in Allelfrequenz-/HWE-Berechnungen einbeziehen.
--make-founders : Eltern-IDs für diese löschen
mit 1+ fehlenden Eltern.
--recode-allel [fn]: Mit --umcodieren A/A-Transponierung/AD, Zählung der in genannten Allele
der Datei (ansonsten werden immer A1-Allele gezählt).
--output-chr [MT-Code]: Chromosomenkodierungsschema in Ausgabedateien festlegen durch
Bereitstellung des gewünschten menschlichen mitochondrialen Codes. (Optionen sind „26“, „M“, „MT“,
„0M“, „chr26“, „chrM“ und „chrMT“.)
--output-missing-genotype [ch]: Legen Sie den Code fest, der zur Darstellung von Fehlen verwendet wird
Genotypen in Ausgabedateien (normalerweise die --missing-genotype Wert).
--output-missing-phenotype [s]: Legen Sie die Zeichenfolge fest, die zur Darstellung von Fehlen verwendet wird
Phänotypen in Ausgabedateien (normalerweise die --missing-phenotype Wert).
--zero-cluster [f]: In Kombination mit --innerhalb/--Familie, Blöcke festlegen
Genotyp-Aufrufe fehlen. Die Eingabedatei sollte zunächst Varianten-IDs enthalten
Spalten- und Cluster-IDs im zweiten. Dies muss nun mit verwendet werden --Bett machen und nein
andere Ausgabebefehle.
--set-hh-missing : Ursache --Bett machen und --umcodieren heterozygot haploid einstellen
Genotypen fehlen.
--split-x [bp1] [bp2] : Ändert den Chromosomencode aller X-Chromosomen
--split-x [bauen]
Varianten mit bp-Position <= bp1 oder >= bp2 zu XY. Die folgenden Build-Codes sind
Als Abkürzung unterstützt: * 'b36'/'hg18' = NCBI 36, 2709521/154584237 * 'b37'/'hg19'
= GRCh37, 2699520/154931044 * 'b38'/'hg38' = GRCh38, 2781479/155701383 Standardmäßig ist
PLINK-Fehler treten auf, wenn keine Varianten davon betroffen wären --split-x; das „No-Fail“
Der Modifikator (nützlich in Skripten) überschreibt dies.
--merge-x
: XY-Chromosom wieder mit X verschmelzen.
--set-me-missing
: Ursache --Bett machen um Mendel-Fehler auf „fehlend“ zu setzen.
--fill-missing-a2 : Ursache --Bett machen um alle fehlenden Anrufe zu ersetzen
homozygote A2-Anrufe.
--set-missing-var-ids [T]
: Gegeben ist eine Vorlagenzeichenfolge mit einem „@“, wo der Chromosomencode stehen soll, und einem „#“
wo die BP-Koordinate hingehört, --set-missing-var-ids vergibt
Chromosomen- und BP-basierte IDs für unbenannte Varianten. Sie können dazu auch „$1“ und „$2“ verwenden
Verweisen Sie auf Allelnamen in der Vorlagenzeichenfolge, und tatsächlich ist dies unerlässlich
wenn mehrere Varianten dieselbe Koordinate haben.
--new-id-max-allele-len [n]: Geben Sie die maximale Anzahl führender Zeichen an
von Allelnamen zur Aufnahme in neue Varianten-IDs (Standard 23).
--missing-var-code [string]: Unbenannten Variantencode ändern (Standard „.“).
--update-chr
[f] {chrcol} {IDcol} {skip}: Varianten-Chromosomencodes aktualisieren.
--update-cm
[f] {cmcol} {IDcol} {skip}: Centimorgan-Positionen aktualisieren.
--update-map
[f] {bpcol} {IDcol} {skip}: Varianten-BP-Positionen aktualisieren.
--update-name [f] {newcol} {oldcol} {skip}: Varianten-IDs aktualisieren.
--update-alleles [fname]: Varianten-Allelcodes aktualisieren.
--allel1234 : A/C/G/T-Allele als 1/2/3/4 interpretieren/umkodieren.
Konvertiert mit „multichar“ alle A/C/G/Ts in Allelnamen in 1/2/3/4.
--alleleACGT : Umkehrung von --allel1234.
--update-ids [f]
: Proben-IDs aktualisieren.
--update-parents [f]: Eltern-IDs aktualisieren.
--update-sex [f] {n}: Geschlechter aktualisieren.
Geschlecht (1 oder M = männlich, 2 oder F = weiblich, 0 = fehlt) wird aus Spalte n+2 geladen
(Standard n ist 1).
- Flip [Dateiname]
: Allele (A<->T, C<->G) für SNP-IDs in der Datei umdrehen.
--flip-subset [fn]
: Nur anwenden - Flip zu Proben in --flip-subset Datei.
--flip-scan-window [ct+1] : Festlegen --flip-scan max. Variante ct dist. (Definition 10).
--flip-scan-window-kb [x]: Festgelegt --flip-scan Maximaler KB-Abstand (Standard 1000).
--flip-scan-threshold [x]: Festgelegt --flip-scan Mindestkorrelation (Standard 0.5).
--keep-allel-order
: Behalten Sie die in der .bim-Datei definierte Allelreihenfolge bei.
--real-ref-alleles
anstatt A2 zu zwingen, das Hauptallel zu sein. --real-ref-alleles Entfernt auch „PR“
aus den von ausgegebenen INFO-Werten --umcodieren vcf{-fid/-iid}.
--a1-Allel [f] {a1col} {IDcol} {skip}: Allele in der Datei auf A1 erzwingen.
--a2-Allel [Dateiname] {a2col} {IDcol} {skip} :
Allele in der Datei auf A2 erzwingen.
("--a2-allel [VCF-Dateiname] 4 3 '#'",
Besonders nützlich ist die Funktion, die Referenz-Allelzuweisungen aus einer VCF-Datei entfernt.)
--indiv-sort [m] {f}: Geben Sie die FID/IID-Sortierreihenfolge an.
Die folgenden vier Modi werden unterstützt: * 'none'/'0' behält die Reihenfolge der Samples bei
Sie sind
geladen.
Standard für Nicht-Merge-Vorgänge.
* 'natural'/'n' ruft 'natural sort' auf, z
'id2' < 'ID3' < 'id10'. Standard beim Zusammenführen.
* 'ascii'/'a' sortiert in ASCII-Reihenfolge, z
'ID3' < 'id10' < 'id2'.
* 'file'/'f' verwendet die Reihenfolge in der angegebenen Datei (benannt
im zweiten Parameter).
Nur für den Moment --verschmelzen/--bmerge/--merge-list und
--Bett machen/--make-just-fam respektiert diese Flagge.
--with-phenotype : Fügen Sie weitere Beispielinformationen hinzu
in neuer .cov-Datei.
--dummy-coding {N} : Kategoriale Variablen aufteilen (n Kategorien,
2 < n <= N, Standard-N ist 49) in n-1 binäre Dummy-Variablen beim Schreiben von Kovariaten
Datei.
--merge-mode [Nein]
: Anpassen --{b}merge/--merge-list-Verhalten basierend auf einem numerischen Code. 1 (Standard) =
Fehlende Anrufe ignorieren, sonst Differenz
-> fehlt
2 = nur ursprünglich fehlende Anrufe überschreiben 3 = nur überschreiben, wenn keine Anrufe fehlen
neue Datei 4/5 = nie überschreiben bzw. immer überschreiben 6 = alles melden
Nicht übereinstimmende Anrufe ohne Zusammenführung 7 = Nicht übereinstimmende, nicht fehlende Anrufe ohne melden
Verschmelzung
--merge-equal-pos
: Mit --verschmelzen/--bmerge/--merge-list, Varianten mit unterschiedlichen Namen zusammenführen, aber
identische Positionen. (Ausnahme: Varianten mit Chromosomencode 0 gleicher Position sind nicht vorhanden
zusammengeführt.)
--mendel-duos
: Mendel-Fehlerprüfungen berücksichtigen Stichproben mit nur einem übergeordneten Element im Datensatz.
--mendel-multigen
: Sorgen Sie dafür, dass Mendel-Fehlerprüfungen (Ur-)Großeltern-Genotypen berücksichtigen, wenn sie elterlich sind
Genotypdaten fehlen.
--ld-window [ct+1] : Festlegen --R/--r2 max Variante ct paarweiser Abstand (usu. 10).
--ld-window-kb [x]: Festgelegt --R/--r2 max. kb paarweiser Abstand (normalerweise 1000).
--ld-window-r2 [x]: Schwellenwert festlegen für --r2 Berichtseinschluss (normalerweise 0.2).
--ld-snp [Var-ID]
: Erste Variante insgesamt festlegen --R/--r2 Paare.
--ld-snps [vID...]: Zuerst einschränken --R/--r2 Variante zu den angegebenen Bereichen.
--ld-snp-list [f]
: Zuerst einschränken --R/--r2 var. an die in der Akte genannten Personen.
--listen Sie alle auf
: Generieren Sie bei Verwendung den Modusbericht „Alle“. --Tags anzeigen im Dateimodus.
--tag-kb [KB]
: Einstellen --Tags anzeigen Maximaler Tag-KB-Abstand (Standard 250).
--tag-r2 [Wert]
: Einstellen --Tags anzeigen Min. Tag R-Quadrat (Standard 0.8)
--tag-mode2
: Zweispaltig verwenden --Tags anzeigen (Dateimodus) E/A-Format.
--ld-xchr [Code]
: Xchr-Modell festlegen für --unabhängig{-paarweise}, --R/--r2, --flip-scan und --Tags anzeigen. 1
(Standard) = Männer kodiert 0/1, Frauen 0/1/2 (A1-Dosierung) 2 = Männer kodiert 0/2 3 =
Männer wurden mit 0/2 kodiert, Frauen erhielten jedoch die doppelte Gewichtung
--blocks-max-kb [KB]
: Einstellen --Blöcke maximale Haploblockspanne (def. 200).
--blocks-min-maf [Abschneiden]
: Anpassen --Blöcke MAF-Minimum (Standard 0.05).
--blocks-strong-lowci [X]
: Einstellen --Blöcke „starke LD“-CI-Schwellenwerte (Standardwerte).
--blocks-strong-highci [X]
0.70 und 0.98).
--blocks-recomb-highci [x]: CI-Schwellenwert für „Rekombination“ festlegen (Standard 0.90).
--blocks-inform-frac [X]
: Haploblock-Verhältnisse [starke LD-Paare]:[gesamte informative Paare] erzwingen, um größer zu sein
als dieser Wert (Standard 0.95).
--distance-wts exp=[x]
: Weisen Sie bei der Berechnung genomischer Abstände jeder Variante eine Gewichtung von (2q(1-q))^{-x} zu,
wobei q der geladene oder abgeleitete MAF ist.
--read-dists [dist file] {id file}: Laden Sie eine dreieckige binäre Distanzmatrix
statt von Grund auf neu zu berechnen.
--ppc-gap [Wert]
: Mindestanzahl an Basenpaaren in Tausenden zwischen informativen Markerpaaren
benutzt in --Genom PPC-Test. 500, falls nicht angegeben.
--Mindest [Abschneiden]
: Geben Sie den minimalen PI_HAT für die Aufnahme an --Genom berichten.
--max [Abschneiden]
: Geben Sie den maximalen PI_HAT für die Aufnahme an --Genom berichten.
--homozyg-match []: Legen Sie die Mindestkonkordanz zwischen gemeinsam homozygoten Personen fest
Varianten für eine paarweise Allelübereinstimmung, die deklariert werden sollen.
--Pool Größe [kt]
: Legen Sie die Mindestgröße der Pools im Bericht „--homozyg group“ fest.
--read-genome [fn]: Laden --Genom Bericht für - Cluster/--neighbour stattdessen
Möglichkeit, die p-Werte des IBS- und PPC-Tests von Grund auf neu zu berechnen.
--ppc [p-Wert]
: Geben Sie den minimalen PPC-Test-p-Wert innerhalb eines Clusters an.
--mc [maximale Größe]
: Geben Sie die maximale Clustergröße an.
--mcc [c1] [c2]
: Geben Sie die maximale Fall- und Kontrollanzahl pro Cluster an.
--K [Min. Anzahl]
: Geben Sie die Mindestclusteranzahl an.
--ibm [Wert]
: Geben Sie die Mindestidentität durch Fehlen an.
--Spiel [f] {mv}: Verwenden Sie Kovariatenwerte, um die Clusterbildung einzuschränken.
Ohne --match-type, zwei Stichproben können nur dann im selben Cluster liegen, wenn alle Kovariaten vorhanden sind
übereinstimmen. Der optionale zweite Parameter gibt einen zu behandelnden Kovariatenwert an
fehlt.
--match-type [f]: Interpretation von verfeinern --Spiel Datei.
Das --match-type Es wird erwartet, dass die Datei eine einzelne Zeile mit so vielen Einträgen wie die Datei enthält
--Spiel Datei hat Kovariaten; „0“-Einträge geben „negative Übereinstimmungen“ (z. B. Stichproben) an
mit gleichen Kovariatenwerten können nicht im selben Cluster liegen), geben Sie „1“-Einträge an
„positive Übereinstimmungen“ (Standard) und „-1“ bewirkt, dass die entsprechende Kovariate vorhanden ist
ignoriert.
--qmatch [f] {m}: Erzwingt, dass alle Mitglieder eines Clusters ähnlich sind
--qt [fname]
quantitative Kovariatenwerte. Der --qmatch Datei enthält die Kovariatenwerte,
während die --qt Die Datei ist eine Liste nichtnegativer Toleranzen (und der Markierung „-1“)
Kovariaten zum Überspringen).
--pca-cluster-names [...] : Diese können einzeln oder in Kombination verwendet werden
--pca-clusters [fname]
um eine Liste von Clustern zu definieren, die im Basic verwendet werden sollen --pca Berechnung.
(--pca-cluster-names erwartet eine durch Leerzeichen getrennte Folge von Clusternamen, while
--pca-clusters erwartet eine Datei mit einem Clusternamen pro Zeile.) Alle Beispiele außerhalb
Diese Cluster werden dann auf die berechneten PCs projiziert.
--mds-plot [verdunkelt] :
Mehrdimensionale Skalierungsanalyse.
Erfordert - Cluster.
--Zelle [dreschen]
: Überspringen Sie einige --Modell testet, ob ein Kontingenztabelleneintrag kleiner als der angegebene Wert ist
Schwelle.
--Zustand [Var-ID] : Eine Variante als hinzufügen --linear
or --logistisch Kovariate.
--condition-list [F] : In der Datei benannte Varianten hinzufügen
as --linear/--logistic covs.
--parameter [...]
: Nur die angegebenen Kovariaten/Wechselwirkungen in die einbeziehen --linear/--logistische Modelle,
identifiziert durch eine Liste von 1-basierten Indizes und/oder Bereichen davon.
--Tests {...}: Führen Sie einen (gemeinsamen) Test für die angegebenen Begriffe im durch
--linear/--logistisches Modell, identifiziert durch 1-basierte Indizes und/oder Bereiche davon. Wenn
Es wurde eine Permutation angefordert, sie basiert auf diesem Test. * Beachten Sie, wann
--parameter ist auch vorhanden, die
Indizes beziehen sich auf die nach dem Beschneiden verbleibenden Terme
--parameter.
* Sie können „--tests all“ verwenden, um alle Begriffe einzuschließen.
--vif [max. VIF]
: VIF-Schwellenwert festlegen für --linear Multikollinearitätsprüfung (Standard 50).
--xchr-model [Code]: Legen Sie das X-Chromosom fest --linear/--logistisches Modell.
0 = Geschlecht und haploide Chromosomen überspringen 1 (Standard) = Geschlecht als Kovariate auf X hinzufügen
Chromosom 2 = kodiert männliche Genotypen 0/2 statt 0/1 3 = Test auf Interaktion
zwischen Genotyp und Geschlecht
--lasso-select-covars {cov(s)...}: Unterwerfen Sie einige oder alle Kovariaten dem LASSO
Modellauswahl.
--anpassen
: Melden Sie einige Korrekturen aufgrund mehrerer Tests.
--lambda [Wert]
: Genomisches Kontroll-Lambda festlegen für --anpassen.
--ci [Größe]
: Konfidenzintervalle für Quotenverhältnisse angeben.
--pfilter [Wert]
: Assoziationstestergebnisse mit höheren p-Werten herausfiltern.
--aperm [min. Dauerwellen - 1] {max. Dauerwellen} {Alpha} {Beta} {Init-Intervall} {Steigung}:
Richten Sie bis zu sechs Parameter ein, die adaptive Permutationstests steuern. * Die ersten zwei
Steuern Sie die minimale und maximale Anzahl der Permutationen
kann für jede Variante ausgeführt werden; Die Standardwerte sind 5 und 1000000.
* Die nächsten beiden steuern die Bedingung für die vorzeitige Beendigung.
A
Für jeden empirischen p-Wert wird ein Konfidenzintervall von 100 % * (1 – Beta/2T) berechnet.
wobei T die Gesamtzahl der Varianten ist; wann immer dieses Konfidenzintervall dies nicht tut
Enthält Alpha, ist die Variante von weiteren Permutationstests ausgenommen. Standard
Die Werte sind 0 und 1e-4.
* Die letzten beiden steuern, wann die Bedingung für die vorzeitige Beendigung überprüft wird.
If
Eine Prüfung erfolgt bei Permutation #p, die nächste Prüfung erfolgt nach [Steigung]p + [init
Intervall] weitere Permutationen (abgerundet). Das Standardanfangsintervall ist 1 und
Die Standardsteigung beträgt 0.001.
--mperm-save
: Beste Max(T)-Permutationsteststatistiken speichern.
--mperm-save-all : Alle max(T)-Permutationsteststatistiken speichern.
--set-p [p-Wert]
: Passen Sie die Obergrenze des p-Werts für die signifikante Variante des festgelegten Tests an (Standard: 0.05).
--set-r2 {v}
: Passen Sie die r^2-Obergrenze der Set-Test-Signifikanten-Variante paarweise an (Standard 0.5). 'schreiben'
führt dazu, dass verletzende Paare in {output prefix}.ldset ausgegeben werden.
--set-max [kt]
: Passen Sie die maximale Anzahl der pro Satz berücksichtigten signifikanten Varianten des Satztests an (Standard 5).
--set-test-lambda [v]: Geben Sie die genomische Kontrollkorrektur für den Set-Test an.
--Grenze [KB]
: Verlängern --kommentieren Bereichsintervalle nach gegebener # kbs.
--annotate-snp-field [nm] : Eingestellt --kommentieren Varianten-ID-Feldname.
--clump-p1 [pval]: Festgelegt --Büschel Indexvariable p-Wert-Obergrenze (Standard 1e-4).
--clump-p2 [pval]: Festgelegt --Büschel sekundärer p-Wert-Schwellenwert (Standard 0.01).
--clump-r2 [r^2]
: Einstellen --Büschel r^2-Schwellenwert (Standard 0.5).
--clump-kb [KB]
: Einstellen --Büschel KB-Radius (Standard 250).
--clump-snp-field [N...]
: Einstellen --Büschel Varianten-ID-Feldname (Standard: „SNP“). Bei mehreren Feldnamen,
Frühere Namen haben Vorrang vor späteren.
--clump-field [Name...]
: Einstellen --Büschel p-Wert-Feldname (Standard: „P“).
--clump-allow-overlap
: Lassen --Büschel Nicht-Index-Variablen. mehrere Klumpen zusammenfügen.
--clump-verbose
: Antrag verlängert --Büschel berichten.
--clump-annotate [hdr...]: Benannte zusätzliche Felder einschließen --clump-verbose und
--clump-best Berichte. (Feldnamen können durch Leerzeichen oder Kommas getrennt werden.)
--clump-range [Dateiname]
: Überlappungen zwischen Klumpen und Regionen melden.
--clump-range-border [kb]: Bereiche dehnen in --clump-range Datei.
--clump-index-first
: Extrakt --Büschel Indexvariablen. nur aus der ersten Datei.
--clump-replicate
: Klumpen ausschließen, die sekundäre Ergebnisse aus nur einer Datei enthalten.
--clump-best
: Geben Sie jeweils den besten Proxy an --Büschel Indexvariable
--meta-analysis-snp-field [n...]: Festgelegt --meta-analyse Varianten-ID, A1/A2
--meta-analysis-a1-field [N...]
Allel, p-Wert und/oder effektive Probe
--meta-analysis-a2-field [N...]
Größenfeldnamen. Standardwerte sind „SNP“,
--meta-analysis-p-field [N...]
„A1“, „A2“, „P“ und „NMISS“,
--meta-analysis-ess-field [N...]
jeweils. Wenn diesen Flags mehrere Parameter zugewiesen werden, werden frühere Namen verwendet
haben Vorrang vor späteren. Beachten Sie, dass, wenn die Zahlen der Fälle und Kontrollen
ungleich sind, sollte die effektive Stichprobengröße sein
4 / (1/[# Fälle] + 1/[# Kontrollen]).
--meta-analysis-report-dups
: Wenn eine Variante mehrmals in derselben Datei vorkommt, melden Sie dies.
--gene-list-border [KB]
: Verlängern --gene-report Regionen nach gegebener Anzahl von kbs.
--gene-subset [Dateiname]
: Geben Sie die Teilmenge des Gennamens an --gene-report.
--gene-report-snp-field [] : Satz --gene-report Varianten-ID-Feldname (Standard).
'SNP'). Nur relevant mit --Extrakt.
--Lücke [KB]
: Stellen Sie '--fast-epistasis case-only' auf min. Lücke (Standard 1000).
--epi1 [p-Wert]: Festgelegt --{fast-}Epistase-Meldeschwelle (Standard).
5e-6 für „Boost“, sonst 1e-4).
--epi2 [p-Wert]: Schwellenwert für den Beitrag zur SIG_E-Zählung festlegen (def. 0.01).
--je-cellmin [n]: Legen Sie die erforderliche Anzahl von Beobachtungen pro 3x3x2-Kontingenz fest
Tabellenzelle für Joint-Effects-Test (Standard 5).
--q-score-range [Bereichsdatei] [Datendatei] {i} {j} :
Bewerben --Spielstand auf Teilmengen von Varianten in der primären Bewertungsliste basierend auf z. B
p-Wert-Bereiche. * Die erste Datei sollte in der ersten Spalte Bereichsbezeichnungen haben.
p-Wert
Untergrenzen in der zweiten Spalte und Obergrenzen in der dritten Spalte. Linien
mit zu wenigen Einträgen oder nichtnumerischen Werten in der zweiten oder dritten Spalte
ignoriert.
* Die zweite Datei sollte jeweils eine Varianten-ID und einen p-Wert enthalten
nicht leere Zeile (außer möglicherweise der ersten).
Varianten-IDs werden ausgelesen
Spalte #i und p-Werte werden aus Spalte #j gelesen, wobei i standardmäßig 1 und j ist
Der Standardwert ist i+1. Der Modifikator „header“ bewirkt die erste nicht leere Zeile dieser Datei
übersprungen werden.
--parallel [k] [n]: Teilen Sie die Ausgabematrix in n Teile und berechnen Sie sie nur
das k-te stück. In der primären Ausgabedatei ist die Stücknummer enthalten
Name, z. B. plink.rel.13 oder plink.rel.13.gz, wenn k 13 ist. Verketten dieser Dateien
in der Reihenfolge erhalten Sie die vollständige Matrix von Interesse. (Ja, das kann vorher gemacht werden
Entpacken.) Hinweis: Dies kann im Allgemeinen nicht zum direkten Schreiben einer symmetrischen Datei verwendet werden
quadratische Matrix. Wählen Sie stattdessen die Form „Quadrat0“ oder „Dreieck“ und führen Sie die Nachbearbeitung als aus
notwendig.
--Erinnerung [Wert]
: Legen Sie die Größe des ersten Workspace-Malloc-Versuchs in MB fest. (Praktisch obligatorisch
bei Verwendung von GNU parallel.)
--fäden [Wert]
: Maximale Anzahl gleichzeitiger Threads festlegen. Dies hat eine bekannte Einschränkung: einige
Lineare Algebra-Operationen von BLAS/LAPACK sind in einer Weise multithreaded, die PLINK nicht kann
Kontrolle. Wenn dies problematisch ist, sollten Sie eine Neukompilierung gegen Single-Threaded durchführen
BLAS/LAPACK.
--D [verkohlen]
: Varianten-/Kovariatenbereichsbegrenzer ändern (normalerweise „-“).
--Samen [Wert...]
: Zufallszahlen-Seed(s) festlegen. Jeder Wert muss eine Ganzzahl zwischen 0 und sein
4294967295 inklusive.
--perm-batch-size [val]: Anzahl der Permutationen pro Stapel für einige festlegen
Permutationstests.
--output-min-p [p]: Geben Sie den minimalen p-Wert an, der in Berichte geschrieben werden soll.
--debuggen
: Verwenden Sie eine langsamere, absturzsicherere Protokollierungsmethode.
Primärmethodenpapier: Chang CC, Chow CC, Tellier LCAM, Vattikuti S, Purcell SM, Lee JJ
(2015) PLINK der zweiten Generation: Sich der Herausforderung größerer und umfangreicherer Datensätze stellen.
GigaScience, 4.
Weitere Dokumentation und Unterstützung finden Sie auf der Hauptwebseite
(https://www.cog-genomics.org/plink2) und/oder die Mailingliste
(https://groups.google.com/d/forum/plink2-users).
Nutzen Sie plink1.9 online über die Dienste von onworks.net