Acesta este instrumentul anfo de comandă care poate fi rulat în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS
PROGRAM:
NUME
anfo-tool - procesează fișierele binare ANFO native
REZUMAT
anfo-instrument [ opțiune | model ... ]
DESCRIERE
anfo-instrument este folosit pentru a filtra, procesa și converti fișierele create de anpho. Fiecare tipar
pe linia de comandă este extinsă wildcard, apoi pentru fiecare fișier de intrare (sau standard
intrare, dacă nu este dat niciun model), anfo-instrument construiește un lanț de filtre de intrare, apoi fuzionează
aceste fluxuri de intrare într-unul din mai multe moduri, împarte rezultatul în ieșiri multiple
fluxuri, fiecare dintre acestea putând avea aplicat un lanț de filtru de ieșire.
OPŢIUNI
General Opţiuni
Aceste opțiuni se aplică la nivel global și modifică comportamentul întregului program. Ei pot fi
plasat oriunde în linia de comandă.
-V, --versiune
Tipăriți numărul versiunii și ieșiți.
-q, --liniște
Suprimați toate ieșirile, cu excepția mesajelor de eroare fatale.
-v, --verbos
Produceți mai multe rezultate, inclusiv indicatori de progres pentru majoritatea operațiunilor.
--depanare
Produceți rezultate de depanare pe lângă informațiile de progres.
-n, --funcționare în uscat
Analizați linia de comandă, opțional imprimați o descriere a operațiunilor dorite, apoi
Ieșire.
--vmem X
Limitați memoria virtuală la X megaocteți. Dacă memoria se epuizează, anfo-instrument încearcă să elibereze
creșterea memoriei uitând de fișierele mari, de exemplu genomul. Utilizați această opțiune pentru a evita
condiții de schimbare sau lipsă de memorie atunci când operațiunile implică mari sau mai multe
genomurilor.
reglaj parametrii
Un parametru poate fi setat de mai multe ori pe linia de comandă și va suprascrie anterior
setări. Orice opțiune de filtru care necesită un parametru preia ultima definiție care
a apărut înaintea opțiunii de filtrare.
--set-slope S
Setați parametrul de pantă la S. pantă este utilizat împreună cu intercepta Unde
filtrele se aplică scorurilor de aliniere; aliniamentele nu au punctat mai rău decât pantă * (Lungime
- intercepta) sunt considerate bune. Valoarea implicită este 7.5.
--set-intercept L
Setați parametrul de interceptare la L. intercepta este utilizat împreună cu pantă
unde se aplică filtre pentru scorurile de aliniere; aliniamentele nu au punctat mai rău decât pantă *
(Lungime - intercepta) sunt considerate bune. Valoarea implicită este 20.
--set-context C
Setați parametrul de context la C. Contextul este numărul de baze înconjurătoare ale
referința inclusă la tipărirea aliniamentelor sub formă de text. Valoarea implicită este 0.
--set-genom G
Setați parametrul genomului la G. Multe filtre vor lua în considerare doar cele mai bune alinieri
la acest genom specific dacă este setat. Dacă nu este setat niciun genom, cel mai bun la nivel global
se folosește alinierea.
--clear-genom
Ștergeți parametrul genomului. Filtrele se aplică pentru cea mai bună aliniere la nivel global
după aceea.
Filtru Opţiuni
Filtrele pot fi aplicate înainte de îmbinarea intrărilor sau după împărțirea back-up-ului.
-s, --sort-pos=n
Sortați după poziția de aliniere în timp ce tamponați nu mai mult de n MiB în memorie. În cazul în care un
genomul este setat, sunt utilizate aliniamente la acel genom.
-S, --sort-name=n
Sortați după numele citit în timp ce stocați în tampon nu mai mult de n MiB în memorie.
-l, --lungimea-filtru=L
Păstrați aliniamentele numai pentru citirile de cel puțin L lungimea bazelor. Citește în sine
sunt tinute.
-f, --filter-score
Păstrați aliniamentele numai dacă scorul lor este suficient de bun. Utilizeazapantăsi intercepta.
--filter-mapq=Q
Eliminați aliniamentele cu calitatea cartografierii de mai jos Q.
-h, --filter-hit=SEQ
Păstrați numai citirile care au acces la o secvență numită SECV. Dacă SECV este gol, citește
sunt păstrate dacă au vreo lovitură. Dacă genomului parametrul este setat, doar accesează la acesta
numărarea genomului.
--delete-hit=SEQ
Ștergeți aliniamentele către SECV. Dacă SECV este gol, toate aliniamentele sunt șterse. Dacă
genomului parametrul este setat, numai alinierea la acel genom sunt șterse.
--filter-qual=Q
Mascați bazele cu calitate de mai jos Q. O astfel de bază este înlocuită cu N ambiguitate
cod.
--multiplicitatea=N
Păstrați numai citiri ale moleculelor care au fost cel puțin secvențiate N ori. Citirile sunt
considerate ca provin din aceeași moleculă originală dacă coordonatele lor aliniate sunt
identic.
--subsample=F
Subeșantionați o fracție F a rezultatelor. Fiecare citire este independentă și aleatorie
ales să fie păstrat sau nu.
--inside-regions=FIȘIER
Citiți o listă de regiuni din FILE, apoi păstrați numai aliniamentele care se suprapun pe an
regiune adnotată.
--outside-regions=FIȘIER
Citiți o listă de regiuni din FILE, apoi păstrați numai aliniamentele care nu se suprapun an
regiune adnotată.
Special Filtre
-d, --rmdup=Q
Eliminați duplicatele PCR, fixați scorurile de calitate la Q. Două lecturi sunt considerate a fi
duplicate, dacă coordonatele lor aliniate sunt identice. În cazul în care un genomului este setat, the
se folosește cea mai bună aliniere la acel genom, altfel cea mai bună aliniere la nivel global. Ambii
aliniamentele trebuie să fie bune, după cum este determinat de pantăsi intercepta. Pentru un set de
duplicate, se numește consens, crescând în general scorurile de calitate. În cazul în care un
scorul de calitate rezultat depășește Q, este setat la Q. Acest filtru necesită intrare
pentru a fi sortate după coordonatele de aliniere pe cea selectată genomului.
--duct-tape=NUME Aliniamente suprapuse cu bandă adezivă în contigs și apelează la un consens
pentru ei. În cazul în care un genomului este setat, sunt folosite aliniamentele la acel genom, altfel
cele mai bune aliniamente la nivel global. Acest filtru necesită ca intrarea să fie sortată după aliniere
coordonate pe genom. Ieșirea este un set de contigs, fiecare poziție este atribuită
o bază de consens, un scor de calitate și probabilități pentru fiecare dialelă posibilă. (Aceasta
se numește bandă adezivă pentru că arată într-un fel ca un ansamblu, dar nu este aproape
ca solid.)
--edit-header=ED
Invocați editorul ED pe reprezentarea text a antetului fluxului. Acesta poate fi
folosit pentru a curăța header-ul care a acumulat prea mult cruft.
fuzionarea Filtre
Pe linia de comandă ar trebui să fie dat exact un filtru de îmbinare, toate opțiunile de filtrare
care apar înainte ca acestea să facă parte din lanțurile de filtre de intrare, toate filtrele ulterioare devin
lanțuri de ieșire. Dacă nu este dat niciun filtru de îmbinare, --concat este presupus și toate filtrele sunt
filtre de intrare.
-c, --concat
Concatenați toate fluxurile de intrare în ordinea în care apar pe linia de comandă.
-m, --merge
Îmbinați fluxurile de intrare sortate, producând un rezultat sortat. Toate intrările trebuie sortate
in acelasi fel.
-j, --ună
Alăturați-vă fluxurilor de intrare și păstrați cele mai bune hit-uri pentru fiecare genom. Fiecare intrare
Fluxul trebuie să conțină o înregistrare pentru fiecare citire, citirile sunt stocate în memorie până la toate
dintre hit-urile lor sunt colectate. În acest fel, alăturarea funcționează bine dacă toate intrările sunt aproape
in aceeasi ordine. Dacă citirile lipsesc din unele fluxuri, alăturarea acestora va fi irosită
memorie.
--mega-merge
Îmbinați multe fluxuri, cum ar fi cele produse prin rulare anfo-sge. Transmite asta
operate pe aceleași citiri sunt unite, apoi totul este îmbinat.
producție Opţiuni
Dacă o opțiune de ieșire este dată pe linia de comandă, lanțul curent de filtru de ieșire este încheiat
și se începe unul nou. Dacă nu este dată nicio opțiune de ieșire, o reprezentare textuală a
fluxul final este scris în stdout. Toate opțiunile de ieșire acceptă - a scrie la stdout.
-o, --ieșire FIȘIER
Scrieți fluxul binar nativ (un mesaj protobuf comprimat) în FILE. Scrierea a
fluxul binar și citirea lui înapoi este fără pierderi.
--output-text FILE
Scrieți un flux de text protobuf în FILE. Dacă sunt disponibili genomii necesari, a
este inclusă reprezentarea textuală a aliniamentelor. Dacă context parametrul este
set, că multe baze suplimentare de referință în amonte și în aval de
alinierea sunt incluse.
--output-sam=FIȘIER
Scrieți aliniamente în format SAM la FILE.
--output-glz FILE
Scrieți contigs în format GLZ 0.9 la FILE. Generarea GLZ funcționează numai după
aplicare a --banda adeziva, fiecare contig devine o înregistrare GLZ.
--output-3aln FILE
Scrieți contigs într-un format bazat pe tabel la FILE. Formatul este încă supus
modificare, consultați codul sursă pentru documentație detaliată.
--output-fasta FILE
Scrieți aliniamente(!) în format FastA la FILE. Aliniamentele sunt scrise ca pereche de
referință și secvență de interogare, coordonatele aliniate sunt indicate în descriere
a secvenței de interogare. Dacă context parametrul este setat, atâtea baze suplimentare
de referință în amonte și în aval de aliniament sunt incluse. Acest
formatul nu este sugerat pentru nicio utilizare serioasă, el există pentru a sprijini moștenirea
aplicatii.
--output-fastq FILE
Scrieți secvențe(!) în format FastQ la FILE. Scrierea eficientă a FastQ
reconstituie intrarea la ANFO dacă nu s-a făcut nicio filtrare asupra rezultatelor.
--output-table FILE
Scrieți statistici per-aliniere la FILE. Fișierul are trei coloane:Âsequence
lungime, scor de aliniere, diferență față de următoarea cea mai bună aliniere. Este util în principal să
analiza/vizualizează distribuția scorurilor de aliniere.
--stats FILE
Scrieți statistici simple pentru FILE. Acest lucru are ca rezultat câteva statistici rezumative simple ale
un întreg flux: numărul de secvențe aliniate, lungimea medie, conținutul GC.
MEDIUL
ANFO_PATH
Listă separată de două puncte de directoare căutate pentru genom și fișiere index.
ANFO_TEMP
Spațiu temporar folosit pentru sortarea fișierelor mari.
Utilizați anfo-tool online folosind serviciile onworks.net