EnglezăFrancezăSpaniolă

Favicon OnWorks

pbbarcode - Online în cloud

Rulați pbbarcode în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda pbbarcode care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


pbbarcode - adnotă citirile de secvențiere PacBio cu informații despre codul de bare

DESCRIERE


pbbcode pachetul oferă utilități pentru adnotarea ZMW-urilor individuale direct din a
bas.h5, emitând fișiere rapide[a|q] pentru fiecare cod de bare, etichetând aliniamentele stocate într-un
cmp.h5 și apelarea consensului asupra ampliconilor mici (necesită pbdagcon(1))

În prezent, codurile de bare pot fi marcate în două moduri diferite: simetric si împerecheat.
Modul simetric acceptă modele de coduri de bare cu două coduri de bare identice pe ambele părți ale unui
SMRTbell, de exemplu, pentru codurile de bare (A, B), moleculele sunt etichetate ca A--A sau B--B. The împerecheat
Modul acceptă modele cu două coduri de bare distincte pe fiecare parte a moleculei, dar niciuna
codul de bare apare fără pereche. Exemplul minim este dat cu următoarele
coduri de bare: (ALstânga, ARdreapta, BLeft, BRight), unde sunt verificate următoarele seturi de coduri de bare:
AStânga--Dreapta, BStânga--BRdreapta.

Este important de subliniat faptul că un fișier FASTA cu cod de bare specifică o listă de disponibile
coduri de bare de evaluat. În funcție de modul de punctare, codurile de bare sunt grupate împreună în
căi diferite. De exemplu, în simetric caz, numărul de coduri de bare posibile
rezultatele sunt pur și simplu numărul de coduri de bare care sunt furnizate rutinei în FASTA
fișier (vezi mai jos pentru utilizare) plus un suplimentar NULL cod de bare care indică faptul că nu există cod de bare
ar putea fi evaluat (notat cu: '--'). Etichete ca aceasta (A--A) sunt folosite în final
iesiri. În împerecheat modul, numărul de rezultate posibile de coduri de bare este jumătate din număr
a secvențelor din fișierul FASTA plus NULL cod de bare. The NULL codul de bare indică faptul că
nu a fost făcută nicio încercare de a nota molecula sau a fost filtrată după criteriile utilizatorului.
Majoritatea cazurilor în care o moleculă nu este punctată sunt legate de neobservarea niciunuia
adaptoare. Dacă un utilizator a executat o rulare „hot-start”, utilizatorul poate încerca „--scoreFirst”
parametru pentru a încerca să eticheteze codul de bare al primului adaptor. Acest lucru crește randamentul
procedura de etichetare în detrimentul unor rezultate probabil false pozitive.

Software-ul este implementat ca un pachet standard python. Codurile de bare sunt etichetate conform
la următoarea logică de nivel înalt. Pentru fiecare moleculă se găsesc toți adaptoarele. Pentru fiecare
adaptor, aliniem (folosind alinierea standard Smith-Watterman) fiecare cod de bare și reversul acestuia
completează secvența de flancare a adaptorului. Dacă două secvenţe de flancare complete sunt
disponibil, împărțim la 2, altfel 1 dacă era disponibilă o singură secvență de flancare (medie
scor la adaptor). Acest lucru permite ca scorurile dintre adaptoare să fie pe aceeași scară (himera
detectare). Depinzând de mod, apoi determinăm care cod(e) de bare sunt maxim
punctare. Stocăm cele două coduri de bare cu punctaj maxim, suma scorurilor lor de aliniere
peste adaptoare. Scorul mediu al codului de bare poate fi dat aproximativ de:
scor total/număr-de-adaptoare. În acest moment, parametrii de aliniere sunt fixați la:

┌──────────┬───────┐
│tip │ scor │
├──────────┼───────┤
│inserție │ -1 │
├──────────┼───────┤
│eliminare │ -1 │
├──────────┼───────┤
│potrivire nepotrivită │ -2 │
├──────────┼───────┤
│potrivire │ 2 │
└──────────┴───────┘

Intrare si producție
labelZmws
utilizare: pbbcode labelZmws [-h] [--outDir EXTERIOR] [--outFofn OUTFOFN]
[--adapterSidePad ADAPTERSIDEPAD] [--insertSidePad INSERTSIDEPAD] [--scoreMode
{symmetric,paired}] [--maxAdapters MAXADAPTERS] [--scoreFirst]
[--startTimeCutoff STARTTIMECUTOFF] [--nZmws NZMWS] [--nProcs NPROCS]
[--saveExtendedInfo] cod de bare.fasta input.fofn

Creează un fișier cod de bare.h5 din fișierele de bază h5.

pozitional argumente:
cod de bare.fasta Introduceți codul de bare fișier fasta input.fofn Baza de introducere
fofn

facultativ argumente:

-h, --Ajutor
afișați acest mesaj de ajutor și ieșiți

--outDir EXTERIOR
Unde să scrieți fișierele cod de bare nou create.h5. (Mod implicit:
/home/UNIXHOME/jbullard/projects/software/bioinformatics/tools/pbbarcode/doc)

--outFofn OUTFOFN
Scrieți în outFofn (implicit: cod de bare.fofn)

--adapterSidePad ADAPTATORSIDEPAD
Pad cu adaptor SidePad baze (implicit: 4)

--insertSidePad INSERTSIDEPAD
Pad cu baze insertSidePad (implicit: 4)

--scoreMode {simetric, pereche}
Modul în care codurile de bare ar trebui să fie punctate. (implicit: simetric)

--maxAdapters MAXADAPTERS
Punctează doar primele maxAdapters (implicit: 20)

--scoreFirst
Dacă să încerci să înscrie codul de bare din stânga dintr-o urmă. (implicit: fals)

--startTimeCutoff STARTTIMECUTOFF
Citirile trebuie să înceapă înainte de această valoare pentru a fi incluse când
scoreFirst este setat. (implicit: 10.0)

--nZmws NZMWS
Utilizați primele n ZMW-uri pentru testare (implicit: -1)

--nProcs NPROCS
Câte procese să utilizați (implicit: 8)

--saveExtendedInfo
Dacă să salvezi informații extinse în fișierele cod de bare.h5; acest
informațiile sunt utile pentru depanare și detectarea himerei (implicit:
Fals)

labelZmws comanda necesită un input.fofn reprezentând un set de fișiere bas.h5 pentru a funcționa
pe. În plus, este nevoie de un fișier cod de bare.fasta. În funcție de ScorMode, fișierul FASTA
vor fi procesate în moduri diferite. Mai exact, în împerecheat mod, fiecare două consecutive
codurile de bare din fișier sunt considerate un set.

Parametrii, adaptorSidePad si insertSidePad reprezintă câte baze ar trebui să fie
luate în considerare de fiecare parte a codului de bare presupus. Acești parametri sunt astfel constrânși
că: |adapterSidePad| + |insertSidePad| + |cod de bare| < 65.

Utilizatorii au opțiunea de a specifica o locație diferită de ieșire pentru diferitele ieșiri.
Mai exact, pentru fiecare fișier bas.h5 din input.fofn, un fișier bc.h5 (cod de bare hdf5) este
generate. Aceste fișiere sunt listate în fișier outFofn care de obicei este doar numit
cod de bare.fofn. Vezi mai jos o descriere a fișierului cod de bare hdf5.

labelAlignments
utilizare: pbbcode labelAlignments [-h]
[--minAvgBarcodeScore MINAVGBARCODESCORE] [--minNumBarcodes MINNUMBARCODES]
[--minScoreRatio MINSCORERATIO] barcode.fofn aligned_reads.cmp.h5

Adaugă informații despre alinierea codurilor de bare la un fișier cmp.h5 dintr-un apel anterior către
„etichetăZmws”.

pozitional argumente:
cod de bare.fofn introducere cod de bare fișier fofn aligned_reads.cmp.h5 fișier cmp.h5
pentru a adăuga etichete cu coduri de bare

facultativ argumente:

-h, --Ajutor
afișați acest mesaj de ajutor și ieșiți

--minAvgBarcodeScore MINAVGBARCODESCORE
Filtru ZMW: excludeți ZMW dacă scorul mediu al codului de bare este mai mic decât această valoare
(implicit: 0.0)

--minNumBarcodes MINNUMBARCCODES
Filtru ZMW: excludeți ZMW dacă numărul de coduri de bare observate este mai mic decât acesta
valoare (implicit: 1)

--minScoreRatio MINSCORERATIO
Filtru ZMW: excludeți ZMW al căror cel mai bun scor împărțit la al 2-lea cel mai bun scor
este mai mic decât acest raport (implicit: 1.0)

labelAlignments comanda ia ca intrare un cod de bare.fofn calculat dintr-un apel către
etichetaZMWs și un fișier cmp.h5 în care sunt scrise informațiile codului de bare. Vezi mai jos pentru a
descrierea adăugărilor fișierului cmp.h5.

emitFastqs
utilizare: pbbcode emitFastqs [-h] [--outDir output.dir] [--subcitește]
[--unlabeledZmws] [--trim TRIM] [--fasta] [--minMaxInsertLength
MINMAXINSERTLENGTH] [--hqStartTime HQSTARTTIME] [--minReadScore MINREADSCORE]
[--minAvgBarcodeScore MINAVGBARCODESCORE] [--minNumBarcodes MINNUMBARCODES]
[--minScoreRatio MINSCORERATIO] input.fofn barcode.fofn

Preia un bas.h5 fofn și un cod de bare.h5 fofn și produce un fișier rapid[a|q] pentru fiecare
cod de bare.

pozitional argumente:
input.fofn input base sau CCS fofn file barcode.fofn input
fişier cod de bare.h5 FON

facultativ argumente:

-h, --Ajutor
afișați acest mesaj de ajutor și ieșiți

--outDir output.dir producție director la scrie rapidq fișiere (Mod implicit: /Acasă/
UNIXHOME/jbullard/projects/software/bioinformatics/too ls/pbbarcode/doc)

--subcitește
dacă să produci fișiere fastq pentru subciturile; implicit este să folosești
CCS citește. Această opțiune se aplică numai atunci când input.fofn are atât consens, cât și
citiri brute, în caz contrar, tipul de citire din input.fofn va fi returnat.
(implicit: fals)

--unlabeledZmws
dacă să emită un fișier fastq pentru ZMW-urile neetichetate. Acestea sunt ZMW-urile
unde nu se găsesc adaptoare de obicei (implicit: False)

--tunde TUNDE
decupați codurile de bare și orice secvență constantă în exces (implicit: 20)

--fasta
dacă fișierele produse ar trebui să fie fișiere FASTA spre deosebire de FASTQ
(implicit: fals)

--minMaxInsertLength MINMAXINSERTLENGTH
Filtru ZMW: excludeți ZMW în cazul în care cea mai lungă citire este mai mică decât această sumă
(implicit: 0)

--hqStartTime HQSTARTTIME
Filtru ZMW: excludeți ZMW dacă ora de pornire a regiunii HQ este mai mare decât această valoare
(secunde) (implicit: inf)

--minReadScore MINREADSCORE
Filtru ZMW: excludeți ZMW dacă readScore este mai mic decât această valoare (implicit: 0)

--minAvgBarcodeScore MINAVGBARCODESCORE
Filtru ZMW: excludeți ZMW dacă scorul mediu al codului de bare este mai mic decât această valoare
(implicit: 0.0)

--minNumBarcodes MINNUMBARCCODES
Filtru ZMW: excludeți ZMW dacă numărul de coduri de bare observate este mai mic decât acesta
valoare (implicit: 1)

--minScoreRatio MINSCORERATIO
Filtru ZMW: excludeți ZMW al căror cel mai bun scor împărțit la al 2-lea cel mai bun scor
este mai mic decât acest raport (implicit: 1.0)

emitFastqs comanda ia ca intrare atât un input.fofn pentru fișierele bas.h5, cât și un
cod de bare.fofn dintr-un apel la labelZmws. Parametrul opțional outDir dictează unde
fișierele vor fi scrise. Pentru fiecare cod de bare detectat, va fi emis un fișier fast[a|q] cu
toate citirile pentru acel cod de bare. The tunde parametrul dictează cât de mult ar trebui citit
fi decupat. Parametrul implicit pentru tunde este lungimea codului de bare (care este
stocate în fișierele de cod de bare hdf5). În acest moment, toate codurile de bare din fișierul FASTA cu coduri de bare
trebuie să aibă aceeași lungime, prin urmare este acceptată doar o valoare constantă de tăiere. In practica,
se poate tăia agresiv pentru a se asigura că bazele suplimentare nu sunt lăsate la capetele
citeste. În cele din urmă, cel subcitește parametrul dictează dacă ar trebui să fie citirile subcitelor sau CCS
returnat cu valoarea implicită fiind citirile corespunzătoare în funcție de tipul fișierului de intrare,
fie CCS, fie subreads. Acest parametru este inspectat numai dacă input.fofn le conține pe ambele
Date CCS și subcitire, dacă input.fofn conține numai date de subcitire sau CCS, atunci asta este
returnat indiferent de starea subcitește parametrul și se emite un avertisment.

consens
utilizare: pbbcode consens [-h] [--subproba SUBSEMPLĂ] [--nZmws NZMWS]
[--outDir OUTDIR] [--keepTmpDir] [--ccsFofn CCSFOFN] [--nProcs NPROCS]
[--noQuiver] [--minMaxInsertLength MINMAXINSERTLENGTH] [--hqStartTime
HQSTARTTIME] [--minReadScore MINREADSCORE] [--minAvgBarcodeScore
MINAVGBARCODESCORE] [--minNumBarcodes MINNUMBARCODES] [--minScoreRatio
MINSCORERATIO] [--barcode BARCODE [BARCCODE ...]] input.fofn barcode.fofn

Calculați secvențele de consens pentru fiecare cod de bare.

pozitional argumente:
input.fofn input bas.h5 fofn file barcode.fofn input bc.h5
fisierul fofn

facultativ argumente:

-h, --Ajutor
afișați acest mesaj de ajutor și ieșiți

--subproba SUBSONGELĂ
Subeșantioane ZMW (implicit: 1)

--nZmws NZMWS
Luați n ZMW (implicit: -1)

--outDir EXTERIOR
Utilizați acest director pentru a obține rezultate (implicit: .)

--keepTmpDir --ccsFofn CCSFOFN Obține date CCS de la ccsFofn în loc de
intrare.fofn
(Mod implicit: )

--nProcs NPROCS
Utilizați nProcs pentru a executa. (implicit: 16)

--noQuiver --minMaxInsertLength MINMAXINSERTLENGTH
Filtru ZMW: excludeți ZMW în cazul în care cea mai lungă citire este mai mică decât această sumă
(implicit: 0)

--hqStartTime HQSTARTTIME
Filtru ZMW: excludeți ZMW dacă ora de pornire a regiunii HQ este mai mare decât această valoare
(secunde) (implicit: inf)

--minReadScore MINREADSCORE
Filtru ZMW: excludeți ZMW dacă readScore este mai mic decât această valoare (implicit: 0)

--minAvgBarcodeScore MINAVGBARCODESCORE
Filtru ZMW: excludeți ZMW dacă scorul mediu al codului de bare este mai mic decât această valoare
(implicit: 0.0)

--minNumBarcodes MINNUMBARCCODES
Filtru ZMW: excludeți ZMW dacă numărul de coduri de bare observate este mai mic decât acesta
valoare (implicit: 1)

--minScoreRatio MINSCORERATIO
Filtru ZMW: excludeți ZMW al căror cel mai bun scor împărțit la al 2-lea cel mai bun scor
este mai mic decât acest raport (implicit: 1.0)

--cod de bare COD DE BARE [COD DE BARRE ...]
Utilizați acest lucru pentru a extrage consens pentru un singur cod de bare. (implicit: niciunul)

emitFastqs comanda ia ca intrare atât un input.fofn pentru fișierele bas.h5, cât și un
cod de bare.fofn dintr-un apel la labelZmws. Rezultatele sunt un fișier FASTA cu o intrare pentru fiecare
cod de bare care conține secvența ampliconului consens. Acest mod utilizează freamăt si pbdagcon
pentru a calcula consensul.

În cazurile în care ampliconul este mai mic de 2.5k baze, utilizarea datelor CCS este destul de utilă. The
--ccsFofn permite trecerea directă a fișierelor ccs. În multe cazuri, atât CCS cât și brut
apelurile de bază sunt în același fișier, așa că puteți verifica prin transmiterea aceluiași parametru la
input.fofn ca la ccsFofn.

dependenţe
Pachetul pbbarcode depinde de o instalare standard pbcore (‐
https://github.com/PacificBiosciences/pbcore). Dacă cineva dorește să folosească consens instrument,
pbdagcon trebuie instalat (https://github.com/PacificBiosciences/pbdagcon).

coduri de bare HDF5 Fișier
Fișierul cod de bare hdf5, bc.h5, reprezintă un simplu depozit de date pentru apelurile cu coduri de bare și a acestora
scoruri pentru fiecare ZMW. În general, un utilizator nu trebuie să interacționeze cu fișierele cu coduri de bare hdf5, dar poate
utilizați rezultatele stocate fie în fișierul cmp.h5 rezultat, fie în fișierele fast[a|q]. Codul de bare
Fișierul hdf5 conține următoarea structură:

/BarcodeCalls/best - (nZMWs, 6) [întreg pe 32 de biți] set de date cu următoarele coloane:
holeNumber,nAdaptoare,barcodeIdx1,barcodeScore1,barcodeIdx2,barcodeScore2

În plus, Cel mai bun setul de date are următoarele atribute:

┌────────────┬───────────────────────────── ───────── ─────────────────────────────┐
│movieName │ m120408_042614_richard_c100309392550000001523011508061222_s1_p0 │
├────────────┼─────────────────────────────── ───────── ─────────────────────────────┤
│ColumnNames │ holeNumber,nAdapters,barcodeIdx1,barcodeScore1,barcodeIdx2, │
│ │ cod de bareScore2 │
└────────────┴───────────────────────────── ───────── ─────────────────────────────┘

│scoreMode │ [simetric|pereche] │
├────────────┼─────────────────────────────── ───────── ─────────────────────────────┤
│coduri de bare │ „bc_1”, „bc_2”, ...., „bc_N” │
└────────────┴───────────────────────────── ───────── ─────────────────────────────┘

Cele două coloane barcodeIdx1 și barcodeIdx2 sunt indici în coduri de bare atribut. The
ScorMode este modul de scor folosit pentru a alinia codurile de bare. The coduri de bare atribut corespunde
codul de bare.numele secvenței fasta.

În plus, în unele circumstanțe, este util să reținem întreaga istorie a
scoring, adică fiecare cod de bare punctat pentru fiecare adaptor în toate ZMW-urile. Pentru a păstra acest lucru
informatii, trebuie sa sunati la:
pbbcode labelZmws --saveExtendedInfo ...

În acest mod, fișierul HDF5 rezultat va avea un set de date suplimentar sub
Grupul BarcodeCalls, denumit: toate. Acest set de date are următorul format:

/BarcodeCalls/all - (ncoduri de bare * nadapters[zmw_i], 4) pentru toate i în 1 ... nZMWs
`holeNumber, adapterIdx, cod de bareIdx, scor`

adapterIdx este indicele adaptorului de-a lungul moleculei, adică adapterIdx 1 este
primul adaptor a marcat.

Adăugări la il comparaţie HDF5 (cmp.h5) Fișier
Pe lângă fișierul cod de bare hdf5, un apel la labelAlignments va adnota un cmp.h5
fişier. Această adnotare este stocată în moduri compatibile cu formatul de fișier cmp.h5.
Mai exact, un nou grup:
/BarcodeInfo/
ID (nBarcodeLabels + 1, 1)[întreg de 32 de biți]
Nume (nBarcodeLabels + 1, 1)[șir de lungime variabilă]

În plus față de grupul /BarcodeInfo/, setul de date cheie care îi atribuie aliniamente
codurile de bare se află la:

/AlnInfo/Cod de bare (nAlignments, 3)[întreg pe 32 de biți] cu următoarele coloane:
index,count,bestIndex,bestScore,secondBestIndex,secondBestScore

Aici index se referă la indexul în Nume vector, scorul corespunde sumei
scorurile pentru codurile de bare și, în cele din urmă, numărul se referă la numărul de adaptoare găsite în
moleculă.

decembrie 2015 PBBARCODE(1)

Utilizați codul de bare pb online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

Comenzi Linux

Ad