Ito ang command na fastq-mcf na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
fastq-mcf - ea-utils: tuklasin ang mga antas ng presensya ng adaptor, kalkulahin ang mga posibilidad at lokasyon
ng mga adaptor
SINOPSIS
fastq-mcf [pagpipilian] [mga kasama1.fq ...]
DESCRIPTION
Bersyon: 1.04.676
Nakikita ang mga antas ng presensya ng adaptor, kinukuwenta ang mga posibilidad at lokasyon (simula, wakas) ng
mga adaptor. Tinatanggal ang mga pagkakasunud-sunod ng adaptor mula sa (mga) fastq file.
Ang mga istatistika ay napupunta sa stderr, maliban kung -o ay tinukoy.
Tukuyin -0 upang i-off ang lahat ng mga default na setting
Kung tumukoy ka ng maramihang mga input na 'ipinares-end', pagkatapos ay a -o kailangan ang opsyon para sa bawat isa. IE:
-o basahin1.clip.q -o basahin2.clip.fq
Opsyon
-h Ang tulong na ito
-o FIL Output file (stats sa stdout)
-s NN Log scale para sa adapter na minimum-length-match (2.2)
-t N % threshold ng paglitaw bago ang clipping ng adapter (0.25)
-m N Pinakamababang haba ng clip, in-override ang naka-scale na auto (1)
-p N Pinakamataas na porsyento ng pagkakaiba ng adaptor (10)
-l N Minimum na natitirang sequence haba (19)
-L N Maximum na natitirang sequence haba (wala)
-D N Alisin ang mga duplicate na nabasa : Read_1 ay may magkaparehong N base (0)
-k N sKew na porsyento-mas mababa sa nagiging sanhi ng pag-aalis ng ikot (2)
-x N 'N' (Hindi magandang nabasa) na porsyento na nagiging sanhi ng pag-aalis ng cycle (20)
-q N kalidad na threshold na nagiging sanhi ng pag-alis ng base (10)
-w N window-size para sa kalidad ng pag-trim (1)
-H alisin ang >95% homopolymer reads (hindi)
-X alisin ang mababang kumplikadong mga nabasa (hindi)
-0 Itakda ang lahat ng default na parameter sa zero/walang gawin
-U|u Puwersang huwag paganahin/paganahin ang pag-filter ng Illumina PF (auto)
-P N Phred-scale (auto)
-R Huwag tanggalin ang mga N sa harap/dulo ng mga nabasa
-n Huwag i-clip, i-output lang kung ano ang gagawin
-C N Bilang ng mga babasahin na gagamitin para sa subsampling (300k)
-S I-save ang lahat ng itinapon na mga nabasa sa '.skip' na mga file
-d Mag-output ng maraming random na bagay sa pag-debug
kalidad pagsasaayos na pagpipilian:
--cycle-adjust
CYC,AMT Isaayos ang cycle CYC (negatibo = offset mula sa dulo) ayon sa halagang AMT
--phred-adjust
SCORE,AMT Ayusin ang score SCORE ayon sa halagang AMT
--phred-adjust-max
SCORE Ayusin ang mga score > SCORE sa SCOTE
Pagsasala mga pagpipilian*:
--[mate-]qual-mean
NUM Pinakamababang mean na marka ng kalidad
--[mate-]qual-gt
NUM,THR Hindi bababa sa NUM quals > THR
--[mate-]max-ns
NUM Maxmium N-call sa isang read (maaaring isang %)
--[mate-]min-len
NUM Minimum na natitirang haba (katulad ng -l)
--homopolymer-pct
Porsiyento ng filter ng PCT Homopolymer (95)
--lowcomplex-pct
Porsiyento ng filter ng pagiging kumplikado ng PCT (95)
Kung ang mate- prefix ay ginagamit, pagkatapos ay nalalapat sa pangalawang hindi barcode read only
Ang mga adapter file ay 'fasta' na naka-format:
Tukuyin ang n/a para i-off ang adapter clipping, at gumamit lang ng mga filter
Ang pagpapataas ng sukat ay nagpapahaba ng mga haba ng pagkilala, ang isang sukat na 100 ay pipilitin
buong-haba na pagkilala ng mga adaptor.
Ang mga sequence ng adapter na may _5p sa kanilang label ay tutugma sa 'end's, at ang mga sequence na may _3p sa
tutugma ang kanilang label sa 'pagsisimula, kung hindi, ang 'pagtatapos' ay awtomatikong tinutukoy.
Ang skew ay kapag ang isang cycle ay mahirap, 'skewed' patungo sa isang partikular na base. Kung anumang nucleotide ay
mas mababa sa porsyento ng skew, pagkatapos ay aalisin ang buong cycle. Huwag paganahin para sa methyl-seq,
at iba pa
Itakda ang skew (-k) o N-pct (-x) hanggang 0 upang i-off ito (dapat gawin para sa miRNA, amplicon
at iba pang mga low-complexity na sitwasyon!)
Ang duplicate na read filtering ay angkop para sa mga gawain sa pagpupulong, at hindi kailanman kapag binasa ang haba
inaasahang saklaw. -D 50 ay gagamit ng 4.5GB RAM sa 100m DNA reads - mag-ingat. Mahusay para sa RNA
pagpupulong.
*Ang mga filter ng kalidad ay sinusuri pagkatapos ng clipping/trimming
Ang pag-filter ng homopolymer ay isang subset ng mababang pagiging kumplikado, ngunit hindi susubaybayan nang hiwalay
maliban kung pareho ay naka-on.
Gumamit ng fastq-mcf online gamit ang mga serbisyo ng onworks.net