Ito ang command na cutadapt3 na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
cutadapt - manual page para sa cutadapt 1.8.3
DESCRIPTION
cutadapt bersyon 1.8.3 Copyright © 2010-2015 Marcel Martin[protektado ng email]>
Tinatanggal ng cutadapt ang mga pagkakasunud-sunod ng adaptor mula sa mga nabasang high-throughput na sequencing.
Paggamit ng:
cutadapt -a ADAPTER [mga opsyon] [-o output.fastq] input.fastq
para paired-end bumabasa ng:
cutadapt -a ADAPT1 -A ADAPT2 [mga opsyon] -o out1.fastq -p out2.fastq in1.fastq
in2.fastq
Palitan ang "ADAPTER" ng aktwal na sequence ng iyong 3' adapter. IUPAC wildcard character
ay suportado. Ang reverse complement ay *hindi* awtomatikong hinanap. Lahat ng nabasa mula sa
input.fastq ay isusulat sa output.fastq na tinanggal ang pagkakasunud-sunod ng adaptor. Adapter
ang pagtutugma ay error-tolerant. Maaaring magbigay ng maraming pagkakasunud-sunod ng adaptor (gamitin pa -a
mga opsyon), ngunit ang pinakamahusay na tumutugmang adaptor lamang ang aalisin.
Ang input ay maaari ding nasa FASTA na format. Ang naka-compress na input at output ay sinusuportahan at
awtomatikong natukoy mula sa pangalan ng file (.gz, .xz, .bz2). Gamitin ang pangalan ng file na '-' para sa pamantayan
input/output. Kung wala ang -o opsyon, ang output ay ipinadala sa karaniwang output.
ilan iba magagamit mga tampok ay:
* Iba't ibang uri ng adapter (5' adapters, "mixed" 5'/3' adapters atbp.) *
Pag-trim ng isang nakapirming bilang ng mga base * Pag-trim ng kalidad * Pag-trim ng colorspace reads *
Pag-filter ng mga nabasa ayon sa iba't ibang pamantayan
Gamitin ang "cutadapt - Tumulong" para makita ang lahat ng opsyon sa command-line. Tingnan
http://cutadapt.readthedocs.org/ para sa buong dokumentasyon.
Opsyon
--bersyon
ipakita ang numero ng bersyon ng programa at lumabas
-h, - Tumulong
ipakita ang mensahe ng tulong na ito at lumabas
-f FORMAT, --format=FORMAT
Format ng input ng file; maaaring alinman sa 'fasta', 'fastq' o 'sra-fastq'. Hindi pinansin kung kailan
pagbabasa ng csfasta/qual file (default: auto-detect mula sa extension ng pangalan ng file).
Mga opsyon na nakakaimpluwensya kung paano matatagpuan ang mga adapter:
Ang bawat isa sa sumusunod na tatlong parameter (-a, -b, -g) ay maaaring gamitin ng maraming beses at
sa anumang kumbinasyon upang maghanap ng isang buong hanay ng mga adaptor na posibleng iba
mga uri. Tanging ang pinakamahusay na tumutugmang adaptor lamang ang pinuputol mula sa bawat nabasa (ngunit tingnan ang
--panahon opsyon). Sa halip na direktang magbigay ng adaptor, maaari ka ring sumulat
file:FILE at ang mga sequence ng adapter ay mababasa mula sa ibinigay na FILE (na dapat ay
sa format na FASTA).
-a ADAPTER, --adapter=ADAPTER
Pagkakasunud-sunod ng isang adaptor na naka-ligate sa dulong 3'. Ang adaptor mismo at
ang anumang kasunod ay pinuputol. Kung ang pagkakasunud-sunod ng adaptor ay nagtatapos sa '$'
character, ang adaptor ay nakaangkla sa dulo ng nabasa at makikita lamang kung ito ay a
panlapi ng binasa.
-g ADAPTER, --harap=ADAPTER
Pagkakasunud-sunod ng isang adaptor na naka-ligate sa dulong 5'. Kung ang pagkakasunod-sunod ng adaptor
nagsisimula sa karakter na '^', ang adaptor ay 'naka-angkla'. Ang isang naka-angkla na adaptor ay dapat
lilitaw sa kabuuan nito sa 5' dulo ng nabasa (ito ay unlapi ng binasa). A
Ang hindi naka-angkla na adaptor ay maaaring bahagyang lumitaw sa dulo ng 5', o maaaring mangyari ito sa loob ng
basahin. Kung ito ay matatagpuan sa loob ng isang nabasa, ang pagkakasunod-sunod na nauuna sa adaptor ay ganoon din
pinutol. Sa lahat ng mga kaso, ang adaptor mismo ay pinutol.
-b ADAPTER, --kahit saan=ADAPTER
Pagkakasunud-sunod ng isang adaptor na naka-ligate sa 5' o 3' dulo. Kung ang adaptor ay
matatagpuan sa loob ng nabasa o nagsasapawan sa 3' dulo ng nabasa, ang pag-uugali ay ang
katulad ng para sa -a opsyon. Kung nag-overlap ang adaptor sa 5' dulo (simula ng
read), ang unang bahagi ng read na tumutugma sa adaptor ay pinutol, ngunit
ang anumang kasunod ay iniingatan.
-e ERROR_RATE, --rate ng error=ERROR_RATE
Pinakamataas na pinapayagang rate ng error (bilang ng mga error na hinati sa haba ng pagtutugma
rehiyon) (default: 0.1)
--walang-indels
Huwag payagan ang mga indel sa mga alignment (pahintulutan lamang ang mga hindi pagkakatugma). Sa kasalukuyan lamang
suportado para sa mga naka-angkla na adaptor. (default: payagan ang parehong mismatches at indels)
-n COUNT, --panahon=COUNT
Subukang tanggalin ang mga adaptor nang hindi hihigit sa COUNT beses. Kapaki-pakinabang kapag may nakadugtong na adaptor
maraming beses (default: 1).
-O HABA, --nagpapatong=LENGTH
Minimum na haba ng overlap. Kung ang overlap sa pagitan ng read at adapter ay mas maikli
kaysa LENGTH, hindi binago ang nabasa. Binabawasan nito ang no. ng mga base na pinutol na puro
dahil sa maikling random na mga tugma ng adaptor (default: 3).
--match-read-wildcards
Payagan ang mga wildcard ng IUPAC sa mga reads (default: False).
-N, --no-match-adapter-wildcards
Huwag bigyang-kahulugan ang mga wildcard ng IUPAC sa mga adaptor.
Mga opsyon para sa pag-filter ng mga naprosesong nabasa:
--discard-trimmed, --i-discard
Itapon ang mga nabasa na naglalaman ng adaptor sa halip na putulin ang mga ito. Gumamit din -O in
upang maiwasan ang pagtatapon ng napakaraming random na katugmang nabasa!
--discard-untrimmed, --trimmed-lamang
Itapon ang mga nabasa na hindi naglalaman ng adaptor.
-m HABA, --minimum-haba=LENGTH
Itapon ang mga na-trim na nabasa na mas maikli kaysa LENGTH. Mga babasahin na masyadong maikli kahit na
bago ang pagtanggal ng adaptor ay itatapon din. Sa colorspace, ang paunang panimulang aklat ay hindi
binibilang (default: 0).
-M HABA, --maximum-haba=LENGTH
Itapon ang mga na-trim na nabasa na mas mahaba kaysa LENGTH. Mga babasahin na masyadong mahaba kahit
bago ang pagtanggal ng adaptor ay itatapon din. Sa colorspace, ang paunang panimulang aklat ay hindi
binibilang (default: walang limitasyon).
--walang-trim
Itugma at i-redirect ang mga nabasa sa output/untrimmed-output gaya ng dati, ngunit huwag alisin
adapter.
--max-n=LENGTH
Ang max na proporsyon ng N's pinapayagan sa isang read. Ang isang numero < 1 ay ituturing bilang a
proporsyon habang ang isang numero > 1 ay ituturing na pinakamataas na bilang ng mga N
nakapaloob.
--mask-adapter
Mask adapter na may 'N' na mga character sa halip na putulin ang mga ito.
Mga opsyon na nakakaimpluwensya kung ano ang makakakuha ng output kung saan:
--tahimik
Huwag mag-print ng ulat sa dulo.
-o FILE, --output=FILE
Isulat ang binagong mga nabasa sa FILE. Ang FASTQ o FASTA na format ay pinili depende sa input.
Ang ulat ng buod ay ipinadala sa karaniwang output. Gamitin ang '{name}' sa FILE para mag-demultiplex
bumabasa sa maramihang mga file. (default: trimmed reads ay nakasulat sa karaniwang output)
--info-file=FILE
Sumulat ng impormasyon tungkol sa bawat nabasa at ang adaptor nito ay tumutugma sa FILE. Tingnan ang
dokumentasyon para sa format ng file.
-r FILE, --pahinga-file=FILE
Kapag tumugma ang adaptor sa gitna ng isang nabasa, isulat ang natitira (pagkatapos ng
adapter) sa FILE.
--wildcard-file=FILE
Kapag ang adaptor ay may mga wildcard base ('N's), isulat ang mga adapter base na tumutugma sa wildcard
mga posisyon sa FILE. Kapag may mga indel sa pagkakahanay, madalas na wala ito
tumpak
--masyadong-maikling-output=FILE
Sumulat ng mga binasa na masyadong maikli (ayon sa haba na tinukoy ng -m) sa FILE.
(default: itapon ang mga nabasa)
--masyadong-mahabang-output=FILE
Sumulat ng mga binasa na masyadong mahaba (ayon sa haba na tinukoy ng -M) sa FILE.
(default: itapon ang mga nabasa)
--untrimmed-output=FILE
Sumulat ng mga nabasa na hindi naglalaman ng adaptor sa FILE. (default: output sa parehong file
bilang trimmed reads)
Mga karagdagang pagbabago sa mga nabasa:
-u HABA, --cut=LENGTH
Alisin ang mga base ng LENGTH sa simula o dulo ng bawat pagbabasa. Kung positibo ang LENGTH,
ang mga base ay tinanggal mula sa simula ng bawat pagbasa. Kung ang LENGTH ay negatibo, ang
ang mga base ay tinanggal mula sa dulo ng bawat pagbasa. Ang pagpipiliang ito ay maaaring tukuyin nang dalawang beses kung
ang mga LENGTH ay may iba't ibang palatandaan.
-q [5'CUTOFF,]3'CUTOFF, --kalidad-cutoff=[5'CUTOFF,]3'CUTOFF
I-trim ang mababang kalidad na mga base mula sa 5' at/o 3' na dulo ng mga reads bago alisin ang adapter. Kung
isang halaga ang ibinibigay, tanging ang 3' dulo lamang ang na-trim. Kung ang dalawang comma-separated cutoff ay
ibinigay, ang 5' dulo ay trimmed sa unang cutoff, ang 3' dulo sa pangalawa. Ang
Ang algorithm ay pareho sa ginamit ng BWA (tingnan ang dokumentasyon). (default: hindi
pagbabawas)
--kalidad-base=QUALITY_BASE
Ipagpalagay na ang mga halaga ng kalidad ay naka-encode bilang ascii(kalidad + QUALITY_BASE). Ang
default (33) ay karaniwang tama, maliban sa mga nabasa na ginawa ng ilang bersyon ng
Illumina pipeline, kung saan dapat itong itakda sa 64. (Default: 33)
--trim-n
Trim N's sa mga dulo ng reads.
-x PREFIX, --prefix=PREFIX
Idagdag ang prefix na ito para mabasa ang mga pangalan
-y SUFFIX, --panlapi=SUFFIX
Idagdag ang suffix na ito para mabasa ang mga pangalan
--strip-suffix=STRIP_SUFFIX
Alisin ang suffix na ito sa mga nabasang pangalan kung mayroon. Maaaring ibigay ng maraming beses.
-c, --colorspace
Colorspace mode: I-trim din ang kulay na katabi ng nakitang adapter.
-d, --double-encode
Kapag nasa colorspace, i-double-encode ang mga kulay (mapa 0,1,2,3,4 hanggang A,C,G,T,N).
-t, --trim-primer
Kapag nasa colorspace, gupitin ang primer base at ang unang kulay (na siyang transition
sa unang nucleotide)
--strip-f3
Para sa colorspace: I-strip ang _F3 suffix ng mga nabasang pangalan
--maq, --bwa
Output ng colorspace na katugma sa MAQ at BWA. Ito ay nagbibigay-daan -c, -d, -t, --strip-f3 at
-y '/1'.
--haba-tag=TAG
Maghanap ng TAG na sinusundan ng isang decimal na numero sa field ng paglalarawan ng nabasa.
Palitan ang decimal na numero ng tamang haba ng trimmed read. Para sa
halimbawa, gamitin --haba-tag 'length=' para itama ang mga field tulad ng 'length=123'.
--walang-zero-cap
Huwag baguhin ang mga negatibong halaga ng kalidad sa zero. Mga halaga ng kalidad ng colorspace ng -1
ay lilitaw bilang mga puwang sa output FASTQ file. Dahil maraming mga tool ang may problema
kasama nito, ang mga negatibong katangian ay na-convert sa zero kapag pinuputol ang data ng colorspace.
Gamitin ang opsyong ito upang mapanatili ang mga negatibong katangian.
-z, --zero-cap
Baguhin ang mga negatibong halaga ng kalidad sa zero. Ito ay pinagana bilang default kapag
-c/--colorspace ay pinagana din. Gamitin ang opsyon sa itaas upang huwag paganahin ito.
Mga opsyon sa paired-end.:
Ang -AAng /-G/-B/-U na mga opsyon ay gumagana tulad ng kanilang -a/-b/-g/-u mga katapat.
-A ADAPTER
3' adapter na aalisin mula sa pangalawang pagbasa sa isang pares.
-G ADAPTER
5' adapter na aalisin mula sa pangalawang pagbasa sa isang pares.
-B ADAPTER
5'/3 adapter na aalisin sa pangalawang pagbabasa sa isang pares.
-U LENGTH
Alisin ang mga base ng LENGTH mula sa simula o dulo ng bawat pagbasa (tingnan --cut).
-p FILE, --pinares-output=FILE
Sumulat ng pangalawang nabasa sa isang pares sa FILE.
--untrimmed-paired-output=FILE
Isulat ang pangalawang nabasa sa isang pares sa FILE na ito kapag walang nakitang adaptor sa una
basahin. Gamitin ang opsyong ito kasama ng --untrimmed-output kapag trimming pairedend
nagbabasa. (Default: output sa parehong file tulad ng mga na-trim na nabasa.)
Gamitin ang cutadapt3 online gamit ang mga serbisyo ng onworks.net