Questo è il comando cutadapt che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
cutadapt - pagina di manuale per cutadapt 1.8.3
DESCRIZIONE
cutadapt versione 1.8.3 Copyright © 2010-2015 Marcel Martin[email protected]>
cutadapt rimuove le sequenze dell'adattatore dalle letture di sequenziamento ad alta velocità.
Uso:
adattare -a ADATTATORE [opzioni] [-o output.fastq] input.fastq
Per coppia di estremità si legge:
adattare -a ADATT1 -A ADAPT2 [opzioni] -o out1.fastq -p out2.fastq in1.fastq
in2.fastq
Sostituisci "ADATTATORE" con la sequenza effettiva del tuo adattatore da 3'. Caratteri jolly IUPAC
sono supportati. Il complemento inverso *non* viene ricercato automaticamente. Tutto letto da
input.fastq verrà scritto in output.fastq con la sequenza dell'adattatore rimossa. Adattatore
la corrispondenza è tollerante agli errori. Possono essere date più sequenze di adattatori (usare ulteriormente -a
opzioni), ma verrà rimosso solo l'adattatore più adatto.
L'input può anche essere in formato FASTA. Sono supportati input e output compressi e
rilevato automaticamente dal nome del file (.gz, .xz, .bz2). Usa il nome del file '-' per standard
input Output. Senza il -o opzione, l'output viene inviato allo standard output.
Alcuni Altro disponibile Caratteristiche siamo:
* Vari altri tipi di adattatori (adattatori 5', adattatori "misti" 5'/3' ecc.) *
Ritaglio di un numero fisso di basi * Ritaglio di qualità * Ritaglio delle letture dello spazio colore *
Filtraggio delle letture in base a vari criteri
Usa "cutadapt --Aiuto" per vedere tutte le opzioni della riga di comando. Vedi
http://cutadapt.readthedocs.org/ per la documentazione completa.
VERSIONI
--versione
mostra il numero di versione del programma ed esci
-h, --Aiuto
mostra questo messaggio di aiuto ed esci
-f FORMATO, --formato=FORMATO
Formato file di input; può essere 'fasta', 'fastq' o 'sra-fastq'. Ignorato quando
lettura di file csfasta/qual (impostazione predefinita: rilevamento automatico dall'estensione del nome file).
Opzioni che influenzano il modo in cui vengono trovati gli adattatori:
Ciascuno dei seguenti tre parametri (-a, -b, -g) può essere utilizzato più volte e
in qualsiasi combinazione per cercare un intero set di adattatori possibilmente diversi
tipi. Solo il miglior adattatore corrispondente viene tagliato da ogni lettura (ma vedi il
--volte opzione). Invece di fornire direttamente un adattatore, puoi anche scrivere
file:FILE e le sequenze dell'adattatore verranno lette dal dato FILE (che deve essere
in formato FASTA).
-a ADATTATORE, --adattatore=ADATTATORE
Sequenza di un adattatore che è stato legato all'estremità 3'. L'adattatore stesso e
tutto ciò che segue viene tagliato. Se la sequenza dell'adattatore termina con '$'
carattere, l'adattatore è ancorato alla fine della lettura e si trova solo se è a
suffisso della lettura.
-g ADATTATORE, --davanti=ADATTATORE
Sequenza di un adattatore che è stato legato all'estremità 5'. Se la sequenza dell'adattatore
inizia con il carattere '^', l'adattatore è 'ancorato'. Un adattatore ancorato deve
appare nella sua interezza all'estremità 5' della lettura (è un prefisso della lettura). UN
l'adattatore non ancorato può apparire parzialmente all'estremità 5' o può verificarsi all'interno del
leggere. Se si trova all'interno di una lettura, anche la sequenza che precede l'adattatore è
tagliato. In tutti i casi, l'adattatore stesso viene tagliato.
-b ADATTATORE, --ovunque=ADATTATORE
Sequenza di un adattatore che è stato legato all'estremità 5' o 3'. Se l'adattatore è
trovato all'interno della lettura o sovrapposto all'estremità 3' della lettura, il comportamento è il
lo stesso che per il -a opzione. Se l'adattatore si sovrappone all'estremità 5' (inizio del
read), la parte iniziale della lettura corrispondente all'adattatore viene tagliata, ma
tutto ciò che segue viene mantenuto.
-e TASSO_ERRORE, --tasso di errore=ERRORE_RATE
Tasso di errore massimo consentito (n. di errori diviso per la lunghezza della corrispondenza
regione) (predefinito: 0.1)
--no-indels
Non consentire indel negli allineamenti (consentire solo disallineamenti). Attualmente solo
supportato per adattatori ancorati. (predefinito: consenti sia i mismatch che gli indel)
-n CONTARE, --volte=COUNT
Prova a rimuovere gli adattatori al massimo COUNT volte. Utile quando viene aggiunto un adattatore
più volte (predefinito: 1).
-O LUNGHEZZA, --sovrapposizione=LUNGHEZZA
Lunghezza minima di sovrapposizione. Se la sovrapposizione tra la lettura e l'adattatore è più breve
superiore a LENGTH, la lettura non viene modificata. Questo riduce il n. di basi rifilate puramente
a causa di brevi corrispondenze casuali dell'adattatore (impostazione predefinita: 3).
--match-read-caratteri jolly
Consenti i caratteri jolly IUPAC nelle letture (impostazione predefinita: False).
-N, --no-match-adapter-jolly
Non interpretare i caratteri jolly IUPAC negli adattatori.
Opzioni per il filtraggio delle letture elaborate:
--scarta-rifilato, --scartare
Scarta le letture che contengono l'adattatore invece di tagliarle. Usa anche -O in
per evitare di buttare via troppe letture con corrispondenza casuale!
--scarta-non tagliato, --solo-rifilato
Scarta letture che non contengono l'adattatore.
-m LUNGHEZZA, --lunghezza-minima=LUNGHEZZA
Elimina le letture tagliate che sono più corte di LENGTH. Letture troppo brevi anche
prima della rimozione dell'adattatore vengono scartati. Nello spazio colore, un primer iniziale non lo è
contato (predefinito: 0).
-M LUNGHEZZA, --lunghezza massima=LUNGHEZZA
Elimina le letture tagliate che sono più lunghe di LENGTH. Letture troppo lunghe anche
prima della rimozione dell'adattatore vengono scartati. Nello spazio colore, un primer iniziale non lo è
contato (predefinito: nessun limite).
--nessun taglio
Abbina e reindirizza le letture a output/untrimmed-output come al solito, ma non rimuovere
adattatori.
--max-n=LUNGHEZZA
La proporzione massima di N consentita in una lettura. Un numero < 1 sarà trattato come a
proporzione mentre un numero > 1 sarà trattato come il numero massimo di N's
contenute.
--adattatore-maschera
Maschera gli adattatori con caratteri 'N' invece di tagliarli.
Opzioni che influenzano cosa ottiene l'output in cui:
--silenzioso
Non stampare un report alla fine.
-o FILE, --produzione=RISORSE
Scrivi le letture modificate su FILE. Il formato FASTQ o FASTA viene scelto a seconda dell'input.
Il report di riepilogo viene inviato allo standard output. Usa '{name}' in FILE per demultiplexare
legge in più file. (predefinito: le letture tagliate vengono scritte sullo standard output)
--file-info=RISORSE
Scrivere informazioni su ciascuna lettura e le relative corrispondenze dell'adattatore in FILE. Vedi il
documentazione per il formato del file.
-r FILE, --rest-file=RISORSE
Quando l'adattatore corrisponde nel mezzo di una lettura, scrivi il resto (dopo il
adattatore) in FILE.
--file con caratteri jolly=RISORSE
Quando l'adattatore dispone di basi con caratteri jolly ('N), scrivere le basi dell'adattatore corrispondenti ai caratteri jolly
posizioni su FILE. Quando ci sono indel nell'allineamento, questo spesso non sarà
accurate.
--uscita troppo corta=RISORSE
Scrivi letture troppo corte (secondo la lunghezza specificata da -m) in FILE.
(predefinito: scarta letture)
--output troppo lungo=RISORSE
Scrivi letture troppo lunghe (secondo la lunghezza specificata da -M) in FILE.
(predefinito: scarta letture)
--output non tagliato=RISORSE
Scrivi letture che non contengono l'adattatore su FILE. (predefinito: output nello stesso file
come letture tagliate)
Ulteriori modifiche alle letture:
-u LUNGHEZZA, --tagliare=LUNGHEZZA
Rimuovere le basi LENGTH dall'inizio o dalla fine di ogni lettura. Se LENGTH è positivo,
le basi vengono rimosse dall'inizio di ogni lettura. Se LENGTH è negativo, il
le basi vengono rimosse alla fine di ogni lettura. Questa opzione può essere specificata due volte se
le LUNGHEZZE hanno segni diversi.
-q [5'CUTOFF,]3'CUTOFF, --qualità-taglio=[5'CUTOFF,]3'CUTOFF
Taglia le basi di bassa qualità dalle estremità 5' e/o 3' delle letture prima della rimozione dell'adattatore. Se
viene dato un valore, viene tagliata solo l'estremità 3'. Se due tagli separati da virgole sono
dato, l'estremità 5' è tagliata con il primo cutoff, l'estremità 3' con la seconda. Il
l'algoritmo è lo stesso utilizzato da BWA (vedi documentazione). (predefinito: no
Rifinitura)
--qualità-base=QUALITÀ_BASE
Assumiamo che i valori di qualità siano codificati come ascii(quality + QUALITY_BASE). Il
default (33) è solitamente corretto, ad eccezione delle letture prodotte da alcune versioni del
Pipeline Illumina, dove dovrebbe essere impostato su 64. (Predefinito: 33)
--trim-n
Tagliare le N alle estremità delle letture.
-x PREFISSO, --prefisso=PREFISSO
Aggiungi questo prefisso per leggere i nomi
-y SUFFISSO, --suffisso=SUFFISSO
Aggiungi questo suffisso per leggere i nomi
--strip-suffisso=SUFFISSO_STRISCIA
Rimuovere questo suffisso dai nomi letti, se presente. Può essere somministrato più volte.
-c, --spazio colore
Modalità Colorspace: ritaglia anche il colore adiacente all'adattatore trovato.
-d, --doppia codifica
Quando si è nello spazio colore, codificare due volte i colori (mappa 0,1,2,3,4 su A,C,G,T,N).
-t, --trim-primer
Quando sei nello spazio colore, taglia la base del primer e il primo colore (che è la transizione
al primo nucleotide)
--striscia-f3
Per lo spazio colore: elimina il suffisso _F3 dei nomi letti
--maq, --bwa
Output dello spazio colore compatibile con MAQ e BWA. Ciò consente -c, -d, -t, --striscia-f3 che a
-y '/1'.
--tag-lunghezza=TAG
Cerca TAG seguito da un numero decimale nel campo descrizione della lettura.
Sostituire il numero decimale con la lunghezza corretta della lettura tagliata. Per
esempio, usa --tag-lunghezza 'length=' per correggere campi come 'length=123'.
--no-zero-cap
Non modificare i valori di qualità negativi a zero. Valori di qualità dello spazio colore di -1
apparirebbe come spazi nel file FASTQ di output. Poiché molti strumenti hanno problemi
con ciò, le qualità negative vengono convertite a zero quando si ritagliano i dati dello spazio colore.
Usa questa opzione per mantenere le qualità negative.
-z, --zero-cap
Modificare i valori di qualità negativi a zero. Questo è abilitato per impostazione predefinita quando
-cAnche /--colorspace è abilitato. Usa l'opzione sopra per disabilitarlo.
Opzioni paired-end.:
Le -ALe opzioni /-G/-B/-U funzionano come le loro -a/-b/-g/-u controparti.
-A ADATTATORE
Adattatore da 3' da rimuovere dalla seconda lettura in coppia.
-G ADATTATORE
Adattatore da 5' da rimuovere dalla seconda lettura in coppia.
-B ADATTATORE
Adattatore 5'/3 da rimuovere dalla seconda lettura in coppia.
-U LUNGHEZZA
Rimuovere le basi LENGTH dall'inizio o dalla fine di ogni lettura (vedi --tagliare).
-p FILE, --output accoppiato=RISORSE
Scrivi la seconda lettura in coppia su FILE.
--output accoppiato non tagliato=RISORSE
Scrivi la seconda lettura in coppia su questo FILE quando non è stato trovato alcun adattatore nel primo
leggere. Usa questa opzione insieme a --output non tagliato quando si taglia il pairedend
legge. (Predefinito: output nello stesso file delle letture tagliate.)
Usa cutadapt online utilizzando i servizi onworks.net