Questo è il comando convert_project che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
convert_project - converte i tipi di file di assembly e sequenza
DESCRIZIONE
Questo programma fa parte del pacchetto assembler MIRA. È usato per convertire il file di progetto
tipi in altri tipi. Si prega di controllare la documentazione di seguito per ulteriori dettagli
informazioni su convert_project.
SINOSSI
convert_progetto
[-F ] [-T [-T ...]] [-aChimMsuZ] [-AcflnNoqrtvxXyz
{...}] {file in entrata} {file in uscita} [ ...]
VERSIONI
-f
caricare questo tipo di file di progetto, dove fromtype è:
caf un assemblaggio completo o singole sequenze da CAF
maf un assemblaggio completo o singole sequenze da CAF
sequenze fasta da un file FASTA
sequenze fastq da un file FASTQ
sequenze gbf da un file GBF
sequenze phd da un file PHD
fofnexp
sequenze in file EXP da file di nomi di file
-t
scrivi le sequenze/assembly a questo tipo (menzioni multiple di -t sono ammessi):
sequenze asso o assemblaggio completo su ACE
sequenze caf o assemblaggio completo a CAF
sequenze maf o assemblaggio completo a MAF
sam assemblaggio completo a SAM
samnbb come sopra, ma tralasciando il riferimento (backbone) negli assembly di mappatura
sequenze gbf o consenso a GBF
consenso gff3 a GFF3
informazioni sulla copertura dell'assemblaggio della parrucca per il file di oscillazione
gcwig assembly gc content info per wiggle file
sequenze fasta o consenso al file FASTA (qualità a
.qual)
sequenze fastq o consenso al file FASTQ
sequenze exp o assemblaggio completo in file EXP in
directory. Gli assemblaggi completi sono adatti per l'importazione di gap4 come assemblaggio diretto.
Nota: si consiglia comunque di utilizzare caf2gap per importare in gap4
testo completo assemblaggio all'allineamento del testo (solo quando -f is
caf, maf o gbf)
html assemblaggio completo in HTML (solo quando -f è caf, maf o
GBF)
tcs montaggio completo su tcs
hsnp che circonda i tag SNP (SROc, SAOc, SIoc) in HTML (solo quando -f è caf, maf o
GBF)
analisi asnp dei tag SNP (solo quando -f è caf, maf o gbf)
cstats file di statistiche contig come da MIRA (solo quando la sorgente contiene contig)
crlist contig read list file come da MIRA (solo quando la sorgente contiene contigs)
mascherata
legge dove il vettore di sequenza è mascherato (con X) nel file FASTA (qualità a
.qual)
sequenze scaf o assemblaggio completo a singole sequenze CAF
-a Aggiungi ai file di destinazione invece di riscrivere
-A
Stringa con parametri MIRA da analizzare Utile quando si impostano parametri che interessano
consenso chiamando come -CO:mrpg ecc. Ad esempio: -a "454_IMPOSTAZIONI -CO:mrpg=3"
-b Dati ciechi Sostituisce tutte le basi in letture/contig con una 'c'
-C Esegui hard clip in read Durante la lettura di formati che definiscono i punti di ritaglio, sarà
salva solo la parte non ritagliata nel file di risultato.
Si applica solo a file/formati che non contengono
contig.
-d Elimina colonne solo gap Quando l'output è contigs: elimina le colonne che lo sono
completamente vuoti (come dopo aver cancellato le letture durante la modifica in gap4 o simili)
Quando l'output viene letto: elimina gli spazi vuoti nelle letture
-F Filtra per leggere i gruppi Caso d'uso speciale, non usarlo ancora.
-m Crea contig (solo per -t = caf o maf) racchiude le letture singole come singoletti contig in
il file CAF/MAF.
-n
quando dato, seleziona solo read o contigs dati per nome in quel file.
-i quando -n viene utilizzato, inverte la selezione
-o Offset qualità fastq (solo per -f = 'fastq') Compensazione dei valori di qualità in FASTQ
file. Il valore predefinito 0 tenta di riconoscere automaticamente.
-Q
Imposta la qualità predefinita per le basi nei tipi di file senza valori di qualità Inoltre, non
non si ferma se mancano file di qualità prevista (es. '.fasta')
-R
Rinomina contigs/singlet/read con una data stringa di nome a cui si trova un contatore
allegato. Bug noto: creerà nomi duplicati se immessi
contiene contigs/singlet così come letture libere, cioè non legge in contigs né
canottiere.
-S
(nome)Schema per rinominare le letture, importante per le estremità accoppiate Solo 'solexa' è
attualmente supportato.
Il i seguenti interruttori lavoro esclusivamente quando ingresso (CAF or MAF) contiene contig.
Attenzione: CAF e MAf possono contenere anche solo letture.
-M Non estrarre contig (o il loro consenso), ma la sequenza delle letture che sono
composto da.
-N
piace -n, ma ordina l'output in base all'ordine indicato nel file.
-r [cCqf]
Ricalcolare il consenso e/o i valori di qualità del consenso e/o i tag delle caratteristiche SNP.
'c' ricalca contro e qualità (con IUPAC) 'C' ricalcola contro e qualità
(forzando non-IUPAC) 'q' ricalca solo le qualità di consenso 'f' ricalca le caratteristiche SNP
Nota: solo l'ultimo di cCq è rilevante, f funziona come a
switch e può essere combinato con cQq (es. "-r C -r F")
Nota: se il CAF/MAF contiene più ceppi, ricalcolo di contro e contro
le qualità sono forzate, tu
può solo influenzare se gli IUPAC vengono utilizzati o meno.
-s dividere l'output in più file invece di creare un singolo file
-u 'fillUp ceppo genomi' Riempi i buchi nel genoma di un ceppo (N o @) con
sequenza da un consenso di altri ceppi Ha effetto solo con -r e -t gbf o
fasta/q in FASTA/Q: le basi riempite sono in minuscolo in GBF: le basi riempite sono
in maiuscolo
-q
Definisce la qualità minima che deve avere una base di consenso di un ceppo, basi di consenso
sotto questo sarà 'N' Predefinito: 0 Usato solo con -r e -f è caf/maf e -t is
(fast
o gbf)
-v Stampa il numero della versione ed esci
-x
Lunghezza minima di lettura o contig Durante il caricamento, scartare tutti i contig / letture con a
lunghezza inferiore a questo valore. Default: 0 (=spento) Nota: non applicato alle letture
in conti!
-X
Simile a -x ma si applica solo alle letture e quindi alla lunghezza ritagliata.
-y
Copertura media minima dei contig Durante il caricamento, scartare tutti i contig con una media
copertura inferiore a questo valore. Predefinito: 1
-z
Numero minimo di letture in contig Durante il caricamento, scarta tutti i contig con un numero
di letture inferiori a questo valore. Default: 0 (=spento)
-l
quando emesso come testo o HTML: numero di basi mostrate in una linea di allineamento. Predefinito:
60
-c
quando emesso come testo o HTML: carattere utilizzato per riempire gli spazi finali. Predefinito: ' ' (vuoto)
Alias: caf2html, exp2fasta, ... ecc. Qualsiasi combinazione di " 2 "
può essere usato come nome del programma (anche usando i collegamenti) in modo che convert_project automaticamente
set -f e -t di conseguenza.
ESEMPI
convert_project sorgente.maf dest.sam
convert_project source.caf dest.fasta parrucca asso
convert_project -x 2000 -y 10 source.caf dest.caf
caf2html -l 100 -c . fonte.caf dest
Usa convert_project online utilizzando i servizi onworks.net