Ito ang command na convert_project na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
convert_project - i-convert ang assembly at sequencing na mga uri ng file
DESCRIPTION
Ang program na ito ay bahagi ng MIRA assembler package. Ito ay ginagamit upang i-convert ang file ng proyekto
mga uri sa iba pang mga uri. Pakitingnan ang dokumentasyon sa ibaba para sa mas detalyado
impormasyon tungkol sa convert_project.
SINOPSIS
convert_project
[-f ] [-t [-t ...]] [-aChimMsuZ] [-AcflnNoqrtvxXyz
{...}] {infile} {outfile} [ ...]
Opsyon
-f
i-load ang ganitong uri ng mga file ng proyekto, kung saan ang fromtype ay:
caf isang kumpletong pagpupulong o solong pagkakasunud-sunod mula sa CAF
maf isang kumpletong pagpupulong o mga solong sequence mula sa CAF
fasta sequences mula sa isang FASTA file
fastq sequence mula sa isang FASTQ file
gbf sequence mula sa isang GBF file
phd sequence mula sa isang PHD file
fofnexp
mga pagkakasunud-sunod sa EXP file mula sa file ng mga filename
-t
isulat ang mga sequence/assembly sa ganitong uri (maraming pagbanggit ng -t pinapayagan):
ace sequence o kumpletong pagpupulong sa ACE
caf sequence o kumpletong pagpupulong sa CAF
maf sequence o kumpletong pagpupulong sa MAF
sam kumpletong pagpupulong sa SAM
samnbb tulad ng nasa itaas, ngunit nag-iiwan ng sanggunian (mga backbone) sa mga pagpupulong sa pagmamapa
gbf sequence o consensus sa GBF
gff3 consensus sa GFF3
impormasyon sa saklaw ng pagpupulong ng peluka upang i-wiggle ang file
gcwig assembly gc na impormasyon ng nilalaman upang i-wiggle ang file
fasta sequence o consensus sa FASTA file (mga katangian sa
.qual)
fastq sequence o consensus sa FASTQ file
exp sequence o kumpletong pagpupulong sa EXP file sa
mga direktoryo. Ang mga kumpletong asembliya ay angkop para sa gap4 na pag-import bilang itinuro na pagpupulong.
Tandaan: ang paggamit ng caf2gap upang mag-import sa gap4 ay inirerekomenda bagaman
text complete assembly sa text alignment (kung kailan lang -f is
caf, maf o gbf)
html kumpletong pagpupulong sa HTML (lamang kapag -f ay caf, maf o
gbf)
tcs kumpletong pagpupulong sa tcs
hsnp na nakapalibot sa mga tag ng SNP (SROc, SAOc, SIOc) hanggang HTML (kapag lamang -f ay caf, maf o
gbf)
asnp analysis ng SNP tags (kung kailan lang -f ay caf, maf o gbf)
cstats contig statistics file tulad ng mula sa MIRA (lamang kapag naglalaman ang source ng contigs)
crlist contig read list file tulad ng mula sa MIRA (lamang kapag ang source ay naglalaman ng contigs)
maskedfasta
nagbabasa kung saan naka-mask out ang sequencing vector (na may X) sa FASTA file (mga katangian sa
.qual)
scaf sequence o kumpletong pagpupulong sa iisang sequence CAF
-a Idagdag sa mga target na file sa halip na muling pagsulat
-A
String na may mga parameter ng MIRA na i-parse Kapaki-pakinabang kapag nagtatakda ng mga parameter na nakakaapekto
consensus calling like -CO:mrpg atbp. Hal: -a "454_SETTINGS -CO:mrpg=3"
-b Blind data Pinapalitan ang lahat ng base sa reads/contigs ng 'c'
-C Magsagawa ng hard clip to reads Kapag nagbabasa ng mga format na tumutukoy sa mga clipping point, ay
i-save lamang ang hindi na-clipped na bahagi sa file ng resulta.
Nalalapat lamang sa mga file/format na hindi naglalaman
contigs.
-d Tanggalin ang gap lamang na mga column Kapag ang output ay contigs: tanggalin ang mga column na
ganap na gaps (tulad ng pagkatapos na tanggalin ang mga nabasa habang nag-e-edit sa gap4 o katulad)
Kapag nabasa ang output: tanggalin ang mga puwang sa mga nabasa
-F I-filter para basahin ang mga grupo Espesyal na kaso ng paggamit, huwag pa gamitin.
-m Gumawa ng contigs (para lang -t = caf o maf) I-encase ang mga single reads bilang contig singlets into
ang CAF/MAF file.
-n
kapag ibinigay, pinipili lamang ang mga read o contigs na ibinigay ng pangalan sa file na iyon.
-i kailan -n ay ginagamit, binabaligtad ang pagpili
-o fastq quality Offset (para lang sa -f = 'fastq') Offset ng mga halaga ng kalidad sa FASTQ
file. Ang default na 0 ay sumusubok na awtomatikong makilala.
-Q
Itakda ang default na kalidad para sa mga base sa mga uri ng file nang walang mga halaga ng kalidad Higit pa rito, gawin
hindi titigil kung nawawala ang inaasahang kalidad ng mga file (hal. '.fasta')
-R
Palitan ang pangalan ng contigs/singlets/reads gamit ang ibinigay na string ng pangalan kung saan ang isang counter ay
nakadugtong. Kilalang bug: lilikha ng mga duplicate na pangalan kung input
naglalaman ng mga contigs/singlet pati na rin ang mga libreng pagbabasa, ibig sabihin, ang mga pagbabasa ay hindi sa contigs ni
singlet.
-S
(pangalan)Skema para sa pagpapalit ng pangalan sa mga nabasa, mahalaga para sa mga paired-ends Tanging ang 'solexa' ay
kasalukuyang sinusuportahan.
Ang sumusunod switch trabaho lamang kailan input (CAF or MAF) naglalaman ng contigs.
Mag-ingat: Ang CAF at MAf ay maaari ding maglaman ng mga nabasa lang.
-M Huwag kunin ang mga contigs (o ang kanilang pinagkasunduan), ngunit ang pagkakasunud-sunod ng mga nabasa ay sila
gawa sa.
-N
gaya ng -n, ngunit inaayos ang output ayon sa pagkakasunud-sunod na ibinigay sa file.
-r [cCqf]
Muling kalkulahin ang consensus at / o consensus na mga halaga ng kalidad at / o mga tag ng feature ng SNP.
'c' recalc cons & cons na mga katangian (na may IUPAC) 'C' recalc cons at cons na mga katangian
(pagpipilit sa hindi IUPAC) 'q' recalc consensus na mga katangian lang 'f' recalc SNP feature
Tandaan: ang huli lang ng cCq ang may kaugnayan, f gumagana bilang a
switch at maaaring isama sa cQq (hal. "-r C -r f")
Tandaan: kung ang CAF/MAF ay naglalaman ng maraming strain, muling pagkalkula ng mga kahinaan at kahinaan
pinipilit ang mga katangian, ikaw
maaari lamang makaimpluwensya kung ang mga IUPAC ay ginagamit o hindi.
-s hatiin ang output sa maraming file sa halip na lumikha ng isang file
-u 'fillUp strain genomes' Punan ang mga butas sa genome ng isang strain (N o @) na may
pagkakasunud-sunod mula sa isang pinagkasunduan ng iba pang mga strain May bisa lamang sa -r at -t gbf o
fasta/q sa FASTA/Q: ang mga base na napunan ay nasa lower case sa GBF: ang mga base na napuno ay
sa upper case
-q
Tinutukoy ang pinakamababang kalidad na dapat magkaroon ng consensus base ng isang strain, mga consensus base
sa ibaba nito ay magiging 'N' Default: 0 Ginagamit lamang kasama ng -r, at -f ay caf/maf at -t is
(fasta
o gbf)
-v I-print ang numero ng bersyon at lumabas
-x
Minimum contig o read length Kapag naglo-load, itapon ang lahat ng contigs / reads na may a
haba na mas mababa kaysa sa halagang ito. Default: 0 (=switched off) Tandaan: hindi inilapat sa mga reads
sa contigs!
-X
Kapareho ng -x ngunit nalalapat lamang sa mga nabasa at pagkatapos ay sa pinutol na haba.
-y
Pinakamababang average na saklaw ng contig Kapag naglo-load, itapon ang lahat ng contig na may average
mas mababa sa halagang ito ang saklaw. Default: 1
-z
Minimum na bilang ng mga nabasa sa contig Kapag naglo-load, itapon ang lahat ng contig na may numero
ng mga reads na mas mababa sa value na ito. Default: 0 (=naka-off)
-l
kapag output bilang text o HTML: bilang ng mga base na ipinapakita sa isang linya ng pagkakahanay. Default:
60.
-c
kapag nag-output bilang text o HTML: character na ginamit upang pad endgaps. Default: ' ' (blangko)
Mga alias: caf2html, exp2fasta, ... atbp. Anumang kumbinasyon ng " 2 "
ay maaaring gamitin bilang pangalan ng programa (gumagamit din ng mga link) upang awtomatiko itong convert_project
set -f at -t ayon dito.
HALIMBAWA
convert_project source.maf dest.sam
convert_project source.caf dest.fasta wig ace
convert_project -x 2000 -y 10 source.caf dest.caf
caf2html -l 100 -c . source.caf dest
Gamitin ang convert_project online gamit ang mga serbisyo ng onworks.net