ນີ້ແມ່ນຄໍາສັ່ງ convert_project ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
convert_project - ປ່ຽນການປະກອບແລະການຈັດລໍາດັບໄຟລ໌ປະເພດ
ລາຍລະອຽດ
ໂຄງການນີ້ແມ່ນສ່ວນຫນຶ່ງຂອງຊຸດປະກອບ MIRA. ມັນຖືກນໍາໃຊ້ເພື່ອປ່ຽນໄຟລ໌ໂຄງການ
ປະເພດເປັນປະເພດອື່ນໆ. ກະລຸນາກວດເບິ່ງເອກະສານຂ້າງລຸ່ມນີ້ສໍາລັບລາຍລະອຽດເພີ່ມເຕີມ
ຂໍ້ມູນກ່ຽວກັບ convert_project.
ສະຫຼຸບສັງລວມ
convert_project
[-f ] [-ທ [-ທ ...]] [-aChimMsuZ] [-AcflnNoqrtvxXyz
{...}] {infile} {outfile} [ ...]
OPTIONS
-f
ໂຫຼດໄຟລ໌ໂຄງການປະເພດນີ້, ບ່ອນທີ່ມາຈາກປະເພດ:
caf ການປະກອບທີ່ສົມບູນຫຼືລໍາດັບດຽວຈາກ CAF
maf ການປະກອບທີ່ສົມບູນຫຼືລໍາດັບດຽວຈາກ CAF
ລໍາດັບ fasta ຈາກໄຟລ໌ FASTA
ລໍາດັບ fastq ຈາກໄຟລ໌ FASTQ
ລໍາດັບ gbf ຈາກໄຟລ໌ GBF
ລໍາດັບ phd ຈາກໄຟລ໌ PHD
fofnexp
ລໍາດັບໃນໄຟລ໌ EXP ຈາກໄຟລ໌ຊື່ໄຟລ໌
-t
ຂຽນລໍາດັບ / ປະກອບກັບປະເພດນີ້ (ກ່າວເຖິງຫຼາຍ -t ອະນຸຍາດໃຫ້:
ລໍາດັບ ace ຫຼືການປະກອບສໍາເລັດກັບ ACE
ລໍາດັບ caf ຫຼືການປະກອບສໍາເລັດກັບ CAF
ລໍາດັບ maf ຫຼືການປະກອບທີ່ສົມບູນກັບ MAF
sam ປະກອບສໍາເລັດກັບ SAM
samnbb ຄືກັບຂ້າງເທິງ, ແຕ່ອອກຈາກການອ້າງອິງ (ກະດູກສັນຫຼັງ) ໃນການປະກອບແຜນທີ່
gbf ລໍາດັບຫຼືຄວາມເຫັນດີກັບ GBF
gff3 ເຫັນດີກັບ GFF3
ຂໍ້ມູນການຄຸ້ມຄອງການປະກອບ wig ເພື່ອ wiggle ໄຟລ໌
gcwig ປະກອບ gc ຂໍ້ມູນເນື້ອຫາເພື່ອ wiggle ໄຟລ໌
ລໍາດັບ fasta ຫຼືເປັນເອກະສັນກັບໄຟລ໌ FASTA (ຄຸນນະພາບກັບ
.qual)
ລໍາດັບ fastq ຫຼືຄວາມເຫັນດີກັບໄຟລ໌ FASTQ
ລໍາດັບ exp ຫຼືປະກອບສໍາເລັດກັບໄຟລ໌ EXP ໃນ
ໄດເລກະທໍລີ. ການປະກອບທີ່ສົມບູນແມ່ນເຫມາະສົມສໍາລັບການນໍາເຂົ້າ gap4 ເປັນການປະກອບໂດຍກົງ.
ຫມາຍເຫດ: ການນໍາໃຊ້ caf2gap ເພື່ອນໍາເຂົ້າເຂົ້າໄປໃນ gap4 ແມ່ນແນະນໍາ
ປະກອບຂໍ້ຄວາມຄົບຖ້ວນເພື່ອຈັດຮຽງຂໍ້ຄວາມ (ພຽງແຕ່ເມື່ອ -f is
caf, maf ຫຼື gbf)
html ສໍາເລັດການປະກອບກັບ HTML (ພຽງແຕ່ໃນເວລາທີ່ -f ແມ່ນ caf, maf ຫຼື
gbf)
tcs ສໍາເລັດການປະກອບກັບ tcs
hsnp ອ້ອມຮອບຂອງ tags SNP (SROc, SAOc, SIOc) ກັບ HTML (ພຽງແຕ່ເມື່ອ -f ແມ່ນ caf, maf ຫຼື
gbf)
ການວິເຄາະ asnp ຂອງແທັກ SNP (ພຽງແຕ່ເມື່ອ -f ແມ່ນ caf, maf ຫຼື gbf)
ໄຟລ໌ສະຖິຕິ cstats contig ເຊັ່ນຈາກ MIRA (ພຽງແຕ່ເມື່ອແຫຼ່ງມີ contigs)
crlist contig ອ່ານໄຟລ໌ລາຍຊື່ເຊັ່ນຈາກ MIRA (ພຽງແຕ່ເມື່ອແຫຼ່ງມີ contigs)
maskedfasta
ອ່ານບ່ອນທີ່ການຈັດລຽງລໍາດັບ vector ແມ່ນຫນ້າກາກອອກ (ມີ X) ກັບ FASTA ໄຟລ໌ (ຄຸນນະພາບເພື່ອ
.qual)
ລໍາດັບ scaf ຫຼືປະກອບສໍາເລັດກັບລໍາດັບດຽວ CAF
-a ຕື່ມໃສ່ກັບໄຟລ໌ເປົ້າຫມາຍແທນທີ່ຈະຂຽນໃຫມ່
-A
String ທີ່ມີພາລາມິເຕີ MIRA ທີ່ຈະວິເຄາະ ເປັນປະໂຫຍດໃນເວລາທີ່ກໍານົດພາລາມິເຕີທີ່ມີຜົນກະທົບ
ການເອີ້ນເປັນເອກະສັນກັນ -CO:mrpg ແລະອື່ນໆ. ຕົວຢ່າງ: -a "454_SETTINGS -CO:mrpg=3"
-b ຂໍ້ມູນຕາບອດແທນທີ່ຖານທັງໝົດໃນ reads/contigs ດ້ວຍ 'c'
-C ປະຕິບັດ clip ຍາກໃນການອ່ານໃນເວລາທີ່ການອ່ານຮູບແບບທີ່ກໍານົດຈຸດ clip, ຈະ
ບັນທຶກພຽງແຕ່ສ່ວນ unclipped ເຂົ້າໄປໃນໄຟລ໌ຜົນໄດ້ຮັບ.
ນຳໃຊ້ກັບໄຟລ໌/ຮູບແບບທີ່ບໍ່ມີ
ຕິດຕໍ່ກັນ.
-d ລຶບຊ່ອງຫວ່າງພຽງແຕ່ຖັນເມື່ອຜົນຜະລິດແມ່ນ contigs: ລຶບຖັນທີ່ເປັນ
ຊ່ອງຫວ່າງທັງຫມົດ (ເຊັ່ນ: ຫຼັງຈາກທີ່ໄດ້ລົບການອ່ານໃນລະຫວ່າງການແກ້ໄຂໃນ gap4 ຫຼືຄ້າຍຄືກັນ)
ເມື່ອຜົນຜະລິດຖືກອ່ານ: ລຶບຊ່ອງຫວ່າງໃນການອ່ານ
-F ການກັ່ນຕອງເພື່ອອ່ານກຸ່ມກໍລະນີການນໍາໃຊ້ພິເສດ, ບໍ່ໄດ້ໃຊ້ເທື່ອ.
-m ເຮັດໃຫ້ contigs (ພຽງແຕ່ສໍາລັບ -t = caf ຫຼື maf) Encase single read as contig singlets into
ໄຟລ໌ CAF/MAF.
-n
ເມື່ອໃຫ້, ເລືອກພຽງແຕ່ການອ່ານຫຼື contigs ໃຫ້ໂດຍຊື່ໃນໄຟລ໌ນັ້ນ.
-i ໃນເວລາທີ່ -n ຖືກນໍາໃຊ້, inverts ການເລືອກ
-o fastq ຄຸນນະພາບ Offset (ພຽງແຕ່ສໍາລັບ -f = 'fastq') ຊົດເຊີຍຄ່າຄຸນນະພາບໃນ FASTQ
ໄຟລ໌. ຄ່າເລີ່ມຕົ້ນຂອງ 0 ພະຍາຍາມຮັບຮູ້ອັດຕະໂນມັດ.
-Q
ກໍານົດຄຸນນະພາບມາດຕະຖານສໍາລັບພື້ນຖານໃນປະເພດໄຟລ໌ທີ່ບໍ່ມີຄຸນຄ່າຄຸນນະພາບນອກຈາກນັ້ນ, ເຮັດ
ບໍ່ຢຸດຖ້າໄຟລ໌ຄຸນນະພາບທີ່ຄາດໄວ້ຈະຫາຍໄປ (ເຊັ່ນ: '.fasta')
-R
ປ່ຽນຊື່ contigs/singlets/reads ທີ່ມີຊື່ທີ່ລະບຸໄວ້ເປັນຕົວນັບ
ຕໍ່ທ້າຍ. ບັກທີ່ຮູ້ຈັກ: ຈະສ້າງຊື່ຊໍ້າກັນຫາກປ້ອນເຂົ້າ
ປະກອບມີ contigs/singlets ເຊັ່ນດຽວກັນກັບການອ່ານຟຣີ, ເຊັ່ນວ່າອ່ານບໍ່ໄດ້ຢູ່ໃນ contigs ຫຼື
ເສື້ອດ່ຽວ.
-S
(name)ໂຄງການສໍາລັບການປ່ຽນຊື່ການອ່ານ, ທີ່ສໍາຄັນສໍາລັບການຄູ່ທ້າຍພຽງແຕ່ 'solexa' ແມ່ນ
ສະຫນັບສະຫນູນໃນປັດຈຸບັນ.
ໄດ້ ດັ່ງຕໍ່ໄປນີ້ switches ການເຮັດວຽກ ພຽງແຕ່ ໃນເວລາທີ່ ການປ້ອນຂໍ້ມູນ (CAF or MAF) ປະກອບດ້ວຍ ຕິດຕໍ່ກັນ.
ລະວັງ: CAF ແລະ MAf ສາມາດມີພຽງການອ່ານເທົ່ານັ້ນ.
-M ຢ່າສະກັດ contigs (ຫຼືຄວາມເຫັນດີຂອງເຂົາເຈົ້າ), ແຕ່ລໍາດັບຂອງການອ່ານພວກເຂົາແມ່ນ
ປະກອບດ້ວຍ.
-N
ຄື -n, ແຕ່ຈັດຮຽງຜົນຜະລິດຕາມຄໍາສັ່ງທີ່ລະບຸໄວ້ໃນໄຟລ໌.
-r [cCqf]
ຄິດໄລ່ຄືນຄວາມເຫັນດີເຫັນພ້ອມແລະ / ຫຼືມູນຄ່າຄຸນນະພາບເປັນເອກະສັນກັນແລະ / ຫຼືແທັກຄຸນນະສົມບັດ SNP.
'c' recalc cons & cons ຄຸນນະພາບ (ກັບ IUPAC) 'C' recalc cons & cons ຄຸນນະພາບ
(forcing non-IUPAC) 'q' recalc consensus quality only 'f' recalc SNP features
ຫມາຍເຫດ: ພຽງແຕ່ສຸດທ້າຍຂອງ cCq ທີ່ກ່ຽວຂ້ອງ, f ເຮັດວຽກເປັນ
switch ແລະສາມາດຖືກລວມເຂົ້າກັບ cQq (ເຊັ່ນ "-r C -r f")
ໝາຍເຫດ: ຖ້າ CAF/MAF ປະກອບດ້ວຍຫຼາຍສາຍພັນ, ການຄຳນວນຂໍ້ເສຍ & ຂໍ້ເສຍຄືນໃໝ່
ຄຸນນະພາບຖືກບັງຄັບ, ເຈົ້າ
ພຽງແຕ່ສາມາດມີອິດທິພົນວ່າ IUPACs ຖືກນໍາໃຊ້ຫຼືບໍ່.
-s ແຍກຜົນຜະລິດອອກເປັນຫຼາຍໄຟລ໌ແທນທີ່ຈະສ້າງໄຟລ໌ດຽວ
-u 'fillUp strain genomes' ຕື່ມຮູຢູ່ໃນ genome ຂອງສາຍພັນຫນຶ່ງ (N ຫຼື @) ດ້ວຍ
ລໍາດັບຈາກການເປັນເອກະສັນກັນຂອງສາຍພັນອື່ນໆ ມີຜົນກະທົບພຽງແຕ່ກັບ -r ແລະ -t gbf ຫຼື
fasta/q ໃນ FASTA/Q: ພື້ນຖານທີ່ຕື່ມໃສ່ແມ່ນຢູ່ໃນຕົວນ້ອຍໃນ GBF: ພື້ນຖານທີ່ເຕີມເຕັມແມ່ນ
ໃນກໍລະນີໃຫຍ່
-q
ກໍານົດຄຸນນະພາບຕໍາ່ສຸດທີ່ຖານຄວາມເຫັນດີເຫັນພ້ອມຂອງສາຍພັນຈະຕ້ອງມີ, ພື້ນຖານຄວາມເຫັນດີເຫັນພ້ອມ
ຂ້າງລຸ່ມນີ້ຈະເປັນ 'N' Default: 0 ພຽງແຕ່ໃຊ້ກັບ -r, ແລະ -f ແມ່ນ caf/maf ແລະ -t is
(ໄວ
ຫຼື gbf)
-v ພິມໝາຍເລກລຸ້ນ ແລະອອກ
-x
ຕໍາ່ສຸດທີ່ contig ຫຼືຄວາມຍາວອ່ານໃນເວລາທີ່ໂຫລດ, ຍົກເລີກ contigs ທັງຫມົດ / ອ່ານດ້ວຍ a
ຄວາມຍາວຫນ້ອຍກວ່າຄ່ານີ້. ຄ່າເລີ່ມຕົ້ນ: 0 (=switched off) ໝາຍເຫດ: ບໍ່ໄດ້ນຳໃຊ້ກັບການອ່ານ
ຕິດຕໍ່ກັນ!
-X
ຄ້າຍຄືກັບ -x ແຕ່ໃຊ້ກັບພຽງແຕ່ການອ່ານແລະຫຼັງຈາກນັ້ນກັບຄວາມຍາວຕັດ.
-y
ການປົກຫຸ້ມຂອງ contig ສະເລ່ຍຕໍາ່ສຸດໃນເວລາທີ່ການໂຫຼດ, ຍົກເລີກ contigs ທັງຫມົດໂດຍສະເລ່ຍ
ການຄຸ້ມຄອງຫນ້ອຍກວ່າມູນຄ່ານີ້. ຄ່າເລີ່ມຕົ້ນ: 1
-z
ຈໍານວນຕໍາ່ສຸດທີ່ອ່ານຢູ່ໃນ contig ເມື່ອໂຫລດ, ຍົກເລີກ contigs ທັງຫມົດດ້ວຍຕົວເລກ
ຂອງການອ່ານຫນ້ອຍກວ່າຄ່ານີ້. ຄ່າເລີ່ມຕົ້ນ: 0 (= ປິດແລ້ວ)
-l
ເມື່ອຜົນອອກມາເປັນຂໍ້ຄວາມ ຫຼື HTML: ຈຳນວນຂອງຖານທີ່ສະແດງຢູ່ໃນແຖວການຈັດຮຽງ. ຄ່າເລີ່ມຕົ້ນ:
60.
-c
ເມື່ອຜົນອອກມາເປັນຂໍ້ຄວາມ ຫຼື HTML: ຕົວອັກສອນທີ່ໃຊ້ເພື່ອ pad endgaps. ຄ່າເລີ່ມຕົ້ນ: ' ' (ເປົ່າ)
ນາມແຝງ: caf2html, exp2fasta, ... ແລະອື່ນໆ ການປະສົມປະສານຂອງ " 2 "
ສາມາດນໍາໃຊ້ເປັນຊື່ໂຄງການ (ຍັງໃຊ້ການເຊື່ອມຕໍ່) ດັ່ງນັ້ນເປັນ convert_project ອັດຕະໂນມັດ
ຊຸດ -f ແລະ -t ດັ່ງນັ້ນ.
ຕົວຢ່າງ
convert_project source.maf dest.sam
convert_project source.caf dest.fasta wig ace
convert_project -x 2000 -y 10 source.caf dest.caf
caf2html -l 100 -c . source.caf dest
ໃຊ້ convert_project ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net