ນີ້ແມ່ນຄໍາສັ່ງ snap-aligner-single ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
snap-aligner_single - ໂຄງການຈັດຮຽງ nucleotide ທີ່ສາມາດຂະຫຍາຍໄດ້
ລາຍລະອຽດ
ຍິນດີຕ້ອນຮັບສູ່ SNAP ເວີຊັ່ນ 1.0beta.18.
ຕົວກໍານົດການຫນ້ອຍເກີນໄປ ການນໍາໃຊ້: snap-aligner ດຽວ [ ] ທີ່
ແມ່ນບັນຊີລາຍຊື່ຂອງໄຟລ໌ທີ່ຈະດໍາເນີນການ.
OPTIONS
-o ການຈັດຮຽງຜົນຜະລິດຊື່ໄຟລ໌ໄປຫາຊື່ໄຟລ໌ໃນຮູບແບບ SAM ຫຼື BAM, ຂຶ້ນກັບໄຟລ໌
ສ່ວນຂະຫຍາຍ ຫຼືຕົວລະບຸປະເພດທີ່ຊັດເຈນ (ເບິ່ງຂ້າງລຸ່ມນີ້). ໃຊ້ dash ທີ່ມີປະເພດທີ່ຊັດເຈນ
ຕົວລະບຸທີ່ຈະຂຽນໃສ່ stdout, ດັ່ງນັ້ນ, ຕົວຢ່າງ -o - ສົມ - ຈະຂຽນ SAM output ກັບ
stdout
-d ໄລຍະແກ້ໄຂສູງສຸດທີ່ອະນຸຍາດໃຫ້ອ່ານ ຫຼືຄູ່ (ຄ່າເລີ່ມຕົ້ນ: 14)
-n ຈໍານວນເມັດທີ່ຈະໃຊ້ຕໍ່ການອ່ານ
-sc ການຄຸ້ມຄອງເມັດພັນ (ເຊັ່ນ, ອ່ານຂະໜາດ/ຂະໜາດເມັດ). ຈຸດລອຍ. ສະເພາະກັບ -n.
(ໃຊ້ໃນຕອນຕົ້ນ -n)
-h ຕີສູງສຸດເພື່ອພິຈາລະນາຕໍ່ເມັດ (ຄ່າເລີ່ມຕົ້ນ: 300)
-ນາງສາວ ການຈັບຄູ່ເມັດພືດຂັ້ນຕ່ຳຕໍ່ສະຖານທີ່ (ຄ່າເລີ່ມຕົ້ນ: 1)
-t ຈໍານວນຂອງຫົວຂໍ້ (ຄ່າເລີ່ມຕົ້ນແມ່ນຫນຶ່ງຕໍ່ຫຼັກ)
-b ຜູກມັດແຕ່ລະກະທູ້ກັບໂປເຊດເຊີຂອງມັນ (ນີ້ແມ່ນຄ່າເລີ່ມຕົ້ນ)
--ຂ ຢ່າຜູກແຕ່ລະກະທູ້ກັບໂປເຊດເຊີຂອງມັນ (ຫມາຍເຫດ double dash)
-P ປິດການໃຊ້ cache prefetching ໃນ genome; ອາດຈະເປັນປະໂຫຍດສໍາລັບເຄື່ອງຈັກທີ່ມີຂະຫນາດນ້ອຍ
cache ຫຼືຫຼາຍ cores / cache
- ດັ່ງນັ້ນ ຄັດໄຟລ໌ຜົນຜະລິດໂດຍສະຖານທີ່ຈັດຕັ້ງ
-sm ຫນ່ວຍຄວາມຈໍາທີ່ຈະໃຊ້ສໍາລັບການຈັດລຽງໃນ Gb
-x ຄົ້ນຫາບາງສ່ວນຂອງເມັດທີ່ນິຍົມຫຼາຍເກີນໄປ (ທີ່ເປັນປະໂຫຍດສໍາລັບການກັ່ນຕອງ)
-f ຢຸດການແຂ່ງຂັນຄັ້ງທໍາອິດພາຍໃນຂອບເຂດການແກ້ໄຂກໍານົດໄລຍະ (ຮູບແບບການກັ່ນຕອງ)
-F ຜົນຜະລິດການກັ່ນຕອງ (a=aligned ເທົ່ານັ້ນ, s=single hit only (MAPQ >= 10), u=unaligned ເທົ່ານັ້ນ,
l = ຍາວພຽງພໍທີ່ຈະຈັດລໍາດັບ (ເບິ່ງ -mrl))
-S ສະກັດກັ້ນການປຸງແຕ່ງເພີ່ມເຕີມ (ຈັດຮຽງຜົນຜະລິດ BAM ເທົ່ານັ້ນ) i=index, d=duplicate
ເຄື່ອງ ໝາຍ
-I ບໍ່ສົນໃຈ ID ທີ່ບໍ່ກົງກັນໃນຕົວຈັດວາງຄູ່
-Cxx ຈະຕ້ອງຕິດຕາມດ້ວຍສອງ + ຫຼື - ສັນຍາລັກທີ່ບອກວ່າຈະ clip ຄຸນນະພາບຕໍ່າຫຼືບໍ່
ພື້ນຖານຈາກດ້ານຫນ້າແລະດ້ານຫລັງຂອງອ່ານຕາມລໍາດັບ; ຄ່າເລີ່ມຕົ້ນ: ກັບຄືນເທົ່ານັ້ນ (-C-+)
-M ຊີ້ໃຫ້ເຫັນວ່າສາຍ CIGAR ໃນໄຟລ໌ SAM ທີ່ສ້າງຂຶ້ນຄວນໃຊ້ M (ການຈັດຮຽງ
match) ແທນທີ່ຈະ = ແລະ X (ລໍາດັບ (mis-)match). ນີ້ແມ່ນຄ່າເລີ່ມຕົ້ນ
-= ໃຊ້ສະໄຕລ໌ CIGAR ແບບໃໝ່ດ້ວຍ = ແລະ X ຫຼາຍກວ່າ M. ກົງກັນຂ້າມຂອງ -M
-G ລະບຸຊ່ອງຫວ່າງເພື່ອໃຊ້ເມື່ອສ້າງສາຍ CIGAR
-pf ລະບຸຊື່ຂອງໄຟລ໌ເພື່ອບັນຈຸຄວາມໄວແລ່ນ
--hp ຊີ້ໃຫ້ເຫັນບໍ່ໃຊ້ຫນ້າຂະຫນາດໃຫຍ່ (ນີ້ອາດຈະເລັ່ງການໂຫຼດດັດສະນີແລະຊ້າລົງ
ການຈັດວາງ
ນີ້ແມ່ນຄ່າເລີ່ມຕົ້ນ
-hp ຊີ້ໃຫ້ເຫັນເຖິງການນໍາໃຊ້ຫນ້າຂະຫນາດໃຫຍ່ (ນີ້ອາດຈະເລັ່ງການຈັດຕໍາແຫນ່ງແລະຊ້າລົງການໂຫຼດດັດສະນີ).
-D ກໍານົດຄວາມເລິກຂອງການຄົ້ນຫາເພີ່ມເຕີມ (ໄລຍະການແກ້ໄຂທີ່ເກີນກວ່າການຕີທີ່ດີທີ່ສຸດຂອງ SNAP
ໃຊ້ເພື່ອຄິດໄລ່ MAPQ). ຄ່າເລີ່ມຕົ້ນ 2
-rg ລະບຸກຸ່ມການອ່ານໃນຕອນຕົ້ນ ຖ້າມັນບໍ່ໄດ້ລະບຸໄວ້ໃນໄຟລ໌ປ້ອນຂໍ້ມູນ
-R ລະບຸເສັ້ນກຸ່ມທີ່ອ່ານທັງໝົດສຳລັບຜົນຜະລິດ SAM/BAM. ອັນນີ້ຕ້ອງປະກອບມີ ID
ແທັກ. ຖ້າມັນບໍ່ເລີ່ມຕົ້ນດ້ວຍ '@RG' SNAP ຈະເພີ່ມມັນ. ລະບຸແຖບໂດຍ \t. ສອງ
backslashes ຈະສ້າງ backslash ດຽວ. backslash ຕິດຕາມດ້ວຍສິ່ງອື່ນ
ແມ່ນຜິດກົດຫມາຍ. ດັ່ງນັ້ນ, '-R @RG\tID:foo\tDS:ຂໍ້ມູນຂອງຂ້ອຍ' ຈະສ້າງການອ່ານດ້ວຍແທັກເລີ່ມຕົ້ນ
foo, ແລະເສັ້ນ @RG ທີ່ລວມເອົາ DS: ຂໍ້ມູນຂອງຂ້ອຍ.
-sa ຮວມເອົາການອ່ານຈາກໄຟລ໌ SAM ຫຼື BAM ກັບໄຟລ໌ສຳຮອງ (0x100) ຫຼື ເອກະສານເສີມ
(0x800) ທຸງຕັ້ງ; ຄ່າເລີ່ມຕົ້ນແມ່ນການຖິ້ມພວກມັນ.
-ໂອ ສົ່ງຜົນການຈັດຮຽງຫຼາຍອັນ. ໃຊ້ເວລາເປັນພາລາມິເຕີຂອງໄລຍະການແກ້ໄຂເພີ່ມເຕີມສູງສຸດ
ທຽບກັບການຈັດຮຽງທີ່ດີທີ່ສຸດເພື່ອອະນຸຍາດໃຫ້ຈັດຮຽງຂັ້ນສອງ
-omax ຈຳກັດຈຳນວນການຈັດຮຽງຕໍ່ການອ່ານທີ່ສ້າງຂຶ້ນໂດຍ -ໂອ.
ນີ້ຫມາຍຄວາມວ່າຖ້າຫາກວ່າ -ໂອ ຈະສ້າງຫຼາຍ
ກ່ວາ -omax ການຈັດຕໍາແຫນ່ງຮອງ, SNAP ຈະຂຽນອອກພຽງແຕ່ທີ່ດີທີ່ສຸດ -omax ຂອງພວກເຂົາ,
ບ່ອນທີ່ 'ດີທີ່ສຸດ' ຫມາຍຄວາມວ່າ 'ມີໄລຍະການແກ້ໄຂຕ່ໍາສຸດ'. ສາຍພົວພັນຖືກແຍກໂດຍຕົນເອງ.
-mpc ຈໍາກັດຈໍານວນຂອງການຈັດລໍາດັບທີ່ສ້າງຂຶ້ນໂດຍ -ໂອ ນີ້ຫຼາຍຕໍ່ contig
(ການເຂົ້າໂຄຣໂມໂຊມ/FASTA);
'mpc' ຫມາຍຄວາມວ່າ 'ສູງສຸດຕໍ່ contig; ຄ່າເລີ່ມຕົ້ນບໍ່ຈຳກັດ.
ການກັ່ນຕອງນີ້ຖືກນໍາໃຊ້ກ່ອນ -omax. ການຈັດລໍາດັບຂັ້ນຕົ້ນ
ຖືກນັບ.
-pc ຮັກສາການຕັດທີ່ອ່ອນໆສໍາລັບການອ່ານທີ່ມາຈາກໄຟລ໌ SAM ຫຼື BAM
-xf ເພີ່ມປັດໄຈການຂະຫຍາຍຕົວສໍາລັບໄຟລ໌ BAM ແລະ GZ (ຄ່າເລີ່ມຕົ້ນ 1.0)
-hdp ໃຊ້ຄຳນຳໜ້າແບບ Hadoop (ຜູ້ລາຍງານ: ສະຖານະ:...) ໃນຂໍ້ຄວາມສະແດງຂໍ້ຜິດພາດ ແລະປ່ອຍອອກມາ.
ຂໍ້ຄວາມຄວາມຄືບໜ້າແບບ hadoop
-mrl ລະບຸຄວາມຍາວການອ່ານຕໍາ່ສຸດທີ່ເພື່ອຈັດຮຽງ, ອ່ານສັ້ນກວ່ານີ້ (ຫຼັງຈາກການຕັດ)
ຢູ່ບໍ່ສອດຄ່ອງ.
ນີ້ຄວນຈະເປັນ
ຂະໜາດໃຫຍ່ກວ່າຄວາມຍາວຂອງແກ່ນ ຫຼື ເຈົ້າອາດມີການຈັດຮຽງທີ່ໜ້າສົງໄສ.
ຄ່າເລີ່ມຕົ້ນ 50
- ແຜນທີ່ ໃຊ້ແຜນທີ່ໄຟລ໌ເພື່ອໂຫລດດັດສະນີແທນທີ່ຈະອ່ານມັນ.
ນີ້ອາດຈະເລັ່ງການໂຫຼດດັດສະນີໃນກໍລະນີ
ບ່ອນທີ່ SNAP ຖືກດໍາເນີນການຊໍ້າຄືນຢູ່ໃນດັດຊະນີດຽວກັນ, ແລະດັດຊະນີແມ່ນໃຫຍ່ກວ່າເຄິ່ງຫນຶ່ງຂອງ
ຂະຫນາດຫນ່ວຍຄວາມຈໍາຂອງເຄື່ອງ. ໃນບາງລະບົບປະຕິບັດການ, ການໂຫຼດດັດສະນີທີ່ມີ
- ແຜນທີ່ ແມ່ນຊ້າກວ່າທີ່ບໍ່ມີຖ້າດັດຊະນີບໍ່ຢູ່ໃນຄວາມຊົງຈໍາ. ທ່ານອາດຈະພິຈາລະນາ
ເພີ່ມ - ກ່ອນ ເພື່ອເອົາດັດຊະນີເຂົ້າໄປໃນ cache ຂອງລະບົບໃນເວລາໂຫລດດ້ວຍ - ແຜນທີ່ ເມື່ອເຈົ້າ
ຢ່າຄາດຫວັງວ່າດັດຊະນີຈະຢູ່ໃນ cache.
- ກ່ອນ ດຶງດັດຊະນີເຂົ້າໄປໃນ cache ຂອງລະບົບ.
ນີ້ແມ່ນພຽງແຕ່ມີຄວາມຫມາຍກັບ - ແຜນທີ່, ແລະພຽງແຕ່ຊ່ວຍຖ້າຫາກວ່າດັດຊະນີບໍ່ແມ່ນ
ຢູ່ໃນຄວາມຊົງຈໍາແລ້ວແລະລະບົບປະຕິບັດການຂອງທ່ານແມ່ນຊ້າໃນການອ່ານໄຟລ໌ທີ່ມີແຜນທີ່ (ie,
ບາງລຸ້ນຂອງ Linux, ແຕ່ບໍ່ແມ່ນ Windows).
-lp ດໍາເນີນການ SNAP ໃນບູລິມະສິດການກໍານົດເວລາຕ່ໍາ (ປະຕິບັດພຽງແຕ່ໃນ Windows)
- ນ ບໍ່ມີ Ukkonen: ບໍ່ຫຼຸດຜ່ອນການແກ້ໄຂການຊອກຫາໄລຍະທາງໂດຍອີງໃສ່ຜູ້ສະຫມັກກ່ອນ. ນີ້
ທາງເລືອກແມ່ນບໍລິສຸດສໍາລັບການປະເມີນຜົນກະທົບການປະຕິບັດຂອງການນໍາໃຊ້ສູດການຄິດໄລ່ຂອງ Ukkonen
ແທນທີ່ຈະ Smith-Waterman, ແລະລະບຸວ່າມັນຈະຊ້າລົງການປະຕິບັດໂດຍບໍ່ມີການ
ປັບປຸງການຈັດວາງ.
-ຢູ່ທີ່ ບໍ່ມີຄໍາສັ່ງ: ຢ່າສັ່ງການປະເມີນການອ່ານເພື່ອເລືອກໂອກາດຫຼາຍ
ຜູ້ສະໝັກກ່ອນ. ທາງເລືອກນີ້ແມ່ນຢ່າງດຽວສໍາລັບການປະເມີນຜົນປະສິດທິພາບຂອງ
ຄໍາສັ່ງການປະເມີນຜົນອ່ານ, ແລະລະບຸວ່າມັນຈະຊ້າລົງການປະຕິບັດໂດຍບໍ່ມີການ
ປັບປຸງການຈັດວາງ.
- ນ ຢ່າຕັດການຄົ້ນຫາທີ່ອີງໃສ່ການຕີເມັດທີ່ພາດ. ທາງເລືອກນີ້ແມ່ນຢ່າງດຽວສໍາລັບ
ການປະເມີນຜົນການປະຕິບັດຂອງການຕັດຜູ້ສະຫມັກ, ແລະລະບຸວ່າຈະ
ຊ້າລົງການປະຕິບັດໂດຍບໍ່ມີການປັບປຸງການຈັດຕໍາແຫນ່ງ.
-wbs ຂຽນຂະຫນາດ buffer ເປັນ megabytes. ຢ່າລະບຸອັນນີ້ເວັ້ນເສຍແຕ່ວ່າທ່ານໄດ້ຮັບຄວາມຜິດພາດ
ຂໍ້ຄວາມທີ່ບອກວ່າເຮັດໃຫ້ມັນໃຫຍ່ຂຶ້ນ. ຄ່າເລີ່ມຕົ້ນ 16.
ທ່ານອາດຈະປະມວນຜົນຫຼາຍກ່ວາການຈັດຕັ້ງໂດຍບໍ່ມີການ restart SNAP, ແລະຖ້າຫາກວ່າເປັນໄປໄດ້ໂດຍບໍ່ມີການ
ໂຫຼດດັດຊະນີຄືນໃໝ່. ເພື່ອເຮັດສິ່ງນີ້, ລາຍຊື່ຕົວກໍານົດການທັງຫມົດໃນເສັ້ນຄໍາສັ່ງ
ສຳລັບການຈັດຮຽງທຳອິດ, ຕິດຕາມດ້ວຍເຄື່ອງໝາຍຈຸດ (ຂັ້ນດ້ວຍຍະຫວ່າງຈາກບ່ອນອື່ນ
parameters) ປະຕິບັດຕາມໂດຍຕົວກໍານົດການສໍາລັບການຈັດລໍາດັບຕໍ່ໄປ (ລວມທັງດຽວຫຼື
ຄູ່). ເຈົ້າອາດຈະມີຫຼາຍເທົ່າທີ່ເຈົ້າກະລຸນາ. ຖ້າສອງການຈັດລຽງຕິດຕໍ່ກັນໃຊ້
ດັດຊະນີດຽວກັນ, ມັນຈະບໍ່ຖືກໂຫຼດຄືນ. ດັ່ງນັ້ນ, ສໍາລັບຕົວຢ່າງ, ທ່ານສາມາດເຮັດ 'snap-aligner
hg19-20 foo.fq ດຽວ -o foo.sam , ຈັບຄູ່ hg19-20 end1.fq end2.fq -o paired.sam' ແລະມັນ
ຈະບໍ່ໂຫຼດດັດຊະນີຄືນໃໝ່ລະຫວ່າງການຈັດຮຽງແບບດ່ຽວ ແລະຄູ່. ໃນເວລາທີ່ກໍານົດເປັນ
ໄຟລ໌ input ຫຼື output, ທ່ານພຽງແຕ່ສາມາດບອກຊື່ໄຟລ໌, ໃນກໍລະນີ SNAP ຈະ infer ໄດ້
ປະເພດຂອງໄຟລ໌ຈາກນາມສະກຸນໄຟລ໌ (ຕົວຢ່າງ.sam ຫຼື .bam), ຫຼືທ່ານສາມາດຢ່າງຊັດເຈນ.
ລະບຸປະເພດໄຟລ໌ໂດຍນໍາຫນ້າຊື່ໄຟລ໌ທີ່ມີຫນຶ່ງໃນ
ຕົວລະບຸປະເພດຕໍ່ໄປນີ້ (ເຊິ່ງເປັນຕົວພິມນ້ອຍໃຫຍ່):
-fastq
- ບີບອັດFastq
- ສົມ
-bam
- ຄູ່Fastq
-pairedInterleavedFastq
-pairedCompressedInterleavedFastq
ດັ່ງນັ້ນ, ສໍາລັບຕົວຢ່າງ, ທ່ານສາມາດກໍານົດ -bam input.file ເພື່ອເຮັດໃຫ້ SNAP ປະຕິບັດ input.file ເປັນ BAM
ໄຟລ໌, ເຖິງແມ່ນວ່າມັນປົກກະຕິຈະສົມມຸດເປັນໄຟລ໌ FASTQ ສໍາລັບການປ້ອນຂໍ້ມູນຫຼືໄຟລ໌ SAM ສໍາລັບ
ຜົນຜະລິດເມື່ອມັນບໍ່ໄດ້ຮັບຮູ້ການຂະຫຍາຍໄຟລ໌. ເພື່ອໃຊ້ຊື່ໄຟລ໌ວ່າ
ເລີ່ມຕົ້ນດ້ວຍ '-' ແລະບໍ່ມີ SNAP ປະຕິບັດມັນເປັນການປ່ຽນ, ທ່ານຕ້ອງລະບຸຢ່າງຊັດເຈນ
ປະເພດ. ແຕ່ແທ້ຈິງແລ້ວ, ມັນເປັນພຽງແຕ່ສັບສົນແລະທ່ານບໍ່ຄວນເຮັດມັນ. ການປ້ອນຂໍ້ມູນແລະຜົນຜະລິດອາດຈະ
ຍັງມາຈາກ/ໄປ stdin/stdout. ເພື່ອເຮັດສິ່ງນີ້, ໃຫ້ໃຊ້ a - ສໍາລັບຊື່ໄຟລ໌ input ຫຼື output ແລະ
ໃຫ້ຕົວລະບຸປະເພດທີ່ຊັດເຈນ. ດັ່ງນັ້ນ, ຕົວຢ່າງ, snap-aligner aligner single myIndex
-fastq - -o - ສົມ - ຈະອ່ານ FASTQ ຈາກ stdin ແລະຂຽນ SAM ກັບ stdout.
ໃຊ້ snap-aligner-single ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net