ນີ້ແມ່ນຄໍາສັ່ງ sim4db ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
sim4db - batch spliced aligned ຂອງລໍາດັບ cDNA ກັບ genome ເປົ້າຫມາຍ.
ສະຫຼຸບສັງລວມ
ການເອີ້ນເສັ້ນຄໍາສັ່ງແບບງ່າຍໆ:
sim4db -genomic g.fasta -cdna c.fasta -scr script -output o.sim4db
ບ່ອນທີ່:
- 'c.fasta' ແລະ 'g.fasta' ແມ່ນໄຟລ໌ cDNA ແລະ genome ລຳດັບຫຼາຍອັນ.
- 'script' ແມ່ນໄຟລ໌ສະຄຣິບທີ່ຊີ້ບອກການຈັດຮຽງແຕ່ລະອັນທີ່ຈະຖືກຄິດໄລ່
- ຜົນຜະລິດໃນຮູບແບບ sim4db ຈະຖືກສົ່ງໄປຫາໄຟລ໌ 'o.sim4db' ('-' ສໍາລັບຜົນຜະລິດມາດຕະຖານ)
ຄຳຮຽກຮ້ອງທີ່ສັບສົນກວ່າ:
sim4db -genomic g.fasta -cdna c.fasta -output o.sim4db [ຕົວເລືອກ]
ລາຍລະອຽດ
ຊິມ4db ປະຕິບັດການຈັດລໍາດັບ batch ໄວຂອງລໍາດັບ cDNA ຂະຫນາດໃຫຍ່ (EST, mRNA) ທີ່ກໍານົດໄວ້ເປັນຊຸດຂອງ.
ພາກພື້ນ genomic eukaryotic. ມັນໃຊ້ sim4 ແລະ sim4cc ສູດການຄິດໄລ່ເພື່ອກໍານົດ
ການຈັດລຽງ, ແຕ່ລວມເອົາກົນໄກການຈັດລໍາດັບໄວແລະການດຶງຂໍ້ມູນ, ປະຕິບັດ
ໃນຊຸດເອື້ອຍ ໃບ(1), ເພື່ອເລັ່ງການປຸງແຕ່ງປະລິມານຂະຫນາດໃຫຍ່ຂອງລໍາດັບ.
ໃນຂະນະທີ່ ຊິມ4db ຜະລິດການສອດຄ່ອງໃນລັກສະນະດຽວກັນກັບ sim4 ຫຼື sim4cc, ມັນມີເພີ່ມເຕີມ
ຄຸນນະສົມບັດເພື່ອເຮັດໃຫ້ມັນມີຄວາມເຫມາະສົມຫຼາຍສໍາລັບການນໍາໃຊ້ກັບທໍ່ annotation genome ທັງຫມົດ. ສະຄຣິບ
ໄຟລ໌ສາມາດຖືກນໍາໃຊ້ເພື່ອຈັດກຸ່ມການຈັບຄູ່ລະຫວ່າງ cDNAs ແລະພາກພື້ນ genomic ທີ່ສອດຄ້ອງກັນຂອງພວກມັນ,
ເພື່ອຈັດລຽງເປັນໄລຍະໜຶ່ງ ແລະໃຊ້ຊຸດຕົວກໍານົດການດຽວກັນ. Sim4db ຍັງທາງເລືອກ
ລາຍງານການສອດຄ່ອງຫຼາຍກວ່າຫນຶ່ງສໍາລັບ cDNA ດຽວກັນພາຍໃນພາກພື້ນ genomic, ຕາບໃດທີ່ພວກມັນ
ຕອບສະຫນອງເງື່ອນໄຂທີ່ຜູ້ໃຊ້ກໍານົດເຊັ່ນ: ຄວາມຍາວຕໍາ່ສຸດ, ຕົວຕົນລໍາດັບສ່ວນຮ້ອຍຫຼື
ການຄຸ້ມຄອງ. ຄຸນນະສົມບັດນີ້ແມ່ນເຄື່ອງມືໃນການຄົ້ນຫາການຈັດຕໍາແຫນ່ງທັງຫມົດຂອງຄອບຄົວ gene ຢູ່ໃນຫນຶ່ງ
ສະຖານທີ່. ສຸດທ້າຍ, ຜົນຜະລິດໄດ້ຖືກນໍາສະເຫນີບໍ່ວ່າຈະເປັນການສອດຄ່ອງ sim4db ແບບກໍາຫນົດເອງຫຼືເປັນ GFF3 gene
ຄຸນລັກສະນະ.
OPTIONS
ທາງເລືອກທີ່ໂດດເດັ່ນ:
-cdna ໃຊ້ລໍາດັບ cDNA ເຫຼົ່ານີ້ (ໄຟລ໌ multi-fasta)
-genomic ໃຊ້ລໍາດັບ genomic ເຫຼົ່ານີ້ (ໄຟລ໌ multi-fasta)
-script ໃຊ້ໄຟລ໌ script ນີ້
-pairwise ຈັດລໍາດັບຄູ່ຂອງລໍາດັບ
ຖ້າບໍ່ມີທາງເລືອກ '-script' ແລະ '-pairwise'
ຖືກກໍານົດໄວ້, sim4db ດໍາເນີນການທັງຫມົດຕໍ່ກັບທັງຫມົດ
ການສອດຄ່ອງລະຫວ່າງຄູ່ຂອງ cDNA ແລະລໍາດັບ genomic.
-output ຂຽນ output ກັບໄຟລ໌ນີ້
-gff3 ລາຍງານຜົນໄດ້ຮັບໃນຮູບແບບ GFF3
-interspecies ໃຊ້ sim4cc ສໍາລັບການຈັດລໍາດັບລະຫວ່າງຊະນິດ (sim4 ເລີ່ມຕົ້ນ)
ຕົວເລືອກການກັ່ນຕອງ:
-mincoverage ຄົ້ນຫາແບບຈໍາລອງ exon ທັງໝົດດ້ວຍການລະບຸ
ຕໍ່າສຸດ PERCENT ການຄຸ້ມຄອງ
-minidentity ຊໍ້າຄືນຊອກຫາແບບຈໍາລອງ exon ທັງໝົດດ້ວຍການລະບຸ
ຕໍ່າສຸດ PERCENT EXON IDENTITY
-minlength ຊ້ຳໆ ຊອກຫາແບບ exon ທັງໝົດດ້ວຍຄ່າທີ່ລະບຸ
ການປົກຫຸ້ມຂອງ absoLUTE ຕໍາ່ສຸດ (ຈໍານວນຂອງ bp ກົງກັນ)
(ຄ່າເລີ່ມຕົ້ນ 0)
- ລາຍງານສະເຫມີລາຍງານ ຮູບແບບ exon, ເຖິງແມ່ນວ່າພວກເຂົາ
ຕ່ຳກວ່າເກນຄຸນນະພາບ
ຖ້າບໍ່ມີການຄອບຄຸມໜ້ອຍ ຫຼືຄວາມນ້ອຍ ຫຼືຄວາມຍາວໜ້ອຍແມ່ນໃຫ້, ເທົ່ານັ້ນ
ຮູບແບບ exon ທີ່ດີທີ່ສຸດຖືກສົ່ງຄືນ. ນີ້ແມ່ນການດໍາເນີນງານ DEFAULT.
ທ່ານອາດຈະຕ້ອງການລະບຸທັງສາມຂອງ mincoverage,
minidentity ແລະ minlength! ຢ່າຖືວ່າຄ່າເລີ່ມຕົ້ນ
ແມ່ນສິ່ງທີ່ທ່ານຕ້ອງການ!
ແນ່ນອນເຈົ້າຈະຕ້ອງລະບຸຢ່າງໜ້ອຍໜຶ່ງສ່ວນຂອງການຄອບຄຸມໜ້ອຍ,
minidentity ແລະ minlength ມີລາຍງານສະເຫມີ! ຖ້າເຈົ້າບໍ່ເຮັດ,
mincoverage ຈະຖືກກໍານົດເປັນ 90 ແລະ minidentity ເປັນ 95 -- ເພື່ອຫຼຸດຜ່ອນ
ຈໍານວນຂອງການແຂ່ງຂັນ spurious ໃນເວລາທີ່ການແຂ່ງຂັນທີ່ດີແມ່ນໄດ້ພົບເຫັນ.
ຕົວເລືອກເສີມ:
-nodeflines ບໍ່ລວມເອົາເສັ້ນກໍານົດຢູ່ໃນຜົນຜະລິດຂອງ sim4db
-alignments ການຈັດຮຽງພິມ
-polytails ຢ່າປິດບັງຫາງ poly-A ແລະ poly-T
-ຕັດ trim ຂອບ exons ຖ້າ A/T % > x (poly-AT tails)
-noncanonical ບໍ່ບັງຄັບສະຖານທີ່ splice canonical
-splicemodel ໃຊ້ຮູບແບບ splice ດັ່ງຕໍ່ໄປນີ້: 0 - sim4 ຕົ້ນສະບັບ;
1 - GeneSplice; 2 - Glimmer; ທາງເລືອກ 1 ແລະ 2 ແມ່ນ
ສາມາດໃຊ້ໄດ້ກັບ '-interspecies' ເທົ່ານັ້ນ.
ຄ່າເລີ່ມຕົ້ນຂອງ sim4 ແມ່ນ 0, ແລະສໍາລັບ sim4cc ແມ່ນ 1.
-forcestrand ບັງຄັບໃຫ້ການຄາດຄະເນຂອງສາຍພັນທີ່ຈະຢູ່ສະເໝີ
ຫນຶ່ງໃນ 'ໄປຂ້າງຫນ້າ' ຫຼື 'ປີ້ນກັບ'
ທາງເລືອກການປະຕິບັດ:
-threads ໃຊ້ n threads.
-touch ສ້າງໄຟລ໌ນີ້ເມື່ອໂຄງການສໍາເລັດການປະຕິບັດ
ທາງເລືອກໃນການດີບັກ:
-v ສະຖານະການພິມເພື່ອ stderr ໃນຂະນະທີ່ແລ່ນ
-V ພິມ script ເສັ້ນ (stderr) ຍ້ອນວ່າເຂົາເຈົ້າກໍາລັງດໍາເນີນການ
ທາງເລືອກນັກພັດທະນາ:
-Z ກໍານົດຮູບແບບເມັດທີ່ມີໄລຍະຫ່າງ
-H ກໍານົດປັດໄຈນ້ໍາຫນັກ relink (H = 1000 ແນະນໍາສໍາລັບ mRNAs)
-K ກໍານົດຂອບເຂດ MSP ທໍາອິດ
-C ກໍານົດຂອບເຂດ MSP ທີສອງ
-Ma ກໍານົດຂອບເຂດຈໍາກັດຂອງຈໍານວນຂອງ MSPs ອະນຸຍາດ
-Mp ດຽວກັນ, ເປັນສ່ວນຮ້ອຍຂອງຖານໃນ cDNA
ຫມາຍເຫດ: ຖ້າໃຊ້, ຕ້ອງລະບຸທັງ -Ma ແລະ -Mp!
ໃຊ້ sim4db ອອນລາຍໂດຍໃຊ້ບໍລິການ onworks.net