ພາສາອັງກິດພາສາຝຣັ່ງແອສປາໂຍນ

OnWorks favicon

sim4db - ອອນລາຍໃນຄລາວ

ແລ່ນ sim4db ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີຜ່ານ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ນີ້ແມ່ນຄໍາສັ່ງ sim4db ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ໂຄງການ:

NAME


sim4db - batch spliced ​​aligned ຂອງລໍາດັບ cDNA ກັບ genome ເປົ້າຫມາຍ.

ສະຫຼຸບສັງລວມ


ການເອີ້ນເສັ້ນຄໍາສັ່ງແບບງ່າຍໆ:

sim4db -genomic g.fasta -cdna c.fasta -scr script -output o.sim4db

ບ່ອນທີ່:
- 'c.fasta' ແລະ 'g.fasta' ແມ່ນໄຟລ໌ cDNA ແລະ genome ລຳດັບຫຼາຍອັນ.
- 'script' ແມ່ນໄຟລ໌ສະຄຣິບທີ່ຊີ້ບອກການຈັດຮຽງແຕ່ລະອັນທີ່ຈະຖືກຄິດໄລ່
- ຜົນຜະລິດໃນຮູບແບບ sim4db ຈະຖືກສົ່ງໄປຫາໄຟລ໌ 'o.sim4db' ('-' ສໍາລັບຜົນຜະລິດມາດຕະຖານ)

ຄຳຮຽກຮ້ອງທີ່ສັບສົນກວ່າ:

sim4db -genomic g.fasta -cdna c.fasta -output o.sim4db [ຕົວເລືອກ]

ລາຍລະອຽດ


ຊິມ4db ປະຕິບັດການຈັດລໍາດັບ batch ໄວຂອງລໍາດັບ cDNA ຂະຫນາດໃຫຍ່ (EST, mRNA) ທີ່ກໍານົດໄວ້ເປັນຊຸດຂອງ.
ພາກພື້ນ genomic eukaryotic. ມັນໃຊ້ sim4 ແລະ sim4cc ສູດການຄິດໄລ່ເພື່ອກໍານົດ
ການຈັດລຽງ, ແຕ່ລວມເອົາກົນໄກການຈັດລໍາດັບໄວແລະການດຶງຂໍ້ມູນ, ປະຕິບັດ
ໃນຊຸດເອື້ອຍ ໃບ(1​)​, ເພື່ອ​ເລັ່ງ​ການ​ປຸງ​ແຕ່ງ​ປະ​ລິ​ມານ​ຂະ​ຫນາດ​ໃຫຍ່​ຂອງ​ລໍາ​ດັບ​.

ໃນຂະນະທີ່ ຊິມ4db ຜະລິດການສອດຄ່ອງໃນລັກສະນະດຽວກັນກັບ sim4 ຫຼື sim4cc, ມັນມີເພີ່ມເຕີມ
ຄຸນນະສົມບັດເພື່ອເຮັດໃຫ້ມັນມີຄວາມເຫມາະສົມຫຼາຍສໍາລັບການນໍາໃຊ້ກັບທໍ່ annotation genome ທັງຫມົດ. ສະຄຣິບ
ໄຟລ໌ສາມາດຖືກນໍາໃຊ້ເພື່ອຈັດກຸ່ມການຈັບຄູ່ລະຫວ່າງ cDNAs ແລະພາກພື້ນ genomic ທີ່ສອດຄ້ອງກັນຂອງພວກມັນ,
ເພື່ອຈັດລຽງເປັນໄລຍະໜຶ່ງ ແລະໃຊ້ຊຸດຕົວກໍານົດການດຽວກັນ. Sim4db ຍັງທາງເລືອກ
ລາຍງານການສອດຄ່ອງຫຼາຍກວ່າຫນຶ່ງສໍາລັບ cDNA ດຽວກັນພາຍໃນພາກພື້ນ genomic, ຕາບໃດທີ່ພວກມັນ
ຕອບສະຫນອງເງື່ອນໄຂທີ່ຜູ້ໃຊ້ກໍານົດເຊັ່ນ: ຄວາມຍາວຕໍາ່ສຸດ, ຕົວຕົນລໍາດັບສ່ວນຮ້ອຍຫຼື
ການຄຸ້ມຄອງ. ຄຸນນະສົມບັດນີ້ແມ່ນເຄື່ອງມືໃນການຄົ້ນຫາການຈັດຕໍາແຫນ່ງທັງຫມົດຂອງຄອບຄົວ gene ຢູ່ໃນຫນຶ່ງ
ສະຖານທີ່. ສຸດທ້າຍ, ຜົນຜະລິດໄດ້ຖືກນໍາສະເຫນີບໍ່ວ່າຈະເປັນການສອດຄ່ອງ sim4db ແບບກໍາຫນົດເອງຫຼືເປັນ GFF3 gene
ຄຸນ​ລັກ​ສະ​ນະ.

OPTIONS


ທາງເລືອກທີ່ໂດດເດັ່ນ:
-cdna ໃຊ້ລໍາດັບ cDNA ເຫຼົ່ານີ້ (ໄຟລ໌ multi-fasta)
-genomic ໃຊ້​ລໍາ​ດັບ genomic ເຫຼົ່າ​ນີ້ (ໄຟລ​໌ multi-fasta​)
-script ໃຊ້ໄຟລ໌ script ນີ້
-pairwise ຈັດລໍາດັບຄູ່ຂອງລໍາດັບ

ຖ້າບໍ່ມີທາງເລືອກ '-script' ແລະ '-pairwise'
ຖືກກໍານົດໄວ້, sim4db ດໍາເນີນການທັງຫມົດຕໍ່ກັບທັງຫມົດ
ການສອດຄ່ອງລະຫວ່າງຄູ່ຂອງ cDNA ແລະລໍາດັບ genomic.

-output ຂຽນ output ກັບໄຟລ໌ນີ້
-gff3 ລາຍງານຜົນໄດ້ຮັບໃນຮູບແບບ GFF3
-interspecies ໃຊ້ sim4cc ສໍາລັບການຈັດລໍາດັບລະຫວ່າງຊະນິດ (sim4 ເລີ່ມຕົ້ນ)

ຕົວເລືອກການກັ່ນຕອງ:
-mincoverage ຄົ້ນຫາແບບຈໍາລອງ exon ທັງໝົດດ້ວຍການລະບຸ
ຕໍ່າສຸດ PERCENT ການຄຸ້ມຄອງ
-minidentity ຊໍ້າຄືນຊອກຫາແບບຈໍາລອງ exon ທັງໝົດດ້ວຍການລະບຸ
ຕໍ່າສຸດ PERCENT EXON IDENTITY
-minlength ຊ້ຳໆ ຊອກຫາແບບ exon ທັງໝົດດ້ວຍຄ່າທີ່ລະບຸ
ການ​ປົກ​ຫຸ້ມ​ຂອງ absoLUTE ຕໍາ​່​ສຸດ (ຈໍາ​ນວນ​ຂອງ bp ກົງ​ກັນ​)
(ຄ່າເລີ່ມຕົ້ນ 0)
- ລາຍ​ງານ​ສະ​ເຫມີ​ລາຍ​ງານ​ ຮູບແບບ exon, ເຖິງແມ່ນວ່າພວກເຂົາ
ຕ່ຳກວ່າເກນຄຸນນະພາບ

ຖ້າບໍ່ມີການຄອບຄຸມໜ້ອຍ ຫຼືຄວາມນ້ອຍ ຫຼືຄວາມຍາວໜ້ອຍແມ່ນໃຫ້, ເທົ່ານັ້ນ
ຮູບແບບ exon ທີ່ດີທີ່ສຸດຖືກສົ່ງຄືນ. ນີ້​ແມ່ນ​ການ​ດໍາ​ເນີນ​ງານ DEFAULT​.

ທ່ານອາດຈະຕ້ອງການລະບຸທັງສາມຂອງ mincoverage,
minidentity ແລະ minlength! ຢ່າຖືວ່າຄ່າເລີ່ມຕົ້ນ
ແມ່ນ​ສິ່ງ​ທີ່​ທ່ານ​ຕ້ອງ​ການ​!

ແນ່ນອນເຈົ້າຈະຕ້ອງລະບຸຢ່າງໜ້ອຍໜຶ່ງສ່ວນຂອງການຄອບຄຸມໜ້ອຍ,
minidentity ແລະ minlength ມີລາຍງານສະເຫມີ! ຖ້າເຈົ້າບໍ່ເຮັດ,
mincoverage ຈະຖືກກໍານົດເປັນ 90 ແລະ minidentity ເປັນ 95 -- ເພື່ອຫຼຸດຜ່ອນ
ຈໍາ​ນວນ​ຂອງ​ການ​ແຂ່ງ​ຂັນ spurious ໃນ​ເວ​ລາ​ທີ່​ການ​ແຂ່ງ​ຂັນ​ທີ່​ດີ​ແມ່ນ​ໄດ້​ພົບ​ເຫັນ​.

ຕົວເລືອກເສີມ:
-nodeflines ບໍ່ລວມເອົາເສັ້ນກໍານົດຢູ່ໃນຜົນຜະລິດຂອງ sim4db
-alignments ການຈັດຮຽງພິມ

-polytails ຢ່າປິດບັງຫາງ poly-A ແລະ poly-T
-ຕັດ trim ຂອບ exons ຖ້າ A/T % > x (poly-AT tails)

-noncanonical ບໍ່ບັງຄັບສະຖານທີ່ splice canonical
-splicemodel ໃຊ້ຮູບແບບ splice ດັ່ງຕໍ່ໄປນີ້: 0 - sim4 ຕົ້ນສະບັບ;
1 - GeneSplice; 2 - Glimmer; ທາງ​ເລືອກ 1 ແລະ 2 ແມ່ນ​
ສາມາດໃຊ້ໄດ້ກັບ '-interspecies' ເທົ່ານັ້ນ.
ຄ່າເລີ່ມຕົ້ນຂອງ sim4 ແມ່ນ 0, ແລະສໍາລັບ sim4cc ແມ່ນ 1.

-forcestrand ບັງຄັບໃຫ້ການຄາດຄະເນຂອງສາຍພັນທີ່ຈະຢູ່ສະເໝີ
ຫນຶ່ງໃນ 'ໄປຂ້າງຫນ້າ' ຫຼື 'ປີ້ນກັບ'

ທາງ​ເລືອກ​ການ​ປະ​ຕິ​ບັດ​:
-threads ໃຊ້ n threads.
-touch ສ້າງໄຟລ໌ນີ້ເມື່ອໂຄງການສໍາເລັດການປະຕິບັດ

ທາງເລືອກໃນການດີບັກ:
-v ສະຖານະການພິມເພື່ອ stderr ໃນຂະນະທີ່ແລ່ນ
-V ພິມ script ເສັ້ນ (stderr) ຍ້ອນວ່າເຂົາເຈົ້າກໍາລັງດໍາເນີນການ

ທາງ​ເລືອກ​ນັກ​ພັດ​ທະ​ນາ:
-Z ກໍານົດຮູບແບບເມັດທີ່ມີໄລຍະຫ່າງ
-H ກໍານົດປັດໄຈນ້ໍາຫນັກ relink (H = 1000 ແນະນໍາສໍາລັບ mRNAs)
-K ກໍານົດຂອບເຂດ MSP ທໍາອິດ
-C ກໍານົດຂອບເຂດ MSP ທີສອງ
-Ma ກໍານົດຂອບເຂດຈໍາກັດຂອງຈໍານວນຂອງ MSPs ອະນຸຍາດ
-Mp ດຽວກັນ, ເປັນສ່ວນຮ້ອຍຂອງຖານໃນ cDNA
ຫມາຍເຫດ: ຖ້າໃຊ້, ຕ້ອງລະບຸທັງ -Ma ແລະ -Mp!

ໃຊ້ sim4db ອອນລາຍໂດຍໃຊ້ບໍລິການ onworks.net


ເຊີບເວີ ແລະສະຖານີເຮັດວຽກຟຣີ

ດາວໂຫຼດແອັບ Windows ແລະ Linux

Linux ຄຳ ສັ່ງ

Ad