ນີ້ແມ່ນຄໍາສັ່ງ ipdSummary ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
ipdSummary - ກວດຫາການດັດແປງພື້ນຖານ DNA ຈາກລາຍເຊັນ kinetic.
ລາຍລະອຽດ
kineticsເຄື່ອງມືໂຫຼດ IPDs ທີ່ສັງເກດຢູ່ໃນແຕ່ລະຕໍາແຫນ່ງໃນ genome, ແລະປຽບທຽບ IPDs ເຫຼົ່ານັ້ນ
ເພື່ອປະເມີນມູນຄ່າທີ່ຄາດໄວ້ສໍາລັບ DNA ທີ່ບໍ່ໄດ້ຮັບການປັບປຸງ, ແລະຜົນໄດ້ຮັບຂອງການທົດສອບສະຖິຕິນີ້.
ຄ່າ IPD ທີ່ຄາດໄວ້ສໍາລັບ DNA ທີ່ບໍ່ໄດ້ດັດແປງສາມາດມາຈາກທັງສອງອັນ ໃນຊິລິໂກ ການຄວບຄຸມ or an
ຂະຫຍາຍໃຫຍ່ຂື້ນ ການຄວບຄຸມ. ໃນການຄວບຄຸມ silico ແມ່ນການຝຶກອົບຮົມໂດຍ PacBio ແລະສົ່ງກັບ
ຊຸດ. ມັນຄາດຄະເນຄາດຄະເນ IPD ໂດຍໃຊ້ສະພາບການລໍາດັບທ້ອງຖິ່ນປະມານປະຈຸບັນ
ຕໍາແຫນ່ງ. ຊຸດຂໍ້ມູນການຄວບຄຸມທີ່ຂະຫຍາຍໃຫຍ່ຂື້ນແມ່ນສ້າງຂື້ນໂດຍການຈັດລໍາດັບ DNA ທີ່ບໍ່ໄດ້ຮັບການແກ້ໄຂດ້ວຍ
ລໍາດັບດຽວກັນກັບຕົວຢ່າງການທົດສອບ. ຕົວຢ່າງການຄວບຄຸມການຂະຫຍາຍໂດຍປົກກະຕິແມ່ນຜະລິດໂດຍ
ການຂະຫຍາຍພັນທຸກໍາຂອງຕົວຢ່າງຕົ້ນສະບັບ.
ການດັດແກ້ ການຄົ້ນພົບ
ຮູບແບບພື້ນຖານຂອງ kineticsTools ເຮັດການປຽບທຽບເອກະລາດຂອງ IPDs ໃນແຕ່ລະຕໍາແຫນ່ງເທິງ
genome, ສໍາລັບແຕ່ລະ strand, ແລະປ່ອຍສະຖິຕິຕ່າງໆໃຫ້ກັບ CSV ແລະ GFF (ຫຼັງຈາກນໍາໃຊ້ a
ການກັ່ນຕອງຄວາມສໍາຄັນ).
ການດັດແປງ ຕົວ
kineticsເຄື່ອງມື ຍັງ ມີ a ການດັດແກ້ ຕົວ ຮູບແບບການ ທີ່ ສາມາດເຮັດໄດ້ ຖອດລະຫັດ ຫຼາຍເວັບໄຊ IPD
'ລາຍນິ້ວມື' ເຂົ້າໄປໃນ a ລົດລົງ ທີ່ກໍານົດໄວ້ of ໂທ of ສະເພາະ ການດັດແປງ. ນີ້ ຄຸນນະສົມບັດ ມີ ໄດ້
ດັ່ງຕໍ່ໄປນີ້ ຜົນປະໂຫຍດ:
· ການດັດແກ້ທີ່ແຕກຕ່າງກັນທີ່ເກີດຂຶ້ນໃນຖານດຽວກັນສາມາດຈໍາແນກ (ສໍາລັບການ
ຕົວຢ່າງ m5C ແລະ m4C)
· ສັນຍານຈາກການດັດແກ້ຫນຶ່ງແມ່ນລວມເຂົ້າເປັນສະຖິຕິຫນຶ່ງ, ການປັບປຸງ
ຄວາມອ່ອນໄຫວ, ເອົາຈຸດສູງສຸດພິເສດອອກ, ແລະວາງສາຍໂທຢ່າງຖືກຕ້ອງ
OPTIONS
ກະລຸນາໂທຫາໂຄງການນີ້ກັບ - ຊ່ວຍ ເພື່ອເບິ່ງຕົວເລືອກທີ່ມີຢູ່.
ອັລເກີຣິດ
synthetic ການຄວບຄຸມ
ການສຶກສາກ່ຽວກັບຄວາມສໍາພັນລະຫວ່າງ IPD ແລະລໍາດັບເຫດການເປີດເຜີຍໃຫ້ເຫັນວ່າຫຼາຍທີ່ສຸດ
ການປ່ຽນແປງຂອງ IPD ສະເລ່ຍໃນທົ່ວ genome ສາມາດຄາດຄະເນໄດ້ຈາກ 12-base context ລໍາດັບ.
ອ້ອມຮອບສະຖານທີ່ເຄື່ອນໄຫວຂອງ DNA polymerase. ຂອບເຂດຂອງສະພາບການທີ່ກ່ຽວຂ້ອງ
ປ່ອງຢ້ຽມສອດຄ່ອງກັບປ່ອງຢ້ຽມຂອງ DNA ໃນການພົວພັນກັບ polymerase ໄດ້, ດັ່ງທີ່ເຫັນຢູ່ໃນ
ໂຄງສ້າງຜລຶກ DNA/polymerase. ເພື່ອເຮັດໃຫ້ຂະບວນການຊອກຫາການດັດແປງ DNA ງ່າຍຂຶ້ນ
ດ້ວຍຂໍ້ມູນ PacBio, ເຄື່ອງມືປະກອບມີຕາຕະລາງການຊອກຫາທີ່ຜ່ານການຝຶກອົບຮົມກ່ອນການສ້າງແຜນທີ່ 12-mer DNA
ລໍາດັບຫມາຍເຖິງ IPD ທີ່ສັງເກດເຫັນໃນ C2 ເຄມີ.
ການກັ່ນຕອງ ແລະ Trimming
kineticsTools ໃຊ້ Mapping QV ທີ່ສ້າງຂຶ້ນໂດຍ BLASR ແລະເກັບໄວ້ໃນໄຟລ໌ cmp.h5 ເພື່ອ
ບໍ່ສົນໃຈການອ່ານທີ່ບໍ່ໄດ້ວາງແຜນໄວ້ຢ່າງໝັ້ນໃຈ. ຄ່າເລີ່ມຕົ້ນຂອງການສ້າງແຜນທີ່ຂັ້ນຕ່ໍາ QV ທີ່ຕ້ອງການແມ່ນ
10, ຫມາຍຄວາມວ່າ BLASR ມີ 90\% ໝັ້ນໃຈວ່າການອ່ານນັ້ນຖືກຕັ້ງໄວ້ຢ່າງຖືກຕ້ອງ. ເພາະວ່າ
ຂອບເຂດຂອງຄວາມຍາວອ່ານທີ່ມີຢູ່ໃນ PacBio data ນີ້ສາມາດປ່ຽນແປງໄດ້ໃນການນໍາໃຊ້
--mapQvThreshold argument ເສັ້ນຄໍາສັ່ງ, ຫຼືຜ່ານກ່ອງໂຕ້ຕອບການຕັ້ງຄ່າ SMRTPportal ສໍາລັບ
ການກວດສອບການດັດແກ້.
ມີລັກສະນະບາງຢ່າງຂອງຂໍ້ມູນ PacBio ທີ່ຕ້ອງການຄວາມສົນໃຈເປັນພິເສດເພື່ອບັນລຸໄດ້
ປະສິດທິພາບການກວດສອບການດັດແປງທີ່ດີ. kineticsເຄື່ອງມືກວດກາຄວາມສອດຄ່ອງລະຫວ່າງ
ພື້ນຖານທີ່ສັງເກດເຫັນແລະລໍາດັບການອ້າງອິງ - ເພື່ອໃຫ້ການວັດແທກ IPD ເປັນ
ລວມຢູ່ໃນການວິເຄາະ, ລໍາດັບການອ່ານ PacBio ຕ້ອງກົງກັບລໍາດັບອ້າງອີງສໍາລັບ k
ອ້ອມຮອບຖານຂອງສະຫມອງ. ໃນໂມດູນປະຈຸບັນ k = 1 ການແຜ່ກະຈາຍ IPD ຢູ່ໃນບາງທ້ອງຖິ່ນ
ຄິດວ່າເປັນການປະສົມລະຫວ່າງຂະບວນການລວມ 'ປົກກະຕິ' IPD, ເຊິ່ງມີຄວາມອ່ອນໄຫວ
ກັບບໍລິບົດລໍາດັບທ້ອງຖິ່ນແລະການດັດແກ້ DNA ແລະຂະບວນການ 'ຢຸດ' ທີ່ປົນເປື້ອນ
IPD ທີ່ມີໄລຍະເວລາດົນກວ່າຫຼາຍ (ຫມາຍຄວາມວ່າ > 10x ຍາວກວ່າປົກກະຕິ), ແຕ່ບໍ່ຄ່ອຍເກີດຂຶ້ນ
(~1% ຂອງ IPD). ໝາຍເຫດ: ຄວາມເຂົ້າໃຈຂອງພວກເຮົາໃນປັດຈຸບັນແມ່ນວ່າການຢຸດຊົ່ວຄາວບໍ່ໄດ້ເປັນປະໂຫຍດ
ຂໍ້ມູນກ່ຽວກັບສະຖານະ methylation ຂອງ DNA, ຢ່າງໃດກໍຕາມ, ການວິເຄາະລະມັດລະວັງຫຼາຍອາດຈະເປັນ
ຮັບປະກັນ. ໃຫ້ສັງເກດວ່າການດັດແກ້ທີ່ເພີ່ມຂຶ້ນຢ່າງຫຼວງຫຼາຍປະມານ 1% ຂອງ
IPDs ທີ່ສັງເກດເຫັນແມ່ນຖືກສ້າງຂຶ້ນໂດຍເຫດການຢຸດຊົ່ວຄາວ. Capping ສັງເກດເຫັນ IPDs ຢູ່ທີ່ 99 ທົ່ວໂລກ
ເປີເຊັນແມ່ນກະຕຸ້ນໂດຍທິດສະດີຈາກການທົດສອບສົມມຸດຕິຖານທີ່ເຂັ້ມແຂງ. ບາງເນື້ອໃນລໍາດັບ
ອາດຈະມີ IPD ທີ່ຍາວກວ່າຕາມທໍາມະຊາດ, ເພື່ອຫຼີກເວັ້ນການເກັບຂໍ້ມູນຫຼາຍເກີນໄປໃນສະພາບການເຫຼົ່ານັ້ນ, ຫລວງ
ເກນຖືກປັບຕາມບໍລິບົດດັ່ງນີ້: capThreshold = ສູງສຸດ(global99,
5*ແບບການຄາດເດົາ, ເປີເຊັນ(ipdObservations, 75))
ສະຖິຕິ ການທົດສອບ
ພວກເຮົາທົດສອບສົມມຸດຕິຖານທີ່ IPDs ສັງເກດເຫັນຢູ່ໃນສະຖານທີ່ສະເພາະໃດຫນຶ່ງໃນຕົວຢ່າງມີ a
ຫມາຍຄວາມວ່າຍາວກວ່າ IPDs ທີ່ສັງເກດເຫັນຢູ່ໃນສະຖານທີ່ດຽວກັນໃນ DNA ທີ່ບໍ່ໄດ້ຮັບການປັບປຸງ. ຖ້າພວກເຮົາສ້າງ
ຊຸດຂໍ້ມູນການຂະຫຍາຍພັນທຸກຳທັງໝົດ, ເຊິ່ງເອົາການດັດແປງ DNA, ພວກເຮົາໃຊ້ຕົວຄວບຄຸມກໍລະນີ,
t-test ສອງຕົວຢ່າງ. ເຄື່ອງມືນີ້ຍັງສະຫນອງຕົວແບບ 'ການຄວບຄຸມສັງເຄາະ' ທີ່ໄດ້ກໍານົດໄວ້ກ່ອນ
ເຊິ່ງຄາດຄະເນ IPD ທີ່ບໍ່ມີການດັດແກ້, ໃຫ້ບໍລິບົດ 12 ລຳດັບພື້ນຖານ. ໃນສັງເຄາະ
ກໍລະນີຄວບຄຸມພວກເຮົາໃຊ້ t-test ຕົວຢ່າງດຽວ, ດ້ວຍການປັບຕົວເພື່ອບັນຊີສໍາລັບຄວາມຜິດພາດໃນ
ຮູບແບບການຄວບຄຸມສັງເຄາະ.
ການນໍາເຂົ້າ
aligned_reads.cmp.h5
ໄຟລ໌ cmp.h5 ມາດຕະຖານມີການຈັດຮຽງ ແລະຂໍ້ມູນ IPD ສະໜອງຂໍ້ມູນ kinetic
ໃຊ້ເພື່ອປະຕິບັດການກວດສອບການດັດແກ້. ໄຟລ໌ cmp.h5 ມາດຕະຖານຂອງວຽກ SMRTportal ແມ່ນ
data/aligned_read.cmp.h5.
ກະສານອ້າງອີງ ລໍາດັບ
ເຄື່ອງມືຮຽກຮ້ອງໃຫ້ມີລໍາດັບການອ້າງອິງທີ່ໃຊ້ເພື່ອປະຕິບັດການຈັດຕໍາແຫນ່ງ. ໃນປັດຈຸບັນນີ້ຕ້ອງ
ສະໜອງໃຫ້ຜ່ານເສັ້ນທາງໄປຫາບ່ອນເກັບຂໍ້ມູນອ້າງອີງ SMRTportal.
OUTPUTS
ເຄື່ອງມືການກວດສອບການດັດແກ້ໃຫ້ຜົນໄດ້ຮັບໃນຫຼາຍຮູບແບບທີ່ເຫມາະສົມສໍາລັບການ
ການວິເຄາະສະຖິຕິໃນຄວາມເລິກ, ກະສານອ້າງອີງໄວ, ແລະການສົມບູນໂດຍເຄື່ອງມືການສ້າງພາບ
ເຊັ່ນ PacBio SMRTView. ຜົນໄດ້ຮັບໂດຍທົ່ວໄປແມ່ນຖືກດັດສະນີໂດຍຕໍາແຫນ່ງອ້າງອີງແລະ
ສາຍອ້າງອີງ. ໃນທຸກໆກໍລະນີ, ມູນຄ່າຂອງສາຍພັນຫມາຍເຖິງສາຍພັນທີ່ຖື
ການປ່ຽນແປງໃນຕົວຢ່າງ DNA. ຈື່ໄວ້ວ່າຜົນກະທົບ kinetic ຂອງການດັດແປງແມ່ນ
ສັງເກດເຫັນຢູ່ໃນລໍາດັບການອ່ານທີ່ສອດຄ່ອງກັບສາຍກົງກັນຂ້າມ. ດັ່ງນັ້ນການອ່ານສອດຄ່ອງກັບ
strand ໃນທາງບວກນໍາເອົາຂໍ້ມູນຂ່າວສານກ່ຽວກັບການດັດແກ້ກ່ຽວກັບ strand ທາງລົບແລະຮອງ
ກົງກັນຂ້າມ, ແຕ່ໃນຊຸດເຄື່ອງມືນີ້ພວກເຮົາສະເຫມີລາຍງານ strand ທີ່ປະກອບດ້ວຍ putative ໄດ້
ການດັດແກ້.
modifications.csv
ໄຟລ໌ modifications.csv ປະກອບມີຫນຶ່ງແຖວສໍາລັບແຕ່ລະຄູ່ (ຕໍາແຫນ່ງອ້າງອີງ, strand).
ທີ່ປາກົດຢູ່ໃນຊຸດຂໍ້ມູນທີ່ມີການຄຸ້ມຄອງຢ່າງຫນ້ອຍ x. x ເລີ່ມຕົ້ນເປັນ 3, ແຕ່ແມ່ນ
ຕັ້ງຄ່າດ້ວຍທຸງ '--minCoverage' ເປັນ ipdSummary.py. ດັດຊະນີຕໍາແຫນ່ງອ້າງອີງແມ່ນ
1-based ສໍາລັບຄວາມເຂົ້າກັນໄດ້ກັບໄຟລ໌ gff ສະພາບແວດລ້ອມ R.
ຜົນຜະລິດ ຄໍລໍາ
ໃນຊິລິໂກ ການຄວບຄຸມ ຮູບແບບການ
┌──────────────────────────────────────────── ──┐
│ຖັນ │ ຄຳອະທິບາຍ │
├─────────────────────────────────────────── ──┤
│refId │ ID ລຳດັບການອ້າງອີງຂອງ │ ນີ້
│ │ ການສັງເກດ │
├─────────────────────────────────────────── ──┤
│tpl │ ຕຳແໜ່ງແມ່ແບບທີ່ອີງໃສ່ 1 │
├─────────────────────────────────────────── ──┤
│strand │ strand ຕົວຢ່າງເດີມທີ່ │
│ │ kinetics ຖືກສ້າງຂຶ້ນ. '0' ແມ່ນ │
│ │ ສາຍຂອງຕົ້ນສະບັບ │
│ │ FASTA, '1' ແມ່ນສາຍກົງກັນຂ້າມ │
│ │ ຈາກ FASTA │
├─────────────────────────────────────────── ──┤
│base │ ຖານ cognate ຢູ່ນີ້ │
│ │ ຕໍາແໜ່ງໃນການອ້າງອີງ │
├─────────────────────────────────────────── ──┤
│score │ Phred-transformed pvalue ເປັນ │
│ │ ການບ່ຽງເບນ kinetic ມີຢູ່ໃນນີ້ │
│ │ ຕໍາແໜ່ງ │
└──────────────────────────────────────────── ──┘
│tMean │ ຄ່າສະເລ່ຍຂອງ IPD ປົກກະຕິ │
│ │ ສັງເກດຢູ່ຕຳແໜ່ງນີ້ │
├─────────────────────────────────────────── ──┤
│tErr │ ຂໍ້ຜິດພາດມາດຕະຖານຂອງ │
│ │ IPD ປົກກະຕິທີ່ສັງເກດເຫັນຢູ່ນີ້ │
│ │ ຕໍາແໜ່ງ (ມາດຕະຖານບ່ຽງເບນ / │
│ │ sqrt(ກວມເອົາ) │
├─────────────────────────────────────────── ──┤
│modelPrediction │ normalized mean IPD ຄາດຄະເນໂດຍ │
│ │ ຮູບແບບການຄວບຄຸມສັງເຄາະສຳລັບ │
│ │ ລຳດັບນີ້ບໍລິບົດ │
├─────────────────────────────────────────── ──┤
│ipdRatio │ tMean / modelPrediction │
├─────────────────────────────────────────── ──┤
│ການຄຸ້ມຄອງ │ ຈຳນວນ IPD ທີ່ຖືກຕ້ອງຢູ່ນີ້ │
ຕໍາແໜ່ງ │ │ (ເບິ່ງພາກການກັ່ນຕອງ │
│ │ ສຳລັບລາຍລະອຽດ) │
├─────────────────────────────────────────── ──┤
│frac │ ການຄາດຄະເນຂອງສ່ວນຫນຶ່ງຂອງ │
│ │ ໂມເລກຸນທີ່ນຳ │
│ │ ການດັດແກ້ │
├─────────────────────────────────────────── ──┤
│fracLow │ 2.5% ຄວາມໝັ້ນໃຈຜູກມັດຂອງ frac │
│ │ ປະມານ │
├─────────────────────────────────────────── ──┤
│fracUpp │ 97.5% ຄວາມໝັ້ນໃຈຜູກມັດຂອງ frac │
│ │ ປະມານ │
└──────────────────────────────────────────── ──┘
ການຄວບຄຸມກໍລະນີ ຮູບແບບການ
┌──────────────────────────────────────────── ──┐
│ຖັນ │ ຄຳອະທິບາຍ │
├─────────────────────────────────────────── ──┤
│refId │ ID ລຳດັບການອ້າງອີງຂອງ │ ນີ້
│ │ ການສັງເກດ │
├─────────────────────────────────────────── ──┤
│tpl │ ຕຳແໜ່ງແມ່ແບບທີ່ອີງໃສ່ 1 │
├─────────────────────────────────────────── ──┤
│strand │ strand ຕົວຢ່າງເດີມທີ່ │
│ │ kinetics ຖືກສ້າງຂຶ້ນ. '0' ແມ່ນ │
│ │ ສາຍຂອງຕົ້ນສະບັບ │
│ │ FASTA, '1' ແມ່ນສາຍກົງກັນຂ້າມ │
│ │ ຈາກ FASTA │
├─────────────────────────────────────────── ──┤
│base │ ຖານ cognate ຢູ່ນີ້ │
│ │ ຕໍາແໜ່ງໃນການອ້າງອີງ │
├─────────────────────────────────────────── ──┤
│score │ Phred-transformed pvalue ເປັນ │
│ │ ການບ່ຽງເບນ kinetic ມີຢູ່ໃນນີ້ │
│ │ ຕໍາແໜ່ງ │
├─────────────────────────────────────────── ──┤
│caseMean │ ຄ່າສະເລ່ຍຂອງກໍລະນີປົກກະຕິ IPDs │
│ │ ສັງເກດຢູ່ຕຳແໜ່ງນີ້ │
├─────────────────────────────────────────── ──┤
│controlMean │ ຄ່າສະເລ່ຍຂອງ IPD ຄວບຄຸມປົກກະຕິ │
│ │ ສັງເກດຢູ່ຕຳແໜ່ງນີ້ │
├─────────────────────────────────────────── ──┤
│caseStd │ ຄ່າບ່ຽງເບນມາດຕະຖານຂອງ case IPDs │
│ │ ສັງເກດຢູ່ຕຳແໜ່ງນີ້ │
├─────────────────────────────────────────── ──┤
│controlStd │ ການບ່ຽງເບນມາດຕະຖານຂອງການຄວບຄຸມ │
│ │ IPD ທີ່ສັງເກດເຫັນຢູ່ຕຳແໜ່ງນີ້ │
└──────────────────────────────────────────── ──┘
│ipdRatio │ tMean / modelPrediction │
├─────────────────────────────────────────── ──┤
│testStatistic │ t-test ສະຖິຕິ │
├─────────────────────────────────────────── ──┤
│ ການຄຸ້ມຄອງ │ ຄ່າສະເລ່ຍຂອງກໍລະນີ ແລະ ການຄວບຄຸມ │
│ │ ການຄຸ້ມຄອງ │
├─────────────────────────────────────────── ──┤
│controlCoverage │ ຈຳນວນຂອງ IPD ຄວບຄຸມທີ່ຖືກຕ້ອງຢູ່ທີ່ │
│ │ ຕໍາແໜ່ງນີ້ (ເບິ່ງ ການກັ່ນຕອງ │
│ │ ພາກສ ຳລັບລາຍລະອຽດ) │
├─────────────────────────────────────────── ──┤
│case Coverage │ ຈຳນວນກໍລະນີ IPD ທີ່ຖືກຕ້ອງຢູ່ │ ນີ້
ຕໍາແໜ່ງ │ │ (ເບິ່ງພາກການກັ່ນຕອງ │
│ │ ສຳລັບລາຍລະອຽດ) │
└──────────────────────────────────────────── ──┘
modifications.gff
modifications.gff ແມ່ນສອດຄ່ອງກັບ GFF Version 3 ສະເພາະ (-
http://www.sequenceontology.org/gff3.shtml). ແຕ່ລະຕໍາແຫນ່ງແມ່ແບບ / ຄູ່ strand ທີ່
p-value ເກີນ pvalue threshold ປາກົດເປັນແຖວ. ຕໍາແຫນ່ງແມ່ແບບແມ່ນ 1-based,
ຕາມ GFF spec. ຖັນ strand ຫມາຍເຖິງ strand ປະຕິບັດການກວດພົບ
ການດັດແກ້, ຊຶ່ງເປັນສາຍກົງກັນຂ້າມຈາກການນໍາໃຊ້ເພື່ອກວດສອບການດັດແກ້. ໄດ້
ຖັນຄວາມເຊື່ອໝັ້ນ GFF ແມ່ນຄ່າກວດຫາທີ່ປ່ຽນເປັນ Phred.
ຫມາຍເຫດ on genome ຕົວທ່ອງເວັບ ເຂົ້າກັນໄດ້
ໄຟລ໌ modifications.gff ຈະບໍ່ເຮັດວຽກໂດຍກົງກັບຕົວທ່ອງເວັບຂອງ genome ສ່ວນໃຫຍ່. ເຈົ້າຈະ
ອາດຈະຈໍາເປັນຕ້ອງເຮັດສໍາເນົາຂອງໄຟລ໌ GFF ແລະປ່ຽນຖັນ _seqid_ ຈາກ
ຊື່ 'ref0000x' ທົ່ວໄປທີ່ສ້າງຂຶ້ນໂດຍ PacBio, ໄປຫາສ່ວນຫົວ FASTA ທີ່ມີຢູ່ໃນຕົ້ນສະບັບ
ເອກະສານອ້າງອີງ FASTA. ຕາຕະລາງແຜນທີ່ແມ່ນຂຽນຢູ່ໃນສ່ວນຫົວຂອງ modifications.gff
ຍື່ນໃນ #ສ່ວນຫົວລຳດັບ ແທັກ. ບັນຫານີ້ຈະຖືກແກ້ໄຂໃນການປ່ອຍ 1.4 ຂອງ
kineticsເຄື່ອງມື
ຖັນຂໍ້ມູນຊ່ວຍຂອງໄຟລ໌ GFF ມີສະຖິຕິອື່ນໆທີ່ອາດຈະເປັນປະໂຫຍດ
ການວິເຄາະທາງລຸ່ມ ຫຼືການກັ່ນຕອງ. ໂດຍສະເພາະລະດັບການຄຸ້ມຄອງຂອງການອ່ານທີ່ເຄີຍໃຊ້
ເຮັດການໂທ, ແລະ +/- ລໍາດັບ 20bp ບໍລິບົດທີ່ອ້ອມຮອບເວັບໄຊທ໌.
┌───────────────┬─────────────────────────────
│ຖັນ │ ຄຳອະທິບາຍ │
├────────────────────────────────────────────────
│seqid │ Fasta contig name │
├────────────────────────────────────────────────
│ແຫຼ່ງ │ ຊື່ຂອງເຄື່ອງມື -- 'kinModCall' │
├────────────────────────────────────────────────
│type │ ປະເພດການດັດແກ້ -- in │
│ │ ໂໝດການລະບຸຕົວຕົນນີ້ຈະເປັນ │
│ │ m6A, m4C, ຫຼື m5C ສໍາລັບການລະບຸ │
│ │ ຖານ, ຫຼືແທັກທົ່ວໄປ │
│ │ 'modified_base' ຖ້າເປັນ kinetic │
ກວດພົບເຫດການ │ │ ທີ່ບໍ່ │
│ │ ກົງກັບການປ່ຽນແປງທີ່ຮູ້ຈັກ │
│ │ ລາຍເຊັນ │
├────────────────────────────────────────────────
│start │ ຕຳແໜ່ງການດັດແກ້ຢູ່ contig │
├────────────────────────────────────────────────
│end │ ການດັດແກ້ຕໍາແໜ່ງຢູ່ contig │
├────────────────────────────────────────────────
│score │ Phred ປ່ຽນ p-value ຂອງ │
│ │ ການກວດຫາ - ນີ້ແມ່ນ │
│ │ ການກວດຫາສະຖານທີ່ດຽວ p-value │
├────────────────────────────────────────────────
│strand │ ຕົວຢ່າງ strand ປະກອບດ້ວຍ │
│ │ ການດັດແກ້ │
└────────────────────────────────────────────────────┘
│ ໄລຍະ │ ບໍ່ສາມາດໃຊ້ໄດ້ │
├────────────────────────────────────────────────
│ຄຸນລັກສະນະ │ ຊ່ອງຂໍ້ມູນພິເສດທີ່ກ່ຽວຂ້ອງກັບພື້ນຖານ │
│ │ mods. IPDRatio ແມ່ນ │ ແບບດັ້ງເດີມ
│ │ IPDRatio, ບໍລິບົດແມ່ນ │
│ │ ລຳດັບອ້າງອີງ -20bp ຫາ │
│ │ +20bp ຮອບການດັດແກ້, │
│ │ ແລະລະດັບການຄຸ້ມຄອງແມ່ນຕົວເລກ │
│ │ ຂອງການສັງເກດ IPD ທີ່ໃຊ້ຫຼັງຈາກ │
│ │ ການສ້າງແຜນທີ່ QV filtering ແລະ │
│ │ ການກັ່ນຕອງຄວາມຖືກຕ້ອງ. ຖ້າແຖວ │
│ │ ຜົນໄດ້ຮັບຈາກ │ ທີ່ໄດ້ລະບຸ
ການດັດແກ້ │ │ ພວກເຮົາຍັງລວມເອົາ │
│ │ identificationQv tag ກັບ │
│ │ ຈາກການດັດແກ້ │
│ │ ຂັ້ນຕອນການລະບຸຕົວຕົນ. │
│ │ identificationQv ແມ່ນ │
│ │ ຄວາມເປັນໄປໄດ້ທີ່ປ່ຽນເປັນ phred ຂອງ │
│ │ ການລະບຸບໍ່ຖືກຕ້ອງ, ສໍາລັບ │
│ │ ພື້ນຖານທີ່ຖືກລະບຸວ່າເປັນ │
│ │ ມີ │ ສະເພາະ
│ │ ການປ່ຽນແປງ. frac, fracLow, │
│ │ fracUp ແມ່ນການຄາດຄະເນ │
│ │ ຊິ້ນສ່ວນຂອງໂມເລກຸນບັນຈຸ │
│ │ ການດັດແກ້, ແລະ 5% │
│ │ ໄລຍະຄວາມໝັ້ນໃຈຂອງ │
│ │ ການຄາດຄະເນ. ເມທິເລດ │
│ │ ເສດສ່ວນປະມານແມ່ນ │
│ │ ຄຸນສົມບັດລະດັບເບຕ້າ, ແລະຄວນ │
│ │ ຖືກໃຊ້ສຳລັບສຳຫຼວດ │ ເທົ່ານັ້ນ
│ │ ຈຸດປະສົງ. │
└────────────────────────────────────────────────────┘
motifs.gff
ຖ້າເຄື່ອງມືຊອກຫາ Motif ຖືກແລ່ນ, ມັນຈະສ້າງ motifs.gff, ເຊິ່ງເປັນເວີຊັນທີ່ປະມວນຜົນແລ້ວ.
ຂອງ modifications.gff ກັບການປ່ຽນແປງດັ່ງຕໍ່ໄປນີ້. ຖ້າຫາກວ່າການດັດແກ້ທີ່ກວດພົບເກີດຂຶ້ນໃນ a
motif ກວດພົບໂດຍ motif finder, ການແກ້ໄຂໄດ້ຖືກອະທິບາຍດ້ວຍຂໍ້ມູນ motif. ອັນ
ຄຸນລັກສະນະ 'motif' ໄດ້ຖືກເພີ່ມປະກອບດ້ວຍ motif string, ແລະຄຸນລັກສະນະ 'id' ຖືກເພີ່ມ
ມີ motif id, ເຊິ່ງແມ່ນ motif string ສໍາລັບ motifs unpaired ຫຼື
'motifString1/motifString2' ສໍາລັບ motifs ຈັບຄູ່. ຖ້າຕົວຢ່າງ motif ມີຢູ່ໃນ genome,
ແຕ່ບໍ່ຖືກກວດພົບໃນ modifications.gff, ມີການເພີ່ມເຂົ້າໃນ motifs.gff, ຊີ້ໃຫ້ເຫັນເຖິງ.
ການປະກົດຕົວຂອງ motif ແລະ kinetics ທີ່ສັງເກດເຫັນຢູ່ໃນສະຖານທີ່ນັ້ນ.
motif_summary.csv
ຖ້າເຄື່ອງມືຊອກຫາ Motif ຖືກເປີດໃຊ້, motif_summary.csv ຈະຖືກສ້າງຂື້ນ, ສະຫຼຸບການດັດແກ້.
motifs ຄົ້ນພົບໂດຍເຄື່ອງມື. CSV ປະກອບດ້ວຍຫນຶ່ງແຖວຕໍ່ກັບ motif ທີ່ກວດພົບ, ມີ
ຕິດຕາມຖັນ
┌──────────────────────────────────────────── ─────┐
│ຖັນ │ ຄຳອະທິບາຍ │
├────────────────────────────────────────── ─────┤
│motifString │ ລຳດັບ motif ທີ່ກວດພົບ │
├────────────────────────────────────────── ─────┤
│centerPos │ ຕໍາແໜ່ງໃນ motif ຂອງ │
│ │ ການດັດແກ້ (0-based) │
├────────────────────────────────────────── ─────┤
│fraction │ ເສດສ່ວນຂອງຕົວຢ່າງນີ້ │
│ │ motif ທີ່ມີການດັດແກ້ QV ຂ້າງເທິງ │
│ │ ເກນ QV │
├────────────────────────────────────────── ─────┤
│nDetected │ ຈຳນວນຂອງກໍລະນີນີ້ │
│ │ motif ທີ່ສູງກວ່າເກນ │
└────────────────────────────────────────── ─────┘
│nGenome │ ຈຳນວນຂອງຕົວຢ່າງນີ້ │
│ │ motif ໃນລໍາດັບອ້າງອີງ │
├────────────────────────────────────────── ─────┤
│groupTag │ ສະຕຣິງທີ່ລະບຸ motif │
│ │ ການຈັດກຸ່ມ. ສຳລັບຮູບແຕ້ມຄູ່ນີ້ │
│ │ ແມ່ນ │
│ │ " / ", │
│ │ ສຳລັບຮູບແຕ້ມທີ່ບໍ່ໄດ້ຈັບຄູ່ ອັນນີ້ເທົ່າກັບ │
│ │ motifString │
├────────────────────────────────────────── ─────┤
│partnerMotifString │ motifString of paired motif │
│ │ (motif ກັບ │
│ │ ປີ້ນກັບກັນ │
│ │ motifString) │
├────────────────────────────────────────── ─────┤
│meanScore │ Mean Modification Qv ຂອງກວດພົບ │
│ │ ຕົວຢ່າງ │
├────────────────────────────────────────── ─────┤
│meanIpdRatio │ ອັດຕາສ່ວນ IPD ສະເລ່ຍຂອງກວດພົບ │
│ │ ຕົວຢ່າງ │
├────────────────────────────────────────── ─────┤
│meanCoverage │ ການຄຸ້ມຄອງສະເລ່ຍຂອງກວດພົບ │
│ │ ຕົວຢ່າງ │
├────────────────────────────────────────── ─────┤
│objectiveScore │ ຄະແນນຈຸດປະສົງຂອງ motif ນີ້ໃນ │
│ │ algorithm finder motif │
└────────────────────────────────────────── ─────┘
ໃຊ້ ipdSummary ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net