यह कमांड pbalign है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
pbalign - PacBio अनुक्रमों को संदर्भों में मैप करना
वर्णन
उपयोग: pbalign [-h] [--verbose] [--संस्करण] [--प्रोफ़ाइल] [--डीबग]
[--क्षेत्र तालिका क्षेत्रीय] [--कॉन्फ़िगफ़ाइल कॉन्फ़िगफ़ाइल] [--पल्सफ़ाइल पल्सफ़ाइल]
[--एल्गोरिदम {blasr,bowtie,gmap}] [--maxHits MAXHITS] [--minAnchorSize
Minanchorsize] [--useccs {useccs,useccsall,useccsdenovo}] [--noSplitSubreads]
[--concordant] [--nproc NPROC] [--algorithmOptions ALGORITHMOTIONS]
[--अधिकतम विचलन अधिकतम विचलन] [--न्यूनतम सटीकता न्यूनतम सटीकता] [--न्यूनतम लंबाई न्यूनतम लंबाई]
[--स्कोरफंक्शन {एलाइनरस्कोर, एडिटडिस्ट, ब्लैसर्सकोर}] [--स्कोर कटऑफ स्कोरक्यूटऑफ]
[--हिटपॉलिसी {रैंडमबेस्ट, ऑलबेस्ट, रैंडम, ऑल, लेफ्टमोस्ट}] [--फ़िल्टर एडाप्टर ओनली]
[--forQuiver] [--loadQVs] [--byread] [--मेट्रिक्स मेट्रिक्स] [--बीज बीज] [--tmpDir
TMPDIR] इनपुट फ़ाइल नाम संदर्भ पथ आउटपुट फ़ाइल नाम
चयन में से चयनित एल्गोरिदम का उपयोग करके संदर्भों के लिए PacBio अनुक्रमों को मैप करना
समर्थित कमांड-लाइन संरेखण एल्गोरिदम। इनपुट fasta, pls.h5, bas.h5 या हो सकता है
ccs.h5 फ़ाइल या एक fofn (फ़ाइल नामों की फ़ाइल)। आउटपुट या तो cmp.h5 या sam प्रारूप में है।
अवस्था का तर्क:
इनपुटफ़ाइलनाम
इनपुट फ़ाइल fasta, plx.h5, bax.h5, ccs.h5 फ़ाइल या fofn हो सकती है।
संदर्भपथ
या तो एक संदर्भ फास्टा फ़ाइल या एक संदर्भ भंडार।
आउटपुट फ़ाइल नाम
आउटपुट cmp.h5 या sam फ़ाइल।
वैकल्पिक तर्क:
-h, --मदद
यह सहायता संदेश दिखाएं और बाहर निकलें
--शब्दशः, -v
वाचालता स्तर निर्धारित करें
--संस्करण
कार्यक्रम का संस्करण संख्या दिखाएं और बाहर निकलें
--प्रोफाइल
बाहर निकलने पर रनटाइम प्रोफ़ाइल प्रिंट करें
- दाढ़
डिबगर में अपवाद पकड़ें (आईपीडीबी की आवश्यकता है)
--क्षेत्र तालिका क्षेत्रीय
पढ़ने को फ़िल्टर करने के लिए एक क्षेत्र तालिका निर्दिष्ट करें।
--configफ़ाइल कॉन्फिगफाइल
उपयोगकर्ता-परिभाषित तर्क मानों का एक सेट निर्दिष्ट करें।
--पल्सफ़ाइल पल्सफ़ाइल
जब इनपुट रीड फास्टा प्रारूप में होता है और आउटपुट cmp.h5 होता है तो यह विकल्प निर्दिष्ट कर सकता है
pls.h5 या bas.h5 या FOFN फ़ाइलें जिनसे क्विवर के लिए पल्स मेट्रिक्स लोड किए जा सकते हैं।
--कलन विधि {blasr,bowtie,gmap}
('blasr', 'bowtie', 'gmap') से एक एलिगोरिदम चुनें। डिफ़ॉल्ट एल्गोरिदम blasr है.
--मैक्सहिट्स मैक्सहिट्स
संदर्भ अनुक्रम में प्रत्येक पठन के मिलान की अधिकतम संख्या होगी
मूल्यांकन किया गया। डिफ़ॉल्ट मान 10 है.
--minAnchorSize लघुकोरसाइज
न्यूनतम एंकर आकार रीड की लंबाई को परिभाषित करता है जो इसके विपरीत मेल खाना चाहिए
संदर्भ क्रम. डिफ़ॉल्ट मान 12 है.
--useccs {useccs,useccsall,useccsdenovo}
पहले ccsSequence को जीनोम में मैप करें, फिर सबरीड्स को उस अंतराल पर संरेखित करें
सीसीएस को मैप किया गया पढ़ता है।
उपयोगसीसीएस: केवल उन मानचित्रों को सबरीड करता है जिनकी लंबाई होती है
नमूना।
useccsall: सभी उपपाठों को मैप करता है।
उपयोगसीसीएसडेनोवो: केवल सीसीएस मानचित्र।
--नोस्प्लिटसब्रेड्स
सबरीड क्षेत्र उपलब्ध होने पर भी रीड को सबरीड में विभाजित न करें। गलती करना
मान गलत है.
--सुसंगत
ZMW के सबरीड्स को समान जीनोमिक स्थान पर मैप करें।
--एनप्रोक एनपीआरओसी
धागों की संख्या। डिफ़ॉल्ट मान 8 है.
--एल्गोरिदमविकल्प एल्गोरिदमविकल्प
संरेखण विकल्पों को पार करें।
--मैक्सडाइवर्जेंस मैक्सडाइवर्जेंस
संदर्भ अनुक्रम से पढ़े गए पाठ का अधिकतम अनुमत प्रतिशत विचलन।
डिफ़ॉल्ट मान 30 है।
--minसटीकता अल्पशुद्धि
संरेखण की न्यूनतम प्रतिशत सटीकता का मूल्यांकन किया जाएगा। डिफ़ॉल्ट मान
एक्सएनएनएक्स है।
--न्यूनतमलंबाई न्यूनतम लंबाई
संरेखण की न्यूनतम संरेखित पठन लंबाई जिसका मूल्यांकन किया जाएगा। डिफ़ॉल्ट मान
एक्सएनएनएक्स है।
--स्कोरफंक्शन {एलाइनर्सस्कोर, एडिटडिस्ट, ब्लैसर्सकोर}
संरेखण के मूल्यांकन के लिए एक स्कोर फ़ंक्शन निर्दिष्ट करें।
एलाइनर्सस्कोर: एसएएम टैग 'एज़' में एलाइनर का स्कोर।
एडिटडिस्ट: पढ़ने और संदर्भ के बीच की दूरी संपादित करें। ब्लैसरस्कोर: ब्लैसर का
डिफ़ॉल्ट स्कोर फ़ंक्शन।
डिफ़ॉल्ट मान एलाइनर्सस्कोर है।
--स्कोरकटऑफ़ स्कोरकटऑफ़
संरेखण को आउटपुट करने के लिए सबसे खराब स्कोर।
--हिटपॉलिसी {रैंडमबेस्ट, ऑलबेस्ट, रैंडम, ऑल, लेफ्टमोस्ट}
मल्टीपल हिट से निपटने के तरीके के लिए एक नीति निर्दिष्ट करें
यादृच्छिक : एक यादृच्छिक हिट का चयन करता है।
सभी : सभी हिट का चयन करता है।
सब अच्छा
: सभी सर्वोत्तम स्कोर हिट का चयन करता है।
रैंडमबेस्ट: सभी सर्वश्रेष्ठ स्कोर हिट में से एक यादृच्छिक हिट का चयन करता है।
सबसे बाईं ओर: उस हिट का चयन करता है जिसका स्कोर सबसे अच्छा है और
किसी भी संदर्भ में सबसे छोटा मानचित्रण समन्वय।
डिफ़ॉल्ट मान यादृच्छिक सर्वोत्तम है.
--केवल फ़िल्टर एडाप्टर
यदि निर्दिष्ट किया गया है, तो संदर्भ के साथ एनोटेशन का उपयोग करके केवल-एडॉप्टर हिट की रिपोर्ट न करें
प्रवेश।
--तरकश के लिए
आउटपुट cmp.h5 फ़ाइल जिसे सॉर्ट किया जाएगा, पल्स QV जानकारी के साथ लोड किया जाएगा, और
दोबारा पैक किया गया, ताकि इसे सीधे तरकश द्वारा खाया जा सके। इसके लिए इनपुट की आवश्यकता है
फ़ाइल PacBio bas/pls.h5 प्रारूप में होनी चाहिए, और --useccs कोई नहीं होना चाहिए. डिफ़ॉल्ट मान है
असत्य।
--loadQVs
के समान --तरकश के लिए, फर्क सिर्फ इतना है --useccs निर्दिष्ट किया जा सकता है।
डिफ़ॉल्ट मान ग़लत है.
--byread
का उपयोग करके पल्स जानकारी लोड करें -बायरीड के बजाय विकल्प -बाइमेट्रिक. केवल तभी काम करता है जब
--तरकश के लिए or --loadQVs तैयार। डिफ़ॉल्ट मान ग़लत है.
--मेट्रिक्स मेट्रिक्स
डिफ़ॉल्ट मेट्रिक्स के बजाय निर्दिष्ट (अल्पविराम-सीमांकित सूची) मेट्रिक्स लोड करें
तरकश द्वारा आवश्यक. यह विकल्प तभी काम करता है जब --तरकश के लिए or --loadQVs तैयार।
डिफ़ॉल्ट: विलोपनQV, विलोपनटैग, सम्मिलनQV, मर्जQV, प्रतिस्थापनQV
--बीज बीज
एक गैर-शून्य पूर्णांक के साथ यादृच्छिक संख्या जनरेटर प्रारंभ करें। शून्य का मतलब है
वर्तमान सिस्टम समय का उपयोग किया जाता है. डिफ़ॉल्ट मान 1 है.
--tmpDir टीएमपीडीआईआर
अस्थायी फ़ाइलों को सहेजने के लिए एक निर्देशिका निर्दिष्ट करें। डिफ़ॉल्ट है /खरोंचना.
onworks.net सेवाओं का उपयोग करके ऑनलाइन pbalign का उपयोग करें