Ubuntu Online, Fedora Online, Windows online emulator അല്ലെങ്കിൽ MAC OS ഓൺലൈൻ എമുലേറ്റർ എന്നിങ്ങനെയുള്ള ഞങ്ങളുടെ ഒന്നിലധികം സൗജന്യ ഓൺലൈൻ വർക്ക്സ്റ്റേഷനുകളിലൊന്ന് ഉപയോഗിച്ച് OnWorks സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവിൽ പ്രവർത്തിപ്പിക്കാവുന്ന കമാൻഡ് cmsearch ആണിത്.
പട്ടിക:
NAME
cmsearch - ഒരു സീക്വൻസ് ഡാറ്റാബേസിനെതിരെ covariance model(കൾ) തിരയുക
സിനോപ്സിസ്
സെമീ സെർച്ച് [ഓപ്ഷനുകൾ]
വിവരണം
സെമീ സെർച്ച് ഒരു ശ്രേണിയ്ക്കെതിരെ ഒന്നോ അതിലധികമോ കോവേരിയൻസ് മോഡലുകൾ (CMs) തിരയാൻ ഉപയോഗിക്കുന്നു
ഡാറ്റാബേസ്. ഓരോ മുഖ്യമന്ത്രിക്കും , എന്ന ടാർഗെറ്റ് ഡാറ്റാബേസ് തിരയാൻ ആ ചോദ്യം CM ഉപയോഗിക്കുക
ലെ സീക്വൻസുകൾ , കൂടാതെ ഏറ്റവും പ്രധാനപ്പെട്ട സീക്വൻസുകളുടെ ഔട്ട്പുട്ട് റാങ്ക് ലിസ്റ്റുകൾ
മുഖ്യമന്ത്രിയോട് മത്സരങ്ങൾ. ഒന്നിലധികം വിന്യാസങ്ങളിൽ നിന്ന് മുഖ്യമന്ത്രിമാരെ നിർമ്മിക്കാൻ, കാണുക cmbuild.
ചോദ്യം ഉപയോഗിച്ച് ഇ-മൂല്യങ്ങൾക്കായി കാലിബ്രേറ്റ് ചെയ്തിരിക്കണം cmcalibrate. ഒരു പ്രത്യേക പോലെ
ഒഴിവാക്കൽ, ഏതെങ്കിലും മോഡലുകൾ പൂജ്യം ബേസ്പെയർ ഉള്ളവ കാലിബ്രേറ്റ് ചെയ്യേണ്ടതില്ല. വേണ്ടി
ഈ മോഡലുകൾ, ചർച്ച ചെയ്തതുപോലെ, CM മോഡലുകൾക്ക് പകരം പ്രൊഫൈൽ HMM തിരയൽ അൽഗോരിതങ്ങൾ ഉപയോഗിക്കും
കൂടുതൽ ചുവടെ.
ചോദ്യം '-' (ഒരു ഡാഷ് പ്രതീകം) ആയിരിക്കാം, ഈ സാഹചര്യത്തിൽ ചോദ്യം CM ഇൻപുട്ട് ആയിരിക്കും
എയിൽ നിന്ന് വായിച്ചു ഒരു ഫയലിൽ നിന്ന് പകരം പൈപ്പ്. ദി കാരണം '-' ആയിരിക്കില്ല
നിലവിലെ നടപ്പാക്കലിന് ഡാറ്റാബേസ് റിവൈൻഡ് ചെയ്യാൻ കഴിയണം, അത് സാധ്യമല്ല
stdin ഇൻപുട്ട്.
ഔട്ട്പുട്ട് ഫോർമാറ്റ് മനുഷ്യർക്ക് വായിക്കാൻ കഴിയുന്ന തരത്തിലാണ് രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്, പക്ഷേ പലപ്പോഴും അത് വളരെ വലുതാണ്
ഇത് വായിക്കുന്നത് അപ്രായോഗികമാണ്, അത് പാഴ്സ് ചെയ്യുന്നത് ഒരു വേദനയാണ്. ദി --tblout ഓപ്ഷൻ a-ൽ ഔട്ട്പുട്ട് സംരക്ഷിക്കുന്നു
സംക്ഷിപ്തവും പാഴ്സ് ചെയ്യാൻ എളുപ്പമുള്ളതുമായ ലളിതമായ പട്ടിക ഫോർമാറ്റ്. ദി -o ഓപ്ഷൻ അനുവദിക്കുന്നു
പ്രധാന ഔട്ട്പുട്ട് റീഡയറക്ട് ചെയ്യുന്നു, അത് /dev/null-ൽ വലിച്ചെറിയുന്നത് ഉൾപ്പെടെ.
സെമീ സെർച്ച് പ്രത്യേക അൽഗോരിതങ്ങൾ ഉപയോഗിച്ച് ടാർഗെറ്റ് സീക്വൻസുകളുടെ 5', 3' ടെർമിനികൾ വീണ്ടും പരിശോധിക്കുന്നു
കണ്ടെത്തുന്നതിന് വെട്ടിച്ചുരുക്കി ഹിറ്റുകൾ, ഇതിൽ 5' കൂടാതെ/അല്ലെങ്കിൽ 3' അവസാനം യഥാർത്ഥ പൂർണ്ണമായ ഭാഗമാണ്
ടാർഗെറ്റ് സീക്വൻസ് ഫയലിൽ ദൈർഘ്യമുള്ള ഹോമോലോഗസ് സീക്വൻസ് കാണുന്നില്ല. ഇത്തരത്തിലുള്ള ഹിറ്റുകൾ
അൺഅസെംബിൾ ചെയ്യാത്ത സീക്വൻസിങ് റീഡുകൾ അടങ്ങുന്ന സീക്വൻസ് ഫയലുകളിൽ ഏറ്റവും സാധാരണമായിരിക്കും. എഴുതിയത്
ഡിഫോൾട്ട്, ടാർഗെറ്റിന്റെ ആദ്യ അവശിഷ്ടം ഉൾപ്പെടുത്താൻ ഏതെങ്കിലും 5' വെട്ടിച്ചുരുക്കിയ ഹിറ്റ് ആവശ്യമാണ്
അതിൽ നിന്ന് ഉരുത്തിരിഞ്ഞ ക്രമം , കൂടാതെ, ഉൾപ്പെടുത്താൻ ഏതെങ്കിലും 3' വെട്ടിച്ചുരുക്കിയ ഹിറ്റ് ആവശ്യമാണ്
അത് ഉരുത്തിരിഞ്ഞ ലക്ഷ്യ ശ്രേണിയുടെ അവസാന അവശിഷ്ടം. ഏതെങ്കിലും 5', 3' വെട്ടിച്ചുരുക്കിയ ഹിറ്റ് നിർബന്ധമാണ്
അതിൽ നിന്ന് ഉരുത്തിരിഞ്ഞ ലക്ഷ്യ ശ്രേണിയുടെ ആദ്യത്തേയും അവസാനത്തേയും അവശിഷ്ടങ്ങൾ ഉൾപ്പെടുത്തുക. ദി --anytruc
ഓപ്ഷൻ സീക്വൻസ് എൻഡ്പോയിന്റുകളുടെ ഹിറ്റ് ഉൾപ്പെടുത്തലിനുള്ള ആവശ്യകതകളിൽ ഇളവ് വരുത്തുകയും വെട്ടിച്ചുരുക്കുകയും ചെയ്യും
ടാർഗെറ്റ് സീക്വൻസുകളുടെ ഏത് സ്ഥാനത്തും ഹിറ്റുകൾ ആരംഭിക്കാനും നിർത്താനും അനുവദിച്ചിരിക്കുന്നു. പ്രധാനമായി
എങ്കിലും, കൂടെ --എനിട്രങ്ക്, മോഡൽ കാലിബ്രേഷൻ ചെയ്യുന്നതിനാൽ ഹിറ്റ് ഇ-മൂല്യങ്ങൾ കൃത്യത കുറവായിരിക്കും
വെട്ടിച്ചുരുക്കിയ ഹിറ്റുകളുടെ സാധ്യത പരിഗണിക്കരുത്, അതിനാൽ ഇത് ജാഗ്രതയോടെ ഉപയോഗിക്കുക. ദി --നടക്കുന്നില്ല
വെട്ടിച്ചുരുക്കിയ ഹിറ്റ് ഡിറ്റക്ഷൻ ഓഫ് ചെയ്യാൻ ഓപ്ഷൻ ഉപയോഗിക്കാം. --നടക്കുന്നില്ല ഓട്ടം കുറയ്ക്കും
സമയം cm തിരയൽ, ടാർഗെറ്റിനായി ഏറ്റവും പ്രധാനമായി നിരവധി ചെറിയ ഫയലുകൾ ഉൾപ്പെടുന്ന ഫയലുകൾ
സീക്വൻസുകൾ.
വെട്ടിച്ചുരുക്കിയ ഹിറ്റ് കണ്ടെത്തൽ സ്വയമേവ ഓഫാകും --പരമാവധി, --നമ്മും, --qdb, or
--ബന്ധമില്ലാത്തത് ത്വരിതപ്പെടുത്തിയ HMM ബാൻഡിന്റെ ഉപയോഗത്തെ ആശ്രയിക്കുന്നതിനാൽ ഓപ്ഷനുകൾ ഉപയോഗിക്കുന്നു
ആ ഓപ്ഷനുകളിലേതെങ്കിലും ഓഫാക്കിയ വിന്യാസ തന്ത്രം.
ഓപ്ഷനുകൾ
-h സഹായം; കമാൻഡ് ലൈൻ ഉപയോഗത്തിന്റെയും ലഭ്യമായ എല്ലാ ഓപ്ഷനുകളുടെയും ഒരു ഹ്രസ്വ ഓർമ്മപ്പെടുത്തൽ പ്രിന്റ് ചെയ്യുക.
-g ഓണാക്കുക ആഗോള അലൈൻമെന്റ് അൽഗോരിതം, അന്വേഷണ മാതൃകയുമായി ബന്ധപ്പെട്ട് ആഗോളവും
ടാർഗെറ്റ് ഡാറ്റാബേസുമായി ബന്ധപ്പെട്ട് പ്രാദേശികം. സ്ഥിരസ്ഥിതിയായി, പ്രാദേശിക വിന്യാസം
ടാർഗെറ്റ് സീക്വൻസും ദിയും സംബന്ധിച്ച് പ്രാദേശികമായ അൽഗോരിതം ഉപയോഗിക്കുന്നു
മാതൃക. ലോക്കൽ മോഡിൽ, ആവശ്യമെങ്കിൽ രണ്ടോ അതിലധികമോ തുടർനടപടികൾ വ്യാപിപ്പിക്കുന്നതിനുള്ള വിന്യാസം
(ഉദാ: അന്വേഷണ മാതൃകയുടെയും ലക്ഷ്യ ശ്രേണിയുടെയും ഘടനകൾ ഭാഗികമായി മാത്രമാണെങ്കിൽ
പങ്കിട്ടത്), ഘടനയിൽ ചില വലിയ ഉൾപ്പെടുത്തലുകളും ഇല്ലാതാക്കലും അനുവദിക്കുന്നു
സാധാരണ ഇൻഡലുകളേക്കാൾ വ്യത്യസ്തമായി പിഴ ചുമത്തി. പ്രാദേശിക മോഡ് അനുഭവത്തിൽ മികച്ച പ്രകടനം കാഴ്ചവയ്ക്കുന്നു
ബെഞ്ച്മാർക്കുകൾ കൂടാതെ റിമോട്ട് ഹോമോളജി ഡിറ്റക്ഷന് കാര്യമായി കൂടുതൽ സെൻസിറ്റീവ് ആണ്.
പ്രായോഗികമായി, ആഗോള തിരയലുകൾ പ്രാദേശിക തിരയലുകളേക്കാൾ വളരെ കുറച്ച് ഹിറ്റുകൾ നൽകുന്നു, അതിനാൽ ആഗോളതലത്തിൽ
ചില പ്രയോഗങ്ങൾക്ക് ആവശ്യമായി വന്നേക്കാം. കൂടെ -ജി, എല്ലാ മോഡലുകളും കാലിബ്രേറ്റ് ചെയ്തിരിക്കണം
പൂജ്യം ബേസ്പെയറുകൾ ഉള്ളവ.
-Z സെർച്ച് സ്പെയ്സ് വലുപ്പം പോലെ ഇ-മൂല്യങ്ങൾ കണക്കാക്കുക മെഗാബേസുകൾ (Mb). ഇല്ലാതെ
ഈ ഓപ്ഷന്റെ ഉപയോഗം, സെർച്ച് സ്പെയ്സിന്റെ ആകെ സംഖ്യയായി നിർവചിച്ചിരിക്കുന്നു
ന്യൂക്ലിയോടൈഡുകൾ തവണ 2, കാരണം ഓരോ ടാർഗെറ്റ് സീക്വൻസിന്റെയും രണ്ട് സ്ട്രോണ്ടുകളും
അന്വേഷിക്കണം.
--ഡെവലപ്പ്
പ്രിന്റ് സഹായം, പോലെ -h , എന്നാൽ പ്രദർശിപ്പിക്കാത്ത വിദഗ്ദ്ധ ഓപ്ഷനുകളും ഉൾപ്പെടുത്തുക
കൂടെ -h . ഈ വിദഗ്ധ ഓപ്ഷനുകൾ വിശാലതയ്ക്ക് പ്രസക്തമാകുമെന്ന് പ്രതീക്ഷിക്കുന്നില്ല
ഭൂരിഭാഗം ഉപയോക്താക്കളും മാനുവൽ പേജിൽ വിവരിച്ചിട്ടില്ല. ഏക വിഭവങ്ങൾ
അവർ യഥാർത്ഥത്തിൽ എന്താണ് ചെയ്യുന്നതെന്ന് മനസിലാക്കാൻ ഹ്രസ്വമായ ഒറ്റവരി വിവരണങ്ങളുടെ ഔട്ട്പുട്ട്
എപ്പോൾ --ഡെവലപ്പ് പ്രവർത്തനക്ഷമമാക്കിയിരിക്കുന്നു, കൂടാതെ സോഴ്സ് കോഡും.
ഓപ്ഷനുകൾ വേണ്ടി നിയന്ത്രിക്കുന്നു ഔട്ട്പ്
-o മനുഷ്യർക്ക് വായിക്കാൻ കഴിയുന്ന പ്രധാന ഔട്ട്പുട്ട് ഒരു ഫയലിലേക്ക് നയിക്കുക സ്ഥിരസ്ഥിതി stdout-ന് പകരം.
-A പ്രധാനപ്പെട്ട എല്ലാ ഹിറ്റുകളുടെയും ഒന്നിലധികം വിന്യാസം സംരക്ഷിക്കുക (തൃപ്തികരമായവ ഉൾപ്പെടുത്തൽ
പരിധി) ഫയലിലേക്ക് .
--tblout
കണ്ടെത്തിയ ഹിറ്റുകൾ സംഗ്രഹിക്കുന്ന ഒരു ലളിതമായ പട്ടിക (സ്പേസ്-ഡീലിമിറ്റഡ്) ഫയൽ ഒന്ന് ഉപയോഗിച്ച് സംരക്ഷിക്കുക
ഓരോ ഹിറ്റിലും ഡാറ്റ ലൈൻ. ഈ ഫയലിന്റെ ഫോർമാറ്റ് ഇൻഫെർണൽ ഉപയോക്തൃ ഗൈഡിൽ വിവരിച്ചിരിക്കുന്നു.
--ac പ്രൊഫൈലുകൾക്ക് ലഭ്യമായ പ്രധാന ഔട്ട്പുട്ടിൽ പേരുകൾക്ക് പകരം പ്രവേശനങ്ങൾ ഉപയോഗിക്കുക
കൂടാതെ/അല്ലെങ്കിൽ ക്രമങ്ങൾ.
--നൊഅലി
പ്രധാന ഔട്ട്പുട്ടിൽ നിന്ന് അലൈൻമെന്റ് വിഭാഗം ഒഴിവാക്കുക. ഇത് ഔട്ട്പുട്ട് ഗണ്യമായി കുറയ്ക്കും
വോളിയം.
--notextw
പ്രധാന ഔട്ട്പുട്ടിൽ ഓരോ വരിയുടെയും ദൈർഘ്യം അൺലിമിറ്റ് ചെയ്യുക. ഡിഫോൾട്ട് പരിധി 120 ആണ്
ഓരോ വരിയിലും പ്രതീകങ്ങൾ, ഇത് ടെർമിനലുകളിലും ഔട്ട്പുട്ട് വൃത്തിയായി പ്രദർശിപ്പിക്കാൻ സഹായിക്കുന്നു
എഡിറ്റർമാരിൽ, എന്നാൽ ടാർഗെറ്റ് പ്രൊഫൈൽ വിവരണ വരികൾ വെട്ടിച്ചുരുക്കാൻ കഴിയും.
--textw
പ്രധാന ഔട്ട്പുട്ടിന്റെ ലൈൻ ദൈർഘ്യ പരിധി ഇതിലേക്ക് സജ്ജമാക്കുക ഓരോ വരിയിലും പ്രതീകങ്ങൾ. സ്ഥിരസ്ഥിതിയാണ്
120.
--വാക്കുകൾ
പ്രധാന ഔട്ട്പുട്ടിൽ ഫിൽട്ടർ ഉൾപ്പെടെയുള്ള അധിക തിരയൽ പൈപ്പ്ലൈൻ സ്ഥിതിവിവരക്കണക്കുകൾ ഉൾപ്പെടുത്തുക
വെട്ടിച്ചുരുക്കിയ ഹിറ്റ് കണ്ടെത്തലിനും നിരസിച്ച എൻവലപ്പുകളുടെ എണ്ണത്തിനുമുള്ള അതിജീവന സ്ഥിതിവിവരക്കണക്കുകൾ
മാട്രിക്സ് വലുപ്പം ഓവർഫ്ലോകൾ കാരണം.
ഓപ്ഷനുകൾ നിയന്ത്രിക്കുന്നു റിപ്പോർട്ടുചെയ്യുന്നു ത്രെഷോൾഡ്സ്
ഔട്ട്പുട്ട് ഫയലുകളിൽ റിപ്പോർട്ട് ചെയ്യപ്പെടുന്ന ഹിറ്റുകൾ (പ്രധാന ഔട്ട്പുട്ട് കൂടാതെ
--tbout) സ്ഥിതിവിവരക്കണക്ക് പ്രാധാന്യം (ഇ-മൂല്യം) പ്രകാരം ഹിറ്റുകൾ റാങ്ക് ചെയ്യപ്പെടുന്നു. ഡിഫോൾട്ടായി, എല്ലാ ഹിറ്റുകളും
ഒരു ഇ-മൂല്യം <= 10 റിപ്പോർട്ട് ചെയ്യുന്നു. ഡിഫോൾട്ട് മാറ്റാൻ ഇനിപ്പറയുന്ന ഓപ്ഷനുകൾ നിങ്ങളെ അനുവദിക്കുന്നു
ഇ-വാല്യൂ റിപ്പോർട്ടിംഗ് ത്രെഷോൾഡുകൾ, അല്ലെങ്കിൽ പകരം ബിറ്റ് സ്കോർ ത്രെഷോൾഡുകൾ ഉപയോഗിക്കുക.
-E ഓരോ ടാർഗെറ്റ് ഔട്ട്പുട്ടിൽ, <= എന്ന ഇ-മൂല്യമുള്ള ടാർഗെറ്റ് സീക്വൻസുകൾ റിപ്പോർട്ട് ചെയ്യുക . ദി
സ്ഥിരസ്ഥിതി 10.0 ആണ്, അതായത് ശരാശരി 10 തെറ്റായ പോസിറ്റീവുകൾ റിപ്പോർട്ട് ചെയ്യപ്പെടും
ഓരോ ചോദ്യത്തിനും, അതിനാൽ നിങ്ങൾക്ക് ശബ്ദത്തിന്റെ മുകൾഭാഗം കാണാനും അതാണോ എന്ന് സ്വയം തീരുമാനിക്കാനും കഴിയും
ശരിക്കും ശബ്ദം.
-T ഇ-മൂല്യത്തിൽ ഓരോ മുഖ്യമന്ത്രിക്കും ഔട്ട്പുട്ട് ത്രെഷോൾഡ് ചെയ്യുന്നതിനുപകരം, a ഉപയോഗിച്ച് ടാർഗെറ്റ് സീക്വൻസുകൾ റിപ്പോർട്ട് ചെയ്യുക
ബിറ്റ് സ്കോർ >= .
ഓപ്ഷനുകൾ വേണ്ടി ഉൾപ്പെടുത്തൽ ത്രെഷോൾഡ്സ്
ഉൾപ്പെടുത്തൽ പരിധികൾ റിപ്പോർട്ടിംഗ് പരിധികളേക്കാൾ കർശനമാണ്. ഉൾപ്പെടുത്തൽ പരിധി നിയന്ത്രണം
ഒരു ഔട്ട്പുട്ട് വിന്യാസത്തിൽ ഉൾപ്പെടുത്താൻ കഴിയുന്നത്ര വിശ്വസനീയമായി കണക്കാക്കപ്പെടുന്ന ഹിറ്റുകൾ അല്ലെങ്കിൽ
സാധ്യമായ ഒരു തുടർന്നുള്ള തിരയൽ റൗണ്ടിൽ, അല്ലെങ്കിൽ വിപരീതമായി പ്രാധാന്യമുള്ളതായി ("!") അടയാളപ്പെടുത്തി
ഹിറ്റ് ഔട്ട്പുട്ടിൽ സംശയാസ്പദമായ ("?").
--incE
<= എന്ന ഇ-മൂല്യം ഉപയോഗിക്കുക ഹിറ്റ് ഉൾപ്പെടുത്തൽ ത്രെഷോൾഡ് ആയി. സ്ഥിരസ്ഥിതി 0.01 ആണ്,
അതായത്, ശരാശരി 1-ൽ ഒരു തെറ്റായ പോസിറ്റീവ് പ്രതീക്ഷിക്കാം
വ്യത്യസ്ത അന്വേഷണ ക്രമങ്ങളുള്ള തിരയലുകൾ.
--incT
ഇൻക്ലൂഷൻ ത്രെഷോൾഡ് സജ്ജീകരിക്കുന്നതിന് ഇ-മൂല്യങ്ങൾ ഉപയോഗിക്കുന്നതിന് പകരം കുറച്ച് ഉപയോഗിക്കുക
സ്കോർ >= ഹിറ്റ് ഉൾപ്പെടുത്തൽ ത്രെഷോൾഡ് ആയി. ഡിഫോൾട്ടായി ഈ ഓപ്ഷൻ സജ്ജീകരിച്ചിട്ടില്ല.
ഓപ്ഷനുകൾ വേണ്ടി മോഡൽ-നിർദ്ദിഷ്ടം സ്കോർ ത്രെഷോൾഡിംഗ്
ക്യൂറേറ്റ് ചെയ്ത CM ഡാറ്റാബേസുകൾ ഓരോ മുഖ്യമന്ത്രിക്കും നിർദ്ദിഷ്ട ബിറ്റ് സ്കോർ ത്രെഷോൾഡുകൾ നിർവചിച്ചേക്കാം.
സ്റ്റാറ്റിസ്റ്റിക്കൽ പ്രാധാന്യത്തെ മാത്രം അടിസ്ഥാനമാക്കിയുള്ള പരിധി.
ഈ ഓപ്ഷനുകൾ ഉപയോഗിക്കുന്നതിന്, പ്രൊഫൈലിൽ ഉചിതമായ (GA, TC, കൂടാതെ/അല്ലെങ്കിൽ NC) അടങ്ങിയിരിക്കണം.
ഓപ്ഷണൽ സ്കോർ ത്രെഷോൾഡ് വ്യാഖ്യാനം; ഇത് എടുത്തതാണ് cmbuild സ്റ്റോക്ക്ഹോം ഫോർമാറ്റിൽ നിന്ന്
വിന്യാസ ഫയലുകൾ. ഓരോ ത്രെഷോൾഡിംഗ് ഓപ്ഷനും സ്കോർ ഉണ്ട് ബിറ്റുകൾ, പോലെ പ്രവർത്തിക്കുന്നു -T
--incT ഓരോ മോഡലിന്റെയും ക്യൂറേറ്റഡ് ത്രെഷോൾഡുകൾ ഉപയോഗിച്ച് പ്രത്യേകമായി പ്രയോഗിച്ചു.
--കട്ട്_ഗാ
ഹിറ്റ് റിപ്പോർട്ടിംഗും ഉൾപ്പെടുത്തലും സജ്ജീകരിക്കാൻ മോഡലിലെ GA (ശേഖരണം) ബിറ്റ് സ്കോറുകൾ ഉപയോഗിക്കുക
പരിധികൾ. GA ത്രെഷോൾഡുകൾ സാധാരണയായി വിശ്വസനീയമായ ക്യൂറേറ്റ് ആയി കണക്കാക്കപ്പെടുന്നു
കുടുംബ അംഗത്വം നിർവചിക്കുന്ന പരിധി; ഉദാഹരണത്തിന്, Rfam-ൽ, ഈ പരിധികൾ
Rfam സീഡ് ഉപയോഗിച്ചുള്ള തിരയലുകളെ അടിസ്ഥാനമാക്കി Rfam ഫുൾ അലൈൻമെന്റിൽ എന്താണ് ഉൾപ്പെടുത്തേണ്ടതെന്ന് നിർവചിക്കുക
മോഡലുകൾ.
--cut_nc
ഹിറ്റ് റിപ്പോർട്ടിംഗ് സജ്ജീകരിക്കാൻ മോഡലിൽ NC (നോയിസ് കട്ട്ഓഫ്) ബിറ്റ് സ്കോർ ത്രെഷോൾഡുകൾ ഉപയോഗിക്കുക
ഉൾപ്പെടുത്തൽ പരിധികളും. NC ത്രെഷോൾഡുകൾ സാധാരണയായി സ്കോർ ആയി കണക്കാക്കപ്പെടുന്നു
അറിയപ്പെടുന്ന തെറ്റായ പോസിറ്റീവ് ഏറ്റവും കൂടുതൽ സ്കോർ.
--കട്ട്_ടിസി
ഹിറ്റ് റിപ്പോർട്ടിംഗ് സജ്ജീകരിക്കാൻ മോഡലിലെ TC (ട്രസ്റ്റഡ് കട്ട്ഓഫ്) ബിറ്റ് സ്കോർ ത്രെഷോൾഡുകൾ ഉപയോഗിക്കുക
ഉൾപ്പെടുത്തൽ പരിധികളും. TC ത്രെഷോൾഡുകൾ സാധാരണയായി സ്കോർ ആയി കണക്കാക്കപ്പെടുന്നു
അറിയപ്പെടുന്ന എല്ലാ തെറ്റായ പോസിറ്റീവുകളേക്കാളും ഏറ്റവും കുറഞ്ഞ സ്കോറുള്ള യഥാർത്ഥ പോസിറ്റീവ്.
ഓപ്ഷനുകൾ നിയന്ത്രിക്കുന്നു ദി ACCELERATION പൈപ്പ്ലൈൻ
ആറ് ഘട്ടങ്ങളുള്ള ഫിൽട്ടർ പൈപ്പ്ലൈനിൽ നരക 1.1 തിരയലുകൾ ത്വരിതപ്പെടുത്തുന്നു. ആദ്യത്തെ അഞ്ച്
ആറാമത്തെ CM CYK ലേക്ക് കൈമാറുന്ന എൻവലപ്പുകൾ നിർവചിക്കുന്നതിന് ഘട്ടങ്ങൾ ഒരു പ്രൊഫൈൽ HMM ഉപയോഗിക്കുന്നു
ഫിൽട്ടർ. എല്ലാ ഫിൽട്ടറുകളെയും അതിജീവിക്കുന്ന എല്ലാ എൻവലപ്പുകളും CM ഉപയോഗിച്ച് അന്തിമ സ്കോറുകൾ അസൈൻ ചെയ്യുന്നു
ഇൻസൈഡ് അൽഗോരിതം. (കൂടുതൽ വിവരങ്ങൾക്ക് ഉപയോക്തൃ ഗൈഡ് കാണുക.)
പ്രൊഫൈൽ HMM ഫിൽട്ടർ നിർമ്മിച്ചിരിക്കുന്നത് cmbuild പ്രോഗ്രാമിൽ സംഭരിച്ചിരിക്കുന്നു .
തുടർന്നുള്ള ഓരോ ഫിൽട്ടറും മുമ്പത്തേതിനേക്കാൾ വേഗത കുറവാണ്, എന്നാൽ അതിലും മികച്ചതാണ്
ഉയർന്ന സ്കോറിംഗ് സിഎം ഹിറ്റുകൾ ഉൾപ്പെട്ടേക്കാവുന്ന തുടർച്ചകളും ചെയ്യുന്നവയും തമ്മിൽ വിവേചനം കാണിക്കുന്നു
അല്ല. ആദ്യത്തെ മൂന്ന് HMM ഫിൽട്ടർ ഘട്ടങ്ങൾ HMMER3-ൽ ഉപയോഗിച്ചതിന് സമാനമാണ്. ഘട്ടം 1 (F1)
ലോംഗ് സീക്വൻസുകൾക്കായി പരിഷ്കരിച്ച ലോക്കൽ HMM SSV ഫിൽട്ടർ ആണ്. ഘട്ടം 2 (F2) എന്നത് പ്രാദേശിക എച്ച്എംഎം ആണ്
വിറ്റെർബി ഫിൽട്ടർ. ഘട്ടം 3 (F3) പ്രാദേശിക എച്ച്എംഎം ഫോർവേഡ് ഫിൽട്ടറാണ്. ആദ്യത്തെ മൂന്നെണ്ണത്തിൽ ഓരോന്നും
ഘട്ടങ്ങൾ ലോക്കൽ മോഡിൽ പ്രൊഫൈൽ HMM ഉപയോഗിക്കുന്നു, ഇത് ഒരു ടാർഗെറ്റ് സബ്സെക്വൻസിനെ വിന്യസിക്കാൻ അനുവദിക്കുന്നു
HMM-ന്റെ ഏതെങ്കിലും പ്രദേശം. ഘട്ടം 4 (F4) ഒരു ഗ്ലോക്കൽ HMM ഫിൽട്ടറാണ്, ഇതിന് ഒരു ലക്ഷ്യം ആവശ്യമാണ്
മുഴുവൻ നീളമുള്ള പ്രൊഫൈലിലേക്ക് വിന്യസിക്കുന്നതിനുള്ള തുടർച്ചയായി HMM. ഘട്ടം 5 (F5) ആഗോള എച്ച്എംഎം ആണ്
എൻവലപ്പ് ഡെഫനിഷൻ ഫിൽട്ടർ, ഇത് നിർവചിക്കാൻ HMMER3-ന്റെ ഡൊമെയ്ൻ ഐഡന്റിഫിക്കേഷൻ ഹ്യൂർസിറ്റിക്സ് ഉപയോഗിക്കുന്നു
എൻവലപ്പ് അതിരുകൾ. 2 മുതൽ 5 വരെയുള്ള ഓരോ ഘട്ടത്തിനും ശേഷം ഒരു ബയസ് ഫിൽട്ടർ ഘട്ടം (F2b, F3b, F4b, കൂടാതെ
പക്ഷപാതം കാരണം ഫിൽട്ടർ കടന്നതായി തോന്നുന്ന സീക്വൻസുകൾ നീക്കം ചെയ്യാൻ F5b) ഉപയോഗിക്കുന്നു
രചന മാത്രം. F1 മുതൽ F5b വരെയുള്ള ഘട്ടങ്ങളെ അതിജീവിക്കുന്ന എല്ലാ എൻവലപ്പുകളും പിന്നീട് കൈമാറും
പ്രാദേശിക CM CYK ഫിൽട്ടർ. CYK ഫിൽട്ടർ ഒരു HMM-ൽ നിന്ന് ഉരുത്തിരിഞ്ഞ നിയന്ത്രണങ്ങൾ (ബാൻഡുകൾ) ഉപയോഗിക്കുന്നു
ആവശ്യമായ കണക്കുകൂട്ടലുകളുടെ എണ്ണം കുറയ്ക്കുന്നതിനും സമയം ലാഭിക്കുന്നതിനും എൻവലപ്പിന്റെ വിന്യാസം.
CYK കടന്നുപോകുന്ന എല്ലാ കവറുകളും വീണ്ടും HMM ഉപയോഗിച്ച് ലോക്കൽ CM ഇൻസൈഡ് അൽഗോരിതം ഉപയോഗിച്ച് സ്കോർ ചെയ്യുന്നു
ത്വരിതപ്പെടുത്തുന്നതിനുള്ള ബാൻഡുകൾ.
ഒരു തുടർനടപടിക്ക് ആവശ്യമായ ഏറ്റവും കുറഞ്ഞ സ്കോർ നിർവചിക്കുന്ന ഡിഫോൾട്ട് ഫിൽട്ടർ ത്രെഷോൾഡുകൾ
ഓരോ ഘട്ടവും അതിജീവിക്കുക എന്നത് ഡാറ്റാബേസിന്റെ വലുപ്പത്തെ അടിസ്ഥാനമാക്കിയാണ് (അല്ലെങ്കിൽ വലിപ്പം
വ്യക്തമാക്കിയ മെഗാബേസുകളിൽ (Mb). -Z or --FZ ഓപ്ഷനുകൾ). വലിയ ഡാറ്റാബേസുകൾക്കായി,
ഫിൽട്ടറുകൾ കൂടുതൽ കർശനമായതിനാൽ കൂടുതൽ ത്വരിതപ്പെടുത്തലിലേക്ക് നയിക്കുന്നു, എന്നാൽ ഇത് കൂടുതൽ നഷ്ടമാകാൻ സാധ്യതയുണ്ട്
സംവേദനക്ഷമത. വലിയ ഡാറ്റാബേസുകൾക്ക്, ഹിറ്റുകൾക്ക് ഉയർന്ന സ്കോറുകൾ ഉണ്ടായിരിക്കണം എന്നതാണ് യുക്തി
സ്ഥിതിവിവരക്കണക്ക് പ്രാധാന്യം നേടുക, അതിനാൽ കുറഞ്ഞ സ്കോറിംഗ് നീക്കം ചെയ്യുന്ന കർശനമായ ഫിൽട്ടറിംഗ്
നിസ്സാര ഹിറ്റുകൾ സ്വീകാര്യമാണ്.
സാധ്യമായ എല്ലാ സെർച്ച് സ്പേസ് വലുപ്പങ്ങൾക്കും എല്ലാ ഫിൽട്ടർ ഘട്ടങ്ങൾക്കുമുള്ള പി-വാല്യൂ ത്രെഷോൾഡുകൾ
അടുത്തതായി പട്ടികപ്പെടുത്തിയിരിക്കുന്നു. (0.01 ന്റെ പി-മൂല്യം പരിധി അർത്ഥമാക്കുന്നത് ഉയർന്ന സ്കോറിംഗിന്റെ ഏകദേശം 1%
nonhomologous subsequence ഫിൽട്ടർ കടന്നുപോകുമെന്ന് പ്രതീക്ഷിക്കുന്നു.) Z എന്നത് സംഖ്യയായി നിർവചിച്ചിരിക്കുന്നു
സമ്പൂർണ്ണ ടാർഗെറ്റ് സീക്വൻസ് ഫയൽ ടൈംസ് 2 ൽ ന്യൂക്ലിയോടൈഡുകൾ, കാരണം രണ്ട് സ്ട്രോണ്ടുകളും ആയിരിക്കും
ഓരോ മോഡലിലും തിരഞ്ഞു.
Z 2 Mb-ൽ കുറവാണെങ്കിൽ: F1 0.35 ആണ്; F2, F2b എന്നിവ ഓഫാണ്; F3, F3b, F4, F4b, F5 എന്നിവ 0.02 ആണ്;
F6 0.0001 ആണ്.
Z 2 Mb നും 20 Mb നും ഇടയിലാണെങ്കിൽ: F1 0.35 ആണ്; F2, F2b എന്നിവ ഓഫാണ്; F3, F3b, F4, F4b, F5
0.005 ആണ്; F6 0.0001 ആണ്.
Z 20 Mb നും 200 Mb നും ഇടയിലാണെങ്കിൽ: F1 0.35 ആണ്; F2, F2b എന്നിവ 0.15 ആണ്; F3, F3b, F4, F4b, F5
0.003 ആണ്; F6 0.0001 ആണ്.
Z 200 Mb നും 2 Gb നും ഇടയിലാണെങ്കിൽ: F1 0.15 ആണ്; F2, F2b എന്നിവ 0.15 ആണ്; F3, F3b, F4, F4b, F5,
കൂടാതെ F5b 0.0008 ആണ്; കൂടാതെ F6 0.0001 ആണ്.
Z 2 Gb നും 20 Gb നും ഇടയിലാണെങ്കിൽ: F1 0.15 ആണ്; F2, F2b എന്നിവ 0.15 ആണ്; F3, F3b, F4, F4b, F5, ഒപ്പം
F5b 0.0002 ആണ്; കൂടാതെ F6 0.0001 ആണ്.
Z 20 Gb-ൽ കൂടുതലാണെങ്കിൽ: F1 0.06 ആണ്; F2, F2b എന്നിവ 0.02 ആണ്; F3, F3b, F4, F4b, F5, F5b
0.0002 ആകുന്നു; കൂടാതെ F6 0.0001 ആണ്.
ഇന്റേണൽ ബെഞ്ച്മാർക്കിലെ പ്രകടനത്തെ അടിസ്ഥാനമാക്കിയാണ് ഈ പരിധി തിരഞ്ഞെടുത്തത്
സാധ്യമായ വ്യത്യസ്ത ക്രമീകരണങ്ങൾ.
പൊതുവായ ഫിൽട്ടറിംഗ് നില നിയന്ത്രിക്കുന്നതിന് അഞ്ച് ഓപ്ഷനുകൾ ഉണ്ട്. ഈ ഓപ്ഷനുകൾ, ഇൻ
ഏറ്റവും കർശനമായ (മന്ദഗതിയിലുള്ളതും എന്നാൽ ഏറ്റവും സെൻസിറ്റീവായതുമായ) മുതൽ ഏറ്റവും കർശനമായ (വേഗമേറിയതും എന്നാൽ ഏറ്റവും കുറഞ്ഞതുമായ) ക്രമം
സെൻസിറ്റീവ്): --പരമാവധി, --നമ്മും, --മധ്യം, --ഡിഫോൾട്ട്, (ഇതാണ് സ്ഥിരസ്ഥിതി ക്രമീകരണം), --rfam. ഒപ്പം
--ഹമ്മൺലി. കൂടെ --സ്ഥിരസ്ഥിതി ഫിൽട്ടർ ത്രെഷോൾഡുകൾ ഡാറ്റാബേസ് വലുപ്പത്തെ ആശ്രയിച്ചിരിക്കും. കാണുക
കൂടുതൽ വിവരങ്ങൾക്ക് ചുവടെയുള്ള ഈ വ്യക്തിഗത ഓപ്ഷനുകളിൽ ഓരോന്നിന്റെയും വിശദീകരണം.
കൂടാതെ, ഒരു വിദഗ്ദ്ധനായ ഉപയോക്താവിന് ഓരോ ഫിൽട്ടർ സ്റ്റേജ് സ്കോർ ത്രെഷോൾഡും കൃത്യമായി നിയന്ത്രിക്കാനാകും
The --F1, --F1b, --F2, --F2b, --F3, --F3b, --F4, --F4b, --F5, --F5b, ഒപ്പം --F6 ഓപ്ഷനുകൾ. പോലെ
അതോടൊപ്പം ഓരോ ഘട്ടവും ഓണാക്കുകയോ ഓഫാക്കുകയോ ചെയ്യുക --noF1, --doF1b, --noF2, --noF2b, --noF3,
--noF3b, --noF4, --noF4b, --noF5, ഒപ്പം --noF6. ഓപ്ഷനുകൾ. ഈ ഓപ്ഷനുകൾ മാത്രം പ്രദർശിപ്പിക്കും
അങ്ങനെയാണെങ്കിൽ --ഡെവലപ്പ് പ്രദർശിപ്പിച്ച ഓപ്ഷനുകളുടെ എണ്ണം നിലനിർത്താൻ ഓപ്ഷൻ ഉപയോഗിക്കുന്നു -h
ന്യായമായതും, ഒരു ചെറിയ ന്യൂനപക്ഷ ഉപയോക്താക്കൾക്ക് മാത്രമേ അവ ഉപയോഗപ്രദമാകൂ എന്ന് പ്രതീക്ഷിക്കപ്പെടുന്നതിനാലും.
ഒരു പ്രത്യേക സാഹചര്യത്തിൽ, ഏത് മോഡലുകൾക്കും പൂജ്യം ബേസ്പെയർ ഉള്ളവ, പ്രൊഫൈൽ HMM
മുഖ്യമന്ത്രി തിരയലുകൾക്ക് പകരം തിരയലുകൾ നടത്തുന്നു. എച്ച്എംഎം അൽഗോരിതം CM-നേക്കാൾ കാര്യക്ഷമമാണ്
അൽഗരിതങ്ങൾ, കൂടാതെ CM അൽഗോരിതങ്ങളുടെ പ്രയോജനം ദ്വിതീയമല്ലാത്ത മോഡലുകൾക്ക് നഷ്ടമാകും
ഘടന (സീറോ ബേസ്പെയറുകൾ). ഈ പ്രൊഫൈൽ HMM തിരയലുകൾ കൂടുതൽ വേഗത്തിൽ പ്രവർത്തിക്കും
മുഖ്യമന്ത്രി അന്വേഷിക്കുന്നു. ഉപയോഗിച്ച് നിങ്ങൾക്ക് HMM-മാത്രം തിരയലുകൾ നിർബന്ധിക്കാം --ഹമ്മൺലി ഓപ്ഷൻ. കൂടുതൽ
HMM-മാത്രം തിരയലുകളെ കുറിച്ചുള്ള വിവരങ്ങൾ ഇതിന്റെ വിവരണം കാണുക --ഹമ്മൺലി ചുവടെയുള്ള ഓപ്ഷൻ, ഒപ്പം
ഉപയോക്തൃ ഗൈഡ്.
--പരമാവധി എല്ലാ ഫിൽട്ടറുകളും ഓഫാക്കുക, എല്ലാ മുഴുനീള ടാർഗെറ്റിലും നോൺ-ബാൻഡ് ഇൻസൈഡ് പ്രവർത്തിപ്പിക്കുക
ക്രമം. ഇത് വേഗതയിൽ വളരെ വലിയ ചിലവിൽ ഒരു പരിധിവരെ സംവേദനക്ഷമത വർദ്ധിപ്പിക്കുന്നു.
--nohmm
എല്ലാ HMM ഫിൽട്ടർ ഘട്ടങ്ങളും ഓഫാക്കുക (F1 മുതൽ F5b വരെ). CYK ഫിൽട്ടർ, QDB-കൾ ഉപയോഗിക്കുന്നു
എല്ലാ മുഴുനീള ടാർഗെറ്റ് സീക്വൻസിലും പ്രവർത്തിപ്പിക്കുകയും പി-വാല്യൂ ത്രെഷോൾഡ് നടപ്പിലാക്കുകയും ചെയ്യും
0.0001. CYK-നെ അതിജീവിക്കുന്ന ഓരോ തുടർച്ചയും ഇൻസൈഡിലേക്ക് കൈമാറും, അത് ചെയ്യും
QDB-കളും ഉപയോഗിക്കുക (എന്നാൽ ഒരു അയഞ്ഞ സെറ്റ്). ഇത് ഒരു പരിധിവരെ സംവേദനക്ഷമത വർദ്ധിപ്പിക്കുന്നു
വേഗതയിൽ വലിയ ചിലവ്.
--മധ്യം HMM SSV, Viterbi ഫിൽട്ടർ ഘട്ടങ്ങൾ (F1 മുതൽ F2b വരെ) ഓഫാക്കുക. ശേഷിക്കുന്ന HMM സജ്ജീകരിക്കുക
ഫിൽട്ടർ ത്രെഷോൾഡുകൾ (F3 മുതൽ F5b വരെ) ഡിഫോൾട്ടായി 0.02 ലേക്ക്, എന്നാൽ ഇതിലേക്ക് മാറ്റാവുന്നതാണ് കൂടെ
--Fmid ക്രമം. ഇത് വേഗതയിൽ കാര്യമായ ചിലവിൽ സംവേദനക്ഷമത വർദ്ധിപ്പിച്ചേക്കാം.
--സ്ഥിരസ്ഥിതി
ഡിഫോൾട്ട് ഫിൽട്ടറിംഗ് തന്ത്രം ഉപയോഗിക്കുക. ഈ ഓപ്ഷൻ ഡിഫോൾട്ടായി ഓണാണ്. ഫിൽട്ടർ
ഡാറ്റാബേസ് വലുപ്പത്തെ അടിസ്ഥാനമാക്കിയാണ് പരിധി നിശ്ചയിക്കുന്നത്.
--rfam വലിയ ഡാറ്റാബേസുകൾക്കായി (20 Gb-ൽ കൂടുതൽ) രൂപപ്പെടുത്തിയിരിക്കുന്ന ഒരു കർശനമായ ഫിൽട്ടറിംഗ് തന്ത്രം ഉപയോഗിക്കുക. ഈ
സംവേദനക്ഷമതയ്ക്കുള്ള സാധ്യതയുള്ള ചെലവിൽ തിരയൽ ത്വരിതപ്പെടുത്തും. അതിന് ഇല്ലായിരിക്കും
ഡാറ്റാബേസ് 20 Gb-ൽ കൂടുതലാണെങ്കിൽ പ്രഭാവം.
--ഹമ്മൺലി
തിരയലുകൾക്കായി ഫിൽട്ടർ പ്രൊഫൈൽ HMM മാത്രം ഉപയോഗിക്കുക, CM ഉപയോഗിക്കരുത്. ഫിൽട്ടർ മാത്രം
F1 മുതൽ F3 വരെയുള്ള ഘട്ടങ്ങൾ കർശനമായ പി-മൂല്യം പരിധികൾ ഉപയോഗിച്ച് (0.02 എന്നതിന്
F1, F0.001-ന് 2, F0.00001-ന് 3). കൂടാതെ ഒരു ബയസ് കോമ്പോസിഷൻ ഫിൽട്ടർ ആണ്
F1 ഘട്ടത്തിന് ശേഷം ഉപയോഗിക്കുന്നു (P=0.02 അതിജീവന പരിധിയിൽ). അതിജീവിക്കുന്ന ഏതൊരു ഹിറ്റും
എല്ലാ ഘട്ടങ്ങളിലും, റിപ്പോർട്ടിംഗ് ത്രെഷോൾഡിന് മുകളിലുള്ള ഒരു HMM ഇ-മൂല്യം അല്ലെങ്കിൽ ബിറ്റ് സ്കോർ ഉണ്ട്
ഔട്ട്പുട്ട് ആകുക. ഉപയോക്താവിന് HMM-മാത്രം ഫിൽട്ടർ ത്രെഷോൾഡുകളും ഓപ്ഷനുകളും മാറ്റാൻ കഴിയും
--hmmF1, --hmmF2, --hmmF3, --ഹമ്മോബിയാസ്, --hmmnonull2, ഒപ്പം --ഹ്മ്മ്മാക്സ്. സ്ഥിരസ്ഥിതിയായി,
സീറോ ബേസ്പെയറുകൾ ഉള്ള ഏത് മോഡലിനായുള്ള തിരയലും HMM-മാത്രം മോഡിൽ പ്രവർത്തിക്കും. ഇതിന് കഴിയും
ഓഫാക്കി, ഈ മോഡലുകൾക്കായി മുഖ്യമന്ത്രി തിരയാൻ നിർബന്ധിതരാകുന്നു --നാമം ഓപ്ഷൻ.
എങ്കിൽ മാത്രമേ ഈ ഓപ്ഷനുകൾ പ്രദർശിപ്പിക്കുകയുള്ളൂ --ഡെവലപ്പ് ഓപ്ഷൻ ഉപയോഗിക്കുന്നു.
--FZ
ഡാറ്റാബേസ് ആണെങ്കിൽ ഉപയോഗിക്കുന്ന ഡിഫോൾട്ടുകളായി ഫിൽട്ടർ ത്രെഷോൾഡുകൾ സജ്ജമാക്കുക മെഗാബേസുകൾ (Mb).
ഉപയോഗിച്ചാൽ 20000 (20 Gb)-ൽ കൂടുതലുള്ള ഈ ഓപ്ഷന്റെ അതേ ഫലമുണ്ട്
--rfam.
--Fmid
കൂടെ --മധ്യം ഓപ്ഷൻ HMM ഫിൽട്ടർ ത്രെഷോൾഡുകൾ (F3 മുതൽ F5b വരെ) ആയി സജ്ജമാക്കുക . By
സ്ഥിരസ്ഥിതി, ആണ്.
മറ്റുള്ളവ ഓപ്ഷനുകൾ
--നടക്കുന്നില്ല
വെട്ടിച്ചുരുക്കിയ ഹിറ്റ് കണ്ടെത്തൽ ഓഫാക്കുക.
--anytruc
ഒരു ടാർഗെറ്റ് ശ്രേണിയിൽ ഏത് സ്ഥാനത്തും ആരംഭിക്കാനും അവസാനിപ്പിക്കാനും വെട്ടിച്ചുരുക്കിയ ഹിറ്റുകൾ അനുവദിക്കുക. എഴുതിയത്
ഡിഫോൾട്ട്, 5' വെട്ടിച്ചുരുക്കിയ ഹിറ്റുകളിൽ അവയുടെ ലക്ഷ്യ ശ്രേണിയുടെ ആദ്യ അവശിഷ്ടം ഉൾപ്പെടുത്തണം
കൂടാതെ 3' വെട്ടിച്ചുരുക്കിയ ഹിറ്റുകളിൽ അവയുടെ ടാർഗെറ്റ് സീക്വൻസിന്റെ അവസാന അവശിഷ്ടം ഉൾപ്പെടുത്തണം. കൂടെ
ഈ ഓപ്ഷൻ ആരംഭം വരെ നീളുന്ന കുറച്ച് ഫുൾ ലെങ്ത് ഹിറ്റുകൾ നിങ്ങൾ നിരീക്ഷിച്ചേക്കാം
മുഖ്യമന്ത്രി ചോദ്യത്തിന്റെ അവസാനം.
--nonull3
പക്ഷപാതപരമായ രചനയ്ക്കായി null3 CM സ്കോർ തിരുത്തലുകൾ ഓഫാക്കുക. ഈ തിരുത്തലാണ്
HMM ഫിൽട്ടർ ഘട്ടങ്ങളിൽ ഉപയോഗിച്ചിട്ടില്ല.
--mxsize
പരമാവധി അനുവദനീയമായ CM DP മാട്രിക്സ് വലുപ്പം സജ്ജമാക്കുക മെഗാബൈറ്റുകൾ. സ്ഥിരസ്ഥിതിയായി ഈ വലുപ്പം
128 Mb ആണ്. ഇത് ഭൂരിഭാഗം തിരയലുകൾക്കും മതിയായതായിരിക്കണം,
പ്രത്യേകിച്ച് ചെറിയ മോഡലുകൾക്കൊപ്പം. എങ്കിൽ സെമീ സെർച്ച് CYK-ൽ ഒരു എൻവലപ്പ് കണ്ടുമുട്ടുന്നു അല്ലെങ്കിൽ
ഒരു വലിയ മാട്രിക്സ് ആവശ്യമുള്ള ഘട്ടത്തിനുള്ളിൽ, എൻവലപ്പ് ഡിസ്കൗണ്ട് നൽകും
പരിഗണന. ഈ സ്വഭാവം ചെലവേറിയത് തടയുന്ന ഒരു അധിക ഫിൽട്ടർ പോലെയാണ്
(മന്ദഗതിയിലുള്ള) CM DP കണക്കുകൂട്ടലുകൾ, എന്നാൽ സംവേദനക്ഷമതയ്ക്ക് സാധ്യതയുള്ള ചിലവിൽ. എങ്കിൽ ശ്രദ്ധിക്കുക
സെമീ സെർച്ച് പ്രവർത്തിപ്പിക്കപ്പെടുന്നു ഒരു മൾട്ടികോർ മെഷീനിൽ ഒന്നിലധികം ത്രെഡുകൾ പിന്നീട് ഓരോന്നും
ത്രെഡിന് വലുപ്പം വരെ അനുവദിച്ച മാട്രിക്സ് ഉണ്ടായിരിക്കാം ഏത് സമയത്തും എം.ബി.
--smxsize
അനുവദനീയമായ പരമാവധി CM തിരയൽ ഡിപി മാട്രിക്സ് വലുപ്പം സജ്ജമാക്കുക മെഗാബൈറ്റുകൾ. സ്ഥിരസ്ഥിതിയായി
ഈ വലിപ്പം 128 Mb ആണ്. മുഖ്യമന്ത്രി എച്ച്എംഎം ഉപയോഗിക്കുന്നില്ലെങ്കിൽ മാത്രമേ ഈ ഓപ്ഷൻ പ്രസക്തമാകൂ
ബാൻഡഡ് മെട്രിക്സ്, അതായത് --പരമാവധി, --നമ്മും, --qdb, --fqdb, --ബന്ധമില്ലാത്ത, or
--fnonbanded ഓപ്ഷനുകളും ഉപയോഗിക്കുന്നു. എങ്കിൽ ശ്രദ്ധിക്കുക സെമീ സെർച്ച് പ്രവർത്തിപ്പിക്കപ്പെടുന്നു
ഒരു മൾട്ടികോർ മെഷീനിൽ ഒന്നിലധികം ത്രെഡുകൾ പിന്നീട് ഓരോ ത്രെഡിനും അനുവദിച്ചിട്ടുണ്ടാകും
വലിപ്പം വരെയുള്ള മാട്രിക്സ് ഏത് സമയത്തും എം.ബി.
--സൈക്ക് എല്ലാ ഹിറ്റുകളുടെയും അന്തിമ സ്കോർ നിർണ്ണയിക്കാൻ, അകത്തല്ല, CYK അൽഗോരിതം ഉപയോഗിക്കുക.
--acyk ഹിറ്റുകൾ വിന്യസിക്കാൻ CYK അൽഗോരിതം ഉപയോഗിക്കുക. ഡിഫോൾട്ടായി, Durbin/Holmes ഒപ്റ്റിമൽ കൃത്യത
അൽഗോരിതം ഉപയോഗിക്കുന്നു, ഇത് പ്രതീക്ഷിക്കുന്ന കൃത്യത പരമാവധി വർദ്ധിപ്പിക്കുന്ന വിന്യാസം കണ്ടെത്തുന്നു
വിന്യസിച്ച എല്ലാ അവശിഷ്ടങ്ങളുടെയും.
--wcx
ഓരോ മുഖ്യമന്ത്രിക്കും, ഒരു ഹിറ്റിന്റെ പ്രതീക്ഷിക്കുന്ന പരമാവധി ദൈർഘ്യമായ W പാരാമീറ്റർ സജ്ജമാക്കുക
മോഡലിന്റെ സമവായ ദൈർഘ്യത്തിന്റെ ഇരട്ടി. സ്ഥിരസ്ഥിതിയായി, W പാരാമീറ്റർ ഇതിൽ നിന്ന് വായിക്കുന്നു
CM ഫയൽ, മോഡലിന്റെ പരിവർത്തന സാധ്യതകളെ അടിസ്ഥാനമാക്കി കണക്കാക്കിയതാണ്
by cmbuild. ഒരു മോഡൽ ഉപയോഗിക്കുന്ന ഡിഫോൾട്ട് W എന്താണെന്ന് നിങ്ങൾക്ക് കണ്ടെത്താനാകും cmstat. ഈ
പലയിടത്തും ഫിൽട്ടറിംഗ് പൈപ്പ്ലൈനിനെ ബാധിക്കുന്നതിനാൽ ഓപ്ഷൻ ജാഗ്രതയോടെ ഉപയോഗിക്കണം
അവ്യക്തമായ വഴികളിൽ വിവിധ ഘട്ടങ്ങൾ. വിദഗ്ദ്ധരായ ഉപയോക്താക്കൾക്ക് മാത്രമേ ഇത് ശുപാർശ ചെയ്യൂ
നിർമ്മിക്കാൻ ഉപയോഗിക്കുന്ന ഏതെങ്കിലും ഹോമോലോഗുകളേക്കാൾ വളരെ ദൈർഘ്യമേറിയ ഹിറ്റുകൾക്കായി തിരയുന്നു
മോഡൽ ഇൻ സെന്റീമീറ്റർ ബിൽഡ്, ഉദാ: വലിയ ഇൻട്രോണുകളോ മറ്റ് വലിയ ഇൻസെർഷനുകളോ ഉള്ളവ. ഈ
എന്നതുമായി സംയോജിപ്പിച്ച് ഓപ്ഷൻ ഉപയോഗിക്കാൻ കഴിയില്ല --നമ്മും, --fqdb or --qdb ഓപ്ഷനുകൾ
കാരണം അത്തരം സന്ദർഭങ്ങളിൽ W എന്നത് അന്വേഷണ-ആശ്രിത ബാൻഡുകളാൽ പരിമിതപ്പെടുത്തിയിരിക്കുന്നു.
--ടൂപോൺലി
ടാർഗെറ്റ് സീക്വൻസുകളുടെ മുകളിലെ (വാട്സൺ) സ്ട്രാൻഡ് മാത്രം തിരയുക . സ്ഥിരസ്ഥിതിയായി,
രണ്ട് ഇഴകളും തിരയുന്നു. ഇത് ഡാറ്റാബേസ് വലുപ്പം (Z) പകുതിയായി കുറയ്ക്കും.
--താഴെയായി
ടാർഗെറ്റ് സീക്വൻസുകളുടെ താഴെയുള്ള (ക്രിക്ക്) സ്ട്രാൻഡ് മാത്രം തിരയുക . സ്ഥിരസ്ഥിതിയായി,
രണ്ട് ഇഴകളും തിരയുന്നു. ഇത് ഡാറ്റാബേസ് വലുപ്പം (Z) പകുതിയായി കുറയ്ക്കും.
--tformat
ടാർഗെറ്റ് സീക്വൻസ് ഡാറ്റാബേസ് ഫയൽ ഫോർമാറ്റിലാണെന്ന് ഉറപ്പിക്കുക . സ്വീകരിച്ച ഫോർമാറ്റുകൾ
ഉൾപ്പെടുന്നു ഫാസ്റ്റ, embl, ജെൻബാങ്ക്, ഡിഡിബിജെ, സ്റ്റോക്ക്ഹോം, pfam, a2m, അഫ, ക്ലസ്റ്റൽ, ഒപ്പം ഫിലിപ്
ഫയലിന്റെ ഫോർമാറ്റ് സ്വയമേവ കണ്ടെത്തുക എന്നതാണ് സ്ഥിരസ്ഥിതി.
--സിപിയു
സമാന്തര തൊഴിലാളി ത്രെഡുകളുടെ എണ്ണം സജ്ജമാക്കുക . സ്ഥിരസ്ഥിതിയായി, Infernal ഇത് സജ്ജമാക്കുന്നു
നിങ്ങളുടെ മെഷീനിൽ അത് കണ്ടെത്തുന്ന സിപിയു കോറുകളുടെ എണ്ണത്തിലേക്ക് - അതായത്, അത് ശ്രമിക്കുന്നു
നിങ്ങളുടെ ലഭ്യമായ പ്രോസസർ കോറുകളുടെ ഉപയോഗം പരമാവധിയാക്കുക. ക്രമീകരണം എന്നതിനേക്കാൾ ഉയർന്നത്
ഏതെങ്കിലും മൂല്യമുണ്ടെങ്കിൽ ലഭ്യമായ കോറുകളുടെ എണ്ണം വളരെ കുറവാണ്, എന്നാൽ നിങ്ങൾ അത് സജ്ജമാക്കാൻ ആഗ്രഹിച്ചേക്കാം
എന്തെങ്കിലും കുറവ്. ഒരു പരിസ്ഥിതി സജ്ജീകരിച്ച് നിങ്ങൾക്ക് ഈ നമ്പർ നിയന്ത്രിക്കാനും കഴിയും
വേരിയബിൾ, INFERNAL_NCPU. Infernal സമാഹരിച്ചതാണെങ്കിൽ മാത്രമേ ഈ ഓപ്ഷൻ ലഭ്യമാകൂ
POSIX ത്രെഡുകളുടെ പിന്തുണയോടെ. ഇതാണ് ഡിഫോൾട്ട്, എന്നാൽ ഇത് ഓഫാക്കിയിരിക്കാം
ചില കാരണങ്ങളാൽ നിങ്ങളുടെ സൈറ്റിനോ മെഷീനോ വേണ്ടി കംപൈൽ-ടൈം.
-- സ്റ്റാൾ
MPI മാസ്റ്റർ/വർക്കർ പതിപ്പ് ഡീബഗ്ഗ് ചെയ്യുന്നതിനായി: പ്രവർത്തനക്ഷമമാക്കാൻ ആരംഭിച്ചതിന് ശേഷം താൽക്കാലികമായി നിർത്തുക
റണ്ണിംഗ് മാസ്റ്ററിലേക്കും വർക്കർ(കൾ) പ്രക്രിയകളിലേക്കും ഡീബഗ്ഗറുകൾ അറ്റാച്ചുചെയ്യാൻ ഡവലപ്പർ. അയക്കുക
താൽക്കാലികമായി നിർത്താൻ SIGCONT സിഗ്നൽ. (ജിഡിബിക്ക് കീഴിൽ: (ജിഡിബി) സിഗ്നൽ SIGCONT) (മാത്രം
കംപൈൽ സമയത്ത് ഓപ്ഷണൽ MPI പിന്തുണ പ്രവർത്തനക്ഷമമാക്കിയിട്ടുണ്ടെങ്കിൽ ലഭ്യമാണ്.)
--mpi ഉപയോഗിച്ച്, MPI മാസ്റ്റർ/വർക്കർ മോഡിൽ പ്രവർത്തിപ്പിക്കുക എംപിരുൺ. ഉപയോഗിക്കുന്നതിന് --mpi, സീക്വൻസ് ഫയൽ വേണം
ഉപയോഗിച്ചാണ് ആദ്യം 'സൂചിക' ചെയ്തത് esl-sfetch പ്രോഗ്രാം, ഇതിൽ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്
നരക, in the easel/miniapps/ ഉപഡയറക്ടറി. (ഓപ്ഷണൽ MPI ആണെങ്കിൽ മാത്രം ലഭ്യമാണ്
കംപൈൽ സമയത്ത് പിന്തുണ പ്രവർത്തനക്ഷമമാക്കി.)
onworks.net സേവനങ്ങൾ ഉപയോഗിച്ച് ഓൺലൈനിൽ cmsearch ഉപയോഗിക്കുക