این دستور cmscan است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
cmscan - دنباله(های) جستجو در برابر پایگاه داده مدل کوواریانس
خلاصه
cmscan [گزینه ها]
شرح
cmscan برای جستجوی توالی ها در برابر مجموعه ای از مدل های کوواریانس استفاده می شود. برای هر
دنباله در ، از آن دنباله پرس و جو برای جستجو در پایگاه داده هدف CM ها استفاده کنید
، و خروجی لیست های رتبه بندی شده از CM ها با بیشترین تطابق به
توالی.
La ممکن است شامل بیش از یک دنباله پرس و جو باشد. این می تواند در فرمت FASTA یا
چندین فرمت فایل متداول دیگر (genbank، embl، و غیره) یا در
فرمت های فایل تراز (استکهلم، فستای تراز شده، و غیره). را ببینید --qformat انتخاب
برای یک لیست کامل
La باید با استفاده از آن فشار داده شود cmpress قبل از اینکه بتوان با آن جستجو کرد cmscan. این
چهار فایل باینری با پسوند .i1{fimp} ایجاد می کند. علاوه بر این، باید بوده است
کالیبره شده برای مقادیر E با cm کالیبره کنید قبل از تحت فشار قرار گرفتن با cmpress.
پرس و جو ممکن است '-' (یک کاراکتر خط تیره) باشد، در این صورت دنباله های پرس و جو هستند
خواندن از a لوله به جای از یک فایل. را از a قابل خواندن نیست
stream، زیرا باید آن چهار فایل باینری کمکی تولید شده توسط cmpress.
فرمت خروجی طوری طراحی شده است که برای انسان قابل خواندن باشد، اما اغلب آنقدر حجیم است که
خواندن آن غیر عملی است و تجزیه آن دردناک است. در -- tblout گزینه خروجی را در a ذخیره می کند
قالب جدولی ساده که مختصر و آسان تر تجزیه می شود. در -o گزینه اجازه می دهد
تغییر مسیر خروجی اصلی، از جمله دور انداختن آن در /dev/null.
cmscan با استفاده از الگوریتم های تخصصی، انتهای 5' و 3' دنباله های هدف را دوباره بررسی می کند.
برای تشخیص کوتاه شده بازدیدها، در کدام قسمت از 5' و/یا 3' پایان کامل واقعی است
طول دنباله همولوگ در فایل دنباله هدف وجود ندارد. این نوع بازدیدها
در فایلهای دنبالهای متشکل از خواندههای توالی نامنظم رایجتر خواهد بود. توسط
بهطور پیشفرض، هر ضربه کوتاه شده 5 اینچی باید شامل اولین باقیمانده هدف باشد
دنباله ای که از in مشتق شده است ، و هر ضربه کوتاه 3 دقیقه باید شامل شود
باقیمانده نهایی دنباله هدفی که از آن مشتق شده است. هر ضربه کوتاه 5' و 3' باید
شامل اولین و آخرین باقیمانده دنباله هدفی است که از آن مشتق شده است. را --anytrunc
گزینه الزامات برای گنجاندن ضربه نقاط انتهایی دنباله و کوتاه شده را کاهش می دهد
ضربه ها مجاز به شروع و توقف در هر موقعیتی از دنباله های هدف هستند. مهم است
هر چند، با --anytrunc، ضربه E-values دقت کمتری خواهد داشت زیرا کالیبراسیون مدل این کار را انجام می دهد
احتمال ضربه های کوتاه شده را در نظر نگیرید، بنابراین با احتیاط از آن استفاده کنید. در --notrunc
می توان از گزینه برای خاموش کردن تشخیص ضربه کوتاه شده استفاده کرد. --notrunc دویدن را کاهش خواهد داد
زمان cmscan، مهم ترین برای هدف فایل هایی که شامل بسیاری از فایل های کوتاه است
دنباله ها تشخیص ضربه کوتاه به طور خودکار خاموش می شود -- حداکثر، --نوهم،
--qdb، or -- بدون نوار از گزینه ها استفاده می شود زیرا بر استفاده از HMM تسریع شده متکی است
استراتژی هم ترازی نواری که توسط هر یک از آن گزینه ها خاموش می شود.
OPTIONS
-h کمک؛ یک یادآوری مختصر از استفاده از خط فرمان و همه گزینه های موجود چاپ کنید.
-g روشن کن جهانی الگوریتم تراز، جهانی با توجه به مدل پرس و جو و
محلی با توجه به پایگاه داده هدف. به طور پیش فرض، تراز محلی
از الگوریتمی استفاده می شود که هم با توجه به دنباله هدف و هم به صورت محلی است
مدل. در حالت محلی، تراز به دو یا چند دنباله در صورت لزوم
(به عنوان مثال اگر ساختارهای مدل پرس و جو و دنباله هدف فقط تا حدی باشد
به اشتراک گذاشته شده)، اجازه می دهد تا درج ها و حذف های بزرگ در ساختار وجود داشته باشد
جریمه متفاوتی نسبت به ایندل های معمولی دارد. حالت محلی در حالت تجربی بهتر عمل می کند
معیارها و به طور قابل توجهی برای تشخیص همسانی از راه دور حساس تر است.
از نظر تجربی، جستجوهای گلوکال تعداد بازدیدهای کمتری نسبت به جستجوهای محلی دارند، بنابراین گلوکال
ممکن است برای برخی از برنامه ها مورد نظر باشد.
-Z مقادیر E را طوری محاسبه کنید که گویی اندازه فضای جستجو است مگابایت (Mb). بدون
با استفاده از این گزینه، اندازه فضای جستجو برای هر دنباله پرس و جو تغییر می کند، آن است
به عنوان طول دنباله پرس و جو فعلی ضربدر 2 تعریف می شود (زیرا هر دو رشته
از دنباله جستجو خواهد شد) برابر تعداد CMها در .
-- devhelp
راهنمای چاپ، مانند -h , بلکه شامل گزینه های متخصصی نیز می شود که نمایش داده نمی شوند
با -h . انتظار نمیرود این گزینههای تخصصی برای گستردهها مرتبط باشند
اکثر کاربران و بنابراین در صفحه راهنما توضیح داده نشده است. تنها منابع
برای درک آنچه که آنها در واقع انجام می دهند، خروجی توضیحات مختصر یک خطی است
چه زمانی -- devhelp فعال است و کد منبع
OPTIONS برای کنترل OUTPUT
-o خروجی اصلی قابل خواندن توسط انسان را به یک فایل هدایت کنید به جای stdout پیش فرض.
-- tblout
یک فایل جدولی ساده (محدود شده با فضا) که تعداد بازدیدهای یافت شده را خلاصه می کند، با یک فایل ذخیره کنید
خط داده در هر ضربه فرمت این فایل در یوزر Infernal توضیح داده شده است
راهنما.
-- حساب در خروجی اصلی که برای نمایهها موجود است، به جای نامها از پیوستها استفاده کنید
و/یا دنباله ها
-- نوعلی
بخش تراز را از خروجی اصلی حذف کنید. این می تواند تا حد زیادی خروجی را کاهش دهد
جلد.
--notextw
طول هر خط را در خروجی اصلی نامحدود کنید. حد پیش فرض 120 است
کاراکتر در هر خط، که به نمایش خالص خروجی در پایانه ها کمک می کند و
در ویرایشگرها، اما می تواند خطوط توصیف نمایه هدف را کوتاه کند.
--textw
حد طول خط خروجی اصلی را روی آن تنظیم کنید کاراکتر در هر خط پیش فرض است
120.
-- پرحرف
شامل آمار خط لوله جستجوی اضافی در خروجی اصلی، از جمله فیلتر
آمار بقا برای تشخیص ضربه کوتاه و تعداد پاکت های دور ریخته شده
به دلیل سرریز اندازه ماتریس.
OPTIONS کنترل گزارش نویسی فروشندگان
آستانه گزارش گیری کنترل می کند که کدام ضربه در فایل های خروجی گزارش می شود (خروجی اصلی و
--tblout) بازدیدها بر اساس اهمیت آماری (ارزش E) رتبه بندی می شوند. به طور پیش فرض، همه بازدیدها
با E-value <= 10 گزارش می شود. گزینه های زیر به شما امکان می دهد پیش فرض را تغییر دهید
آستانه های گزارش ارزش الکترونیکی، یا به جای آن از آستانه های امتیاز بیت استفاده کنید.
-E در خروجی به ازای هر هدف، دنباله های هدف را با E-value <= گزارش کنید . La
پیش فرض 10.0 است، به این معنی که به طور متوسط حدود 10 مثبت کاذب گزارش می شود
به ازای هر پرس و جو، بنابراین می توانید قسمت بالای نویز را ببینید و خودتان تصمیم بگیرید که آیا وجود دارد یا خیر
واقعا سر و صدا
-T به جای آستانه گذاری خروجی هر CM در E-value، دنباله های هدف را با یک
بیت امتیاز >= .
OPTIONS برای نقص فروشندگان
آستانههای ورود سختتر از آستانههای گزارشدهی هستند. کنترل آستانه های ورود
کدام ضربه ها به اندازه کافی قابل اعتماد در نظر گرفته می شوند که در موارد بعدی احتمالی گنجانده شوند
دور جستجو، یا علامت گذاری شده به عنوان قابل توجه ("!") در مقابل سوال سوال ("?") در ضربه
خروجی.
--incE
از یک ارزش الکترونیکی <= استفاده کنید به عنوان آستانه ورود. پیش فرض 0.01 است،
به این معنی که به طور متوسط از هر 1 مورد 100 مثبت کاذب انتظار می رود
جستجو با توالی های مختلف پرس و جو.
--incT
به جای استفاده از E-values برای تنظیم آستانه گنجاندن، در عوض از مقدار کمی استفاده کنید
امتیاز >= به عنوان آستانه ورود. به طور پیش فرض این گزینه تنظیم نشده است.
OPTIONS برای مدل خاص SCORE آستانه
پایگاه دادههای مدیریتشده CM ممکن است آستانههای بیتی خاصی را برای هر CM تعیین کنند، که جایگزین آنها شود
آستانه گذاری تنها بر اساس معناداری آماری.
برای استفاده از این گزینهها، نمایه باید حاوی موارد مناسب (GA، TC و/یا NC) باشد.
حاشیه نویسی آستانه امتیاز اختیاری. این توسط برداشت شده است cmbuild از فرمت استکهلم
فایل های تراز هر گزینه آستانه امتیازی دارد بیت می کند و طوری عمل می کند که انگار -T
--incT به طور خاص با استفاده از آستانه های انتخاب شده هر مدل اعمال شده است.
--cut_ga
از امتیازات بیت GA (جمع آوری) در مدل برای تنظیم گزارش و گنجاندن ضربه استفاده کنید
آستانه ها آستانه های GA به طور کلی به عنوان نمونه قابل اعتماد در نظر گرفته می شوند
آستانه تعیین کننده عضویت خانواده؛ به عنوان مثال، در Rfam، این آستانه
بر اساس جستجو با Rfam Seed، آنچه را که در ترازهای Rfam Full گنجانده می شود، تعریف کنید
مدل ها.
--cut_nc
از آستانه امتیاز بیت NC (برش نویز) در مدل برای تنظیم گزارش ضربه استفاده کنید
و آستانه های ورود آستانه NC به طور کلی به عنوان امتیاز در نظر گرفته می شود
بالاترین امتیاز مثبت کاذب شناخته شده
--cut_tc
از آستانه امتیاز بیت TC (قطع مطمئن) در مدل برای تنظیم گزارش ضربه استفاده کنید
و آستانه های ورود آستانه TC به طور کلی به عنوان امتیاز در نظر گرفته می شود
کمترین امتیاز مثبت واقعی شناخته شده که بالاتر از همه موارد مثبت کاذب شناخته شده است.
OPTIONS کنترل L' شتاب خط لوله
جستجوهای Infernal 1.1 در یک خط لوله فیلتر شش مرحله ای تسریع می شود. پنج نفر اول
مراحل از یک پروفایل HMM برای تعریف پاکت هایی استفاده می کنند که به مرحله شش CM CYK ارسال می شوند
فیلتر به هر پاکت نامه ای که از تمام فیلترها جان سالم به در ببرد، با استفاده از CM امتیاز نهایی به آنها اختصاص داده می شود
الگوریتم داخلی
فیلتر HMM پروفایل توسط شرکت ساخته شده است cmbuild برنامه و در آن ذخیره می شود .
هر فیلتر متوالی کندتر از فیلتر قبلی است، اما بهتر از آن است
تمایز بین دنبالههایی که ممکن است حاوی ضربههای CM با امتیاز بالا باشند و آنهایی که این کار را انجام میدهند
نه سه مرحله اول فیلتر HMM همان مراحل استفاده شده در HMMER3 است. مرحله 1 (F1)
فیلتر محلی HMM SSV است که برای دنباله های طولانی اصلاح شده است. مرحله 2 (F2) HMM محلی است
فیلتر ویتربی. مرحله 3 (F3) فیلتر محلی HMM Forward است. هر یک از سه مورد اول
مراحل از نمایه HMM در حالت محلی استفاده می کند، که به یک دنباله هدف اجازه می دهد تا با آن تراز شود
هر منطقه از HMM مرحله 4 (F4) یک فیلتر HMM گلوکال است که به یک هدف نیاز دارد
برای تراز کردن با نمایه تمام قد HMM. مرحله 5 (F5) HMM گلوکال است
فیلتر تعریف پاکت، که از هورسیتیک های شناسایی دامنه HMMER3 برای تعریف استفاده می کند
مرزهای پاکت بعد از هر مرحله از 2 تا 5 یک مرحله فیلتر بایاس (F2b، F3b، F4b، و
F5b) برای حذف دنباله هایی استفاده می شود که به نظر می رسد به دلیل بایاس از فیلتر عبور کرده اند
ترکیب به تنهایی سپس هر پاکت که از مراحل F1 تا F5b جان سالم به در میبرد، با آنها ارسال میشود
فیلتر محلی CM CYK فیلتر CYK از محدودیت ها (باندها) مشتق شده از HMM استفاده می کند
تراز کردن پاکت برای کاهش تعداد محاسبات مورد نیاز و صرفه جویی در زمان.
هر پاکت نامه ای که از CYK عبور کند، با الگوریتم محلی CM Inside، دوباره با استفاده از HMM نمره گذاری می شود.
باندهای شتاب
آستانههای فیلتر پیشفرض که حداقل امتیاز لازم برای یک دنباله را تعیین میکنند
زنده ماندن هر مرحله بر اساس اندازه فضای جستجو (Z) تعریف شده است
به عنوان طول دنباله پرس و جو فعلی برابر 2 (زیرا هر دو رشته خواهند بود
جستجو شده) برابر تعداد پروفایل های موجود در . با این حال، اگر یکی از -Z or --FZ
از گزینه ها استفاده می شود سپس فضای جستجو در نظر گرفته می شود برای اهداف
تعیین آستانه فیلتر
برای پایگاه داده های بزرگتر، فیلترها سختگیرانه تر هستند که منجر به شتاب بیشتر می شود
به طور بالقوه از دست دادن حساسیت بیشتر. منطق این است که برای پایگاه های داده بزرگتر،
بازدیدها برای دستیابی به اهمیت آماری باید نمرات بالاتری داشته باشند، بنابراین فیلتر کردن سختگیرانهتر است
که حذف ضربات ناچیز با امتیاز کمتر قابل قبول است.
آستانه های P-value برای همه اندازه های فضای جستجوی ممکن و تمام مراحل فیلتر هستند
در ادامه فهرست شده است. (آستانه P-value 0.01 به این معنی است که تقریباً 1٪ از بالاترین امتیاز
انتظار می رود دنباله های غیرهمولوگ از فیلتر عبور کنند.) Z به عنوان تعداد تعریف می شود
نوکلئوتیدها در فایل توالی هدف کامل 2 برابر هستند زیرا هر دو رشته خواهند بود
با هر مدل جستجو شد
اگر Z کمتر از 2 مگابایت باشد: F1 0.35 است. F2 و F2b خاموش هستند. F3، F3b، F4، F4b و F5 0.02 هستند.
F6 0.0001 است.
اگر Z بین 2 مگابایت و 20 مگابایت باشد: F1 0.35 است. F2 و F2b خاموش هستند. F3، F3b، F4، F4b و F5
0.005 هستند; F6 0.0001 است.
اگر Z بین 20 مگابایت و 200 مگابایت باشد: F1 0.35 است. F2 و F2b 0.15 هستند. F3، F3b، F4، F4b و F5
0.003 هستند; F6 0.0001 است.
اگر Z بین 200 مگابایت و 2 گیگابیت باشد: F1 0.15 است. F2 و F2b 0.15 هستند. F3، F3b، F4، F4b، F5،
و F5b 0.0008 هستند. و F6 0.0001 است.
اگر Z بین 2 گیگابیت و 20 گیگابیت باشد: F1 0.15 است. F2 و F2b 0.15 هستند. F3، F3b، F4، F4b، F5، و
F5b 0.0002 هستند. و F6 0.0001 است.
اگر Z بیشتر از 20 گیگابیت باشد: F1 0.06 است. F2 و F2b 0.02 هستند. F3، F3b، F4، F4b، F5 و F5b
0.0002 هستند; و F6 0.0001 است.
این آستانه ها بر اساس عملکرد در یک معیار داخلی که بسیاری را آزمایش می کند، انتخاب شدند
تنظیمات ممکن مختلف
پنج گزینه برای کنترل سطح فیلتر کلی وجود دارد. این گزینه ها، در
سفارش از کم سخت ترین (کندترین اما حساس ترین) به سخت ترین (سریع ترین اما کم).
حساس): -- حداکثر، --نوهم، -- اواسط، -- پیش فرض، (این تنظیمات پیش فرض است) --rfam. و
-- همونه با -- پیش فرض آستانه فیلتر وابسته به اندازه پایگاه داده خواهد بود. را ببینید
توضیح هر یک از این گزینه های فردی در زیر برای اطلاعات بیشتر.
علاوه بر این، یک کاربر خبره می تواند دقیقاً آستانه امتیاز هر مرحله فیلتر را با آن کنترل کند
la --F1، --F1b، --F2، --F2b، --F3، --F3b، --F4، --F4b، --F5، --F5b، و --F6 گزینه ها. مانند
همچنین هر مرحله را با دکمه روشن یا خاموش کنید --noF1، --doF1b، --noF2، --noF2b، --noF3،
--noF3b، --noF4، --noF4b، --noF5، و --noF6. گزینه ها. این گزینه ها فقط نمایش داده می شوند
اگر -- devhelp گزینه برای حفظ تعداد گزینه های نمایش داده شده با استفاده می شود -h
منطقی است، و به این دلیل که انتظار می رود آنها فقط برای اقلیت کوچکی از کاربران مفید باشند.
به عنوان یک مورد خاص، برای هر مدل در که دارای جفت پایه صفر هستند، پروفیل HMM
جستجوها به جای جستجوهای CM اجرا می شوند. الگوریتم های HMM کارآمدتر از CM هستند
الگوریتمها، و مزایای الگوریتمهای CM برای مدلهایی که ثانویه ندارند از بین میرود
ساختار (صفر جفت پایه). این جستجوهای HMM نمایه به طور قابل توجهی سریعتر از آن اجرا می شوند
CM جستجو می کند. میتوانید جستجوهای فقط HMM را با -- همونه گزینه. برای بیشتر
اطلاعات مربوط به جستجوهای فقط HMM به راهنمای کاربر مراجعه کنید.
-- حداکثر همه فیلترها را خاموش کنید و Inside بدون نوار را روی هر هدف تمام قد اجرا کنید
توالی. این حساسیت را تا حدودی افزایش می دهد، با هزینه بسیار زیاد در سرعت.
--نوهم
تمام مراحل فیلتر HMM (F1 تا F5b) را خاموش کنید. فیلتر CYK با استفاده از QDB ها، این کار را انجام می دهد
روی هر دنباله هدف تمام قد اجرا شود و یک آستانه P-value از
0.0001. هر دنباله ای که از CYK زنده بماند به Inside ارسال می شود که این کار را انجام می دهد
همچنین از QDBها (اما یک مجموعه شلتر) استفاده کنید. این حساسیت را تا حدودی افزایش می دهد، در یک مقدار
هزینه زیاد در سرعت
-- اواسط مراحل فیلتر HMM SSV و Viterbi (F1 تا F2b) را خاموش کنید. HMM باقیمانده را تنظیم کنید
آستانه فیلتر (F3 تا F5b) به طور پیش فرض به 0.02، اما قابل تغییر به با
--Fmid توالی. این ممکن است حساسیت را با هزینه قابل توجهی در سرعت افزایش دهد.
-- پیش فرض
از استراتژی فیلتر پیش فرض استفاده کنید. این گزینه به صورت پیش فرض روشن است. فیلتر
آستانه ها بر اساس اندازه پایگاه داده تعیین می شوند.
--rfam از یک استراتژی فیلترینگ سختگیرانه برای پایگاه های داده بزرگ (بیش از 20 گیگابیت) استفاده کنید. این
جستجو را با هزینه بالقوه حساسیت تسریع می کند.
-- همونه
فقط از نمایه فیلتر HMM برای جستجو استفاده کنید، از CM استفاده نکنید. فقط فیلتر
مراحل F1 تا F3 با استفاده از آستانه های سخت P-value (0.02 برای
F1، 0.001 برای F2 و 0.00001 برای F3). علاوه بر این یک فیلتر ترکیب سوگیری است
بعد از مرحله F1 (با آستانه بقا 0.02/XNUMX P=) استفاده می شود. هر ضربه ای که زنده بماند
تمام مراحل و دارای یک HMM E-value یا امتیاز بیت بالاتر از آستانه گزارش است
خروجی باشد. کاربر میتواند آستانهها و گزینههای فیلتر فقط HMM را با آن تغییر دهد
--hmmF1، --hmmF2، --hmmF3، --همنوبیاس، --hmmnonull2، و --hmmmax. به طور پیش فرض،
جستجو برای هر مدلی با جفت پایه صفر در حالت فقط HMM اجرا می شود. این می تواند
خاموش شود و CM را مجبور به جستجوی این مدل ها با -- به طور غیرممکن گزینه.
--FZ
آستانه فیلتر را به عنوان پیش فرض های مورد استفاده در صورت وجود پایگاه داده تنظیم کنید مگابایت (Mb).
در صورت استفاده با بیشتر از 20000 (20 گیگابیت) این گزینه همان اثر را دارد
--rfam.
--Fmid
با -- اواسط گزینه آستانه فیلتر HMM (F3 تا F5b) را روی آن تنظیم کنید . By
پیش فرض، 0.02 است
OTHER OPTIONS
--notrunc
تشخیص ضربه کوتاه شده را خاموش کنید.
--anytrunc
اجازه دهید ضربه های کوتاه شده در هر موقعیتی در یک دنباله هدف شروع و پایان یابد. توسط
بهطور پیشفرض، ضربههای کوتاه شده ۵ دقیقه باید اولین باقیمانده دنباله هدف خود را داشته باشند
و ضربه های کوتاه شده 3 دقیقه باید شامل باقیمانده نهایی دنباله هدف خود باشد. با
این گزینه ممکن است تعداد ضربات تمام طول کمتری را مشاهده کنید که تا ابتدا و
انتهای پرس و جو CM.
--nonull3
تصحیح امتیاز null3 CM را برای ترکیب مغرضانه خاموش کنید. این اصلاح است
در مراحل فیلتر HMM استفاده نمی شود.
--mxsize
حداکثر اندازه مجاز ماتریس CM DP را روی آن تنظیم کنید مگابایت به طور پیش فرض این اندازه
128 مگابایت است. این باید برای اکثریت قریب به اتفاق جستجوها به اندازه کافی بزرگ باشد،
مخصوصا با مدل های کوچکتر اگر cmsearch با یک پاکت در CYK یا مواجه می شود
داخل مرحله ای که نیاز به ماتریس بزرگتر دارد، پاکت از آن تخفیف داده می شود
توجه. این رفتار مانند یک فیلتر اضافی است که از گرانی جلوگیری می کند
(آهسته) محاسبات CM DP، اما با هزینه بالقوه برای حساسیت. توجه داشته باشید که اگر
cmsearch در حال اجرا است چند رشته در یک ماشین چند هسته ای و سپس هر کدام
نخ ممکن است ماتریس اختصاص داده شده به اندازه داشته باشد Mb در هر زمان معین.
--smxsize
حداکثر اندازه ماتریس DP جستجوی CM مجاز را روی آن تنظیم کنید مگابایت به صورت پیش فرض
این اندازه 128 مگابایت است. این گزینه فقط در صورتی مرتبط است که CM از HMM استفاده نکند
ماتریس های نواری، یعنی اگر -- حداکثر، --نوهم، --qdb، --fqdb، -- بدون نوار، or
--fnonbanded گزینه ها نیز استفاده می شود. توجه داشته باشید که اگر cmsearch در حال اجرا است
چندین رشته در یک ماشین چند هسته ای، سپس هر رشته ممکن است یک رشته اختصاص داده شود
ماتریس تا اندازه Mb در هر زمان معین.
-- cyk از الگوریتم CYK، نه Inside، برای تعیین امتیاز نهایی همه بازدیدها استفاده کنید.
--acyk از الگوریتم CYK برای تراز کردن بازدیدها استفاده کنید. به طور پیش فرض، دقت بهینه Durbin/Holmes
الگوریتمی استفاده می شود که هم ترازی را پیدا می کند که دقت مورد انتظار را به حداکثر می رساند
از تمام باقی مانده های هم تراز شده
--wcx
برای هر CM، پارامتر W، حداکثر طول مورد انتظار ضربه را روی آن تنظیم کنید
برابر طول اجماع مدل به طور پیش فرض، پارامتر W از آن خوانده می شود
فایل CM و بر اساس احتمالات انتقال مدل محاسبه شد
by cmbuild. می توانید دریابید که W پیش فرض برای مدلی که استفاده می کند چیست cmstat. این
گزینه باید با احتیاط مورد استفاده قرار گیرد زیرا چندین بار بر خط لوله فیلتر تأثیر می گذارد
مراحل مختلف به روش های غیر آشکار فقط برای کاربران متخصص توصیه می شود
جستجو برای بازدیدهایی که بسیار طولانی تر از همولوگ های مورد استفاده برای ساخت هستند
مدل در cmbuild، به عنوان مثال آنهایی که دارای اینترون های بزرگ یا سایر درج های بزرگ هستند. آی تی
نمی توان در ترکیب با --نوهم، --fqdb or --qdb گزینه ها زیرا در
این موارد W توسط باندهای وابسته به پرس و جو محدود می شود.
--toponly
فقط رشته بالایی (واتسون) دنباله های هدف را در آن جستجو کنید . به طور پیش فرض،
هر دو رشته جستجو می شوند. این اندازه فضای جستجو (Z) را به نصف کاهش می دهد.
-- به صورت پایین
فقط رشته پایین (Crick) دنباله های هدف را در جستجو کنید . By
به طور پیش فرض، هر دو رشته جستجو می شوند. این اندازه فضای جستجو (Z) را به نصف کاهش می دهد.
--qformat
ادعا کنید که فایل پایگاه داده دنباله پرس و جو در قالب است . فرمت های پذیرفته شده
شامل فستا، امبل، جنبانک، ddbj، استکهلم، pfam، a2m آفا، خوشه ای، و فیلیپ
پیش فرض تشخیص خودکار فرمت فایل است.
--گلیست
زیر مجموعه ای از مدل ها را پیکربندی کنید در حالت هم ترازی گلوکال، به جای
حالت محلی، یعنی مدل های فهرست شده در فایل . تمام مدل های دیگر را پیکربندی کنید
(کسانی که در لیست نیستند ) در حالت محلی این گزینه با -g.
پرونده باید نامهای معتبر مدلها را فهرست کند ، هر کدام با یک جدا شده اند
کاراکتر فضای خالی (به عنوان مثال یک کاراکتر خط جدید).
--cpu
تعداد نخ های کارگر موازی را بر روی تنظیم کنید . به طور پیش فرض، Infernal این را تنظیم می کند
به تعداد هسته های CPU که در دستگاه شما تشخیص می دهد - یعنی سعی می کند
استفاده از هسته های پردازنده موجود خود را به حداکثر برسانید. تنظیمات بالاتر از
تعداد هستههای موجود بسیار کم است، اما ممکن است بخواهید آن را روی آن تنظیم کنید
چیزی کمتر همچنین می توانید با تنظیم یک محیط این عدد را کنترل کنید
متغیر ، INFERNAL_NCPU. این گزینه فقط در صورتی موجود است که Infernal کامپایل شده باشد
با پشتیبانی از رشته های POSIX. این پیش فرض است، اما ممکن است در خاموش شده باشد
به دلایلی زمان کامپایل برای سایت یا ماشین شما.
-- غرفه
برای اشکال زدایی نسخه اصلی/کارگر MPI: پس از شروع مکث کنید تا فعال شود
توسعه دهنده برای پیوست کردن دیباگرها به فرآیندهای اصلی و کارگر(های) در حال اجرا. ارسال
سیگنال SIGCONT برای آزاد کردن مکث. (تحت gdb: (gdb) سیگنال SIGCONT) (فقط
اگر پشتیبانی اختیاری MPI در زمان کامپایل فعال شده باشد، در دسترس است.)
--mpi با استفاده از حالت MPI master/worker اجرا شود mpirun. (فقط در صورت اختیاری MPI موجود است
پشتیبانی در زمان کامپایل فعال شد.)
از cmscan آنلاین با استفاده از خدمات onworks.net استفاده کنید