این دستور cutadapt3 است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
cutadapt - صفحه دستی برای cutadapt 1.8.3
شرح
نسخه بریده 1.8.3 کپی رایت © 2010-2015 Marcel Martin[ایمیل محافظت شده]>
cutadapt دنباله های آداپتور را از خواندن توالی با توان بالا حذف می کند.
طریقه استفاده:
تطبیق دادن -a آداپتور [گزینه ها] [-o output.fastq] input.fastq
برای جفت شده آمده است:
تطبیق دادن -a ADAPT1 -A ADAPT2 [گزینهها] -o out1.fastq -p out2.fastq in1.fastq
in2.fastq
"ADAPTER" را با دنباله واقعی آداپتور 3 اینچی خود جایگزین کنید. کاراکترهای عام IUPAC
پشتیبانی می شوند. متمم معکوس به صورت خودکار جستجو نمیشود. همه خوانده شده از
input.fastq با حذف دنباله آداپتور در output.fastq نوشته می شود. آداپتور
تطبیق تحمل خطا دارد. چندین توالی آداپتور را می توان ارائه داد (از بیشتر استفاده کنید -a
گزینه ها)، اما فقط بهترین آداپتور منطبق حذف خواهد شد.
ورودی ممکن است در قالب FASTA نیز باشد. ورودی و خروجی فشرده پشتیبانی می شود و
به طور خودکار از نام فایل (gz، .xz، .bz2.) شناسایی می شود. از نام فایل '-' برای استاندارد استفاده کنید
ورودی خروجی. بدون -o گزینه، خروجی به خروجی استاندارد ارسال می شود.
برخی از دیگر در دسترس امکانات هستند:
* انواع آداپتورهای مختلف (آداپتورهای 5 اینچ، آداپتورهای "مخلوط" 5'/3' و غیره) *
برش تعداد ثابت پایه * پیرایش با کیفیت * برش دادن فضای رنگی خوانده می شود *
فیلتر کردن بر اساس معیارهای مختلف خوانده می شود
از «cutadapt» استفاده کنید --کمکبرای دیدن همه گزینه های خط فرمان. ببینید
http://cutadapt.readthedocs.org/ برای مستندات کامل
OPTIONS
- نسخه
نمایش شماره نسخه برنامه و خروج
-h, --کمک
این پیام راهنما را نشان داده و خارج شوید
-f فرمت، --قالب=FORMAT
فرمت فایل ورودی؛ می تواند 'fasta'، 'fastq' یا 'sra-fastq' باشد. وقتی نادیده گرفته شد
خواندن فایلهای csfasta/qual (پیشفرض: تشخیص خودکار از پسوند نام فایل).
گزینه هایی که بر نحوه یافتن آداپتورها تأثیر می گذارد:
هر یک از سه پارامتر زیر (-a, -b, -g) می تواند چندین بار استفاده شود و
در هر ترکیبی برای جستجوی یک مجموعه کامل از آداپتورهای احتمالاً متفاوت
انواع فقط بهترین آداپتور منطبق از هر خوانده شده بریده می شود (اما به
--بار گزینه). به جای دادن آداپتور مستقیم، می توانید بنویسید
file:FILE و دنباله های آداپتور از فایل داده شده خوانده می شوند (که باید باشد
در قالب FASTA).
-a آداپتور، -- آداپتور=ADAPTER
دنباله ای از یک آداپتور که به انتهای 3' بسته شده بود. خود آداپتور و
هر چیزی که در ادامه می آید بریده می شود. اگر دنباله آداپتور با '$' ختم شود
کاراکتر، آداپتور به انتهای خوانده شده متصل می شود و فقط در صورتی پیدا می شود که a باشد
پسوند خوانده شده
-g آداپتور، -- جلو=ADAPTER
دنباله ای از یک آداپتور که به انتهای 5' بسته شده بود. اگر دنباله آداپتور
با کاراکتر «^» شروع می شود، آداپتور «لنگر» است. یک آداپتور لنگر باید
به طور کامل در انتهای 5 دقیقه خوانده شده ظاهر می شود (این پیشوند خوانده شده است). آ
آداپتور غیر لنگر ممکن است تا حدی در انتهای 5' ظاهر شود، یا ممکن است در داخل آن رخ دهد
خواندن. اگر در یک خواندن یافت شود، دنباله قبل از آداپتور نیز خواهد بود
کوتاه شده در همه موارد، خود آداپتور بریده شده است.
-b آداپتور، --هر جا=ADAPTER
دنباله ای از آداپتور که به انتهای 5 یا 3' بسته شده است. اگر آداپتور باشد
در داخل خوانده شده یا با همپوشانی انتهای 3' خوانده شده، این رفتار عبارت است از
همان طور که برای -a گزینه. اگر آداپتور با انتهای 5' همپوشانی داشته باشد (ابتدای
خواندن)، بخش اولیه خواندن مطابق با آداپتور بریده شده است، اما
هر چیزی که در ادامه می آید حفظ می شود.
-e نرخ خطا، --نرخ خطا=نرخ خطا
حداکثر میزان خطای مجاز (تعداد خطا تقسیم بر طول تطابق
منطقه) (پیشفرض: 0.1)
--بدون ایندلز
ایندل ها را در ترازها مجاز نکنید (فقط عدم تطابق را مجاز کنید). در حال حاضر فقط
برای آداپتورهای لنگردار پشتیبانی می شود. (پیشفرض: هم عدم تطابق و هم ایندلها مجاز است)
-n شمردن، --بار=COUNT
حداکثر COUNT بار سعی کنید آداپتورها را حذف کنید. هنگامی که یک آداپتور اضافه می شود مفید است
چندین بار (پیشفرض: 1).
-O طول، -- همپوشانی=LENGTH
حداقل طول همپوشانی اگر همپوشانی بین خوانده شده و آداپتور کوتاه تر باشد
از LENGTH، خوانده شده اصلاح نشده است. این باعث کاهش شماره می شود. از پایه های کاملا بریده شده
به دلیل تطابق کوتاه آداپتور تصادفی (پیشفرض: 3).
-مطابقت-خواندن-کارت های عام
اجازه دادن به حروف عام IUPAC در خواندن (پیشفرض: نادرست).
-N, --بدون تطابق-آداپتور-کارت های عام
حروف عام IUPAC را در آداپتورها تفسیر نکنید.
گزینه هایی برای فیلتر کردن مطالب پردازش شده:
-- دور انداخته شده, -- دور انداختن
به جای بریدن مطالبی که حاوی آداپتور هستند، آنها را دور بریزید. همچنین استفاده کنید -O in
به منظور جلوگیری از دور انداختن تعداد زیادی از خواندن های تطبیق تصادفی!
-- دور انداختن - بریده نشده, --فقط بریده شده
مطالبی را که حاوی آداپتور نیستند دور بریزید.
-m طول، - حداقل طول=LENGTH
خواندن های بریده شده را که کوتاهتر از LENGTH هستند دور بریزید. مطالبی که حتی خیلی کوتاه هستند
قبل از حذف آداپتور نیز دور انداخته می شوند. در Colorspace، پرایمر اولیه وجود ندارد
شمارش شده (پیش فرض: 0).
-M طول، -- حداکثر طول=LENGTH
خواندن های بریده شده که بیشتر از LENGTH هستند را دور بریزید. مطالبی که حتی خیلی طولانی هستند
قبل از حذف آداپتور نیز دور انداخته می شوند. در Colorspace، پرایمر اولیه وجود ندارد
شمارش شده (پیش فرض: بدون محدودیت).
-- بدون تریم
مطابق معمول و تغییر مسیر خوانده شده به خروجی/خروجی حذف نشده، اما حذف نکنید
آداپتورها
--max-n=LENGTH
حداکثر نسبت N مجاز در خواندن. عدد < 1 به عنوان یک تلقی می شود
نسبت در حالی که یک عدد > 1 به عنوان حداکثر تعداد N ها در نظر گرفته می شود
موجود است.
---آداپتور ماسک
آداپتورها را با کاراکترهای "N" به جای برش دادن آنها بپوشانید.
گزینه هایی که بر آنچه خروجی به کجا می رسد تأثیر می گذارد:
--ساکت
در پایان گزارشی چاپ نکنید.
-o فایل، -- خروجی=فایل
خواندن های اصلاح شده را در FILE بنویسید. فرمت FASTQ یا FASTA بسته به ورودی انتخاب می شود.
گزارش خلاصه به خروجی استاندارد ارسال می شود. از «{name}» در FILE برای دیمولتیپلکس استفاده کنید
در چندین فایل می خواند. (پیشفرض: قرائتهای کوتاهشده در خروجی استاندارد نوشته میشوند)
---فایل اطلاعات=فایل
اطلاعات مربوط به هر خوانده شده و مطابقت آداپتور آن را در FILE بنویسید. را ببینید
اسناد برای فرمت فایل
-r فایل، -- rest-file=فایل
وقتی آداپتور در وسط خواندن مطابقت داشت، بقیه را بنویسید (بعد از
آداپتور) در FILE.
-فایل wildcard=فایل
هنگامی که آداپتور دارای پایههای عام ('N's) است، پایههای آداپتور مطابق با حروف عام بنویسید
موقعیت ها برای FILE. وقتی ایندل ها در تراز وجود داشته باشند، اغلب اینطور نخواهد بود
دقیق.
- خروجی خیلی کوتاه=فایل
خواندن هایی را بنویسید که خیلی کوتاه هستند (با توجه به طول مشخص شده توسط -m) به FILE.
(پیشفرض: صرفنظر کردن از خواندن)
- خروجی خیلی طولانی=فایل
خواندن هایی بنویسید که خیلی طولانی هستند (با توجه به طول مشخص شده توسط -M) به FILE.
(پیشفرض: صرفنظر کردن از خواندن)
-خروجی بدون برش=فایل
مطالب خواندنی را بنویسید که شامل آداپتور FILE نباشد. (پیشفرض: خروجی به همان فایل
همانطور که بریده شده خوانده می شود)
اصلاحات اضافی برای خوانده شده:
-u طول، --قطع كردن=LENGTH
پایه های LENGTH را از ابتدا یا انتهای هر خواندن حذف کنید. اگر LENGTH مثبت باشد،
پایه ها از ابتدای هر خواندن حذف می شوند. اگر LENGTH منفی باشد،
پایه ها از انتهای هر خواندن حذف می شوند. این گزینه را می توان دو بار مشخص کرد if
LENGTH ها علائم مختلفی دارند.
-q [5'CUTOFF،]3'CUTOFF، -- کیفیت-قطع=[5'قطع،]3'قطع
پایههای با کیفیت پایین را قبل از برداشتن آداپتور از انتهای 5 و/یا 3 اینچ خوانها کوتاه کنید. اگر
یک مقدار داده شده است، فقط انتهای 3 بریده شده است. اگر دو برش با کاما از هم جدا شده باشند
با داده شده، انتهای 5 با اولین برش، انتهای 3' با برش دوم کوتاه می شود. در
الگوریتم همان الگوریتم مورد استفاده BWA است (به مستندات مراجعه کنید). (پیش فرض: خیر
پیرایش)
---پایه کیفیت=QUALITY_BASE
فرض کنید که مقادیر کیفیت به صورت ascii (کیفیت + QUALITY_BASE) کدگذاری می شوند. در
پیشفرض (33) معمولاً درست است، به جز خواندنهایی که توسط برخی نسخههای آن تولید میشوند
خط لوله Illumina، جایی که باید روی 64 تنظیم شود. (پیشفرض: 33)
-- trim-n
برش N در انتهای خوانده شده.
-x پیشوند، -- پیشوند=پیشوند
برای خواندن اسامی این پیشوند را اضافه کنید
-y پسوند، --پسوند=پسوند
برای خواندن اسامی این پسوند را اضافه کنید
نوار-پسوند=STRIP_SUFFIX
در صورت وجود این پسوند را از نام های خوانده شده حذف کنید. می توان چندین بار داد.
-c, --فضای رنگی
حالت Colorspace: همچنین رنگی را که در مجاورت آداپتور پیدا شده است، برش دهید.
-d, --دوبار رمزگذاری
هنگامی که در فضای رنگی هستید، رنگ ها را دوبار رمزگذاری کنید (نقشه 0,1,2,3,4،XNUMX،XNUMX،XNUMX،XNUMX تا A،C،G،T،N).
-t, -- تریم پرایمر
هنگامی که در colorspace هستید، پایه پرایمر و اولین رنگ (که انتقال است) را اصلاح کنید
به اولین نوکلئوتید)
--strip-f3
برای colorspace: پسوند _F3 را از نام های خوانده شده بردارید
-- maq, --bwa
خروجی فضای رنگی سازگار با MAQ و BWA. این را قادر می سازد -c, -d, -t, --strip-f3 و
-y '/1'.
- طول-برچسب=TAG
TAG و سپس یک عدد اعشاری را در قسمت توضیحات خوانده شده جستجو کنید.
عدد اعشاری را با طول صحیح خوانده شده بریده شده جایگزین کنید. برای
به عنوان مثال، استفاده کنید - طول-برچسب 'length=' برای تصحیح فیلدهایی مانند 'length=123'.
--بدون درپوش صفر
مقادیر منفی کیفیت را به صفر تغییر ندهید. مقادیر کیفیت فضای رنگی -1
به صورت فاصله در فایل FASTQ خروجی ظاهر می شود. از آنجایی که بسیاری از ابزارها مشکل دارند
با این کار، کیفیت های منفی هنگام برش داده های colorspace به صفر تبدیل می شوند.
از این گزینه برای حفظ ویژگی های منفی استفاده کنید.
-z, --کلاه صفر
مقادیر منفی کیفیت را به صفر تغییر دهید. این به طور پیش فرض زمانی فعال می شود که
-c/--colorspace نیز فعال است. برای غیرفعال کردن آن از گزینه بالا استفاده کنید.
گزینه های جفت شده.:
La -Aگزینه های /-G/-B/-U مانند آنها کار می کنند -a/-b/-g/-u همتایان.
-A ADAPTER
آداپتور 3 به صورت جفت از دومین خوانده شده حذف شود.
-G ADAPTER
آداپتور 5 به صورت جفت از دومین خوانده شده حذف شود.
-B ADAPTER
آداپتور 5'/3 به صورت جفت از دومین قرائت حذف شود.
-U LENGTH
پایه های LENGTH را از ابتدا یا انتهای هر خواندن بردارید (نگاه کنید به --قطع كردن).
-p فایل، - خروجی جفت شده=فایل
خواندن دوم را به صورت جفتی در FILE بنویسید.
-خروجی جفت نشده=فایل
خواندن دوم را به صورت جفتی در این فایل بنویسید، زمانی که هیچ آداپتوری در فایل اول یافت نشد
خواندن. از این گزینه به همراه استفاده کنید -خروجی بدون برش هنگام پیرایش جفت
می خواند. (پیشفرض: خروجی به همان فایلی که بریدهشده خوانده میشود.)
با استفاده از خدمات onworks.net از cutadapt3 به صورت آنلاین استفاده کنید
