این دستور macs2_callpeak است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
macs2_callpeak - تجزیه و تحلیل مبتنی بر مدل برای چیپ-توالی
شرح
استفاده: macs2 callpeak [-h] -t TFILE [TFILE ...] [-c [CFILE [CFILE ...]]]
[-f {AUTO،BAM،SAM،BED،ELAND،ELANDMULTI،ELANDEXPORT،BOWTIE،BAMPE}]
[-g GSIZE] [--keep-dup KEEPDUPLICATES] [--buffer-size BUFFER_SIZE] [--outdir
OUTDIR] [-n NAME] [-B] [--verbose VERBOSE] [--Trackline] [--SPMR] [-s TSIZE] [--bw
BW] [-m MFOLD MFOLD] [--fix-bimodal] [--nomodel] [--shift SHIFT] [--extsize
EXTSIZE] [-q QVALUE | -p PVALUE] [--به-بزرگ] [--نسبت RATIO] [--down-samp]
[--seed SEED] [--nolambda] [--slocal SMALLLOCAL] [--local LARGELOCAL] [--گسترده]
[--BROADCUTOFF-برش گسترده] [--برش-تحلیل] [--تماس-اجلاس] [--fe-cutoff
FECUTOFF]
اختیاری استدلال ها:
-h, --کمک
این پیام راهنما را نشان داده و خارج شوید
ورودی فایل ها استدلال ها:
-t TFILE [TFILE ...]، --رفتار TFILE [TFILE ...]
فایل درمان ChiP-seq. اگر چندین فایل به عنوان '-t AB C' داده شود، آنگاه خواهد شد
همه با هم خوانده و جمع شوند. ضروری.
-c [CFILE [CFILE ...]]، --کنترل [CFILE [CFILE ...]]
فایل کنترلی اگر چندین فایل بهعنوان «-c AB C» داده شود، آنها با هم ترکیب میشوند
نویز پس زمینه چیپ-seq را تخمین بزنید.
-f {AUTO,BAM,SAM,BED,ELAND,ELANDMULTI,ELANDEXPORT,BOWTIE,BAMPE}, --قالب
{AUTO,BAM,SAM,BED,ELAND,ELANDMULTI,ELANDEXPORT,BOWTIE,BAMPE}
فرمت فایل برچسب، "AUTO"، "BED" یا "ELAND" یا "ELANDMULTI" یا "ELANDEXPORT" یا
"SAM" یا "BAM" یا "BOWTIE" یا "BAMPE". گزینه پیش فرض AUTO به MACS اجازه تصمیم گیری می دهد
فرمت فایل کدام است لطفاً در صورت تمایل، تعریف موجود در فایل README را بررسی کنید
ELAND/ELANDMULTI/ELANDEXPORT/SAM/BAM/BOWTIE. پیش فرض: "AUTO"
-g GSIZE، --gsize GSIZE
اندازه موثر ژنوم این می تواند 1.0e+9 یا 1000000000 باشد، یا میانبر: 'hs' برای انسان
(2.7e9)، 'mm' برای ماوس (1.87e9)، 'ce' برای C. elegans (9e7) و 'dm' برای Frufly
(1.2e8)، پیش فرض:hs
-- نگه داشتن KEEPDUPLICATES
رفتار MACS را نسبت به تگ های تکراری در همان مکان کنترل می کند --
همان هماهنگی و همان رشته. گزینه "خودکار" باعث می شود MACS محاسبه شود
حداکثر تگ ها در همان مکان بر اساس توزیع دوجمله ای با استفاده از
1e-5 به عنوان قطع pvalue. و گزینه "همه" هر تگ را نگه می دارد. اگر یک عدد صحیح باشد
با توجه به این، حداکثر این تعداد برچسب در همان مکان نگهداری می شود. پیشفرض
این است که یک برچسب را در یک مکان نگه دارید. پیش فرض: 1
- اندازه بافر BUFFER_SIZE
اندازه بافر برای افزایش تدریجی اندازه آرایه داخلی برای ذخیره خواندن
اطلاعات تراز در بیشتر موارد، لازم نیست این پارامتر را تغییر دهید.
با این حال، اگر تعداد زیادی کروموزوم / کانتیگ / داربست در شما وجود داشته باشد
تراز، توصیه می شود اندازه بافر کوچکتری را برای کاهش تعیین کنید
استفاده از حافظه (اما خواندن فایل های تراز مدت زمان بیشتری طول می کشد). حداقل حافظه
درخواست شده برای خواندن یک فایل تراز حدود # کروموزوم * BUFFER_SIZE * 2 است
بایت ها پیش فرض: 100000
تولید استدلال ها:
-- outdir OUTDIR
در صورت مشخص شدن تمام فایل های خروجی در آن دایرکتوری نوشته می شود. پیش فرض:
فهرست کار فعلی
-n نام، --نام نام
نام آزمایش، که برای تولید نام فایل های خروجی استفاده می شود. پیش فرض: "NA"
-B, --bdg
صرفه جویی در انباشت قطعه گسترده و آهنگ های لامبدا محلی (دو
فایل ها) در هر bp در یک فایل bedGraph. پیش فرض: نادرست
-- پرحرف VERBOSE
سطح پرمخاطب پیام زمان اجرا را تنظیم کنید. 0: فقط نمایش پیام انتقادی، 1: نمایش
پیام هشدار اضافی، 2: نمایش اطلاعات فرآیند، 3: نمایش پیام های اشکال زدایی.
پیش فرض: 2
- خط مسیر
به MACS میگوید که خط مسیر را با فایلهای bedGraph اضافه کند. برای گنجاندن این خط مسیر
هنگام نمایش bedGraph در مرورگر ژنوم UCSC، میتواند نام و شرح آن را نشان دهد
فایل را نیز با این حال پیشنهاد من این است که bedGraph را به bigWig تبدیل کنید، سپس نشان دهید
فایل bigWig باینری کوچکتر و سریعتر در مرورگر ژنوم UCSC و همچنین
تحلیل پایین دستی نیاز -B تنظیم شود. پیشفرض: شامل خط مسیر نمیشود.
--SPMR اگر درست باشد، MACS سیگنال را به ازای هر میلیون خواندن برای پروفایلهای انباشته قطعه ذخیره میکند.
نیاز به -B تنظیم شود. پیش فرض: نادرست
انتقال مدل استدلال ها:
-s TSIZE، --tsize TSIZE
اندازه برچسب این اندازه تگ شناسایی شده خودکار را لغو می کند. پیش فرض: تنظیم نشده است
--bw BW
پهنای باند برای انتخاب مناطق برای محاسبه اندازه قطعه. این مقدار فقط استفاده می شود
در حین ساخت مدل تعویض. پیش فرض: 300
-m امفولد امفولد، --mfold MFOLD MFOLD
مناطقی را در محدوده MFOLD نسبت غنی سازی با اطمینان بالا انتخاب کنید
پس زمینه برای ساخت مدل. غنیسازی چینها در نواحی باید کمتر از سطح بالایی باشد
حد، و بالاتر از حد پایین تر. به عنوان "-m 10 30" استفاده کنید. پیش فرض: 5 50
---اصلاح دووجهی
آیا فرآیند مدل جفت خودکار را روشن کنید. در صورت تنظیم، زمانی که MACS ساخته نشد
مدل جفت شده، از تنظیمات nomodel استفاده خواهد کرد --exsize پارامتر برای گسترش
هر برچسب به سمت 3 '. عدم استفاده از این تثبیت خودکار پیش فرض است
رفتار در حال حاضر پیش فرض: نادرست
--نومدل
اینکه آیا مدل شیفتی ساخته شود یا نه. اگر درست باشد، MACS مدل نمیسازد. توسط
به طور پیش فرض به معنای تغییر اندازه = 100 است، سعی کنید extsize را برای تغییر آن تنظیم کنید. پیش فرض:
غلط
--تغییر مکان از SHIFT
(نه میراث ---size گزینه!) تغییر دلخواه در bp. از احتیاط استفاده کنید
در حالی که آن را به غیر از مقدار پیش فرض تنظیم کنید. وقتی NOMODEL تنظیم شود، MACS از آن استفاده خواهد کرد
مقدار برای حرکت انتهای برش (5') به سمت 5'->3' سپس EXTSIZE را در
آنها را به قطعات گسترش دهید. وقتی این مقدار منفی باشد، انتهای آن به سمت حرکت میشود
جهت 3'->5'. توصیه می شود آن را به عنوان 0 پیش فرض برای مجموعه داده های ChIP-Seq یا -1
* نیمی از EXTSIZE همراه با گزینه EXTSIZE برای تشخیص مکان های برش غنی شده
مانند مجموعه داده های خاص DNAseI-Seq. توجه داشته باشید، شما نمی توانید مقادیری غیر از 0 را تنظیم کنید
فرمت BAMPE برای داده های جفت شده است. پیش فرض: 0.
--extsize EXTSIZE
اندازه پسوند دلخواه بر حسب bp. زمانی که nomodel true باشد، MACS از این مقدار استفاده خواهد کرد
به اندازه قطعه برای گسترش هر خوانده شده به سمت انتهای 3'، سپس آنها را روی هم انباشته کنید. این است
دقیقاً دو برابر تعداد SHIFTSIZE منسوخ شده است. در زبان قبلی، هر خوانده شده است
جهت 5'->3' به وسط قطعه 1/2 روز منتقل شد، سپس به هر دو گسترش یافت
جهت با 1/2 د. این معادل این است که بگوییم هر خواندن به سمت گسترش یافته است
5'-> 3' در بخش اندازه آگهی. پیش فرض: 200. EXTSIZE و SHIFT زمانی که می توانند ترکیب شوند
لازم است. گزینه SHIFT را علامت بزنید.
اوج فراخوانی استدلال ها:
-q QVALUE، --Qvalue QVALUE
حداقل قطع FDR (q-value) برای تشخیص پیک. پیش فرض: 0.05. -qو -p هستند
متقابل منحصر به فرد
-p PVALUE، --pvalue PVALUE
Pvalue cutoff برای تشخیص پیک. پیش فرض: تنظیم نشده است. -qو -p متقابل هستند
انحصاری. اگر برش pvalue تنظیم شود، qvalue به عنوان محاسبه و گزارش نمی شود
-1 در فایل xls نهایی.
--به بزرگ
وقتی تنظیم شد، نمونه کوچک را به نمونه بزرگتر تبدیل کنید. به طور پیش فرض، بزرگتر
مجموعه داده به سمت مجموعه داده کوچکتر کوچک می شود که منجر به کوچکتر شدن می شود
p/qvalues و نتایج خاص تر. به خاطر داشته باشید که کاهش حجم باعث کاهش می شود
صدای پس زمینه بیشتر پیش فرض: نادرست
-- نسبت نسبت
هنگام تنظیم، از نسبت مقیاس بندی سفارشی تراشه/کنترل استفاده کنید (مثلاً با استفاده از NCIS محاسبه می شود)
برای مقیاس بندی خطی پیش فرض: ingore
---پایین-نمونه
در صورت تنظیم، روش نمونهگیری تصادفی، نمونه بزرگتر را کاهش میدهد. به صورت پیش فرض،
MACS از مقیاس بندی خطی استفاده می کند. هشدار: این گزینه نتیجه شما را ناپایدار می کند و
غیر قابل تکرار، زیرا هر بار، خواندن تصادفی انتخاب می شود. استفاده را در نظر بگیرید
در عوض اسکریپت 'randsample'. در صورت استفاده همراه با --SPMR، 1
میلیون خوانده شده منحصر به فرد به طور تصادفی انتخاب خواهد شد. احتیاط: به دلیل
اجرای، ممکن است تعداد نهایی خوانده های انتخاب شده آنطور که انتظار داشتید نباشد!
پیش فرض: نادرست
-- دانه SEED
دانه تصادفی را در حین پایین آوردن داده های نمونه برداری تنظیم کنید. باید یک عدد صحیح غیر منفی در باشد
به منظور موثر بودن پیش فرض: تنظیم نشده است
--نولامبدا
اگر درست باشد، MACS از لامبدای پسزمینه ثابت بهعنوان لامبدای محلی برای هر پیک استفاده میکند
منطقه به طور معمول، MACS یک لامبدا محلی پویا را محاسبه می کند تا سوگیری محلی را منعکس کند
به دلیل ساختار کروماتین بالقوه
-- محلی کوچک محلی
منطقه کوچک نزدیک به صورت جفت پایه برای محاسبه لامبدا پویا. این عادت دارد
سوگیری در نزدیکی منطقه قله قله را بگیرید. اگر داده کنترلی وجود نداشته باشد نامعتبر است.
اگر این را روی 0 تنظیم کنید، MACS از محاسبه لامبدا موضعی صرفنظر می کند. *توجه داشته باشید* که MACS
همیشه یک محاسبه لامبدا محلی با اندازه d انجام می دهد. سوگیری محلی نهایی باید
حداکثر مقدار لامبدا از پنجرههای d، slocal و local اندازه باشد.
پیش فرض: 1000
-- محلی LARGELOCAL
منطقه بزرگ نزدیک به صورت جفت پایه برای محاسبه لامبدا پویا. این عادت دارد
سوگیری فراگیر را ضبط کنید. اگر این را روی 0 تنظیم کنید، MACS از لامبدا محلی صرفنظر می کند
محاسبه *توجه داشته باشید* که MACS همیشه یک لامبدا محلی با اندازه d اجرا می کند
محاسبه بایاس محلی نهایی باید حداکثر مقدار لامبدا از d باشد،
پنجره های اندازه محلی و محلی پیش فرض: 10000.
-- گسترده
در صورت تنظیم، MACS سعی خواهد کرد تا قلههای وسیع را با پیوند دادن نزدیک به بسیار غنیشده فراخوانی کند
مناطق ناحیه پیوند دهنده توسط یک بریدگی دیگر کنترل می شود
---پیوند دادن. حداکثر طول ناحیه پیوند 4 برابر d از MACS است.
پیش فرض: نادرست
-- برش گسترده BROADCUTOFF
برش برای منطقه وسیع این گزینه در دسترس نیست مگر اینکه -- گسترده تنظیم شده است. اگر -p
تنظیم شده است، این یک برش pvalue است، در غیر این صورت، یک قطع qvalue است. پیش فرض: 0.1
--تجزیه و تحلیل
در حین تنظیم، MACS2 تعداد یا طول کل قله هایی را که می توان با آنها فراخوانی کرد، تجزیه و تحلیل می کند
برش p-value مختلف سپس یک جدول خلاصه برای کمک به کاربر در تصمیم گیری بهتر خروجی می گیرد
قطع جدول در فایل NAME_cutoff_analysis.txt ذخیره خواهد شد. توجه داشته باشید، مینلن و
maxgap ممکن است بر نتایج تأثیر بگذارد. اخطار: ممکن است تا 30 برابر زمان بیشتری طول بکشد تا تمام شود.
پیش فرض: نادرست
پردازش بعد از گزینه ها:
-- تماس-اجلاس
در صورت تنظیم، MACS از رویکرد پردازش سیگنال پیچیده تری برای یافتن استفاده خواهد کرد
قله های فرعی در هر منطقه قله غنی شده. پیش فرض: نادرست
--fe-cutoff FECUTOFF
وقتی تنظیم شود، از این مقدار برای فیلتر کردن قلههایی با غنیسازی پایین استفاده میشود.
توجه داشته باشید، MACS2 از 1.0 به عنوان شبه شمار در هنگام محاسبه غنیسازی برابر استفاده میکند. پیش فرض: 1.0
با استفاده از خدمات onworks.net از macs2_callpeak به صورت آنلاین استفاده کنید