این دستور gmt-music-bmr-calc-covgp است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
موسیقی gmt bmr calc-covg - از calcRoiCovg.c برای شمارش بازهای تحت پوشش در هر ژن برای هر ژن استفاده می کند.
با توجه به یک جفت BAM طبیعی تومور.
نسخه
این سند gmt music bmr calc-covg نسخه 0.04 (2016/01/01 در 23:10:19) را شرح میدهد.
خلاصه
موسیقی gmt bmr calc-covg --gene-covg-dir=؟ --roi-file=؟ --reference-sequence=؟ --bam-list=؟
--output-dir=؟ [--cmd-list-file=?] [--cmd-prefix=?] [--normal-min-depth=?]
[--tumor-min-depth=?] [--min-mapq=?]
استفاده عمومی:
... موسیقی bmr calc-covg \
--bam-list input_dir/bam_list \
--output-dir output_dir/ \
--reference-sequence input_dir/all_sequences.fa \
--roi-file input_dir/all_coding_exons.tsv
برای ایجاد لیستی از دستورات که امکان پردازش هر جفت تومور طبیعی را فراهم می کند
به موازات یک زمانبندی کار LSF:
... موسیقی bmr calc-covg \
--bam-list input_dir/bam_list \
--output-dir output_dir/ \
--reference-sequence input_dir/all_sequences.fa \
--roi-file input_dir/all_coding_exons.tsv \
--cmd_list_file parallelizable_commands \
--cmd_prefix bsub
در حالت فوق، دستورات چاپ شده در فایل خروجی "parallelizable_commands" می توانند
به صورت موازی اجرا شود پس از تکمیل آنها، این اسکریپت را همانطور که مستقیماً در زیر چاپ شده است، دوباره اجرا کنید
(--cmd_list_file و -cmd_prefix حذف شده اند) برای ادغام موارد موازی شده
محاسبات:
... موسیقی bmr calc-covg \
--bam-list input_dir/bam_list \
--output-dir output_dir/ \
--reference-sequence input_dir/all_sequences.fa \
--roi-file input_dir/all_coding_exons.tsv
مورد نیاز ادله
gene-covg-dir متن
دایرکتوری که فایل های پوشش ژن هر نمونه در آن قرار دارند
roi-پرونده متن
فهرست ROI با برگه محدود شده [chr start stop gene_name] (به توضیحات مراجعه کنید)
مرجع-توالی متن
مسیر به دنباله مرجع در قالب FASTA
بام لیست متن
فهرست جداشده از برگههای فایلهای BAM [نمونه_نام normal_bam tumor_bam] (به توضیحات مراجعه کنید)
خروجی- کارگردان متن
دایرکتوری که در آن فایل های خروجی و زیر شاخه ها نوشته می شوند
اختیاری ادله
cmd-list-file متن
فایلی برای نوشتن دستورات calcRoiCovg (به توضیحات مراجعه کنید)
پیشوند cmd متن
دستوری که یک کار را به خوشه شما ارسال می کند (به توضیحات مراجعه کنید)
نرمال-دقیقه عمق عدد صحیح
حداقل عمق خواندن برای در نظر گرفتن پایه BAM معمولی تحت پوشش
عمق تومور در دقیقه عدد صحیح
حداقل عمق خواندن برای در نظر گرفتن پایه تومور BAM تحت پوشش
min-mapq عدد صحیح
حداقل کیفیت نگاشت خواندنی ها که باید برای شمارش عمق خواندن در نظر گرفته شود
شرح
این اسکریپت پایگاه هایی را با پوشش کافی در ROI هر ژن در داده شده شمارش می کند
جفت فایل های BAM طبیعی تومور و دسته بندی آنها به - AT، CG (غیر CpG)، و CpG
شمارش می کند. همچنین این تعداد پایه را در تمام ROIهای هر ژن برای هر نمونه جمع می کند.
اما پایه های پوشیده شده که در ROI های همپوشانی قرار دارند بیش از یک بار به حساب نمی آیند
این تعداد کل
به طور پیش فرض، این اسکریپت یک ابزار مبتنی بر C به نام calcRoiCovg را برای هر نمونه یکی پس از آن اجرا می کند.
دیگری، 30 دقیقه در هر نمونه برای تولید تعداد پایه تحت پوشش هر ROI صرف می شود. اگر
نتایج calcRoiCovg برای یک نمونه از قبل در زیر شاخه خروجی roi_covgs وجود دارد،
محاسبه مجدد حذف شده است. این به شما امکان می دهد کارهای calcRoiCovg خود را به صورت موازی یا به صورت موازی اجرا کنید
در چندین ماشین (به خواندن ادامه دهید).
با اجرای موازی کارهای calcRoiCovg کارها را افزایش دهید: اگر یک خوشه محاسباتی یا چندگانه
ماشین ها در دسترس هستند، این اسکریپت را دو بار به صورت زیر اجرا کنید:
· تعریف cmd-list-file و cmd-prefix برای تولید یک فایل با دستوراتی که می تواند باشد
به یک خوشه ارسال شود یا به صورت دستی اجرا شود. این مشاغل تعداد پایه به ازای ROI را در a می نویسند
زیر شاخه roi_covgs.
· پس از تکمیل تمام کارهای موازی calcRoiCovg، این اسکریپت را دوباره اجرا کنید
آنها را جمع کنید و تعداد پایه هر ژن نهایی را در یک زیر شاخه gene_covgs ایجاد کنید.
به یاد داشته باشید که آرگومان های cmd-list-file و cmd-prefix را حذف کنید وگرنه فقط دوباره
ایجاد لیستی از دستورات
ادله
--roi-فایل
مناطق مورد علاقه (ROI) هر ژن معمولاً مناطقی هستند که برای آنها هدف قرار می گیرند
توالی یابی یا ادغام جایگاه های اگزون (از رونوشت های متعدد) ژن ها با 2 جفت باز
پهلوها (اتصالات اتصالات). ROI از همان کروموزوم باید در مجاورت فهرست شود
یکدیگر در این فایل این اجازه می دهد تا کد مبتنی بر C زیربنایی بسیار بیشتر اجرا شود
کارآمد باشد و از شمارش مجدد مبانی مشاهده شده در ROIهای همپوشانی (برای کل پوشش داده شده) اجتناب کنید
شمارش پایه). برای تعداد بازهای هر ژن، هر بار یک باز همپوشانی شمارش می شود
در ROI همان ژن ظاهر می شود. برای جلوگیری از این امر، حتما با هم ادغام شوند
همپوشانی ROI همان ژن. mergeBed BEDtools در صورت استفاده از هر ژن می تواند کمک کند.
-- مرجع- توالی
دنباله مرجع در قالب FASTA. اگر یک شاخص توالی مرجع پیدا نشد
در کنار این فایل (فایل .fai) ایجاد می شود.
--بام-لیست
برای هر کدام یک فایل حاوی نامهای نمونه و مکانهای BAM طبیعی/توموری ارائه کنید. استفاده کنید
فرمت جداشده با برگه [نام_نمونه_normal_bam tumor_bam] در هر خط. اضافی
ستون هایی مانند داده های بالینی مجاز هستند، اما نادیده گرفته می شوند. نمونه_نام باید یکسان باشد
به عنوان نام نمونه تومور استفاده شده در فایل MAF (ستون شانزدهم، با هدر
تومور_نمونه_بارکد).
--output-dir
یک دایرکتوری خروجی را مشخص کنید که در آن موارد زیر ایجاد/نوشته شود: roi_covgs:
دایرکتوری فرعی حاوی تعداد پایه تحت پوشش هر ROI برای هر نمونه. gene_covgs:
فهرست فرعی حاوی تعداد بازهای تحت پوشش هر ژن برای هر نمونه. total_covgs:
فایل حاوی پوششهای غیر همپوشانی کلی در هر نمونه.
--cmd-list-file
فایلی را مشخص کنید که لیستی از کارهای calcRoiCovg در آن نوشته شود. اینها می توانند باشند
به طور موازی برنامه ریزی می شود و تعداد پایه های تحت پوشش هر ROI را در خروجی می نویسد
زیر شاخه roi_covgs. اگر cmd-list-file نامشخص باقی بماند، این اسکریپت اجرا می شود
calcRoiCovg در هر نمونه یکی پس از دیگری، حدود 30 دقیقه در هر نمونه طول می کشد، اما از بین می رود
نمونه هایی که خروجی آنها قبلاً در roi_covgs است.
--cmd-پیشوند
یک دستور ارسال شغل را مشخص کنید که پیشوند هر دستور در cmd-list- باشد.
فایل. این امر ارسال دسته ای را آسان تر می کند. فقط فایل cmd-list-file را به صورت پوسته اجرا کنید
اسکریپت برای ارسال شغل اگر خوشه شما از کار LSF استفاده می کند، پیشوند cmd "bsub" است
زمانبندی یا "qsub" در Torque. در صورت لزوم آرگومان ها را اضافه کنید. به عنوان مثال، "bsub -M 4GB"
محدودیت حافظه نرم 4 گیگابایت را تعیین می کند.
از gmt-music-bmr-calc-covgp به صورت آنلاین با استفاده از خدمات onworks.net استفاده کنید