هذا هو الأمر genome-music-bmr-calc-covgp الذي يمكن تشغيله في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة على الإنترنت مثل Ubuntu Online أو Fedora Online أو Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت
برنامج:
اسم
موسيقى الجينوم bmr calc-covg - يستخدم calcRoiCovg.c لحساب القواعد المغطاة لكل جين لكل منها
نظرا لزوج الورم الطبيعي من BAMs.
VERSION
يصف هذا المستند موسيقى الجينوم bmr calc-covg الإصدار 0.04 (2016-01-01 الساعة 23:10:18)
موجز
موسيقى الجينوم bmr calc-covg --gene-covg-dir =؟ - ملف-roi =؟ - تسلسل المرجع =؟
- قائمة بام =؟ - إخراج دير =؟ [--cmd-list-file =؟] [--cmd-prefix =؟] [--normal-min-deep =؟]
[- tumor-min-deep =؟] [--min-mapq =؟]
الاستخدام العام:
... الموسيقى bmr calc-covg \
--bam-list input_dir / bam_list \
- إخراج- دير output_dir / \
- إدخال تسلسل المرجع / all_sequences.fa \
--roi-file input_dir / all_coding_exons.tsv
لإنشاء قائمة بالأوامر التي تسمح بمعالجة كل زوج ورم عادي في
بالتوازي مع برنامج جدولة الوظائف LSF:
... الموسيقى bmr calc-covg \
--bam-list input_dir / bam_list \
- إخراج- دير output_dir / \
- إدخال تسلسل المرجع / all_sequences.fa \
--roi-file input_dir / all_coding_exons.tsv \
--cmd_list_fileتوازي أوامر_
--cmd_prefix bsub
في الحالة المذكورة أعلاه ، يمكن للأوامر المطبوعة في ملف الإخراج "المتوازي_الأوامر"
يتم تشغيلها بالتوازي. بعد الانتهاء ، أعد تشغيل هذا البرنامج النصي كما طُبع أدناه مباشرةً
(تمت إزالة --cmd_list_file و --cmd_prefix) لدمج المتوازي
العمليات الحسابية:
... الموسيقى bmr calc-covg \
--bam-list input_dir / bam_list \
- إخراج- دير output_dir / \
- إدخال تسلسل المرجع / all_sequences.fa \
--roi-file input_dir / all_coding_exons.tsv
مطلوبة الحجج
الجين covg-dir نص
الدليل حيث توجد ملفات تغطية الجينات لكل عينة
roi- ملف نص
قائمة محددة بعلامات جدولة لعائدات الاستثمار [chr start stop gene_name] (انظر الوصف)
التسلسل المرجعي نص
المسار إلى التسلسل المرجعي بتنسيق FASTA
قائمة بام نص
قائمة محددة بعلامات جدولة لملفات BAM [sample_name normal_bam tumor_bam] (انظر الوصف)
الإخراج- دير نص
الدليل حيث سيتم كتابة ملفات الإخراج والأدلة الفرعية
اختياري الحجج
cmd قائمة ملف نص
ملف لكتابة أوامر calcRoiCovg إليه (انظر الوصف)
بادئة cmd نص
أمر يرسل مهمة إلى نظام المجموعة الخاص بك (انظر الوصف)
عادي دقيقة العمق عدد صحيح
الحد الأدنى لعمق القراءة لاعتبار قاعدة BAM العادية مغطاة
ورم-مين-عمق عدد صحيح
الحد الأدنى لعمق القراءة لاعتبار قاعدة Tumor BAM مغطاة
مين خريطة عدد صحيح
الحد الأدنى من جودة تعيين القراءات التي يجب مراعاتها في حساب عمق القراءة
الوصف
يحسب هذا البرنامج النصي القواعد مع التغطية الكافية في ROIs لكل جين في المعطى
أزواج من ملفات BAM العادية للأورام وتصنفها إلى - AT و CG (غير CpG) و CpG
العد. كما أنها تجمع هذه الأعداد الأساسية عبر جميع عوائد الاستثمار لكل جين لكل عينة ،
لكن القواعد المغطاة التي تقع ضمن عائد الاستثمار المتداخلة لا يتم احتسابها أكثر من مرة
مجموع هذه التهم.
بشكل افتراضي ، يقوم هذا البرنامج النصي بتشغيل أداة تستند إلى C تسمى calcRoiCovg لكل عينة واحدة بعد
آخر ، يستغرق حوالي 30 دقيقة لكل عينة لتوليد تعدادات أساسية مغطاة لكل عائد استثمار. إذا كان
نتائج calcRoiCovg لعينة موجودة بالفعل في دليل الإخراج الفرعي roi_covgs ،
تم تخطي إعادة الحساب. هذا يسمح لك بتشغيل وظائف calcRoiCovg الخاصة بك بالتوازي أو
على أجهزة متعددة (استمر في القراءة).
تسريع الأمور عن طريق تشغيل مهام calcRoiCovg بالتوازي: إذا كان حساب الكتلة أو متعدد
تتوفر الأجهزة ، قم بتشغيل هذا البرنامج النصي مرتين كما يلي:
· تحديد ملف قائمة cmd و cmd بادئة لإنشاء ملف مع الأوامر التي يمكن أن تكون
يتم إرسالها إلى مجموعة أو تشغيلها يدويًا. ستكتب هذه الوظائف التعداد الأساسي لكل عائد استثمار في ملف
الدليل الفرعي roi_covgs.
بعد الانتهاء من جميع وظائف calcRoiCovg المتوازية ، قم بتشغيل هذا البرنامج النصي مرة أخرى
قم بإضافتها وإنشاء التعداد النهائي لكل جين في دليل فرعي gene_covgs.
تذكر إزالة الوسيطتين cmd-list-file و cmd-prefix وإلا ستعيد-
إنشاء قائمة الأوامر.
الحجج
- ملف-roi
عادةً ما تكون مناطق الاهتمام (ROIs) لكل جين هي المناطق المستهدفة
التسلسل أو دمج مواقع exon (من نصوص متعددة) للجينات ذات 2-bp
الأجنحة (تقاطعات لصق). يجب أن يتم سرد ROIs من نفس الكروموسوم بجوار
بعضها البعض في هذا الملف. يسمح هذا للكود الأساسي المستند إلى C بتشغيل أكثر من ذلك بكثير
بكفاءة وتجنب إعادة حساب القواعد التي شوهدت في تداخل عائد الاستثمار (للتغطية الشاملة
التهم الأساسية). بالنسبة للعدد الأساسي لكل جين ، سيتم حساب قاعدة متداخلة في كل مرة
يظهر في عائد الاستثمار لنفس الجين. لتجنب ذلك ، تأكد من الدمج معًا
تداخل عائد الاستثمار لنفس الجين. يمكن أن يساعد MergeBed BEDtools إذا تم استخدامه لكل جين.
- تسلسل المرجع
التسلسل المرجعي بتنسيق FASTA. إذا لم يتم العثور على فهرس التسلسل المرجعي
بجانب هذا الملف (ملف .fai) ، سيتم إنشاؤه.
- قائمة بام
قدم ملفًا يحتوي على عينات من الأسماء ومواقع BAM الطبيعية / الورمية لكل منها. يستخدم
التنسيق المحدد بعلامات جدولة [sample_name normal_bam tumor_bam] لكل سطر. إضافي
أعمدة مثل البيانات السريرية مسموح بها ، ولكن يتم تجاهلها. يجب أن يكون اسم العينة هو نفسه
كأسماء عينة الورم المستخدمة في ملف MAF (العمود السادس عشر ، مع الرأس
Tumor_Sample_Barcode).
- إخراج دير
حدد دليل الإخراج حيث سيتم إنشاء / كتابة ما يلي: roi_covgs:
دليل فرعي يحتوي على التهم الأساسية لكل عائد استثمار مغطاة لكل عينة. gene_covgs:
دليل فرعي يحتوي على التهم الأساسية المغطاة لكل جين لكل عينة. إجمالي_حجم الإنتاج:
ملف يحتوي على التغطيات الشاملة غير المتداخلة لكل عينة.
- قائمة ملف- cmd
حدد الملف الذي سيتم كتابة قائمة وظائف calcRoiCovg فيه. يمكن أن تكون هذه
مجدولة بالتوازي ، وسوف تكتب التهم الأساسية المغطاة لكل عائد على الاستثمار في الناتج
الدليل الفرعي roi_covgs. إذا تم ترك ملف قائمة cmd غير محدد ، فسيتم تشغيل هذا البرنامج النصي
calcRoiCovg لكل عينة واحدة تلو الأخرى ، يستغرق حوالي 30 دقيقة لكل عينة ، لكنه يتخطى
العينات التي تم إنتاجها بالفعل في roi_covgs.
- بادئة cmd
حدد أمر إرسال مهمة يكون مسبوقًا لكل أمر في قائمة cmd-
ملف. هذا يجعل إرسال الدُفعات أسهل. ما عليك سوى تشغيل ملف cmd-list-file كصدفة
السيناريو لتقديم الوظائف. cmd-prefix هي "bsub" إذا كانت مجموعتك تستخدم وظيفة LSF
مجدول ، أو "qsub" في عزم الدوران. أضف الحجج حسب الضرورة. على سبيل المثال ، "bsub -M 4 غيغابايت"
يحدد حد ذاكرة ناعم يبلغ 4 جيجابايت.
استخدم genome-music-bmr-calc-covgp عبر الإنترنت باستخدام خدمات onworks.net