Ini adalah perintah gmt-music-bmr-calc-covgp yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
gmt music bmr calc-covg - Menggunakan calcRoiCovg.c untuk menghitung basis tercakup per-gen untuk masing-masing
diberikan pasangan BAM tumor-normal.
VERSION
Dokumen ini menjelaskan gmt music bmr calc-covg versi 0.04 (2016-01-01 pukul 23:10:19)
RINGKASAN
gmt music bmr calc-covg --gene-covg-dir=? --roi-file=? --referensi-urutan=? --bam-daftar=?
--keluaran-dir=? [--cmd-daftar-file=?] [--cmd-awalan=?] [--normal-min-kedalaman=?]
[--tumor-min-kedalaman=?] [--min-mapq=?]
penggunaan umum:
... musik bmr calc-covg \
--bam-daftar input_dir/bam_list \
--keluaran-dir keluaran_dir/ \
--referensi-urutan input_dir/all_sequences.fa \
--roi-file input_dir/all_coding_exons.tsv
Untuk membuat daftar perintah yang memungkinkan pemrosesan setiap pasangan tumor-normal di
paralel dengan penjadwal pekerjaan LSF:
... musik bmr calc-covg \
--bam-daftar input_dir/bam_list \
--keluaran-dir keluaran_dir/ \
--referensi-urutan input_dir/all_sequences.fa \
--roi-file input_dir/all_coding_exons.tsv \
--cmd_list_file parallelizable_commands \
--cmd_awalan bsub
Dalam kasus di atas, perintah yang dicetak ke dalam file keluaran "parallelizable_commands" dapat
dijalankan secara paralel. Setelah selesai, jalankan kembali skrip ini seperti yang dicetak langsung di bawah ini
(--cmd_list_file dan --cmd_prefix telah dihapus) untuk menggabungkan yang diparalelkan
perhitungan:
... musik bmr calc-covg \
--bam-daftar input_dir/bam_list \
--keluaran-dir keluaran_dir/ \
--referensi-urutan input_dir/all_sequences.fa \
--roi-file input_dir/all_coding_exons.tsv
DIBUTUHKAN ARGUMEN
gen-covg-dir Teks
Direktori tempat file cakupan gen per sampel berada
file roi Teks
Daftar ROI yang dibatasi tab [chr start stop gene_name] (Lihat Deskripsi)
referensi-urutan Teks
Jalur ke urutan referensi dalam format FASTA
daftar bam Teks
Daftar file BAM yang dibatasi tab [sample_name normal_bam tumor_bam] (Lihat Deskripsi)
keluaran-dir Teks
Direktori tempat file output dan subdirektori akan ditulis
OPSIONAL ARGUMEN
cmd-daftar-file Teks
File untuk menulis perintah calcRoiCovg (Lihat Deskripsi)
cmd-awalan Teks
Perintah yang mengirimkan pekerjaan ke cluster Anda (Lihat Deskripsi)
normal-min-kedalaman Bilangan bulat
Kedalaman baca minimum untuk mempertimbangkan basis BAM Normal seperti yang dicakup
tumor-min-kedalaman Bilangan bulat
Kedalaman baca minimum untuk mempertimbangkan basis BAM Tumor sebagai tercakup
min-mapq Bilangan bulat
Kualitas pemetaan minimum bacaan yang perlu dipertimbangkan untuk penghitungan kedalaman baca
DESKRIPSI
Skrip ini menghitung basis dengan cakupan yang cukup dalam ROI dari setiap gen yang diberikan
pasang file BAM tumor-normal dan mengkategorikannya menjadi - AT, CG (non-CpG), dan CpG
dihitung. Itu juga menambahkan jumlah dasar ini di semua ROI dari setiap gen untuk setiap sampel,
tetapi pangkalan tertutup yang terletak di dalam ROI yang tumpang tindih tidak dihitung lebih dari satu kali terhadap
jumlah total ini.
Secara default, skrip ini menjalankan alat berbasis C bernama calcRoiCovg untuk setiap sampel satu demi satu
yang lain, membutuhkan waktu ~30 menit per sampel untuk menghasilkan jumlah dasar tercakup per-ROI. jika
hasil calcRoiCovg untuk sampel sudah ada di subdirektori keluaran roi_covgs,
perhitungan ulang dilewati. Ini memungkinkan Anda untuk menjalankan tugas calcRoiCovg Anda sendiri secara paralel atau
pada beberapa mesin (Terus membaca).
Percepat dengan menjalankan tugas calcRoiCovg secara paralel: Jika kluster komputasi atau banyak
mesin tersedia, jalankan skrip ini dua kali sebagai berikut:
· Tentukan cmd-list-file dan cmd-prefix untuk menghasilkan file dengan perintah yang dapat
dikirimkan ke cluster atau dijalankan secara manual. Pekerjaan ini akan menulis jumlah dasar per-ROI dalam a
subdirektori roi_covgs.
· Setelah semua pekerjaan calcRoiCovg yang diparalelkan selesai, jalankan skrip ini lagi untuk
tambahkan mereka dan hasilkan jumlah basis per-gen akhir dalam subdirektori gene_covgs.
Ingatlah untuk menghapus argumen cmd-list-file dan cmd-prefix atau Anda hanya akan kembali
membuat daftar perintah.
ARGUMEN
--roi-file
Wilayah yang diminati (ROI) dari setiap gen biasanya merupakan wilayah yang ditargetkan untuk
pengurutan atau penggabungan lokus ekson (dari beberapa transkrip) gen dengan 2-bp
sisi (sambungan sambungan). ROI dari kromosom yang sama harus dicantumkan berdekatan dengan
satu sama lain dalam file ini. Ini memungkinkan kode berbasis C yang mendasarinya berjalan lebih banyak
efisien dan menghindari penghitungan ulang basis yang terlihat pada ROI yang tumpang tindih (untuk keseluruhan yang dicakup
hitungan dasar). Untuk jumlah basis per gen, basis yang tumpang tindih akan dihitung setiap kali
itu muncul dalam ROI dari gen yang sama. Untuk menghindari ini, pastikan untuk bergabung bersama
tumpang tindih ROI dari gen yang sama. MergeBed BEDtools dapat membantu jika digunakan per gen.
--referensi-urutan
Urutan referensi dalam format FASTA. Jika indeks urutan referensi tidak ditemukan
di sebelah file ini (file .fai), itu akan dibuat.
--bam-daftar
Berikan file yang berisi nama sampel dan lokasi BAM normal/tumor untuk masing-masing. Menggunakan
format tab-delimited [sample_name normal_bam tumor_bam] per baris. Tambahan
kolom seperti data klinis diperbolehkan, tetapi diabaikan. Sample_name harus sama
sebagai nama sampel tumor yang digunakan dalam file MAF (kolom ke-16, dengan header
Tumor_Sample_Barcode).
--keluaran-dir
Tentukan direktori keluaran di mana yang berikut ini akan dibuat/ditulis: roi_covgs:
Subdirektori yang berisi jumlah dasar tercakup per-ROI untuk setiap sampel. gene_covgs:
Subdirektori yang berisi jumlah basa tercakup per-gen untuk setiap sampel. total_covgs:
File yang berisi keseluruhan cakupan yang tidak tumpang tindih per sampel.
--cmd-daftar-file
Tentukan file tempat daftar pekerjaan calcRoiCovg akan ditulis. Ini bisa jadi
dijadwalkan secara paralel, dan akan menulis penghitungan dasar per-ROI yang tercakup ke dalam output
subdirektori roi_covgs. Jika cmd-list-file dibiarkan tidak ditentukan, skrip ini berjalan
calcRoiCovg per sampel satu demi satu, memakan waktu ~30 menit per sampel, tetapi dilewati
sampel yang outputnya sudah ada di roi_covgs.
--cmd-awalan
Tentukan perintah pengiriman pekerjaan yang akan diawali dengan setiap perintah di cmd-list-
mengajukan. Ini membuat pengiriman batch lebih mudah. Jalankan saja file cmd-list-file sebagai shell
naskah untuk mengirimkan pekerjaan. cmd-prefix adalah "bsub" jika cluster Anda menggunakan tugas LSF
scheduler, atau "qsub" di Torsi. Tambahkan argumen jika perlu. Misalnya, "bsub -M 4GB"
menetapkan batas memori lunak 4GB.
Gunakan gmt-music-bmr-calc-covgp online menggunakan layanan onworks.net