Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Biểu tượng yêu thích OnWorks

gmt-music-bmr-calc-covgp - Trực tuyến trên đám mây

Chạy gmt-music-bmr-calc-covgp trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh gmt-music-bmr-calc-covgp có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


gmt music bmr calc-covg - Sử dụng calcRoiCovg.c để đếm các bazơ được che phủ trên mỗi gen cho mỗi
đưa ra cặp BAM bình thường của khối u.

PHIÊN BẢN


Tài liệu này mô tả gmt music bmr calc-covg phiên bản 0.04 (2016-01-01 lúc 23:10:19)

SYNOPSIS


gmt nhạc bmr calc-covg --gene-covg-dir =? --roi-file =? --reference-sequence =? --bam-list =?
--output-dir =? [--cmd-list-file =?] [--cmd-prefix =?] [--normal-min-depth =?]
[--tumor-min-depth =?] [--min-mapq =?]

Cách sử dụng chung:

... âm nhạc bmr calc-covg \
--bam-list input_dir / bam_list \
--output-dir output_dir / \
--reference-sequence input_dir / all_sequences.fa \
--roi-file input_dir / all_coding_exons.tsv

Để tạo một danh sách các lệnh sẽ cho phép xử lý từng cặp khối u-bình thường trong
song song với một bộ lập lịch công việc LSF:

... âm nhạc bmr calc-covg \
--bam-list input_dir / bam_list \
--output-dir output_dir / \
--reference-sequence input_dir / all_sequences.fa \
--roi-file input_dir / all_coding_exons.tsv \
--cmd_list_filellelizable_commands \
--cmd_prefix bsub

Trong trường hợp trên, các lệnh được in vào tệp đầu ra "llelizable_commands "có thể
được chạy song song. Sau khi hoàn tất, hãy chạy lại tập lệnh này như được in ngay bên dưới
(--cmd_list_file và --cmd_prefix đã bị loại bỏ) để hợp nhất tệp song song
tính toán:

... âm nhạc bmr calc-covg \
--bam-list input_dir / bam_list \
--output-dir output_dir / \
--reference-sequence input_dir / all_sequences.fa \
--roi-file input_dir / all_coding_exons.tsv

YÊU CẦU TRANH LUẬN


gen-covg-dir bản văn
Thư mục nơi chứa các tệp bao phủ gen của mỗi mẫu

tập tin roi bản văn
Danh sách ROI được phân tách bằng tab [chr start stop gene_name] (Xem phần mô tả)

tham chiếu-trình tự bản văn
Đường dẫn đến chuỗi tham chiếu ở định dạng FASTA

danh sách bam bản văn
Danh sách tệp BAM được phân tách bằng tab [sample_name normal_bam u_bam] (Xem phần mô tả)

đầu ra-dir bản văn
Thư mục nơi các tệp đầu ra và thư mục con sẽ được ghi

CHỌN TRANH LUẬN


tập tin danh sách cmd bản văn
Một tệp để ghi các lệnh calcRoiCovg vào (Xem phần Mô tả)

tiền tố cmd bản văn
Một lệnh gửi một công việc đến cụm của bạn (Xem phần Mô tả)

độ sâu bình thường tối thiểu Số nguyên
Độ sâu đọc tối thiểu để xem xét cơ sở BAM bình thường như được bảo hiểm

độ sâu tối thiểu của khối u Số nguyên
Độ sâu đọc tối thiểu để xem xét một cơ sở Tumor BAM là được bao phủ

bản đồ tối thiểu Số nguyên
Chất lượng ánh xạ tối thiểu của các lần đọc để xem xét đối với số lượng độ sâu đọc

MÔ TẢ


Tập lệnh này đếm các cơ sở có đủ mức độ bao phủ trong ROI của mỗi gen trong
các cặp tệp BAM bình thường của khối u và phân loại chúng thành - AT, CG (không phải CpG) và CpG
số đếm. Nó cũng cộng các số lượng cơ sở này trên tất cả ROI của mỗi gen cho mỗi mẫu,
nhưng các cơ sở được bảo hiểm nằm trong ROI chồng chéo không được tính nhiều hơn một lần đối với
tổng số này.

Theo mặc định, tập lệnh này chạy một công cụ dựa trên C có tên là calcRoiCovg cho từng mẫu sau
khác, mất ~ 30 phút mỗi mẫu để tạo số lượng cơ sở được bao phủ trên mỗi ROI. Nếu
kết quả của calcRoiCovg cho một mẫu đã tồn tại trong thư mục con đầu ra roi_covgs,
tính toán lại bị bỏ qua. Điều này cho phép bạn chạy song song các công việc calcRoiCovg của riêng mình hoặc
trên nhiều máy (Tiếp tục đọc).

Tăng tốc mọi thứ bằng cách chạy song song các công việc calcRoiCovg: Nếu một cụm máy tính hoặc nhiều
máy có sẵn, hãy chạy tập lệnh này hai lần như sau:

· Xác định cmd-list-file và cmd-prefix để tạo tệp bằng các lệnh có thể
được gửi đến một cụm hoặc chạy thủ công. Những công việc này sẽ ghi số cơ sở trên mỗi ROI trong một
thư mục con roi_covgs.

· Sau khi tất cả các công việc calcRoiCovg song song hoàn thành, hãy chạy lại tập lệnh này để
cộng chúng lại và tạo số lượng cơ sở cuối cùng trên mỗi gen trong một thư mục con gen_covgs.
Hãy nhớ xóa các đối số cmd-list-file và cmd-prefix, nếu không bạn sẽ chỉ bị
tạo một danh sách các lệnh.

TRANH LUẬN


--roi-file
Các vùng quan tâm (ROI) của mỗi gen thường là các vùng được nhắm mục tiêu
giải trình tự hoặc được hợp nhất các locus exon (từ nhiều bản sao chép) của các gen có 2-bp
hai bên sườn (mối nối ghép). ROI từ cùng một nhiễm sắc thể phải được liệt kê liền kề với
nhau trong tập tin này. Điều này cho phép mã nền tảng C chạy nhiều hơn
một cách hiệu quả và tránh tính lại các cơ sở được thấy trong ROI trùng lặp (đối với tổng thể được bao phủ
số lượng cơ sở). Đối với số lượng cơ sở trên mỗi gen, một cơ sở chồng chéo sẽ được tính mỗi lần
nó xuất hiện trong ROI của cùng một gen. Để tránh điều này, hãy đảm bảo hợp nhất với nhau
ROI trùng lặp của cùng một gen. BEDtools 'mergeBed có thể hữu ích nếu được sử dụng trên mỗi gen.
- chuỗi tham khảo
Trình tự tham chiếu ở định dạng FASTA. Nếu không tìm thấy chỉ mục trình tự tham chiếu
bên cạnh tệp này (tệp .fai), nó sẽ được tạo.
--bam-danh sách
Cung cấp tệp chứa tên mẫu và vị trí BAM bình thường / khối u cho mỗi. Sử dụng
định dạng được phân tách bằng tab [tên_mẫu_bình_bình_băm] trên mỗi dòng. Thêm vào
các cột như dữ liệu lâm sàng được phép, nhưng bị bỏ qua. Tên_mẫu phải giống nhau
là tên mẫu khối u được sử dụng trong tệp MAF (cột thứ 16, với tiêu đề
Khối u_Mẫu_Mã vạch).
--output-dir
Chỉ định một thư mục đầu ra sẽ được tạo / ghi: roi_covgs:
Thư mục con chứa số lượng cơ sở được bao phủ trên mỗi ROI cho mỗi mẫu. gene_covgs:
Thư mục con chứa số lượng cơ sở được bao phủ trên mỗi gen cho mỗi mẫu. total_covgs:
Tệp chứa các giá trị trung bình tổng thể không chồng chéo cho mỗi mẫu.
--cmd-list-file
Chỉ định một tệp mà danh sách các công việc calcRoiCovg sẽ được ghi vào. Đây có thể là
được lập lịch song song và sẽ ghi số cơ sở được bao phủ trên mỗi ROI vào đầu ra
thư mục con roi_covgs. Nếu cmd-list-file không được chỉ định, tập lệnh này sẽ chạy
calcRoiCovg lần lượt cho mỗi mẫu, mất ~ 30 phút cho mỗi mẫu, nhưng nó bỏ qua
các mẫu có đầu ra đã ở trong roi_covgs.
- tiền tốcmd
Chỉ định một lệnh đệ trình công việc sẽ được đặt trước cho mỗi lệnh trong cmd-list-
tập tin. Điều này làm cho việc gửi hàng loạt dễ dàng hơn. Chỉ cần chạy tệp cmd-list-file dưới dạng shell
kịch bản để gửi công việc. tiền tố cmd là "bsub" nếu cụm của bạn sử dụng công việc LSF
bộ lập lịch hoặc "qsub" trong Torque. Thêm đối số nếu cần. Ví dụ: "bsub -M 4GB"
đặt giới hạn bộ nhớ mềm là 4GB.

Sử dụng gmt-music-bmr-calc-covgp trực tuyến bằng các dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

Lệnh Linux

Ad