Đây là lệnh abyss-pe có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
abyss-pe - lắp ráp các lần đọc thành contigs
SYNOPSIS
vực thẳm [TÙY CHỌN] ... [PARAMETER=VALUE ] ... [MAKE_TARGET] ...
MÔ TẢ
Tập hợp các lần đọc của các tệp đầu vào vào các contigs. Các bài đọc có thể ở FASTA, FASTQ,
định dạng qseq, export, SRA, SAM hoặc BAM và có thể được nén với gz, bz2 hoặc xz và có thể là
xỉn màu.
abyss-pe là một tập lệnh Makefile. Bất kỳ tùy chọn thực hiện nào cũng có thể được sử dụng với abyss-pe.
Thông số of vực thẳm
tên, TÊN CÔNG VIỆC
Tên của hội đồng này. Các giàn giáo kết quả sẽ được lưu trữ trong
$ {name} -scaffolds.fa.
in các tập tin đầu vào. Sử dụng biến này khi tập hợp dữ liệu từ một thư viện.
lib danh sách được trích dẫn của các tên thư viện kết thúc được ghép nối được phân tách bằng khoảng trắng. Sử dụng biến thể này
khi tập hợp dữ liệu từ nhiều thư viện đầu cuối được ghép nối. Đối với mỗi tên thư viện trong
lib, người dùng phải xác định một biến trên dòng lệnh có cùng tên,
cho biết các tệp đã đọc cho thư viện đó. Nhìn thấy VÍ DỤ bên dưới cho một bê tông
ví dụ về cách sử dụng.
pe danh sách các thư viện đầu cuối được ghép nối sẽ chỉ được sử dụng để hợp nhất các unitigs vào
điều chỉnh và sẽ không đóng góp vào trình tự đồng thuận.
mp danh sách các thư viện cặp mate sẽ được sử dụng cho giàn giáo. Thư viện cặp đôi
không đóng góp vào trình tự đồng thuận.
Dài danh sách các thư viện chuỗi dài sẽ được sử dụng để dàn dựng lại. chuỗi dài
thư viện không đóng góp vào trình tự đồng thuận.
se các tệp chứa các lần đọc một đầu
a số nhánh tối đa của bong bóng [2]
b chiều dài tối đa của bong bóng (bp) [10000]
c phạm vi bao phủ k-mer trung bình tối thiểu của một unitig [câu hỏi(Trung bình)]
d sai số cho phép của một ước tính khoảng cách (bp) [6]
e độ che phủ k-mer xói mòn tối thiểu [câu hỏi(Trung bình)]
E độ che phủ k-mer xói mòn tối thiểu trên mỗi sợi [1]
j số lượng chủ đề [2]
k kích thước của k-mer (khi K không được đặt) hoặc khoảng của cặp k-mer (khi K được đặt)
K kích thước của một k-mer duy nhất trong một cặp k-mer (bp)
l độ dài căn chỉnh tối thiểu của một lần đọc (bp) [k]
m chồng chéo tối thiểu của hai đơn vị (bp) [30]
n số lượng cặp tối thiểu cần thiết để xây dựng các đường viền [10]
N số lượng cặp tối thiểu cần thiết để xây dựng giàn giáo [n]
p nhận dạng trình tự tối thiểu của một bong bóng [0.9]
q chất lượng cơ bản tối thiểu khi cắt [3]
Cắt bỏ các cơ sở từ các đầu đọc có chất lượng nhỏ hơn q.
Q chất lượng cơ bản tối thiểu [0]
Ẩn tất cả các cơ sở đọc có chất lượng nhỏ hơn Q là `N '.
s kích thước unitig tối thiểu cần thiết để xây dựng contigs (bp) [200]
Chiều dài hạt ít nhất phải gấp đôi giá trị của k. Nếu trình tự nhiều hơn là
được lắp ráp hơn kích thước bộ gen mong đợi, hãy thử tăng s.
S kích thước khung tối thiểu cần thiết để xây dựng giàn giáo (bp) [s]
SS SS = - SS để lắp ráp ở chế độ dành riêng cho từng sợi
Yêu cầu tất cả các thư viện đều là thư viện RNA-Seq cụ thể từng sợi. Giả sử rằng
bài đọc đầu tiên trong một cặp bài đọc được ghi lại WRT các bảng điểm được sắp xếp theo trình tự.
t kích thước tiền boa tối thiểu (bp) [2k]
v v = -v để bật tính năng ghi nhật ký chi tiết
np, NSLOTS
số lượng quy trình của một tổ hợp MPI
mpirun con đường đến mpirun
căn chỉnh
Chương trình được sử dụng để căn chỉnh các giá trị đọc với đường viền [bản đồ].
Các giá trị được phép là: map, kaligner, bwa, bwasw, bowtie, bowtie2, dida. Xem
DIDA phần bên dưới để biết thêm thông tin về tùy chọn dida.
cs chuyển đổi các đường viền không gian màu thành các đường viền nucleotide sau khi lắp ráp
Các lựa chọn of làm cho
-n, - chạy thử
In các lệnh sẽ được thực thi, nhưng không thực hiện chúng.
Hãy mục tiêu cho vực thẳm
mặc định
Tương đương với `` số liệu thống kê về giàn giáo-chấm ''.
đơn vị
Lắp ráp các unitigs.
dấu chấm đơn vị
Đưa ra đồ thị chồng chéo unitig.
pe-sam Đầu cuối của bản đồ được ghép nối đọc tới các unitigs và xuất ra một tệp SAM. Tệp SAM sẽ chỉ
chứa ánh xạ các lần đọc tới các đường nét khác nhau và ID, trình tự và chất lượng đọc
chuỗi sẽ được thay thế bằng ký tự '*'.
pe-bam Map-end-end đọc cho các unitigs và xuất ra một tệp BAM. Tệp BAM sẽ chỉ
chứa ánh xạ các lần đọc tới các đường nét khác nhau và ID, trình tự và chất lượng đọc
chuỗi sẽ được thay thế bằng ký tự '*'.
chỉ số pe
Tạo chỉ mục của các unitigs được sử dụng bởi abyss-map.
đường viền
Lắp ráp contigs.
dấu chấm
Xuất ra đồ thị chồng chéo contig.
mp-sam Cặp đối tác ánh xạ đọc đến đường viền và xuất ra tệp SAM. Tệp SAM sẽ chỉ
chứa ánh xạ các lần đọc tới các đường nét khác nhau và ID, trình tự và chất lượng đọc
chuỗi sẽ được thay thế bằng ký tự '*'.
mp-bam Cặp đối tác ánh xạ đọc đến contigs và xuất ra tệp BAM. Tệp BAM sẽ chỉ
chứa ánh xạ các lần đọc tới các đường nét khác nhau và ID, trình tự và chất lượng đọc
chuỗi sẽ được thay thế bằng ký tự '*'.
mp-chỉ mục
Tạo chỉ mục của các đường viền được sử dụng bởi abyss-map.
giàn giáo
Lắp ráp giàn giáo.
giàn giáo-chấm
Xuất ra đồ thị chồng chéo giàn giáo.
mảnh vụn
Phá vỡ giàn giáo và tạo tệp AGP.
vết sẹo dài
Bán lại bằng cách sử dụng các khung lắp ráp RNA-Seq.
dấu chấm dài
Xuất ra đồ thị chồng chéo giàn RNA.
số liệu thống kê Hiển thị thống kê tiếp giáp lắp ráp.
giống cá lăng Loại bỏ các tệp trung gian.
phiên bản
Hiển thị phiên bản của abyss-pe.
phiên bản
Hiển thị các phiên bản của tất cả các chương trình được abyss-pe sử dụng.
giúp đỡ Hiển thị một thông báo hữu ích.
DIDA
ABySS hỗ trợ việc sử dụng DIDA (Căn chỉnh điều phối lập chỉ mục phân tán), dựa trên MPI
khung liên kết để tính toán sắp xếp trình tự trên nhiều máy. Để sử dụng
DIDA với ABySS, trước tiên hãy tải xuống và cài đặt DIDA từ
http://www.bcgsc.ca/platform/bioinfo/software/dida, sau đó chỉ định `dida` làm giá trị của
các căn chỉnh tham số để vực thẳm.
Liên quan đến DIDA vực thẳm thông số
DIDA_MPIRUN
Lệnh `mpirun` được sử dụng để chạy các công việc DIDA.
DIDA_RUN_OPTIONS
Các tùy chọn thời gian chạy như số luồng trên mỗi xếp hạng MPI và các giá trị cho môi trường
biến (ví dụ: PATH, LD_LIBRARY_PATH). Chạy `abyss-dida --help` để có danh sách
Tùy chọn có sẵn.
DIDA_OPTIONS
Các tùy chọn được chuyển trực tiếp đến tệp nhị phân DIDA. Ví dụ, điều này có thể được sử dụng
để kiểm soát ngưỡng độ dài căn chỉnh tối thiểu. Chạy `dida-wrapper --help` cho một
danh sách các tùy chọn có sẵn.
Bộ KH & ĐT Tương thích
Do sử dụng đa luồng, DIDA đã biết các vấn đề về bế tắc với OpenMPI. Sử dụng
thư viện MPICH MPI được khuyến khích mạnh mẽ khi chạy các tổ hợp với DIDA. Thử nghiệm
đã được thực hiện với MPICH 3.1.3, được biên dịch với --enable-thread = funneled.
THÍ DỤ
Cấu hình thời gian chạy được đề xuất cho DIDA là xếp hạng 1 MPI trên mỗi máy và 1 luồng trên mỗi
Lõi CPU. Ví dụ: để chạy một lắp ráp trên 3 nút cụm với 12 lõi mỗi nút, hãy thực hiện:
abyss-pe k = 64 name = ecoli in = 'read1.fa read2.fa' aligner = dida
DIDA_RUN_OPTIONS = '- j12' DIDA_MPIRUN = 'mpirun -np 3 -ppn 1 -bind-to board'
Ví dụ này sử dụng các tùy chọn dòng lệnh MPICH cho `mpirun`. Ở đây, `-np 3` chỉ ra
số lượng xếp hạng MPI, `-ppn 1` cho biết số lượng xếp hạng MPI trên mỗi" nút ", và
`-bind-to board` định nghĩa một" nút "là một bo mạch chủ (tức là một máy đầy đủ).
MÔI TRƯỜNG BIẾN
Bất kỳ tham số nào có thể được chỉ định trên dòng lệnh cũng có thể được chỉ định trong
biến môi trường.
PATH phải chứa thư mục nơi các tệp thực thi ABySS được cài đặt. Sử dụng `abyss-
pe phiên bản` để kiểm tra xem PATH có được định cấu hình chính xác hay không.
TMPDIR chỉ định một thư mục để sử dụng cho các tệp tạm thời
Scheduler hội nhập
ABySS tích hợp tốt với các bộ lập lịch công việc cụm, chẳng hạn như:
* SGE (Công cụ lưới mặt trời)
* Hệ thống hàng loạt di động (PBS)
* Cơ sở chia sẻ tải (LSF)
* Trình cân bằng tải của IBM
Các biến môi trường SGE JOB_NAME, SGE_TASK_ID và NSLOTS có thể được sử dụng để chỉ định
tên tham số, k và np, và tương tự cho các bộ lập lịch khác.
VÍ DỤ
Một kết thúc cặp thư viện
abyss-pe k = 64 name = ecoli in = 'read1.fa read2.fa'
nhiều kết thúc cặp thư viện
abyss-pe k = 64 name = ecoli lib = 'lib1 lib2' \
lib1='lib1_1.fa lib1_2.fa' lib2='lib2_1.fa lib2_2.fa' \
se = 'se1.fa se2.fa'
Kết thúc ghép nối và bạn đời thư viện
abyss-pe k = 64 name = ecoli lib = 'pe1 pe2' mp = 'mp1 mp2' \
pe1='pe1_1.fa pe1_2.fa' pe2='pe2_1.fa pe2_2.fa' \
mp1='mp1_1.fa mp1_2.fa' mp2='mp2_1.fa mp2_2.fa' \
se = 'se1.fa se2.fa'
Bao gồm Trình tự RNA Hội đồng
abyss-pe k = 64 name = ecoli lib = pe1 mp = mp1 long = long1 \
pe1='pe1_1.fa pe1_2.fa' mp1='mp1_1.fa mp1_2.fa' \
long1 = long1.fa
Bộ KH & ĐT
abyss-pe np = 8 k = 64 name = ecoli in = 'read1.fa read2.fa'
SGE
qsub -N ecoli -t 64 -pe openmpi 8 \
abyss-pe n = 10 in = 'read1.fa read2.fa'
Sử dụng abyss-pe trực tuyến bằng các dịch vụ onworks.net