Đây là lệnh meryl có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
meryl - đếm kmer trong và ngoài lõi và các tiện ích
SYNOPSIS
Ước tính trí nhớ yêu cầu
thủy tinh -P -m kmersize [-c #] [-p] -s seq.fasta
thủy tinh -P -m kmersize [-c #] [-p] -n thương tiếc
Xây dựng a bàn
thủy tinh -B -m kmersize [-c #] [-p] [-v] [-f|-r|-C] [-L thiểu năng] [-U tối đa]
[-threads n | {-phân đoạn phân đoạn | -ký ức megabyte} [-configbatch [-sge tên công việc]]]
-s seq.fasta -o tiền tố tbl
thủy tinh -đếm con số [-sgebuild "chuỗi tùy chọn qsub"] -o tiền tố tbl
thủy tinh -mergebatch con số [-sgemerge "chuỗi tùy chọn qsub"] -o tiền tố tbl
Thực hiện hoạt động on a bàn
thủy tinh -M hoạt động [-v] -s tiền tố tbl [-s tblprefix2 ...] -o đầu ra
Bán phá giá a bàn
thủy tinh -H -s tiền tố tbl
thủy tinh -Dt -n số tiền tối thiểu -s tiền tố tbl
MÔ TẢ
thủy tinh tính toán hàm lượng kmer của trình tự bộ gen. Nội dung Kmer được thể hiện dưới dạng
danh sách các kmers và số lần mỗi lần xuất hiện trong các trình tự đầu vào. Kmer có thể được
chỉ giới hạn ở km tiến, chỉ km lùi hoặc km chính tắc
(nhỏ hơn về mặt từ vựng của kmer tiến và lùi tại mỗi vị trí). Meryl có thể
báo cáo biểu đồ số lượng, danh sách kmers và số lượng của chúng hoặc có thể thực hiện
toán học và các phép toán thiết lập trên các tệp dữ liệu đã xử lý.
Đầu ra của thủy tinh là hai tệp nhị phân, được gọi là cơ sở dữ liệu meryl, có thể nhanh chóng
được kết xuất để cung cấp biểu đồ về số lượng hoặc số lượng thực tế. Một thư viện C ++ được cung cấp
để truy cập trực tiếp vào các tệp.
LỰA CHỌN
-P Ước tính yêu cầu bộ nhớ. Cho một tệp trình tự (-s) hoặc giới hạn trên
số mers trong tệp (-n), tính toán kích thước bảng (-t đang xây dựng) để giảm thiểu
việc sử dụng bộ nhớ. Chế độ này nhận dạng các tùy chọn sau:
-m # kích thước của một mer (bắt buộc)
-c # nén homopolymer (tùy chọn)
-p cho phép các vị trí
-s seq.fasta
Tệp trình tự được quét để xác định số mers
-n # tập tin giả định compute params với nhiều mers này trong đó
Chỉ một trong số -s, -n cần phải được chỉ định. Nếu cả hai đều được đưa ra, -s được ưu tiên.
-B Tính toán các bảng đếm được đưa ra một tệp trình tự (-s) và rất nhiều thông số. Qua
mặc định, cả hai sợi đều được xử lý.
-f chỉ xây dựng cho sợi phía trước
-r chỉ xây dựng cho sợi ngược
-C sử dụng mers chuẩn (giả sử cả hai sợi)
-L # KHÔNG lưu các mers xảy ra ít hơn # lần
-U # KHÔNG lưu những người xảy ra nhiều hơn # lần
-m # kích thước của một mer (bắt buộc)
-c # nén homopolymer (tùy chọn)
-p cho phép các vị trí
-s seq.fasta
trình tự xây dựng bảng cho
-o tiền tố tbl
tiền tố bảng đầu ra
-v giải trí cho người dùng
Sản phẩm thủy tinh quy trình có thể chạy trong một lô bộ nhớ lớn, trong nhiều lô bộ nhớ nhỏ,
hoặc dưới sự kiểm soát của SGE, tất cả đều có hoặc không sử dụng nhiều lõi CPU. Theo mặc định,
việc tính toán được thực hiện như một quá trình tuần tự lớn. Hoạt động đa luồng
là có thể, với chi phí bộ nhớ bổ sung, cũng như hoạt động được phân đoạn, bổ sung
Chi phí I / O.
Có ren hoạt động
Chia số đếm thành n phần có kích thước gần như bằng nhau. Điều này sử dụng thêm
h MB (từ -P) trên mỗi chủ đề.
-threads n
sử dụng n chủ đề để xây dựng
Đã phân đoạn, tuần tự hoạt động
Chia số đếm thành nhiều phần vừa với không quá m MB
bộ nhớ, hoặc thành n phần có kích thước bằng nhau. Mỗi phần được tính toán tuần tự,
và kết quả được hợp nhất ở cuối. Chỉ một trong số -ký ức và -phân đoạn is
cần thiết.
-ký ức m
sử dụng nhiều nhất m MB bộ nhớ trên mỗi phân đoạn
-phân đoạn n
sử dụng n phân đoạn
Đã phân đoạn, nhiều đợt hoạt động
Tương tự như tuần tự, ngoại trừ điều này cho phép từng phân đoạn được thực thi theo cách thủ công
song song. Chỉ một trong số -ký ức và -phân đoạn là cần thiết. Cũng xem
THÍ DỤ phần trên trang này.
-ký ức m
sử dụng nhiều nhất m MB bộ nhớ trên mỗi phân đoạn
-phân đoạn n
sử dụng n phân đoạn
-configbatch
tạo các lô
-đếm n
chạy số lô n
-mergebatch
hợp nhất các lô
Chế độ hàng loạt có thể chạy trên lưới.
-sge tên công việc
tên công việc duy nhất cho việc thực hiện này. Meryl sẽ gửi công việc có tên
mptên công việc, nctên công việc, bước sóngtên công việc, cho các giai đoạn chuẩn bị, đếm và hợp nhất.
-sgebuild "tùy chọn"
-sgemerge "tùy chọn"
bất kỳ tùy chọn bổ sung nào để qsub(1) (ví dụ: "-p -153 -Thể dục chủ đề 2 -A
merylaccount ") NB - -N sẽ bị bỏ qua NB - hãy nhớ trích dẫn
lựa chọn
-M Đưa ra một danh sách các bảng, hãy thực hiện một phép toán, logic hoặc phép toán ngưỡng. Trừ phi
được chỉ định, tất cả các hoạt động lấy bất kỳ số lượng cơ sở dữ liệu nào. Các phép toán là:
phút số đếm là số lượng tối thiểu cho tất cả các cơ sở dữ liệu. Nếu hợp nhất KHÔNG tồn tại trong
tất cả cơ sở dữ liệu, mer có số XNUMX và KHÔNG có trong đầu ra.
thợ mỏ
count là số lượng tối thiểu cho tất cả các cơ sở dữ liệu có chứa mer
tối đa số lượng là số lượng tối đa cho tất cả các cơ sở dữ liệu
thêm vào số đếm là tổng số các số lượng cho tất cả các cơ sở dữ liệu
phụ số đếm là số đầu tiên trừ đi số thứ hai (chỉ nhị phân)
abs số đếm là giá trị tuyệt đối của giá trị đầu tiên trừ đi thứ hai (chỉ nhị phân)
Các phép toán logic là:
và kết quả đầu ra mer iff nó tồn tại trong tất cả các cơ sở dữ liệu
nand kết quả đầu ra mer iff nó tồn tại trong ít nhất một, nhưng không phải tất cả, cơ sở dữ liệu
or kết quả đầu ra mer iff nó tồn tại trong ít nhất một cơ sở dữ liệu
xor kết quả đầu ra mer iff nó tồn tại trong một số lẻ cơ sở dữ liệu
Các hoạt động ngưỡng là:
ít hơn x
kết quả đầu ra mer iff nó có số đếm <x
nhỏ hơn hoặc bằng x
kết quả đầu ra mer iff nó có số lượng <= x
lớn hơn x
kết quả đầu ra mer iff nó có số lượng> x
lớn hơn hoặc bằng x
kết quả đầu ra mer iff nó có số lượng> = x
như nhau x
kết quả đầu ra mer iff nó có số lượng == x
Các hoạt động ngưỡng hoạt động trên chính xác một cơ sở dữ liệu.
-s tiền tố tbl
sử dụng tiền tố tbl như một cơ sở dữ liệu
-o tiền tố tbl
tạo đầu ra này
-v giải trí cho người dùng
-D Bàn kết xuất (không phải tất cả những thứ này đều hoạt động)
-đ Kết xuất một biểu đồ về khoảng cách giữa những người giống nhau.
-Dt Bán phá giá> = một ngưỡng. Sử dụng -n để chỉ định ngưỡng.
-Dc Đếm số mers, mers riêng biệt và mers duy nhất.
-H Dump (thành stdout) một biểu đồ về số lượng mer.
-s Đọc bảng đếm từ đây (bỏ qua .mcdat hoặc .mcidx).
THÍ DỤ
Hàng loạt tạo of a bàn
Khởi tạo máy tính với -configbatch, cần tất cả các tùy chọn xây dựng. Thực thi tất cả
-đếm công việc, sau đó -mergebatch để hoàn thành.
thủy tinh -configbatch -B [tùy chọn] -o hồ sơ
thủy tinh -đếm 0 -o hồ sơ
thủy tinh -đếm 1 -o hồ sơ
...
thủy tinh -đếm N -o hồ sơ
thủy tinh -mergebatch N -o hồ sơ
Sử dụng meryl trực tuyến bằng các dịch vụ onworks.net