Đây là lệnh nhỏ có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình mô phỏng trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
miniasm - trình biên dịch de novo cho các chuỗi đọc dài
SYNOPSIS
sự thu nhỏ [-b12V] [-m trận đấu tối thiểu] [-i phútIden] [-s khoảng cách tối thiểu] [-c phútCov] [-o phútOvlp] [-h
maxHang] [-I intThres] [-g maxGapDiff] [-d maxBubDist] [-e kích thước tối thiểuUtg] [-f Đọc tài liệu] [-n
nVòng] [-r tỷ lệ giảm] [-F tỷ lệ thả cuối cùng] [-p thông tin đầu ra] bản đồ.paf > đầu ra.gfa
MÔ TẢ
Miniasm là một trình biên dịch de novo dựa trên OLC rất nhanh để đọc những đoạn dài có nhiễu. Phải mất tất cả-vs-
tất cả đều đọc các bản đồ tự ánh xạ ở định dạng PAF làm đầu vào và đầu ra biểu đồ lắp ráp trong GFA
định dạng. Khác với các hãng lắp ráp thông thường, miniasm không có bước thống nhất. Nó
chỉ cần ghép các phần của chuỗi đọc để tạo ra chuỗi đơn vị cuối cùng. Như vậy
tỷ lệ lỗi trên mỗi cơ sở tương tự như số lần đọc đầu vào thô.
LỰA CHỌN
Bảo vệ trước lựa chọn
-m INT Thả ánh xạ có ít hơn INT các bazơ phù hợp (col10 trong PAF) [100]. Cái này
tùy chọn có vai trò tương tự như -L của bản đồ nhỏ.
-s INT Thả ánh xạ ngắn hơn INT-bp [1000]. Tùy chọn này cũng ảnh hưởng đến thứ hai
vòng lọc đọc và độ dài chồng chéo tối thiểu.
-i PHAO NỔI Trong quá trình lọc đọc, bỏ qua ánh xạ có col10/col11 bên dưới PHAO NỔI [0.05.
Ánh xạ bị bỏ qua vẫn được sử dụng để đọc chồng chéo.
-c INT Mức độ bao phủ tối thiểu của các lần đọc khác [3]. Ở vòng lọc đầu tiên, miniasm
tìm thấy khu vực dài nhất được bao phủ bởi INT hoặc nhiều lần đọc. Ở vòng thứ hai, nó
Ngoài ra, yêu cầu mỗi căn cứ còn lại phải được bao phủ bởi INT ít nhất là căn cứ
khoảng cách tối thiểu/2 từ phần cuối của các lần đọc khác.
Chồng chéo lựa chọn
-o INT Độ dài chồng chéo tối thiểu [giống như khoảng cách tối thiểu]
-h INT Chiều dài nhô ra tối đa [1000]. Phần nhô ra là một vùng chưa được lập bản đồ cần được
được ánh xạ để có sự chồng chéo thực sự hoặc ngăn chặn thực sự. Nếu phần nhô ra quá dài,
ánh xạ được coi là đối sánh nội bộ và sẽ bị bỏ qua.
-I PHAO NỔI Tỷ lệ tối thiểu của độ dài ánh xạ với ánh xạ + độ dài phần nhô ra cho ánh xạ
được coi là ngăn chặn hoặc chồng chéo [0.8]. Tùy chọn này có vai trò tương tự như
-h, ngoại trừ việc nó kiểm soát tỷ lệ chứ không phải độ dài.
Đồ thị bố trí lựa chọn
-g INT Chênh lệch khoảng cách tối đa giữa hai lần đọc trong ánh xạ [1000]. Thông số này là
chỉ được sử dụng để giảm chuyển tiếp.
-d INT Khoảng cách thăm dò tối đa để làm nổ bong bóng [50000]. Bong bóng dài hơn INT
sẽ không được bật lên.
-e INT Một đơn vị được coi là nhỏ nếu nó bao gồm ít hơn INT đọc [4].
Miniasm có thể cố gắng loại bỏ các đơn vị nhỏ ở nhiều bước khác nhau.
-f FILE Đọc tệp trình tự ở định dạng FASTA hoặc FASTQ để tạo chuỗi đơn vị
[vô giá trị]. Nếu tùy chọn này không có, miniasm sẽ tạo ra đầu ra GFA mà không có
trình tự.
-r FLOAT1,[FLOAT2]
Tỷ lệ giảm chồng lấp tối đa và tối thiểu [0.7,0.5]. Đặt chồng lấp (v->w) là chồng chéo
độ dài của cạnh v->w và maxovlp(v)=max_w{overlap(v->w)} là độ dài lớn nhất
chồng chéo. Mức giảm nhỏ nhất chồng lên nhau v->w nếu chồng chéo(v->w)/maxovlp(v) ở dưới a
ngưỡng được kiểm soát bởi tùy chọn này. Áp dụng sự tối giản nVòng vòng ngắn
loại bỏ chồng chéo với ngưỡng tăng dần giữa NỔI1 và NỔI2.
-n INT Vòng loại bỏ chồng chéo ngắn [3].
-F PHAO NỔI Ngưỡng tỷ lệ giảm chồng chéo sau khi loại bỏ đơn vị ngắn [0.8]
hỗn hợp lựa chọn
-b Chỉ ra rằng trong đầu vào, ánh xạ giống nhau có thể được đưa ra hai lần
-1 Bỏ qua vòng lựa chọn đọc trước khi lắp ráp đầu tiên
-2 Bỏ qua vòng lựa chọn đọc trước khi lắp ráp thứ hai
-p STR Thông tin đầu ra và định dạng [ug]. Khả thi STR các giá trị bao gồm - giường: bưu kiện-
các vùng đọc được lọc ở định dạng BED; PAF: ánh xạ giữa các bộ lọc sau
đọc; sg: đọc biểu đồ chồng chéo ở định dạng GFA; ug: đồ thị đơn vị trong GFA
định dạng.
-V In số phiên bản ra stdout
ĐẦU VÀO FORMAT
Miniasm đọc các vị trí ánh xạ ở Định dạng ánh xạ theo cặp (PAF), là TAB-
định dạng văn bản được phân tách với mỗi dòng bao gồm ít nhất 12 trường như được mô tả trong
bảng sau:
┌────┬─────────┬───────────────────────────────────── ────────────────────────────┐
│cổ áo │ Kiểu │ Mô tả │
├────┼─────────┼───────────────────────────────────── ────────────────────────────┤
│ 1 │ chuỗi │ Tên chuỗi truy vấn │
│ 2 │ int │ Độ dài chuỗi truy vấn │
│ 3 │ int │ Tọa độ bắt đầu truy vấn (dựa trên 0) │
│ 4 │ int │ Tọa độ kết thúc truy vấn (dựa trên 0) │
│ 5 │ char │ `+ 'nếu truy vấn và mục tiêu trên cùng một chuỗi; `- 'nếu ngược lại │
│ 6 │ chuỗi │ Tên chuỗi mục tiêu │
│ 7 │ int │ Độ dài chuỗi mục tiêu │
│ 8 │ int │ Tọa độ bắt đầu đích trên sợi ban đầu │
│ 9 │ int │ Tọa độ cuối mục tiêu trên sợi ban đầu │
│ 10 │ int │ Số lượng các cơ sở phù hợp trong ánh xạ │
│ 11 │ int │ Cơ sở số, bao gồm cả khoảng trống, trong ánh xạ │
│ 12 │ int │ Chất lượng ánh xạ (0-255 thiếu 255) │
└────┴─────────┴───────────────────────────────────── ────────────────────────────┘
Xin vui lòng xem bản đồ nhỏ(1) để biết mô tả chi tiết của từng lĩnh vực.
OUTPUT FORMAT
Miniasm xuất ra tập hợp ở định dạng Tập hợp mảnh đồ họa (GFA). Nó là một
định dạng được phân cách bằng TAB dựa trên dòng, với chữ cái đầu cho biết loại dòng.
Bảng sau đây cung cấp các loại đường được sử dụng bởi miniasm:
┌─────┬─────────────┬──────────────────── ───────── ───────────────────────┐
│Dòng │ Bình luận │ đã sửa các lĩnh vực │
├─────┼─────────────┼──────────────────── ───────── ───────────────────────┤
│ H │ Tiêu đề │ Không áp dụng │
│ S │ Phân đoạn │ segName segSeq │
│ L │ Chồng chéo │ segName1 segOri1 segName2 segOri2 ovlpCIGAR │
│ a │ Đường dẫn vàng │ utgName utgStart readName:start-end readOri length │
└─────┴─────────────┴──────────────────── ───────── ───────────────────────┘
Sử dụng miniasm trực tuyến bằng dịch vụ onworks.net