Đây là lệnh cutadapt3 có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
cutadapt - trang hướng dẫn sử dụng cutadapt 1.8.3
MÔ TẢ
cutadapt phiên bản 1.8.3 Bản quyền © 2010-2015 Marcel Martin[email được bảo vệ]>
cutadapt loại bỏ trình tự bộ điều hợp khỏi các lần đọc trình tự thông lượng cao.
Cách sử dụng:
cắt thích ứng -a ADAPTOR [tùy chọn] [-o output.fastq] input.fastq
Trong kết thúc cặp đọc:
cắt thích ứng -a THÍCH ỨNG1 -A ADAPT2 [tùy chọn] -o out1.fastq -p out2.fastq in1.fastq
in2.fastq
Thay thế "ADAPTOR" bằng trình tự thực tế của bộ chuyển đổi 3 'của bạn. Các ký tự đại diện IUPAC
được hỗ trợ. Phần bổ sung ngược lại * không * được tìm kiếm tự động. Tất cả các lần đọc từ
input.fastq sẽ được ghi vào output.fastq với trình tự bộ điều hợp bị loại bỏ. Bộ chuyển đổi
so khớp có thể chịu được lỗi. Nhiều trình tự bộ điều hợp có thể được đưa ra (sử dụng thêm -a
tùy chọn), nhưng chỉ bộ điều hợp phù hợp nhất mới bị xóa.
Đầu vào cũng có thể ở định dạng FASTA. Đầu vào và đầu ra nén được hỗ trợ và
tự động phát hiện từ tên tệp (.gz, .xz, .bz2). Sử dụng tên tệp '-' cho tiêu chuẩn
đầu ra đầu vào. Không có -o tùy chọn, đầu ra được gửi đến đầu ra tiêu chuẩn.
Một số khác có sẵn Tính năng, đặc điểm là:
* Nhiều loại bộ điều hợp khác (bộ điều hợp 5 ', bộ điều hợp "hỗn hợp" 5' / 3 ', v.v.) *
Cắt tỉa một số lượng cơ sở cố định * Cắt chất lượng * Cắt các lần đọc không gian màu *
Lọc các lần đọc theo nhiều tiêu chí khác nhau
Sử dụng "cutadapt --Cứu giúp"để xem tất cả các tùy chọn dòng lệnh. Xem
http://cutadapt.readthedocs.org/ để có đầy đủ tài liệu.
LỰA CHỌN
--phiên bản
hiển thị số phiên bản của chương trình và thoát
-h, --Cứu giúp
hiển thị thông báo trợ giúp này và thoát
-f ĐỊNH DẠNG, --định dạng=FORMAT
Định dạng tệp đầu vào; có thể là 'fasta', 'fastq' hoặc 'sra-fastq'. Bỏ qua khi
đọc tệp csfasta / Qual (mặc định: tự động phát hiện từ phần mở rộng tên tệp).
Các tùy chọn ảnh hưởng đến cách tìm thấy bộ điều hợp:
Mỗi tham số trong ba tham số sau (-a, -b, -g) có thể được sử dụng nhiều lần và
trong bất kỳ sự kết hợp nào để tìm kiếm toàn bộ bộ điều hợp có thể khác
các loại. Chỉ bộ điều hợp phù hợp nhất mới được cắt khỏi mỗi lần đọc (nhưng hãy xem
- thời gian Lựa chọn). Thay vì đưa bộ điều hợp trực tiếp, bạn cũng có thể viết
tệp: FILE và trình tự bộ điều hợp sẽ được đọc từ FILE đã cho (phải là
ở định dạng FASTA).
-a ADAPTOR, --dapter=Bộ chuyển đổi
Trình tự của bộ điều hợp được nối với đầu 3 '. Bản thân bộ điều hợp và
bất cứ điều gì sau đó được cắt bỏ. Nếu chuỗi bộ điều hợp kết thúc bằng '$'
ký tự, bộ điều hợp được neo vào cuối phần đọc và chỉ được tìm thấy nếu nó là
hậu tố của bài đọc.
-g ADAPTOR, --đằng trước=Bộ chuyển đổi
Trình tự của một bộ điều hợp được nối với đầu 5 '. Nếu trình tự bộ điều hợp
bắt đầu bằng ký tự '^', bộ điều hợp là 'neo'. Bộ điều hợp được cố định phải
xuất hiện toàn bộ ở cuối 5 'của bài đọc (nó là tiền tố của bài đọc). MỘT
bộ điều hợp không được cố định có thể xuất hiện một phần ở đầu 5 'hoặc nó có thể xuất hiện trong
đọc. Nếu nó được tìm thấy trong một lần đọc, trình tự trước bộ điều hợp cũng là
cắt tỉa. Trong mọi trường hợp, bản thân bộ điều hợp bị cắt.
-b ADAPTOR, - ở bất cứ đâu=Bộ chuyển đổi
Trình tự của bộ điều hợp được nối với đầu 5 'hoặc 3'. Nếu bộ điều hợp là
được tìm thấy trong phần đã đọc hoặc chồng chéo vào phần cuối 3 'của phần đọc, hành vi là
giống như đối với -a Lựa chọn. Nếu bộ điều hợp chồng lên đầu 5 '(đầu của
đọc), phần đầu tiên của nội dung đọc khớp với bộ điều hợp được cắt bớt, nhưng
bất cứ điều gì sau đó được giữ lại.
-e ERROR_RATE, - tỷ lệ lỗi=ERROR_RATE
Tỷ lệ lỗi tối đa cho phép (số lỗi chia cho độ dài của khớp
vùng) (mặc định: 0.1)
--no-indels
Không cho phép các indels trong căn chỉnh (chỉ cho phép các trường hợp không khớp). Hiện tại chỉ
được hỗ trợ cho các bộ điều hợp cố định. (mặc định: cho phép cả giá trị không khớp và dấu ấn)
-n ĐẾM, - thời gian=ĐẾM
Cố gắng xóa bộ điều hợp nhiều nhất COUNT lần. Hữu ích khi một bộ điều hợp được thêm vào
nhiều lần (mặc định: 1).
-O CHIỀU DÀI, --chồng chéo=LENGTH
Chiều dài chồng chéo tối thiểu. Nếu phần trùng lặp giữa đầu đọc và bộ điều hợp ngắn hơn
hơn LENGTH, bài đọc không được sửa đổi. Điều này làm giảm số không. trong số các cơ sở được cắt tỉa hoàn toàn
do các trận đấu bộ điều hợp ngẫu nhiên ngắn (mặc định: 3).
--match-read-ký tự đại diện
Cho phép ký tự đại diện IUPAC trong lần đọc (mặc định: Sai).
-N, --no-match-adapter-ký tự đại diện
Không giải thích các ký tự đại diện IUPAC trong bộ điều hợp.
Các tùy chọn để lọc các lần đọc đã xử lý:
- đĩa đã cắt, --card
Loại bỏ các lần đọc có chứa bộ điều hợp thay vì cắt chúng. Cũng sử dụng -O in
để tránh vứt bỏ quá nhiều lần đọc trùng khớp ngẫu nhiên!
--discard-unrimmed, --trimmed-chỉ
Loại bỏ các lần đọc không chứa bộ điều hợp.
-m CHIỀU DÀI, --chiều dài tối thiểu=LENGTH
Hủy các nội dung đã đọc ngắn hơn LENGTH. Các bài đọc quá ngắn ngay cả
trước khi loại bỏ bộ điều hợp cũng bị loại bỏ. Trong không gian màu, lớp sơn lót ban đầu không
được tính (mặc định: 0).
-M CHIỀU DÀI, --chiều dài tối đa=LENGTH
Hủy các nội dung đã đọc có thời lượng dài hơn LENGTH. Các bài đọc quá dài ngay cả
trước khi loại bỏ bộ điều hợp cũng bị loại bỏ. Trong không gian màu, lớp sơn lót ban đầu không
được tính (mặc định: không giới hạn).
- không cắt
Khớp và chuyển hướng đọc đến đầu ra / đầu ra không bị cắt như bình thường, nhưng không loại bỏ
bộ điều hợp.
--max-n=LENGTH
Tỷ lệ N tối đa được phép trong một lần đọc. Một số <1 sẽ được coi là
tỷ lệ trong khi một số> 1 sẽ được coi là số N tối đa
chứa.
- mặt nạ-bộ chuyển đổi
Bộ điều hợp mặt nạ với các ký tự 'N' thay vì cắt chúng.
Các tùy chọn ảnh hưởng đến những gì được đầu ra đến nơi:
--Yên lặng
Không in một báo cáo ở cuối.
-o TẬP TIN, - đầu ra=FILE
Viết các lần đọc đã sửa đổi vào FILE. Định dạng FASTQ hoặc FASTA được chọn tùy thuộc vào đầu vào.
Báo cáo tóm tắt được gửi đến đầu ra tiêu chuẩn. Sử dụng '{name}' trong FILE để phân kênh
đọc thành nhiều tệp. (mặc định: các lần đọc được cắt bớt được ghi vào đầu ra tiêu chuẩn)
--info-tệp=FILE
Viết thông tin về mỗi lần đọc và bộ điều hợp của nó phù hợp vào FILE. Xem
tài liệu cho định dạng tệp.
-r TẬP TIN, --rest-file=FILE
Khi bộ điều hợp khớp ở giữa phần đọc, hãy ghi phần còn lại (sau dấu
bộ chuyển đổi) thành FILE.
--wildcard-tệp=FILE
Khi bộ điều hợp có các cơ sở ký tự đại diện ('N), hãy ghi các cơ sở bộ điều hợp khớp với ký tự đại diện
các vị trí cần FILE. Khi có các indels trong căn chỉnh, điều này thường sẽ không
chính xác
- đầu ra ngắn hạn=FILE
Viết các lần đọc quá ngắn (theo độ dài được chỉ định bởi -m) nộp.
(mặc định: loại bỏ các lần đọc)
- đầu ra dài hạn=FILE
Viết các lần đọc quá dài (theo độ dài được chỉ định bởi -M) nộp.
(mặc định: loại bỏ các lần đọc)
--untrimmed-đầu ra=FILE
Ghi các lần đọc không chứa bộ điều hợp thành FILE. (mặc định: xuất ra cùng một tệp
như những lần đọc đã được cắt xén)
Các sửa đổi bổ sung đối với các bài đọc:
-u CHIỀU DÀI, --cắt=LENGTH
Loại bỏ các cơ sở LENGTH từ đầu hoặc cuối mỗi bài đọc. Nếu LENGTH là dương,
các cơ sở được xóa khỏi đầu mỗi lần đọc. Nếu LENGTH là âm,
bazơ được xóa khỏi phần cuối của mỗi bài đọc. Tùy chọn này có thể được chỉ định hai lần nếu
các CHIỀU DÀI có các dấu hiệu khác nhau.
-q [5'CUTOFF,] 3'CUTOFF, - giới hạn chất lượng=[5'CUTOFF,] 3'CUTOFF
Cắt các đế chất lượng thấp từ các đầu đọc 5 'và / hoặc 3' trước khi tháo bộ điều hợp. Nếu như
một giá trị được đưa ra, chỉ phần cuối 3 'được cắt bớt. Nếu hai dấu phân cách bằng dấu phẩy thì
đã cho, đầu 5 'được cắt bằng phần cắt đầu tiên, phần cuối 3' bằng phần thứ hai. Các
thuật toán giống như thuật toán được BWA sử dụng (xem tài liệu). (mặc định: không
cắt tỉa)
- chất lượng-cơ sở=Quality_BASE
Giả sử rằng các giá trị chất lượng được mã hóa dưới dạng ascii (chất lượng + CHẤT LƯỢNG_BASE). Các
mặc định (33) thường đúng, ngoại trừ các lần đọc được tạo ra bởi một số phiên bản của
Đường ống Illumina, nơi điều này sẽ được đặt thành 64. (Mặc định: 33)
--trim-n
Cắt chữ N ở phần cuối của số lần đọc.
-x TIẾP ĐẦU NGỮ, --tiếp đầu ngữ=TIẾP ĐẦU NGỮ
Thêm tiền tố này để đọc tên
-y HẬU VỆ, --hậu tố=HẬU VỆ
Thêm hậu tố này để đọc tên
hậu tố --strip=STRIP_SUFFIX
Xóa hậu tố này khỏi các tên đã đọc nếu có. Có thể cho nhiều lần.
-c, --không gian màu
Chế độ không gian màu: Cũng cắt bớt màu bên cạnh bộ điều hợp được tìm thấy.
-d, - mã hóa kép
Khi ở trong không gian màu, mã hóa kép các màu (ánh xạ 0,1,2,3,4 thành A, C, G, T, N).
-t, --trim-sơn lót
Khi ở trong không gian màu, cắt lớp nền sơn lót và màu đầu tiên (là phần chuyển tiếp
đến nucleotide đầu tiên)
--dải-f3
Đối với không gian màu: Bỏ hậu tố _F3 của tên đã đọc
--maq, --bwa
Đầu ra không gian màu tương thích MAQ- và BWA. Điều này cho phép -c, -d, -t, --dải-f3 và
-y '/ 1'.
--thẻ dài=TAG
Tìm kiếm TAG theo sau là một số thập phân trong trường mô tả của bài đọc.
Thay thế số thập phân bằng độ dài chính xác của số đọc đã cắt. Vì
ví dụ, sử dụng --thẻ dài 'length =' để sửa các trường như 'length = 123'.
--no-zero-cap
Không thay đổi giá trị chất lượng âm thành không. Các giá trị chất lượng không gian màu của -1
sẽ xuất hiện dưới dạng khoảng trắng trong tệp FASTQ đầu ra. Vì nhiều công cụ có vấn đề
cùng với đó, chất lượng âm được chuyển đổi thành XNUMX khi cắt bớt dữ liệu không gian màu.
Sử dụng tùy chọn này để giữ các phẩm chất tiêu cực.
-z, --không giới hạn
Thay đổi giá trị chất lượng âm thành không. Điều này được bật theo mặc định khi
-c/ - không gian màu cũng được bật. Sử dụng tùy chọn trên để vô hiệu hóa nó.
Các tùy chọn đầu cuối được ghép nối:
Sản phẩm -A/ -G / -B / -U tùy chọn hoạt động giống như của họ -a/ -b / -g / -u đối trọng.
-A Bộ chuyển đổi
Bộ điều hợp 3 'được tháo ra khỏi đầu đọc thứ hai trong một cặp.
-G Bộ chuyển đổi
Bộ điều hợp 5 'được tháo ra khỏi đầu đọc thứ hai trong một cặp.
-B Bộ chuyển đổi
Bộ điều hợp 5 '/ 3 được tháo ra khỏi đầu đọc thứ hai trong một cặp.
-U LENGTH
Loại bỏ các cơ sở LENGTH từ đầu hoặc cuối mỗi bài đọc (xem --cắt).
-p TẬP TIN, - đầu ra theo cặp=FILE
Viết lần đọc thứ hai trong một cặp vào FILE.
--untrimmed-ghép nối-đầu ra=FILE
Ghi lần đọc thứ hai theo cặp vào FILE này khi không tìm thấy bộ điều hợp nào trong lần đầu tiên
đọc. Sử dụng tùy chọn này cùng với --untrimmed-đầu ra khi cắt tỉa ghép nối
đọc. (Mặc định: xuất ra cùng một tệp dưới dạng các lần đọc đã được cắt bớt.)
Sử dụng cutadapt3 trực tuyến bằng các dịch vụ onworks.net