cdhit-454 - Trực tuyến trên đám mây

Đây là lệnh cdhit-454 có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình mô phỏng trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


cd-hit-454 - nhóm nhanh các chuỗi, được tối ưu hóa cho dữ liệu 454

SYNOPSIS


cdhit-454 [Các lựa chọn]

MÔ TẢ


====== CD-HIT phiên bản 4.6 (được xây dựng vào ngày 23 tháng 2016 năm XNUMX) ======

Các lựa chọn

-i tên tệp đầu vào ở định dạng fasta, bắt buộc

-o tên tệp đầu ra, bắt buộc

-c ngưỡng nhận dạng trình tự, mặc định 0.98 đây là "nhận dạng trình tự toàn cầu"
được tính bằng: số lượng axit amin giống hệt nhau thẳng hàng chia cho toàn bộ
độ dài của chuỗi ngắn hơn + khoảng trống

-b băng thông của căn chỉnh, mặc định 10

-M giới hạn bộ nhớ (tính bằng MB) cho chương trình, mặc định 800; 0 cho không được phép;

-T số lượng chủ đề, mặc định 1; với 0, tất cả các CPU sẽ được sử dụng

-n word_length, mặc định 10, xem hướng dẫn người dùng để chọn nó

-aL phạm vi căn chỉnh cho chuỗi dài hơn, mặc định 0.0 nếu được đặt thành 0.9,
sự liên kết phải bao gồm 90% trình tự

-AL điều khiển phạm vi căn chỉnh cho chuỗi dài hơn, mặc định 99999999 nếu được đặt thành 60,
và độ dài của dãy là 400, thì căn chỉnh phải> = 340 (400-60)
cặn bã

-như phạm vi căn chỉnh cho chuỗi ngắn hơn, mặc định 0.0 nếu được đặt thành 0.9,
sự liên kết phải bao gồm 90% trình tự

-NHƯ kiểm soát phạm vi căn chỉnh cho chuỗi ngắn hơn, mặc định 99999999 nếu được đặt thành 60,
và độ dài của dãy là 400, thì căn chỉnh phải> = 340 (400-60)
cặn bã

-B 1 hoặc 0, mặc định 0, theo mặc định, các chuỗi được lưu trữ trong RAM nếu được đặt thành 1, chuỗi
được lưu trữ trên ổ cứng, nó được khuyến khích sử dụng -B 1 cho cơ sở dữ liệu khổng lồ

-g 1 hoặc 0, mặc định là 0 theo thuật toán mặc định của cd-hit, một chuỗi được nhóm thành
cụm đầu tiên đáp ứng ngưỡng (cụm nhanh). Nếu được đặt thành 1, chương trình sẽ
nhóm nó thành một cụm tương tự nhất đáp ứng ngưỡng (chính xác nhưng chậm
chế độ) nhưng 1 hoặc 0 sẽ không thay đổi đại diện của các cụm cuối cùng

-D kích thước tối đa cho mỗi indel, mặc định 1

-trận đấu điểm phù hợp, mặc định 2

-không khớp
điểm không khớp, mặc định -1

-khoảng cach tỷ số mở khoảng cách, mặc định -3

-gap-ext
điểm số mở rộng khoảng cách, mặc định -1

-thùng rác ghi tệp cụm sao lưu (1 hoặc 0, mặc định là 0)

-h in cái này giúp

Các câu hỏi, lỗi, hãy liên hệ với Weizhong Li tại liwz@sdsc.edu

Nếu bạn thấy cd-hit hữu ích, vui lòng trích dẫn:

"Tập hợp các trình tự tương đồng cao để giảm kích thước của protein lớn
cơ sở dữ liệu ", Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Tin sinh học, (2001)
17: 282-283 "Cd-hit: một chương trình nhanh chóng để phân nhóm và so sánh các tập hợp lớn
trình tự protein hoặc nucleotide ", Weizhong Li & Adam Godzik. Tin sinh học, (2006)
22:1658-1659 "Beifang Niu, Limin Fu, Shulei Sun và Weizhong Li. Nhân tạo và
các bản sao tự nhiên trong quá trình đọc dữ liệu metagenomic theo trình tự pyro. Tin sinh học BMC
(2010) 11: 187

Sử dụng cdhit-454 trực tuyến bằng dịch vụ onworks.net



Các chương trình trực tuyến Linux & Windows mới nhất