hmmsearch - Trực tuyến trên đám mây

Chạy hmmsearch trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks qua Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh hmmsearch có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Chạy trong Ubuntu Chạy trong Fedora Chạy trong Windows Sim Chạy trong MACOS Sim

CHƯƠNG TRÌNH:

TÊN

hmmsearch - (các) hồ sơ tìm kiếm dựa trên cơ sở dữ liệu trình tự

SYNOPSIS

hmmtìm kiếm [tùy chọn]

MÔ TẢ

hmmtìm kiếm được sử dụng để tìm kiếm một hoặc nhiều cấu hình dựa trên cơ sở dữ liệu trình tự. Cho mỗi
hồ sơ trong , sử dụng cấu hình truy vấn đó để tìm kiếm cơ sở dữ liệu mục tiêu của các chuỗi trong
và xuất ra danh sách xếp hạng của các chuỗi có các kết quả phù hợp nhất với
Hồ sơ. Để tạo hồ sơ từ nhiều căn chỉnh, hãy xem hmmm xây dựng.

Cả truy vấn hoặc mục tiêu có thể là '-' (một ký tự gạch ngang), trong đó
trong trường hợp hồ sơ truy vấn hoặc đầu vào cơ sở dữ liệu đích sẽ được đọc từ đường ống thay thế
trong tổng số từ một tệp. Chỉ một nguồn đầu vào có thể đi qua , không phải cả hai. Một ngoại lệ là
rằng nếu chứa nhiều hơn một truy vấn hồ sơ, sau đó không thể đến từ
, bởi vì chúng tôi không thể tua lại cơ sở dữ liệu mục tiêu phát trực tuyến để tìm kiếm nó bằng
Hồ sơ.

Định dạng đầu ra được thiết kế để con người có thể đọc được, nhưng thường quá lớn nên
đọc nó là không thực tế, và phân tích nó là một nỗi đau. Các --tbout và --domtbout lựa chọn
lưu đầu ra ở định dạng bảng đơn giản ngắn gọn và dễ phân tích cú pháp hơn. Các -o tùy chọn
cho phép chuyển hướng đầu ra chính, bao gồm cả việc ném nó đi trong / dev / null.

LỰA CHỌN

-h Cứu giúp; in lời nhắc ngắn gọn về việc sử dụng dòng lệnh và tất cả các tùy chọn có sẵn.

LỰA CHỌN CHO KIỂM SOÁT OUTPUT

-o Hướng đầu ra chính mà con người có thể đọc được vào một tệp thay vì stdout mặc định.

-A Lưu nhiều sự liên kết của tất cả các lượt truy cập quan trọng (những lượt truy cập thỏa mãn đưa vào
ngưỡng) vào tệp .

--tbout
Lưu một tệp dạng bảng đơn giản (được phân cách bằng dấu cách) tóm tắt kết quả đầu ra cho mỗi mục tiêu,
với một dòng dữ liệu cho mỗi chuỗi mục tiêu tương đồng được tìm thấy.

--domtbout
Lưu một tệp dạng bảng đơn giản (được phân cách bằng dấu cách) tóm tắt kết quả đầu ra cho mỗi miền,
với một dòng dữ liệu cho mỗi miền tương đồng được phát hiện trong chuỗi truy vấn cho mỗi
mô hình tương đồng.

--NS Sử dụng quyền truy cập thay vì tên trong đầu ra chính, nếu có sẵn cho cấu hình
và / hoặc trình tự.

--noali
Bỏ qua phần căn chỉnh khỏi đầu ra chính. Điều này có thể làm giảm đáng kể sản lượng
âm lượng.

--notextw
Bỏ qua độ dài của mỗi dòng trong đầu ra chính. Mặc định là giới hạn 120
các ký tự trên mỗi dòng, giúp hiển thị đầu ra rõ ràng trên các thiết bị đầu cuối và
trong trình chỉnh sửa, nhưng có thể cắt bớt các dòng mô tả hồ sơ đích.

--textw
Đặt giới hạn độ dài dòng của đầu ra chính thành các ký tự trên mỗi dòng. Mặc định là
120.

LỰA CHỌN KIỂM SOÁT BÁO CÁO NGƯỠNG

Các ngưỡng báo cáo kiểm soát lần truy cập nào được báo cáo trong các tệp đầu ra (đầu ra chính,
--tboutvà --domtbout). Số lần truy cập theo trình tự và số lần truy cập tên miền được xếp hạng theo thống kê
mức ý nghĩa (giá trị E) và đầu ra được tạo thành hai phần được gọi là mỗi mục tiêu và mỗi
miền đầu ra. Trong đầu ra cho mỗi mục tiêu, theo mặc định, tất cả các chuỗi đều truy cập với giá trị E <= 10
được báo cáo. Trong đầu ra cho mỗi miền, cho mỗi mục tiêu đã vượt qua mỗi mục tiêu
các ngưỡng báo cáo, tất cả các miền đáp ứng các ngưỡng báo cáo cho mỗi miền đều được báo cáo.
Theo mặc định, đây là các miền có giá trị E có điều kiện là <= 10. Các tùy chọn sau
cho phép bạn thay đổi các ngưỡng báo cáo giá trị E mặc định hoặc sử dụng điểm bit
các ngưỡng thay thế.

-E Trong đầu ra cho mỗi mục tiêu, hãy báo cáo chuỗi mục tiêu có giá trị E là <= . Các
mặc định là 10.0, có nghĩa là trung bình, khoảng 10 kết quả dương tính giả sẽ được báo cáo
cho mỗi truy vấn, vì vậy bạn có thể thấy đầu của tiếng ồn và tự quyết định xem nó có
thực sự ồn ào.

-T Thay vì đặt ngưỡng đầu ra cho mỗi cấu hình trên E-value, hãy thay vào đó, hãy báo cáo mục tiêu
chuỗi có điểm bit> = .

--domE
Trong đầu ra trên mỗi miền, đối với các chuỗi mục tiêu đã thỏa mãn
ngưỡng báo cáo hồ sơ, báo cáo các miền riêng lẻ với giá trị E có điều kiện
trong số <= . Mặc định là 10.0. Giá trị E có điều kiện có nghĩa là số dự kiến
các tên miền dương tính giả bổ sung trong không gian tìm kiếm nhỏ hơn
so sánh đã thỏa mãn ngưỡng báo cáo trên mỗi mục tiêu (và do đó
phải có ít nhất một miền tương đồng rồi).

--domT
Thay vì đặt ngưỡng đầu ra cho mỗi miền trên E-value, hãy báo cáo các miền với
điểm bit của> = .

LỰA CHỌN CHO BAO GỒM NGƯỠNG

Ngưỡng đưa vào nghiêm ngặt hơn ngưỡng báo cáo. Kiểm soát ngưỡng bao gồm
lượt truy cập nào được coi là đủ tin cậy để được đưa vào căn chỉnh đầu ra hoặc
vòng tìm kiếm tiếp theo hoặc được đánh dấu là quan trọng ("!") thay vì nghi vấn ("?")
trong đầu ra miền.

--incE
Sử dụng giá trị E là <= làm ngưỡng bao gồm cho mỗi mục tiêu. Mặc định là
0.01, nghĩa là trung bình, sẽ có khoảng 1 dương tính giả trong mỗi
100 tìm kiếm với các chuỗi truy vấn khác nhau.

--incT
Thay vì sử dụng các giá trị E để đặt ngưỡng bao gồm, hãy sử dụng một chút
điểm> = làm ngưỡng bao gồm cho mỗi mục tiêu. Theo mặc định, tùy chọn này là
không đặt.

--incdomE
Sử dụng giá trị E có điều kiện là <= là ngưỡng bao gồm cho mỗi miền, trong
mục tiêu đã thỏa mãn ngưỡng bao gồm tổng thể cho mỗi mục tiêu.
Giá trị mặc định là 0.01.

--incdomT
Thay vì sử dụng giá trị E, hãy sử dụng điểm bit> = như bao gồm mỗi miền
Ngưỡng.

LỰA CHỌN CHO MÔ HÌNH-CỤ THỂ SCORE NGƯỠNG

Cơ sở dữ liệu hồ sơ được sắp xếp có thể xác định các ngưỡng điểm bit cụ thể cho từng hồ sơ,
thay thế bất kỳ ngưỡng nào chỉ dựa trên ý nghĩa thống kê.

Để sử dụng các tùy chọn này, hồ sơ phải chứa (GA, TC và / hoặc NC) thích hợp
chú thích ngưỡng điểm tùy chọn; cái này được nhặt bởi hmmm xây dựng từ định dạng Stockholm
các tập tin căn chỉnh. Mỗi tùy chọn ngưỡng có hai điểm: ngưỡng cho mỗi trình tự
và ngưỡng cho mỗi miền Chúng hoạt động như thể -T --incT --domT
--incdomT đã được áp dụng cụ thể bằng cách sử dụng các ngưỡng được sắp xếp của từng mô hình.

--cut_ga
Sử dụng điểm số bit GA (tập hợp) trong mô hình để đặt cho mỗi chuỗi (GA1) và mỗi
các ngưỡng báo cáo và bao gồm miền (GA2). Các ngưỡng GA nói chung là
được coi là các ngưỡng được lựa chọn đáng tin cậy để xác định tư cách thành viên gia đình; vì
ví dụ, trong Pfam, các ngưỡng này xác định những gì được đưa vào Pfam Full
căn chỉnh dựa trên các tìm kiếm với các mô hình Pfam Seed.

--cut_nc
Sử dụng các ngưỡng điểm số bit NC (cắt tiếng ồn) trong mô hình để đặt cho mỗi chuỗi
(NC1) và trên mỗi miền (NC2) ngưỡng bao gồm và báo cáo. Ngưỡng NC là
thường được coi là điểm của dương tính giả có điểm số cao nhất đã biết.

--cut_tc
Sử dụng các ngưỡng điểm số bit TC (ngưỡng tin cậy) trong mô hình để đặt cho mỗi chuỗi
(TC1) và trên mỗi miền (TC2) ngưỡng bao gồm và báo cáo. Ngưỡng TC là
thường được coi là điểm của số tích cực thực sự được cho là điểm thấp nhất mà
là trên tất cả các trường hợp dương tính giả đã biết.

LỰA CHỌN KIỂM SOÁT CÁC SỰ TĂNG TỐC ĐƯỜNG ỐNG

Tìm kiếm HMMER3 được tăng tốc trong một đường ống bộ lọc ba bước: bộ lọc MSV,
Bộ lọc Viterbi và bộ lọc Chuyển tiếp. Bộ lọc đầu tiên là bộ lọc nhanh nhất và nhiều nhất
gần đúng; cuối cùng là thuật toán tính điểm Chuyển tiếp đầy đủ. Ngoài ra còn có một bộ lọc thiên vị
bước giữa MSV và Viterbi. Mục tiêu vượt qua tất cả các bước trong quy trình tăng tốc
sau đó sẽ được xử lý sau - xác định miền và cho điểm bằng cách sử dụng
Thuật toán Forward / Backward.

Việc thay đổi ngưỡng bộ lọc chỉ loại bỏ hoặc bao gồm các mục tiêu khỏi xem xét; thay đổi
ngưỡng bộ lọc không làm thay đổi điểm số bit, giá trị E hoặc căn chỉnh, tất cả đều
được xác định duy nhất trong xử lý hậu kỳ.

--max Tắt tất cả các bộ lọc, bao gồm cả bộ lọc thiên vị và chạy Tiến / lùi đầy đủ
xử lý hậu kỳ trên mọi mục tiêu. Điều này làm tăng độ nhạy phần nào, nói chung
chi phí trong tốc độ.

--F1
Đặt ngưỡng giá trị P cho bước lọc MSV. Giá trị mặc định là 0.02, nghĩa là
rằng khoảng 2% trong số các mục tiêu phi vật chất có điểm số cao nhất được mong đợi sẽ vượt qua
Bộ lọc.

--F2
Đặt ngưỡng giá trị P cho bước lọc Viterbi. Giá trị mặc định là 0.001.

--F3
Đặt ngưỡng giá trị P cho bước Bộ lọc chuyển tiếp. Giá trị mặc định là 1e-5.

--không thiên vị
Tắt bộ lọc thiên vị. Điều này làm tăng độ nhạy phần nào, nhưng có thể đến
chi phí cao về tốc độ, đặc biệt nếu truy vấn có thành phần dư lượng thiên vị (chẳng hạn như
một vùng trình tự lặp lại, hoặc nếu nó là một protein màng với các vùng lớn
kỵ nước). Nếu không có bộ lọc thiên vị, quá nhiều chuỗi có thể vượt qua bộ lọc
với các truy vấn thiên vị, dẫn đến hiệu suất chậm hơn mong đợi vì
Các thuật toán Chuyển tiếp / Lùi về mặt tính toán chuyên sâu về tính toán
tải.

KHÁC LỰA CHỌN

--nonul2
Tắt chỉnh sửa điểm null2 cho thành phần thiên vị.

-Z Khẳng định rằng tổng số mục tiêu trong các tìm kiếm của bạn là , cho các mục đích
các phép tính giá trị E trên mỗi chuỗi, thay vì số lượng mục tiêu thực tế
đã xem.

--domZ
Khẳng định rằng tổng số mục tiêu trong các tìm kiếm của bạn là , cho các mục đích
các phép tính giá trị E có điều kiện cho mỗi miền, thay vì số lượng mục tiêu
đã vượt qua ngưỡng báo cáo.

--hạt giống
Đặt hạt giống số ngẫu nhiên thành . Một số bước trong xử lý hậu kỳ yêu cầu Monte
Mô phỏng Carlo. Mặc định là sử dụng một hạt cố định (42), vì vậy kết quả là
chính xác có thể tái tạo. Bất kỳ số nguyên dương nào khác sẽ cho kết quả khác (nhưng cũng
có thể tái tạo) kết quả. Sự lựa chọn 0 sử dụng một hạt giống được chọn ngẫu nhiên.

--tformat
Khẳng định rằng tệp cơ sở dữ liệu trình tự đích có định dạng . Các định dạng được chấp nhận
bao gồm nhịn ăn, nhúng tay vào, ngân hàng gen, đbj, đơn nguyên, Stockholm, pfam, a2mvà afa. Các
mặc định là tự động phát hiện định dạng của tệp.

--CPU
Đặt số luồng công nhân song song thành . Theo mặc định, HMMER đặt điều này thành
số lõi CPU mà nó phát hiện trong máy của bạn - tức là nó cố gắng tối đa hóa
việc sử dụng các lõi bộ xử lý có sẵn của bạn. Thiết lập cao hơn số lượng
các lõi có sẵn rất ít nếu có giá trị, nhưng bạn có thể muốn đặt nó thành một cái gì đó
ít hơn. Bạn cũng có thể kiểm soát con số này bằng cách đặt một biến môi trường,
HMMER_NCPU.

Tùy chọn này chỉ khả dụng nếu HMMER được biên dịch với hỗ trợ luồng POSIX.
Đây là mặc định, nhưng nó có thể đã bị tắt vào lúc biên dịch cho trang web của bạn
hoặc máy vì một số lý do.

--ngăn cản
Để gỡ lỗi phiên bản chính / công nhân MPI: tạm dừng sau khi bắt đầu, để bật
nhà phát triển để đính kèm trình gỡ lỗi vào (các) quy trình chính và công nhân đang chạy. Gửi
Tín hiệu SIGCONT để giải phóng tạm dừng. (Theo gdb: (Gdb) tín hiệu NEXTCONT) (Chỉ một
khả dụng nếu hỗ trợ MPI tùy chọn được bật tại thời điểm biên dịch.)

--mpi Chạy ở chế độ chính / công nhân MPI, sử dụng mpirun. (Chỉ khả dụng nếu MPI tùy chọn
hỗ trợ đã được kích hoạt tại thời điểm biên dịch.)

Sử dụng hmmsearch trực tuyến bằng các dịch vụ onworks.net