Jest to polecenie hmmscan, które można uruchomić w bezpłatnym dostawcy hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS
PROGRAM:
IMIĘ
hmmscan - przeszukuj sekwencje białek w bazie danych profili białek
STRESZCZENIE
hmmskan [opcje]
OPIS
hmmskan służy do wyszukiwania sekwencji białek w zbiorach profili białek. Dla
każda sekwencja w , użyj tej sekwencji zapytań, aby przeszukać docelową bazę danych
profile w i wygeneruj rankingowe listy profili z najważniejszymi
pasuje do sekwencji.
Kurs może zawierać więcej niż jedną sekwencję zapytań. Może być w formacie FASTA lub
kilka innych popularnych formatów plików sekwencji (między innymi genbank, embl i uniprot) lub
w formatach plików wyrównań (sztokholm, wyrównana fasta i inne). Zobacz --qformat opcja
dla pełnej listy.
Kurs musi być wciśnięty za pomocą hmm naciśnij zanim będzie można go przeszukać za pomocą hmmskan.
Spowoduje to utworzenie czterech plików binarnych z rozszerzeniem .h3{fimp}.
Zapytanie może być „-” (znak myślnika), w takim przypadku sekwencje zapytania to
czytać z potok zamiast z pliku. ten nie można odczytać z a
stream, ponieważ musi mieć te cztery pomocnicze pliki binarne wygenerowane przez
hmm naciśnij.
Format wyjściowy został zaprojektowany tak, aby był czytelny dla człowieka, ale często jest tak obszerny, że
czytanie go jest niepraktyczne, a analizowanie go jest uciążliwe. ten --tblout i --domtblout Opcje
zapisywać dane wyjściowe w prostych formatach tabelarycznych, które są zwięzłe i łatwiejsze do przeanalizowania. The -o opcja
umożliwia przekierowanie głównego wyjścia, w tym wyrzucenie go do /dev/null.
OPCJE
-h Pomoc; wydrukuj krótkie przypomnienie o użyciu wiersza poleceń i wszystkich dostępnych opcjach.
OPCJE DLA KONTROLOWANIE WYDAJNOŚĆ
-o Skieruj główne czytelne dla człowieka wyjście do pliku zamiast domyślnego standardowego wyjścia.
--tblout
Zapisz prosty plik tabelaryczny (rozdzielony spacjami) podsumowujący dane wyjściowe dla każdego celu,
z jedną linią danych na każdy znaleziony homologiczny model docelowy.
--domtblout
Zapisz prosty plik tabelaryczny (rozdzielony spacjami) podsumowujący dane wyjściowe dla poszczególnych domen,
z jedną linią danych na domenę homologiczną wykrytą w sekwencji zapytania dla każdej
model homologiczny.
--pfamtblout
Zapisz szczególnie zwięzły plik tabelaryczny (rozdzielany spacjami) podsumowujący poszczególne
wynik docelowy, z jedną linią danych na każdy znaleziony homologiczny model docelowy.
--wg Użyj przystąpień zamiast nazw w głównych danych wyjściowych, jeśli są dostępne dla profili
i/lub sekwencje.
--noali
Pomiń sekcję wyrównania z głównego wyjścia. Może to znacznie zmniejszyć wydajność
objętość.
--notekstw
Ogranicz długość każdej linii w głównym wyjściu. Domyślny limit to 120
znaków na linię, co pomaga w czytelnym wyświetlaniu wyjścia na terminalach i
w edytorach, ale może skrócić linie opisu profilu docelowego.
--tekstw
Ustaw limit długości linii wyjścia głównego na znaków w wierszu. Wartość domyślna to
120.
OPCJE DLA RAPORTOWANIE PROGI
Progi raportowania kontrolują, które trafienia są raportowane w plikach wyjściowych (wyjście główne,
--tblout, --domtblout).
-E W wynikach dla poszczególnych celów zgłoś profile docelowe z wartością E <= ,
domyślna wartość to 10.0, co oznacza, że średnio zostanie zgłoszonych około 10 fałszywych alarmów
na zapytanie, dzięki czemu możesz zobaczyć szczyt szumu i sam zdecydować, czy jest
naprawdę hałas.
-T Zamiast określać wartość progową danych wyjściowych dla poszczególnych profili na podstawie wartości E, zamiast tego należy raportować cel
profile z wynikiem bitowym >= .
--kopuła
W wynikach dla domeny, dla profili docelowych, które już spełniły
próg raportowania profilu, zgłaszaj poszczególne domeny z warunkową wartością E
z <= . Wartość domyślna to 10.0. Warunkowa wartość E oznacza oczekiwaną liczbę
dodatkowych fałszywie dodatnich domen w mniejszej przestrzeni wyszukiwania niż te
porównania, które już spełniły próg raportowania dla poszczególnych profili (a tym samym
musi mieć już co najmniej jedną domenę homologiczną).
--domT
Zamiast progowania danych wyjściowych dla każdej domeny na podstawie wartości E, zamiast tego zgłaszaj domeny z a
wynik bitowy >= .
OPCJE DLA WŁĄCZENIE PROGI
Progi włączenia są bardziej rygorystyczne niż progi zgłaszania. Kontrola progów włączenia
które trafienia są uważane za wystarczająco wiarygodne, aby można je było uwzględnić w wyrównaniu wyjściowym lub a
kolejna runda poszukiwań. W hmmskan, który nie ma żadnych wyników wyrównania (np
hmmszukaj or phmmer) ani żadnych iteracyjnych etapów wyszukiwania (np Jackhmmer), progi włączenia
mają niewielki wpływ. Wpływają tylko na to, które domeny zostaną oznaczone jako istotne (!) lub
wątpliwe (?) w wynikach domeny.
--incE
Użyj wartości E <= jako próg włączenia dla celu. Wartość domyślna to
0.01, co oznacza, że średnio można się spodziewać około 1 fałszywego alarmu w każdym przypadku
100 wyszukiwań z różnymi sekwencjami zapytań.
--incT
Zamiast używać wartości E do ustawiania progu włączenia, zamiast tego użyj bitu
wynik >= jako próg włączenia na cel. Byłoby nietypowe w użyciu
progi wyniku bitowego za pomocą hmmskan, ponieważ nie oczekujesz ani jednego wyniku
próg do pracy dla różnych profili; różne profile mają nieznacznie
różne oczekiwane rozkłady wyników.
--incdomE
Użyj warunkowej wartości E równej <= jako próg włączenia dla domeny, w
cele, które już osiągnęły ogólny próg włączenia na cel.
Wartość domyślna to 0.01.
--incdomT
Zamiast używać wartości E, zamiast tego użyj wyniku bitowego >= jako na domenę
próg włączenia. Jak z --incT powyżej, użycie jednego bitu byłoby niezwykłe
próg punktacji w hmmskan.
OPCJE DLA SPECYFICZNY DLA MODELU SCORE PRÓG
Wyselekcjonowane bazy danych profili mogą definiować określone progi wyniku bitowego dla każdego profilu,
zastępując wszelkie wartości progowe oparte wyłącznie na istotności statystycznej.
Aby skorzystać z tych opcji, profil musi zawierać odpowiednie (GA, TC i/lub NC)
opcjonalna adnotacja o progu wyniku; to jest odbierane przez hmmbuduj z formatu sztokholmskiego
pliki wyrównania. Każda opcja progowania ma dwa wyniki: próg na sekwencję
oraz próg na domenę Te działają jak gdyby -T --incT --domT
--incdomT został zastosowany specjalnie przy użyciu ustalonych progów każdego modelu.
--cut_ga
Użyj wyników bitów GA (zbierania) w modelu, aby ustawić na sekwencję (GA1) i na
domena (GA2) progi raportowania i włączania. Progi GA są ogólnie
uważane za wiarygodne wyselekcjonowane progi określające przynależność do rodziny; Do
na przykład w Pfam te progi określają, co zostanie uwzględnione w Pfam Full
wyrównania na podstawie wyszukiwania z modelami Pfam Seed.
--cut_nc
Użyj progów wyniku bitowego NC (odcięcia szumu) w modelu, aby ustawić na sekwencję
(NC1) i dla domeny (NC2) progi raportowania i włączania. progi NC są
ogólnie uważany za wynik najwyższego wyniku znanego fałszywego alarmu.
--cut_tc
Użyj progów wyniku bitowego NC (zaufanego odcięcia) w modelu, aby ustawić dla każdej sekwencji
(TC1) i progi raportowania i włączenia dla domeny (TC2). Progi TC są
ogólnie uważa się, że jest to wynik najniższego znanego prawdziwie pozytywnego wyniku
to przede wszystkim znane fałszywe alarmy.
CONTROL OF THE PRZYŚPIESZENIE RUROCIĄG
Wyszukiwania HMMER3 są przyspieszane w trzyetapowym potoku filtrów: filtr MSV, filtr
Filtr Viterbiego i filtr Forward. Pierwszy filtr jest najszybszy i najbardziej
przybliżony; ostatni to pełny algorytm punktacji Forward. Jest też filtr biasu
krok między MSV a Viterbim. Elementy docelowe, które przejdą wszystkie etapy potoku przyspieszania
są następnie poddawane postprocessingowi — identyfikacji domeny i punktacji za pomocą
Algorytm do przodu/do tyłu.
Zmiana progów filtra usuwa lub uwzględnia tylko cele z rozważania; wymiana pieniędzy
progi filtrów nie zmieniają wyników bitowych, wartości E ani wyrównań, z których wszystkie są
ustalane wyłącznie w postprocessingu.
--maks Wyłącz wszystkie filtry, w tym filtr biasu, i uruchom pełne przewijanie do przodu/do tyłu
postprocessing na każdym celu. Zwiększa to nieco czułość, ogólnie
koszt w szybkości.
--F1
Ustaw próg wartości P dla kroku filtra MSV. Wartość domyślna to 0.02, co oznacza
oczekuje się, że około 2% niehomologicznych celów o najwyższej punktacji przejdzie pomyślnie
filtr.
--F2
Ustaw próg wartości P dla kroku filtra Viterbiego. Wartość domyślna to 0.001.
--F3
Ustaw próg wartości P dla kroku filtra do przodu. Wartość domyślna to 1e-5.
--nobias
Wyłącz filtr biasu. Zwiększa to nieco czułość, ale może osiągnąć ok
wysoki koszt szybkości, zwłaszcza jeśli zapytanie ma tendencyjny skład pozostałości (np
powtarzalnego regionu sekwencji lub jeśli jest to białko błonowe z dużymi regionami
hydrofobowość). Bez filtra odchylenia zbyt wiele sekwencji może przejść przez filtr
z tendencyjnymi zapytaniami, co prowadzi do wolniejszej niż oczekiwano wydajności, ponieważ
intensywne obliczeniowo algorytmy Forward/Backward są niezwykle ciężkie
załadować.
INNE OPCJE
--nonnull2
Wyłącz korekty wyniku null2 dla tendencyjnej kompozycji.
-Z Potwierdź, że łączna liczba celów w Twoich wyszukiwaniach wynosi , do celów
obliczeń wartości E na sekwencję, a nie rzeczywistą liczbę celów
widziany.
--dom Z
Potwierdź, że łączna liczba celów w Twoich wyszukiwaniach wynosi , do celów
warunkowych obliczeń wartości E dla poszczególnych dziedzin, a nie liczby celów
które przekroczyły progi zgłaszania.
--nasionko
Ustaw ziarno liczby losowej na . Niektóre etapy przetwarzania końcowego wymagają Monte
Symulacja Carla. Domyślnie używane jest stałe ziarno (42), więc wyniki są
dokładnie powtarzalny. Każda inna dodatnia liczba całkowita da inną (ale także
powtarzalne) wyniki. Wybór wartości 0 powoduje użycie dowolnie wybranego materiału siewnego.
--qformat
Sprawdź, czy plik sekwencji zapytań ma format . Akceptowane formaty obejmują
post, emblować, Genbank, ddbj, uniprot, Sztokholm, pfam, a2m, dziadek.
--procesor
Ustaw liczbę równoległych wątków roboczych na . Domyślnie HMMER ustawia to na
liczbę rdzeni procesora, które wykryje w twojej maszynie - to znaczy, że próbuje zmaksymalizować
wykorzystanie dostępnych rdzeni procesora. Ustawienie wyższa niż liczba
dostępnych rdzeni ma niewielką lub żadną wartość, ale możesz chcieć coś ustawić
mniej. Możesz także kontrolować tę liczbę, ustawiając zmienną środowiskową,
HMMER_NCPU.
Ta opcja jest dostępna tylko wtedy, gdy HMMER został skompilowany z obsługą wątków POSIX.
Jest to ustawienie domyślne, ale mogło zostać wyłączone dla Twojej witryny lub komputera
jakiś powód.
--stoisko
W przypadku debugowania wersji master/worker MPI: wstrzymaj po uruchomieniu, aby włączyć
programistę, aby dołączyć debugery do działających procesów głównych i roboczych. Wysłać
Sygnał SIGCONT zwalniający pauzę. (W gdb: (Gdb) sygnał SYGKONT)
(Dostępne tylko wtedy, gdy w czasie kompilacji włączono opcjonalną obsługę MPI.)
--mpi Uruchom w trybie master/pracownik MPI, używając mpiruna.
(Dostępne tylko wtedy, gdy w czasie kompilacji włączono opcjonalną obsługę MPI.)
Użyj hmmscan online, korzystając z usług onworks.net