Jest to polecenie compseqe, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS
PROGRAM:
IMIĘ
compseq — Oblicz skład unikalnych słów w sekwencjach
STRESZCZENIE
komp -sekwencja następna [-w pliku w pliku] -słowo liczba całkowita [rama liczba całkowita] -ignorować boolean
-odwrócić boolean [-częst.oblicz boolean] -plik wyjściowy plik wyjściowy [-zero boolean]
komp -Pomoc
OPIS
komp to program wiersza poleceń firmy EMBOSS („The European Molecular Biology Open
Pakiet oprogramowania"). Jest częścią polecenia „Nucleic:Composition, Protein:Composition”.
grupa(y).
OPCJE
Wkład Sekcja
-sekwencja następna
-w pliku w pliku
Jest to plik utworzony wcześniej przez „compseq”, którego można użyć do ustawienia oczekiwanych wartości
częstotliwości słów w tej analizie. Rozmiar słowa w bieżącym przebiegu musi wynosić
taki sam jak ten w tym pliku wyników. Oczywiście powinieneś użyć pliku utworzonego z
sekwencje białek, jeśli liczysz częstotliwości słów sekwencji białek, a musisz
użyj tego utworzonego na podstawie częstotliwości nukleotydów, jeśli analizujesz sekwencję nukleotydów.
Wymagane Sekcja
-słowo liczba całkowita
Jest to rozmiar słowa (n-mer) do zliczenia. Zatem jeśli chcesz policzyć częstotliwości kodonów
w przypadku sekwencji nukleotydowej należy tutaj wpisać 3. Wartość domyślna: 2
Dodatkowy Sekcja
rama liczba całkowita
Normalnym zachowaniem „compseq” jest zliczanie częstotliwości wszystkich występujących słów
przesuwając za każdym razem okno długości „słowo” w górę o jeden. Ta opcja na to pozwala
Za każdym razem przesuwaj okno w górę o długość słowa, pomijając odstępy
słowa. Możesz policzyć tylko te słowa, które występują w jednej ramce słowa
ustawienie tej wartości na liczbę inną niż zero. Jeśli ustawisz na 1, będzie się to liczyło
słowa w ramce 1, 2 będą liczyć tylko słowa w ramce 2 i tak dalej.
-ignorować boolean
Kod aminokwasu B oznacza asparaginę lub kwas asparaginowy, a kod Z reprezentuje
Glutamina lub kwas glutaminowy. Nie są to powszechnie używane kody i możesz tego nie chcieć
policz słowa zawierające je, po prostu odnotowując je w liczbie słów „Inne”. Domyślny
wartość: T
-odwrócić boolean
Ustaw tę opcję jako true, jeśli chcesz także liczyć słowa w odwrotnym uzupełnieniu
sekwencja nukleinowa. Wartość domyślna: N
-częst.oblicz boolean
Jeśli ta opcja jest ustawiona na true, oczekiwana częstotliwość występowania słów jest obliczana na podstawie
obserwowana częstotliwość pojedynczych zasad lub reszt w sekwencjach. Jeśli zgłaszasz
słowo o rozmiarze 1 (pojedyncze zasady lub reszty), to nie ma sensu tego używać
opcję, ponieważ obliczona oczekiwana częstotliwość będzie równa obserwowanej
częstotliwość. Obliczenie oczekiwanych częstotliwości w ten sposób da przybliżenie
oczekiwanych częstotliwości, które można uzyskać, korzystając z pliku wejściowego częstotliwości
wyprodukowane w poprzednim uruchomieniu tego programu. Jeśli plik wejściowy oczekiwanego słowa
częstotliwości, wówczas zamiast tego zostaną użyte wartości z tego pliku
to obliczenie oczekiwanej częstotliwości z sekwencji, nawet jeśli ustawiono opcję „calcfreq”.
Mów prawdę. Wartość domyślna: N
Wydajność Sekcja
-plik wyjściowy plik wyjściowy
To jest plik wyników.
-zero boolean
Możesz znacznie zmniejszyć plik wyników wyjściowych, jeśli nie wyświetlasz słów za pomocą
licznik zerowy. Wartość domyślna: Y
Korzystaj z Compseqe online, korzystając z usług onworks.net