hmmbuild - онлайн у хмарі

Це команда hmmbuild, яку можна запустити у безкоштовного хостинг-провайдера OnWorks за допомогою однієї з наших безкоштовних онлайн-робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

ПРОГРАМА:

ІМ'Я


hmmbuild - побудувати профіль HMM з кількох послідовностей вирівнювання

СИНТАКСИС


hmmbuild [параметри]

ОПИС


Для кожного множинного вирівнювання послідовності в створити профіль HMM і зберегти його в новому
файл .

може бути '-' (тире), що означає читання цього введення з stdin а не файл.
Щоб використовувати «-», ви також повинні вказати формат файлу вирівнювання --інформація , як в
--інформація Стокгольм (через поточне обмеження в нашій реалізації файл MSA
формати не можна автоматично визначити у вхідному потоці без можливості перемотування.)

може не бути '-' (стандартний вихід), оскільки надсилання файлу HMM до stdout б
конфліктує з іншим текстовим виводом програми.

ВАРІАНТИ


-h Допомога; надрукувати коротке нагадування про використання командного рядка та всі доступні параметри.

-n Назвіть новий профіль . За замовчуванням використовується назва траси (якщо вона є
присутній в msafile, або, якщо цього немає, ім'я hmmфайл. Якщо msafile
містить більше ніж одне вирівнювання, -n не працює, і кожне вирівнювання має мати a
ім'я, зазначене в msafile (як у Stockholm #=GF ID анотації).

-o Спрямуйте вихідний підсумок у файл , а не до stdout.

-O Після створення кожної моделі повторно збережіть анотований, можливо, змінений джерело
вирівнювання до файлу у стокгольмському форматі. Вирівнювання позначені а
рядок посилальної анотації, що вказує, які стовпці були призначені консенсусними, і
послідовності анотовано тим, які відносні ваги послідовності були призначені. Дещо
залишки вирівнювання могли бути зміщені, щоб врахувати обмеження
Архітектура профілю Plan7, яка забороняє переходи між вставкою та видаленням
держави.

ВАРІАНТИ ДЛЯ УКАЗАННЯ THE АЛФАВИТ


Тип алфавіту (аміно, ДНК або РНК) автоматично визначається за замовчуванням, дивлячись на
склад в msafile. Автоматичне визначення зазвичай досить надійне, але іноді
тип алфавіту може бути неоднозначним, і автоматичне визначення може бути невдалим (наприклад, на крихітній іграшці
вирівнювання лише кількох залишків). Щоб уникнути цього або підвищити надійність автоматизованого
конвеєрів аналізу, ви можете вказати тип алфавіту msafile з цими параметрами.

--аміно
Вкажіть, що всі послідовності в msafile є білками.

--дна Вкажіть, що всі послідовності в msafile є ДНК.

--рна Вкажіть, що всі послідовності в msafile є РНК.

ВАРІАНТИ КОНТРОЛЬ ПРОФІЛЬ БУДІВНИЦТВО


Ці параметри визначають спосіб визначення консенсусних стовпців у вирівнюванні.

--швидко Визначте стовпці консенсусу як ті, які мають дріб >= симфрак залишків як
протиставляється прогалинам. (Див. нижче про --symfrac параметр.) Це значення за умовчанням.

--рука Визначте стовпці консенсусу в наступному профілі, використовуючи довідкову анотацію до множини
вирівнювання. Це дозволяє визначати будь-які консенсусні стовпці, які вам подобаються.

--symfrac
Визначте поріг фракції залишку, необхідний для визначення консенсусного стовпця, коли
використання --швидко варіант. За замовчуванням встановлено значення 0.5. Символьна частка в кожному стовпці дорівнює
обчислюється після врахування відносного зважування послідовності та ігнорування розриву
символи, що відповідають кінцям фрагментів послідовності (на відміну від внутрішніх
вставки/видалення). Встановлення значення 0.0 означає, що кожен стовпець вирівнювання буде
призначатися як консенсус, що може бути корисним у деяких випадках. Встановивши значення 1.0
означає, що будуть лише стовпці, які містять 0 пропусків (внутрішні вставки/видалення).
призначається як консенсус.

--fragthresh
Ми хочемо рахувати термінальні проміжки як видалення лише якщо відома вирівняна послідовність
бути повним, а не фрагментом (наприклад, тому що лише його частина
була секвенована). HMMER використовує просте правило для виведення фрагментів: якщо діапазон a
послідовність у вирівнюванні (кількість стовпців вирівнювання між першим і
останні позиції послідовності) менше або дорівнює частці разів
довжина вирівнювання в стовпцях, тоді послідовність обробляється як фрагмент. The
за замовчуванням 0.5. Налаштування --fragthresh0 визначатиме відсутність (непорожню) послідовність як a
фрагмент; ви можете зробити це, якщо знаєте, що у вас є ретельно підібраний
вирівнювання повнометражних секвенцій. Налаштування --fragthresh1 все визначить
послідовності як фрагменти; ви можете зробити це, якщо знаєте, що ваше вирівнювання є
повністю складається з фрагментів, таких як перекладені короткі читання в метагеномі
дані про дробовик.

ВАРІАНТИ КОНТРОЛЬ РОБОТИ Ваги


HMMER використовує спеціальний алгоритм зважування послідовності для зниження ваги тісно пов’язаних послідовностей
і ті, що мають віддалене споріднення. Це робить моделі менш упередженими
нерівномірне філогенетичне представлення. Наприклад, зазвичай дві ідентичні послідовності
кожен отримує половину ваги, ніж одна послідовність. Ці параметри контролюють, які
використовується алгоритм.

--wpb Використовуйте схему зважування послідовності на основі позиції Генікоффа [Henikoff and Henikoff,
J. Mol. біол. 243:574, 1994]. Це значення за замовчуванням.

--wgsc Використовуйте алгоритм зважування Gerstein/Sonnhammer/Chothia [Gerstein et al, J. Mol.
біол. 235:1067, 1994].

--wblosum
Використовуйте ту саму схему кластеризації, яка була використана для зважування даних при обчисленні BLOSUM
матриці підстановки [Henikoff and Henikoff, Proc. Natl. акад. Sci 89:10915, 1992].
Послідовності групуються по одному зв’язку на порозі ідентичності (за замовчуванням 0.62; див.
--шир) і в кожному кластері c послідовностей кожна послідовність отримує відносну вагу
1/c.

--немає
Відносних ваг немає. Усім послідовностям присвоюється однакова вага.

--шир
Встановлює поріг ідентичності, який використовується при однозв’язній кластеризації --wblosum.
Недійсний з будь-якою іншою схемою зважування. За замовчуванням 0.62.

ВАРІАНТИ КОНТРОЛЬ ЕФЕКТИВНО ПОСЛІДОВНІСТЬ НОМЕР


Після визначення відносних ваг вони нормалізуються до суми до загальної ефективної
порядковий номер, eff_nseq. Це число може бути фактичною кількістю послідовностей у
вирівнювання, але воно майже завжди менше. Зважування ентропії за замовчуванням
метод (--eent) зменшує ефективний порядковий номер, щоб зменшити вміст інформації
(відносна ентропія, або середня очікувана оцінка справжніх гомологів) на консенсусну позицію. The
цільова відносна ентропія контролюється функцією з двома параметрами, де два параметра
параметри встановлюються за допомогою -- Ось та --езигма.

--eent Налаштуйте ефективний порядковий номер для досягнення певної відносної ентропії за
положення (див -- Ось). Це значення за замовчуванням.

--екклюст
Встановіть ефективний порядковий номер на кількість кластерів з одним зв’язком у a
конкретний поріг ідентифікації (див -- Ід). Цей варіант не рекомендується; це для
експерименти, які оцінюють, наскільки краще --eent є.

--енон
Вимкніть ефективне визначення порядкового номера та просто використовуйте фактичну кількість
послідовності. Одна з причин, чому ви захочете це зробити, — спробувати максимізувати відносну
ентропія/позиція вашої моделі, що може бути корисно для коротких моделей.

--eset
Явно встановіть ефективний порядковий номер для всіх моделей .

-- Ось
Встановіть мінімальну відносну ентропію/ціль положення . Вимагає --eent. За замовчуванням
залежить від алфавіту послідовності. Для білкових послідовностей це 0.59 біт/позицію;
для нуклеотидних послідовностей це 0.45 біт/позицію.

--езигма
Встановлює мінімальну відносну ентропію, яку сприяє вирівнювання всієї моделі
на всю його довжину. Це призводить до того, що короткі моделі мають вищий відносний
ентропія на позицію ніж -- Ось один би дав. За замовчуванням – 45.0 біт.

-- Ід
Встановлює дробове попарне відсічення ідентичності, яке використовується для кластеризації одного зв’язку з
--екклюст варіант. За замовчуванням 0.62.

ВАРІАНТИ КОНТРОЛЬ Пріори


За замовчуванням зважені підрахунки перетворюються на параметр середньої апостеріорної ймовірності
оцінки з використанням суміші Діріхле. Стандартні параметри суміші Діріхле для
вбудовані моделі білків і моделі нуклеїнових кислот (РНК і ДНК). Наступне
Параметри дозволяють замінити стандартні параметри.

--pnone
Не використовуйте жодних пріорів. Параметри ймовірності будуть просто спостережуваними
частоти після зважування відносної послідовності.

--місце
Використовуйте попередній Лаплас +1 замість стандартної суміші Діріхле.

ВАРІАНТИ КОНТРОЛЬ Е-ЗНАЧЕННЯ КАЛІБРАЦІЯ


Параметри розташування для очікуваних розподілів оцінок для оцінок фільтра MSV,
Оцінки фільтра Вітербі та оцінки Форвард вимагають трьох коротких симуляцій у випадковій послідовності.

--ЕмЛ
Встановлює довжину послідовності в симуляції, яка оцінює параметр розташування mu для
MSV фільтр E-значення. За замовчуванням 200.

--EmN
Встановлює кількість послідовностей у симуляції, яка оцінює параметр розташування mu
для E-значень фільтра MSV. За замовчуванням 200.

--EvL
Встановлює довжину послідовності в симуляції, яка оцінює параметр розташування mu для
Фільтр Вітербі E-значення. За замовчуванням 200.

--ЕвН
Встановлює кількість послідовностей у симуляції, яка оцінює параметр розташування mu
для фільтрів Вітербі E-значення. За замовчуванням 200.

--EfL
Встановлює довжину послідовності в симуляції, яка оцінює параметр розташування tau
для прямих E-значень. За замовчуванням 100.

--EfN
Встановлює кількість послідовностей у симуляції, яка оцінює параметр розташування
tau для прямих E-значень. За замовчуванням 200.

--Eft
Встановлює масову частку хвоста так, щоб вона вписувалася в моделювання, яке оцінює місце розташування
параметр tau для прямих оцінок. За замовчуванням 0.04.

ІНШІ ВАРІАНТИ


--ЦП
Встановіть кількість паралельних робочих потоків . За замовчуванням HMMER встановлює для цього значення
кількість ядер ЦП, яку він виявляє у вашій машині, тобто намагається максимізувати
використання наявних процесорних ядер. Налаштування вище за кількість
доступні ядра мають незначну цінність, але ви можете щось налаштувати
менше. Ви також можете керувати цим числом, встановивши змінну середовища,
HMMER_NCPU.

Цей параметр доступний, лише якщо HMMER був скомпільований з підтримкою потоків POSIX.
Це значення за замовчуванням, але воно, можливо, було вимкнено для вашого сайту або комп’ютера
чомусь.

--інформація
Оголосити, що введення msafile є у форматі . На даний момент прийнято кілька
Формати файлів послідовності вирівнювання включають Stockholm, Aligned FASTA, Clustal, NCBI
PSI-BLAST, PHYLIP, Selex і UCSC SAM A2M. За замовчуванням формат визначається автоматично
файл.

--насіння
Заповніть генератор випадкових чисел за допомогою , ціле число >= 0. Якщо ненульовий, будь-який
стохастичні моделювання будуть відтворюваними; та сама команда дасть те саме
результати. Якщо дорівнює 0, генератор випадкових чисел заповнюється довільно, і
стохастичні симуляції будуть відрізнятися від виконання до виконання однієї і тієї ж команди. За замовчуванням
насіння - 42.

--w_beta
Довжина вікна хвостової маси. Верхня межа, W, на довжину, на якій nhmmer очікує
для пошуку екземпляра моделі встановлюється такий, що частка всіх послідовностей
генерується моделлю з довжиною >= W менше, ніж . За замовчуванням – 1e-7.

--w_довжина
Перевизначити верхню межу довжини екземпляра моделі, W, який інакше контролюється
--w_beta. Він повинен бути більше довжини моделі. Значення W використовується глибоко
в конвеєрі прискорення, і очікується, що незначні зміни не вплинуть на результати
(хоча більші значення W призводять до довшого часу роботи).

--mpi Запуск як паралельна програма MPI. Кожне вирівнювання призначається робочому вузлу MPI для
будівництво. (Тому максимальне розпаралелювання не може перевищувати кількість
вирівнювання у вхідних даних msafile.) Це корисно під час створення великого профілю
бібліотеки. Цей параметр доступний, лише якщо ввімкнуто додаткову можливість MPI
час компіляції.

-- стійло
Для налагодження розпаралелювання MPI: негайно зупиніть виконання програми
запустіть і зачекайте, поки налагоджувач приєднається до запущеного процесу та відпустить
арешт.

--maxinsertlen
Обмежте параметризацію довжини вставки так, щоб очікувана довжина вставки була на рівні
кожна позиція моделі становить не більше ніж .

Використовуйте hmmbuild онлайн за допомогою сервісів onworks.net



Найновіші онлайн-програми для Linux і Windows