emmae - Интернет в облаке

Это команда emmae, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


emma - Множественное выравнивание последовательностей (оболочка ClustalW)

СИНТАКСИС


Эмма -последовательность Seqall [-толькоденд тумблер] -денд тумблер -дендфайл вводить [-медленный тумблер]
-pwматрица список -pwdnamatrix список -пользовательская матрица переменная -pairwiseфайл данных вводить
-матрица список -usermatrix переменная -ДНКматрица список -умаматрица переменная
-mamatrixfile вводить -pwgapopen плавать -pwgapextend плавать -ктуп целое -зазор целое
-topdiags целое -окно целое -непроцентный логический [-закрыть плавать]
[-гапэкстенд плавать] [-конечные зазоры логический] [-гапдист целое] -норгап логический
-hgapres string -ногап логический [-максдив целое] -outseq секаутсет
-dendoutfile Outfile

Эмма -Помощь

ОПИСАНИЕ


Эмма это программа командной строки от EMBOSS («Европейское открытое программное обеспечение для молекулярной биологии»).
Люкс »). Он является частью группы (групп) команд «Выравнивание: несколько».

ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ


вход .
-последовательность Seqall

-толькоденд тумблер
Значение по умолчанию: N

-денд тумблер
Значение по умолчанию: N

-дендфайл вводить

-медленный тумблер
Расстояние вычисляется между каждой парой последовательностей, и они используются для
построить дендрограмму, по которой будет проводиться окончательное множественное выравнивание. Оценки
рассчитывается из отдельных попарных выравниваний. Их можно рассчитать двумя способами:
динамическое программирование (медленное, но точное) или по методу Уилбура и Липмана
(очень быстро, но приблизительно). Медленно-точный метод подходит для коротких последовательностей.
но будет ОЧЕНЬ МЕДЛЕННЫМ для многих (например,> 100) длинных (например,> 1000 остатков) последовательностей.
Значение по умолчанию: Y

парный выравнивать кредита
-pwматрица список
Таблица оценок, которая описывает сходство каждой аминокислоты друг с другом.
Предлагаются три серии встроенных весовых матриц. Каждый состоит из нескольких
матрицы, которые работают по-разному на разных эволюционных расстояниях. Чтобы увидеть точное
подробности читайте в документации. Грубо говоря, мы храним в памяти несколько матриц,
охватывающий весь диапазон аминокислотных расстояний (от почти идентичных последовательностей до
сильно расходящиеся). Для очень похожих последовательностей лучше всего использовать строгий вес.
матрица, которая дает высокий балл только идентичностям и наиболее предпочтительным консерваторам
замены. Для более расходящихся последовательностей уместно использовать «более мягкие»
матрицы, которые дают высокую оценку многим другим частым заменам. 1) BLOSUM
(Хеников). Эти матрицы кажутся лучшими из имеющихся для ведения базы данных.
подобие (поиски гомологии). Используемые матрицы: Blosum80, 62, 45 и 30. 2) PAM.
(Выходной день). Они получили широкое распространение с конца 70-х годов. Мы используем PAM
Матрицы 120, 160, 250 и 350. 3) ГОННЕТ. Эти матрицы были получены с использованием почти
та же процедура, что и у Dayhoff (см. выше), но гораздо более актуальна и
на основе гораздо большего набора данных. Они кажутся более чувствительными, чем Dayhoff
серии. Мы используем матрицы GONNET 40, 80, 120, 160, 250 и 350. Мы также поставляем
матрица идентичности, которая дает оценку от 1.0 до двух идентичных аминокислот и оценку
ноль в противном случае. Эта матрица не очень полезна. Значение по умолчанию: b

-pwdnamatrix список
Таблица оценок, в которой описаны оценки, присвоенные совпадениям и несоответствиям.
(включая коды неоднозначности IUB). Значение по умолчанию: i

-пользовательская матрица переменная

-pairwiseфайл данных вводить

матрица кредита
-матрица список
Это дает меню, в котором вам предлагается выбор весовых матриц. По умолчанию для
Белки - это серия PAM, полученная Гоннетом и его коллегами. Обратите внимание, используется серия!
Фактическая используемая матрица зависит от того, насколько похожи последовательности, которые необходимо выровнять по
этот шаг выравнивания. Различные матрицы работают по-разному на каждом этапе эволюции.
расстояние. Предлагаются три серии встроенных весовых матриц. Каждый состоит
нескольких матриц, которые работают по-разному на разных эволюционных расстояниях. Чтобы увидеть
точные подробности читайте в документации. Грубо говоря, мы храним несколько матриц в
память, охватывающая весь диапазон аминокислотных расстояний (от почти идентичных
последовательности в сильно расходящиеся). Для очень похожих последовательностей лучше всего использовать
строгая матрица весов, которая дает высокий балл только личностям и наиболее избранным
консервативные замены. Для более расходящихся последовательностей целесообразно использовать
«более мягкие» матрицы, которые дают высокую оценку многим другим частым заменам. 1)
БЛОСУМ (Хеникофф). Эти матрицы кажутся лучшими из доступных для проведения
сходство баз данных (поиск гомологии). Используемые матрицы: Blosum80, 62, 45 и
30. 2) PAM (Dayhoff). Они получили широкое распространение с конца 70-х годов. Мы
используйте матрицы PAM 120, 160, 250 и 350. 3) ГОННЕТ. Эти матрицы были получены
используя почти ту же процедуру, что и Dayhoff (см. выше), но гораздо больше
date и основаны на гораздо большем наборе данных. Они кажутся более чувствительными, чем
Dayhoff серия. Мы используем матрицы GONNET 40, 80, 120, 160, 250 и 350. Мы тоже
предоставить матрицу идентичности, которая дает оценку от 1.0 до двух идентичных аминокислот и
в противном случае - ноль. Эта матрица не очень полезна. В качестве альтернативы вы можете прочитать
в своей (только одна матрица, а не серия). Значение по умолчанию: b

-usermatrix переменная

-ДНКматрица список
Это дает меню, в котором можно выбрать одну матрицу (а не серию). Значение по умолчанию:
i

-умаматрица переменная

-mamatrixfile вводить

дополнительный .
Замедлять выравнивать кредита
-pwgapopen плавать
Штраф за открытие пробела в парных раскладах. Значение по умолчанию: 10.0

-pwgapextend плавать
Штраф за увеличение разрыва на 1 остаток при попарном выравнивании. Дефолт
значение: 0.1

Быстрый выравнивать кредита
-ктуп целое
Это размер точно совпадающего фрагмента, который используется. УВЕЛИЧЕНИЕ скорости (макс. = 2
для белков; 4 для ДНК), УМЕНЬШЕНИЕ для чувствительности. Для более длинных последовательностей (например,> 1000
остатки) вам может потребоваться увеличить значение по умолчанию. Значение по умолчанию: @ ($ (acdprotein)? 1: 2)

-зазор целое
Это штраф за каждый пробел в быстрых раскладах. Это мало влияет на
скорость или чувствительность, кроме крайних значений. Значение по умолчанию: @ ($ (acdprotein)? 3: 5)

-topdiags целое
Количество совпадений k-кортежей на каждой диагонали (на воображаемом матричном графике) равно
рассчитано. При раскладке используются только лучшие (с наибольшим количеством совпадений). Этот
параметр указывает сколько. Снижение скорости; увеличение чувствительности. Дефолт
значение: @ ($ (acdprotein)? 5: 4)

-окно целое
Это количество диагоналей вокруг каждой из «лучших» диагоналей, которые будут использоваться.
Снижение скорости; увеличение чувствительности. Значение по умолчанию: @ ($ (acdprotein)? 5: 4)

-непроцентный логический
Значение по умолчанию: N

разрыв кредита
-закрыть плавать
Штраф за открытие бреши в раскладе. Увеличение штрафа за открытие щели
сделает пропуски менее частыми. Значение по умолчанию: 10.0

-гапэкстенд плавать
Штраф за увеличение промежутка на 1 остаток. Увеличение штрафа за расширение промежутка
сделает зазоры короче. Клеммные зазоры не штрафуются. Значение по умолчанию: 5.0

-конечные зазоры логический
Разделение торцевых зазоров: обрабатывает торцевые зазоры так же, как внутренние зазоры для целей
избегание слишком близких зазоров (задается «расстоянием разделения зазоров»). Если вы включите это
off, зазоры на концах для этой цели будут игнорироваться. Это полезно, когда вы хотите выровнять
фрагменты, в которых концевые промежутки не имеют биологического значения. Значение по умолчанию: Y

-гапдист целое
Расстояние разделения зазоров: пытается уменьшить вероятность того, что зазоры будут слишком близко друг к другу.
Другие. Промежутки, расстояние между которыми меньше этого расстояния, штрафуются больше, чем другие промежутки.
Это не мешает закрывать зазоры; это делает их менее частыми, продвигая блочные
внешний вид расклада. Значение по умолчанию: 8

-норгап логический
Штрафы, специфичные для остатков: штрафы за пробелы, специфичные для аминокислот, которые уменьшают или увеличивают
штрафы за открытие пробелов в каждой позиции в расстановке или последовательности. Как
Например, позиции, богатые глицином, с большей вероятностью будут иметь соседний разрыв
чем позиции, богатые валином. Значение по умолчанию: N

-hgapres string
Это набор остатков, «считающихся» гидрофильными. Используется, когда
введение штрафов за гидрофильный разрыв. Значение по умолчанию: GPSNDQEKR.

-ногап логический
Штрафы за гидрофильный разрыв: используются для увеличения шансов на разрыв в пробеге (5 или
больше остатков) гидрофильных аминокислот; это скорее всего петля или случайная катушка
регионы, где чаще встречаются пробелы. Остатки, которые «считаются»
гидрофильные устанавливаются -hgapres. Значение по умолчанию: N

-максдив целое
Этот переключатель задерживает выравнивание наиболее отдаленно связанных последовательностей до тех пор, пока
наиболее близкородственные последовательности были выровнены. Настройка показывает процент
уровень идентичности, необходимый для задержки добавления последовательности; последовательности, которые меньше
идентичные, чем этот уровень, любым другим последовательностям, которые будут выровнены позже. Значение по умолчанию:
30

Результат .
-outseq секаутсет

-dendoutfile Outfile

Используйте emmae онлайн с помощью сервисов onworks.net



Новейшие онлайн-программы для Linux и Windows