İngilizceFransızcaİspanyolca

OnWorks favicon'u

hmmbuild - Bulutta Çevrimiçi

Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü üzerinden OnWorks ücretsiz barındırma sağlayıcısında hmmbuild çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen hmmbuild komutudur.

Program:

ADI


hmmbuild - çoklu dizi hizalamalarından profil HMM'lerini oluştur

SİNOPSİS


hmm inşa [seçenekler]

TANIM


Her bir çoklu dizi hizalaması için bir profil HMM oluşturun ve yeni bir HMM'ye kaydedin
dosya .

'-' (tire) olabilir, bu da bu girdiyi şuradan okumak anlamına gelir: stdin bir dosyadan ziyade.
'-' kullanmak için, hizalama dosyası biçimini de belirtmelisiniz. --bilgi , içinde olduğu gibi
--bilgi Stockholm (uygulamamızdaki mevcut bir sınırlama nedeniyle, MSA dosyası
biçimler, geri sarılamaz bir giriş akışında otomatik olarak algılanamaz.)

olmayabilir '-' (stdout), çünkü HMM dosyasını stdout'u olur
programın diğer metin çıktısıyla çakışıyor.

SEÇENEKLER


-h Yardım; komut satırı kullanımı ve mevcut tüm seçenekler hakkında kısa bir hatırlatma yazdırın.

-n Yeni profili adlandırın . Varsayılan, hizalamanın adını kullanmaktır (eğer varsa
içinde mevcut msa dosyası, veya bu olmazsa, hmm dosyası. Eğer msa dosyası
birden fazla hizalama içerir, -n çalışmıyor ve her hizalamanın bir
açıklamalı isim msa dosyası (Stockholm #=GF ID ek açıklamasında olduğu gibi).

-o Özet çıktısını dosyaya yönlendirin , yerine stdout'u.

-O Her model oluşturulduktan sonra açıklamalı, muhtemelen değiştirilmiş kaynağı yeniden kaydedin
bir dosyaya hizalamalar Stockholm formatında. Hizalamalar bir
hangi sütunların fikir birliği olarak atandığını gösteren referans açıklama satırı ve
diziler, hangi göreli dizi ağırlıklarının atandığı ile açıklanır. Biraz
hizalamanın kalıntıları, kısıtlamalara uyum sağlamak için kaydırılmış olabilir.
Ekleme ve silme arasındaki geçişlere izin vermeyen Plan7 profil mimarisi
devletler.

SEÇENEKLER İÇİN BELİRTİLEN L' ALFABE


Alfabe türü (amino, DNA veya RNA) varsayılan olarak aşağıdakilere bakılarak otomatik olarak algılanır.
bileşimi msa dosyası. Otomatik algılama normalde oldukça güvenilirdir, ancak bazen
alfabe türü belirsiz olabilir ve otomatik algılama başarısız olabilir (örneğin, küçük oyuncak
sadece birkaç kalıntının hizalanması). Bunu önlemek veya otomatikleştirilmiş sistemlerde sağlamlığı artırmak için
analiz boru hatları, alfabe türünü belirtebilirsiniz msa dosyası bu seçeneklerle.

--amino
içindeki tüm dizilerin msa dosyası proteinlerdir.

--DNA içindeki tüm dizilerin msa dosyası DNA'lardır.

--rna içindeki tüm dizilerin msa dosyası RNA'lardır.

SEÇENEKLER KONTROL PROFİL İNŞAAT


Bu seçenekler, fikir birliği sütunlarının bir hizalamada nasıl tanımlandığını kontrol eder.

--hızlı Konsensüs sütunlarını >= kesiri olan sütunlar olarak tanımlayın simetrik olarak kalıntıların
boşluklara karşı. (Aşağıya bakınız --symfrac seçeneği.) Bu varsayılandır.

--el Çoklu referans açıklamasını kullanarak bir sonraki profilde fikir birliği sütunlarını tanımlayın
hizalama. Bu, istediğiniz herhangi bir fikir birliği sütununu tanımlamanıza olanak tanır.

--symfrac
Bir konsensüs sütunu tanımlamak için gerekli olan kalıntı fraksiyonu eşiğini tanımlayın.
ile --hızlı seçenek. Varsayılan 0.5'tir. Her sütundaki sembol kesri
göreli dizi ağırlığı dikkate alındıktan ve boşluk göz ardı edildikten sonra hesaplanır
dizi parçalarının uçlarına karşılık gelen karakterler (dahili
eklemeler/silmeler). Bunu 0.0'a ayarlamak, her hizalama sütununun
bazı durumlarda yararlı olabilecek fikir birliği olarak atanabilir. 1.0 olarak ayarlamak
yalnızca 0 boşluk içeren sütunların (dahili eklemeler/silmeler) olacağı anlamına gelir
konsensüs olarak atanmıştır.

--fragthresh
Hizalanmış sıra biliniyorsa, yalnızca terminal boşluklarını silme olarak saymak istiyoruz.
tam uzunlukta olması, bir parça olması halinde değil (örneğin, yalnızca bir parçası olduğu için)
sıralandı). HMMER, parçaları çıkarmak için basit bir kural kullanır:
hizalamadaki sıra (birinci ve
dizinin son konumları) bir kesre eşit veya daha küçüktür kez
sütunlarda hizalama uzunluğu, ardından dizi bir parça olarak işlenir. NS
varsayılan 0.5'tir. Ayar --fragthresh0 olarak hiçbir (boş olmayan) diziyi tanımlayacaktır
parça; Dikkatli bir şekilde küratörlüğünüz olduğunu biliyorsanız, bunu yapmak isteyebilirsiniz.
tam uzunlukta dizilerin hizalanması. Ayar --fragthresh1 hepsini tanımlayacak
fragmanlar olarak diziler; hizalamanızın olduğunu biliyorsanız, bunu yapmak isteyebilirsiniz.
metagenomik olarak çevrilmiş kısa okumalar gibi tamamen parçalardan oluşur.
av tüfeği verileri.

SEÇENEKLER KONTROL BAĞIL AĞIRLIKLAR


HMMER, yakından ilişkili dizileri azaltmak için özel bir dizi ağırlıklandırma algoritması kullanır
ve uzaktan ilgili olanları büyütün. Bu, modelleri daha az önyargılı hale getirme etkisine sahiptir.
eşit olmayan filogenetik temsil. Örneğin, iki özdeş dizi tipik olarak
her biri bir dizinin alacağı ağırlığın yarısını alır. Bu seçenekler, hangi
algoritma kullanılır.

--wpb Henikoff pozisyon tabanlı dizi ağırlıklandırma şemasını kullanın [Henikoff ve Henikoff,
J. Mol. Biol. 243:574, 1994]. Bu varsayılandır.

--wgsc Gerstein/Sonnhammer/Chothia ağırlıklandırma algoritmasını kullanın [Gerstein ve diğerleri, J. Mol.
Biyol. 235:1067, 1994].

--wblosum
BLOSUM hesaplanırken verileri ağırlıklandırmak için kullanılan aynı kümeleme şemasını kullanın
ikame matrisleri [Henikoff ve Henikoff, Proc. Natl. Acad. Sci 89:10915, 1992].
Diziler, bir kimlik eşiğinde kümelenmiş tek bağlantıdır (varsayılan 0.62; bkz.
--geniş) ve her c dizisi kümesinde, her dizi göreceli ağırlık alır
1/ç.

--wnone
Göreceli ağırlıklar yok. Tüm dizilere tek tip ağırlık atanır.

--geniş
Kullanırken tek bağlantı kümeleme tarafından kullanılan kimlik eşiğini ayarlar. --wblosum.
Diğer ağırlıklandırma şemalarında geçersizdir. Varsayılan 0.62'dir.

SEÇENEKLER KONTROL ETKİLİ SIRA NUMBER


Göreceli ağırlıklar belirlendikten sonra, toplam efektif değere toplanacak şekilde normalleştirilirler.
Sıra numarası, eff_nseq. Bu sayı, dizideki gerçek dizi sayısı olabilir.
hizalama, ancak neredeyse her zaman bundan daha küçüktür. Varsayılan entropi ağırlığı
yöntem (--ent) bilgi içeriğini azaltmak için etkin sıra numarasını azaltır
(göreceli entropi veya gerçek homologlarda beklenen ortalama puan) fikir birliği pozisyonu başına. NS
hedef bağıl entropi, iki parametreli bir fonksiyon tarafından kontrol edilir;
parametreler ile ayarlanabilir --buraya ve --esigma.

--ent Belirli bir göreli entropi elde etmek için etkin sıra numarasını ayarlayın.
konum (bkz. --buraya). Bu varsayılandır.

--eklust
Etkin sıra numarasını, belirli bir noktada tek bağlantı kümelerinin sayısına ayarlayın.
belirli kimlik eşiği (bkz. --bayram). Bu seçenek önerilmez; bu ... için
ne kadar iyi olduğunu değerlendiren deneyler --ent olduğunu.

--enon
Etkili sıra numarası belirlemeyi kapatın ve yalnızca gerçek sayıyı kullanın.
diziler. Bunu yapmak isteyebileceğiniz bir neden, göreli değeri maksimize etmeye çalışmaktır.
kısa modeller için faydalı olabilecek modelinizin entropisi/konumu.

--eset
Tüm modeller için etkin sıra numarasını açıkça ayarlayın. .

--buraya
Minimum göreli entropi/konum hedefini şuna ayarlayın: . gerektirir --ent. Varsayılan
sıra alfabesine bağlıdır. Protein dizileri için 0.59 bit/konumdur;
nükleotid dizileri için 0.45 bit/konumdur.

--esigma
Tüm model hizalamasının katkıda bulunduğu minimum göreli entropiyi ayarlar.
tüm uzunluğu. Bu, kısa modellerin göreceli olarak daha yüksek olmasını sağlama etkisine sahiptir.
konum başına entropi --buraya tek verecekti. Varsayılan 45.0 bittir.

--bayram
ile tek bağlantı kümeleme tarafından kullanılan kesirli ikili kimlik kesmesini ayarlar.
the --eklust seçenek. Varsayılan 0.62'tür.

SEÇENEKLER KONTROL ÖNCEKİLER


Varsayılan olarak, ağırlıklı sayılar ortalama sonsal olasılık parametresine dönüştürülür
Karışım Dirichlet önceliklerini kullanarak tahminler. Varsayılan karışım Dirichlet ön parametreleri için
protein modelleri ve nükleik asit (RNA ve DNA) modelleri yerleşiktir. Aşağıdakiler
seçenekler, varsayılan öncelikleri geçersiz kılmanıza izin verir.

--pnone
Herhangi bir öncelik kullanmayın. Olasılık parametreleri basitçe gözlemlenecek
bağıl dizi ağırlıklandırmasından sonra frekanslar.

--yer
Önceden varsayılan Dirichlet karışımı yerine bir Laplace +1 kullanın.

SEÇENEKLER KONTROL E-DEĞER KALİBRASYON


MSV filtre puanları için beklenen puan dağılımları için konum parametreleri,
Viterbi filtre puanları ve İleri puanlar, üç kısa rastgele dizi simülasyonu gerektirir.

--EmL
için konum parametresini tahmin eden simülasyondaki dizi uzunluğunu ayarlar.
MSV filtre E değerleri. Varsayılan 200'dür.

--EmN
Konum parametresini tahmin eden simülasyondaki dizilerin sayısını ayarlar mu
MSV filtre E değerleri için. Varsayılan 200'dür.

--EvL
için konum parametresini tahmin eden simülasyondaki dizi uzunluğunu ayarlar.
Viterbi filtre E değerleri. Varsayılan 200'dür.

--EvN
Konum parametresini tahmin eden simülasyondaki dizilerin sayısını ayarlar mu
Viterbi filtresi E değerleri için. Varsayılan 200'dür.

--EfL
Konum parametresi tau'yu tahmin eden simülasyondaki dizi uzunluğunu ayarlar
İleri E-değerleri için. Varsayılan 100'dür.

--EfN
Konum parametresini tahmin eden simülasyondaki dizilerin sayısını ayarlar
İleri E-değerleri için tau. Varsayılan 200'dür.

--Eft
Kuyruk kütle fraksiyonunu konumu tahmin eden simülasyona sığacak şekilde ayarlar
İleri değerler için tau parametresi. Varsayılan 0.04'tür.

DİĞER SEÇENEKLER


--İşlemci
Paralel çalışan iş parçacığı sayısını şuna ayarlayın: . Varsayılan olarak, HMMER bunu şu şekilde ayarlar:
makinenizde algıladığı CPU çekirdeği sayısı - yani en üst düzeye çıkarmaya çalışır
mevcut işlemci çekirdeklerinizin kullanımı. Ayar sayısından daha yüksek
mevcut çekirdeklerin değeri çok azdır, ancak bunu bir şeye ayarlamak isteyebilirsiniz.
az. Bu numarayı bir ortam değişkeni ayarlayarak da kontrol edebilirsiniz,
HMMER_NCPU.

Bu seçenek yalnızca HMMER, POSIX iş parçacığı desteğiyle derlendiyse kullanılabilir.
Bu varsayılandır, ancak siteniz veya makineniz için kapatılmış olabilir.
bir sebep.

--bilgi
giriş olduğunu beyan msa dosyası formatta . Şu anda kabul edilen çoklu
hizalama dizisi dosya formatları arasında Stockholm, Aligned FASTA, Clustal, NCBI bulunur
PSI-BLAST, PHYLIP, Selex ve UCSC SAM A2M. Varsayılan, biçimini otomatik olarak algılamaktır.
dosya.

--tohum
Rastgele sayı üretecini şu şekilde tohumlayın , bir tamsayı >= 0. sıfırdan farklı, herhangi
stokastik simülasyonlar tekrarlanabilir olacaktır; aynı komut aynı şeyi verecek
Sonuçlar. Eğer 0 ise, rastgele sayı üreteci keyfi olarak ekilir ve
stokastik simülasyonlar, aynı komutun çalıştırılmasından çalıştırılmasına değişiklik gösterecektir. Varsayılan
tohum 42'dir.

--w_beta
Pencere uzunluğu kuyruk kütlesi. Üst sınır, W, nhmmer'in beklediği uzunlukta
modelin bir örneğini bulmak için, tüm dizilerin kesri şu şekilde ayarlanır:
uzunluklu model tarafından üretilen >= W daha az . Varsayılan 1e-7'dir.

--w_uzunluk
Model örneği uzunluğu üst sınırını geçersiz kıl, Wtarafından kontrol edilen
--w_beta. Model uzunluğundan daha büyük olmalıdır. Değeri W derin kullanılır
hızlandırma hattında ve mütevazı değişikliklerin sonuçları etkilemesi beklenmiyor
(daha büyük değerler olsa da W daha uzun çalışma süresine yol açar).

--mpi Paralel bir MPI programı olarak çalıştırın. Her hizalama, aşağıdakiler için bir MPI çalışan düğümüne atanır:
yapı. (Bu nedenle, maksimum paralelleştirme,
giriş hizalamaları msa dosyası.) Bu, büyük profil oluştururken kullanışlıdır
kütüphaneler. Bu seçenek yalnızca isteğe bağlı MPI özelliği şurada etkinleştirildiyse kullanılabilir:
Derleme zamanı.

--ahır
MPI paralelleştirmesinde hata ayıklamak için: programın yürütülmesini hemen sonra durdurun
başlatın ve bir hata ayıklayıcının çalışan işleme eklenmesini bekleyin ve
tutuklamak.

--maxinsertlen
Uç uzunluğu parametreleştirmesini, beklenen uç uzunluğu
modelin her konumu en fazla .

onworks.net hizmetlerini kullanarak hmmbuild'i çevrimiçi kullanın


Ücretsiz Sunucular ve İş İstasyonları

Windows ve Linux uygulamalarını indirin

Linux komutları

Ad