Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen sumaclust komutudur.
Program:
ADI
sumaclust - genetik dizilerin yıldız kümelenmesi
SİNOPSİS
sumaklut [seçenekler]
TANIM
Yeni nesil dizilemenin gelişmesiyle birlikte, işlemek için verimli araçlara ihtiyaç vardır.
makul miktarlarda milyonlarca dizi. Sumaclust tarafından geliştirilen bir programdır.
LECA. Sumaclust, dizileri aynı anda hızlı ve kesin bir şekilde kümelemeyi amaçlar.
zaman. Bu araç, DNA tarafından üretilen veri türüne uyarlanmak üzere geliştirilmiştir.
metabarkodlama, yani tamamen sıralı, kısa belirteçler. Sumaclust kümeleri dizileri kullanarak
UCLUST ve CD-HIT ile aynı kümeleme algoritması. Bu algoritma esas olarak aşağıdakiler için yararlıdır:
amplifikasyon ve sıralama protokolleri sırasında oluşturulan 'hatalı' dizileri tespit etmek,
'doğru' dizilerden türeyen.
SEÇENEKLER
-h [H]elp - yazdır Yardım
-l : Referans dizi uzunluğu en kısadır.
-L Referans dizisi uzunluğu en büyüğüdür.
-a Referans dizisi uzunluğu, hizalama uzunluğudur (varsayılan).
-n Puan, referans dizi uzunluğuna göre normalleştirilir (varsayılan).
-r : Ham puan, normalleştirilmemiş.
-d : Puan, mesafe olarak ifade edilir (varsayılan: puan, benzerlik olarak ifade edilir).
-t ##.## : Kümeleme için puan eşiği. Skor normalleştirilir ve ifade edilirse
benzerlik (varsayılan),
bu bir özdeşliktir, örneğin %0.95'lik bir özdeşlik için 95. Skor normalleştirilirse ve
mesafe olarak ifade edildiğinde, (1.0 - özdeşlik), örneğin %0.05'lik bir özdeşlik için 95'tir.
Skor normalize edilmemişse ve benzerlikle ifade edilmemişse, bu, puanın uzunluğudur.
En Uzun Ortak Müdahale. Skor normalleştirilmemiş ve ifade edilmemişse
mesafe, öyledir (referans uzunluğu - LCS uzunluğu). Sadece benzerliği olan diziler
Yukarıdaki ##.## bir kümenin merkez dizisi ile o kümeye atanır.
Varsayılan: 0.97.
-e Tam seçenek: Merkez sıralı kümeye bir sıra atanır
varsayılanın aksine en yüksek benzerlik puanı > eşiğini sunmak
Bir merkezle bulunan ilk kümeye bir dizinin atandığı 'hızlı' seçenek
bir puan > eşik sunan dizi.
-R ## İki dizinin sayıları arasındaki maksimum oran, böylece daha az bol olan
daha bol olanın bir varyantı olarak kabul edilebilir. Varsayılan: 1.0.
-p ## openMP kullanarak ## thread ile çoklu okuma.
-s ####
####'a göre sıralama. Sıralama yapılmaması için 'Hiçbiri' veya fasta başlığında bir anahtar olmalıdır
hesaplanabilen sayı dışında her dizi (varsayılan:
saymak).
-o Sıralama artan düzendedir (varsayılan: azalan).
-g n'ler a'larla değiştirilir (varsayılan: n'li diziler atılır).
-B ### OTU tablosunun BIOM formatındaki çıktısı etkinleştirilir ve ### dosyasına yazılır.
-O ### OTU haritasının (gözlem haritası) çıktısı etkinleştirilir ve ### dosyasına yazılır.
-F ### FASTA formatındaki çıktı, standart çıktı yerine ### dosyasına yazılır.
-f FASTA formatındaki çıktı devre dışı bırakılır.
Argüman : kümelenecek nükleotid veri kümesi
onworks.net hizmetlerini kullanarak sumaclust'u çevrimiçi kullanın