İngilizceFransızcaİspanyolca

OnWorks favicon'u

denizanası - Bulutta Çevrimiçi

Denizanasını Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü üzerinden OnWorks ücretsiz barındırma sağlayıcısında çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen denizanası komutudur.

Program:

ADI


Denizanası, DNA dizilerindeki k-merleri sayan bir yazılımdır.

SİNOPSİS


denizanası sayısı [-oönek] [-mdeniz boyu] [-tKonuları] [-skarma boyut] [--her iki iplikçik] Fasta
[Fasta Kendi ID’n ile mağazalarını oluştur ]
denizanası birleştirme HASH1 HASH2 Kendi ID’n ile mağazalarını oluştur
denizanası dökümü esrar
denizanası istatistikleri esrar
denizanası tarihi [-hyüksek] [-ldüşük] [-iartım] esrar
denizanası sorgusu esrar
denizanası alıntı

Artı Quake modu için eşdeğer sürüm: qhisto, qdump ve qmerge.

TANIM


Denizanası, çok iş parçacıklı bir karma tablo uygulamasına dayalı bir k-mer sayacıdır.

SAYIM VE BİRLEŞME
K-mer'leri saymak için aşağıdaki gibi bir komut kullanın:

denizanası sayısı -m 22 -o çıktı -c 3 -s 10000000 -t 32 girdi.fasta

Bu, input.fasta'daki 22-mers'i 32 thread ile sayacaktır. içindeki sayaç alanı
karma yalnızca 3 bit kullanır ve karma en az 10 milyon girişe sahiptir.

Çıktı dosyaları çıktı_0, çıktı_1 vb. olarak adlandırılacaktır (önek,
-o değiştirmek). Karma yeterince büyükse (belirtilen -s anahtarı) hepsine uyacak şekilde
k-mers, output_0 adında yalnızca bir çıktı dosyası olacak. Hash daha önce dolduysa
tüm mer'ler okundu, karma diske döküldü, sıfırlandı ve mer'de okundu
özgeçmiş. Disklerde output_0, adlı birden çok aracı dosya bulunacaktır.
çıktı_1, vb.

Diğer alt komutlardan (histo, stat vb. gibi) doğru sonuçlar elde etmek için,
varsa birden çok çıktı dosyasının birleştirme komutuyla birleştirilmesi gerekir. İçin
aşağıdaki komutla örnek:

denizanası birleştirme -o çıktı.jf çıktı\_*

Çok sayıda aracı çıktı dosyası alırsanız (yüzlerce diyelim), karma tablosunun boyutu
çok küçük. Denizanasını daha büyük bir boyutta yeniden çalıştırma (seçenek -s) muhtemelen daha hızlıdır
tüm aracı dosyaları birleştirmek.

ORYANTASYON
Giriş fasta dosyasındaki dizilerin yönü bilinmediğinde, örn.
kullanarak okumaları sıralama --her iki iplikçik (-C) en mantıklısı.

Herhangi bir k-mer m için, kanonik gösterimi m'nin kendisi veya onun ters tamamlayıcısıdır,
sözlükbilimsel olarak hangisi önce gelirse. seçeneği ile -C, sadece kanonik
merlerin temsili karmada saklanır ve sayım değeri,
hem mer hem de ters tamamlayıcısının oluşumları.

SEÇME L' HASH BOYUT
En iyi performansı elde etmek için minimum sayıda aracı dosya yazılmalıdır.
diske. yani parametre -s mümkün olduğu kadar çok k-mer'e uyacak şekilde seçilmelidir (ideal olarak
hepsi) hala belleğe sığarken.

Örnekleri ele alıyoruz: okumaları sıralamada ve bitmiş bir genomda mers sayma.

İlk olarak, kısa dizi okumalarda k-mer'leri saydığımızı varsayalım: n okuma var ve
her bir hatanın k benzersiz mers ürettiği okuma başına ortalama 1 hata. eğer genom
boyut G, karma boyutu (seçenek -s) tüm k-mer'lere aynı anda uyması için tahmin edilir: $(G
+ k*n)/0.8$. 0.8'e bölme, yaklaşık %80$'lık maksimum kullanımı telafi eder
hash tablosundan.

Öte yandan, birleştirilmiş G uzunluğundaki bir dizideki k-mer'leri sayarken, ayar -s
G için uygundur.

Kolaylık sağlamak amacıyla, Jellyfish, karma boyutu için ISO son eklerini anlar.
Dolayısıyla, '-s 10M' 10 milyon giriş anlamına gelirken '-s 50G' 50 milyar giriş anlamına gelir.

Hash tablosunun gerçek bellek kullanımı aşağıdaki gibi hesaplanabilir. gerçek boyutu
hash, 2'nin bir sonraki kuvvetine yuvarlanacaktır: s=2^l. r parametresi şu şekildedir:
maksimum yeniden inceleme değeri (-p) artı bir, 2^r'den küçüktür. Ardından giriş başına bellek kullanımı
karmada (bayt değil, bit olarak) 2k-l+r+1'dir. Hash tablosunun toplam bellek kullanımı
bayt: 2^l*(2k-l+r+1)/8.

SEÇME L' SAYIM SAHA BOYUT
Yerden tasarruf etmek için, karma tablo değişken uzunluklu sayacı destekler, yani bir k-mer oluşur
sadece birkaç kez küçük bir sayaç kullanacak, birçok kez meydana gelen bir k-mer birden fazla kullanılacak
hash içindeki girişler.

Önemli: sayım alanının boyutu sonucu DEĞİŞTİRMEZ, yalnızca
kullanılan bellek miktarı. Özellikle, karmada maksimum değer yoktur. Olsa bile
sayma alanı 5 bit kullanır, 2 milyon kez meydana gelen bir k-mer, rapor edilen bir değere sahip olacaktır.
2 milyon (yani 2^5 ile sınırlı değildir).

The -c sayma alanının uzunluğunu (bit olarak) belirtin. Takas aşağıdaki gibidir: a
düşük değer, karmadaki giriş başına alan tasarrufu sağlar ancak potansiyel olarak sayısını artırabilir.
girdiler kullanılır, bu nedenle belki daha büyük bir karma gerektirebilir.

Pratikte, için bir değer kullanın -c böylece çoğu k-mer'iniz sadece 1 giriş gerektirir. İçin
örneğin, dizinin çoğunun benzersiz olduğu bir genomdaki k-merleri saymak için -c1 or
-c2. Okumaları sıralamak için bir değer kullanın -c iki katına kadar sayabilecek kadar büyük
kapsama. Örneğin, kapsama alanı 10X ise, 5'lik bir sayaç uzunluğu seçin (-c5) 2^5 $ olarak
> 20$.

ALT KOMUTLAR VE SEÇENEKLER


COUNT
Kullanım: denizanası sayısı [seçenekler] dosyası:yol+

Fasta veya fastq dosyalarındaki k-mer'leri veya qmer'leri sayın

Seçenekler (() içindeki varsayılan değer), *gerekli):

-m, --mer-len=uint32
*Mer uzunluğu

-s, --boy=uint64
* Karma boyutu

-t, --İş Parçacığı=uint32
Diş sayısı (1)

-o, --çıktı=dize
Çıktı öneki (mer_counts)

-c, -- karşı len= Uzunluk
bit olarak Sayma alanının uzunluğu (7)

--out-counter-len= Uzunluk
bayt cinsinden Çıkıştaki sayaç alanının uzunluğu (4)

-C,--her iki iplikçik
Her iki diziyi de sayın, kurallı gösterim (yanlış)

-p, --reprobelar=uint32
Maksimum tekrar sayısı (62)

-r,--çiğ
Ham veritabanı yaz (yanlış)

-q,-- deprem
Quake uyumluluk modu (yanlış)

--kalite-başlangıç=uint32
Kalite değerleri için ASCII'yi başlatma (64)

--min-kalite=uint32
Asgari kalite. Daha düşük kaliteye sahip bir baz N (0) olur

-L, --düşük-sayım=uint64
Sayım < düşük sayım ile k-mer çıktısı vermeyin

-U, --üst sayım=uint64
Sayım > üst sayım ile k-mer çıktısı vermeyin

--matris= matris
dosya Hash işlevi ikili matris

--zamanlama=Zamanlama
dosya Zamanlama bilgilerini yazdır

--istatistikler=İstatistikler
dosya İstatistikleri yazdır

--kullanım
kullanım

-h,--yardım et
Bu mesaj

--tam yardım
Ayrıntılı yardım

-V,--versiyon
Sürümü

İSTATİSTİKLER
Kullanım: denizanası istatistikleri [seçenekler] db:path

İstatistikler

Karmadaki k-mer'ler hakkında bazı istatistikleri görüntüleyin:

Benzersiz: Yalnızca bir kez oluşan k-mer sayısı. Belirgin: K-mer sayısı, sayılmaz
çokluk. Toplam: Çokluk dahil olmak üzere k-mer sayısı. Max_count: Maksimum sayı
bir k-mer oluşumu.

Seçenekler (() içindeki varsayılan değer), *gerekli):

-L, --düşük-sayım=uint64
k-mer'i sayım < düşük sayı ile düşünme

-U, --üst sayım=uint64
k-mer'i sayım > üst sayım ile düşünme

-v,--ayrıntılı
Ayrıntılı (yanlış)

-o, --çıktı=dize
Çıktı dosyası

--kullanım
kullanım

-h,--yardım et
Bu mesaj

--tam yardım
Ayrıntılı yardım

-V,--versiyon
Sürümü

HİSTO
Kullanım: denizanası histo [seçenekler] db:path

K-mer oluşumlarının bir histogramını oluşturun

Belirli bir sayıya sahip k-mer sayısı ile bir histogram oluşturun. 'i' kovasında
'düşük+i*inc <= c < düşük+(i+1)*inc'yi karşılayan 'c' sayısına sahip k-mer'leri saydı.
Çıktıdaki kovalar, alt uç noktasıyla (düşük+i*art) etiketlenir.

Çıktıdaki son kova bir toplama görevi görür: tüm k-mer'leri bir sayı ile sayar
bu kepçenin alt uç noktasına eşit veya daha büyük.

Seçenekler (() içindeki varsayılan değer), *gerekli):

-l, --düşük=uint64
Histogramın düşük sayım değeri (1)

-h, --yüksek=uint64
Histogramın yüksek sayım değeri (10000)

-i, --artış=uint64
Kovalar için artış değeri (1)

-t, --İş Parçacığı=uint32
Diş sayısı (1)

-f,--tam dolu
Tam geçmiş. 0 sayısını atlamayın. (yanlış)

-o, --çıktı=dize
Çıktı dosyası

-v,--ayrıntılı
Çıkış bilgisi (yanlış)

--kullanım
kullanım

--yardım et
Bu mesaj

--tam yardım
Ayrıntılı yardım

-V,--versiyon
Sürümü

DÖKÜMÜ
Kullanım: denizanası dökümü [seçenekler] db:path

Döküm k-mer sayıları

Varsayılan olarak, başlığın sayı ve sıranın ise sayı olduğu bir fasta biçiminde döküm yapın.
k-mer dizisi. Sütun formatı 2 sütunlu bir çıktıdır: k-mer sayısı.

Seçenekler (() içindeki varsayılan değer), *gerekli):

-c,--kolon
Sütun biçimi (yanlış)

-t,--tab
Sekme ayırıcı (yanlış)

-L, --düşük-sayım=uint64
Sayım < düşük sayım ile k-mer çıktısı vermeyin

-U, --üst sayım=uint64
Sayım > üst sayım ile k-mer çıktısı vermeyin

-o, --çıktı=dize
Çıktı dosyası

--kullanım
kullanım

-h,--yardım et
Bu mesaj

-V,--versiyon
Sürümü

BİRLEŞTİRMEK
Kullanım: denizanası birleştirme [seçenekler] girdisi:string+

Denizanası veritabanlarını birleştir

Seçenekler (() içindeki varsayılan değer), *gerekli):

-s, --tampon boyutu=Tampon
uzunluk Giriş arabelleğinin bayt cinsinden uzunluğu (10000000)

-o, --çıktı=dize
Çıktı dosyası (mer_counts_merged.jf)

--out-counter-len=uint32
Çıkışta (4) sayma alanının uzunluğu (bayt cinsinden)

--out-buffer-size=uint64
İş parçacığı başına çıktı arabelleği boyutu (10000000)

-v,--ayrıntılı
Ayrıntılı ol (yanlış)

--kullanım
kullanım

-h,--yardım et
Bu mesaj

-V,--versiyon
Sürümü

SORGU
Kullanım: denizanası sorgusu [seçenekler] db:path

Sıkıştırılmış bir veritabanından sorgulama

Bir karma sorgulayın. Standart girişten k-mer'leri okur ve sayıları standart girişe yazar.
çıktı.

Seçenekler (() içindeki varsayılan değer), *gerekli):

-C,--her iki iplikçik
Her iki iplikçik (yanlış)

-c,--cary-bit
Cary bit bilgisi olarak değer alanı (yanlış)

-i, --giriş=dosya
Giriş dosyası

-o, --çıktı=dosya
Çıktı dosyası

--kullanım
kullanım

-h,--yardım et
Bu mesaj

-V,--versiyon
Sürümü

QHİSTO
Kullanım: denizanası qhisto [seçenekler] db:string

K-mer oluşumlarının bir histogramını oluşturun

Seçenekler (() içindeki varsayılan değer), *gerekli):

-l, --düşük= çift
Histogramın düşük sayım değeri (0.0)

-h, --yüksek= çift
Histogramın yüksek sayım değeri (10000.0)

-i, --artış= çift
Kovalar için artış değeri (1.0)

-f,--tam dolu
Tam geçmiş. 0 sayısını atlamayın. (yanlış)

--kullanım
kullanım

--yardım et
Bu mesaj

-V,--versiyon
Sürümü

DÖKÜM
Kullanım: denizanası qdump [seçenekler] db:path

Bir qmer veritabanından k-mer dökümü

Varsayılan olarak, başlığın sayı ve sıranın ise sayı olduğu bir fasta biçiminde döküm yapın.
k-mer dizisi. Sütun formatı 2 sütunlu bir çıktıdır: k-mer sayısı.

Seçenekler (() içindeki varsayılan değer), *gerekli):

-c,--kolon
Sütun biçimi (yanlış)

-t,--tab
Sekme ayırıcı (yanlış)

-L, --düşük-sayım= çift
Sayım < düşük sayım ile k-mer çıktısı vermeyin

-U, --üst sayım= çift
Sayım > üst sayım ile k-mer çıktısı vermeyin

-v,--ayrıntılı
Ayrıntılı ol (yanlış)

-o, --çıktı=dize
Çıktı dosyası

--kullanım
kullanım

-h,--yardım et
Bu mesaj

-V,--versiyon
Sürümü

Q BİRLEŞTİRME
Kullanım: denizanası birleştirme [seçenekler] db:string+

Deprem veritabanlarını birleştir

Seçenekler (() içindeki varsayılan değer), *gerekli):

-s, --boy=uint64
* Birleştirilmiş karma tablo boyutu

-m, --mer-len=uint32
* Mer uzunluğu

-o, --çıktı=dize
Çıktı dosyası (birleştirilmiş.jf)

-p, --reprobelar=uint32
Maksimum tekrar sayısı (62)

--kullanım
kullanım

-h,--yardım et
Bu mesaj

--tam yardım
Ayrıntılı yardım

-V,--versiyon
Sürümü

ISCED
Kullanım: denizanası alıntı [seçenekler]

Denizanası makalesinden alıntı nasıl yapılır

Kağıt alıntı

Seçenekler (() içindeki varsayılan değer), *gerekli):

-b,--bibteks
Bibtex formatı (yanlış)

-o, --çıktı=dize
Çıktı dosyası

--kullanım
kullanım

-h,--yardım et
Bu mesaj

-V,--versiyon
Sürümü

VERSION


Sürüm: 1.1.4 / 2010/10/1

onworks.net hizmetlerini kullanarak denizanasını çevrimiçi kullanın


Ücretsiz Sunucular ve İş İstasyonları

Windows ve Linux uygulamalarını indirin

Linux komutları

Ad