Ray - Bulutta Çevrimiçi

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen Ray komutudur.

Program:

ADI


Işın - mesaj ileten arabirimi kullanarak genomları paralel olarak birleştirin

SİNOPSİS


mpiexec -n NUMBER_OF_RANKS Işını -k KMERLENGTH -p l1_1.fastq l1_2.fastq -p l2_1.fastq
l2_2.fastq -o test

mpiexec -n NUMBER_OF_RANKS Ray Ray.conf # bir dosyadaki komutlarla

AÇIKLAMA:


Ray genom birleştiricisi, genel bir eklenti tabanlı RayPlatform'un üzerine inşa edilmiştir.
için mesaj iletme arabirimini kullanan dağıtılmış ve paralel hesaplama motoru
geçen mesajlar

Ray birkaç uygulamayı hedefler:

- de novo genom derlemesi (Ray vanilya ile) - de novo meta-genom derlemesi (ile
Ray Meta) - de novo transkriptome düzeneği (çalışıyor, ancak çok fazla test edilmedi) -
bitişik bollukların nicelenmesi - mikrobiyom konsorsiyumlarının nicelleştirilmesi
üyeler (Ray Communities ile) - transkript ifadesinin nicelleştirilmesi - sınıflandırma
örneklerin profillenmesi (Ray Communities ile) - örneklerin gen ontolojisi profillemesi
(Ray Ontology ile birlikte)

-Yardım

Bu yardım sayfasını görüntüler.

-version

Ray sürümünü ve derleme seçeneklerini görüntüler.

Bir yapılandırma dosyası kullanma

Ray, mpiexec ile başlatılabilir -n 16 Ray Ray.conf Yapılandırma dosyası
yorumları dahil edin (# ile başlayan).

K-mer uzunluğu

-k kmerUzunluk

K-merlerin uzunluğunu seçer. Varsayılan değer 21'dir. Tek olmalıdır çünkü
ters tamamlayıcı köşeler birlikte saklanır. Maksimum uzunluk şurada tanımlanır:
MAXKMERLENGTH tarafından derleme Daha büyük k-mer'ler daha fazla bellek kullanır.

Girdiler

-p leftSequenceFile rightSequenceFile [averageOuterDistance standardSapma]

Eşleştirilmiş uç okumalar içeren iki dosya sağlar. ortalamaDış Mesafe ve
standartSapma sağlanmazsa otomatik olarak hesaplanır.

-i interleavedSequenceFile [averageOuterDistance standardSapma]

Araya eklenmiş çift uçlu okumalar içeren bir dosya sağlar. ortalamaDışMesafe
ve standardDeviation sağlanmazsa otomatik olarak hesaplanır.

-s sıraDosya

Tek uçlu okumaları içeren bir dosya sağlar.

Çıkışlar

-o çıktıDizin

Çıktı alınan dosyalar için dizini belirtir. Varsayılan RayOutput'tur

Montaj seçenekleri (varsayılanlar iyi çalışır)

-devre dışı bırak-geri dönüşüm

Montaj okumaları sırasında okuma geri dönüşümünü devre dışı bırakmak 3 durumda serbest bırakılır: 1.
mesafe bir çift için eşleşmedi 2. okuma eşiyle karşılaşmadı 3.
kitaplık popülasyonu yanlış bir yerleşimi gösteriyor bkz. Tekrarların kısıtlı geçişi
eşleştirilmiş diziler ile Sebastien Boisvert, Elenie Godzaridis, François Laviolette
& Jacques Corbeil. Massively Paralel Üzerine İlk Yıllık RECOMB Uydu Çalıştayı
Sıralama, 26-27 Mart 2011, Vancouver, BC, Kanada.

-devre dışı-iskele

İskeleyi devre dışı bırakır.

-minimum-contig-uzunluğu minimumContigLength

Minimum bitiş uzunluğunu değiştirir, varsayılan 100 nükleotittir

-renk-uzay

Renk alanında çalışır csfasta dosyalarına ihtiyaç duyar. csfasta dosyaları varsa otomatik olarak etkinleştirilir
sağlanır.

-kullanım-maksimum-tohum kapsamı maksimum Tohum KapsamıDepth

Bu eşiğin üzerinde bir kapsama derinliğine sahip herhangi bir tohumu yok sayar. Varsayılan
4294967295

-kullanım-minimum-tohum kapsamı minimumTohumKapsam Derinliği

Minimum tohum kapsama derinliğini ayarlar. Kapsama derinliği aşağıdakilerden daha düşük olan herhangi bir yol
bu atılacak. Varsayılan 0'dır.

Dağıtılmış depolama motoru (tüm bu değerler her MPI sıralaması içindir)

-bloom-filtre-bitleri bit

Bloom filtresi için bit sayısını ayarlar Varsayılan 268435456 bit, 0 bit
Bloom filtresini devre dışı bırakır.

-karma-tablo-kovalar kovalar

İlk paket sayısını ayarlar. 2'nin kuvveti olmalı! Varsayılan değer:
268435456

-grup başına-karma-tablo-kovaları kovalar

Seyrek depolama için grup başına kova sayısını ayarlar Varsayılan değer: 64, Olmalıdır
>=1 ile <= 64 arasında

-karma-tablo-yük faktörü-eşiği eşik

Gerçek zamanlı yeniden boyutlandırma için yük faktörü eşiğini ayarlar Varsayılan değer: 0.75, olmalıdır
>= 0.5 ve < 1

-karma-tablo-ayrıntısı

Dağıtılmış depolama motoru için ayrıntı düzeyini etkinleştirir

biyolojik bolluk

-arama aramaDizin

De Bruijn grafiğinde aranacak fasta dosyalarını içeren bir dizin sağlar.
Biyolojik bolluklar RayOutput/BiologicalAbundances'a yazılacaktır Bkz.
Belgeler/BiologicalAbundances.txt

-dosya başına bir renk

Sıra başına bir renk yerine dosya başına bir renk ayarlar. Varsayılan olarak, her bir dizi
her dosyanın farklı bir rengi vardır. Çok sayıda diziye sahip dosyalar için
dosya başına tek bir renk daha verimli olabilir.

Renkli de Bruijn grafikleriyle taksonomik profil oluşturma

-taksonomi ile Genom-to-Taxon.tsv TreeOfLife-Edges.tsv Takson-Names.tsv

Taksonomi sağlar. Ayrıntılı taksonomik profilleri hesaplar ve yazar. Görmek
Ayrıntılar için Documentation/Taxonomy.txt.

-Gen ontolojisi OntologyTerms.txt
Açıklamalar.txt

Bir ontoloji ve açıklamalar sağlar. OntologyTerms.txt şuradan alınır:
http://geneontology.org Annotations.txt 2 sütunlu bir dosyadır (EMBL_CDS tanıtıcı &
gen ontoloji tanımlayıcısı) Bkz. Documentation/GeneOntology.txt

Diğer çıktılar

-etkin-mahalleler

De Bruijn grafiğindeki bitişik mahalleleri hesaplar Çıktı dosyası:
RayOutput/NeighbourhoodRelations.txt

-amos

RayOutput/AMOS.afg adlı AMOS dosyasını yazar Bir AMOS dosyası okuma konumları içerir
devam ediyor. Grafik kullanıcı arayüzü ile yazılım ile açılabilir.

-yazma-kmers

RayOutput/kmers.txt dosyasına k-mer grafiği yazar.
Işın. Ortaya çıkan dosya çok büyük.

-yazma-okuma-işaretleyicileri

Diske okuma işaretçileri yazar.

-yaz-tohumlar

Tohum DNA dizilerini RayOutput/Rank'e yazar .RaySeeds.fasta

-yazma uzantıları

Uzatma DNA dizilerini RayOutput/Rank'e yazar .RayExtensions.fasta

-yazma-contig-yolları

Kapsam değerleriyle birlikte bitiş yollarını RayOutput/Rank'e yazar .RayContigPaths.txt

-yazma-işaretleyici-özeti

İşaret istatistiklerini yazar.

Hafıza kullanımı

-göster-bellek-kullanımı

Bellek kullanımını gösterir. Veriler şuradan alınır: / proc GNU/Linux İhtiyaçları üzerine __linux__

-göster-bellek-tahsisatları

Bellek ayırma olaylarını gösterir

Algoritma ayrıntı düzeyi

-göster-uzantı-seçimi

Uzatma sırasında yapılan seçimi (diğer seçeneklerle birlikte) gösterir.

-göster-bitiş-bağlam

Her uzantının bitiş bağlamını gösterir. Köşenin çocuklarına nerede olduğunu gösterir
uzatma çok zordu.

-göster-mesafe-özeti

Bir uzatma yolu için kullanılan dış mesafelerin özetini gösterir.

-göster-konsensüs

Bir seçim yapıldığında fikir birliğini gösterir.

checkpointing

-yazma-kontrol noktaları kontrol noktasıDizin

Kontrol noktası dosyaları yaz

-oku-kontrol noktaları kontrol noktasıDizin

Kontrol noktası dosyalarını oku

-okuma-yazma-kontrol noktaları kontrol noktasıDizin

Kontrol noktası dosyalarını okuyun ve yazın

Çok sayıda çekirdek için mesaj yönlendirme

-rota-mesajlar

Ray mesaj yönlendiricisini etkinleştirir. Varsayılan olarak devre dışıdır. Mesajlar yönlendirilecek
buna göre, herhangi bir rütbe, yalnızca birkaç kişiyle doğrudan iletişim kurabilir.
olmadan -rota-mesajlar, herhangi bir rütbe, diğer herhangi bir rütbe ile doğrudan iletişim kurabilir.
Oluşturulan dosyalar: Routing/Connections.txt, Routing/Routes.txt ve
Yönlendirme/RelayEvents.txt ve Yönlendirme/Summary.txt

-bağlantı türü tip

Rotalar için bağlantı türünü ayarlar. Kabul edilen değerler deebruijn, hypercube,
politop, grup, rastgele, kautz ve eksiksiz. Varsayılan değer deebruijn'dir.

deebruijn: tam bir de Bruijn grafiği belirli bir alfabe ve çap hiperküpü: a
hiperküp, alfabe {0,1} ve köşeler 2 politopun kuvvetidir: dışbükey
normal politop, alfabe {0,1,...,B-1} ve köşeler B grubunun bir kuvvetidir:
grup başına bir temsilcinin yabancılarla iletişim kurabileceği aptal model
rastgele: Erdos-Renyi model kautz: bir de'nin alt grafiği olan tam bir de Kautz grafiği
Bruijn grafiği tamamlandı: tüm olası bağlantıları içeren tam bir grafik

deebruijn türünde, sıra sayısı bir şeyin gücü olmalıdır.
Örnekler: 256 = 16*16, 512=8*8*8, 49=7*7 vb. Aksi takdirde, debruijn kullanmayın
yönlendirme ama başka bir tane kullanın kautz tipinde, sıra sayısı n olmalıdır
bazı k ve d için n=(k+1)*k^(d-1)

-yönlendirme-grafiği-derecesi derece

Yönlendirme grafiği için giden dereceyi belirtir. Bkz. Documentation/Routing.txt

Donanım testi

-yalnızca ağ testi

Ağı test eder ve geri döner.

-yaz-ağ-test-ham-veri

Ağ testini ayrıntılandıran sıra başına bir ek dosya yazar.

-değişimler Değişim Sayısı

Değişim sayısını ayarlar

-devre dışı-ağ-testi

Ağ testini atlar.

Hata ayıklama

-doğrulama-mesaj-bütünlüğü

Boş olmayan herhangi bir mesaj için mesaj verilerinin güvenilirliğini kontrol eder. '-D CONFIG_SSE_4_2' ekleyin
Donanım talimatını kullanmak için Makefile'de (SSE 4.2)

-run-profilleyici

Kod çalışırken profil oluşturucuyu çalıştırır. Varsayılan olarak, yalnızca ayrıntı düzeyi uyarılarını göster.
Profil oluşturucuyu çalıştırmak, çalışma sürelerini artırır.

-profilleyici-detayları ile

Her seferinde her yöntemde gönderilen ve alınan mesajların sayısını gösterir
dilimler (dönemler). ihtiyaçlar -run-profilleyici.

-gösteri-iletişim-etkinlikleri

Gönderilen ve alınan tüm mesajları gösterir.

-göster-oku-yerleştirme

Uzantı sırasında grafikte okuma yerleşimini gösterir.

-debug-kabarcıkları

Hata ayıklama balonu kodu. Baloncuklar heterozigot sitelerden veya sıralama hatalarından kaynaklanabilir.
veya diğer (bilinmeyen) olaylar

-hata ayıklama tohumları

Hata ayıklar tohum kodu. Tohumlar, grafikte muhtemelen benzersiz olan yollardır.

-debug-füzyonları

Füzyon kodunda hata ayıklar.

-debug-iskele

İskelede hata ayıklayın.

DOSYALAR

Giriş dosyaları

Not: dosya formatı dosya uzantısı ile belirlenir.

.fasta .fasta.gz (derlemede HAVE_LIBZ=y gerekir) .fasta.bz2 (HAV_LIBBZ2=y gerekir
derlemede) .fastq .fastq.gz (derlemede HAVE_LIBZ=y gerekir) .fastq.bz2
(derlemede HAVE_LIBBZ2=y gerekir) .sff (eşleştirilmiş okumalar manuel olarak çıkarılmalıdır)
.csfasta (renk alanı okumaları)

Çıktı alınan dosyalar

Yapı iskeleleri

RayOutput/Scaffolds.fasta

FASTA formatında iskele dizileri

RayOutput/ScaffoldComponents.txt

Her iskelenin bileşenleri

RayOutput/ScaffoldLengths.txt

Her iskelenin uzunluğu

RayOutput/ScaffoldLinks.txt

İskele bağlantıları

Contig'ler

RayOutput/Contigs.fasta

FASTA formatında bitişik diziler

RayOutput/ContigLengths.txt

Bitişik dizilerin uzunlukları

ÖZET

RayOutput/OutputNumbers.txt

Montaj için genel sayılar

de Bruijn grafiği

RayOutput/CoverageDistribution.txt

Kapsama değerlerinin dağılımı

RayOutput/CoverageDistributionAnaliz.txt

Kapsam dağılımının analizi

RayOutput/degreeDistribution.txt

Gelen ve giden derecelerin dağılımı

RayOutput/kmers.txt

k-mer grafiği, gerekli seçenek: -yazma-kmers

Ortaya çıkan dosya Ray tarafından kullanılmaz. Ortaya çıkan dosya çok büyük.

Montaj adımları

RayOutput/SeedLengthDistribution.txt

Tohum uzunluğunun dağılımı

RayÇıkış/Sıralama .OptimalReadMarkers.txt

İşaretçileri okuyun.

RayÇıkış/Sıralama .RaySeeds.fasta

Tohum DNA dizileri, gerekli seçenek: -yaz-tohumlar

RayÇıkış/Sıralama .RayExtensions.fasta

Uzatma DNA dizileri, gerekli seçenek: -yazma uzantıları

RayÇıkış/Sıralama .RayContigPaths.txt

Kapsam değerlerine sahip bitişik yollar, gerekli seçenek: -yazma-contig-yolları

eşleştirilmiş okumalar

RayOutput/LibraryStatistics.txt

Eşleştirilmiş okumalar için dış mesafelerin tahmini

RayOutput/Kütüphane .txt

Gözlemlenen dış mesafeler için frekanslar (giriş boyutu + okuma uzunlukları)

Bölme

RayOutput/NumberOfSequences.txt

Her dosyadaki okuma sayısı

RayOutput/SequencePartition.txt

sıra bölümü

Işın yazılımı

RayOutput/RayVersion.txt

Ray'in sürümü

RayOutput/RayCommand.txt

Sağlanan tam olarak aynı komut

AMOS

RayOutput/AMOS.afg

AMOS formatında montaj gösterimi, gerekli seçenek: -amos

Yakın İletişim

RayOutput/MessagePassingInterface.txt

Gönderilen mesaj sayısı

RayOutput/NetworkTest.txt

Mikrosaniye cinsinden gecikmeler

RayÇıkış/Sıralama NetworkTestData.txt

Ağ testi ham verileri

DOKÜMANTASYON

- mpiexec -n 1 Işın -Yardım|less (her zaman güncel) - Bu yardım sayfası (her zaman
güncel) - Dizin Dokümantasyon/ - Kılavuz (Taşınabilir Belge Formatı):
InstructionManual.tex (Dokümantasyonda) - Posta listesi arşivleri:
http://sourceforge.net/mailarchive/forum.php?forum_name=denovoassembler-kullanıcıları

YAZAR

Sebastien Boisvert tarafından yazıldı.

RAPORLAMA HATALARI

Hataları şuraya bildir: denovoassembler-users@lists.sourceforge.net Ana sayfa:
<http://denovoassembler.sourceforge.net/>

TELİF HAKKI

Bu program ücretsiz bir yazılımdır: altında yeniden dağıtabilir ve/veya değiştirebilirsiniz.
Özgür Yazılım tarafından yayınlanan GNU Genel Kamu Lisansı koşulları
Foundation, Lisansın 3. sürümü.

Bu program yararlı olacağı umuduyla dağıtılmıştır, ancak HİÇBİR ŞEY OLMADAN
GARANTİ; SATILABİLİRLİK veya A İÇİN UYGUNLUK zımni garantisi bile olmadan
BELİRLİ AMAÇ. Daha fazla ayrıntı için GNU Genel Kamu Lisansına bakın.

Bu programla birlikte GNU Genel Kamu Lisansının bir kopyasını aldınız
(bkz. LİSANS).

Ray 2.1.0

Ray Lisansı: GNU Genel Kamu Lisansı sürüm 3 RayPlatform sürümü: 1.1.0 Lisansı
RayPlatform için: GNU Kısıtlı Genel Kamu Lisansı sürüm 3

MAXKMERLENGTH: 32 KMER_U64_ARRAY_SIZE: 1 CoverageDepth tarafından depolanan maksimum kapsama derinliği:
4294967295 MAXIMUM_MESSAGE_SIZE_IN_BYTES: 4000 bayt FORCE_PACKING = n ASSERT = n
HAVE_LIBZ = y HAVE_LIBBZ2 = y CONFIG_PROFILER_COLLECT = n CONFIG_CLOCK_GETTIME = n
__linux__ = y _MSC_VER = n __GNUC__ = y RAY_32_BITS = n RAY_64_BITS = y MPI standardı
sürüm: MPI 2.1 MPI kitaplığı: Open-MPI 1.4.2 Derleyici: GNU gcc/g++ 4.4.5

onworks.net hizmetlerini kullanarak Ray'i çevrimiçi kullanın



En yeni Linux ve Windows çevrimiçi programları