Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen Ray komutudur.
Program:
ADI
Işın - mesaj ileten arabirimi kullanarak genomları paralel olarak birleştirin
SİNOPSİS
mpiexec -n NUMBER_OF_RANKS Işını -k KMERLENGTH -p l1_1.fastq l1_2.fastq -p l2_1.fastq
l2_2.fastq -o test
mpiexec -n NUMBER_OF_RANKS Ray Ray.conf # bir dosyadaki komutlarla
AÇIKLAMA:
Ray genom birleştiricisi, genel bir eklenti tabanlı RayPlatform'un üzerine inşa edilmiştir.
için mesaj iletme arabirimini kullanan dağıtılmış ve paralel hesaplama motoru
geçen mesajlar
Ray birkaç uygulamayı hedefler:
- de novo genom derlemesi (Ray vanilya ile) - de novo meta-genom derlemesi (ile
Ray Meta) - de novo transkriptome düzeneği (çalışıyor, ancak çok fazla test edilmedi) -
bitişik bollukların nicelenmesi - mikrobiyom konsorsiyumlarının nicelleştirilmesi
üyeler (Ray Communities ile) - transkript ifadesinin nicelleştirilmesi - sınıflandırma
örneklerin profillenmesi (Ray Communities ile) - örneklerin gen ontolojisi profillemesi
(Ray Ontology ile birlikte)
-Yardım
Bu yardım sayfasını görüntüler.
-version
Ray sürümünü ve derleme seçeneklerini görüntüler.
Bir yapılandırma dosyası kullanma
Ray, mpiexec ile başlatılabilir -n 16 Ray Ray.conf Yapılandırma dosyası
yorumları dahil edin (# ile başlayan).
K-mer uzunluğu
-k kmerUzunluk
K-merlerin uzunluğunu seçer. Varsayılan değer 21'dir. Tek olmalıdır çünkü
ters tamamlayıcı köşeler birlikte saklanır. Maksimum uzunluk şurada tanımlanır:
MAXKMERLENGTH tarafından derleme Daha büyük k-mer'ler daha fazla bellek kullanır.
Girdiler
-p leftSequenceFile rightSequenceFile [averageOuterDistance standardSapma]
Eşleştirilmiş uç okumalar içeren iki dosya sağlar. ortalamaDış Mesafe ve
standartSapma sağlanmazsa otomatik olarak hesaplanır.
-i interleavedSequenceFile [averageOuterDistance standardSapma]
Araya eklenmiş çift uçlu okumalar içeren bir dosya sağlar. ortalamaDışMesafe
ve standardDeviation sağlanmazsa otomatik olarak hesaplanır.
-s sıraDosya
Tek uçlu okumaları içeren bir dosya sağlar.
Çıkışlar
-o çıktıDizin
Çıktı alınan dosyalar için dizini belirtir. Varsayılan RayOutput'tur
Montaj seçenekleri (varsayılanlar iyi çalışır)
-devre dışı bırak-geri dönüşüm
Montaj okumaları sırasında okuma geri dönüşümünü devre dışı bırakmak 3 durumda serbest bırakılır: 1.
mesafe bir çift için eşleşmedi 2. okuma eşiyle karşılaşmadı 3.
kitaplık popülasyonu yanlış bir yerleşimi gösteriyor bkz. Tekrarların kısıtlı geçişi
eşleştirilmiş diziler ile Sebastien Boisvert, Elenie Godzaridis, François Laviolette
& Jacques Corbeil. Massively Paralel Üzerine İlk Yıllık RECOMB Uydu Çalıştayı
Sıralama, 26-27 Mart 2011, Vancouver, BC, Kanada.
-devre dışı-iskele
İskeleyi devre dışı bırakır.
-minimum-contig-uzunluğu minimumContigLength
Minimum bitiş uzunluğunu değiştirir, varsayılan 100 nükleotittir
-renk-uzay
Renk alanında çalışır csfasta dosyalarına ihtiyaç duyar. csfasta dosyaları varsa otomatik olarak etkinleştirilir
sağlanır.
-kullanım-maksimum-tohum kapsamı maksimum Tohum KapsamıDepth
Bu eşiğin üzerinde bir kapsama derinliğine sahip herhangi bir tohumu yok sayar. Varsayılan
4294967295
-kullanım-minimum-tohum kapsamı minimumTohumKapsam Derinliği
Minimum tohum kapsama derinliğini ayarlar. Kapsama derinliği aşağıdakilerden daha düşük olan herhangi bir yol
bu atılacak. Varsayılan 0'dır.
Dağıtılmış depolama motoru (tüm bu değerler her MPI sıralaması içindir)
-bloom-filtre-bitleri bit
Bloom filtresi için bit sayısını ayarlar Varsayılan 268435456 bit, 0 bit
Bloom filtresini devre dışı bırakır.
-karma-tablo-kovalar kovalar
İlk paket sayısını ayarlar. 2'nin kuvveti olmalı! Varsayılan değer:
268435456
-grup başına-karma-tablo-kovaları kovalar
Seyrek depolama için grup başına kova sayısını ayarlar Varsayılan değer: 64, Olmalıdır
>=1 ile <= 64 arasında
-karma-tablo-yük faktörü-eşiği eşik
Gerçek zamanlı yeniden boyutlandırma için yük faktörü eşiğini ayarlar Varsayılan değer: 0.75, olmalıdır
>= 0.5 ve < 1
-karma-tablo-ayrıntısı
Dağıtılmış depolama motoru için ayrıntı düzeyini etkinleştirir
biyolojik bolluk
-arama aramaDizin
De Bruijn grafiğinde aranacak fasta dosyalarını içeren bir dizin sağlar.
Biyolojik bolluklar RayOutput/BiologicalAbundances'a yazılacaktır Bkz.
Belgeler/BiologicalAbundances.txt
-dosya başına bir renk
Sıra başına bir renk yerine dosya başına bir renk ayarlar. Varsayılan olarak, her bir dizi
her dosyanın farklı bir rengi vardır. Çok sayıda diziye sahip dosyalar için
dosya başına tek bir renk daha verimli olabilir.
Renkli de Bruijn grafikleriyle taksonomik profil oluşturma
-taksonomi ile Genom-to-Taxon.tsv TreeOfLife-Edges.tsv Takson-Names.tsv
Taksonomi sağlar. Ayrıntılı taksonomik profilleri hesaplar ve yazar. Görmek
Ayrıntılar için Documentation/Taxonomy.txt.
-Gen ontolojisi OntologyTerms.txt
Açıklamalar.txt
Bir ontoloji ve açıklamalar sağlar. OntologyTerms.txt şuradan alınır:
http://geneontology.org Annotations.txt 2 sütunlu bir dosyadır (EMBL_CDS tanıtıcı &
gen ontoloji tanımlayıcısı) Bkz. Documentation/GeneOntology.txt
Diğer çıktılar
-etkin-mahalleler
De Bruijn grafiğindeki bitişik mahalleleri hesaplar Çıktı dosyası:
RayOutput/NeighbourhoodRelations.txt
-amos
RayOutput/AMOS.afg adlı AMOS dosyasını yazar Bir AMOS dosyası okuma konumları içerir
devam ediyor. Grafik kullanıcı arayüzü ile yazılım ile açılabilir.
-yazma-kmers
RayOutput/kmers.txt dosyasına k-mer grafiği yazar.
Işın. Ortaya çıkan dosya çok büyük.
-yazma-okuma-işaretleyicileri
Diske okuma işaretçileri yazar.
-yaz-tohumlar
Tohum DNA dizilerini RayOutput/Rank'e yazar .RaySeeds.fasta
-yazma uzantıları
Uzatma DNA dizilerini RayOutput/Rank'e yazar .RayExtensions.fasta
-yazma-contig-yolları
Kapsam değerleriyle birlikte bitiş yollarını RayOutput/Rank'e yazar .RayContigPaths.txt
-yazma-işaretleyici-özeti
İşaret istatistiklerini yazar.
Hafıza kullanımı
-göster-bellek-kullanımı
Bellek kullanımını gösterir. Veriler şuradan alınır: / proc GNU/Linux İhtiyaçları üzerine __linux__
-göster-bellek-tahsisatları
Bellek ayırma olaylarını gösterir
Algoritma ayrıntı düzeyi
-göster-uzantı-seçimi
Uzatma sırasında yapılan seçimi (diğer seçeneklerle birlikte) gösterir.
-göster-bitiş-bağlam
Her uzantının bitiş bağlamını gösterir. Köşenin çocuklarına nerede olduğunu gösterir
uzatma çok zordu.
-göster-mesafe-özeti
Bir uzatma yolu için kullanılan dış mesafelerin özetini gösterir.
-göster-konsensüs
Bir seçim yapıldığında fikir birliğini gösterir.
checkpointing
-yazma-kontrol noktaları kontrol noktasıDizin
Kontrol noktası dosyaları yaz
-oku-kontrol noktaları kontrol noktasıDizin
Kontrol noktası dosyalarını oku
-okuma-yazma-kontrol noktaları kontrol noktasıDizin
Kontrol noktası dosyalarını okuyun ve yazın
Çok sayıda çekirdek için mesaj yönlendirme
-rota-mesajlar
Ray mesaj yönlendiricisini etkinleştirir. Varsayılan olarak devre dışıdır. Mesajlar yönlendirilecek
buna göre, herhangi bir rütbe, yalnızca birkaç kişiyle doğrudan iletişim kurabilir.
olmadan -rota-mesajlar, herhangi bir rütbe, diğer herhangi bir rütbe ile doğrudan iletişim kurabilir.
Oluşturulan dosyalar: Routing/Connections.txt, Routing/Routes.txt ve
Yönlendirme/RelayEvents.txt ve Yönlendirme/Summary.txt
-bağlantı türü tip
Rotalar için bağlantı türünü ayarlar. Kabul edilen değerler deebruijn, hypercube,
politop, grup, rastgele, kautz ve eksiksiz. Varsayılan değer deebruijn'dir.
deebruijn: tam bir de Bruijn grafiği belirli bir alfabe ve çap hiperküpü: a
hiperküp, alfabe {0,1} ve köşeler 2 politopun kuvvetidir: dışbükey
normal politop, alfabe {0,1,...,B-1} ve köşeler B grubunun bir kuvvetidir:
grup başına bir temsilcinin yabancılarla iletişim kurabileceği aptal model
rastgele: Erdos-Renyi model kautz: bir de'nin alt grafiği olan tam bir de Kautz grafiği
Bruijn grafiği tamamlandı: tüm olası bağlantıları içeren tam bir grafik
deebruijn türünde, sıra sayısı bir şeyin gücü olmalıdır.
Örnekler: 256 = 16*16, 512=8*8*8, 49=7*7 vb. Aksi takdirde, debruijn kullanmayın
yönlendirme ama başka bir tane kullanın kautz tipinde, sıra sayısı n olmalıdır
bazı k ve d için n=(k+1)*k^(d-1)
-yönlendirme-grafiği-derecesi derece
Yönlendirme grafiği için giden dereceyi belirtir. Bkz. Documentation/Routing.txt
Donanım testi
-yalnızca ağ testi
Ağı test eder ve geri döner.
-yaz-ağ-test-ham-veri
Ağ testini ayrıntılandıran sıra başına bir ek dosya yazar.
-değişimler Değişim Sayısı
Değişim sayısını ayarlar
-devre dışı-ağ-testi
Ağ testini atlar.
Hata ayıklama
-doğrulama-mesaj-bütünlüğü
Boş olmayan herhangi bir mesaj için mesaj verilerinin güvenilirliğini kontrol eder. '-D CONFIG_SSE_4_2' ekleyin
Donanım talimatını kullanmak için Makefile'de (SSE 4.2)
-run-profilleyici
Kod çalışırken profil oluşturucuyu çalıştırır. Varsayılan olarak, yalnızca ayrıntı düzeyi uyarılarını göster.
Profil oluşturucuyu çalıştırmak, çalışma sürelerini artırır.
-profilleyici-detayları ile
Her seferinde her yöntemde gönderilen ve alınan mesajların sayısını gösterir
dilimler (dönemler). ihtiyaçlar -run-profilleyici.
-gösteri-iletişim-etkinlikleri
Gönderilen ve alınan tüm mesajları gösterir.
-göster-oku-yerleştirme
Uzantı sırasında grafikte okuma yerleşimini gösterir.
-debug-kabarcıkları
Hata ayıklama balonu kodu. Baloncuklar heterozigot sitelerden veya sıralama hatalarından kaynaklanabilir.
veya diğer (bilinmeyen) olaylar
-hata ayıklama tohumları
Hata ayıklar tohum kodu. Tohumlar, grafikte muhtemelen benzersiz olan yollardır.
-debug-füzyonları
Füzyon kodunda hata ayıklar.
-debug-iskele
İskelede hata ayıklayın.
DOSYALAR
Giriş dosyaları
Not: dosya formatı dosya uzantısı ile belirlenir.
.fasta .fasta.gz (derlemede HAVE_LIBZ=y gerekir) .fasta.bz2 (HAV_LIBBZ2=y gerekir
derlemede) .fastq .fastq.gz (derlemede HAVE_LIBZ=y gerekir) .fastq.bz2
(derlemede HAVE_LIBBZ2=y gerekir) .sff (eşleştirilmiş okumalar manuel olarak çıkarılmalıdır)
.csfasta (renk alanı okumaları)
Çıktı alınan dosyalar
Yapı iskeleleri
RayOutput/Scaffolds.fasta
FASTA formatında iskele dizileri
RayOutput/ScaffoldComponents.txt
Her iskelenin bileşenleri
RayOutput/ScaffoldLengths.txt
Her iskelenin uzunluğu
RayOutput/ScaffoldLinks.txt
İskele bağlantıları
Contig'ler
RayOutput/Contigs.fasta
FASTA formatında bitişik diziler
RayOutput/ContigLengths.txt
Bitişik dizilerin uzunlukları
ÖZET
RayOutput/OutputNumbers.txt
Montaj için genel sayılar
de Bruijn grafiği
RayOutput/CoverageDistribution.txt
Kapsama değerlerinin dağılımı
RayOutput/CoverageDistributionAnaliz.txt
Kapsam dağılımının analizi
RayOutput/degreeDistribution.txt
Gelen ve giden derecelerin dağılımı
RayOutput/kmers.txt
k-mer grafiği, gerekli seçenek: -yazma-kmers
Ortaya çıkan dosya Ray tarafından kullanılmaz. Ortaya çıkan dosya çok büyük.
Montaj adımları
RayOutput/SeedLengthDistribution.txt
Tohum uzunluğunun dağılımı
RayÇıkış/Sıralama .OptimalReadMarkers.txt
İşaretçileri okuyun.
RayÇıkış/Sıralama .RaySeeds.fasta
Tohum DNA dizileri, gerekli seçenek: -yaz-tohumlar
RayÇıkış/Sıralama .RayExtensions.fasta
Uzatma DNA dizileri, gerekli seçenek: -yazma uzantıları
RayÇıkış/Sıralama .RayContigPaths.txt
Kapsam değerlerine sahip bitişik yollar, gerekli seçenek: -yazma-contig-yolları
eşleştirilmiş okumalar
RayOutput/LibraryStatistics.txt
Eşleştirilmiş okumalar için dış mesafelerin tahmini
RayOutput/Kütüphane .txt
Gözlemlenen dış mesafeler için frekanslar (giriş boyutu + okuma uzunlukları)
Bölme
RayOutput/NumberOfSequences.txt
Her dosyadaki okuma sayısı
RayOutput/SequencePartition.txt
sıra bölümü
Işın yazılımı
RayOutput/RayVersion.txt
Ray'in sürümü
RayOutput/RayCommand.txt
Sağlanan tam olarak aynı komut
AMOS
RayOutput/AMOS.afg
AMOS formatında montaj gösterimi, gerekli seçenek: -amos
Yakın İletişim
RayOutput/MessagePassingInterface.txt
Gönderilen mesaj sayısı
RayOutput/NetworkTest.txt
Mikrosaniye cinsinden gecikmeler
RayÇıkış/Sıralama NetworkTestData.txt
Ağ testi ham verileri
DOKÜMANTASYON
- mpiexec -n 1 Işın -Yardım|less (her zaman güncel) - Bu yardım sayfası (her zaman
güncel) - Dizin Dokümantasyon/ - Kılavuz (Taşınabilir Belge Formatı):
InstructionManual.tex (Dokümantasyonda) - Posta listesi arşivleri:
http://sourceforge.net/mailarchive/forum.php?forum_name=denovoassembler-kullanıcıları
YAZAR
Sebastien Boisvert tarafından yazıldı.
RAPORLAMA HATALARI
Hataları şuraya bildir: denovoassembler-users@lists.sourceforge.net Ana sayfa:
<http://denovoassembler.sourceforge.net/>
TELİF HAKKI
Bu program ücretsiz bir yazılımdır: altında yeniden dağıtabilir ve/veya değiştirebilirsiniz.
Özgür Yazılım tarafından yayınlanan GNU Genel Kamu Lisansı koşulları
Foundation, Lisansın 3. sürümü.
Bu program yararlı olacağı umuduyla dağıtılmıştır, ancak HİÇBİR ŞEY OLMADAN
GARANTİ; SATILABİLİRLİK veya A İÇİN UYGUNLUK zımni garantisi bile olmadan
BELİRLİ AMAÇ. Daha fazla ayrıntı için GNU Genel Kamu Lisansına bakın.
Bu programla birlikte GNU Genel Kamu Lisansının bir kopyasını aldınız
(bkz. LİSANS).
Ray 2.1.0
Ray Lisansı: GNU Genel Kamu Lisansı sürüm 3 RayPlatform sürümü: 1.1.0 Lisansı
RayPlatform için: GNU Kısıtlı Genel Kamu Lisansı sürüm 3
MAXKMERLENGTH: 32 KMER_U64_ARRAY_SIZE: 1 CoverageDepth tarafından depolanan maksimum kapsama derinliği:
4294967295 MAXIMUM_MESSAGE_SIZE_IN_BYTES: 4000 bayt FORCE_PACKING = n ASSERT = n
HAVE_LIBZ = y HAVE_LIBBZ2 = y CONFIG_PROFILER_COLLECT = n CONFIG_CLOCK_GETTIME = n
__linux__ = y _MSC_VER = n __GNUC__ = y RAY_32_BITS = n RAY_64_BITS = y MPI standardı
sürüm: MPI 2.1 MPI kitaplığı: Open-MPI 1.4.2 Derleyici: GNU gcc/g++ 4.4.5
onworks.net hizmetlerini kullanarak Ray'i çevrimiçi kullanın