Ray - Online sa Cloud

Ito ang command na Ray na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


Ray - mag-ipon ng mga genome nang magkatulad gamit ang interface ng pagpasa ng mensahe

SINOPSIS


mpiexec -n NUMBER_OF_RANKS Ray -k KMERLENGTH -p l1_1.fastq l1_2.fastq -p l2_1.fastq
l2_2.fastq -o pagsusulit

mpiexec -n NUMBER_OF_RANKS Ray Ray.conf # na may mga command sa isang file

DESCRIPTION:


Ang Ray genome assembler ay binuo sa ibabaw ng RayPlatform, isang generic na plugin-based
distributed at parallel compute engine na gumagamit ng message-passing interface para sa
pagpasa ng mga mensahe.

Tina-target ni Ray ang ilang application:

- de novo genome assembly (may Ray vanilla) - de novo meta-genome assembly (may
Ray Meta) - de novo transcriptome assembly (gumagana, ngunit hindi nasubok ng maraming) -
quantification of contig abundances - quantification of microbiome consortia
miyembro (na may Ray Communities) - quantification ng transcript expression - taxonomy
profiling ng mga sample (na may Ray Communities) - gene ontology profiling ng mga sample
(kasama si Ray Ontologies)

-tulong

Ipinapakita ang pahina ng tulong na ito.

-version

Ipinapakita ang bersyon ng Ray at mga pagpipilian sa compilation.

Paggamit ng configuration file

Maaaring ilunsad si Ray sa mpiexec -n 16 Ray Ray.conf Ang configuration file ay maaaring
isama ang mga komento (nagsisimula sa #).

K-mer ang haba

-k kmerLength

Pinipili ang haba ng k-mers. Ang default na halaga ay 21. Ito ay dapat na kakaiba dahil
Ang reverse-complement vertices ay iniimbak nang magkasama. Ang maximum na haba ay tinukoy sa
compilation ni MAXKMERLENGTH Ang mas malaking k-mer ay gumagamit ng mas maraming memorya.

Input

-p leftSequenceFile rightSequenceFile [averageOuterDistance standardDeviation]

Nagbibigay ng dalawang file na naglalaman ng mga paired-end reads. averageOuterDistance at
Ang standardDeviation ay awtomatikong kinukuwenta kung hindi ibinigay.

-i interleavedSequenceFile [averageOuterDistance standardDeviation]

Nagbibigay ng isang file na naglalaman ng interleaved paired-end reads. averageOuterDistance
at ang standardDeviation ay awtomatikong kinukuwenta kung hindi ibinigay.

-s sequenceFile

Nagbibigay ng file na naglalaman ng single-end reads.

Output

-o outputDirectory

Tinutukoy ang direktoryo para sa mga nai-output na file. Default ay RayOutput

Mga opsyon sa pagpupulong (mahusay na gumagana ang mga default)

-disable-recycle

Ang mga hindi pinapagana ang pagre-recycle sa pagbasa sa panahon ng pagbabasa ng assembly ay itatakda nang libre sa 3 kaso: 1.
ang distansya ay hindi tumugma para sa isang pares 2. ang binasa ay hindi nakilala ang kanyang kapareha 3. ang
Ang populasyon ng aklatan ay nagpapahiwatig ng maling pagkakalagay tingnan ang Pinilit na pagtawid ng mga pag-uulit
na may magkakapares na pagkakasunod-sunod. Sebastien Boisvert, Elenie Godzaridis, Francois Laviolette
& Jacques Corbeil. Unang Taunang RECOMB Satellite Workshop sa Massively Parallel
Sequencing, Marso 26-27 2011, Vancouver, BC, Canada.

-disable-scaffolder

Hindi pinapagana ang scaffolder.

-minimum-contig-haba minimumContigLength

Binabago ang pinakamababang haba ng contig, ang default ay 100 nucleotides

-kulay-espasyo

Tumatakbo sa color-space Nangangailangan ng mga csfasta file. Awtomatikong na-activate kung csfasta file
ay ibinigay.

-gamitin-maximum-seed-coverage maximumSeedCoverageDepth

Binabalewala ang anumang binhi na may lalim na saklaw sa itaas ng threshold na ito. Ang default ay
4294967295.

-gamitin-minimum-seed-coverage minimumSeedCoverageDepth

Itinatakda ang pinakamababang lalim ng saklaw ng binhi. Anumang landas na may lalim ng saklaw na mas mababa kaysa sa
ito ay itatapon. Ang default ay 0.

Distributed storage engine (lahat ng mga value na ito ay para sa bawat MPI rank)

-bloom-filter-bits bits

Itinatakda ang bilang ng mga bit para sa Bloom filter na Default ay 268435456 bits, 0 bits
hindi pinapagana ang filter na Bloom.

-hash-table-bucket Mga timba

Itinatakda ang paunang bilang ng mga bucket. Dapat ay isang kapangyarihan ng 2! Default na halaga:
268435456

-hash-table-buckets-per-group Mga timba

Itinatakda ang bilang ng mga bucket bawat pangkat para sa kalat-kalat na imbakan Default na halaga: 64, Dapat ay
sa pagitan ng >=1 at <= 64

-hash-table-load-factor-threshold threshold

Itinatakda ang load factor threshold para sa real-time na pagbabago ng laki Default na halaga: 0.75, dapat
>= 0.5 at < 1

-hash-table-verbosity

Ina-activate ang verbosity para sa distributed storage engine

Biological na kasaganaan

-search searchDirectory

Nagbibigay ng direktoryo na naglalaman ng mga fasta file na hahanapin sa de Bruijn graph.
Ang mga biological abundances ay isusulat sa RayOutput/BiologicalAbundances See
Documentation/BiologicalAbundances.txt

-one-color-per-file

Nagtatakda ng isang kulay sa bawat file sa halip na isa sa bawat sequence. Bilang default, ang bawat sequence sa
ang bawat file ay may iba't ibang kulay. Para sa mga file na may malaking bilang ng mga sequence, gamit ang
ang isang solong kulay sa bawat file ay maaaring maging mas mahusay.

Taxonomic profiling na may kulay na de Bruijn graph

-may-taxonomy Genome-to-Taxon.tsv TreeOfLife-Edges.tsv Taxon-Names.tsv

Nagbibigay ng taxonomy. Nag-compute at nagsusulat ng mga detalyadong profile ng taxonomic. Tingnan mo
Documentation/Taxonomy.txt para sa mga detalye.

-gene-ontology OntologyTerms.txt
Anotasyon.txt

Nagbibigay ng ontolohiya at anotasyon. Ang OntologyTerms.txt ay kinukuha mula sa
http://geneontology.org Ang Annotations.txt ay isang 2-column file (EMBL_CDS handle &
gene ontology identifier) ​​Tingnan ang Documentation/GeneOntology.txt

Iba pang mga output

-enable-mga kapitbahayan

Kinuwenta ang mga contig neighborhood sa de Bruijn graph Output file:
RayOutput/NeighbourhoodRelations.txt

-amos

Isinulat ang AMOS file na tinatawag na RayOutput/AMOS.afg Ang AMOS file ay naglalaman ng mga read position
sa contigs. Maaaring mabuksan gamit ang software na may graphical na user interface.

-magsulat-kmers

Nagsusulat ng k-mer graph sa RayOutput/kmers.txt Ang resultang file ay hindi ginagamit ng
Ray. Ang resultang file ay napakalaki.

-write-read-marker

Nagsusulat ng mga read marker sa disk.

-sumulat-mga buto

Nagsusulat ng mga sequence ng seed DNA sa RayOutput/Rank .RaySeeds.fasta

-magsulat-mga extension

Nagsusulat ng mga extension ng DNA sequence sa RayOutput/Rank .RayExtensions.fasta

-write-contig-paths

Nagsusulat ng mga contig path na may mga halaga ng saklaw sa RayOutput/Rank .RayContigPaths.txt

-sumulat-marker-buod

Sumulat ng mga istatistika ng marker.

Paggamit ng memory

-ipakita-gamit-memorya

Ipinapakita ang paggamit ng memorya. Kinukuha ang data mula sa / proc sa GNU/Linux Kailangan ng __linux__

-ipakita-memory-allocations

Nagpapakita ng mga kaganapan sa paglalaan ng memorya

Algorithm verbosity

-show-extension-choice

Ipinapakita ang piniling ginawa (kasama ang iba pang mga pagpipilian) sa panahon ng extension.

-show-ending-context

Ipinapakita ang pangwakas na konteksto ng bawat extension. Ipinapakita sa mga bata ng vertex kung saan
masyadong mahirap ang extension.

-ipakita-distansya-buod

Nagpapakita ng buod ng mga panlabas na distansya na ginamit para sa isang extension path.

-show-consensus

Ipinapakita ang pinagkasunduan kapag ang isang pagpipilian ay tapos na.

Checkpointing

-sulat-checkpoints checkpointDirectory

Sumulat ng mga checkpoint file

-read-checkpoints checkpointDirectory

Basahin ang mga checkpoint file

-read-write-checkpoints checkpointDirectory

Magbasa at magsulat ng mga checkpoint file

Pagruruta ng mensahe para sa malaking bilang ng mga core

-ruta-mensahe

Pinapagana ang Ray message router. Hindi pinagana bilang default. Iruruta ang mga mensahe
nang naaayon upang ang anumang ranggo ay direktang makipag-ugnayan sa iilan lamang.
Wala -ruta-mensahe, anumang ranggo ay maaaring direktang makipag-ugnayan sa anumang iba pang ranggo.
Mga file na nabuo: Routing/Connections.txt, Routing/Routes.txt at
Routing/RelayEvents.txt at Routing/Summary.txt

-uri ng koneksyon uri

Itinatakda ang uri ng koneksyon para sa mga ruta. Ang mga tinatanggap na halaga ay debruijn, hypercube,
polytope, grupo, random, kautz at kumpleto. Ang default ay debruijn.

debruijn: isang buong de Bruijn graph isang ibinigay na alpabeto at diameter hypercube: a
hypercube, ang alpabeto ay {0,1} at ang vertices ay isang kapangyarihan ng 2 polytope: isang matambok
regular na polytope, ang alpabeto ay {0,1,...,B-1} at ang vertices ay isang kapangyarihan ng pangkat B:
hangal na modelo kung saan maaaring makipag-usap ang isang kinatawan sa bawat grupo sa mga tagalabas
random: Erdos-Renyi model kautz: isang buong de Kautz graph, na isang subgraph ng isang de
Kumpleto ang Bruijn graph: isang buong graph kasama ang lahat ng posibleng koneksyon

Sa uri ng debruijn, ang bilang ng mga ranggo ay dapat na kapangyarihan ng isang bagay.
Mga halimbawa: 256 = 16*16, 512=8*8*8, 49=7*7, at iba pa. Kung hindi, huwag gumamit ng debruijn
routing ngunit gumamit ng isa pa Sa uri ng kautz, ang bilang ng mga ranggo n ay dapat na
n=(k+1)*k^(d-1) para sa ilang k at d

-routing-graph-degree degree

Tinutukoy ang papalabas na antas para sa graph ng pagruruta. Tingnan ang Documentation/Routing.txt

Pagsubok sa hardware

-test-network-lamang

Sinusuri ang network at nagbabalik.

-write-network-test-raw-data

Sumulat ng isang karagdagang file sa bawat ranggo na nagdedetalye ng pagsubok sa network.

-palitan NumberOfExchanges

Itinatakda ang bilang ng mga palitan

-disable-network-test

Nilaktawan ang pagsubok sa network.

Pag-debug

-patunayan-mensahe-integridad

Sinusuri ang pagiging maaasahan ng data ng mensahe para sa anumang hindi walang laman na mensahe. idagdag ang '-D CONFIG_SSE_4_2'
sa Makefile para gumamit ng hardware na pagtuturo (SSE 4.2)

-run-profiler

Pinapatakbo ang profiler habang tumatakbo ang code. Bilang default, ipakita lamang ang mga babala ng granularity.
Ang pagpapatakbo ng profiler ay nagpapataas ng mga oras ng pagtakbo.

-may-profiler-detalye

Ipinapakita ang bilang ng mga mensaheng ipinadala at natanggap sa bawat pamamaraan sa bawat oras
mga hiwa (panahon). Pangangailangan -run-profiler.

-show-communication-events

Ipinapakita ang lahat ng mensaheng ipinadala at natanggap.

-ipakita-basahin-paglalagay

Ipinapakita ang read placement sa graph sa panahon ng extension.

-debug-bubbles

Nagde-debug ng bubble code. Ang mga bula ay maaaring dahil sa mga heterozygous na site o mga error sa sequencing
o iba pang (hindi alam) na mga kaganapan

-debug-seeds

Nagde-debug ng seed code. Ang mga buto ay mga landas sa graph na malamang na natatangi.

-debug-fusions

Nagde-debug ng fusion code.

-debug-scaffolder

I-debug ang scaffolder.

MGA FILE

Mag-input ng mga file

Tandaan: tinutukoy ang format ng file gamit ang extension ng file.

.fasta .fasta.gz (kailangan ng HAVE_LIBZ=y sa compilation) .fasta.bz2 (kailangan ng HAVE_LIBBZ2=y
sa compilation) .fastq .fastq.gz (kailangan ng HAVE_LIBZ=y sa compilation) .fastq.bz2
(kailangan ng HAVE_LIBBZ2=y sa compilation) .sff (kailangang ma-extract nang manu-mano ang mga ipinares na pagbabasa)
.csfasta (color-space reads)

Na-output na mga file

Scaffolds

RayOutput/Scaffolds.fasta

Ang scaffold sequence sa FASTA na format

RayOutput/ScaffoldComponents.txt

Ang mga bahagi ng bawat plantsa

RayOutput/ScaffoldLengths.txt

Ang haba ng bawat plantsa

RayOutput/ScaffoldLinks.txt

Mga link sa plantsa

Contigs

RayOutput/Contigs.fasta

Magkadikit na pagkakasunud-sunod sa FASTA na format

RayOutput/ContigLengths.txt

Ang mga haba ng magkadikit na pagkakasunod-sunod

Buod

RayOutput/OutputNumbers.txt

Pangkalahatang mga numero para sa pagpupulong

de Bruijn graph

RayOutput/CoverageDistribution.txt

Ang pamamahagi ng mga halaga ng saklaw

RayOutput/CoverageDistributionAnalysis.txt

Pagsusuri ng pamamahagi ng saklaw

RayOutput/degreeDistribution.txt

Pamamahagi ng ingoing at outgoing degrees

RayOutput/kmers.txt

k-mer graph, kinakailangang opsyon: -magsulat-kmers

Ang resultang file ay hindi ginagamit ni Ray. Ang resultang file ay napakalaki.

Mga hakbang sa pagpupulong

RayOutput/SeedLengthDistribution.txt

Pamamahagi ng haba ng buto

RayOutput/Ranggo .OptimalReadMarkers.txt

Basahin ang mga marker.

RayOutput/Ranggo .RaySeeds.fasta

Seed DNA sequence, kinakailangang opsyon: -sumulat-mga buto

RayOutput/Ranggo .RayExtensions.fasta

Mga sequence ng extension ng DNA, kinakailangang opsyon: -magsulat-mga extension

RayOutput/Ranggo .RayContigPaths.txt

Mga contig path na may mga halaga ng saklaw, kinakailangang opsyon: -write-contig-paths

Nakapares na mga nabasa

RayOutput/LibraryStatistics.txt

Pagtatantya ng mga panlabas na distansya para sa mga ipinares na pagbabasa

RayOutput/Library .txt

Mga frequency para sa naobserbahang mga panlabas na distansya (insert size + read length)

Partisyon

RayOutput/NumberOfSequences.txt

Bilang ng mga nabasa sa bawat file

RayOutput/SequencePartition.txt

Pagkakasunod-sunod na pagkahati

Ray software

RayOutput/RayVersion.txt

Ang bersyon ni Ray

RayOutput/RayCommand.txt

Ang eksaktong parehong utos na ibinigay

AMOS

RayOutput/AMOS.afg

Ang representasyon ng assembly sa format na AMOS, kinakailangang opsyon: -amos

Pakikipag-usap

RayOutput/MessagePassingInterface.txt

Bilang ng mga mensaheng ipinadala

RayOutput/NetworkTest.txt

Mga latency sa microseconds

RayOutput/Ranggo NetworkTestData.txt

Sinusuri ng network ang raw data

Dokumentasyon

- mpiexec -n 1 Ray -tulong|less (laging napapanahon) - Ang pahina ng tulong na ito (palaging
up-to-date) - Ang direktoryo ng Dokumentasyon/ - Manwal (Portable Document Format):
InstructionManual.tex (sa Documentation) - Mga archive ng mailing list:
http://sourceforge.net/mailarchive/forum.php?forum_name=denovoassembler-users

AUTHOR

Isinulat ni Sebastien Boisvert.

PAG-UULAT NG MGA BUGS

Mag-ulat ng mga bug sa denovoassembler-users@lists.sourceforge.net Home page:
<http://denovoassembler.sourceforge.net/>

COPYRIGHT

Ang program na ito ay libreng software: maaari mo itong muling ipamahagi at/o baguhin ito sa ilalim ng
mga tuntunin ng GNU General Public License na inilathala ng Free Software
Foundation, bersyon 3 ng Lisensya.

Ang programang ito ay ipinamahagi sa pag-asa na ito ay magiging kapaki-pakinabang, ngunit WALANG ANUMANG
GARANTIYA; nang walang kahit na ipinahiwatig na warranty ng MERCHANTABILITY o FITNESS FOR A
PARTIKULAR NA LAYUNIN. Tingnan ang GNU General Public License para sa higit pang mga detalye.

Nakatanggap ka ng kopya ng GNU General Public License kasama ng programang ito
(tingnan ang LISENSYA).

Sinag 2.1.0

Lisensya para sa Ray: GNU General Public License bersyon 3 RayPlatform na bersyon: 1.1.0 License
para sa RayPlatform: GNU Lesser General Public License bersyon 3

MAXKMERLENGTH: 32 KMER_U64_ARRAY_SIZE: 1 Maximum na lalim ng coverage na inimbak ayon sa CoverageDepth:
4294967295 MAXIMUM_MESSAGE_SIZE_IN_BYTES: 4000 bytes FORCE_PACKING = n ASSERT = n
MAY_LIBZ = y MAY_LIBBZ2 = y CONFIG_PROFILER_COLLECT = n CONFIG_CLOCK_GETTIME = n
__linux__ = y _MSC_VER = n __GNUC__ = y RAY_32_BITS = n RAY_64_BITS = y pamantayan ng MPI
bersyon: MPI 2.1 MPI library: Open-MPI 1.4.2 Compiler: GNU gcc/g++ 4.4.5

Gamitin ang Ray online gamit ang mga serbisyo ng onworks.net



Pinakabagong Linux at Windows online na mga programa