Ito ang command na Ray na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
Ray - mag-ipon ng mga genome nang magkatulad gamit ang interface ng pagpasa ng mensahe
SINOPSIS
mpiexec -n NUMBER_OF_RANKS Ray -k KMERLENGTH -p l1_1.fastq l1_2.fastq -p l2_1.fastq
l2_2.fastq -o pagsusulit
mpiexec -n NUMBER_OF_RANKS Ray Ray.conf # na may mga command sa isang file
DESCRIPTION:
Ang Ray genome assembler ay binuo sa ibabaw ng RayPlatform, isang generic na plugin-based
distributed at parallel compute engine na gumagamit ng message-passing interface para sa
pagpasa ng mga mensahe.
Tina-target ni Ray ang ilang application:
- de novo genome assembly (may Ray vanilla) - de novo meta-genome assembly (may
Ray Meta) - de novo transcriptome assembly (gumagana, ngunit hindi nasubok ng maraming) -
quantification of contig abundances - quantification of microbiome consortia
miyembro (na may Ray Communities) - quantification ng transcript expression - taxonomy
profiling ng mga sample (na may Ray Communities) - gene ontology profiling ng mga sample
(kasama si Ray Ontologies)
-tulong
Ipinapakita ang pahina ng tulong na ito.
-version
Ipinapakita ang bersyon ng Ray at mga pagpipilian sa compilation.
Paggamit ng configuration file
Maaaring ilunsad si Ray sa mpiexec -n 16 Ray Ray.conf Ang configuration file ay maaaring
isama ang mga komento (nagsisimula sa #).
K-mer ang haba
-k kmerLength
Pinipili ang haba ng k-mers. Ang default na halaga ay 21. Ito ay dapat na kakaiba dahil
Ang reverse-complement vertices ay iniimbak nang magkasama. Ang maximum na haba ay tinukoy sa
compilation ni MAXKMERLENGTH Ang mas malaking k-mer ay gumagamit ng mas maraming memorya.
Input
-p leftSequenceFile rightSequenceFile [averageOuterDistance standardDeviation]
Nagbibigay ng dalawang file na naglalaman ng mga paired-end reads. averageOuterDistance at
Ang standardDeviation ay awtomatikong kinukuwenta kung hindi ibinigay.
-i interleavedSequenceFile [averageOuterDistance standardDeviation]
Nagbibigay ng isang file na naglalaman ng interleaved paired-end reads. averageOuterDistance
at ang standardDeviation ay awtomatikong kinukuwenta kung hindi ibinigay.
-s sequenceFile
Nagbibigay ng file na naglalaman ng single-end reads.
Output
-o outputDirectory
Tinutukoy ang direktoryo para sa mga nai-output na file. Default ay RayOutput
Mga opsyon sa pagpupulong (mahusay na gumagana ang mga default)
-disable-recycle
Ang mga hindi pinapagana ang pagre-recycle sa pagbasa sa panahon ng pagbabasa ng assembly ay itatakda nang libre sa 3 kaso: 1.
ang distansya ay hindi tumugma para sa isang pares 2. ang binasa ay hindi nakilala ang kanyang kapareha 3. ang
Ang populasyon ng aklatan ay nagpapahiwatig ng maling pagkakalagay tingnan ang Pinilit na pagtawid ng mga pag-uulit
na may magkakapares na pagkakasunod-sunod. Sebastien Boisvert, Elenie Godzaridis, Francois Laviolette
& Jacques Corbeil. Unang Taunang RECOMB Satellite Workshop sa Massively Parallel
Sequencing, Marso 26-27 2011, Vancouver, BC, Canada.
-disable-scaffolder
Hindi pinapagana ang scaffolder.
-minimum-contig-haba minimumContigLength
Binabago ang pinakamababang haba ng contig, ang default ay 100 nucleotides
-kulay-espasyo
Tumatakbo sa color-space Nangangailangan ng mga csfasta file. Awtomatikong na-activate kung csfasta file
ay ibinigay.
-gamitin-maximum-seed-coverage maximumSeedCoverageDepth
Binabalewala ang anumang binhi na may lalim na saklaw sa itaas ng threshold na ito. Ang default ay
4294967295.
-gamitin-minimum-seed-coverage minimumSeedCoverageDepth
Itinatakda ang pinakamababang lalim ng saklaw ng binhi. Anumang landas na may lalim ng saklaw na mas mababa kaysa sa
ito ay itatapon. Ang default ay 0.
Distributed storage engine (lahat ng mga value na ito ay para sa bawat MPI rank)
-bloom-filter-bits bits
Itinatakda ang bilang ng mga bit para sa Bloom filter na Default ay 268435456 bits, 0 bits
hindi pinapagana ang filter na Bloom.
-hash-table-bucket Mga timba
Itinatakda ang paunang bilang ng mga bucket. Dapat ay isang kapangyarihan ng 2! Default na halaga:
268435456
-hash-table-buckets-per-group Mga timba
Itinatakda ang bilang ng mga bucket bawat pangkat para sa kalat-kalat na imbakan Default na halaga: 64, Dapat ay
sa pagitan ng >=1 at <= 64
-hash-table-load-factor-threshold threshold
Itinatakda ang load factor threshold para sa real-time na pagbabago ng laki Default na halaga: 0.75, dapat
>= 0.5 at < 1
-hash-table-verbosity
Ina-activate ang verbosity para sa distributed storage engine
Biological na kasaganaan
-search searchDirectory
Nagbibigay ng direktoryo na naglalaman ng mga fasta file na hahanapin sa de Bruijn graph.
Ang mga biological abundances ay isusulat sa RayOutput/BiologicalAbundances See
Documentation/BiologicalAbundances.txt
-one-color-per-file
Nagtatakda ng isang kulay sa bawat file sa halip na isa sa bawat sequence. Bilang default, ang bawat sequence sa
ang bawat file ay may iba't ibang kulay. Para sa mga file na may malaking bilang ng mga sequence, gamit ang
ang isang solong kulay sa bawat file ay maaaring maging mas mahusay.
Taxonomic profiling na may kulay na de Bruijn graph
-may-taxonomy Genome-to-Taxon.tsv TreeOfLife-Edges.tsv Taxon-Names.tsv
Nagbibigay ng taxonomy. Nag-compute at nagsusulat ng mga detalyadong profile ng taxonomic. Tingnan mo
Documentation/Taxonomy.txt para sa mga detalye.
-gene-ontology OntologyTerms.txt
Anotasyon.txt
Nagbibigay ng ontolohiya at anotasyon. Ang OntologyTerms.txt ay kinukuha mula sa
http://geneontology.org Ang Annotations.txt ay isang 2-column file (EMBL_CDS handle &
gene ontology identifier) Tingnan ang Documentation/GeneOntology.txt
Iba pang mga output
-enable-mga kapitbahayan
Kinuwenta ang mga contig neighborhood sa de Bruijn graph Output file:
RayOutput/NeighbourhoodRelations.txt
-amos
Isinulat ang AMOS file na tinatawag na RayOutput/AMOS.afg Ang AMOS file ay naglalaman ng mga read position
sa contigs. Maaaring mabuksan gamit ang software na may graphical na user interface.
-magsulat-kmers
Nagsusulat ng k-mer graph sa RayOutput/kmers.txt Ang resultang file ay hindi ginagamit ng
Ray. Ang resultang file ay napakalaki.
-write-read-marker
Nagsusulat ng mga read marker sa disk.
-sumulat-mga buto
Nagsusulat ng mga sequence ng seed DNA sa RayOutput/Rank .RaySeeds.fasta
-magsulat-mga extension
Nagsusulat ng mga extension ng DNA sequence sa RayOutput/Rank .RayExtensions.fasta
-write-contig-paths
Nagsusulat ng mga contig path na may mga halaga ng saklaw sa RayOutput/Rank .RayContigPaths.txt
-sumulat-marker-buod
Sumulat ng mga istatistika ng marker.
Paggamit ng memory
-ipakita-gamit-memorya
Ipinapakita ang paggamit ng memorya. Kinukuha ang data mula sa / proc sa GNU/Linux Kailangan ng __linux__
-ipakita-memory-allocations
Nagpapakita ng mga kaganapan sa paglalaan ng memorya
Algorithm verbosity
-show-extension-choice
Ipinapakita ang piniling ginawa (kasama ang iba pang mga pagpipilian) sa panahon ng extension.
-show-ending-context
Ipinapakita ang pangwakas na konteksto ng bawat extension. Ipinapakita sa mga bata ng vertex kung saan
masyadong mahirap ang extension.
-ipakita-distansya-buod
Nagpapakita ng buod ng mga panlabas na distansya na ginamit para sa isang extension path.
-show-consensus
Ipinapakita ang pinagkasunduan kapag ang isang pagpipilian ay tapos na.
Checkpointing
-sulat-checkpoints checkpointDirectory
Sumulat ng mga checkpoint file
-read-checkpoints checkpointDirectory
Basahin ang mga checkpoint file
-read-write-checkpoints checkpointDirectory
Magbasa at magsulat ng mga checkpoint file
Pagruruta ng mensahe para sa malaking bilang ng mga core
-ruta-mensahe
Pinapagana ang Ray message router. Hindi pinagana bilang default. Iruruta ang mga mensahe
nang naaayon upang ang anumang ranggo ay direktang makipag-ugnayan sa iilan lamang.
Wala -ruta-mensahe, anumang ranggo ay maaaring direktang makipag-ugnayan sa anumang iba pang ranggo.
Mga file na nabuo: Routing/Connections.txt, Routing/Routes.txt at
Routing/RelayEvents.txt at Routing/Summary.txt
-uri ng koneksyon uri
Itinatakda ang uri ng koneksyon para sa mga ruta. Ang mga tinatanggap na halaga ay debruijn, hypercube,
polytope, grupo, random, kautz at kumpleto. Ang default ay debruijn.
debruijn: isang buong de Bruijn graph isang ibinigay na alpabeto at diameter hypercube: a
hypercube, ang alpabeto ay {0,1} at ang vertices ay isang kapangyarihan ng 2 polytope: isang matambok
regular na polytope, ang alpabeto ay {0,1,...,B-1} at ang vertices ay isang kapangyarihan ng pangkat B:
hangal na modelo kung saan maaaring makipag-usap ang isang kinatawan sa bawat grupo sa mga tagalabas
random: Erdos-Renyi model kautz: isang buong de Kautz graph, na isang subgraph ng isang de
Kumpleto ang Bruijn graph: isang buong graph kasama ang lahat ng posibleng koneksyon
Sa uri ng debruijn, ang bilang ng mga ranggo ay dapat na kapangyarihan ng isang bagay.
Mga halimbawa: 256 = 16*16, 512=8*8*8, 49=7*7, at iba pa. Kung hindi, huwag gumamit ng debruijn
routing ngunit gumamit ng isa pa Sa uri ng kautz, ang bilang ng mga ranggo n ay dapat na
n=(k+1)*k^(d-1) para sa ilang k at d
-routing-graph-degree degree
Tinutukoy ang papalabas na antas para sa graph ng pagruruta. Tingnan ang Documentation/Routing.txt
Pagsubok sa hardware
-test-network-lamang
Sinusuri ang network at nagbabalik.
-write-network-test-raw-data
Sumulat ng isang karagdagang file sa bawat ranggo na nagdedetalye ng pagsubok sa network.
-palitan NumberOfExchanges
Itinatakda ang bilang ng mga palitan
-disable-network-test
Nilaktawan ang pagsubok sa network.
Pag-debug
-patunayan-mensahe-integridad
Sinusuri ang pagiging maaasahan ng data ng mensahe para sa anumang hindi walang laman na mensahe. idagdag ang '-D CONFIG_SSE_4_2'
sa Makefile para gumamit ng hardware na pagtuturo (SSE 4.2)
-run-profiler
Pinapatakbo ang profiler habang tumatakbo ang code. Bilang default, ipakita lamang ang mga babala ng granularity.
Ang pagpapatakbo ng profiler ay nagpapataas ng mga oras ng pagtakbo.
-may-profiler-detalye
Ipinapakita ang bilang ng mga mensaheng ipinadala at natanggap sa bawat pamamaraan sa bawat oras
mga hiwa (panahon). Pangangailangan -run-profiler.
-show-communication-events
Ipinapakita ang lahat ng mensaheng ipinadala at natanggap.
-ipakita-basahin-paglalagay
Ipinapakita ang read placement sa graph sa panahon ng extension.
-debug-bubbles
Nagde-debug ng bubble code. Ang mga bula ay maaaring dahil sa mga heterozygous na site o mga error sa sequencing
o iba pang (hindi alam) na mga kaganapan
-debug-seeds
Nagde-debug ng seed code. Ang mga buto ay mga landas sa graph na malamang na natatangi.
-debug-fusions
Nagde-debug ng fusion code.
-debug-scaffolder
I-debug ang scaffolder.
MGA FILE
Mag-input ng mga file
Tandaan: tinutukoy ang format ng file gamit ang extension ng file.
.fasta .fasta.gz (kailangan ng HAVE_LIBZ=y sa compilation) .fasta.bz2 (kailangan ng HAVE_LIBBZ2=y
sa compilation) .fastq .fastq.gz (kailangan ng HAVE_LIBZ=y sa compilation) .fastq.bz2
(kailangan ng HAVE_LIBBZ2=y sa compilation) .sff (kailangang ma-extract nang manu-mano ang mga ipinares na pagbabasa)
.csfasta (color-space reads)
Na-output na mga file
Scaffolds
RayOutput/Scaffolds.fasta
Ang scaffold sequence sa FASTA na format
RayOutput/ScaffoldComponents.txt
Ang mga bahagi ng bawat plantsa
RayOutput/ScaffoldLengths.txt
Ang haba ng bawat plantsa
RayOutput/ScaffoldLinks.txt
Mga link sa plantsa
Contigs
RayOutput/Contigs.fasta
Magkadikit na pagkakasunud-sunod sa FASTA na format
RayOutput/ContigLengths.txt
Ang mga haba ng magkadikit na pagkakasunod-sunod
Buod
RayOutput/OutputNumbers.txt
Pangkalahatang mga numero para sa pagpupulong
de Bruijn graph
RayOutput/CoverageDistribution.txt
Ang pamamahagi ng mga halaga ng saklaw
RayOutput/CoverageDistributionAnalysis.txt
Pagsusuri ng pamamahagi ng saklaw
RayOutput/degreeDistribution.txt
Pamamahagi ng ingoing at outgoing degrees
RayOutput/kmers.txt
k-mer graph, kinakailangang opsyon: -magsulat-kmers
Ang resultang file ay hindi ginagamit ni Ray. Ang resultang file ay napakalaki.
Mga hakbang sa pagpupulong
RayOutput/SeedLengthDistribution.txt
Pamamahagi ng haba ng buto
RayOutput/Ranggo .OptimalReadMarkers.txt
Basahin ang mga marker.
RayOutput/Ranggo .RaySeeds.fasta
Seed DNA sequence, kinakailangang opsyon: -sumulat-mga buto
RayOutput/Ranggo .RayExtensions.fasta
Mga sequence ng extension ng DNA, kinakailangang opsyon: -magsulat-mga extension
RayOutput/Ranggo .RayContigPaths.txt
Mga contig path na may mga halaga ng saklaw, kinakailangang opsyon: -write-contig-paths
Nakapares na mga nabasa
RayOutput/LibraryStatistics.txt
Pagtatantya ng mga panlabas na distansya para sa mga ipinares na pagbabasa
RayOutput/Library .txt
Mga frequency para sa naobserbahang mga panlabas na distansya (insert size + read length)
Partisyon
RayOutput/NumberOfSequences.txt
Bilang ng mga nabasa sa bawat file
RayOutput/SequencePartition.txt
Pagkakasunod-sunod na pagkahati
Ray software
RayOutput/RayVersion.txt
Ang bersyon ni Ray
RayOutput/RayCommand.txt
Ang eksaktong parehong utos na ibinigay
AMOS
RayOutput/AMOS.afg
Ang representasyon ng assembly sa format na AMOS, kinakailangang opsyon: -amos
Pakikipag-usap
RayOutput/MessagePassingInterface.txt
Bilang ng mga mensaheng ipinadala
RayOutput/NetworkTest.txt
Mga latency sa microseconds
RayOutput/Ranggo NetworkTestData.txt
Sinusuri ng network ang raw data
Dokumentasyon
- mpiexec -n 1 Ray -tulong|less (laging napapanahon) - Ang pahina ng tulong na ito (palaging
up-to-date) - Ang direktoryo ng Dokumentasyon/ - Manwal (Portable Document Format):
InstructionManual.tex (sa Documentation) - Mga archive ng mailing list:
http://sourceforge.net/mailarchive/forum.php?forum_name=denovoassembler-users
AUTHOR
Isinulat ni Sebastien Boisvert.
PAG-UULAT NG MGA BUGS
Mag-ulat ng mga bug sa denovoassembler-users@lists.sourceforge.net Home page:
<http://denovoassembler.sourceforge.net/>
COPYRIGHT
Ang program na ito ay libreng software: maaari mo itong muling ipamahagi at/o baguhin ito sa ilalim ng
mga tuntunin ng GNU General Public License na inilathala ng Free Software
Foundation, bersyon 3 ng Lisensya.
Ang programang ito ay ipinamahagi sa pag-asa na ito ay magiging kapaki-pakinabang, ngunit WALANG ANUMANG
GARANTIYA; nang walang kahit na ipinahiwatig na warranty ng MERCHANTABILITY o FITNESS FOR A
PARTIKULAR NA LAYUNIN. Tingnan ang GNU General Public License para sa higit pang mga detalye.
Nakatanggap ka ng kopya ng GNU General Public License kasama ng programang ito
(tingnan ang LISENSYA).
Sinag 2.1.0
Lisensya para sa Ray: GNU General Public License bersyon 3 RayPlatform na bersyon: 1.1.0 License
para sa RayPlatform: GNU Lesser General Public License bersyon 3
MAXKMERLENGTH: 32 KMER_U64_ARRAY_SIZE: 1 Maximum na lalim ng coverage na inimbak ayon sa CoverageDepth:
4294967295 MAXIMUM_MESSAGE_SIZE_IN_BYTES: 4000 bytes FORCE_PACKING = n ASSERT = n
MAY_LIBZ = y MAY_LIBBZ2 = y CONFIG_PROFILER_COLLECT = n CONFIG_CLOCK_GETTIME = n
__linux__ = y _MSC_VER = n __GNUC__ = y RAY_32_BITS = n RAY_64_BITS = y pamantayan ng MPI
bersyon: MPI 2.1 MPI library: Open-MPI 1.4.2 Compiler: GNU gcc/g++ 4.4.5
Gamitin ang Ray online gamit ang mga serbisyo ng onworks.net