cdhit - Online sa Cloud

Ito ang command cdhit na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


cdhit - mabilis na pagkakasunud-sunod ng pangkat

SINOPSIS


cdhit [Options]

DESCRIPTION


====== CD-HIT na bersyon 4.6 (itinayo noong Ene 23 2016) ======

Options

-i input filename sa fasta format, kinakailangan

-o output filename, kinakailangan

-c sequence identity threshold, default 0.9 ito ang default na cd-hit na "global
pagkakakilanlan ng pagkakasunud-sunod" na kinakalkula bilang: bilang ng magkaparehong mga amino acid sa pagkakahanay
hinati sa buong haba ng mas maikling sequence

-G gumamit ng global sequence identity, default 1 kung nakatakda sa 0, pagkatapos ay gumamit ng local sequence
pagkakakilanlan, kinalkula bilang : bilang ng magkakahawig na mga amino acid sa pagkakahanay na hinati sa
ang haba ng alignment NOTE!!! huwag gumamit -G 0 maliban kung gagamit ka ng alignment
tingnan ng mga kontrol sa saklaw ang mga opsyon -aL, -AL, -aS, -AS

-b band_width ng alignment, default 20

-M limitasyon ng memorya (sa MB) para sa programa, default na 800; 0 para sa walang limitasyon;

-T bilang ng mga thread, default 1; na may 0, lahat ng mga CPU ay gagamitin

-n word_length, default 5, tingnan ang gabay ng gumagamit para sa pagpili nito

-l haba ng throw_away_sequences, default 10

-t tolerance para sa redundance, default 2

-d haba ng paglalarawan sa .clstr file, ang default ay 20 kung nakatakda sa 0, ito ay tumatagal ng mabilis
defline at huminto sa unang espasyo

-s cutoff ng pagkakaiba sa haba, default na 0.0 kung itinakda sa 0.9, kailangan ng mas maiikling pagkakasunud-sunod
hindi bababa sa 90% ang haba ng kinatawan ng cluster

-S haba ng pagkakaiba cutoff sa amino acid, default 999999 kung nakatakda sa 60, ang haba
pagkakaiba sa pagitan ng mas maikling mga pagkakasunud-sunod at ang kinatawan ng cluster ay maaaring
hindi hihigit sa 60

-aL alignment coverage para sa mas mahabang sequence, default na 0.0 kung nakatakda sa 0.9, ang
Ang pagkakahanay ay dapat sumasakop sa 90% ng pagkakasunud-sunod

-AL alignment coverage control para sa mas mahabang sequence, default na 99999999 kung nakatakda sa 60,
at ang haba ng sequence ay 400, kung gayon ang alignment ay dapat na >= 340 (400-60)
nalalabi

-aS alignment coverage para sa mas maikling sequence, default na 0.0 kung nakatakda sa 0.9, ang
Ang pagkakahanay ay dapat sumasakop sa 90% ng pagkakasunud-sunod

-AS alignment coverage control para sa mas maikling sequence, default na 99999999 kung nakatakda sa 60,
at ang haba ng sequence ay 400, kung gayon ang alignment ay dapat na >= 340 (400-60)
nalalabi

-A minimal alignment coverage control para sa parehong sequence, default 0 alignment dapat
cover >= ang value na ito para sa parehong sequence

-uL maximum na hindi tugmang porsyento para sa mas mahabang sequence, default na 1.0 kung nakatakda sa 0.1,
ang walang kaparis na rehiyon (hindi kasama ang mga nangunguna at tailing gaps) ay hindi dapat higit sa 10%
ng pagkakasunod-sunod

-uS maximum na hindi tugmang porsyento para sa mas maikling sequence, default na 1.0 kung nakatakda sa 0.1,
ang walang kaparis na rehiyon (hindi kasama ang mga nangunguna at tailing gaps) ay hindi dapat higit sa 10%
ng pagkakasunod-sunod

-U maximum na hindi katugmang haba, default na 99999999 kung nakatakda sa 10, ang hindi katugmang rehiyon
(hindi kasama ang leading at tailing gaps) ay hindi dapat higit sa 10 base

-B 1 o 0, default 0, bilang default, ang mga sequence ay naka-imbak sa RAM kung nakatakda sa 1, sequence
ay naka-imbak sa hard drive ito ay inirerekomenda na gamitin -B 1 para sa malalaking database

-p 1 o 0, default na 0 kung nakatakda sa 1, magkakapatong ang pagkakahanay ng pag-print sa .clstr file

-g 1 o 0, default na 0 sa pamamagitan ng default na algorithm ng cd-hit, ang isang sequence ay naka-cluster sa
unang cluster na nakakatugon sa threshold (mabilis na cluster). Kung nakatakda sa 1, gagawin ng programa
i-cluster ito sa pinakakaparehong cluster na nakakatugon sa threshold (tumpak ngunit mabagal
mode) ngunit alinman sa 1 o 0 ay hindi magbabago sa mga kinatawan ng mga huling kumpol

-bak magsulat ng backup na cluster file (1 o 0, default 0)

-h i-print ang tulong na ito

Mga tanong, bug, makipag-ugnayan kay Limin Fu sa l2fu@ucsd.edu, o Weizhong Li at liwz@sdsc.edu
Para sa mga na-update na bersyon at impormasyon, pakibisita ang: http://cd-hit.org

Available din ang cd-hit web server mula sa http://cd-hit.org

Kung nakita mong kapaki-pakinabang ang cd-hit, mangyaring banggitin ang:

"Pag-cluster ng mga homologous na pagkakasunud-sunod upang bawasan ang laki ng malaking protina
database", Weizhong Li, Lukasz Jaroszewski at Adam Godzik. Bioinformatics, (2001)
17:282-283 "Ang pagpapaubaya sa ilang kalabisan ay makabuluhang nagpapabilis ng pagkumpol ng malalaking
mga database ng protina", Weizhong Li, Lukasz Jaroszewski at Adam Godzik. Bioinformatics,
(2002) 18:77-82

Gumamit ng cdhit online gamit ang mga serbisyo ng onworks.net



Pinakabagong Linux at Windows online na mga programa