cdhit-454 - 클라우드의 온라인

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 cdhit-454 명령입니다.

프로그램:

이름


cd-hit-454 - 454 데이터에 최적화된 빠른 그룹 시퀀스

개요


CDHIT-454 [옵션 ]

기술


====== CD-HIT 버전 4.6(23년 2016월 XNUMX일 빌드) ======

옵션

-i fasta 형식의 파일 이름 입력, 필수

-o 출력 파일 이름, 필수

-c 서열 동일성 임계값, 기본값 0.98 이는 "전역 서열 동일성"입니다.
다음과 같이 계산됩니다: 정렬된 동일한 아미노산의 수를 전체로 나눈 값
더 짧은 시퀀스의 길이 + 간격

-b band_width 정렬, 기본값 10

-M 프로그램의 메모리 제한(MB), 기본값은 800입니다. 무제한의 경우 0,

-T 스레드 수, 기본값은 1입니다. 0이면 모든 CPU가 사용됩니다.

-n word_length, 기본값 10, 선택에 대한 사용자 가이드 참조

-알 더 긴 시퀀스에 대한 정렬 적용 범위, 0.0로 설정된 경우 기본값 0.9,
정렬은 시퀀스의 90%를 커버해야 합니다.

-알 더 긴 시퀀스에 대한 정렬 적용 범위 제어, 99999999으로 설정된 경우 기본값 60,
시퀀스의 길이가 400이면 정렬은 >= 340(400-60)이어야 합니다.
잔류 물

-같이 더 짧은 시퀀스에 대한 정렬 적용 범위, 0.0로 설정된 경우 기본값 0.9,
정렬은 시퀀스의 90%를 커버해야 합니다.

-같이 더 짧은 시퀀스에 대한 정렬 적용 범위 제어, 99999999으로 설정된 경우 기본값 60,
시퀀스의 길이가 400이면 정렬은 >= 340(400-60)이어야 합니다.
잔류 물

-B 1 또는 0, 기본값 0, 기본적으로 시퀀스는 1로 설정된 경우 RAM에 저장됩니다. 시퀀스
하드 드라이브에 저장되어 사용하는 것이 좋습니다. -B 1 거대한 데이터베이스용

-g 1 또는 0, cd-hit의 기본 알고리즘에 의한 기본값 0, 시퀀스는 다음으로 클러스터링됩니다.
임계값을 충족하는 첫 번째 클러스터(빠른 클러스터). 1로 설정하면 프로그램은
임계값을 충족하는 가장 유사한 클러스터로 클러스터링합니다(정확하지만 느린
모드) 그러나 1 또는 0은 최종 클러스터의 대표자를 변경하지 않습니다.

-D indel당 최대 크기, 기본값 1

-시합 일치 점수, 기본값 2

- 불일치
일치하지 않는 점수, 기본값 -1

-갭 갭 오프닝 점수, 기본 -3

-갭 확장
갭 확장 점수, 기본값 -1

-박 백업 클러스터 파일 쓰기(1 또는 0, 기본값 0)

-h 이 도움말 인쇄

질문, 버그, Weizhong Li에게 문의하십시오. liwz@sdsc.edu

cd-hit이 유용하다고 생각되면 다음을 인용하십시오.

"대형 단백질의 크기를 줄이기 위한 고도로 상동성인 서열의 클러스터링
데이터베이스", Weizhong Li, Lukasz Jaroszewski & Adam Godzik. 생물정보학, (2001)
17:282-283 "Cd-hit: 대규모 집합을 클러스터링하고 비교하기 위한 빠른 프로그램
단백질 또는 뉴클레오티드 서열", Weizhong Li & Adam Godzik. Bioinformatics, (2006)
22:1658-1659 "Beifang Niu, Limin Fu, Shulei Sun 및 Weizhong Li. 인공 및
메타게놈 데이터의 파이로시퀀싱 읽기에서 자연적인 복제가 발생합니다. BMC 생물정보학
(2010) 오전 11시 187분

onworks.net 서비스를 사용하여 온라인으로 cdhit-454 사용



최신 Linux 및 Windows 온라인 프로그램