이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 featureCounts 명령입니다.
프로그램:
이름
featureCounts - 매우 효율적이고 정확한 읽기 요약 프로그램
사용법
기능 개수 [옵션] -a -o 입력_파일1 [입력_파일2]
...
필수 인수:
-a
주석 파일의 이름입니다. 기본적으로 GTF 형식입니다. 보다 -F 더 많은 형식에 대한 옵션.
-o
읽기 횟수를 포함한 출력 파일의 이름입니다. 요약을 포함하는 별도의 파일
집계 결과의 통계도 출력에 포함됩니다(` .요약')
입력 파일
BAM 또는 SAM 형식의 입력 파일 목록입니다. 사용자는 BAM 또는
샘.
선택적 인수:
-A
일치하는 데 사용되는 염색체 별칭을 포함하는 쉼표로 구분된 파일의 이름
주석에 사용된 염색체 이름과 BAM/SAM 입력에 사용된 염색체 이름이 있는 경우
다른. 파일 형식은 사용 설명서를 참조하십시오.
-F
제공된 주석 파일의 형식을 지정합니다. 허용되는 형식에는 `GTF' 및
'세이프'. 기본적으로 'GTF'. SAF 형식에 대한 설명은 사용 설명서를 참조하십시오.
-t
GTF 주석에서 기능 유형을 지정합니다. 기본적으로 '엑손'. 읽기에 사용되는 기능
제공된 값을 사용하여 주석에서 계산이 추출됩니다.
-g
GTF 주석에 속성 유형을 지정합니다. 기본적으로 'gene_id'. 사용된 메타 기능
읽기 카운팅을 위해 제공된 값을 사용하여 주석에서 추출됩니다.
-f 기능 수준에서 읽기 카운팅을 수행합니다(예: 읽기가 아닌 엑손에 대한 읽기 계산).
유전자).
-O 겹치는 모든 메타 기능(또는 다음과 같은 경우 기능)에 읽기를 할당합니다. -f is
지정).
-s
가닥별 읽기 카운팅을 수행합니다. 가능한 값: 0(풀림), 1
(좌초) 및 2(역방향 좌초). 기본적으로 0입니다.
-M 다중 매핑 읽기도 계산됩니다. 다중 매핑 읽기의 경우 보고된 모든
정렬이 계산됩니다. BAM/SAM 입력의 'NH' 태그는 감지하는 데 사용됩니다.
다중 매핑 읽기.
-Q
읽기가 계산되기 위해 충족해야 하는 최소 매핑 품질 점수입니다. 을 위한
페어드 엔드 읽기의 경우 적어도 한쪽 끝이 이 기준을 충족해야 합니다. 기본적으로 0입니다.
-T
스레드 수. 기본적으로 1입니다.
-v 프로그램의 출력 버전.
-J 각 엑손-엑손 접합을 지원하는 읽기 수를 계산합니다. 접합부는
입력(CIGAR에 'N' 포함)의 엑손 스패닝 읽기에서 식별
끈). 계수 결과는 '라는 파일에 저장됩니다. .jcounts'
-G
입력 SAM 생성에 사용된 참조 게놈을 포함하는 Fasta 파일 또는
BAM 파일. 이 인수는 교차점 계산을 수행할 때만 필요합니다.
-R 각 읽기에 대한 세부 할당 결과를 출력합니다. 에 대한 텍스트 파일이 생성됩니다.
읽기 및 메타 기능/기능 읽기의 이름을 포함한 각 입력 파일은
할당. 자세한 내용은 사용 설명서를 참조하십시오.
--largestOverlap
겹치는 수가 가장 많은 메타 기능/기능에 읽기 할당
기지.
--minOverlap
읽기와 읽기 사이에 필요한 겹치는 염기의 최소 수를 지정합니다.
읽기가 할당된 메타 기능/기능. 기본적으로 1입니다.
--read2pos <5:3>
읽기를 5' 최다 베이스 또는 3' 최다 베이스로 줄입니다. 그런 다음 읽기 카운팅이 수행됩니다.
읽기가 축소되는 단일 염기를 기반으로 합니다.
--readExtension5 읽기는 다음에 의해 업스트림으로 확장됩니다. 그들의 기지
5' 끝.
--readExtension3 읽기는 다음에 의해 업스트림으로 확장됩니다. 그들의 기지
3' 끝.
--분수
보고된 각 정렬에 대해 1(일) 카운트 대신 분수 카운트 1/n을 사용합니다.
읽기 카운팅에서 다중 매핑 읽기의 n은 보고된 총 정렬 수입니다.
다중 매핑 읽기의 경우. 이 옵션은 '-M' 옵션과 함께 사용해야 합니다.
--일 순위
기본 정렬만 계산합니다. 기본 정렬은 비트 0x100을 사용하여 식별됩니다.
SAM/BAM 플래그 필드.
--ignoreDup
읽기 카운팅에서 중복 읽기를 무시합니다. 중복 읽기는 비트를 사용하여 식별됩니다.
BAM/SAM FLAG 필드의 Ox400. 읽기 중 하나가 다음과 같은 경우 전체 읽기 쌍이 무시됩니다.
페어드 엔드 데이터에 대한 중복 읽기.
--countSplitAlignmentsOnly 분할 정렬만 계산합니다(예:
'N'을 포함하는 CIGAR 문자열). 분할 정렬의 예는 엑손 스패닝 읽기입니다.
RNA-seq 데이터에서.
-p 개별 읽기 대신 조각(읽기 쌍)을 계산합니다. 각 읽기 쌍에 대해
두 개의 읽기는 BAM/SAM 입력에서 서로 인접해야 합니다.
-P 읽기 쌍을 계산할 때 쌍방향 거리의 유효성을 확인하십시오. 사용 -d and -D 에
임계값을 설정합니다.
-d
최소 조각/템플릿 길이, 기본적으로 50
-D
최대 조각/템플릿 길이, 기본적으로 600.
-B 양쪽 끝이 성공적으로 정렬된 읽기 쌍만 계산합니다.
-S
동일한 쌍에서 두 읽기의 방향 지정, 기본적으로 'fr'
(앞으로/뒤로).
-C 두 끝이 다른 염색체에 매핑되는 읽기 쌍을 세지 마십시오.
또는 동일한 염색체에 매핑되지만 다른 가닥에 매핑됩니다.
--정렬하지 않음
BAM/SAM 입력에서 읽기를 정렬하지 마십시오. 동일한 쌍의 읽기가 필요합니다.
입력에서 서로 옆에 위치합니다.
--maxMOp
CIGAR 문자열에서 허용되는 'M' 작업의 최대 수입니다. 기본적으로 10입니다. 둘 다
'X'와 '='는 'M'으로 취급되며 인접한 'M' 연산은 CIGAR에서 병합됩니다.
끈.
onworks.net 서비스를 사용하여 온라인에서 featureCounts 사용