이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 bp_unplatten_seqp 명령입니다.
프로그램:
이름
bp_unplatten_seq - genbank 또는 genbank 스타일 기능 파일을 중첩 해제하여
SeqFeature 계층 구조
개요
bp_unplatten_seq.PLS -e 3 -gff ~/cvs/bioperl-live/t/data/AE003644_Adh-genomic.gb
bp_unplatten_seq.PLS --세부사항 ~/cvs/bioperl-live/t/data/AE003644_Adh-genomic.gb
bp_unplatten_seq.PLS -i foo.embl --from embl --to chadoxml -o out.chado.xml
bp_unplatten_seq.PLS --notypemap --detail --asciitree -ethresh 2 AE003644_Adh-genomic.gb
기술
이 스크립트는 평평하지 않은 SeqFeatures의 genbank 또는 genbank 스타일 파일을 중첩된
계층.
Bio::SeqFeature::Tools::UnFlattener 참조
GenBank/EMBL 표현에서 기능은 '플랫'합니다. 예를 들어 링크가 없습니다.
암시적 링크 이외의 mRNA와 CDS 사이(예: 태그 또는 스플라이스 사이트를 통해)
좌표) 코딩하기 어려울 수 있습니다.
이는 기본 출력 형식으로 가장 쉽게 설명됩니다. 아스키트리
평탄화되지 않은 Genbank 기능 세트는 다음과 같습니다(AB077698).
시퀀스: AB077698
데이터뱅크_항목 1..2701[+]
유전자
mRNA
CDS hCHCR-G 80..1144[+]
엑손 80..1144[+]
five_prime_UTR 1..79[+]
located_sequence_feature 137..196[+]
located_sequence_feature 239..292[+]
located_sequence_feature 617..676[+]
located_sequence_feature 725..778[+]
three_prime_UTR 1145..2659[+]
폴리A_사이트 1606..1606[+]
폴리A_사이트 2660..2660[+]
아니면 이렇게(AE003734의 일부)
유전자
mRNA CG3320-RA
CDS CG3320-PA 53126..54971[-]
엑손 52204..53323[-]
엑손 53404..53631[-]
엑손 53688..53735[-]
엑손 53798..53918[-]
엑손 54949..55287[-]
mRNA CG3320-RB
CDS CG3320-PB 53383..54971[-]
엑손 52204..53631[-]
엑손 53688..53735[-]
엑손 53798..53918[-]
엑손 54949..55287[-]
평탄화 해제는 또한 포함 계층 구조를 '정규화'합니다(의미에서).
이를 표준화합니다. 예를 들어, genbank가 있더라도 항상 성적표 기록이 있는지 확인합니다.
CDS와 유전자만 지정함)
기본적으로 GenBank 유형은 SO 유형에 매핑됩니다.
Bio::SeqFeature::Tools::TypeMapper를 참조하세요.
COMMAND LINE 인수
-i|파일 입력
입력 파일(마지막 인수로 지정할 수도 있음)
-FORMAT에서
입력 형식(기본값은 genbank)
플랫이 아닌 형식에 이것을 사용하는 것은 아마도 그다지 의미가 없을 것입니다. 즉, 그 외에
엠블/젠뱅크
-포맷으로
출력 형식(기본값은 asciitree)
실제로 SeqFeature를 인식하는 중첩된 형식이어야 합니다. 내 생각엔 이것뿐인 것 같아
asciitree, chadoxml 및 gff3
-gff
GFF3 형식으로 내보내기(3 이전 GFF는 평면화되지 않은 시퀀스에는 의미가 없습니다.
특성 그래프를 나타내는 정해진 방법이 없습니다)
-o|출력 파일
아웃파일의 기본값은 STDOUT입니다.
-세부 묘사
기능에 대한 추가 세부 정보 표시(asciitree 모드에만 해당)
-e|ethresh INT
평탄해제 시 오류 임계값을 설정합니다.
기본적으로 이 스크립트는 genbank에서 이상한 항목을 발견하면 흔들릴 것입니다.
파일 - 오류 임계값을 높여 이를 무시하고 보고하도록 신호를 보냅니다.
STDERR)
-노매직
평탄화 해제 시 use_magic을 억제합니다(Bio::SeqFeature::Tools::UnFlattener 참조).
-notypemap
유형 매핑을 억제합니다(Bio::SeqFeature::Tools::TypeMapper 참조).
ALL
Bio::SeqFeature::Tools::UnFlattener를 사용하면 평탄화 해제를 세밀하게 제어할 수 있습니다.
프로세스 - 명령줄에서 이 제어를 허용하려면 더 많은 옵션을 추가해야 합니다.
피드백
메일 링 기울기
사용자 피드백은 이 모듈과 다른 Bioperl 모듈의 진화에서 필수적인 부분입니다. 보내다
귀하의 의견과 제안은 가급적 Bioperl 메일링 리스트로 보내주십시오. 귀하의 참여
대단히 감사합니다.
[이메일 보호] - 일반 토론
http://bioperl.org/wiki/Mailing_lists - 메일링 리스트에 대해
통계 보고서 버그
Bioperl 버그 추적 시스템에 버그를 보고하여 버그와 버그를 추적하는 데 도움이 됩니다.
해결. 버그 보고서는 이메일이나 웹을 통해 제출할 수 있습니다.
https://github.com/bioperl/bioperl-live/issues
onworks.net 서비스를 사용하여 온라인으로 bp_unplatten_seqp를 사용하세요.