Ito ang command na 2ndscore na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
2ndscore - hanapin ang pinakamahusay na hairpin na naka-angkla sa bawat posisyon.
SINOPSIS
2ndscore in.fasta > out.hairpins
DESCRIPTION
Para sa bawat posisyon sa pagkakasunud-sunod ay maglalabas ito ng isang linya:
-0.6 52 .. 62 TTCCTAAAGGTTCCA GCG CAAAA TGC CATAAGCACCACATT
(iskor) (simula .. wakas) (kaliwang konteksto) (hairpin) (kanang contenxt)
Para sa mga posisyon na malapit sa mga dulo ng mga pagkakasunud-sunod, ang konteksto ay maaaring lagyan ng 'x'
mga karakter. Kung walang mahahanap na hairpin, ang score ay 'Wala'.
Maaaring magbigay ng maramihang mga fasta file at maaaring magkaroon ng maraming pagkakasunud-sunod sa bawat fasta file. Ang
ang output para sa bawat sequence ay paghihiwalayin ng isang linya na nagsisimula sa '>' at naglalaman ng
FASTA paglalarawan ng pagkakasunud-sunod.
Dahil ang mga marka ng hairpin ng plus-strand at minus-strand ay maaaring mag-iba (dahil sa GU
binding sa RNA), bilang default, ang 2ndscore ay naglalabas ng dalawang set ng hairpins para sa bawat sequence: ang
FORWARD hairpins at ang REVERSE hairpins. Ang lahat ng pasulong na mga hairpin ay output muna, at
ay nakikilala sa pamamagitan ng pagkakaroon ng salitang 'FORWARD' sa dulo ng linyang '>' na nauuna sa kanila.
Katulad nito, ang REVERSE hairpins ay nakalista pagkatapos ng '>' na linya na nagtatapos sa 'REVERSE'. kung ikaw
gusto mong maghanap lamang ng isa o sa iba pang strand, maaari mong gamitin ang:
--no-fwd Huwag i-print ang FORWARD hairpins
--no-rvs Huwag i-print ang REVERSE hairpins
Maaari mong itakda ang ginamit na function ng enerhiya, tulad ng sa transterm na may --gc, --au, --gu,
--mm, --gap na mga opsyon. Ang --min-loop, --max-loop, at --max-len na mga opsyon ay sinusuportahan din.
FORMAT OF ANG .BAG MGA FILE
Ang mga column para sa mga .bag file ay, sa pagkakasunud-sunod:
1. gene_name
2. terminator_start
3. terminator_end
4. hairpin_score
5. tail_score
6. terminator_sequence
7. terminator_confidence: kumbinasyon ng hairpin at tail score na
Isinasaalang-alang kung gaano ang posibilidad na ang mga naturang marka ay nasa random na pagkakasunod-sunod. Ito
ay ang pangunahing "iskor" para sa terminator at kinukuwenta gaya ng inilarawan sa
ang papel.
8. APPROXIMATE_distance_from_end_of_gene: Ang *tinatayang* bilang ng base
mga pares sa pagitan ng dulo ng gene at simula ng terminator. Ito
ay tinatayang sa ilang paraan: Una, (at pinakamahalaga) TransTermHP
ay hindi palaging gumagamit ng tunay na dulo ng gene. Depende sa mga opsyon na ibibigay mo
maaari nitong putulin ang ilan sa mga dulo ng mga gene upang mahawakan ang mga terminator na iyon
bahagyang nagsasapawan sa mga gene. Pangalawa, kung saan "nagsisimula" ang terminator
ay hindi na mahusay na tinukoy. Ang field na ito ay inilaan lamang para sa pagsusuri sa katinuan
(Ang mga terminator na iniulat na ang pinakamahusay na malapit sa dulo ng mga gene ay hindi dapat
_masyadong malayo_ mula sa dulo ng gene).
GAMIT TRANSTERM WALA GENOME MGA ANOTASYON
Gumagamit ang TransTermHP ng kilalang impormasyon ng gene para lamang sa 3 bagay: (1) pag-tag sa pinag-uusapan
terminator bilang alinman sa "inside genes" o "intergenic," (2) pagpili ng background na GC-
porsyento ng nilalaman upang makalkula ang mga marka, dahil ang mga gene ay kadalasang may iba't ibang nilalaman ng GC
kaysa sa mga intergenic na rehiyon, at (3) gumagawa ng bahagyang mas nababasang output. Mga bagay (1)
at (3) ay hindi talaga kailangan, at (2) ay walang epekto kung ang iyong mga gene ay may halos pareho
GC-content bilang iyong mga intergenic na rehiyon.
Sa kasamaang palad, ang TransTermHP ay wala pang simpleng opsyon na tumakbo nang walang anotasyon
file (alinman sa .ptt o .coords), at nangangailangan ng hindi bababa sa 2 gene na naroroon. Ang solusyon
ay upang lumikha ng mga pekeng, maliliit na genes na pumapalibot sa bawat chromosome. Para magawa ito, gumawa ng fake.coords
file na naglalaman lamang ng dalawang linyang ito:
fakegene1 1 2 chome_id
fakegene2 L-1 L chrom_id
kung saan ang L ay ang haba ng input sequence at ang L-1 ay 1 mas mababa kaysa sa haba ng input
pagkakasunod-sunod. Ang "chrom_id" ay dapat ang salitang direktang sumusunod sa ">" sa .fasta file
naglalaman ng iyong sequence. (Kung, halimbawa, ang iyong .fasta file ay nagsimula sa ">seq1", kung gayon
chrom_id = seq1).
Lumilikha ito ng "pekeng" annotation na may dalawang 1-base-long genes na nasa gilid ng sequence sa isang
pagkakaayos ng buntot-buntot: --> <--. Maaaring patakbuhin ang TransTermHP gamit ang:
transterm -p expterm.dat sequence.fasta fake.coords
Kung ang nilalaman ng G/C ng iyong mga intergenic na rehiyon ay halos kapareho ng iyong mga gene, kung gayon ito
ay hindi magkakaroon ng labis na epekto sa mga markang matatanggap ng mga terminator. Sa kabilang kamay,
ang paggamit na ito ng TransTermHP ay hindi pa gaanong nasubok, kaya mahirap patunayan ang
katumpakan.
Gamitin ang 2ndscore online gamit ang mga serbisyo ng onworks.net