EngelsFransSpaans

OnWorks-favicon

ipdSummary - Online in de cloud

Voer ipdSummary uit in de gratis hostingprovider van OnWorks via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is de opdracht ipdSummary die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


ipdSummary - Detecteer DNA-base-modificaties op basis van kinetische handtekeningen.

PRODUCTBESCHRIJVING


kineticsTool laadt IPD's die op elke positie in het genoom zijn waargenomen, en vergelijkt die IPD's
de verwachte waarde voor ongemodificeerd DNA, en geeft het resultaat van deze statistische test weer.
De verwachte IPD-waarde voor ongemodificeerd DNA kan afkomstig zijn van een in silico onder controle te houden of
versterkte onder controle te houden. De in silico-controle is getraind door PacBio en geleverd met de
pakket. Het voorspelt de IPD met behulp van de lokale reekscontext rond de stroom
positie. Een geamplificeerde controlegegevensset wordt gegenereerd door ongemodificeerd DNA te sequencen met behulp van de
dezelfde volgorde als het testmonster. Een versterkt controlemonster wordt gewoonlijk gegenereerd door
amplificatie van het hele genoom van het originele monster.

Wijziging Detectie
De basismodus van kineticsTools voert een onafhankelijke vergelijking uit van IPD's op elke positie
het genoom, voor elke streng, en verzendt verschillende statistieken naar CSV en GFF (na toepassing van een
significantiefilter).

wijzigingen Identificatie
kinetiekHulpmiddelen ook heeft a Wijziging Identificatie mode uit die blikje decoderen multisite IPD
'vingerafdrukken' om in a gereduceerd reeks of gesprekken of specifiek veranderingen. Deze kenmerken heeft the
volgend voordelen:

· Er kunnen verschillende wijzigingen worden onderscheiden die op dezelfde basis plaatsvinden (bijv
voorbeeld m5C en m4C)

· Het signaal van één wijziging wordt gecombineerd in één statistiek, waardoor het verbetert
gevoeligheid, het verwijderen van extra pieken en het correct centreren van de oproep

OPTIES


Roep dit programma op met --help om de beschikbare opties te zien.

ALGORITME


Synthetisch Controleer:
Uit onderzoek naar de relatie tussen IPD en sequentiecontext blijkt dat de meeste van de
variatie in gemiddelde IPD over een genoom kan worden voorspeld op basis van een sequentiecontext van 12 basen
rondom de actieve plaats van het DNA-polymerase. De grenzen van de relevante context
venster komt overeen met het venster van DNA dat in contact is met het polymerase, zoals te zien is in
DNA/polymerase-kristalstructuren. Om het proces van het vinden van DNA-modificaties te vereenvoudigen
met PacBio-gegevens bevat de tool een vooraf getrainde opzoektabel die 12-meer DNA in kaart brengt
sequenties betekenen IPD's waargenomen in de C2-chemie.

Filtering en Hoefverzorging
kineticsTools gebruikt de Mapping QV gegenereerd door BLASR en opgeslagen in het cmp.h5-bestand om
negeer lezingen die niet met vertrouwen in kaart zijn gebracht. De standaard minimaal vereiste Mapping QV is
10, wat impliceert dat BLASR dat heeft gedaan 90\% vertrouwen dat de uitlezing correct in kaart is gebracht. Vanwege
het bereik van leeslengtes die inherent zijn aan PacBio-gegevens. Dit kan worden gewijzigd door gebruik te maken van de
--mapQvThreshold opdrachtregelargument, of via het SMRTPortal-configuratiedialoogvenster voor
Wijzigingsdetectie.

Er zijn een paar kenmerken van PacBio-gegevens die speciale aandacht vereisen om dit te bereiken
goede wijzigingsdetectieprestaties. kineticsTools inspecteert de uitlijning tussen de
waargenomen basen en de referentiesequentie - zodat een IPD-meting kan plaatsvinden
opgenomen in de analyse, moet de PacBio-leessequentie overeenkomen met de referentiesequentie k
rond de verwante basis. In de huidige module k = 1 De IPD-verdeling op een bepaalde locatie is
gezien als een mengsel tussen het 'normale' incorporatieproces IPD, dat gevoelig is
aan de lokale sequentiecontext en DNA-modificaties en een vervuilend 'pauze'-proces
IPD die veel langer duren (gemiddeld >10x langer dan normaal), maar zelden voorkomen
(~1% van de IPD's). Opmerking: Ons huidige inzicht is dat pauzes niet nuttig zijn
informatie over de methyleringstoestand van het DNA, hoe zorgvuldiger de analyse ook mag zijn
gegarandeerd. Merk ook op dat wijzigingen die de ruwweg 1% van de
waargenomen IPD's worden gegenereerd door pauzegebeurtenissen. Aftopping van waargenomen IPD's op de mondiale 99e
percentiel wordt gemotiveerd door theorie uit het robuust testen van hypothesen. Sommige reekscontexten
kunnen van nature langere IPD's hebben, om te voorkomen dat er te veel gegevens in die contexten worden afgetopt, de cap
drempel wordt per context als volgt aangepast: capThreshold = max(global99,
5*modelVoorspelling, percentiel(ipdObservaties, 75))

Statistisch Testen
We testen de hypothese dat IPD's die op een bepaalde locus in de steekproef worden waargenomen, een
langere gemiddelden dan IPD's waargenomen op dezelfde locus in ongemodificeerd DNA. Als we gegenereerd hebben
een Whole Genome Amplified dataset, die DNA-modificaties verwijdert, we gebruiken een case-control,
t-test met twee steekproeven. Deze tool biedt ook een vooraf gekalibreerd 'synthetisch controle'-model
die de ongemodificeerde IPD voorspelt, gegeven een sequentiecontext van 12 basen. In de synthetische
In het controlegeval gebruiken we een t-test met één steekproef, met een aanpassing om rekening te houden met fouten in de
synthetisch controlemodel.

INGANGEN


uitgelijnd_reads.cmp.h5
Een standaard cmp.h5-bestand bevat uitlijningen en IPD-informatie levert de kinetische gegevens
gebruikt om wijzigingsdetectie uit te voeren. Het standaard cmp.h5-bestand van een SMRTportal-jobs is
data/aligned_read.cmp.h5.

Referentie Volgorde
Het gereedschap vereist de referentiereeks die wordt gebruikt om uitlijningen uit te voeren. Momenteel moet dit
worden geleverd via het pad naar een SMRTportal-referentierepository-item.

UITGANGEN


De wijzigingsdetectietool biedt resultaten in verschillende formaten die geschikt zijn voor
diepgaande statistische analyse, snelle referentie en verbruik door visualisatietools
zoals PacBio SMRTView. De resultaten worden over het algemeen geïndexeerd op basis van referentiepositie en
referentie streng. In alle gevallen verwijst de strengwaarde naar de streng die de
wijziging in DNA-monster. Vergeet niet dat het kinetische effect van de wijziging is
waargenomen in leessequenties die uitgelijnd zijn met de tegenovergestelde streng. Dus leest afstemmen op de
positieve streng bevat informatie over modificatie op de negatieve streng en ondeugd
omgekeerd, maar in deze toolkit rapporteren we altijd de streng die de vermeende waarde bevat
wijziging.

wijzigingen.csv
Het bestand modificaties.csv bevat één rij voor elk paar (referentiepositie, streng).
die in de dataset voorkomen met een dekking van minimaal x. x is standaard ingesteld op 3, maar is dat wel
configureerbaar met de vlag '--minCoverage' naar ipdSummary.py. De referentiepositie-index is
1-gebaseerd voor compatibiliteit met het gff-bestand in de R-omgeving.

uitgang kolommen
in silico onder controle te houden mode

┌────────────────┬────────────────────── ────────── ──┐
│Kolom │ Beschrijving │
├────────────────┼────────────────────── ────────── ──┤
│refId │ referentiesequentie-ID van deze │
│ │ observatie │
├────────────────┼────────────────────── ────────── ──┤
│tpl │ 1-gebaseerde sjabloonpositie │
├────────────────┼────────────────────── ────────── ──┤
│streng │ oorspronkelijke monsterstreng waarbij │
│ │ kinetiek werd gegenereerd. '0' is │
│ │ de streng van het origineel │
│ │ FASTA, '1' is tegengestelde streng │
│ │ van FASTA │
├────────────────┼────────────────────── ────────── ──┤
│basis │ de verwante basis op deze │
│ │ positie in de referentie │
├────────────────┼────────────────────── ────────── ──┤
│score │ Phred-getransformeerde pwaarde die een │
│ │ Op deze │ bestaat kinetische afwijking
│ │ positie │
└────────────────┴────────────────────── ────────── ──┘

│tGemiddelde │ begrensd gemiddelde van genormaliseerde IPD's │
│ │ waargenomen op deze positie │
├────────────────┼────────────────────── ────────── ──┤
│tErr │ afgetopte standaardfout van │
│ │ genormaliseerde IPD's waargenomen op deze │
│ │ positie (standaardafwijking / │
│ │ sqrt(dekking) │
├────────────────┼────────────────────── ────────── ──┤
│modelvoorspelling │ genormaliseerde gemiddelde IPD voorspeld door │
│ │ het synthetische controlemodel voor │
│ │ deze reekscontext │
├────────────────┼────────────────────── ────────── ──┤
│ipdRatio │ tGemiddelde / modelvoorspelling │
├────────────────┼────────────────────── ────────── ──┤
│dekking │ aantal geldige IPD's op dit │
│ │ positie (zie het gedeelte Filteren │
│ │ voor details) │
├────────────────┼────────────────────── ────────── ──┤
│frac │ schatting van de fractie van │
│ │ moleculen die de │ dragen
│ │ wijziging │
├────────────────┼────────────────────── ────────── ──┤
│fracLaag │ 2.5% betrouwbaarheidsgrens van frac │
│ │ schatting │
├────────────────┼────────────────────── ────────── ──┤
│fracUpp │ 97.5% betrouwbaarheidsgrens van frac │
│ │ schatting │
└────────────────┴────────────────────── ────────── ──┘

case-control mode

┌────────────────┬────────────────────── ────────── ──┐
│Kolom │ Beschrijving │
├────────────────┼────────────────────── ────────── ──┤
│refId │ referentiesequentie-ID van deze │
│ │ observatie │
├────────────────┼────────────────────── ────────── ──┤
│tpl │ 1-gebaseerde sjabloonpositie │
├────────────────┼────────────────────── ────────── ──┤
│streng │ oorspronkelijke monsterstreng waarbij │
│ │ kinetiek werd gegenereerd. '0' is │
│ │ de streng van het origineel │
│ │ FASTA, '1' is tegengestelde streng │
│ │ van FASTA │
├────────────────┼────────────────────── ────────── ──┤
│basis │ de verwante basis op deze │
│ │ positie in de referentie │
├────────────────┼────────────────────── ────────── ──┤
│score │ Phred-getransformeerde pwaarde die een │
│ │ Op deze │ bestaat kinetische afwijking
│ │ positie │
├────────────────┼────────────────────── ────────── ──┤
│caseMean │ gemiddelde van genormaliseerde case-IPD's │
│ │ waargenomen op deze positie │
├────────────────┼────────────────────── ────────── ──┤
│controlegemiddelde │ gemiddelde van genormaliseerde controle-IPD's │
│ │ waargenomen op deze positie │
├────────────────┼────────────────────── ────────── ──┤
│caseStd │ standaardafwijking van case-IPD's │
│ │ waargenomen op deze positie │
├────────────────┼────────────────────── ────────── ──┤
│controlStd │ standaardafwijking van controle │
│ │ IPD's waargenomen op deze positie │
└────────────────┴────────────────────── ────────── ──┘

│ipdRatio │ tGemiddelde / modelvoorspelling │
├────────────────┼────────────────────── ────────── ──┤
│testStatistiek │ t-teststatistiek │
├────────────────┼────────────────────── ────────── ──┤
│dekking │ gemiddelde van geval en controle │
│ │ dekking │
├────────────────┼────────────────────── ────────── ──┤
│controlCoverage │ aantal geldige controle-IPD's bij │
│ │ deze positie (zie Filteren │
│ │ sectie voor details) │
├────────────────┼────────────────────── ────────── ──┤
│caseCoverage │ telling van geldige case-IPD's op dit │
│ │ positie (zie het gedeelte Filteren │
│ │ voor details) │
└────────────────┴────────────────────── ────────── ──┘

wijzigingen.gff
De modificaties.gff voldoet aan de GFF versie 3-specificatie (‐
http://www.sequenceontology.org/gff3.shtml). Elke sjabloonpositie/strengpaar waarvan
p-waarde overschrijdt de p-waardedrempel en wordt weergegeven als een rij. De sjabloonpositie is op 1 gebaseerd,
volgens de GFF-specificatie. De strengkolom verwijst naar de streng die het gedetecteerde draagt
modificatie, wat de tegenovergestelde streng is van de strengen die worden gebruikt om de modificatie te detecteren. De
GFF-betrouwbaarheidskolom is een Phred-getransformeerde p-waarde van detectie.

Note on genoom browser verenigbaarheid

Het bestand modificaties.gff werkt niet rechtstreeks met de meeste genoombrowsers. Je zal
waarschijnlijk moet u een kopie maken van het GFF-bestand en de _seqid_-kolommen converteren van de
generieke 'ref0000x'-namen gegenereerd door PacBio, naar de FASTA-headers die aanwezig zijn in het origineel
referentie FASTA-bestand. De toewijzingstabel wordt geschreven in de header van de modificaties.gff
bestand in #reeks-header labels. Dit probleem wordt opgelost in versie 1.4 van
kinetiekHulpmiddelen.

De aanvullende gegevenskolom van het GFF-bestand bevat andere statistieken die nuttig kunnen zijn
stroomafwaartse analyse of filtering. Met name de dekkingsgraad van de reads die je gewend bent
de oproep doen, en +/- 20 bp sequentiecontext rondom de site.

┌───────────┬───────────────────────────────────────────────────────
│Kolom │ Beschrijving │
├───────────┼───────────────────────────────────────────────────────
│seqid │ Fasta contig-naam │
├───────────┼───────────────────────────────────────────────────────
│bron │ Naam van het hulpmiddel -- 'kinModCall' │
├───────────┼───────────────────────────────────────────────────────
│type │ Wijzigingstype -- in │
│ │ identificatiemodus dit zal │ zijn
│ │ m6A, m4C of m5C voor geïdentificeerde │
│ │ basen, of de generieke tag │
│ │ 'modified_base' als een kinetische │
│ │ gebeurtenis gedetecteerd die niet │
│ │ komt overeen met een bekende wijziging │
│ │ handtekening │
├───────────┼───────────────────────────────────────────────────────
│start │ Wijzigingspositie op contig │
├───────────┼───────────────────────────────────────────────────────
│einde │ Wijzigingspositie op contig │
├───────────┼───────────────────────────────────────────────────────
│score │ Phred transformeerde de p-waarde van │
│ │ detectie - dit is de │
│ │ p-waarde voor detectie op één locatie │
├───────────┼───────────────────────────────────────────────────────
│streng │ Monsterstreng met │
│ │ wijziging │
└───────────┴───────────────────────────────────────────────────────

│fase │ Niet van toepassing │
├───────────┼───────────────────────────────────────────────────────
│attributen │ Extra velden relevant voor basis │
│ │ modificaties. IPDRatio is traditioneel │
│ │ IPDRatio, context is de │
│ │ referentiesequentie -20bp tot │
│ │ +20bp rond de wijziging, │
│ │ en dekkingsniveau is het getal │
│ │ van IPD-waarnemingen gebruikt na │
│ │ QV-filtering in kaart brengen en │
│ │ nauwkeurigheidsfiltering. Als de rij │
│ │ is het resultaat van een geïdentificeerde │
│ │ wijziging voegen we ook een │ toe
│ │ identificatieQv-tag met de │
│ │ van de wijziging │
│ │ identificatieprocedure. │
│ │ identificatieQv is de │
│ │ phred-getransformeerde waarschijnlijkheid van │
│ │ een onjuiste identificatie, voor │
│ │ basen die werden geïdentificeerd als │
│ │ een bepaalde │ hebben
│ │ wijziging. frac, fracLaag, │
│ │ fracUp zijn de geschatte │
│ │ fractie van moleculen die │ dragen
│ │ de wijziging, en de 5% │
│ │ betrouwbaarheidsintervallen van de │
│ │ schatting. De gemethyleerde │
│ │ breukschatting is een │
│ │ bèta-niveau functie, en zou │
│ │ alleen voor verkennende │ gebruiken
│ │ doeleinden. │
└───────────┴───────────────────────────────────────────────────────

motieven.gff
Als de Motif Finder-tool wordt uitgevoerd, genereert deze motieven.gff, een opnieuw verwerkte versie
van modificaties.gff met de volgende wijzigingen. Als een gedetecteerde wijziging plaatsvindt op a
motief gedetecteerd door de motiefzoeker, wordt de wijziging geannoteerd met motiefgegevens. Een
attribuut 'motief' wordt toegevoegd dat de motiefreeks bevat, en een attribuut 'id' wordt toegevoegd
met de motief-ID, wat de motiefreeks is voor ongepaarde motieven of
'motifString1/motifString2' voor gepaarde motieven. Als er een motiefinstantie in het genoom bestaat,
maar werd niet gedetecteerd in modificaties.gff, er wordt een vermelding toegevoegd aan motieven.gff, die de
aanwezigheid van dat motief en de kinetiek die op die plek werd waargenomen.

motief_samenvatting.csv
Als de Motif Finder-tool wordt uitgevoerd, wordt motive_summary.csv gegenereerd, waarin de gewijzigde
motieven ontdekt door de tool. Het CSV bevat één rij per gedetecteerd motief, met de
volgende kolommen

┌───────────────────┬─────────────────── ────────── ─────┐
│Kolom │ Beschrijving │
├───────────────────┼─────────────────── ────────── ─────┤
│motiefString │ Gedetecteerde motiefreeks │
├───────────────────┼─────────────────── ────────── ─────┤
│centerPos │ Positie in motief van │
│ │ wijziging (0-gebaseerd) │
├───────────────────┼─────────────────── ────────── ─────┤
│fractie │ Fractie van instanties van deze │
│ │ motief met wijziging QV hierboven │
│ │ de QV-drempel │
├───────────────────┼─────────────────── ────────── ─────┤
│nGedetecteerd │ Aantal exemplaren van deze │
│ │ motief met bovendrempel │
└───────────────────┴─────────────────── ────────── ─────┘

│nGenoom │ Aantal exemplaren van deze │
│ │ motief in referentiereeks │
├───────────────────┼─────────────────── ────────── ─────┤
│groupTag │ Een string die het motief identificeert │
│ │ groepering. Voor gepaarde motieven is dit │
│ │ is │
│ │ " / ", │
│ │ Voor ongepaarde motieven is dit gelijk aan │
│ │ motiefString │
├───────────────────┼─────────────────── ────────── ─────┤
│partnerMotiefString │ motiefString van gepaard motief │
│ │ (motief met │
│ │ omgekeerd-complementair │
│ │ motiefString) │
├───────────────────┼─────────────────── ────────── ─────┤
│meanScore │ Gemiddelde wijziging Qv van gedetecteerde │
│ │ exemplaren │
├───────────────────┼─────────────────── ────────── ─────┤
│meanIpdRatio │ Gemiddelde IPD-ratio van gedetecteerde │
│ │ exemplaren │
├───────────────────┼─────────────────── ────────── ─────┤
│gemiddelde dekking │ Gemiddelde dekking van gedetecteerde │
│ │ exemplaren │
├───────────────────┼─────────────────── ────────── ─────┤
│objectiveScore │ Objectieve score van dit motief in │
│ │ het motiefzoekeralgoritme │
└───────────────────┴─────────────────── ────────── ─────┘

Gebruik ipdSummary online met behulp van onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

  • 1
    PAC-manager
    PAC-manager
    PAC is een Perl/GTK-vervanging voor
    SecureCRT/Putty/etc (linux
    ssh/telnet/... gui)... Het biedt een GUI
    om verbindingen te configureren: gebruikers,
    wachtwoorden, VERWACHT regel...
    PAC-manager downloaden
  • 2
    GeoServer
    GeoServer
    GeoServer is open source-software
    server geschreven in Java waarmee gebruikers
    om geospatiale gegevens te delen en te bewerken.
    Ontworpen voor interoperabiliteit, het
    publiceert d...
    GeoServer downloaden
  • 3
    Vuurvliegje III
    Vuurvliegje III
    Een gratis en open-source persoonlijke financiering
    manager. Firefly III beschikt over een
    dubbel boekhoudsysteem. Jij kan
    voer snel in en organiseer uw
    transacties ik...
    Vuurvlieg III downloaden
  • 4
    Apache OpenOffice-extensies
    Apache OpenOffice-extensies
    De officiële catalogus van Apache
    OpenOffice-extensies. Je zult vinden
    extensies variërend van woordenboeken tot
    hulpmiddelen om PDF-bestanden te importeren en verbinding te maken
    met ext...
    Apache OpenOffice-extensies downloaden
  • 5
    BidsprinkhanenBT
    BidsprinkhanenBT
    Mantis is een eenvoudig te implementeren, web
    gebaseerde bugtracker om productbugs te helpen
    volgen. Het vereist PHP, MySQL en een
    web Server. Bekijk onze demo en gehost
    offer...
    MantisBT downloaden
  • 6
    LAN Messenger
    LAN Messenger
    LAN Messenger is een p2p-chattoepassing
    voor intranetcommunicatie en niet
    een server nodig hebben. Diverse handige
    functies worden ondersteund, inclusief
    melden...
    LAN Messenger downloaden
  • Meer "

Linux-commando's

  • 1
    blijf
    blijf
    abidw - serialiseer de ABI van een ELF
    bestand abidw leest een gedeelde bibliotheek in ELF
    formaat en verzendt een XML-representatie
    van zijn ABI naar standaarduitvoer. De
    uitgestoten ...
    Voer abidw uit
  • 2
    in staat
    in staat
    abilint - valideer een abigail ABI
    representatie abilint ontleedt de native
    XML-representatie van een ABI zoals uitgezonden
    door abidw. Zodra het de XML heeft geparseerd
    vertegenwoordigen...
    Voer abilint uit
  • 3
    coresendmsg
    coresendmsg
    coresendmsg - stuur een CORE API-bericht
    naar de core-daemon-daemon ...
    Voer coresendmsg uit
  • 4
    kern_server
    kern_server
    core_server - De primaire server voor
    Spambayes. OMSCHRIJVING: dient momenteel
    alleen de webinterface. Insteken
    luisteraars voor verschillende protocollen is nader te bepalen.
    Dit ...
    Voer core_server uit
  • 5
    fwflits
    fwflits
    fwflash - programma om afbeeldingsbestand te flashen
    naar een aangesloten NXT-apparaat ...
    Voer fwflash uit
  • 6
    fwts-verzamel
    fwts-verzamel
    fwts-collect - verzamel logs voor fwts
    bug-rapportage. ...
    Voer fwts-collect uit
  • Meer "

Ad