Pocketsphinx_batch – Online in der Cloud

Führen Sie Pocketsphinx_batch im kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist der Befehl „taschenphinx_batch“, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

Unter Ubuntu ausführen Lauf in Fedora In Windows Sim ausführen In MACOS Sim ausführen

PROGRAMM:

NAME/FUNKTION

Pocketsphinx_batch – Spracherkennung im Batch-Modus ausführen

ZUSAMMENFASSUNG

Taschenphinx_batch -Hmm hmmdir -dict dictfile [ Optionen ] ...

BESCHREIBUNG

Führen Sie die Spracherkennung über eine Liste von Äußerungen im Batchmodus aus. Eine Liste von Argumenten
folgt:

-adchdr
Größe des Audiodatei-Headers in Bytes (Header werden ignoriert)

-adcin Eingabe sind rohe Audiodaten

-agc Automatische Verstärkungsregelung für c0 („max“, „emax“, „noise“ oder „none“)

-agcthresh
Anfangsschwelle für die automatische Verstärkungsregelung

-allphone
Phonemdekodierung mit phonetischem Film

-allphone_ci
Führen Sie die Phonemdekodierung nur mit phonetischem Film und kontextunabhängigen Einheiten durch

-Alpha Preemphasis-Parameter

-argfile
Datei mit zusätzlichen Argumenten.

-eine Skala
Kehrwert der akustischen Modellskala zur Berechnung des Konfidenzwerts

-aw Auf akustische Partituren angewendete umgekehrte Gewichtung.

-Rückverfolgung
Ergebnisse drucken und in die Protokolldatei zurückverfolgen.

-Strahl Strahlbreite wird bei der Viterbi-Suche auf jeden Frame angewendet (kleinere Werte bedeuten breiter).
Strahl)

-besterWeg
Bestpath-Suche (Dijkstra) über Wortgitter ausführen (dritter Durchgang)

-bestpathlw
Wahrscheinlichkeitsgewichtung des Sprachmodells für die Suche nach dem besten Pfad

-build_outdirs
Erstellen Sie fehlende Unterverzeichnisse im Ausgabeverzeichnis

-cepdir
Dateiverzeichnis (vor Dateispezifikationen in der Steuerdatei)

-cepext
Erweiterung der Eingabedateien (angehängt an Dateispezifikationen in der Steuerdatei)

-ceplen
Anzahl der Komponenten im Eingabe-Feature-Vektor

-cmn Cepstral-Mittelwertnormalisierungsschema („aktuell“, „vorherig“ oder „keine“)

-cmnnit
Anfangswerte (durch Kommas getrennt) für den Cepstral-Mittelwert, wenn „prior“ verwendet wird

-compallsen
Berechnen Sie alle Senone-Scores in jedem Frame (kann schneller sein, wenn es viele gibt).
Senone)

-ctl Datei mit den zu verarbeitenden Äußerungen

-ctlcount
Anzahl der zu verarbeitenden Äußerungen (nach Überspringen). -ctloffset Einträge)

-ctlincr
Führen Sie jede N-te Zeile in der Steuerdatei aus

-ctloffset
Anzahl der Äußerungen zu Beginn -ctl Datei, die übersprungen werden soll

-ctm Ausgabe im CTM-Dateiformat (möglicherweise ist eine Nachsortierung erforderlich)

-debuggen Ebene zum Debuggen von Nachrichten

-dict Eingabedatei für das Aussprachewörterbuch (Lexikon).

-dictcase
Beim Wörterbuch wird die Groß-/Kleinschreibung beachtet (HINWEIS: Die Groß-/Kleinschreibung gilt für ASCII-Zeichen
nur)

-zittern
Fügen Sie 1/2-Bit-Rauschen hinzu

-doublebw
Verwenden Sie Filter mit doppelter Bandbreite (gleiche Mittenfrequenz).

-ds Downsampling-Verhältnis der Frame-GMM-Berechnung

-fdict Eingabedatei für das Wortaussprachewörterbuch

-feat Der Feature-Stream-Typ hängt vom akustischen Modell ab

-featparams
Enthält Merkmalsextraktionsparameter.

-fillprob
Wahrscheinlichkeit des Füllwortübergangs

-Frate Bildfrequenz

-fsg Formatieren Sie eine endliche Grammatikdatei

-fsgctl
Datei, die die FSG-Datei auflistet, die für jede Äußerung verwendet werden soll

-fsgdir
Verzeichnis für FSG-Dateien

-fsgext
Erweiterung für FSG-Dateien (einschließlich führender Punkt)

-fsgusealtpron
Fügen Sie FSG alternative Aussprachen hinzu

-fsgusefiller
Fügen Sie bei jedem Bundesstaat Füllwörter ein.

-fwdflat
Flache Lexikonsuche vorwärts über Wortgitter ausführen (2. Durchgang)

-fwdflatbeam
Strahlbreite, die bei der flachen Suche im zweiten Durchgang auf jedes Bild angewendet wird

-fwdflatefwid
Mindestanzahl von Endrahmen für ein Wort, das bei der fwdflat-Suche durchsucht werden soll

-fwdflatlw
Wahrscheinlichkeitsgewichtung des Sprachmodells für die Dekodierung des flachen Lexikons (2. Durchgang).

-fwdflatsfwin
Fenster mit Rahmen im Gitter zur Suche nach Nachfolgewörtern in der fwdflat-Suche

-fwdflatwbeam
Strahlbreite, die bei der flachen Suche im zweiten Durchgang auf Wortausgänge angewendet wird

-fwdtree
Vorwärts-Lexikonbaumsuche ausführen (1. Durchgang)

-Hmm Enthält akustische Modelldateien.

-hyp Name der Ausgabedatei

-hypseg
Ausgabe mit Segmentierungsdateinamen

-input_endian
Endianness der Eingabedaten, groß oder klein, wird ignoriert, wenn NIST oder MS Wav

-jsgf Grammatikdatei

-Schlüsselsatz
zu erkennen

-kws Datei mit zu erkennenden Schlüsselwörtern, eine pro Zeile

-kws_delay
Verzögerung beim Warten auf die beste Erkennungsbewertung

-kws_plp
Wahrscheinlichkeit einer Telefonschleife zum Erkennen von Schlüsselwörtern

-kws_threshold
Schwellenwert für das Verhältnis p(hyp)/p(alternativen).

-latsize
Anfängliche Größe der Backpointer-Tabelle

-lda Enthält eine Transformationsmatrix, die auf Features (Single-Stream-Features) angewendet werden soll
nur)

-ldadim
Dimensionalität der Ausgabe der Merkmalstransformation (0, um die gesamte Matrix zu verwenden)

-Heber
Länge der Sinuskurve für Lifting oder 0 für kein Lifting.

-lm Eingabedatei für das Trigramm-Sprachmodell

-lmctl eine Reihe von Sprachmodellen

Das -Hmm und -dict Argumente sind immer gefragt. Entweder -lm or -fsg Wird benötigt,
abhängig davon, ob Sie ein statistisches Sprachmodell oder eine endliche Grammatik verwenden.
Um die Batchmodus-Erkennung durchzuführen, müssen Sie mithilfe von eine Steuerdatei angeben -ctl Dieser Kurs ist ein
einfache Textdatei mit einem Eintrag pro Zeile. Jeder Eintrag ist der Name einer Eingabedatei
im Verhältnis zu -cepdir Verzeichnis und ohne die Dateinamenerweiterung (die in angegeben ist).
-cepext Streit).

Wenn Sie Akustik-Feature-Dateien als Eingabe verwenden (siehe sphinx_fe(1) für Informationen darüber, wie
um diese zu generieren), können Sie auch einen Unterteil einer Datei angeben, indem Sie das folgende Format verwenden:

DATEINAME START-FRAME ENDRAHMEN AUSSPRACHE-ID

Nutzen Sie Pocketsphinx_batch online über die Dienste von onworks.net