Dies ist der Befehl „taschenphinx_batch“, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
Pocketsphinx_batch – Spracherkennung im Batch-Modus ausführen
ZUSAMMENFASSUNG
Taschenphinx_batch -Hmm hmmdir -dict dictfile [ Optionen ] ...
BESCHREIBUNG
Führen Sie die Spracherkennung über eine Liste von Äußerungen im Batchmodus aus. Eine Liste von Argumenten
folgt:
-adchdr
Größe des Audiodatei-Headers in Bytes (Header werden ignoriert)
-adcin Eingabe sind rohe Audiodaten
-agc Automatische Verstärkungsregelung für c0 („max“, „emax“, „noise“ oder „none“)
-agcthresh
Anfangsschwelle für die automatische Verstärkungsregelung
-allphone
Phonemdekodierung mit phonetischem Film
-allphone_ci
Führen Sie die Phonemdekodierung nur mit phonetischem Film und kontextunabhängigen Einheiten durch
-Alpha Preemphasis-Parameter
-argfile
Datei mit zusätzlichen Argumenten.
-eine Skala
Kehrwert der akustischen Modellskala zur Berechnung des Konfidenzwerts
-aw Auf akustische Partituren angewendete umgekehrte Gewichtung.
-Rückverfolgung
Ergebnisse drucken und in die Protokolldatei zurückverfolgen.
-Strahl Strahlbreite wird bei der Viterbi-Suche auf jeden Frame angewendet (kleinere Werte bedeuten breiter).
Strahl)
-besterWeg
Bestpath-Suche (Dijkstra) über Wortgitter ausführen (dritter Durchgang)
-bestpathlw
Wahrscheinlichkeitsgewichtung des Sprachmodells für die Suche nach dem besten Pfad
-build_outdirs
Erstellen Sie fehlende Unterverzeichnisse im Ausgabeverzeichnis
-cepdir
Dateiverzeichnis (vor Dateispezifikationen in der Steuerdatei)
-cepext
Erweiterung der Eingabedateien (angehängt an Dateispezifikationen in der Steuerdatei)
-ceplen
Anzahl der Komponenten im Eingabe-Feature-Vektor
-cmn Cepstral-Mittelwertnormalisierungsschema („aktuell“, „vorherig“ oder „keine“)
-cmnnit
Anfangswerte (durch Kommas getrennt) für den Cepstral-Mittelwert, wenn „prior“ verwendet wird
-compallsen
Berechnen Sie alle Senone-Scores in jedem Frame (kann schneller sein, wenn es viele gibt).
Senone)
-ctl Datei mit den zu verarbeitenden Äußerungen
-ctlcount
Anzahl der zu verarbeitenden Äußerungen (nach Überspringen). -ctloffset Einträge)
-ctlincr
Führen Sie jede N-te Zeile in der Steuerdatei aus
-ctloffset
Anzahl der Äußerungen zu Beginn -ctl Datei, die übersprungen werden soll
-ctm Ausgabe im CTM-Dateiformat (möglicherweise ist eine Nachsortierung erforderlich)
-debuggen Ebene zum Debuggen von Nachrichten
-dict Eingabedatei für das Aussprachewörterbuch (Lexikon).
-dictcase
Beim Wörterbuch wird die Groß-/Kleinschreibung beachtet (HINWEIS: Die Groß-/Kleinschreibung gilt für ASCII-Zeichen
nur)
-zittern
Fügen Sie 1/2-Bit-Rauschen hinzu
-doublebw
Verwenden Sie Filter mit doppelter Bandbreite (gleiche Mittenfrequenz).
-ds Downsampling-Verhältnis der Frame-GMM-Berechnung
-fdict Eingabedatei für das Wortaussprachewörterbuch
-feat Der Feature-Stream-Typ hängt vom akustischen Modell ab
-featparams
Enthält Merkmalsextraktionsparameter.
-fillprob
Wahrscheinlichkeit des Füllwortübergangs
-Frate Bildfrequenz
-fsg Formatieren Sie eine endliche Grammatikdatei
-fsgctl
Datei, die die FSG-Datei auflistet, die für jede Äußerung verwendet werden soll
-fsgdir
Verzeichnis für FSG-Dateien
-fsgext
Erweiterung für FSG-Dateien (einschließlich führender Punkt)
-fsgusealtpron
Fügen Sie FSG alternative Aussprachen hinzu
-fsgusefiller
Fügen Sie bei jedem Bundesstaat Füllwörter ein.
-fwdflat
Flache Lexikonsuche vorwärts über Wortgitter ausführen (2. Durchgang)
-fwdflatbeam
Strahlbreite, die bei der flachen Suche im zweiten Durchgang auf jedes Bild angewendet wird
-fwdflatefwid
Mindestanzahl von Endrahmen für ein Wort, das bei der fwdflat-Suche durchsucht werden soll
-fwdflatlw
Wahrscheinlichkeitsgewichtung des Sprachmodells für die Dekodierung des flachen Lexikons (2. Durchgang).
-fwdflatsfwin
Fenster mit Rahmen im Gitter zur Suche nach Nachfolgewörtern in der fwdflat-Suche
-fwdflatwbeam
Strahlbreite, die bei der flachen Suche im zweiten Durchgang auf Wortausgänge angewendet wird
-fwdtree
Vorwärts-Lexikonbaumsuche ausführen (1. Durchgang)
-Hmm Enthält akustische Modelldateien.
-hyp Name der Ausgabedatei
-hypseg
Ausgabe mit Segmentierungsdateinamen
-input_endian
Endianness der Eingabedaten, groß oder klein, wird ignoriert, wenn NIST oder MS Wav
-jsgf Grammatikdatei
-Schlüsselsatz
zu erkennen
-kws Datei mit zu erkennenden Schlüsselwörtern, eine pro Zeile
-kws_delay
Verzögerung beim Warten auf die beste Erkennungsbewertung
-kws_plp
Wahrscheinlichkeit einer Telefonschleife zum Erkennen von Schlüsselwörtern
-kws_threshold
Schwellenwert für das Verhältnis p(hyp)/p(alternativen).
-latsize
Anfängliche Größe der Backpointer-Tabelle
-lda Enthält eine Transformationsmatrix, die auf Features (Single-Stream-Features) angewendet werden soll
nur)
-ldadim
Dimensionalität der Ausgabe der Merkmalstransformation (0, um die gesamte Matrix zu verwenden)
-Heber
Länge der Sinuskurve für Lifting oder 0 für kein Lifting.
-lm Eingabedatei für das Trigramm-Sprachmodell
-lmctl eine Reihe von Sprachmodellen
Das -Hmm und -dict Argumente sind immer gefragt. Entweder -lm or -fsg Wird benötigt,
abhängig davon, ob Sie ein statistisches Sprachmodell oder eine endliche Grammatik verwenden.
Um die Batchmodus-Erkennung durchzuführen, müssen Sie mithilfe von eine Steuerdatei angeben -ctl Dieser Kurs ist ein
einfache Textdatei mit einem Eintrag pro Zeile. Jeder Eintrag ist der Name einer Eingabedatei
im Verhältnis zu -cepdir Verzeichnis und ohne die Dateinamenerweiterung (die in angegeben ist).
-cepext Streit).
Wenn Sie Akustik-Feature-Dateien als Eingabe verwenden (siehe sphinx_fe(1) für Informationen darüber, wie
um diese zu generieren), können Sie auch einen Unterteil einer Datei angeben, indem Sie das folgende Format verwenden:
DATEINAME START-FRAME ENDRAHMEN AUSSPRACHE-ID
Nutzen Sie Pocketsphinx_batch online über die Dienste von onworks.net