pocketphinx_continuous - Online nel cloud

Esegui pocketphinx_continuous nel provider di hosting gratuito OnWorks su Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

Questo è il comando pocketphinx_continuous che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS

Esegui in Ubuntu Corri in Fedora Esegui in Windows Sim Esegui in MACOS Sim

PROGRAMMA:

NOME

pocketphinx_continuous - Esegue il riconoscimento vocale in modalità di ascolto continuo

SINOSSI

pocketphinx_continuo -Hmm mmm -dice file dict [ Opzioni ] ...

DESCRIZIONE

Questo programma apre il dispositivo audio e attende il parlato. Quando rileva un'espressione,
esegue il riconoscimento vocale su di esso.

-addr
Dimensione dell'intestazione del file audio in byte (le intestazioni vengono ignorate)

-adcin L'input è costituito da dati audio grezzi

-agc Controllo automatico del guadagno per c0 ("max", "emax", "noise" o "none")

-agctresh
Soglia iniziale per il controllo automatico del guadagno

-tutti i telefoni
decodifica dei fonemi con lm . fonetica

-allphone_ci
Eseguire la decodifica dei fonemi solo con lm fonetico e unità indipendenti dal contesto

-alfa Parametro di preenfasi

-file arg
file che fornisce argomenti aggiuntivi.

-una scala
Inversa della scala del modello acustico per il calcolo del punteggio di confidenza

-ah Peso inverso applicato alle partiture acustiche.

-ritorno
Stampa risultati e backtrace nel file di registro.

-fascio Larghezza del fascio applicata a ogni fotogramma nella ricerca Viterbi (valori più piccoli significano più ampio
trave)

-miglior percorso
Esegui la ricerca bestpath (Dijkstra) sul reticolo di parole (3° passaggio)

-percorso migliorew
Peso di probabilità del modello linguistico per la ricerca del percorso migliore

-build_outdir
Crea sottodirectory mancanti nella directory di output

-cepdir
directory files (preceduto da filespecs nel file di controllo)

-cext
Estensione file di input (suffisso a filespecs nel file di controllo)

-celen
Numero di componenti nel vettore delle caratteristiche di input

- cm Schema di normalizzazione media cepstrale ("corrente", "precedente" o "nessuno")

-cmnit
Valori iniziali (separati da virgole) per la media cepstrale quando si usa "precedente"

-compallsen
Calcola tutti i punteggi del senone in ogni fotogramma (può essere più veloce quando ce ne sono molti
senoni)

-ctl file che elencano le espressioni da elaborare

-ctlcount
N. di enunciati da elaborare (dopo il salto -ctloffset inserimenti)

-clincr
Esegui ogni ennesima riga nel file di controllo

-ctloffset
N. di enunciati all'inizio di -ctl file da saltare

-ctm output in formato file CTM (potrebbe richiedere un ordinamento successivo)

-debug livello per il debug dei messaggi

-dice file di input del dizionario di pronuncia (lessico)

-dictcase
Il dizionario fa distinzione tra maiuscole e minuscole (NOTA: l'insensibilità tra maiuscole e minuscole si applica ai caratteri ASCII
solo)

-dithering
Aggiungi rumore di 1/2 bit

-doppiobw
Usa filtri a doppia larghezza di banda (stessa frequenza centrale)

-ds Rapporto di downsampling calcolo frame GMM

-fdict file di input del dizionario di pronuncia delle parole

-impresa Tipo di flusso di funzionalità, dipende dal modello acustico

-featparams
contenente i parametri di estrazione delle caratteristiche.

-fillprob
Probabilità di transizione della parola di riempimento

-frate Frequenza dei fotogrammi

-fg formatta il file di grammatica a stati finiti

-fsgctl
elenco di file FSG file da utilizzare per ogni espressione

-fsgdir
directory per i file FSG

-fsgest
estensione per i file FSG (incluso il punto iniziale)

-fsgusaltpron
Aggiungi pronunce alternative a FSG

-fgusefiller
Inserisci parole di riempimento in ogni stato.

-fwdflat
Esegui ricerca flat-lexicon in avanti sul reticolo di parole (2° passaggio)

-fwdtravepiatta
Larghezza del fascio applicata a ogni fotogramma nella ricerca piatta al secondo passaggio

-fwdflatefwid
Numero minimo di frame finali per una parola da cercare nella ricerca fwdflat

-fwdflatlw
Peso di probabilità del modello linguistico per la decodifica del lessico piatto (secondo passaggio)

-fwdflatsfwin
Finestra di frame in reticolo per la ricerca di parole successive nella ricerca fwdflat

-fwdflatwbeam
Larghezza del raggio applicata alle uscite di parole nella ricerca piatta al secondo passaggio

-fwdtree
Esegui ricerca nell'albero lessicale in avanti (1° passaggio)

-Hmm contenente file di modelli acustici.

- hyp nome del file di output

-ipseg
output con il nome del file di segmentazione

-input_endian
Endianness dei dati di input, grandi o piccoli, ignorati se NIST o MS Wav

-jsgf file di grammatica

-frase chiave
individuare

-kws file con frasi chiave da individuare, una per riga

-kws_ritardo
Ritardo nell'attesa del miglior punteggio di rilevamento

-kws_plp
Probabilità di loop telefonico per individuare le parole chiave

-kws_soglia
Soglia per il rapporto p(hyp)/p(alternative)

-latitudine
Dimensione iniziale della tabella del backpointer

-lda contenente la matrice di trasformazione da applicare alle feature (caratteristiche a flusso singolo
solo)

-ldadim
Dimensionalità dell'output della trasformazione delle caratteristiche (0 per utilizzare l'intera matrice)

-sollevatore
Lunghezza della curva del seno per l'alzata, o 0 per nessuna alzata.

- lm file di input del modello di linguaggio trigram

-lmctl un insieme di modelli linguistici

Le -Hmm e a -dice gli argomenti sono sempre obbligatori. o - lm or -fg è obbligatorio,
a seconda che si utilizzi un modello linguistico statistico o una grammatica a stati finiti.

Usa pocketphinx_continuous online utilizzando i servizi onworks.net

<Prec
Succ.>