Questo è il comando pocketphinx_continuous che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
pocketphinx_continuous - Esegue il riconoscimento vocale in modalità di ascolto continuo
SINOSSI
pocketphinx_continuo -Hmm mmm -dice file dict [ Opzioni ] ...
DESCRIZIONE
Questo programma apre il dispositivo audio e attende il parlato. Quando rileva un'espressione,
esegue il riconoscimento vocale su di esso.
-addr
Dimensione dell'intestazione del file audio in byte (le intestazioni vengono ignorate)
-adcin L'input è costituito da dati audio grezzi
-agc Controllo automatico del guadagno per c0 ("max", "emax", "noise" o "none")
-agctresh
Soglia iniziale per il controllo automatico del guadagno
-tutti i telefoni
decodifica dei fonemi con lm . fonetica
-allphone_ci
Eseguire la decodifica dei fonemi solo con lm fonetico e unità indipendenti dal contesto
-alfa Parametro di preenfasi
-file arg
file che fornisce argomenti aggiuntivi.
-una scala
Inversa della scala del modello acustico per il calcolo del punteggio di confidenza
-ah Peso inverso applicato alle partiture acustiche.
-ritorno
Stampa risultati e backtrace nel file di registro.
-fascio Larghezza del fascio applicata a ogni fotogramma nella ricerca Viterbi (valori più piccoli significano più ampio
trave)
-miglior percorso
Esegui la ricerca bestpath (Dijkstra) sul reticolo di parole (3° passaggio)
-percorso migliorew
Peso di probabilità del modello linguistico per la ricerca del percorso migliore
-build_outdir
Crea sottodirectory mancanti nella directory di output
-cepdir
directory files (preceduto da filespecs nel file di controllo)
-cext
Estensione file di input (suffisso a filespecs nel file di controllo)
-celen
Numero di componenti nel vettore delle caratteristiche di input
- cm Schema di normalizzazione media cepstrale ("corrente", "precedente" o "nessuno")
-cmnit
Valori iniziali (separati da virgole) per la media cepstrale quando si usa "precedente"
-compallsen
Calcola tutti i punteggi del senone in ogni fotogramma (può essere più veloce quando ce ne sono molti
senoni)
-ctl file che elencano le espressioni da elaborare
-ctlcount
N. di enunciati da elaborare (dopo il salto -ctloffset inserimenti)
-clincr
Esegui ogni ennesima riga nel file di controllo
-ctloffset
N. di enunciati all'inizio di -ctl file da saltare
-ctm output in formato file CTM (potrebbe richiedere un ordinamento successivo)
-debug livello per il debug dei messaggi
-dice file di input del dizionario di pronuncia (lessico)
-dictcase
Il dizionario fa distinzione tra maiuscole e minuscole (NOTA: l'insensibilità tra maiuscole e minuscole si applica ai caratteri ASCII
solo)
-dithering
Aggiungi rumore di 1/2 bit
-doppiobw
Usa filtri a doppia larghezza di banda (stessa frequenza centrale)
-ds Rapporto di downsampling calcolo frame GMM
-fdict file di input del dizionario di pronuncia delle parole
-impresa Tipo di flusso di funzionalità, dipende dal modello acustico
-featparams
contenente i parametri di estrazione delle caratteristiche.
-fillprob
Probabilità di transizione della parola di riempimento
-frate Frequenza dei fotogrammi
-fg formatta il file di grammatica a stati finiti
-fsgctl
elenco di file FSG file da utilizzare per ogni espressione
-fsgdir
directory per i file FSG
-fsgest
estensione per i file FSG (incluso il punto iniziale)
-fsgusaltpron
Aggiungi pronunce alternative a FSG
-fgusefiller
Inserisci parole di riempimento in ogni stato.
-fwdflat
Esegui ricerca flat-lexicon in avanti sul reticolo di parole (2° passaggio)
-fwdtravepiatta
Larghezza del fascio applicata a ogni fotogramma nella ricerca piatta al secondo passaggio
-fwdflatefwid
Numero minimo di frame finali per una parola da cercare nella ricerca fwdflat
-fwdflatlw
Peso di probabilità del modello linguistico per la decodifica del lessico piatto (secondo passaggio)
-fwdflatsfwin
Finestra di frame in reticolo per la ricerca di parole successive nella ricerca fwdflat
-fwdflatwbeam
Larghezza del raggio applicata alle uscite di parole nella ricerca piatta al secondo passaggio
-fwdtree
Esegui ricerca nell'albero lessicale in avanti (1° passaggio)
-Hmm contenente file di modelli acustici.
- hyp nome del file di output
-ipseg
output con il nome del file di segmentazione
-input_endian
Endianness dei dati di input, grandi o piccoli, ignorati se NIST o MS Wav
-jsgf file di grammatica
-frase chiave
individuare
-kws file con frasi chiave da individuare, una per riga
-kws_ritardo
Ritardo nell'attesa del miglior punteggio di rilevamento
-kws_plp
Probabilità di loop telefonico per individuare le parole chiave
-kws_soglia
Soglia per il rapporto p(hyp)/p(alternative)
-latitudine
Dimensione iniziale della tabella del backpointer
-lda contenente la matrice di trasformazione da applicare alle feature (caratteristiche a flusso singolo
solo)
-ldadim
Dimensionalità dell'output della trasformazione delle caratteristiche (0 per utilizzare l'intera matrice)
-sollevatore
Lunghezza della curva del seno per l'alzata, o 0 per nessuna alzata.
- lm file di input del modello di linguaggio trigram
-lmctl un insieme di modelli linguistici
Le -Hmm e a -dice gli argomenti sono sempre obbligatori. o - lm or -fg è obbligatorio,
a seconda che si utilizzi un modello linguistico statistico o una grammatica a stati finiti.
Usa pocketphinx_continuous online utilizzando i servizi onworks.net