Este é o comando pocketsphinx_continuous que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online Windows ou emulador online MAC OS
PROGRAMA:
NOME
pocketsphinx_continuous - executa o reconhecimento de voz no modo de escuta contínua
SINOPSE
pocketsphinx_continuo -Hmm hmmdir -dito arquivo do dicionário [ opções ] ...
DESCRIÇÃO
Este programa abre o dispositivo de áudio e espera pela fala. Quando detecta um enunciado,
ele realiza reconhecimento de fala nele.
-adchdr
Tamanho do cabeçalho do arquivo de áudio em bytes (cabeçalhos são ignorados)
-adcin A entrada são dados de áudio brutos
-agc Controle de ganho automático para c0 ('max', 'emax', 'ruído' ou 'nenhum')
-agctresh
Limite inicial para controle de ganho automático
-todos os telefones
decodificação de fonema com lm fonético
-allphone_ci
Realize a decodificação de fonemas com filme fonético e unidades independentes de contexto apenas
-alfa Parâmetro de pré-ênfase
-argfile
arquivo fornecendo argumentos extras.
-uma escala
Inverso da escala do modelo acústico para cálculo de pontuação de confiança
-ah Peso inverso aplicado às pontuações acústicas.
-retorno
Imprimir resultados e backtraces para o arquivo de log.
-feixe Largura do feixe aplicada a cada quadro na pesquisa Viterbi (valores menores significam maior
feixe)
-melhor caminho
Execute a pesquisa bestpath (Dijkstra) sobre a palavra lattice (3ª passagem)
-melhor caminho
Peso de probabilidade do modelo de linguagem para bestpath search
-build_outdirs
Crie subdiretórios ausentes no diretório de saída
-cepdir
diretório de arquivos (prefixado para filespecs no arquivo de controle)
-cepext
Extensão de arquivos de entrada (com sufixo para especificações de arquivo no arquivo de controle)
-ceplen
Número de componentes no vetor de recursos de entrada
-cmn Esquema de normalização média cepstral ('atual', 'anterior' ou 'nenhum')
-cmninit
Valores iniciais (separados por vírgula) para a média cepstral quando 'anterior' é usado
-compallsen
Calcula todas as pontuações senone em cada quadro (pode ser mais rápido quando há muitos
senones)
-ctl enunciados de lista de arquivos a serem processados
-ctlcount
Nº de declarações a serem processadas (após pular -ctlooffset entradas)
-ctlincr
Faça cada enésima linha no arquivo de controle
-ctlooffset
Nº de declarações no início de -ctl arquivo a ser pulado
-ctm saída em formato de arquivo CTM (pode exigir pós-classificação)
-depurar nível de depuração de mensagens
-dito arquivo de entrada de dicionário de pronúncia (léxico)
-dicto
O dicionário diferencia maiúsculas de minúsculas (NOTA: a diferenciação de maiúsculas e minúsculas se aplica a caracteres ASCII
apenas)
-tanto
Adicionar ruído de 1/2 bit
-duplo
Use filtros de largura de banda dupla (mesma frequência central)
-ds Taxa de redução da resolução de computação do Frame GMM
-fdict arquivo de entrada de dicionário de pronúncia de palavras
-Parceria Tipo de fluxo de recurso, depende do modelo acústico
-featparams
contendo parâmetros de extração de recursos.
-fillrob
Probabilidade de transição de palavras de preenchimento
-frate Taxa de quadros
-fsg formatar arquivo de gramática de estado finito
-fsgctl
arquivo com lista de arquivos FSG para usar em cada expressão
-fsgdir
diretório para arquivos FSG
-fsgext
extensão para arquivos FSG (incluindo ponto inicial)
-fsgusealtpron
Adicionar pronúncias alternativas ao FSG
-fsgusefiller
Insira palavras de preenchimento em cada estado.
-fwdflat
Execute uma pesquisa de vocabulário simples sobre a palavra-chave (2ª passagem)
-fwdflatbeam
Largura do feixe aplicada a cada quadro na pesquisa plana de segunda passagem
-fwdflatefwid
Número mínimo de frames finais para uma palavra a ser pesquisada na pesquisa fwdflat
-fwdflatlw
Peso de probabilidade do modelo de linguagem para decodificação de léxico plano (2ª passagem)
-fwdflatsfwin
Janela de quadros na rede para pesquisar palavras sucessoras na pesquisa fwdflat
-fwdflatwbeam
Largura do feixe aplicada às saídas de palavras na pesquisa plana de segunda passagem
-fwdtree
Execute a pesquisa em árvore léxico para a frente (1ª passagem)
-Hmm contendo arquivos de modelo acústico.
-hip nome do arquivo de saída
-hipseg
saída com nome de arquivo de segmentação
-input_endian
Endianness de dados de entrada, grande ou pequeno, ignorado se NIST ou MS Wav
-jsgf arquivo de gramática
-frase chave
para manchar
-kws arquivo com frases-chave para detectar, uma por linha
-kws_delay
Atrase para esperar pela melhor pontuação de detecção
-kws_plp
Probabilidade de loop de telefone para localização de palavras-chave
-kws_limiar
Limiar para razão p (hip) / p (alternativas)
-latsize
Tamanho inicial da tabela do ponteiro posterior
-lda contendo a matriz de transformação a ser aplicada aos recursos (recursos de fluxo único
apenas)
-ldadim
Dimensionalidade da saída da transformação do recurso (0 para usar a matriz inteira)
-levantador
Comprimento da curva de pecado para levantamento ou 0 para nenhum levantamento.
-lm arquivo de entrada do modelo de linguagem trigrama
-lmctl um conjunto de modelo de linguagem
A -Hmm e -dito argumentos são sempre necessários. Qualquer -lm or -fsg É necessário,
dependendo se você está usando um modelo de linguagem estatística ou uma gramática de estado finito.
Use pocketsphinx_continuous online usando serviços onworks.net