Il s'agit de la commande pocketphinx_continuous qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
pocketphinx_continuous - Exécuter la reconnaissance vocale en mode d'écoute continue
SYNOPSIS
pocketphinx_continuous -Hmm hmmdir -dict fichier dict [ Options ] ...
DESCRIPTION
Ce programme ouvre le périphérique audio et attend la parole. Lorsqu'il détecte un énoncé,
il effectue une reconnaissance vocale sur celui-ci.
-addchdr
Taille de l'en-tête du fichier audio en octets (les en-têtes sont ignorés)
-adcin L'entrée est des données audio brutes
-agc Contrôle de gain automatique pour c0 (« max », « emax », « bruit » ou « aucun »)
-agcseuil
Seuil initial pour le contrôle automatique du gain
-tous les téléphones
décodage de phonèmes avec lm phonétique
-allphone_ci
Effectuer le décodage des phonèmes avec lm phonétique et les unités indépendantes du contexte uniquement
-alpha Paramètre de préaccentuation
-fichierarg
fichier donnant des arguments supplémentaires.
-une échelle
Inverse de l'échelle du modèle acoustique pour le calcul du score de confiance
-oh Poids inverse appliqué aux scores acoustiques.
-retour en arrière
Imprimez les résultats et les backtraces dans le fichier journal.
-faisceau Largeur de faisceau appliquée à chaque image dans la recherche Viterbi (des valeurs plus petites signifient des valeurs plus larges
rayonner)
-meilleur chemin
Exécutez la recherche bestpath (Dijkstra) sur le réseau de mots (3e passage)
-meilleur chemin
Poids de probabilité du modèle de langue pour la recherche du meilleur chemin
-build_outdirs
Créer des sous-répertoires manquants dans le répertoire de sortie
-ceprép
répertoire de fichiers (préfixé par filespecs dans le fichier de contrôle)
-cetexte
Extension des fichiers d'entrée (suffixée aux spécifications de fichier dans le fichier de contrôle)
-ceplen
Nombre de composants dans le vecteur de caractéristiques en entrée
-cmn Schéma de normalisation moyenne cepstrale (« actuel », « précédent » ou « aucun »)
-cmninit
Valeurs initiales (séparées par des virgules) pour la moyenne cepstrale lorsque « prior » est utilisé
-compallsen
Calculez tous les scores de sénone dans chaque image (peut être plus rapide lorsqu'il y a plusieurs
sénones)
-ctl fichier listant les énoncés à traiter
-ctlcount
Nombre d'énoncés à traiter (après avoir sauté -ctloffset entrées)
-ctlincr
Faire chaque Nième ligne dans le fichier de contrôle
-ctloffset
Nombre d'énoncés au début de -ctl fichier à ignorer
-ctm sortie au format de fichier CTM (peut nécessiter un post-tri)
-déboguer niveau de débogage des messages
-dict fichier d'entrée du dictionnaire de prononciation (lexique)
-dictcase
Le dictionnaire est sensible à la casse (REMARQUE : l'insensibilité à la casse s'applique aux caractères ASCII
seulement)
-tremblement
Ajouter du bruit 1/2-bit
-double bw
Utiliser des filtres à double bande passante (même fréquence centrale)
-ds Taux de sous-échantillonnage du calcul GMM de la trame
-fdict fichier d'entrée du dictionnaire de prononciation des mots
-exploit Type de flux d'entités, dépend du modèle acoustique
-featparams
contenant des paramètres d'extraction de caractéristiques.
-fillprob
Probabilité de transition des mots de remplissage
-frate Fréquence d'images
-fsg formater le fichier de grammaire à l'état fini
-fsgctl
fichier listant le fichier FSG à utiliser pour chaque énoncé
-fsgdir
répertoire pour les fichiers FSG
-fsgext
extension pour les fichiers FSG (y compris le point initial)
-fsgusealtpron
Ajouter des prononciations alternatives à FSG
-fsgusfiller
Insérez des mots de remplissage à chaque état.
-fwdflat
Exécuter une recherche de lexique plat vers l'avant sur le réseau de mots (2e passage)
-fwdflatbeam
Largeur de faisceau appliquée à chaque image dans la recherche à plat de seconde passe
-fwdflatefwid
Nombre minimum d'images de fin pour un mot à rechercher dans la recherche fwdflat
-fwdflatlw
Poids de probabilité du modèle de langue pour le décodage du lexique plat (2e passe)
-fwdflatsfwin
Fenêtre de cadres en treillis pour rechercher les mots successeurs dans la recherche fwdflat
-fwdflatwbeam
Largeur de faisceau appliquée aux sorties de mots dans la recherche à plat de seconde passe
-fwdtree
Exécuter la recherche lexique en avant (1er passage)
-Hmm contenant des fichiers de modèles acoustiques.
-hype nom du fichier de sortie
-hypseg
sortie avec le nom du fichier de segmentation
-input_endian
Endianité des données d'entrée, grande ou petite, ignorée si NIST ou MS Wav
-jsgf fichier de grammaire
-phrase clé
reperer
-kws fichier avec des phrases clés à repérer, une par ligne
-kws_délai
Délai d'attente pour le meilleur score de détection
-kws_plp
Probabilité de boucle téléphonique pour le repérage de mots clés
-kws_seuil
Seuil pour le rapport p(hyp)/p(alternatives)
-grande taille
Taille initiale de la table du pointeur arrière
-lda contenant la matrice de transformation à appliquer aux entités (entités à flux unique
seulement)
-ldadim
Dimensionnalité de la sortie de la transformation de caractéristiques (0 pour utiliser la matrice entière)
-élévateur
Longueur de la courbe sin pour le levage, ou 0 pour pas de levage.
-lm fichier d'entrée du modèle de langage trigramme
-lmctl un ensemble de modèle de langage
Quand vous vous déconnectez, votre profil -Hmm et -dict les arguments sont toujours requis. Soit -lm or -fsg est requis,
selon que vous utilisez un modèle de langage statistique ou une grammaire à états finis.
Utilisez pocketphinx_continuous en ligne en utilisant les services onworks.net