هذه هي جيوب الأوامر التي يمكن تشغيلها في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة على الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت
برنامج:
اسم
؛ pocketsphinx_batch - تشغيل التعرف على الكلام في وضع الدُفعات
موجز
Pocketsphinx_batch -همم همدير -قاموس إملاء [ الخيارات ] ...
الوصف
قم بتشغيل التعرف على الكلام عبر قائمة بالألفاظ في وضع الدُفعات. قائمة الحجج
يتبع:
-ادشدر
حجم رأس الملف الصوتي بالبايت (يتم تجاهل الرؤوس)
-ادسين الإدخال عبارة عن بيانات صوتية خام
-agc التحكم التلقائي في الكسب لـ c0 ("max" أو "emax" أو "Noise" أو "none")
-اكتريش
العتبة الأولية للتحكم التلقائي في الكسب
-الهاتف
فك الصوت مع لفظي lm
-allphone_ci
قم بإجراء فك تشفير الصوت باستخدام وحدات lm الصوتية والوحدات المستقلة عن السياق فقط
-ألفا معلمة التشديد المسبق
-argfile
ملف يعطي حجج إضافية.
-اسكال
معكوس مقياس النموذج الصوتي لحساب درجة الثقة
-آو الوزن العكسي المطبق على الدرجات الصوتية.
-تتبع خلفي
نتائج الطباعة و backtraces لملف السجل.
-الحزم يتم تطبيق عرض الشعاع على كل إطار في بحث Viterbi (القيم الأصغر تعني أعرض
الحزم)
-أفضل ممر
قم بتشغيل bestpath (Dijkstra) للبحث عبر شبكة الكلمات (التمريرة الثالثة)
-أفضل
وزن احتمال نموذج اللغة للبحث عن المسار الأفضل
-بناء_أوتدرس
إنشاء أدلة فرعية مفقودة في دليل الإخراج
-cepdir
دليل الملفات (مسبوق بـ filespecs في ملف التحكم)
-cepext
ملحق ملفات الإدخال (ملحق بـ filespecs في ملف التحكم)
-سبيلين
عدد المكونات في متجه ميزة الإدخال
-سمن Cepstral يعني مخطط التطبيع ("الحالي" أو "السابق" أو "لا شيء")
-سمنيت
القيم الأولية (مفصولة بفواصل) لمتوسط cepstral عند استخدام كلمة "pre"
-مضاعفات
احسب جميع درجات senone في كل إطار (يمكن أن يكون أسرع عندما يكون هناك الكثير
سينونيس)
-كتل ملف سرد الكلمات المراد معالجتها
-كتلكونت
عدد الألفاظ المراد معالجتها (بعد التخطي -كتل أوفست إدخالات)
-ctlincr
قم بعمل كل سطر ن في ملف التحكم
-كتل أوفست
عدد الأقوال في بداية -كتل الملف المطلوب تخطيه
-كتم الإخراج بتنسيق ملف CTM (قد يتطلب الفرز اللاحق)
-ديبوغ مستوى لتصحيح أخطاء الرسائل
-قاموس قاموس النطق (المعجم) ملف الإدخال
-قضية
القاموس حساس لحالة الأحرف (ملاحظة: ينطبق عدم حساسية حالة الأحرف على أحرف ASCII
فقط)
-إذا
أضف ضوضاء 1/2 بت
-مزدوجة
استخدم مرشحات النطاق الترددي المزدوج (نفس التكرار المركزي)
-دس نسبة اختزال حساب الإطار GMM
- حكم ملف إدخال قاموس نطق الكلمات
-عمل نوع دفق الميزة ، يعتمد على النموذج الصوتي
-مساء
تحتوي على معلمات استخراج الميزة.
-fillprob
احتمالية انتقال الكلمات الحشو
معدل معدل الاطار
-فسغ تنسيق ملف قواعد الحالة المحدودة
-fsgctl
ملف يسرد ملف FSG لاستخدامه لكل نطق
-فسجدير
دليل لملفات FSG
-fsgext
التمديد لملفات FSG (بما في ذلك النقطة البادئة)
-fsgusealtpron
إضافة طرق نطق بديلة إلى FSG
- fsgusefiller
أدخل كلمات حشو في كل ولاية.
-fwdflat
قم بتشغيل بحث المعجم المسطح للأمام عبر شبكة الكلمات (التمرير الثاني)
-fwdflatbeam
يتم تطبيق عرض الشعاع على كل إطار في البحث المسطح بالمرور الثاني
-fwdflatefwid
الحد الأدنى لعدد إطارات النهاية للكلمة المراد البحث عنها في بحث fwdflat
-fwdflatlw
وزن احتمالية نموذج اللغة لفك ترميز المعجم المسطح (مرور ثاني)
-fwdflatsfwin
نافذة من الإطارات في شبكة للبحث عن الكلمات اللاحقة في بحث fwdflat
-fwdflatwbeam
يتم تطبيق عرض الحزمة على مخارج الكلمات في البحث المسطح بالمرور الثاني
-فودتري
قم بتشغيل البحث عن شجرة المعجم إلى الأمام (التمريرة الأولى)
-همم تحتوي على ملفات نماذج صوتية.
-النفعة ضع اسم الملف
- ضغط
الإخراج مع اسم ملف التجزئة
-input_endian
Endianness لبيانات الإدخال ، كبيرة كانت أم صغيرة ، يتم تجاهلها إذا كانت NIST أو MS Wav
-jsgf ملف القواعد
-العبارة الرئيسية
لتحديد
-كيلوواط ملف بعبارات رئيسية لتحديدها ، واحدة في كل سطر
-kws_delay
تأخير لانتظار أفضل نتيجة للكشف
-kws_plp
احتمال حلقة الهاتف لاكتشاف الكلمات الرئيسية
-kws_threshold
عتبة النسبة p (hyp) / p (البدائل)
-آخر
الحجم الأولي لجدول المؤشر الخلفي
-الدا تحتوي على مصفوفة تحويل ليتم تطبيقها على المعالم (ميزات أحادية الدفق
فقط)
-الدايم
أبعاد ناتج تحويل الميزة (0 لاستخدام المصفوفة بأكملها)
-رافع
طول منحنى الخطيئة للرفع ، أو 0 بدون رفع.
-للم ملف إدخال نموذج لغة تريجرام
-لمكتل مجموعة من نموذج اللغة
تشير -همم -قاموس الحجج مطلوبة دائما. أيضاً -للم or -فسغ مطلوب،
اعتمادًا على ما إذا كنت تستخدم نموذج لغة إحصائيًا أم قواعد نحوية محدودة.
للقيام بالتعرف على وضع الدُفعات ، ستحتاج إلى تحديد ملف تحكم باستخدام -كتل هذا هو
ملف نصي بسيط يحتوي على إدخال واحد في كل سطر. كل إدخال هو اسم ملف الإدخال
نسبة إلى -cepdir الدليل ، وبدون امتداد اسم الملف (الذي يتم تقديمه بتنسيق
هيه -cepext دعوى).
إذا كنت تستخدم ملفات الميزات الصوتية كمدخلات (انظر sphinx_fe(1) للحصول على معلومات حول كيفية القيام بذلك
لإنشاء هذه) ، يمكنك أيضًا تحديد جزء فرعي من الملف ، باستخدام التنسيق التالي:
اسم الملف إطار البداية نهاية الإطار معرف القول
استخدم pocketsphinx_batch عبر الإنترنت باستخدام خدمات onworks.net