هذا هو الأمر gocr الذي يمكن تشغيله في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة عبر الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت
برنامج:
اسم
gocr - أداة التعرف على نص سطر الأوامر
موجز
com.gocr [OPTION] [-i] pnm- ملف
الوصف
gocr هو برنامج التعرف الضوئي على الحروف يمكن استخدامه من سطر الأوامر.
يستغرق الإدخال بتنسيق PNM أو PGM أو PBM أو PPM أو PCX ، ويكتب النص الذي تم التعرف عليه إلى المعياري.
إذا كان PNM ملف هي شرطة واحدة ، يتم قراءة بيانات PNM منها ستدين. إذا كان gzip و bzip2 و netpbm-
يتم تثبيت البرامج ويدعم نظامك بوبين(3) أيضًا pnm.gz ، pnm.bz2 ، png ، jpg ،
يتم دعم jpeg و tiff و gif و bmp و ps (صفحات مفردة فقط) و eps كملفات إدخال (وليس كـ
تيار الإدخال) ، حيث يمكن استبدال pnm بواحد من ppm و pgm و pbm.
OPTIONS
-h عرض معلومات الاستخدام
-i ملف
قراءة المدخلات من ملف (أو ستدين if ملف هي شرطة واحدة)
-o ملف
إرسال الإخراج إلى ملف بدلا من المعياري
-e ملف
إرسال أخطاء إلى ملف بدلا من ستدير أو المعياري if ملف هو اندفاعة
-x ملف
تقدم الإخراج إلى ملف (ملف يمكن أن يكون اسم ملف أو اسم فيفو أو واصف ملف
1 ... 255) ، هذا مفيد لمطوري واجهة المستخدم الرسومية لإظهار تقدم OCR ، الملف
الوسيطة descriptor متاحة فقط ، إذا تم تجميعها مع تعريف __USE_POSIX
-p مسار
مسار قاعدة البيانات ، يجب تضمين شرطة مائلة نهائية ، الافتراضي هو ./db/ ، سيكون هذا المسار
مليئة بصور الشخصيات المكتسبة
-f شكل
الناتج شكل من النص المعترف به (ISO8859_1 TeX HTML XML UTF8 ASCII) ، سوف XML
أيضا إخراج بيانات الموقف والاحتمال
-l مستوى
اضبط المستوى الرمادي على مستوى (0 <160 <= 255 ، افتراضي: 0 للكشف التلقائي) ، وحدات بكسل أغمق
تنتمي إلى الأحرف ، يتم تفسير وحدات البكسل الأكثر سطوعًا كخلفية للإدخال
صورة
-d المقاس
قم بتعيين حجم الغبار بالبكسل (تتم إزالة المجموعات الأصغر من ذلك) ، 0 يعني لا
تتم إزالة المجموعات ، الافتراضي هو -1 للكشف التلقائي
-s NUM ضبط عرض الفضاء بين الكلمات بوحدات من النقاط (الافتراضي: 0 للكشف التلقائي) ، على نطاق أوسع
يتم تفسير العروض على أنها مسافات للكلمات ، وتكون أصغر كمسافات بين الأحرف
-v الإسهاب
يكون مطولا إلى stderr ؛ الإسهاب هو حقل بت
-c سلسلة
فقط إخراج مطول للأحرف من سلسلة إلى stderr ، يتم إنشاء المزيد من الإنتاج
لجميع الأحرف داخل السلسلة ، تشير الشرطة السفلية إلى أحرف غير معروفة ، وهذا
الوظيفة مفيدة لقصر معلومات التصحيح على المعلومات الضرورية
-C سلسلة
يتعرف فقط على الشخصيات من سلسلة، هذه وظيفة تصفية في الحالات التي يكون فيها ملف
الفائدة فقط على جزء من الحروف الأبجدية ، يمكنك استخدام 0-9 أو az to
حدد النطاقات ، استخدم - لاكتشاف علامة الطرح
-a يقين
قم بتعيين القيمة من أجل يقين التعرف (0..100 ؛ الافتراضي: 95) ، الأحرف ذات أ
يتم قبول درجة أعلى من اليقين ، ويتم التعامل مع الأحرف الأقل يقينًا على أنها
غير معروف (غير معروف) ؛ قم بتعيين قيم أعلى ، إذا كنت تريد أن تكون أكثر يقينًا فقط
الشخصيات المعترف بها
-u سلسلة
إخراج هذه السلسلة لكل حرف غير معروف (الافتراضي هو "_")
-m طريقة
ضبط الوضع التشغيلي ؛ الوضع هو حقل بت (الافتراضي: 0)
-n منطقي
if منطقي هو غير صفري ، يتعرف فقط على الأرقام (هذا الآن قديم ، استخدم -C
"0123456789")
تم تحديد الإسهاب كحقل بت:
1 طباعة مزيد من المعلومات
2 قائمة أشكال المربعات (انظر -c) إلى stderr
4 قائمة نمط المربعات (انظر -c) إلى stderr
8 نمط الطباعة بعد التعرف على التصحيح
16 طباعة معلومات تصحيح الأخطاء حول التعرف على الخطوط إلى stderr
32 قم بإنشاء outXX.png باستخدام مربعات وخطوط مميزة في كل خطوة عامة من خطوات التعرف الضوئي على الحروف
أوضاع التشغيل هي:
2 استخدام قاعدة البيانات للتعرف على الأحرف التي لا يتعرف عليها الآخرون
الخوارزميات (التطوير المبكر)
4 التبديل على تحليل التخطيط أو تقسيم المناطق (التطوير)
8 لا تقارن الأحرف غير المتعرف عليها بأحرف معروفة
16 لا تحاول تقسيم الأحرف المتداخلة إلى حرفين أو ثلاثة أحرف مفردة
32 لا تصحح السياق
64 تعبئة الأحرف ، قبل بدء التعرف ، يتم البحث عن الأحرف المتشابهة
وسيتم إرسال حرف واحد فقط من هذه الأحرف إلى محرك التعرف
(تطوير)
130 توسيع قاعدة البيانات ، يطالب المستخدم بأحرف غير محددة ويمدد الامتداد
قاعدة بيانات بإجابة المستخدمين (128 + 2 ، التطوير المبكر)
256 قم بإيقاف تشغيل محرك التعرف (يكون منطقيًا مع -m 2)
استخدم gocr عبر الإنترنت باستخدام خدمات onworks.net