هذا هو تطبيق Linux المسمى DocWire DocToText والذي يمكن تنزيل أحدث إصدار له باسم doctotext-5.0.9-msvc.zip. يمكن تشغيله عبر الإنترنت في موفر الاستضافة المجاني OnWorks لمحطات العمل.
قم بتنزيل هذا التطبيق المسمى DocWire DocToText وتشغيله عبر الإنترنت باستخدام OnWorks مجانًا.
اتبع هذه التعليمات لتشغيل هذا التطبيق:
- 1. قم بتنزيل هذا التطبيق على جهاز الكمبيوتر الخاص بك.
- 2. أدخل في مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX باسم المستخدم الذي تريده.
- 3. تحميل هذا التطبيق في هذا الملف.
- 4. ابدأ تشغيل OnWorks Linux عبر الإنترنت أو محاكي Windows عبر الإنترنت أو محاكي MACOS عبر الإنترنت من هذا الموقع.
- 5. من نظام تشغيل OnWorks Linux الذي بدأته للتو ، انتقل إلى مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX مع اسم المستخدم الذي تريده.
- 6. قم بتنزيل التطبيق وتثبيته وتشغيله.
دوكوير دوكتوتكست
Ad
الوصف
DocWire's DocToText - مجموعة أدوات تطوير برمجيات لاستخراج البيانات متعددة الأوجه تقوم بتحويل جميع أنواع الملفات إلى نص عادي و html. مكتوبة بلغة C ++ ، تحتوي أداة استخراج البيانات هذه على محلل قادر على تحويل ملفات PST و OST إلى جانب واجهة برمجة تطبيقات جديدة لمعالجة الملفات بشكل أفضل.
لتعزيز فائدتها ، يمكن دمج DocToText ، كأداة لاستخراج البيانات ، مع تطبيقات استخراج البيانات وتحليلات البيانات الأخرى. يأتي مزودًا بتقنية التعرف الضوئي على الحروف عالية الجودة وقابلة للنصوص والتدرب عليها والتي تحتوي على التعرف على الأحرف على أساس الشبكات العصبية LSTM. محلل المستندات هذا قادر على استخراج البيانات الوصفية جنبًا إلى جنب مع التعليقات التوضيحية ويدعم قائمة التنسيقات التي تشمل: DOC ، XLS ، XLSB ، PPT ، RTF ، ODF (ODT ، ODS ، ODP) ،
OOXML (DOCX و XLSX و PPTX) و iWork (الصفحات والأرقام والمفاتيح الرئيسية) ،
ODFXML (FODP ، FODS ، FODT) ، PDF ، EML ، HTML ، Outlook (PST ، OST) ،
صورة (JPG ، JPEG ، JFIF ، BMP ، PNM ، PNG ، TIFF ، WEBP)
متوفر بموجب رخصة جنو العامة الإصدار 2.0 (GPLv2) والترخيص التجاري.
المميزات
- القدرة على استخراج/استيراد وتصدير النصوص والصور والتنسيقات والبيانات الوصفية بالإضافة إلى التعليقات التوضيحية
- يمكن تحويل البيانات بين الاستيراد والتصدير (التصفية والتجميع وما إلى ذلك)
- مجهزة بمستوردين متعددين
- مجهزة بمصدرين متعددين
- مزود بتقنية التعرف الضوئي على الحروف (OCR) عالية الجودة وقابلة للبرمجة والتدريب والتي تتميز بالتعرف على الأحرف المستندة إلى الشبكات العصبية LSTM
- التحليل المتزايد لإرجاع البيانات بمجرد توفرها
- منصة مشتركة: Linux، Windows، MacOSX (والمزيد قادم)
- يمكن تضمينها في التطبيق الخاص بك (SDK)
- يمكن دمجها مع تطبيقات استخراج البيانات وتحليل البيانات الأخرى
- يمكن تصميم عملية التحليل بسهولة عن طريق توصيل الكائنات بأنبوب | المشغل في سلسلة
- تحليل اتصالات عناصر السلسلة بناءً على إشارات التعزيز
- يمكن إضافة عناصر سلسلة تحليل مخصصة (المستوردين، المحولات، المصدرين)
- ثنائيات صغيرة، كود C++ أصلي سريع
الجمهور
المستخدمون النهائيون المتقدمون والمطورون والمستخدمون / سطح المكتب
واجهة المستخدم
سطر الأوامر
لغة البرمجة
سي ++ ، سي
الأقسام
هذا تطبيق يمكن جلبه أيضًا من https://sourceforge.net/projects/doctotext/. تمت استضافته في OnWorks ليتم تشغيله عبر الإنترنت بأسهل طريقة من أحد أنظمتنا التشغيلية المجانية.