این برنامه لینوکس با نام DocWire DocToText است که آخرین نسخه آن را می توان با عنوان doctotext-5.0.9-msvc.zip دانلود کرد. می توان آن را به صورت آنلاین در ارائه دهنده میزبانی رایگان OnWorks برای ایستگاه های کاری اجرا کرد.
این اپلیکیشن با نام DocWire DocToText را با OnWorks به صورت آنلاین دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. OnWorks Linux آنلاین یا شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MACOS را از این وب سایت راه اندازی کنید.
- 5. از سیستم عامل لینوکس OnWorks که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. اپلیکیشن را دانلود کرده، نصب و اجرا کنید.
DocWire DocToText
Ad
شرح
DocToText DocWire - یک مجموعه ابزار توسعه نرم افزار استخراج داده چند وجهی که انواع فایل ها را به متن ساده و html تبدیل می کند. این ابزار استخراج داده که به زبان C++ نوشته شده است، دارای تجزیه کننده ای است که می تواند فایل های PST و OST را به همراه یک API کاملاً جدید برای پردازش بهتر فایل تبدیل کند.
برای افزایش کاربرد آن، DocToText، به عنوان یک ابزار استخراج داده، می تواند با سایر برنامه های داده کاوی و تجزیه و تحلیل داده ادغام شود. مجهز به یک OCR درجه بالا، قابل برنامهنویسی و آموزش است که دارای تشخیص کاراکتر مبتنی بر شبکههای عصبی LSTM است. این تجزیه کننده اسناد قادر به استخراج ابرداده به همراه حاشیه نویسی است و لیستی از فرمت ها را پشتیبانی می کند که عبارتند از: DOC، XLS، XLSB، PPT، RTF، ODF (ODT، ODS، ODP)،
OOXML (DOCX، XLSX، PPTX)، iWork (PAGES، NUMBERs، KEYNOTE)،
ODFXML (FODP، FODS، FODT)، PDF، EML، HTML، Outlook (PST، OST)،
تصویر (JPG، JPEG، JFIF، BMP، PNM، PNG، TIFF، WEBP)
تحت مجوز عمومی عمومی گنو نسخه 2.0 (GPLv2) و مجوز تجاری موجود است.
امکانات
- امکان استخراج/وارد کردن و صادرات متن، تصاویر، قالب بندی و ابرداده به همراه حاشیه نویسی
- داده ها را می توان بین واردات و صادرات (فیلتر کردن، تجمیع و غیره) تبدیل کرد.
- مجهز به چند واردکننده
- مجهز به صادرکنندگان متعدد
- مجهز به یک OCR درجه بالا، قابل اسکریپت و آموزش پذیر است که دارای تشخیص کاراکتر مبتنی بر شبکه های عصبی LSTM است.
- تجزیه افزایشی داده ها را به محض در دسترس بودن برمی گرداند
- پلتفرم متقابل: لینوکس، ویندوز، MacOSX (و موارد دیگر در راه است)
- قابل جاسازی در برنامه شما (SDK)
- می تواند با سایر برنامه های داده کاوی و تجزیه و تحلیل داده ادغام شود
- فرآیند تجزیه را می توان به راحتی با اتصال اجسام با لوله | طراحی کرد اپراتور در یک زنجیره
- ارتباط عناصر زنجیره تجزیه بر اساس سیگنال های تقویتی
- عناصر زنجیره تجزیه سفارشی را می توان اضافه کرد (واردکنندگان، ترانسفورماتورها، صادرکنندگان)
- باینری های کوچک، کد بومی C++ سریع
مخاطبان
کاربران نهایی پیشرفته، توسعه دهندگان، کاربران نهایی / دسکتاپ
رابط کاربری
خط فرمان
زبان برنامه نویسی
C++، C
دسته بندی ها
این برنامه ای است که می تواند از https://sourceforge.net/projects/doctotext/ نیز دریافت شود. در OnWorks میزبانی شده است تا به آسانی از یکی از سیستم عامل های رایگان ما به صورت آنلاین اجرا شود.