适用于 Linux 的 DocWire DocToText 下载

这是名为 DocWire DocToText 的 Linux 应用程序,其最新版本可以作为 doctotext-5.0.9-msvc.zip 下载。 它可以在免费的工作站托管提供商 OnWorks 中在线运行。

 
 

使用 OnWorks 免费下载并在线运行此名为 DocWire DocToText 的应用程序。

请按照以下说明运行此应用程序:

- 1. 在您的 PC 中下载此应用程序。

- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。

- 3. 在这样的文件管理器中上传这个应用程序。

- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。

- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。

- 6. 下载应用程序,安装并运行。

DocWire 文档转文本



描述:

DocWire 的 DocToText - 一个多方面的数据提取软件开发工具包,可将各种文件转换为纯文本和 html。 该数据提取工具使用 C++ 编写,具有能够转换 PST 和 OST 文件的解析器以及用于更好地处理文件的全新 API。
为了增强其实用性,DocToText 作为一种数据提取工具,可以与其他数据挖掘和数据分析应用程序集成。 它配备了具有基于 LSTM 神经网络的字符识别的高级、可编写脚本和可训练的 OCR。 此文档解析器能够提取元数据和注释,并支持一系列格式,包括:DOC、XLS、XLSB、PPT、RTF、ODF(ODT、ODS、ODP),
OOXML(DOCX、XLSX、PPTX)、iWork(页面、数字、基调)、
ODFXML(FODP、FODS、FODT)、PDF、EML、HTML、Outlook(PST、OST)、
图片(JPG、JPEG、JFIF、BMP、PNM、PNG、TIFF、WEBP)

可根据 GNU 通用公共许可证版本 2.0 (GPLv2) 和商业许可使用。



产品优势

  • 能够提取/导入和导出文本、图像、格式和元数据以及注释
  • 数据可以在导入和导出之间转换(过滤、聚合等)
  • 配备多家进口商
  • 配备多家出口商
  • 配备高级、可编写脚本且可训练的 OCR,具有基于 LSTM 神经网络的字符识别功能
  • 增量解析一旦数据可用就返回数据
  • 跨平台:Linux、Windows、MacOSX(以及更多即将推出)
  • 可以嵌入到您的应用程序(SDK)中
  • 可以与其他数据挖掘和数据分析应用程序集成
  • 通过用管道连接对象,可以轻松设计解析过程 | 运营商进入链
  • 基于Boost Signals的链元通信解析
  • 可以添加自定义解析链元素(导入器、转换器、导出器)
  • 小二进制文件、快速本机 C++ 代码


目的

高级最终用户、开发人员、最终用户/桌面


用户界面

命令行


程式语言

C++,C


分类

文本处理、库、数据恢复、OCR、数据分析

这是一个也可以从 https://sourceforge.net/projects/doctotext/ 获取的应用程序。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。



最新的 Linux 和 Windows 在线程序


下载适用于 Windows 和 Linux 的软件和程序的类别