这是名为 DocWire DocToText 的 Linux 应用程序,其最新版本可以作为 doctotext-5.0.9-msvc.zip 下载。 它可以在免费的工作站托管提供商 OnWorks 中在线运行。
使用 OnWorks 免费下载并在线运行此名为 DocWire DocToText 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
DocWire 文档转文本
Ad
商品描述
DocWire 的 DocToText - 一个多方面的数据提取软件开发工具包,可将各种文件转换为纯文本和 html。 该数据提取工具使用 C++ 编写,具有能够转换 PST 和 OST 文件的解析器以及用于更好地处理文件的全新 API。
为了增强其实用性,DocToText 作为一种数据提取工具,可以与其他数据挖掘和数据分析应用程序集成。 它配备了具有基于 LSTM 神经网络的字符识别的高级、可编写脚本和可训练的 OCR。 此文档解析器能够提取元数据和注释,并支持一系列格式,包括:DOC、XLS、XLSB、PPT、RTF、ODF(ODT、ODS、ODP),
OOXML(DOCX、XLSX、PPTX)、iWork(页面、数字、基调)、
ODFXML(FODP、FODS、FODT)、PDF、EML、HTML、Outlook(PST、OST)、
图片(JPG、JPEG、JFIF、BMP、PNM、PNG、TIFF、WEBP)
可根据 GNU 通用公共许可证版本 2.0 (GPLv2) 和商业许可使用。
产品优势
- 能够提取/导入和导出文本、图像、格式和元数据以及注释
- 数据可以在导入和导出之间转换(过滤、聚合等)
- 配备多家进口商
- 配备多家出口商
- 配备高级、可编写脚本且可训练的 OCR,具有基于 LSTM 神经网络的字符识别功能
- 增量解析一旦数据可用就返回数据
- 跨平台:Linux、Windows、MacOSX(以及更多即将推出)
- 可以嵌入到您的应用程序(SDK)中
- 可以与其他数据挖掘和数据分析应用程序集成
- 通过用管道连接对象,可以轻松设计解析过程 | 运营商进入链
- 基于Boost Signals的链元通信解析
- 可以添加自定义解析链元素(导入器、转换器、导出器)
- 小二进制文件、快速本机 C++ 代码
目的
高级最终用户、开发人员、最终用户/桌面
用户界面
命令行
程式语言
C++,C
分类
这是一个也可以从 https://sourceforge.net/projects/doctotext/ 获取的应用程序。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。