适用于 Windows 的 tika-python 下载

这是名为 tika-python 的 Windows 应用程序,其最新版本可以作为 ApacheTika2.6.0Release.zip 下载。 它可以在工作站的免费托管服务提供商 OnWorks 中在线运行。

 
 

使用 OnWorks 免费下载并在线运行这个名为 tika-python 的应用程序。

请按照以下说明运行此应用程序:

- 1. 在您的 PC 中下载此应用程序。

- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。

- 3. 在这样的文件管理器中上传这个应用程序。

- 4. 从本网站启动任何 OS OnWorks 在线模拟器,但更好的 Windows 在线模拟器。

- 5. 从您刚刚启动的 OnWorks Windows 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。

- 6. 下载应用程序并安装。

- 7. 从您的 Linux 发行版软件存储库下载 Wine。 安装后,您可以双击该应用程序以使用 Wine 运行它们。 您还可以尝试 PlayOnLinux,这是 Wine 上的一个花哨界面,可帮助您安装流行的 Windows 程序和游戏。

Wine 是一种在 Linux 上运行 Windows 软件的方法,但不需要 Windows。 Wine 是一个开源的 Windows 兼容层,可以直接在任何 Linux 桌面上运行 Windows 程序。 本质上,Wine 试图从头开始重新实现足够多的 Windows,以便它可以运行所有这些 Windows 应用程序,而实际上不需要 Windows。

截图:


提卡蟒蛇


描述:

Apache Tika 库的 Python 端口,使用 Tika REST 服务器使 Tika 可用。 这使得 Apache Tika 可以作为 Python 库使用,可以通过 Setuptools、Pip 安装并且易于安装。 要使用此库,您需要在系统上安装 Java 7+,因为 tika-python 在后台启动 Tika REST 服务器。 要使其在断开连接的环境中工作,请下载一个 tika 服务器文件(tika-server.jar 和 tika-server.jar.md5,可以在此处找到)并将 TIKA_SERVER_JAR 环境变量设置为 TIKA_SERVER_JAR="file:// //tika-server.jar”,它成功地告诉 python-tika “下载”这个文件并将其移动到 /tmp/tika-server.jar 并作为后台进程运行。 这是在没有互联网访问的情况下运行 python-tika 的唯一方法。 如果没有这个设置,默认是检查 tika 版本并每次从 Apache 中拉取最新版本。



項目特色

  • 解析器接口(在 REST 之前向后兼容)
  • 解析器接口使用 /rmeta 接口提取文本和元数据
  • 或者,您可以传递 Tika 服务器 URL 以及对多实例执行有用的调用
  • 指定 XHTML 的输出格式
  • 解包接口在一次调用中处理元数据和文本提取
  • 内部返回内部解压的元数据和文本条目的 tarball


程式语言

Python


分类

文本处理、医疗保健、机器学习

这是一个也可以从 https://sourceforge.net/projects/tika-python.mirror/ 获取的应用程序。 它已托管在 OnWorks 中,以便以最简单的方式从我们的免费操作系统之一在线运行。



最新的 Linux 和 Windows 在线程序


下载适用于 Windows 和 Linux 的软件和程序的类别