英语法语西班牙文

OnWorks 网站图标

适用于 Linux 的 WebMagic 下载

免费下载 WebMagic Linux 应用程序以在 Ubuntu 在线、Fedora 在线或 Debian 在线中在线运行

这是名为 WebMagic 的 Linux 应用程序,其最新版本可以下载为 WebMagic-0.9.1.zip。 它可以在工作站的免费托管服务提供商 OnWorks 中在线运行。

免费下载并在线运行这个名为 WebMagic with OnWorks 的应用程序。

请按照以下说明运行此应用程序:

- 1. 在您的 PC 中下载此应用程序。

- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。

- 3. 在这样的文件管理器中上传这个应用程序。

- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。

- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。

- 6. 下载应用程序,安装并运行。

SCREENSHOTS

Ad


网络魔术


商品描述

WebMagic 是一个可扩展的爬虫框架。 它涵盖了爬虫、下载、url管理、内容提取和持久化的整个生命周期。 它可以简化特定爬虫的开发。 WebMagic 是一个简单但可扩展的爬虫框架。 您可以基于它轻松开发爬虫。 WebMagic 有一个简单的核心,具有很高的灵活性,一个简单的 html 提取 API。 它还提供了带有POJO的注解来自定义爬虫,不需要配置。 其他一些功能包括它是多线程并具有分发支持的事实。 WebMagic 很容易集成。 将依赖项添加到您的 pom.xml。 WebMagic 使用 slf4j 和 slf4j-log4j12 实现。 如果您自定义了 slf4j 实现,请排除 slf4j-log4j12。 您可以编写 PageProcessor 的类实现。



产品优势

  • 具有高灵活性的简单核心
  • 用于 html 提取的简单 API
  • 用POJO注解自定义爬虫,无需配置
  • 多线程和分发支持
  • 易于集成
  • 覆盖爬虫全生命周期


程式语言

爪哇岛


分类

框架、网络爬虫

这是一个也可以从 https://sourceforge.net/projects/webmagic.mirror/ 获取的应用程序。 它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最简单的方式在线运行。


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad