这是名为 X-RAY 的 Linux 应用程序,其最新版本可以作为 Housekeepingedition.zip 下载。 它可以在工作站的免费托管服务提供商 OnWorks 中在线运行。
使用 OnWorks 免费下载并在线运行这个名为 X-RAY 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
X-RAY
商品描述
支持字符串、数组、对象数组和嵌套对象结构。 该架构与您正在抓取的页面结构无关,允许您以您选择的结构提取数据。 API 是完全可组合的,在抓取每个页面的方式上为您提供了极大的灵活性。 通过网站分页,抓取每个页面。 X-ray 还支持请求延迟和分页限制。 抓取的页面可以流式传输到文件中,因此如果页面上出现错误,您不会丢失已经抓取的内容。 从一页开始,然后轻松移动到下一页。 在对每个页面进行广度优先爬网之后,流程是可预测的。 X-ray 支持并发、节流、延迟、超时和限制,以帮助您负责任地抓取任何页面。 根据您的需要更换不同的刮刀。 目前支持 HTTP 和 PhantomJS 驱动驱动。 将来,我希望看到一个 Tor 驱动程序,用于通过 Tor 网络请求页面。
产品优势
- 灵活的模式
- 可组合
- 分页支持
- 爬虫支持
- 负责
- 可插拔驱动程序
程式语言
JavaScript
这是一个也可以从 https://sourceforge.net/projects/x-ray.mirror/ 获取的应用程序。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。