英语法语西班牙文

OnWorks 网站图标

啊爬虫

免费下载 ahCrawler Linux 应用程序,以在 Ubuntu online、Fedora online 或 Debian online 中在线运行

这是名为 ahCrawler 的 Linux 应用程序,其最新版本可以作为 ahcrawler-0.164.zip 下载。 它可以在工作站的免费托管服务提供商 OnWorks 中在线运行。

使用 OnWorks 免费下载并在线运行这个名为 ahCrawler 的应用程序。

请按照以下说明运行此应用程序:

- 1. 在您的 PC 中下载此应用程序。

- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。

- 3. 在这样的文件管理器中上传这个应用程序。

- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。

- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。

- 6. 下载应用程序,安装并运行。

SCREENSHOTS

Ad


啊爬虫


商品描述

ahCrawler 是一套用于在您的网站上实现您自己的搜索以及您的网络内容的分析器。 它可以在共享主机上使用。

它包括

* 爬虫(spider)和索引器
* 搜索您的网站
* 搜索统计
* 网站分析器(http 标题、短标题和关键字、链接检查器等)

您需要将其安装在您自己的服务器上。 因此,所有爬取的数据都保留在您的环境中。
您永远不知道外部网络蜘蛛何时更新了您的内容。 随时触发重新扫描 - 您始终可以控制检查什么时间的哪些数据。

Spider 是 CLI 工具,必须作为 cronjob 添加。

在基于 Web 的后端中,您可以控制所有数据并分析您的数据。
您可以在同一个后端处理多个网站。

PHP 7 或 8 + PDO (Mysql/Sqlite)



产品优势

  • 具有多个同时请求的爬虫/蜘蛛
  • Crawler 尊重 robots.txt、X-Robots、meta robots infomration 和链接中的 rel 属性
  • 爬虫支持 http 到 2.0 版本
  • 一次安装即可处理多个实例(多个网站)
  • 当前证书的 SSL 检查
  • SSL 检查 II:显示未加密的元素(如果您的网站使用 https)
  • 显示彩色的 http 响应标头,其中包含有关未使用的信息和安全标头的提示
  • 如果您要访问网站上的所有链接,请查看所有设置的 cookie
  • 在您的网站上集成搜索表单 + 结果
  • Linkchecker 播种错误、重定向、警告
  • 通过状态码、类型、MIME 类型探索/过滤整个网站
  • 所有 url 的详细页面:http 标头,链接在哪里,显示其传出链接/引用元素
  • 基于 Web 的集成更新程序


目的

高级最终用户、系统管理员、开发人员、质量工程师


用户界面

基于 Web 的命令行


程式语言

PHP


数据库环境

MySQL



分类

搜索引擎、网络分析

这是一个也可以从 https://sourceforge.net/projects/ahcrawler/ 获取的应用程序。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。


Ad