这是命令 hxextract,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
hxextract - 从 HTML 或 XML 文件中提取选定的元素
概要
提取物 [ -h | -? [ -x [ -s 文本 [ -e 文本 [ -b 基地 ] 元素或类 [ -c
配置文件 | 文件或 URL ]
商品描述
提取物 输出具有特定名称和/或类的所有元素。
输入必须格式良好,因为没有应用 HTML 启发式方法。
配置
支持以下选项:
-x 使用 XML 格式约定。
-s 文本 插页 文本 在输出的开始。
-e 文本 插页 文本 在输出结束时。
-b 基地 网址库
-c 配置文件
阅读@chapter 行 配置文件 (行的格式必须为“@chapter
filename") 并从每个文件中提取元素。
-h, -? 打印命令用法。
操作数
支持以下操作数:
元素或类
要提取的元素的名称(例如,“H2”),或前面的类的名称
经过 ”。” (例如,“.example”)或两者的组合(例如,“H2.example”)。
文件或 URL
文件名或 URL。 要从标准输入读取,请使用“-”。
环境
要使用代理检索远程文件,请设置环境变量 HTTP_PROXY 和
ftp_代理. 例如, http_proxy="http://localhost:8080/"
使用 onworks.net 服务在线使用 hxextract