这是 pdfgrep 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
pdfgrep - 在 pdf 文件中搜索正则表达式
概要
pdfgrep [OPTION...] 模式 [文件...]
商品描述
寻找 模式 每个 文件. 模式 是一个扩展的正则表达式。
pdfgrep 工作方式与 grep 非常相似,但有一个区别:它在页面上而不是在行上运行。
配置
-i, --忽略大小写
忽略两者中的大小写区别 模式 和输入文件。
-F, --固定字符串
阐释 模式 作为由换行符分隔的固定字符串列表,其中任何一个都是
匹配。
-P, --perl-正则表达式
阐释 模式 作为 Perl 兼容的正则表达式 (PCRE)。 看 前语法(3)
快速概览。
-H, --with-文件名
打印每个匹配项的文件名。 当有更多时,这是默认设置
多于一个要搜索的文件。
-h, --无文件名
禁止输出文件名的前缀。 这是默认设置,当有
只有一个文件要搜索。
-n, --页码
用找到它的页面的编号作为每个匹配项的前缀。
-c, - 数数
抑制正常输出。 而是打印每个输入文件的匹配数。 笔记
与 grep 不同的是,同一页面上的多个匹配项将被单独计算。
-p, --页数
喜欢 -c, 但打印每页的匹配数。
-C, - 语境 民
最多打印 国际数字 每个匹配项周围的上下文字符。 确切的数字将
变化,因为 pdfgrep 试图尊重单词边界。 如果 民 是“线“, 整体
行将被打印。 如果未设置此选项,pdfgrep 会尝试打印
不超过终端宽度。
- 颜色 WHEN
用要显示的转义序列环绕文件名、页码和匹配文本
它们在终端上是彩色的。 (默认设置是 汽车). WHEN 可:
时刻
始终使用颜色,即使 stdout 不是终端。
决不要
不要使用颜色。
汽车
仅当 stdout 是终端时才使用颜色。
-o, --仅匹配
只打印一行的匹配部分,没有任何周围的上下文。
-r, -递归
递归搜索所有文件(受限制 - 包括 和 - 排除) 在每个
目录,仅当它们在命令行上时才跟随符号链接。
-R, --取消引用递归
与...一样 -r,但遵循所有符号链接。
--排除=格劳博
跳过基本名称匹配的文件 格劳博。 看 水珠(7) 对于可以使用的通配符。 你
可以多次使用此选项以排除更多模式。 它优先于
- 包括. 请注意, in- 和 excludes 仅适用于通过以下方式找到的文件 -递归 和
不是参数列表。
--包括=格劳博
只搜索基本名称匹配的文件 格劳博。 看 - 排除 详情。 默认的
is * .pdf.
--密码=密码
使用 PASSWORD 解密 PDF 文件。 可以多次指定; 所有密码
将在所有 PDF 上试用。 备注 此密码将显示在您的命令中
历史和输出 ps(1). 所以请不要使用这个,如果安全 密码
很重要
-m, --最大计数 民
停止读取文件后 民 火柴。 当还使用 -c 或 --count 选项时,
pdfgrep 不输出大于 民.
-Z, - 空值
输出一个空字节(称为 NUL 在 ASCII 和 '\0' 在 C) 而不是冒号
通常将文件名与行的其余部分分开。 此选项使输出
文件名中存在冒号、空格或换行符时是明确的。 有可能
与命令结合使用,例如 参数 -0 or perl的 -0.
--匹配前缀分隔符 SEP
将输出中用于分隔文件名、行号和文本的冒号更改为
SEP, 可以是任意字符串。 当文件名包含冒号时,这很有用,
但仅用于交互式使用。 对于脚本, - 空值 应该使用。
-调试
启用调试输出。 备注: 由于0.30.0版本之前poppler的限制,有些
调试输出也没有打印 -调试 当使用这样的 poppler 版本时。
--警告-空
打印警告 斯特德 如果 PDF 不包含可搜索的文本。 这是这种情况
仅包含图像的 PDF,例如扫描的文档。
--unac
从搜索模式和 PDF 文档中删除重音符号和连字。 这个
如果您想搜索包含“ae”的单词,这很有用,但 PDF 使用
取而代之的是单个字符“æ”。 看 联合国反腐败委员会(3) 和 不重音(1) 了解详情。
本篇 选项 is 试验 和 仅由 可使用 if pdfgrep is 编译 - 联合国反腐败委员会
支持。
-q, - 安静的
禁止所有正常输出到标准输出。 将打印错误并退出代码
被退回(见下文)。
- 帮帮我
打印选项的简短摘要。
-V, - 版 显示版本信息。
退出 状态
通常,如果至少找到一个匹配项,则退出状态为 0,如果没有找到匹配项,则退出状态为 1,并且
2 如果发生错误。 但如果 - 安静的 or -q 使用选项并找到匹配项,
pdfgrep 无论错误如何,都将返回 0。
环境 变数
的行为 pdfgrep 受以下环境变量影响。
GREP_颜色
指定用于突出显示各个部分的颜色和其他属性
输出。 语法和值就像 GREP_颜色 of grep的。 看 grep的(1) 更多
细节。 目前只有能力 mt, ms, mc, fn, ln 和 se 被使用
pdfgrep,其中 mt, ms 和 mc 具有相同的效果。
示例
打印 此 第一 十 线 匹配 模式 和 打印 其 页 数
pdfgrep -n --max-count 10 模式 foo.pdf
搜索 所有 .PDF 档 谁的 名称 开始 - FOO 递归地 in 此 当前 目录
pdfgrep -r --include "foo*.pdf" 模式
搜索 所有 .PDF 档 这 旨在 小 比 12M 递归地 in 此 当前 目录
找 。 -name "*.pdf" -size -12M -print0 | xargs -0 pdfgrep 模式
请注意,与前面的示例相比,此任务无法通过
单独的 pdfgrep,但 Unix 工具 发现(1) 和 参数(1) 必须使用。 那是因为
pdfgrep 本身不包含按文件大小排除文件的选项。 但正如你所见,
没有必要!
使用 onworks.net 服务在线使用 pdfgrep