英语法语西班牙文

OnWorks 网站图标

pdfgrep - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 pdfgrep

这是 pdfgrep 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


pdfgrep - 在 pdf 文件中搜索正则表达式

概要


pdfgrep [OPTION...] 模式 [文件...]

商品描述


寻找 模式 每个 文件. 模式 是一个扩展的正则表达式。

pdfgrep 工作方式与 grep 非常相似,但有一个区别:它在页面上而不是在行上运行。

配置


-i, --忽略大小写
忽略两者中的大小写区别 模式 和输入文件。

-F, --固定字符串
阐释 模式 作为由换行符分隔的固定字符串列表,其中任何一个都是
匹配。

-P, --perl-正则表达式
阐释 模式 作为 Perl 兼容的正则表达式 (PCRE)。 看 前语法(3)
快速概览。

-H, --with-文件名
打印每个匹配项的文件名。 当有更多时,这是默认设置
多于一个要搜索的文件。

-h, --无文件名
禁止输出文件名的前缀。 这是默认设置,当有
只有一个文件要搜索。

-n, --页码
用找到它的页面的编号作为每个匹配项的前缀。

-c, - 数数
抑制正常输出。 而是打印每个输入文件的匹配数。 笔记
与 grep 不同的是,同一页面上的多个匹配项将被单独计算。

-p, --页数
喜欢 -c, 但打印每页的匹配数。

-C, - 语境
最多打印 国际数字 每个匹配项周围的上下文字符。 确切的数字将
变化,因为 pdfgrep 试图尊重单词边界。 如果 是“线“, 整体
行将被打印。 如果未设置此选项,pdfgrep 会尝试打印
不超过终端宽度。

- 颜色 WHEN
用要显示的转义序列环绕文件名、页码和匹配文本
它们在终端上是彩色的。 (默认设置是 汽车). WHEN 可:

时刻
始终使用颜色,即使 stdout 不是终端。

决不要
不要使用颜色。

汽车
仅当 stdout 是终端时才使用颜色。

-o, --仅匹配
只打印一行的匹配部分,没有任何周围的上下文。

-r, -递归
递归搜索所有文件(受限制 - 包括- 排除) 在每个
目录,仅当它们在命令行上时才跟随符号链接。

-R, --取消引用递归
与...一样 -r,但遵循所有符号链接。

--排除=格劳博
跳过基本名称匹配的文件 格劳博。 看 水珠(7) 对于可以使用的通配符。 你
可以多次使用此选项以排除更多模式。 它优先于
- 包括. 请注意, in- 和 excludes 仅适用于通过以下方式找到的文件 -递归
不是参数列表。

--包括=格劳博
只搜索基本名称匹配的文件 格劳博。 看 - 排除 详情。 默认的
is * .pdf.

--密码=密码
使用 PASSWORD 解密 PDF 文件。 可以多次指定; 所有密码
将在所有 PDF 上试用。 备注 此密码将显示在您的命令中
历史和输出 ps(1). 所以请不要使用这个,如果安全 密码
很重要

-m, --最大计数
停止读取文件后 火柴。 当还使用 -c 或 --count 选项时,
pdfgrep 不输出大于 .

-Z, - 空值
输出一个空字节(称为 NUL 在 ASCII 和 '\0' 在 C) 而不是冒号
通常将文件名与行的其余部分分开。 此选项使输出
文件名中存在冒号、空格或换行符时是明确的。 有可能
与命令结合使用,例如 参数 -0 or perl的 -0.

--匹配前缀分隔符 SEP
将输出中用于分隔文件名、行号和文本的冒号更改为
SEP, 可以是任意字符串。 当文件名包含冒号时,这很有用,
但仅用于交互式使用。 对于脚本, - 空值 应该使用。

-调试
启用调试输出。 备注: 由于0.30.0版本之前poppler的限制,有些
调试输出也没有打印 -调试 当使用这样的 poppler 版本时。

--警告-空
打印警告 斯特德 如果 PDF 不包含可搜索的文本。 这是这种情况
仅包含图像的 PDF,例如扫描的文档。

--unac
从搜索模式和 PDF 文档中删除重音符号和连字。 这个
如果您想搜索包含“ae”的单词,这很有用,但 PDF 使用
取而代之的是单个字符“æ”。 看 联合国反腐败委员会(3)不重音(1) 了解详情。

本篇 选项 is 试验 仅由 可使用 if pdfgrep is 编译 - 联合国反腐败委员会
支持。

-q, - 安静的
禁止所有正常输出到标准输出。 将打印错误并退出代码
被退回(见下文)。

- 帮帮我
打印选项的简短摘要。

-V, - 版 显示版本信息。

退出 状态


通常,如果至少找到一个匹配项,则退出状态为 0,如果没有找到匹配项,则退出状态为 1,并且
2 如果发生错误。 但如果 - 安静的 or -q 使用选项并找到匹配项,
pdfgrep 无论错误如何,都将返回 0。

环境 变数


的行为 pdfgrep 受以下环境变量影响。

GREP_颜色
指定用于突出显示各个部分的颜色和其他属性
输出。 语法和值就像 GREP_颜色 of grep的。 看 grep的(1) 更多
细节。 目前只有能力 mt, ms, mc, fn, lnse 被使用
pdfgrep,其中 mt, msmc 具有相同的效果。

示例


打印 第一 工艺生产线 匹配 模式 打印

pdfgrep -n --max-count 10 模式 foo.pdf

搜索 所有 .PDF 谁的 名称 开始 - FOO 递归地 in 当前 目录

pdfgrep -r --include "foo*.pdf" 模式

搜索 所有 .PDF 旨在 12M 递归地 in 当前 目录

找 。 -name "*.pdf" -size -12M -print0 | xargs -0 pdfgrep 模式

请注意,与前面的示例相比,此任务无法通过
单独的 pdfgrep,但 Unix 工具 发现(1)参数(1) 必须使用。 那是因为
pdfgrep 本身不包含按文件大小排除文件的选项。 但正如你所见,
没有必要!

使用 onworks.net 服务在线使用 pdfgrep


免费服务器和工作站

下载 Windows 和 Linux 应用程序

  • 1
    AstrOrz播放器
    AstrOrz播放器
    AstrOrz Player 是一款免费的媒体播放器
    软件,部分基于 WMP 和 VLC。 这
    播放器采用极简风格,带有
    十多个主题色,还可以
    B ...
    下载 AstrOrzPlayer
  • 2
    电影启动器
    电影启动器
    Kodi Movistar+ TV 是 XBMC/ 的 ADDON
    Kodi 许可分配器
    IPTV服务解码器
    Movistar Integrado en uno de los
    媒体中心马...
    下载 movistartv
  • 3
    代码::块
    代码::块
    Code::Blocks 是一个免费的、开源的、
    跨平台 C、C++ 和 Fortran IDE
    专为满足最苛刻的需求而打造
    它的用户。 它的设计非常
    扩展...
    下载代码::Blocks
  • 4
    之中
    之中
    中间或高级 Minecraft 界面
    和数据/结构跟踪是一种工具
    显示 Minecraft 的概览
    世界,而无需实际创造它。 它
    能够 ...
    下载烟雨
  • 5
    系统2
    系统2
    MSYS2 是一组工具和
    图书馆为您提供
    易于使用的建筑环境,
    安装和运行本机 Windows
    软件。 它连...
    下载 MSYS2
  • 6
    libjpeg-turbo
    libjpeg-turbo
    libjpeg-turbo 是一个 JPEG 图像编解码器
    使用 SIMD 指令(MMX、SSE2、
    NEON、AltiVec)加速基线
    JPEG 压缩和解压
    x86、x8...
    下载 libjpeg-turbo
  • 更多 ”

Linux 命令

Ad