pdfgrep - Online in der Cloud

Dies ist der Befehl pdfgrep, der im kostenlosen OnWorks-Hosting-Provider mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


pdfgrep - Durchsuchen Sie PDF-Dateien nach einem regulären Ausdruck

ZUSAMMENFASSUNG


pdfgrep [zur Auswahl...] MUSTER [FILE...]

BESCHREIBUNG


Suchen Sie nach MUSTER in jedem FILE. MUSTER ist ein erweiterter regulärer Ausdruck.

pdfgrep funktioniert ähnlich wie grep, mit einem Unterschied: Es arbeitet auf Seiten und nicht auf Zeilen.

OPTIONAL


-i, --Fall ignorieren
Ignorieren Sie Fallunterscheidungen in beiden MUSTER und die Eingabedateien.

-F, --fixed-strings
Interpretieren MUSTER als Liste fester Zeichenfolgen, die durch Zeilenumbrüche getrennt sind, von denen jede to
abgestimmt werden.

-P, --perl-regexp
Interpretieren MUSTER als Perl-kompatibler regulärer Ausdruck (PCRE). Sehen pcresyntax(3)
für einen schnellen Überblick.

-H, --mit-Dateiname
Drucken Sie den Dateinamen für jede Übereinstimmung aus. Dies ist die Standardeinstellung, wenn mehr vorhanden sind
als eine Datei zu durchsuchen.

-h, --no-Dateiname
Unterdrücken Sie das Präfix des Dateinamens bei der Ausgabe. Dies ist die Standardeinstellung, wenn es
ist nur eine Datei zu durchsuchen.

-n, --Seitennummer
Setzen Sie jeder Übereinstimmung die Nummer der Seite voran, auf der sie gefunden wurde.

-c, --zählen
Normale Ausgabe unterdrücken. Geben Sie stattdessen die Anzahl der Übereinstimmungen für jede Eingabedatei aus. Notiz
dass im Gegensatz zu grep mehrere Übereinstimmungen auf derselben Seite einzeln gezählt werden.

-p, --Seitenzahl
Like -c, sondern druckt die Anzahl der Übereinstimmungen pro Seite.

-C, --Kontext NUM
Höchstens drucken INUM Zeichen des Kontexts um jede Übereinstimmung. Die genaue Zahl wird
variieren, weil pdfgrep versucht, Wortgrenzen zu respektieren. Wenn NUM ist "Linie", das Ganze
Zeile gedruckt wird. Wenn diese Option nicht gesetzt ist, versucht pdfgrep Zeilen zu drucken, die
nicht länger als die Klemmenbreite.

--color WENN
Umgeben Sie Dateinamen, Seitenzahlen und übereinstimmenden Text mit Escape-Sequenzen zur Anzeige
sie farbig auf dem Terminal. (Die Standardeinstellung ist Auto). WENN lassen sich:

immer
Verwenden Sie immer Farben, auch wenn stdout kein Terminal ist.

niemals
Verwenden Sie keine Farben.

Auto
Verwenden Sie Farben nur, wenn stdout ein Terminal ist.

-o, --only-matching
Drucken Sie nur den übereinstimmenden Teil einer Zeile ohne umgebenden Kontext.

-r, - rekursiv
Alle Dateien rekursiv durchsuchen (eingeschränkt durch --enthalten und --ausschließen) unter jedem
-Verzeichnis, folgen Sie Symlinks nur, wenn sie sich in der Befehlszeile befinden.

-R, --dereference-rekursiv
Das gleiche wie -r, aber folgt allen symbolischen Links.

--ausschließen=WELTWEIT
Dateien überspringen, deren Basisname übereinstimmt WELTWEIT. Sehen Klacks(7) für Platzhalter, die Sie verwenden können. Du
Sie können diese Option mehrmals verwenden, um weitere Muster auszuschließen. Es hat Vorrang vor
--enthalten. Beachten Sie, dass Ein- und Ausschlüsse nur für Dateien gelten, die über gefunden wurden - rekursiv und
nicht in die Argumentliste.

--include=WELTWEIT
Nur Dateien suchen, deren Basisname übereinstimmt WELTWEIT. Sehen --ausschließen für Details. Der Standard
is * .pdf.

--Passwort=PASSWORD
Verwenden Sie PASSWORD, um die PDF-Dateien zu entschlüsseln. Kann mehrfach angegeben werden; alle Passwörter
wird bei allen PDFs ausprobiert. Note dass dieses Passwort in Ihrem Befehl angezeigt wird
Geschichte und die Ausgabe von ps(1). Bitte verwenden Sie dies also nicht, wenn die Sicherheit von PASSWORD
ist wichtig.

-m, --max-count NUM
Beenden Sie das Lesen einer Datei nach NUM Streichhölzer. Wenn auch die Option -c oder --count verwendet wird,
pdfgrep gibt keine Anzahl größer als aus NUM.

-Z, --Null
Geben Sie ein Null-Byte aus (genannt NUL in ASCII und '\0' in C) anstelle des Doppelpunkts, der
trennt normalerweise einen Dateinamen vom Rest der Zeile. Diese Option macht die Ausgabe
eindeutig bei Vorhandensein von Doppelpunkten, Leerzeichen oder Zeilenumbrüchen im Dateinamen. Es kann sein
verwendet in Verbindung mit Befehlen wie xargs -0 or perl -0.

--match-prefix-separator September
Ändert den Doppelpunkt, der verwendet wird, um Dateiname, Zeilennummer und Text in der Ausgabe zu trennen in
September, die eine beliebige Zeichenfolge sein kann. Dies ist nützlich, wenn Dateinamen Doppelpunkte enthalten,
aber nur für interaktive Nutzung. Für die Skripterstellung, --Null sollte benutzt werden.

--debuggen
Debug-Ausgabe aktivieren. Note: Aufgrund von Einschränkungen von Poppler vor Version 0.30.0, einige
Debug-Ausgabe wird auch ohne ausgedruckt --debuggen bei Verwendung einer solchen Poppler-Version.

--warn-leer
Drucken Sie eine Warnung an stderr wenn ein PDF keinen durchsuchbaren Text enthält. Dies ist der Fall für
PDFs, die nur aus Bildern bestehen, zum Beispiel gescannte Dokumente.

--unac
Entfernen Sie Akzente und Ligaturen sowohl aus dem Suchmuster als auch aus den PDF-Dokumenten. Dies
ist nützlich, wenn Sie nach einem Wort suchen möchten, das "ae" enthält, aber das PDF verwendet das
stattdessen ein einzelnes Zeichen "æ". Sehen unac(3) und akzentfrei(1) .

Dieses zu erhalten is experimentell und einzige verfügbar if pdfgrep is kompiliert mit unac
unterstützen.

-q, --ruhig
Unterdrücken Sie alle normalen Ausgaben auf stdout. Fehler werden gedruckt und die Exit-Codes werden
zurückgegeben werden (siehe unten).

--help
Drucken Sie eine kurze Zusammenfassung der Optionen aus.

-V, --Version Versionsinformationen anzeigen.

EXIT STATUS


Normalerweise ist der Exit-Status 0, wenn mindestens eine Übereinstimmung gefunden wurde, 1, wenn keine Übereinstimmung gefunden wurde und
2 wenn ein Fehler aufgetreten ist. Aber wenn die --ruhig or -q Option verwendet wird und eine Übereinstimmung gefunden wurde,
pdfgrep gibt 0 zurück, unabhängig von Fehlern.

VARIABLEN


Das Verhalten von pdfgrep wird von der folgenden Umgebungsvariablen beeinflusst.

GREP_COLORS
Gibt die Farben und andere Attribute an, die verwendet werden, um verschiedene Teile des
Ausgang. Syntax und Werte sind wie GREP_COLORS of grep. Sehen grep(1) für mehr
Einzelheiten. Derzeit nur die Fähigkeiten mt, ms, mc, fn, ln und se werden verwendet von
pdfgrep, Wobei mt, ms und mc haben den gleichen Effekt.

Beispiele:


Print zuerst zehn Linien Abstimmung Anleitungen und drucken ihr Seite Anzahl

pdfgrep -n --max-count 10 Muster foo.pdf

Suche alle . Pdf Dateien deren Namen beginnen mit foo rekursiv in Strom Verzeichnis

pdfgrep -r --include "foo*.pdf"-Muster

Suche alle . Pdf Dateien zur Verbesserung der Gesundheitsgerechtigkeit sind kleinere als 12M rekursiv in Strom Verzeichnis

finden . -Name "*.pdf" -Größe -12M -Druck0 | xargs -0 pdfgrep-Muster

Beachten Sie, dass diese Aufgabe im Gegensatz zu den vorherigen Beispielen nicht mit gelöst werden konnte
pdfgrep allein, aber die Unix-Tools gefunden(1) und xargs(1) gebraucht werden musste. Das ist, weil
pdfgrep selbst enthält keine Optionen zum Ausschließen von Dateien nach ihrer Größe. Aber wie du siehst,
es muss nicht!

Verwenden Sie pdfgrep online mit den onworks.net-Diensten



Neueste Linux- und Windows-Online-Programme