זוהי הפקודה pdfgrep שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS
תָכְנִית:
שֵׁם
pdfgrep - חפש ביטוי רגולרי בקבצי pdf
תַקצִיר
pdfgrep [אוֹפְּצִיָה...] תַבְנִית [קובץ...]
תיאור
חיפוש תַבְנִית בכל אחד קובץ. תַבְנִית הוא ביטוי רגולרי מורחב.
pdfgrep עובד בדומה ל-grep, עם הבחנה אחת: הוא פועל על דפים ולא על קווים.
אפשרויות
-i, --התעלם ממקרה
התעלם מהבחנות המקרים בשני המקרים תַבְנִית וקבצי הקלט.
-F, --מחרוזות קבועות
לפרש תַבְנִית כרשימה של מחרוזות קבועות מופרדות בשורות חדשות, שכל אחת מהן היא ל
להיות מותאם.
-P, --perl-regexp
לפרש תַבְנִית כביטוי רגולרי תואם Perl (PCRE). לִרְאוֹת תחביר pcre(3)
לסקירה מהירה.
-H, --עם-שם קובץ
הדפס את שם הקובץ עבור כל התאמה. זוהי הגדרת ברירת המחדל כאשר יש יותר
מקובץ אחד לחיפוש.
-h, --אין שם קובץ
דחק את הקידומת של שם הקובץ בפלט. זוהי הגדרת ברירת המחדל כאשר יש
הוא רק קובץ אחד לחיפוש.
-n, --מספר עמוד
הקדימו של כל התאמה עם מספר העמוד שבו היא נמצאה.
-c, --לספור
דיכוי פלט רגיל. במקום זאת הדפס את מספר ההתאמות עבור כל קובץ קלט. הערה
שבניגוד ל-grep, התאמות מרובות באותו עמוד ייספרו בנפרד.
-p, --ספירת עמודים
כמו -c, אך מדפיס את מספר ההתאמות לכל עמוד.
-C, --הֶקשֵׁר NUM
להדפיס לכל היותר INUM תווים של הקשר סביב כל התאמה. המספר המדויק יהיה
להשתנות, כי pdfgrep מנסה לכבד את גבולות המילים. אם NUM הוא "קו", הכל
השורה תודפס. אם אפשרות זו לא מוגדרת, pdfgrep מנסה להדפיס שורות שכן
לא יותר מרוחב הטרמינל.
--צֶבַע כאשר
הקף שמות קבצים, מספרי עמודים וטקסט תואם עם רצפי בריחה לתצוגה
אותם בצבע על הטרמינל. (הגדרת ברירת המחדל היא המכונית). כאשר יכול להיות:
תמיד
השתמש תמיד בצבעים, גם כאשר stdout אינו מסוף.
לעולם לא
אין להשתמש בצבעים.
המכונית
השתמש בצבעים רק כאשר stdout הוא מסוף.
-o, --בלבד-תואם
הדפס רק את החלק התואם של קו ללא כל הקשר מסביב.
-r, - רקורסיבי
חיפוש רקורסיבי בכל הקבצים (מוגבל על ידי --לִכלוֹל ו --לא לכלול) מתחת לכל אחד
ספרייה, עוקב אחר קישורים סימנים רק אם הם נמצאים בשורת הפקודה.
-R, --התייחסות-רקורסיבית
כמו -r, אך עוקב אחר כל הקישורים הסמליים.
--exclude=גלוב
דלג על קבצים ששם הבסיס שלהם תואם גלוב. לראות גוש(7) עבור תווים כלליים שניתן להשתמש בהם. אתה
יכול להשתמש באפשרות זו מספר פעמים כדי לא לכלול עוד דפוסים. זה מקבל עדיפות על פני
--לִכלוֹל. שים לב, כי ב-ולא כולל חלים רק על קבצים שנמצאו באמצעות - רקורסיבי ו
לא לרשימת הטיעונים.
--include=גלוב
חפש רק קבצים ששם הבסיס שלהם תואם גלוב. לראות --לא לכלול לפרטים. ברירת המחדל
is * .pdf.
--סיסמה=סיסמא
השתמש ב-PASSWORD כדי לפענח את קבצי ה-PDF. ניתן לציין מספר פעמים; כל הסיסמאות
ינוסה בכל קובצי ה-PDF. הערות שהסיסמה הזו תופיע בפקודה שלך
היסטוריה והתפוקה של ps(1). אז בבקשה אל תשתמש בזה אם האבטחה של סיסמא
חשוב.
-m, --ספירה מקסימלית NUM
תפסיק לקרוא קובץ אחרי NUM התאמות. כאשר נעשה שימוש גם באפשרות -c או --count,
pdfgrep אינו מוציא ספירה גדולה מ- NUM.
-Z, --ריק
פלט בית ריק (נקרא NUL ב-ASCII ו-'\0' ב-C) במקום המעי הגס כי
בדרך כלל מפריד שם קובץ משאר השורה. אפשרות זו עושה את הפלט
חד משמעי בנוכחות נקודתיים, רווחים או שורות חדשות בשם הקובץ. זה יכול להיות
משמש בשילוב עם פקודות כגון קסארגס -0 or פרל -0.
---match-prefix-separator ספטמבר
משנה את הנקודתיים המשמשת להפרדה בין שם הקובץ, מספר השורה והטקסט בפלט
ספטמבר, שיכולה להיות מחרוזת שרירותית. זה שימושי כאשר שמות קבצים מכילים נקודתיים,
אבל רק לשימוש אינטראקטיבי. עבור סקריפטים, --ריק יש להשתמש.
--לנפות
אפשר פלט ניפוי באגים. הערות: עקב מגבלות של poppler לפני גרסה 0.30.0, כמה
פלט באגים מודפס גם ללא --לנפות כאשר משתמשים בגרסת פופלר כזו.
--הזהיר-ריק
הדפס אזהרה ל סטדרר אם PDF אינו מכיל טקסט שניתן לחיפוש. זה המקרה של
קובצי PDF המורכבים רק מתמונות, למשל מסמכים סרוקים.
--unac
הסר הדגשים וקשרים הן מדפוס החיפוש והן ממסמכי ה-PDF. זֶה
שימושי אם ברצונך לחפש מילה המכילה "ae", אך ה-PDF משתמש ב-
במקום זאת תו בודד "æ". לִרְאוֹת unac(3) ו חסר מבטא(1) לקבלת פרטים.
זֶה אוֹפְּצִיָה is ניסיוני ו רק זמין if pdfgrep is הידור עם unac
תומכים.
-q, --שֶׁקֶט
דכא את כל הפלט הרגיל ל-stdout. שגיאות יודפסו וקודי היציאה יודפסו
יוחזר (ראה להלן).
- עזרה
הדפס סיכום קצר של האפשרויות.
-V, --גִרְסָה הצג מידע על גרסה.
יְצִיאָה סטָטוּס
בדרך כלל, מצב היציאה הוא 0 אם נמצאה לפחות התאמה אחת, 1 אם לא נמצאה התאמה ו
2 אם אירעה שגיאה. אבל אם ה --שֶׁקֶט or -q נעשה שימוש באפשרות ונמצאה התאמה,
pdfgrep יחזיר 0 ללא קשר לשגיאות.
הסביבה וריאציות
ההתנהגות של pdfgrep מושפע ממשתנה הסביבה הבא.
GREP_COLORS
מציין את הצבעים ותכונות אחרות המשמשות להדגשת חלקים שונים של
תְפוּקָה. התחביר והערכים הם כמו GREP_COLORS of grep. לראות grep(1) לעוד
פרטים. כרגע רק היכולות mt, ms, mc, fn, ln ו se משמשים
pdfgrep, שם mt, ms ו mc יש את אותה השפעה.
דוגמאות
קופונים להדפסה מה היא ראשון עשר קווים תואם דפוס ו הדפסה שֶׁלָהֶם עמוד מספר
pdfgrep -n --max-count 10 דפוס foo.pdf
חיפוש את כל . PDF קבצים של מי שמות להתחיל עם Foo רקורסיבית in מה היא נוֹכְחִי בספרייה
pdfgrep -r --include דפוס "foo*.pdf".
חיפוש את כל . PDF קבצים זֶה יש לו קטן יותר מֵאֲשֶׁר 12 מ"ר רקורסיבית in מה היא נוֹכְחִי בספרייה
למצוא . -שם "*.pdf" -גודל -12M -print0 | xargs -0 תבנית pdfgrep
שימו לב שבניגוד לדוגמאות הקודמות, לא ניתן היה לפתור את המשימה הזו עם
pdfgrep לבד, אבל כלי יוניקס למצוא(1) ו קסארגס(1) היה צריך להשתמש. זה בגלל
pdfgrep עצמו אינו כולל אפשרויות לא לכלול קבצים לפי גודלם. אבל כפי שאתה רואה,
זה לא חייב!
השתמש ב-pdfgrep באינטרנט באמצעות שירותי onworks.net