זוהי הפקודה pdf2djvu שניתן להריץ בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS
תָכְנִית:
שֵׁם
pdf2djvu - יוצר קבצי DjVu מקובצי PDF
תַקצִיר
pdf2djvu [{-o | --תְפוּקָה} פלט-djvu-קובץ] [אוֹפְּצִיָה...] קובץ pdf...
pdf2djvu {-i | --עקיף} index-djvu-קובץ [אוֹפְּצִיָה...] קובץ pdf...
pdf2djvu {--גִרְסָה | - עזרה | -h}
תיאור
תוכנית זו יוצרת קובץ DjVu מקובץ אחד או יותר בפורמט מסמך נייד.
אפשרויות
pdf2djvu מקבל את האפשרויות הבאות:
מסמך סוג, פילה שמות
-o, --פלט=פלט-djvu-קובץ
צור מסמך מרובה עמודים מאגד. כתוב את הקובץ לתוך פלט-djvu-קובץ במקום
של תפוקה סטנדרטית.
-i, --עקיף=index-djvu-קובץ
צור מסמך עקיף מרובה עמודים. להשתמש index-djvu-קובץ כשם קובץ האינדקס;
הכניסו את קבצי הרכיבים לאותה ספרייה. הספרייה חייבת להתקיים ולהיות
ניתן לכתוב.
--page-id-template=תבנית
מציין את ערכת השמות עבור מזהי עמודים. עיין ב-"TEMPLATE LANGUAGE"
סעיף לתיאור שפת התבנית.
תבנית ברירת המחדל היא "p{page:04*}.djvu".
מסיבות ניידות, מזהי דפים:
· חייב להכיל רק אותיות ASCII קטנות, ספרות, _, +, - ונקודה,
· לא יכול להתחיל עם +, - או נקודה,
· לא יכול להכיל שתי נקודות רצופות,
· חייב להסתיים בסיומת .djvu או סיומת .djv.
--page-id-prefix=קידומת
שווה ערך ל"--page-id-template=קידומת{page:04*}.djvu".
--page-title-template=תבנית
מציין את התבנית עבור כותרות הדפים. עיין בסעיף "שפת תבנית" עבור
תיאור שפת התבנית.
תבנית ברירת המחדל היא "{תווית}".
--ללא כותרות עמודים
אל תגדיר כותרות עמודים. שווה ערך ל"--page-title-template=".
פתרון הבעיה, עמוד גודל
-d, --dpi=החלטה
מציין את הרזולוציה הרצויה ל החלטה נקודות לאינץ'. ברירת המחדל היא 300 dpi.
הטווח המותר הוא: 72 ≤ החלטה ≤ 6000.
---media-box
השתמש ב-MediaBox כדי לקבוע את גודל העמוד. CropBox משמש כברירת מחדל.
--עמוד-גודל=רוחבxגובה
מציין את גודל העמוד המועדף ל רוחב פיקסלים × גובה פיקסלים. העמוד בפועל
הגודל עשוי להשתנות כדי לכבד את יחס הגובה-רוחב ואת מגבלות ה-DjVu
פתרון הבעיה. (אפשרות זו עדיפה -d/--dpi.)
--נחש-dpi
נסה לנחש רזולוציה מקורית על ידי בדיקת תמונות מוטבעות. השתמש בזהירות.
תמונה איכות
--bg-slices=n+...+n, --bg-slices=n,...,n
מציין את איכות הקידוד של שכבת הרקע של IW44. אפשרות זו דומה ל
מה היא -פרוסה אופציה של c44. התייעץ עם c44(1) דף מדריך לפרטים. ברירת המחדל היא
72 + 11 + 10 + 10.
--bg-subsample=n
מציין את יחס תת-דגימת הרקע. ברירת המחדל היא 3. ערכים חוקיים הם
מספרים שלמים בין 1 ל-12, כולל.
--fg-colors=ברירת מחדל
נסו לשמר את כל צבעי שכבת החזית. זוהי ברירת המחדל.
--fg-colors=web
צמצם את צבעי שכבת החזית לפלטת האינטרנט (216 צבעים). אפשרות זו לא
מומלץ.
--fg-colors=n
השתמש ב-GraphicsMagick כדי להפחית את מספר הצבעים הנבדלים בשכבת החזית ל n.
ערכים חוקיים הם מספרים שלמים בין 1 ל-4080. אפשרות זו אינה מומלצת.
--fg-colors=שחור
הסר כל מידע צבע משכבת החזית.
--מונוכרום
עיבוד דפים כמפות סיביות מונוכרומיות. עם אפשרות זו, --בג-... ו --fg-... אפשרויות
לא מכבדים.
---loss-level=n
מציין את האגרסיביות של הדחיסה המאבדת. ברירת המחדל היא 0 (ללא הפסדים).
ערכים חוקיים הם מספרים שלמים בין 0 ל-200, כולל. אפשרות זו דומה ל-
-רמת הפסד אופציה של cjb2; להתייעץ עם cjb2(1) דף מדריך לפרטים. אפשרות זו
ניתן להשתמש רק אם --מונוכרום האפשרות מופעלת גם כן.
-- אובדן
מילה נרדפת ל ---loss-level=100.
--אנטי כינוי
אפשר הפחתת גופנים ווקטורים. אפשרות זו אינה מומלצת.
הפקה
--ללא מטא נתונים
אל תחלץ את המטא נתונים.
כברירת מחדל:
· נשלפים הערכים הבאים של מילון מידע המסמך: כותרת,
מחבר, נושא, יוצר, מפיק, CreationDate, ModDate. חותמות זמן הן
מעוצב לפי RFC 3999[1], עם רכיבי תאריך ושעה מופרדים על ידי א
חלל בודד.
· המטא נתונים של XMP נשלפים (או נוצרים) ומתעדכנים בהתאם.
הערות
אם צוינו מספר מסמכי קלט, נלקחים רק מטא נתונים של הראשון
בחשבון.
--מילה במילה-metadata
שמור את המטא-נתונים המקוריים ללא פגע.
--ללא קווי מתאר
אל תחלץ את מתאר המסמך.
--hyperlinks=border-avis
הפוך את גבולות ההיפר-קישורים לגלויים תמיד.
כברירת מחדל, גבול היפר-קישור גלוי רק כאשר העכבר נמצא מעל ההיפר-קישור.
--hyperlinks=#RRGGBB
כפה על צבע הגבול שצוין עבור היפר-קישורים.
--ללא היפר-קישורים, --היפר-קישורים=אין
אל תחלץ היפר-קישורים.
--אין טקסט
אל תחלץ את הטקסט.
--מילים
חלץ את הטקסט. רשמו את המיקום של כל מילה. זוהי ברירת המחדל.
--שורות
חלץ את הטקסט. רשום את המיקום של כל שורה, ולא כל מילה.
--חתוך-טקסט
אין לחלץ טקסט מחוץ לגבול העמוד.
--לא-nfkc
אין להחיל NFKC[2] נורמליזציה על הטקסט, למעט תווים מה
אלפביתי מצגת טפסים בלוק[3] (U+FB00–U+FB4F), אשר מנורמלים
ללא תנאים.
ברירת המחדל היא להחיל נורמליזציה של NFKC על כל התווים.
--פילטר-טקסט=שורת הפקודה
סנן את הטקסט דרך שורת הפקודה. המסנן שסופק חייב לשמור
רווח לבן, תווי בקרה וספרות עשרוניות.
מרמז על אפשרות זו --לא-nfkc.
-p, --עמודים=טווח דפים
מציין דפים להמרה. טווח דפים היא רשימה מופרדת בפסיקים של טווחי משנה. כל אחד
טווח משנה הוא עמוד בודד (למשל 17) או טווח רציף של עמודים
(למשל 37-42). מספרי עמודים כפולים אינם מותרים. הדפים ממוספרים מ-1.
ברירת המחדל היא להמיר את כל הדפים.
ביצוע
-j, --משרות=n
השתמש n שרשורים לביצוע המרה. ברירת המחדל היא להשתמש בשרשור אחד.
-J0, --משרות=0
קבע באופן אוטומטי בכמה שרשורים להשתמש כדי לבצע המרה.
מֶלֶל, לעזור
-v, --מִלוּלִי
הצג הודעות מידע נוספות בזמן המרת הקובץ.
-q, --שֶׁקֶט
אל תציג הודעות מידע בזמן המרת הקובץ.
--גִרְסָה
פלט מידע על גרסת ויציאה.
-h, - עזרה
הצג עזרה וצא.
הסביבה
משתני הסביבה הבאים משפיעים pdf2djvu במערכות יוניקס:
OMP_*
פרטים של התנהגות בזמן ריצה ביחס להקבלה יכולים להיות נשלטים על ידי כמה
משתני סביבה. אנא עיין ב Openmp API מפרט[4] לפרטים.
TMPDIR
pdf2djvu עושה שימוש רב בקבצים זמניים. זה יאחסן אותם בספרייה
מוגדר על ידי משתנה זה. ברירת המחדל היא /tmp.
תבנית שָׂפָה
תבנית תחביר
שפת התבנית מעוצבת באופן גס על פי פיתון מחרוזת עיצוב תחביר[5].
תבנית היא פיסת טקסט המכילה שדות, מוקפים בסוגרים מסולסלים {}. שדות
מוחלפים בערכים בפורמט מתאים כאשר התבנית מוערכת. יתר על כך,
{{ מוחלף ביחיד { ו-}} מוחלף ביחיד }.
שדה תחביר
כל שדה מורכב משם משתנה, אופציונלי ואחריו תזוזה, באופן אופציונלי
ואחריו מפרט פורמט.
ההסטה היא מספר שלם בסימן (כלומר מתחיל בתו + או -).
מפרט הפורמט מורכב מנקודתיים, ואחריו מפרט רוחב.
מפרט הרוחב הוא מספר שלם עשרוני המגדיר את רוחב השדה המינימלי. אם לא
שצוין, אז רוחב השדה ייקבע לפי התוכן. לפני הרוחב
מפרט עם תו אפס (0) מאפשר ריפוד אפס.
מפרט הרוחב מלווה באופן אופציונלי תו כוכבית (*), אשר
מגדיל את רוחב השדה המינימלי לרוחב התוכן הארוך ביותר האפשרי של
משתנה
זמין משתנים
dpage
מספר עמוד במסמך DjVu.
עמוד, spage
מספר עמוד במסמך PDF.
תווית
תווית עמוד (מספר עמוד לוגי) במסמך ה-PDF.
משתנה זה זמין רק עבור כותרות דפים.
יישום פרטים
שִׁכבָה הפרדה אַלגוֹרִיתְם
אלא אם כן ה --מונוכרום האפשרות מופעלת, pdf2djvu משתמש בהפרדת השכבות הנאיבית הבאה
אַלגוֹרִיתְם:
1. עבור כל עמוד, בצע את הפעולות הבאות:
1. רסטר את הדף ל-pixmap, באופן הרגיל.
2. רסטר את הדף ל-pixmap אחר, תוך השמטת רכיבי העמוד הבאים:
· טקסט,
· תמונות רסטר של 1 סיביות לפיקסל,
· אלמנטים וקטוריים (למעט מילוי של שטחים גדולים).
3. השווה את שתי מפות הפיקס, פיקסל אחר פיקסל:
1. אם הצבעים שלהם תואמים, סווגו את הפיקסל כחלק משכבת הרקע.
2. אחרת, סווגו את הפיקסל כחלק משכבת החזית.
חֶרֶק דיווחים
אם אתה מוצא באג ב-pdf2djvu, אנא דווח עליו בכתובת מה היא סוגיה גשש[6].
השתמש ב-pdf2djvu באינטרנט באמצעות שירותי onworks.net