यह कमांड pdf2htmlEX है जिसे हमारे कई मुफ़्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर में से एक का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
pdf2htmlEX - टेक्स्ट और फॉर्मेट खोए बिना पीडीएफ को एचटीएमएल में कनवर्ट करता है।
उपयोग
pdf2htmlEX [विकल्प] [ ]
वर्णन
pdf2htmlEX एक उपयोगिता है जो पीडीएफ फाइलों को एचटीएमएल फाइलों में परिवर्तित करती है।
pdf2htmlEX पीडीएफ को सटीक रूप से प्रस्तुत करने, उचित स्टाइल बनाए रखने की पूरी कोशिश करता है, जबकि
टेक्स्ट को बनाए रखना और वेब के लिए ऑप्टिमाइज़ करना।
फ़ॉन्ट्स को पीडीएफ के रूप में निकाला जाता है और फिर HTML में एम्बेड किया जाता है, परिवर्तित HTML फ़ाइल में टेक्स्ट
आमतौर पर चयन योग्य और कॉपी करने योग्य होता है।
अन्य वस्तुओं को छवियों के रूप में प्रस्तुत किया जाता है और उन्हें भी एम्बेड किया जाता है।
विकल्प
पेज
-एफ, --पहला पन्ना (चूक जाना: 1)
संसाधित करने के लिए पहला पृष्ठ निर्दिष्ट करें
-एल, --अंतिम पृष्ठ (चूक जाना: पिछली बार पेज)
संसाधित करने के लिए अंतिम पृष्ठ निर्दिष्ट करें
आयाम
--ज़ूम , --चौड़ाई पर फ़िट , --ठीक ऊंचाई
--ज़ूम सीधे ज़ूम फ़ैक्टर को निर्दिष्ट करता है; --फिट-चौड़ाई/ऊंचाई अधिकतम निर्दिष्ट करती है
किसी पृष्ठ की चौड़ाई/ऊंचाई, मान पिक्सेल में हैं।
यदि एकाधिक मान निर्दिष्ट हैं, तो न्यूनतम मान का उपयोग किया जाएगा।
यदि कोई निर्दिष्ट नहीं है, तो पृष्ठों को 72DPI के रूप में प्रस्तुत किया जाएगा।
--उपयोग-फसल बॉक्स <0|1> (चूक जाना: 1)
आउटपुट के लिए MediaBox के बजाय क्रॉपबॉक्स का उपयोग करें।
--एचडीपीआई , --vdpi (चूक जाना: 144)
छवियों के लिए क्षैतिज और लंबवत डीपीआई निर्दिष्ट करें
उत्पादन
--एम्बेड
--एम्बेड-सीएसएस <0|1> (चूक जाना: 1)
--एम्बेड-फ़ॉन्ट <0|1> (चूक जाना: 1)
--एम्बेड-छवि <0|1> (चूक जाना: 1)
--एम्बेड-जावास्क्रिप्ट <0|1> (चूक जाना: 1)
--एम्बेड-रूपरेखा <0|1> (चूक जाना: 1)
निर्दिष्ट करें कि कौन से तत्व आउटपुट HTML फ़ाइल में एम्बेड किए जाने चाहिए।
अगर स्विच ऑफ किया जाता है, तो अलग की गई फाइलें HTML फाइल के साथ-साथ जेनरेट की जाएंगी
संबंधित तत्व।
--embed एक स्ट्रिंग को तर्क के रूप में स्वीकार करता है। स्ट्रिंग का प्रत्येक अक्षर इनमें से एक होना चाहिए
`cCfFiIjJoO`, जो --embed-*** स्विच में से एक से मेल खाती है। निचला मामला
0 के लिए अक्षर और 1 के लिए अपर केस लेटर्स। उदाहरण के लिए, `--एम्बेड cFIJo` का अर्थ है to
सीएसएस फाइलों और रूपरेखाओं को छोड़कर सब कुछ एम्बेड करें।
--विभाजन-पृष्ठ <0|1> (चूक जाना: 0)
चालू होने पर, प्रत्येक पृष्ठ की सामग्री को एक अलग फ़ाइल में संग्रहीत किया जाता है।
यह स्विच उपयोगी है यदि आप चाहते हैं कि पृष्ठों को अलग से और गतिशील रूप से लोड किया जाए -- a
सहायक सर्वर आवश्यक हो सकता है।
यह भी देखें --पृष्ठ-फ़ाइल नाम।
--dest-dir (चूक जाना: .)
गंतव्य फ़ोल्डर निर्दिष्ट करें।
--css-फ़ाइलनाम (चूक जाना: )
अगर एम्बेड नहीं किया गया है, तो जेनरेट की गई css फ़ाइल का फ़ाइल नाम निर्दिष्ट करें।
यदि यह खाली है, तो फ़ाइल का नाम स्वचालित रूप से निर्धारित किया जाएगा।
--पृष्ठ-फ़ाइलनाम (चूक जाना: )
पृष्ठों के लिए फ़ाइल नाम टेम्पलेट निर्दिष्ट करें जब --split-पृष्ठ 1
एक %d प्लेसहोल्डर को `फाइलनाम` में शामिल किया जा सकता है ताकि यह इंगित किया जा सके कि पेज नंबर कहां है
रखा जाना चाहिए। प्लेसहोल्डर सामान्य संख्यात्मक के सीमित उपसमुच्चय का समर्थन करता है
निर्दिष्ट चौड़ाई और शून्य पैडिंग सहित प्लेसहोल्डर।
अगर `फ़ाइल नाम` में पेज नंबर, पेज नंबर के लिए प्लेसहोल्डर नहीं है
फ़ाइल एक्सटेंशन से पहले सीधे डाला जाएगा। यदि फ़ाइल नाम में नहीं है
एक एक्सटेंशन, पृष्ठ संख्या फ़ाइल नाम के अंत में रखी जाएगी।
यदि --पृष्ठ-फ़ाइलनाम निर्दिष्ट नहीं है, उत्पादन के लिए इस्तेमाल किया जाएगा
फ़ाइल नाम, एक्सटेंशन को .page से बदलना और सीधे पेज नंबर जोड़ना
विस्तार से पहले।
उदाहरण
pdf2htmlEX --विभाजन-पृष्ठ 1 फू.पीडीएफ
यील्ड पेज फाइल्स foo1.page, foo2.page, आदि।
pdf2htmlEX --विभाजन-पृष्ठ 1 फू.पीडीएफ --पृष्ठ-फ़ाइलनाम बार.बाज़
पैदावार पृष्ठ फ़ाइलें bar1.baz, bar2.baz, आदि।
pdf2htmlEX --विभाजन-पृष्ठ 1 फू.पीडीएफ --पृष्ठ-फ़ाइलनाम पेज%dbar.baz
पैदावार पृष्ठ फ़ाइलें page1bar.baz, page2bar.baz, आदि।
pdf2htmlEX --विभाजन-पृष्ठ 1 फू.पीडीएफ --पृष्ठ-फ़ाइलनाम बार% 03d.baz
पैदावार पृष्ठ फ़ाइलें bar001.baz, bar002.baz, आदि।
--रूपरेखा-फ़ाइलनाम (चूक जाना: )
एम्बेडेड आउटलाइन फ़ाइल का फ़ाइल नाम निर्दिष्ट करें, यदि एम्बेड नहीं किया गया है।
यदि यह खाली है, तो फ़ाइल का नाम स्वचालित रूप से निर्धारित किया जाएगा।
--प्रोसेस-नॉनटेक्स्ट <0|1> (चूक जाना: 1)
गैर-पाठ वस्तुओं को संसाधित करना है या नहीं (छवियों के रूप में)
--प्रक्रिया-रूपरेखा <0|1> (चूक जाना: 1)
जेनरेट किए गए HTML में आउटलाइन दिखाना है या नहीं
--प्रक्रिया-व्याख्या <0|1> (चूक जाना: 0)
जेनरेट किए गए HTML में एनोटेशन दिखाना है या नहीं
--प्रक्रिया-रूप <0|1> (चूक जाना: 0)
जेनरेट किए गए HTML में टेक्स्ट फ़ील्ड और रेडियो बटन शामिल करना है या नहीं
--मुद्रण <0|1> (चूक जाना: 1)
मुद्रण समर्थन सक्षम करें। इस विकल्प को अक्षम करने से CSS का आकार कम हो सकता है।
--मैदान छोड़ना <0|1> (चूक जाना: 0)
बेहतर सटीकता और ब्राउज़र संगतता के लिए फ़ॉलबैक मोड में आउटपुट, लेकिन
आकार बड़ा हो जाता है।
--tmp-फ़ाइल-आकार-सीमा (चूक जाना: -1)
यह अस्थायी फ़ाइलों के कुल आकार (केबी में) को सीमित करता है जो इसे सीमित भी करेगा
आउटपुट फ़ाइल का कुल आकार। यह एक अनुमान है और यह एक पेज के बाद रुक जाएगा,
एक बार कुल अस्थायी फ़ाइलों का आकार इस संख्या से अधिक हो जाता है।
-1 का मतलब कोई सीमा नहीं है और डिफ़ॉल्ट है।
फ़ॉन्ट्स
--एम्बेड-बाहरी-फ़ॉन्ट <0|1> (चूक जाना: 1)
निर्दिष्ट करें कि क्या स्थानीय मिलान वाले फोंट, पीडीएफ में एम्बेड नहीं किए गए फोंट के लिए होना चाहिए
एचटीएमएल में एम्बेडेड।
यदि यह स्विच बंद है, तो केवल फ़ॉन्ट नाम निर्यात किए जाते हैं ताकि वेब ब्राउज़र कोशिश कर सकें
स्वयं उचित फ़ॉन्ट खोजने के लिए, और इससे गलत फ़ॉन्ट के बारे में समस्या हो सकती है
मैट्रिक्स।
--फ़ॉन्ट-प्रारूप (चूक जाना: वोफ)
पीडीएफ फाइल से निकाले गए फोंट का प्रारूप निर्दिष्ट करें।
--अपघटन-संयुक्ताक्षर <0|1> (चूक जाना: 0)
विघटित संयुक्ताक्षर। उदाहरण के लिए 'फाई' -> 'एफ''आई'।
--ऑटो-संकेत <0|1> (चूक जाना: 0)
यदि 1 पर सेट किया जाता है, तो FontForge का उपयोग करके फ़ॉन्ट के लिए संकेत उत्पन्न होंगे।
यह --external-hint-tool से पहले हो सकता है।
--बाहरी-संकेत-उपकरण (चूक जाना: )
यदि निर्दिष्ट किया गया है, तो फोंट के लिए हिंटिंग बढ़ाने के लिए टूल को कॉल किया जाएगा, यह
पहले होगा --ऑटो-संकेत।
उपकरण के रूप में कहा जाएगा ' ', जहां प्रत्यय होगा
जैसा कि --font-format के लिए निर्दिष्ट किया गया है।
--खिंचाव-संकीर्ण ग्लिफ़ <0|1> (चूक जाना: 0)
यदि 1 पर सेट किया जाता है, तो पीडीएफ में वर्णित की तुलना में संकरे ग्लिफ़ को बढ़ाया जाएगा; अन्यथा
जगह ग्लिफ़ के दाईं ओर गद्देदार होगी
--स्क्वीज़-वाइड-ग्लिफ़ <0|1> (चूक जाना: 1)
यदि 1 पर सेट किया जाता है, तो PDF में वर्णित ग्लिफ़ से अधिक चौड़ा ग्लिफ़ निचोड़ा जाएगा; अन्यथा यह होगा
काट दिया जाए।
--ओवरराइड-fstype <0|1> (चूक जाना: 0)
टीटीएफ/ओटीएफ फोंट में fstype बिट्स को साफ़ करें।
अगर इंटरनेट एक्सप्लोरर 'अनुमति इंस्टॉल करने योग्य होना चाहिए' के बारे में शिकायत करता है तो इसे चालू करें
और आपके पास ऐसा करने की अनुमति है।
--प्रक्रिया-प्रकार3 <0|1> (चूक जाना: 0)
अगर चालू किया जाता है, तो pdf2htmlEX टाइप 3 फ़ॉन्ट्स को इस तरह कनवर्ट करने का प्रयास करेगा कि टेक्स्ट हो सकता है
HTML में मूल रूप से प्रस्तुत किया गया। अन्यथा टाइप 3 फॉन्ट वाले सभी टेक्स्ट रेंडर किए जाएंगे
छवि के रूप में।
यह सुविधा अत्यधिक प्रयोगात्मक है।
टेक्स्ट
--हेप्स , --वेप्स (चूक जाना: 1)
अधिकतम सहनीय क्षैतिज/ऊर्ध्वाधर ऑफसेट (पिक्सेल में) निर्दिष्ट करें।
pdf2htmlEX इसके भीतर उत्पन्न टेक्स्ट को स्थानांतरित करने वाली उत्पन्न HTML फ़ाइल को अनुकूलित करने का प्रयास करेगा
दूरी।
--स्पेस-दहलीज (चूक जाना: 0.125)
pdf2htmlEX यदि दो के बीच की दूरी है तो एक व्हाइटस्पेस वर्ण '' ' सम्मिलित करेगा
एक ही पंक्ति में लगातार अक्षर * font_size के अनुपात से बड़े होते हैं।
--फ़ॉन्ट-आकार-गुणक (चूक जाना: 4.0)
कई वेब ब्राउज़र न्यूनतम फ़ॉन्ट आकार को सीमित कर देते हैं, और कई दिए गए फ़ॉन्ट को गोल कर देते हैं
आकार, जिसके परिणामस्वरूप गलत प्रतिपादन होता है।
निर्दिष्ट करें कि 1 से अधिक अनुपात इस समस्या को हल करेगा, हालांकि यह स्थिर हो सकता है
कुछ ब्राउज़र।
हालाँकि, फ़ायरफ़ॉक्स के कुछ संस्करणों के लिए, फ़ॉन्ट आकार में समस्या होगी
बहुत बड़ा है, इस स्थिति में यहां एक छोटा मान निर्दिष्ट किया जाना चाहिए।
--स्पेस-एज़-ऑफ़सेट <0|1> (चूक जाना: 0)
यदि 1 पर सेट किया जाता है, तो स्पेस वर्णों को ऑफ़सेट के रूप में माना जाएगा, जो एक बेहतर . की अनुमति देता है
अनुकूलन।
खराब एन्कोडिंग वाली PDF फ़ाइलों के लिए, इस विकल्प को चालू करने से नुकसान हो सकता है
अक्षर.
--टूयूनिकोड <-1|0|1> (चूक जाना: 0)
PDF में प्रत्येक फ़ॉन्ट के लिए एक ToUnicode नक्शा प्रदान किया जा सकता है जो 'अर्थ' को इंगित करता है
पात्रों की। हालाँकि अक्सर टाइप 0/1 . में बेहतर "ToUnicode" जानकारी होती है
फोंट, और कभी-कभी प्रदान किया गया ToUnicode नक्शा गलत होता है। यदि यह मान पर सेट है
1, ToUnicode मानचित्र हमेशा लागू होता है, यदि PDF में प्रदान किया जाता है, और वर्ण नहीं हो सकते हैं
टकराव होने पर एचटीएमएल में सही ढंग से प्रस्तुत करें।
यदि -1 पर सेट किया जाता है, तो एक अनुकूलित मानचित्र का उपयोग इस प्रकार किया जाता है कि HTML में प्रतिपादन सही होगा
(नेत्रहीन रूप से समान), लेकिन हो सकता है कि आपको चुनिंदा और कॉपी करके सही वर्ण न मिलें और
पेस्ट करें।
यदि 0 पर सेट किया जाता है, तो pdf2htmlEX ऊपर दी गई दो विधियों को संतुलित करने का भरसक प्रयास करेगा।
--अनुकूलित-पाठ <0|1> (चूक जाना: 0)
यदि 1 पर सेट किया जाता है, तो pdf2htmlEX इसके लिए उपयोग किए जाने वाले HTML तत्वों की संख्या को कम करने का प्रयास करेगा
मूलपाठ। कुछ भी गलत होने पर इसे बंद कर दें।
--सही-पाठ-दृश्यता <0|1> (चूक जाना: 0)
यदि 1 पर सेट किया जाता है, तो pdf2htmlEX अन्य ग्राफ़िक्स द्वारा कवर किए गए टेक्स्ट का पता लगाने का प्रयास करेगा और
उन्हें ठीक से व्यवस्थित करें, यानी कवर किए गए टेक्स्ट को टेक्स्ट लेयर में पारदर्शी बनाया जाता है, और
पृष्ठभूमि परत पर खींचे गए हैं।
पृष्ठभूमि छवि
--bg-प्रारूप (चूक जाना: पीएनजी)
पृष्ठभूमि छवि प्रारूप निर्दिष्ट करें। सभी समर्थित की जाँच करने के लिए `pdf2htmlEX -v` चलाएँ
प्रारूपों.
--svg-नोड-गिनती-सीमा (चूक जाना: -1)
यदि किसी svg पृष्ठभूमि छवि में नोड संख्या इस सीमा से अधिक हो जाती है, तो इस पृष्ठ पर वापस आएं
बिटमैप पृष्ठभूमि; ऋणात्मक मान का अर्थ है कोई सीमा नहीं। यह विकल्प तभी उपयोगी होता है जब
'--bg-format svg' निर्दिष्ट है। ध्यान दें कि svg में नोड गणना की गणना की जाती है
लगभग।
--svg-एम्बेड-बिटमैप <0|1> (चूक जाना: 1)
svg बैकग्राउंड इमेज में बिटमैप्स एम्बेड करें या नहीं। 1: svg बैकग्राउंड में बिटमैप्स एम्बेड करें;
0: यदि संभव हो तो बिटमैप्स को बाहरी फ़ाइलों में डंप करें।
यह विकल्प केवल तभी उपयोगी होता है जब '--bg-format svg' निर्दिष्ट हो और '--embed-image'
बंद है।
वर्तमान में, पीडीएफ में आरजीबी या ग्रे जेपीईजी बिटमैप्स को डंप किया जा सकता है, जबकि अन्य में
प्रारूप या रंगस्थान अभी भी एम्बेडेड हैं। यदि बिटमैप्स को अपेक्षित रूप से डंप नहीं किया जाता है,
अपने PDF को घोस्टस्क्रिप्ट या एक्रोबैट द्वारा पूर्व-संसाधित करने का प्रयास करें और सुनिश्चित करें कि इसमें बिटमैप्स हैं
आरजीबी/ग्रे जेपीईजी प्रारूप में परिवर्तित हो जाते हैं। अधिक जानकारी के लिए प्रोजेक्ट विकी देखें।
पीडीएफ सुरक्षा
-ओ, --स्वामी-पासवर्ड
स्वामी पासवर्ड निर्दिष्ट करें
-यू, --उपयोगकर्ता पासवर्ड
उपयोगकर्ता पासवर्ड निर्दिष्ट करें
--नो-ड्रम <0|1> (चूक जाना: 0)
दस्तावेज़ DRM सेटिंग्स को ओवरराइड करें
इसे तभी चालू करें जब आपके पास अनुमति हो।
विविध.
--साफ-टीएमपी <0|1> (चूक जाना: 1)
यदि स्विच ऑफ किया जाता है, तो अंत में इंटरमीडिएट फाइलें साफ नहीं होंगी।
--डेटा-डीआईआर (चूक जाना: /usr/शेयर/pdf2htmlEX)
मेनिफेस्ट और अन्य फ़ाइलों को रखने वाले फ़ोल्डर को निर्दिष्ट करें (मेनिफेस्ट के लिए नीचे देखें
फ़ाइल) `
--tmp-दिर (चूक जाना: / Tmp or $टीएमपीडीआईआर if सेट)
अस्थायी फ़ाइलों के लिए उपयोग करने के लिए अस्थायी फ़ोल्डर निर्दिष्ट करें
--सीएसएस-ड्रा <0|1> (चूक जाना: 0)
प्रयोगात्मक और असमर्थित CSS आरेखण
- दाढ़ <0|1> (चूक जाना: 0)
डिबग जानकारी प्रिंट करें।
--सबूत <0|1|2> (चूक जाना: 0)
एक सबूत संस्करण आउटपुट करें। यदि कोई सकारात्मक मान निर्दिष्ट किया जाता है, तो दोनों पर टेक्स्ट तैयार किए जाते हैं
तुलना के लिए पाठ परत और पृष्ठभूमि छवि। यदि 2 निर्दिष्ट है, तो टेक्स्ट पर
पृष्ठभूमि विभिन्न रंगों में हैं। यदि पीएनजी/जेपीजी पृष्ठभूमि प्रारूप का उपयोग किया जाता है, तो उच्चतर
पठनीयता के लिए hdpi/vdpi (उदा. 288) की अनुशंसा की जाती है।
मेटा
-में, --संस्करण
कॉपीराइट और संस्करण जानकारी प्रिंट करें
--मदद प्रिंट उपयोग की जानकारी
MANIFEST और डेटा-डीआईआरई
जब स्प्लिट-पेज 0 होता है, तो मेनिफेस्ट फ़ाइल बताती है कि अंतिम html पेज कैसा होना चाहिए
उत्पन्न।
डिफ़ॉल्ट रूप से, pdf2htmlEX डिफ़ॉल्ट डेटा-डीआईआर में मेनिफेस्ट का उपयोग करेगा (चलें `pdf2htmlEX -v`
चेक करने के लिए), जो इसके सिंटैक्स का एक सरल डेमो देता है।
आप डिफ़ॉल्ट को संशोधित कर सकते हैं, या आप एक नया बना सकते हैं और सही निर्दिष्ट कर सकते हैं
कमांड लाइन में डेटा-डीआईआर।
मेनिफेस्ट द्वारा संदर्भित सभी फाइलें डेटा-डीआईआर में स्थित होनी चाहिए।
उदाहरण
pdf2htmlEX /पथ/से/file.pdf
file.pdf को file.html . में बदलें
pdf2htmlEX --साफ-टीएमपी 0 - दाढ़ 1 /पथ/से/file.pdf
file.pdf कन्वर्ट करें और सभी इंटरमीडिएट फाइलों को छोड़ दें।
pdf2htmlEX --dest-dir आउट --एम्बेड fi /पथ/से/file.pdf
file.pdf को out/file.html में कनवर्ट करें और फॉन्ट/इमेज फाइलों को अलग छोड़ दें।
कॉपीराइट
कॉपीराइट 2012,2013 लू वांग[ईमेल संरक्षित]>
pdf2htmlEX अतिरिक्त शर्तों के साथ GPLv3 के तहत लाइसेंस प्राप्त है, विवरण के लिए LICENSE पढ़ें।
onworks.net सेवाओं का उपयोग करके pdf2htmlEX ऑनलाइन का उपयोग करें