هذا هو الأمر pdf2htmlEX الذي يمكن تشغيله في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة على الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت
برنامج:
اسم
pdf2htmlEX - يحول PDF إلى HTML دون فقد النص والصيغة.
الاستعمال
pdf2htmlEX [خيارات] [ ]
الوصف
pdf2htmlEX هي أداة مساعدة تقوم بتحويل ملفات PDF إلى ملفات HTML.
يبذل pdf2htmlEX قصارى جهده لتقديم ملف PDF بدقة ، والحفاظ على الشكل المناسب ، بينما
الاحتفاظ بالنص وتحسينه للويب.
يتم استخراج الخطوط من PDF ثم يتم تضمينها في HTML ، النص في ملف HTML المحول
عادة ما يكون قابلاً للتحديد والنسخ.
يتم عرض الكائنات الأخرى على هيئة صور ويتم تضمينها أيضًا.
OPTIONS
الصفحات
-F، --الصفحة الأولى (تقصير: 1)
حدد الصفحة الأولى للمعالجة
-ل ، --آخر صفحة (تقصير: آخر الصفحة)
حدد الصفحة الأخيرة للمعالجة
الأبعاد
--تكبير و --العرض المناسب و --ارتفاع ملائم
--zoom يحدد عامل التكبير / التصغير مباشرة ؛ - تناسب العرض / الارتفاع يحدد الحد الأقصى
عرض / ارتفاع الصفحة ، القيم بالبكسل.
إذا تم تحديد قيم متعددة ، فسيتم استخدام الحد الأدنى.
إذا لم يتم تحديد أي شيء ، فسيتم تقديم الصفحات كـ 72 نقطة لكل بوصة.
--استخدام المحاصيل <0 | 1> (تقصير: 1)
استخدم CropBox بدلاً من MediaBox للإخراج.
- hdpi و - vdpi (تقصير: 144)
حدد DPI الأفقي والرأسي للصور
الناتج
- جمعة
--embed-css <0 | 1> (تقصير: 1)
- يمبيد الخط <0 | 1> (تقصير: 1)
--أجمع-الصورة <0 | 1> (تقصير: 1)
--يمبيد جافا سكريبت <0 | 1> (تقصير: 1)
--مبيد - مخطط <0 | 1> (تقصير: 1)
حدد العناصر التي يجب تضمينها في ملف HTML الناتج.
إذا تم إيقاف التشغيل ، فسيتم إنشاء ملفات منفصلة مع ملف HTML لملف
العناصر المقابلة.
- يقبلembed سلسلة نصية كوسيطة. يجب أن يكون كل حرف في السلسلة واحدًا من
"cCfFiIjJoO" ، والذي يتوافق مع أحد مفاتيح التبديل --embed - ***. أحرف صغيرة
أحرف لـ 0 وأحرف كبيرة لـ 1. على سبيل المثال ، `--embed cFIJo` تعني to
تضمين كل شيء ما عدا ملفات CSS والمخططات التفصيلية.
- تقسيم الصفحات <0 | 1> (تقصير: 0)
إذا تم تشغيله ، يتم تخزين محتوى كل صفحة في ملف منفصل.
يكون رمز التبديل هذا مفيدًا إذا كنت تريد تحميل الصفحات بشكل منفصل وديناميكي - أ
قد يكون من الضروري دعم الخادم.
راجع أيضًا اسم ملف - صفحة.
- ديست دير (تقصير: .)
حدد مجلد الوجهة.
--css- اسم الملف (تقصير: )
حدد اسم ملف ملف css الذي تم إنشاؤه ، إذا لم يكن مدمجًا.
إذا كان فارغًا ، فسيتم تحديد اسم الملف تلقائيًا.
--اسم ملف الصفحة (تقصير: )
حدد قالب اسم الملف للصفحات عندما تكون --split-pages هي 1
يمكن تضمين عنصر نائب٪ d في "اسم الملف" للإشارة إلى مكان رقم الصفحة
يجب وضعها. يدعم العنصر النائب مجموعة فرعية محدودة من العددي العادي
العناصر النائبة ، بما في ذلك العرض المحدد والمساحة الصفرية.
إذا كان "اسم الملف" لا يحتوي على عنصر نائب لرقم الصفحة ، رقم الصفحة
مباشرة قبل امتداد الملف. إذا لم يكن اسم الملف
امتدادًا ، سيتم وضع رقم الصفحة في نهاية اسم الملف.
إذا لم يتم تحديد --page-filename ، سيتم استخدامها للإخراج
filename ، مع استبدال الامتداد بـ .page وإضافة رقم الصفحة مباشرة
قبل التمديد.
أمثلة
pdf2htmlEX - تقسيم الصفحات 1 foo.pdf
إنتاج ملفات الصفحات foo1.page و foo2.page وما إلى ذلك.
pdf2htmlEX - تقسيم الصفحات 1 foo.pdf --اسم ملف الصفحة بار باز
إنتاجية ملفات الصفحة bar1.baz ، bar2.baz ، إلخ.
pdf2htmlEX - تقسيم الصفحات 1 foo.pdf --اسم ملف الصفحة الصفحة٪ dbar.baz
نتائج صفحة الملفات page1bar.baz ، page2bar.baz ، إلخ.
pdf2htmlEX - تقسيم الصفحات 1 foo.pdf --اسم ملف الصفحة شريط٪ 03d.baz
إنتاجية ملفات الصفحة bar001.baz ، bar002.baz ، إلخ.
- اسم ملف تفصيلي (تقصير: )
حدد اسم الملف لملف المخطط التفصيلي الذي تم إنشاؤه ، إذا لم يكن مدمجًا.
إذا كان فارغًا ، فسيتم تحديد اسم الملف تلقائيًا.
- عملية غير نصية <0 | 1> (تقصير: 1)
ما إذا كان سيتم معالجة الكائنات غير النصية (كصور)
- مخطط العملية <0 | 1> (تقصير: 1)
ما إذا كان سيتم إظهار المخطط التفصيلي في HTML الذي تم إنشاؤه
- شرح العملية <0 | 1> (تقصير: 0)
ما إذا كان سيتم إظهار التعليق التوضيحي في HTML الذي تم إنشاؤه أم لا
- شكل العملية <0 | 1> (تقصير: 0)
ما إذا كان سيتم تضمين الحقول النصية وأزرار الاختيار في HTML الذي تم إنشاؤه
- طباعة <0 | 1> (تقصير: 1)
تمكين دعم الطباعة. قد يؤدي تعطيل هذا الخيار إلى تقليل حجم CSS.
--تراجع <0 | 1> (تقصير: 0)
الإخراج في الوضع الاحتياطي ، من أجل دقة أفضل وتوافق مع المتصفح ، ولكن
يصبح الحجم أكبر.
- tmp-file-size-limit (تقصير: -1)
هذا يحد من الحجم الإجمالي (بالكيلوبايت) للملفات المؤقتة والذي سيحد أيضًا من
الحجم الإجمالي لملف الإخراج. هذا تقدير وسيتوقف بعد صفحة ،
بمجرد أن يصبح الحجم الإجمالي للملفات المؤقتة أكبر من هذا الرقم.
-1 يعني عدم وجود حد وهو الافتراضي.
الخطوط
--مبيد - خارجي - الخط <0 | 1> (تقصير: 1)
حدد ما إذا كانت الخطوط المطابقة المحلية ، للخطوط غير المضمنة في PDF ، يجب أن تكون كذلك
مضمن في HTML.
إذا كان هذا التبديل في وضع إيقاف التشغيل ، فسيتم تصدير أسماء الخطوط فقط بحيث تحاول متصفحات الويب ذلك
للعثور على الخطوط المناسبة بأنفسهم ، وقد يتسبب ذلك في حدوث مشكلات تتعلق بالخط غير الصحيح
المقاييس.
- شكل خط (تقصير: ووف)
حدد تنسيق الخطوط المستخرجة من ملف PDF.
- تفكيك - ضمد <0 | 1> (تقصير: 0)
تحلل الحروف المركبة. على سبيل المثال "fi" -> "f" i ".
- تلميح تلقائي <0 | 1> (تقصير: 0)
في حالة الضبط على 1 ، سيتم إنشاء تلميحات للخطوط باستخدام FontForge.
قد يسبق ذلك --external-hint-tool.
--أداة تلميح خارجية (تقصير: )
إذا تم تحديد الأداة ، فسيتم استدعاء الأداة من أجل تحسين تلميح الخطوط ، هذا
سوف تسبق - تلميح تلقائي.
ستسمى الأداة باسم " ، حيث ستكون اللاحقة
هو نفسه المحدد لـ - تنسيق الخط.
- تمدد-ضيق-رسومي <0 | 1> (تقصير: 0)
إذا تم الضبط على 1 ، فإن الحروف الرسومية أضيق مما هو موصوف في PDF سيتم تمديدها ؛ خلاف ذلك
الفضاء سوف يكون مبطن على يمين الحروف الرسومية
- اضغط على رسومي عريض <0 | 1> (تقصير: 1)
إذا تم ضبطه على 1 ، سيتم ضغط الحروف الرسومية الأعرض من الوصف في PDF ؛ وإلا فإنه سوف
يتم اقتطاعها.
--override-fstype <0 | 1> (تقصير: 0)
امسح بتات fstype في خطوط TTF / OTF.
قم بتشغيل هذا إذا اشتكى Internet Explorer من "يجب أن يكون الإذن قابلاً للتثبيت"
ولديك إذن للقيام بذلك.
- نوع العملية 3 <0 | 1> (تقصير: 0)
إذا تم تشغيله ، سيحاول pdf2htmlEX تحويل خطوط Type 3 بحيث يمكن أن يكون هذا النص
يتم تقديمها في الأصل بتنسيق HTML. وإلا فسيتم تقديم كل النص الذي يحتوي على خطوط Type 3
كصورة.
هذه الميزة تجريبية للغاية.
نص
- صغار و --veps (تقصير: 1)
حدد الحد الأقصى المسموح به للإزاحة الأفقية / الرأسية (بالبكسل).
سيحاول pdf2htmlEX تحسين ملف HTML الذي تم إنشاؤه لنقل النص داخل هذا
مسافه: بعد.
- عتبة المسافة (تقصير: 0.125)
سيقوم pdf2htmlEX بإدراج حرف مسافة بيضاء "" إذا كانت المسافة بين اثنين
الأحرف المتتالية في نفس السطر أعرض من النسبة * font_size.
--مضاعف حجم الخط (تقصير: 4.0)
تحد العديد من متصفحات الويب من الحد الأدنى لحجم الخط ، ويقوم العديد بتقريب الخط المحدد
الحجم ، مما يؤدي إلى عرض غير صحيح.
تحديد نسبة أكبر من 1 من شأنه حل هذه المشكلة ، ومع ذلك قد يتم تجميدها
بعض المتصفحات.
ومع ذلك ، بالنسبة لبعض إصدارات Firefox ، ستكون هناك مشكلة عند حجم الخط
كبير جدًا ، وفي هذه الحالة يجب تحديد قيمة أصغر هنا.
- المسافة كإزاحة <0 | 1> (تقصير: 0)
إذا تم التعيين على 1 ، فسيتم التعامل مع أحرف المسافات على أنها إزاحات ، مما يسمح بامتداد
الاقوي.
بالنسبة لملفات PDF ذات الترميزات السيئة ، قد يؤدي تشغيل هذا الخيار إلى فقدان ملفات
حرفا.
--tounicode <-1 | 0 | 1> (تقصير: 0)
يمكن توفير خريطة ToUnicode لكل خط في PDF والتي تشير إلى "المعنى"
من الشخصيات. ومع ذلك ، غالبًا ما توجد معلومات "ToUnicode" أفضل في النوع 0/1
الخطوط ، وأحيانًا تكون خريطة ToUnicode المقدمة خاطئة. إذا تم تعيين هذه القيمة على
1 ، يتم دائمًا تطبيق خريطة ToUnicode ، إذا تم توفيرها في PDF ، وقد لا يتم تطبيق الأحرف
التقديم بشكل صحيح في HTML إذا كان هناك تضارب.
إذا تم الضبط على -1 ، فسيتم استخدام خريطة مخصصة بحيث يكون التقديم صحيحًا في HTML
(نفس الشيء من الناحية المرئية) ، ولكن قد لا تحصل على الأحرف الصحيحة عن طريق التحديد والنسخ &
معجون.
إذا تم الضبط على 0 ، فإن pdf2htmlEX سيبذل قصارى جهده لتحقيق التوازن بين الطريقتين المذكورتين أعلاه.
- تحسين النص <0 | 1> (تقصير: 0)
إذا تم الضبط على 1 ، سيحاول pdf2htmlEX تقليل عدد عناصر HTML المستخدمة
نص. قم بإيقاف تشغيله إذا حدث خطأ ما.
- رؤية النص الصحيح <0 | 1> (تقصير: 0)
إذا تم الضبط على 1 ، سيحاول pdf2htmlEX اكتشاف النصوص التي تغطيها رسومات أخرى وملفات
رتبهم بشكل صحيح ، أي أن النصوص المغطاة شفافة في طبقة النص ، و
يتم رسمها على طبقة الخلفية.
خلفيّة صورة
--bg- شكل (تقصير: بي إن جي)
حدد تنسيق صورة الخلفية. قم بتشغيل `pdf2htmlEX -v` للتحقق من جميع الملفات المدعومة
الأشكال.
--svg-node-count-limit (تقصير: -1)
إذا تجاوز عدد العقد في صورة خلفية svg هذا الحد ، فارجع إلى هذه الصفحة
خلفية الصورة النقطية القيمة السالبة تعني عدم وجود حد. هذا الخيار مفيد فقط عندما
تم تحديد "--bg-format svg". لاحظ أنه يتم حساب عدد العقد في svg فقط
تقريبا.
--svg-embed-bitmap <0 | 1> (تقصير: 1)
سواء تم تضمين الصور النقطية في صورة الخلفية بتنسيق svg. 1: تضمين الصور النقطية في خلفية svg ؛
0: تفريغ الصور النقطية إلى الملفات الخارجية إن أمكن.
يكون هذا الخيار مفيدًا فقط عند تحديد "--bg-format svg" و "--embed-image"
مغلق.
حاليًا ، يمكن التخلص من الصور النقطية بتنسيق RGB أو Gray JPEG في ملف PDF ، بينما يمكن التخلص من الصور النقطية الموجودة في ملفات أخرى
التنسيقات أو مساحات الألوان لا تزال مضمنة. إذا لم يتم إغراق الصور النقطية كما هو متوقع ،
جرب المعالجة المسبقة لملف PDF الخاص بك عن طريق ghostscript أو acrobat وتأكد من وجود الصور النقطية فيه
إلى تنسيق RGB / Gray JPEG. انظر ويكي المشروع لمزيد من التفاصيل.
PDF حماية
-o ، - مالك كلمة المرور
حدد كلمة مرور المالك
-u ، - كلمة مرور المستخدم
حدد كلمة مرور المستخدم
--لا درم <0 | 1> (تقصير: 0)
تجاوز إعدادات DRM الخاصة بالوثيقة
قم بتشغيل هذا فقط عندما يكون لديك إذن.
الباقي
--clean-tmp <0 | 1> (تقصير: 1)
إذا تم إيقاف تشغيله ، فلن يتم تنظيف الملفات الوسيطة في النهاية.
--data- دير (تقصير: / usr / share / pdf2htmlEX)
حدد المجلد الذي يحتوي على البيان والملفات الأخرى (انظر أدناه للاطلاع على البيان
ملف) `
--تمب دير (تقصير: / تمة or تمبدير $ if جلس)
حدد المجلد المؤقت لاستخدامه مع الملفات المؤقتة
--css- رسم <0 | 1> (تقصير: 0)
رسم CSS تجريبي وغير مدعوم
--Debug <0 | 1> (تقصير: 0)
طباعة معلومات التصحيح.
--دليل <0 | 1 | 2> (تقصير: 0)
إخراج نسخة تجريبية. إذا تم تحديد قيمة موجبة ، يتم رسم النصوص على كليهما
طبقة النص وصورة الخلفية للمقارنة. إذا تم تحديد 2 ، فسيتم تشغيل النصوص
الخلفية بألوان مختلفة. إذا تم استخدام تنسيق الخلفية png / jpg ، فإن تنسيق أعلى
يوصى باستخدام hdpi / vdpi (على سبيل المثال 288) من أجل الوضوح.
مييتااا
-الخامس، --الإصدار
طباعة معلومات حقوق النشر والإصدار
--مساعدة طباعة معلومات الاستخدام
قائمة داتا-دير
عندما تكون الصفحات المقسمة تساوي 0 ، يصف ملف البيان كيف يجب أن تكون صفحة html النهائية
ولدت.
بشكل افتراضي ، سيستخدم pdf2htmlEX البيان في data-dir الافتراضي (تشغيل `pdf2htmlEX -v`
للتحقق) ، والذي يعطي عرضًا توضيحيًا بسيطًا لصياغته.
يمكنك تعديل الافتراضي ، أو يمكنك إنشاء واحدة جديدة وتحديد الصحيح
البيانات- دير في سطر الأوامر.
يجب أن تكون جميع الملفات المشار إليها بواسطة البيان موجودة في data-dir.
مثال
pdf2htmlEX /المسار/إلى/file.pdf
تحويل file.pdf إلى file.html
pdf2htmlEX --clean-tmp 0 --Debug 1 /المسار/إلى/file.pdf
قم بتحويل file.pdf واترك جميع الملفات الوسيطة.
pdf2htmlEX - ديست دير خارج - جمعة fi /المسار/إلى/file.pdf
قم بتحويل file.pdf إلى out / file.html واترك ملفات الخطوط / الصور مفصولة.
حقوق الطبع والنشر
حقوق النشر 2012,2013،XNUMX لو وانغ[البريد الإلكتروني محمي]>
تم ترخيص pdf2htmlEX بموجب GPLv3 بشروط إضافية ، اقرأ LICENSE للحصول على التفاصيل.
استخدم pdf2htmlEX عبر الإنترنت باستخدام خدمات onworks.net