АнглийскийФранцузскийИспанский

Значок OnWorks

pdf2htmlEX - Интернет в облаке

Запустите pdf2htmlEX в провайдере бесплатного хостинга OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда pdf2htmlEX, которую можно запустить в провайдере бесплатного хостинга OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


pdf2htmlEX - конвертирует PDF в HTML без потери текста и формата.

ИСПОЛЬЗОВАНИЕ


pdf2htmlEX [параметры] [ ]

ОПИСАНИЕ


pdf2htmlEX - это утилита, конвертирующая файлы PDF в файлы HTML.

pdf2htmlEX изо всех сил пытается точно отобразить PDF-файл, сохранить правильный стиль, в то время как
сохранение текста и оптимизация для Интернета.

Шрифты извлекаются из PDF, а затем встраиваются в HTML, текст - в преобразованный файл HTML.
обычно можно выбирать и копировать.

Другие объекты визуализируются как изображения и также встраиваются.

ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ


Страницы
-ф, --первая страница (Дефолт: 1)
Укажите первую страницу для обработки

-л, --Последняя страница (Дефолт: последний страница)
Укажите последнюю страницу для обработки

Габаритные размеры:
- масштаб , - подходящая ширина , - по высоте
--zoom указывает коэффициент масштабирования напрямую; --fit-width / height указывает максимум
ширина / высота страницы, значения в пикселях.

Если указано несколько значений, будет использоваться минимальное.

Если ничего не указано, страницы будут отображаться как 72DPI.

--use-урожай <0 | 1> (Дефолт: 1)
Используйте CropBox вместо MediaBox для вывода.

--hdpi , --vdpi (Дефолт: 144)
Укажите разрешение по горизонтали и вертикали для изображений

Результат
- встроить
--embed-css <0 | 1> (Дефолт: 1)
--embed-шрифт <0 | 1> (Дефолт: 1)
--embed-изображение <0 | 1> (Дефолт: 1)
--embed-javascript <0 | 1> (Дефолт: 1)
--embed-контур <0 | 1> (Дефолт: 1)
Укажите, какие элементы должны быть встроены в выходной HTML-файл.

Если этот параметр отключен, будут созданы отдельные файлы вместе с файлом HTML для
соответствующие элементы.

--embed принимает строку в качестве аргумента. Каждая буква строки должна быть одной из
cCfFiIjJoO, который соответствует одному из переключателей --embed - ***. Нижний регистр
буквы для 0 и буквы в верхнем регистре для 1. Например, `--embed cFIJo` означает
вставлять все, кроме файлов CSS и контуров.

--split-страницы <0 | 1> (Дефолт: 0)
Если этот параметр включен, содержимое каждой страницы сохраняется в отдельном файле.

Этот переключатель полезен, если вы хотите, чтобы страницы загружались отдельно и динамически -
может потребоваться поддерживающий сервер.

См. Также --page-filename.

--dest-дир (Дефолт: .)
Укажите папку назначения.

--css-имя файла (Дефолт: )
Укажите имя созданного файла css, если он не встроен.

Если он пуст, имя файла будет определено автоматически.

--page-имя_файла (Дефолт: )
Укажите шаблон имени файла для страниц, когда --split-pages равно 1

В `filename` можно включить заполнитель% d, чтобы указать, где находится номер страницы.
следует разместить. Заполнитель поддерживает ограниченное подмножество обычных числовых
заполнители, включая указанную ширину и нулевое заполнение.

Если `filename` не содержит заполнителя для номера страницы, номер страницы
будет вставлен непосредственно перед расширением файла. Если в имени файла нет
расширение, номер страницы будет помещен в конец имени файла.

Если --page-filename не указано, будет использоваться для вывода
имя файла, заменив расширение на .page и добавив непосредственно номер страницы
перед расширением.

Примеры

pdf2htmlEX --split-страницы 1 фу.pdf

Выводит файлы подкачки foo1.page, foo2.page и т. Д.

pdf2htmlEX --split-страницы 1 фу.pdf --page-имя_файла бар.баз

Выводит файлы подкачки bar1.baz, bar2.baz и т. Д.

pdf2htmlEX --split-страницы 1 фу.pdf --page-имя_файла страница% dbar.baz

Выводит файлы подкачки page1bar.baz, page2bar.baz и т. Д.

pdf2htmlEX --split-страницы 1 фу.pdf --page-имя_файла бар% 03d.baz

Выводит файлы подкачки bar001.baz, bar002.baz и т. Д.

--outline-имя-файла (Дефолт: )
Укажите имя файла сгенерированного файла схемы, если он не встроен.

Если он пуст, имя файла будет определено автоматически.

--процесс-нетекст <0 | 1> (Дефолт: 1)
Следует ли обрабатывать нетекстовые объекты (как изображения)

- схема процесса <0 | 1> (Дефолт: 1)
Показывать ли схему в сгенерированном HTML

--процесс-аннотация <0 | 1> (Дефолт: 0)
Показывать ли аннотацию в сгенерированном HTML

--процесс-форма <0 | 1> (Дефолт: 0)
Следует ли включать текстовые поля и переключатели в сгенерированный HTML

--печать <0 | 1> (Дефолт: 1)
Включите поддержку печати. Отключение этой опции может уменьшить размер CSS.

--отступать <0 | 1> (Дефолт: 0)
Вывод в резервном режиме для большей точности и совместимости с браузером, но
размер становится больше.

--tmp-file-size-limit (Дефолт: -1)
Это ограничивает общий размер (в КБ) временных файлов, что также ограничивает размер
общий размер выходного файла. Это оценка, и она остановится после страницы,
как только общий размер временных файлов превышает это число.

-1 означает отсутствие ограничения и значение по умолчанию.

шрифты
--embed-внешний-шрифт <0 | 1> (Дефолт: 1)
Укажите, должны ли локальные сопоставленные шрифты для шрифтов, не встроенных в PDF, быть
встроен в HTML.

Если этот переключатель выключен, экспортируются только имена шрифтов, так что веб-браузеры могут попробовать
чтобы сами найти правильные шрифты, и это может вызвать проблемы с неправильным шрифтом
метрики.

- font-format (Дефолт: ничего себе)
Укажите формат шрифтов, извлеченных из файла PDF.

--разложить лигатуру <0 | 1> (Дефолт: 0)
Разложите лигатуры. Например, «фи» -> «ф''и».

--авто-подсказка <0 | 1> (Дефолт: 0)
Если установлено значение 1, подсказки будут генерироваться для шрифтов с помощью FontForge.

Этому может предшествовать --external-hint-tool.

--внешний-подсказка-инструмент (Дефолт: )
Если указано, инструмент будет вызываться для улучшения хинтинга для шрифтов, это
будет предшествовать --auto-hint.

Инструмент будет называться ' ', где будет суффикс
то же, что указано для --font-format.

- растянутый-узкий-глиф <0 | 1> (Дефолт: 0)
Если установлено значение 1, глифы, более узкие, чем описано в PDF, будут растянуты; иначе
пробел будет добавлен справа от глифов

--squeeze-wide-глиф <0 | 1> (Дефолт: 1)
Если установлено значение 1, глифы шире, чем описано в PDF, будут сжаты; иначе это будет
быть усеченным.

--override-fstype <0 | 1> (Дефолт: 0)
Очистите биты fstype в шрифтах TTF / OTF.

Включите это, если Internet Explorer жалуется на «Разрешение должно быть устанавливаемым».
И у вас есть на это разрешение.

--процесс-тип3 <0 | 1> (Дефолт: 0)
Если этот параметр включен, pdf2htmlEX попытается преобразовать шрифты Type 3 так, чтобы текст можно было
изначально отображается в HTML. В противном случае будет отображаться весь текст со шрифтами Type 3.
как изображение.

Это экспериментальная функция.

Текст
- гепс , --вепс (Дефолт: 1)
Укажите максимально допустимое смещение по горизонтали / вертикали (в пикселях).

pdf2htmlEX попытается оптимизировать сгенерированный HTML-файл, перемещая текст в этом
расстояние.

--пространство-порог (Дефолт: 0.125)
pdf2htmlEX вставит пробельный символ '', если расстояние между двумя
последовательные буквы в одной строке шире, чем соотношение * font_size.

- font-size-multiplier (Дефолт: 4.0)
Многие веб-браузеры ограничивают минимальный размер шрифта, и многие округляют данный шрифт.
size, что приводит к некорректному рендерингу.

Если указать соотношение больше 1, проблема будет решена, однако она может зависнуть.
некоторые браузеры.

Однако для некоторых версий Firefox возникнет проблема, если размер шрифта
слишком велико, и в этом случае здесь следует указать меньшее значение.

- пробел как смещение <0 | 1> (Дефолт: 0)
Если установлено значение 1, символы пробела будут рассматриваться как смещения, что позволяет лучше
оптимизация.

Для файлов PDF с плохой кодировкой включение этого параметра может привести к потере
символы.

--туникод <-1 | 0 | 1> (Дефолт: 0)
Для каждого шрифта в PDF может быть предоставлена ​​карта ToUnicode, которая указывает «значение»
персонажей. Однако часто информация "ToUnicode" лучше в типе 0/1.
шрифты, а иногда и предоставленная карта ToUnicode неверна. Если это значение установлено на
1, всегда применяется карта ToUnicode, если она предоставлена ​​в PDF, и символы не могут
правильно отображать в HTML, если есть коллизии.

Если установлено значение -1, используется настроенная карта, поэтому отображение в HTML будет правильным.
(визуально то же самое), но вы можете не получить правильные символы, выбрав & скопировать &
вставить.

Если установлено значение 0, pdf2htmlEX постарается максимально сбалансировать два вышеуказанных метода.

--оптимизировать-текст <0 | 1> (Дефолт: 0)
Если установлено значение 1, pdf2htmlEX попытается уменьшить количество элементов HTML, используемых для
текст. Выключите его, если что-то пойдет не так.

--правильный текст-видимость <0 | 1> (Дефолт: 0)
Если установлено значение 1, pdf2htmlEX попытается обнаружить тексты, покрытые другой графикой и
правильно расположить их, т.е. закрытые тексты становятся прозрачными в текстовом слое, и
рисуются на фоновом слое.

проверка данных Фото товара
--bg-формат (Дефолт: png)
Укажите формат фонового изображения. Запустите `pdf2htmlEX -v`, чтобы проверить все поддерживаемые
форматов.

--svg-node-количество-лимит (Дефолт: -1)
Если количество узлов в фоновом изображении svg превышает этот предел, откатите эту страницу к
растровый фон; отрицательное значение означает отсутствие ограничения. Эта опция полезна только тогда, когда
'--bg-format svg' указан. Обратите внимание, что количество узлов в svg просто рассчитывается
примерно.

--svg-embed-битмап <0 | 1> (Дефолт: 1)
Встраивать ли растровые изображения в фоновое изображение svg. 1: вставлять растровые изображения в фон svg;
0: сбрасывать растровые изображения во внешние файлы, если это возможно.

Эта опция полезна, только если указан --bg-format svg и --embed-image.
выключен.

В настоящее время растровые изображения RGB или Gray JPEG в PDF могут быть сброшены, в то время как в других
форматы или цветовые пространства по-прежнему встроены. Если растровые изображения не выгружаются должным образом,
попробуйте предварительно обработать PDF-файл с помощью ghostscript или acrobat и убедитесь, что в нем есть растровые изображения
преобразуются в формат RGB / Gray JPEG. См. Вики проекта для получения более подробной информации.

PDF Protection
-о, --владелец-пароль
Укажите пароль владельца

-у, --пользовательский пароль
Укажите пароль пользователя

--no-drm <0 | 1> (Дефолт: 0)
Отменить настройки DRM документа

Включайте это только при наличии разрешения.

Разный
--clean-tmp <0 | 1> (Дефолт: 1)
Если он выключен, промежуточные файлы не будут очищаться.

--data-каталог (Дефолт: / usr / share / pdf2htmlEX)
Укажите папку, в которой хранится манифест и другие файлы (см. Ниже манифест
файл) `

--tmp-дир (Дефолт: / Tmp or $ TMPDIR if задавать)
Укажите временную папку, которая будет использоваться для временных файлов

--css-рисовать <0 | 1> (Дефолт: 0)
Экспериментальный и неподдерживаемый рисунок CSS

--отлаживать <0 | 1> (Дефолт: 0)
Распечатать отладочную информацию.

--доказательство <0 | 1 | 2> (Дефолт: 0)
Выведите пробную версию. Если указано положительное значение, текст отображается на обоих
текстовый слой и фоновое изображение для сравнения. Если указано 2, текст на
фон в разных цветах. Если используется фоновый формат png / jpg, более высокий
hdpi / vdpi (например, 288) рекомендуется для удобочитаемости.

Мета
-в, --версия
Распечатать информацию об авторских правах и версии

--Помогите Информация об использовании печати

МАНИФЕСТ и ДАННЫЕ-КАТАЛОГ


Когда разделение страниц равно 0, файл манифеста описывает, как должна быть окончательная страница html.
генерируется.

По умолчанию pdf2htmlEX будет использовать манифест в каталоге данных по умолчанию (запустите `pdf2htmlEX -v`
для проверки), который дает простую демонстрацию его синтаксиса.

Вы можете изменить значение по умолчанию или создать новое и указать правильный
data-dir в командной строке.

Все файлы, указанные в манифесте, должны находиться в каталоге данных.

ПРИМЕР


pdf2htmlEX /путь/к/файлу.pdf
Преобразуйте file.pdf в file.html

pdf2htmlEX --clean-tmp 0 --отлаживать 1 /путь/к/файлу.pdf
Преобразуйте file.pdf и оставьте все промежуточные файлы.

pdf2htmlEX --dest-дир внешний - встроить fi /путь/к/файлу.pdf
Преобразуйте file.pdf в out / file.html и оставьте файлы шрифтов / изображений разделенными.

АВТОРСКИЕ ПРАВА


Авторские права 2012,2013 Лу Ван[электронная почта защищена]>

pdf2htmlEX находится под лицензией GPLv3 с дополнительными условиями, подробности читайте в ЛИЦЕНЗИИ.

Используйте pdf2htmlEX онлайн с помощью сервисов onworks.net


Бесплатные серверы и рабочие станции

Скачать приложения для Windows и Linux

Команды Linux

Ad