Это команда hocr2djvused, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
hocr2djvused - hOCR для djvused конвертер скриптов
СИНТАКСИС
hocr2djvused [вариант...] [hocr-файл...]
ОПИСАНИЕ
hocr2djvused читает один или несколько HOCR[1] файлы (созданные ОКРопус[2] или клинопись[3] или
Тессеракт[4]) и преобразует их в djvused скрипты.
Если имя файла явно не указано в командной строке, hOCR считывается из
стандартный ввод.
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
Текст сегментация кредита
-t линий, --Детали линий
Запишите расположение каждой строки. Не записывайте расположение определенных слов или
символы.
-t слова, --details = слова
Запишите расположение каждой строки и каждого слова. Не записывайте местоположения определенных
символы.
Это значение по умолчанию.
-t символы, --details = символы
Запишите расположение каждой строки, каждого слова и каждого символа.
--word-segmentation = простой
Считайте каждую непустую последовательность непробельных символов одним словом.
Это значение по умолчанию, несмотря на то, что оно неверно с лингвистической точки зрения.
--word-segmentation = uax29
Использовать Unicode Текст Сегментация[5] алгоритм разбиения строк на слова.
Эта опция нарушает предположения некоторых инструментов DjVu о том, что слова разделяются пробелами,
и поэтому это не рекомендуется.
Другой кредита
--rotation =n
Предположим, что страницы DjVu повернуты n градусов.
--page-size =ширинаxвысота
Указывает, что размер страницы ширина пикселей × высота пиксели.
Эта опция необходима для hOCR, сгенерированного клинописью (<0.8) и лишних
в противном случае.
--html5
Использовать HTML5 синтаксический анализатор[6], который более надежен, но медленнее, чем синтаксический анализатор по умолчанию.
--fix-utf8
Попытка исправить проблемы с кодировкой UTF-8 и устранить нежелательные управляющие символы.
Эта опция может быть необходима для hOCR, генерируемого Cuneiform [7] или Tesseract [8].
--версия
Вывести информацию о версии и выйти.
-h, --Помогите
Показать справку и выйти.
Используйте hocr2djvused онлайн с помощью сервисов onworks.net