Este es el comando djvuxml que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
djvutoxml, djvuxmlparser - Herramientas XML DjVuLibre.
SINOPSIS
djvutoxml [opciones] entradadjvufile [archivo xml de salida]
analizadordjvuxml [ -o archivodjvu ] archivo xml de entrada
DESCRIPCIÓN
Las herramientas DjVuLibre XML permiten editar los metadatos, los hipervínculos y el texto oculto.
asociado con archivos DjVu. diferente a djvused(1) las herramientas XML DjVuLibre se basan en XML
tecnología y puede aprovechar los editores y verificadores XML.
DJVUTOXML
Programa djvutoxml crea un archivo XML archivo xml de salida que contiene una referencia al original
Documento DjVu entradadjvufile así como etiquetas que describen los metadatos, hipervínculos y
texto oculto asociado con el archivo DjVu.
Se admiten las siguientes opciones:
--página número de página
Seleccione una página en un documento de varias páginas. Sin esta opción, djvutoxml da salida al
XML correspondiente a todas las páginas del documento.
--con texto
Especifica el EXTRACTO OCULTO El elemento de cada página debe incluirse en la salida.
Si se especifica sin el --con-anno bandera entonces la --sin-anno está implícito. Si
ninguno de los --con texto, --sin texto, --con-anno, or --sin-anno, las banderas son
especificado, entonces el --con texto y --con-anno las banderas están implícitas.
--sin texto
Especifica no generar el EXTRACTO OCULTO elemento para cada página. Si se especifica sin
los --sin-anno bandera entonces la --con-anno la bandera está implícita.
--con-anno
Especifica el área MAPA El elemento de cada página debe incluirse en la salida. Si
especificado sin el --con texto bandera entonces la --sin texto la bandera está implícita.
--sin-anno
Especifica el área MAPA El elemento de cada página no debe incluirse en la salida.
Si se especifica sin el --sin texto bandera entonces la --con texto la bandera está implícita.
DJVUXMLPARSER
Archivos producidos por djvutoxml luego se puede modificar utilizando un editor de texto o un XML
editor. Programa analizadordjvuxml analiza el archivo XML archivo xml de entrada para modificar el
metadatos del archivo DjVu correspondiente.
-o archivodjvu
En principio, el archivo DjVu de destino es el archivo al que hace referencia el OBJETO elemento de
el archivo XML. Esta opción proporciona los medios para anular el nombre de archivo especificado en
los OBJETO .
DJVUXML DOCUMENTO TIPO DEFINICIÓN
El archivo de definición de tipo de documento (DTD)
/usr/share/djvu/pubtext/DjVuXML-s.dtd
define la entrada y salida de las herramientas DjVu XML.
El DTD DjVuXML-s es una simplificación del DTD HTML:
http://www.w3c.org/TR/1998/REC-html40-19980424/sgml/dtd.html
con algunos atributos nuevos agregados específicos para DjVu. Cada una de las páginas especificadas de un DjVu
el documento se representa como OBJETO elementos dentro del CUERPO elemento del archivo XML. Cada
OBJETO el elemento puede contener múltiples PARAM elementos para especificar atributos como el nombre de la página,
resolución y factor gamma. Cada OBJETO el elemento también puede contener uno TEXTO OCULTO
elemento para especificar el texto oculto (generalmente generado con un motor OCR) dentro de DjVu
página. Además cada OBJETO el elemento puede hacer referencia a un área única MAPA elemento que
contiene múltiples Reservada elementos para representar todos los hipervínculos y resaltar áreas dentro
el documento DjVu.
PARAM Elements
Legal PARAM elementos de un DjVu OBJETO incluyen pero no se limitan a PÁGINA para especificar
el nombre de la página, GAMA para especificar el factor de corrección gamma (normalmente 2.2), y DPI
para especificar la resolución de la página.
EXTRACTO OCULTO Elements
El EXTRACTO OCULTO elementos consta de elementos anidados de COLUMNAS DE PAGINA, REGIÓN, PÁRRAFO,
LÍNEA, y PALABRA. El elemento especificado más profundamente anidado, debe especificar el límite
coordenadas del elemento en orientación de arriba hacia abajo. El cuerpo de los más profundamente anidados
El elemento debe contener el texto. La mayoría de los documentos DjVu utilizan LÍNEA or WORD como el
elemento de nivel más bajo, pero cualquier elemento es legal como elemento de nivel más bajo. Un espacio en blanco
siempre se agrega entre WORD elementos y siempre se agrega un salto de línea entre LÍNEA
elementos. Dado que idiomas como el japonés no utilizan espacios entre palabras, es bastante
común para el uso de motores de OCR asiáticos WORD como personajes en su lugar.
MAPA Elements
El cuerpo de la MAPA los elementos consisten en Reservada elementos. Además de los atributos
enumerado en
http://www.w3.org/TR/1998/REC-html40-19980424/struct/objects.html# edef-AREA,
los atributos tipo de borde, color del borde, fronteray destacar se han agregado para especificar
tipo de borde, color de borde, ancho de borde y colores de resaltado respectivamente. Valores legales
para cada uno de estos atributos se enumeran en el DTD DjVuXML-s. Además, la forma oval
se ha agregado a la lista legal de formas. Un óvalo usa un cuadro delimitador rectangular.
Use djvuxml en línea usando los servicios de onworks.net