Este es el comando djvu que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
DjVu - DjVu y DjVuLibre.
INTRODUCCIÓN
Aunque Internet nos ha proporcionado una infraestructura mundial sobre la que construir la
biblioteca universal, gran parte del conocimiento, la historia y la literatura del mundo todavía está atrapada
en papel en los sótanos de las bibliotecas tradicionales del mundo. Muchas bibliotecas y contenido
los propietarios están en proceso de digitalizar sus colecciones. Si bien muchos de esos esfuerzos
implican el minucioso proceso de convertir documentos en papel a un formato compatible con la computadora,
como los formatos basados en SGML, el alto costo de tales conversiones limita su alcance.
Escanear documentos y distribuir las imágenes resultantes electrónicamente no es solo
considerablemente más barato, pero también más fiel al documento original porque conserva
su aspecto visual.
A pesar de la rápida mejora de la velocidad de las conexiones de red y las computadoras, el número de
Las imágenes de documentos escaneados accesibles en la Web hoy en día son relativamente pequeñas. Hay varios
razones para esto.
La primera razón es el costo relativamente alto de escanear cualquier otra cosa que no sean hojas sin encuadernar.
en blanco y negro. Este problema está desapareciendo lentamente con la aparición de rápidos y bajos
cuestan escáneres en color con alimentadores de hojas.
La segunda razón es que los estándares de compresión de imágenes y los formatos de archivo establecidos desde hace mucho tiempo
han demostrado ser inadecuados para distribuir documentos escaneados en alta resolución, particularmente
documentos en color. No solo los tamaños de archivo y los tiempos de descarga son poco prácticos, la decodificación
y los tiempos de renderización también son prohibitivos. Una página de revista típica escaneada en color a 100
ppp en JPEG normalmente ocuparía de 100 KB a 200 KB, pero el texto difícilmente sería
legible: insuficiente para la visualización en pantalla y totalmente inaceptable para la impresión. Lo mismo
página a 300 ppp tendría suficiente calidad para ver e imprimir, pero el tamaño del archivo
sería de 300 KB a 1000 KB en el mejor de los casos, lo que no es práctico para el acceso remoto. Otro mayor
El problema es que una imagen en color de 300 dpi completamente decodificada de una página tamaño carta ocupa 24 MB
de memoria y provoca fácilmente el intercambio de disco.
La tercera razón es que los documentos digitales son más que una colección de datos individuales.
imágenes de la página. Las páginas de un documento escaneado tienen un orden de serie natural. Provisión especial
debe hacerse para garantizar que pasar las páginas sea instantáneo y sin esfuerzo para
mantener una buena experiencia de usuario. Aún más importante, la mayoría de los formatos de documentos existentes fuerzan
que los usuarios descarguen primero el documento completo antes de mostrar una página elegida. Sin embargo,
los usuarios a menudo quieren saltar a páginas individuales del documento sin esperar a que
documento completo para descargar. La navegación eficiente requiere un acceso aleatorio eficiente a la página,
cambio de página secuencial rápido y renderizado rápido. Esto se puede lograr con un
combinación de compresión avanzada, búsqueda previa, decodificación previa, almacenamiento en caché y progresivo
representación. DjVu descompone cada página en varios componentes (texto, fondos, imágenes,
bibliotecas de formas comunes ...) que pueden ser compartidas por varias páginas y descargadas en
demanda. Todos estos requisitos exigen un control muy sofisticado pero parsimonioso
mecanismo para manejar la descarga bajo demanda, la búsqueda previa, la decodificación, el almacenamiento en caché y
representación progresiva de las imágenes de la página. Lo que se considera aquí no es solo un
técnica de compresión de imágenes de documentos, sino una plataforma completa para la entrega de documentos.
DjVu es una técnica de compresión de imágenes, un formato de documento y una plataforma de software para
entregar imágenes de documentos a través de Internet que cumplan con los requisitos anteriores.
DJVU IMAGEN COMPRESIÓN
La compresión de imágenes DjVu se basa en tres tecnologías:
DjVuFoto
DjVuPhoto, también conocido como IW44, es una compresión de imagen de tono continuo basada en wavelets
técnica con decodificación / renderización progresiva. Se utiliza mejor para codificar fotografías
imágenes en colores o en tonos de gris. Las imágenes suelen tener la mitad del tamaño que JPEG para
misma distorsión.
DjVuBitonal
DjVuBitonal, también conocido como JB2, es una compresión de imagen bitonal que aprovecha
repeticiones de formas casi idénticas en la página (como caracteres) para
comprimir imágenes de texto. Se utiliza mejor para comprimir imágenes en blanco y negro que representan
texto y dibujos sencillos. Una página típica de 300 ppp en DjVuBitonal ocupa de 5 a 25 KB (de 3 a
8 veces mejor que TIFF-G4 o PDF).
DjVuDocumento
DjVuDocument es una técnica de compresión diseñada específicamente para documentos digitales en color.
imágenes que contienen imágenes y texto, como la página de una revista. DjVuDocument
representa imágenes en capas comprimidas por separado. La capa de primer plano suele ser
comprimido con DjVu Bitonal y contiene el texto y los dibujos. La capa de fondo es
normalmente comprimido con DjVuPhoto y contiene la textura de fondo y las imágenes en
resolución más baja.
DJVU DOCUMENTO A TODO EL MUNDO PLATAFORMA
La tecnología DjVu está diseñada desde cero para respaldar la entrega eficiente de
documentos digitales a través de Internet. Proporciona varias formas de lidiar con las
documentos y varias formas de enriquecer el contenido con hipervínculos, metadatos, búsquedas
texto, etc.
MÍMICA tipos
El formato DjVu tiene un tipo oficial de MIME de image / vnd.djvu, que es el preferido
tipo de contenido que proporcionarán los servidores http para los archivos DjVu. Tipos de mimo no oficiales utilizados
históricamente son image / x.djvu y imagen / x-djvu, que aún se puede encontrar. Idealmente,
los clientes deben estar configurados para manejar los tres. (Para obtener ayuda sobre la configuración del servidor web, consulte
http://www.djvuzone.org/support/tutorial/chapter-authoring1.html.)
liado multi página documentos
El documento DjVu de varias páginas incluido utiliza un solo archivo para representar todo el documento.
Este único archivo contiene todas las páginas, así como información complementaria (por ejemplo, la página
directorio, datos compartidos por varias páginas, miniaturas, etc.). Usar un solo formato de archivo es
muy conveniente para almacenar documentos o para enviar archivos adjuntos de correo electrónico.
Cuando escribe la URL de un documento de varias páginas, el complemento del navegador DjVu comienza a descargarse
todo el archivo, pero muestra la primera página tan pronto como esté disponible. Usted puede
navegue inmediatamente a otras páginas utilizando la barra de herramientas DjVu. Sin embargo, supongamos que el
El documento se almacena en un servidor web remoto. Puede acceder fácilmente a la primera página y ver
que este no es el documento que querías. Aunque nunca mostrarás las otras páginas
el navegador está transfiriendo datos para estas páginas y está desperdiciando el ancho de banda de su
servidor (y el ancho de banda de Internet también). También puede ver el resumen de la
documento en la primera página y saltar a la página 100. Pero la página 100 no se puede mostrar hasta que
Se han recibido los datos de las páginas 1 a 99. Puede que tenga que esperar la transmisión de
datos de página innecesarios. Este segundo problema (la espera innecesaria) se puede resolver utilizando el
Opciones de `` servicio de bytes '' del protocolo HTTP / 1.1. Esta opción tiene que ser compatible con el
servidor web, los proxies, los cachés y el navegador. Sin embargo, el servicio de bytes no resuelve
el primer problema (el desperdicio de ancho de banda).
indirecto multi página documentos
Los documentos DjVu indirectos de varias páginas resuelven ambos problemas. Un DjVu indirecto de varias páginas
El documento se compone de varios archivos. El archivo principal se denomina archivo de índice. Usted puede
navegar por un documento utilizando la URL del archivo de índice, al igual que lo hace con un paquete de
documento de página. Sin embargo, el archivo de índice es muy pequeño. Simplemente contiene el documento
directorio y las URL de los archivos secundarios que contienen los datos de la página. Cuando navegas por un
documento indirecto de varias páginas, el navegador solo accede a los datos de las páginas que está
visita. Esto se puede hacer a una velocidad razonable porque el navegador mantiene un caché de
páginas y, a veces, busca previamente unas páginas antes de la página actual. Este modelo utiliza
el ancho de banda de servicio web de forma mucho más eficaz. También elimina retrasos innecesarios
al pasar a páginas ubicadas en cualquier lugar de un documento largo.
Anotaciones
Cada imagen de DjVu incluye opcionalmente los llamados trozos de anotación. El fragmento de la anotación es
se utiliza a menudo para definir hipervínculos a otras páginas de documentos o páginas web arbitrarias.
Los fragmentos de anotaciones también se pueden utilizar para otros fines, como configurar la visualización inicial.
modo de una página, definir zonas resaltadas o almacenar metadatos arbitrarios sobre la página
o el documento.
Oculto texto
Cada imagen de DjVu incluye opcionalmente una capa de texto oculta que asocia gráficos
características con el texto correspondiente. La capa de texto oculta generalmente es generada por
ejecutando un software de reconocimiento óptico de caracteres. Esta información textual proporciona
indexar documentos DjVu y copiar / pegar texto de imágenes de página DjVu.
Miniaturas
Los documentos DjVu a veces contienen miniaturas de página precalculadas.
Esquema
Los documentos DjVu a veces contienen un fragmento de navegación que contiene un esquema, es decir, un
tabla de contenido jerárquica con punteros a las páginas del documento correspondiente.
DJVUZONA Y DJVULIBRE
La tecnología DjVu fue creada inicialmente por algunos investigadores de AT&T Labs entre 1995
y 1999. Lizardtech, Inc. ( http://www.lizardtech.com ) luego obtuvo un comercial
licencia de AT&T y continuó el desarrollo. Ahora tienen una variedad de soluciones para
producir y distribuir documentos utilizando la tecnología DjVu.
El sitio web DjVuZone ( http://www.djvuzone.org ) es administrado por los pocos laboratorios de AT&T
investigadores que crearon la tecnología DjVu en primer lugar. Promocionamos el DjVu
tecnología proporcionando una fuente independiente de información sobre DjVu.
Entendiendo el poco espacio que hay para un formato de documento propietario, Lizardtech
lanzó la biblioteca de referencia DjVu bajo la licencia pública GNU en diciembre de 2000. Este
biblioteca define completamente el formato de compresión y los códecs elementales. Seis meses
Más tarde, Lizardtech lanzó una biblioteca de referencia DjVu actualizada, así como el código fuente de
el visor de Unix.
Estas dos versiones forman la base de nuestro software DjVuLibre inicial. Modificamos el
construir un sistema para cumplir con las expectativas de la comunidad de código abierto. Varios errores
y se han solucionado los problemas de portabilidad. También intentamos que sea más fácil de usar y
instalar, conservando la estructura esencial de las versiones de Lizardtech.
El software DjVuLibre contiene los siguientes componentes:
bzz(1) Un programa de línea de comandos de compresión de uso general. Muchos datos internos de DjVu
las estructuras se comprimen utilizando esta técnica.
c44(1) Un codificador de línea de comando DjVuPhoto. Este compresor de ondas de última generación produce
Imágenes DjVuPhoto de imágenes PPM o JPEG.
cjb2(1)
Un codificador de línea de comando DjVuBitonal. Este compresor de coincidencia de patrones suaves produce
Imágenes DjVuBitonal de imágenes PBM. Puede codificar imágenes sin pérdida, o
introducir pequeños cambios para mejorar la relación de compresión. El sin pérdidas
El modo de codificación es competitivo con el de los codificadores comerciales de Lizardtech.
cpaldjvu(1)
Un codificador de línea de comandos DjVuDocument para imágenes con pocos colores. Este codificador es
muy adecuado para comprimir imágenes con una pequeña cantidad de colores distintos (p. ej.
capturas de pantalla). El color dominante está codificado por la capa de fondo. El otro
los colores están codificados por la capa de primer plano.
csepdjvu(1)
Un codificador de línea de comando DjVuDocument para imágenes separadas. Este codificador toma un
archivo que contiene imágenes de primer plano y de fondo presegmentadas y produce un
Imagen DjVuDocument.
ddjvu(1)
Un decodificador de línea de comandos para imágenes DjVu. Este programa produce una imagen PNM
que representa cualquier segmento de cualquier página de un documento DjVu en cualquier resolución.
djvista(1)
Un visor independiente de imágenes DjVu. Este visor sofisticado muestra DjVu
documentos. Implementa la navegación de documentos, así como el zoom y la panorámica rápidos.
nsdejavu(1)
Un complemento de navegador web para ver imágenes DjVu. Este pequeño complemento permite ver
Documentos DjVu de navegadores web. Utiliza internamente djview para realizar la
extra.
djvups(1)
Una herramienta de línea de comandos para convertir documentos DjVu a PostScript.
djvm(1)
Una herramienta de línea de comandos para manipular documentos DjVu de varias páginas empaquetados. Esta
El programa se utiliza a menudo para recopilar páginas individuales y producir un documento empaquetado.
djvmcvt(1)
Una herramienta de línea de comandos para convertir documentos empaquetados en documentos indirectos y
en cambio.
djvused(1)
Una poderosa herramienta de línea de comandos para manipular documentos de varias páginas, crear o
editar fragmentos de anotaciones, crear o editar capas de texto ocultas, pre-computación
imágenes en miniatura y más ...
djvutxt(1)
Una herramienta de línea de comandos para extraer el texto oculto de los documentos DjVu.
djvudump(1)
Una herramienta de línea de comandos para inspeccionar archivos DjVu y mostrar sus
estructura.
extracto de djvu(1)
Una herramienta de línea de comandos para desmontar archivos de imagen DjVu.
djvumake(1)
Una herramienta de línea de comandos para ensamblar archivos de imagen DjVu.
djvuserve(1)
Un programa CGI para generar documentos DjVu indirectos de varias páginas sobre la marcha.
djvutoxml(1) analizadordjvuxml(1)
Herramientas de línea de comandos para editar metadatos DjVu como archivos XML.
DJVU CODIFICADORES Y ANY2DJVU
DjVuLibre viene con una variedad de codificadores especializados, c44(1) para imágenes fotográficas,
cjb2(1) para imágenes bitonales y cpaldjvu(1) para imágenes con pocos colores distintos. A pesar de que
Estos codificadores funcionan bien en su dominio especializado, no pueden manejar tareas complejas.
que implica la segmentación y la codificación de varias páginas.
Los productos comerciales de Lizardtech (ver http://www.lizardtech.com/solutions/document) Puede
realizar estas complejas tareas de codificación
El servidor de compresión proporciona otra solución en (http://any2djvu.djvuzone.org).
Esta máquina utiliza codificadores prototipo pre-lizardtech de AT&T Labs y funciona casi como
así como los codificadores comerciales Lizardtech. Tenga en cuenta que la compresión Any2DjVu
servidor viene sin garantía, que no se hace nada para asegurar que sus documentos
permanecen confidenciales, y que solo hay una computadora funcionando para todo el planeta.
CRÉDITOS
Numerosas personas han contribuido al código fuente de DjVu durante los últimos cinco años.
Envíe un informe de error de sourceforge para actualizar la siguiente lista.
Yoshua Bengio, Léon Bottou, Chakradhar Chandaluri, Regis M. Chaplin, Ming Chen, Parag
Deshmukh, Royce Edwards, Andrew Erofeev, Praveen Guduru, Patrick Haffner, Paul G.
Howard, Orlando Keise, Yann Le Cun, Artem Mikheev, Florin Nicsa, Joseph M. Orost,
Steven Pigeon, Bill Riemers, Patrice Simard, Jeffery Triggs, Luc Vincent, Pascal
Vicente.
Use djvu en línea usando los servicios de onworks.net