djvuxmlparser - Trực tuyến trên đám mây

Đây là lệnh djvuxmlparser có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


djvutoxml, djvuxmlparser - Công cụ XML DjVuLibre.

SYNOPSIS


djvutoxml [lựa chọn] đầu vàodjvufile [đầu raxmlfile]
djvuxmlparser [ -o tập tin djvu ] đầu vàoxmlfile

MÔ TẢ


Công cụ XML DjVuLibre cung cấp để chỉnh sửa siêu dữ liệu, siêu liên kết và văn bản ẩn
được liên kết với các tệp DjVu. không giống djvuse(1) Công cụ XML DjVuLibre dựa trên XML
công nghệ và có thể tận dụng các trình soạn thảo và trình xác minh XML.

DJVUTOXML


chương trình djvutoxml tạo một tệp XML đầu raxmlfile chứa một tham chiếu đến bản gốc
Tài liệu DjVu đầu vàodjvufile cũng như các thẻ mô tả siêu dữ liệu, siêu liên kết và
văn bản ẩn được liên kết với tệp DjVu.

Các tùy chọn sau được hỗ trợ:

--trang số trang
Chọn một trang trong tài liệu nhiều trang. Nếu không có tùy chọn này, djvutoxml xuất ra
XML tương ứng với tất cả các trang của tài liệu.

--có văn bản
Chỉ định VĂN BẢN BỊ ẨN phần tử cho mỗi trang phải được đưa vào đầu ra.
Nếu được chỉ định mà không có --with-bực cờ sau đó - không cần thông báo được ngụ ý. Nếu như
không ai trong số --với-văn bản, - không có văn bản, --with-bực, or --without-bực, cờ là
được chỉ định, sau đó --có văn bản--with-bực cờ được ngụ ý.

--không có văn bản
Chỉ định không xuất ra VĂN BẢN BỊ ẨN cho mỗi trang. Nếu được chỉ định mà không có
các - không cần thông báo cờ sau đó --with-bực cờ được ngụ ý.

--with-bực
Chỉ định khu vực MAP phần tử cho mỗi trang phải được đưa vào đầu ra. Nếu như
được chỉ định mà không có --có văn bản cờ sau đó --không có văn bản cờ được ngụ ý.

- không cần thông báo
Chỉ định khu vực MAP phần tử cho mỗi trang không nên được đưa vào đầu ra.
Nếu được chỉ định mà không có --không có văn bản cờ sau đó --có văn bản cờ được ngụ ý.

DJVUXMLPARSER


Tệp do djvutoxml sau đó có thể được sửa đổi bằng cách sử dụng trình soạn thảo văn bản hoặc XML
người biên tập. Chương trình djvuxmlparser phân tích cú pháp tệp XML đầu vàoxmlfile để sửa đổi
siêu dữ liệu của tệp DjVu tương ứng.

-o tập tin djvu
Về nguyên tắc, tệp DjVu đích là tệp được tham chiếu bởi VẬT một yếu tố của
tệp XML. Tùy chọn này cung cấp phương tiện để ghi đè tên tệp được chỉ định trong
các VẬT thành phần.

DJVUXML TÀI LIỆU LOẠI ĐỊNH NGHĨA


Tệp định nghĩa loại tài liệu (DTD)

/usr/share/djvu/pubtext/DjVuXML-s.dtd

xác định đầu vào và đầu ra của các công cụ DjVu XML.

DjVuXML-s DTD là sự đơn giản hóa của HTML DTD:

http://www.w3c.org/TR/1998/REC-html40-19980424/sgml/dtd.html

với một vài thuộc tính mới được thêm vào dành riêng cho DjVu. Mỗi trang được chỉ định của DjVu
tài liệu được đại diện là VẬT các yếu tố trong BODY phần tử của tệp XML. Mỗi
VẬT phần tử có thể chứa nhiều THÔNG SỐ các phần tử để chỉ định các thuộc tính như tên trang,
độ phân giải và hệ số gamma. Mỗi VẬT phần tử cũng có thể chứa một ẨN VĂN BẢN
phần tử để chỉ định văn bản ẩn (thường được tạo bằng công cụ OCR) trong DjVu
trang. Ngoài ra mỗi VẬT phần tử có thể tham chiếu đến một khu vực duy nhất MAP yếu tố nào
chứa nhiều KHU VỰC các phần tử để đại diện cho tất cả các khu vực siêu kết nối và đánh dấu bên trong
tài liệu DjVu.

THÔNG SỐ Các yếu tố
Chính sách THÔNG SỐ các phần tử của DjVu VẬT bao gồm nhưng không giới hạn ở TRANG để xác định
tên trang, GAMMA để chỉ định hệ số hiệu chỉnh gamma (thường là 2.2) và Sở KH & ĐT
để chỉ định độ phân giải trang.

VĂN BẢN BỊ ẨN Các yếu tố
Sản phẩm VĂN BẢN BỊ ẨN phần tử bao gồm các phần tử lồng nhau của CỘT TRANG, KHU VỰC, ĐOẠN VĂN,
HÀNG,WORD. Phần tử lồng nhau sâu nhất được chỉ định, phải chỉ định giới hạn
tọa độ của phần tử theo hướng từ trên xuống. Cơ thể của tổ ấm sâu nhất
phần tử phải chứa văn bản. Hầu hết các tài liệu DjVu sử dụng ĐƯỜNG DÂY or WORD như
phần tử cấp thấp nhất, nhưng bất kỳ phần tử nào cũng hợp pháp là phần tử cấp thấp nhất. Một khoảng trắng
luôn được thêm vào giữa WORD các phần tử và nguồn cấp dữ liệu dòng luôn được thêm vào giữa ĐƯỜNG DÂY
các yếu tố. Vì các ngôn ngữ như tiếng Nhật không sử dụng dấu cách giữa các từ, nó khá
phổ biến cho các động cơ OCR Châu Á sử dụng WORD thay vào đó là các ký tự.

MAP Các yếu tố
Cơ thể của MAP các yếu tố bao gồm KHU VỰC các yếu tố. Ngoài các thuộc tính
được liệt kê trong

http://www.w3.org/TR/1998/REC-html40-19980424/struct/objects.html# edef-VÙNG,

các thuộc tính kiểu biên giới, màu viền, biên giớilàm nổi bật đã được thêm vào để chỉ định
loại đường viền, màu đường viền, độ rộng đường viền và màu tô sáng tương ứng. Giá trị pháp lý
cho mỗi thuộc tính này được liệt kê trong DjVuXML-s DTD. Ngoài ra, hình dạng hình trái xoan
đã được thêm vào danh sách hợp pháp của các hình dạng. Hình bầu dục sử dụng một hộp giới hạn hình chữ nhật.

Sử dụng djvuxmlparser trực tuyến bằng các dịch vụ onworks.net



Các chương trình trực tuyến Linux & Windows mới nhất