Ito ang command djvuxmlparser na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
djvutoxml, djvuxmlparser - DjVuLibre XML Tools.
SINOPSIS
djvutoxml [pagpipilian] inputdjvufile [outputxmlfile]
djvuxmlparser [ -o djvufile ] inputxmlfile
DESCRIPTION
Ang DjVuLibre XML Tools ay nagbibigay para sa pag-edit ng metadata, mga hyperlink at nakatagong teksto
nauugnay sa mga DjVu file. Unlike djvused(1) umaasa ang DjVuLibre XML Tools sa XML
teknolohiya at maaaring samantalahin ang mga XML editor at verifier.
DJVUTOXML
Programa djvutoxml lumilikha ng isang XML file outputxmlfile naglalaman ng sanggunian sa orihinal
Dokumento ng DjVu inputdjvufile pati na rin ang mga tag na naglalarawan sa metadata, hyperlink, at
nakatagong teksto na nauugnay sa DjVu file.
Ang mga sumusunod na opsyon ay sinusuportahan:
--pahina pagenum
Pumili ng page sa isang multi-page na dokumento. Kung wala ang pagpipiliang ito, djvutoxml output ang
XML na naaayon sa lahat ng pahina ng dokumento.
--may-text
Tinutukoy ang HIDDENTEXT elemento para sa bawat pahina ay dapat na kasama sa output.
Kung tinukoy nang wala ang --with-anno bandila pagkatapos ay ang --walang-anno ay ipinahiwatig. Kung
wala sa --may-text, --walang-text, --with-anno, or --nang walang-anno, ang mga flag ay
tinukoy, pagkatapos ay ang --may-text at --with-anno ipinahiwatig ang mga watawat.
--walang-text
Tinutukoy na hindi i-output ang HIDDENTEXT elemento para sa bawat pahina. Kung tinukoy nang wala
ang --walang-anno bandila pagkatapos ay ang --with-anno ipinahiwatig ang bandila.
--with-anno
Tinutukoy ang lugar MAPA elemento para sa bawat pahina ay dapat na kasama sa output. Kung
tinukoy nang walang --may-text bandila pagkatapos ay ang --walang-text ipinahiwatig ang bandila.
--walang-anno
Tinutukoy ang lugar MAPA elemento para sa bawat pahina ay hindi dapat isama sa output.
Kung tinukoy nang wala ang --walang-text bandila pagkatapos ay ang --may-text ipinahiwatig ang bandila.
DJVUXMLPARSER
Mga file na ginawa ng djvutoxml pagkatapos ay maaaring baguhin gamit ang alinman sa isang text editor o isang XML
editor. Programa djvuxmlparser na-parse ang XML file inputxmlfile upang mabago ang
metadata ng kaukulang DjVu file.
-o djvufile
Sa prinsipyo ang target na DjVu file ay ang file na isinangguni ng LAYUNIN elemento ng
ang XML file. Ang pagpipiliang ito ay nagbibigay ng paraan upang i-override ang filename na tinukoy sa
ang LAYUNIN elemento.
DJVUXML DOKUMENTO TYPE DEFINISYON
Ang file ng kahulugan ng uri ng dokumento (DTD)
/usr/share/djvu/pubtext/DjVuXML-s.dtd
tumutukoy sa input at output ng mga tool ng DjVu XML.
Ang DjVuXML-s DTD ay isang pagpapasimple ng HTML DTD:
http://www.w3c.org/TR/1998/REC-html40-19980424/sgml/dtd.html
na may ilang bagong katangian na idinagdag na partikular sa DjVu. Ang bawat isa sa mga tinukoy na pahina ng isang DjVu
dokumento ay kinakatawan bilang LAYUNIN mga elemento sa loob ng BODY elemento ng XML file. Bawat isa
LAYUNIN ang elemento ay maaaring maglaman ng maramihan PARAM mga elemento upang tukuyin ang mga katangian tulad ng pangalan ng pahina,
resolution, at gamma factor. Bawat isa LAYUNIN ang elemento ay maaari ding maglaman ng isa HIDENTTEXT
elemento upang tukuyin ang nakatagong teksto (karaniwang nabuo gamit ang isang OCR engine) sa loob ng DjVu
pahina. Bilang karagdagan sa bawat isa LAYUNIN elemento ay maaaring sumangguni sa isang solong lugar MAPA elemento na
naglalaman ng maramihang AREA mga elemento upang kumatawan sa lahat ng hyperlink at i-highlight ang mga lugar sa loob
ang dokumento ng DjVu.
PARAM Mga Sangkap
legal PARAM mga elemento ng isang DjVu LAYUNIN isama ngunit hindi limitado sa PAGE para sa pagtukoy
ang pangalan ng pahina, Gamma para sa pagtukoy ng gamma correction factor (karaniwang 2.2), at DPI
para sa pagtukoy ng resolusyon ng pahina.
HIDDENTEXT Mga Sangkap
Ang HIDDENTEXT ang mga elemento ay binubuo ng mga nested na elemento ng PAGECOLUMNS, REHIYON, TALATA,
LINE, at WORD. Ang pinaka malalim na nested na elemento na tinukoy, ay dapat tukuyin ang hangganan
mga coordinate ng elemento sa top-down na oryentasyon. Ang katawan ng pinakamalalim na pugad
elemento ay dapat maglaman ng teksto. Karamihan sa mga dokumento ng DjVu ay gumagamit ng alinman LINE or WORD bilang
pinakamababang antas ng elemento, ngunit ang anumang elemento ay legal bilang pinakamababang antas ng elemento. Isang puting espasyo
ay palaging idinaragdag sa pagitan WORD elemento at isang line feed ay palaging idinaragdag sa pagitan LINE
mga elemento. Dahil ang mga wika tulad ng Japanese ay hindi gumagamit ng mga puwang sa pagitan ng mga salita, ito ay medyo
karaniwan para sa Asian OCR engine na gamitin WORD bilang mga karakter sa halip.
MAPA Mga Sangkap
Ang katawan ng MAPA binubuo ng mga elemento AREA mga elemento. Bilang karagdagan sa mga katangian
nakalista sa
http://www.w3.org/TR/1998/REC-html40-19980424/struct/objects.html#edef-AREA,
ang mga katangian uri ng hangganan, kulay ng hangganan, hangganan, at highlight ay naidagdag upang tukuyin
uri ng hangganan, kulay ng hangganan, lapad ng hangganan, at mga kulay ng highlight ayon sa pagkakabanggit. Mga legal na halaga
para sa bawat isa sa mga katangiang ito ay nakalista sa DjVuXML-s DTD. Bilang karagdagan, ang hugis hugis-itlog
ay naidagdag sa legal na listahan ng mga hugis. Ang isang hugis-itlog ay gumagamit ng isang hugis-parihaba na bounding box.
Gumamit ng djvuxmlparser online gamit ang mga serbisyo ng onworks.net