InglesPransesEspanyol

OnWorks favicon

pdf2htmlEX - Online sa Cloud

Patakbuhin ang pdf2htmlEX sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command na pdf2htmlEX na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


pdf2htmlEX - kino-convert ang PDF sa HTML nang hindi nawawala ang text at format.

PAGGAMIT


pdf2htmlEX [mga opsyon] [ ]

DESCRIPTION


Ang pdf2htmlEX ay isang utility na nagko-convert ng mga PDF file sa HTML file.

Sinusubukan ng pdf2htmlEX ang lahat ng makakaya upang mai-render ang PDF nang tumpak, mapanatili ang tamang estilo, habang
pagpapanatili ng teksto at pag-optimize para sa Web.

Ang mga font ay kinukuha sa anyo ng PDF at pagkatapos ay naka-embed sa HTML, teksto sa na-convert na HTML file
ay karaniwang maaaring piliin at kopyahin.

Ang iba pang mga bagay ay nai-render bilang mga imahe at naka-embed din.

Opsyon


Pahina
-f, --unang pahina (Default: 1)
Tukuyin ang unang pahina na ipoproseso

-l, --huling pahina (Default: huli pahina)
Tukuyin ang huling pahinang ipoproseso

Mga Dimensyon
--zoom , --fit-width , --fit-taas
--Zoom ay direktang tumutukoy sa zoom factor; --fit-width/height ay tumutukoy sa maximum
lapad/taas ng isang pahina, ang mga halaga ay nasa mga pixel.

Kung maraming halaga ang tinukoy, ang pinakamababa ay gagamitin.

Kung walang tinukoy, ang mga pahina ay ire-render bilang 72DPI.

--use-cropbox <0|1> (Default: 1)
Gumamit ng CropBox sa halip na MediaBox para sa output.

--hdpi , --vdpi (Default: 144)
Tukuyin ang pahalang at patayong DPI para sa mga larawan

Pagbubuhos
--embed
--embed-css <0|1> (Default: 1)
--embed-font <0|1> (Default: 1)
--embed-image <0|1> (Default: 1)
--embed-javascript <0|1> (Default: 1)
--embed-outline <0|1> (Default: 1)
Tukuyin kung aling mga elemento ang dapat i-embed sa output HTML file.

Kung naka-off, ang mga hiwalay na file ay bubuo kasama ng HTML file para sa
kaukulang elemento.

--embed ay tumatanggap ng isang string bilang argumento. Ang bawat titik ng string ay dapat isa sa
`cCfFiIjJoO`, na tumutugma sa isa sa mga --embed-*** switch. Lower case
mga titik para sa 0 at malalaking titik para sa 1. Halimbawa, ang ibig sabihin ng `--embed cFIJo` ay
i-embed ang lahat maliban sa mga CSS file at outline.

--split-pages <0|1> (Default: 0)
Kung naka-on, ang nilalaman ng bawat pahina ay nakaimbak sa isang hiwalay na file.

Kapaki-pakinabang ang switch na ito kung gusto mong i-load ang mga page nang hiwalay at pabago-bago -- a
maaaring kailanganin ang pagsuporta sa server.

Tingnan din ang --page-filename.

--dest-dir (Default: .)
Tukuyin ang destination folder.

--css-filename (Default: )
Tukuyin ang filename ng nabuong css file, kung hindi naka-embed.

Kung ito ay walang laman, ang pangalan ng file ay awtomatikong matutukoy.

--page-filename (Default: )
Tukuyin ang template ng filename para sa mga pahina kapag ang --split-pages ay 1

Maaaring isama ang isang %d placeholder sa `filename` upang isaad kung saan ang numero ng pahina
dapat ilagay. Sinusuportahan ng placeholder ang isang limitadong subset ng normal na numerical
mga placeholder, kabilang ang tinukoy na lapad at zero padding.

Kung ang `filename` ay walang placeholder para sa page number, ang page number
ay direktang ipapasok bago ang extension ng file. Kung ang filename ay walang
isang extension, ang numero ng pahina ay ilalagay sa dulo ng pangalan ng file.

Kung hindi tinukoy ang --page-filename, gagamitin para sa output
filename, pinapalitan ang extension ng .page at direktang idagdag ang page number
bago ang extension.

Mga halimbawa

pdf2htmlEX --split-pages 1 foo.pdf

Nagbubunga ng mga file ng page foo1.page, foo2.page, atbp.

pdf2htmlEX --split-pages 1 foo.pdf --page-filename bar.baz

Nagbubunga ng mga file ng page bar1.baz, bar2.baz, atbp.

pdf2htmlEX --split-pages 1 foo.pdf --page-filename page%dbar.baz

Nagbubunga ng mga page file page1bar.baz, page2bar.baz, atbp.

pdf2htmlEX --split-pages 1 foo.pdf --page-filename bar%03d.baz

Nagbubunga ng mga file ng page bar001.baz, bar002.baz, atbp.

--outline-filename (Default: )
Tukuyin ang filename ng nabuong outline file, kung hindi naka-embed.

Kung ito ay walang laman, ang pangalan ng file ay awtomatikong matutukoy.

--process-nontext <0|1> (Default: 1)
Kung magpoproseso ng mga bagay na hindi teksto (bilang mga larawan)

--process-outline <0|1> (Default: 1)
Kung magpapakita ng outline sa nabuong HTML

--process-annotation <0|1> (Default: 0)
Kung magpapakita ng anotasyon sa nabuong HTML

--proseso-form <0|1> (Default: 0)
Kung isasama ang mga text field at radio button sa nabuong HTML

--paglimbag <0|1> (Default: 1)
Paganahin ang suporta sa pag-print. Ang hindi pagpapagana sa opsyong ito ay maaaring mabawasan ang laki ng CSS.

--umurong <0|1> (Default: 0)
Output sa fallback mode, para sa mas mahusay na katumpakan at browser compatibility, ngunit ang
ang laki ay nagiging mas malaki.

--tmp-file-size-limit (Default: -1)
Nililimitahan nito ang kabuuang sukat (sa KB) ng mga pansamantalang file na maglilimita rin sa
kabuuang sukat ng output file. Ito ay isang pagtatantya at ito ay titigil pagkatapos ng isang pahina,
kapag ang kabuuang laki ng pansamantalang file ay mas malaki kaysa sa numerong ito.

-1 ay nangangahulugang walang limitasyon at ito ang default.

Font
--embed-external-font <0|1> (Default: 1)
Tukuyin kung ang mga lokal na katugmang font, para sa mga font na hindi naka-embed sa PDF, ay dapat
naka-embed sa HTML.

Kung naka-off ang switch na ito, ang mga pangalan ng font lang ang ine-export para masubukan ng mga web browser
upang mahanap mismo ang mga wastong font, at maaaring magdulot iyon ng mga isyu tungkol sa maling font
sukatan.

--format ng font (Default: woff)
Tukuyin ang format ng mga font na kinuha mula sa PDF file.

--decompose-ligature <0|1> (Default: 0)
Mabulok ang mga ligature. Halimbawa 'fi' -> 'f''i'.

--awtomatikong pahiwatig <0|1> (Default: 0)
Kung nakatakda sa 1, bubuo ng mga pahiwatig para sa mga font gamit ang FontForge.

Ito ay maaaring unahan ng --external-hint-tool.

--external-hint-tool (Default: )
Kung tinukoy, tatawagin ang tool upang mapahusay ang pahiwatig para sa mga font, ito
mauuna --auto-hint.

Ang tool ay tatawagin bilang ' ', kung saan magiging suffix
kapareho ng tinukoy para sa --font-format.

--stretch-narrow-glyph <0|1> (Default: 0)
Kung itatakda sa 1, ang mga glyph na mas makitid kaysa sa inilarawan sa PDF ay iuunat; kung hindi
ang espasyo ay may palaman sa kanan ng mga glyph

--squeeze-wide-glyph <0|1> (Default: 1)
Kung itatakda sa 1, pipigain ang mga glyph na mas malawak kaysa sa inilarawan sa PDF; kung hindi ay ito
putulin.

--override-fstype <0|1> (Default: 0)
I-clear ang mga fstype bit sa mga TTF/OTF na font.

I-on ito kung nagreklamo ang Internet Explorer tungkol sa 'Dapat na mai-install ang Pahintulot'
AT mayroon kang pahintulot na gawin ito.

--uri-proseso3 <0|1> (Default: 0)
Kung naka-on, susubukan ng pdf2htmlEX na i-convert ang Type 3 na mga font na maaaring maging ganoon ang text
native na nai-render sa HTML. Kung hindi, ire-render ang lahat ng text na may Type 3 font
bilang imahe.

Ang tampok na ito ay lubos na pang-eksperimento.

teksto
--heps , --veps (Default: 1)
Tukuyin ang maximum na matitiis na horizontal/vertical offset (sa mga pixel).

Susubukan ng pdf2htmlEX na i-optimize ang nabuong HTML file na gumagalaw na Text sa loob nito
distansya

--space-threshold (Default: 0.125)
Ang pdf2htmlEX ay maglalagay ng whitespace na character na ' ' kung ang distansya sa pagitan ng dalawa
Ang magkasunod na mga titik sa parehong linya ay mas malawak kaysa ratio * font_size.

--font-size-multiplier (Default: 4.0)
Maraming mga web browser ang naglilimita sa pinakamababang laki ng font, at marami ang magpapabilog sa ibinigay na font
laki, na nagreresulta sa maling pag-render.

Tumukoy ng ratio na mas malaki sa 1 ang makakalutas sa isyung ito, gayunpaman maaari itong mag-freeze
ilang mga browser.

Para sa ilang bersyon ng Firefox, gayunpaman, magkakaroon ng problema kapag ang laki ng font
ay masyadong malaki, kung saan ang isang mas maliit na halaga ay dapat na tukuyin dito.

--space-as-offset <0|1> (Default: 0)
Kung itatakda sa 1, ang mga space character ay ituturing bilang mga offset, na nagbibigay-daan sa isang mas mahusay
pag-optimize.

Para sa mga PDF file na may masamang pag-encode, ang pag-on sa opsyong ito ay maaaring maging sanhi ng pagkawala
character.

--tounicode <-1|0|1> (Default: 0)
Maaaring magbigay ng ToUnicode na mapa para sa bawat font sa PDF na nagpapahiwatig ng 'kahulugan'
ng mga karakter. Gayunpaman madalas mayroong mas mahusay na "ToUnicode" na impormasyon sa Uri 0/1
mga font, at kung minsan ay mali ang ibinigay na mapa ng ToUnicode. Kung nakatakda ang value na ito sa
1, palaging inilalapat ang ToUnicode Map, kung ibinigay sa PDF, at maaaring hindi ang mga character
i-render nang tama sa HTML kung may mga banggaan.

Kung nakatakda sa -1, ang isang naka-customize na mapa ay ginagamit upang ang pag-render ay magiging tama sa HTML
(biswal na pareho), ngunit maaaring hindi ka makakuha ng mga tamang character sa pamamagitan ng pagpili at pagkopya at
i-paste

Kung itatakda sa 0, susubukan ng pdf2htmlEX ang lahat ng makakaya upang balansehin ang dalawang pamamaraan sa itaas.

--optimize-text <0|1> (Default: 0)
Kung nakatakda sa 1, susubukan ng pdf2htmlEX na bawasan ang bilang ng mga elemento ng HTML na ginamit para sa
text. I-off ito kung may mali.

--correct-text-visibility <0|1> (Default: 0)
Kung nakatakda sa 1, susubukan ng pdf2htmlEX na tuklasin ang mga text na sakop ng iba pang mga graphics at
maayos na ayusin ang mga ito, ibig sabihin, ang mga sakop na teksto ay ginagawang transparent sa layer ng teksto, at
ay iginuhit sa layer ng background.

likuran Imahen
--bg-format (Default: png)
Tukuyin ang format ng larawan sa background. Patakbuhin ang `pdf2htmlEX -v` upang suriin ang lahat ng suportado
format.

--svg-node-count-limit (Default: -1)
Kung ang bilang ng node sa isang svg na larawan sa background ay lumampas sa limitasyong ito, ibalik ang pahinang ito sa
background ng bitmap; ang negatibong halaga ay nangangahulugang walang limitasyon. Ang pagpipiliang ito ay kapaki-pakinabang lamang kapag
'--bg-format svg' ay tinukoy. Tandaan na ang bilang ng node sa svg ay kinakalkula lamang
humigit-kumulang

--svg-embed-bitmap <0|1> (Default: 1)
Mag-embed man ng mga bitmap sa svg na larawan sa background. 1: mag-embed ng mga bitmap sa svg background;
0: dump bitmaps sa mga external na file kung maaari.

Ang pagpipiliang ito ay kapaki-pakinabang lamang kapag ang '--bg-format svg' ay tinukoy at '--embed-image'
ay naka-off.

Sa kasalukuyan, maaaring i-dump ang mga RGB o Gray na JPEG na mga bitmap sa isang PDF, habang ang mga nasa iba pa
naka-embed pa rin ang mga format o colorspace. Kung ang mga bitmap ay hindi itinapon gaya ng inaasahan,
subukang pre-processing ang iyong PDF sa pamamagitan ng ghostscript o acrobat at siguraduhing may bitmaps dito
ay na-convert sa RGB/Gray na JPEG na format. Tingnan ang wiki ng proyekto para sa higit pang mga detalye.

PDF proteksyon
-o, --may-ari-password
Tukuyin ang password ng may-ari

-ikaw, --user-password
Tukuyin ang password ng user

--hindi-drm <0|1> (Default: 0)
I-override ang mga setting ng DRM ng dokumento

I-on lang ito kapag may pahintulot ka.

Misc.
--linis-tmp <0|1> (Default: 1)
Kung naka-off, ang mga intermediate na file ay hindi malilinis sa huli.

--data-dir (Default: /usr/share/pdf2htmlEX)
Tukuyin ang folder na may hawak na manifest at iba pang mga file (tingnan sa ibaba para sa manifest
file)`

--tmp-dir (Default: / Tmp or $TMPDIR if itakda)
Tukuyin ang pansamantalang folder na gagamitin para sa mga pansamantalang file

--css-draw <0|1> (Default: 0)
Eksperimento at hindi sinusuportahang pagguhit ng CSS

--debug <0|1> (Default: 0)
I-print ang impormasyon sa pag-debug.

--patunay <0|1|2> (Default: 0)
Mag-output ng isang patunay na bersyon. Kung ang isang positibong halaga ay tinukoy, ang mga teksto ay iguguhit sa pareho
layer ng teksto at larawan sa background para sa paghahambing. Kung 2 ang tinukoy, naka-on ang mga text
ang background ay nasa iba't ibang kulay. Kung png/jpg background format ang ginamit, mas mataas
Ang hdpi/vdpi (hal. 288) ay inirerekomenda para sa pagiging madaling mabasa.

meta
-sa, --bersyon
I-print ang impormasyon ng copyright at bersyon

- Tumulong I-print ang impormasyon sa paggamit

MANIFEST at DATA-DIR


Kapag ang mga split-page ay 0, inilalarawan ng manifest file kung paano dapat ang huling html page
nabuo

Bilang default, gagamitin ng pdf2htmlEX ang manifest sa default na data-dir (patakbuhin ang `pdf2htmlEX -v`
upang suriin), na nagbibigay ng isang simpleng demo ng syntax nito.

Maaari mong baguhin ang default, o maaari kang lumikha ng bago at tukuyin ang tama
data-dir sa command line.

Ang lahat ng mga file na tinutukoy ng manifest ay dapat na matatagpuan sa data-dir.

Halimbawa


pdf2htmlEX /path/to/file.pdf
I-convert ang file.pdf sa file.html

pdf2htmlEX --linis-tmp 0 --debug 1 /path/to/file.pdf
I-convert ang file.pdf at iwanan ang lahat ng mga intermediate na file.

pdf2htmlEX --dest-dir Palabas --embed fi /path/to/file.pdf
I-convert ang file.pdf sa out/file.html at iwanang magkahiwalay ang mga font/image file.

COPYRIGHT


Copyright 2012,2013 Lu Wang[protektado ng email]>

Ang pdf2htmlEX ay lisensyado sa ilalim ng GPLv3 na may mga karagdagang tuntunin, basahin ang LICENSE para sa mga detalye.

Gamitin ang pdf2htmlEX online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

Linux command

Ad