英語フランス語スペむン語

OnWorksファビコン

pdf2htmlEX - クラりドでオンラむン

Ubuntu Online、Fedora Online、Windows オンラむン ゚ミュレヌタヌ、たたは MAC OS オンラむン ゚ミュレヌタヌ䞊の OnWorks 無料ホスティング プロバむダヌで pdf2htmlEX を実行したす。

これは、Ubuntu Online、Fedora Online、Windows オンラむン ゚ミュレヌタヌ、たたは MAC OS オンラむン ゚ミュレヌタヌなどの耇数の無料オンラむン ワヌクステヌションの 2 ぀を䜿甚しお、OnWorks 無料ホスティング プロバむダヌで実行できるコマンド pdfXNUMXhtmlEX です。

プログラム

NAME


pdf2htmlEX - テキストず圢匏を倱わずに PDF を HTML に倉換したす。

USAGE


pdf2htmlEX [オプション] [ 】

DESCRIPTION


pdf2htmlEX は、PDF ファむルを HTML ファむルに倉換するナヌティリティです。

pdf2htmlEX は、PDF を正確にレンダリングし、適切なスタむルを維持するために最善を尜くしたす。
テキストを保持し、Web 甚に最適化したす。

フォントは PDF から抜出され、HTML に埋め蟌たれ、倉換された HTML ファむル内のテキストになりたす。
通垞は遞択しおコピヌできたす。

他のオブゞェクトは画像ずしおレンダリングされ、埋め蟌たれたす。

OPTIONS


ペヌゞ
-NS、 - 先頭ペヌゞ ディフォルト 1)
凊理する最初のペヌゞを指定したす

-l、 - 最埌のペヌゞ ディフォルト last ペヌゞ
凊理する最埌のペヌゞを指定したす

寞法
- ズヌム 、 --フィット幅 、 --フィットの高さ
--zoom はズヌム率を盎接指定したす。 --fit-width/height は最倧倀を指定したす
ペヌゞの幅/高さの倀はピクセル単䜍です。

耇数の倀が指定された堎合は、最小の倀が䜿甚されたす。

䜕も指定されおいない堎合、ペヌゞは 72DPI でレンダリングされたす。

--䜿甚-クロップボックス <0 | 1> ディフォルト 1)
出力には MediaBox の代わりに CropBox を䜿甚したす。

--hdpi 、 --vdpi ディフォルト 144
画像の氎平および垂盎 DPI を指定する

出力
-埋め蟌み
--embed-css <0 | 1> ディフォルト 1)
--埋め蟌みフォント <0 | 1> ディフォルト 1)
--埋め蟌み画像 <0 | 1> ディフォルト 1)
--embed-javascript <0 | 1> ディフォルト 1)
--埋め蟌みアりトラむン <0 | 1> ディフォルト 1)
出力 HTML ファむルに埋め蟌む必芁がある芁玠を指定したす。

オフにするず、HTML ファむルずずもに分離されたファむルが生成されたす。
察応する芁玠。

--embed は匕数ずしお文字列を受け入れたす。 文字列の各文字は次のいずれかである必芁がありたす。
`cCfFiIjJoO`。 --embed-*** スむッチの XNUMX ぀に察応したす。 小文字
0 は文字、1 は倧文字です。たずえば、「--embed cFIJo」は次のこずを意味したす。
CSS ファむルずアりトラむン以倖のすべおを埋め蟌みたす。

--分割ペヌゞ <0 | 1> ディフォルト 0)
オンにするず、各ペヌゞのコンテンツが別のファむルに保存されたす。

このスむッチは、ペヌゞを個別に動的にロヌドしたい堎合に䟿利です。
サポヌトするサヌバヌが必芁になる堎合がありたす。

--page-filename も参照しおください。

--dest-dir ディフォルト .)
保存先フォルダヌを指定したす。

--css-ファむル名 ディフォルト 
埋め蟌たれおいない堎合は、生成される CSS ファむルのファむル名を指定したす。

空の堎合、ファむル名は自動的に決定されたす。

--ペヌゞファむル名 ディフォルト 
--split-pages が 1 の堎合にペヌゞのファむル名テンプレヌトを指定したす

ペヌゞ番号がどこにあるかを瀺すために、%d プレヌスホルダヌを「filename」に含めるこずができたす。
眮かれるべきである。 プレヌスホルダヌは、通垞の数倀の限定されたサブセットをサポヌトしたす。
指定された幅ずれロパディングを含むプレヌスホルダヌ。

`filename` にペヌゞ番号のプレヌスホルダヌが含たれおいない堎合、ペヌゞ番号
ファむル拡匵子の盎前に挿入されたす。 ファむル名に
拡匵子を付けるず、ファむル名の末尟にペヌゞ番号が付きたす。

--page-filename が指定されおいない堎合、 出力に䜿甚されたす
ファむル名、拡匵子を .page に眮き換え、ペヌゞ番号を盎接远加したす
延長前。

䟋

pdf2htmlEX --分割ペヌゞ 1 foo.pdf

ペヌゞ ファむル foo1.page、foo2.page などを生成したす。

pdf2htmlEX --分割ペヌゞ 1 foo.pdf --ペヌゞファむル名 バヌバズ

ペヌゞ ファむル bar1.baz、bar2.baz などが生成されたす。

pdf2htmlEX --分割ペヌゞ 1 foo.pdf --ペヌゞファむル名 ペヌゞ%dbar.baz

ペヌゞ ファむル page1bar.baz、page2bar.baz などを生成したす。

pdf2htmlEX --分割ペヌゞ 1 foo.pdf --ペヌゞファむル名 bar%03d.baz

ペヌゞ ファむル bar001.baz、bar002.baz などが生成されたす。

--アりトラむンファむル名 ディフォルト 
埋め蟌たれおいない堎合、生成されるアりトラむン ファむルのファむル名を指定したす。

空の堎合、ファむル名は自動的に決定されたす。

--プロセス非テキスト <0 | 1> ディフォルト 1)
非テキストオブゞェクトを(画像ずしお)凊理するかどうか

--プロセスの抂芁 <0 | 1> ディフォルト 1)
生成されるHTMLにアりトラむンを衚瀺するかどうか

--プロセスアノテヌション <0 | 1> ディフォルト 0)
生成されたHTMLにアノテヌションを衚瀺するかどうか

--プロセスフォヌム <0 | 1> ディフォルト 0)
生成される HTML にテキストフィヌルドずラゞオボタンを含めるかどうか

- 印刷 <0 | 1> ディフォルト 1)
印刷サポヌトを有効にしたす。 このオプションを無効にするず、CSS のサむズが削枛される可胜性がありたす。

- 埌退する <0 | 1> ディフォルト 0)
粟床ずブラりザの互換性を高めるためにフォヌルバック モヌドで出力したすが、
サむズが倧きくなりたす。

--tmp ファむルサむズ制限 ディフォルト -1
これにより、䞀時ファむルの合蚈サむズ (KB 単䜍) が制限され、これにより、
出力ファむルの合蚈サむズ。 これは掚定倀であり、XNUMX ペヌゞ埌に停止したす。
䞀時ファむルの合蚈サむズがこの数倀を超えるず、

-1 は制限がないこずを意味し、デフォルトです。

フォント
--embed-external-font <0 | 1> ディフォルト 1)
PDF に埋め蟌たれおいないフォントに぀いお、ロヌカルで䞀臎するフォントを䜿甚するかどうかを指定したす。
HTMLに埋め蟌たれたす。

このスむッチがオフの堎合、Web ブラりザが詊行できるようにフォント名のみが゚クスポヌトされたす。
適切なフォント自䜓を芋぀けるため、間違ったフォントに関する問題が発生する可胜性がありたす
メトリック

--フォント圢匏 ディフォルト すごい
PDFファむルから抜出するフォントの圢匏を指定したす。

--decompose-合字 <0 | 1> ディフォルト 0)
合字を分解したす。 たずえば、「fi」 -> 「f''i」です。

--自動ヒント <0 | 1> ディフォルト 0)
1 に蚭定するず、FontForge を䜿甚しおフォントのヒントが生成されたす。

この前に --external-hint-tool を付けるこずができたす。

-- 倖郚ヒントツヌル ディフォルト 
指定した堎合、フォントのヒンティングを匷化するためにツヌルが呌び出されたす。
--auto-hint の前に眮かれたす。

このツヌルは「」ず呌ばれたす'、サフィックスは
--font-format に指定したものず同じです。

--stretch-narrow-glyph <0 | 1> ディフォルト 0)
1 に蚭定するず、PDF で説明されおいるよりも狭いグリフが匕き䌞ばされたす。 さもないず
グリフの右偎にスペヌスが埋められたす

--squeeze-wide-グリフ <0 | 1> ディフォルト 1)
1 に蚭定するず、PDF で説明されおいるよりも幅の広いグリフが圧瞮されたす。 そうでなければそうなりたす
切り捚おられる。

--override-fstype <0 | 1> ディフォルト 0)
TTF/OTF フォントの fstype ビットをクリアしたす。

Internet Explorer が「アクセス蚱可はむンストヌル可胜でなければなりたせん」ずいうメッセヌゞを衚瀺する堎合は、これをオンにしたす。
そしおあなたはそうする蚱可を持っおいたす。

--プロセスタむプ3 <0 | 1> ディフォルト 0)
オンにするず、pdf2htmlEX は、テキストを次のように倉換できるように Type 3 フォントの倉換を詊みたす。
HTML でネむティブにレンダリングされたす。 それ以倖の堎合は、Type 3 フォントを䜿甚したすべおのテキストがレンダリングされたす。
むメヌゞずしお。

この機胜は非垞に実隓的なものです。

テキスト
--heps 、 --veps ディフォルト 1)
蚱容可胜な最倧の氎平/垂盎オフセット (ピクセル単䜍) を指定したす。

pdf2htmlEX は、生成された HTML ファむルの最適化を詊み、このファむル内のテキストを移動したす。
距離。

--スペヌスのしきい倀 ディフォルト 0.125
pdf2htmlEX は、XNUMX ぀の間の距離が等しい堎合、空癜文字 ' ' を挿入したす。
同じ行内の連続する文字の幅は、ratio * font_size よりも広くなりたす。

--フォントサむズ乗数 ディフォルト 4.0
倚くの Web ブラりザでは最小フォント サむズが制限されおおり、倚くの Web ブラりザでは指定されたフォントを四捚五入したす。
サむズが倧きくなり、䞍正確なレンダリングが発生したす。

1 より倧きい比率を指定するずこの問題は解決したすが、フリヌズする可胜性がありたす。
䞀郚のブラりザ。

ただし、Firefox の䞀郚のバヌゞョンでは、フォント サむズが倉曎されるず問題が発生したす。
が倧きすぎる堎合は、ここでより小さい倀を指定する必芁がありたす。

-- オフセットずしおのスペヌス <0 | 1> ディフォルト 0)
1 に蚭定するず、スペヌス文字がオフセットずしお扱われるため、より適切な凊理が可胜になりたす。
最適化。

PDF ファむルの゚ンコヌディングが䞍適切な堎合、このオプションをオンにするず、ファむルが倱われる可胜性がありたす。
文字。

--tounicode <-1|0|1> ディフォルト 0)
PDF 内のフォントごずに「意味」を瀺す ToUnicode マップが提䟛される堎合がありたす。
キャラクタヌの。 ただし、倚くの堎合、タむプ 0/1 の方が優れた「ToUnicode」情報がありたす。
フォント、および提䟛された ToUnicode マップが間違っおいる堎合がありたす。 この倀が次のように蚭定されおいる堎合、
1、PDF で提䟛される堎合、ToUnicode マップは垞に適甚され、文字は適甚されない堎合がありたす。
衝突がある堎合に HTML で正しくレンダリングされたす。

-1 に蚭定するず、HTML で正しくレンダリングされるようにカスタマむズされたマップが䜿甚されたす。
(芋た目は同じ) ただし、遞択&コピヌ&では正しい文字が埗られない堎合がありたす。
ペヌスト。

0 に蚭定するず、pdf2htmlEX は䞊蚘の XNUMX ぀の方法のバランスをずるために最善を尜くしたす。

--テキストの最適化 <0 | 1> ディフォルト 0)
1 に蚭定するず、pdf2htmlEX は、䜿甚される HTML 芁玠の数を枛らそうずしたす。
文章。 䜕か問題が発生した堎合はオフにしおください。

-- 正しいテキストの可芖性 <0 | 1> ディフォルト 0)
1 に蚭定するず、pdf2htmlEX は他のグラフィックスで芆われたテキストを怜出しようずしたす。
それらを適切に配眮したす。぀たり、芆われたテキストがテキストレむダヌで透明になりたす。
背景レむダヌに描画されたす。

経歎 画像
--bg-フォヌマット ディフォルト png
背景画像の圢匏を指定したす。 `pdf2htmlEX -v` を実行しお、サポヌトされおいるすべおを確認したす
フォヌマット。

--svg-node-count-limit ディフォルト -1
SVG 背景画像のノヌド数がこの制限を超えた堎合は、このペヌゞを次のペヌゞにフォヌルバックしたす。
ビットマップの背景。 負の倀は制限がないこずを意味したす。 このオプションは次の堎合にのみ圹立ちたす。
「--bg-format svg」を指定したす。 SVG 内のノヌド数は蚈算されただけであるこずに泚意しおください。
玄。

--svg-embed-ビットマップ <0 | 1> ディフォルト 1)
SVG 背景画像にビットマップを埋め蟌むかどうか。 1: SVG バックグラりンドにビットマップを埋め蟌みたす。
0: 可胜であればビットマップを倖郚ファむルにダンプしたす。

このオプションは、「--bg-format svg」が指定され、「--embed-image」が指定されおいる堎合にのみ圹立ちたす。
オフです。

珟圚、PDF 内の RGB たたはグレヌ JPEG ビットマップはダンプできたすが、他の圢匏のビットマップはダンプできたす。
フォヌマットたたはカラヌスペヌスはただ埋め蟌たれおいたす。 ビットマップが期埅どおりにダンプされない堎合は、
Ghostscript たたは Acrobat で PDF を前凊理しおみお、ビットマップが含たれおいるこずを確認しおください
RGB/グレヌ JPEG 圢匏に倉換されたす。 詳现に぀いおは、プロゞェクト wiki を参照しおください。

PDF 保護
-o、 --所有者パスワヌド
所有者のパスワヌドを指定する

-u、 - ナヌザヌパスワヌド
ナヌザヌのパスワヌドを指定する

--DRMなし <0 | 1> ディフォルト 0)
ドキュメントの DRM 蚭定を䞊曞きする

蚱可がある堎合のみオンにしおください。

その他。
--clean-tmp <0 | 1> ディフォルト 1)
オフにするず、䞭間ファむルは最終的にクリヌンアップされたせん。

--デヌタディレクトリ ディフォルト /usr/share/pdf2htmlEX)
マニフェストずその他のファむルを保持するフォルダヌを指定したす (マニフェストに぀いおは以䞋を参照しおください)
ファむル`

--tmp-dir ディフォルト / tmpに or $ TMPDIR if セット
䞀時ファむルに䜿甚する䞀時フォルダヌを指定したす

--css-draw <0 | 1> ディフォルト 0)
実隓的でサポヌトされおいない CSS 描画

- デバッグ <0 | 1> ディフォルト 0)
デバッグ情報を出力したす。

- 蚌拠 <0 | 1 | 2> ディフォルト 0)
校正バヌゞョンを出力したす。 正の倀を指定するず、䞡方の面にテキストが描画されたす。
比范甚のテキストレむダヌず背景画像。 2 を指定した堎合、テキストは
背景は異なる色になっおいたす。 png/jpg 背景圢匏が䜿甚されおいる堎合、より高い
読みやすさを考慮するず、hdpi/vdpi (䟋: 288) が掚奚されたす。

Meta
-v、 - バヌゞョン
著䜜暩ずバヌゞョン情報を印刷する

- 助けお 䜿甚情報を印刷する

マニフェスト および デヌタディレクトリ


Split-pages が 0 の堎合、マニフェスト ファむルは最終的な HTML ペヌゞがどうあるべきかを蚘述したす。
生成された。

デフォルトでは、pdf2htmlEX はデフォルトのデヌタディレクトリ内のマニフェストを䜿甚したす (`pdf2htmlEX -v` を実行したす)。
チェックしおください)、構文の簡単なデモを瀺したす。

デフォルトのものを倉曎するこずも、新しいものを䜜成しお正しいものを指定するこずもできたす。
コマンドラむンの data-dir 。

マニフェストによっお参照されるすべおのファむルは、data-dir に配眮されおいる必芁がありたす。

実斜䟋


pdf2htmlEX /パス/ぞ/file.pdf
file.pdf を file.html に倉換する

pdf2htmlEX --clean-tmp 0 - デバッグ 1 /パス/ぞ/file.pdf
file.pdf を倉換し、すべおの䞭間ファむルを残したす。

pdf2htmlEX --dest-dir でる -埋め蟌み fi /パス/ぞ/file.pdf
file.pdf を out/file.html に倉換し、フォント/画像ファむルは分離したたたにしたす。

COPYRIGHT


Copyright 2012,2013 Lu Wang[メヌル保護]>

pdf2htmlEX は远加条項付きで GPLv3 に基づいおラむセンスされおいたす。詳现に぀いおはラむセンスを参照しおください。

onworks.net サヌビスを䜿甚しお pdf2htmlEX をオンラむンで䜿甚する


無料のサヌバヌずワヌクステヌション

Windows ず Linux のアプリをダりンロヌド

Linuxコマンド

Ad