Ini ialah arahan pdf2htmlEX yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
pdf2htmlEX - menukar PDF kepada HTML tanpa kehilangan teks dan format.
PENGGUNAAN
pdf2htmlEX [pilihan] [ ]
DESCRIPTION
pdf2htmlEX ialah utiliti yang menukar fail PDF kepada fail HTML.
pdf2htmlEX cuba sedaya upaya untuk memberikan PDF dengan tepat, mengekalkan gaya yang betul, sambil
mengekalkan teks dan mengoptimumkan untuk Web.
Fon diekstrak dalam bentuk PDF dan kemudian dibenamkan ke dalam HTML, teks dalam fail HTML yang ditukar
biasanya boleh dipilih dan boleh disalin.
Objek lain dipaparkan sebagai imej dan juga dibenamkan.
PILIHAN
Laman
-f, --muka surat pertama (Lalai: 1)
Tentukan halaman pertama untuk diproses
-l, --muka surat terakhir (Lalai: lepas halaman)
Tentukan halaman terakhir untuk diproses
Ukuran
--zum , --sesuai-lebar , --sesuai-tinggi
--zoom menentukan faktor zum secara langsung; --fit-width/height menentukan maksimum
lebar/tinggi halaman, nilainya adalah dalam piksel.
Jika berbilang nilai ditentukan, nilai minimum akan digunakan.
Jika tiada yang dinyatakan, halaman akan dipaparkan sebagai 72DPI.
--gunakan-kotak tanaman <0|1> (Lalai: 1)
Gunakan CropBox dan bukannya MediaBox untuk output.
--hdpi , --vdpi (Lalai: 144)
Tentukan DPI mendatar dan menegak untuk imej
Output
--benamkan
--embed-css <0|1> (Lalai: 1)
--embed-font <0|1> (Lalai: 1)
--embed-imej <0|1> (Lalai: 1)
--embed-javascript <0|1> (Lalai: 1)
--embed-outline <0|1> (Lalai: 1)
Tentukan elemen yang harus dibenamkan ke dalam fail HTML output.
Jika dimatikan, fail yang diasingkan akan dijana bersama-sama dengan fail HTML untuk
elemen yang sepadan.
--embed menerima rentetan sebagai hujah. Setiap huruf rentetan mestilah satu daripada
`cCfFiIjJoO`, yang sepadan dengan salah satu suis --embed-***. Huruf kecil
huruf untuk 0 dan huruf besar untuk 1. Contohnya, `--embed cFIJo` bermaksud untuk
benamkan segala-galanya kecuali fail dan garis besar CSS.
--muka-muka berpecah <0|1> (Lalai: 0)
Jika dihidupkan, kandungan setiap halaman disimpan dalam fail berasingan.
Suis ini berguna jika anda mahu halaman dimuatkan secara berasingan & dinamik -- a
pelayan sokongan mungkin diperlukan.
Lihat juga --page-filename.
--dest-dir (Lalai: .)
Tentukan folder destinasi.
--css-nama fail (Lalai: )
Tentukan nama fail fail css yang dijana, jika tidak dibenamkan.
Jika ia kosong, nama fail akan ditentukan secara automatik.
--halaman-nama fail (Lalai: )
Tentukan templat nama fail untuk halaman apabila --split-pages ialah 1
Pemegang tempat %d boleh disertakan dalam `nama fail` untuk menunjukkan di mana nombor halaman
hendaklah diletakkan. Pemegang tempat menyokong subset terhad berangka normal
ruang letak, termasuk lebar yang ditentukan dan pelapik sifar.
Jika `nama fail` tidak mengandungi pemegang tempat untuk nombor halaman, nombor halaman
akan dimasukkan terus sebelum sambungan fail. Jika nama fail tidak mempunyai
sambungan, nombor halaman akan diletakkan di hujung nama fail.
Jika --page-filename tidak dinyatakan, akan digunakan untuk keluaran
nama fail, menggantikan sambungan dengan .page dan menambah nombor halaman secara terus
sebelum lanjutan.
Contoh
pdf2htmlEX --muka-muka berpecah 1 foo.pdf
Menghasilkan fail halaman foo1.page, foo2.page, dsb.
pdf2htmlEX --muka-muka berpecah 1 foo.pdf --halaman-nama fail bar.baz
Menghasilkan fail halaman bar1.baz, bar2.baz, dsb.
pdf2htmlEX --muka-muka berpecah 1 foo.pdf --halaman-nama fail page%dbar.baz
Menghasilkan fail halaman page1bar.baz, page2bar.baz, dsb.
pdf2htmlEX --muka-muka berpecah 1 foo.pdf --halaman-nama fail bar%03d.baz
Menghasilkan fail halaman bar001.baz, bar002.baz, dsb.
--outline-nama fail (Lalai: )
Tentukan nama fail fail garis besar yang dijana, jika tidak dibenamkan.
Jika ia kosong, nama fail akan ditentukan secara automatik.
--proses-bukanteks <0|1> (Lalai: 1)
Sama ada untuk memproses objek bukan teks (sebagai imej)
--garis-proses <0|1> (Lalai: 1)
Sama ada untuk menunjukkan garis besar dalam HTML yang dijana
--proses-anotasi <0|1> (Lalai: 0)
Sama ada mahu menunjukkan anotasi dalam HTML yang dijana
--bentuk-proses <0|1> (Lalai: 0)
Sama ada hendak memasukkan medan teks dan butang radio dalam HTML yang dijana
--mencetak <0|1> (Lalai: 1)
Dayakan sokongan pencetakan. Melumpuhkan pilihan ini boleh mengurangkan saiz CSS.
--sandaran <0|1> (Lalai: 0)
Output dalam mod sandaran, untuk ketepatan yang lebih baik dan keserasian penyemak imbas, tetapi
saiz menjadi lebih besar.
--tmp-fail-had-had (Lalai: -1)
Ini mengehadkan jumlah saiz (dalam KB) fail sementara yang juga akan mengehadkan
jumlah saiz fail output. Ini adalah anggaran dan ia akan berhenti selepas halaman,
apabila jumlah saiz fail sementara lebih besar daripada nombor ini.
-1 bermaksud tiada had dan merupakan lalai.
Font
--embed-external-font <0|1> (Lalai: 1)
Tentukan sama ada fon dipadankan tempatan, untuk fon yang tidak dibenamkan dalam PDF, sepatutnya
dibenamkan ke dalam HTML.
Jika suis ini dimatikan, hanya nama fon dieksport supaya pelayar web boleh mencuba
untuk mencari sendiri fon yang betul, dan itu mungkin menyebabkan isu tentang fon yang salah
sukatan.
--format-font (Lalai: woff)
Tentukan format fon yang diekstrak daripada fail PDF.
--reput-ligatur <0|1> (Lalai: 0)
Mengurai ligatur. Contohnya 'fi' -> 'f''i'.
--petunjuk automatik <0|1> (Lalai: 0)
Jika ditetapkan kepada 1, pembayang akan dijana untuk fon menggunakan FontForge.
Ini mungkin didahului oleh --external-hint-tool.
--alat-petunjuk-luaran (Lalai: )
Jika dinyatakan, alat itu akan dipanggil untuk pembayang yang dipertingkatkan untuk fon, ini
akan mendahului --auto-hint.
Alat itu akan dipanggil sebagai ' ', di mana akhiran akan berada
sama seperti yang dinyatakan untuk --font-format.
--regangan-sempit-glyph <0|1> (Lalai: 0)
Jika ditetapkan kepada 1, glif yang lebih sempit daripada yang diterangkan dalam PDF akan diregangkan; sebaliknya
ruang akan berlapik di sebelah kanan glif
--picit-wide-glyph <0|1> (Lalai: 1)
Jika ditetapkan kepada 1, glif yang lebih lebar daripada yang diterangkan dalam PDF akan diperah; jika tidak ia akan
dipotong.
--override-fstype <0|1> (Lalai: 0)
Kosongkan bit fstype dalam fon TTF/OTF.
Hidupkan ini jika Internet Explorer mengadu tentang 'Kebenaran mesti Boleh Dipasang'
DAN anda mempunyai kebenaran untuk berbuat demikian.
--jenis-proses3 <0|1> (Lalai: 0)
Jika dihidupkan, pdf2htmlEX akan cuba menukar fon Jenis 3 supaya teks boleh
dipaparkan secara asli dalam HTML. Jika tidak, semua teks dengan fon Jenis 3 akan dipaparkan
sebagai imej.
Ciri ini sangat eksperimen.
teks
--heps , --veps (Lalai: 1)
Tentukan offset mendatar/menegak yang boleh diterima maksimum (dalam piksel).
pdf2htmlEX akan cuba mengoptimumkan fail HTML yang dijana bergerak Teks dalam ini
jarak.
--ruang-ambang (Lalai: 0.125)
pdf2htmlEX akan memasukkan aksara ruang putih ' ' jika jarak antara dua
huruf berturut-turut dalam baris yang sama adalah lebih lebar daripada nisbah * font_size.
--pengganda-saiz-font (Lalai: 4.0)
Banyak pelayar web mengehadkan saiz fon minimum, dan ramai yang akan membulatkan fon yang diberikan
saiz, yang mengakibatkan pemaparan yang salah.
Tentukan nisbah yang lebih besar daripada 1 akan menyelesaikan isu ini, namun ia mungkin terhenti
beberapa pelayar.
Bagi sesetengah versi Firefox, bagaimanapun, akan terdapat masalah apabila saiz fon
terlalu besar, dalam hal ini nilai yang lebih kecil harus dinyatakan di sini.
--ruang-sebagai-offset <0|1> (Lalai: 0)
Jika ditetapkan kepada 1, aksara ruang akan dianggap sebagai offset, yang membolehkan yang lebih baik
pengoptimuman.
Untuk fail PDF dengan pengekodan buruk, menghidupkan pilihan ini boleh menyebabkan kehilangan
watak-watak.
--tounicode <-1|0|1> (Lalai: 0)
Peta ToUnicode boleh disediakan untuk setiap fon dalam PDF yang menunjukkan 'makna'
daripada watak-watak tersebut. Walau bagaimanapun selalunya terdapat maklumat "ToUnicode" yang lebih baik dalam Jenis 0/1
fon, dan kadangkala peta ToUnicode yang disediakan adalah salah. Jika nilai ini ditetapkan kepada
1, Peta ToUnicode sentiasa digunakan, jika disediakan dalam PDF, dan aksara mungkin tidak
render dengan betul dalam HTML jika terdapat perlanggaran.
Jika ditetapkan kepada -1, peta tersuai digunakan supaya pemaparan akan betul dalam HTML
(secara visual sama), tetapi anda mungkin tidak mendapat aksara yang betul dengan memilih & menyalin &
tampal.
Jika ditetapkan kepada 0, pdf2htmlEX akan cuba sedaya upaya untuk mengimbangi kedua-dua kaedah di atas.
--optimum-teks <0|1> (Lalai: 0)
Jika ditetapkan kepada 1, pdf2htmlEX akan cuba mengurangkan bilangan elemen HTML yang digunakan
teks. Matikan jika ada masalah.
--keterlihatan-teks yang betul <0|1> (Lalai: 0)
Jika ditetapkan kepada 1, pdf2htmlEX akan cuba mengesan teks yang diliputi oleh grafik lain dan
menyusunnya dengan betul, iaitu teks yang dilindungi dibuat telus dalam lapisan teks, dan
dilukis pada lapisan latar belakang.
Latar Belakang Image
--bg-format (Lalai: png)
Tentukan format imej latar belakang. Jalankan `pdf2htmlEX -v` untuk menyemak semua yang disokong
format.
--svg-node-count-limit (Lalai: -1)
Jika kiraan nod dalam imej latar belakang svg melebihi had ini, kembalikan halaman ini ke
latar belakang peta bit; nilai negatif bermakna tiada had. Pilihan ini hanya berguna apabila
'--bg-format svg' ditentukan. Ambil perhatian bahawa kiraan nod dalam svg baru dikira
lebih kurang.
--svg-embed-bitmap <0|1> (Lalai: 1)
Sama ada membenamkan peta bit dalam imej latar belakang svg. 1: benamkan peta bit dalam latar belakang svg;
0: buang peta bit ke fail luaran jika boleh.
Pilihan ini hanya berguna apabila '--bg-format svg' ditentukan dan '--embed-image'
dimatikan.
Pada masa ini, peta bit JPEG RGB atau Kelabu dalam PDF boleh dibuang, manakala peta bit yang lain
format atau ruang warna masih dibenamkan. Jika peta bit tidak dibuang seperti yang dijangkakan,
cuba pra-memproses PDF anda dengan ghostscript atau akrobat dan pastikan peta bit di dalamnya
ditukar kepada format JPEG RGB/Kelabu. Lihat wiki projek untuk butiran lanjut.
PDF perlindungan
-o, --kata laluan pemilik
Nyatakan kata laluan pemilik
-u, --kata laluan pengguna
Nyatakan kata laluan pengguna
--tidak-drm <0|1> (Lalai: 0)
Gantikan tetapan DRM dokumen
Hidupkan ini hanya apabila anda mempunyai kebenaran.
Misc.
--bersih-tmp <0|1> (Lalai: 1)
Jika dimatikan, fail perantaraan tidak akan dibersihkan pada akhirnya.
--data-dir (Lalai: /usr/share/pdf2htmlEX)
Tentukan folder yang menyimpan manifes dan fail lain (lihat di bawah untuk manifes
fail)`
--tmp-dir (Lalai: / tmp or $TMPDIR if set)
Tentukan folder sementara untuk digunakan untuk fail sementara
--css-draw <0|1> (Lalai: 0)
Lukisan CSS eksperimen dan tidak disokong
--nyahpepijat <0|1> (Lalai: 0)
Cetak maklumat nyahpepijat.
--bukti <0|1|2> (Lalai: 0)
Keluarkan versi bukti. Jika nilai positif ditentukan, teks dilukis pada kedua-duanya
lapisan teks dan imej latar belakang untuk perbandingan. Jika 2 dinyatakan, teks dihidupkan
latar belakang adalah dalam warna yang berbeza. Jika format latar belakang png/jpg digunakan, lebih tinggi
hdpi/vdpi (cth 288) disyorkan untuk kebolehbacaan.
meta
-v, --versi
Cetak maklumat hak cipta dan versi
- membantu Cetak maklumat penggunaan
NYATA and DATA-DIR
Apabila halaman pisah ialah 0, fail manifes menerangkan cara halaman html akhir sepatutnya
dihasilkan.
Secara lalai, pdf2htmlEX akan menggunakan manifes dalam dir data lalai (jalankan `pdf2htmlEX -v`
untuk menyemak), yang memberikan demo ringkas sintaksnya.
Anda boleh mengubah suai yang lalai, atau anda boleh mencipta yang baharu dan menentukan yang betul
data-dir dalam baris arahan.
Semua fail yang dirujuk oleh manifes mesti terletak dalam dir data.
CONTOH
pdf2htmlEX /path/to/file.pdf
Tukar file.pdf kepada file.html
pdf2htmlEX --bersih-tmp 0 --nyahpepijat 1 /path/to/file.pdf
Tukar file.pdf dan tinggalkan semua fail perantaraan.
pdf2htmlEX --dest-dir keluar --benamkan fi /path/to/file.pdf
Tukar file.pdf ke out/file.html dan biarkan fail fon/imej dipisahkan.
HAKCIPTA
Hak Cipta 2012,2013 Lu Wang[e-mel dilindungi]>
pdf2htmlEX dilesenkan di bawah GPLv3 dengan syarat tambahan, baca LESEN untuk mendapatkan butiran.
Gunakan pdf2htmlEX dalam talian menggunakan perkhidmatan onworks.net