Ini adalah perintah pdf2htmlEX yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa stasiun kerja online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
pdf2htmlEX - mengonversi PDF ke HTML tanpa kehilangan teks dan format.
PENGGUNAAN
pdf2htmlEX [opsi] [ ]
DESKRIPSI
pdf2htmlEX adalah utilitas yang mengubah file PDF menjadi file HTML.
pdf2htmlEX mencoba yang terbaik untuk membuat PDF dengan tepat, mempertahankan gaya yang tepat, sementara
mempertahankan teks dan mengoptimalkan untuk Web.
Font diekstraksi dari PDF dan kemudian disematkan ke HTML, teks dalam file HTML yang dikonversi
biasanya dapat dipilih dan disalin.
Objek lain dirender sebagai gambar dan juga disematkan.
PILIHAN
Pages
-F, --halaman pertama (Bawaan: 1)
Tentukan halaman pertama yang akan diproses
-aku, --halaman terakhir (Bawaan: terakhir halaman)
Tentukan halaman terakhir untuk diproses
Ukuran
--Perbesar , --pas-lebar , --fit-tinggi
--zoom menentukan faktor zoom secara langsung; --fit-width/height menentukan maksimum
lebar/tinggi halaman, nilainya dalam piksel.
Jika beberapa nilai ditentukan, nilai minimum akan digunakan.
Jika tidak ada yang ditentukan, halaman akan dirender sebagai 72DPI.
--gunakan-cropbox <0|1> (Bawaan: 1)
Gunakan CropBox alih-alih MediaBox untuk output.
--hdpi , --vdpi (Bawaan: 144)
Tentukan DPI horizontal dan vertikal untuk gambar
Keluaran
--menanamkan
--sematkan-css <0|1> (Bawaan: 1)
--sematkan-font <0|1> (Bawaan: 1)
--sematkan-gambar <0|1> (Bawaan: 1)
--sematkan-javascript <0|1> (Bawaan: 1)
--embed-garis besar <0|1> (Bawaan: 1)
Tentukan elemen mana yang harus disematkan ke dalam file HTML keluaran.
Jika dimatikan, file terpisah akan dibuat bersama dengan file HTML untuk
elemen yang sesuai.
--embed menerima string sebagai argumen. Setiap huruf dari string harus salah satu dari
`cCfFiIjJoO`, yang sesuai dengan salah satu sakelar --embed-***. Huruf kecil
huruf untuk 0 dan huruf besar untuk 1. Misalnya, `--embed cFIJo` berarti untuk
sematkan semuanya kecuali file dan garis CSS.
--split-halaman <0|1> (Bawaan: 0)
Jika diaktifkan, konten setiap halaman disimpan dalam file terpisah.
Tombol ini berguna jika Anda ingin halaman dimuat secara terpisah & dinamis -- a
server pendukung mungkin diperlukan.
Lihat juga --page-filename.
--tujuan-dir (Bawaan: .)
Tentukan folder tujuan.
--css-nama file (Bawaan: )
Tentukan nama file dari file css yang dihasilkan, jika tidak disematkan.
Jika kosong, nama file akan ditentukan secara otomatis.
--halaman-nama file (Bawaan: )
Tentukan template nama file untuk halaman ketika --split-pages adalah 1
Placeholder %d dapat disertakan dalam `nama file` untuk menunjukkan di mana nomor halaman
harus ditempatkan. Placeholder mendukung subset terbatas dari numerik normal
placeholder, termasuk lebar yang ditentukan dan bantalan nol.
Jika `nama file` tidak berisi placeholder untuk nomor halaman, nomor halaman
akan disisipkan langsung sebelum ekstensi file. Jika nama file tidak memiliki
ekstensi, nomor halaman akan ditempatkan di akhir nama file.
Jika --page-filename tidak ditentukan, akan digunakan untuk keluaran
nama file, mengganti ekstensi dengan .page dan menambahkan nomor halaman secara langsung
sebelum ekstensi.
contoh
pdf2htmlEX --split-halaman 1 foo.pdf
Menghasilkan file halaman foo1.page, foo2.page, dll.
pdf2htmlEX --split-halaman 1 foo.pdf --halaman-nama file bar.baz
Menghasilkan file halaman bar1.baz, bar2.baz, dll.
pdf2htmlEX --split-halaman 1 foo.pdf --halaman-nama file halaman%dbar.baz
Menghasilkan file halaman page1bar.baz, page2bar.baz, dll.
pdf2htmlEX --split-halaman 1 foo.pdf --halaman-nama file bar%03d.baz
Menghasilkan file halaman bar001.baz, bar002.baz, dll.
--garis-nama file (Bawaan: )
Tentukan nama file dari file garis besar yang dihasilkan, jika tidak disematkan.
Jika kosong, nama file akan ditentukan secara otomatis.
--proses-nonteks <0|1> (Bawaan: 1)
Apakah akan memproses objek non-teks (sebagai gambar)
--proses-garis besar <0|1> (Bawaan: 1)
Apakah akan menampilkan garis besar dalam HTML yang dihasilkan
--proses-anotasi <0|1> (Bawaan: 0)
Apakah akan menampilkan anotasi dalam HTML yang dihasilkan
--proses-bentuk <0|1> (Bawaan: 0)
Apakah akan menyertakan bidang teks dan tombol radio dalam HTML yang dihasilkan
--pencetakan <0|1> (Bawaan: 1)
Aktifkan dukungan pencetakan. Menonaktifkan opsi ini dapat mengurangi ukuran CSS.
--mundur <0|1> (Bawaan: 0)
Keluaran dalam mode mundur, untuk akurasi dan kompatibilitas browser yang lebih baik, tetapi
ukuran menjadi lebih besar.
--tmp-file-ukuran-batas (Bawaan: -1)
Ini membatasi ukuran total (dalam KB) dari file-file sementara yang juga akan membatasi
ukuran total file keluaran. Ini adalah perkiraan dan akan berhenti setelah satu halaman,
setelah total ukuran file sementara lebih besar dari jumlah ini.
-1 berarti tidak ada batasan dan merupakan default.
Font
--sematkan-eksternal-font <0|1> (Bawaan: 1)
Tentukan apakah font lokal yang cocok, untuk font yang tidak disematkan dalam PDF, seharusnya
tertanam ke dalam HTML.
Jika sakelar ini dimatikan, hanya nama font yang diekspor sehingga browser web dapat mencoba
untuk menemukan font yang tepat sendiri, dan itu dapat menyebabkan masalah tentang font yang salah
metrik.
--format-font (Bawaan: wah)
Tentukan format font yang diekstrak dari file PDF.
--membusuk-ligatur <0|1> (Bawaan: 0)
Mengurai ligatur. Misalnya 'fi' -> 'f''i'.
--petunjuk otomatis <0|1> (Bawaan: 0)
Jika disetel ke 1, petunjuk akan dibuat untuk font menggunakan FontForge.
Ini mungkin didahului oleh --external-hint-tool.
--alat-petunjuk-eksternal (Bawaan: )
Jika ditentukan, alat akan dipanggil untuk meningkatkan petunjuk untuk font, ini
akan mendahului --auto-hint.
Alat tersebut akan disebut sebagai ' ', di mana sufiks akan berada
sama seperti yang ditentukan untuk --font-format.
--peregangan-sempit-mesin terbang <0|1> (Bawaan: 0)
Jika disetel ke 1, mesin terbang yang lebih sempit dari yang dijelaskan dalam PDF akan diregangkan; sebaliknya
ruang akan diisi di sebelah kanan mesin terbang
--peras-lebar-mesin terbang <0|1> (Bawaan: 1)
Jika disetel ke 1, mesin terbang yang lebih lebar dari yang dijelaskan dalam PDF akan terjepit; jika tidak maka akan
dipotong.
--override-fstype <0|1> (Bawaan: 0)
Hapus bit fstype dalam font TTF/OTF.
Aktifkan ini jika Internet Explorer mengeluh tentang 'Izin harus Dapat Diinstal'
DAN Anda memiliki izin untuk melakukannya.
--proses-tipe3 <0|1> (Bawaan: 0)
Jika diaktifkan, pdf2htmlEX akan mencoba mengonversi font Tipe 3 sehingga teks dapat
dirender secara native dalam HTML. Jika tidak, semua teks dengan font Tipe 3 akan ditampilkan
sebagai gambar.
Fitur ini sangat eksperimental.
Teks
--hep , --vep (Bawaan: 1)
Tentukan offset horizontal/vertikal maksimum yang dapat ditoleransi (dalam piksel).
pdf2htmlEX akan mencoba mengoptimalkan file HTML yang dihasilkan, memindahkan Teks di dalam ini
jarak.
--ruang-ambang (Bawaan: 0.125)
pdf2htmlEX akan menyisipkan karakter spasi ' ' jika jarak antara dua
huruf berurutan pada baris yang sama lebih lebar dari rasio * font_size.
--pengganda ukuran-font (Bawaan: 4.0)
Banyak browser web membatasi ukuran font minimum, dan banyak yang akan membulatkan font yang diberikan
ukuran, yang menghasilkan rendering yang salah.
Tentukan rasio yang lebih besar dari 1 akan menyelesaikan masalah ini, namun mungkin membeku
beberapa browser.
Namun, untuk beberapa versi Firefox, akan ada masalah ketika ukuran font
terlalu besar, dalam hal ini nilai yang lebih kecil harus ditentukan di sini.
--ruang-sebagai-offset <0|1> (Bawaan: 0)
Jika disetel ke 1, karakter spasi akan diperlakukan sebagai offset, yang memungkinkan a
optimasi.
Untuk file PDF dengan penyandian yang buruk, mengaktifkan opsi ini dapat menyebabkan kehilangan
karakter.
--tounicode <-1|0|1> (Bawaan: 0)
Peta ToUnicode dapat disediakan untuk setiap font dalam PDF yang menunjukkan 'arti'
dari karakter. Namun seringkali ada info "ToUnicode" yang lebih baik di Ketik 0/1
font, dan terkadang peta ToUnicode yang disediakan salah. Jika nilai ini disetel ke
1, Peta ToUnicode selalu diterapkan, jika disediakan dalam PDF, dan karakter tidak boleh
render dengan benar dalam HTML jika ada tabrakan.
Jika disetel ke -1, peta yang disesuaikan digunakan sehingga rendering akan benar dalam HTML
(secara visual sama), tetapi Anda mungkin tidak mendapatkan karakter yang benar dengan memilih & menyalin &
tempel.
Jika disetel ke 0, pdf2htmlEX akan mencoba yang terbaik untuk menyeimbangkan dua metode di atas.
--optimasi-teks <0|1> (Bawaan: 0)
Jika disetel ke 1, pdf2htmlEX akan mencoba mengurangi jumlah elemen HTML yang digunakan untuk
teks. Matikan jika terjadi kesalahan.
--benar-teks-visibilitas <0|1> (Bawaan: 0)
Jika disetel ke 1, pdf2htmlEX akan mencoba mendeteksi teks yang dicakup oleh grafik lain dan
mengaturnya dengan benar, yaitu teks tertutup dibuat transparan di lapisan teks, dan
digambar pada lapisan latar belakang.
Latar Belakang Gambar
--format-bg (Bawaan: png)
Tentukan format gambar latar belakang. Jalankan `pdf2htmlEX -v` untuk memeriksa semua yang didukung
format.
--svg-node-hitung-batas (Bawaan: -1)
Jika jumlah simpul dalam gambar latar belakang svg melebihi batas ini, mundur halaman ini ke
latar belakang bitmap; nilai negatif berarti tidak ada batas. Opsi ini hanya berguna ketika
'--bg-format svg' ditentukan. Perhatikan bahwa jumlah simpul dalam svg baru saja dihitung
sekitar.
--svg-sematkan-bitmap <0|1> (Bawaan: 1)
Apakah menyematkan bitmap dalam gambar latar belakang svg. 1: sematkan bitmap di latar belakang svg;
0: membuang bitmap ke file eksternal jika memungkinkan.
Opsi ini hanya berguna ketika '--bg-format svg' ditentukan dan '--embed-image'
tidak aktif.
Saat ini, bitmap RGB atau Gray JPEG dalam PDF dapat dibuang, sedangkan bitmap lainnya
format atau ruang warna masih tertanam. Jika bitmap tidak dibuang seperti yang diharapkan,
coba pra-proses PDF Anda dengan ghostscript atau akrobat dan pastikan bitmap di dalamnya
dikonversi ke format JPEG RGB/Abu-abu. Lihat wiki proyek untuk lebih jelasnya.
PDF Proteksi
-Hai, --pemilik-kata sandi
Tentukan kata sandi pemilik
-kamu, --pengguna-sandi
Tentukan kata sandi pengguna
--tanpa-drm <0|1> (Bawaan: 0)
Ganti pengaturan DRM dokumen
Aktifkan ini hanya jika Anda memiliki izin.
Lain-lain.
--bersih-tmp <0|1> (Bawaan: 1)
Jika dimatikan, file perantara tidak akan dibersihkan pada akhirnya.
--data-dir (Bawaan: /usr/berbagi/pdf2htmlEX)
Tentukan folder yang menyimpan manifes dan file lainnya (lihat di bawah untuk manifes
berkas)`
--tmp-dir (Bawaan: / Tmp or $TMPDIR if mengatur)
Tentukan folder sementara yang akan digunakan untuk file sementara
--css-draw <0|1> (Bawaan: 0)
Gambar CSS eksperimental dan tidak didukung
--debug <0|1> (Bawaan: 0)
Cetak informasi debug.
--bukti <0|1|2> (Bawaan: 0)
Keluarkan versi bukti. Jika nilai positif ditentukan, teks digambar pada keduanya
lapisan teks dan gambar latar belakang untuk perbandingan. Jika 2 ditentukan, teks di
latar belakang dalam warna yang berbeda. Jika format latar belakang png/jpg digunakan, lebih tinggi
hdpi/vdpi (misalnya 288) direkomendasikan untuk keterbacaan.
meta
-di, --Versi: kapan
Cetak hak cipta dan info versi
--membantu Cetak informasi penggunaan
NYATA dan DATA-DIR
Ketika halaman terpisah adalah 0, file manifes menjelaskan bagaimana halaman html akhir seharusnya
dihasilkan.
Secara default, pdf2htmlEX akan menggunakan manifes dalam direktori data default (jalankan `pdf2htmlEX -v`
untuk memeriksa), yang memberikan demo sederhana dari sintaksnya.
Anda dapat memodifikasi yang default, atau Anda dapat membuat yang baru dan menentukan yang benar
data-dir di baris perintah.
Semua file yang dirujuk oleh manifes harus ditempatkan di direktori data.
CONTOH
pdf2htmlEX /path/ke/file.pdf
Ubah file.pdf menjadi file.html
pdf2htmlEX --bersih-tmp 0 --debug 1 /path/ke/file.pdf
Konversikan file.pdf dan tinggalkan semua file perantara.
pdf2htmlEX --tujuan-dir di luar --menanamkan fi /path/ke/file.pdf
Ubah file.pdf menjadi out/file.html dan biarkan file font/gambar terpisah.
HAK CIPTA
Hak Cipta 2012,2013 Lu Wang[email dilindungi]>
pdf2htmlEX dilisensikan di bawah GPLv3 dengan persyaratan tambahan, baca LISENSI untuk detailnya.
Gunakan pdf2htmlEX online menggunakan layanan onworks.net