Ini ialah arahan hocr2djvused yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
hocr2djvused - hOCR kepada djvused penukar skrip
SINOPSIS
hocr2djvused [pilihan...] [fail-hocr...]
DESCRIPTION
hocr2djvused membaca satu atau lebih hOCR[1] fail (seperti yang dihasilkan oleh OCRopus[2] atau Cuneiform[3] atau
Tesseract[4]) dan menukarkannya kepada a djvused skrip.
Melainkan nama fail diberikan secara eksplisit pada baris arahan, hOCR dibaca daripada
input standard.
PILIHAN
teks segmentasi pilihan
-t talian, --perincian talian
Rekod lokasi setiap baris. Jangan rakam lokasi perkataan tertentu atau
watak-watak.
-t perkataan, --details=perkataan
Rekod lokasi setiap baris dan setiap perkataan. Jangan rakam lokasi tertentu
watak-watak.
Ini adalah lalai.
-t kereta kebal, --details=aksara
Rakam lokasi setiap baris, setiap perkataan dan setiap aksara.
--pembahagian-perkataan=mudah
Pertimbangkan setiap jujukan bukan kosong bagi aksara bukan ruang putih satu perkataan.
Ini adalah lalai, walaupun secara linguistik tidak betul.
--pembahagian-perkataan=uax29
Menggunakan Unicode teks Segmentation[5] algoritma untuk memecahkan baris menjadi perkataan.
Pilihan ini memecahkan andaian beberapa alat DjVu bahawa perkataan dipisahkan oleh ruang,
dan oleh itu adakah ia tidak disyorkan.
lain-lain pilihan
--putaran=n
Andaikan bahawa halaman DjVu diputar oleh n darjah.
--saiz halaman=lebarxketinggian
Menentukan saiz halaman itu lebar piksel × ketinggian piksel.
Pilihan ini diperlukan untuk hOCR yang dijana oleh Cuneiform (< 0.8) dan berlebihan
sebaliknya.
--html5
Gunakan HTML5 parser[6], yang lebih teguh tetapi lebih perlahan daripada penghurai lalai.
--fix-utf8
Cuba untuk membetulkan isu pengekodan UTF-8 dan menghapuskan aksara kawalan yang tidak diingini.
Pilihan ini mungkin diperlukan untuk hOCR yang dijana oleh Cuneiform[7] atau Tesseract[8].
--versi
Maklumat versi keluaran dan keluar.
-h, - membantu
Paparkan bantuan dan keluar.
Gunakan hocr2djvused dalam talian menggunakan perkhidmatan onworks.net