EnglishFrenchSpanyol

Favicon OnWorks

hocr2djvused - Dalam Talian di Awan

Jalankan hocr2djvused dalam penyedia pengehosan percuma OnWorks melalui Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS

Ini ialah arahan hocr2djvused yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.

JADUAL:

NAMA


hocr2djvused - hOCR kepada djvused penukar skrip

SINOPSIS


hocr2djvused [pilihan...] [fail-hocr...]

DESCRIPTION


hocr2djvused membaca satu atau lebih hOCR[1] fail (seperti yang dihasilkan oleh OCRopus[2] atau Cuneiform[3] atau
Tesseract[4]) dan menukarkannya kepada a djvused skrip.

Melainkan nama fail diberikan secara eksplisit pada baris arahan, hOCR dibaca daripada
input standard.

PILIHAN


teks segmentasi pilihan
-t talian, --perincian talian
Rekod lokasi setiap baris. Jangan rakam lokasi perkataan tertentu atau
watak-watak.

-t perkataan, --details=perkataan
Rekod lokasi setiap baris dan setiap perkataan. Jangan rakam lokasi tertentu
watak-watak.

Ini adalah lalai.

-t kereta kebal, --details=aksara
Rakam lokasi setiap baris, setiap perkataan dan setiap aksara.

--pembahagian-perkataan=mudah
Pertimbangkan setiap jujukan bukan kosong bagi aksara bukan ruang putih satu perkataan.

Ini adalah lalai, walaupun secara linguistik tidak betul.

--pembahagian-perkataan=uax29
Menggunakan Unicode teks Segmentation[5] algoritma untuk memecahkan baris menjadi perkataan.

Pilihan ini memecahkan andaian beberapa alat DjVu bahawa perkataan dipisahkan oleh ruang,
dan oleh itu adakah ia tidak disyorkan.

lain-lain pilihan
--putaran=n
Andaikan bahawa halaman DjVu diputar oleh n darjah.

--saiz halaman=lebarxketinggian
Menentukan saiz halaman itu lebar piksel × ketinggian piksel.

Pilihan ini diperlukan untuk hOCR yang dijana oleh Cuneiform (< 0.8) dan berlebihan
sebaliknya.

--html5
Gunakan HTML5 parser[6], yang lebih teguh tetapi lebih perlahan daripada penghurai lalai.

--fix-utf8
Cuba untuk membetulkan isu pengekodan UTF-8 dan menghapuskan aksara kawalan yang tidak diingini.

Pilihan ini mungkin diperlukan untuk hOCR yang dijana oleh Cuneiform[7] atau Tesseract[8].

--versi
Maklumat versi keluaran dan keluar.

-h, - membantu
Paparkan bantuan dan keluar.

Gunakan hocr2djvused dalam talian menggunakan perkhidmatan onworks.net


Pelayan & Stesen Kerja Percuma

Muat turun apl Windows & Linux

Arahan Linux

Ad