Ini adalah perintah gocr yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
gocr - alat pengenalan teks baris perintah
RINGKASAN
gocr [PILIHAN] [-i] file pnm
DESKRIPSI
gocr adalah program pengenalan karakter optik yang dapat digunakan dari baris perintah.
Dibutuhkan input dalam format PNM, PGM, PBM, PPM, atau PCX, dan menulis teks yang dikenali ke stdout.
Jika pnm fillet adalah tanda hubung tunggal, data PNM dibaca dari stdin. Jika gzip, bzip2 dan netpbm-
prog diinstal dan sistem Anda mendukung buka(3) juga pnm.gz, pnm.bz2, png, jpg,
jpeg, tiff, gif, bmp, ps (hanya satu halaman) dan eps didukung sebagai file input (bukan sebagai
input stream), di mana pnm dapat diganti dengan salah satu ppm, pgm dan pbm.
PILIHAN
-h tampilkan informasi penggunaan
-i fillet
membaca masukan dari fillet (Atau stdin if fillet adalah tanda hubung tunggal)
-o fillet
kirim output ke fillet alih-alih stdout
-e fillet
kirim kesalahan ke fillet alih-alih stderr atau stdout if fillet adalah tanda hubung
-x fillet
kemajuan output ke fillet (fillet dapat berupa nama file, nama fifo, atau deskriptor file
1....255), ini berguna bagi pengembang GUI untuk menunjukkan kemajuan OCR, file
argumen deskriptor hanya tersedia, jika dikompilasi dengan __USE_POSIX didefinisikan
-p path
jalur basis data, garis miring terakhir harus disertakan, defaultnya adalah ./db/, jalur ini akan menjadi
diisi dengan gambar karakter yang dipelajari
-f format
keluaran format dari teks yang dikenali (ISO8859_1 TeX HTML XML UTF8 ASCII), XML akan
juga menampilkan posisi dan data probabilitas
-l tingkat
atur tingkat abu-abu ke tingkat (0<160<=255, default: 0 untuk deteksi otomatis), piksel lebih gelap
milik karakter, piksel yang lebih cerah ditafsirkan sebagai latar belakang input
gambar
-d ukuran
atur ukuran debu dalam piksel (cluster yang lebih kecil dari ini dihapus), 0 berarti tidak
cluster dihapus, defaultnya adalah -1 untuk deteksi otomatis
-s num atur lebar spasi antar kata dalam satuan titik (default: 0 untuk deteksi otomatis), lebih lebar
lebar ditafsirkan sebagai spasi kata, lebih kecil sebagai spasi karakter
-v kata kerja
bertele-tele untuk stderr; kata kerja adalah medan kecil
-c string
hanya keluaran verbose karakter dari string ke stderr, lebih banyak output yang dihasilkan
untuk semua karakter dalam string, garis bawah adalah singkatan dari karakter yang tidak diketahui, ini
fungsi berguna untuk membatasi informasi debug ke yang diperlukan
-C string
hanya mengenali karakter dari string, ini adalah fungsi filter dalam kasus di mana
bunga hanya untuk bagian dari alfabet karakter, Anda dapat menggunakan 0-9 atau az untuk
tentukan rentang, gunakan -- untuk mendeteksi tanda minus
-a kepastian
atur nilai untuk kepastian pengenalan (0..100; default: 95), karakter dengan a
kepastian yang lebih tinggi diterima, karakter dengan kepastian yang lebih rendah diperlakukan sebagai
tidak diketahui (tidak dikenali); tetapkan nilai yang lebih tinggi, jika Anda hanya ingin lebih pasti
karakter yang dikenali
-u string
keluaran string ini untuk setiap karakter yang tidak dikenal (defaultnya adalah "_")
-m mode
mengatur mode operasional; mode adalah bitfield (default: 0)
-n bool
if bool bukan nol, hanya mengenali angka (ini sekarang sudah usang, gunakan -C
"0123456789")
Verbosity ditentukan sebagai bitfield:
1 cetak info lebih lanjut
2 daftar bentuk kotak (lihat -c) ke stderr
4 daftar pola kotak (lihat -c) ke stderr
8 pola cetak setelah pengakuan untuk debugging
16 cetak informasi debug tentang pengenalan garis ke stderr
32 buat outXX.png dengan kotak dan garis yang ditandai pada setiap langkah OCR umum
Mode operasi adalah:
2 menggunakan database untuk mengenali karakter yang tidak dikenali oleh orang lain
algoritma, (pengembangan awal)
4 mengaktifkan analisis tata letak atau zonasi (pengembangan)
8 jangan bandingkan karakter yang tidak dikenal dengan yang dikenali
16 jangan mencoba membagi karakter yang tumpang tindih menjadi dua atau tiga karakter tunggal
32 jangan lakukan koreksi konteks
64 pengepakan karakter, sebelum pengenalan dimulai, karakter serupa dicari
dan hanya satu dari karakter ini yang akan dikirim ke mesin pengenalan
(perkembangan)
130 memperluas basis data, meminta pengguna untuk karakter tak dikenal dan memperluas
database dengan jawaban pengguna (128+2, pengembangan awal)
256 matikan mesin pengenalan (masuk akal bersama dengan -m 2)
Gunakan gocr online menggunakan layanan onworks.net