यह कमांड gocr है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर में से एक का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
gocr - कमांड लाइन टेक्स्ट रिकग्निशन टूल
SYNOPSIS
गोक्र [विकल्प] [-i] पीएनएम-फ़ाइल
वर्णन
gocr एक ऑप्टिकल कैरेक्टर रिकग्निशन प्रोग्राम है जिसे कमांड लाइन से इस्तेमाल किया जा सकता है।
यह पीएनएम, पीजीएम, पीबीएम, पीपीएम, या पीसीएक्स प्रारूप में इनपुट लेता है, और मान्यता प्राप्त पाठ लिखता है stdout.
अगर पीएनएम पट्टिका एक एकल डैश है, पीएनएम डेटा से पढ़ा जाता है stdin. अगर gzip, bzip2 और netpbm-
प्रोग स्थापित हैं और आपका सिस्टम समर्थन करता है पोप करना(3) भी pnm.gz, pnm.bz2, png, jpg,
जेपीईजी, टिफ, जीआईएफ, बीएमपी, पीएस (केवल सिंगल पेज) और ईपीएस इनपुट फाइलों के रूप में समर्थित हैं (जैसा नहीं है
इनपुट स्ट्रीम), जहां पीएनएम को पीपीएम, पीजीएम और पीबीएम में से एक से बदला जा सकता है।
विकल्प
-h उपयोग की जानकारी दिखाएं
-i पट्टिका
से इनपुट पढ़ें पट्टिका (या stdin if पट्टिका एक एकल डैश है)
-o पट्टिका
को आउटपुट भेजें पट्टिका के बजाय stdout
-e पट्टिका
त्रुटियाँ भेजें पट्टिका के बजाय stderr या करने के लिए stdout if पट्टिका एक पानी का छींटा है
-x पट्टिका
प्रगति उत्पादन करने के लिए पट्टिका (पट्टिका फ़ाइल नाम, फीफो नाम या फ़ाइल विवरणक हो सकता है
1...255), यह GUI डेवलपर्स के लिए OCR प्रगति दिखाने के लिए उपयोगी है, फ़ाइल
डिस्क्रिप्टर तर्क केवल तभी उपलब्ध होता है, जब __USE_POSIX परिभाषित के साथ संकलित किया जाता है
-p पथ
डेटाबेस पथ, एक अंतिम स्लैश शामिल किया जाना चाहिए, डिफ़ॉल्ट है ./db/, यह पथ होगा
सीखे हुए पात्रों की छवियों से भरा हुआ
-f प्रारूप
उत्पादन प्रारूप मान्यता प्राप्त पाठ का (ISO8859_1 TeX HTML XML UTF8 ASCII), XML होगा
आउटपुट स्थिति और संभाव्यता डेटा भी
-l स्तर
ग्रे स्तर को पर सेट करें स्तर (0<160<=255, डिफ़ॉल्ट: 0 स्वत: पता लगाने के लिए), गहरा पिक्सेल
वर्णों से संबंधित हैं, उज्जवल पिक्सेल को इनपुट की पृष्ठभूमि के रूप में व्याख्यायित किया जाता है
की छवि
-d आकार
पिक्सेल में धूल का आकार सेट करें (इससे छोटे क्लस्टर हटा दिए जाते हैं), 0 का अर्थ है नहीं
क्लस्टर हटा दिए जाते हैं, ऑटो डिटेक्शन के लिए डिफ़ॉल्ट -1 है
-s संख्या डॉट्स की इकाइयों में शब्दों के बीच स्पेसविड्थ सेट करें (डिफ़ॉल्ट: 0 ऑटोडेटेक्ट के लिए), व्यापक
चौड़ाई को शब्द रिक्त स्थान के रूप में व्याख्या किया जाता है, वर्ण रिक्त स्थान के रूप में छोटा होता है
-v शब्दाडंबर
stderr के लिए क्रियात्मक होना; शब्दाडंबर एक बिटफील्ड है
-c स्ट्रिंग
से वर्णों का केवल वर्बोज़ आउटपुट स्ट्रिंग stderr के लिए, अधिक आउटपुट उत्पन्न होता है
स्ट्रिंग के भीतर सभी वर्णों के लिए, अंडरस्कोर अज्ञात वर्णों के लिए है, यह
डिबग जानकारी को आवश्यक तक सीमित करने के लिए फ़ंक्शन उपयोगी है
-C स्ट्रिंग
केवल पात्रों को पहचानें स्ट्रिंग, यह उन मामलों में एक फ़िल्टर फ़ंक्शन है जहां
रुचि केवल वर्ण वर्णमाला के एक भाग के लिए है, आप 0-9 या az to . का उपयोग कर सकते हैं
श्रेणी निर्दिष्ट करें, उपयोग करें -- ऋण चिह्न का पता लगाने के लिए
-a निश्चय
मान्यता की निश्चितता के लिए मान सेट करें (0..100; डिफ़ॉल्ट: 95), वर्ण a . के साथ
उच्च निश्चितता स्वीकार की जाती है, कम निश्चितता वाले वर्णों को माना जाता है
अज्ञात (पहचान नहीं); उच्च मान सेट करें, यदि आप केवल अधिक निश्चित होना चाहते हैं
मान्यता प्राप्त वर्ण
-u स्ट्रिंग
प्रत्येक अपरिचित वर्ण के लिए इस स्ट्रिंग को आउटपुट करें (डिफ़ॉल्ट "_" है)
-m मोड
ऑपरेशनल मोड सेट करें; मोड एक बिटफ़ील्ड है (डिफ़ॉल्ट: 0)
-n bool
if bool गैर-शून्य है, केवल संख्याओं को पहचानें (यह अब अप्रचलित है, -C . का उपयोग करें)
"0123456789")
वर्बोसिटी को बिटफील्ड के रूप में निर्दिष्ट किया गया है:
1 अधिक जानकारी प्रिंट करें
2 बक्से के आकार की सूची (देखें -c) से stderr
4 बक्से की सूची पैटर्न (देखें-सी) से stderr
8 डिबगिंग के लिए मान्यता के बाद प्रिंट पैटर्न
16 stderr को लाइनों की पहचान के बारे में डिबग जानकारी प्रिंट करें
32 प्रत्येक सामान्य ओसीआर-चरण पर चिह्नित बक्से और लाइनों के साथ outXX.png बनाएं
ऑपरेशन मोड हैं:
2 उन पात्रों को पहचानने के लिए डेटाबेस का उपयोग करें जिन्हें अन्य द्वारा पहचाना नहीं गया है
एल्गोरिदम, (प्रारंभिक विकास)
4 लेआउट विश्लेषण या ज़ोनिंग (विकास) पर स्विच करना
8 अपरिचित वर्णों की तुलना पहचाने गए वर्णों से न करें
16 अतिव्यापी वर्णों को दो या तीन एकल वर्णों में विभाजित करने का प्रयास न करें
32 संदर्भ सुधार न करें
64 चरित्र पैकिंग, पहचान शुरू होने से पहले, समान वर्ण खोजे जाते हैं
और इस वर्ण में से केवल एक ही पहचान इंजन को भेजा जाएगा
(विकास)
130 डेटाबेस का विस्तार करें, अज्ञात वर्णों के लिए उपयोगकर्ता को संकेत दें और विस्तार करें
उपयोगकर्ताओं के उत्तर के साथ डेटाबेस (128+2, प्रारंभिक विकास)
256 पहचान इंजन बंद करें (-एम 2 के साथ मिलकर समझ में आता है)
onworks.net सेवाओं का उपयोग करके ऑनलाइन gocr का उपयोग करें