এটি হল gocr কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।
কার্যক্রম:
NAME এর
gocr - কমান্ড লাইন পাঠ্য শনাক্তকরণ টুল
সাইনোপিসিস
gocr [অনুযায়ী OPTION] [-i] pnm-ফাইল
বর্ণনাঃ
gocr হল একটি অপটিক্যাল ক্যারেক্টার রিকগনিশন প্রোগ্রাম যা কমান্ড লাইন থেকে ব্যবহার করা যেতে পারে।
এটি PNM, PGM, PBM, PPM, বা PCX ফর্ম্যাটে ইনপুট নেয় এবং স্বীকৃত পাঠ্য লেখে stdout.
যদি pnm ফাইল একটি একক ড্যাশ, পিএনএম ডেটা থেকে পড়া হয় stdin. যদি gzip, bzip2 এবং netpbm-
progs ইনস্টল করা হয় এবং আপনার সিস্টেম সমর্থন করে পোপেন(3) এছাড়াও pnm.gz, pnm.bz2, png, jpg,
jpeg, tiff, gif, bmp, ps (শুধুমাত্র একক পৃষ্ঠা) এবং eps ইনপুট ফাইল হিসাবে সমর্থিত (এর মতো নয়
ইনপুট স্ট্রীম), যেখানে pnm ppm, pgm এবং pbm এর একটি দ্বারা প্রতিস্থাপিত হতে পারে।
বিকল্প
-h ব্যবহারের তথ্য দেখান
-i ফাইল
থেকে ইনপুট পড়ুন ফাইল (অথবা stdin if ফাইল একটি একক ড্যাশ)
-o ফাইল
আউটপুট পাঠান ফাইল পরিবর্তে stdout
-e ফাইল
ত্রুটি পাঠান ফাইল পরিবর্তে stderr অথবা stdout if ফাইল একটি ড্যাশ হয়
-x ফাইল
অগ্রগতি আউটপুট ফাইল (ফাইল একটি ফাইলের নাম, একটি ফিফো নাম বা একটি ফাইল বর্ণনাকারী হতে পারে
1...255), এটি GUI বিকাশকারীদের জন্য OCR অগ্রগতি, ফাইলটি দেখানোর জন্য দরকারী
বর্ণনাকারী যুক্তি শুধুমাত্র উপলব্ধ, যদি __USE_POSIX সংজ্ঞায়িত করা হয়
-p পথ
ডাটাবেস পাথ, একটি চূড়ান্ত স্ল্যাশ অন্তর্ভুক্ত করা আবশ্যক, ডিফল্ট হল ./db/, এই পথটি হবে
শেখা চরিত্রের ইমেজ দ্বারা জনবহুল
-f বিন্যাস
আউটপুট বিন্যাস স্বীকৃত পাঠ্যের (ISO8859_1 TeX HTML XML UTF8 ASCII), XML করবে
আউটপুট অবস্থান এবং সম্ভাব্যতা তথ্য
-l স্তর
ধূসর স্তর সেট করুন স্তর (0<160<=255, ডিফল্ট: স্বয়ংক্রিয় সনাক্তকরণের জন্য 0), গাঢ় পিক্সেল
অক্ষরের অন্তর্গত, উজ্জ্বল পিক্সেলগুলি ইনপুটের পটভূমি হিসাবে ব্যাখ্যা করা হয়
ভাবমূর্তি
-d আয়তন
পিক্সেলে ধুলোর আকার সেট করুন (এর চেয়ে ছোট ক্লাস্টারগুলি সরানো হয়), 0 মানে না
ক্লাস্টারগুলি সরানো হয়েছে, স্বয়ংক্রিয় সনাক্তকরণের জন্য ডিফল্ট -1
-s NUM বিন্দুর এককের শব্দের মধ্যে স্থান প্রস্থ নির্ধারণ করুন (ডিফল্ট: স্বয়ংক্রিয় সনাক্তকরণের জন্য 0), আরও প্রশস্ত
প্রস্থকে শব্দ স্পেস হিসাবে ব্যাখ্যা করা হয়, অক্ষর স্পেস হিসাবে ছোট
-v শব্দচয়ন
verbose to stderr হতে; শব্দচয়ন একটি বিটফিল্ড
-c স্ট্রিং
থেকে অক্ষরের শুধুমাত্র ভার্বোস আউটপুট স্ট্রিং stderr-এ, আরও আউটপুট তৈরি হয়
স্ট্রিংয়ের মধ্যে সমস্ত অক্ষরের জন্য, আন্ডারস্কোর অজানা অক্ষরগুলির জন্য দাঁড়িয়েছে, এটি
প্রয়োজনীয় তথ্য ডিবাগ তথ্য সীমাবদ্ধ করার জন্য ফাংশন দরকারী
-C স্ট্রিং
শুধুমাত্র থেকে অক্ষর চিনতে স্ট্রিং, এই ক্ষেত্রে একটি ফিল্টার ফাংশন যেখানে
আগ্রহ শুধুমাত্র অক্ষর বর্ণমালার একটি অংশে, আপনি 0-9 বা az ব্যবহার করতে পারেন
পরিসীমা নির্দিষ্ট করুন, বিয়োগ চিহ্ন সনাক্ত করতে -- ব্যবহার করুন
-a নিশ্চয়তা
স্বীকৃতির নিশ্চিততার জন্য মান সেট করুন (0..100; ডিফল্ট: 95), a সহ অক্ষর
উচ্চতর নিশ্চিততা গ্রহণ করা হয়, কম নিশ্চিততার সাথে অক্ষর হিসাবে বিবেচিত হয়
unknown (স্বীকৃত নয়); উচ্চতর মান সেট করুন, যদি আপনি আরও নির্দিষ্ট করতে চান
স্বীকৃত অক্ষর
-u স্ট্রিং
প্রতিটি অচেনা অক্ষরের জন্য এই স্ট্রিংটি আউটপুট করুন (ডিফল্ট হল "_")
-m মোড
অপারেশনাল মোড সেট করুন; মোড একটি বিটফিল্ড (ডিফল্ট: 0)
-n bool,
if bool, অ-শূন্য, শুধুমাত্র সংখ্যা সনাক্ত করুন (এটি এখন অপ্রচলিত, -C ব্যবহার করুন
"0123456789")
verbosity একটি বিটফিল্ড হিসাবে নির্দিষ্ট করা হয়েছে:
1 আরও তথ্য প্রিন্ট করুন
2 বাক্সের আকারের তালিকা (দেখুন -c) থেকে stderr
4 বাক্সের তালিকা প্যাটার্ন (দেখুন -c) থেকে stderr
8 ডিবাগিংয়ের জন্য স্বীকৃতির পরে প্রিন্ট প্যাটার্ন
16 stderr এ লাইনের স্বীকৃতি সম্পর্কে ডিবাগ তথ্য মুদ্রণ করুন
32 প্রতিটি সাধারণ OCR-ধাপে চিহ্নিত বক্স এবং লাইন দিয়ে outXX.png তৈরি করুন
অপারেশন মোড হল:
2 অক্ষর চিনতে ডাটাবেস ব্যবহার করুন যা অন্যদের দ্বারা স্বীকৃত নয়
অ্যালগরিদম, (প্রাথমিক বিকাশ)
4 লেআউট বিশ্লেষণ বা জোনিং চালু করা (উন্নয়ন)
8 স্বীকৃত অক্ষরের সাথে অচেনা অক্ষরের তুলনা করবেন না
16 ওভারল্যাপিং অক্ষরকে দুই বা তিনটি একক অক্ষরে ভাগ করার চেষ্টা করবেন না
32 প্রসঙ্গ সংশোধন করবেন না
64 অক্ষর প্যাকিং, স্বীকৃতি শুরু হওয়ার আগে, অনুরূপ অক্ষর অনুসন্ধান করা হয়
এবং এই অক্ষরের মধ্যে শুধুমাত্র একটি স্বীকৃতি ইঞ্জিনে পাঠানো হবে
(উন্নয়ন)
130 ডাটাবেস প্রসারিত করে, ব্যবহারকারীকে অজ্ঞাত অক্ষরের জন্য অনুরোধ করে এবং প্রসারিত করে
ব্যবহারকারীদের উত্তর সহ ডাটাবেস (128+2, প্রাথমিক বিকাশ)
256 স্বীকৃতি ইঞ্জিন বন্ধ করুন (-m 2 এর সাথে একত্রে বোঝা যায়)
onworks.net পরিষেবা ব্যবহার করে অনলাইনে gocr ব্যবহার করুন