এটি হল djvu2hocr কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।
কার্যক্রম:
NAME এর
djvu2hocr - DjVu থেকে hOCR রূপান্তরকারী
সাইনোপিসিস
djvu2hocr [পছন্দ...] djvu-ফাইল
djvu2hocr {--সংস্করণ | --help | -h}
বর্ণনাঃ
djvu2hocr একটি DjVu ফাইল থেকে লুকানো পাঠ্যকে তে রূপান্তর করে এইচওসিআর[১] বিন্যাস।
বিকল্প
ইনপুট নির্বাচন অপশন
-p, --পৃষ্ঠা=পৃষ্ঠা ব্যাপ্তি
গোপন করার জন্য পৃষ্ঠাগুলি নির্দিষ্ট করে। পৃষ্ঠা ব্যাপ্তি সাব-রেঞ্জের একটি কমা দ্বারা বিভক্ত তালিকা। প্রতিটি
উপ-পরিসর হয় একটি একক পৃষ্ঠা (যেমন 17) অথবা পৃষ্ঠাগুলির একটি সংলগ্ন পরিসর
(যেমন 37-42)। পৃষ্ঠাগুলি 1 থেকে সংখ্যাযুক্ত।
ডিফল্ট সব পৃষ্ঠা রূপান্তর হয়.
পাঠ সেগমেন্টেশন অপশন
--শব্দ-বিভাজন = সরল
DjVu ফাইলে পাওয়া একই শব্দ বিভাজন ব্যবহার করুন।
এটি ডিফল্ট।
--word-segmentation=uax29
ব্যবহার ইউনিকোড পাঠ সেগমেন্টেশন[২] অ্যালগরিদম শব্দে লাইন ভাঙার জন্য, সম্ভবত
DjVu ফাইলে পাওয়া শব্দ বিভাজন ঠিক করা।
এইচটিএমএল আউটপুট অপশন
--শিরোনাম=খেতাব
নথির শিরোনাম নির্দিষ্ট করে।
ডিফল্ট হল "DjVu লুকানো পাঠ্য স্তর"।
--css=শৈলী
নথিতে নির্দিষ্ট CSS শৈলী যোগ করুন।
উদাহরণ স্বরূপ, --css='.ocrx_line { প্রদর্শন: ব্লক }' দৃশ্যত সংরক্ষণ করতে ব্যবহার করা যেতে পারে
লাইন ব্রেক.
অন্যান্য অপশন
--সংস্করণ
আউটপুট সংস্করণ তথ্য এবং প্রস্থান.
-h, --help
সাহায্য প্রদর্শন এবং প্রস্থান করুন.
পোর্টেবিলিটি
djvu2hocr অক্ষর ধরে রাখতে hOCR-তে একটি কাস্টম এক্সটেনশন ব্যবহার করে যা সরাসরি হতে পারে না
একটি HTML/XML নথিতে উপস্থাপিত। উদাহরণস্বরূপ, নিয়ন্ত্রণ অক্ষর BEL (^G, U+0007), হল
নিম্নলিখিত HTML খণ্ডে রূপান্তরিত:
onworks.net পরিষেবা ব্যবহার করে অনলাইনে djvu2hocr ব্যবহার করুন