এটি ইউনিডেস্ক কমান্ড যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।
কার্যক্রম:
NAME এর
unidesc - একটি ইউনিকোড টেক্সট ফাইলের বিষয়বস্তু বর্ণনা করুন
সাইনোপিসিস
unidesc ([বিকল্প পতাকা]) ( নাম>)
যদি কোন ইনপুট ফাইলের নাম সরবরাহ করা না হয়, unidesc স্ট্যান্ডার্ড ইনপুট থেকে পড়ে।
বর্ণনাঃ
unidesc একটি ইউনিকোড টেক্সট ফাইলের বিষয়বস্তু বর্ণনা করে ক্যারেক্টার রেঞ্জে রিপোর্ট করে
যা পাঠ্যের বিভিন্ন অংশের অন্তর্গত। রিপোর্ট করা রেঞ্জ উভয় অফিসিয়াল অন্তর্ভুক্ত
ইউনিকোড ব্যাপ্তি এবং নিবন্ধিত ব্যক্তিগত ব্যবহারের এলাকার মধ্যে নির্মিত ভাষার রেঞ্জ
কনস্ক্রিপ্ট ইউনিকোড রেজিস্ট্রি সহ (http://www.evertype.com/standards/csur/) প্রতিটির জন্য, প্রত্যেকটির জন্য
অক্ষরের পরিসীমা, unidesc এর শুরুর অক্ষর বা বাইট অফসেট প্রিন্ট করে
পরিসর, পরিসরের শেষের অক্ষর বা বাইট অফসেট এবং ব্যাপ্তির নাম।
অফসেটগুলি 0 থেকে শুরু হয়।
যেহেতু ASCII সংখ্যা, বিরাম চিহ্ন এবং হোয়াইটস্পেস অক্ষরগুলি প্রায়শই ব্যবহৃত হয়
অন্যান্য লেখার সিস্টেমে, ডিফল্টরূপে এই অক্ষরগুলিকে নিরপেক্ষ হিসাবে বিবেচনা করা হয়, অর্থাৎ যেমন নয়
কোনো নির্দিষ্ট অক্ষর পরিসরের একচেটিয়াভাবে অন্তর্গত। এই অক্ষর হিসাবে বিবেচনা করা হয়
তাদের পূর্ববর্তী যে কোন অক্ষরগুলির পরিসরের অন্তর্গত।
যদি ইনপুটটি নিরপেক্ষ অক্ষর দিয়ে শুরু হয়, তবে সেগুলিকে এর পরিসরের অন্তর্গত হিসাবে গণ্য করা হয়
যাই হোক না কেন অক্ষর তাদের অনুসরণ. ফাইল সম্পূর্ণরূপে নিরপেক্ষ অক্ষর গঠিত হলে,
পরিসীমা হিসাবে চিহ্নিত করা হয় নিরপেক্ষ দ্বারা অনুসরণ মৌলিক ল্যাটিন বর্গাকার বন্ধনীতে।
ইউনিকোড এনকোডিং সনাক্তকারী একটি ম্যাজিক নম্বর ইউনিকোড স্ট্যান্ডার্ডের অংশ নয়, তাই
বিশুদ্ধ ইউনিকোড ফাইলে কোনো ম্যাজিক নম্বর থাকে না। যাইহোক, অনানুষ্ঠানিক সম্মেলন আছে
এই উদ্দেশ্যে উদ্ভূত। কমান্ড লাইন পতাকা যদি -m দেওয়া হয়, unidesc করার চেষ্টা করবে
ইনপুটের প্রথম কয়েকটি বাইট পরীক্ষা করে ইউনিকোড সাবটাইপ সনাক্ত করুন। ইনপুট হলে
দুটি গ্রহণযোগ্য প্রকারের একটি হিসাবে চিহ্নিত করা হয়, UTF-8 বা নেটিভ অর্ডার UTF-32, এটি হবে
তারপর ইনপুটের বিষয়বস্তু বর্ণনা করতে এগিয়ে যান। অন্যথায়, এটি যা আছে তা রিপোর্ট করবে
শিখেছি এবং প্রস্থান. মনে রাখবেন যে যদি ফাইলটিতে একটি ম্যাজিক নম্বর থাকে তবে আপনাকে অবশ্যই ব্যবহার করতে হবে -m
পতাকা এই পতাকা ছাড়া unidesc অনুমান করে যে ইনপুটটিতে বিশুদ্ধ ইউনিকোড রয়েছে
অক্ষর তথ্য অবিলম্বে শুরু। তাই জাদু দ্বারা এটি নিক্ষিপ্ত হবে
সংখ্যা।
ডিফল্টরূপে, ইনপুট UTF-8 হবে বলে আশা করা হচ্ছে। নেটিভ অর্ডার UTF-32ও গ্রহণযোগ্য। UTF-32
কমান্ড লাইন পতাকার মাধ্যমে নির্দিষ্ট করা যেতে পারে -u অথবা, যদি কমান্ড লাইন পতাকা -m দেওয়া হয়,
ম্যাজিক নম্বরের মাধ্যমে।
কমান্ড লাইন ফ্ল্যাগস
-b অক্ষরের পরিবর্তে বাইটে ফাইল অফসেট দিন।
-d ASCII সংখ্যাগুলিকে একচেটিয়াভাবে বেসিক ল্যাটিন পরিসরের অন্তর্গত হিসাবে বিবেচনা করুন৷
-h ব্যবহারের তথ্য মুদ্রণ করুন।
-L ইউনিকোড রেঞ্জ বর্ণানুক্রমিকভাবে তালিকাভুক্ত করুন।
-l কোডপয়েন্ট দ্বারা ইউনিকোড রেঞ্জ তালিকাভুক্ত করুন।
-m ইউনিকোড সাবটাইপ নির্ধারণ করতে ফাইলের ম্যাজিক নম্বর পরীক্ষা করুন।
-p ASCII বিরাম চিহ্নকে একচেটিয়াভাবে বেসিক ল্যাটিন পরিসরের অন্তর্গত হিসাবে বিবেচনা করুন।
-r তালিকাভুক্ত রেঞ্জগুলির সম্মুখীন হওয়ার পরিবর্তে, শুধুমাত্র সনাক্ত করা ব্যাপ্তিগুলি তালিকাভুক্ত করুন
সব ইনপুট পড়া হয়েছে পরে.
-u ইনপুট হল নেটিভ অর্ডার UTF-32।
-v প্রিন্ট সংস্করণ তথ্য।
-w ASCII হোয়াইটস্পেসকে একচেটিয়াভাবে বেসিক ল্যাটিন পরিসরের অন্তর্গত হিসাবে বিবেচনা করুন।
onworks.net পরিষেবা ব্যবহার করে unidesc অনলাইন ব্যবহার করুন