هذا هو الأمر unidesc الذي يمكن تشغيله في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة عبر الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت
برنامج:
اسم
unidesc - وصف محتويات ملف نصي بتنسيق Unicode
موجز
com.unidesc ([اختيار الأعلام]) ( الاسم>)
إذا لم يتم توفير اسم ملف الإدخال ، com.unidesc يقرأ من المدخلات القياسية.
الوصف
com.unidesc يصف محتوى ملف نصي Unicode بالإبلاغ عن نطاقات الأحرف إلى
أي أجزاء مختلفة من النص تنتمي. النطاقات المبلغ عنها تشمل كلا الرسمية
نطاقات Unicode ونطاقات اللغة المنشأة ضمن مناطق الاستخدام الخاص المسجلة
مع سجل Unicode المجند (http://www.evertype.com/standards/csur/). لكل
مجموعة من الشخصيات ، com.unidesc يطبع الحرف أو البايت من بداية الملف
النطاق ، وإزاحة الحرف أو البايت في نهاية النطاق ، واسم النطاق.
الإزاحات تبدأ من 0.
نظرًا لأن أرقام ASCII ، يتم استخدام علامات الترقيم والمسافات البيضاء بشكل متكرر بواسطة
أنظمة الكتابة الأخرى ، يتم التعامل مع هذه الأحرف افتراضيًا على أنها محايدة ، أي ليست كذلك
تنتمي حصريًا إلى أي نطاق أحرف معين. يتم التعامل مع هذه الشخصيات على أنها
تنتمي إلى نطاق أي أحرف تسبقها.
إذا بدأ الإدخال بأحرف محايدة ، فسيتم التعامل معها على أنها تنتمي إلى النطاق
مهما كانت الشخصيات التي تتبعهم. إذا كان الملف يتكون بالكامل من أحرف محايدة ، فإن الامتداد
يتم تحديد النطاق على أنه متعدد تليها Basic لاتيني بين قوسين مربعين.
الرقم السحري الذي يحدد ترميز Unicode ليس جزءًا من معيار Unicode ، لذلك
لا تحتوي ملفات Unicode الخالصة على رقم سحري. ومع ذلك ، فإن الاتفاقيات غير الرسمية لها
نشأت لهذا الغرض. إذا كان علم سطر الأوامر -m معطى، com.unidesc سيحاول
تحديد النوع الفرعي Unicode من خلال فحص البايتات القليلة الأولى من الإدخال. إذا كان الإدخال
كواحد من النوعين المقبولين ، UTF-8 أو الترتيب الأصلي UTF-32 ، فسيتم ذلك
ثم انتقل لوصف محتويات المدخلات. خلاف ذلك ، فإنه سيبلغ عما لديه
تعلمت والخروج. لاحظ أنه إذا كان الملف يحتوي على رقم سحري ، فيجب عليك استخدام الامتداد -m
علم. بدون هذا العلم com.unidesc يفترض أن الإدخال يتكون من Unicode خالص مع
تبدأ بيانات الشخصية على الفور. لذلك سوف يلقى بها السحر
عدد.
بشكل افتراضي ، من المتوقع أن يكون الإدخال UTF-8. الطلب الأصلي UTF-32 مقبول أيضًا. UTF-32
يمكن تحديدها عبر علامة سطر الأوامر -u أو ، إذا كانت علامة سطر الأوامر -m معطى،
عبر الرقم السحري.
COMMAND خط FLAGS
-ب إعطاء إزاحات الملف بالبايت بدلاً من الأحرف.
-d تعامل مع أرقام ASCII على أنها تنتمي حصريًا إلى النطاق اللاتيني الأساسي.
-ح معلومات استخدام الطباعة.
-L قائمة نطاقات Unicode أبجديًا.
-l سرد نطاقات Unicode حسب نقطة الرمز.
-m تحقق من الرقم السحري للملف لتحديد نوع Unicode الفرعي.
-p تعامل مع علامات الترقيم ASCII على أنها تنتمي حصريًا إلى النطاق اللاتيني الأساسي.
-r بدلاً من سرد النطاقات عند مواجهتها ، ما عليك سوى سرد النطاقات التي تم اكتشافها
بعد أن تمت قراءة كل المدخلات.
-u الإدخال هو ترتيب أصلي UTF-32.
-v معلومات نسخة الطباعة.
-w تعامل مع المسافات البيضاء ASCII على أنها تنتمي حصريًا إلى النطاق اللاتيني الأساسي.
استخدم unidesc عبر الإنترنت باستخدام خدمات onworks.net