Это команда ascii2uni, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
ascii2uni - конвертировать 7-битные представления ASCII в UTF-8 Unicode
СИНТАКСИС
ascii2uni [опции] ( файл имя>)
ОПИСАНИЕ
ascii2uni преобразует различные 7-битные представления ASCII в UTF-8. Он читается из
стандартный ввод и записывает на стандартный вывод. Понятные представления
перечисленные ниже в параметрах командной строки. Если формат не указан, стандартный
предполагается шестнадцатеричный формат (например, 0x00e9).
КОМАНДА ЛИНИЯ ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
-a Преобразование из указанного формата. Форматы могут быть указаны с помощью
следующие произвольные односимвольные коды с помощью таких имен, как "SGML_decimal", и
на примерах желаемого формата.
A Преобразуйте шестнадцатеричные числа с префиксом U в угловые скобки ( ).
B Преобразовать шестнадцатеричный код с экранированием \ x (например, \ x00E9)
C Преобразуйте экранированные шестнадцатеричные числа \ x в фигурные скобки (например, \ x {00E9}).
D Преобразование десятичных ссылок на числовые символы HTML (например, é)
E Шестнадцатеричное преобразование с префиксом U (U00E9).
F Преобразуйте шестнадцатеричное с префиксом u (u00E9).
G Преобразуйте шестнадцатеричное число в одинарные кавычки с префиксом X (например, X'00E9 ').
H Преобразование шестнадцатеричных ссылок на числовые символы HTML (например, é)
I Преобразуйте шестнадцатеричный кодекс UTF-8 с каждым шестнадцатеричным байтом, которому предшествует знак = (например,
= C3 = A9). Это формат цитируемой печати, определенный в RFC 2045.
J Преобразование шестнадцатеричного UTF-8 с шестнадцатеричным байтом, которому предшествует знак% (например,
% C3% A9). Это формат URIescape, определенный в RFC 2396.
K Преобразование восьмеричного UTF-8 с экранированием каждого байта обратной косой чертой (например, \ 303 \ 251)
L Преобразование \ U-экранированного гексагона вне BMP, \ u-экранированного гексагона внутри BMP
(U + 0000-U + FFFF).
M Преобразование шестнадцатеричных ссылок на числовые символы SGML (например, \ # xE9;)
N Преобразование десятичных ссылок на числовые символы SGML (например, \ # 233;)
O Преобразуйте восьмеричные escape-последовательности для трех младших байтов в обратном порядке (например,
\ 000 \ 000 \ 351))
P Преобразование шестнадцатеричных чисел с префиксом U + (например, U + 00E9)
Q Преобразование сущностей символов HTML (например, é).
R Преобразование необработанных шестнадцатеричных чисел (например, 00E9)
S Преобразуйте шестнадцатеричные escape-последовательности для трех младших байтов в обратном порядке (например,
\ x00 \ x00 \ xE9)
T Преобразуйте десятичные escape-последовательности для трех младших байтов в обратном порядке (например,
\ d000 \ d000 \ d233)
U Преобразование \ u-экранированных шестнадцатеричных чисел (например, \ u00E9).
V Преобразование \ u-экранированных десятичных чисел (например, \ u00233).
X Преобразуйте стандартные шестнадцатеричные числа (например, 0x00E9).
Y Преобразуйте все три типа экранирования HTML: шестнадцатеричный и десятичный символ.
ссылки и символьные сущности.
0 Преобразование шестнадцатеричного UTF-8 с шестнадцатеричным числом каждого байта, заключенным в угловые скобки
(например ).
1 Преобразование шестнадцатеричных чисел в формате Common Lisp (например, # x00E9).
2 Преобразуйте десятичные числа в формате Perl с префиксом v (например, v233).
3 Преобразуйте шестнадцатеричные числа с префиксом $ (например, $ 00E9).
4 Преобразование шестнадцатеричных чисел в формате Postscript с префиксом 16 # (например, 16 # 00E9).
5 Преобразование шестнадцатеричных чисел в формате Common Lisp с префиксом # 16r (например, # 16r00E9).
6 Преобразование шестнадцатеричных чисел формата ADA с префиксом 16 # и суффиксом # (например,
16 # 00E9 #).
7 Преобразуйте шестнадцатеричный формат журнала Apache UTF-8 с шестнадцатеричным числом перед каждым байтом
обратная косая черта-x (например, \ xC3 \ xA9).
8 Преобразование шестнадцатеричных чисел формата Microsoft OOXML с префиксом _x и суффиксом _
(например, _x00E9_).
9 Преобразуйте% \ u-экранированные шестнадцатеричные числа (например,% \ u00E9).
-h Помощь. Распечатайте сообщение об использовании и выйдите.
-v Распечатайте информацию о версии программы и выйдите.
-m Принимать устаревшие объекты HTML без конечной точки с запятой, например "é" на месте
из «Мэтт».
-p Чистый. Предположим, что входные данные полностью состоят из экранирований, за исключением произвольных (но
ненулевое значение) количество разделительных пробелов.
-q Будь спокоен. Не болтайте без надобности.
-Z
Преобразуйте ввод, используя предоставленный формат. Указанный формат будет использоваться в качестве
строка формата при вызове sscanf(3) с одним аргументом, состоящим из указателя
в длинное целое число без знака. Например, чтобы получить те же результаты, что и с -U
flag, формат будет: \ u% 04X.
Если используется формат Quoted-Printable, хотя, строго говоря, это не преобразование
Преобразование ASCII в Unicode в соответствии с RFC 2045, если в конце стоит знак равенства
входной строки пропускаются как знак равенства, так и следующая за ним новая строка.
Все параметры, которые принимают шестнадцатеричный ввод, распознают шестнадцатеричные числа как в верхнем, так и в нижнем регистре.
цифры.
ВЫХОД статус
При выходе возвращаются следующие значения:
0 УСПЕХ
Вход был успешно преобразован.
3 ИНФОРМАЦИЯ Пользователь запросил такую информацию, как номер версии или описание использования и
это было предусмотрено.
5 ПЛОХОЙ ВАРИАНТ
В командной строке указан неверный флаг параметра.
7 КОНЕЧНО ПАМЯТЬ
Не удалось запросить дополнительную память.
8 ПЛОХОЙ РЕКОРД
На входе обнаружена некорректная запись.
Используйте ascii2uni онлайн с помощью сервисов onworks.net