这是 uni2ascii 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
uni2ascii - 将 UTF-8 Unicode 转换为各种 7 位 ASCII 表示
概要
uni2ascii [选项] ( 文件 名称>)
商品描述
uni2ascii 将 UTF-8 Unicode 转换为各种 7 位 ASCII 表示。 如果没有格式
指定,使用标准的十六进制格式(例如 0x00e9)。 它从标准中读取
输入并写入标准输出。
命令行选项是:
-A 列出由 -y 标志执行的单个字符近似值。
-a
转换为指定格式。 可以通过以下方式指定格式
任意单个字符代码,通过诸如“SGML_decimal”之类的名称,以及
所需格式的示例。
A 在尖括号中生成前缀为 U 的十六进制数 ( )。
B 生成 \x 转义的十六进制(例如 \x00E9)
C 在大括号中生成 \x 转义的十六进制数(例如 \x{00E9})。
D 生成十进制 HTML 数字字符引用(例如 é)
E 生成带有前缀 U 的十六进制 (U00E9)。
F 生成带有前缀 u (u00E9) 的十六进制。
G 将十六进制转换为带前缀 X 的单引号(例如 X'00E9')。
H 生成十六进制 HTML 数字字符引用(例如 é)
I 生成十六进制 UTF-8,每个字节的十六进制前面带有一个 =-sign(例如
=C3=A9)。 这是 RFC 2045 定义的引用打印格式。
J 生成十六进制 UTF-8,每个字节的十六进制前面带有一个 % 符号(例如
%C3%A9)。 这是 RFC 2396 定义的 URI 转义格式。
K 生成八进制 UTF-8,每个字节用反斜杠转义(例如 \303\251)
L 在 BMP 外生成 \U 转义的十六进制,在 BMP 内生成 \u 转义的十六进制
(U+0000-U+FFFF)。
M 生成十六进制 SGML 数字字符引用(例如 \#xE9;)
N 生成十进制 SGML 数字字符引用(例如 \#233;)
O 以大端顺序为三个低字节生成八进制转义符(例如
\000\000\351))
P 生成带有前缀 U+ 的十六进制数(例如 U+00E9)
Q 尽可能生成字符实体(例如é),否则为十六进制
数字字符引用。
R 生成原始十六进制数(例如 00E9)
S 为大端顺序的三个低字节生成十六进制转义(例如
\x00\x00\xE9)
T 以大端顺序为三个低字节生成十进制转义(例如
\d000\d000\d233)
U 生成 \u 转义的十六进制数(例如 \u00E9)。
V 生成 \u 转义的十进制数(例如 \u00233)。
X 生成标准的十六进制数(例如 0x00E9)。
0 生成十六进制 UTF-8,每个字节的十六进制用尖括号括起来
(例如)。
1 生成 Common Lisp 格式的十六进制数(例如#x00E9)。
2 生成带有前缀 v 的 Perl 格式的十进制数(例如 v233)。
3 生成带有前缀 $ 的十六进制数字(例如 $00E9)。
4 生成带有前缀 16#(例如 16#00E9)的 Postscript 格式的十六进制数。
5 生成带有前缀#16r(例如#16r00E9)的Common Lisp 格式的十六进制数。
6 生成前缀为 16# 和后缀 # 的 ADA 格式的十六进制数(例如
16#00E9#)。
7 生成 Apache 日志格式的十六进制 UTF-8,每个字节的十六进制前面都有一个
反斜杠-x(例如\xC3\xA9)。
8 生成带有前缀 _x 和后缀 _ 的 Microsoft OOXML 格式的十六进制数
(例如 _x00E9_)。
9 生成 %\u 转义的十六进制数(例如 %\u00E9)。
-B 如果可能,转换为 ASCII。 此选项等效于组合 cdefx。
-c 将带圆圈和带括号的字符转换为其未封闭的对应字符。
-d 剥离变音符号。 这将转换表示字符的单个代码点
对应的 ASCII 字符的变音符号并删除单独编码
变音符号。
-e 将字符转换为其近似的 ASCII 等效项,如下所示:
U+0085 下一行 0x0A 换行符
U+00A0 无中断空间 0x20 空间
U+00AB 左指双角引号 0x22 双引号
U+00AD 软连字符 0x2D 减
U+00AF 宏 0x2D 减
U+00B7 中间点 0x2E 周期
U+00BB 右指双角引号 0x22 双引号
U+1361 埃塞俄比亚字空间 0x20 空间
U+1680 奥格姆空间 0x20 空间
U+2000 四 0x20 空间
U+2001 em quad 0x20 空间
U+2002 en 空格 0x20 空格
U+2003 em 空间 0x20 空间
U+2004 0-per-em 空间 20xXNUMX 空间
U+2005 0-per-em 空间 20xXNUMX 空间
U+2006 0-per-em 空间 20xXNUMX 空间
U+2007 图形空间 0x20 空间
U+2008 标点空格 0x20 空格
U+2009 瘦空间 0x20 空间
U+200A 发空间 0x20 空间
U+200B 零宽度空间 0x20 空间
U+2010 连字符 0x2D 减
U+2011 不间断连字符 0x2D 减
U+2012 数字短划线 0x2D 减
U+2013 短划线 0x2D 减
U+2014 破折号 0x2D 减
U+2018 左单引号 0x60 左单引号
U+2019 右单引号 0x27 右或中性单引号
报价
U+201A 单低 9 引号 0x60 左单引号
U+201B 单高反9引号0x60左单引号
U+201C 左双引号 0x22 双引号
U+201D 右双引号 0x22 双引号
U+201E 双低 9 引号 0x22 双引号
U+201F 双高反-9 引号 0x22 双引号
U+2022 项目符号 0x6F 小写字母 o
U+2028 行分隔符 0x0A 换行符
U+2033 双质数 0x22 双引号
U+2039 单左尖角引号 0x60 左单引号
U+203A 单右尖角引号 0x27 右或中性单
报价
U+204E 低星号 0x2A 星号
U+2212 减号 0x2D 减号
U+2216 设置减去 0x5C 反斜杠
U+2217 星号运算符 0x2A 星号
U+2223 划分 0x7C 垂直线
U+2500 框画灯水平 0x2D 减
U+2501 框绘制重水平 0x2D 减去
U+2502框画灯竖0x7C竖线
U+2503框画粗竖0x7C竖线
U+2731 重星号 0x2A 星号
U+275D 重双转逗号引号 0x22 双引号
U+275E 重双逗号引号 0x22 双引号
U+3000 表意空格 0x20 空格
U+FE60 小号 0x26 号
U+FE61 小星号 0x2A 星号
U+FE62 小加号 0x2B 加号
-E 列出由 -x 标志执行的扩展。
-f 将样式变体转换为纯 ASCII。 文体等价物包括:
上标和下标形式、小写字母(例如 U+1D04)、脚本形式(例如
U+212C)、黑色字母形式(例如 U+212D)、全角形式(例如 U+FF01)、半角
形式(例如 U+FF7B)和数学字母数字符号(例如 U+1D400)。
-h 帮助。 打印使用信息并退出。
-l 生成十六进制数时使用小写 af。
-n 也转换换行符。 默认情况下,它们是单独存在的。
-P 如果字符是,则通过 Unicode 而不是转换为 ASCII 转义
未通过变音符号等转换转换为 ASCII 字符
剥离。 请注意,如果使用此选项,则输出可能不是纯 ASCII。
-p 纯的。 将 ASCII 范围内的字符(空格和换行符除外)转换为
以及上面的那些。
-q 安静的。 工作时不要闲聊。
-s 也转换空格字符。 默认情况下,它们是单独存在的。
-S
定义自定义替换。 参数应包含 Unicode 代码点
被替换,后跟要用作的字符的 ASCII 码
替换,用冒号分隔。 如果冒号后没有 ASCII 代码,则
指定的 Unicode 字符将被删除。 代码值可能在
遵循通常约定的十六进制、八进制或十进制(准确地说,那些
of 斯特尔图尔(3))。 此选项可以根据需要重复多次以定义
多次替换。
-v 打印程序版本信息并退出。
-w 在每个转换项目后添加一个空格。
-x 将某些字符扩展为多字符序列。 受影响的字符是
与受 -y 选项影响的那些相同。
U+00A2 分符号 -> 分
U+00A3 磅符号 -> 磅
U+00A5 日元标志 -> 日元
U+00A9 版权符号 -> (c)
U+00AE 注册符号 -> (R)
U+00BC 四分之一 -> 1/4
U+00BD 一半 -> 1/2
U+00BE 三季度 -> 3/4
U+00C6 大写字母灰 -> AE
U+00DF 小写字母夏普 S -> ss
U+00E6 小写字母灰 -> ae
U+0132 连字 IJ -> IJ
U+0133 连字 ij -> ij
U+0152 连字 OE -> OE
U+0153 连字 oe -> oe
U+01F1 大写字母 DZ -> DZ
U+01F2 混合字母 Dz -> Dz
U+01F3 小写字母 DZ -> dz
U+02A6 小写字母 TS DIGRAPH -> ts
U+2026 水平省略号 -> ...
U+20AC 欧元符号 -> 欧元
U+22EF 中线水平椭圆 -> ...
U+2190 向左箭头 -> <-
U+2192 向右箭头 -> ->
U+21D0 向左双箭头 -> <=
U+21D2 向右双箭头 -> =>
U+FB00 拉丁文小连字 FF -> ff
U+FB01 拉丁文小连字 FI -> fi
U+FB02 拉丁文小连字 FL -> fl
U+FB03 拉丁文小连字 FFI -> ffi
U+FB04 拉丁文小连字 FFL -> ffl
U+FB06 拉丁文小连字 ST -> st
-y 将某些具有多字符扩展的字符转换为单字符
ascii 近似值(例如,保持字符定位)。 这
受影响的字符与受 -x 选项影响的字符相同。
U+00A2 分号 -> c
U+00A3 磅符号 -> #
U+00A5 日元符号 -> Y
U+00A9 版权符号 -> C
U+00AE 注册符号 -> R
U+00BC 四分之一 -> -
U+00BD 一半 -> -
U+00BE 三季度 -> -
U+00C6 大写字母灰 -> A
U+00DF 小写字母夏普 S -> s
U+00E6 小写字母灰 -> a
U+0132 连字 IJ -> I
U+0133 连字 ij -> i
U+0152 连字 OE -> O
U+0153 连字 oe -> o
U+01F1 大写字母 DZ -> D
U+01F2 混合字母 Dz -> D
U+01F3 小写字母 DZ -> d
U+02A6 小写字母 TS DIGRAPH -> t
U+2026 水平省略号 -> .
U+20AC 欧元符号 -> E
U+22EF 中线水平省略号 -> .
U+2190 向左箭头 ->
U+2192 向右箭头 -> >
U+21D0 向左双箭头 ->
U+21D2 向右双箭头 -> >
-Z
使用提供的格式生成输出。 指定的格式将用作
调用中的格式字符串 的printf(3) 带有一个由一个参数组成的参数
无符号长整数。 例如,要获得与 -U 标志相同的输出,
格式为:\u%04X。
如果禁用空格转换(默认情况下),如果空格字符超出
遇到 ASCII 范围(U+3000 表意空间,U+1351 埃塞俄比亚字空间,以及
U+1680 ogham 空格标记),它们被替换为 ASCII 空格字符(0x20),以便
保持输出纯 7 位 ASCII。
请注意,XML 和 XHTML 数字字符实体与 HTML 的数字字符实体类似,具有两个
限制。 首先,在 X(HT)ML 中,不能省略终止分号。 二、在
X(HT)ML "x" 必须是小写的,而在 HTML 中它可以是大写或小写。
我们总是生成终止分号并使用小写的“x”,所以选项
被称为“HTML”的也产生有效的 XML 和 XHTML。
退出 状态
退出时返回以下值:
0 成功
输入已成功转换。
2 输入/输出错误
输入或输出期间发生系统错误。
3 INFO 用户请求的信息,如版本号或使用概要和
这已提供。
5 错误的选择
命令行上给出了错误的选项标志。
8 不良记录
在输入中检测到格式错误的 UTF-8。
使用 onworks.net 服务在线使用 uni2ascii