英语法语西班牙文

OnWorks 网站图标

enca - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 enca

这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令 enca,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


enca——检测和转换文本文件的编码

概要


恩卡 [-L 语言[OPTION]……[文件] ...
转接 [-L 语言[OPTION]……[文件] ...

引言 AND 示例


如果你足够幸运,你只需要知道两件事:命令

恩卡 文件

会告诉你是哪个编码文件 文件 使用(不改变它),和

转接 文件

将转换文件 文件 到您的语言环境本机编码。 将文件转换为其他文件
编码使用 -x 选项(见 -x 部分条目 配置 和部分 转换
编码 了解详细信息)。

两者都适用于多个文件和标准输入(输出)。 例如

enca -x latin2

确保文件“sometext”在发送到打印机时采用 ISO Latin 2 格式。

这些命令将失败并将您的文件变成垃圾的主要原因是 Enca
需要知道他们的语言来检测编码。 它试图确定你的语言
和区域设置中的首选字符集,这可能不是您想要的。

您可以(或必须)使用 -L 选项告诉它正确的语言。 假设你下载了
一些俄罗斯 HTML 文件,`file.htm',它声称它是 windows-1251,但它不是。 所以你跑

enca -L ru 文件.htm

并找出它是 KOI8-R(例如)。 请注意,目前支持的并不多
语言(见部分 语言).

另一个警告与 Enca 的几个特性有关,即它的字符集转换
功能,很大程度上取决于系统上安装了哪些其他工具(请参阅
部分 转换)- 跑

enca--版本

获取功能列表(请参阅部分 功能)。 也试试

恩卡--帮助

获取所有其他 Enca 选项的描述(并找到本手册页的其余部分
多余的)。

商品描述


Enca 读取给定的文本文件,或在没有给定的情况下读取标准输入,并使用知识
关于他们的语言(必须得到你的支持)以及解析、统计的混合
分析、猜测和黑魔法来确定它们的编码,然后打印到
标准输出(或者它承认它不知道编码可能是什么)。 经过
默认情况下,Enca 将结果显示为多行人类可读的描述,其他几个
格式可用 - 请参阅下面的输出类型选择器。

Enca 还可以将文件转换为其他一些编码 ENC 当你要求它时——要么使用
内置转换器,一些转换库,或通过调用外部转换器。

Enca 的主要目标是在无人值守的情况下使用,作为一种自动转换工具,尽管它
也许还没有达到这一点(请参阅部分 保安).

请注意,除了极少数情况外,Enca 确实必须知道输入文件的语言才能给出
你一个可靠的答案。 另一方面,它可以很好地处理那些
不是纯文本的,甚至不是检测某些二进制文件中的文本字符串的字符集; 的
当然,这取决于非文本组件的字符。

Enca 不关心输入文件的结构,它将它们视为一个统一的
文本/数据。 对于多部分文件(例如邮箱),您必须使用一些工具知道
首先提取单个部分的结构。 这是检测能力的代价
任何损坏、不完整或其他不正确文件的编码。

配置


有几类选项:操作模式选项、输出类型选择器、
猜测参数、转换参数、一般选项和列表。

所有长选项都可以缩写,只要它们是明确的、强制性的参数
长选项对于短选项也是强制性的。

操作 模式
以下是:

-c, --自动转换
相当于调用 Enca 作为 转接.

如果没有指定输出类型选择器,检测文件编码,猜测你的
区域设置中的首选字符集,并将文件转换为该字符集(仅适用于
+目标字符集自动功能)。

-g, - 猜测
相当于调用 Enca 作为 恩卡.

如果未指定输出类型选择器,则检测文件编码并报告它们。

输出 类型 选择器
选择 Enca 在确定编码时将采取的行动; 他们中的大多数只是
在不同的名称、格式和约定之间选择如何打印编码,但是
其中之一(-x) 很特别:它告诉 Enca 将文件重新编码为其他编码 ENC.
这些选项是相互排斥的; 如果您指定多个输出类型选择器
最后一个优先。

几种输出类型表示其他程序使用的字符集名称,但不是所有这些
程序知道 Enca 识别的所有字符集。 请注意,Enca 没有区别
在无法识别的字符集和在给定命名空间中没有名称的字符集之间
的情况。

-d, - 细节
它过去常常打印几页有关猜测过程的详细信息,但自从 Enca
只是一个与 Enca 库链接的程序,这是不可能的,这个选项
大致相当于 --人类可读, 除非它报告失败原因时
Enca 无法识别编码。

-e, --enca 名称
打印 Enca 的字符集的好名字,即,也许是最普遍接受的
和或多或少人类可读的字符集标识符,附加了表面。

调用外部转换器时也使用此名称。

-f, --人类可读
打印检测到的字符集和表面的口头描述——人类的东西
最了解。 这是默认行为。

精确格式如下:第一行仅包含字符集名称,并且
它后面是零个或多个包含检测到的表面名称的缩进线。
但是,这种格式不适合或不打算用于进一步的机器处理,
并且语言字符集描述在未来可能会发生变化。

-i, --图标名称
打印方式 的iconv(3) (和/或 的iconv(1)) 调用检测到的字符集。 更确切地说,
它打印一个或多或少任意选择的、被 iconv 接受的别名。 一个字符集
对 iconv 来说未知算作未知。

只有当 Enca 编译时带有 iconv 支持(特性
+iconv 接口)。

-r, --rfc1345-名称
打印 RFC 1345 字符集名称。 当这样的名称不存在时,因为 RFC 1345
不定义给定的编码,在其他一些 RFC 中定义的其他一些名称或只是
作者认为“最规范”的名字被印刷出来。

由于 RFC 1345 没有定义表面,因此没有附加表面信息。

-m, --mime 名称
打印检测到的字符集的首选 MIME 名称。 这是你应该取的名字
通常在修复电子邮件或网页时使用。

中不存在的字符集 http://www.iana.org/assignments/character-sets 算作
未知。

-s, --cstocs 名称
打印方式 斯托克斯(1) 调用检测到的字符集。 cstocs 未知的字符集
算作未知。

-n, --名称=WORD
打印选择的字符集(编码)名称 WORD (可以缩写,只要是
明确)。 对于上面列出的名字, --名称=WORD 相当于 --WORD.

运用 别名 因为输出类型会导致 Enca 打印所有接受别名的列表
检测到的字符集。

-x, --转换为=[..]ENC
将文件转换为编码 ENC.

编码名称前的可选`..'没有特殊意义,除非你可以使用
它提醒自己,不像 重新编码(1), 你应该指定 期望
编码,而不是当前。

您可以使用 重新编码(1) 重新编码链或任何其他类型的脑死亡重新编码
规格 ENC, 前提是你告诉 Enca 使用一些工具理解
它用于转换(见部分 转换).

当 Enca 无法确定编码时,它会打印警告并留下
按原样归档; 当它作为过滤器运行时,它会尽力复制标准
输入到标准输出不变。 尽管如此,你不应该依赖它并做
备份。

揣测 参数
只有一个: -L 设置输入文件的语言。 此选项是强制性的(但请参阅
下文)。

-L, --语言=
将输入文件的语言设置为 .

更确切地说, 可以是任何有效的语言环境名称(或带有 +locale-alias 的别名
功能)的某些支持的语言。 您还可以指定“无”作为语言名称,
然后只能识别多字节编码。 跑

enca --list 语言

获取支持的语言列表。 当您未指定 Enca 尝试的任何语言时
从区域设置猜测您的语言并假设输入文件使用它
语。 见部分 语言 了解详情。

转化 参数
让您更好地控制如何执行字符集转换。 他们不影响
什么时候 -x 未指定为输出类型。 请参阅部分 转换 等加工。为
血腥的转换细节。

-C, --尝试转换器=清单
附加逗号分隔 清单 到将要尝试的转换器列表
要求转换。 他们的名字可以缩写,只要他们是
明确的。 跑

enca --list 转换器

获取所有有效转换器名称的列表(并参见部分 转换 他们的
描述)。

默认列表取决于 Enca 的编译方式,运行

恩卡--帮助

找出默认转换器列表。

请注意,仅当您未指定时才使用默认列表 -C 根本。 除此以外,
该列表的构建就像它最初是空的一样,并且每个 -C 添加新的转换器
到它。 此外,指定 没有 由于转换器名称导致清除转换器
名单。

-E, --外部转换器程序=PATH
将外部转换器程序名称设置为 PATH. 默认外部转换器取决于
关于如何遵守 enca,以及使用外部转换器的可能性可能
根本不可用。 跑

恩卡--帮助

找出您的 enca 版本中的默认转换器程序。

常见问题 选项
不适合其他选项类别...

-p, --with-文件名
强制 Enca 使用相应的文件名作为每个结果的前缀。 默认情况下,Enca
在多个文件上运行时,使用文件名前缀结果。

标准输入打印为 标准输入 和标准输出为 标准输出 (后者可以
可能仅在错误消息中看到)。

-P, --无文件名
强制 Enca 不在结果前面加上文件名。 默认情况下,Enca 没有前缀
在单个文件(包括标准输入)上运行时的结果与文件名。

-V, --详细
增加详细级别(每次使用增加一个)。

目前这个选项不是很有用,因为 Enca 的不同部分响应
与相同的详细级别不同,大多数情况下根本没有。

房源
都是终端,即当 Enca 遇到其中一些时,它会打印所需的列表
并终止而不处理任何以下选项。

-h, - 帮帮我
打印简短的使用帮助。

-G, - 执照
打印完整的 Enca 许可证(如果可能,通过寻呼机)。

-l, --列表=WORD
打印指定的列表 WORD (可以缩写,只要它是明确的)。
可用列表包括:

内置字符集. 内置转换器可转换的所有编码,按组(均
输入和输出编码必须来自这个列表并且属于同一组
内部转换)。

内置编码. 相当于 内置字符集,但被认为已经过时; 将要
接受警告,一段时间。

转换器. 所有有效的转换器名称(与 -C).

字符集. 所有编码(字符集)。 您可以选择要打印的名称
- - 姓名 或任何名称输出类型选择器(当然,只有具有
然后将打印给定命名空间中的名称),必须指定选择器
before - 列表.

编码. 相当于 字符集,但被认为已经过时; 将被接受
警告,暂时。

语言. 所有支持的语言以及属于它们的字符集。 笔记
输出类型在这里选择语言名称样式,而不是字符集名称样式。

名称. 所有可能的值 - 姓名 选项。

名单. 此选项的所有可能值。 (疯狂的?)

. Enca 可识别的所有表面。

-v, - 版
打印程序版本和功能列表(请参阅部分 功能).

转换


虽然 Enca 最初被设计为仅用于猜测编码的工具,但现在它
具有多种字符集转换方法。 您可以控制它们中的哪些将是
与使用 -C.

Enca 从指定的列表中依次尝试转换器 -C 直到它发现一些
能够执行所需的转换或直到它用完列表。 你应该指定
首先是首选转换器,之后不太受欢迎。 外部转换器(外部) 应该
总是最后指定,仅作为最后的手段,因为通常无法恢复
当它失败时。 转换器的默认列表始终以 内建的 然后
继续第一个可用的: 自由编码, 的iconv, 没有。

应该注意的是,当 Enca 说它无法执行转换时,它仅表示
没有一个转换器能够执行它。 仍然可以执行
需要分几个步骤进行转换,使用多个转换器,但要弄清楚如何,
可能需要人类智慧。

内建的 变流器
是最简单的,也是最快的,只能执行几个字节到字节
直接就地转换和修改文件(可能被认为是危险的,但
相当有效)。 您可以获得它可以转换的所有编码的列表

enca --list 内置

除了速度,它的主要优点(也是缺点)是它不在乎:它
简单地转换在目标编码中有表示的字符,不接触
其他任何东西,从不打印任何错误消息。

该转换器可以指定为 内建的 - -C.

自由码 变流器
是 GNU 重新编码库的接口,它执行实际的重新编码工作。 它可能或可能
不被编译; 跑

enca--版本

找出它在您的 enca 版本中的可用性(功能 +librecode-interface)。

你应该熟悉 重新编码(1) 在使用它之前,因为重新编码是一个相当
复杂而强大的字符集转换工具。 您可能会遇到使用它的问题
与 Enca 一起特别是因为 Enca 对表面的支持不是 100% 兼容,
因为重新编码太努力使转换可逆,因为它有时
默默地忽略 I/O 错误,因为它有令人难以置信的错误。 请参阅 GNU 重新编码
有关重新编码库的详细信息的信息页面。

该转换器可以指定为 自由编码 - -C.

语言Iconv 变流器
是 UNIX98 的接口 的iconv(3) 转换函数,即进行实际的重新编码
工作。 它可能会或可能不会被编译; 跑

enca--版本

找出它在您的 enca 版本中的可用性(功能 +iconv-interface)。

虽然 iconv 出现在当今大多数系统上,但它很少提供一些有用的
可用的转换,唯一值得注意的例外是来自 GNU libc 的 iconv。 这是
通常对表面也很挑剔(同时,不实现表面
转换)。 然而,它可能代表唯一能够执行的标准(化)工具
从/到Unicode的转换。 有关其详细信息,请参阅 iconv 文档
您特定系统上的功能。

该转换器可以指定为 的iconv - -C.

外部 变流器
是可以指定的任意外部转换工具 -E 选项(最多一个
可以同时定义)。 有一些标准,与 enca 一起提供:
斯托克斯, 重新编码, 地图, 地图图像转换. 都是包装脚本:for 斯托克斯(1) 重新编码(1)
地图(1) 地图(1), 图像转换(1)。

请注意,enca 几乎无法控制外部转换器的真正作用。 如果你设置
/bin/rm 您对后果承担全部责任。

如果您想制作自己的转换器以与 enca 一起使用,您应该知道它始终是
被称为

变矩器 ENC_当前 ENC 文件 [-]

哪里 变矩器 是由什么设置的 -E, ENC_当前 被检测到编码, ENC 是什么
已指定 -x文件 是要转换的文件,即为每个文件调用它
分别归档。 可选的第四个参数, -, 应该导致(当存在时)发送
转换为标准输出而不是覆盖文件的结果 文件。 该
转换器还应注意不更改文件权限,返回错误代码 1
当它失败并清理其临时文件时。 请参阅标准外部
转换器为例。

该转换器可以指定为 外部 - -C.

默认 目标 字符集
指定目标字符集的直接方法是 -x 选项,它覆盖任何
默认值。 当 Enca 被称为 转接, 默认目标字符集被准确地选择
同样的方式 重新编码(1) 这样做。

如果 默认字符集 环境变量已设置,它用作目标字符集。

否则,如果您的系统提供 nl_语言信息(3) function,当前locale的native
charset 用作目标字符集。

当两种方法都失败时,Enca 会抱怨并终止。

可逆性 笔记
如果可逆性对您来说至关重要,那么您根本不应该使用 enca 作为转换器(或者也许
你可以,用非常特别的设计 重新编码(1) 包装)。 否则你应该在
至少知道处理不可转换字符实体有四种基本方法:

失败——这也是一种可能性,顺便说一句,这正是当前的 GNU libc
iconv 实现可以(也可以告诉重新编码来做)

不要碰它们——这就是 enca 内部转换器经常做的事情,recode 可以做的事情;
虽然它不可逆,但人类通常能够重建原始(在
至少原则上)

近似它们——这是 cstocs 可以做的,也可以重新编码,尽管不同; 和
如果您只想使该诅咒的文本可读,则是最佳选择

删除它们——这是 recode 和 cstocs 都可以做的(cstocs 也可以替换这些
字符由一些固定字符而不是仅仅忽略); 有用的时候
被省略的字符仅包含噪声。

有关此问题的详细信息,请查阅您最喜欢的转换器手册。 一般来说,如果
你不够幸运在你的文件中拥有所有可转换的字符,手册
无论如何都需要干预。

性能 笔记
可用转换器的性能不佳是包括在内的主要原因之一
enca 中的内置转换器。 尽可能尝试使用它,即当文件在
考虑是足够干净的字符集或足够混乱的字符集,以便它的零内置
智商无所谓。 它不需要额外的磁盘空间或额外的内存,并且可以
跑赢大市 重新编码(1) 在大文件和 Perl 版本上超过 10 倍(即更快
之一 斯托克斯(1) 在小文件上超过 400 次(实际上它几乎和仅仅一样快
cp(1))。

在不是绝对必要的时候尽量避免使用外部转换器,因为所有的分叉
移动东西的速度非常慢。

编码


您可以使用以下命令获取已识别字符集的列表

enca --list 字符集

和使用 - 姓名 参数,您可以选择要在列表中使用的任何名称。
您还可以列出所有曲面

enca --list 表面

编码和表面名称不区分大小写,非字母数字字符不区分
考虑在内。 但是,大多数情况下根本不允许使用非字母数字字符。
唯一允许的有:`-'、`_'、`.'、`:'和`/'(作为字符集/表面分隔符)。 所以
`ibm852' 和 `IBM-852' 是一样的,而 `IBM 852' 不被接受。

字符集
以下已识别字符集列表使用 Enca 的名称(-e) 和口头描述为
恩卡报道(-f):

ASCII 7bit ASCII 字符
ISO-8859-2 ISO 8859-2 标准; ISO 拉丁语 2
ISO-8859-4 ISO 8859-4 标准; 拉丁语 4
ISO-8859-5 ISO 8859-5 标准; ISO西里尔字母
ISO-8859-13 ISO 8859-13 标准; ISO波罗的海; 拉丁语 7
ISO-8859-16 ISO 8859-16 标准
CP1125 MS-Windows 代码页 1125
CP1250 MS-Windows 代码页 1250
CP1251 MS-Windows 代码页 1251
CP1257 MS-Windows 代码页 1257; WinBaltRim
IBM852 IBM/MS 代码页 852; PC (DOS) 拉丁语 2
IBM855 IBM/MS 代码页 855
IBM775 IBM/MS 代码页 775
IBM866 IBM/MS 代码页 866
波罗的海 ISO-IR-179; 波罗的海
KEYBCS2 Kamenicky 编码; KEYBCS2
macce Macintosh 中欧

maccyr Macintosh 西里尔文
ECMA-113 Ecma 西里尔字母; ECMA-113
KOI-8_CS_2 KOI8-CS2 代码 (`T602')
KOI8-R KOI8-R 西里尔文
KOI8-U KOI8-U 西里尔文
KOI8-UNI KOI8-统一西里尔字母
TeX (La)TeX 控制序列
UCS-2 通用字符集 2 个字节; UCS-2; BMP
UCS-4 通用字符集 4 个字节; UCS-4; ISO-10646
UTF-7 通用转换格式 7 位; UTF-7
UTF-8 通用转换格式 8 位; UTF-8
CORK 软木编码; T1
GBK简体中文国家标准; GB2312
BIG5 繁体中文工业标准; 大五
HZ HZ 编码 GB2312
未知 无法识别的编码

哪里 不明 不是任何真正的编码,当 Enca 无法给出
可靠的答案。


Enca 对所谓的表面有一些实验支持(见下文)。 它检测
以下表面(并非所有表面都可以应用于所有字符集):

/CR CR 行终止符
/LF LF 行终止符
/CRLF CRLF 行终止符
NA 混合线路终止符
NA 被非文本数据包围/混合
/21 字节顺序成对颠倒 (1,2 -> 2,1)
/4321 字节顺序颠倒四倍 (1,2,3,4 -> 4,3,2,1)
NA 小端和大端块,连接在一起
/qp 带引号的可打印编码

注意一些表面用 NA 代替标识符——它们不能在命令中指定
行,他们只能由 Enca 报告。 这是故意的,因为他们只通知你
为什么文件不能被认为是表面一致的,而不是代表一个真实的
表面。

每个字符集都有其未报告的自然表面(在重新编码中称为“隐含”),
例如,对于 IBM 852 字符集,它是“CRLF 行终止符”。 对于 UCS 编码,大端是
视为自然表面; 不寻常的字节顺序是从 21 和 4321 构造的
排列:2143 简单地报告为 21,而 3412 报告为 4321 的组合
和21。

双重编码的 UTF-8 既不是字符集也不是表面,只是被报道了。

关于我们 字符集, 编码
字符集是一组字符实体,而编码是它在术语中的表示
字节和位。 在恩卡,这个词 编码 与“文本表示”的意思相同,
即构成文本的字符实体序列与
构成文件的字节(位)序列。

因此,编码既是字符集又是所谓的表面(行终止符、字节顺序、
合并、Base64 转换等)。 尽管如此,事实证明使用它很方便
一些 {charset,surface} 对与真正的字符集一样。 所以,如 重新编码(1)、所有 UCS- 和
通用字符集的 UTF 编码称为字符集。 请看重新编码
有关此问题的更多详细信息的文档。

表面唯一的好处是:当你不开始玩它们时,
Enca 不会启动,它会尽量表现得像一个表面不知道的人
程序,即使在与重新编码交谈时也是如此。

语言


Enca 需要知道输入文件的语言才能可靠地工作,至少在
常规 8 位编码。 任何拉丁文、西里尔文都应识别多字节编码
或希腊语。

您可以(或必须)使用 -L 告诉 Enca 语言的选项。 由于人们最常
Enca 尝试使用与已配置语言环境相同语言的文件
试图通过检查的值来猜测语言 LC_CTYPE 和其他语言环境类别
(请参见 当地(7)) 并在您未指定任何语言时将其用于语言。 的
当然,这可能是完全错误的,会给你无意义的答案并损害你的
文件,所以请不要忘记使用 -L 选项。 你也可以使用 恩考特 环境
设置默认语言的变量(请参阅部分 环境).

Enca 支持以下语言(每种语言都与支持的语言一起列出)
8 位编码)。

白俄罗斯CP1251 IBM866 ISO-8859-5 KOI8-UNI maccyr IBM855
保加利亚语 CP1251 ISO-8859-5 IBM855 Maccyr ECMA-113
捷克 ISO-8859-2 CP1250 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
爱沙尼亚语 ISO-8859-4 CP1257 IBM775 ISO-8859-13 macce 波罗的海
克罗地亚 CP1250 ISO-8859-2 IBM852 软木塞
匈牙利 ISO-8859-2 CP1250 IBM852 软木塞
立陶宛 CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce baltic
拉脱维亚 CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce 波罗的海
波兰 ISO-8859-2 CP1250 IBM852 macce ISO-8859-13 ISO-8859-16 波罗的海软木
俄罗斯K​​OI8-R CP1251 ISO-8859-5 IBM866 maccyr
斯洛伐克 CP1250 ISO-8859-2 IBM852 KEYBCS2 macce KOI-8_CS_2 软木塞
斯洛文尼亚 ISO-8859-2 CP1250 IBM852 软木塞
乌克兰CP1251 IBM855 ISO-8859-5 CP1125 KOI8-U maccyr
中文 GBK BIG5 HZ
没有

特殊的语言 没有 可以缩短为 __,它不包含 8 位编码,所以只有
检测到多字节编码。

您还可以使用区域设置名称而不是语言:

白俄罗斯语
保加利亚语 bg
捷克语 cs
爱沙尼亚语
克罗地亚语 hr
匈牙利胡
立陶宛语
拉脱维亚lv
波兰语
俄语
斯洛伐克sk
斯洛文尼亚语
乌克兰语 英国
中文zh

功能


Enca 的几个功能取决于您的系统上可用的内容以及它的使用方式
编译。 你可以得到他们的名单

enca--版本

功能名称前的加号表示可用,减号表示此版本缺少
特定的功能。

librecode-接口. Enca 具有与 GNU 重新编码库字符集转换的接口
功能。

iconv-接口. Enca 具有到 UNIX98 iconv 字符集转换功能的接口。

外部转换器. Enca 可以使用外部转换程序(如果您有一些合适的
已安装)。

语言检测. Enca 试图猜测语言(-L) 来自语言环境。 你不需要
- 语 选项,至少在原则上是这样。

地区别名. Enca 能够解密用于语言名称的区域设置别名。

目标字符集自动. Enca 尝试从语言环境中检测您的首选字符集。 选项
--自动转换 并将 Enca 称为 转接 至少在原则上是有效的。

恩考特. Enca 能够在命令行之前正确解析此环境变量
参数。 简单的东西,比如 ENCAOPT="-L 英国” 即使没有这个功能也能工作。

环境


变量 恩考特 可以保存一组默认的 Enca 选项。 其内容被解释
在命令行参数之前。 不幸的是,这并不适用于所有地方(必须有
+ENCAOPT 功能)。

LC_CTYPE, LC_COLLATE, LC_消息 (可能继承自 LC_ALL or ) 是用来
猜测你的语言(必须有 +language-detection 功能)。

变量 默认字符集 可供...使用 转接 作为默认目标字符集。

诊断


当所有输入文件成功处理(即所有输入文件)时,Enca 返回退出代码 0
检测到编码并将所有文件转换为所需的编码,如果转换
被要求)。 当 Enca 无法猜测编码或
对任何输入文件执行转换,因为它不够聪明。 退出代码 2 是
出现严重(例如 I/O)故障时退回。

保安


应该可以让 Enca 无人值守地工作,这是它的目标。 然而:

不保证检测 100% 有效。 不要赌,你很容易输
有价值的数据。

不要使用 enca(程序),如果您想要任何类似的东西,请改为链接到 libenca
安全。 然后你必须自己执行最终的转换。

不要使用外部转换器。 理想情况下,在编译时禁用它们。

意识到 恩考特 以及所有内置的自动猜测各种事物
环境,即语言环境。

使用 onworks.net 服务在线使用 enca


免费服务器和工作站

下载 Windows 和 Linux 应用程序

  • 1
    XML电视
    XML电视
    XMLTV 是一组要处理的程序
    电视 (tvguide) 列表和帮助管理
    您的电视观看,将列表存储在
    基于 XML 的格式。 有实用程序
    做...
    下载 XMLTV
  • 2
    罢工者
    罢工者
    Strikr 自由软件项目。 文物
    在“基于意图的”下发布
    双许可证:AGPLv3(社区)和
    CC-BY-NC-ND 4.0 国际
    (商业的)...
    下载 strikr
  • 4
    GIFLIB
    GIFLIB
    giflib 是一个用于阅读和
    写gif图片。 它是 API 和 ABI
    与 libungif 兼容
    LZW压缩时广泛使用
    算法是...
    下载 GIFLIB
  • 5
    Alt-F
    Alt-F
    Alt-F 提供了一个免费和开源的
    DLINK 的替代固件
    DNS-320/320L/321/323/325/327L and
    DNR-322L。 Alt-F 有 Samba 和 NFS;
    支持ext2/3/4...
    下载 Alt-F
  • 6
    usm
    usm
    usm 是一个统一的 slackware 包
    处理自动的经理
    依赖解决。 它统一了
    各种软件包存储库,包括
    slackware、slacky、p...
    下载usm
  • 更多 ”

Linux 命令

Ad