英语法语西班牙文

OnWorks 网站图标

dos2unix - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 dos2unix

这是命令 dos2unix,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


dos2unix - DOS/Mac 到 Unix,反之亦然文本文件格式转换器

概要


dos2unix [选项] [文件 ...] [-n INFILE OUTFILE ...]
unix2dos [选项] [文件 ...] [-n INFILE OUTFILE ...]

商品描述


Dos2unix 软件包包括用于转换纯文本的实用程序“dos2unix”和“unix2dos”
将 DOS 或 Mac 格式的文件转换为 Unix 格式,反之亦然。

在 DOS/Windows 文本文件中,换行符,也称为换行符,是两个的组合
字符:回车符 (CR) 后跟换行符 (LF)。 在 Unix 文本文件中一行
break 是单个字符:换行符 (LF)。 在 Mac OS X 之前的 Mac 文本文件中,
换行符是单个回车 (CR) 字符。 现在 Mac OS 使用 Unix 风格 (LF)
换行。

除了换行之外,Dos2unix 还可以转换文件的编码。 几个 DOS 代码页
可以转换为 Unix Latin-1。 并且可以将 Windows Unicode (UTF-16) 文件转换为
Unix Unicode (UTF-8) 文件。

二进制文件会自动跳过,除非强制转换。

非常规文件,例如目录和 FIFO,会自动跳过。

默认情况下,符号链接及其目标保持不变。 符号链接可以
可以选择替换,或者可以将输出写入符号链接目标。
不支持 Windows 上的符号链接。 Windows 符号链接总是被替换,
保持目标不变。

Dos2unix 仿照 SunOS/Solaris 下的 dos2unix 进行建模,并具有类似的转换方式。

配置


-- 将以下所有选项视为文件名。 如果要转换,请使用此选项
名称以破折号开头的文件。 例如,要转换名为“-foo”的文件,您
可以使用这个命令:

dos2unix ---foo

或者在新文件模式下:

dos2unix -n -- -foo out.txt

-ascii
仅转换换行符。 这是默认的转换模式。

-iso
DOS 和 ISO-8859-1 字符集之间的转换。 另见转换部分
模式。

-1252
使用 Windows 代码页 1252(西欧)。

-437
使用 DOS 代码页 437(美国)。 这是用于 ISO 转换的默认代码页。

-850
使用 DOS 代码页 850(西欧)。

-860
使用 DOS 代码页 860(葡萄牙语)。

-863
使用 DOS 代码页 863(加拿大法语)。

-865
使用 DOS 代码页 865(北欧)。

-7 将 8 位字符转换为 7 位空格。

-C, --转换模式 转换模式
设置转换模式。 其中,CONVMODE 是以下之一: ASCII, 7bit, , MAC ascii 是
默认值。

-F, - 力量
强制转换二进制文件。

-H, - 帮帮我
显示帮助并退出。

-k, --保持最新
保持输出文件的日期戳与输入文件相同。

-L, - 执照
显示程序的许可证。

-l, - 新队
添加额外的换行符。

dos2unix: 仅将 DOS 换行符更改为两个 Unix 换行符。 仅限 Mac 模式
Mac 换行符更改为两个 Unix 换行符。

UNIX2DOS: 只有 Unix 换行符更改为两个 DOS 换行符。 在 Mac 模式下 Unix
换行符更改为两个 Mac 换行符。

-米, --添加bom
在输出文件中写入 UTF-8 字节顺序标记。 切勿在以下情况下使用此选项
输出编码不是 UTF-8。 另请参阅 UNICODE 部分。

-n, - 新文件 文件 输出文件 ...
新文件模式。 转换文件 INFILE 并将输出写入文件 OUTFILE。 文件名必须
成对给出,通配符名称应该 而不去 被使用或你 丢失您的文件。

在新文件(配对)模式下开始转换的人将是
转换后的文件。 新文件的读/写权限将是权限
原始文件减去 遮罩(1) 运行转换的人。

-o, --旧文件 文件 ...
旧文件模式。 转换文件 FILE 并将输出覆盖到它。 程序默认为
在这种模式下运行。 可以使用通配符名称。

在旧文件(就地)模式下,转换后的文件具有相同的所有者、组和
读/写权限作为原始文件。 此外,当文件被转换为
对文件具有写权限的另一个用户(例如用户 root)。 转换
当无法保留原始值时将被中止。 的变化
所有者可能意味着原始所有者无法再读取该文件。 改变
组可能存在安全风险,该文件可以为人可读
谁不是有意的。 保留所有者、组和读/写权限是
仅在 Unix 上受支持。

-q, - 安静的
静音模式。 禁止所有警告和消息。 返回值为零。 除了当
使用了错误的命令行选项。

-是的, - 安全的
跳过二进制文件(默认)。

的, --假设-utf16le
假设输入文件格式为 UTF-16LE。

当输入文件中有字节顺序标记时,BOM 优先于这个
选项。

当您做出错误假设(输入文件不是 UTF-16LE 格式)并且
转换成功,您将得到一个带有错误文本的 UTF-8 输出文件。 您可以撤消
错误的转换 的iconv(1) 通过将 UTF-8 输出文件转换回
UTF-16LE。 这将带回原始文件。

UTF-16LE 的假设作为 转变 模式. 通过切换到默认
ASCII 模式 UTF-16LE 假设被关闭。

-ub, --假设-utf16be
假设输入文件格式为 UTF-16BE。

此选项与选项“-ul”的作用相同。

-F, --follow-符号链接
按照符号链接并转换目标。

-R, --替换符号链接
用转换后的文件替换符号链接(原始目标文件保持不变)。

-S, --跳过符号链接
保持符号链接和目标不变(默认)。

-V, - 版
显示版本信息并退出。

苹果电脑 MODE


在正常模式下,换行符从 DOS 转换为 Unix,反之亦然。 Mac 换行符
不转换。

在 Mac 模式下,换行符从 Mac 转换为 Unix,反之亦然。 DOS 换行符是
没有改变。

要在 Mac 模式下运行,请使用命令行选项“-c mac”或使用命令“mac2unix”或
“unix2mac”。

转换 模式


转换模式 ASCII, 7bit 类似于 dos2unix/unix2dos 下的那些
SunOS/Solaris。

ASCII
在“ascii”模式下,只转换换行符。 这是默认的转换模式。

虽然这种模式的名称是 ASCII,这是一个 7 位标准,但实际的模式是
8 位。 转换 Unicode UTF-8 文件时始终使用此模式。

7bit
在这种模式下,所有 8 位非 ASCII 字符(值从 128 到 255)都是
转换为 7 位空间。

字符在 DOS 字符集(代码页)和 ISO 字符集之间转换
Unix 上的 ISO-8859-1 (Latin-1)。 没有 ISO-8859-1 等价物的 DOS 字符,其中
转换是不可能的,被转换成一个点。 ISO-8859-1 也同样重要
没有 DOS 对应的字符。

当仅使用选项“-iso”时,dos2unix 将尝试确定活动代码页。
当这不可能时,dos2unix 将使用默认代码页 CP437,主要是
在美国使用。 要强制使用特定代码页,请使用选项“-437”(美国)、“-850”
(西欧)、“-860”(葡萄牙语)、“-863”(加拿大法语)或“-865”(北欧)。
选项“-1252”也支持 Windows 代码页 CP1252(西欧)。 为了
其他代码页结合使用 dos2unix 的iconv(1). iconv 可以相互转换
一长串字符编码。

切勿对 Unicode 文本文件使用 ISO 转换。 它会破坏 UTF-8 编码的文件。

一些例子:

从 DOS 默认代码页转换为 Unix Latin-1

dos2unix -iso -n 输入.txt 输出.txt

从 DOS CP850 转换为 Unix Latin-1

dos2unix -850 -n 输入.txt 输出.txt

从 Windows CP1252 转换为 Unix Latin-1

dos2unix -1252 -n 输入.txt 输出.txt

从 Windows CP1252 转换为 Unix UTF-8 (Unicode)

iconv -f CP1252 -t UTF-8 in.txt | dos2unix > out.txt

从 Unix Latin-1 转换为 DOS 默认代码页。

unix2dos -iso -n 输入.txt 输出.txt

从 Unix Latin-1 转换为 DOS CP850

unix2dos -850 -n 输入.txt 输出.txt

从 Unix Latin-1 转换为 Windows CP1252

unix2dos -1252 -n 输入.txt 输出.txt

从 Unix UTF-8 (Unicode) 转换为 Windows CP1252

unix2dos < in.txt | iconv -f UTF-8 -t CP1252 > out.txt

也可以看看http://czyborra.com/charsets/codepages.html>和
<http://czyborra.com/charsets/iso8859.html>.

UNICODE


编码
存在不同的 Unicode 编码。 在 Unix 和 Linux 上,Unicode 文件通常是
以 UTF-8 编码编码。 在 Windows 上,Unicode 文本文件可以用 UTF-8、UTF-16、
或 UTF-16 big endian,但大多以 UTF-16 格式编码。

转化
Unicode 文本文件可以像普通文本文件一样具有 DOS、Unix 或 Mac 换行符。

所有版本的 dos2unix 和 unix2dos 都可以转换 UTF-8 编码的文件,因为 UTF-8 是
设计用于向后兼容 ASCII。

Dos2unix 和 unix2dos 支持 Unicode UTF-16,可以读取小端和大端 UTF-16
编码的文本文件。 要查看 dos2unix 是否是使用 UTF-16 支持类型“dos2unix -V”构建的。

dos2unix 和 unix2dos 的 Windows 版本总是将 UTF-16 编码文件转换为 UTF-8
编码的文件。 Unix 版本的 dos2unix/unix2dos 将 UTF-16 编码的文件转换为
设置为 UTF-8 时的语言环境字符编码。 使用 当地(1)命令查找
语言环境字符编码是什么。

因为 UTF-8 格式的文本文件在 Windows 和 Unix 上都得到很好的支持,所以 dos2unix
和 unix2dos 没有写入 UTF-16 文件的选项。 所有 UTF-16 字符都可以编码为
UTF-8。 从 UTF-16 到 UTF-8 的转换是没有损失的。 UTF-16 文件将被跳过
Unix 当语言环境字符编码不是 UTF-8 时,防止文本意外丢失。
当出现 UTF-16 到 UTF-8 转换错误时,例如当 UTF-16 输入文件时
包含错误,该文件将被跳过。

ISO 和 7 位模式转换不适用于 UTF-16 文件。

字节 下单 纪念
在 Windows 上,Unicode 文本文件通常有一个字节顺序标记 (BOM),因为许多 Windows
程序(包括记事本)默认添加 BOM。 也可以看看
<http://en.wikipedia.org/wiki/Byte_order_mark>.

在 Unix Unicode 文件通常没有 BOM。 假设文本文件是
以语言环境字符编码进行编码。

如果文件有 BOM,Dos2unix 只能检测文件是否为 UTF-16 格式。 当一个
UTF-16 文件没有 BOM,dos2unix 会将文件视为二进制文件。

使用选项“-ul”或“-ub”来转换没有 BOM 的 UTF-16 文件。

Dos2unix 从不在输出文件中写入 BOM,除非您使用选项“-m”。

Unix2dos 当输入文件有 BOM 时,或当有选项时,在输出文件中写入 BOM
使用“-m”。

统一 例子
从 Windows UTF-16(带 BOM)转换为 Unix UTF-8

dos2unix -n 输入.txt 输出.txt

从 Windows UTF-16LE(无 BOM)转换为 Unix UTF-8

dos2unix -ul -n 输入.txt 输出.txt

使用 BOM 从 Unix UTF-8 转换为 Windows UTF-8

unix2dos -m -n 输入.txt 输出.txt

从 Unix UTF-8 转换为 Windows UTF-16

unix2dos < in.txt | iconv -f UTF-8 -t UTF-16 > out.txt

示例


从“stdin”读取输入并将输出写入“stdout”。

dos2unix
dos2unix -l -c mac

转换并替换 a.txt。 转换并替换 b.txt。

dos2unix a.txt b.txt
dos2unix -o a.txt b.txt

以ascii转换方式转换和替换a.txt。

dos2unix a.txt

以ascii转换方式转换和替换a.txt。 7位转换替换b.txt
转换模式。

dos2unix a.txt -c 7bit b.txt
dos2unix -c ascii a.txt -c 7bit b.txt
dos2unix -ascii a.txt -7 b.txt

将 a.txt 从 Mac 转换为 Unix 格式。

dos2unix -c mac a.txt
mac2unix 一个.txt

将 a.txt 从 Unix 转换为 Mac 格式。

unix2dos -c mac a.txt
unix2mac a.txt

在保留原始日期戳的同时转换和替换 a.txt。

dos2unix -k a.txt
dos2unix -k -o a.txt

转换 a.txt 并写入 e.txt。

dos2unix -n a.txt e.txt

将a.txt 转换成e.txt,保持e.txt 的日期戳与a.txt 相同。

dos2unix -k -n a.txt e.txt

转换并替换 a.txt。 转换 b.txt 并写入 e.txt。

dos2unix a.txt -n b.txt e.txt
dos2unix -o a.txt -n b.txt e.txt

转换 c.txt 并写入 e.txt。 转换并替换 a.txt。 转换并替换 b.txt。
转换 d.txt 并写入 f.txt。

dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt

递归 转换


结合使用 dos2unix 发现(1)和 参数(1) 递归转换命令
目录树结构中的文本文件。 例如转换所有 .txt 文件
当前目录类型下的目录树:

找 。 -name *.txt |xargs dos2unix

本土化



主要语言是通过环境变量 LANG 选择的。 LANG 变量
由几个部分组成。 第一部分是小写的语言代码。
第二个是可选的,是大写的国家代码,前面有一个
下划线。 还有一个可选的第三部分:字符编码,前面有一个
点。 POSIX 标准类型 shell 的一些示例:

出口 LANG=nl 荷兰语
export LANG=nl_NL 荷兰语,荷兰
出口 LANG=nl_BE 荷兰、比利时
export LANG=es_ES 西班牙语,西班牙
export LANG=es_MX 西班牙语,墨西哥
export LANG=en_US.iso88591 英语,美国,Latin-1 编码
导出 LANG=en_GB.UTF-8 英语、英国、UTF-8 编码

有关语言和国家/地区代码的完整列表,请参阅 gettext 手册:
<http://www.gnu.org/software/gettext/manual/gettext.html#语言代码>

在 Unix 系统上,您可以使用命令 当地(1) 获取特定于语言环境的信息。

语言
使用 LANGUAGE 环境变量,您可以指定语言的优先级列表,
用冒号分隔。 Dos2unix 优先使用 LANGUAGE 而不是 LANG。 例如,
首先是荷兰语,然后是德语:“LANGUAGE=nl:de”。 您必须首先启用本地化,
通过将 LANG(或 LC_ALL)设置为“C”以外的值,然后才能使用语言
优先级列表通过 LANGUAGE 变量。 另请参阅 gettext 手册:
<http://www.gnu.org/software/gettext/manual/gettext.html#语言变量>

如果您选择不可用的语言,您将获得标准英语
消息。

DOS2UNIX_LOCALDIR
使用环境变量 DOS2UNIX_LOCALEDIR LOCALEDIR 在编译期间设置
可以被否决。 LOCALEDIR 用于查找语言文件。 GNU 默认值
是“/usr/local/share/locale”。 选项 - 版 将显示 LOCALEDIR 是
用过的。

示例(POSIX 外壳):

导出 DOS2UNIX_LOCALEDIR=$HOME/share/locale

返回 VALUE


成功时,返回零。 当发生系统错误时,最后一个系统错误将是
回来。 对于其他错误,返回 1。

在安静模式下返回值始终为零,除非是错误的命令行选项
用过的。

标准


<http://en.wikipedia.org/wiki/Text_file>

<http://en.wikipedia.org/wiki/Carriage_return>

<http://en.wikipedia.org/wiki/Newline>

<http://en.wikipedia.org/wiki/Unicode>

作者


本杰明林 -[电子邮件保护]> Bernd Johannes Wuebben (mac2unix 模式) -
<[电子邮件保护]>, Christian Wurll(添加额外的换行符)-[电子邮件保护]>、欧文
沃特兰德 -[电子邮件保护]>(维护者)

项目页面:http://waterlan.home.xs4all.nl/dos2unix.html>

SourceForge 页面:http://sourceforge.net/projects/dos2unix/>

免费代码:http://freecode.com/projects/dos2unix>

使用 onworks.net 服务在线使用 dos2unix


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad