이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 unix2mac 명령입니다.
프로그램:
이름
dos2unix - DOS/Mac에서 Unix로 또는 그 반대로 텍스트 파일 형식 변환기
개요
dos2unix [옵션] [파일 ...] [-n INFILE OUTFILE ...]
unix2dos [옵션] [파일 ...] [-n INFILE OUTFILE ...]
기술
Dos2unix 패키지에는 일반 텍스트를 변환하는 "dos2unix" 및 "unix2dos" 유틸리티가 포함되어 있습니다.
DOS 또는 Mac 형식의 파일을 Unix 형식으로 또는 그 반대로.
DOS/Windows 텍스트 파일에서 줄 바꿈이라고도 하는 줄 바꿈은 두 개의 조합입니다.
문자: 캐리지 리턴(CR) 다음에 줄 바꿈(LF). Unix 텍스트 파일에서 한 줄
break는 단일 문자인 줄 바꿈(LF)입니다. Mac OS X 이전의 Mac 텍스트 파일에서
줄 바꿈이 단일 CR(캐리지 리턴) 문자였습니다. 요즘 Mac OS는 Unix 스타일(LF)을 사용합니다.
줄 바꿈.
줄 바꿈 외에도 Dos2unix는 파일 인코딩을 변환할 수도 있습니다. 몇 가지 DOS 코드 페이지
Unix Latin-1로 변환할 수 있습니다. 그리고 Windows 유니코드(UTF-16) 파일을 다음으로 변환할 수 있습니다.
유닉스 유니코드(UTF-8) 파일.
강제로 변환하지 않는 한 바이너리 파일은 자동으로 건너뜁니다.
디렉토리 및 FIFO와 같은 비정규 파일은 자동으로 건너뜁니다.
심볼릭 링크와 그 대상은 기본적으로 그대로 유지됩니다. 심볼릭 링크는
선택적으로 대체되거나 출력이 기호 링크 대상에 기록될 수 있습니다.
Windows의 심볼릭 링크는 지원되지 않습니다. Windows 심볼릭 링크는 항상 대체됩니다.
목표를 변경하지 않고 유지합니다.
Dos2unix는 SunOS/Solaris에서 dos2unix를 모델로 했으며 유사한 변환 모드를 가지고 있습니다.
옵션
-- 다음 모든 옵션을 파일 이름으로 취급하십시오. 변환하려면 이 옵션을 사용하십시오.
이름이 대시로 시작하는 파일. 예를 들어 "-foo"라는 파일을 변환하려면
이 명령을 사용할 수 있습니다:
dos2unix ---foo
또는 새 파일 모드에서:
dos2unix -n -- -foo out.txt
-아스키
줄바꿈만 변환합니다. 이것은 기본 변환 모드입니다.
-이소
DOS와 ISO-8859-1 문자 집합 간의 변환. 변환 섹션도 참조하십시오.
모드.
-1252
Windows 코드 페이지 1252(서유럽어)를 사용합니다.
-437
DOS 코드 페이지 437(미국)을 사용합니다. ISO 변환에 사용되는 기본 코드 페이지입니다.
-850
DOS 코드 페이지 850(서유럽어)을 사용합니다.
-860
DOS 코드 페이지 860(포르투갈어)을 사용합니다.
-863
DOS 코드 페이지 863(캐나다 프랑스어)을 사용합니다.
-865
DOS 코드 페이지 865(Nordic)를 사용합니다.
-7 8비트 문자를 7비트 공간으로 변환합니다.
-씨, --전환 모드 변환 모드
변환 모드를 설정합니다. 여기서 CONVMODE는 다음 중 하나입니다. 아스키, 7bit, 이소, 맥 아스키로
기본값.
-NS, --힘
바이너리 파일의 강제 변환.
-시간, --도움
도움말을 표시하고 종료합니다.
-케이, --유지
출력 파일의 날짜 스탬프를 입력 파일과 동일하게 유지합니다.
-엘, --특허
프로그램의 라이선스를 표시합니다.
-엘, --개행
추가 개행을 추가하십시오.
도스투유닉스: DOS 줄바꿈만 Unix 줄바꿈 XNUMX개로 변경됩니다. Mac 모드에서만
Mac 줄 바꿈은 두 개의 Unix 줄 바꿈으로 변경됩니다.
유닉스2도스: Unix 줄바꿈만 두 개의 DOS 줄바꿈으로 변경됩니다. 맥 모드 유닉스에서
줄 바꿈이 두 개의 Mac 줄 바꿈으로 변경되었습니다.
-미디엄, --추가 봄
출력 파일에 UTF-8 바이트 순서 표시를 씁니다. 다음과 같은 경우에는 이 옵션을 사용하지 마십시오.
출력 인코딩이 UTF-8이 아닙니다. 유니코드 섹션도 참조하십시오.
-N, --새로운 파일 인파일 아웃파일 ...
새 파일 모드. INFILE 파일을 변환하고 출력을 OUTFILE 파일에 씁니다. 파일 이름은
쌍으로 제공되어야 하며 와일드카드 이름은 지원 사용되거나 당신이 의지 파일을 잃어버리십시오.
새 파일(페어링) 모드에서 변환을 시작하는 사람이 의 소유자가 됩니다.
변환된 파일. 새 파일의 읽기/쓰기 권한은 권한이 됩니다.
원본 파일에서 빼기 마스크(1) 변환을 실행하는 사람.
-영형, --오래된 파일 FILE ...
이전 파일 모드. FILE 파일을 변환하고 출력을 덮어씁니다. 프로그램은 기본적으로
이 모드에서 실행하십시오. 와일드카드 이름을 사용할 수 있습니다.
이전 파일(현재 위치) 모드에서 변환된 파일은 동일한 소유자, 그룹 및
읽기/쓰기 권한을 원본 파일로 사용합니다. 또한 파일을 변환할 때
파일에 대한 쓰기 권한이 있는 다른 사용자(예: 사용자 루트). 전환
원래 값을 보존할 수 없는 경우 중단됩니다. 의 변화
소유자는 원래 소유자가 더 이상 파일을 읽을 수 없음을 의미할 수 있습니다. 변화
그룹의 보안 위험이 있을 수 있는 경우 파일을 사람이 읽을 수 있도록 만들 수 있습니다.
의도하지 않은 사람. 소유자, 그룹 및 읽기/쓰기 권한의 보존은
Unix에서만 지원됩니다.
-NS, --조용한
조용한 모드. 모든 경고 및 메시지를 표시하지 않습니다. 반환 값은 XNUMX입니다. 때를 제외하고
잘못된 명령줄 옵션이 사용되었습니다.
-에스, --안전한
바이너리 파일을 건너뜁니다(기본값).
CPC, --가정-utf16le
입력 파일 형식이 UTF-16LE라고 가정합니다.
입력 파일에 바이트 순서 표시가 있는 경우 BOM이 이 표시보다 우선합니다.
옵션을 선택합니다.
잘못된 가정을 했을 때(입력 파일이 UTF-16LE 형식이 아님)
변환에 성공하면 잘못된 텍스트가 포함된 UTF-8 출력 파일을 얻게 됩니다. 취소할 수 있습니다.
잘못된 변환 의 iconv(1) UTF-8 출력 파일을 다시
UTF-16LE. 이렇게 하면 원본 파일이 다시 나타납니다.
UTF-16LE의 가정은 다음과 같이 작동합니다. 변환 모드. 기본값으로 전환하여
아스키 모드 UTF-16LE 가정이 해제됩니다.
-우, --가정-utf16be
입력 파일 형식이 UTF-16BE라고 가정합니다.
이 옵션은 "-ul" 옵션과 동일하게 작동합니다.
-NS, --follow-symlink
심볼릭 링크를 따라 타겟을 변환하십시오.
-NS, --replace-symlink
심볼릭 링크를 변환된 파일로 교체합니다(원래 대상 파일은 변경되지 않음).
-NS, --건너뛰기 심볼릭 링크
기호 링크와 대상을 변경하지 않은 상태로 유지합니다(기본값).
-V, --번역
버전 정보를 표시하고 종료합니다.
맥 모드
일반 모드에서 줄 바꿈은 DOS에서 Unix로 또는 그 반대로 변환됩니다. 맥 줄바꿈
변환되지 않습니다.
Mac 모드에서 줄 바꿈은 Mac에서 Unix로 또는 그 반대로 변환됩니다. DOS 줄바꿈은
변경되지 않았습니다.
Mac 모드에서 실행하려면 명령줄 옵션 "-c mac"을 사용하거나 "mac2unix" 또는
"유닉스2맥".
변환 모드
변환 모드 아스키, 7bit및 이소 아래의 dos2unix/unix2dos와 유사합니다.
썬OS/솔라리스.
아스키
"ascii" 모드에서는 줄 바꿈만 변환됩니다. 이것은 기본 변환 모드입니다.
이 모드의 이름은 7비트 표준인 ASCII이지만 실제 모드는
8비트. 유니코드 UTF-8 파일을 변환할 때 항상 이 모드를 사용하십시오.
7bit
이 모드에서 모든 8비트 비 ASCII 문자(128에서 255 사이의 값 포함)는
7비트 공간으로 변환됩니다.
이소 문자는 DOS 문자 세트(코드 페이지)와 ISO 문자 세트 간에 변환됩니다.
Unix의 ISO-8859-1(Latin-1). ISO-8859-1에 상응하지 않는 DOS 문자,
변환이 불가능하며 점으로 변환됩니다. ISO-8859-1도 마찬가지입니다.
DOS 대응 문자가 없는 문자.
"-iso" 옵션만 사용되면 dos2unix는 활성 코드 페이지를 결정하려고 시도합니다.
이것이 불가능할 때 dos2unix는 기본 코드 페이지 CP437을 사용합니다.
미국에서 사용. 특정 코드 페이지를 강제 실행하려면 "-437"(미국), "-850" 옵션을 사용하십시오.
(서유럽어), "-860"(포르투갈어), "-863"(프랑스어 캐나다) 또는 "-865"(북유럽어).
Windows 코드 페이지 CP1252(서유럽어)도 "-1252" 옵션으로 지원됩니다. 을위한
다른 코드 페이지는 dos2unix를 다음과 함께 사용합니다. 의 iconv(1). Iconv는 다음 사이에서 변환할 수 있습니다.
문자 인코딩의 긴 목록.
유니코드 텍스트 파일에 ISO 변환을 사용하지 마십시오. UTF-8로 인코딩된 파일이 손상됩니다.
몇 가지 예 :
DOS 기본 코드 페이지에서 Unix Latin-1로 변환
dos2unix -iso -n in.txt out.txt
DOS CP850에서 Unix Latin-1로 변환
dos2unix -850 -n in.txt out.txt
Windows CP1252에서 Unix Latin-1로 변환
dos2unix -1252 -n in.txt out.txt
Windows CP1252에서 Unix UTF-8(유니코드)로 변환
iconv -f CP1252 -t UTF-8 in.txt | dos2unix > out.txt
Unix Latin-1에서 DOS 기본 코드 페이지로 변환합니다.
unix2dos -iso -n in.txt out.txt
Unix Latin-1에서 DOS CP850으로 변환
unix2dos -850 -n in.txt out.txt
Unix Latin-1에서 Windows CP1252로 변환
unix2dos -1252 -n in.txt out.txt
Unix UTF-8(유니코드)에서 Windows CP1252로 변환
unix2dos < in.txt | iconv -f UTF-8 -t CP1252 > out.txt
또한보십시오http://czyborra.com/charsets/codepages.html> 및
<http://czyborra.com/charsets/iso8859.html>.
유니 코드
인코딩
다양한 유니코드 인코딩이 있습니다. Unix 및 Linux에서 유니코드 파일은 일반적으로
UTF-8 인코딩으로 인코딩됩니다. Windows에서 유니코드 텍스트 파일은 UTF-8, UTF-16,
또는 UTF-16 빅 엔디안이지만 대부분 UTF-16 형식으로 인코딩됩니다.
매출 상승
유니코드 텍스트 파일에는 일반 텍스트 파일과 같이 DOS, Unix 또는 Mac 줄 바꿈이 있을 수 있습니다.
모든 버전의 dos2unix 및 unix2dos는 UTF-8 인코딩 파일을 변환할 수 있습니다.
ASCII와의 하위 호환성을 위해 설계되었습니다.
유니코드 UTF-2을 지원하는 Dos2unix 및 unix16dos, little 및 big endian UTF-16을 읽을 수 있습니다.
인코딩된 텍스트 파일. dos2unix가 UTF-16 지원 유형으로 빌드되었는지 확인하려면 "dos2unix -V"를 입력하세요.
Windows 버전의 dos2unix 및 unix2dos는 UTF-16으로 인코딩된 파일을 항상 UTF-8로 변환합니다.
인코딩된 파일. dos2unix/unix2dos의 Unix 버전은 UTF-16으로 인코딩된 파일을
UTF-8로 설정된 경우 로케일 문자 인코딩. 사용 장소(1) 알아내라는 명령
로케일 문자 인코딩이 무엇인지.
UTF-8 형식의 텍스트 파일은 Windows와 Unix 모두에서 잘 지원되기 때문에 dos2unix
그리고 unix2dos에는 UTF-16 파일을 쓰는 옵션이 없습니다. 모든 UTF-16 문자는 다음으로 인코딩할 수 있습니다.
UTF-8. UTF-16에서 UTF-8로의 변환은 손실이 없습니다. UTF-16 파일은 건너뜁니다.
실수로 텍스트가 손실되는 것을 방지하기 위해 로케일 문자 인코딩이 UTF-8이 아닌 경우 Unix.
UTF-16에서 UTF-8로의 변환 오류가 발생한 경우(예: UTF-16 입력 파일이
오류가 있으면 파일을 건너뜁니다.
ISO 및 7비트 모드 변환은 UTF-16 파일에서 작동하지 않습니다.
바이트 주문번호 표시
Windows에서 유니코드 텍스트 파일에는 일반적으로 BOM(바이트 순서 표시)이 있습니다.
프로그램(메모장 포함)은 기본적으로 BOM을 추가합니다. 또한보십시오
<http://en.wikipedia.org/wiki/Byte_order_mark>.
Unix에서 유니코드 파일에는 일반적으로 BOM이 없습니다. 텍스트 파일은 다음과 같다고 가정합니다.
로케일 문자 인코딩으로 인코딩됩니다.
Dos2unix는 파일에 BOM이 있는 경우에만 파일이 UTF-16 형식인지 감지할 수 있습니다. 언제
UTF-16 파일에는 BOM이 없으며 dos2unix는 파일을 바이너리 파일로 봅니다.
BOM 없이 UTF-16 파일을 변환하려면 "-ul" 또는 "-ub" 옵션을 사용하십시오.
Dos2unix는 "-m" 옵션을 사용하지 않는 한 출력 파일에 BOM을 쓰지 않습니다.
Unix2dos는 입력 파일에 BOM이 있거나 옵션이 있는 경우 출력 파일에 BOM을 씁니다.
"-m"이 사용됩니다.
유니 코드 예
Windows UTF-16(BOM 포함)에서 Unix UTF-8로 변환
dos2unix -n in.txt out.txt
Windows UTF-16LE(BOM 제외)에서 Unix UTF-8로 변환
dos2unix -ul -n in.txt out.txt
BOM을 사용하여 Unix UTF-8에서 Windows UTF-8로 변환
unix2dos -m -n in.txt out.txt
Unix UTF-8에서 Windows UTF-16으로 변환
unix2dos < in.txt | iconv -f UTF-8 -t UTF-16 > out.txt
사용 예
'stdin'에서 입력을 읽고 'stdout'에 출력을 씁니다.
도스투유닉스
dos2unix -l -c 맥
a.txt를 변환하고 바꿉니다. b.txt를 변환하고 바꿉니다.
도스2유닉스 a.txt b.txt
dos2unix -o a.txt b.txt
ASCII 변환 모드에서 a.txt를 변환하고 바꿉니다.
도스2유닉스 a.txt
ASCII 변환 모드에서 a.txt를 변환하고 바꿉니다. 7비트에서 b.txt 변환 및 바꾸기
변환 모드.
dos2unix a.txt -c 7비트 b.txt
dos2unix -c ascii a.txt -c 7비트 b.txt
dos2unix -ascii a.txt -7 b.txt
Mac에서 Unix 형식으로 a.txt를 변환합니다.
dos2unix -c 맥 a.txt
mac2unix a.txt
Unix에서 Mac 형식으로 a.txt를 변환합니다.
unix2dos -c 맥 a.txt
유닉스2맥 a.txt
원래 날짜 스탬프를 유지하면서 .txt를 변환하고 바꾸십시오.
dos2unix -k a.txt
dos2unix -k -o a.txt
a.txt를 변환하고 e.txt에 씁니다.
dos2unix -n a.txt e.txt
a.txt를 변환하여 e.txt로 작성하고 e.txt의 날짜 스탬프를 .txt와 동일하게 유지합니다.
dos2unix -k -n a.txt e.txt
a.txt를 변환하고 바꿉니다. b.txt를 변환하고 e.txt로 씁니다.
dos2unix a.txt -n b.txt e.txt
dos2unix -o a.txt -n b.txt e.txt
c.txt를 변환하고 e.txt에 씁니다. a.txt를 변환하고 바꿉니다. b.txt를 변환하고 바꿉니다.
d.txt를 변환하고 f.txt에 씁니다.
dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt
재귀 변환
dos2unix를 다음과 함께 사용하십시오. 발견(1)과하면 xargs(1) 재귀적으로 변환하는 명령
디렉토리 트리 구조의 텍스트 파일. 예를 들어 모든 .txt 파일을 변환하려면
현재 디렉토리 유형 아래의 디렉토리 트리:
찾기 . -이름 *.txt |xargs dos2unix
현지화
랑
기본 언어는 환경 변수 LANG로 선택됩니다. LANG 변수
여러 부분으로 구성됩니다. 첫 번째 부분은 소문자로 된 언어 코드입니다.
두 번째는 선택 사항이며 대문자로 된 국가 코드입니다.
밑줄. 선택적 세 번째 부분인 문자 인코딩도 있습니다.
점. POSIX 표준 유형 셸에 대한 몇 가지 예:
export LANG=nl 네덜란드어
export LANG=nl_NL 네덜란드어, 네덜란드
export LANG=nl_BE 네덜란드, 벨기에
export LANG=es_ES 스페인어, 스페인
export LANG=es_MX 스페인어, 멕시코
export LANG=en_US.iso88591 영어, 미국, 라틴-1 인코딩
export LANG=en_GB.UTF-8 영어, 영국, UTF-8 인코딩
언어 및 국가 코드의 전체 목록은 gettext 설명서를 참조하십시오.
<http://www.gnu.org/software/gettext/manual/gettext.html#언어코드>
Unix 시스템에서는 다음 명령을 사용할 수 있습니다. 장소(1) 로케일 특정 정보를 가져옵니다.
언어
LANGUAGE 환경 변수를 사용하여 언어의 우선 순위 목록을 지정할 수 있습니다.
콜론으로 구분됩니다. Dos2unix는 LANG보다 LANGUAGE를 선호합니다. 예를 들어,
먼저 네덜란드어, 그 다음 독일어: "LANGUAGE=nl:de". 먼저 현지화를 활성화해야 합니다.
언어를 사용하기 전에 LANG(또는 LC_ALL)을 "C" 이외의 값으로 설정하여
LANGUAGE 변수를 통한 우선 순위 목록. gettext 매뉴얼도 참조하십시오.
<http://www.gnu.org/software/gettext/manual/gettext.html#The-LANGUAGE-변수>
사용할 수 없는 언어를 선택하면 표준 영어가 표시됩니다.
메시지.
DOS2UNIX_LOCALEDIR
환경 변수 DOS2UNIX_LOCALEDIR을 사용하면 컴파일하는 동안 LOCALEDIR이 설정됩니다.
기각될 수 있습니다. LOCALEDIR은 언어 파일을 찾는 데 사용됩니다. GNU 기본값
"/usr/local/share/locale"입니다. 옵션 --번역 LOCALEDIR을 표시합니다.
익숙한.
예(POSIX 쉘):
내보내기 DOS2UNIX_LOCALEDIR=$HOME/share/locale
RETURN VALUE
성공하면 XNUMX이 반환됩니다. 시스템 오류가 발생하면 마지막 시스템 오류는
돌아왔다. 다른 오류의 경우 1이 반환됩니다.
잘못된 명령줄 옵션이 있는 경우를 제외하고 자동 모드에서 반환 값은 항상 XNUMX입니다.
익숙한.
기준
<http://en.wikipedia.org/wiki/Text_file>
<http://en.wikipedia.org/wiki/Carriage_return>
<http://en.wikipedia.org/wiki/Newline>
<http://en.wikipedia.org/wiki/Unicode>
작가
벤자민 린 -[이메일 보호]> 베른트 요하네스 뷔벤(mac2unix 모드) -
<[이메일 보호]>, Christian Wurll(새 줄 추가) -[이메일 보호]>, 어윈
워터랜더 -[이메일 보호]> (관리자)
프로젝트 페이지:http://waterlan.home.xs4all.nl/dos2unix.html>
소스포지 페이지:http://sourceforge.net/projects/dos2unix/>
프리코드:http://freecode.com/projects/dos2unix>
onworks.net 서비스를 사용하여 온라인으로 unix2mac을 사용하세요.