Ito ang command na mac2unix na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
dos2unix - DOS/Mac sa Unix at vice versa text file format converter
SINOPSIS
dos2unix [mga opsyon] [FILE ...] [-n INFILE OUTFILE ...]
unix2dos [mga opsyon] [FILE ...] [-n INFILE OUTFILE ...]
DESCRIPTION
Kasama sa package ng Dos2unix ang mga utility na "dos2unix" at "unix2dos" para mag-convert ng plain text
mga file sa DOS o Mac na format sa Unix na format at vice versa.
Sa mga text file ng DOS/Windows ang isang line break, na kilala rin bilang newline, ay isang kumbinasyon ng dalawa
mga character: isang Carriage Return (CR) na sinusundan ng Line Feed (LF). Sa Unix text file isang linya
ang break ay isang character: ang Line Feed (LF). Sa mga Mac text file, bago ang Mac OS X, a
line break ay nag-iisang Carriage Return (CR) na character. Sa ngayon, ang Mac OS ay gumagamit ng Unix style (LF)
mga line break.
Bukod sa mga line break, maaari ding i-convert ng Dos2unix ang pag-encode ng mga file. Ilang DOS code na pahina
maaaring i-convert sa Unix Latin-1. At ang Windows Unicode (UTF-16) na mga file ay maaaring ma-convert sa
Unix Unicode (UTF-8) na mga file.
Awtomatikong nilaktawan ang mga binary file, maliban kung pinipilit ang conversion.
Ang mga hindi regular na file, tulad ng mga direktoryo at FIFO, ay awtomatikong nilaktawan.
Ang mga simbolikong link at ang kanilang mga target ay sa pamamagitan ng default ay pinananatiling hindi nagalaw. Ang mga simbolikong link ay maaari
opsyonal na palitan, o ang output ay maaaring isulat sa simbolikong link na target.
Ang mga simbolikong link sa Windows ay hindi suportado. Palaging pinapalitan ang mga simbolikong link ng Windows,
pinapanatili ang mga target na hindi nagbabago.
Ang Dos2unix ay namodelo pagkatapos ng dos2unix sa ilalim ng SunOS/Solaris at may katulad na mga mode ng conversion.
Opsyon
-- Tratuhin ang lahat ng mga sumusunod na opsyon bilang mga pangalan ng file. Gamitin ang opsyong ito kung gusto mong mag-convert
mga file na ang mga pangalan ay nagsisimula sa isang gitling. Halimbawa upang i-convert ang isang file na pinangalanang "-foo", ikaw
maaaring gamitin ang utos na ito:
dos2unix ----foo
O sa bagong file mode:
dos2unix -n -- -foo out.txt
-ascii
I-convert lamang ang mga line break. Ito ang default na mode ng conversion.
-iso
Conversion sa pagitan ng DOS at ISO-8859-1 character set. Tingnan din ang seksyong CONVERSION
MGA MODE.
-1252
Gamitin ang Windows code page 1252 (Western European).
-437
Gamitin ang DOS code page 437 (US). Ito ang default na pahina ng code na ginagamit para sa ISO conversion.
-850
Gamitin ang DOS code page 850 (Western European).
-860
Gamitin ang DOS code page 860 (Portuguese).
-863
Gamitin ang DOS code page 863 (French Canadian).
-865
Gamitin ang DOS code page 865 (Nordic).
-7 I-convert ang 8 bit na character sa 7 bit na espasyo.
-c, --convmode CONVMODE
Itakda ang conversion mode. Kung saan ang CONVMODE ay isa sa: ASCII, 7bit, ISO, kapote may pagiging ascii
ang default.
-f, --puwersa
Pilitin ang pag-convert ng mga binary file.
-h, - Tumulong
Ipakita ang tulong at lumabas.
-k, --keepdate
Panatilihin ang stamp ng petsa ng output file na katulad ng input file.
-L, --lisensya
Ipakita ang lisensya ng programa.
-l, --bagong linya
Magdagdag ng karagdagang bagong linya.
dos2unix: Tanging ang mga line break ng DOS ay binago sa dalawang linya ng Unix. Sa Mac mode lang
Ang mga line break sa Mac ay binago sa dalawang Unix line break.
unix2dos: Tanging ang mga line break ng Unix ay binago sa dalawang DOS line break. Sa Mac mode Unix
ang mga line break ay binago sa dalawang Mac line break.
-m, --add-bom
Sumulat ng UTF-8 Byte Order Mark sa output file. Huwag kailanman gamitin ang opsyong ito kapag ang
ang output encoding ay iba sa UTF-8. Tingnan din ang seksyong UNICODE.
-n, --bagong file INFILE OUTFILE ...
Bagong file mode. I-convert ang file na INFILE at isulat ang output sa file na OUTFILE. Ang mga pangalan ng file ay dapat
ibigay sa pares at dapat na mga wildcard na pangalan hindi gamitin o ikaw habilin mawala ang iyong mga file.
Ang taong magsisimula ng conversion sa bagong file (pinares) na mode ang magiging may-ari ng
ang na-convert na file. Ang mga pahintulot sa pagbabasa/pagsusulat ng bagong file ang magiging mga pahintulot
ng orihinal na file minus ang umask(1) ng taong nagpapatakbo ng conversion.
-o, --oldfile FILE ...
Lumang file mode. I-convert ang file na FILE at i-overwrite ang output dito. Nagde-default ang program sa
tumakbo sa mode na ito. Maaaring gamitin ang mga pangalan ng wildcard.
Sa lumang file (in-place) mode ang na-convert na file ay nakakakuha ng parehong may-ari, grupo, at
basahin/isulat ang mga pahintulot bilang orihinal na file. Gayundin kapag ang file ay na-convert ng
isa pang user na may mga pahintulot sa pagsulat sa file (hal. user root). Ang conversion
ay aabort kapag hindi posible na mapanatili ang mga orihinal na halaga. Pagbabago ng
maaaring mangahulugan ang may-ari na hindi na nababasa ng orihinal na may-ari ang file. Baguhin
ng grupo ay maaaring isang panganib sa seguridad, ang file ay maaaring gawing nababasa para sa mga tao para sa
kanino ito ay hindi nilayon. Ang pangangalaga ng may-ari, grupo, at mga pahintulot sa pagbasa/pagsusulat ay
sinusuportahan lamang sa Unix.
-q, --tahimik
Tahimik na mode. Pigilan ang lahat ng babala at mensahe. Ang return value ay zero. Maliban kung kailan
ginagamit ang mga maling opsyon sa command-line.
-oo, --ligtas
Laktawan ang mga binary file (default).
-ul, --assume-utf16le
Ipagpalagay na ang format ng input file ay UTF-16LE.
Kapag mayroong Byte Order Mark sa input file, ang BOM ay may priyoridad dito
pagpipilian.
Kapag nagkamali ka ng palagay (ang input file ay wala sa format na UTF-16LE) at ang
nagtagumpay ang conversion, makakakuha ka ng UTF-8 output file na may maling text. Maaari mong i-undo
ang maling conversion sa iconv(1) sa pamamagitan ng pag-convert ng UTF-8 output file pabalik sa
UTF-16LE. Ibabalik nito ang orihinal na file.
Ang pagpapalagay ng UTF-16LE ay gumagana bilang a Conversion paraan. Sa pamamagitan ng paglipat sa default
ASCII mode ang UTF-16LE assumption ay naka-off.
-ub, --assume-utf16be
Ipagpalagay na ang format ng input file ay UTF-16BE.
Gumagana ang pagpipiliang ito sa parehong opsyon na "-ul".
-F, --follow-symlink
Sundin ang mga simbolikong link at i-convert ang mga target.
-R, --palitan-symlink
Palitan ang mga simbolikong link ng mga na-convert na file (nananatiling hindi nagbabago ang mga orihinal na target na file).
-S, --skip-symlink
Panatilihing hindi nagbabago ang mga simbolikong link at target (default).
-V, --bersyon
Ipakita ang impormasyon ng bersyon at lumabas.
MAC MODE
Sa normal na mode, ang mga line break ay kino-convert mula sa DOS patungong Unix at vice versa. Naputol ang linya ng Mac
ay hindi napagbagong loob.
Sa Mac mode, ang mga line break ay kino-convert mula sa Mac patungong Unix at vice versa. Ang mga line break ng DOS ay
Hindi nabago.
Upang tumakbo sa Mac mode gamitin ang command-line na opsyon na "-c mac" o gamitin ang mga command na "mac2unix" o
"unix2mac".
KONVERSYON mode
Mga mode ng conversion ASCII, 7bit, at ISO ay katulad ng sa dos2unix/unix2dos sa ilalim
SunOS/Solaris.
ASCII
Sa mode na "ascii" ang mga line break lang ang kino-convert. Ito ang default na mode ng conversion.
Kahit na ang pangalan ng mode na ito ay ASCII, na isang 7 bit na pamantayan, ang aktwal na mode ay
8 bit. Gamitin palagi ang mode na ito kapag nagko-convert ng mga Unicode UTF-8 file.
7bit
Sa mode na ito lahat ng 8 bit na hindi ASCII na character (na may mga halaga mula 128 hanggang 255) ay
na-convert sa isang 7 bit space.
ISO Ang mga character ay kino-convert sa pagitan ng isang DOS character set (code page) at ISO character set
ISO-8859-1 (Latin-1) sa Unix. Mga character ng DOS na walang katumbas na ISO-8859-1, kung saan
hindi posible ang conversion, na-convert sa isang tuldok. Ang parehong bilang para sa ISO-8859-1
mga character na walang katapat na DOS.
Kapag ginamit lamang ang opsyong "-iso" susubukan ng dos2unix na tukuyin ang aktibong pahina ng code.
Kapag hindi ito posible, gagamit ang dos2unix ng default na pahina ng code na CP437, na higit sa lahat
ginamit sa USA. Upang pilitin ang isang partikular na pahina ng code, gumamit ng mga opsyon na "-437" (US), "-850"
(Western European), "-860" (Portuguese), "-863" (French Canadian), o "-865" (Nordic).
Ang pahina ng Windows code na CP1252 (Western European) ay sinusuportahan din ng opsyong "-1252". Para sa
ang ibang mga pahina ng code ay gumagamit ng dos2unix kasama ng iconv(1). Maaaring mag-convert ang Iconv sa pagitan
isang mahabang listahan ng mga pag-encode ng character.
Huwag kailanman gumamit ng ISO conversion sa Unicode text file. Masisira nito ang mga naka-encode na file ng UTF-8.
Ang ilang mga halimbawa:
I-convert mula sa DOS default code na pahina sa Unix Latin-1
dos2unix -iso -n in.txt out.txt
I-convert mula sa DOS CP850 sa Unix Latin-1
dos2unix -850 -n in.txt out.txt
I-convert mula sa Windows CP1252 patungong Unix Latin-1
dos2unix -1252 -n in.txt out.txt
I-convert mula sa Windows CP1252 patungong Unix UTF-8 (Unicode)
iconv -f CP1252 -t UTF-8 in.txt | dos2unix > out.txt
I-convert mula sa Unix Latin-1 sa pahina ng default na code ng DOS.
unix2dos -iso -n in.txt out.txt
I-convert mula sa Unix Latin-1 sa DOS CP850
unix2dos -850 -n in.txt out.txt
I-convert mula sa Unix Latin-1 sa Windows CP1252
unix2dos -1252 -n in.txt out.txt
I-convert mula sa Unix UTF-8 (Unicode) sa Windows CP1252
unix2dos < in.txt | iconv -f UTF-8 -t CP1252 > out.txt
Tingnan dinhttp://czyborra.com/charsets/codepages.html> at
<http://czyborra.com/charsets/iso8859.html>.
Unicode
Mga encoding
Mayroong iba't ibang Unicode encodings. Sa Unix at Linux Unicode file ay karaniwang
naka-encode sa UTF-8 encoding. Sa Windows Unicode text file ay maaaring ma-encode sa UTF-8, UTF-16,
o UTF-16 big endian, ngunit karamihan ay naka-encode sa UTF-16 na format.
Conversion
Ang mga Unicode text file ay maaaring magkaroon ng DOS, Unix o Mac line break, tulad ng mga regular na text file.
Ang lahat ng mga bersyon ng dos2unix at unix2dos ay maaaring mag-convert ng mga file na naka-encode ng UTF-8, dahil ang UTF-8 ay
idinisenyo para sa pabalik na pagkakatugma sa ASCII.
Dos2unix at unix2dos na may suporta sa Unicode UTF-16, nakakabasa ng maliit at malaking endian na UTF-16
naka-encode na mga text file. Upang makita kung ang dos2unix ay binuo gamit ang uri ng suporta ng UTF-16 na "dos2unix -V".
Ang mga bersyon ng Windows ng dos2unix at unix2dos ay palaging nagko-convert ng UTF-16 na naka-encode na mga file sa UTF-8
naka-encode na mga file. Ang mga bersyon ng Unix ng dos2unix/unix2dos ay nagko-convert ng mga file na naka-encode ng UTF-16 sa
locale character encoding kapag nakatakda ito sa UTF-8. Gamitin ang lokal(1) utos upang malaman
ano ang locale character encoding.
Dahil ang naka-format na UTF-8 na mga text file ay mahusay na sinusuportahan sa parehong Windows at Unix, dos2unix
at walang opsyon ang unix2dos na magsulat ng mga file na UTF-16. Maaaring i-encode ang lahat ng UTF-16 na character
UTF-8. Ang conversion mula sa UTF-16 patungong UTF-8 ay walang pagkawala. Ang mga UTF-16 na file ay lalaktawan
Unix kapag ang locale character encoding ay hindi UTF-8, para maiwasan ang aksidenteng pagkawala ng text.
Kapag may nangyaring error sa conversion ng UTF-16 hanggang UTF-8, halimbawa kapag ang input file ng UTF-16
naglalaman ng isang error, ang file ay lalaktawan.
Hindi gumagana ang ISO at 7-bit na mode na conversion sa mga UTF-16 na file.
Byte order Utak ng buto
Sa Windows Unicode text file ay karaniwang may Byte Order Mark (BOM), dahil maraming Windows
mga program (kabilang ang Notepad) ay nagdaragdag ng mga BOM bilang default. Tingnan din
<http://en.wikipedia.org/wiki/Byte_order_mark>.
Sa Unix Unicode file ay karaniwang walang BOM. Ipinapalagay na ang mga text file ay
naka-encode sa locale na character encoding.
Made-detect lang ng Dos2unix kung ang isang file ay nasa UTF-16 na format kung ang file ay may BOM. Kapag ang isang
Ang UTF-16 file ay walang BOM, makikita ng dos2unix ang file bilang isang binary file.
Gamitin ang opsyong "-ul" o "-ub" para mag-convert ng UTF-16 file na walang BOM.
Ang Dos2unix ay hindi kailanman nagsusulat ng BOM sa output file, maliban kung gumamit ka ng opsyon na "-m".
Nagsusulat ang Unix2dos ng BOM sa output file kapag may BOM ang input file, o kapag opsyon
Ginagamit ang "-m".
Unicode halimbawa
I-convert mula sa Windows UTF-16 (na may BOM) sa Unix UTF-8
dos2unix -n in.txt out.txt
I-convert mula sa Windows UTF-16LE (walang BOM) sa Unix UTF-8
dos2unix -ul -n in.txt out.txt
I-convert mula sa Unix UTF-8 sa Windows UTF-8 gamit ang BOM
unix2dos -m -n in.txt out.txt
I-convert mula sa Unix UTF-8 patungong Windows UTF-16
unix2dos < in.txt | iconv -f UTF-8 -t UTF-16 > out.txt
HALIMBAWA
Basahin ang input mula sa 'stdin' at isulat ang output sa 'stdout'.
dos2unix
dos2unix -l -c mac
I-convert at palitan ang a.txt. I-convert at palitan ang b.txt.
dos2unix a.txt b.txt
dos2unix -o a.txt b.txt
I-convert at palitan ang a.txt sa ascii conversion mode.
dos2unix a.txt
I-convert at palitan ang a.txt sa ascii conversion mode. I-convert at palitan ang b.txt sa 7bit
mode ng conversion.
dos2unix a.txt -c 7bit b.txt
dos2unix -c ascii a.txt -c 7bit b.txt
dos2unix -ascii a.txt -7 b.txt
I-convert ang a.txt mula sa Mac patungo sa Unix na format.
dos2unix -c mac a.txt
mac2unix a.txt
I-convert ang a.txt mula sa Unix patungo sa Mac na format.
unix2dos -c mac a.txt
unix2mac a.txt
I-convert at palitan ang a.txt habang pinapanatili ang orihinal na stamp ng petsa.
dos2unix -k a.txt
dos2unix -k -o a.txt
I-convert ang a.txt at isulat sa e.txt.
dos2unix -n a.txt e.txt
I-convert ang a.txt at sumulat sa e.txt, panatilihing katulad ng a.txt ang stamp ng petsa ng e.txt.
dos2unix -k -n a.txt e.txt
I-convert at palitan ang a.txt. I-convert ang b.txt at isulat sa e.txt.
dos2unix a.txt -n b.txt e.txt
dos2unix -o a.txt -n b.txt e.txt
I-convert ang c.txt at isulat sa e.txt. I-convert at palitan ang a.txt. I-convert at palitan ang b.txt.
I-convert ang d.txt at isulat sa f.txt.
dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt
RECURSIVE KONVERSYON
Gumamit ng dos2unix kasama ang mahanap(1) at xargs(1) mga utos sa recursively convert
mga text file sa isang istraktura ng puno ng direktoryo. Halimbawa para i-convert ang lahat ng .txt file sa
puno ng direktoryo sa ilalim ng kasalukuyang uri ng direktoryo:
hanapin ang . -name *.txt |xargs dos2unix
LOKASYON
WIKA
Ang pangunahing wika ay pinili gamit ang environment variable na LANG. Ang variable ng LANG
binubuo ng ilang bahagi. Ang unang bahagi ay nasa maliliit na titik ang code ng wika.
Ang pangalawa ay opsyonal at ang country code sa malalaking letra, na sinusundan ng an
salungguhitan. Mayroon ding opsyonal na ikatlong bahagi: pag-encode ng character, na sinusundan ng a
tuldok. Ilang halimbawa para sa POSIX na karaniwang uri ng mga shell:
i-export ang LANG=nl Dutch
i-export ang LANG=nl_NL Dutch, The Netherlands
i-export ang LANG=nl_BE Dutch, Belgium
i-export ang LANG=es_ES Spanish, Spain
i-export ang LANG=es_MX Spanish, Mexico
i-export ang LANG=en_US.iso88591 English, USA, Latin-1 encoding
i-export ang LANG=en_GB.UTF-8 English, UK, UTF-8 encoding
Para sa kumpletong listahan ng mga code ng wika at bansa tingnan ang manwal ng gettext:
<http://www.gnu.org/software/gettext/manual/gettext.html#Language-Codes>
Sa mga Unix system na magagamit mo sa pag-utos lokal(1) upang makakuha ng partikular na impormasyon sa lokal.
ANG WIKA
Gamit ang LANGUAGE environment variable maaari kang tumukoy ng priority list ng mga wika,
pinaghihiwalay ng mga tutuldok. Ang Dos2unix ay nagbibigay ng kagustuhan sa LANGUAGE kaysa LANG. Halimbawa,
unang Dutch at pagkatapos ay German: "LANGUAGE=nl:de". Kailangan mo munang paganahin ang lokalisasyon,
sa pamamagitan ng pagtatakda ng LANG (o LC_ALL) sa isang halaga maliban sa "C", bago ka makagamit ng isang wika
listahan ng priyoridad sa pamamagitan ng variable na LANGUAGE. Tingnan din ang manwal ng gettext:
<http://www.gnu.org/software/gettext/manual/gettext.html#The-LANGUAGE-variable>
Kung pipili ka ng isang wika na hindi magagamit makakakuha ka ng karaniwang Ingles
mga mensahe.
DOS2UNIX_LOCALEDIR
Gamit ang environment variable DOS2UNIX_LOCALEDIR ang LOCALEDIR set sa panahon ng compilation
maaaring i-overrule. Ang LOCALEDIR ay ginagamit upang mahanap ang mga file ng wika. Ang default na halaga ng GNU
ay "/usr/local/share/locale". Pagpipilian --bersyon ay magpapakita ng LOCALEDIR na
ginagamit.
Halimbawa (POSIX shell):
i-export ang DOS2UNIX_LOCALEDIR=$HOME/share/locale
RETURN VALUE
Sa tagumpay, ibinabalik ang zero. Kapag nangyari ang isang error sa system, ang huling error sa system ay
ibinalik. Para sa iba pang mga error 1 ay ibinalik.
Ang return value ay palaging zero sa quiet mode, maliban kung mali ang mga opsyon sa command-line
ginagamit.
Pamantayan
<http://en.wikipedia.org/wiki/Text_file>
<http://en.wikipedia.org/wiki/Carriage_return>
<http://en.wikipedia.org/wiki/Newline>
<http://en.wikipedia.org/wiki/Unicode>
MGA AUTHORS
Benjamin Lin -[protektado ng email]> Bernd Johannes Wuebben (mac2unix mode) -
<[protektado ng email]>, Christian Wurll (magdagdag ng dagdag na bagong linya) -[protektado ng email]>, Erwin
Waterlander -[protektado ng email]> (Maintainer)
Pahina ng proyekto:http://waterlan.home.xs4all.nl/dos2unix.html>
Pahina ng SourceForge:http://sourceforge.net/projects/dos2unix/>
Freecode:http://freecode.com/projects/dos2unix>
Gamitin ang mac2unix online gamit ang mga serbisyo ng onworks.net