Il s'agit de la commande mac2unix qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
dos2unix - Convertisseur de format de fichier texte DOS/Mac vers Unix et vice versa
SYNOPSIS
dos2unix [options] [FICHIER ...] [-n INFILE OUTFILE ...]
unix2dos [options] [FICHIER ...] [-n INFILE OUTFILE ...]
DESCRIPTION
Le package Dos2unix comprend les utilitaires "dos2unix" et "unix2dos" pour convertir le texte brut
fichiers au format DOS ou Mac au format Unix et vice versa.
Dans les fichiers texte DOS/Windows, un saut de ligne, également appelé retour à la ligne, est une combinaison de deux
caractères : un retour chariot (CR) suivi d'un saut de ligne (LF). Dans les fichiers texte Unix, une ligne
break est un seul caractère : le saut de ligne (LF). Dans les fichiers texte Mac, avant Mac OS X, un
le saut de ligne était un seul caractère de retour chariot (CR). De nos jours, Mac OS utilise le style Unix (LF)
sauts de ligne.
Outre les sauts de ligne, Dos2unix peut également convertir l'encodage des fichiers. Quelques pages de codes DOS
peut être converti en Unix Latin-1. Et les fichiers Windows Unicode (UTF-16) peuvent être convertis en
Fichiers Unix Unicode (UTF-8).
Les fichiers binaires sont automatiquement ignorés, sauf si la conversion est forcée.
Les fichiers non réguliers, tels que les répertoires et les FIFO, sont automatiquement ignorés.
Les liens symboliques et leurs cibles sont par défaut conservés intacts. Les liens symboliques peuvent
éventuellement être remplacé, ou la sortie peut être écrite dans la cible du lien symbolique.
Les liens symboliques sous Windows ne sont pas pris en charge. Liens symboliques Windows toujours remplacés,
en gardant les objectifs inchangés.
Dos2unix a été calqué sur dos2unix sous SunOS/Solaris et a des modes de conversion similaires.
OPTIONS
-- Traitez toutes les options suivantes comme des noms de fichiers. Utilisez cette option si vous souhaitez convertir
fichiers dont les noms commencent par un tiret. Par exemple pour convertir un fichier nommé "-foo", vous
peut utiliser cette commande :
dos2unix -- -foo
Ou en mode nouveau fichier :
dos2unix -n -- -foo sortie.txt
-ascii
Convertissez uniquement les sauts de ligne. Il s'agit du mode de conversion par défaut.
-iso
Conversion entre le jeu de caractères DOS et ISO-8859-1. Voir aussi la section CONVERSION
MODES.
- 1252
Utilisez la page de codes Windows 1252 (Europe de l'Ouest).
- 437
Utilisez la page de codes DOS 437 (États-Unis). Il s'agit de la page de codes par défaut utilisée pour la conversion ISO.
- 850
Utilisez la page de codes DOS 850 (Europe de l'Ouest).
- 860
Utilisez la page de codes DOS 860 (portugais).
- 863
Utilisez la page de code DOS 863 (français canadien).
- 865
Utilisez la page de codes DOS 865 (nordique).
-7 Convertissez les caractères 8 bits en espace 7 bits.
-c, --convmode MODE CONV
Définir le mode de conversion. Où CONVMODE est l'un des éléments suivants : ascii, 7bit, iso, mac avec ascii étant
le défaut.
-F, --Obliger
Forcer la conversion des fichiers binaires.
-h, --Aidez-moi
Affichez l'aide et quittez.
-k, --garder à jour
Conservez l'horodatage du fichier de sortie identique à celui du fichier d'entrée.
-L, --Licence
Afficher la licence du programme.
-l, --nouvelle ligne
Ajouter une nouvelle ligne supplémentaire.
dos2unix: Seuls les sauts de ligne DOS sont remplacés par deux sauts de ligne Unix. En mode Mac uniquement
Les sauts de ligne Mac sont remplacés par deux sauts de ligne Unix.
unix2dos: Seuls les sauts de ligne Unix sont remplacés par deux sauts de ligne DOS. En mode Mac Unix
les sauts de ligne sont remplacés par deux sauts de ligne Mac.
-m, --ajouter-bom
Écrivez une marque d'ordre d'octet UTF-8 dans le fichier de sortie. N'utilisez jamais cette option lorsque le
l'encodage de sortie est autre que UTF-8. Voir aussi la section UNICODE.
-n, --nouveau fichier DANS LE FICHIER FICHIERS
Nouveau mode de fichier. Convertissez le fichier INFILE et écrivez la sortie dans le fichier OUTFILE. Les noms de fichiers doivent
être donnés par paires et les noms génériques devraient pas être utilisé ou vous sera perdre vos fichiers.
La personne qui démarre la conversion en mode nouveau fichier (apparié) sera le propriétaire de
le fichier converti. Les autorisations de lecture/écriture du nouveau fichier seront les autorisations
du fichier d'origine moins le umask(1) de la personne qui dirige la conversion.
-o, --ancienfichier DOSSIER
Ancien mode de fichier. Convertissez le fichier FILE et écrasez la sortie dessus. Le programme par défaut
fonctionner dans ce mode. Des noms génériques peuvent être utilisés.
En mode ancien fichier (sur place), le fichier converti obtient le même propriétaire, groupe et
autorisations de lecture/écriture en tant que fichier d'origine. Aussi lorsque le fichier est converti par
un autre utilisateur qui a des autorisations d'écriture sur le fichier (par exemple l'utilisateur root). La conversion
sera abandonné lorsqu'il n'est pas possible de conserver les valeurs d'origine. Changement de
propriétaire peut signifier que le propriétaire d'origine n'est plus en mesure de lire le fichier. Changer
du groupe pourrait constituer un risque pour la sécurité, le fichier pourrait être rendu lisible par des personnes pour
à qui il n'est pas destiné. La préservation des autorisations de propriétaire, de groupe et de lecture/écriture est
uniquement pris en charge sur Unix.
-q, --silencieux
Mode silencieux. Supprimer tous les avertissements et messages. La valeur de retour est zéro. Sauf quand
de mauvaises options de ligne de commande sont utilisées.
-Oui, --en sécurité
Ignorer les fichiers binaires (par défaut).
L', --assume-utf16le
Supposons que le format de fichier d'entrée est UTF-16LE.
Lorsqu'il y a une marque d'ordre d'octet dans le fichier d'entrée, la nomenclature a la priorité sur cette
option.
Lorsque vous avez fait une fausse hypothèse (le fichier d'entrée n'était pas au format UTF-16LE) et que le
conversion réussie, vous obtiendrez un fichier de sortie UTF-8 avec un texte erroné. Vous pouvez annuler
la mauvaise conversion avec iconv(1) en reconvertissant le fichier de sortie UTF-8 en
UTF-16LE. Cela ramènera le fichier d'origine.
L'hypothèse de l'UTF-16LE fonctionne comme un Conversion mode. En passant à la valeur par défaut
ascii l'hypothèse UTF-16LE est désactivée.
-ub, --assume-utf16be
Supposons que le format de fichier d'entrée est UTF-16BE.
Cette option fonctionne de la même manière que l'option "-ul".
-F, --follow-symlink
Suivez les liens symboliques et convertissez les cibles.
-R, --remplacer le lien symbolique
Remplacez les liens symboliques par les fichiers convertis (les fichiers cibles d'origine restent inchangés).
-S, --skip-lien symbolique
Conserver les liens symboliques et les cibles inchangés (par défaut).
-V, --version
Affichez les informations de version et quittez.
MAC MODE
En mode normal, les sauts de ligne sont convertis de DOS en Unix et vice versa. sauts de ligne Mac
ne sont pas convertis.
En mode Mac, les sauts de ligne sont convertis de Mac en Unix et vice versa. Les sauts de ligne DOS sont
inchangé.
Pour exécuter en mode Mac, utilisez l'option de ligne de commande "-c mac" ou utilisez les commandes "mac2unix" ou
"unix2mac".
CONVERSION MODES
Modes de conversion ascii, 7bit et iso sont similaires à ceux de dos2unix/unix2dos sous
SunOS/Solaris.
ascii
En mode "ascii", seuls les sauts de ligne sont convertis. Il s'agit du mode de conversion par défaut.
Bien que le nom de ce mode soit ASCII, qui est une norme 7 bits, le mode réel est
8 bits. Utilisez toujours ce mode lors de la conversion de fichiers Unicode UTF-8.
7bit
Dans ce mode, tous les caractères non-ASCII 8 bits (avec des valeurs de 128 à 255) sont
converti en un espace 7 bits.
iso Les caractères sont convertis entre un jeu de caractères DOS (page de codes) et un jeu de caractères ISO
ISO-8859-1 (Latin-1) sur Unix. Caractères DOS sans équivalent ISO-8859-1, pour lesquels
la conversion n'est pas possible, sont convertis en un point. La même chose compte pour ISO-8859-1
caractères sans contrepartie DOS.
Lorsque seule l'option "-iso" est utilisée, dos2unix essaiera de déterminer la page de code active.
Lorsque cela n'est pas possible, dos2unix utilisera la page de codes par défaut CP437, qui est principalement
utilisé aux USA. Pour forcer une page de code spécifique, utilisez les options "-437" (US), "-850"
(Europe occidentale), "-860" (portugais), "-863" (canadien français) ou "-865" (nordique).
La page de codes Windows CP1252 (Europe de l'Ouest) est également prise en charge avec l'option "-1252". Pour
d'autres pages de codes utilisent dos2unix en combinaison avec iconv(1). Iconv peut convertir entre
une longue liste d'encodages de caractères.
N'utilisez jamais la conversion ISO sur des fichiers texte Unicode. Cela corrompt les fichiers encodés en UTF-8.
Quelques exemples:
Conversion de la page de codes par défaut DOS en Unix Latin-1
dos2unix -iso -n entrée.txt sortie.txt
Convertir DOS CP850 en Unix Latin-1
dos2unix -850 -n entrée.txt sortie.txt
Convertir de Windows CP1252 en Unix Latin-1
dos2unix -1252 -n entrée.txt sortie.txt
Convertir de Windows CP1252 en Unix UTF-8 (Unicode)
iconv -f CP1252 -t UTF-8 in.txt | dos2unix > out.txt
Conversion de la page de codes par défaut d'Unix Latin-1 vers la page de codes DOS.
unix2dos -iso -n entrée.txt sortie.txt
Convertir Unix Latin-1 en DOS CP850
unix2dos -850 -n entrée.txt sortie.txt
Convertir Unix Latin-1 en Windows CP1252
unix2dos -1252 -n entrée.txt sortie.txt
Convertir d'Unix UTF-8 (Unicode) en Windows CP1252
unix2dos < in.txt | iconv -f UTF-8 -t CP1252 > out.txt
Voir égalementhttp://czyborra.com/charsets/codepages.html> et
<http://czyborra.com/charsets/iso8859.html>.
UNICODE
Encodages
Il existe différents encodages Unicode. Sous Unix et Linux, les fichiers Unicode sont généralement
codé en UTF-8. Sous Windows, les fichiers texte Unicode peuvent être encodés en UTF-8, UTF-16,
ou UTF-16 big endian, mais sont principalement encodés au format UTF-16.
Conversion
Les fichiers texte Unicode peuvent avoir des sauts de ligne DOS, Unix ou Mac, comme les fichiers texte normaux.
Toutes les versions de dos2unix et unix2dos peuvent convertir des fichiers encodés UTF-8, car UTF-8 était
conçu pour une compatibilité descendante avec ASCII.
Dos2unix et unix2dos avec support Unicode UTF-16, peuvent lire le petit et le gros boutien UTF-16
fichiers texte encodés. Pour voir si dos2unix a été construit avec le support UTF-16, tapez "dos2unix -V".
Les versions Windows de dos2unix et unix2dos convertissent toujours les fichiers encodés UTF-16 en UTF-8
fichiers encodés. Les versions Unix de dos2unix/unix2dos convertissent les fichiers encodés UTF-16 au format
l'encodage des caractères des paramètres régionaux lorsqu'il est défini sur UTF-8. Utilisez le local(1) commande pour savoir
quel est l'encodage des caractères des paramètres régionaux.
Étant donné que les fichiers texte au format UTF-8 sont bien pris en charge sur Windows et Unix, dos2unix
et unix2dos n'a aucune option pour écrire des fichiers UTF-16. Tous les caractères UTF-16 peuvent être encodés dans
UTF-8. La conversion d'UTF-16 en UTF-8 se fait sans perte. Les fichiers UTF-16 seront ignorés le
Unix lorsque l'encodage des caractères des paramètres régionaux n'est pas UTF-8, pour éviter toute perte accidentelle de texte.
Lorsqu'une erreur de conversion UTF-16 en UTF-8 se produit, par exemple lorsque le fichier d'entrée UTF-16
contient une erreur, le fichier sera ignoré.
La conversion en mode ISO et 7 bits ne fonctionne pas sur les fichiers UTF-16.
Octet Order Marquez
Sous Windows, les fichiers texte Unicode ont généralement une marque d'ordre d'octet (BOM), car de nombreux
les programmes (y compris le Bloc-notes) ajoutent des nomenclatures par défaut. Voir également
<http://en.wikipedia.org/wiki/Byte_order_mark>.
Sous Unix, les fichiers Unicode n'ont généralement pas de nomenclature. On suppose que les fichiers texte sont
codés dans le codage des caractères de la région.
Dos2unix ne peut détecter si un fichier est au format UTF-16 que si le fichier a une nomenclature. Quand un
Le fichier UTF-16 n'a pas de nomenclature, dos2unix verra le fichier comme un fichier binaire.
Utilisez l'option "-ul" ou "-ub" pour convertir un fichier UTF-16 sans BOM.
Dos2unix n'écrit jamais de nomenclature dans le fichier de sortie, sauf si vous utilisez l'option "-m".
Unix2dos écrit une nomenclature dans le fichier de sortie lorsque le fichier d'entrée a une nomenclature, ou lorsque l'option
"-m" est utilisé.
Unicode exemples
Convertir de Windows UTF-16 (avec BOM) en Unix UTF-8
dos2unix -n entrée.txt sortie.txt
Convertir de Windows UTF-16LE (sans BOM) en Unix UTF-8
dos2unix -ul -n entrée.txt sortie.txt
Convertir d'Unix UTF-8 en Windows UTF-8 avec BOM
unix2dos -m -n entrée.txt sortie.txt
Convertir d'Unix UTF-8 en Windows UTF-16
unix2dos < in.txt | iconv -f UTF-8 -t UTF-16 > out.txt
EXEMPLES
Lire l'entrée de 'stdin' et écrire la sortie dans 'stdout'.
dos2unix
dos2unix -l -c mac
Convertissez et remplacez a.txt. Convertissez et remplacez b.txt.
dos2unix a.txt b.txt
dos2unix -o a.txt b.txt
Convertissez et remplacez a.txt en mode de conversion ASCII.
dos2unix a.txt
Convertissez et remplacez a.txt en mode de conversion ASCII. Convertir et remplacer b.txt en 7bit
mode de conversion.
dos2unix a.txt -c 7bit b.txt
dos2unix -c ascii a.txt -c 7bit b.txt
dos2unix -ascii a.txt -7 b.txt
Convertissez a.txt du format Mac au format Unix.
dos2unix -c mac a.txt
mac2unix a.txt
Convertissez a.txt du format Unix au format Mac.
unix2dos -c mac a.txt
unix2mac a.txt
Convertissez et remplacez a.txt tout en conservant l'horodatage d'origine.
dos2unix -k a.txt
dos2unix -k -o a.txt
Convertissez a.txt et écrivez en e.txt.
dos2unix -n a.txt e.txt
Convertissez a.txt et écrivez en e.txt, conservez l'horodatage de e.txt identique à a.txt.
dos2unix -k -n a.txt e.txt
Convertissez et remplacez a.txt. Convertissez b.txt et écrivez en e.txt.
dos2unix a.txt -n b.txt e.txt
dos2unix -o a.txt -n b.txt e.txt
Convertissez c.txt et écrivez en e.txt. Convertissez et remplacez a.txt. Convertissez et remplacez b.txt.
Convertissez d.txt et écrivez dans f.txt.
dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt
RÉCURSIF CONVERSION
Utilisez dos2unix en combinaison avec le trouverde Géographie (1) et avec la xarg(1) commandes pour convertir récursivement
fichiers texte dans une arborescence de répertoires. Par exemple pour convertir tous les fichiers .txt dans le
arborescence de répertoires sous le type de répertoire actuel :
trouve . -name *.txt |xargs dos2unix
LOCALISATION
LANGUE
La langue principale est sélectionnée avec la variable d'environnement LANG. La variable LANG
se compose de plusieurs parties. La première partie est en minuscules le code de la langue.
Le second est facultatif et correspond au code du pays en lettres majuscules, précédé d'un
souligner. Il existe également une troisième partie facultative : l'encodage des caractères, précédé d'un
point. Quelques exemples de shells de type standard POSIX :
export LANG=nl Néerlandais
export LANG=nl_NL Néerlandais, Pays-Bas
export LANG=nl_BE Néerlandais, Belgique
export LANG=es_ES Espagnol, Espagne
export LANG=es_MX Espagnol, Mexique
export LANG=en_US.iso88591 encodage anglais, américain, latin-1
export LANG=en_GB.UTF-8 Encodage anglais, britannique, UTF-8
Pour une liste complète des codes de langue et de pays, consultez le manuel gettext :
<http://www.gnu.org/software/gettext/manual/gettext.html#Codes-Langues>
Sur les systèmes Unix, vous pouvez utiliser pour commander local(1) pour obtenir des informations spécifiques aux paramètres régionaux.
LANGUAGE
Avec la variable d'environnement LANGUAGE vous pouvez spécifier une liste prioritaire de langues,
séparés par des deux points. Dos2unix donne la préférence à LANGUAGE sur LANG. Par exemple,
d'abord en néerlandais puis en allemand : "LANGUAGE=nl:de". Vous devez d'abord activer la localisation,
en définissant LANG (ou LC_ALL) sur une valeur autre que "C", avant de pouvoir utiliser une langue
liste de priorité via la variable LANGUAGE. Voir aussi le manuel gettext :
<http://www.gnu.org/software/gettext/manual/gettext.html#La-variable-LANGUAGE>
Si vous sélectionnez une langue qui n'est pas disponible, vous obtiendrez l'anglais standard
des messages.
DOS2UNIX_LOCALEDIR
Avec la variable d'environnement DOS2UNIX_LOCALEDIR le LOCALEDIR défini lors de la compilation
peut être annulé. LOCALEDIR est utilisé pour trouver les fichiers de langue. La valeur par défaut de GNU
est "/usr/local/share/locale". Option --version affichera le LOCALEDIR qui est
utilisé.
Exemple (shell POSIX) :
exporter DOS2UNIX_LOCALEDIR=$HOME/partage/locale
RETOUR VALEURE
En cas de succès, zéro est renvoyé. Lorsqu'une erreur système se produit, la dernière erreur système sera
revenu. Pour les autres erreurs, 1 est renvoyé.
La valeur de retour est toujours zéro en mode silencieux, sauf lorsque de mauvaises options de ligne de commande sont
utilisé.
NORMES
<http://en.wikipedia.org/wiki/Text_file>
<http://en.wikipedia.org/wiki/Carriage_return>
<http://en.wikipedia.org/wiki/Newline>
<http://en.wikipedia.org/wiki/Unicode>
AUTEURS
Benjamin Lin -[email protected]> Bernd Johannes Wuebben (mode mac2unix) -
<[email protected]>, Christian Wurll (ajouter une nouvelle ligne supplémentaire) -[email protected]>, Erwin
Waterlander -[email protected]> (Gestionnaire)
Page du projet :http://waterlan.home.xs4all.nl/dos2unix.html>
Page SourceForge :http://sourceforge.net/projects/dos2unix/>
Code gratuit :http://freecode.com/projects/dos2unix>
Utiliser mac2unix en ligne en utilisant les services onworks.net