Este es el comando dos2unix que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
dos2unix - Conversor de formato de archivo de texto de DOS / Mac a Unix y viceversa
SINOPSIS
dos2unix [opciones] [ARCHIVO ...] [-n INFILE SALIDA ...]
unix2dos [opciones] [FILE ...] [-n INFILE OUTFILE ...]
DESCRIPCIÓN
El paquete Dos2unix incluye las utilidades "dos2unix" y "unix2dos" para convertir texto sin formato
archivos en formato DOS o Mac a formato Unix y viceversa.
En archivos de texto de DOS / Windows, un salto de línea, también conocido como nueva línea, es una combinación de dos
caracteres: un retorno de carro (CR) seguido de un salto de línea (LF). En archivos de texto Unix, una línea
El salto es un solo carácter: el salto de línea (LF). En archivos de texto de Mac, anteriores a Mac OS X, un
El salto de línea era un solo carácter de retorno de carro (CR). Hoy en día, Mac OS usa estilo Unix (LF)
saltos de línea.
Además de los saltos de línea, Dos2unix también puede convertir la codificación de archivos. Algunas páginas de códigos de DOS
se puede convertir a Unix Latin-1. Y los archivos Windows Unicode (UTF-16) se pueden convertir a
Archivos Unix Unicode (UTF-8).
Los archivos binarios se omiten automáticamente, a menos que se fuerce la conversión.
Los archivos no regulares, como directorios y FIFO, se omiten automáticamente.
Los enlaces simbólicos y sus objetivos se mantienen intactos de forma predeterminada. Los enlaces simbólicos pueden
opcionalmente se puede reemplazar, o la salida se puede escribir en el destino del enlace simbólico.
Los enlaces simbólicos en Windows no son compatibles. Los enlaces simbólicos de Windows siempre se reemplazan,
manteniendo los objetivos sin cambios.
Dos2unix se modeló a partir de dos2unix en SunOS / Solaris y tiene modos de conversión similares.
OPCIONES
-- Trate todas las siguientes opciones como nombres de archivo. Utilice esta opción si desea convertir
archivos cuyos nombres comienzan con un guión. Por ejemplo, para convertir un archivo llamado "-foo",
puede usar este comando:
dos2unix - -foo
O en modo de archivo nuevo:
dos2unix -n - -foo out.txt
-ascii
Convierta solo saltos de línea. Este es el modo de conversión predeterminado.
-Yo asi
Conversión entre el juego de caracteres DOS e ISO-8859-1. Consulte también la sección CONVERSIÓN
MODOS.
-1252
Utilice la página de códigos de Windows 1252 (Europa occidental).
-437
Utilice la página de códigos de DOS 437 (EE. UU.). Esta es la página de códigos predeterminada utilizada para la conversión ISO.
-850
Utilice la página de códigos de DOS 850 (Europa occidental).
-860
Utilice la página de códigos de DOS 860 (portugués).
-863
Utilice la página de códigos de DOS 863 (francés canadiense).
-865
Utilice la página de códigos de DOS 865 (nórdico).
-7 Convierta caracteres de 8 bits en espacios de 7 bits.
-C, --modoconv CONVMODO
Establecer el modo de conversión. Donde CONVMODE es uno de: ascii, 7bit, iso, Mac con ascii siendo
el valor por defecto.
-F, --fuerza
Forzar la conversión de archivos binarios.
-h, --ayuda
Mostrar ayuda y salir.
-k, --mantener fecha
Mantenga el sello de fecha del archivo de salida igual que el del archivo de entrada.
-l, --licencia
Muestra la licencia del programa.
-yo, --nueva línea
Agregue una nueva línea adicional.
dos2unix: Solo los saltos de línea de DOS se cambian a dos saltos de línea de Unix. Solo en modo Mac
Los saltos de línea de Mac se cambian a dos saltos de línea de Unix.
unix2dos: Solo los saltos de línea de Unix se cambian a dos saltos de línea de DOS. En modo Mac Unix
Los saltos de línea se cambian a dos saltos de línea de Mac.
-metro, --add-bom
Escriba una marca de orden de bytes UTF-8 en el archivo de salida. Nunca use esta opción cuando el
La codificación de salida es distinta a UTF-8. Consulte también la sección UNICODE.
-norte, --archivo nuevo EN ARCHIVO PERFIL ...
Nuevo modo de archivo. Convierta el archivo INFILE y escriba la salida en el archivo OUTFILE. Los nombres de archivo deben
darse en pares y los nombres comodín deben no ser usado o tu will perder sus archivos.
La persona que inicie la conversión en el modo de archivo nuevo (emparejado) será el propietario de
el archivo convertido. Los permisos de lectura / escritura del nuevo archivo serán los permisos
del archivo original menos el umask(1) de la persona que dirige la conversión.
-Oh, --archivoantiguo ARCHIVO ...
Modo de archivo antiguo. Convierta el archivo ARCHIVO y sobrescriba la salida en él. El programa predeterminado es
ejecutar en este modo. Se pueden utilizar nombres comodín.
En el modo de archivo antiguo (en el lugar), el archivo convertido obtiene el mismo propietario, grupo y
permisos de lectura / escritura como el archivo original. Además, cuando el archivo es convertido por
otro usuario que tenga permisos de escritura en el archivo (por ejemplo, usuario root). La conversión
se cancelará cuando no sea posible conservar los valores originales. Cambio de
propietario podría significar que el propietario original ya no puede leer el archivo. Cambio
de grupo podría ser un riesgo de seguridad, el archivo podría ser legible para personas para
a quien no está destinado. La preservación de los permisos de propietario, grupo y lectura / escritura es
solo es compatible con Unix.
-q, --tranquilo
Modo silencioso. Suprima todas las advertencias y mensajes. El valor de retorno es cero. Excepto cuando
se utilizan opciones de línea de comandos incorrectas.
-s, --a salvo
Omitir archivos binarios (predeterminado).
El, --asume-utf16le
Suponga que el formato de archivo de entrada es UTF-16LE.
Cuando hay una marca de orden de bytes en el archivo de entrada, la lista de materiales tiene prioridad sobre este
.
Cuando hizo una suposición incorrecta (el archivo de entrada no estaba en formato UTF-16LE) y el
la conversión se realizó correctamente, obtendrá un archivo de salida UTF-8 con texto incorrecto. Puedes deshacer
la conversión incorrecta con iconv(1) convirtiendo el archivo de salida UTF-8 de nuevo a
UTF-16LE. Esto traerá de vuelta el archivo original.
La suposición de UTF-16LE funciona como un conversión modo. Cambiando al predeterminado
ascii modo, la suposición UTF-16LE está desactivada.
-ub, --asume-utf16be
Suponga que el formato de archivo de entrada es UTF-16BE.
Esta opción funciona igual que la opción "-ul".
-F, --seguir-enlace simbólico
Siga enlaces simbólicos y convierta los objetivos.
-R, --reemplazar-enlace simbólico
Reemplace los enlaces simbólicos con archivos convertidos (los archivos de destino originales permanecen sin cambios).
-S, --skip-enlace simbólico
Mantenga los enlaces simbólicos y los destinos sin cambios (predeterminado).
-V, --versión
Muestra la información de la versión y sale.
dirección MAC MODO
En modo normal, los saltos de línea se convierten de DOS a Unix y viceversa. Saltos de línea de Mac
no se convierten.
En el modo Mac, los saltos de línea se convierten de Mac a Unix y viceversa. Los saltos de línea de DOS son
sin cambio.
Para ejecutar en modo Mac, use la opción de línea de comandos "-c mac" o use los comandos "mac2unix" o
"unix2mac".
CONVERSIÓN MODOS
Modos de conversión ascii, 7bity iso son similares a los de dos2unix / unix2dos bajo
SunOS / Solaris.
ascii
En el modo "ascii" solo se convierten los saltos de línea. Este es el modo de conversión predeterminado.
Aunque el nombre de este modo es ASCII, que es un estándar de 7 bits, el modo real es
8 bits. Utilice siempre este modo al convertir archivos Unicode UTF-8.
7bit
En este modo, todos los caracteres no ASCII de 8 bits (con valores de 128 a 255) son
convertido a un espacio de 7 bits.
iso Los caracteres se convierten entre un juego de caracteres DOS (página de códigos) y un juego de caracteres ISO
ISO-8859-1 (Latin-1) en Unix. Caracteres DOS sin equivalente ISO-8859-1, para los cuales
la conversión no es posible, se convierten en un punto. Lo mismo cuenta para ISO-8859-1
caracteres sin homólogo de DOS.
Cuando solo se utiliza la opción "-iso", dos2unix intentará determinar la página de códigos activa.
Cuando esto no sea posible, dos2unix utilizará la página de códigos predeterminada CP437, que es principalmente
utilizado en los EE. UU. Para forzar una página de códigos específica, use las opciones "-437" (EE. UU.), "-850"
(Europa occidental), "-860" (portugués), "-863" (francés canadiense) o "-865" (nórdico).
La página de códigos de Windows CP1252 (Europa occidental) también es compatible con la opción "-1252". Para
otras páginas de códigos utilizan dos2unix en combinación con iconv(1). Iconv puede convertir entre
una larga lista de codificaciones de caracteres.
Nunca use la conversión ISO en archivos de texto Unicode. Dañará archivos codificados en UTF-8.
Algunos ejemplos:
Convertir de la página de códigos predeterminada de DOS a Unix Latin-1
dos2unix -iso -n entrada.txt salida.txt
Convertir de DOS CP850 a Unix Latin-1
dos2unix -850 -n entrada.txt salida.txt
Convierta de Windows CP1252 a Unix Latin-1
dos2unix -1252 -n entrada.txt salida.txt
Convertir de Windows CP1252 a Unix UTF-8 (Unicode)
iconv -f CP1252 -t UTF-8 pulg.txt | dos2unix> out.txt
Convierta de Unix Latin-1 a la página de códigos predeterminada de DOS.
unix2dos -iso -n entrada.txt salida.txt
Convertir de Unix Latin-1 a DOS CP850
unix2dos -850 -n entrada.txt salida.txt
Convertir de Unix Latin-1 a Windows CP1252
unix2dos -1252 -n entrada.txt salida.txt
Convertir de Unix UTF-8 (Unicode) a Windows CP1252
unix2dos <in.txt | iconv -f UTF-8 -t CP1252> out.txt
Ver tambiénhttp://czyborra.com/charsets/codepages.html> y
<http://czyborra.com/charsets/iso8859.html>.
UNICODE
Codificaciones
Existen diferentes codificaciones Unicode. En Unix y Linux, los archivos Unicode suelen
codificado en codificación UTF-8. En Windows, los archivos de texto Unicode se pueden codificar en UTF-8, UTF-16,
o big endian UTF-16, pero en su mayoría están codificados en formato UTF-16.
Conversión
Los archivos de texto Unicode pueden tener saltos de línea DOS, Unix o Mac, como archivos de texto normales.
Todas las versiones de dos2unix y unix2dos pueden convertir archivos codificados en UTF-8, porque UTF-8 fue
diseñado para compatibilidad con versiones anteriores de ASCII.
Dos2unix y unix2dos con soporte Unicode UTF-16, pueden leer little y big endian UTF-16
archivos de texto codificados. Para ver si dos2unix fue construido con soporte UTF-16, escriba "dos2unix -V".
Las versiones de Windows de dos2unix y unix2dos convierten archivos codificados en UTF-16 siempre a UTF-8
archivos codificados. Las versiones Unix de dos2unix / unix2dos convierten archivos codificados en UTF-16 a
codificación de caracteres de configuración regional cuando se establece en UTF-8. Utilizar el local(1) comando para averiguar
cuál es la codificación de caracteres de la configuración regional.
Debido a que los archivos de texto con formato UTF-8 son compatibles con Windows y Unix, dos2unix
y unix2dos no tienen opción para escribir archivos UTF-16. Todos los caracteres UTF-16 se pueden codificar en
UTF-8. La conversión de UTF-16 a UTF-8 no tiene pérdidas. Se omitirán los archivos UTF-16
Unix cuando la codificación de caracteres de la configuración regional no es UTF-8, para evitar la pérdida accidental de texto.
Cuando se produce un error de conversión de UTF-16 a UTF-8, por ejemplo, cuando el archivo de entrada UTF-16
contiene un error, se omitirá el archivo.
La conversión de modo ISO y de 7 bits no funciona en archivos UTF-16.
Byte Order Marc
En Windows, los archivos de texto Unicode suelen tener una marca de orden de bytes (BOM), porque muchos archivos de Windows
Los programas (incluido el Bloc de notas) agregan listas de materiales de forma predeterminada. Ver también
<http://en.wikipedia.org/wiki/Byte_order_mark>.
En Unix, los archivos Unicode normalmente no tienen una lista de materiales. Se supone que los archivos de texto son
codificado en la codificación de caracteres de la configuración regional.
Dos2unix solo puede detectar si un archivo está en formato UTF-16 si el archivo tiene una lista de materiales. Cuando un
El archivo UTF-16 no tiene una lista de materiales, dos2unix verá el archivo como un archivo binario.
Utilice la opción "-ul" o "-ub" para convertir un archivo UTF-16 sin BOM.
Dos2unix nunca escribe una lista de materiales en el archivo de salida, a menos que use la opción "-m".
Unix2dos escribe una lista de materiales en el archivo de salida cuando el archivo de entrada tiene una lista de materiales o cuando la opción
Se utiliza "-m".
Unicode ejemplos
Convierta de Windows UTF-16 (con BOM) a Unix UTF-8
dos2unix -n entrada.txt salida.txt
Convierta de Windows UTF-16LE (sin BOM) a Unix UTF-8
dos2unix -ul -n entrada.txt salida.txt
Convierta de Unix UTF-8 a Windows UTF-8 con BOM
unix2dos -m -n entrada.txt salida.txt
Convertir de Unix UTF-8 a Windows UTF-16
unix2dos <in.txt | iconv -f UTF-8 -t UTF-16> out.txt
EJEMPLOS
Lea la entrada de 'stdin' y escriba la salida en 'stdout'.
dos2unix
dos2unix -l -c mac
Convierta y reemplace a.txt. Convierta y reemplace b.txt.
dos2unix a.txt b.txt
dos2unix -o a.txt b.txt
Convierta y reemplace a.txt en el modo de conversión ascii.
dos2unix a.txt
Convierta y reemplace a.txt en el modo de conversión ascii. Convierta y reemplace b.txt en 7 bits
modo de conversión.
dos2unix a.txt -c 7 bits b.txt
dos2unix -c ascii a.txt -c 7 bits b.txt
dos2unix -ascii a.txt -7 b.txt
Convierte un.txt de Mac a formato Unix.
dos2unix -c mac a.txt
mac2unix a.txt
Convierta un.txt de formato Unix a Mac.
unix2dos -c mac a.txt
unix2mac a.txt
Convierta y reemplace a.txt manteniendo el sello de fecha original.
dos2unix -k a.txt
dos2unix -k -o a.txt
Convierta a.txt y escriba en e.txt.
dos2unix -n a.txt e.txt
Convierta a.txt y escriba a e.txt, mantenga el sello de fecha de e.txt igual que a.txt.
dos2unix -k -n a.txt e.txt
Convierta y reemplace a.txt. Convierta b.txt y escriba en e.txt.
dos2unix a.txt -n b.txt e.txt
dos2unix -o a.txt -n b.txt e.txt
Convierta c.txt y escriba en e.txt. Convierta y reemplace a.txt. Convierta y reemplace b.txt.
Convierta d.txt y escriba en f.txt.
dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt
RECURSIVO CONVERSIÓN
Utilice dos2unix en combinación con el find(1) y xargs(1) comandos para convertir recursivamente
archivos de texto en una estructura de árbol de directorios. Por ejemplo, para convertir todos los archivos .txt en el
árbol de directorio bajo el tipo de directorio actual:
encontrar . -nombre * .txt | xargs dos2unix
LOCALIZACIÓN
IDIOMA
El idioma principal se selecciona con la variable de entorno LANG. La variable LANG
consta de varias partes. La primera parte es en minúsculas el código del idioma.
El segundo es opcional y es el código de país en letras mayúsculas, precedido de un
guion bajo. También hay una tercera parte opcional: codificación de caracteres, precedida de un
punto. Algunos ejemplos de shells de tipo estándar POSIX:
export LANG = nl holandés
export LANG = nl_NL Dutch, The Netherlands
export LANG = nl_BE holandés, Bélgica
export LANG = es_ES español, España
export LANG = es_MX Español, México
export LANG = en_US.iso88591 Inglés, EE. UU., codificación Latin-1
export LANG = en_GB.UTF-8 Codificación en inglés, Reino Unido, UTF-8
Para obtener una lista completa de los códigos de idioma y país, consulte el manual de gettext:
<http://www.gnu.org/software/gettext/manual/gettext.html# Códigos-de-idioma>
En los sistemas Unix puede usar para ordenar local(1) para obtener información específica de la configuración regional.
IDIOMA
Con la variable de entorno LANGUAGE puede especificar una lista de prioridad de idiomas,
separados por dos puntos. Dos2unix da preferencia a IDIOMA sobre IDIOMA. Por ejemplo,
primero holandés y luego alemán: "IDIOMA = nl: de". Primero tienes que habilitar la localización,
estableciendo LANG (o LC_ALL) en un valor que no sea "C", antes de que pueda usar un idioma
lista de prioridades a través de la variable IDIOMA. Consulte también el manual de gettext:
<http://www.gnu.org/software/gettext/manual/gettext.html# La-variable-IDIOMA>
Si selecciona un idioma que no está disponible, obtendrá el inglés estándar
mensajes.
DOS2UNIX_LOCALEDIR
Con la variable de entorno DOS2UNIX_LOCALEDIR el LOCALEDIR establecido durante la compilación
puede ser anulado. LOCALEDIR se utiliza para encontrar los archivos de idioma. El valor predeterminado de GNU
es "/ usr / local / share / locale". Opción --versión mostrará el LOCALEDIR que es
usado.
Ejemplo (shell POSIX):
exportar DOS2UNIX_LOCALEDIR = $ HOME / share / locale
DEVOLUCION VALOR
En caso de éxito, se devuelve cero. Cuando ocurre un error del sistema, el último error del sistema será
regresó. Para otros errores se devuelve 1.
El valor de retorno es siempre cero en modo silencioso, excepto cuando se muestran opciones de línea de comando incorrectas.
usado.
NORMAS
<http://en.wikipedia.org/wiki/Text_file>
<http://en.wikipedia.org/wiki/Carriage_return>
<http://en.wikipedia.org/wiki/Newline>
<http://en.wikipedia.org/wiki/Unicode>
AUTORES
Benjamin Lin -[email protected]> Bernd Johannes Wuebben (modo mac2unix) -
<[email protected]>, Christian Wurll (agregar nueva línea adicional) -[email protected]>, Erwin
Waterlander -[email protected]> (Mantenedor)
Página del proyecto:http://waterlan.home.xs4all.nl/dos2unix.html>
Página de SourceForge:http://sourceforge.net/projects/dos2unix/>
Código libre:http://freecode.com/projects/dos2unix>
Utilice dos2unix en línea utilizando los servicios de onworks.net