Este es el comando trposix que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
tr - traducir caracteres
SINOPSIS
tr [−c | −C] [−s] string1 string2
tr-s [−c | −C] string1
tr-d [−c | −C] string1
tr-ds [−c | −C] string1 string2
DESCRIPCIÓN
La tr La utilidad copiará la entrada estándar a la salida estándar con sustitución o
eliminación de caracteres seleccionados. Las opciones especificadas y el string1 y string2
Los operandos controlarán las traducciones que se produzcan al copiar caracteres y
elementos de recopilación de caracteres.
OPCIONES
La tr La utilidad deberá cumplir con el volumen de Definiciones Básicas de POSIX.1‐2008, Sección 12.2,
Utilidad Sintaxis Líneas directrices.
Se admitirán las siguientes opciones:
−c Complementa el conjunto de valores especificado por string1. Ver la DESCRIPCIÓN AMPLIADA
.
−C Complementa el conjunto de caracteres especificado por string1. Ver el EXTENDIDO
Sección DESCRIPCIÓN.
−d Elimina todas las apariciones de caracteres de entrada especificados por string1.
−s Reemplace las instancias de caracteres repetidos con un solo carácter, como se describe
en la sección DESCRIPCIÓN EXTENDIDA.
OPERANDOS
Se admitirán los siguientes operandos:
string1, string2
Cadenas de control de traducción. Cada cadena representará un conjunto de caracteres para
convertirse en una serie de caracteres utilizados para la traducción. Para
descripción detallada de cómo se interpretan las cadenas, consulte el EXTENDED
Sección DESCRIPCIÓN.
ESTÁNDAR
La entrada estándar puede ser cualquier tipo de archivo.
ENTRADA ARCHIVOS
Ninguna.
MEDIO AMBIENTE VARIABLES
Las siguientes variables de entorno afectarán la ejecución de tr:
IDIOMA Proporcione un valor predeterminado para las variables de internacionalización que no están configuradas o
nulo. (Consulte el volumen de Definiciones básicas de POSIX.1‐2008, Sección 8.2,
Internacionalización Variables por la precedencia de la internacionalización
variables utilizadas para determinar los valores de las categorías de configuración regional).
LC_TODOS Si se establece en un valor de cadena no vacío, anule los valores de todos los demás
Variables de internacionalización.
LC_COLLATE
Determinar la configuración regional para el comportamiento de expresiones de rango y equivalencia.
clases.
LC_CTYPE Determinar la configuración regional para la interpretación de secuencias de bytes de datos de texto.
como caracteres (por ejemplo, de un solo byte en lugar de caracteres de varios bytes en
argumentos) y el comportamiento de las clases de caracteres.
LC_MENSAJES
Determine la configuración regional que se debe utilizar para afectar el formato y el contenido de
mensajes de diagnóstico escritos en error estándar.
NLSPATH Determinar la ubicación de los catálogos de mensajes para el procesamiento de LC_MENSAJES.
ASINCRÓNICO EVENTOS
Por defecto.
SALIDA ESTÁNDAR
La tr la salida debe ser idéntica a la entrada, con la excepción de la especificada
transformaciones.
ESTDERR
El error estándar se utilizará solo para mensajes de diagnóstico.
SALIDA ARCHIVOS
Ninguna.
EXTENDIDO DESCRIPCIÓN
Los operandos string1 y string2 (si se especifica) define dos matrices de caracteres. los
Las construcciones de la siguiente lista se pueden utilizar para especificar caracteres o caracteres de un solo carácter.
recopilación de elementos. Si alguna de las construcciones da como resultado elementos de clasificación de varios caracteres,
tr excluirá, sin un diagnóstico, aquellos elementos de múltiples caracteres del resultado
formación.
personaje Cualquier carácter no descrito por una de las convenciones siguientes representará
misma.
\octal Las secuencias octales se pueden utilizar para representar caracteres con valores codificados específicos.
Una secuencia octal constará de un seguido por el más largo
secuencia de caracteres de uno, dos o tres dígitos octales (01234567). La secuencia
causará el valor cuya codificación está representada por el uno, dos o tres-
dígito entero octal que se colocará en la matriz. Los caracteres de varios bytes requieren
múltiples secuencias de escape concatenadas de este tipo, incluida la
para cada byte.
\personaje
los -secuencias de escape en el volumen de Definiciones básicas de POSIX.1‐2008,
Mesa 5 - 1, Escapar Secuencias y Asociado Acciones ('\\', '\a', '\B', '\F',
'\norte', '\ r', '\ t', '\ v') deberá ser apoyado. Los resultados de usar cualquier otro
carácter, que no sea un dígito octal, siguiendo el no están especificados.
Además, si no hay ningún carácter siguiendo el , los resultados son
sin especificar.
c-c En la configuración regional POSIX, esta construcción representará el rango de clasificación
elementos entre los puntos finales del rango (siempre que ninguno de los puntos finales sea un octal
secuencia de la forma \octal), inclusive, según lo definido por la secuencia de clasificación.
Los caracteres o elementos de clasificación en el rango se colocarán en la matriz.
en secuencia de clasificación ascendente. Si el segundo punto final precede al inicio
punto final en la secuencia de clasificación, no se especifica si el rango de
La clasificación de elementos está vacía o esta construcción se considera no válida. En locales
Aparte de la configuración regional POSIX, esta construcción tiene un comportamiento no especificado.
Si uno o ambos puntos finales del rango son secuencias octales de la forma \octal,
esto representará el rango de valores codificados específicos entre los dos rangos
puntos finales, inclusive.
[:clase:] Representa todos los caracteres que pertenecen a la clase de caracteres definida, como se define
por el ajuste actual de la LC_CTYPE categoría de configuración regional. El siguiente personaje
Los nombres de clases se aceptarán cuando se especifiquen en string1:
alnum en blanco dígito lower punto superior
alfa controlar gráfica Imprimir espacio xdigito
Además, las expresiones de clase de caracteres de la forma [:nombre :] será
reconocidos en aquellos lugares donde el nombre A la palabra clave se le ha dado una clase de char
definición en el LC_CTYPE .
Cuando tanto el −d y −s se especifican las opciones, cualquiera de los nombres de clase de caracteres
será aceptado en string2. De lo contrario, solo nombres de clases de caracteres lower or
superior son válidos en string2 y luego solo si la clase de carácter correspondiente
(superior y lower, respectivamente) se especifica en la misma posición relativa en
string1. Dicha especificación se interpretará como una solicitud de caso.
conversión. Cuando [:lower:] aparece en string1 y [:superior:] aparece en string2,
las matrices deben contener los caracteres de la topper mapeo en el LC_CTYPE
categoría de la configuración regional actual. Cuando [:superior:] aparece en string1 y [:lower:]
aparece en string2, las matrices deben contener los caracteres de la reducir
mapeo en el LC_CTYPE categoría de la configuración regional actual. El primer personaje de
cada par de mapeo estará en la matriz para string1 y el segundo personaje
de cada par de mapeo deberá estar en la matriz para string2 en el mismo pariente
larga.
Excepto por la conversión de mayúsculas y minúsculas, los caracteres especificados por una clase de caracteres
La expresión se colocará en la matriz en un orden no especificado.
Si el nombre especificado para clase no define una clase de caracteres válida en el
configuración regional actual, el comportamiento no está definido.
[=equivalente=] Representa todos los caracteres o elementos de clasificación que pertenecen al mismo
clase de equivalencia como equivalente, según lo definido por el ajuste actual del LC_COLLATE
categoría de configuración regional. Solo se permitirá una expresión de clase de equivalencia en
string1, O en string2 cuando está siendo utilizado por el combinado −d y −s .
Los caracteres que pertenecen a la clase de equivalencia se colocarán en la matriz.
en un orden no especificado.
[x*n] Representa n apariciones repetidas del personaje x. Porque esta expresion
se utiliza para asignar varios caracteres a uno, solo es válido cuando ocurre en
string2. Si n se omite o es cero, se interpretará como lo suficientemente grande para
extender el string2-secuencia basada en la longitud de la string1-secuencia basada.
If n tiene un cero a la izquierda, se interpretará como un valor octal. De lo contrario,
se interpretará como un valor decimal.
Cuando el −d la opción no está especificada:
* Si string2 está presente, cada carácter de entrada que se encuentra en la matriz especificada por string1
será reemplazado por el carácter en la misma posición relativa en la matriz
especificado por string2. Si la matriz especificada por string2 es más corto que el
especificado por string1, o si un personaje aparece más de una vez en string1, los resultados
no están especificados.
* Si el −C se especifica la opción, los complementos de los caracteres especificados por string1
(el conjunto de todos los caracteres en el conjunto de caracteres actual, según lo definido por el
ajuste de LC_CTYPE, excepto aquellos realmente especificados en el string1 operando) deberá
colocarse en la matriz en secuencia de clasificación ascendente, según lo definido por el
ajuste de LC_COLLATE.
* Si el −c se especifica la opción, el complemento de los valores especificados por string1 deberá
colocarse en la matriz en orden ascendente por valor binario.
* Porque el orden en el que los caracteres especificados por expresiones de clase de caracteres o
Las expresiones de clase de equivalencia no están definidas, tales expresiones solo deben usarse si
la intención es mapear varios personajes en uno. Una excepción es la conversión de casos, ya que
descrito anteriormente.
Cuando el −d se especifica la opción:
* Introduzca los caracteres que se encuentran en la matriz especificada por string1 será eliminado.
* Cuando el −C La opción se especifica con −d, todos los caracteres excepto los especificados por
string1 será eliminado. Los contenidos de string2 son ignorados, a menos que el −s opción es
también especificado.
* Cuando el −c La opción se especifica con −d, todos los valores excepto los especificados por string1
será eliminado. Los contenidos de string2 será ignorado, a menos que el −s opción es
también especificado.
* No se puede utilizar la misma cadena para ambos −d y la −s opción; cuando ambas opciones
se especifican, ambos string1 (usado para borrar) y string2 (usado para exprimir)
ser requerido.
Cuando el −s se especifica la opción, después de que se hayan realizado eliminaciones o traducciones,
Las secuencias repetidas del mismo carácter serán reemplazadas por una ocurrencia del mismo
carácter, si el carácter se encuentra en la matriz especificada por el último operando. Si el
El último operando contiene una clase de carácter, como el siguiente ejemplo:
tr −s '[:espacio:]'
la matriz del último operando debe contener todos los caracteres de esa clase de caracteres.
Sin embargo, en una conversión de caso, como se describió anteriormente, como:
tr −s '[:superior:]' '[:más bajo:]'
la matriz del último operando debe contener solo los caracteres definidos como el segundo
personajes en cada uno de los topper or reducir pares de caracteres, según corresponda.
Una cadena vacía utilizada para string1 or string2 produce resultados indefinidos.
SALIR ESTADO
Se devolverán los siguientes valores de salida:
0 Todas las entradas se procesaron correctamente.
> 0 Ocurrió un error.
CONSECUENCIAS OF ERRORES
Por defecto.
La siguiendo (secciones) están informativo.
SOLICITUD USO
Si necesario, string1 y string2 se puede citar para evitar que el shell coincida con los patrones.
Si un dígito ordinario (que se representa a sí mismo) debe seguir una secuencia octal, el octal
La secuencia debe utilizar los tres dígitos completos para evitar ambigüedades.
Cuándo string2 es más corto que string1, se produce una diferencia entre el histórico Sistema V y
Sistemas BSD. Un sistema de almohadillas BSD string2 con el último carácter encontrado en string2. Por lo tanto,
es posible hacer lo siguiente:
tr 0123456789 d
que traduciría todos los dígitos a la letra 're'. Dado que esta área es específicamente
no especificado en este volumen de POSIX.1‐2008, tanto los comportamientos BSD como System V son
permitido, pero una aplicación conforme no puede depender del comportamiento BSD. Tendría que
codifique el ejemplo de la siguiente manera:
tr 0123456789 '[D*]'
Cabe señalar que, a pesar de las similitudes en apariencia, los operandos de cadena utilizados por
tr no son expresiones regulares.
A diferencia de algunas implementaciones históricas, esta definición del tr utilidad correctamente
procesa caracteres NUL en su flujo de entrada. Los caracteres NUL se pueden eliminar usando:
tr −d '\ 000'
EJEMPLOS
1. El siguiente ejemplo crea una lista de todas las palabras en file1 uno por línea en file2,
donde una palabra se toma como una cadena máxima de letras.
tr −cs "[:alfa:]" "[\norte*]" <archivo1 > archivo2
2. El siguiente ejemplo traduce todos los caracteres en minúscula en file1 a mayúsculas y escribe
los resultados a la salida estándar.
tr "[:más bajo:]" "[:superior:]" <archivo1
3. Este ejemplo usa una clase de equivalencia para identificar variantes acentuadas de la base
personaje 'mi' in file1, que están despojados de signos diacríticos y escritos en file2.
tr "[= e =]" "[mi*]" <archivo1 > archivo2
RAZÓN FUNDAMENTAL
En algunas propuestas iniciales, una opción explícita −norte fue agregado para deshabilitar el histórico
comportamiento de eliminar caracteres NUL de la entrada. Se consideró que automáticamente
eliminar los caracteres NUL de la entrada no era una funcionalidad correcta. sin embargo, el
eliminación de −norte en una propuesta posterior no elimina el requisito de que tr correctamente
procesar caracteres NUL en su flujo de entrada. Los caracteres NUL se pueden eliminar usando tr −d
'\ 000'.
Implementaciones históricas de tr difieren ampliamente en sintaxis y comportamiento. Por ejemplo, el
La versión BSD no ha necesitado los caracteres entre corchetes para la secuencia de repetición. los tr
la sintaxis de la utilidad se basa más de cerca en el modelo System V y XPG3 al intentar
acomodar implementaciones históricas de BSD. En el caso del corto string2 acolchado, el
La decisión fue no especificar el comportamiento y preservar los scripts de System V y XPG3, que podrían
encontrar dificultades con el método BSD. Se asumió que los usuarios de BSD de tr que
hacer adaptaciones para cumplir con la sintaxis definida aquí. Dado que es posible utilizar el
secuencia de repetición para duplicar el comportamiento deseado, mientras que no hay una forma sencilla de
lograr el método System V, este era el enfoque correcto, si no deseable.
El uso de valores octales para especificar caracteres de control, teniendo precedentes históricos,
no es portátil. La introducción de secuencias de escape para caracteres de control debe
proporcionar la portabilidad necesaria. Se reconoce que esto puede causar algunos
guiones para romper.
Una de las primeras propuestas incluía la compatibilidad con elementos de recopilación de varios caracteres. Fue apuntado
fuera de eso, mientras tr emplea algunos elementos sintácticos de los RE, el objetivo de tr es bastante
diferente; rangos, por ejemplo, no tienen un significado similar (`` cualquiera de los caracteres en el
coincidencias de rango '', y no `` traduce cada carácter en el rango a la salida
contrapartida''). Como resultado, el soporte incluido anteriormente para la clasificación de varios caracteres
elementos se han eliminado. Lo que queda son rangos en el orden de clasificación actual (para respaldar,
por ejemplo, caracteres acentuados), clases de caracteres y clases de equivalencia.
En XPG3 el [:clase:] y [=equivalente=] las convenciones se muestran con corchetes dobles, como en RE
sintaxis. Sin embargo, tr no implementa los principios de ER; simplemente toma prestada parte de la sintaxis.
Como consecuencia, [:clase:] y [=equivalente=] deben considerarse como elementos sintácticos a la par
con [x*n], que no es una expresión de corchetes RE.
Los desarrolladores estándar considerarán cambios en tr que le permiten traducir caracteres
entre diferentes codificaciones de caracteres, o considerarán proporcionar una nueva utilidad para
lograr esto.
En los sistemas históricos System V, una expresión de rango requiere encerrar corchetes,
como:
tr '[Arizona]' '[ARIZONA]'
Sin embargo, los sistemas basados en BSD no requerían los corchetes, y esta convención se usa aquí
para evitar romper una gran cantidad de scripts BSD:
tr Arizona A-Z
La secuencia de comandos de System V anterior seguirá funcionando porque los corchetes, tratados como
caracteres regulares, se traducen a sí mismos. Sin embargo, cualquier script de System V que
confiado en "Arizona" representando los tres personajes 'A', '-'y 'z' tiene que ser reescrito
as "az-".
La norma ISO POSIX ‐ 2: 1993 tenía una −c opción que se comportó de manera similar a la −C opción, pero
no proporcionó una funcionalidad equivalente a la −c opción especificada en POSIX.1‐2008. Esta
significaba que la práctica histórica de poder especificar tr −CD\ 000− \ 177 (que sería
eliminar todos los bytes con el bit superior establecido) no tendría ningún efecto porque, en la configuración regional C,
los bytes con los valores octal 200 a octal 377 no son caracteres.
La versión anterior también decía que las secuencias octales se referían a combinar elementos y
podrían colocarse adyacentes entre sí para especificar caracteres de varios bytes. Sin embargo, fue
señaló que esto causó ambigüedades porque tr no sería capaz de decir si adyacente
Las secuencias octales tenían la intención de especificar caracteres multibyte o múltiples bytes individuales.
caracteres. POSIX.1‐2008 especifica que las secuencias octales siempre se refieren a binarios de un solo byte
valores cuando se usa para especificar un punto final de un rango de elementos de clasificación.
Las versiones anteriores de este estándar permitían implementaciones con bytes distintos a ocho
bits, pero esto ha sido modificado en esta versión.
FUTURO DIRECCIONES
Ninguna.
Utilice trposix en línea utilizando los servicios de onworks.net