Este es el comando dictfmt que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
dictfmt: formatea una base de datos de diccionario de protocolo DICT
SINOPSIS
dictamen -c5 | -t | -e | -f | -h | -j | -p [opciones] nombre base
dictamen -i | -I [opciones]
DESCRIPCIÓN
dictamen toma un archivo, EXPEDIENTE, en stdin y crea una base de datos de diccionario denominada
nombre base.dict, que se ajusta al protocolo DICT. También crea un archivo de índice llamado
nombrebase.índice. De forma predeterminada, el índice se ordena según la configuración regional C, y solo
Los caracteres alfanuméricos y los espacios se utilizan en la ordenación, sin embargo, esto se puede cambiar con
las opciones --locale y --allchars. ( nombre base se elige comúnmente para corresponder a la
nombre base de ARCHIVO , pero esto no es obligatorio).
A menos que la base de datos sea extremadamente pequeña, se recomienda encarecidamente que nombrebase.dict be
comprimido con / usr / bin / dictzip y crear nombrebase.dict.dz. (dictzip está incluido en el
dictado paquete fuente.)
ARCHIVO puede estar en cualquiera de los varios formatos descritos por las opciones de formato -c5, -t, -e, -f,
-h, -j, -p, -io -I. Se debe dar exactamente una de estas opciones.
dictamen antepone varios encabezados al archivo .dict. El encabezado 00-database-url da
el valor de la opción -u como la URL del sitio desde el que se utilizó la base de datos original
adquirido. El encabezado 00-database-short da el valor de la opción -s como nombre corto
del diccionario. (Este "nombre corto" es el nombre de identificación dado por el "dict-D"
opción.) Si se omiten las opciones -u y / o -s, estos valores se mostrarán como
"desconocido", que no es deseable para una base de datos distribuida públicamente.
La fecha de conversión (formateo) se da en el encabezado 00-database-info. Todo el texto en
el archivo de entrada antes del primer encabezado (según lo definido por el formato apropiado
opción) se adjunta a este encabezado. Todo el texto del archivo de entrada después de un encabezado, arriba
al siguiente encabezado, se copia sin cambios al archivo .dict.
FORMATEAR OPCIONES
-c5 ARCHIVO está formateado con palabras clave precedido por 5 o más caracteres de subrayado (_)
y una línea en blanco. Todo el texto hasta el próximo palabra principal se considera la definición.
Los caracteres `@ 'iniciales se eliminan, pero el archivo no se modifica.
Esta opción se escribió para formatear el CIA WORLD FACTBOOK 1995.
-t Las opciones -c5, --without-info y --without-headword están implícitas. Utilice esta opción,
si una base de datos de entrada proviene de dictunformato utilidad.
-e ARCHIVO está en formato html, con la palabra principal etiquetado como negrita. ( palabra clave - )
Esta opción se escribió para formatear el DICCIONARIO BÍBLICO DE 1897 DE EASTON. Una entrada típica
de Easton es:
Abagtha -
uno de los siete eunucos de la corte de Asuero (Ester 1:10; 2:21).
Esto se convierte en:
abagtha
uno de los siete eunucos de la corte de Asuero (Ester 1:10; 2:21).
El encabezado " se omite y el palabra principal "Abagtha" está indexado.
NOTA: Esta opción debe usarse con precaución. Elimina varias etiquetas html
(suficiente para formatear Easton correctamente), pero no todos. El Makefile que fue originalmente
escrito en formato dict-easton usa scripts sed para modificar ciertas referencias cruzadas
etiquetas. Puede ser necesario canalizar el archivo de entrada a través de un script sed, o piratear el
fuente de dictfmt para formatear correctamente otras bases de datos html.
-f ARCHIVO está formateado con el palabras clave comenzando en la columna 0, con la definición
sangrado al menos un espacio (o carácter de tabulación) en las líneas siguientes. El sistema third línea
comenzando in visión de conjunto 0 is adoptado as de la forma más first palabra principal y las dos primeras líneas
que comienzan en la columna 0 se tratan como parte del encabezado 00-database-info. Esta
La opción se escribió para formatear el FOLDOC
-h ARCHIVO está formateado con el palabras clave comenzando en la columna 0, seguida de una coma,
con la definición continuando en la misma línea. Todo el texto antes del primer single
la línea de caracteres se incluye en el encabezado 00-database-info, y las líneas con solo una
Los caracteres se omiten del archivo .dict. El sistema first palabra principal is on de la forma más línea
siguiendo de la forma más first soltero personaje la línea. El sistema palabra principal está indexado; el texto de
el archivo no se cambia. Esta opción fue escrita para formatear NOMBRES BÍBLICOS DE HITCHCOCK
DICCIONARIO.
-j ARCHIVO está formateado con palabras clave comenzando en la columna 0, entre dos puntos, seguido de
la definición. Los dos puntos que rodean el palabra principal se eliminan, y el palabra principal
está indexado. Las líneas que comienzan con '*', '=' o '-' también se eliminan. Todo el texto
antes de que se incluya el primer encabezado en los encabezados. Esta opción fue escrita para
formatee el ARCHIVO JARGON.
NOTA: Algunas versiones recientes del ARCHIVO JARGON tenían tres espacios en blanco insertados antes del
primeros dos puntos en cada palabra clave. Estos deben eliminarse antes de procesar con
dictfmt. (Se han utilizado scripts sed para este propósito. scripts ed, awk o perl
también son posibles.)
-p ARCHIVO tiene el formato '% h' en la columna 0, seguido de un espacio en blanco, seguido de
palabra principal, opcionalmente seguido de una línea que contiene '% d' en la columna 0. El
la definición comienza en la siguiente línea. La primera línea que comienza con ´% h´ y cualquier
las líneas que comienzan con '% d' se eliminan del archivo .dict, y '% h' se elimina de
delante del lema. Todo el texto antes del primer encabezado se incluye en el
encabezados. El sistema second línea comienzo '% h' is adoptado as de la forma más first palabra principal.
Esta opción se escribió para formatear la base de datos de elementos de Jay Kominek.
-i -I Estas dos opciones son diferentes de todas las demás opciones de formato. Son
destinado a recurrir (según dictado requisito) un archivo .index proporcionado en stdin.
Es decir, el archivo .dict no se genera en absoluto. Solo se hace recurrir. Tres o
Se espera una entrada similar a un índice de cuatro columnas. -i espera desplazamiento decimal y longitud,
mientras -I los espera en formato base64.
OPCIONES
-u url Especifica la URL del sitio del que se obtuvo la base de datos sin procesar. Si esto
se especifica la opción, 00-database-url headword y la definición apropiada será
ignorado
-s nombre
Especifica el nombre y, opcionalmente, la versión y la fecha de la base de datos. (Si
esto contiene espacios, debe estar entre comillas.) Si se especifica esta opción,
00-database-short headword y la definición apropiada serán ignoradas.
-L mostrar información sobre licencias y derechos de autor
-V mostrar información de la versión
-D salida de información de depuración
--ayuda mostrar un mensaje de ayuda
--lugar local
Especifica la configuración regional utilizada para ordenar. Si no se especifica ninguna configuración regional, la configuración regional "C"
se utiliza. Para usar el modo UTF-8, se necesita --utf8.
--8 bits genera una base de datos en modo de 8 bits, consulte --lugar opción también.
Nota: Esta opción está obsoleta. Úselo para crear diccionarios de 8 bits (no UTF8)
solamente. Para crear un diccionario UTF-8, use --utf8 opción en lugar.
--utf8 Si se especifica, se crea la base de datos UTF-8.
--todos los caracteres
Especifica que se deben usar todos los caracteres para la búsqueda, solo por defecto
Los caracteres alfabéticos, numéricos y los espacios se colocan en el archivo .index y, por lo tanto, se
utilizado en la búsqueda. Crea la entrada especial 00-database-allchars.
--distingue mayúsculas y minúsculas
hace que la búsqueda distinga entre mayúsculas y minúsculas. Crea la entrada especial 00-database-case-
sensible.
- separador de palabras clave sep
establece el separador de palabras clave, lo que permite que varias palabras tengan el mismo
definición. Por ejemplo, si se da ´ - headword-separator %%% 'y la entrada
el archivo contiene 'otoño %%% otoño', tanto 'otoño' como 'otoño' se indexarán como
encabezados, con la misma definición.
--índice-separador de datos sep
establece el índice / separador de datos, lo que permite establecer la primera y la cuarta columna
del archivo .index de forma independiente. Esa es la primera columna que se puede tratar como un índice.
columna (donde busca el comando COINCIDIR) y la cuarta columna como columna de resultado
(donde MATCH obtiene las cosas que se devuelven), y ellas (columnas 1ª y 4ª) son
completamente independientes entre sí. El valor predeterminado para este separador es
Símbolo ASCII "\ 034".
--break-encabezados
se escribirán varias palabras clave en líneas separadas en el archivo .dict. Para usar
con '--headword-separator.
--index-mantener-orig
Cuando se especifica --utf-8, las palabras clave están en minúsculas y son caracteres no alfanuméricos
se eliminan antes de guardar en un archivo .index para simplificar la búsqueda.
Cuando se utiliza la opción --index-keep-orig, se crea la cuarta columna (si es necesario) en
.index, y contiene un encabezado original que es devuelto por el comando MATCH.
Esta opción puede resultar útil para evitar la conversión de "AT&T" a "ATT" o para mantener la
sustantivos con la primera letra en mayúscula.
--sin palabra clave
las palabras clave no se incluirán en el archivo .dict
--sin encabezado
el encabezado no se copiará en la entrada de información de la base de datos
--sin URL
La URL no se copiará en la entrada de información de la base de datos
--sin tiempo
la hora de creación no se copiará en la entrada de información de la base de datos
--sin-ver
Por defecto dictamen crea una entrada especial 00-database-dictfmt-XYZ que contiene
(en archivo .dict) dictfmt versión en formato dictfmt-XYZ Esta opción suprime
esta.
--sin información
No se creará la entrada de información de la base de datos. Esto puede ser útil si el encabezado 00-database-info
se espera de stdin (dictunformat lo genera).
--columnas columnas
Por defecto dictamen envuelve las cadenas leídas desde stdin a 72 columnas. Esta opción
cambia este valor predeterminado. Si se establece en cero o en un valor negativo, la envoltura está desactivada.
--estrategia-predeterminada estrategia
Establece la estrategia de búsqueda predeterminada para la base de datos. Se usará en lugar de
estrategia '.'. Entrada especial 00-estrategia-predeterminada-de-base de datos se crea para esto
objetivo. Esta opción puede resultar útil, por ejemplo, para diccionarios que contienen
principalmente frases pero las palabras sueltas. En cualquier caso, utilice esta opción si está
absolutamente seguro de lo que estás haciendo.
--mime-encabezado encabezado_mime
Cuando el cliente envía OPCIÓN MÍMICA comando a la dictado , definiciones encontradas en este
La base de datos está precedida por el encabezado MIME especificado. Crea la entrada especial
00-base-de-datos-mime-header.
CRÉDITOS
dictamen fue escrito por Rik Faith ([email protected]) como parte del paquete dict-misc.
dictamen se distribuye bajo los términos de la Licencia Pública General GNU. Si lo necesitas
distribuir bajo otros términos, escribir al autor.
Use dictfmt en línea usando los servicios de onworks.net