Este es el comando grind que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
grind - procesa archivos de lexicógrafo de WordNet
SINOPSIS
moler [ -v ] [ -s ] [ -Larchivo de registro ] [ -a ] [ -d ] [ -i ] [ -o ] [ -n ] nombre de archivo [
nombre de archivo...]
DESCRIPCIÓN
triturar() procesa archivos de lexicógrafo de WordNet, produciendo archivos de base de datos adecuados para su uso
con el código de interfaz y búsqueda de WordNet y otras aplicaciones. La sintáctica y
Se verifica la integridad estructural de los archivos de entrada. Las advertencias y los errores se informan a través de
stderr y se produce un registro de tiempo de ejecución en stdout. Una base de datos se genera solo si hay
no hay errores.
Entrada archivos
Los archivos de entrada corresponden a las categorías sintácticas implementadas en WordNet - sustantivo, verbo,
adjetivo y adverbio. Cada archivo de lexicógrafo de entrada consta de una lista de conjuntos de sinónimos
(sinsets) para una parte del discurso. Aunque la sintaxis básica de synset es la misma para todos
las partes del discurso, algunas partes de la sintaxis solo se aplican a una parte particular del discurso.
See entrada(5WN) para obtener una descripción del formato del archivo de entrada.
Cada nombre de archivo especificado tiene la forma:
ruta/pos.sufijo
donde ruta es opcional y pos es cualquiera sustantivo, verbo, adj or adv. sufijo puede ser usado
para separar grupos de synsets en diferentes archivos, por ejemplo sustantivo animal y
sustantivo planta. Uno o más archivos de entrada, en cualquier combinación de categorías sintácticas, pueden ser
especificado. Ver nombres de lex(5WN) para obtener una lista de los archivos de lexicógrafo utilizados para construir el
base de datos completa de WordNet.
Salida archivos
triturar() produce los siguientes archivos de salida:
┌────────────┬──────────────────────────────────── ────┐
│ Nombre del archivo │ Descripción │
├────────────┼──────────────────────────────────── ────┤
│índice.pos │ Archivo de índice para cada categoría sintáctica │
│datos.pos │ Archivo de datos para cada categoría sintáctica │
│índice.sentido │ Índice de sentido │
└────────────┴──────────────────────────────────── ────┘
See wndb(5WN) para obtener una descripción de los formatos de archivo de la base de datos.
Cada vez triturar() se ejecuta, cualquier archivo de base de datos existente se sobrescribe con la base de datos
archivos generados a partir de los archivos de entrada especificados. Si no hay archivos de entrada de un sintáctico
categoría, los archivos de base de datos correspondientes no se sobrescriben.
sentido Números
Los sentidos generalmente se ordenan de mayor a menor uso, con el más común
sentido numerado 1. La frecuencia de uso está determinada por la cantidad de veces que se etiqueta un sentido
en los distintos textos de concordancia semántica. Los sentidos que no están etiquetados semánticamente siguen
los sentidos ordenados en un orden arbitrario. Tenga en cuenta que este pedido es solo una estimación
basado en el uso en un pequeño corpus.
Las etiquetasense_cnt campo para cada entrada en el índice.pos archivos indica cuántos de los
los sentidos de la lista han sido etiquetados.
Las lista de control El archivo provisto con la base de datos enumera el número de veces que se etiqueta cada sentido.
en las concordancias semánticas. triturar() utiliza los datos de lista de control para ordenar los sentidos de
cada palabra. Cuando el índice.pos se generan archivos, el sincronización_offsets se emiten en sentido
orden numérico, con el sentido 1 primero en la lista. Sentidos con el mismo número de semánticas
A las etiquetas se les asignan números de sentido únicos pero consecutivos. La WordNet Descripción Buscar
muestra todos los sentidos de la palabra especificada, en todas las categorías sintácticas, e indica
cuáles de los sentidos están representados en los textos etiquetados semánticamente.
OPCIONES
-v Verifique la integridad de la entrada sin generar una base de datos.
-s Suprima la generación de mensajes de advertencia. Generalmente moler se ejecuta con esto
opción hasta que se corrijan todos los errores sintácticos y estructurales, ya que
los mensajes de advertencia pueden dificultar la detección de mensajes de error.
-Larchivo de registro Escribe todos los mensajes a archivo de registro en lugar de stderr.
-a Genere informe estadístico sobre archivos de entrada procesados.
-d Genere distribución de sentidos por informe de longitud de cadena en archivos de entrada
procesado.
-i Genere un archivo de índice de detección.
-o Ordenar los sentidos usando lista de control.
-n Genere enlaces de nominalización (morfología derivada) en la base de datos.
nombre de archivo Archivo de entrada de la forma descrita en Entrada Archivos.
Use grind en línea usando los servicios de onworks.net