Это команда yaz-icu, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
yaz-icu - утилита YAZ ICU
СИНТАКСИС
Yaz-icu [-с конфиг] [-п выбирать] [-s] [-x] [входящий файл]
ОПИСАНИЕ
Yaz-icu - это утилита, демонстрирующая модуль цепочки ICU yaz. (yaz / icu.h).
Утилиту можно использовать двумя способами. Он может читать некоторый текст, используя конфигурацию XML для
настройка ICU и показ текстового анализа. Этот режим запускается опцией -c, которая
определяет используемую конфигурацию. Входной файл читается со стандартного ввода или
из файла, если указан infile.
Утилита также может отображать информацию ICU. Это запускается опцией -p.
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
-c конфиг
Задает файл, содержащий конфигурацию цепочки ICU на основе XML.
-p напишите
Задает дополнительную информацию о системе ICU для печати. Если напишите это c, то ICU
конвертеры печатаются. Если напишите напечатаны ли доступные языковые стандарты. Если напишите t
печатаются доступные транслитераторы.
-s
Указывает, что выходные данные также должны включать ключ сортировки. Обратите внимание, что ключ сортировки отличается
между версиями ICU.
-x
Указывает, что вывод должен быть основан на XML, а не на «текстовом».
ICU СЕТЬ КОНФИГУРАЦИЯ
Конфигурация цепочки ICU определяет одно или несколько правил для преобразования текстовых данных в токены.
Формат конфигурации основан на XML.
Элемент верхнего уровня должен называться icu_chain. У элемента icu_chain есть один требуемый
атрибут locale, который указывает языковой стандарт ICU, который будет использоваться на этапах преобразования.
Элемент icu_chain должен включать элементы, каждый из которых определяет преобразование.
шаг. Преобразование выполняется в том порядке, в котором шаги преобразования
указано. Каждый элемент преобразования принимает один атрибут: правило, которое служит аргументом для
шаг преобразования.
Доступны следующие элементы преобразования:
карта дел
Преобразует регистр, а правило определяет, как:
l
Нижний регистр с использованием функции ICU u_strToLower.
u
Верхний регистр с использованием функции ICU u_strToUpper.
t
Для заголовка используйте функцию UCU u_strToTitle.
f
Сверните корпус с помощью функции ICU u_strFoldCase.
дисплей
Это мета-шаг, который указывает, что должен отображаться термин / токен. Этот термин
извлекается в приложении с помощью функции icu_chain_token_display (yaz / icu.h).
трансформировать
Задает правило преобразования ICU с использованием идентификатора транслитератора. Атрибут правила
- идентификатор транслитератора. Видеть ICU Трансформации[1] для получения дополнительной информации.
Transliterate
Задает транслитератор на основе правил. Атрибут правила - это настраиваемое преобразование.
правило, которое будет использоваться. Видеть ICU Трансформации[1] для получения дополнительной информации.
токенизировать
Разбивает / токенизирует строку на компоненты с помощью функций ICU ubrk_open,
ubrk_setText, ... Правило одно из:
l
Линия. ICU: UBRK_LINE.
s
Приговор. ICU: UBRK_SENTENCE.
w
Слово. ICU: UBRK_WORD.
c
Характер. ICU: UBRK_CHARACTER.
t
Заголовок. ICU: UBRK_TITLE.
ПРИМЕРЫ
Следующая команда анализирует текст в тексте файла с помощью файла конфигурации цепочки ICU chain.xml:
текст кошки | yaz-icu -c chain.xml
Chain.xml может выглядеть следующим образом:
z"/>
Используйте yaz-icu онлайн с помощью сервисов onworks.net