Aceasta este comanda yaz-icu care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS
PROGRAM:
NUME
yaz-icu - utilitar YAZ ICU
REZUMAT
yaz-icu [-c config] [-p opta] [-s] [-x] [în fișier]
DESCRIERE
yaz-icu este utilitatea care demonstrează modulul lanțului ICU al lui yaz. (yaz/icu.h).
Utilitarul poate fi utilizat în două moduri. Poate citi ceva text folosind o configurație XML pentru
configurarea ICU și afișarea analizei textului. Acest mod este declanșat de opțiunea -c care
specifică configurația care trebuie utilizată. Fișierul de intrare este citit de la intrare standard sau
dintr-un fișier dacă este specificat infile.
Utilitarul poate afișa, de asemenea, informații UCI. Acest lucru este declanșat de opțiunea -p.
OPŢIUNI
-c config
Specifică fișierul care conține configurația lanțului ICU, care se bazează pe XML.
-p tip
Specifică informații suplimentare de tipărit despre sistemul ICU. Dacă tip este c atunci UTI
convertizoarele sunt imprimate. Dacă tip localurile disponibile sunt tipărite. Dacă tip este t
sunt tipărite transliteratoarele disponibile.
-s
Specifică faptul că rezultatul trebuie să includă și cheia de sortare. Rețineți că cheia de sortare diferă
între versiunile ICU.
-x
Specifică faptul că ieșirea trebuie să fie bazată pe XML și nu pe „text”.
ATI LANT CONFIGURARE
Configurația lanțului ICU specifică una sau mai multe reguli pentru a converti datele text în jetoane.
Formatul de configurare este bazat pe XML.
Elementul de nivel superior trebuie denumit icu_chain. Elementul icu_chain are unul necesar
localitatea atributului care specifică localitatea ICU care va fi utilizată în pașii de conversie.
Elementul icu_chain trebuie să includă elemente în care fiecare element specifică o conversie
Etapa. Conversia se realizează în ordinea în care sunt pașii de conversie
specificat. Fiecare element de conversie are un atribut: regulă care servește drept argument pentru
pasul de conversie.
Sunt disponibile următoarele elemente de conversie:
hartă de caz
Convertește minuscule și regula specifică cum:
l
Litere mici utilizând funcția ICU u_strToLower.
u
Litere mari folosind funcția ICU u_strToUpper.
t
Pentru titluri folosind funcția UCU u_strToTitle.
f
Îndoiți carcasa utilizând funcția ICU u_strFoldCase.
afișa
Acesta este un meta pas care specifică faptul că un termen/token trebuie să fie afișat. Acest termen este
preluat într-o aplicație folosind funcția icu_chain_token_display (yaz/icu.h).
transforma
Specifică o regulă de transformare a ICU folosind un identificator de transliterator. Atributul regulii
este identificatorul transliteratorului. Vedea ATI transformări[1] pentru mai multe informații.
transliterat
Specifică un transliterator bazat pe reguli. Atributul regulii este transformarea personalizată
regula care trebuie folosita. Vedea ATI transformări[1] pentru mai multe informații.
tokeniza
Rupe / tokenizează un șir în componente folosind funcțiile ICU ubrk_open,
ubrk_setText, .. . Regula este una dintre:
l
Linia. UTI: UBRK_LINE.
s
Propoziție. ICU: UBRK_SENTENCE.
w
Cuvânt. UTI: UBRK_WORD.
c
Caracter. ICU: UBRK_CHARACTER.
t
Titlu. ICU: UBRK_TITLE.
EXEMPLE
Următoarea comandă analizează textul din textul fișierului folosind configurația lanțului ICU chain.xml:
text pisica | yaz-icu -c chain.xml
Chain.xml ar putea arăta după cum urmează:
z"/>
Utilizați yaz-icu online folosind serviciile onworks.net