Este es el comando kakasi que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
KAKASI - Inversor simple Kanji kana (entre Kanji, tanto Kana como Romaji)
SINOPSIS
kakasi [opciones] [jisyo1 [jisyo2 [jisyo1 ,,]]]
DESCRIPCIÓN
KAKASI En japonés, las oraciones a menudo se componen de una mezcla de caracteres chinos (Kanji),
Kana (Hiragana y Katakana) y Romaji (pronunciación fonética latina). Este programa
convierte entre estas cuatro formas diferentes de escribir japonés.
Este programa es útil para aquellos cuyo terminal o escritorio no es compatible con el nativo
visualización de japonés. Además, esta es una gran herramienta para aquellos que están aprendiendo japonés.
(estudiantes internacionales y niños, etc.).
Se puede pasar una palabra a la entrada estándar (stdin), luego se traduce y se envía a
salida estándar (salida estándar). En el siguiente ejemplo, el kanji "bunchu" se convierte en
hiragana.
kakasi -JH <documento
Desde la versión 2.3.0 se admite texto con espacios entre palabras. En el
En el siguiente ejemplo, la salida tiene espacios entre cada palabra.
kakasi -w <documento
Desde la versión 2.3.5, se admite el modo de conversión de nivel. En el siguiente ejemplo,
los Kanjis simples se dejan sin convertir, y los Kanjis difíciles se traducen en
hiragana.
kakasi -l4 <documento
KAKASI Es posible convertir letras a caracteres alfabéticos. También Katakana
Las letras en el juego de caracteres JIS x0201 y el Hiragana en el juego de caracteres JIS x0208 pueden
ser convertidos entre sí.
KAKASI El siguiente juego de caracteres entre paréntesis que se muestra.
ASCII (a) Conocido como conjunto de caracteres "ascii".
JIS ROMAN (j)
Conocido como conjunto de caracteres "jis roman".
GRÁFICO (g)
Es el conjunto de caracteres gráficos DEC.
katakana (k)
JIS x0201, definido como parte del juego de caracteres GR.
Como cuestión de conveniencia, JIS x0208 se divide como se indica a continuación.
Kanji (J)
Caracteres JIS x0208 incluidos entre 16 y 94 secciones.
Hiraganá (H)
Caracteres JIS x0208 incluidos en la sección 4 (Hiragana)
Katakana (K)
Caracteres JIS x0208 incluidos en la sección 5 (Katakana)
Signo (E)
Caracteres JIS x0208 incluidos en la sección 1,2,3,6,7, 8, XNUMX, XNUMX, XNUMX y XNUMX. (Tenga en cuenta que la sección
9-15 no están definidos en JIS x0208.)
Se encuentran disponibles traducciones entre los siguientes conjuntos de caracteres.
ASCII -> JISROMAN, Signo
JISROMAN -> ASCII, signo
GRÁFICO -> ASCII, JISROMAN, Signo
JISx0201 Katakana
-> ASCII, JISROMAN, Kana, Hiragana
Firmar -> ASCII, JISROMAN
Katakana -> ASCII, JISROMAN, JISx0201 Katakana, Hiragana
Hiragana -> ASCII, JISROMAN, JISx0201 Katakana, Kana
Kanji -> ASCII, JISROMAN, JISx0201 Katakana, Kana, Hiragana
Con la conversión de ASCII y JISROMAN se realiza la conversión de caracteres alfabéticos
de JISx0201 Katakana, Katakana, Hiragana y Kanji.
Ejemplo:
1. Todos los caracteres kanji se convierten a Hiragana.
kakasi-JH
2. Todos los caracteres JIS x0208 se convierten a JIS X 0201.
kakasi -Hk -Kk -Jk -Ea
3. Todos los caracteres se convierten a JIS X 0208.
kakasi -aE -jE -gE -kK
4. Todos los caracteres se convierten a ascii y las palabras se separan.
kakasi-Ha-Ka-Ja-Ea-ka
5. Intercambio entre personajes Katakana e Hiragana.
kakasi-HK-KH
CONVERSIÓN DESIGNADO PERSONAJE SET
Algunos conjuntos de caracteres están categorizados por kakasi y se indican mediante los siguientes mnemónicos: a, j,
g, k, e, h, k, j.
a --- caracteres ASCII
j --- JIS ROMAN (casi igual a ASCII, "~" y "
diferente) definido por JIS x0201
g --- Caracteres gráficos DEC
k --- KATAKANA definido por JIS x0201
E, H, K y J se incluyen en el juego de caracteres JIS x0208.
J --- Caracteres KANJI de JIS x0208.
H --- Caracteres HIRAGANA de JIS x0208.
K --- Caracteres KATAKANA de JIS x0208.
E --- El resto de los caracteres anteriores de JIS x0208 que incluye
alfabetos, números, símbolos, etc.
- (de) (a) significa conversión del juego de caracteres (de) a (a). Por ejemplo, opción -JK
hace que los caracteres KANJI se conviertan a HIRAGANA. Las combinaciones de la siguiente tabla son
disponible. (No debes recordarlo, porque la -h muestra la misma información)
a \ desde | ajk EHKJ g
------- + ------------------------------------------ -
un | - o o1 o o1 o1 o12 o
j | o - o1 o o1 o1 o12 o
k | - oo o2
E | oo - o
H | o-o o2
K | oo -
o - convertido.
1 - convertido a Romaji.
2 - Kanji -> Conversión de Kana.
Kanji CODIFICACIÓN CONVERSIÓN
Desafortunadamente, en Japón se utilizan varios sistemas de codificación y se cambia el estándar JIS x0208
en 1983. Por lo tanto, KAKASI puede distinguir automáticamente el sistema de codificación y la codificación
revisión y luego use el mismo sistema de codificación de salida si el documento no incluye JIS
x0201 KATAKANA. Si se incluye JIS x0201 KATAKANA o si desea cambiar la codificación kanji
sistema, puede utilizar las siguientes opciones.
-i: codificación de entrada
-o: codificación de salida
jis: ampliamente utilizado en Internet. (Ej: fj, jp, .. grupos de noticias)
Derivado de la forma de codificación ISO-2022.
newjis: JISx0208 (1983) invocado por ESC - $ - B.
oldjis: JISx0208 (1978) invocado por ESC - $ - @.
euc, dec: se usa a menudo en UNIX como computadoras. JISx0208 es
asignado a GR (MSB es 1). La principal diferencia entre
euc y dec es la asignación de JISx0201 KATAKANA y
el carácter gráfico DEC.
sjis: definido por Microsoft Corp. Ampliamente utilizado en el ámbito personal
computadoras (MSDOS, Mac, ..)
utf8: estándar internacional actual. Todos los sistemas operativos modernos usan esto
codificación del juego de caracteres Unicode como predeterminado.
ROMAJÍ CONVERSIÓN
Opciones de conversión de kanji kana. Usado con -J? opción. Hay 2 tipos de escritura Romaji.
El primero es el método Kunrei definido por el gobierno japonés, y el segundo es el
Método Hepburn. Creo que el método Hepburn suena naturalmente a los extranjeros.
-rhepburn: método Hepburn (predeterminado)
-rkunrei: Método Kunrei
OTROS OPCIONES
-p: enumera todas las lecturas posibles. Si existen dos o más
posibles lecturas, KAKASI las muestra entre llaves {aaa, bbb}.
-s: inserta un carácter separado entre las palabras.
-f: modo Furigana. Muestra la palabra kanji original con lectura.
-c: omite caracteres dentro de una palabra. (predeterminado TAB CR LF BLANK)
-C: escribir en mayúscula la palabra Romaji (con la opción -Ja o -Jj)
-U: palabra romaji en mayúsculas (con la opción -Ja o -Jj)
-u: Llama a fflush ().
-w: modo wakatigaki. 'wakatigaki' es la segmentación de palabras para
Frases japonesas.
DICCIONARIOS
KAKASI puede aceptar un diccionario adicional al diccionario del sistema. El formato aceptable
de diccionario adicional es SKK formato, y Wnn formato, etc. Es decir, cada registro es
una línea con dos campos, Yomi (lectura) y Jukugo (modismo). Los campos se separan con
comas (o TAB, o en blanco). El código kanji está restringido a JIS o EUC. Ver otro
documento llamado JISYO para más detalles.
MEDIO AMBIENTE VARIABLES
El comportamiento se ve afectado por las siguientes variables de entorno.
RUTA KANWADICTP
Especifica una ruta de kanwadict (ruta completa que incluye el nombre del archivo). El valor predeterminado es
/ usr / share / kakasi / kanwadict.
ITAIJIDICTPATH
Especifica una ruta de itaijidict (ruta completa que incluye el nombre del archivo). El valor predeterminado es
/ usr / share / kakasi / itaijidict.
Use kakasi en línea usando los servicios de onworks.net