Это команда nkf, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
nkf - сетевой фильтр кандзи
СИНТАКСИС
нкф [-butjnesliohrTVvwWJESZxXFfmMBOcdILg] [файл ...]
ОПИСАНИЕ
НКФ - это еще один преобразователь кода кандзи в сетях, хостах и терминалах. Это
преобразует входной код кандзи в обозначенный код кандзи, такой как ISO-2022-JP, Shift_JIS, EUC-JP,
UTF-8, UTF-16 или UTF-32.
Один из самых уникальных факультетов нкф это предположение входных кодировок кандзи. Это
в настоящее время распознает ISO-2022-JP, Shift_JIS, EUC-JP, UTF-8, UTF-16 и UTF-32. Итак, пользователи
не нужно явно указывать входной код кандзи.
По умолчанию кана X0201 преобразуется в кана X0208. Для X0201 kana, SO / SI, SSO и
Поддерживаются методы ESC - (- I. Для автоматического определения кода nkf не предполагает, что кана X0201 в
Shift_JIS. Чтобы принять X0201 в Shift_JIS, используйте -X, -x or -S.
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
-J -S -E -W -W16 -W32 -j -s -e -w -w16 -w32
Укажите входные и выходные кодировки. Вводится верхний регистр. ср. --ic и --oc.
-J ISO-2022-JP (код JIS).
-S Shift_JIS и JIS X 0201 kana. EUC-JP обозначен как X0201 kana. Без -x
flag, JIS X 0201 Katakana (akahalfwidth kana) преобразуется в JIS X 0208. Если
вы используете Windows, см. Windows-31J (CP932).
-E EUC-JP.
-W УТФ-8Н.
-W16 [BL] [0]
UTF-16. B или L указывают на порядок байтов с прямым порядком байтов или с прямым порядком байтов. 0 дает возможность поставить спецификацию
или нет.
-W32 [BL] [0]
UTF-32. B или L указывают на порядок байтов с прямым порядком байтов или с прямым порядком байтов. 0 дает возможность поставить спецификацию
или нет.
-b -u
Вывод буферизируется (ПО УМОЛЧАНИЮ), вывод небуферизуется.
-t Никакой конверсии.
-i [@B]
Задайте escape-последовательность для JIS X 0208.
-я@ Используйте ESC (@. (JIS X 0208-1978)
-iB Используйте ESC (B. (JIS X 0208-1983 / 1990 ПО УМОЛЧАНИЮ)
-o [BJ]
Укажите управляющую последовательность для US-ASCII / JIS X 0201 Roman. (ПО УМОЛЧАНИЮ B)
-r {de / en} склеп ROT13 / 47
-h [123] --хирагана --катакана --катакана-хирагана
-H1 --хирагана
Преобразование катаканы в хирагану.
-H2 --катакана
Преобразование хираганы в катакану.
-H3 --катакана-хирагана
Преобразование катаканы в хирагану и хирагану в катакану.
-T Вывод в текстовом режиме (MS-DOS)
-f [m [- n]]
Складывание на m длина с n маржа в строке. Без этой опции длина сгиба составляет 60
а поле сгиба - 10.
-F Новая линия, сохраняющая фальцовку.
-Z [0-3]
Преобразуйте алфавит X0208 (полноширинные алфавиты) в ASCII.
-Z -Z0
Преобразование алфавита X0208 в ASCII.
-Z1 Преобразуйте канкаку X0208 в одно пространство ASCII.
-Z2 Преобразуйте канкаку X0208 в двойные пробелы ASCII.
-Z3 Замена fullwidth>, <, ", & на '>', '<', '"', '&', как в HTML.
-X -x
В -X или без этой опции X0201 преобразуется в X0208 Kana. С участием -x, пробовать
сохранить кану X0208 и не преобразовывать кану X0201 в X0208. В выводе JIS ESC - (- I -
использовал. На выходе EUC используется SS2.
-B [0-2]
Предположим, неверный ввод JIS-Kanji, который потерял ESC. Полезно, когда на вашем сайте используется старый
Патч B-News Nihongo.
-B1 разрешает любые символы после ESC- (или ESC- $.
-B2 принудительно использовать ASCII после NL.
-I Замена символа, отличного от iso-2022-jp, на символ geta (заменяющий символ в
Японский).
-m [BQN0]
MIME ISO-2022-JP / ISO8859-1 декодирует. (ПО УМОЛЧАНИЮ) Чтобы увидеть ISO8859-1 (Latin-1) -l
необходимо.
-мБ Декодируйте поток, закодированный в формате MIME base64. Перед преобразованием удалите заголовок или другую часть.
-mQ Расшифровать поток в кавычках MIME. '_' в цитируемом потоке преобразуется в пробел.
-мН Нестрогкое декодирование. Это позволяет разрыв строки в середине кодировки base64.
-м0 Нет MIME-декодирования.
-M MIME-кодирование. Стиль заголовка. Все коды ASCII и управляющие символы не повреждены.
-MB MIME кодирует поток Base64. Преобразование кандзи выполняется перед кодированием, поэтому
не может использоваться в качестве кодировщика изображений.
-MQ Выполните цитируемое кодирование.
-l Код ввода и вывода - ISO8859-1 (Latin-1) и ISO-2022-JP. -s, -e и -x не
совместим с этой опцией.
-L [uwm] -d -c
Преобразование разрывов строк.
-Лу -d
юникс (LF)
-Lw -c
окна (CRLF)
-Лм макинтош (CR)
Без этой опции nkf не преобразует разрывы строк.
--fj --unix --мак --msdos - окна
Конвертируйте для этих систем.
--джис --euc --sjis - мим --base64
Преобразовать в именованный код.
--jis-ввод --euc-вход --sjis-ввод --MIME-ввод --base64-ввод
Предположим систему ввода
--ic =вход набор кодов --oc =выходной набор кодов
Установите кодовый набор ввода или вывода. NKF поддерживает следующие кодовые наборы и эти кодовые наборы
имена нечувствительны к регистру.
ИСО 2022-JP
он же RFC1468, 7-битный JIS, JUNET
EUC-JP (eucJP-nkf)
также известный как AT&T JIS, японский EUC, UJIS
eucJP-ascii
eucJP-мс
CP51932
Версия Microsoft EUC-JP.
Shift_JIS
он же SJIS, MS_Kanji
Окна-31J
он же CP932
UTF-8
то же, что и UTF-8N
UTF-8N
UTF-8 без спецификации
UTF-8-BOM
UTF-8 с спецификацией
UTF8-MAC (только ввод)
разложенный UTF-8
UTF-16
то же, что и UTF-16BE
UTF-16BE
UTF-16 Big Endian без спецификации
UTF-16BE-BOM
UTF-16 Big Endian с BOM
UTF-16LE
UTF-16 Little Endian без спецификации
UTF-16LE-БОМ
UTF-16 Little Endian с спецификацией
UTF-32
то же, что и UTF-32BE
UTF-32BE
UTF-32 Big Endian без спецификации
UTF-32BE-BOM
UTF-32 Big Endian с BOM
UTF-32LE
UTF-32 Little Endian без спецификации
UTF-32LE-БОМ
UTF-32 Little Endian с спецификацией
--fb- {пропустить, HTML, XML, Perl, Джава, подсимвол}
Укажите способ, которым nkf обрабатывает неназначенные символы. Без этой опции
--fb-skip предполагается.
--prefix =бежать персонаж персонаж..
Когда nkf преобразуется в Shift_JIS, nkf добавляет указанный escape-символ к указанному второму
байт символов Shift_JIS. 1-й байт аргумента - это escape-символ и
следующие байты являются целевыми символами.
--no-cp932ext
Обрабатывайте символы, расширенные в CP932, как неназначенные символы.
--no-наилучшие-подходящие-символы
При преобразовании Unicode в закодированные байты не конвертируйте символы, которые не являются круглыми
безопасное путешествие. При преобразовании Unicode в Unicode, с этой опцией и -x, nkf может быть
используется как конвертер UTF. (Другими словами, без этого параметра и параметра -x, nkf не сохраняет
некоторые персонажи)
Когда nkf преобразует строки, относящиеся к пути, вы должны использовать этот параметр.
--cap-ввод
Расшифровать символы в шестнадцатеричной кодировке.
--url-ввод
Процент экранированных символов без экранирования.
--numchar-вход
Расшифровать ссылку на символ, например "& # ....;".
- на месте [=СУФФИКС] --overwrite [=СУФФИКС]
затирать оригинал перечисленные файлы по отфильтрованному результату.
Внимание --overwrite сохраняет временные метки исходных файлов.
--guess = [12]
Вывести предполагаемую кодировку и новую строку. (2 по умолчанию, 1 только кодировка)
--Помогите
Распечатайте справку nkf.
--версия
Распечатайте версию nkf.
-- Игнорировать остальную часть опции -option.
Используйте nkf в Интернете с помощью сервисов onworks.net