Это команда make-lingua-identify-languagep, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
make-lingua-identify-language - создает языковые модули для Lingua :: Identify
СИНТАКСИС
make-lingua-identify-language Language-Tag Language-Name file1 [файл2 ...]
or
make-lingua-identify-language -d TAG1-LANGUAGE1 / [TAG2-LANGUAGE2 / ...]
or
make-lingua-идентифицировать
ОПИСАНИЕ
Создает языковые модули для использования Lingua :: Identify.
После создания модулей вам все равно придется их установить.
Обратите внимание, что этот сценарий все еще находится на ранней стадии. Пожалуйста, даже не смотрите на
код...
Без параметров make-lingua-identify-language принимает режим -d и проходит через все
каталоги в текущем. Это полезно использовать в каталоге, в котором вы
что-то вроде этого:
.
| - en-english
| `- english.txt
| - fr-французский
| `- french1.txt
| `- french2.txt
`- pt-португальский
`- португальский.txt
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
-d
Режим каталога. Каждый передаваемый параметр должен быть каталогом, имя которого должно иметь форму
имя-тега (например, en-english /). Каждый из переданных каталогов должен содержать текстовые файлы
который можно использовать для обучения Lingua :: Identify.
-D
Режим отладки. Только для развития.
-h
Показать справку и выйти.
-v
Показать версию и выйти.
-подробный
Подробный режим.
-locale = " "
Установите конкретный языковой стандарт. Таким образом, ваш текст будет переведен в нижний регистр перед анализом.
МЕТА.yml
Файлы "META.yml" не анализируются как другие файлы, они игнорируются.
В режиме каталога (переключатель "-d") файлы "META.yml" проверяются на наличие информации о кодах языков.
и наборы.
Вот простой "META.yml", который вы можете поместить в свои каталоги:
двухбуквенный_код: pt
three_letter_code: порт
наборы:
talken_in_portugal
При этом язык будет идентифицирован с помощью двухбуквенного кода "pt" или трех
буквенный код «пор»; он также будет в наборе ": speaken_in_portugal".
СОДЕЙСТВИЕ НОВЫЕ ЯЗЫКИ
Пожалуйста, не добавляйте модули, которые вы сделали сами. Легче внести свой вклад с
необработанный текст, потому что это позволяет новым версиям Lingua :: Identify не
выберите языки, если я не смогу связаться с вами к тому времени.
Используйте сделать-лингва-идентифицировать-язык создать новый модуль для личного пользования, если вы
должен, но постарайтесь внести свой вклад с необработанным текстом, а не с этими модулями.
Используйте make-lingua-identify-languagep в Интернете с помощью сервисов onworks.net