Это приложение для Linux под названием TXM, последний выпуск которого можно загрузить как PreparationetImportdansTXM2019.zip. Его можно запустить онлайн в бесплатном хостинг-провайдере OnWorks для рабочих станций.
Загрузите и запустите онлайн это приложение под названием TXM с OnWorks бесплатно.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
СКРИНШОТЫ
Ad
ТХМ
ОПИСАНИЕ
TXM - это бесплатная кросс-платформенная среда для анализа текста / корпуса с открытым исходным кодом и графический клиент на основе Unicode и XML, поддерживающая Windows, Linux и Mac OS X. Его также можно использовать в Интернете в качестве веб-портала, совместимого со стандартом J2EE (на основе GWT). со встроенным контролем доступа.
СКАЧАТЬ ПОСЛЕДНЮЮ ВЕРСИЮ TXM: http://textometrie.ens-lyon.fr/spip.php?rubrique61&lang=en
TXM предлагает широкий спектр инструментов анализа (согласования, поиск по словосочетанию, списки частот и т. Д.) На основе мощной полнотекстовой поисковой системы CQP (http://cwb.sourceforge.net) и ряд статистических функций (факторный анализ, классификация, анализ валют и т. д.) на основе пакетов R (http://www.r-project.org).
Ознакомьтесь с научной информацией на сайте проекта Textométrie. http://textometrie.ens-lyon.fr/?lang=en.
Прочтите полное описание на вики-странице TEI Tools. http://wiki.tei-c.org/index.php/TXM.
Особенности
- Предоставляет инструменты качественного анализа: согласование лексических шаблонов на основе запросов на уровне слов и структур, навигация по текстовым редакциям на основе расширенного HTML, отображение макета экземпляров шаблонов
- Предоставляет инструменты количественного анализа: факторный анализ соответствия, конститутивные особенности слов, иерархическая классификация, совпадение шаблонов.
- Работает с любыми коллекциями документов в кодировке Unicode различных форматов: коллекциями текстов (TXT, XML, XML-TEI P5), транскрипциями записей (XML-Transcriber), выровненными корпусами (XML-TMX), статьями для прессы (XML-PPS Factiva, Europress ) и более.
- Применяет различные инструменты НЛП на лету к текстам перед анализом (например, TreeTagger для лемматизации и тегирования pos)
- Позволяет строить различные подкорпусы и перегородки (для конструктивного анализа текстовых структур или групп слов)
- Экспортирует любой результат в формат CSV, XML или SVG.
- Скрипт для автоматизации повторяющихся задач или расширения платформы (на Groovy / Java)
- Включает текстовый редактор для редактирования источников данных, результатов и скриптов.
- Работает как отдельное приложение для Windows, Mac OS X или Linux
- Работает также как веб-приложение портала для доступа и анализа корпусов в режиме онлайн через веб-браузер (с управлением контролем доступа)
- Открытый исходный код: основан на лучших компонентах с открытым исходным кодом для анализа текста: библиотеки CQP, R, Java и XSLT.
- Модульная архитектура (соответствие Eclipse RCP OSGi и J2EE): один набор инструментов, соединяющий все основные компоненты, используется всеми приложениями
- Эффективная среда разработки на базе Eclipse или Netbeans
Аудитория
Наука / исследования, продвинутые конечные пользователи, разработчики, конечные пользователи / настольные компьютеры
Интерфейс пользователя
Java SWT, веб-интерфейс, консоль / терминал, Eclipse
Язык программирования
C, Groovy, Java, S / R
Среда базы данных
Другой API
Категории
Это приложение также можно загрузить с https://sourceforge.net/projects/txm/. Он размещен в OnWorks, чтобы его можно было легко запускать в Интернете с помощью одной из наших бесплатных операционных систем.