Это приложение для Linux под названием MTEB, последнюю версию которого можно загрузить как 1.1.1C-MTEB.PL-MTEB,Multi-GPU.zip. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.
Загрузите и запустите онлайн это приложение под названием MTEB с помощью OnWorks бесплатно.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
СКРИНШОТЫ
Ad
МТЕБ
ОПИСАНИЕ
Встраивание текста обычно оценивается на небольшом наборе наборов данных из одной задачи, не охватывая их возможного применения в других задачах. Неясно, могут ли современные внедрения семантического текстового сходства (STS) быть одинаково хорошо применены к другим задачам, таким как кластеризация или переранжирование. Это затрудняет отслеживание прогресса в этой области, поскольку различные модели постоянно предлагаются без надлежащей оценки. Чтобы решить эту проблему, мы представляем тест Massive Text Embedding Benchmark (MTEB). MTEB охватывает 8 задач внедрения, охватывающих в общей сложности 58 наборов данных и 112 языков. Путем сравнительного анализа 33 моделей на MTEB мы установили наиболее полный на сегодняшний день тест встраивания текста. Мы обнаружили, что ни один конкретный метод встраивания текста не является доминирующим во всех задачах. Это говорит о том, что в этой области еще предстоит прийти к универсальному методу встраивания текста и масштабировать его в достаточной степени, чтобы обеспечить самые современные результаты для всех задач встраивания.
Особенности
- Выбор набора данных
- Наборы данных можно выбрать, предоставив список наборов данных.
- Вы также можете указать, какие языки загружать для многоязычных/межязычных задач.
- Оценивать можно только на тестовых сплитах всех задач
- Используйте пользовательскую модель
- Оценить индивидуальное задание
Язык программирования
Питон
Категории
Это приложение также можно загрузить с https://sourceforge.net/projects/mteb.mirror/. Он размещен в OnWorks, чтобы его можно было проще запускать в Интернете из одной из наших бесплатных операционных систем.