Это приложение для Windows под названием VALL-E, последнюю версию которого можно загрузить в виде файла GreatlyimprovedaccuracyandFixGPUmemoryincreaseduringtraining.zip. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.
Загрузите и запустите онлайн это приложение под названием VALL-E с OnWorks бесплатно.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите любой онлайн-эмулятор OS OnWorks с этого сайта, но лучше онлайн-эмулятор Windows.
- 5. В только что запущенной ОС Windows OnWorks перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение и установите его.
- 7. Загрузите Wine из репозиториев программного обеспечения вашего дистрибутива Linux. После установки вы можете дважды щелкнуть приложение, чтобы запустить его с помощью Wine. Вы также можете попробовать PlayOnLinux, необычный интерфейс поверх Wine, который поможет вам установить популярные программы и игры для Windows.
Wine - это способ запустить программное обеспечение Windows в Linux, но без Windows. Wine - это уровень совместимости с Windows с открытым исходным кодом, который может запускать программы Windows непосредственно на любом рабочем столе Linux. По сути, Wine пытается заново реализовать Windows с нуля, чтобы можно было запускать все эти Windows-приложения, фактически не нуждаясь в Windows.
СКРИНШОТЫ
Ad
ВАЛЛ-Э
ОПИСАНИЕ
Мы представляем подход к языковому моделированию для синтеза речи (TTS). В частности, мы обучаем модель языка нейронного кодека (называемую VALL-E) с использованием дискретных кодов, полученных из готовой модели нейронного аудиокодека, и рассматриваем TTS как задачу моделирования условного языка, а не непрерывную регрессию сигнала, как в предыдущей работе. На этапе предварительного обучения мы масштабируем данные обучения TTS до 60 3 часов английской речи, что в сотни раз больше, чем в существующих системах. VALL-E обладает возможностями обучения в контексте и может использоваться для синтеза высококачественной персонализированной речи с помощью всего XNUMX-секундной зарегистрированной записи невидимого говорящего в качестве акустической подсказки. Результаты эксперимента показывают, что VALL-E значительно превосходит современную систему TTS с нулевым выстрелом с точки зрения естественности речи и сходства говорящих. Кроме того, мы обнаружили, что VALL-E может сохранять эмоции говорящего и акустическую среду акустической подсказки в синтезе.
Особенности
- Конвейер VALL-E: фонема → дискретный код → сигнал.
- VALL-E генерирует дискретные коды аудиокодеков на основе подсказок фонем и акустических кодов.
- VALL-E напрямую включает различные приложения для синтеза речи
- Zero-shot TTS, редактирование речи и создание контента
- В сочетании с другими генеративными моделями ИИ, такими как GPT-3.
- VALL-E может синтезировать персонализированную речь, сохраняя при этом акустическую среду подсказки говорящего.
Язык программирования
Питон
Категории
Это приложение также можно загрузить с https://sourceforge.net/projects/vall-e.mirror/. Он был размещен в OnWorks, чтобы его можно было легко запускать в Интернете с помощью одной из наших бесплатных операционных систем.