这是名为 VALL-E 的 Windows 应用程序,其最新版本可以下载为 GreatlyimprovedaccuracyandFixGPUmemoryincreaseduringtraining.zip。 它可以在工作站的免费托管服务提供商 OnWorks 中在线运行。
使用 OnWorks 免费下载并在线运行这个名为 VALL-E 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从本网站启动任何 OS OnWorks 在线模拟器,但更好的 Windows 在线模拟器。
- 5. 从您刚刚启动的 OnWorks Windows 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序并安装。
- 7. 从您的 Linux 发行版软件存储库下载 Wine。 安装后,您可以双击该应用程序以使用 Wine 运行它们。 您还可以尝试 PlayOnLinux,这是 Wine 上的一个花哨界面,可帮助您安装流行的 Windows 程序和游戏。
Wine 是一种在 Linux 上运行 Windows 软件的方法,但不需要 Windows。 Wine 是一个开源的 Windows 兼容层,可以直接在任何 Linux 桌面上运行 Windows 程序。 本质上,Wine 试图从头开始重新实现足够多的 Windows,以便它可以运行所有这些 Windows 应用程序,而实际上不需要 Windows。
截图:
瓦力
描述:
我们介绍了一种用于文本到语音合成 (TTS) 的语言建模方法。 具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为条件语言建模任务,而不是像以前的工作那样连续信号回归。 在预训练阶段,我们将 TTS 训练数据扩展到 60K 小时的英语语音,这是现有系统的数百倍。 VALL-E 出现了上下文学习能力,可用于合成高质量的个性化语音,只需录制 3 秒的未见过的说话者的注册录音作为声音提示。 实验结果表明,VALL-E 在语音自然度和说话人相似度方面明显优于最先进的零样本 TTS 系统。 此外,我们发现 VALL-E 可以在合成中保留说话者的情绪和声音提示的听觉环境。
项目特色
- VALL-E的流水线是音素→离散码→波形
- VALL-E 根据音素和声学代码提示生成离散音频编解码器代码
- VALL-E直接赋能各种语音合成应用
- 零镜头 TTS、语音编辑和内容创建
- 与 GPT-3 等其他生成式 AI 模型相结合
- VALL-E 可以合成个性化语音,同时保持说话人提示的声学环境
程式语言
Python
分类
这是一个也可以从 https://sourceforge.net/projects/vall-e.mirror/ 获取的应用程序。 它已托管在 OnWorks 中,以便以最简单的方式从我们的免费操作系统之一在线运行。