これは VALL-E という名前の Windows アプリで、最新リリースは GreatlyimprovedaccuracyandFixGPUmemoryincreaseduringtraining.zip としてダウンロードできます。 ワークステーション用の無料ホスティング プロバイダー OnWorks でオンラインで実行できます。
OnWorks を使用して VALL-E という名前のこのアプリをオンラインで無料でダウンロードして実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOSOnWorksオンラインエミュレーターを起動しますが、Windowsオンラインエミュレーターの方が優れています。
-5。起動したばかりのOnWorksWindows OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードしてインストールします。
-7.LinuxディストリビューションソフトウェアリポジトリからWineをダウンロードします。 インストールしたら、アプリをダブルクリックして、Wineで実行できます。 また、人気のあるWindowsプログラムやゲームのインストールに役立つWine上の豪華なインターフェイスであるPlayOnLinuxを試すこともできます。
WineはLinux上でWindowsソフトウェアを実行する方法ですが、Windowsは必要ありません。 Wineは、任意のLinuxデスクトップでWindowsプログラムを直接実行できるオープンソースのWindows互換性レイヤーです。 基本的に、Wineは、実際にWindowsを必要とせずに、これらすべてのWindowsアプリケーションを実行できるように、十分な数のWindowsを最初から再実装しようとしています。
スクリーンショットは
Ad
谷
DESCRIPTION
テキスト音声合成 (TTS) のための言語モデリング アプローチを紹介します。 具体的には、既製のニューラル オーディオ コーデック モデルから派生した離散コードを使用してニューラル コーデック言語モデル (VALL-E と呼ばれる) をトレーニングし、TTS を以前の研究のような連続信号回帰ではなく、条件付き言語モデリング タスクとみなします。 事前トレーニング段階では、TTS トレーニング データを既存のシステムの数百倍となる 60 時間の英語音声にスケールアップします。 VALL-E はコンテキスト内学習機能を備えており、目に見えない話者の音響プロンプトとして登録されたわずか 3 秒の録音で、高品質のパーソナライズされた音声を合成するために使用できます。 実験結果は、音声の自然さと話者の類似性の点で、VALL-E が最先端のゼロショット TTS システムよりも大幅に優れていることを示しています。 さらに、VALL-E は合成時に話者の感情と音響プロンプトの音響環境を保存できることがわかりました。
特徴
- VALL-Eのパイプラインは音素→離散符号→波形
- VALL-E は、音素と音響コード プロンプトに基づいて個別のオーディオ コーデック コードを生成します。
- VALL-E はさまざまな音声合成アプリケーションを直接実現します
- ゼロショット TTS、音声編集、コンテンツ作成
- GPT-3 などの他の生成 AI モデルと組み合わせる
- VALL-E は、スピーカー プロンプトの音響環境を維持しながら、パーソナライズされた音声を合成できます。
プログラミング言語
Python
カテゴリー
これは、https://sourceforge.net/projects/vall-e.mirror/ から取得できるアプリケーションです。 無料のオペレーティング システムの XNUMX つから最も簡単な方法でオンラインで実行できるように、OnWorks でホストされています。