VALL-E라는 이름의 Windows 앱으로 최신 릴리스를 Greatlyimprovedaccuracy andFixGPUmemoryincreaseduringtraining.zip으로 다운로드할 수 있습니다. 워크스테이션용 무료 호스팅 제공업체인 OnWorks에서 온라인으로 실행할 수 있습니다.
OnWorks와 함께 VALL-E라는 이 앱을 무료로 다운로드하여 온라인에서 실행하십시오.
이 앱을 실행하려면 다음 지침을 따르세요.
- 1. 이 애플리케이션을 PC에 다운로드했습니다.
- 2. 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX에 원하는 사용자 이름을 입력합니다.
- 3. 이러한 파일 관리자에서 이 응용 프로그램을 업로드합니다.
- 4. 이 웹사이트에서 모든 OS OnWorks 온라인 에뮬레이터를 시작하지만 더 나은 Windows 온라인 에뮬레이터를 시작합니다.
- 5. 방금 시작한 OnWorks Windows OS에서 원하는 사용자 이름으로 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX로 이동합니다.
- 6. 애플리케이션을 다운로드하여 설치합니다.
- 7. Linux 배포 소프트웨어 저장소에서 Wine을 다운로드합니다. 설치가 완료되면 앱을 두 번 클릭하여 Wine과 함께 실행할 수 있습니다. 인기 있는 Windows 프로그램 및 게임을 설치하는 데 도움이 되는 Wine을 통한 멋진 인터페이스인 PlayOnLinux를 사용해 볼 수도 있습니다.
Wine은 Linux에서 Windows 소프트웨어를 실행하는 방법이지만 Windows가 필요하지 않습니다. Wine은 모든 Linux 데스크탑에서 직접 Windows 프로그램을 실행할 수 있는 오픈 소스 Windows 호환성 계층입니다. 본질적으로 Wine은 Windows가 필요하지 않고 모든 Windows 응용 프로그램을 실행할 수 있도록 Windows를 처음부터 충분히 다시 구현하려고 합니다.
스크린 샷
Ad
발-E
기술
TTS(텍스트 음성 합성)를 위한 언어 모델링 접근 방식을 소개합니다. 구체적으로 기성 신경 오디오 코덱 모델에서 파생된 이산 코드를 사용하여 신경 코덱 언어 모델(VALL-E라고 함)을 학습하고 TTS를 이전 작업과 같은 연속 신호 회귀가 아닌 조건부 언어 모델링 작업으로 간주합니다. 사전 훈련 단계에서 TTS 훈련 데이터를 기존 시스템보다 수백 배 큰 60만 시간의 영어 음성으로 확장합니다. VALL-E는 상황에 맞는 학습 기능을 제공하며 보이지 않는 화자의 3초 등록 녹음을 음향 프롬프트로 사용하여 고품질 개인화된 음성을 합성하는 데 사용할 수 있습니다. 실험 결과 VALL-E는 음성의 자연스러움과 화자의 유사성 측면에서 최첨단 제로샷 TTS 시스템보다 월등히 뛰어난 성능을 보였다. 또한 VALL-E는 화자의 감정과 합성 시 음향 프롬프트의 음향 환경을 보존할 수 있음을 발견했습니다.
기능
- VALL-E의 파이프라인은 음소 → 이산 부호 → 파형
- VALL-E는 음소 및 음향 코드 프롬프트를 기반으로 개별 오디오 코덱 코드를 생성합니다.
- VALL-E는 다양한 음성 합성 애플리케이션을 직접 지원합니다.
- Zero-shot TTS, 음성 편집 및 콘텐츠 제작
- GPT-3와 같은 다른 생성 AI 모델과 결합
- VALL-E는 화자 프롬프트의 음향 환경을 유지하면서 개인화된 음성을 합성할 수 있습니다.
프로그래밍 언어
Python
카테고리
이것은 https://sourceforge.net/projects/vall-e.mirror/에서도 가져올 수 있는 애플리케이션입니다. 무료 운영 체제 중 하나에서 가장 쉬운 방법으로 온라인으로 실행하기 위해 OnWorks에서 호스팅되었습니다.