यह VALL-E नाम का विंडोज ऐप है जिसकी नवीनतम रिलीज़ को ग्रेटली इम्प्रूव्ड एक्यूरेसी एंड फिक्स जीपीयू मेमोरी इनक्रीजिंगट्रेनिंग.ज़िप के रूप में डाउनलोड किया जा सकता है। इसे वर्कस्टेशन के लिए मुफ्त होस्टिंग प्रदाता ऑनवर्क्स में ऑनलाइन चलाया जा सकता है।
VALL-E with OnWorks नाम के इस ऐप को मुफ्त में डाउनलोड करें और ऑनलाइन चलाएं।
इस ऐप को चलाने के लिए इन निर्देशों का पालन करें:
- 1. इस एप्लिकेशन को अपने पीसी में डाउनलोड करें।
- 2. हमारे फ़ाइल प्रबंधक में https://www.onworks.net/myfiles.php?username=XXXXX उस उपयोगकर्ता नाम के साथ दर्ज करें जो आप चाहते हैं।
- 3. इस एप्लिकेशन को ऐसे फाइल मैनेजर में अपलोड करें।
- 4. इस वेबसाइट से कोई भी ओएस ऑनवर्क्स ऑनलाइन एमुलेटर शुरू करें, लेकिन बेहतर विंडोज ऑनलाइन एमुलेटर।
- 5. ऑनवर्क्स विंडोज ओएस से आपने अभी शुरुआत की है, हमारे फाइल मैनेजर को https://www.onworks.net/myfiles.php?username=XXXXX उस यूजरनेम के साथ जाएं जो आप चाहते हैं।
- 6. एप्लिकेशन डाउनलोड करें और इसे इंस्टॉल करें।
- 7. अपने Linux वितरण सॉफ़्टवेयर रिपॉजिटरी से वाइन डाउनलोड करें। एक बार इंस्टॉल हो जाने पर, आप ऐप को वाइन के साथ चलाने के लिए डबल-क्लिक कर सकते हैं। आप PlayOnLinux को भी आज़मा सकते हैं, जो वाइन पर एक फैंसी इंटरफ़ेस है जो आपको लोकप्रिय विंडोज़ प्रोग्राम और गेम इंस्टॉल करने में मदद करेगा।
वाइन लिनक्स पर विंडोज सॉफ्टवेयर चलाने का एक तरीका है, लेकिन विंडोज की आवश्यकता नहीं है। वाइन एक ओपन-सोर्स विंडोज संगतता परत है जो किसी भी लिनक्स डेस्कटॉप पर सीधे विंडोज प्रोग्राम चला सकती है। अनिवार्य रूप से, वाइन खरोंच से पर्याप्त विंडोज़ को फिर से लागू करने की कोशिश कर रहा है ताकि वह उन सभी विंडोज़ अनुप्रयोगों को वास्तव में विंडोज़ की आवश्यकता के बिना चला सके।
स्क्रीनशॉट
Ad
घाटी
वर्णन
हम टेक्स्ट टू स्पीच सिंथेसिस (TTS) के लिए भाषा मॉडलिंग दृष्टिकोण पेश करते हैं। विशेष रूप से, हम एक ऑफ-द-शेल्फ न्यूरल ऑडियो कोडेक मॉडल से प्राप्त असतत कोड का उपयोग करके एक न्यूरल कोडेक भाषा मॉडल (जिसे VALL-E कहा जाता है) को प्रशिक्षित करते हैं, और TTS को पिछले कार्य की तरह निरंतर सिग्नल प्रतिगमन के बजाय एक सशर्त भाषा मॉडलिंग कार्य के रूप में मानते हैं। पूर्व-प्रशिक्षण चरण के दौरान, हम टीटीएस प्रशिक्षण डेटा को 60K घंटे के अंग्रेजी भाषण तक बढ़ाते हैं जो मौजूदा प्रणालियों की तुलना में सैकड़ों गुना बड़ा है। VALL-E संदर्भ में सीखने की क्षमताओं को उभरता है और एक ध्वनिक संकेत के रूप में एक अनदेखे वक्ता की केवल 3-सेकंड नामांकित रिकॉर्डिंग के साथ उच्च-गुणवत्ता वाले व्यक्तिगत भाषण को संश्लेषित करने के लिए उपयोग किया जा सकता है। प्रयोग के परिणाम बताते हैं कि VALL-E भाषण की सहजता और वक्ता समानता के मामले में अत्याधुनिक जीरो-शॉट TTS सिस्टम से महत्वपूर्ण रूप से बेहतर प्रदर्शन करता है। इसके अलावा, हम पाते हैं कि VALL-E संश्लेषण में वक्ता की भावना और ध्वनिक संकेत के ध्वनिक वातावरण को संरक्षित कर सकता है।
विशेषताएं
- VALL-E की पाइपलाइन स्वनिम → डिस्क्रीट कोड → वेवफॉर्म है
- VALL-E फोनीमे और ध्वनिक कोड संकेतों के आधार पर असतत ऑडियो कोडेक कोड उत्पन्न करता है
- VALL-E विभिन्न वाक् संश्लेषण अनुप्रयोगों को सीधे सक्षम बनाता है
- शून्य-शॉट टीटीएस, भाषण संपादन और सामग्री निर्माण
- GPT-3 जैसे अन्य जनरेटिव AI मॉडल के साथ संयुक्त
- VALL-E स्पीकर प्रॉम्प्ट के ध्वनिक वातावरण को बनाए रखते हुए वैयक्तिकृत भाषण को संश्लेषित कर सकता है
प्रोग्रामिंग भाषा
अजगर
कैटिगरीज
यह एक ऐसा एप्लिकेशन है जिसे https://sourceforge.net/projects/vall-e.mirror/ से भी प्राप्त किया जा सकता है। इसे हमारे निःशुल्क ऑपरेटिव सिस्टम में से किसी एक से आसान तरीके से ऑनलाइन चलाने के लिए ऑनवर्क्स में होस्ट किया गया है।