यह CUTLASS नाम का Linux ऐप है जिसकी नवीनतम रिलीज़ को CUTLASS3.2.1.zip के रूप में डाउनलोड किया जा सकता है। इसे वर्कस्टेशन के लिए मुफ्त होस्टिंग प्रदाता ऑनवर्क्स में ऑनलाइन चलाया जा सकता है।
CUTLASS with OnWorks नाम के इस ऐप को मुफ्त में डाउनलोड करें और ऑनलाइन चलाएं।
इस ऐप को चलाने के लिए इन निर्देशों का पालन करें:
- 1. इस एप्लिकेशन को अपने पीसी में डाउनलोड करें।
- 2. हमारे फ़ाइल प्रबंधक में https://www.onworks.net/myfiles.php?username=XXXXX उस उपयोगकर्ता नाम के साथ दर्ज करें जो आप चाहते हैं।
- 3. इस एप्लिकेशन को ऐसे फाइल मैनेजर में अपलोड करें।
- 4. इस वेबसाइट से ऑनवर्क्स लिनक्स ऑनलाइन या विंडोज ऑनलाइन एमुलेटर या मैकोज़ ऑनलाइन एमुलेटर शुरू करें।
- 5. ऑनवर्क्स लिनक्स ओएस से आपने अभी शुरुआत की है, हमारे फाइल मैनेजर को https://www.onworks.net/myfiles.php?username=XXXXX उस यूजरनेम के साथ जाएं जो आप चाहते हैं।
- 6. एप्लिकेशन डाउनलोड करें, इसे इंस्टॉल करें और इसे चलाएं।
स्क्रीनशॉट
Ad
कटलैस
वर्णन
CUTLASS, CUDA के भीतर सभी स्तरों और पैमानों पर उच्च-प्रदर्शन मैट्रिक्स-गुणन (GEMM) और संबंधित संगणनाओं को लागू करने के लिए CUDA C++ टेम्पलेट सार का एक संग्रह है। यह cuBLAS और cuDNN को लागू करने के लिए उपयोग किए जाने वाले समान पदानुक्रमित अपघटन और डेटा आंदोलन के लिए रणनीतियों को शामिल करता है। CUTLASS इन "मूविंग पार्ट्स" को पुन: प्रयोज्य, मॉड्यूलर सॉफ़्टवेयर घटकों में सी ++ टेम्पलेट कक्षाओं द्वारा सारणित करता है। ये थ्रेड-वाइड, वार्प-वाइड, ब्लॉक-वाइड, और डिवाइस-वाइड प्रिमिटिव्स को कस्टम टाइलिंग साइज, डेटा टाइप्स और अन्य एल्गोरिथम पॉलिसी के जरिए स्पेशलाइज्ड और ट्यून किया जा सकता है। परिणामी लचीलापन कस्टम गुठली और अनुप्रयोगों के भीतर बिल्डिंग ब्लॉक्स के रूप में उनके उपयोग को सरल बनाता है। विभिन्न प्रकार के अनुप्रयोगों का समर्थन करने के लिए, CUTLASS मिश्रित-सटीक संगणनाओं के लिए व्यापक समर्थन प्रदान करता है, विशेष डेटा-आंदोलन प्रदान करता है और अर्ध-परिशुद्धता फ़्लोटिंग पॉइंट (FP16), BFloat16 (BF16), Tensor Float 32 (TF32) के लिए बहु-संचित सार प्रदान करता है। वगैरह।
विशेषताएं
- CUTLASS निहित GEMM एल्गोरिथम के माध्यम से उच्च-प्रदर्शन कनवॉल्यूशन को लागू करता है
- निहित जीईएमएम एक जीईएमएम के रूप में कनवल्शन ऑपरेशन का सूत्रीकरण है जिससे कटलास के मॉड्यूलर जीईएमएम पाइपलाइन का लाभ उठाया जा रहा है।
- अत्यधिक अनुकूलित ताना-चौड़ा GEMM घटकों और नीचे का पुन: उपयोग करके दृढ़ संकल्प बनाएं
- छोटे चैनल की गिनती और कम संरेखण के लिए विशेष रूप से पहली परत कनवल्शन कर्नेल
- BLAS3 ऑपरेटरों को Tensor Cores द्वारा त्वरित किया गया
- CUDA 11.7 का उपयोग करके इष्टतम प्रदर्शन
प्रोग्रामिंग भाषा
सी + +
कैटिगरीज
यह एक ऐसा एप्लिकेशन है जिसे https://sourceforge.net/projects/cutlass.mirror/ से भी प्राप्त किया जा सकता है। इसे हमारे निःशुल्क ऑपरेटिव सिस्टम में से किसी एक से आसान तरीके से ऑनलाइन चलाने के लिए ऑनवर्क्स में होस्ट किया गया है।