Ini adalah aplikasi Linux bernama CUTLASS yang rilis terbarunya dapat diunduh sebagai CUTLASS3.2.1.zip. Ini dapat dijalankan secara online di penyedia hosting gratis OnWorks untuk workstation.
Unduh dan jalankan secara online aplikasi bernama CUTLASS with OnWorks ini secara gratis.
Ikuti petunjuk ini untuk menjalankan aplikasi ini:
- 1. Download aplikasi ini di PC Anda.
- 2. Masuk ke file manager kami https://www.onworks.net/myfiles.php?username=XXXXX dengan username yang anda inginkan.
- 3. Upload aplikasi ini di filemanager tersebut.
- 4. Jalankan emulator online OnWorks Linux atau Windows online atau emulator online MACOS dari situs web ini.
- 5. Dari OS Linux OnWorks yang baru saja Anda mulai, buka file manager kami https://www.onworks.net/myfiles.php?username=XXXXX dengan nama pengguna yang Anda inginkan.
- 6. Download aplikasinya, install dan jalankan.
Tangkapan layar
Ad
PEDANG PENDEK
DESKRIPSI
CUTLASS adalah kumpulan abstraksi template CUDA C++ untuk mengimplementasikan perkalian matriks kinerja tinggi (GEMM) dan komputasi terkait di semua level dan skala dalam CUDA. Ini menggabungkan strategi untuk dekomposisi hierarkis dan pergerakan data yang serupa dengan yang digunakan untuk mengimplementasikan cuBLAS dan cuDNN. CUTLASS menguraikan "bagian bergerak" ini menjadi komponen perangkat lunak modular yang dapat digunakan kembali yang disarikan oleh kelas template C++. Primitif selebar benang, selebar warp, selebar blok, dan selebar perangkat ini dapat dispesialisasikan dan disetel melalui ukuran ubin khusus, tipe data, dan kebijakan algoritmik lainnya. Fleksibilitas yang dihasilkan menyederhanakan penggunaannya sebagai blok penyusun dalam kernel dan aplikasi khusus. Untuk mendukung berbagai macam aplikasi, CUTLASS menyediakan dukungan ekstensif untuk komputasi presisi campuran, menyediakan pemindahan data khusus dan abstraksi akumulasi multipel untuk floating point setengah presisi (FP16), BFloat16 (BF16), Tensor Float 32 (TF32), dll.
Fitur
- CUTLASS mengimplementasikan Konvolusi berkinerja tinggi melalui algoritme GEMM implisit
- GEMM implisit adalah perumusan operasi konvolusi sebagai GEMM sehingga memanfaatkan pipa GEMM modular CUTLASS
- Bangun konvolusi dengan menggunakan kembali komponen GEMM lebar warp yang sangat optimal dan di bawahnya
- Kernel Konvolusi lapisan pertama dikhususkan untuk jumlah saluran kecil dan penyelarasan yang dikurangi
- Operator BLAS3 dipercepat oleh Tensor Cores
- Performa optimal menggunakan CUDA 11.7
Bahasa Pemrograman
C + +
Kategori
Ini adalah aplikasi yang juga dapat diambil dari https://sourceforge.net/projects/cutlass.mirror/. Itu telah dihosting di OnWorks untuk dijalankan secara online dengan cara termudah dari salah satu Sistem Operasi gratis kami.