Đây là ứng dụng Linux có tên CUTLASS có bản phát hành mới nhất có thể tải xuống dưới dạng CUTLASS3.2.1.zip. Nó có thể chạy trực tuyến trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng này có tên CUTLASS with OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động trình giả lập trực tuyến OnWorks Linux hoặc trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MACOS từ trang web này.
- 5. Từ Hệ điều hành OnWorks Linux mà bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng, cài đặt và chạy nó.
MÀN HÌNH:
CẮT
SỰ MIÊU TẢ:
CUTLASS là tập hợp các bản tóm tắt mẫu CUDA C++ để triển khai phép nhân ma trận hiệu suất cao (GEMM) và các tính toán liên quan ở mọi cấp độ và quy mô trong CUDA. Nó kết hợp các chiến lược để phân tách theo cấp bậc và di chuyển dữ liệu tương tự như các chiến lược được sử dụng để triển khai cuBLAS và cuDNN. CUTLASS phân tách các "bộ phận chuyển động" này thành các thành phần phần mềm mô-đun, có thể tái sử dụng được trừu tượng hóa bởi các lớp mẫu C++. Các nguyên mẫu toàn luồng, toàn dọc, toàn khối và toàn thiết bị này có thể được chuyên biệt hóa và điều chỉnh thông qua các kích thước ốp lát tùy chỉnh, loại dữ liệu và chính sách thuật toán khác. Tính linh hoạt kết quả đơn giản hóa việc sử dụng chúng như các khối xây dựng trong các ứng dụng và hạt nhân tùy chỉnh. Để hỗ trợ nhiều ứng dụng khác nhau, CUTLASS cung cấp hỗ trợ rộng rãi cho các tính toán có độ chính xác hỗn hợp, cung cấp chuyển động dữ liệu chuyên biệt và trừu tượng tích lũy bội số cho dấu phẩy động nửa chính xác (FP16), BFloat16 (BF16), Tensor Float 32 (TF32), vân vân.
Tính năng
- CUTLASS triển khai Convolution hiệu suất cao thông qua thuật toán GEMM ẩn
- GEMM ẩn là công thức của phép toán tích chập dưới dạng GEMM do đó tận dụng đường ống GEMM mô-đun của CUTLASS
- Xây dựng các kết cấu bằng cách sử dụng lại các thành phần GEMM trên toàn sợi dọc được tối ưu hóa cao trở xuống
- Nhân Convolution lớp đầu tiên chuyên dùng cho số lượng kênh nhỏ và giảm căn chỉnh
- Toán tử BLAS3 được tăng tốc bởi Tensor Cores
- Hiệu suất tối ưu khi sử dụng CUDA 11.7
Ngôn ngữ lập trình
C + +
Danh Mục
Đây là một ứng dụng cũng có thể được tìm nạp từ https://sourceforge.net/projects/cutlass.mirror/. Nó đã được lưu trữ trong OnWorks để có thể chạy trực tuyến theo cách dễ dàng nhất từ một trong các Hệ điều hành miễn phí của chúng tôi.