Esta es la aplicación de Linux llamada CUTLASS cuya última versión se puede descargar como CUTLASS3.2.1.zip. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada CUTLASS con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.
- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación, instálala y ejecútala.
CAPTURAS DE PANTALLA:
CUTLASS
DESCRIPCIÓN:
CUTLASS es una colección de abstracciones de plantillas de CUDA C++ para implementar la multiplicación de matrices de alto rendimiento (GEMM) y cálculos relacionados en todos los niveles y escalas dentro de CUDA. Incorpora estrategias de descomposición jerárquica y movimiento de datos similares a las utilizadas para implementar cuBLAS y cuDNN. CUTLASS descompone estas "partes móviles" en componentes de software modulares y reutilizables abstraídos por clases de plantillas de C++. Estas primitivas de todo el subproceso, toda la deformación, todo el bloque y todo el dispositivo se pueden especializar y ajustar a través de tamaños de mosaico personalizados, tipos de datos y otras políticas algorítmicas. La flexibilidad resultante simplifica su uso como bloques de construcción dentro de kernels y aplicaciones personalizados. Para admitir una amplia variedad de aplicaciones, CUTLASS proporciona un amplio soporte para cálculos de precisión mixta, proporcionando movimiento de datos especializado y abstracciones de acumulación múltiple para coma flotante de precisión media (FP16), BFloat16 (BF16), Tensor Float 32 (TF32), etc.
Caracteristicas
- CUTLASS implementa Convolución de alto rendimiento a través del algoritmo GEMM implícito
- GEMM implícito es la formulación de una operación de convolución como un GEMM, aprovechando así la canalización modular GEMM de CUTLASS.
- Cree circunvoluciones reutilizando componentes GEMM de warp-wide altamente optimizados e inferiores
- Núcleos de convolución de primera capa especializados para recuentos de canales pequeños y alineación reducida
- Operadores BLAS3 acelerados por Tensor Cores
- Rendimiento óptimo con CUDA 11.7
Lenguaje de programación
C + +
Categorías
Esta es una aplicación que también se puede obtener desde https://sourceforge.net/projects/cutlass.mirror/. Ha sido alojado en OnWorks para poder ejecutarse online de la forma más sencilla desde uno de nuestros Sistemas Operativos gratuitos.