これは CUTLASS という名前の Windows アプリで、その最新リリースは CUTLASS3.2.1.zip としてダウンロードできます。 これは、ワークステーション用の無料のホスティング プロバイダーである OnWorks でオンラインで実行できます。
CUTLASS with OnWorks という名前のこのアプリをオンラインで無料でダウンロードして実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOSOnWorksオンラインエミュレーターを起動しますが、Windowsオンラインエミュレーターの方が優れています。
-5。起動したばかりのOnWorksWindows OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードしてインストールします。
-7.LinuxディストリビューションソフトウェアリポジトリからWineをダウンロードします。 インストールしたら、アプリをダブルクリックして、Wineで実行できます。 また、人気のあるWindowsプログラムやゲームのインストールに役立つWine上の豪華なインターフェイスであるPlayOnLinuxを試すこともできます。
WineはLinux上でWindowsソフトウェアを実行する方法ですが、Windowsは必要ありません。 Wineは、任意のLinuxデスクトップでWindowsプログラムを直接実行できるオープンソースのWindows互換性レイヤーです。 基本的に、Wineは、実際にWindowsを必要とせずに、これらすべてのWindowsアプリケーションを実行できるように、十分な数のWindowsを最初から再実装しようとしています。
スクリーンショットは
Ad
カットラス
DESCRIPTION
CUTLASS は、CUDA 内のすべてのレベルとスケールで高性能行列乗算 (GEMM) および関連する計算を実装するための CUDA C++ テンプレート抽象化のコレクションです。 cuBLAS および cuDNN の実装に使用されるものと同様の階層的分解およびデータ移動の戦略が組み込まれています。 CUTLASS は、これらの「可動部分」を、C++ テンプレート クラスによって抽象化された再利用可能なモジュラー ソフトウェア コンポーネントに分解します。 これらのスレッド全体、ワープ全体、ブロック全体、およびデバイス全体のプリミティブは、カスタム タイル サイズ、データ型、およびその他のアルゴリズム ポリシーによって特殊化および調整できます。 結果として得られる柔軟性により、カスタム カーネルおよびアプリケーション内でのビルディング ブロックとしての使用が簡素化されます。 さまざまなアプリケーションをサポートするために、CUTLASS は混合精度計算の広範なサポートを提供し、半精度浮動小数点 (FP16)、BFloat16 (BF16)、Tensor Float 32 (TF32)、等
特徴
- CUTLASS は、暗黙の GEMM アルゴリズムを介して高性能な畳み込みを実装します
- Implicit GEMM は畳み込み操作を GEMM として定式化したもので、CUTLASS のモジュラー GEMM パイプラインを利用します。
- 高度に最適化されたワープ全体の GEMM コンポーネント以下を再利用して畳み込みを構築する
- 小さなチャネル数とアライメントの削減に特化した第 XNUMX 層の畳み込みカーネル
- Tensor コアによって高速化された BLAS3 演算子
- CUDA 11.7 を使用した最適なパフォーマンス
プログラミング言語
C + +
カテゴリー
これは https://sourceforge.net/projects/cutlass.mirror/ からも取得できるアプリケーションです。 これは、OnWorks でホストされており、無料のオペレーティング システムの XNUMX つからオンラインで簡単に実行できます。