To jest aplikacja dla systemu Linux o nazwie AIMET, której najnowszą wersję można pobrać jako 1.28.0.zip. Można go uruchomić online w darmowym dostawcy usług hostingowych OnWorks dla stacji roboczych.
Pobierz i uruchom online tę aplikację o nazwie AIMET z OnWorks za darmo.
Postępuj zgodnie z tymi instrukcjami, aby uruchomić tę aplikację:
- 1. Pobrałem tę aplikację na swój komputer.
- 2. Wpisz w naszym menedżerze plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 3. Prześlij tę aplikację w takim menedżerze plików.
- 4. Uruchom emulator online OnWorks Linux lub Windows online lub emulator online MACOS z tej witryny.
- 5. W systemie operacyjnym OnWorks Linux, który właśnie uruchomiłeś, przejdź do naszego menedżera plików https://www.onworks.net/myfiles.php?username=XXXXX z wybraną nazwą użytkownika.
- 6. Pobierz aplikację, zainstaluj ją i uruchom.
ZRZUTY EKRANU
Ad
CEL
OPIS
Centrum Innowacji Qualcomm (QuIC) przoduje w umożliwianiu wnioskowania o niskim poborze mocy na krawędzi dzięki pionierskim badaniom nad wydajnością modeli. QuIC ma misję pomagania w migracji ekosystemu w kierunku wnioskowania o punktach stałych. W tym celu QuIC przedstawia zestaw narzędzi AI Model Efficiency Toolkit (AIMET) — bibliotekę, która zapewnia zaawansowane techniki kwantyzacji i kompresji dla wyszkolonych modeli sieci neuronowych. AIMET umożliwia wydajniejsze działanie sieci neuronowych na akceleratorach sprzętowych AI ze stałym punktem. Wnioskowanie skwantowane jest znacznie szybsze niż wnioskowanie zmiennoprzecinkowe. Na przykład modele, które uruchomiliśmy na procesorze Qualcomm® Hexagon™ DSP, a nie na procesorze Qualcomm® Kryo™, dały przyspieszenie od 5 do 15 razy. Ponadto model 8-bitowy ma również 4-krotnie mniejszy rozmiar pamięci w porównaniu z modelem 32-bitowym. Jednak często podczas kwantyzacji modelu uczenia maszynowego (np. z 32-bitowej wartości zmiennoprzecinkowej do 8-bitowej wartości stałoprzecinkowej) poświęca się dokładność modelu.
Zakładka Charakterystyka
- Wyrównaj tensory wagi, aby zmniejszyć wahania amplitudy w kanałach
- Technika rozkładu tensorowego w celu podzielenia dużej warstwy na dwie mniejsze
- Koryguje przesunięcie w wyjściach warstw spowodowane kwantyzacją
- Usuwa nadmiarowe kanały wejściowe z warstwy i rekonstruuje wagi warstw
- Użyj symulacji kwantyzacji, aby dalej trenować model w celu zwiększenia dokładności
- Automatycznie wybiera stopień kompresji każdej warstwy w modelu
Język programowania
Python
Kategorie
Jest to aplikacja, którą można również pobrać z https://sourceforge.net/projects/aimet.mirror/. Został umieszczony w OnWorks, aby można go było uruchomić online w najprostszy sposób z jednego z naszych bezpłatnych systemów operacyjnych.