Il s'agit de la commande alt-nvidia-340-smi qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
nvidia-smi - programme d'interface de gestion de système NVIDIA
SYNOPSIS
nvidia-smi [OPTION1 [ARG1]] [OPTION2 [ARG2]] ...
DESCRIPTION
nvidia-smi (également NVSMI) fournit des capacités de surveillance et de gestion pour chacun des
Les appareils Tesla, Quadro et GRID de NVIDIA de Fermi et des familles d'architecture supérieures. Très
des informations limitées sont également fournies pour les appareils Geforce. NVSMI est un outil multiplateforme
qui prend en charge toutes les distributions Linux standard prises en charge par les pilotes NVIDIA, ainsi que 64 bits
versions de Windows commençant par Windows Server 2008 R2. Les métriques peuvent être consommées
directement par les utilisateurs via stdout, ou fourni par fichier via les formats CSV et XML pour les scripts
fins pratiques.
Notez qu'une grande partie des fonctionnalités de NVSMI est fournie par le sous-jacent NVML basé sur le C
une bibliothèque. Consultez le lien du site Web des développeurs NVIDIA ci-dessous pour plus d'informations sur NVML.
Des liaisons python basées sur NVML sont également disponibles.
Il n'est pas garanti que la sortie de NVSMI soit rétrocompatible. Cependant, NVML et
les liaisons Python sont rétrocompatibles et devraient être le premier choix lors de l'écriture
tous les outils qui doivent être maintenus dans les versions de pilotes NVIDIA.
NVML SDK: http://developer.nvidia.com/nvidia-management-library-nvml/
Python liaisons : http://pypi.python.org/pypi/nvidia-ml-py/
OPTIONS
GÉNÉRAL OPTIONS
-h, --Aidez-moi
Imprimez les informations d'utilisation et quittez.
RÉSUMÉ OPTIONS
-L, --list-gpu
Répertoriez chacun des GPU NVIDIA du système, ainsi que leurs UUID.
QUERY OPTIONS
-q, --mettre en doute
Afficher les informations sur le GPU ou l'unité. Les informations affichées incluent toutes les données répertoriées dans le (GPU CARACTÉRISTIQUES)
ou (UNITÉ CARACTÉRISTIQUES) sections de ce document. Certains appareils et/ou environnements ne
soutenir toutes les informations possibles. Toute donnée non prise en charge est indiquée par un « N/A » dans le
sortir. Par défaut, les informations pour tous les GPU ou unités disponibles sont affichées. Utilisez le -i
option pour restreindre la sortie à un seul GPU ou unité.
[plus optionnel]
-tu, --unité
Affichez les données de l'unité au lieu des données du GPU. Les données unitaires ne sont disponibles que pour NVIDIA S-class
Boîtiers Tesla.
-je, --id=identifiant
Affichez les données pour un seul GPU ou unité spécifié. L'identifiant spécifié peut être celui du GPU/de l'unité
Index de base 0 dans l'énumération naturelle renvoyée par le pilote, le numéro de série de la carte du GPU
numéro, l'UUID du GPU ou l'ID de bus PCI du GPU (comme domain:bus:device.function en hexadécimal).
Il est recommandé aux utilisateurs souhaitant une cohérence d'utiliser l'UUID ou l'ID de bus PCI, car
l'ordre d'énumération des périphériques n'est pas garanti pour être cohérent entre les redémarrages et la carte
Le numéro de série peut être partagé entre plusieurs GPU sur la même carte.
-f DÉPOSER, --filename=FICHIER
Rediriger la sortie de la requête vers le fichier spécifié à la place de la sortie standard par défaut. Le spécifié
fichier sera écrasé.
-X, --format-xml
Produisez une sortie XML à la place du format lisible par défaut. Requête GPU et Unit
les sorties sont conformes aux DTD correspondantes. Ceux-ci sont disponibles via le --dtd drapeau.
--dtd
Utiliser avec -x. Intégrez la DTD dans la sortie XML.
-d TAPER, --affichage=TYPE
Afficher uniquement les informations sélectionnées : MÉMOIRE, UTILISATION, ECC, TEMPÉRATURE, PUISSANCE, HORLOGE,
COMPUTE, PIDS, PERFORMANCE, SUPPORTED_CLOCKS, PAGE_RETIREMENT, ACCOUNTING Les indicateurs peuvent être
combiné avec une virgule, par exemple "MEMORY,ECC". L'échantillonnage des données avec max, min et avg est également
renvoyé pour les types d'affichage POWER, UTILIZATION et CLOCK. Ne fonctionne pas avec -u/--unit ou
Indicateurs au format -x/--xml.
-l SECONDE, --loop=SEC
Signaler en continu les données de requête à l'intervalle spécifié, plutôt que la valeur par défaut de seulement
une fois que. L'application se mettra en veille entre les requêtes. Notez que sur l'erreur Linux ECC ou XID
les événements d'erreur s'imprimeront pendant la période de veille si le -x le drapeau n'a pas été spécifié.
Appuyer sur Ctrl+C à tout moment annulera la boucle, qui sinon s'exécutera indéfiniment.
Si aucun argument n'est spécifié pour le -l forme un intervalle par défaut de 5 secondes est utilisé.
SÉLECTIF QUERY OPTIONS
Permet à l'appelant de transmettre une liste explicite de propriétés à interroger.
[une de]
--query-gpu=
Informations sur le GPU. Passez la liste des propriétés que vous souhaitez interroger, séparées par des virgules. par exemple
--query-gpu=pci.bus_id,persistence_mode. Appelez --help-query-gpu pour plus d'informations.
--query-supported-horloges=
Liste des horloges prises en charge. Appelez --help-query-supported-clocks pour plus d'informations.
--query-compute-apps=
Liste des processus de calcul actuellement actifs. Appelez --help-query-compute-apps pour plus d'informations.
--query-accounted-apps=
Liste des processus de calcul comptabilisés. Appelez --help-query-accounted-apps pour plus d'informations.
--query-pages-retirées=
Liste des pages de mémoire de périphérique GPU qui ont été retirées. Appelez --help-query-retired-pages
pour plus d'informations.
[obligatoire]
--format=
Liste d'options de format séparées par des virgules :
· csv - valeurs séparées par des virgules (OBLIGATOIRE)
· noheader - saute la première ligne avec les en-têtes de colonne
· noms - n'imprime pas les unités pour les valeurs numériques
[plus tout de]
-je, --id=identifiant
Afficher les données pour un seul GPU spécifié. L'identifiant spécifié peut être l'index basé sur 0 du GPU
dans l'énumération naturelle renvoyée par le driver, le numéro de série de la carte du GPU, le
UUID du GPU ou ID de bus PCI du GPU (comme domain:bus:device.function en hexadécimal). Il est
recommandé aux utilisateurs souhaitant une cohérence d'utiliser l'UUID ou l'ID de bus PCI, car le périphérique
l'ordre d'énumération n'est pas garanti pour être cohérent entre les redémarrages et la série de la carte
nombre peut être partagé entre plusieurs GPU sur la même carte.
-f DÉPOSER, --filename=FICHIER
Rediriger la sortie de la requête vers le fichier spécifié à la place de la sortie standard par défaut. Le spécifié
fichier sera écrasé.
-l SECONDE, --loop=SEC
Signaler en continu les données de requête à l'intervalle spécifié, plutôt que la valeur par défaut de seulement
une fois que. L'application se mettra en veille entre les requêtes. Notez que sur l'erreur Linux ECC ou XID
les événements d'erreur s'imprimeront pendant la période de veille si le -x le drapeau n'a pas été spécifié.
Appuyer sur Ctrl+C à tout moment annulera la boucle, qui sinon s'exécutera indéfiniment.
Si aucun argument n'est spécifié pour le -l forme un intervalle par défaut de 5 secondes est utilisé.
-lms Mme, --loop-ms=ms
Identique à -l,--loop mais en millisecondes.
DISPOSITIF MODIFICATION OPTIONS
[tout UN de]
-pm, --persistence-mode=MODE
Définissez le mode de persistance pour les GPU cibles. Voir le (GPU CARACTÉRISTIQUES) section pour un
description du mode persistance. Nécessite la racine. Aura un impact sur tous les GPU à moins qu'un seul GPU
est spécifié à l'aide de la -i argument. L'effet de cette opération est immédiat. Cependant,
il ne persiste pas entre les redémarrages. Après chaque redémarrage, le mode de persistance sera par défaut
"Désactivée". Disponible sur Linux uniquement.
-e, --ecc-config=CONFIG
Définissez le mode ECC pour les GPU cibles. Voir le (GPU CARACTÉRISTIQUES) section pour une description
du mode ECC. Nécessite la racine. Aura un impact sur tous les GPU à moins qu'un seul GPU ne soit spécifié à l'aide de
le -i argument. Ce paramètre prend effet après le prochain redémarrage et est persistant.
-p, --reset-ecc-errors=TYPE
Réinitialisez les compteurs d'erreurs ECC pour les GPU cibles. Voir le (GPU CARACTÉRISTIQUES) section pour un
description des types de compteurs d'erreurs ECC. Les arguments disponibles sont 0|VOLATILE ou
1|AGRÉGÉ. Nécessite la racine. Aura un impact sur tous les GPU à moins qu'un seul GPU ne soit spécifié à l'aide de
le -i argument. L'effet de cette opération est immédiat.
-c, --compute-mode=MODE
Définissez le mode de calcul pour les GPU cibles. Voir le (GPU CARACTÉRISTIQUES) section pour un
description du mode de calcul. Nécessite la racine. Aura un impact sur tous les GPU à moins qu'un seul GPU ne soit
spécifié à l'aide de la -i argument. L'effet de cette opération est immédiat. Cependant, il
ne persiste pas entre les redémarrages. Après chaque redémarrage, le mode de calcul sera réinitialisé sur "DEFAULT".
-dm TAPER, --driver-model=TYPE
-fdm TAPER, --force-driver-model=TYPE
Activer ou désactiver le modèle de pilote TCC. Pour Windows uniquement. Nécessite des privilèges d'administrateur.
-dm échouera si un écran est connecté, mais -fdm forcera le modèle de pilote à changer.
Aura un impact sur tous les GPU à moins qu'un seul GPU ne soit spécifié à l'aide de la -i argument. Un redémarrage est
nécessaire pour que le changement ait lieu. Voir Chauffeur Modèle pour plus d'informations sur Windows
modèles de pilotes.
--gom=MODE
Définir le mode de fonctionnement du GPU : 0/ALL_ON, 1/COMPUTE, 2/LOW_DP Pris en charge sur GK110 M-class et X-
produits Tesla de classe de la famille Kepler. Non pris en charge sur Quadro et Tesla classe C
des produits. Nécessite des privilèges d'administrateur. Voir GPU Opération Mode pour plus d'informations
à propos de GOM. Les modifications de GOM prennent effet après le redémarrage. L'exigence de redémarrage peut être supprimée
à l'avenir. Calculer uniquement les GOM ne prennent pas en charge WDDM (Windows Display Driver Model)
-r, --gpu-reset
Déclenchez une réinitialisation du GPU. Peut être utilisé pour effacer l'état du matériel et du logiciel du GPU dans des situations qui
nécessiterait sinon un redémarrage de la machine. Généralement utile si une erreur ECC double bit a
eu lieu. A besoin -i passer à l'appareil cible spécifique. Nécessite la racine. Il ne peut pas y avoir
toutes les applications utilisant cet appareil particulier (par exemple, application CUDA, application graphique
comme le serveur X, l'application de surveillance comme une autre instance de nvidia-smi). Là aussi
il ne peut pas s'agir d'applications de calcul exécutées sur un autre GPU du système. Seulement sur
appareils pris en charge de la famille Fermi et Kepler fonctionnant sous Linux.
La réinitialisation du GPU n'est pas garantie de fonctionner dans tous les cas. Il n'est pas recommandé pour la production
environnements en ce moment. Dans certaines situations, il peut y avoir des composants matériels sur la carte
qui ne parviennent pas à revenir à un état initial après la demande de réinitialisation. C'est plus
susceptible d'être vu sur les produits de la génération Fermi par rapport à Kepler, et plus susceptible d'être vu si
la réinitialisation est effectuée sur un GPU bloqué.
Après une réinitialisation, il est recommandé de vérifier la santé du GPU avant de poursuivre
utilisation. L'outil nvidia-healthmon est un bon choix pour ce test. Si le GPU n'est pas sain
une réinitialisation complète doit être déclenchée en redémarrant le nœud.
Visitez le http://developer.nvidia.com/gpu-deployment-kit pour télécharger le GDK et nvidia-
santémon.
-ac, --applications-clocks=MEM_CLOCK,GRAPHICS_CLOCK
Spécifie le maximum horloges sous forme de paire (par exemple 2000,800) qui définit les GPU
vitesse lors de l'exécution d'applications sur un GPU. Uniquement sur les appareils Tesla de la famille Kepler+.
Nécessite root à moins que les restrictions ne soient assouplies avec la commande -acp.
-rac, --reset-applications-horloges
Réinitialise les horloges des applications à la valeur par défaut. Uniquement sur les appareils Tesla de Kepler+
famille. Nécessite root à moins que les restrictions ne soient assouplies avec la commande -acp.
-acp, --applications-clocks-permission=MODE
Basculez si les horloges des applications peuvent être modifiées par tous les utilisateurs ou uniquement par root. Disponible
les arguments sont 0|SANS RESTRICTION, 1|RESTRICTED. Uniquement sur les appareils Tesla du Kepler+
famille. Nécessite la racine.
-PL, --power-limit=LIMITE_PUISSANCE
Spécifie la limite de puissance maximale en watts. Accepte les nombres entiers et à virgule flottante. Seul
sur les appareils pris en charge de la famille Kepler. Nécessite des privilèges d'administrateur. Besoins de valeur
être entre Min et Max Power Limit comme indiqué par nvidia-smi.
-un m, --accounting-mode=MODE
Active ou désactive la comptabilité GPU. Avec la comptabilité GPU, on peut suivre l'utilisation de
ressources tout au long de la durée de vie d'un même processus. Uniquement sur les appareils pris en charge par Kepler
famille. Nécessite des privilèges d'administrateur. Les arguments disponibles sont 0|DISABLED ou
1|ACTIVÉ.
-caa, --clear-accouted-apps
Efface tous les processus comptabilisés jusqu'à présent. Uniquement sur les appareils pris en charge de la famille Kepler.
Nécessite des privilèges d'administrateur.
--auto-boost-default=MODE
Définissez la politique de boost automatique par défaut sur 0/DISABLED ou 1/ENABLED, en appliquant uniquement le changement
après la sortie du dernier client boost. Uniquement sur certains appareils Tesla du Kepler+
famille. Nécessite la racine.
--auto-boost-default-force=MODE
Définissez la politique de boost automatique par défaut sur 0/DISABLED ou 1/ENABLED, en appliquant le changement
immédiatement. Uniquement sur certains appareils Tesla de la famille Kepler+. Nécessite la racine.
--auto-boost-permission=MODE
Autoriser le contrôle non administrateur/root sur le mode boost automatique. Les arguments disponibles sont
0|SANS RESTRICTION, 1|RESTREINT. Uniquement sur certains appareils Tesla de la famille Kepler+.
Nécessite la racine.
[plus optionnel]
-je, --id=identifiant
Modifier un seul GPU spécifié. L'identifiant spécifié peut être l'index basé sur 0 du GPU/unité dans
l'énumération naturelle renvoyée par le driver, le numéro de série de la carte du GPU, le
UUID, ou l'ID de bus PCI du GPU (comme domain:bus:device.function en hexadécimal). C'est recommandé
que les utilisateurs souhaitant une cohérence utilisent soit l'UUID, soit l'ID de bus PCI, car l'énumération des périphériques
la commande n'est pas garantie d'être cohérente entre les redémarrages et le numéro de série de la carte peut
être partagé entre plusieurs GPU sur la même carte.
UNITÉ MODIFICATION OPTIONS
-t, --toggle-led=ÉTAT
Réglez l'état de l'indicateur LED à l'avant et à l'arrière de l'unité sur la couleur spécifiée. Voir
les (UNITÉ CARACTÉRISTIQUES) pour une description des états des LED. Les couleurs autorisées sont
0|VERT et 1|AMBRE. Nécessite la racine.
[plus optionnel]
-je, --id=identifiant
Modifier une seule unité spécifiée. L'identifiant spécifié est l'index basé sur 0 de l'unité dans le
énumération naturelle renvoyée par le conducteur.
SPECTACLES DTD OPTIONS
--dtd
Afficher le périphérique ou l'unité DTD.
[plus optionnel]
-f DÉPOSER, --filename=FICHIER
Rediriger la sortie de la requête vers le fichier spécifié à la place de la sortie standard par défaut. Le spécifié
fichier sera écrasé.
-tu, --unité
Affichez le DTD de l'unité au lieu du DTD de l'appareil.
stats
Afficher des informations statistiques sur le GPU. Utilisez "nvidia-smi stats -h" pour plus
informations. Linux uniquement.
Pois
Afficher les informations de topologie sur le système. Utilisez "nvidia-smi topo -h" pour plus
informations. Linux uniquement. Remarque : l'énumération GPU est la même que NVML.
RETOUR VALEURE
Le code de retour indique si l'opération a réussi ou échoué et quelle était la raison de
échec.
· Code retour 0 - Réussite
· Code de retour 2 - Un argument ou un indicateur fourni n'est pas valide
· Code retour 3 - L'opération demandée n'est pas disponible sur l'appareil cible
· Code de retour 4 - L'utilisateur actuel n'a pas la permission d'accéder à cet appareil ou
effectuer cette opération
· Code retour 6 - Une requête pour trouver un objet a échoué
· Code de retour 8 - Les câbles d'alimentation externes d'un appareil ne sont pas correctement connectés
· Code retour 9 - Le pilote NVIDIA n'est pas chargé
· Code de retour 10 - NVIDIA Kernel a détecté un problème d'interruption avec un GPU
· Code de retour 12 - La bibliothèque partagée NVML n'a pas pu être trouvée ou chargée
· Code de retour 13 - La version locale de NVML n'implémente pas cette fonction
· Code de retour 14 - l'infoROM est corrompue
· Code retour 15 - Le GPU est tombé du bus ou est devenu
inaccessible
· Code de retour 255 - Une autre erreur ou une erreur de pilote interne s'est produite
GPU CARACTÉRISTIQUES
La liste suivante décrit toutes les données possibles renvoyées par le -q option de requête de périphérique.
Sauf indication contraire, tous les résultats numériques sont en base 10 et sans unité.
Horodatage
L'horodatage actuel du système au moment où nvidia-smi a été appelé. Le format est "Jour de la semaine
Mois Jour HH:MM:SS Année".
Chauffeur Version
La version du pilote d'affichage NVIDIA installé. Il s'agit d'une chaîne alphanumérique.
Attached GPU
Le nombre de GPU NVIDIA dans le système.
Produit Nom
Le nom de produit officiel du GPU. Il s'agit d'une chaîne alphanumérique. Pour tous les produits.
Présentoir Mode
Un indicateur qui indique si un affichage physique (par exemple un moniteur) est actuellement connecté à
l'un des connecteurs du GPU. « Enabled » indique un affichage connecté. "Désactivée"
indique le contraire.
Présentoir Actif
Un drapeau qui indique si un affichage est initialisé sur les GPU (par exemple la mémoire est
alloué sur l'appareil pour l'affichage). L'affichage peut être actif même lorsqu'aucun moniteur n'est
physiquement attaché. « Enabled » indique un affichage actif. "Désactivé" indique
autrement.
Persistence Mode
Un indicateur qui indique si le mode persistance est activé pour le GPU. La valeur est soit
« Activé » ou « Désactivé ». Lorsque le mode persistance est activé, le pilote NVIDIA reste
chargé même lorsqu'aucun client actif, tel que X11 ou nvidia-smi, n'existe. Cela minimise le
latence de chargement du pilote associée à l'exécution d'applications dépendantes, telles que les programmes CUDA. Pour
tous les produits compatibles CUDA. Linux uniquement.
Comptabilité Mode
Un indicateur qui indique si le mode de comptabilisation est activé pour la valeur GPU est soit Quand
la comptabilité est activée les statistiques sont calculées pour chaque processus de calcul en cours d'exécution sur le
GPU. Les statistiques sont disponibles pour requête une fois le processus terminé. Voir --help-query-
accounted-apps pour plus d'informations.
Comptabilité Mode Buffer Taille
Renvoie la taille du tampon circulaire qui contient la liste des processus pouvant être interrogés
pour les statistiques comptables. Il s'agit du nombre maximum de processus que les informations comptables
sera stocké avant que les informations sur les processus les plus anciens ne soient écrasées par
informations sur les nouveaux processus.
Chauffeur Modèle
Sous Windows, les modèles de pilotes TCC et WDDM sont pris en charge. Le modèle de pilote peut être modifié
avec le (-dm) Or (-fdm) drapeaux. Le modèle de pilote TCC est optimisé pour le calcul
applications. Les temps de lancement du noyau IE seront plus rapides avec TCC. Le modèle de pilote WDDM
est conçu pour les applications graphiques et n'est pas recommandé pour les applications de calcul.
Linux ne prend pas en charge plusieurs modèles de pilotes et aura toujours la valeur "N/A".
Courant Le modèle de pilote actuellement utilisé. Toujours "N/A" sur Linux.
En Attente Le modèle de pilote qui sera utilisé au prochain redémarrage. Toujours "N/A" activé
Linux.
Port série Numéro
Ce numéro correspond au numéro de série physiquement imprimé sur chaque carte. C'est un monde
valeur alphanumérique unique et immuable.
GPU UUID
Cette valeur est l'identifiant alphanumérique immuable et unique au monde du GPU. Cela fait
ne correspond à aucune étiquette physique sur la carte.
Mineurs Numéro
Le numéro mineur du périphérique est tel que le fichier de nœud de périphérique Nvidia pour chaque GPU sera
avoir la forme /dev/nvidia[numéro mineur]. Disponible uniquement sur la plate-forme Linux.
BIOS Version
Le BIOS de la carte GPU.
MultiGPU Conseil d'administration
Que ce GPU fasse ou non partie d'une carte multiGPU.
Conseil d'administration ID
L'ID de carte unique attribué par le conducteur. Si deux ou plusieurs GPU ont le même ID de carte
et le champ "MultiGPU" ci-dessus est vrai, alors les GPU sont sur la même carte.
Infos Version
Numéros de version pour chaque objet dans le stockage d'informations de la carte GPU. L'info est un
petit magasin persistant de données de configuration et d'état pour le GPU. Toutes les informations de la version
les champs sont numériques. Il peut être utile de connaître ces numéros de version car certains GPU
les fonctionnalités ne sont disponibles qu'avec les inforoms d'une certaine version ou supérieure.
Si l'un des champs ci-dessous renvoie une erreur inconnue, un contrôle de vérification Inforom supplémentaire est
effectuée et le message d'avertissement approprié s'affiche.
Image(s) Version Version globale de l'image infoROM. Version de l'image tout comme la version VBIOS
décrit de manière unique la version exacte de l'infoROM flashée sur la carte dans
contrairement à la version de l'objet infoROM qui n'est qu'un indicateur de prise en charge
caractéristiques.
OEM Objet Version pour les données de configuration OEM.
ECC Objet Version pour les données d'enregistrement ECC.
Puissance Objet Version pour les données de gestion de l'alimentation.
GPU Opération Mode
GOM permet de réduire la consommation d'énergie et d'optimiser le débit du GPU en désactivant les fonctionnalités du GPU.
Chaque GOM est conçu pour répondre aux besoins spécifiques des utilisateurs.
En mode « All On », tout est activé et fonctionne à pleine vitesse.
Le mode "Compute" est conçu pour exécuter uniquement des tâches de calcul. Les opérations graphiques ne sont pas
autorisé.
Le mode "Low Double Precision" est conçu pour exécuter des applications graphiques qui ne
nécessitent une double précision à bande passante élevée.
GOM peut être modifié avec le (--gom) drapeau.
Pris en charge sur les produits Tesla GK110 de classe M et de classe X de la famille Kepler. Pas
pris en charge sur les produits Quadro et Tesla classe C.
Courant Le GOM actuellement utilisé.
En Attente Le GOM qui sera utilisé au prochain redémarrage.
PCI
Informations PCI de base pour le périphérique. Certaines de ces informations peuvent changer chaque fois que les cartes sont
ajouté/supprimé/déplacé dans un système. Pour tous les produits.
Transport public Numéro de bus PCI, en hexadécimal
Appareil Numéro de périphérique PCI, en hexadécimal
Domaine Numéro de domaine PCI, en hexadécimal
Appareil Id ID de périphérique du fournisseur PCI, en hexadécimal
Sol Système Id Identifiant du sous-système PCI, en hexadécimal
Transport public Id ID de bus PCI comme "domain:bus:device.function", en hexadécimal
GPU Lien d'information
La génération de liens PCIe et la largeur de bus
Courant La génération et la largeur du lien actuel. Ceux-ci peuvent être réduits lorsque le GPU
n'est pas utilisé.
Maximum La génération et la largeur de liens maximales possibles avec ce GPU et ce système
configuration. Par exemple, si le GPU prend en charge une génération PCIe supérieure
que le système prend en charge, cela signale la génération PCIe du système.
Pont Puce
Informations relatives à Bridge Chip sur l'appareil. Le micrologiciel de la puce de pont n'est présent que
sur certaines cartes et peut afficher « N/A » pour certaines cartes multiGPU plus récentes.
Type Le type de puce de pont. Signalé comme N/A s'il n'existe pas.
Microcode Version
La version du firmware de la puce bridge. Signalé comme N/A s'il n'existe pas.
Ventilateur Vitesse
La valeur de la vitesse du ventilateur est le pourcentage de la vitesse maximale à laquelle le ventilateur de l'appareil est actuellement
destiné à courir à. Il varie de 0 à 100 %. Remarque : La vitesse indiquée est la vitesse prévue
vitesse du ventilateur. Si le ventilateur est physiquement bloqué et incapable de tourner, cette sortie ne
correspondre à la vitesse réelle du ventilateur. De nombreuses pièces ne signalent pas les vitesses des ventilateurs car elles reposent sur
refroidissement via des ventilateurs dans l'enceinte environnante. Pour tous les produits discrets avec
ventilateurs.
Performance Région
L'état actuel des performances du GPU. Les états vont de P0 (performance maximale) à
P12 (performance minimale).
Horloges Étrangler Raisons
Récupère des informations sur les facteurs qui réduisent la fréquence des horloges. Seulement sur
appareils Tesla pris en charge de la famille Kepler.
Si toutes les raisons de l'accélérateur sont renvoyées comme « Non actives », cela signifie que les horloges fonctionnent comme
haut que possible.
Idle Rien ne fonctionne sur le GPU et les horloges tombent à l'état inactif.
Ce limiteur peut être supprimé dans une version ultérieure.
Application Horloges Paramètres
Les horloges GPU sont limitées par le réglage des horloges des applications. Par exemple, peut être modifié
en utilisant nvidia-smi --applications-clocks=
SW Puissance Casquettes L'algorithme SW Power Scaling réduit les horloges en dessous des horloges demandées
car le GPU consomme trop d'énergie. Par exemple, la limite du plafond de puissance SW peut
être modifié avec nvidia-smi --power-limit=
HW Ralentissez Le ralentissement HW (réduction des horloges centrales d'un facteur 2 ou plus) est activé.
C'est un indicateur de :
* La température est trop élevée
* L'assertion de frein de puissance externe est déclenchée (par exemple par l'alimentation du système
la fourniture)
* La consommation d'énergie est trop élevée et la protection Fast Trigger réduit les horloges
Inconnu Un autre facteur non spécifié réduit les horloges.
FB Mémoire Utilisation
Informations sur la mémoire tampon de trame intégrée. La mémoire totale signalée est affectée par l'état ECC.
Si ECC est activé, la mémoire totale disponible est diminuée de plusieurs pour cent, en raison de la
bits de parité requis. Le pilote peut également réserver une petite quantité de mémoire pour
utiliser, même sans travail actif sur le GPU. Pour tous les produits.
Total Taille totale de la mémoire FB.
Occasion Taille utilisée de la mémoire FB.
Gratuit Taille disponible de la mémoire FB.
BARRE1 Mémoire Utilisation
BAR1 est utilisé pour mapper le FB (mémoire de l'appareil) afin qu'il soit directement accessible par la CPU
ou par des périphériques tiers (pair à pair sur le bus PCIe).
Total Taille totale de la mémoire BAR1.
Occasion Taille utilisée de la mémoire BAR1.
Gratuit Taille disponible de la mémoire BAR1.
calcul Mode
L'indicateur de mode de calcul indique si des applications de calcul individuelles ou multiples peuvent
exécuter sur le GPU.
"Par défaut" signifie que plusieurs contextes sont autorisés par appareil.
"Exclusive Thread" signifie qu'un seul contexte est autorisé par appareil, utilisable à partir d'un thread à
un temps.
« Processus exclusif » signifie qu'un seul contexte est autorisé par appareil, utilisable à partir de plusieurs
fils à la fois.
"Interdit" signifie qu'aucun contexte n'est autorisé par appareil (pas d'applications de calcul).
"EXCLUSIVE_PROCESS" a été ajouté dans CUDA 4.0. Les versions précédentes de CUDA ne prenaient en charge qu'une seule
mode exclusif, qui équivaut à "EXCLUSIVE_THREAD" dans CUDA 4.0 et au-delà.
Pour tous les produits compatibles CUDA.
Utilisation
Les taux d'utilisation indiquent le taux d'occupation de chaque GPU au fil du temps et peuvent être utilisés pour déterminer comment
une application utilise les GPU dans le système.
Remarque : lors de l'initialisation du pilote, lorsque ECC est activé, vous pouvez voir un GPU et une mémoire élevés
Lectures d'utilisation. Ceci est causé par le mécanisme de nettoyage de la mémoire ECC qui est effectué
lors de l'initialisation du pilote.
GPU Pourcentage de temps au cours de la dernière période d'échantillonnage au cours de laquelle un ou plusieurs
kernels s'exécutait sur le GPU. La période d'échantillonnage peut être comprise entre 1
seconde et 1/6 seconde selon le produit.
Mémoire Pourcentage de temps au cours de la dernière période d'échantillonnage au cours de laquelle global (appareil)
la mémoire était en cours de lecture ou d'écriture. La période d'échantillonnage peut être comprise entre 1
seconde et 1/6 seconde selon le produit.
Ecc Mode
Un indicateur qui indique si la prise en charge ECC est activée. Peut être soit « Activé » ou
"Désactivée". Les modifications apportées au mode ECC nécessitent un redémarrage. Nécessite la version de l'objet Inforom ECC
1.0 ou supérieur.
Courant Le mode ECC sous lequel le GPU fonctionne actuellement.
En Attente Le mode ECC sous lequel le GPU fonctionnera après le prochain redémarrage.
ECC Erreurs
Les GPU NVIDIA peuvent fournir des nombres d'erreurs pour divers types d'erreurs ECC. Certaines erreurs ECC sont
bit simple ou double, où les erreurs à bit unique sont corrigées et les erreurs à double bit
sont incorrigibles. Les erreurs de mémoire de texture peuvent être corrigibles via un renvoi ou non corrigibles
si le renvoi échoue. Ces erreurs sont disponibles sur deux échelles de temps (volatile et
agrégat). Les erreurs ECC à bit unique sont automatiquement corrigées par le matériel et n'entraînent pas
dans la corruption de données. Les erreurs de bit double sont détectées mais non corrigées. S'il vous plaît voir l'ECC
documents sur le Web pour plus d'informations sur le comportement de l'application de calcul en cas de double bit
des erreurs se produisent. Les compteurs d'erreurs volatiles suivent le nombre d'erreurs détectées depuis la dernière
charge du pilote. Les nombres d'erreurs agrégés persistent indéfiniment et agissent ainsi comme une durée de vie
contrer.
Remarque sur les décomptes volatils : sous Windows, il s'agit d'une fois par démarrage. Sous Linux, cela peut être plus
fréquent. Sous Linux, le pilote se décharge lorsqu'aucun client actif n'existe. Par conséquent, si
le mode persistance est activé ou il y a toujours un pilote client actif (par exemple X11), alors
Linux voit également un comportement par démarrage. Sinon, les comptes volatiles sont réinitialisés chaque fois qu'un calcul
l'application est exécutée.
Les produits Tesla et Quadro de la famille Fermi et Kepler peuvent afficher une erreur ECC totale
comptes, ainsi qu'une ventilation des erreurs en fonction de l'emplacement sur la puce. Les emplacements sont
décrit ci-dessous. Les données basées sur l'emplacement pour le nombre d'erreurs agrégé nécessitent Inforom ECC
objet version 2.0. Tous les autres décomptes ECC nécessitent l'objet ECC version 1.0.
Appareil Mémoire Erreurs détectées dans la mémoire globale de l'appareil.
S'inscrire Déposez votre dernière attestation Erreurs détectées dans la mémoire du fichier de registre.
L1 Cache Erreurs détectées dans le cache L1.
L2 Cache Erreurs détectées dans le cache L2.
Texture Mémoire Erreurs de parité détectées dans la mémoire de texture.
Total Nombre total d'erreurs détectées sur l'ensemble de la puce. Somme de Appareil Mémoire, S'inscrire
Déposez votre dernière attestation , L1 Cache, L2 Cache et Texture Mémoire.
Page Retraite
Les GPU NVIDIA peuvent retirer des pages de mémoire de périphérique GPU lorsqu'elles ne sont plus fiables. Ceci peut
se produisent lorsque plusieurs erreurs ECC à bit unique se produisent pour la même page, ou sur un ECC à double bit
Erreur. Lorsqu'une page est retirée, le pilote NVIDIA la masquera de sorte qu'aucun pilote, ou
les allocations de mémoire d'application peuvent y accéder.
Double Bit ECC Le nombre de pages de mémoire de périphérique GPU qui ont été retirées en raison d'un
erreur ECC double bit.
Simple Bit ECC Le nombre de pages de mémoire de périphérique GPU qui ont été retirées en raison de
plusieurs erreurs ECC sur un seul bit.
En Attente Vérifie si des pages de mémoire de périphérique GPU sont en attente de retrait au prochain redémarrage.
Les pages en attente de retrait peuvent toujours être attribuées et peuvent entraîner d'autres
problèmes de fiabilité.
Température
Lectures des capteurs de température sur la carte. Toutes les lectures sont en degrés C. Pas toutes
les produits prennent en charge tous les types de lecture. En particulier, les produits dans des facteurs de forme de module qui
les ventilateurs de boîtier ou le refroidissement passif ne fournissent généralement pas de relevés de température. Voir
ci-dessous pour les restrictions.
GPU Température du cœur du GPU. Pour tous les produits discrets et de classe S.
Puissance Lectures
Les lectures de puissance aident à faire la lumière sur l'utilisation actuelle de la puissance du GPU et les facteurs
qui affectent cette utilisation. Lorsque la gestion de l'alimentation est activée, le GPU limite la consommation d'énergie sous
charge pour s'adapter à une enveloppe de puissance prédéfinie en manipulant les performances actuelles
Etat. Voir ci-dessous pour les limites de disponibilité.
Puissance Région L'état de l'alimentation est obsolète et a été renommé en état de performance dans
2.285. Pour maintenir la compatibilité XML, au format XML, l'état des performances est
répertoriés aux deux endroits.
Puissance Gestionnaires
Un indicateur qui indique si la gestion de l'alimentation est activée. Soit
"Supporté" ou "N/A". Nécessite l'objet Inforom PWR version 3.0 ou supérieure ou
Appareil Kepler.
Puissance Match nul La dernière consommation d'énergie mesurée pour l'ensemble de la carte, en watts. Seul
disponible si la gestion de l'alimentation est prise en charge. Cette lecture est précise pour
dans +/- 5 watts. Nécessite l'objet Inforom PWR version 3.0 ou supérieure ou
Appareil Kepler.
Puissance limite La limite de puissance du logiciel, en watts. Défini par un logiciel tel que nvidia-smi.
Disponible uniquement si la gestion de l'alimentation est prise en charge. Nécessite Inforom PWR
objet version 3.0 ou supérieure ou appareil Kepler. Sur les appareils Kepler
La limite peut être ajustée à l'aide des commutateurs -pl,--power-limit=.
Forcées Puissance limite
Plafond de puissance de l'algorithme de gestion de l'alimentation, en watts. Pension totale
la consommation d'énergie est manipulée par l'algorithme de gestion de l'alimentation de telle sorte qu'elle
reste sous cette valeur. Cette limite est le minimum de diverses limites telles
comme la limite logicielle indiquée ci-dessus. Disponible uniquement si la gestion de l'alimentation est
prise en charge. Nécessite un appareil Kepler.
Réglage par défaut Puissance limite
Plafond de puissance de l'algorithme de gestion de l'alimentation par défaut, en watts. Puissance
La limite sera remise à la limite de puissance par défaut après le déchargement du pilote. Seulement sur
appareils pris en charge de la famille Kepler.
Min Puissance limite
La valeur minimale en watts à laquelle la limite de puissance peut être définie. Seulement sur
appareils pris en charge de la famille Kepler.
Max Puissance limite
La valeur maximale en watts à laquelle la limite de puissance peut être définie. Seulement sur
appareils pris en charge de la famille Kepler.
Horloges
Fréquence actuelle à laquelle certaines parties du GPU s'exécutent. Toutes les lectures sont en MHz.
Graphiques Fréquence actuelle de l'horloge graphique (shader).
SM Fréquence actuelle de l'horloge SM (Streaming Multiprocessor).
Mémoire Fréquence actuelle de l'horloge mémoire.
Applications Horloges
Fréquence spécifiée par l'utilisateur à laquelle les applications seront exécutées. Peut être modifié avec
[-ac | --applications-clocks].
Graphiques Fréquence d'horloge graphique (shader) spécifiée par l'utilisateur.
Mémoire Fréquence d'horloge mémoire spécifiée par l'utilisateur.
Réglage par défaut Applications Horloges
Fréquence par défaut à laquelle les applications seront exécutées. Les horloges d'application peuvent être
changé avec [-ac | --applications-clocks]. Les horloges des applications peuvent être réglées sur
par défaut en utilisant [-rac | --reset-applications-clocks].
Graphiques Fréquence par défaut de l'horloge graphique (shader) des applications.
Mémoire Fréquence par défaut de l'horloge de la mémoire des applications.
Max Horloges
Fréquence maximale à laquelle les parties du GPU sont conçues pour fonctionner. Toutes les lectures sont en MHz.
Sur les GPU de la famille Fermi, les horloges P0 actuelles (rapportées dans la section Horloges) peuvent différer de
horloges max de quelques MHz.
Graphiques Fréquence maximale de l'horloge graphique (shader).
SM Fréquence maximale de l'horloge SM (Streaming Multiprocessor).
Mémoire Fréquence maximale de l'horloge mémoire.
horloge Politique
Paramètres spécifiés par l'utilisateur pour les changements de pointage automatisés tels que le boost automatique.
Voiture Boost Indique si le mode boost automatique est actuellement activé pour ce GPU (On) ou
désactivé pour ce GPU (Désactivé). Affiche (N/A) si le boost n'est pas pris en charge. Auto
boost permet une synchronisation dynamique du GPU en fonction de la puissance, de la température et de l'utilisation.
Lorsque le boost automatique est désactivé, le GPU tentera de maintenir les horloges à
précisément les paramètres Current Application Clocks (à chaque fois qu'un contexte CUDA
c'est actif). Avec le boost automatique activé, le GPU tentera toujours de maintenir
cet étage, mais augmentera de manière opportuniste vers des horloges plus élevées lorsque l'alimentation,
la marge thermique et d'utilisation permettent. Ce paramètre persiste pour la vie
du contexte CUDA pour lequel il a été demandé. Les applications peuvent demander un
mode particulier soit via un appel NVML (voir NVML SDK) soit en définissant le
Variable d'environnement CUDA CUDA_AUTO_BOOST.
Voiture Boost Réglage par défaut
Indique le réglage par défaut du mode boost automatique, soit activé (On) soit
désactivé (Désactivé). Affiche (N/A) si le boost n'est pas pris en charge. Les applications s'exécuteront dans le
mode par défaut s'ils n'ont pas explicitement demandé un mode particulier.
Appareils horloges
Liste des combinaisons possibles de mémoire et d'horloges graphiques sur lesquelles le GPU peut fonctionner (pas
en tenant compte des horloges réduites du frein HW). Ce sont les seules combinaisons d'horloge qui
peut être passé à l'indicateur --applications-clocks. Les horloges prises en charge ne sont répertoriées que lorsque -q -d
Les commutateurs SUPPORTED_CLOCKS sont fournis ou au format XML.
calcul Processus
Liste des processus ayant un contexte de calcul sur l'appareil.
Chaque entrée est de format " . "
Occasion GPU Mémoire
Quantité de mémoire utilisée sur l'appareil par le contexte. Non disponible sur Windows
lors de l'exécution en mode WDDM car Windows KMD gère toute la mémoire non
Pilote NVIDIA.
Stats (EXPÉRIMENTAL)
Répertorier les statistiques GPU telles que les échantillons d'alimentation, les échantillons d'utilisation, les événements xid, le changement d'horloge
les événements et les compteurs de violations.
Pris en charge sur les produits basés sur Tesla, GRID et Quadro sous Linux.
Limité à Kepler ou aux GPU plus récents.
Affiche les statistiques au format CSV comme suit :
, , ,
Les métriques à afficher avec leurs unités sont les suivantes :
Échantillons de puissance en watts.
Exemples d'utilisation du GPU, de la mémoire, de l'encodeur et du décodeur en pourcentage.
Événements d'erreur Xid signalés avec le code d'erreur Xid. Le code d'erreur est 999 pour xid inconnu
Erreur.
Changements d'horloge du processeur et de la mémoire en MHz.
Violation due au plafonnement de la puissance avec temps de violation en ns. (Tesla uniquement)
Violation due au plafonnement thermique avec indicateur booléen de violation (1/0). (Tesla uniquement)
Notes:
Toute statistique précédée de "#" est un commentaire.
L'appareil non pris en charge s'affiche sous la forme "# , Dispositif non pris en charge".
La métrique non prise en charge s'affiche sous la forme " , , S/O, S/O".
Violation due à Thermique/Puissance prise en charge uniquement pour les produits basés sur Tesla. Violations thermiques
sont limités à Tesla K20 et supérieur.
topologie (EXPÉRIMENTAL)
Répertorier les informations de topologie sur les GPU du système, ainsi que la manière dont ils se connectent les uns aux autres
en tant que cartes réseau qualifiées capables de RDMA
Affiche une matrice des GPU disponibles avec la légende suivante :
Légende:
X = Soi
SOC = Le chemin traverse un lien au niveau du socket (par exemple, QPI)
PHB = Le chemin traverse un pont hôte PCIe
PXB = le chemin traverse plusieurs commutateurs internes PCIe
PIX = Le chemin traverse un commutateur interne PCIe
UNITÉ CARACTÉRISTIQUES
La liste suivante décrit toutes les données possibles renvoyées par le -q -u option de requête d'unité.
Sauf indication contraire, tous les résultats numériques sont en base 10 et sans unité.
Horodatage
L'horodatage actuel du système au moment où nvidia-smi a été appelé. Le format est "Jour de la semaine
Mois Jour HH:MM:SS Année".
Chauffeur Version
La version du pilote d'affichage NVIDIA installé. Le format est
"Major-Numéro.Mineur-Numéro".
CE Info
Informations sur les cartes d'interface hôte (HIC) installées dans le système.
Microcode Version
La version du micrologiciel s'exécutant sur le HIC.
Attached Unités
Le nombre d'unités attachées dans le système.
Produit Nom
Le nom officiel du produit de l'unité. Il s'agit d'une valeur alphanumérique. Pour toutes les classes S
en vente au détail.
Produit Id
Identificateur de produit de l'unité. Il s'agit d'une valeur alphanumérique de la forme
"partie1-partie2-partie3". Pour tous les produits de la classe S.
Produit Port série
Identificateur global unique et immuable de l'unité. Il s'agit d'une valeur alphanumérique.
Pour tous les produits de la classe S.
Microcode Version
La version du micrologiciel en cours d'exécution sur l'unité. Le format est "Major-Number.Minor-Number".
Pour tous les produits de la classe S.
DEL Région
L'indicateur LED est utilisé pour signaler les systèmes présentant des problèmes potentiels. Une LED de couleur AMBRE
indique un problème. Pour tous les produits de la classe S.
Couleur La couleur de l'indicateur LED. Soit "VERT" ou "AMBRE".
Causes La raison de la couleur actuelle de la LED. La cause peut être répertoriée comme n'importe quelle
combinaison de "Inconnu", "Défini sur AMBRE par le système hôte", "Capteur thermique
panne », « Panne du ventilateur » et « La température dépasse la limite critique ».
Température
Lectures de température pour les composants importants de l'unité. Toutes les lectures sont en degrés C.
Toutes les lectures peuvent ne pas être disponibles. Pour tous les produits de la classe S.
Prise Température de l'air à l'entrée de l'unité.
Échappement Température de l'air au point d'évacuation de l'unité.
Conseil d'administration Température de l'air à travers la carte de l'unité.
PSU
Lectures pour l'alimentation de l'unité. Pour tous les produits de la classe S.
Région État de fonctionnement du bloc d'alimentation. L'état de l'alimentation peut être l'un des
suivant : "Normal", "Anormal", "Haute tension", "Défaillance du ventilateur", "Dissipateur
température", "Limite de courant", "Tension inférieure au seuil d'alarme UV",
"Basse tension", "Commande d'arrêt à distance I2C", "Entrée MOD_DISABLE" ou "Broche courte
transition".
Tension Réglage de la tension du bloc d'alimentation, en volts.
Courant Consommation de courant du bloc d'alimentation, en ampères.
Ventilateur Info
Lectures de ventilateur pour l'unité. Une lecture est prévue pour chaque ventilateur, dont il peut y avoir
de nombreux. Pour tous les produits de la classe S.
Région L'état du ventilateur, soit "NORMAL" soit "FAILED".
Vitesse Pour un ventilateur en bonne santé, la vitesse du ventilateur en RPM.
Attached GPU
Une liste d'identifiants de bus PCI qui correspondent à chacun des GPU connectés à l'unité. Le bus
Les identifiants ont la forme "domain:bus:device.function", en hexadécimal. Pour tous les produits de la classe S.
NOTES
Sous Linux, les fichiers de périphérique NVIDIA peuvent être modifiés par nvidia-smi s'ils sont exécutés en tant que root. S'il te plait regarde
la section appropriée du fichier README du pilote.
VOTRE -a et -g les arguments sont maintenant dépréciés en faveur de -q et -i, respectivement. cependant,
les anciens arguments fonctionnent toujours pour cette version.
EXEMPLES
Nvidia-smi -q
Interrogez une seule fois les attributs de tous les GPU et affichez-les en texte brut sur la sortie standard.
Nvidia-smi --format=csv, sans en-tête --query-gpu=uuid,mode_persistance
Interrogez l'UUID et le mode de persistance de tous les GPU du système.
Nvidia-smi -q -d ECC, PUISSANCE -i 0 -l 10 -f out.log
Interroger les erreurs ECC et la consommation électrique du GPU 0 à une fréquence de 10 secondes,
indéfiniment, et enregistrez-le dans le fichier out.log.
Nvidia-smi -c 1 -i GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8
Définissez le mode de calcul sur "EXCLUSIVE_THREAD" pour le GPU avec UUID
"GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8".
Nvidia-smi -q -u -x --dtd
Interrogez les attributs de toutes les unités une fois et affichez-les au format XML avec la DTD intégrée pour
sortie standard.
Nvidia-smi --dtd -u -f nvsmi_unit.dtd
Écrivez la DTD d'unité dans nvsmi_unit.dtd.
Nvidia-smi -q -d SUPPORTED_CLOCKS
Affichez les horloges prises en charge de tous les GPU.
Nvidia-smi -i 0 --applications-horloges 2500,745
Réglez les horloges des applications sur une mémoire de 2500 MHz et des graphiques à 745 MHz.
CHANGEMENT Se Connecter
=== Problèmes connus ===
* Sous Linux, la réinitialisation du GPU ne peut pas être déclenchée lorsqu'un changement de GOM est en attente.
* Sous Linux, la réinitialisation du GPU peut ne pas changer avec succès le mode ECC en attente. Un redémarrage complet peut être
requis pour activer le changement de mode.
* En mode Windows WDDM, la mémoire GPU est allouée par Windows au démarrage puis
géré directement. Nvidia-smi signale la mémoire utilisée/libre du point de vue du conducteur, donc dans
En mode WDDM, les résultats peuvent être trompeurs. Cela sera probablement corrigé à l'avenir.
=== Changements entre la mise à jour nvidia-smi v331 et v340 ===
* Ajout de rapports d'informations sur les seuils de température.
* Ajout de rapports sur les informations de marque (par exemple Tesla, Quadro, etc.)
* Ajout de rapports de max, min et avg pour les échantillons (puissance, utilisation, changements d'horloge).
Exemple de ligne de commande : nvidia-smi -q -d power,utilisation, clock
* Ajout de l'interface de statistiques nvidia-smi pour collecter des statistiques telles que la puissance, l'utilisation,
changements d'horloge, événements xid et compteurs de perf capping avec une notion de temps attachée à chacun
échantillon. Exemple de ligne de commande : statistiques nvidia-smi
* Ajout de la prise en charge des rapports collectifs de métriques sur plusieurs GPU. Utilisé avec une virgule
séparés par l'option "-i". Exemple : nvidia-smi -i 0,1,2
* Ajout de la prise en charge de l'affichage des utilisations de l'encodeur et du décodeur GPU
* Ajout de l'interface topo nvidia-smi pour afficher la matrice de communication GPUDirect
(EXPÉRIMENTAL)
* Ajout de la prise en charge de l'affichage de l'ID de la carte GPU et du fait qu'il s'agisse ou non d'une carte multiGPU
* Suppression de la raison de l'accélérateur définie par l'utilisateur de la sortie XML
=== Changements entre la mise à jour nvidia-smi v5.319 et v331 ===
* Ajout du rapport de nombre mineur.
* Ajout de la taille de la mémoire BAR1.
* Ajout de rapports sur le micrologiciel de la puce de pont.
=== Changements entre nvidia-smi v4.319 Production et v4.319 Update ===
* Ajout d'un nouveau commutateur --applications-clocks-permission pour modifier les exigences d'autorisation
pour régler et réinitialiser les horloges des applications.
=== Changements entre nvidia-smi v4.304 et v4.319 Production ===
* Ajout de rapports sur l'état d'affichage actif et mise à jour de la documentation pour clarifier la façon dont il
diffère du mode d'affichage et de l'état d'affichage actif
* Pour plus de cohérence sur les cartes multi-GPU, nvidia-smi -L affiche toujours l'UUID au lieu de
numéro de série
* Ajout de rapports sélectifs lisibles par machine. Voir la section OPTIONS DE REQUÊTE SÉLECTIVE de
nvidia-smi -h
* Ajout de requêtes pour les informations de retrait de page. Voir --help-query-retired-pages et -d
PAGE_RETRAITE
* Horloges définies par l'utilisateur pour la raison de l'accélérateur d'horloge renommées en paramètres d'horloges d'applications
* En cas d'erreur, les codes de retour ont des valeurs distinctes non nulles pour chaque classe d'erreur. Voir RETOUR
section VALEUR
* nvidia-smi -i peut désormais demander des informations à partir d'un GPU sain en cas de problème avec
autre GPU dans le système
* Tous les messages indiquant un problème avec un identifiant de bus PCI d'impression GPU d'un GPU en panne
* Nouvel indicateur --loop-ms pour interroger des informations à des taux plus élevés qu'une fois par seconde (peut
avoir un impact négatif sur les performances du système)
* Ajout de requêtes pour les processus comptables. Voir --help-query-accounted-apps et -d
COMPTABILITÉ
* Ajout de la limite de puissance imposée à la sortie de la requête
=== Changements entre nvidia-smi v4.304 RC et v4.304 Production ===
* Ajout de rapports sur le mode de fonctionnement du GPU (GOM)
* Ajout d'un nouveau commutateur --gom pour définir le mode de fonctionnement du GPU
=== Changements entre nvidia-smi v3.295 et v4.304 RC ===
* Sortie non verbeuse reformatée en raison des commentaires des utilisateurs. Suppression des informations en attente de
tableau.
* Imprimez un message utile si l'initialisation échoue en raison de la non-réception du module du noyau
interruptions
* Meilleure gestion des erreurs lorsque la bibliothèque partagée NVML n'est pas présente dans le système
* Ajout d'un nouveau commutateur --applications-clocks
* Ajout d'un nouveau filtre au commutateur --display. Exécuter avec -d SUPPORTED_CLOCKS pour lister les possibles
horloges sur un GPU
* Lorsque vous déclarez de la mémoire libre, calculez-la à partir du total arrondi et de la mémoire utilisée afin
que les valeurs s'additionnent
* Ajout de rapports sur les contraintes de limite de gestion de l'alimentation et la limite par défaut
* Ajout d'un nouveau commutateur de limite de puissance
* Ajout du rapport des erreurs ECC de la mémoire de texture
* Ajout de rapports sur les raisons de l'accélération de l'horloge
=== Changements entre nvidia-smi v2.285 et v3.295 ===
* Rapports d'erreur plus clairs pour l'exécution des commandes (comme le changement de mode de calcul)
* Lors de l'exécution de commandes sur plusieurs GPU à la fois, les erreurs N/A sont traitées comme des avertissements.
* nvidia-smi -i prend désormais également en charge l'UUID
* Le format UUID a changé pour correspondre à la norme UUID et rapportera une valeur différente.
=== Changements entre nvidia-smi v2.0 et v2.285 ===
* Rapporter la version VBIOS.
* Ajout du drapeau -d/--display pour filtrer des parties de données
* Ajout de rapports sur l'ID du sous-système PCI
* Documents mis à jour pour indiquer que nous prenons en charge M2075 et C2075
* Signaler la version du micrologiciel HIC HWBC avec le commutateur -u
* Rapporter les horloges max (P0) à côté des horloges actuelles
* Ajout de l'indicateur --dtd pour imprimer la DTD de l'appareil ou de l'unité
* Message ajouté lorsque le pilote NVIDIA n'est pas en cours d'exécution
* Ajout de rapports sur la génération de liens PCIe (max et actuelle) et la largeur de lien (max et
courant).
* L'obtention du modèle de pilote en attente fonctionne sur les non-administrateurs
* Ajout de la prise en charge de l'exécution de nvidia-smi sur les comptes invités Windows
* L'exécution de nvidia-smi sans la commande -q produira une version non détaillée de -q au lieu de
vous aider
* Correction de l'analyse de l'argument -l/--loop= (valeur par défaut, 0, à grande valeur)
* Format modifié de pciBusId (en XXXX:XX:XX.X - ce changement était visible en 280)
* L'analyse de busId pour la commande -i est moins restrictive. Vous pouvez passer 0:2:0.0 ou
0000:02:00 et autres variantes
* Modification du schéma de version pour inclure également la "version du pilote"
* Le format XML est toujours conforme à la DTD, même lorsque des conditions d'erreur se produisent
* Ajout de la prise en charge des événements ECC simples et doubles bits et des erreurs XID (activé par défaut
avec l'indicateur -l désactivé pour l'indicateur -x)
* Ajout d'indicateurs de réinitialisation de périphérique -r --gpu-reset
* Ajout de la liste des processus de calcul en cours d'exécution
* État d'alimentation renommé en état de performance. Un support obsolète existe dans la sortie XML
seulement.
* Numéro de version DTD mis à jour à 2.0 pour correspondre à la sortie XML mise à jour
Utilisez alt-nvidia-340-smi en ligne en utilisant les services onworks.net