این دستور alt-nvidia-340-smi است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
nvidia-smi - برنامه رابط مدیریت سیستم NVIDIA
خلاصه
nvidia-smi [OPTION1 [ARG1]] [OPTION2 [ARG2]] ...
شرح
nvidia-smi (همچنین NVSMI) قابلیت های نظارت و مدیریت را برای هر یک از آنها فراهم می کند
دستگاههای Tesla، Quadro و GRID NVIDIA از خانوادههای معماری Fermi و بالاتر. خیلی
اطلاعات محدودی نیز برای دستگاه های Geforce ارائه شده است. NVSMI یک ابزار متقابل پلتفرم است
که از تمام توزیعهای لینوکس استاندارد NVIDIA و همچنین 64 بیت پشتیبانی میکند
نسخه های ویندوز که با ویندوز سرور 2008 R2 شروع می شود. متریک ها را می توان مصرف کرد
به طور مستقیم توسط کاربران از طریق stdout، یا توسط فایل از طریق فرمت های CSV و XML برای اسکریپت ارائه شده است
اهداف.
توجه داشته باشید که بسیاری از عملکردهای NVSMI توسط NVML مبتنی بر C ارائه می شود
کتابخانه برای اطلاعات بیشتر در مورد NVML به پیوند وب سایت توسعه دهنده NVIDIA در زیر مراجعه کنید.
اتصالات پایتون مبتنی بر NVML نیز در دسترس هستند.
خروجی NVSMI تضمینی برای سازگاری با عقب نیست. با این حال، هم NVML و هم
اتصالات پایتون با عقب سازگار هستند و باید اولین انتخاب در هنگام نوشتن باشد
هر ابزاری که باید در نسخه های درایور NVIDIA نگهداری شود.
NVML SDK ها: http://developer.nvidia.com/nvidia-management-library-nvml/
پــایتــون اتصالات: http://pypi.python.org/pypi/nvidia-ml-py/
OPTIONS
عمومی OPTIONS
-h، --کمک
چاپ اطلاعات استفاده و خروج.
خلاصه OPTIONS
-ل، --list-gpus
هر یک از GPU های NVIDIA در سیستم را به همراه UUID های آنها فهرست کنید.
پرس و جو OPTIONS
-q، --پرس و جو
نمایش اطلاعات GPU یا Unit. اطلاعات نمایش داده شده شامل تمام داده های فهرست شده در (GPU ویژگی های)
یا (واحد ویژگی های) بخش های این سند. برخی از دستگاه ها و/یا محیط ها این کار را نمی کنند
پشتیبانی از تمام اطلاعات ممکن هر داده پشتیبانی نشده با یک "N/A" در نشان داده می شود
خروجی بهطور پیشفرض اطلاعات مربوط به تمام واحدهای گرافیکی یا واحدهای موجود نمایش داده میشود. استفاده کنید -i
گزینه ای برای محدود کردن خروجی به یک GPU یا واحد.
[به علاوه اختیاری]
-u، --واحد
نمایش داده های واحد به جای داده های GPU. داده های واحد فقط برای NVIDIA S-class در دسترس است
محوطه های تسلا
-من، --id=ID
نمایش داده ها برای یک واحد گرافیکی یا واحد مشخص. شناسه مشخص شده ممکن است GPU/Unit باشد
شاخص مبتنی بر 0 در شمارش طبیعی که توسط درایور برگردانده شده است، سریال برد GPU
شماره، UUID GPU، یا شناسه گذرگاه PCI GPU (به عنوان domain:bus:device.function به صورت هگز).
توصیه می شود که کاربرانی که مایل به سازگاری هستند از UUID یا PCI bus ID استفاده کنند
ترتیب شمارش دستگاه تضمین نمی شود که بین راه اندازی مجدد و برد هماهنگ باشد
شماره سریال ممکن است بین چندین GPU در یک برد مشترک به اشتراک گذاشته شود.
-f فایل، --filename=FILE
خروجی query را به جای stdout پیش فرض به فایل مشخص شده هدایت کنید. مشخص شده
فایل رونویسی خواهد شد
-ایکس، فرمت --xml
به جای فرمت پیش فرض قابل خواندن توسط انسان، خروجی XML تولید کنید. هم GPU و هم Unit query
خروجی ها با DTD های مربوطه مطابقت دارند. اینها از طریق در دسترس هستند --dtd پرچم.
--dtd
با استفاده از -x. DTD را در خروجی XML قرار دهید.
-d نوع، --display=TYPE
نمایش فقط اطلاعات انتخاب شده: حافظه، استفاده، ECC، دما، برق، ساعت،
COMPUTE، PIDS، PERFORMANCE، SUPPORTED_CLOCKS، PAGE_RETIREMENT، ACCOUNTING پرچم ها را می توان
ترکیب با کاما به عنوان مثال "MEMORY,ECC". نمونه برداری از داده ها با حداکثر، حداقل و میانگین نیز می باشد
برای انواع نمایشگر POWER، UTILIZATION و CLOCK برگردانده شد. با -u/--unit یا کار نمی کند
پرچم های -x/--xml با فرمت.
-l SEC، --loop=SEC
بهجای پیشفرض فقط، دادههای پرس و جو را به طور مداوم در بازه زمانی مشخص گزارش کنید
یک بار. برنامه در بین پرس و جوها می خوابد. توجه داشته باشید که در لینوکس خطا ECC یا XID
رویدادهای خطا در طول دوره خواب چاپ می شوند اگر -x پرچم مشخص نشد
با فشار دادن Ctrl+C در هر زمان، حلقه قطع می شود، در غیر این صورت به طور نامحدود اجرا می شود.
اگر هیچ آرگومانی برای -l فرم یک فاصله پیش فرض 5 ثانیه استفاده می شود.
انتخابی پرس و جو OPTIONS
به تماسگیرنده اجازه میدهد تا فهرست صریح ویژگیها را به پرس و جو ارسال کند.
[یک از]
--query-gpu=
اطلاعات در مورد پردازنده گرافیکی لیست خصوصیاتی را که می خواهید پرس و جو کنید، با ویرگول جدا کنید. به عنوان مثال
--query-gpu=pci.bus_id,persistence_mode. برای اطلاعات بیشتر با --help-query-gpu تماس بگیرید.
--query-supported-clocks=
لیست ساعت های پشتیبانی شده برای اطلاعات بیشتر با --help-query-supported-clocks تماس بگیرید.
--query-compute-apps=
فهرست فرآیندهای محاسباتی فعال در حال حاضر. برای اطلاعات بیشتر با --help-query-compute-apps تماس بگیرید.
--query-accounted-apps=
فهرست فرآیندهای محاسباتی حساب شده برای اطلاعات بیشتر با --help-query-accounted-apps تماس بگیرید.
--query-retired-pages=
فهرست صفحات حافظه دستگاه GPU که بازنشسته شده اند. با --help-query-retired-pages تماس بگیرید
برای اطلاعات بیشتر.
[اجباری]
--فرمت=
لیست گزینه های قالب جدا شده با کاما:
· csv - مقادیر جدا شده با کاما (اجباری)
· noheader - از خط اول با سرصفحه های ستون بگذرید
· واحدها - واحدها را برای مقادیر عددی چاپ نکنید
[به علاوه هر از]
-من، --id=ID
نمایش داده ها برای یک GPU مشخص. شناسه مشخص شده ممکن است شاخص مبتنی بر 0 GPU باشد
در شمارش طبیعی ارائه شده توسط راننده، شماره سریال برد GPU،
UUID GPU یا شناسه گذرگاه PCI GPU (به عنوان domain:bus:device.function به صورت هگز). این است
توصیه می شود که کاربرانی که مایل به سازگاری هستند از UUID یا PCI bus ID استفاده کنند
ترتیب شمارش بین راه اندازی مجدد و سریال برد تضمین نمی شود
ممکن است شماره بین چندین GPU در یک برد مشترک باشد.
-f فایل، --filename=FILE
خروجی query را به جای stdout پیش فرض به فایل مشخص شده هدایت کنید. مشخص شده
فایل رونویسی خواهد شد
-l SEC، --loop=SEC
بهجای پیشفرض فقط، دادههای پرس و جو را به طور مداوم در بازه زمانی مشخص گزارش کنید
یک بار. برنامه در بین پرس و جوها می خوابد. توجه داشته باشید که در لینوکس خطا ECC یا XID
رویدادهای خطا در طول دوره خواب چاپ می شوند اگر -x پرچم مشخص نشد
با فشار دادن Ctrl+C در هر زمان، حلقه قطع می شود، در غیر این صورت به طور نامحدود اجرا می شود.
اگر هیچ آرگومانی برای -l فرم یک فاصله پیش فرض 5 ثانیه استفاده می شود.
-lms اماس، --loop-ms=ms
همان حلقه -l،-- اما در میلی ثانیه.
دستگاه تغییر OPTIONS
[هر یک از]
-بعد از ظهر، -Persistence-mode=MODE
حالت ماندگاری را برای GPUهای مورد نظر تنظیم کنید. ببینید (GPU ویژگی های) بخش برای الف
شرح حالت ماندگاری نیاز به روت دارد. روی همه پردازندههای گرافیکی تأثیر میگذارد، مگر اینکه یک GPU واحد
با استفاده از -i بحث و جدل. تاثیر این عمل فوری است. با این حال،
در طول راه اندازی مجدد باقی نمی ماند. پس از هر راهاندازی مجدد، حالت ماندگاری پیشفرض به حالت پیشفرض خواهد بود
"معلول". فقط در لینوکس موجود است.
-ه ، --ecc-config=CONFIG
حالت ECC را برای GPUهای مورد نظر تنظیم کنید. ببینید (GPU ویژگی های) بخش برای توضیح
از حالت ECC نیاز به روت دارد. روی همه پردازندههای گرافیکی تأثیر میگذارد، مگر اینکه یک واحد پردازش گرافیکی با استفاده از آن مشخص شده باشد
la -i بحث و جدل. این تنظیم پس از راه اندازی مجدد بعدی اعمال می شود و پایدار است.
-پ، --reset-ecc-errors=TYPE
شمارشگرهای خطای ECC را برای GPUهای هدف بازنشانی کنید. ببینید (GPU ویژگی های) بخش برای الف
شرح انواع شمارنده خطا ECC آرگومان های موجود 0|VOLATILE یا
1|مجموعه. نیاز به روت دارد. روی همه پردازندههای گرافیکی تأثیر میگذارد، مگر اینکه یک واحد پردازش گرافیکی با استفاده از آن مشخص شده باشد
la -i بحث و جدل. تاثیر این عمل فوری است.
-c، --compute-mode=MODE
حالت محاسبه را برای GPUهای مورد نظر تنظیم کنید. ببینید (GPU ویژگی های) بخش برای الف
شرح حالت محاسباتی نیاز به روت دارد. روی همه پردازندههای گرافیکی تأثیر میگذارد، مگر اینکه یک GPU واحد باشد
مشخص شده با استفاده از -i بحث و جدل. تاثیر این عمل فوری است. با این حال، آن را
در طول راه اندازی مجدد باقی نمی ماند. پس از هر بار راه اندازی مجدد، حالت محاسبه به "پیش فرض" بازنشانی می شود.
-dm نوع، --driver-model=TYPE
-fdm نوع، --force-driver-model=TYPE
مدل درایور TCC را فعال یا غیرفعال کنید. فقط برای ویندوز به حقوق مدیر نیاز دارد.
-dm اگر یک صفحه نمایش متصل شود، شکست خواهد خورد، اما -fdm مدل درایور را مجبور به تغییر می کند.
روی همه پردازندههای گرافیکی تأثیر میگذارد، مگر اینکه یک GPU واحد با استفاده از آن مشخص شده باشد -i بحث و جدل. راه اندازی مجدد است
برای انجام تغییر لازم است. دیدن راننده مدل برای اطلاعات بیشتر در مورد ویندوز
مدل های درایور
--gom=MODE
تنظیم حالت عملکرد GPU: 0/ALL_ON، 1/COMPUTE، 2/LOW_DP پشتیبانی شده در GK110 M-class و X-
محصولات کلاس تسلا از خانواده کپلر. در Quadro و Tesla C-class پشتیبانی نمی شود
محصولات به حقوق مدیر نیاز دارد. دیدن GPU عمل حالت برای اطلاعات بیشتر
در مورد GOM تغییرات GOM پس از راه اندازی مجدد اعمال می شود. ممکن است مورد نیاز راه اندازی مجدد حذف شود
در آینده. فقط GOM های محاسبه از WDDM (مدل درایور نمایشگر ویندوز) پشتیبانی نمی کنند
-r، --gpu-reset
بازنشانی GPU را راه اندازی کنید. می توان از آن برای پاک کردن وضعیت GPU HW و SW در شرایطی استفاده کرد
در غیر این صورت نیاز به راه اندازی مجدد دستگاه دارد. اگر خطای ECC دو بیتی داشته باشد، معمولاً مفید است
رخ داده است. نیاز دارد -i به دستگاه خاص مورد نظر تغییر دهید. نیاز به روت دارد. نمی تواند وجود داشته باشد
هر برنامه ای که از این دستگاه خاص استفاده می کند (مانند برنامه CUDA، برنامه گرافیکی
مانند سرور X، برنامه نظارتی مانند سایر نمونه های nvidia-smi). اونجا هم
نمیتوان برنامههای محاسباتی را روی هر GPU دیگری در سیستم اجرا کرد. فقط در
دستگاه های پشتیبانی شده از خانواده Fermi و Kepler که روی لینوکس اجرا می شوند.
تنظیم مجدد GPU تضمینی برای کارکرد در همه موارد نیست. برای تولید توصیه نمی شود
محیط ها در این زمان در برخی شرایط ممکن است اجزای HW روی برد وجود داشته باشد
که پس از درخواست تنظیم مجدد به حالت اولیه باز نمی گردند. این بیشتر است
به احتمال زیاد در محصولات نسل فرمی در مقابل کپلر دیده می شود و به احتمال زیاد اگر دیده شود
بازنشانی بر روی یک GPU آویزان انجام می شود.
پس از تنظیم مجدد، توصیه می شود که سلامت GPU قبل از ادامه بررسی شود
استفاده کنید. ابزار nvidia-healthmon انتخاب خوبی برای این تست است. اگر GPU سالم نیست
بازنشانی کامل باید با چرخه برق گره ایجاد شود.
بازدید http://developer.nvidia.com/gpu-deployment-kit برای دانلود GDK و nvidia-
سلامتی
-ac، --applications-clocks=MEM_CLOCK,GRAPHICS_CLOCK
حداکثر را مشخص می کند ساعت ها به عنوان یک جفت (مثلا 2000,800) که GPU ها را تعریف می کند
سرعت در حین اجرای برنامه ها روی GPU فقط در دستگاه های تسلا از خانواده Kepler+.
نیاز به روت دارد مگر اینکه محدودیت ها با دستور -acp رفع شوند..
-راس، --بازنشانی-برنامه ها-ساعت
ساعت برنامه ها را به مقدار پیش فرض بازنشانی می کند. فقط در دستگاه های تسلا از Kepler+
خانواده. نیاز به روت دارد مگر اینکه محدودیت ها با دستور -acp رفع شوند.
-acp، --applications-clocks-permission=MODE
تغییر دهید که آیا ساعت برنامهها توسط همه کاربران قابل تغییر است یا فقط توسط روت. در دسترس
آرگومان ها 0|نامحدود، 1|محدود هستند. فقط در دستگاه های تسلا از Kepler+
خانواده. نیاز به روت دارد.
-pl، --power-limit=POWER_LIMIT
حداکثر حد توان را بر حسب وات مشخص می کند. اعداد صحیح و ممیز شناور را می پذیرد. فقط
در دستگاه های پشتیبانی شده از خانواده Kepler. به حقوق مدیر نیاز دارد. نیازهای ارزشی
همانطور که توسط nvidia-smi گزارش شده است، بین حداقل و حداکثر توان مجاز باشد.
-صبح، --accounting-mode=MODE
حسابداری GPU را فعال یا غیرفعال می کند. با حسابداری GPU می توان میزان استفاده از آن را پیگیری کرد
منابع در طول عمر یک فرآیند واحد فقط در دستگاه های پشتیبانی شده از Kepler
خانواده. به حقوق مدیر نیاز دارد. آرگومان های موجود 0|غیرفعال یا
1|فعال.
-کاآ، -پاک کردن برنامه های حساب شده
تمام فرآیندهای حساب شده تا کنون را پاک می کند. فقط در دستگاه های پشتیبانی شده از خانواده Kepler.
به حقوق مدیر نیاز دارد.
--auto-boost-default=MODE
سیاست تقویت خودکار پیشفرض را روی 0/DISABLED یا 1/ENABLED تنظیم کنید و فقط تغییر را اعمال کنید.
پس از خروج آخرین بوست کلاینت. فقط در دستگاههای خاص تسلا از Kepler+
خانواده. نیاز به روت دارد.
--auto-boost-default-force=MODE
سیاست تقویت خودکار پیشفرض را روی 0/DISABLED یا 1/ENABLED تنظیم کنید و تغییر را اعمال کنید.
بلافاصله. مستقیما. فقط در دستگاههای خاص تسلا از خانواده Kepler+. نیاز به روت دارد.
--auto-boost-permission=MODE
اجازه کنترل غیر ادمین/روت روی حالت تقویت خودکار. آرگومان های موجود هستند
0|بدون محدودیت، 1|محدود. فقط در دستگاههای خاص تسلا از خانواده Kepler+.
نیاز به روت دارد.
[به علاوه اختیاری]
-من، --id=ID
یک GPU مشخص شده را تغییر دهید. شناسه مشخص شده ممکن است شاخص 0 مبتنی بر GPU/Unit باشد
شمارش طبیعی ارائه شده توسط درایور، شماره سریال برد GPU، GPU
UUID یا شناسه گذرگاه PCI GPU (به عنوان domain:bus:device.function به صورت هگز). توصیه می شود
که کاربرانی که مایل به ثبات هستند، از زمان شمارش دستگاه، از شناسه اتوبوس UUID یا PCI استفاده می کنند
تضمین نمی شود که سفارش بین راه اندازی مجدد و شماره سریال برد هماهنگ باشد
بین چندین پردازنده گرافیکی روی یک برد به اشتراک گذاشته شود.
واحد تغییر OPTIONS
-t، --toggle-led=STATE
وضعیت نشانگر LED در جلو و پشت دستگاه را روی رنگ مشخص شده تنظیم کنید. دیدن
(واحد ویژگی های) بخش برای شرح حالات LED. رنگ های مجاز هستند
0|سبز و 1|کهربا. نیاز به روت دارد.
[به علاوه اختیاری]
-من، --id=ID
یک واحد مشخص شده را تغییر دهید. شناسه مشخص شده ایندکس مبتنی بر 0 واحد است
شمارش طبیعی توسط راننده برگردانده شده است.
SHOW DTD OPTIONS
--dtd
نمایش دستگاه یا واحد DTD.
[به علاوه اختیاری]
-f فایل، --filename=FILE
خروجی query را به جای stdout پیش فرض به فایل مشخص شده هدایت کنید. مشخص شده
فایل رونویسی خواهد شد
-u، --واحد
نمایش واحد DTD به جای دستگاه DTD.
آمار
نمایش اطلاعات آماری در مورد GPU. برای اطلاعات بیشتر از "nvidia-smi stats -h" استفاده کنید
اطلاعات فقط لینوکس
TOPO
نمایش اطلاعات توپولوژی در مورد سیستم برای اطلاعات بیشتر از "nvidia-smi topo -h" استفاده کنید
اطلاعات فقط لینوکس توجه: شمارش GPU همانند NVML است.
برگشت ارزش
کد بازگشت نشان می دهد که آیا عملیات موفقیت آمیز بوده یا شکست خورده است و دلیل آن چه بوده است
شکست.
· کد بازگشت 0 - موفقیت آمیز
· کد برگشتی 2 - آرگومان یا پرچم ارائه شده نامعتبر است
· کد بازگشت 3 - عملیات درخواستی در دستگاه مورد نظر در دسترس نیست
· کد برگشت 4 - کاربر فعلی اجازه دسترسی به این دستگاه را ندارد یا
این عملیات را انجام دهید
· کد بازگشت 6 - پرس و جو برای یافتن یک شی ناموفق بود
· کد برگشت 8 - کابل های برق خارجی دستگاه به درستی وصل نشده اند
· کد بازگشت 9 - درایور NVIDIA بارگذاری نشده است
· کد برگشت 10 - هسته NVIDIA یک مشکل وقفه در یک GPU را شناسایی کرد
· کد بازگشت 12 - کتابخانه مشترک NVML یافت نشد یا بارگیری شد
· کد بازگشت 13 - نسخه محلی NVML این تابع را اجرا نمی کند
· کد برگشت 14 - infoROM خراب است
· کد برگشتی 15 - GPU از اتوبوس افتاده یا در غیر این صورت تبدیل شده است
غیر قابل دسترس
· کد برگشت 255 - خطای دیگر یا خطای داخلی درایور رخ داده است
GPU ویژگی های
لیست زیر تمام داده های ممکن برگردانده شده توسط -q گزینه پرس و جو دستگاه
مگر اینکه خلاف آن ذکر شده باشد، همه نتایج عددی پایه 10 و بدون واحد هستند.
TIMESTAMP
مهر زمانی سیستم فعلی در زمانی که nvidia-smi فراخوانی شد. قالب "روز از هفته است
ماه روز HH:MM:SS سال".
راننده نسخه
نسخه درایور نمایشگر NVIDIA نصب شده. این یک رشته الفبایی است.
پیوست GPU ها
تعداد GPU های NVIDIA در سیستم.
محصول نام
نام رسمی محصول GPU. این یک رشته الفبایی است. برای تمامی محصولات
نمایش دادن حالت
پرچمی که نشان می دهد آیا یک صفحه نمایش فیزیکی (مثلاً مانیتور) در حال حاضر به آن متصل است یا خیر
هر یک از کانکتورهای GPU "Enabled" یک صفحه نمایش پیوست را نشان می دهد. "معلول"
خلاف آن را نشان می دهد.
نمایش دادن فعال
پرچمی که نشان میدهد آیا نمایشگر روی GPU مقداردهی اولیه شده است (مثلاً حافظه است
بر روی دستگاه برای نمایش اختصاص داده شده است). حتی زمانی که هیچ مانیتوری وجود ندارد، نمایشگر می تواند فعال باشد
از نظر فیزیکی متصل شده است. "فعال" یک صفحه نمایش فعال را نشان می دهد. "غیرفعال" نشان می دهد
در غیر این صورت.
اصرار حالت
پرچمی که نشان می دهد که آیا حالت ماندگاری برای GPU فعال است یا خیر. ارزش هر دو است
"فعال" یا "غیرفعال". هنگامی که حالت ماندگاری فعال است، درایور NVIDIA باقی می ماند
حتی زمانی که هیچ کلاینت فعالی مانند X11 یا nvidia-smi وجود ندارد، بارگیری می شود. این به حداقل می رساند
تأخیر بارگذاری درایور مرتبط با اجرای برنامههای وابسته، مانند برنامههای CUDA. برای
همه محصولات با قابلیت CUDA فقط لینوکس
حسابداری (Accounting) حالت
پرچمی که نشان میدهد آیا حالت حسابداری برای مقدار GPU فعال است یا خیر، زمانی است
حسابداری فعال است آمار برای هر فرآیند محاسباتی در حال اجرا بر روی محاسبه می شود
پردازنده گرافیکی پس از پایان فرآیند، آمار برای پرس و جو در دسترس است. مشاهده --help-query-
برنامه های حسابداری برای اطلاعات بیشتر
حسابداری (Accounting) حالت بافر اندازه
اندازه بافر دایرهای را برمیگرداند که فهرستی از فرآیندهای قابل پرس و جو را در خود نگه میدارد
برای آمار حسابداری این حداکثر تعداد فرآیندهایی است که اطلاعات حسابداری انجام می شود
قبل از اینکه اطلاعات مربوط به قدیمی ترین فرآیندها توسط آنها بازنویسی شود، ذخیره می شود
اطلاعات در مورد فرآیندهای جدید
راننده مدل
در ویندوز، مدلهای درایور TCC و WDDM پشتیبانی میشوند. مدل درایور قابل تغییر است
با (-dm) یا (-fdm) پرچم ها مدل درایور TCC برای محاسبه بهینه شده است
برنامه های کاربردی. زمان راه اندازی هسته اینترنت اکسپلورر با TCC سریعتر خواهد بود. مدل درایور WDDM
برای برنامه های گرافیکی طراحی شده است و برای برنامه های محاسباتی توصیه نمی شود.
لینوکس از چندین مدل درایور پشتیبانی نمی کند و همیشه مقدار "N/A" خواهد داشت.
جاری مدل راننده در حال حاضر استفاده می شود. همیشه در لینوکس "N/A" وجود دارد.
در انتظار مدل درایوری که در راه اندازی مجدد بعدی استفاده می شود. همیشه "N/A" روشن است
لینوکس است.
سریال شماره
این شماره با شماره سریال چاپ شده روی هر تابلو مطابقت دارد. جهانی است
ارزش الفبایی تغییرناپذیر منحصر به فرد
GPU UUID
این مقدار شناسه الفبایی و عددی تغییرناپذیر منحصر به فرد GPU در سراسر جهان است. این کار را انجام می دهد
با هیچ برچسب فیزیکی روی تابلو مطابقت ندارد.
صغیر شماره
عدد کوچک برای دستگاه به گونه ای است که فایل گره دستگاه Nvidia برای هر GPU خواهد بود
فرم /dev/nvidia [شماره کوچک] را داشته باشید. فقط در پلتفرم لینوکس موجود است.
VBIOS نسخه
بایوس برد GPU.
MultiGPU تخته
این که آیا این GPU بخشی از یک برد چند GPU است یا خیر.
تخته ID
شناسه منحصر به فرد برد که توسط راننده اختصاص داده شده است. اگر دو یا چند GPU شناسه برد یکسانی داشته باشند
و فیلد "MultiGPU" بالا درست است، سپس GPUها روی همان برد قرار دارند.
اطلاعات نسخه
شماره نسخه برای هر شیء در فضای ذخیره اطلاعات برد GPU. اینفورم یک است
ذخیره کوچک و دائمی اطلاعات پیکربندی و وضعیت برای GPU. نسخه همه اطلاعات
فیلدها عددی هستند دانستن این شمارههای نسخه به دلیل برخی از GPU میتواند مفید باشد
ویژگیها فقط با اطلاعات یک نسخه خاص یا بالاتر در دسترس هستند.
اگر هر یک از فیلدهای زیر خطای ناشناخته را برگرداند، بررسی تأیید صحت اطلاعات اضافی است
انجام شده و پیام هشدار مناسب نمایش داده می شود.
تصویر نسخه نسخه جهانی تصویر infoROM. نسخه تصویر درست مانند نسخه VBIOS
نسخه دقیق infoROM فلش شده روی برد را به طور منحصر به فرد توصیف می کند
برخلاف نسخه شیء infoROM که فقط نشانگر پشتیبانی است
ویژگی های.
OEM شیء نسخه برای داده های پیکربندی OEM.
ECC شیء نسخه برای داده های ضبط ECC.
قدرت شیء نسخه برای داده های مدیریت انرژی.
GPU عمل حالت
GOM با غیرفعال کردن ویژگی های GPU امکان کاهش مصرف انرژی و بهینه سازی توان پردازش گرافیکی را فراهم می کند.
هر GOM برای برآوردن نیازهای کاربر خاص طراحی شده است.
در حالت "همه روشن" همه چیز فعال است و با سرعت کامل اجرا می شود.
حالت "Compute" فقط برای اجرای وظایف محاسباتی طراحی شده است. عملیات گرافیکی نیست
مجاز.
حالت "Low Double Precision" برای اجرای برنامه های گرافیکی طراحی شده است که این کار را نمی کنند
نیاز به پهنای باند بالا دقت مضاعف.
GOM را می توان با (-- گوم) پرچم.
پشتیبانی از محصولات GK110 M-class و X-class Tesla از خانواده Kepler. نه
در محصولات Quadro و Tesla C-class پشتیبانی می شود.
جاری GOM در حال حاضر در حال استفاده است.
در انتظار GOM که در راه اندازی مجدد بعدی استفاده خواهد شد.
PCI
اطلاعات اولیه PCI برای دستگاه. برخی از این اطلاعات ممکن است هر زمان که کارت ها تغییر کنند
اضافه/حذف/انتقال در یک سیستم. برای تمامی محصولات
اتوبوس شماره باس PCI، به صورت هگز
دستگاه شماره دستگاه PCI، به صورت هگز
دامنه شماره دامنه PCI، به صورت هگز
دستگاه Id شناسه دستگاه فروشنده PCI، به صورت هگز
زیر سیستم Id شناسه سیستم فرعی PCI، به صورت هگز
اتوبوس Id شناسه گذرگاه PCI به صورت "domain:bus:device.function" به صورت هگز
GPU ارتباط دادن اطلاعات
تولید پیوند PCIe و عرض گذرگاه
جاری نسل و عرض پیوند فعلی. این ممکن است زمانی که GPU کاهش می یابد
استفاده نمی شود
بیشترین حداکثر تولید لینک و عرض ممکن با این GPU و سیستم
پیکربندی برای مثال، اگر GPU از نسل بالاتر PCIe پشتیبانی کند
پس از آن که سیستم از آن پشتیبانی می کند، تولید PCIe سیستم را گزارش می دهد.
پل تراشه
اطلاعات مربوط به Bridge Chip روی دستگاه. سیستم عامل تراشه پل فقط موجود است
روی بردهای خاص و ممکن است برای برخی از بردهای چندGPU جدیدتر "N/A" نمایش داده شود.
نوع نوع تراشه پل. در صورت عدم وجود، به عنوان N/A گزارش شده است.
سفت افزار نسخه
نسخه سیستم عامل تراشه بریج. در صورت عدم وجود، به عنوان N/A گزارش شده است.
پنکه سرعت
مقدار سرعت فن، درصد حداکثر سرعتی است که فن دستگاه در حال حاضر دارد
در نظر گرفته شده برای اجرا در. از 0 تا 100 درصد متغیر است. توجه: سرعت گزارش شده در نظر گرفته شده است
سرعت فن. اگر فن از نظر فیزیکی مسدود شده باشد و نتواند بچرخد، این خروجی نخواهد بود
مطابق با سرعت واقعی فن بسیاری از قطعات سرعت فن را گزارش نمی کنند زیرا به آن تکیه می کنند
خنک سازی از طریق فن در محفظه اطراف. برای همه محصولات مجزا با اختصاصی
طرفداران.
عملکرد دولت
وضعیت عملکرد فعلی برای GPU. وضعیت ها از P0 (حداکثر عملکرد) تا
P12 (حداقل عملکرد).
ساعت دریچه گاز دلایل
اطلاعاتی در مورد عواملی که فرکانس ساعت ها را کاهش می دهند بازیابی می کند. فقط در
از دستگاه های تسلا از خانواده کپلر پشتیبانی می کند.
اگر همه دلایل دریچه گاز به عنوان "Not Active" برگردانده شوند، به این معنی است که ساعت ها به عنوان کار می کنند
بالاترین حد ممکن
آرام هیچ چیز روی GPU اجرا نمی شود و ساعت ها به حالت Idle می روند.
این محدود کننده ممکن است در نسخه بعدی حذف شود.
کاربرد ساعت محیط
ساعتهای GPU با تنظیمات ساعت برنامهها محدود میشوند. به عنوان مثال قابل تغییر است
با استفاده از nvidia-smi --applications-clocks=
SW قدرت کلاه الگوریتم SW Power Scaling ساعتهای زیر ساعتهای درخواستی را کاهش میدهد
زیرا GPU انرژی زیادی مصرف می کند. به عنوان مثال SW قدرت محدودیت کلاهک می تواند
با nvidia-smi --power-limit= تغییر دهید
HW کاهش سرعت HW Slowdown (کاهش ساعت هسته با ضریب 2 یا بیشتر) درگیر است.
این یک شاخص است از:
*دما خیلی بالاست
* اصرار ترمز قدرت خارجی (به عنوان مثال با قدرت سیستم) فعال می شود
عرضه)
* مصرف برق خیلی زیاد است و حفاظت از ماشه سریع ساعت ها را کاهش می دهد
ناشناخته یکی دیگر از عوامل نامشخص کاهش ساعت است.
FB حافظه استفاده
اطلاعات حافظه بافر فریم روی برد. کل حافظه گزارش شده تحت تأثیر وضعیت ECC قرار می گیرد.
اگر ECC فعال باشد، کل حافظه موجود چند درصد کاهش می یابد، به دلیل این
بیت های برابری لازم درایور همچنین ممکن است مقدار کمی از حافظه داخلی را رزرو کند
استفاده کنید، حتی بدون کار فعال روی GPU. برای تمامی محصولات
جمع حجم کل حافظه FB
استفاده می شود اندازه استفاده شده از حافظه FB.
رایگان اندازه موجود حافظه FB.
BAR1 حافظه استفاده
BAR1 برای نقشه برداری از FB (حافظه دستگاه) استفاده می شود تا بتواند مستقیماً توسط CPU به آن دسترسی داشته باشد
یا توسط دستگاه های شخص ثالث (نظیر به نظیر در گذرگاه PCIe).
جمع اندازه کل حافظه BAR1.
استفاده می شود اندازه استفاده شده از حافظه BAR1.
رایگان اندازه موجود حافظه BAR1.
محاسبه حالت
پرچم حالت محاسباتی نشان می دهد که آیا برنامه های محاسباتی منفرد یا چندگانه ممکن است
روی GPU اجرا شود
"پیشفرض" به این معنی است که چندین زمینه در هر دستگاه مجاز است.
"رشته انحصاری" به این معنی است که فقط یک زمینه در هر دستگاه مجاز است، قابل استفاده از یک رشته در
زمان.
"فرآیند انحصاری" به این معنی است که فقط یک زمینه در هر دستگاه مجاز است که از چندین مورد قابل استفاده است
رشته ها در یک زمان
"ممنوع" به این معنی است که هیچ زمینه ای برای هر دستگاه مجاز نیست (بدون برنامه محاسباتی).
"EXCLUSIVE_PROCESS" در CUDA 4.0 اضافه شد. نسخههای قبلی CUDA فقط یکی را پشتیبانی میکرد
حالت انحصاری، که معادل "EXCLUSIVE_THREAD" در CUDA 4.0 و بالاتر است.
برای همه محصولات دارای CUDA.
بهره برداری
نرخهای استفاده گزارش میدهند که هر GPU در طول زمان چقدر مشغول است و میتواند برای تعیین نحوه استفاده از آن استفاده شود
بسیاری از برنامه ها از GPU در سیستم استفاده می کنند.
توجه: در هنگام راه اندازی اولیه درایور هنگامی که ECC فعال است، می توانید GPU و حافظه بالایی را مشاهده کنید
قرائت های استفاده این به دلیل مکانیسم Scrubbing حافظه ECC است که انجام می شود
در طول اولیه سازی درایور
GPU درصد زمان در دوره نمونه گذشته که طی آن یک یا چند
کرنل روی پردازنده گرافیکی در حال اجرا بود. دوره نمونه ممکن است بین 1 باشد
دوم و 1/6 ثانیه بسته به محصول.
حافظه درصد زمان در دوره نمونه گذشته که طی آن جهانی (دستگاه)
حافظه خوانده یا نوشته می شد. دوره نمونه ممکن است بین 1 باشد
دوم و 1/6 ثانیه بسته به محصول.
Ecc حالت
پرچمی که نشان می دهد پشتیبانی ECC فعال است یا خیر. ممکن است "فعال" یا
"معلول". تغییر در حالت ECC نیاز به راه اندازی مجدد دارد. به نسخه شی Inforom ECC نیاز دارد
1.0 یا بالاتر
جاری حالت ECC که GPU در حال حاضر تحت آن کار می کند.
در انتظار حالت ECC که GPU پس از راهاندازی مجدد بعدی تحت آن کار میکند.
ECC خطاهای
پردازندههای گرافیکی NVIDIA میتوانند تعداد خطاها را برای انواع مختلف خطاهای ECC ارائه دهند. برخی از خطاهای ECC هستند
تک بیت یا دو بیت، که در آن خطاهای تک بیت تصحیح می شوند و خطاهای دو بیتی
غیر قابل اصلاح هستند خطاهای حافظه بافت ممکن است از طریق ارسال مجدد قابل اصلاح یا غیر قابل اصلاح باشند
اگر ارسال مجدد ناموفق باشد. این خطاها در دو مقیاس زمانی (فرار و
تجمیع). خطاهای ECC تک بیتی به طور خودکار توسط HW تصحیح می شوند و به نتیجه نمی رسند
در فساد داده ها خطاهای دو بیتی شناسایی می شوند اما اصلاح نمی شوند. لطفا ECC را ببینید
اسنادی در وب برای اطلاعات در مورد رفتار برنامه کاربردی زمانی که دو بیتی هستند
خطاها رخ می دهد شمارشگرهای خطای فرار تعداد خطاهای شناسایی شده از آخرین خطا را ردیابی می کنند
بار راننده تعداد کل خطاها به طور نامحدود ادامه می یابد و بنابراین به عنوان یک عمر عمل می کند
پیشخوان.
نکته ای در مورد تعداد فرار: در ویندوز این یک بار در هر بوت است. در لینوکس این می تواند بیشتر باشد
زود زود. در لینوکس، زمانی که هیچ کلاینت فعالی وجود نداشته باشد، درایور بارگیری می شود. از این رو، اگر
حالت تداوم فعال است یا همیشه یک سرویس گیرنده درایور فعال است (مثلا X11).
لینوکس همچنین رفتار هر بوت را می بیند. در غیر این صورت، هر بار که محاسبه میشود، شمارشهای فرار بازنشانی میشوند
برنامه اجرا می شود
محصولات تسلا و کوادرو از خانواده فرمی و کپلر می توانند خطای کل ECC را نشان دهند
شمارش، و همچنین تفکیک خطاها بر اساس مکان روی تراشه. مکان ها هستند
در زیر شرح داده شده است. دادههای مبتنی بر مکان برای تعداد کل خطاها به Inforom ECC نیاز دارند
شی نسخه 2.0. همه شمارشهای دیگر ECC به شی ECC نسخه 1.0 نیاز دارند.
دستگاه حافظه خطاهای شناسایی شده در حافظه جهانی دستگاه.
ثبت نام پرونده خطاهای شناسایی شده در حافظه فایل رجیستر.
L1 مخزن خطاهای شناسایی شده در حافظه پنهان L1.
L2 مخزن خطاهای شناسایی شده در حافظه پنهان L2.
بافت حافظه خطاهای برابری در حافظه بافت شناسایی شده است.
جمع کل خطاهای شناسایی شده در کل تراشه. مجموع دستگاه حافظه, ثبت نام
پرونده, L1 مخزن, L2 مخزن و بافت حافظه.
صفحه بازنشستگی
پردازندههای گرافیکی NVIDIA میتوانند صفحات حافظه دستگاه GPU را زمانی که غیرقابل اعتماد شوند، بازنشسته کنند. این می تواند
زمانی اتفاق می افتد که چندین خطای ECC تک بیتی برای یک صفحه یا در یک ECC دو بیتی رخ دهد
خطا هنگامی که صفحه ای بازنشسته می شود، درایور NVIDIA آن را به گونه ای مخفی می کند که هیچ درایوری وجود نداشته باشد، یا
تخصیص حافظه برنامه می تواند به آن دسترسی داشته باشد.
دوبار بیت ECC تعداد صفحات حافظه دستگاه GPU که به دلیل الف بازنشسته شده اند
خطای ECC دو بیتی
تنها بیت ECC تعداد صفحات حافظه دستگاه GPU که به دلیل بازنشستگی
چندین خطای ECC تک بیتی
در انتظار بررسی می کند که آیا صفحات حافظه دستگاه GPU در راه اندازی مجدد بعدی در انتظار بازنشستگی هستند یا خیر.
صفحاتی که در انتظار بازنشستگی هستند هنوز هم قابل تخصیص هستند و ممکن است باعث ایجاد بیشتر شوند
مسائل مربوط به قابلیت اطمینان
درجه حرارت
خوانش سنسورهای دما روی برد. همه قرائت ها در درجه C هستند. نه همه
محصولات از همه انواع خواندن پشتیبانی می کنند. به ویژه، محصولات در ماژول عواملی را تشکیل می دهند که
تکیه بر فن های کیس یا خنک کننده غیرفعال معمولاً خوانش دما را ارائه نمی دهد. دیدن
در زیر برای محدودیت
GPU دمای هسته پردازنده گرافیکی برای همه محصولات گسسته و کلاس S.
قدرت خوانش
خوانش قدرت به روشن کردن میزان مصرف برق فعلی GPU و عوامل کمک می کند
که بر آن استفاده تأثیر می گذارد. هنگامی که مدیریت انرژی فعال است، GPU مصرف انرژی را محدود می کند
بارگذاری کنید تا با دستکاری عملکرد فعلی در یک پوشش توان از پیش تعریف شده قرار گیرد
دولت. برای محدودیت در دسترس بودن به زیر مراجعه کنید.
قدرت دولت Power State منسوخ شده و به Performance State in تغییر نام داده است
2.285. برای حفظ سازگاری XML، در قالب XML وضعیت عملکرد است
در هر دو مکان ذکر شده است.
قدرت مدیریت
پرچمی که نشان می دهد آیا مدیریت انرژی فعال است یا خیر. هر دو
"پشتیبانی شده" یا "N/A". به شیء Inforom PWR نسخه 3.0 یا بالاتر یا بالاتر نیاز دارد
دستگاه کپلر.
قدرت قرعه کشی آخرین مصرف انرژی اندازه گیری شده برای کل برد، بر حسب وات. فقط
در صورت پشتیبانی از مدیریت انرژی موجود است. این خواندن دقیق است
در +/- 5 وات. به شیء Inforom PWR نسخه 3.0 یا بالاتر یا بالاتر نیاز دارد
دستگاه کپلر.
قدرت محدود کردن محدودیت توان نرم افزار، بر حسب وات. توسط نرم افزارهایی مانند nvidia-smi تنظیم شده است.
فقط در صورتی در دسترس است که مدیریت انرژی پشتیبانی شود. به اطلاعات PWR نیاز دارد
شی نسخه 3.0 یا بالاتر یا دستگاه کپلر. در دستگاه های Kepler Power
حد را می توان با استفاده از کلیدهای -pl،--power-limit= تنظیم کرد.
اجرا قدرت محدود کردن
سقف توان الگوریتم مدیریت توان، بر حسب وات. کل تخته
جذب نیرو توسط الگوریتم مدیریت توان به گونه ای دستکاری می شود که
زیر این مقدار باقی می ماند این حد حداقل حدهای مختلف از این قبیل است
به عنوان محدودیت نرم افزار ذکر شده در بالا. فقط در صورت وجود مدیریت انرژی در دسترس است
پشتیبانی. به دستگاه کپلر نیاز دارد.
به طور پیش فرض قدرت محدود کردن
سقف توان الگوریتم مدیریت توان پیشفرض، بر حسب وات. قدرت
پس از بارگیری درایور، محدودیت به حد پیشفرض قدرت برمیگردد. فقط در
دستگاه های پشتیبانی شده از خانواده Kepler.
دقیقه قدرت محدود کردن
حداقل مقدار بر حسب وات که محدودیت توان را می توان روی آن تنظیم کرد. فقط در
دستگاه های پشتیبانی شده از خانواده Kepler.
حداکثر قدرت محدود کردن
حداکثر مقدار بر حسب وات که محدودیت توان را می توان روی آن تنظیم کرد. فقط در
دستگاه های پشتیبانی شده از خانواده Kepler.
ساعت
فرکانس فعلی که در آن بخش هایی از GPU در حال اجرا است. تمام قرائت ها بر حسب مگاهرتز هستند.
گرافیک فرکانس فعلی ساعت گرافیکی (شیدر).
SM فرکانس فعلی ساعت SM (چند پردازنده جریانی).
حافظه فرکانس فعلی ساعت حافظه
اپلیکیشنها ساعت
فرکانس مشخص شده توسط کاربر که برنامه ها در آن اجرا می شوند. قابل تغییر با
[-ac | --applications-clocks] سوئیچ.
گرافیک فرکانس ساعت گرافیکی (سایه زن) مشخص شده توسط کاربر.
حافظه فرکانس ساعت حافظه مشخص شده توسط کاربر
به طور پیش فرض اپلیکیشنها ساعت
فرکانس پیشفرض که برنامهها در آن اجرا میشوند. ساعت های کاربردی می تواند باشد
با [-ac | تغییر کرد --applications-clocks] سوئیچ. ساعت های برنامه را می توان روی آن تنظیم کرد
پیش فرض با استفاده از [-rac | --بازنشانی-اپلیکیشن-ساعت] سوئیچ ها.
گرافیک فرکانس پیش فرض برنامه های کاربردی ساعت گرافیکی (سایه زن).
حافظه فرکانس پیش فرض ساعت حافظه برنامه ها.
حداکثر ساعت
حداکثر فرکانسی که بخشهایی از GPU برای اجرا طراحی شدهاند. تمام قرائت ها بر حسب مگاهرتز هستند.
در پردازندههای گرافیکی خانواده فرمی، ساعتهای فعلی P0 (گزارششده در بخش ساعتها) میتوانند با
حداکثر ساعت چند مگاهرتز
گرافیک حداکثر فرکانس ساعت گرافیکی (شیدر).
SM حداکثر فرکانس ساعت SM (چند پردازنده جریانی).
حافظه حداکثر فرکانس ساعت حافظه
ساعت سیاست
تنظیمات مشخص شده توسط کاربر برای تغییرات ساعت خودکار مانند تقویت خودکار.
خودکار بالا بردن نشان می دهد که آیا حالت تقویت خودکار در حال حاضر برای این GPU (روشن) فعال است یا خیر
برای این پردازنده گرافیکی غیرفعال است (خاموش). در صورت عدم پشتیبانی از تقویت (N/A) نمایش داده می شود. خودکار
بوست به کلاک GPU پویا بر اساس توان، حرارت و استفاده امکان پذیر میشود.
هنگامی که تقویت خودکار غیرفعال است، پردازنده گرافیکی سعی می کند ساعت را در حالت ثابت نگه دارد
دقیقاً تنظیمات ساعتهای برنامه فعلی (هر زمان که زمینه CUDA باشد
فعال است). با فعال کردن بوست خودکار، GPU همچنان تلاش میکند حفظ کند
این طبقه، اما به طور فرصت طلبانه به ساعت های بالاتر در هنگام برق رسانی،
حرارتی و استفاده از فضای سر اجازه می دهد. این تنظیم برای زندگی ادامه دارد
از زمینه CUDA که برای آن درخواست شده است. برنامه ها می توانند درخواست a
حالت خاص یا از طریق تماس NVML (به NVML SDK مراجعه کنید) یا با تنظیم
متغیر محیطی CUDA CUDA_AUTO_BOOST.
خودکار بالا بردن به طور پیش فرض
تنظیم پیشفرض برای حالت تقویت خودکار، فعال (روشن) یا فعال را نشان میدهد
غیر فعال (خاموش). در صورت عدم پشتیبانی از تقویت (N/A) نمایش داده می شود. برنامه ها در
حالت پیش فرض اگر آنها به صراحت حالت خاصی را درخواست نکرده باشند.
پشتیبانی ساعتها
لیستی از ترکیبات حافظه و ساعت های گرافیکی ممکن که GPU می تواند روی آنها کار کند (نه
با در نظر گرفتن ساعت های کاهش یافته ترمز HW). اینها تنها ترکیبات ساعتی هستند که
را می توان به پرچم --applications-clocks منتقل کرد. ساعتهای پشتیبانیشده فقط زمانی فهرست میشوند که -q -d باشد
سوئیچ SUPPORTED_CLOCKS یا در قالب XML ارائه شده است.
محاسبه فرآیندهای
فهرستی از فرآیندهایی که زمینه محاسباتی روی دستگاه دارند.
هر ورودی با فرمت است " . "
استفاده می شود GPU حافظه
مقدار حافظه استفاده شده در دستگاه توسط زمینه. در ویندوز موجود نیست
هنگام اجرا در حالت WDDM زیرا Windows KMD تمام حافظه را مدیریت نمی کند
درایور NVIDIA.
آمار (تجربی)
فهرست آمارهای GPU مانند نمونه های قدرت، نمونه های استفاده، رویدادهای xid، تغییر ساعت
رویدادها و شمارنده های تخلف
بر روی محصولات مبتنی بر Tesla، GRID و Quadro تحت لینوکس پشتیبانی می شود.
محدود به Kepler یا GPUهای جدیدتر.
آمار را در قالب CSV به صورت زیر نمایش می دهد:
، ، ،
معیارهای نمایش با واحدهای آنها به شرح زیر است:
نمونه های قدرت بر حسب وات
نمونه های استفاده از GPU، حافظه، رمزگذار و رمزگشا به درصد.
رویدادهای خطای Xid با کد خطای Xid گزارش شده است. کد خطا برای xid ناشناخته 999 است
خطا.
ساعت پردازنده و حافظه بر حسب مگاهرتز تغییر می کند.
نقض به دلیل درپوش قدرت با زمان نقض در ns. (فقط تسلا)
تخلف ناشی از پوشش حرارتی با پرچم بولی نقض (1/0). (فقط تسلا)
یادداشت:
هر آماری که قبل از "#" باشد یک نظر است.
دستگاه پشتیبانی نشده به عنوان "# نمایش داده می شود ، دستگاه پشتیبانی نمی شود".
اندازه گیری پشتیبانی نشده به صورت " نمایش داده می شود ، , N/A, N/A”.
نقض ناشی از حرارت/برق فقط برای محصولات مبتنی بر تسلا پشتیبانی میشود. تخلفات حرارتی
محدود به تسلا K20 و بالاتر هستند.
توپولوژی (تجربی)
اطلاعات توپولوژی مربوط به GPUهای سیستم، نحوه اتصال آنها به یکدیگر را نیز فهرست کنید
به عنوان NIC های واجد شرایط که قادر به RDMA هستند
ماتریسی از GPUهای موجود را با شرح زیر نمایش می دهد:
شرح:
X = خود
SOC = مسیر از یک پیوند در سطح سوکت (مثلا QPI) عبور می کند.
PHB = مسیر از پل میزبان PCIe عبور می کند
PXB = مسیر چندین سوئیچ داخلی PCIe را طی می کند
PIX = مسیر از یک سوئیچ داخلی PCIe عبور می کند
واحد ویژگی های
لیست زیر تمام داده های ممکن برگردانده شده توسط -q -u گزینه پرس و جو واحد
مگر اینکه خلاف آن ذکر شده باشد، همه نتایج عددی پایه 10 و بدون واحد هستند.
TIMESTAMP
مهر زمانی سیستم فعلی در زمانی که nvidia-smi فراخوانی شد. قالب "روز از هفته است
ماه روز HH:MM:SS سال".
راننده نسخه
نسخه درایور نمایشگر NVIDIA نصب شده. فرمت است
«عداد-عدد.فرع-عدد».
این اطلاعات
اطلاعات مربوط به هر کارت رابط میزبان (HIC) که در سیستم نصب شده است.
سفت افزار نسخه
نسخه سیستم عامل در حال اجرا بر روی HIC.
پیوست واحد
تعداد واحدهای پیوست شده در سیستم.
محصول نام
نام رسمی محصول واحد. این یک مقدار الفبایی است. برای همه کلاس S
محصولات می باشد.
محصول Id
شناسه محصول برای واحد. این مقدار حروف عددی فرم است
"part1-part2-part3". برای تمام محصولات کلاس S.
محصول سریال
شناسه منحصر به فرد جهانی غیرقابل تغییر برای واحد. این یک مقدار الفبایی است.
برای تمام محصولات کلاس S.
سفت افزار نسخه
نسخه سفتافزاری که روی دستگاه اجرا میشود. قالب "Major-Number.Minor-Number" است.
برای تمام محصولات کلاس S.
رهبری دولت
نشانگر LED برای نشان دادن سیستم هایی با مشکلات احتمالی استفاده می شود. رنگ ال ای دی کهربایی
مسئله ای را نشان می دهد برای تمام محصولات کلاس S.
رنگ رنگ نشانگر LED. یا "سبز" یا "کهربا".
علت دلیل رنگ فعلی LED. علت ممکن است به عنوان هر یک ذکر شود
ترکیبی از "ناشناخته"، "تنظیم به AMBER توسط سیستم میزبان"، "حسگر حرارتی
خرابی، "شکست فن" و "دما از حد بحرانی فراتر رفت".
درجه حرارت
خوانش دما برای اجزای مهم واحد. همه قرائت ها بر حسب درجه سانتیگراد هستند.
ممکن است همه خواندن در دسترس نباشد. برای تمام محصولات کلاس S.
مصرف دمای هوا در ورودی واحد.
اگزوز دمای هوا در نقطه خروجی واحد
تخته دمای هوا در سراسر صفحه واحد.
PSU
قرائت برای منبع تغذیه واحد. برای تمام محصولات کلاس S.
دولت وضعیت عملکرد PSU. حالت منبع تغذیه می تواند هر یک از
موارد زیر: "عادی"، "غیر طبیعی"، "ولتاژ بالا"، "عملکرد فن"، "هیت سینک"
دما، "محدودیت جریان"، "ولتاژ زیر آستانه هشدار UV"،
"ولتاژ پایین"، "فرمان خاموش کردن از راه دور I2C"، "ورودی MOD_DISABLE" یا "پین کوتاه"
انتقال".
ولتاژ تنظیم ولتاژ PSU، بر حسب ولت.
جاری کشش جریان PSU، بر حسب آمپر.
پنکه اطلاعات
قرائت فن برای واحد. برای هر طرفدار قرائتی ارائه می شود که می تواند وجود داشته باشد
زیاد. برای تمام محصولات کلاس S.
دولت وضعیت فن، یا "NORMAL" یا "FAILED".
سرعت برای یک فن سالم، سرعت فن در RPM است.
پیوست GPU ها
فهرستی از شناسه های گذرگاه PCI که مربوط به هر یک از GPU های متصل به واحد است. اتوبوس
شناسه ها به شکل "domain:bus:device.function" به صورت هگز هستند. برای تمام محصولات کلاس S.
NOTES
در لینوکس، فایل های دستگاه NVIDIA ممکن است توسط nvidia-smi اصلاح شوند، اگر به صورت روت اجرا شوند. لطفا ببینید
بخش مربوطه از فایل README درایور.
La -a و -g در حال حاضر استدلال به نفع منسوخ شده است -q و -i، به ترتیب. با این حال،
استدلال های قدیمی هنوز برای این نسخه کار می کنند.
مثال ها
nvidia-smi -q
صفات را برای همه GPUها یک بار جستجو کنید و به صورت متنی ساده در stdout نمایش دهید.
nvidia-smi --format=csv,noheader --query-gpu=uuid,persistence_mode
UUID و حالت ماندگاری همه پردازندههای گرافیکی در سیستم را جستجو کنید.
nvidia-smi -q -d ECC، POWER -i 0 -l 10 -f خارج کردن.ورود
پرس و جو خطاهای ECC و مصرف انرژی برای GPU 0 در فرکانس 10 ثانیه،
به طور نامحدود، و در فایل out.log ضبط کنید.
nvidia-smi -c 1 -i GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8
حالت محاسبه را برای GPU با UUID روی "EXCLUSIVE_THREAD" تنظیم کنید
"GPU-b2f5f1b745e3d23d-65a3a26d-097db358-7303e0b6-149642ff3d219f8587cde3a8".
nvidia-smi -q -u -x --dtd
صفات را برای همه واحدها یک بار جستجو کنید و در قالب XML با DTD تعبیه شده به نمایش داده شود
stdout.
nvidia-smi --dtd -u -f nvsmi_unit.dtd
واحد DTD را در nvsmi_unit.dtd بنویسید.
nvidia-smi -q -d SUPPORTED_CLOCKS
نمایش ساعت های پشتیبانی شده از تمام پردازنده های گرافیکی
nvidia-smi -i 0 --برنامه ها-ساعت 2500,745
ساعت برنامه ها را روی حافظه 2500 مگاهرتز و گرافیک 745 مگاهرتز تنظیم کنید.
EXCHANGE ورود کاربران
=== مسائل شناخته شده ===
* در لینوکس بازنشانی GPU نمیتواند زمانی که در انتظار تغییر GOM باشد فعال شود.
* در لینوکس، تنظیم مجدد GPU ممکن است با موفقیت حالت ECC معلق را تغییر ندهد. راه اندازی مجدد کامل ممکن است باشد
برای فعال کردن تغییر حالت مورد نیاز است.
* در حالت WDDM ویندوز، حافظه GPU در هنگام راه اندازی و سپس توسط ویندوز تخصیص می یابد
مدیریت مستقیم گزارش Nvidia-smi حافظه استفاده شده/آزاد از دید راننده، بنابراین در
در حالت WDDM نتایج ممکن است گمراه کننده باشند. احتمالاً در آینده این مشکل برطرف خواهد شد.
=== بین به روز رسانی nvidia-smi v331 و v340 تغییر می کند ===
* اضافه شدن گزارش اطلاعات آستانه دما.
* اضافه شدن گزارش اطلاعات برند (به عنوان مثال تسلا، کوادرو، و غیره)
* اضافه شدن گزارش حداکثر، حداقل و میانگین برای نمونه ها (قدرت، استفاده، تغییرات ساعت).
خط فرمان مثال: nvidia-smi -q -d power, utilization, clock
* اضافه شدن رابط آماری nvidia-smi برای جمع آوری آمارهایی مانند قدرت، استفاده،
تغییرات ساعت، رویدادهای xid و شمارندههای درپوش perf با مفهوم زمان متصل به هر یک
نمونه. مثال خط فرمان: آمار nvidia-smi
* اضافه شدن پشتیبانی برای گزارش دادن معیارهای جمعی در بیش از یک GPU. با کاما استفاده می شود
با گزینه "-i" جدا شده است. مثال: nvidia-smi -i 0,1,2
* اضافه شدن پشتیبانی برای نمایش رمزگذار GPU و استفاده از رمزگشا
* اضافه شدن رابط nvidia-smi topo برای نمایش ماتریس ارتباطی GPUDirect
(تجربی)
* اضافه شدن پشتیبانی برای نمایش شناسه برد GPU و اینکه آیا این برد چند GPU است یا خیر
* دلیل دریچه گاز تعریف شده توسط کاربر از خروجی XML حذف شد
=== بین به روز رسانی nvidia-smi v5.319 و v331 تغییر می کند ===
* اضافه شدن گزارش تعداد جزئی.
* اضافه شدن گزارش اندازه حافظه BAR1.
* اضافه شدن گزارش سیستم عامل تراشه پل.
=== تغییرات بین nvidia-smi v4.319 Production و v4.319 update ===
* سوئیچ جدید --applications-clocks-permission برای تغییر الزامات مجوز اضافه شد
برای تنظیم و تنظیم مجدد ساعت برنامه ها
=== تغییرات بین nvidia-smi v4.304 و v4.319 Production ===
* اضافه شدن گزارش وضعیت Display Active و اسناد به روز شده برای روشن شدن چگونگی آن
با حالت نمایش و حالت نمایش فعال متفاوت است
* برای ثبات در بردهای چند GPU، nvidia-smi -L همیشه UUID را به جای
شماره سریال
* اضافه شدن گزارش انتخابی قابل خواندن توسط ماشین. بخش SELECTIVE QUERY OPTIONs را ببینید
nvidia-smi -h
* اضافه شده نمایش داده شد برای اطلاعات بازنشستگی صفحه. به --help-query-retired-pages و -d مراجعه کنید
PAGE_RETIREMENT
* تغییر نام ساعت دریچه گاز دلیل تعیین شده توسط کاربر ساعت ها به برنامه ها تنظیمات ساعت
* در صورت خطا، کدهای بازگشتی مقادیر غیر صفر متمایز برای هر کلاس خطا دارند. رجوع به بازگشت شود
بخش VALUE
* nvidia-smi -i اکنون می تواند در صورت بروز مشکل، اطلاعات را از GPU سالم استعلام کند
GPU دیگر در سیستم
* همه پیامهایی که به مشکلی در GPU نشان میدهند که شناسه گذرگاه pci یک GPU خطاکار را چاپ میکنند
* پرچم جدید --loop-ms برای جستجوی اطلاعات با نرخ های بالاتر از یک بار در ثانیه (می تواند
تأثیر منفی بر عملکرد سیستم دارد)
* اضافه شده نمایش داده شد برای فرآیندهای حسابداری. به --help-query-accounted-apps و -d مراجعه کنید
حسابداری
* محدودیت قدرت اجباری را به خروجی پرس و جو اضافه کرد
=== تغییرات بین nvidia-smi v4.304 RC و v4.304 Production ===
* اضافه شدن گزارش حالت عملیات GPU (GOM)
* اضافه شدن سوئیچ --gom جدید برای تنظیم حالت عملیات GPU
=== بین nvidia-smi v3.295 و v4.304 RC تغییر می کند ===
* به دلیل بازخورد کاربر، خروجی غیرکلامی دوباره فرمت شد. اطلاعات معلق حذف شد
جدول.
* در صورت عدم موفقیت اولیه به دلیل دریافت نشدن ماژول هسته، پیام مفید را چاپ کنید
قطع می شود
* هنگامی که کتابخانه مشترک NVML در سیستم وجود ندارد مدیریت بهتر خطاها
* اضافه شدن سوئیچ جدید --applications-clocks
* اضافه شدن فیلتر جدید به سوئیچ -display. اجرا با -d SUPPORTED_CLOCKS به لیست ممکن است
ساعت روی یک GPU
* هنگام گزارش حافظه آزاد، آن را از مجموع گرد شده و حافظه استفاده شده محاسبه کنید
که ارزش ها جمع می شوند
* اضافه شدن گزارش محدودیت های مدیریت توان و محدودیت پیش فرض
* سوئیچ جدید -- power-limit اضافه شد
* اضافه شدن گزارش خطاهای ECC حافظه بافت
* اضافه شدن گزارش از دلایل دریچه گاز ساعت
=== بین nvidia-smi v2.285 و v3.295 تغییر می کند ===
* گزارش خطای واضح تر برای دستورات در حال اجرا (مانند تغییر حالت محاسباتی)
* هنگام اجرای دستورات روی چندین پردازنده گرافیکی همزمان، خطاهای N/A به عنوان هشدار تلقی می شوند.
* nvidia-smi -i اکنون از UUID نیز پشتیبانی می کند
* قالب UUID برای مطابقت با استاندارد UUID تغییر کرده و مقدار متفاوتی را گزارش خواهد کرد.
=== بین nvidia-smi v2.0 و v2.285 تغییر می کند ===
* گزارش نسخه VBIOS.
* اضافه شده -d/--پرچم نمایش برای فیلتر کردن بخش هایی از داده ها
* اضافه شدن گزارش PCI Sub System ID
* اسناد به روز شد تا نشان دهد ما از M2075 و C2075 پشتیبانی می کنیم
* نسخه سیستم عامل HIC HWBC را با سوئیچ -u گزارش کنید
* حداکثر (P0) ساعت ها را در کنار ساعت های فعلی گزارش کنید
* اضافه شدن پرچم --dtd برای چاپ دستگاه یا واحد DTD
* هنگامی که درایور NVIDIA در حال اجرا نیست، پیام اضافه شد
* اضافه شدن گزارش تولید پیوند PCIe (حداکثر و فعلی)، و عرض پیوند (حداکثر و
جاری).
* دریافت مدل درایور معلق روی غیر مدیر کار می کند
* اضافه شدن پشتیبانی برای اجرای nvidia-smi در حساب های Windows Guest
* اجرای nvidia-smi بدون دستور -q به جای خروجی نسخه غیرکلامی -q
کمک
* تجزیه آرگومان -l/--loop= ثابت شد (مقدار پیشفرض، 0، به مقدار بزرگ)
* فرمت pciBusId تغییر کرد (به XXXX:XX:XX.X - این تغییر در 280 قابل مشاهده بود)
* تجزیه دستور busId برای -i محدودتر است. شما می توانید 0:2:0.0 یا
0000:02:00 و تغییرات دیگر
* طرح نسخهسازی تغییر کرد تا شامل "نسخه درایور" نیز شود
* قالب XML همیشه با DTD مطابقت دارد، حتی زمانی که شرایط خطا رخ می دهد
* اضافه شدن پشتیبانی از رویدادهای ECC تک بیتی و دو بیتی و خطاهای XID (به طور پیش فرض فعال است
با پرچم -l غیرفعال برای پرچم -x)
* اضافه شدن پرچم های تنظیم مجدد دستگاه -r --gpu-reset
* اضافه شدن لیستی از فرآیندهای در حال اجرا محاسباتی
* تغییر نام وضعیت قدرت به وضعیت عملکرد. پشتیبانی منسوخ شده در خروجی XML وجود دارد
تنها.
* شماره نسخه DTD را به 2.0 به روز کرد تا با خروجی XML به روز شده مطابقت داشته باشد
با استفاده از خدمات onworks.net از alt-nvidia-340-smi به صورت آنلاین استفاده کنید