Это команда sdiag, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
sdiag - средство диагностики расписания для Slurm
СИНТАКСИС
сдиаг
ОПИСАНИЕ
sdiag показывает информацию, относящуюся к выполнению slurmctld: потоки, агенты, задания и
алгоритмы планирования. Цель состоит в том, чтобы получить данные из поведения slurmctld, помогающие
настроить параметры конфигурации или политики очередей. Основная причина - знать
Поведение Slurm в системах с высокой пропускной способностью.
Имеет два режима исполнения. Режим по умолчанию --все показывает несколько счетчиков и статистику
объяснено позже, и есть еще один вариант выполнения --сброс настроек для сброса этих значений.
По умолчанию значения сбрасываются в полночь по всемирному координированному времени.
Первый блок информации связан с глобальным выполнением slurmctld:
серверу нить считать
Количество текущих активных потоков slurmctld. Большое число означало бы высокое
события обработки загрузки, такие как отправка заданий, диспетчеризация заданий, завершение заданий,
и т.д. Если это часто близко к MAX_SERVER_THREADS, это может указывать на потенциальную
узкое место.
Агент очередь размер
Дизайн Slurm имеет в виду масштабируемость, и отправка сообщений на тысячи узлов является
нетривиальная задача. Механизм агента помогает контролировать обмен данными между
slurm daemons и контроллер изо всех сил. Если эти значения близки к
MAX_AGENT_CNT возможны задержки, влияющие на управление заданиями.
Джобс представленный
Количество заданий, отправленных с момента последнего сброса
Джобс и политические лидеры
Количество заданий, запущенных с момента последнего сброса. Это включает в себя засыпанные работы.
Джобс завершенный
Количество заданий, выполненных с момента последнего сброса.
Джобс отменен
Количество заданий, отмененных с момента последнего сброса.
Джобс не удалось
Количество заданий, не выполненных с момента последнего сброса.
Второй блок информации относится к основному алгоритму планирования на основе заданий.
приоритеты. Цикл планирования подразумевает получение блокировки job_write_lock, а затем попытку получить
ресурсы для незавершенных вакансий, начиная с самого приоритетного и заканчивая последующим
порядок. Как только задание не может получить ресурсы, цикл продолжается, но только для заданий.
запрос других разделов. Вакансии с зависимостями или ограничениями учетных записей являются
не обработано.
Фамилия цикл
Время в микросекундах для последнего цикла планирования.
Max цикл
Время в микросекундах для максимального цикла планирования с момента последнего сброса.
Всего циклы
Количество циклов планирования с момента последнего сброса. Планирование осуществляется периодически
и когда работа отправлена или работа завершена.
среднее цикл
Среднее количество циклов планирования с момента последнего сброса
среднее глубина цикл
Среднее значение глубины цикла. Глубина означает количество заданий, обработанных в цикле планирования.
циклы для минут
Счетчик расписания исполнений в минуту
Фамилия очередь
Длина очереди незавершенных заданий.
Третий блок информации относится к алгоритму планирования обратной засыпки. А
цикл планирования обратной засыпки подразумевает получение блокировок для заданий, узлов и объектов разделов
затем пытается получить ресурсы для незавершенных работ. Задания обрабатываются по приоритетам. Если
задание не может получить ресурсы, вычисляемые алгоритмом, тогда как задание может получить
будущее время начала работы. Затем выполняется следующая работа, и алгоритм пытается получить
ресурсы для этой работы, но избегая влияния на предыдущий те,, и снова вычисляет
время начала в будущем, если текущие ресурсы недоступны. Алгоритм обратной засыпки занимает
больше времени для обработки каждого нового задания, поскольку это не повлияет на более приоритетные задания. В
сам алгоритм принимает меры, чтобы избежать длительного цикла выполнения и принять все
замки слишком долго.
Всего засыпанный работе (поскольку последний трепать начало)
Количество работ, начатых за счет обратной засыпки с момента последнего запуска шлама.
Всего засыпанный работе (поскольку последний Статистика цикл начало)
Количество заданий, начатых благодаря обратной засыпке с момента последнего сброса статистики. К
по умолчанию эти значения сбрасываются в полночь по всемирному координированному времени.
Всего циклы
Количество циклов планирования с момента последнего сброса
Фамилия цикл когда
Время, когда произошел последний цикл выполнения, в формате "день недели Месяц МесяцДень".
час: минута.секунды год "
Фамилия цикл
Время последнего цикла засыпки в микросекундах. Считает только время выполнения
удаление времени сна внутри цикла планирования, когда он занимает слишком много времени. Примечание
что блокировки снимаются во время сна, чтобы можно было продолжить работу.
Max цикл
Время в микросекундах выполнения максимального цикла засыпки с момента последнего сброса. Это
считает только время выполнения, удаляя время сна внутри цикла планирования, когда он
занимает слишком много времени. Обратите внимание, что блокировки снимаются во время сна, так что
другая работа может продолжаться.
среднее цикл
Среднее количество циклов планирования обратной засыпки в микросекундах с момента последнего сброса
Фамилия глубина цикл
Количество обработанных заданий за последний цикл планирования обратной засыпки. Считает каждый
процесс, даже если у него нет возможности выполнить из-за зависимостей или ограничений.
Фамилия глубина цикл (пытаться график)
Количество обработанных заданий за последний цикл планирования обратной засыпки. Это имеет значение только
процессы с возможностью запуска в ожидании доступных ресурсов. Эти вакансии
что усложняет алгоритм засыпки.
глубина среднее
Среднее количество обработанных заданий во время циклов планирования обратной засыпки с момента последнего сброса.
глубина среднее (пытаться график)
Среднее количество обработанных заданий во время циклов планирования обратной засыпки с момента последнего сброса. Это
подсчитывает только те процессы, которые могут быть запущены в ожидании доступных ресурсов. Эти
рабочих мест, что усложняет алгоритм обратной засыпки.
Фамилия очередь
Количество заданий, ожидающих обработки алгоритмом обратной засыпки. Работа отображается как
столько раз, сколько требовалось разделов.
Очередь среднее
Среднее количество заданий, ожидающих обработки алгоритмом обратной засыпки.
Четвертый и пятый блоки информации сообщают о наиболее часто выпускаемых удаленных
вызовы процедур (RPC), вызовы демона Slurmctld для выполнения какого-либо действия. В
четвертый блок сообщает о выданных RPC по типу сообщения. Вам нужно будет найти эти RPC
коды в исходном коде Slurm, найдя их в файле
src / common / slurm_protocol_defs.h. В отчете указывается, сколько раз каждый RPC
вызвано, общее время, затраченное всеми этими RPC, плюс среднее время, затраченное на
каждый RPC в микросекундах. Пятый блок сообщает RPC, выданные по идентификатору пользователя, общее
количество выпущенных RPC, общее время, затраченное на все эти RPC, плюс
среднее время, затрачиваемое каждым RPC в микросекундах.
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
-a, --все
Получать и сообщать информацию. Это режим работы по умолчанию.
-h, --Помогите
Распечатать описание опций и выйти.
-i, --сортировать по идентификатору
Сортировка данных удаленного вызова процедур (RPC) по идентификатору типа сообщения и идентификатору пользователя.
-r, --сброс настроек
Сбросить счетчики. Поддерживается только операторами и администраторами Slurm.
-t, --сортировать по времени
Сортировка данных удаленного вызова процедур (RPC) по общему времени выполнения.
-T, --сортировать по времени2
Сортировка данных удаленного вызова процедур (RPC) по среднему времени выполнения.
--использование
Распечатать список опций и выйти.
-V, --версия
Вывести номер текущей версии и выйти.
ОКРУЖАЮЩАЯ СРЕДА ПЕРЕМЕННЫЕ
Некоторые сдиаг параметры могут быть установлены через переменные среды. Эти переменные среды,
вместе с соответствующими параметрами перечислены ниже. (Примечание: параметры командной строки будут
всегда отменять эти настройки)
SLURM_CONF Расположение файла конфигурации Slurm.
КОПИРОВАНИЕ
Copyright (C) 2010-2011 Барселонский суперкомпьютерный центр.
Copyright (C) 2010-2014 ООО «ЩедМД».
Slurm - бесплатное программное обеспечение; вы можете распространять и / или изменять его в соответствии с условиями
Стандартная общественная лицензия GNU, опубликованная Free Software Foundation; либо версия 2
Лицензии или (по вашему выбору) любой более поздней версии.
Slurm распространяется в надежде, что он будет полезен, но БЕЗ КАКИХ-ЛИБО ГАРАНТИЙ; без
даже подразумеваемая гарантия ТОВАРНОЙ ЦЕННОСТИ или ПРИГОДНОСТИ ДЛЯ КОНКРЕТНОЙ ЦЕЛИ. Увидеть
GNU General Public License для более подробной информации.
Используйте sdiag в Интернете с помощью сервисов onworks.net