Amazon Best VPN GoSearch

OnWorks 网站图标

strigger - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 srigger

这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令触发器,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


strigger - 使用设置、获取或清除 Slurm 触发信息。

概要


强者 - 放 [配置...]
强者 - 得到 [配置...]
强者 - 清除 [配置...]

商品描述


强者 用于设置、获取或清除 Slurm 触发信息。 触发器包括事件
例如节点失败、作业达到其时间限制或作业终止。 这些事件
可能导致诸如执行任意脚本之类的操作。 典型用途包括
通知系统管理员节点故障并在以下情况下正常终止作业
它的时间限制快到了。 节点列表或作业 ID 的主机列表表达式为
作为参数传递给程序。

触发事件不会立即处理,但会检查触发事件
定期(目前每 15 秒一次)。 在该范围内发生的任何触发事件
间隔将与时间结束时设置的触发程序进行比较
间隔。 触发程序将针对发生在那里的任何事件执行一次
间隔。 这些事件的记录(例如,在前 15
秒)然后将被清除。 触发程序必须在结束前设置一个新的触发器
下一个间隔,以确保不会错过任何触发事件或触发必须
使用“--flags=PERM”参数创建。 如果需要,可以设置多个触发程序
为同一事件设置。

重要 注意: 此命令只能由用户运行才能设置触发器 Slurm用户 除非
Slurm用户 配置为root用户。 这是必需的 slurmctld 要设置的守护进程
执行程序的适当用户和组 ID。 还要注意触发器
程序在同一个节点上执行 slurmctld 守护进程使用而不是一些
分配的计算节点。 检查值 Slurm用户,运行命令:

控制 显示 配置 | grep的 Slurm用户

争论


-a, --primary_slurmctld_failure
当主 slurmctld 失败时触发事件。

-A, --primary_slurmctld_resumed_操作
当主 slurmctld 在失败后恢复操作时触发事件。

-b, --primary_slurmctld_resumed_control
当主 slurmctld 恢复控制时触发事件。

--block_err
当 BlueGene 模块进入 ERROR 状态时触发事件。

-B, --backup_slurmctld_failure
当备份 slurmctld 失败时触发事件。

-c, --backup_slurmctld_resumed_操作
当备份 slurmctld 在失败后恢复操作时触发事件。

-C, --backup_slurmctld_assumed_control
当备份 slurmctld 接管时触发事件。

- 清除
清除或删除先前定义的事件触发器。 这 - ID, --求职 or - 用户
必须指定选项以标识要清除的触发器。 仅用户 root
或者触发器的创建者可以删除触发器。

-d, - 下
如果指定节点进入 DOWN 状态,则触发事件。

-D, --沥干
如果指定节点进入 DRAINED 状态,则触发事件。

-e, --primary_slurmctld_acct_buffer_full
当主 slurmctld 记帐缓冲区已满时触发事件。

-F, - 失败
如果指定节点进入 FAILING 状态,则触发事件。

-f, --菲尼
当指定的作业完成执行时触发事件。

--标志=类型
将标志与预订相关联。 多个标志应该用逗号分隔。
有效标志包括:

PERM 使触发器永久。 事件发生后不要清除它。

- 前端
根据前端节点的状态变化而不是计算来触发事件
节点。 仅适用于 BlueGene 和 Cray 架构,其中 slurmd 守护进程
在前端节点而不是计算节点上执行。 将此选项与
无论是 - 向上 or - 下 选项。

-g, --primary_slurmdbd_failure
当主 slurmdbd 失败时触发事件。

-G, --primary_slurmdbd_resumed_操作
当主 slurmdbd 在失败后恢复操作时触发事件。

- 得到 显示注册的事件触发器。 选项可用于过滤目的。

-h, --主数据库失败
当主数据库失败时触发事件。

-H, --primary_database_resumed_操作
当主数据库在失败后恢复操作时触发一个事件。

-i, - ID=id
触发器 ID 号。

-I, - 闲置的
如果指定节点至少保持空闲状态,则触发事件
规定的时间段 - 抵消 选项。 这对于休眠一个
保持空闲的节点,从而降低功耗。

-j, --求职=id
感兴趣的工作 ID。 注意: 这个 --求职 选项不能与
这些因素包括原料奶的可用性以及达到必要粉末质量水平所需的工艺。 - 节点 选项。 当。。。的时候 --求职 选项与 - 向上 or
- 下 选项,分配给该作业的所有节点都将视为用作
触发事件。

-M, --集群=<绳子>
向其发出命令的集群。

-n, - 节点[=主持人]
感兴趣的主机名。 默认情况下,与作业关联的所有节点(如果
--求职 被指定)或在系统上被视为事件触发器。 注意:
这个 - 节点 选项不能与 --求职 选项。 当。。。的时候
--求职 选项与 - 向上, - 下 or --沥干 选项,
分配给该作业的所有节点都将视为用作触发事件的节点。
由于此选项的参数是可选的,为了正确解析单个字母
选项必须紧跟在值后面,并且中间不能包含空格
他们。 例如“-ntux”而不是“-n tux”。

-N, --无标题
显示触发器列表时不要打印标题。

-o, - 抵消=
指定的操作应在此时间间隔内跟随事件。 指定一个
如果操作应该在事件之前发生,则为负值。 默认值为零,如果
没有 - 抵消 选项被指定。 这个时间的分辨率大约是20秒,
所以在作业到达时间前不少于五分钟执行脚本
限制,指定 --偏移=320 (5 分钟加 20 秒)。

-p, - 程序=
事件发生时在指定的完全限定路径名处执行程序
发生。 如果需要,您可以引用路径并包含额外的程序参数。
程序将以设置触发器的用户身份执行。 如果程序
未能在 5 分钟内终止,它将与任何生成的
流程。

-Q, - 安静的
不要报告非致命错误。 这对于清除可能会触发的触发器很有用
已经被清除了。

-r, --重新配置
当系统配置改变时触发事件。 当
slurmctld 守护进程读取其配置文件或在节点状态更改时读取。

- 放 根据提供的选项注册事件触发器。 注意:一个事件只是
触发一次。 必须为未来的事件设置一个新的事件触发器
要处理的相同类型。 只有在命令由以下人员运行时才能设置触发器
用户 Slurm用户 除非 Slurm用户 配置为root用户。

-t, - 时间
当达到指定作业的时间限制时触发事件。 这个必须用
连同 --求职 选项。

-u, - 向上
如果指定节点从 DOWN 状态恢复服务,则触发事件。

- 用户=用户名或 ID
清除或获取指定用户创建的触发器。 例如,一个触发器
由用户创建 对于用户创建的作业 亚当 可以用一个选项清除
--用户=root. 指定用户名或用户 ID。

-v, --详细
打印详细的事件记录。 这包括数据结构上的时间戳、记录
计数等

-V , - 版
打印版本信息并退出。

OUTPUT 领域 随便果简介


触发器编号
触发器 ID 号。

RES_类型
资源类型: 工作 or 节点

RES_ID 资源 ID:作业 ID 或主机名或任何主机的“*”

触发类型: or (仅适用于工作), 向下 or up (对于作业或节点),或
倒掉, 闲置 or 重新配置 (仅适用于节点)

OFFSET 以秒为单位的时间偏移。 负数表示动作应该在之前发生
事件(如果可能)

USER 请求操作的用户名称

课程
事件发生时要执行的程序的路径名

环境 变数


强者 选项可以通过环境变量设置。 这些环境变量,
下面列出了它们的相应选项。 (注意:命令行选项将
始终覆盖这些设置)

SLURM_CONF Slurm 配置文件的位置。

示例


每当主 slurmctld 执行程序“/usr/sbin/primary_slurmctld_failure”
将失败。

> 猫 /usr/sbin/primary_slurmctld_failure
#!/ bin / bash
# 提交下一个主要 slurmctld 失败事件的触发器
触发器--设置--primary_slurmctld_failure \
--program=/usr/sbin/primary_slurmctld_failure
# 使用邮件通知管理员使用失败
/usr/bin/邮件 [电子邮件保护] -s 主_SLURMCTLD_FAILURE

> strigger --set --primary_slurmctld_failure \
--program=/usr/sbin/primary_slurmctld_failure

每当集群中的任何节点离开时,执行程序“/usr/sbin/slurm_admin_notify”
下。 主题行将包含已进入停机状态的节点名称
(由 Slurm 作为参数传递给脚本)。

> 猫 /usr/sbin/slurm_admin_notify
#!/ bin / bash
# 提交下一个事件的触发器
触发器 --set --node --down \
--program=/usr/sbin/slurm_admin_notify
# 通过邮件通知管理员使用
/usr/bin/邮件 [电子邮件保护] -s 节点关闭:$*

> strigger --set --node --down \
--program=/usr/sbin/slurm_admin_notify

每当集群中的任何节点时执行程序“/usr/sbin/slurm_suspend_node”
保持空闲状态至少 600 秒。

> strigger --set --node --idle --offset=600 \
--program=/usr/sbin/slurm_suspend_node

当作业 1234 在到达的 10 分钟内时执行程序“/home/joe/clean_up”
它的时间限制。

> strigger --set --jobid=1234 --time --offset=-600 \
--程序=/home/joe/clean_up

当分配给作业 1234 的任何节点进入时执行程序“/home/joe/node_died”
下降状态。

> 斯特里格 --set --jobid=1234 --down \
--program=/home/joe/node_die

显示与作业 1235 关联的所有触发器。

> 斯特里格 --get --jobid=1235
TRIG_ID RES_TYPE RES_ID TYPE 偏移用户程序
123 工作 1235 时间 -600 乔 /home/bob/clean_up
125 作业 1235 下来 0 乔 /home/bob/node_died

删除事件触发器 125。

> 斯特里格 --clear --id=125

作业 1237 完成后执行 /home/joe/job_fini。

> strigger --set --jobid=1237 --fini --program=/home/joe/job_fini

复印


版权所有 (C) 2007 加州大学董事会。 劳伦斯出品
利弗莫尔国家实验室(参见,免责声明)。
版权所有 (C) 2008-2010 Lawrence Livermore National Security。
版权所有 (C) 2010-2013 SchedMD LLC。

该文件是资源管理程序 Slurm 的一部分。 有关详细信息,请参阅
<http://slurm.schedmd.com/>.

Slurm 是免费软件; 您可以根据条款重新分发和/或修改它
由自由软件基金会发布的 GNU 通用公共许可证; 版本 2
许可证,或(由您选择)任何更高版本。

Slurm 是分发的,希望它有用,但没有任何保证; 没有
甚至针对特定目的的适销性或适用性的默示保证。 见
有关更多详细信息,请参见GNU通用公共许可证。

使用 onworks.net 服务在线使用 srigger


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad




×
广告
❤️在这里购物、预订或购买——免费,有助于保持服务免费。