これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、MAC OS オンライン エミュレーターなど、複数の無料オンライン ワークステーションのいずれかを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド sacctmgr です。
プログラム:
NAME
sacctmgr - Slurm アカウント情報を表示および変更するために使用されます。
SYNOPSIS
sacctmgr [OPTIONS...] [COMMAND...]
DESCRIPTION
sacctmgr Slurm アカウント情報を表示または変更するために使用されます。 アカウント情報は
によって提供されるインターフェースを使用して、データベース内に維持されます。 slurmdbd (スラムデータベース
デーモン)。 このデータベースは、ユーザーおよびコンピューター情報の中央保管庫として機能します。
XNUMX つのサイトの複数のコンピューター用。 Slurm のアカウント情報は、以下に基づいて記録されます。
と呼ばれるものを形成する XNUMX つのパラメーター 協会. これらのパラメータは
user, , パーティション, アカウント. user ログイン名です。 の名前です
によって指定された Slurm マネージド クラスター クラスタ名 内のパラメータ slurm.conf
設定ファイル パーティション そのクラスターの Slurm パーティションの名前です。 アカウント
仕事用の銀行口座です。 意図した動作モードは、 sacctmgr
コマンド、追加、削除、変更、および/またはリスト 協会 レコードは変更をコミットし、
出口。
ご注意: Slurm のデータベースの内容は小文字で維持されます。 これにより、
一部 sacctmgr 他の Slurm コマンドの出力とは異なります。
OPTIONS
-h, - 助けて
の使用方法を説明するヘルプ メッセージを出力します。 sacctmgr。 これは、
助けます
-i, - すぐに
変更をすぐにコミットします。
-n, --ヘッダーなし
出力の先頭にヘッダーは追加されません。
-p, -解析可能
出力は「|」になります「|」で区切られた最後に。
-P, --parseable2
出力は「|」になります「|」なしで区切られた最後に。
-Q, - 静かな
エラーメッセージ以外のメッセージを出力しません。 これは 静かな
-r, -読み取り専用
実行中の sacctmgr がアカウンティング情報を変更できないようにします。 の
読み取り専用 オプションは、対話モードで使用するためのものです。
-s, --協会
show または list で使用して、エンティティとの関連付けを表示します。 これは同等です
から 団体
-v, -詳細
詳細ログを有効にします。 これは 詳細
-V , - バージョン
バージョン番号を表示します。 これは バージョン
コマンド
加えます <エンティティ>>SPECS>
エンティティを追加します。 と同じ 作ります
団体
show または list で使用して、エンティティとの関連付けを表示します。
作ります <エンティティ>>SPECS>
エンティティを追加します。 と同じ 加えます
削除 <エンティティ>どこでSPECS>
指定されたエンティティを削除します。
ダンプ <エンティティ>>ファイル=ファイル名>
クラスタ データを指定されたファイルにダンプします。 ファイル名が指定されていない場合は、
clustername.cfg ファイル名はデフォルトです。
終了する sacctmgr 対話モードを終了します。 と同じ やめます
助けます sacctmgr のオプションとコマンドの説明を表示します。
リスト <エンティティ> [SPECS>]
指定されたエンティティに関する情報を表示します。 デフォルトでは、すべてのエントリは
表示された場合、クエリで SPECS を指定して結果を絞り込むことができます。 と同じ
表示する
負荷 <ファイル名>
指定されたファイルからクラスター データを読み込みます。 これは生成された構成ファイルです
sacctmgr dump コマンドを実行します。 このコマンドはアーカイブ データをロードしません。
代わりに sacctmgr アーカイブ ロード オプションを使用してください。
修正する <エンティティ>どこでSPECS> セットSPECS>
エンティティを変更します。
問題
エンティティの問題を表示するには、show または list と共に使用します。
静かな エラーメッセージ以外のメッセージを出力しません。
やめます sacctmgr 対話モードの実行を終了します。 と同じ 終了する
再構成する
SlurmDBD で実行している場合は、SlurmDBD を再構成します。
表示する <エンティティ> [SPECS>]
指定されたエンティティに関する情報を表示します。 デフォルトでは、すべてのエントリは
表示された場合、クエリで SPECS を指定して結果を絞り込むことができます。 と同じ
リスト
詳細
詳細ログを有効にします。 これには、データ構造のタイムスタンプ、レコードが含まれます
counts など。これは独立したコマンドであり、
インタラクティブモード。
バージョン
sacctmgr のバージョン番号を表示します。
!! 最後のコマンドを繰り返します。
エンティティ
アカウント
銀行口座。通常は、ジョブの送信時に --アカウント= オプションを選択します。
これらは、アカウントなど、階層的に配置される場合があります。 化学 と
物理学 アカウントの子である可能性があります 科学. 階層には
任意の深さ。
協会
XNUMX つのパラメーターで構成される情報をグループ化するために使用されるエンティティー: アカウント,
, パーティション (optional), user. のみで使用 リスト or 表示する
追加、変更、および削除は、ユーザー、アカウント、またはクラスター エンティティに対して行う必要があります。 これ
次に、基になる関連付けを更新します。
この クラスタ名 内のパラメータ slurm.conf 設定ファイル、使用
異なるマシンからアカウントを区別します。
の監視
のみで使用 リスト or 表示する コマンドを実行して、現在のシステム構成を報告します。
コーディネーター
特別な特権を持つユーザー (通常はアカウント マネージャーなど) で、ユーザーを追加したり、
サブアカウントをコーディネーターであるアカウントに。 これは信頼できる
内部でアカウントとユーザーの関連付けの制限を変更できるため
レルム。
イベント クラスター上のノードのダウンやドレインなどのイベント。
ジョブ ジョブ - ただし、ジョブの XNUMX つの特定のフィールドのみ: 派生終了コードとコメント
String
コス サービスの質。
事業紹介
システムのソフトウェア リソース。 それらは、間で共有されるソフトウェア ライセンスです。
クラスター。
トランザクション
特定の期間中に発生したトランザクションのリスト。
user ログイン名。 小文字のユーザー名のみがサポートされています。
ウィスキーズ ワークロード特性化キー。 直交をグループ化するための任意の文字列
アカウント。
全般的な 規格 FOR 協会 ベース エンティティ
注: グループ制限 (GrpJobs、GrpTRES など) は、ジョブが検討されているときにテストされます。
リソースが割り当てられているため。 ジョブを開始すると、そのグループ制限のいずれかが
超過した場合、そのジョブが先取りされる可能性がある場合でも、そのジョブはスケジューリングの対象とは見なされません
保留中のジョブのために十分なグループ リソースを解放する他のジョブ
開始した。
デフォルトQOS=
このアソシエーションとその子が持つべきデフォルトの QOS。 これはオーバーライドされます
ユーザーに直接設定した場合。 以前に設定した値をクリアするには、modify コマンドを使用します
-1 の新しい値で。
公正な取り分=
ジョブの優先順位を決定するために他のアカウントと組み合わせて使用される番号。 こともできます
文字列になる 親、ユーザーで使用される場合、これは親関連付けが
フェアシェアに使用されます。 Fairshare=parent がアカウントに設定されている場合、そのアカウントの
子は、フェアシェア計算のために効果的に最初の親に変更されます
Fairshare=parent ではない親の親。 制限は変わりませんが、
そのフェアシェア値が影響を受けます。 以前に設定した値をクリアするには、変更を使用します
-1 の新しい値を持つコマンド。
グレースタイム=
ジョブに延長されるプリエンプション猶予時間を秒単位で指定します。
プリエンプションに選ばれたもの。 デフォルト値はゼロで、プリエンプションはありません
この QOS では猶予時間が許可されます。
注: この値は、QOS PreemptMode=CANCEL の場合にのみ意味があります)
グループTRESMins=
過去、現在、および現在で使用できる可能性のあるTRES分の合計数
この関連付けとその子から実行される将来のジョブ。 クリアするには
値を設定するには、新しい値 -1 を指定して modify コマンドを使用します。
注: クラスタのルート アソシエーションに設定されている場合、この制限は適用されません。 そうであっても
sacctmgr の出力に表示される場合がありますが、強制されることはありません。
また、注意: この制限は、Priority Multifactor プラグインを使用する場合にのみ適用されます。 時間
に設定されている PriorityDecayHalfLife または PriorityUsageResetPeriod の値を使用して減衰されます
slurm.conf。 この制限に達すると、実行中のすべての関連ジョブが強制終了され、
グループ内の関連付けで送信された将来のすべてのジョブは、それらが完了するまで遅延されます。
限界内で走れる。
GrpTRESRunMins=
実行中のすべてのジョブで使用される合計 TRES 分数を制限するために使用されます
この協会とその子供たちと。 これは時間制限を考慮します
制限に達した場合、新しいジョブは開始されません
他のジョブが完了するまで、時間を空けてください。
グループトレス=
このために合計で割り当てられる TRES 実行ジョブの最大数
関連付け、およびこの関連付けの子であるすべての関連付け。 クリアするには
以前に設定された値は、modify コマンドを使用して新しい値 -1 を指定します。
注: この制限は、Select Consumable Resource プラグインを使用する場合にのみ完全に適用されます。
グループジョブ=
このアソシエーションとすべてのアソシエーションの合計で実行中のジョブの最大数
この関連付けの子である関連付け。 以前の設定をクリアするには
value 新しい値 -1 を指定して、modify コマンドを使用します。
グループ送信ジョブ=
いつでも保留中または実行中の状態にできるジョブの最大数
このアソシエーションと、このアソシエーションの子であるすべてのアソシエーションの集計
協会。 以前に設定した値をクリアするには、modify コマンドに新しい
-1 の値。
グループ壁=
ジョブを実行している最大ウォール クロック時間は、このために総計で割り当てることができます
関連付け、およびこの関連付けの子であるすべての関連付け。 クリアするには
以前に設定された値は、modify コマンドを使用して新しい値 -1 を指定します。
注: クラスタのルート アソシエーションに設定されている場合、この制限は適用されません。 そうであっても
sacctmgr の出力に表示される場合がありますが、強制されることはありません。
また、注意: この制限は、Priority Multifactor プラグインを使用する場合にのみ適用されます。 時間
に設定されている PriorityDecayHalfLife または PriorityUsageResetPeriod の値を使用して減衰されます
slurm.conf。 この制限に達すると、実行中のすべての関連ジョブが強制終了され、
グループ内の関連付けで送信された将来のすべてのジョブは、それらが完了するまで遅延されます。
限界内で走れる。
MaxTRESMins=
各ジョブがこのアソシエーションで使用できる最大 TRES 分数。 これ
ユーザーに直接設定するとオーバーライドされます。 デフォルトはクラスターの制限です。 クリアするには
以前に設定された値は、modify コマンドを使用して新しい値 -1 を指定します。
MaxTRES=
各ジョブがこの関連付けで使用できる TRES の最大数。 これは
ユーザーに直接設定すると上書きされます。 デフォルトはクラスターの制限です。 クリアするには
以前に設定された値は、新しい値 -1 で変更コマンドを使用します。
注: この制限は、Select Consumable Resource プラグインを使用する場合にのみ完全に適用されます。
最大ジョブ数=
この関連付けで各ユーザーが一度に実行できるジョブの最大数。
ユーザーに直接設定すると、これはオーバーライドされます。 デフォルトはクラスターの制限です。 に
以前に設定した値をクリアするには、新しい値 -1 を指定して modify コマンドを使用します。
最大送信ジョブ数=
この関連付けが保留中または実行中のジョブの最大数
いつでも状態。 デフォルトはクラスターの制限です。 以前の設定をクリアするには
value 新しい値 -1 を指定して、modify コマンドを使用します。
マックスウォール=
各ジョブがこの関連付けで使用できる最大ウォール クロック時間。 これは
ユーザーに直接設定すると上書きされます。 デフォルトはクラスターの制限です。
フォーマットはまた: また: : また- : : また
- . 値は分単位で記録され、必要に応じて丸められます。 クリアするには
以前に設定された値は、新しい値 -1 で変更コマンドを使用します。
注: この値を変更しても、実行中または保留中のジョブには影響しません。
QoS レベル
このためにジョブを実行できるデフォルトのサービス品質を指定します
協会。 有効な QOS のリストを取得するには、「sacctmgr list qos」を使用します。 この値
親の値を上書きし、新しいデフォルトとして子にプッシュダウンします。
QosLevel を '' (間に何も置かない XNUMX つの一重引用符) に設定すると、
初期設定。 演算子 += および -= を使用して、特定のものを追加または削除することもできます
QOSリストからのQOS。
有効値は次のとおりです。
= 作成セッションプロセスで QoS レベル 指定された値に。 ご注意: 特定の時点で使用できる QOS
階層内のアカウントは、そのアカウントの子によって継承されます。 に
で QOS を割り当てる = 割り当てられた QOS のみに署名すると、アカウントで使用できます
とその子。
+= 指定の追加現在の値 QoS レベル. アカウントには
この QOS および以前に割り当てられた他の QOS へのアクセス。
-= 指定の削除現在からの値 QoS レベル.
ジョブの設定方法については、 例 以下のセクションをご覧ください。
規格 FOR 会計
クラスタ=
アカウントを追加する特定のクラスター。 デフォルトはすべてシステム内です。
説明=
アカウントを説明する任意の文字列。
お名前=
銀行口座の名前。 名前は一意である必要があり、表すことはできないことに注意してください
口座階層のさまざまなポイントにあるさまざまな銀行口座。
組織=
アカウントが属する組織。
親=
このアカウントの親アカウント。 デフォルトは、最上位のアカウントである root アカウントです。
生の使用量=
これにより、管理者はアカウントに発生した生の使用量をリセットできます。 の
現在サポートされている値は 0 (ゼロ) のみです。 設定のみの仕様です
- アカウントを一覧表示するためのフィルターとして使用することはできません。
関連付けあり
このアカウントのすべての関連付けを表示します。
座標あり
このアカウントのすべてのコーディネーターを表示します。
削除済み
以前に削除されたデータの情報を表示します。
注: WithAssoc オプションを使用する場合は、特定の関連付けに対してクエリを実行することもできます
このアカウントが持つ可能性がある特定の関連付けのみを表示するための情報。 これらの追加オプション
の中で見つけることができます 規格 FOR 協会 セクション。 一般の方もご利用いただけます
上記の仕様リスト 全般的な 規格 FOR 協会 ベース エンティティ
のセクションから無料でダウンロードできます。
リスト/ショー アカウント FORMAT OPTIONS
アカウント
銀行口座の名前。
説明
アカウントを説明する任意の文字列。
組織
アカウントが属する組織。
コーディネーター
アカウントのコーディネーターであるユーザーのリスト。 (使用時のみ記入)
WithCoordinator オプション)。
注: WithAssoc オプションを使用すると、さまざまな
アカウントがシステム内のすべてのクラスターで持つ可能性のある関連付け。 協会
フォーマット フィールドについては、 リスト/ショー 協会 FORMAT OPTIONS のセクションから無料でダウンロードできます。
規格 FOR 協会
クラスター=
クラスターの関連付けを一覧表示します。
アカウント=
アカウントの関連付けを一覧表示します。
ユーザー=
ユーザーの関連付けを一覧表示します。
パーティション=
パーティションの関連付けを一覧表示します。
注: 上記の一般的な仕様リストを使用することもできます。 全般的な 規格
FOR 協会 ベース エンティティ のセクションから無料でダウンロードできます。
その他 オプション ユニーク for リスト 関連付け:
デフォルトのみ
デフォルトの関連付けである関連付けのみを表示する
木 アカウント名を階層的に表示します。
削除済み
以前に削除されたデータの情報を表示します。
サブアカウントあり
サブアカウントで情報を表示します。 と一緒に使用する場合にのみ、本当に価値があります。
アカウント=オプション。 これにより、サブアカウントの関連付けがすべて表示されます。
オプションにリストされているアカウント。
WOリミット
制限情報なしで情報を表示します。 これは、より小さなデフォルト形式用です
クラスタ、アカウント、ユーザー、パーティションの
WOP情報
親情報なしで情報を表示します。 (つまり、親 ID と親アカウント
このオプションは、WOPLIMITS も呼び出します。
WOPリミット
階層的な親の制限なしで情報を表示します。 (つまり、表示のみ
親から伝播するのではなく、設定されている場所を制限します。)
リスト/ショー 協会 FORMAT OPTIONS
アカウント
協会の銀行口座の名前。
クラスタ
アソシエーション内のクラスターの名前。
デフォルトQOS
関連付けが QOS リスト内のアクセスとしてデフォルトで使用される QOS
下記に記載されています。
公正な取り分
ジョブの優先順位を決定するために他のアカウントと組み合わせて使用される番号。 こともできます
文字列になる 親、ユーザーで使用される場合、これは親関連付けが
フェアシェアに使用されます。 Fairshare=parent がアカウントに設定されている場合、そのアカウントの
子は、フェアシェア計算のために効果的に最初の親に変更されます
Fairshare=parent ではない親の親。 制限は変わりませんが、
そのフェアシェア値が影響を受けます。
グループTRESMins
過去、現在、および現在で使用できる可能性のあるTRES分の合計数
この関連付けとその子から実行される将来のジョブ。
GrpTRESRunMins
実行中のすべてのジョブで使用される合計 TRES 分数を制限するために使用されます
この協会とその子供たちと。 これは時間制限を考慮します
制限に達した場合、新しいジョブは開始されません
他のジョブが完了するまで、時間を空けてください。
グループトレス
このために合計で割り当てられる TRES 実行ジョブの最大数
関連付け、およびこの関連付けの子であるすべての関連付け。
グループジョブ
このアソシエーションとすべてのアソシエーションの合計で実行中のジョブの最大数
この関連付けの子である関連付け。
グループ送信ジョブ
いつでも保留中または実行中の状態にできるジョブの最大数
このアソシエーションと、このアソシエーションの子であるすべてのアソシエーションの集計
協会。
グループ壁
ジョブを実行している最大ウォール クロック時間は、このために総計で割り当てることができます
関連付け、およびこの関連付けの子であるすべての関連付け。
ID 関連付けの ID。
LFT アソシエーションは階層で保持されます。これは、階層の一番左の場所です。
RGT 変数とともに使用すると、この LFT 内の LFT とのすべての関連付けと、
RGT の前は、この関連付けの子です。
MaxTRESMins
各ジョブが使用できる TRES の最大分数。
MaxTRES
各ジョブが使用できる TRES の最大数。
最大ジョブ数
各ユーザーが一度に実行できるジョブの最大数。
最大送信ジョブ数
いつでも保留中または実行中の状態のジョブの最大数。
マックスウォール
各ジョブが使用できる最大ウォール クロック時間。
Qos この関連付けに有効な QOS'。
親ID
この関連付けの親の関連付け ID。
親の名前
この関連付けの親のアカウント名。
パーティション
アソシエーション内のパーティションの名前。
RawQOS この関連付けの有効な QOS' の数値。
RGT アソシエーションは階層に保持されます。これは、階層内の最も右側の場所です。
LFT 変数とともに使用すると、この RGT 内の LFT とのすべての関連付けと
LFT の後は、この関連付けの子です。
ユーザー 関連付け内のユーザーの名前。
規格 FOR クラスター
Classification=
機械の種類、現在の分類は能力と能力です。
フラグ=
特定のクラスターの属性のカンマ区切りリスト。 現在のフラグには以下が含まれます
AIX、BGL、BGP、BGQ、Bluegene、CrayXT、FrontEnd、MultipleSlurmd、および
太陽星座
お名前=
クラスターの名前。 これは、 クラスタ名 内のパラメータ
slurm.conf 一部の Slurm 管理クラスターの構成ファイル。
RPC=
数値 RPC 値のカンマ区切りリスト。
WOリミット
制限情報なしで情報を表示します。 これは、より小さなデフォルト形式用です
クラスタ、ControlHost、ControlPort、RPC の
注: 上記の一般的な仕様リストを使用することもできます。 全般的な 規格
FOR 協会 ベース エンティティ のセクションから無料でダウンロードできます。
リスト/ショー CLUSTER FORMAT OPTIONS
Classification
マシンのタイプ、つまり能力または能力。
クラスタ
クラスターの名前。
コントロールホスト
slurmctld がデータベースに登録されると、コントローラーの IP アドレスは
ここに配置。
コントロールポート
slurmctld がデータベースに登録すると、コントローラーがリッスンしているポート
on がここに配置されます。
THREE 追跡可能なリソース (BB (バースト バッファー)、CPU、エネルギー、GRES、ライセンス、メモリ、および
Node) このクラスターが占めている。
フラグ クラスタが持つ属性。
ノード数
クラスターに関連付けられているノードの現在の数。
ノード名
クラスターに関連付けられている現在のノード。
プラグインID選択
クラスターが使用している選択プラグインの数値。
RPC slurmctld がデータベースに登録するとき、コントローラの rpc バージョンは
実行中はここに配置されます。
メモ: クラスタのルート関連付けに関する情報も表示できます。 の
アソシエーション形式フィールドについては、 リスト/ショー 協会 FORMAT OPTIONS
のセクションから無料でダウンロードできます。
規格 FOR コーディネーター
アカウント=
このユーザーをコーディネーターとして追加するアカウント名。
名=
コーディネーターの名前。
注: コーディネーターを一覧表示するには、リスト アカウントまたはリスト ユーザーで WithCoordinator オプションを使用します。
規格 FOR イベント
すべてのクラスター
すべてのクラスター ショートカットに関する情報を取得します。
オールタイム
すべての時間ショートカットの期間を取得します。
クラスター=
クラスターのイベントを一覧表示します。 デフォルトは、コマンドが実行されたクラスターです。
実行されます。
終わり=
イベント期間終了。 デフォルトは現在です。
有効な時刻形式は...
時:MM[:SS][午前|午後]
MMDD[YY] または MM/DD[/YY] または MM.DD[.YY]
月/日[/YY]-HH:MM[:SS]
YYYY-MM-DD[THH:MM[:SS]]
イベント=
検索する特定のイベント。有効なオプションは Cluster または Node で、デフォルトは両方です。
MaxTRES=
イベントによって影響を受ける TRES の最大数。
ミントレ=
イベントによって影響を受ける TRES の最小数。
Nodes=
イベントの影響を受けるノード名。
理由=
イベントが発生した理由。
お気軽にご連絡ください=
イベント期間開始。 州が指定されていない限り、デフォルトは前日の 00:00:00 です。
States= 仕様イベントで指定されます。 この場合、デフォルトの動作は
現在指定された状態にあるイベントを返します。
有効な時刻形式は...
時:MM[:SS][午前|午後]
MMDD[YY] または MM/DD[/YY] または MM.DD[.YY]
月/日[/YY]-HH:MM[:SS]
YYYY-MM-DD[THH:MM[:SS]]
米国=
ノード イベントでのノードの状態。 これが設定されている場合、イベント タイプが設定されます
ノードに自動的に。
ユーザー=
イベントを設定したユーザーに対してクエリを実行します。 これが設定されている場合、イベント タイプが設定されます
ユーザー slurm のみがクラスター イベントを実行できるため、Node に自動的に送信されます。
リスト/ショー EVENT FORMAT OPTIONS
クラスタ
発生したクラスター イベントの名前。
ClusterNode
クラスター イベントのクラスター上のノードのホストリスト。
THREE イベントに関与した TRES の数。
演奏時間
イベントの期間。
終わり イベントが終了した期間。
イベント イベントの名前。
イベント生
イベントの名前の数値。
ノード名
イベントの影響を受けるノード。 クラスター イベントでは、これは空白です。
理由 イベントが発生した理由。
お気軽にご連絡ください イベントが始まった期間。
都道府県 ノード イベントでは、これはイベント中のノードのフォーマットされた状態です。
状態未加工
ノード イベントでは、これはイベント中のノードの状態の数値です。
イベント。
ユーザー ノード イベントでは、これはイベントを発生させたユーザーです。
規格 FOR 仕事
派生した終了コード
派生した終了コードは、ユーザーの
仕事が成功したか失敗したかの判定。 ユーザーは、
自分のジョブの派生終了コード。
コメント
AccountingStoreJobComment パラメーターが
slurm.conf ファイルが YES に設定されています (またはデフォルト)。 ユーザーはコメントのみを変更できます
自分の仕事の文字列。
この 派生した終了コード と コメント フィールドは唯一のフィールドです
ジョブの完了後に変更できるデータベース内のジョブ レコードの。
リスト/ショー 仕事 FORMAT OPTIONS
この サクト command は、Slurm データベースからジョブ レコードを表示するための専用コマンドです。
規格 FOR QOS
注: グループの制限 (GrpJobs、GrpNodes など) は、ジョブが検討されているときにテストされます。
リソースが割り当てられているため。 ジョブを開始すると、そのグループ制限のいずれかが
超過した場合、そのジョブが先取りされる可能性がある場合でも、そのジョブはスケジューリングの対象とは見なされません
保留中のジョブのために十分なグループ リソースを解放する他のジョブ
開始した。
フラグ 特定の特性をオーバーライドまたは強制するために slurmctld によって使用されます。
有効なオプションは次のとおりです
拒否オンリミット
この QOS を使用するセット ジョブは、送信時に拒否されます。
QoS の「最大」制限に準拠していません。 デフォルトでは、これらを超えるジョブ
制限は、準拠するまで保留されます。
使用量のしきい値を強制する
設定されている場合、QOS にも UsageThreshold があり、これを使用して送信されたすべてのジョブ
UsageThreshold を下回る QOS は、Fairshare まで保持されます
使用量がしきい値を超えています。
予約なし
このフラグが設定され、バックフィル スケジューリングが使用されている場合、この QOS を使用するジョブ
バックフィル スケジュールのリソース マップでリソースを予約しません。
時間を通して割り当てられます。 このフラグは、QOS で使用することを目的としています。
他のすべての QOS に関連付けられたジョブによってプリエンプトされます (たとえば、「スタンバイ」で使用)
QOS)。 割り当てられた が、すべてでプリエンプトできない QOS で使用されている場合
他の QOS では、大規模なジョブが枯渇する可能性があります。
PartitionMaxNodes
この QOS を使用するジョブを設定すると、要求された
パーティションの MaxNodes 制限。
パーティション最小ノード数
この QOS を使用するジョブを設定すると、要求された
パーティションの MinNodes 制限。
オーバーパーツQOS
この QOS を使用するセット ジョブは、
要求されたパーティションの QOS 制限。
パーティション時間制限
この QOS を使用するジョブを設定すると、要求された
パーティションの TimeLimit。
要予約
この QOS を使用して設定されたジョブは、送信時に予約を指定する必要があります。
仕事。 このオプションは、QOS の使用を制限するのに役立ちます。
より大きなプリエンプティブ能力または追加のリソースのみが許可される
予約内。
グレースタイム
選択されたジョブに延長されるプリエンプション猶予時間
先取り。
グループTRESMins
過去、現在、および現在で使用できる可能性のあるTRES分の合計数
この QOS から実行される将来のジョブ。
GrpTRESRunMins TRES の合計総数を制限するために使用されます。
この QOS で実行されているすべてのジョブで使用された分。 これは時間を考慮して
実行中のジョブの制限とそれを消費します。制限に達した場合、新しいジョブはありません
解放する時間を確保するために、他のジョブが終了するまで開始されます。
グループトレス
このために合計で割り当てられる TRES 実行ジョブの最大数
品質。
グループジョブ
この QOS の合計で実行中のジョブの最大数。
グループ送信ジョブ
いつでも保留中または実行中の状態にできるジョブの最大数
この QOS の集約。
グループ壁
ジョブを実行している最大ウォール クロック時間は、このために総計で割り当てることができます
品質。 この制限に達すると、送信リクエストは拒否され、実行中の
仕事は殺されます。
ID QOS の ID。
MaxTRESMins
各ジョブが使用できる TRES の最大分数。
MaxTRESPerJob
各ジョブが使用できる TRES の最大数。
MaxTRESPerNode
ジョブ割り当て内の各ノードが使用できる TRES の最大数。
MaxTRESPerUser
各ユーザーが使用できる TRES の最大数。
最大ジョブ数
各ユーザーが一度に実行できるジョブの最大数。
MinTRESPerJob
この QOS で実行されている各ジョブが要求する必要がある TRES の最小数。 そうでなければ、
ジョブは変更されるまで保留されます。
最大送信ジョブ数
ユーザーごとの保留中または実行中の状態のジョブの最大数。
マックスウォール
各ジョブが使用できる最大ウォール クロック時間。
お名前 QOS の名前。
先制する
他の QOS' この QOS はプリエンプトできます。
プリエンプトモード
この QOS のジョブを横取りするために使用されるメカニズム プリエンプトタイプ is
次のように構成されています プリエンプト/QOS. デフォルトのプリエンプション メカニズムは、
クラスター全体 プリエンプトモード 設定パラメータ。 可能な値は「クラスター」です
(クラスターのデフォルトを使用することを意味します)、「キャンセル」、「チェックポイント」、および「再キューイング」。 このオプション
PreemptMode=OFF または PreemptMode=SUSPEND と互換性がありません (つまり、プリエンプトされたジョブ
リソースから削除する必要があります)。
優先
この QOS を使用するときに、ジョブの優先度に追加される優先度。
生の使用量=
これにより、管理者は QOS に発生した生の使用量をリセットできます。 唯一の
現在サポートされている値は 0 (ゼロ) です。 これは設定可能な仕様のみです。
アカウントを一覧表示するためのフィルターとして使用することはできません。
使用率
この QOS で実行する場合の使用率。
使用しきい値
ジョブを実行できるアソシエーションの最低フェアシェアを表す float。
関連付けがこのしきい値を下回り、保留中のジョブがあるか、新しい
これらのジョブは、使用率がしきい値を超えるまで保持されます。 使用する
シェア システム上の現在の共有を表示します。
削除済み
以前に削除されたデータの情報を表示します。
リスト/ショー QOS FORMAT OPTIONS
説明
QOS を説明する任意の文字列。
グレースタイム
選択されたジョブに延長されるプリエンプション猶予時間
hh:mm:ss 形式のプリエンプション。 デフォルト値はゼロで、プリエンプションはありません
このパーティションでは猶予時間が許可されます。 注: この値は、
QOS PreemptMode=CANCEL。
グループTRESMins
過去、現在、および現在で使用できる可能性のあるTRES分の合計数
この QOS から実行される将来のジョブ。 以前に設定した値をクリアするには、変更を使用します
-1 の新しい値を持つコマンド。 注: この制限は、
Priority Multifactor プラグイン。 の値を使用して時間は減衰します。
slurm.conf で設定されている PriorityDecayHalfLife または PriorityUsageResetPeriod。 いつ
この制限に達すると、実行中のすべての関連ジョブが強制終了され、今後のすべてのジョブが強制終了されます
この QOS でサブミットされたジョブは、内部で実行できるようになるまで遅延されます
限定。
グループトレス
このために合計で割り当てられる TRES 実行ジョブの最大数
品質。 以前に設定した値をクリアするには、modify コマンドに新しい値を指定して使用します。
-1。
グループジョブ
この QOS の合計で実行中のジョブの最大数。 クリアするには
値を設定するには、新しい値 -1 を指定して modify コマンドを使用します。
グループ送信ジョブ
いつでも保留中または実行中の状態にできるジョブの最大数
この QOS の集約。 以前に設定した値をクリアするには、modify コマンドを使用します
-1 の新しい値で。
グループ壁
ジョブを実行している最大ウォール クロック時間は、このために総計で割り当てることができます
品質。 以前に設定した値をクリアするには、modify コマンドに新しい値を指定して使用します。
-1. 注: この制限は、Priority Multifactor プラグインを使用する場合にのみ適用されます。 の
PriorityDecayHalfLife の値を使用して時間を減衰させるか、
slurm.conf で設定されている PriorityUsageResetPeriod。 この制限に達すると、すべて
実行中の関連ジョブは強制終了され、今後のすべてのジョブはこの QOS で送信されます
制限内で実行できるようになるまで遅延されます。
MaxTRESMins
各ジョブが使用できる TRES の最大分数。 以前の設定をクリアするには
value 新しい値 -1 を指定して、modify コマンドを使用します。
MaxTRESPerJob
各ジョブが使用できる TRES の最大数。 以前に設定した値をクリアするには
新しい値 -1 を指定して、modify コマンドを使用してください。
MaxTRESPerNode
ジョブ割り当て内の各ノードが使用できる TRES の最大数。 クリアするには
以前に設定された値は、新しい値 -1 で変更コマンドを使用します。
MaxTRESPerUser
各ユーザーが使用できる TRES の最大数。 以前に設定した値をクリアするには
新しい値 -1 を指定して、modify コマンドを使用してください。
最大ジョブ数
各ユーザーが一度に実行できるジョブの最大数。 クリアするには
以前に設定された値は、新しい値 -1 で変更コマンドを使用します。
最大送信ジョブ数
ユーザーごとの保留中または実行中の状態のジョブの最大数。 クリアするには
以前に設定された値は、新しい値 -1 で変更コマンドを使用します。
マックスウォール
各ジョブが使用できる最大ウォール クロック時間。 フォーマットはまた
: また: : また- : : また- . の
値は分単位で記録され、必要に応じて丸められます。 以前の設定をクリアするには
value 新しい値 -1 を指定して、modify コマンドを使用します。
ミントレ
この QOS で実行されている各ジョブが要求する必要がある TRES の最小数。 そうでなければ、
ジョブは変更されるまで保留されます。 以前に設定した値をクリアするには、変更を使用します
-1 の新しい値を持つコマンド。
お名前 QOS の名前。 作成に必要です。
先制する
他の QOS' この QOS はプリエンプトできます。 Preempt を '' に設定します (XNUMX つの単一引用符と
それらの間に何もない) は、デフォルト設定を復元します。 演算子を使用することもできます
+= および -= は、特定の QOS を QOS リストに追加または削除します。
プリエンプトモード
この QOS のジョブを横取りするために使用されるメカニズム プリエンプトタイプ is
次のように構成されています プリエンプト/QOS. デフォルトのプリエンプション メカニズムは、
クラスター全体 プリエンプトモード 設定パラメータ。 可能な値は「クラスター」です
(クラスターのデフォルトを使用することを意味します)、「キャンセル」、「チェックポイント」、および「再キューイング」。 このオプション
PreemptMode=OFF または PreemptMode=SUSPEND と互換性がありません (つまり、プリエンプトされたジョブ
リソースから削除する必要があります)。
優先
この QOS を使用するときに、ジョブの優先度に追加される優先度。 クリアするには
以前に設定された値は、新しい値 -1 で変更コマンドを使用します。
使用率
この QOS で実行する場合の使用率。 これは、
実行中のジョブの優先時間の計算。 たとえば、QOS の使用率が 2 の場合
ジョブが実行された TRESBillingUnit 秒ごとに 2 としてカウントされます。
使用率が .5 の場合、XNUMX 秒は半分の時間しかカウントされません。 設定
この値を 0 にすると、実行中のジョブがフェアシェアに時間を追加したり、
アソシエーション/qos 制限。 以前に設定した値をクリアするには、modify コマンドを使用します
-1 の新しい値で。
規格 FOR リソース
クラスター= 指定されたリソースのクラスター名のカンマ区切りリスト
利用可能になります。 名前が指定されていない場合、クラスタはすでに使用を許可されています
このリソースは変更されます。
ワンランク上の=
実行中のシステムに構成されている特定の名前のソフトウェア リソースの数
リソースマネージャーによって制御されます。
説明=
リソースの簡単な説明。
フラグ=
システム リソースの特定の属性を識別するフラグ。 現時点ではありません
フラグが定義されています。
サーバータイプ=
ライセンスを提供するソフトウェア リソース マネージャーのタイプ。 例えば
FlexNext Publisher Flexlm ライセンス サーバーまたは Reprise License Manager RLM。
名=
システムに構成されているリソースの名前のカンマ区切りリスト
リソースマネージャーによって制御されます。 このリソースが slurmctld で見られる場合、それは
で定義されたローカル リソースと区別するために、name は name@server になります。
slurm.conf。
パーセント許可=
指定したクラスターで使用できる特定のリソースの割合。
サーバー=
リソースを提供するサーバーの名前。 デフォルトは「slurmdb」で、
ライセンスはデータベースによって提供されています。
種類=
このレコードが表すリソースのタイプ。 現在、唯一の有効なタイプ
ライセンスです。
クラスタあり
リソースのクラスターの割合を表示します。 リソースが与えられていない場合
クラスターでは、リソースはこのフラグで表示されません。
注: リソースは、使用可能なシステムで構成された各リソースを定義するために使用されます
スラームクラスターによる。
リスト/ショー リソース FORMAT OPTIONS
クラスタ
クラスタ リソースの名前が付けられます。
ワンランク上の システム上でグローバルに構成された特定のリソースの数。
割り当てられました
クラスターに割り当てられたライセンスの割合。
説明
リソースの説明。
サーバータイプ
ライセンスを制御するサーバーのタイプ。
お名前 このリソースの名前。
サーバー リソースを提供するサーバー。
種類 このレコードが表すリソースのタイプ。
規格 FOR 取引
アカウント=
指定されたアカウントに影響するトランザクションのみを出力します。
行動=
俳優=
特定の人物が行った取引のみを表示します。
クラスター=
指定されたクラスターに影響を与えるトランザクションのみを出力します。
終わり=
この日時より前のすべてのトランザクションを返します。 デフォルトは現在です。
お気軽にご連絡ください=
この日時以降のすべてのトランザクションを返します。 デフォルトはエポックです。
End と Start の有効な時刻形式は...
時:MM[:SS][午前|午後]
MMDD[YY] または MM/DD[/YY] または MM.DD[.YY]
月/日[/YY]-HH:MM[:SS]
YYYY-MM-DD[THH:MM[:SS]]
ユーザー=
指定したユーザーに影響するトランザクションのみを出力します。
関連付けあり
トランザクションによって影響を受けた関連付けに関する情報を取得します。
リスト/ショー 取引 FORMAT OPTIONS
行動
俳優
インフォ
タイムスタンプ
場所
注: WithAssoc オプションを使用すると、さまざまな
トランザクションが影響した関連付け。 アソシエーション形式のフィールドについては、
リスト/ショー 協会 FORMAT OPTIONS のセクションから無料でダウンロードできます。
規格 FOR USERS
アカウント=
このユーザーを追加するアカウント名。
管理レベル=
ユーザーの管理者レベル。 有効なレベルは、None、Operator、および Admin です。
クラスタ=
アカウントにユーザーを追加する特定のクラスター。 デフォルトはすべてシステム内です。
デフォルトのアカウント=
何も指定されていない場合にジョブに使用されるデフォルトの銀行口座名を特定します
提出時間。
デフォルトのWCKey=
デフォルトのワークロード特性化キーを特定します。
お名前=
ユーザーの名前。
パーティション=
パーティション名。
生の使用量=
これにより、管理者はユーザーに発生した生の使用量をリセットできます。 唯一の
現在サポートされている値は 0 (ゼロ) です。 これは設定可能な仕様のみです。
ユーザーを一覧表示するためのフィルターとして使用することはできません。
WCKey=
ワークロード特性化のキー値。
関連付けあり
このユーザーのすべての関連付けを表示します。
座標あり
ユーザーがコーディネーターであるすべてのアカウントを表示します。
削除済み
以前に削除されたデータの情報を表示します。
注: WithAssoc オプションを使用する場合は、特定の関連付けに対してクエリを実行することもできます
このアカウントが持つ可能性がある特定の関連付けのみを表示するための情報。 これらの追加オプション
の中で見つけることができます 規格 FOR 協会 セクション。 一般の方もご利用いただけます
上記の仕様リスト 全般的な 規格 FOR 協会 ベース エンティティ
のセクションから無料でダウンロードできます。
リスト/ショー USER FORMAT OPTIONS
管理レベル
ユーザーの管理者レベル。
デフォルトのアカウント
ユーザーのデフォルト アカウント。
コーディネーター
アカウントのコーディネーターであるユーザーのリスト。 (使用時のみ記入)
WithCoordinator オプション)。
ユーザー ユーザーの名前。
注: WithAssoc オプションを使用すると、さまざまな
ユーザーがシステム内のすべてのクラスターで持つ可能性のある関連付け。 協会の形式
フィールドについては、 リスト/ショー 協会 FORMAT OPTIONS のセクションから無料でダウンロードできます。
リスト/ショー WCキー
WCキー ワークロード特性化キー。
クラスタ
WCKey の特定のクラスター。
ユーザー WCKey のユーザーの名前。
注: WithAssoc オプションを使用すると、さまざまな
ユーザーがシステム内のすべてのクラスターで持つ可能性のある関連付け。 協会の形式
フィールドについては、 リスト/ショー 協会 FORMAT OPTIONS のセクションから無料でダウンロードできます。
リスト/ショー THREE
お名前 追跡可能なリソースの名前。 このオプションは、TRES タイプ BB に必要です。
(バースト バッファ)、GRES、およびライセンス。 タイプ CPU、エネルギー、メモリ、およびノードにはありません
名前。 たとえば、GRES がタイプの場合、name は GRES の名称です。
それ自体、例えば GPU。
ID データベースに表示される追跡可能なリソースの識別番号。
種類 追跡可能なリソースのタイプ。 現在のタイプは、BB (バースト バッファー)、CPU、
エネルギー、GRES、ライセンス、メモリ、およびノード。
THREE 情報
追跡可能なリソース (TRES) は、多くの QOS またはアソシエーションの制限で使用されます。 設定時
カンマ区切りのリストです。 各 TRES には異なる制限があります。
GrpTRESMins=cpu=10,mem=20 は、2 CPU 分の 1 つと 10 分の 1 の 20 つの異なる制限を作成します。
MB メモリー分。 これは、TRES を扱う各制限に当てはまります。 を削除するには
limit -1 が使用されます。つまり、GrpTRESMins=cpu-1 は、cpu TRES 制限のみを削除します。
注: GrpTRES 制限では、ノードを TRES として扱います。 各ジョブのノード割り当ては
別々にカウントされます (つまり、XNUMX つのノードに XNUMX つのジョブにリソースが割り当てられている場合、これは
割り当てられた XNUMX つのノードとしてカウントされます)。
注: メモリを TRES として扱う場合、すべての制限は MB 単位です。
GLOBAL FORMAT オプション
さまざまなフィールドをリストするために format オプションを使用する場合、後で %NUMBER を付けることができます
印刷する文字数を指定します。
たとえば、format=name%30 は、30 文字のフィールド名を右寄せで出力します。 -30意志
左寄せで 30 文字を出力します。
FLAT FILE DUMP そして 負荷
sacctmgr には、ファイルとの間で Slurm 関連付けデータをロードおよびダンプする機能があります。
この方法では、新しいクラスターを簡単に追加したり、既存のクラスターの関連付けを
同様のアカウントを持つ新しいクラスター。 各ファイルには、単一の Slurm 関連付けデータが含まれています。
集まる。 コメントは、# 文字を使用してファイルに入れることができます。 の各行
情報は XNUMX つのタイトルのいずれかで始まる必要があります。 集まる、 親、 アカウント or ユーザー.
タイトルの後には、スペース、ダッシュ、スペース、エンティティ値、仕様が続きます。
指定はコロン区切りです。 組織などの変数にスペースがある場合
名前を一重引用符または二重引用符で囲みます。
実行できる関連付けのファイルを作成するには
> sacctmgr ダンプ tux ファイル =tux.cfg
(file=tux.cfg はオプションです)
以前に作成したファイルをロードするには、実行できます
> sacctmgr ロード ファイル = tux.cfg
ロードのその他のオプションは次のとおりです-
clean - 既存のものを削除し、この情報を使用してゼロから開始します。
Cluster= - ファイルにあるものとは異なるクラスター名を指定します。
ファイルの仕組みを簡単に説明します。
システム内の関連付けは階層に従っているため、ファイルも階層に従っています。 何でも
親は子の前に定義する必要があります。 唯一の例外は理解されている
「ルート」アカウント。 これは常にどのクラスターのデフォルトでもあり、定義する必要はありません。
ファイルを編集/作成するには、新しいクラスターのクラスター行から始めます
クラスタ - クラスター名:MaxNodesPerJob=15
この行に含まれるものはすべて、このクラスターのすべての関連付けのデフォルトになります。
これらのオプションは次のとおりです...
GrpTRESMin=
過去、現在、および現在で使用できる可能性のあるTRES分の合計数
この関連付けとその子から実行される将来のジョブ。
GrpTRESRunMins=
実行中のすべてのジョブで使用される合計 TRES 分数を制限するために使用されます
この協会とその子供たちと。 これは時間制限を考慮します
制限に達した場合、新しいジョブは開始されません
他のジョブが完了するまで、時間を空けてください。
GrpTRES=
このために合計で割り当てられる TRES 実行ジョブの最大数
関連付け、およびこの関連付けの子であるすべての関連付け。
グループジョブ=
このアソシエーションとすべてのアソシエーションの合計で実行中のジョブの最大数
この関連付けの子である関連付け。
グループノード=
ジョブを実行しているノードの最大数は、このために合計で割り当てることができます
関連付け、およびこの関連付けの子であるすべての関連付け。
注: 各ジョブのノード割り当ては個別にカウントされます (つまり、単一のノードが
リソースが XNUMX つのジョブに割り当てられている場合、これは XNUMX つの割り当てられたノードとしてカウントされます)。
GrpSubmitJobs=
いつでも保留中または実行中の状態にできるジョブの最大数
このアソシエーションと、このアソシエーションの子であるすべてのアソシエーションの集計
協会。
グループウォール=
ジョブを実行している最大ウォール クロック時間は、このために総計で割り当てることができます
関連付け、およびこの関連付けの子であるすべての関連付け。
フェアシェア=
ジョブの優先順位を決定するために、他の関連付けと組み合わせて使用される番号。
最大ジョブ=
この関連付けの子が実行できるジョブの最大数。
ジョブあたりの最大ノード数=
この関連付けの子が実行できる、ジョブごとのノードの最大数。
ジョブごとの MaxWallDuration=
このアカウントの子ジョブを実行できる最大時間 (ジョブ サイズには関係ありません)。
品質= Quality of Service 名のカンマ区切りリスト (sacctmgr で定義)。
この方法で必要なアカウントが続きます...
親 - ルート (デフォルトで定義)
アカウント - cs:MaxNodesPerJob=5:MaxJobs=4:FairShare=399:MaxWallDurationPerJob=40:Description='コンピュータ
Science':Organization='LC'
親 - cs
アカウント - test:MaxNodesPerJob=1:MaxJobs=1:FairShare=1:MaxWallDurationPerJob=1:Description='Test
アカウント':組織='テスト'
「:」の後のオプションは省略でき、任意の順序で指定できます。
サブアカウントを追加したい場合は、すでに存在している親をリストするだけです
この方法でアカウント行の前に作成されます...
すべてのアカウント オプションは、
説明=
アカウントの簡単な説明。
GrpTRESMin=
ジョブを実行している TRES 時間の最大数は、合計で割り当てることができます。
この関連付けと、この関連付けの子であるすべての関連付け。
GrpTRESRunMins= すべてのデバイスで使用される TRES 分の合計合計数を制限するために使用されます。
この関連付けとその子で実行されているジョブ。 これは考慮に入れる
実行中のジョブの時間制限とそれを消費します。制限に達した場合、新しいジョブはありません
解放する時間を確保するために、他のジョブが終了するまで開始されます。
GrpTRES=
このために合計で割り当てられる TRES 実行ジョブの最大数
関連付け、およびこの関連付けの子であるすべての関連付け。
グループジョブ=
このアソシエーションとすべてのアソシエーションの合計で実行中のジョブの最大数
この関連付けの子である関連付け。
グループノード=
ジョブを実行しているノードの最大数は、このために合計で割り当てることができます
関連付け、およびこの関連付けの子であるすべての関連付け。
注: 各ジョブのノード割り当ては個別にカウントされます (つまり、単一のノードが
リソースが XNUMX つのジョブに割り当てられている場合、これは XNUMX つの割り当てられたノードとしてカウントされます)。
GrpSubmitJobs=
いつでも保留中または実行中の状態にできるジョブの最大数
このアソシエーションと、このアソシエーションの子であるすべてのアソシエーションの集計
協会。
グループウォール=
ジョブを実行している最大ウォール クロック時間は、このために総計で割り当てることができます
関連付け、およびこの関連付けの子であるすべての関連付け。
フェアシェア=
ジョブの優先順位を決定するために、他の関連付けと組み合わせて使用される番号。
最大ジョブ=
この関連付けの子が実行できるジョブの最大数。
ジョブあたりの最大ノード数=
この関連付けの子が実行できる、ジョブごとのノードの最大数。
ジョブごとの MaxWallDuration=
このアカウントの子ジョブを実行できる最大時間 (ジョブ サイズには関係ありません)。
組織=
このアカウントを所有する組織の名前。
QOS(=,+=,-=)
Quality of Service 名のカンマ区切りリスト (sacctmgr で定義)。
ユーザーをアカウントに追加するには、Parent - 行の後に次のような行を追加します
親 - test
ユーザー - ADAM:MaxNodesPerJob=2:MaxJobs=3:FairShare=1:MaxWallDurationPerJob=1:AdminLevel=Operator:Coordinator='test'
すべてのユーザー オプションは、
管理者レベル=
このユーザーの管理者のタイプ (管理者、オペレーター)
必須 be 定義済みの on 最初の 発生 of ユーザー。
コーディネーター=
このユーザーがコーディネーターであるアカウントのカンマ区切りリスト
必須 be 定義済みの on 最初の 発生 of ユーザー。
デフォルトアカウント=
システム全体のデフォルト アカウント名
必須 be 定義済みの on 最初の 発生 of ユーザー。
フェアシェア=
ジョブの優先順位を決定するために、他の関連付けと組み合わせて使用される番号。
最大ジョブ=
このユーザーが実行できるジョブの最大数。
ジョブあたりの最大ノード数=
このユーザーが実行できるジョブごとのノードの最大数。
ジョブごとの MaxWallDuration=
このユーザーが実行できる最大時間 (ジョブのサイズには関係ありません)。
QOS(=,+=,-=)
Quality of Service 名のカンマ区切りリスト (sacctmgr で定義)。
アーカイブ 機能性
Sacctmgr には、必要に応じてフラットファイルにアーカイブしたり、そのデータをロードしたりする機能があります。
後で。 アーカイブは通常、slurmdbd によって行われます。
自分が何をしているのかを完全に理解している場合にのみ、sacctmgr を使用して実行してください。 slurmdbd の場合
オプションの詳細については、「man slurmdbd」を参照してください。 データベースへのデータのロードは、
古いデータを表示するか、ロールアップされたデータを再生成するために、これらのファイルから実行されます。
これらは、アーカイブ情報のダンプとロードの両方のオプションです。
アーカイブダンプ
ディレクトリ=
アーカイブ データを格納するディレクトリ。
イベント イベントのアーカイブ。 指定されておらず、PurgeEventAfter が設定されている場合、すべてのイベント データが削除されます
永久に失われます。
Jobs > Create New Job アーカイブ ジョブ。 指定されておらず、PurgeJobAfter が設定されている場合、すべてのジョブ データが削除されます。
永久に失われます。
パージイベント後=
月単位で指定された時間よりも古いクラスター イベント レコードを消去します。 パージしたい場合
より短い期間では、数値の後ろに数時間または数日を含めることができます
それらのより頻繁なパージを取得します。 (たとえば、'12hours' の値はすべてをパージします
12時間以上。)
パージジョブアフター=
月単位で指定された時間よりも古いジョブ レコードを削除します。 でパージしたい場合
取得する数値の後ろに数時間または数日を含めることができるより短い期間
それらのより頻繁なパージ。 (たとえば、'12hours' の値は古いものをすべて削除します
12時間以上)
PurgeStepAfter=
月単位で指定された時間よりも古いステップ レコードを消去します。 でパージしたい場合
取得する数値の後ろに数時間または数日を含めることができるより短い期間
それらのより頻繁なパージ。 (たとえば、'12hours' の値は古いものをすべて削除します
12時間以上)
パージ一時停止後=
月単位で指定された時間よりも古いジョブ中断レコードをパージします。 パージしたい場合
より短い期間では、数値の後ろに数時間または数日を含めることができます
それらのより頻繁なパージを取得します。 (たとえば、'12hours' の値はすべてをパージします
12時間以上。)
スクリプト=
フラット ファイルへのアーカイブの一般的な形式の代わりに、このスクリプトを実行します。
ステップ ステップをアーカイブします。 指定されておらず、PurgeStepAfter が設定されている場合、すべてのステップ データが削除されます
永久に失われます。
サスペンド
一時停止データのアーカイブ。 指定がなく、PurgeSuspendAfter が設定されている場合はすべてサスペンド
削除されたデータは永久に失われます。
アーカイブ 負荷
以前にアーカイブされたデータをデータベースにロードします。
ファイル= データベースにロードするファイル。
挿入=
データベースに直接挿入する SQL。 これは非常に慎重に使用する必要があります
これはSQLをデータベースに書き込んでいるためです。
ENVIRONMENT 変数
一部 sacctmgr オプションは、環境変数を介して設定できます。 これらの環境変数、
対応するオプションとともに、以下にリストされています。 (注:コマンドラインオプションは
常にこれらの設定を上書きします)
SLURM_CONF Slurm構成ファイルの場所。
例
注: 会計組合の設立命令があります。 クラスタを定義する必要があります
アカウントを追加する前に、ユーザーを追加する前にアカウントを追加する必要があります。
-> sacctmgr クラスター tux を作成
-> sacctmgr create account name=science fairshare=50
-> sacctmgr create account name=chemistry parent=science fairshare=30
-> sacctmgr create account name=physics parent=science fairshare=20
-> sacctmgr create user name=adam cluster=tux account=physics fairshare=10
-> sacctmgr delete user name=adam cluster=tux account=physics
-> sacctmgr delete account name=physics cluster=tux
-> sacctmgr 変更ユーザー名 = adam クラスター = tux アカウント = 物理セット
maxjobs=2 maxwall=30:00
-> sacctmgr リストの関連付け cluster=tux format=Account,Cluster,User,Fairshare tree withd
-> sacctmgr list transactions StartTime=11/03\-10:30:00 format=Timestamp,Action,Actor
-> sacctmgr ダンプ クラスタ=tux ファイル=tux_data_file
-> sacctmgr ロード tux_data_file
ユーザーのアカウントを直接変更することはできません。 の新しい関連付けを作成する必要があります
新しいアカウントを持つユーザー。 その後、古いアカウントとの関連付けを削除できます。
キーワード「set」とオプションの「where」を配置してオブジェクトを変更する場合は重要です
以下は、正しい結果を生成するための例です。 経験則として
セットの前に置くものはすべて量指定子として使用されます。 入れたい場合
キーワード 'set' の後の量指定子は、キーワード 'where' を使用する必要があります。
間違った -> sacctmgr 変更ユーザー名 = adam set fairshare = 10 クラスター = tux
上記の行は、modify user adam set fairshare=10 を読み取るため、エラーが発生します。
クラスター=tux.
右-> sacctmgr 変更ユーザー名 = adam クラスター = tux set fairshare = 10
right-> sacctmgr modify user name=adam set fairshare=10 where cluster=tux
何かの qos を変更するときは、明示的に設定したい場合にのみ「=」演算子を使用します
何かへのqos。 ほとんどの場合、'+=' または '\-=' 演算子を使用して、
すでに配置されている既存の qos に追加または削除します。
ユーザーがすでに親の通常の qos を持っている場合、またはそれが明示的に設定されている場合
qos+=expedite を使用して、これをこの方法でリストに追加する必要があります。
特定のアカウントまたはクラスタのみに qos expedite を追加することのみを検討している場合
これは、sacctmgr 行で指定することで実行できます。
-> sacctmgr ユーザー名を変更 = adam set qos+=expedite
> sacctmgr 変更ユーザー名 = adam acct = このクラスター = tux セット qos + = 促進
QOS をユーザー アカウントに追加する方法の例を挙げましょう。 で利用可能なすべての QOS を一覧表示します
クラスタ。
->sacctmgr show qos format=name
お名前
---------
通常の
迅速化する
クラスター内のすべての関連付けを一覧表示します。
->sacctmgr show assoc format=cluster,account,qos
クラスタ アカウントの QOS
-------- ---------- -----
ゼブラ ルート法線
ゼブラ ルート法線
ゼブラ g ノーマル
ゼブラ g1 ノーマル
QOS 速達をアカウント G1 に追加し、結果を表示します。 演算子 += の QOS の使用
既存の QOS と一緒にこのアカウントに追加されます。
->sacctmgr modify account name=g1 set qos+=expedite
->sacctmgr show assoc format=cluster,account,qos
クラスタ アカウントの QOS
-------- -------- -------
ゼブラ ルート法線
ゼブラ ルート法線
ゼブラ g ノーマル
ゼブラ g1 促進、通常
ここで、アカウント G の唯一の QOS として QOS 迅速化を設定し、結果を表示します。 使用する
オペレーター = アカウント G で使用できる QOS は expedite だけです
->sacctmgr modify account name=G set qos=expedite
>sacctmgr show assoc format=cluster,account,user,qos
クラスタ アカウントの QOS
---------- -------- -----
ゼブラ ルート法線
ゼブラ ルート法線
ゼブラ g 急行
ゼブラ g1 促進、通常
アカウント G の下に新しいアカウントが追加された場合、QOS 速達を継承し、
通常の QOS にアクセスできません。
->sacctmgr アカウントバナナを追加 親 = G
->sacctmgr show assoc format=cluster,account,qos
クラスタ アカウントの QOS
---------- -------- -----
ゼブラ ルート法線
ゼブラ ルート法線
ゼブラ g 急行
ゼブラバナナ急行
ゼブラ g1 促進、通常
追跡可能なリソースのリストの例
->sacctmgr ショー トレス
型名ID
---------- ------ --------
CPU1
メモリ 2
エネルギー 3
ノード4
gres gpu: テスラ 1001
ライセンス VCS 1002
BBクレイ1003
コピー
Copyright (C) 2008-2010 Lawrence Livermore National Security. ローレンスでプロデュース
リバモア国立研究所(免責事項を参照)。
Copyright(C)2010-2015 SchedMDLLC。
このファイルは、リソース管理プログラムであるSlurmの一部です。 詳細については、を参照してください。
<http://slurm.schedmd.com/>.
Slurmはフリーソフトウェアです。 あなたはそれを再配布および/またはそれを変更することができます
Free SoftwareFoundationによって発行されたGNUGeneral Public License; いずれかのバージョン2
ライセンスの、または(オプションで)それ以降のバージョン。
Slurmは、それが役立つことを期待して配布されていますが、いかなる保証もありません。 それなし
商品性または特定の目的への適合性の黙示の保証ですら。 を参照してください
詳細については、GNU General Public License。
onworks.net サービスを使用してオンラインで sacctmgr を使用する