Ini adalah kontrol perintah yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
scontrol - Digunakan melihat dan memodifikasi konfigurasi dan status Slurm.
RINGKASAN
kendali [PILIHAN...] [COMMAND...]
DESKRIPSI
kendali digunakan untuk melihat atau memodifikasi konfigurasi Slurm termasuk: job, job step, node,
partisi, reservasi, dan konfigurasi sistem secara keseluruhan. Sebagian besar perintah hanya bisa
dijalankan oleh root pengguna. Jika upaya untuk melihat atau mengubah informasi konfigurasi dilakukan
oleh pengguna yang tidak sah, pesan kesalahan akan dicetak dan tindakan yang diminta akan
tidak terjadi. Jika tidak ada perintah yang dimasukkan pada baris eksekusi, kendali akan beroperasi di
mode interaktif dan prompt untuk input. Itu akan terus meminta input dan mengeksekusi
perintah sampai secara eksplisit dihentikan. Jika sebuah perintah dimasukkan pada baris eksekusi,
kendali akan menjalankan perintah itu dan mengakhiri. Semua perintah dan opsi adalah
peka huruf besar/kecil, meskipun nama simpul, nama partisi, dan nama reservasi adalah
peka huruf besar/kecil (nama simpul "LX" dan "lx" berbeda). Semua perintah dan opsi dapat
disingkat sejauh spesifikasinya unik. Slurm yang dimodifikasi
konfigurasi dapat ditulis ke file menggunakan kendali menulis config perintah. Itu
file yang dihasilkan akan diberi nama menggunakan konvensi "slurm.conf. " dan terletak di
direktori yang sama dengan file "slurm.conf" asli. Direktori yang berisi
slurm.conf asli harus dapat ditulis agar ini terjadi.
PILIHAN
-a, --semua
Ketika Menunjukkan perintah digunakan, lalu tampilkan semua partisi, pekerjaan dan pekerjaannya
Langkah. Ini menyebabkan informasi ditampilkan tentang partisi yang dikonfigurasi
sebagai tersembunyi dan partisi yang tidak tersedia untuk grup pengguna.
-d, --detail
Menyebabkan Menunjukkan perintah untuk memberikan detail tambahan jika tersedia. Mengulangi
opsi lebih dari sekali (misalnya, "-dd") akan menyebabkan Menunjukkan pekerjaan perintah untuk juga
daftar skrip batch, jika pekerjaan itu adalah pekerjaan batch.
-h, --membantu
Cetak pesan bantuan yang menjelaskan penggunaan scontrol.
--bersembunyi Jangan tampilkan informasi tentang partisi tersembunyi, tugas, dan langkah kerjanya. Oleh
default, baik partisi yang dikonfigurasi sebagai tersembunyi maupun partisi tersebut
tidak tersedia untuk grup pengguna akan ditampilkan (yaitu ini adalah perilaku default).
-M, --cluster=<string>
Cluster untuk mengeluarkan perintah. Hanya satu nama cluster yang dapat ditentukan.
-o, --satu baris
Cetak informasi satu baris per catatan.
-Q, --diam
Tidak mencetak pesan peringatan atau informasi, hanya pesan kesalahan fatal.
-v, --bertele-tele
Cetak pencatatan peristiwa terperinci. Beberapa -v's lebih lanjut akan meningkatkan verbositas dari
penebangan. Secara default hanya kesalahan yang akan ditampilkan.
-V , --Versi: kapan
Cetak informasi versi dan keluar.
PERINTAH
semua Tampilkan semua partisi, pekerjaan mereka dan langkah-langkah pekerjaan. Hal ini menyebabkan informasi menjadi
ditampilkan tentang partisi yang dikonfigurasi sebagai tersembunyi dan partisi yang
tidak tersedia untuk grup pengguna.
menggugurkan Instruksikan pengontrol Slurm untuk segera mengakhiri dan menghasilkan file inti.
Lihat "man slurmctld" untuk informasi tentang di mana file inti akan ditulis.
pos pemeriksaan CKPT_OP ID
Lakukan aktivitas pos pemeriksaan pada langkah kerja dengan identifikasi yang ditentukan.
ID dapat digunakan untuk mengidentifikasi pekerjaan tertentu (misalnya " ", yang berlaku untuk semua
langkah-langkah yang ada) atau langkah pekerjaan tertentu (misalnya " . "). Dapat diterima
nilai untuk CKPT_OP meliputi:
sanggup Uji jika saat ini tidak dinonaktifkan, laporkan waktu mulai jika pos pemeriksaan masuk
kemajuan
membuat Buat pos pemeriksaan dan lanjutkan pekerjaan atau langkah pekerjaan
menonaktifkan Nonaktifkan pos pemeriksaan di masa mendatang
aktif Aktifkan pos pemeriksaan di masa mendatang
kesalahan Laporkan hasil untuk permintaan pos pemeriksaan terakhir, kode kesalahan, dan
pesan
Restart Mulai ulang eksekusi pekerjaan atau langkah pekerjaan yang sebelumnya diperiksa
antrean Buat pos pemeriksaan dan requeue pekerjaan batch, menggabungkan mengosongkan dan
memulai kembali operasi
mengosongkan Buat pos pemeriksaan dan hentikan pekerjaan atau langkah pekerjaan
Nilai yang dapat diterima untuk CKPT_OP meliputi:
MaxTunggu= Waktu maksimum untuk menulis pos pemeriksaan. Nilai default adalah 10
detik. Berlaku dengan membuat dan mengosongkan pilihan saja.
ImageDir=
Lokasi file pos pemeriksaan. Berlaku dengan membuat, mengosongkan dan
Restart pilihan saja. Nilai ini lebih diutamakan daripada apa pun
--checkpoint-dir nilai yang ditentukan pada waktu penyerahan pekerjaan.
StickToNode Jika disetel, lanjutkan pekerjaan pada node yang sama yang sebelumnya digunakan.
Berlaku dengan Restart pilihan saja.
kelompok CLUSTER_NAME
Cluster untuk mengeluarkan perintah. Hanya satu nama cluster yang dapat ditentukan.
membuat SPESIFIKASI
Buat partisi atau reservasi baru. Lihat daftar lengkap parameter di bawah ini.
Sertakan tag "res" untuk membuat reservasi tanpa menentukan reservasi
Nama.
menyelesaikan
Tampilkan semua pekerjaan dalam status PENYELESAIAN bersama dengan node terkait baik di a
status LENGKAP atau TURUN.
hapus SPESIFIKASI
Hapus entri dengan yang ditentukan SPESIFIKASI. Keduanya SPESIFIKASI pilihan
adalah Nama Partisi= dan Reservasi=. Di Bluegene yang ditata secara dinamis
sistem NamaBlok= juga bekerja. Reservasi dan partisi seharusnya tidak ada
pekerjaan terkait pada saat penghapusannya (ubah pekerjaan terlebih dahulu). jika
partisi tertentu sedang digunakan, permintaan ditolak.
details
Menyebabkan Menunjukkan perintah untuk memberikan detail tambahan jika tersedia. Pekerjaan
informasi akan mencakup CPU dan memori NUMA yang dialokasikan pada setiap node. Perhatikan bahwa pada
komputer dengan hyperthreading diaktifkan dan Slurm dikonfigurasi untuk mengalokasikan inti, masing-masing
CPU yang terdaftar mewakili satu inti fisik. Setiap hyperthread pada inti itu dapat
mengalokasikan tugas terpisah, sehingga jumlah CPU tugas dan jumlah tugas mungkin berbeda. Lihat
--cpu_bind dan --mem_bind deskripsi opsi di halaman manual srun untuk lebih banyak
informasi. Itu details opsi saat ini hanya didukung untuk Menunjukkan pekerjaan
memerintah. Untuk juga mencantumkan skrip batch untuk pekerjaan batch, selain detailnya,
gunakan naskah opsi yang dijelaskan di bawah ini alih-alih opsi ini.
kesalahan ERNO
Diberikan nomor kesalahan Slurm, kembalikan string deskriptif.
keluar Hentikan eksekusi scontrol. Ini adalah perintah independen tanpa
pilihan dimaksudkan untuk digunakan dalam mode interaktif.
membantu Menampilkan deskripsi opsi dan perintah kontrol.
menyembunyikan Jangan tampilkan informasi langkah partisi, pekerjaan, atau pekerjaan untuk partisi yang
dikonfigurasi sebagai tersembunyi atau partisi yang tidak tersedia untuk grup pengguna. Ini
adalah perilaku default.
memegang daftar_pekerjaan
Cegah pekerjaan yang tertunda dari awal dimulai (menetapkan prioritasnya ke 0). Menggunakan
melepaskan perintah untuk mengizinkan pekerjaan dijadwalkan. Argumen job_list adalah
daftar ID pekerjaan yang dipisahkan koma ATAU "jobname=" dengan nama pekerjaan, yang akan
mencoba untuk menahan semua pekerjaan yang memiliki nama itu. Perhatikan bahwa ketika suatu pekerjaan dipegang oleh
administrator sistem menggunakan memegang perintah, hanya administrator sistem yang boleh
lepaskan pekerjaan untuk dieksekusi (lihat juga tunggu memerintah). Ketika pekerjaan dipegang oleh
pemiliknya, itu juga dapat dilepaskan oleh pemilik pekerjaan.
memberitahukan pekerjaan_id pesan
Kirim pesan ke kesalahan standar dari perintah salloc atau srun atau pekerjaan batch
terkait dengan yang ditentukan pekerjaan_id.
satu liner
Cetak informasi satu baris per catatan.
pidinfo proc_id
Cetak id pekerjaan Slurm dan waktu penghentian terjadwal sesuai dengan yang disediakan
ID proses, proc_id, pada simpul saat ini. Ini hanya akan bekerja dengan proses pada
simpul di mana scontrol dijalankan, dan hanya untuk proses-proses yang dihasilkan oleh Slurm dan
keturunan mereka.
listpid [pekerjaan_id[.langkah_id]] [NamaNode]
Cetak daftar ID proses dalam langkah pekerjaan (jika JOBID.STEPID disediakan), atau
semua langkah pekerjaan dalam pekerjaan (jika pekerjaan_id disediakan), atau semua langkah pekerjaan di
semua pekerjaan di node lokal (jika pekerjaan_id tidak disediakan atau pekerjaan_id adalah "*").
Ini hanya akan bekerja dengan proses pada node di mana scontrol dijalankan, dan hanya
untuk proses-proses yang dimunculkan oleh Slurm dan turunannya. Perhatikan bahwa beberapa Slurm
konfigurasi (Tipe Proctrack nilai hal or ayx) tidak dapat mengidentifikasi semua
proses yang terkait dengan pekerjaan atau langkah pekerjaan.
Perhatikan bahwa opsi NodeName hanya sangat berguna ketika Anda memiliki banyak slurmd
daemon yang berjalan pada mesin host yang sama. Beberapa daemon slurmd pada satu host adalah,
pada umumnya hanya digunakan oleh developer Slurm.
ping Ping daemon slurmctld primer dan sekunder dan laporkan jika mereka merespons.
tenang Tidak mencetak pesan peringatan atau informasi, hanya pesan kesalahan fatal.
berhenti Hentikan eksekusi scontrol.
reboot_nodes [Daftar Node]
Reboot semua node dalam sistem ketika mereka menjadi idle menggunakan Program Reboot as
dikonfigurasi dalam file slurm.conf Slurm. Menerima daftar pilihan node untuk reboot.
Secara default semua node di-boot ulang. CATATAN: Perintah ini tidak mencegah tambahan
pekerjaan dari yang dijadwalkan pada node ini, begitu banyak pekerjaan dapat dieksekusi pada node
sebelum mereka di-reboot. Anda dapat secara eksplisit menguras node untuk reboot
node sesegera mungkin, tetapi node juga harus secara eksplisit dikembalikan ke
layanan setelah di-boot ulang. Anda dapat membuat reservasi lanjutan secara bergantian ke
mencegah pekerjaan tambahan dimulai pada node untuk di-boot ulang. CATATAN: Node
akan ditempatkan dalam keadaan "MAINT" sampai reboot dan kembali ke layanan dengan a
keadaan normal. Sebagai alternatif, status node "MAINT" dapat dihapus dengan menggunakan
scontrol perintah untuk mengatur status node ke "LANJUTKAN", yang menghapus bendera "MAINT".
konfigurasikan ulang
Instruksikan semua daemon Slurm untuk membaca ulang file konfigurasi. Perintah ini tidak
tidak me-restart daemon. Mekanisme ini akan digunakan untuk mengubah konfigurasi
parameter (Epilog, Prolog, SlurmctldLogFile, SlurmdLogFile, dll.). Slurm
controller (slurmctld) meneruskan permintaan semua daemon lainnya (slurmd daemon on
setiap node komputasi). Menjalankan pekerjaan melanjutkan eksekusi. Sebagian besar parameter konfigurasi
dapat diubah hanya dengan menjalankan perintah ini, namun, daemon Slurm seharusnya
shutdown dan restart jika salah satu dari parameter ini akan diubah: AuthType,
BackupAddr, BackupController, ControlAddr, ControlMach, PluginDir,
StateSaveLocation, SlurmctldPort atau SlurmdPort. Daemon slurmctld harus
restart jika node ditambahkan ke atau dihapus dari cluster.
melepaskan daftar_pekerjaan
Lepaskan pekerjaan yang ditahan sebelumnya untuk memulai eksekusi. Argumen job_list adalah koma
daftar ID pekerjaan yang terpisah ATAU "nama pekerjaan=" dengan nama pekerjaan, yang akan mencoba untuk
tahan semua pekerjaan yang memiliki nama itu. Lihat juga memegang.
antrean daftar_pekerjaan
Requeue pekerjaan batch Slurm yang berjalan, ditangguhkan atau selesai ke status tertunda. NS
argumen job_list adalah daftar ID pekerjaan yang dipisahkan koma.
penampung ulang daftar_pekerjaan
Requeue pekerjaan batch Slurm yang sedang berjalan, ditangguhkan atau selesai ke status tertunda,
apalagi pekerjaan dimasukkan ke dalam status ditahan (prioritas nol). Argumen job_list adalah
daftar ID pekerjaan yang dipisahkan koma. Pekerjaan yang ditahan dapat dilepaskan menggunakan kontrol untuk
atur ulang prioritasnya (mis. "rilis kontrol "). Perintah menerima
pilihan berikut:
Status=Keluar Khusus
Kata kunci "SpecialExit" menentukan bahwa pekerjaan harus ditempatkan di tempat khusus
negara JOB_SPECIAL_EXIT. Perintah "scontrol show job" akan menampilkan
Status Pekerjaan sebagai KHUSUS_KELUAR, sedangkan perintah "squeue" sebagai SE.
lanjut daftar_pekerjaan
Melanjutkan pekerjaan yang sebelumnya ditangguhkan. Argumen job_list adalah daftar yang dipisahkan koma
dari ID pekerjaan. Lihat juga menangguhkan.
CATATAN: Pekerjaan yang ditangguhkan melepaskan CPU-nya untuk dialokasikan ke pekerjaan lain. Melanjutkan
pekerjaan yang sebelumnya ditangguhkan dapat mengakibatkan beberapa pekerjaan dialokasikan pada CPU yang sama,
yang dapat memicu penjadwalan geng dengan beberapa konfigurasi atau degradasi parah
dalam kinerja dengan konfigurasi lain. Gunakan perintah scancel untuk mengirim
Sinyal SIGSTOP dan SIGCONT akan menghentikan pekerjaan tanpa melepaskan CPU-nya untuk
mengalokasikan ke pekerjaan lain dan akan menjadi mekanisme yang lebih disukai dalam banyak kasus. Menggunakan
dengan hati-hati.
tingkat jadwal TINGKAT
Mengaktifkan atau menonaktifkan logging penjadwal. TINGKAT mungkin "0", "1", "nonaktifkan" atau "aktifkan".
"0" memiliki efek yang sama dengan "nonaktifkan". "1" memiliki efek yang sama dengan "mengaktifkan". Ini
nilai bersifat sementara dan akan ditimpa ketika daemon slurmctld membaca
slurm.conf file konfigurasi (misalnya ketika daemon di-restart atau kendali
konfigurasikan ulang dijalankan) jika parameter SlurmSchedLogLevel ada.
naskah Menyebabkan Menunjukkan pekerjaan perintah untuk membuat daftar skrip batch untuk pekerjaan batch selain
informasi detail yang dijelaskan di bawah details opsi di atas.
setdebug TINGKAT
Ubah tingkat debug daemon slurmctld. TINGKAT mungkin merupakan nilai bilangan bulat
antara nol dan sembilan (menggunakan nilai yang sama dengan SlurmctldDebug dalam slurm.conf
file) atau nama jenis pesan paling detail yang akan dicetak: "quiet",
"fatal", "error", "info", "verbose", "debug", "debug2", "debug3", "debug4", atau
"debug5". Nilai ini bersifat sementara dan akan ditimpa setiap kali slurmctld
daemon membaca file konfigurasi slurm.conf (misalnya ketika daemon di-restart
or kendali konfigurasikan ulang dieksekusi).
setdebugflag [+|-]BENDERA
Tambahkan atau hapus DebugFlags dari daemon slurmctld. Lihat "man slurm.conf" untuk daftarnya
dari DebugFlag yang didukung. CATATAN: Mengubah nilai beberapa DebugFlags tidak akan ada
efek tanpa memulai ulang daemon slurmctld, yang akan mengatur berbasis DebugFlags
pada isi file konfigurasi slurm.conf.
Menunjukkan KESATUAN ID
Menampilkan status entitas yang ditentukan dengan identifikasi yang ditentukan.
KESATUAN mungkin alias, Cache, config, daemon, paling depan, pekerjaan, simpul, pembagian,
powercap, Pemesanan, slurmd, langkah, topologi, daftar tuan rumah, daftar host diurutkan or
nama host (Juga blok or kapal selam pada sistem BlueGene). ID dapat digunakan untuk mengidentifikasi
elemen spesifik dari entitas yang diidentifikasi: ID pekerjaan, nama node, nama partisi,
nama reservasi, atau ID langkah pekerjaan untuk pekerjaan, simpul, pembagian, atau langkah masing.
Untuk KESATUAN of topologi, yang ID mungkin nama node atau switch. Jika satu nama simpul
ditentukan, semua sakelar yang terhubung ke simpul itu (dan sakelar induknya) akan
ditampilkan. Jika lebih dari satu nama node ditentukan, hanya switch yang terhubung ke
semua node bernama akan ditampilkan. alias akan mengembalikan semua NamaNode nilai yang terkait
untuk diberikan NodeHostname (berguna untuk mendapatkan daftar node virtual yang terkait dengan a
simpul nyata dalam konfigurasi di mana beberapa daemon slurmd dijalankan pada satu
menghitung simpul). Cache menampilkan konten internal slurmctld saat ini
cache untuk pengguna dan asosiasi. config menampilkan nama parameter dari
file konfigurasi dalam kasus campuran (misalnya SlurmdPort=7003) saat parameter turunan
nama hanya dalam huruf besar (misalnya SLURM_VERSION). nama host mengambil opsional
ekspresi hostlist sebagai input dan menulis daftar nama host individual ke standar
keluaran (satu per baris). Jika tidak ada ekspresi hostlist yang diberikan, isi dari
Variabel lingkungan SLURM_NODELIST digunakan. Misalnya "tux[1-3]" dipetakan ke
"tux1", "tux2" dan "tux3" (satu nama host per baris). daftar tuan rumah mengambil daftar host
nama dan mencetak ekspresi hostlist untuk mereka (kebalikan dari nama host).
daftar tuan rumah juga dapat mengambil nama path absolut dari suatu file (dimulai dengan
karakter '/') yang berisi daftar nama host. Beberapa nama node mungkin
ditentukan menggunakan ekspresi rentang simpul sederhana (misalnya "lx[10-20]"). Semua lainnya ID
nilai harus mengidentifikasi satu elemen. ID langkah pekerjaan berbentuk
"job_id.step_id", (misalnya "1234.1"). slurmd melaporkan status slurmd saat ini
daemon yang dieksekusi pada node yang sama dari mana perintah scontrol dijalankan (the
tuan rumah lokal). Ini dapat berguna untuk mendiagnosis masalah. Secara default daftar tuan rumah tidak
mengurutkan daftar simpul atau membuatnya unik (misalnya tux2,tux1,tux2 = tux[2,1-2]). Jika kamu
ingin daftar yang diurutkan gunakan daftar host diurutkan (misalnya tux2,tux1,tux2 = tux[1-2,2]). Oleh
default, semua elemen dari tipe entitas yang ditentukan akan dicetak. Untuk sebuah KESATUAN of
pekerjaan, jika pekerjaan tidak menentukan socket-per-node, core-per-socket atau thread-per-
core maka akan menampilkan '*' di kolom ReqS:C:T=*:*:*.
penutupan PILIHAN
Instruksikan daemon Slurm untuk menyimpan status saat ini dan mengakhiri. Secara default, Slurm
controller (slurmctld) meneruskan permintaan semua daemon lainnya (slurmd daemon on
setiap node komputasi). NS PILIHAN of slurmctld or pengawas hanya menghasilkan
slurmctld daemon sedang dimatikan dan daemon slurmd tetap aktif.
menangguhkan daftar_pekerjaan
Menangguhkan pekerjaan yang sedang berjalan. Argumen job_list adalah daftar ID pekerjaan yang dipisahkan koma.
Gunakan lanjut perintah untuk melanjutkan eksekusinya. Proses pengguna harus berhenti pada
menerima sinyal SIGSTOP dan melanjutkan setelah menerima SIGCONT untuk operasi ini ke
menjadi efektif. Tidak semua arsitektur dan konfigurasi mendukung penangguhan pekerjaan. Jika
pekerjaan yang ditangguhkan adalah requeued, itu akan ditempatkan dalam status ditahan.
pengambilalihan
Instruksikan pengontrol cadangan Slurm (slurmctld) untuk mengambil alih kendali sistem.
Pengontrol cadangan Slurm meminta kontrol dari yang utama dan menunggunya
penghentian. Setelah itu, ia beralih dari mode cadangan ke mode pengontrol. Jika
pengontrol utama tidak dapat dihubungi, itu langsung beralih ke mode pengontrol.
Ini dapat digunakan untuk mempercepat mekanisme kegagalan pengontrol Slurm ketika
simpul utama turun. Ini dapat digunakan untuk meminimalkan gangguan jika komputer
mengeksekusi pengontrol Slurm utama dijadwalkan turun. (Catatan: Slurm utama
controller akan mengambil kendali kembali saat startup.)
tunggu daftar_pekerjaan
Cegah pekerjaan yang tertunda agar tidak dimulai (menetapkan prioritasnya ke 0). daftar_pekerjaan
argumen adalah daftar ID pekerjaan atau nama pekerjaan yang dipisahkan spasi. Menggunakan melepaskan
perintah untuk mengizinkan pekerjaan dijadwalkan. Perintah ini dirancang untuk sistem
administrator untuk memegang pekerjaan sehingga pemilik pekerjaan dapat melepaskannya daripada
memerlukan intervensi dari administrator sistem (lihat juga: memegang memerintah).
memperbarui SPESIFIKASI
Perbarui pekerjaan, langkah, simpul, partisi, pembatasan daya, atau konfigurasi reservasi per
spesifikasi yang disediakan. SPESIFIKASI dalam format yang sama dengan Slurm
file konfigurasi dan output dari Menunjukkan perintah yang dijelaskan di atas. Itu mungkin
diinginkan untuk mengeksekusi Menunjukkan perintah (dijelaskan di atas) pada entitas tertentu Anda
yang akan diperbarui, lalu gunakan alat potong dan tempel untuk memasukkan nilai konfigurasi yang diperbarui
ke memperbarui. Perhatikan bahwa sebagian besar nilai konfigurasi dapat diubah menggunakan ini
perintah, tidak semua dapat diubah menggunakan mekanisme ini. Secara khusus, perangkat keras
konfigurasi node atau penambahan fisik atau penghapusan node dari
cluster hanya dapat dicapai melalui pengeditan file konfigurasi Slurm dan
mengeksekusi konfigurasikan ulang perintah (dijelaskan di atas).
bertele-tele
Cetak pencatatan peristiwa terperinci. Ini termasuk stempel waktu pada struktur data, catatan
hitungan, dll.
versi
Menampilkan nomor versi scontrol yang dijalankan.
tunggu_pekerjaan pekerjaan_id
Tunggu hingga pekerjaan dan semua nodenya siap digunakan atau pekerjaan telah memasuki beberapa
keadaan terminasi. Opsi ini sangat berguna di Prolog Slurm atau di
skrip batch itu sendiri jika node dimatikan dan dimulai ulang secara otomatis sebagai
dibutuhkan.
menulis config
Tulis konfigurasi saat ini ke file dengan konvensi penamaan
"slurm.conf. " di direktori yang sama dengan file slurm.conf asli.
!! Ulangi perintah terakhir yang dieksekusi.
SPESIFIKASI UNTUK UPDATE MEMERINTAH, JOBS
Akun=
Nama akun yang akan diubah untuk penggunaan sumber daya pekerjaan ini. Nilai dapat dihapus dengan
nilai data kosong, "Akun=".
ArrayTugasThrottle=
Tentukan jumlah maksimum tugas dalam larik pekerjaan yang dapat dijalankan pada saat yang sama
waktu. Atur hitungan ke nol untuk menghilangkan batas apa pun. Tugas mencekik
count untuk larik pekerjaan dilaporkan sebagai bagian dari bidang ArrayTaskId, didahului dengan a
tanda persen. Misalnya "ArrayTaskId=1-10%2" menunjukkan jumlah maksimum
menjalankan tugas terbatas pada 2.
BurstBuffer=
Spesifikasi buffer burst akan diubah untuk penggunaan sumber daya tugas ini. Nilai mungkin
dibersihkan dengan nilai data kosong, "BurstBuffer=". Formatnya adalah plugin buffer burst
spesifik.
Tipe-Sambungan=
Setel ulang jenis koneksi simpul. Hanya didukung pada sistem IBM BlueGene. Mungkin
nilai pada adalah "MESH", "TORUS" dan "NAV" (mesh lain torus).
Berdekatan=
Tetapkan persyaratan pekerjaan untuk node yang berdekatan (berturut-turut) yang akan dialokasikan.
Nilai yang mungkin adalah "YA" dan "TIDAK". Hanya administrator atau root Slurm yang dapat
mengubah parameter ini.
Ketergantungan=
Tunda inisiasi pekerjaan sampai spesifikasi ketergantungan pekerjaan yang ditentukan terpenuhi.
Batalkan ketergantungan dengan daftar_dependensi kosong (mis. "Ketergantungan=").
<daftar_ketergantungan> berbentukketik:id_pekerjaan[:id_pekerjaan][,ketik:id_pekerjaan[:id_pekerjaan]]>.
Banyak pekerjaan dapat berbagi ketergantungan yang sama dan pekerjaan ini bahkan mungkin milik yang berbeda
pengguna.
setelah:job_id[:jobid...]
Pekerjaan ini dapat memulai eksekusi setelah pekerjaan yang ditentukan telah mulai dieksekusi.
setelah itu:job_id[:jobid...]
Pekerjaan ini dapat memulai eksekusi setelah pekerjaan yang ditentukan telah dihentikan.
setelahnotok:job_id[:jobid...]
Pekerjaan ini dapat mulai dieksekusi setelah pekerjaan yang ditentukan telah berakhir pada
beberapa status gagal (kode keluar bukan nol, kegagalan simpul, waktu habis, dll).
setelahnya:job_id[:jobid...]
Pekerjaan ini dapat mulai dieksekusi setelah pekerjaan yang ditentukan berhasil
dieksekusi (berlari sampai selesai dengan kode keluar nol).
tunggal
Pekerjaan ini dapat mulai dieksekusi setelah pekerjaan yang diluncurkan sebelumnya membagikan
nama pekerjaan dan pengguna yang sama telah dihentikan.
Waktu yang Layak=
Lihat Waktu mulai.
Daftar Node Exc=
Tetapkan daftar pekerjaan dari node yang dikecualikan. Beberapa nama node dapat ditentukan menggunakan
ekspresi rentang simpul sederhana (misalnya "lx[10-20]"). Nilai dapat dihapus dengan kosong
nilai data, "ExcNodeList=".
Fitur=
Setel fitur simpul yang diperlukan pekerjaan. Daftar fitur mungkin termasuk beberapa
nama fitur dipisahkan oleh operator ampersand (AND) dan/atau vertikal bar (OR). Untuk
contoh: Fitur="opteron&video" or Fitur="cepat|lebih cepat". Pada contoh pertama,
hanya node yang memiliki fitur "opteron" DAN fitur "video" yang akan digunakan.
Tidak ada mekanisme untuk menentukan bahwa Anda menginginkan satu node dengan fitur "opteron" dan
node lain dengan fitur "video" jika tidak ada node yang memiliki kedua fitur tersebut. Jika hanya satu
dari satu set opsi yang memungkinkan harus digunakan untuk semua node yang dialokasikan, kemudian gunakan
OR operator dan sertakan opsi dalam tanda kurung siku. Sebagai contoh:
"Fitur=[rack1|rack2|rack3|rack4]" mungkin digunakan untuk menentukan bahwa semua node harus
dialokasikan pada satu rak cluster, tetapi salah satu dari empat rak tersebut dapat
digunakan. Permintaan juga dapat menentukan jumlah node yang dibutuhkan dengan beberapa fitur dengan
menambahkan tanda bintang dan menghitung setelah nama fitur. Sebagai contoh
"Fitur=grafik*4" menunjukkan bahwa setidaknya empat node yang dialokasikan harus memiliki
fitur "grafik." Batasan dengan jumlah node hanya dapat digabungkan dengan AND
operator. Nilai dapat dihapus dengan nilai data kosong, misalnya "Fitur=".
Geometri=
Atur ulang geometri pekerjaan yang diperlukan. Pada Blue Gene nilainya harus tiga digit
dipisahkan dengan "x" atau ",". Digit mewakili ukuran alokasi di X, Y dan Z
dimensi (misalnya "2x3x4").
Gres=
Menentukan daftar sumber daya habis pakai generik yang dibatasi koma. Format dari
setiap entri dalam daftar adalah "name[:count[*cpu]]". Namanya adalah bahan habis pakai
sumber. Hitungan adalah jumlah sumber daya tersebut dengan nilai default 1.
Sumber daya yang ditentukan akan dialokasikan ke pekerjaan pada setiap node yang dialokasikan kecuali
"*cpu" ditambahkan, dalam hal ini sumber daya akan dialokasikan pada per cpu
dasar. Sumber daya konsumsi generik yang tersedia dapat dikonfigurasi oleh sistem
administrator. Daftar sumber daya konsumsi generik yang tersedia akan dicetak
dan perintah akan keluar jika argumen opsi adalah "bantuan". Contoh penggunaan
termasuk "Gres=gpus:2*cpu,disk=40G" dan "Gres=help".
IDPekerjaan=
Identifikasi pekerjaan yang akan diperbarui. Job_list mungkin berupa daftar yang dipisahkan koma dari
ID pekerjaan. Salah satu IDPekerjaan or Nama Pekerjaan Dibutuhkan.
Lisensi=
Spesifikasi lisensi (atau sumber daya lain yang tersedia di semua node dari
cluster) seperti yang dijelaskan dalam halaman manual salloc/sbatch/srun.
MinCPUsNode=
Tetapkan jumlah minimum pekerjaan CPU per node ke nilai yang ditentukan.
MinMemoriCPU=
Setel memori nyata minimum pekerjaan yang diperlukan per CPU yang dialokasikan ke yang ditentukan
nilai. Salah satu MinMemoriCPU or MinMemoryNode dapat diatur, tetapi tidak keduanya.
MinMemoryNode=
Tetapkan memori nyata minimum pekerjaan yang diperlukan per node ke nilai yang ditentukan. Salah satu
MinMemoriCPU or MinMemoryNode dapat diatur, tetapi tidak keduanya.
MinTmpDiskNode=
Atur ruang disk sementara minimum pekerjaan yang diperlukan per node ke yang ditentukan
nilai. Hanya administrator atau root Slurm yang dapat mengubah parameter ini.
Nama Pekerjaan=
Identifikasi nama pekerjaan yang akan dimodifikasi atau atur nama pekerjaan ke yang ditentukan
nilai. Ketika digunakan untuk mengidentifikasi pekerjaan yang akan dimodifikasi, semua pekerjaan milik semua pengguna
dimodifikasi kecuali Identitas pengguna pilihan digunakan untuk mengidentifikasi pengguna tertentu. Salah satu
IDPekerjaan or Nama Pekerjaan Dibutuhkan.
Bagus[=delta]
Sesuaikan prioritas pekerjaan dengan nilai yang ditentukan. Nilai default adalah 100. Penyesuaian
rentang dari -10000 (prioritas tertinggi) hingga 10000 (prioritas terendah). Nilai yang bagus
perubahan tidak aditif, tetapi menimpa nilai bagus sebelumnya dan diterapkan ke
prioritas dasar pekerjaan. Hanya pengguna dengan hak istimewa, administrator Slurm atau root, yang dapat
tentukan penyesuaian negatif.
Daftar Node=
Ubah node yang dialokasikan ke pekerjaan yang sedang berjalan untuk mengecilkan ukurannya. yang ditentukan
daftar node harus merupakan subset dari node yang saat ini dialokasikan untuk pekerjaan tersebut.
Beberapa nama node dapat ditentukan menggunakan ekspresi rentang node sederhana (mis
"lx[10-20]"). Setelah alokasi job dikurangi, selanjutnya lari perintah harus
secara eksplisit menentukan jumlah node dan tugas yang valid untuk alokasi baru.
JumlahCPU= [- ]
Tetapkan jumlah CPU minimum dan opsional maksimum pekerjaan yang akan dialokasikan.
JumlahNode= [- ]
Tetapkan jumlah node minimum dan opsional maksimum pekerjaan yang akan dialokasikan. Jika
pekerjaan sudah berjalan, gunakan ini untuk menentukan jumlah simpul kurang dari saat ini
dialokasikan dan sumber daya yang sebelumnya dialokasikan untuk pekerjaan itu akan dilepaskan. Setelah
alokasi pekerjaan berkurang, selanjutnya lari perintah harus secara eksplisit menentukan
jumlah node dan tugas yang valid untuk alokasi baru. Lihat juga Daftar Node
parameter di atas.
JumlahTugas=
Tetapkan jumlah tugas tugas yang diperlukan ke nilai yang ditentukan.
sekat=
Atur partisi pekerjaan ke nilai yang ditentukan.
Prioritas=
Tetapkan prioritas pekerjaan ke nilai yang ditentukan. Perhatikan bahwa prioritas pekerjaan nol
mencegah pekerjaan dari yang pernah dijadwalkan. Dengan menetapkan prioritas pekerjaan ke nol
diadakan. Tetapkan prioritas ke nilai bukan nol untuk mengizinkannya berjalan. Secara eksplisit
menyetel prioritas pekerjaan menghapus nilai bagus yang ditetapkan sebelumnya dan menghapus
kemampuan plugin prioritas/multifaktor untuk mengelola prioritas pekerjaan. Untuk
mengembalikan kemampuan plugin prioritas/multifaktor untuk mengelola prioritas pekerjaan, tahan
dan kemudian melepaskan pekerjaan. Hanya administrator atau root Slurm yang dapat meningkatkan pekerjaan
prioritas.
QOS=
Atur QOS (Quality Of Service) pekerjaan ke nilai yang ditentukan. Nilai mungkin
dibersihkan dengan nilai data kosong, "QOS=".
DaftarNodePermintaan=
Tetapkan daftar pekerjaan dari node yang diperlukan. Beberapa nama node dapat ditentukan menggunakan
ekspresi rentang simpul sederhana (misalnya "lx[10-20]"). Nilai dapat dihapus dengan kosong
nilai data, "ReqNodeList=".
antrean=<0|1>
Menetapkan apakah pekerjaan harus diantrekan kembali setelah kegagalan node: 0 untuk tidak, 1 untuk
iya nih.
Nama Reservasi=
Atur reservasi pekerjaan ke nilai yang ditentukan. Nilai dapat dihapus dengan kosong
nilai data, "ReservationName=".
Putar=
Izinkan geometri pekerjaan untuk diputar. Nilai yang mungkin adalah "YA" dan "TIDAK".
bersama=
Atur kemampuan pekerjaan untuk berbagi node dengan pekerjaan lain. Nilai yang mungkin adalah "YA"
dan tidak". Opsi ini hanya dapat diubah untuk pekerjaan yang tertunda.
Waktu mulai=
Atur waktu inisiasi pekerjaan paling awal. Ia menerima waktu dari formulir JJ:MM:SS untuk
menjalankan pekerjaan pada waktu tertentu dalam sehari (detik adalah opsional). (Jika waktu itu
sudah lewat, hari berikutnya diasumsikan.) Anda juga dapat menentukan tengah malam, tengah hari, fika
(3 sore) atau minum teh (4 PM) dan Anda dapat memiliki akhiran waktu dengan AM or PM untuk
lari pagi atau sore hari. Anda juga dapat mengatakan hari apa pekerjaan itu
jalankan, dengan menentukan tanggal formulir MMDDYY or MM/HH/YY or MM.DD.YY, atau tanggal dan
waktu sebagai YYYY-MM-DD[THH:MM[:SS]]. Anda juga dapat memberikan waktu seperti sekarang + menghitung
satuan waktu, di mana satuan waktu dapat menit, jam, hari-hari, atau minggu dan Anda dapat
beri tahu Slurm untuk menjalankan pekerjaan hari ini dengan kata kunci hari ini dan untuk menjalankan pekerjaan besok
dengan kata kunci besok.
Catatan tentang spesifikasi tanggal/waktu:
- meskipun bidang 'detik' dari spesifikasi waktu HH:MM:SS diizinkan oleh
kode, perhatikan bahwa waktu polling penjadwal Slurm tidak cukup tepat untuk
menjamin pengiriman pekerjaan pada detik yang tepat. Pekerjaan akan memenuhi syarat untuk
mulai pada polling berikutnya mengikuti waktu yang ditentukan. Interval polling yang tepat
tergantung pada penjadwal Slurm (misalnya, 60 detik dengan sched/builtin default).
- jika tidak ada waktu (JJ:MM:SS) yang ditentukan, defaultnya adalah (00:00:00).
- jika tanggal ditentukan tanpa tahun (misalnya, MM/DD) maka tahun berjalan adalah
diasumsikan, kecuali kombinasi MM/DD dan HH:MM:SS telah lulus untuk itu
tahun, dalam hal ini tahun berikutnya digunakan.
Switch= [@ ]
Ketika topologi pohon digunakan, ini menentukan jumlah maksimum sakelar yang diinginkan
untuk alokasi pekerjaan. Jika Slurm menemukan alokasi yang berisi lebih banyak sakelar daripada
jumlah yang ditentukan, pekerjaan tetap tertunda sampai menemukan alokasi
dengan jumlah sakelar yang diinginkan atau batas waktu berakhir. Secara default tidak ada sakelar
batas hitungan dan tidak ada batas waktu tunda. Atur hitungan ke nol untuk membersihkan apapun
hitungan yang ditetapkan sebelumnya (menonaktifkan batas). Penundaan waktu maksimum pekerjaan mungkin
dibatasi oleh administrator sistem menggunakan PenjadwalParameter konfigurasi
parameter dengan max_switch_wait opsi parameter. Lihat juga tunggu-untuk-beralih.
Batas waktu=
Batas waktu pekerjaan. Format keluaran adalah [hari-]jam:menit:detik atau
"TAK TERBATAS". Format masukan (untuk memperbarui perintah) set adalah menit, menit:detik,
jam:menit:detik, hari-jam, hari-jam:menit atau
hari-jam:menit:detik. Resolusi waktu adalah satu menit dan nilai detik adalah
dibulatkan ke menit berikutnya. Jika mengubah batas waktu pekerjaan, tentukan
nilai batas waktu baru atau mendahului waktu dengan "+" atau "-" untuk menambah atau
mengurangi batas waktu saat ini (misalnya "TimeLimit=+30"). Untuk meningkatkan atau
mengurangi batas waktu saat ini, IDPekerjaan spesifikasi harus mendahului
Batas waktu spesifikasi. Hanya administrator atau root Slurm yang dapat meningkatkan pekerjaan
Batas waktu.
Identitas pengguna=
Digunakan dengan Nama Pekerjaan pilihan untuk mengidentifikasi pekerjaan yang akan dimodifikasi. Entah nama pengguna
atau ID numerik (UID), dapat ditentukan.
Kunci WC=
Setel kunci karakterisasi beban kerja pekerjaan ke nilai yang ditentukan.
CATATAN: Perintah "tampilkan", bila digunakan dengan "pekerjaan" atau "pekerjaan "
entitas menampilkan informasi rinci tentang pekerjaan atau pekerjaan. Banyak dari informasi ini
dapat dimodifikasi menggunakan perintah "perbarui pekerjaan" seperti yang dijelaskan di atas. Namun,
bidang berikut yang ditampilkan oleh perintah show job adalah read-only dan tidak dapat
diubah:
Alokasi Node:Sid
Node lokal dan id sistem membuat alokasi sumber daya.
Bendera Batch
Pekerjaan yang dikirimkan menggunakan perintah sbatch memiliki BatchFlag yang disetel ke 1. Pekerjaan yang dikirimkan
menggunakan perintah lain, BatchFlag disetel ke 0.
Spesifikasi Inti=
Jumlah inti untuk cadangan per node untuk penggunaan sistem. Pekerjaan akan dikenakan biaya untuk
inti ini, tetapi tidak dapat menggunakannya. Akan dilaporkan sebagai "*" jika tidak
dibatasi.
Akhir waktu
Waktu pekerjaan diharapkan berakhir berdasarkan batas waktu pekerjaan. Ketika
pekerjaan berakhir lebih cepat, bidang ini akan diperbarui dengan waktu akhir yang sebenarnya.
Kode Keluar= :
Status keluar dilaporkan untuk pekerjaan oleh fungsi wait(). Angka pertama adalah
kode keluar, biasanya diatur oleh fungsi exit(). bilangan kedua dari
sinyal yang menyebabkan proses berhenti jika dihentikan oleh sinyal.
Id Grup
Grup tempat tugas dikirimkan.
Status Pekerjaan
Kondisi pekerjaan saat ini.
Daftar Node
Daftar node yang dialokasikan untuk pekerjaan.
NodeListIndexes
NodeIndices mengekspos indeks internal ke dalam tabel node yang terkait dengan
node (s) yang dialokasikan untuk pekerjaan.
TugasPerN:B:S:C=
: : :
Menentukan jumlah tugas yang akan dimulai per komponen perangkat keras (node,
alas tiang, soket dan inti). Nilai yang tidak dibatasi dapat ditampilkan sebagai "0" atau "*".
Waktu Preempt
Waktu di mana pekerjaan ditandai bahwa itu dipilih untuk preemption. (Berarti
hanya untuk PreemptMode=CANCEL dan partisi atau QOS yang pekerjaannya
terkait memiliki nilai GraceTime yang ditunjuk.)
Waktu PraSus
Waktu pekerjaan berjalan sebelum penangguhan terakhir.
Alasan Alasan pekerjaan tidak berjalan: misalnya, menunggu "Sumber Daya".
PersyaratanB:S:C:T=
: : :
Menentukan jumlah berbagai komponen perangkat keras yang diminta oleh pekerjaan.
Nilai yang tidak dibatasi dapat ditampilkan sebagai "0" atau "*".
DetikPraSuspend=
Jika pekerjaan ditangguhkan, ini adalah waktu proses yang diakumulasikan oleh pekerjaan (dalam detik)
sebelum ditangguhkan.
kaus kaki/simpul=
Hitungan soket yang diinginkan per node
Waktu Kirim
Stempel waktu dan tanggal (dalam Universal Time Coordinated, UTC) pekerjaan itu
diserahkan. Format output identik dengan bidang EndTime.
CATATAN: Jika pekerjaan diantrekan ulang, waktu pengiriman akan diatur ulang. Untuk mendapatkan yang asli
mengirimkan waktu perlu menggunakan "sacct -j ]" perintah juga
menunjuk opsi -D atau --duplicate untuk menampilkan semua entri duplikat untuk a
pekerjaan.
Waktu Penangguhan
Waktu pekerjaan terakhir ditangguhkan atau dilanjutkan.
Identitas pengguna Pengguna tempat pekerjaan dikirimkan.
CATATAN pada informasi yang ditampilkan untuk berbagai status pekerjaan:
Saat Anda mengajukan permintaan untuk fungsi "tampilkan pekerjaan", proses kontrol membuat
RPC meminta panggilan ke slurmctld dengan tipe pesan REQUEST_JOB_INFO. Jika negara
pekerjaan adalah PENDING, kemudian mengembalikan beberapa informasi detail seperti: min_nodes,
min_procs, cpus_per_task, dll. Jika statusnya selain PENDING, kode akan diasumsikan
bahwa itu dalam keadaan lebih lanjut seperti RUNNING, COMPLETE, dll. Dalam kasus ini
kode secara eksplisit mengembalikan nol untuk nilai-nilai ini. Nilai-nilai ini tidak ada artinya sekali
sumber daya pekerjaan telah dialokasikan dan pekerjaan telah dimulai.
SPESIFIKASI UNTUK UPDATE MEMERINTAH, LANGKAH
LangkahId= [. ]
Identifikasi langkah yang akan diperbarui. Jika job_id diberikan, tetapi tidak ada step_id
ditentukan maka semua langkah dari pekerjaan yang diidentifikasi akan dimodifikasi. Ini
spesifikasi diperlukan.
File Komp=
Perbarui langkah dengan informasi tentang penyelesaian langkah. Dapat bermanfaat jika langkah
statistik tidak langsung tersedia melalui plugin jobacct_gather. Filenya adalah
file yang dibatasi spasi dengan format untuk Versi 1 adalah sebagai berikut
1 34461 0 2 0 3 1361906011 1361906015 1 1 3368 13357 / bin / tidur
ABCDEFGHIJKLM
Deskripsi Bidang:
Versi file
Api B ALPS
blok masuk C
D outblock
E status keluar
F jumlah CPU yang dialokasikan
G waktu mulai
H akhir waktu
saya utime
Waktu J
K maksrs
cair
Nama perintah M
Batas waktu=
Batas waktu pekerjaan. Format keluaran adalah [hari-]jam:menit:detik atau
"TAK TERBATAS". Format masukan (untuk memperbarui perintah) set adalah menit, menit:detik,
jam:menit:detik, hari-jam, hari-jam:menit atau
hari-jam:menit:detik. Resolusi waktu adalah satu menit dan nilai detik adalah
dibulatkan ke menit berikutnya. Jika mengubah batas waktu langkah, baik
tentukan nilai batas waktu baru atau awali waktu dengan "+" atau "-" untuk bertambah
atau kurangi batas waktu saat ini (misalnya "TimeLimit=+30"). Untuk meningkatkan
atau mengurangi batas waktu saat ini, LangkahId spesifikasi harus mendahului
Batas waktu spesifikasi.
SPESIFIKASI UNTUK UPDATE MEMERINTAH, NODA
NamaNode=
Identifikasi node yang akan diperbarui. Beberapa nama node dapat ditentukan menggunakan
ekspresi rentang simpul sederhana (misalnya "lx[10-20]"). Spesifikasi ini diperlukan.
Fitur=
Identifikasi fitur yang akan dikaitkan dengan node yang ditentukan. Sebelumnya
fitur yang ditentukan akan ditimpa dengan nilai baru. Fitur yang diberikan melalui
kendali hanya akan bertahan selama restart daemon slurmctld dengan -R
opsi dan file status yang diawetkan atau tanda terima SIGHUP slurmctld. Memperbarui
slurm.conf dengan perubahan apa pun yang dimaksudkan untuk bertahan di seluruh restart normal
slurmctld atau eksekusi kendali konfigurasi ulang.
Gres=
Identifikasi sumber daya generik untuk dikaitkan dengan node yang ditentukan. Setiap
sumber daya generik yang ditentukan sebelumnya akan ditimpa dengan nilai baru.
Spesifikasi untuk beberapa sumber daya generik harus dipisahkan dengan koma. Setiap
spesifikasi sumber daya terdiri dari nama diikuti oleh titik dua opsional dengan a
nilai numerik (nilai default adalah satu) (misalnya "Gres=bandwidth:10000,gpus"). Umum
sumber daya yang ditugaskan melalui kendali hanya akan bertahan selama restart
slurmctld daemon dengan -R opsi dan status file yang diawetkan atau slurmctld's
penerimaan SIGHUP. Perbarui slurm.conf dengan perubahan apa pun yang dimaksudkan untuk bertahan
di restart normal slurmctld atau eksekusi kendali konfigurasi ulang.
Alasan=
Identifikasi alasan node berada dalam "BAWAH". "DRAINING", "DRAINING", "GAGAL" atau
status "GAGAL". Gunakan tanda kutip untuk menyertakan alasan yang memiliki lebih dari satu kata.
Negara=
Identifikasi status yang akan ditugaskan ke node. Status simpul yang mungkin adalah "NoResp",
"ALLOC", "ALOKASI", "SELESAI", "TURUN", "DRAIN", "ERROR, "GAGAL", "GAGAL",
"FUTURE" "IDLE", "MAINT", "CAMPURAN", "PERFCTRS/NPC", "RESERVED", "POWER_DOWN",
"POWER_UP", "LANJUTKAN" atau "UNDRAIN". Tidak semua status tersebut dapat diatur menggunakan
scontrol hanya perintah berikut yang dapat: "NoResp", "DRAIN", "FAIL", "FUTURE",
"LANJUTKAN", "POWER_DOWN", "POWER_UP" dan "UNDRAIN". Jika sebuah node dalam keadaan "CAMPURAN"
itu biasanya berarti node berada di beberapa negara bagian. Misalnya jika hanya sebagian dari
node adalah "DIALOKASI" dan sisa node adalah "IDLE" statusnya akan "CAMPURAN".
Jika Anda ingin menghapus node dari layanan, Anda biasanya ingin mengatur statusnya ke
"MENGERINGKAN". "GAGAL" mirip dengan "DRAIN" kecuali beberapa aplikasi akan mencari
untuk melepaskan node tersebut sebelum pekerjaan selesai. "PERFCTRS/NPC" menunjukkan bahwa
Penghitung Kinerja Jaringan yang terkait dengan simpul ini sedang digunakan, merender ini
node sebagai tidak dapat digunakan untuk pekerjaan lain. "RESERVED" menunjukkan node berada dalam
reservasi lanjutan dan tidak tersedia secara umum. "LANJUTKAN" bukan simpul yang sebenarnya
state, tetapi akan mengubah status node dari "DRAINED", "DRAINING", "DOWN" atau "MAINT"
ke status "IDLE" atau "ALOKASI" sebagaimana mestinya. "UNDRAIN" membersihkan simpul
agar tidak terkuras (seperti "LANJUTKAN"), tetapi tidak akan mengubah status dasar node (mis
"TURUN"). Menyetel simpul "BAWAH" akan menyebabkan semua pekerjaan yang berjalan dan ditangguhkan pada itu
simpul yang akan diakhiri. "POWER_DOWN" dan "POWER_UP" akan menggunakan konfigurasi
TangguhkanProg dan LanjutkanProg program untuk secara eksplisit menempatkan simpul di dalam atau di luar daya
modus hemat. Jika sebuah node sudah dalam proses dinyalakan atau dimatikan,
perintah tidak akan berpengaruh sampai ResumeTimeout atau SuspendTimeout yang dikonfigurasi adalah
tercapai. Status "NoResp" hanya akan menyetel flag "NoResp" untuk sebuah node tanpa
mengubah keadaan dasarnya. Sementara semua status di atas valid, beberapa dari
mereka bukan status simpul baru yang valid mengingat status sebelumnya. Jika kode status simpul
dicetak diikuti oleh "~", ini menunjukkan node saat ini dalam penghematan daya
mode (biasanya berjalan pada frekuensi yang dikurangi). Jika kode status simpul diikuti
dengan "#", ini menunjukkan bahwa node sedang dinyalakan atau dikonfigurasi. Jika
kode status simpul diikuti oleh "$", ini menunjukkan simpul saat ini dalam a
reservasi dengan nilai flag "pemeliharaan" atau dijadwalkan untuk di-boot ulang.
Umumnya hanya "DRAIN", "GAGAL" dan "LANJUTKAN" yang harus digunakan. CATATAN: Kontrol
perintah tidak boleh digunakan untuk mengubah status node pada sistem Cray. Gunakan alat Cray
seperti xtprocadmin sebagai gantinya.
Berat=
Identifikasi bobot untuk dikaitkan dengan node yang ditentukan. Ini memungkinkan perubahan dinamis
untuk bobot yang terkait dengan node, yang akan digunakan untuk node berikutnya
keputusan alokasi. Berat diberikan melalui kendali hanya akan bertahan di
restart daemon slurmctld dengan -R opsi dan file status dipertahankan atau
tanda terima SIGHUP dari slurmctld. Perbarui slurm.conf dengan perubahan apa pun yang dimaksudkan
persisten di restart normal slurmctld atau eksekusi kendali
konfigurasi ulang.
SPESIFIKASI UNTUK UPDATE MEMERINTAH, Frontend
Nama Depan=
Identifikasi node ujung depan yang akan diperbarui. Spesifikasi ini diperlukan.
Alasan=
Identifikasi alasan node berada dalam status "BAWAH" atau "DRAIN". Gunakan kutipan untuk
menyertakan alasan yang memiliki lebih dari satu kata.
Negara=
Identifikasi status yang akan ditugaskan ke node ujung depan. Nilai yang mungkin adalah
"TURUN", "DRAIN" atau "LANJUTKAN". Jika Anda ingin menghapus node ujung depan dari layanan,
Anda biasanya ingin mengatur statusnya menjadi "DRAIN". "LANJUTKAN" bukan simpul yang sebenarnya
status, tetapi akan mengembalikan simpul ujung depan "DRAINED", "DRAINING", atau "DOWN" ke
layanan, baik status "IDLE" atau "ALOKASI" sebagaimana mestinya. Mengatur ujung depan
simpul "BAWAH" akan menyebabkan semua pekerjaan yang berjalan dan ditangguhkan pada simpul itu menjadi
dihentikan.
SPESIFIKASI UNTUK MEMBUAT, MEMPERBARUI, DAN DELETE PERINTAH, PARTISI
IzinkanGrup=
Identifikasi grup pengguna yang mungkin menggunakan partisi ini. Beberapa grup mungkin
ditentukan dalam daftar yang dipisahkan koma. Untuk mengizinkan semua grup menggunakan partisi
tentukan "AllowGroups=ALL".
Alokasi Node=
Daftar node yang dipisahkan koma dari mana pengguna dapat menjalankan pekerjaan di partisi.
Nama node dapat ditentukan menggunakan sintaks ekspresi rentang node yang dijelaskan di atas.
Nilai defaultnya adalah "SEMUA".
Bergantian=
Partisi alternatif yang akan digunakan jika status partisi ini adalah "DRAIN" atau
"TIDAK AKTIF." Nilai "NONE" akan menghapus partisi alternatif yang ditetapkan sebelumnya.
Default=
Tentukan apakah partisi ini akan digunakan oleh pekerjaan yang tidak secara eksplisit mengidentifikasi
partisi yang akan digunakan. Nilai keluaran yang mungkin adalah "YA" dan "TIDAK". Untuk mengubah
partisi default dari sistem yang sedang berjalan, gunakan perintah pembaruan scontrol dan atur
Default=yes untuk partisi yang ingin Anda jadikan default baru.
Waktu Default=
Batas waktu berjalan yang digunakan untuk tugas yang tidak menentukan nilai. Jika tidak disetel maka MaxTime
akan digunakan. Formatnya sama dengan MaxTime.
DefMemPerCPU=
Atur memori default yang akan dialokasikan per CPU untuk pekerjaan di partisi ini. NS
ukuran memori ditentukan dalam megabyte.
DefMemPerNode=
Atur memori default yang akan dialokasikan per node untuk pekerjaan di partisi ini. NS
ukuran memori ditentukan dalam megabyte.
NonaktifkanRootJobs=
Tentukan apakah pekerjaan dapat dijalankan sebagai root pengguna. Nilai yang mungkin adalah "YA" dan "TIDAK".
Waktu Grace=
Menentukan, dalam satuan detik, waktu tenggang preemption untuk diperpanjang ke suatu pekerjaan
yang telah dipilih untuk preemption. Nilai default adalah nol, tidak ada preemption
waktu tenggang diperbolehkan pada partisi ini atau qos. (Berarti hanya untuk
PreemptMode=BATAL)
Tersembunyi=
Tentukan apakah partisi dan tugasnya harus disembunyikan dari pandangan. Tersembunyi
partisi secara default tidak akan dilaporkan oleh API atau perintah Slurm. Mungkin
nilainya adalah "YA" dan "TIDAK".
MaxMemPerCPU=
Atur memori maksimum yang akan dialokasikan per CPU untuk pekerjaan di partisi ini. NS
ukuran memori ditentukan dalam megabyte.
MaxMemPerCNode=
Atur memori maksimum yang akan dialokasikan per node untuk pekerjaan di partisi ini. NS
ukuran memori ditentukan dalam megabyte.
MaxNode=
Tetapkan jumlah maksimum node yang akan dialokasikan untuk setiap pekerjaan tunggal di
partisi. Tentukan nomor, "INFINITE" atau "UNLIMITED". (Pada sistem tipe Bluegene
ini mewakili hitungan c-node.) Mengubah MaxNode dari sebuah partisi tidak memiliki
berpengaruh pada pekerjaan yang sudah mulai dieksekusi.
Waktu Maks=
Waktu berjalan maksimum untuk pekerjaan. Format keluaran adalah [hari-]jam:menit:detik atau
"TAK TERBATAS". Format masukan (untuk memperbarui perintah) adalah menit, menit:detik,
jam:menit:detik, hari-jam, hari-jam:menit atau
hari-jam:menit:detik. Resolusi waktu adalah satu menit dan nilai detik adalah
dibulatkan ke menit berikutnya. Mengubah Waktu Maks dari partisi tidak berpengaruh
atas pekerjaan yang sudah mulai dieksekusi.
MinNode=
Tetapkan jumlah minimum node yang akan dialokasikan untuk setiap pekerjaan tunggal di
partisi. (Pada sistem tipe Bluegene ini mewakili hitungan c-node.) Mengubah
itu MinNode partisi tidak berpengaruh pada pekerjaan yang telah dimulai
eksekusi.
Nodes=
Identifikasi node yang akan dikaitkan dengan partisi ini. Beberapa nama node mungkin
ditentukan menggunakan ekspresi rentang simpul sederhana (misalnya "lx[10-20]"). Perhatikan bahwa
pekerjaan hanya dapat dikaitkan dengan satu partisi setiap saat. Tentukan data kosong
nilai untuk menghapus semua node dari partisi: "Nodes=". Mengubah Nodes dalam
partisi tidak berpengaruh pada pekerjaan yang sudah mulai dieksekusi.
Nama Partisi=
Identifikasi partisi yang akan diperbarui. Spesifikasi ini diperlukan.
Mode Preempt=
Setel ulang mekanisme yang digunakan untuk mendahului pekerjaan di partisi ini jika Jenis Preempt is
dikonfigurasi untuk preempt/partisi_prio. Mekanisme preemption default ditentukan
oleh seluruh cluster Mode Preempt parameter konfigurasi. Nilai yang mungkin adalah
"OFF", "CANCEL", "CHECKPOINT", "REQUEUE" dan "SUSPEND".
Prioritas=
Pekerjaan yang dikirimkan ke partisi prioritas yang lebih tinggi akan dikirim sebelum tertunda
pekerjaan di partisi prioritas yang lebih rendah dan jika mungkin mereka akan mendahului pekerjaan yang sedang berjalan
dari partisi prioritas yang lebih rendah. Perhatikan bahwa prioritas partisi diutamakan
atas prioritas pekerjaan. Nilainya tidak boleh melebihi 65533.
Akar Saja=
Tentukan apakah hanya permintaan alokasi yang diprakarsai oleh root pengguna yang akan dipenuhi. Ini
dapat digunakan untuk membatasi kontrol partisi ke beberapa meta-scheduler. Mungkin
nilainya adalah "YA" dan "TIDAK".
PermintaanResv=
Tentukan apakah hanya permintaan alokasi yang menunjukkan reservasi yang akan dipenuhi.
Ini digunakan untuk membatasi penggunaan partisi yang diizinkan hanya dalam reservasi.
Nilai yang mungkin adalah "YA" dan "TIDAK".
bersama= [: ]
Tentukan apakah node di partisi ini dapat digunakan bersama oleh banyak pekerjaan. Nilai yang mungkin
adalah "YA", "TIDAK", "EKSKLUSIF" dan "PAKSA". Hitungan pekerjaan opsional menentukan berapa banyak
pekerjaan dapat dialokasikan untuk menggunakan setiap sumber daya.
Negara=
Tentukan apakah pekerjaan dapat dialokasikan node atau diantrekan di partisi ini. Mungkin
nilainya adalah "UP", "DOWN", "DRAIN" dan "INACTIVE".
UP Menunjuk bahwa pekerjaan baru dapat diantrekan di partisi, dan pekerjaan itu mungkin
dialokasikan node dan dijalankan dari partisi.
BAWAH Menunjuk bahwa pekerjaan baru dapat diantrekan di partisi, tetapi pekerjaan yang antri
mungkin tidak dialokasikan node dan dijalankan dari partisi. Pekerjaan sudah
berjalan pada partisi terus berjalan. Pekerjaan harus secara eksplisit
dibatalkan untuk memaksa penghentian mereka.
MENGURAS Menunjukkan bahwa tidak ada pekerjaan baru yang dapat diantrekan pada partisi (job
permintaan pengiriman akan ditolak dengan pesan kesalahan), tetapi pekerjaan
sudah antri di partisi dapat dialokasikan node dan dijalankan. Lihat juga
spesifikasi partisi "Alternate".
TIDAK AKTIF Menunjukkan bahwa tidak ada pekerjaan baru yang dapat diantrekan di partisi, dan pekerjaan
sudah antri mungkin tidak dialokasikan node dan dijalankan. Lihat juga
Spesifikasi partisi "Alternatif".
SPESIFIKASI UNTUK UPDATE MEMERINTAH, POWERCAP
PowerCap=
Setel jumlah watt yang dibatasi kluster. Tentukan nomor, "INFINITE" untuk
aktifkan logika pembatasan daya tanpa pembatasan daya atau "0" untuk menonaktifkan
logika pembatasan daya. Perbarui slurm.conf dengan perubahan apa pun yang dimaksudkan untuk bertahan
di restart normal slurmctld atau eksekusi kendali konfigurasi ulang.
SPESIFIKASI UNTUK MEMBUAT, MEMPERBARUI, DAN DELETE PERINTAH, RESERVASI
Reservasi=
Identifikasi nama reservasi yang akan dibuat, diperbarui, atau dihapus. Ini
parameter diperlukan untuk pembaruan dan merupakan satu-satunya parameter untuk dihapus. Untuk membuat,
jika Anda tidak ingin memberikan nama reservasi, gunakan "scontrol create res ..." dan a
nama akan dibuat secara otomatis.
Akun=
Daftar akun yang diizinkan untuk menggunakan node yang dipesan, misalnya
"Akun = physcode1, physcode2". Seorang pengguna di salah satu akun dapat menggunakan yang dipesan
node. Reservasi baru harus menyebutkan Pengguna dan/atau Akun. Jika kedua Pengguna dan
Akun ditentukan, pekerjaan harus cocok dengan keduanya untuk menggunakan reservasi.
Akun juga dapat ditolak aksesnya ke reservasi dengan mendahului semua akun
nama dengan '-'. Awali tanda sama dengan '-' secara bergantian. Sebagai contoh,
"Accounts=-physcode1,-physcode2" atau "Accounts-=physcode1,physcode2" akan mengizinkan
akun kecuali physcode1 dan physcode2 untuk menggunakan reservasi. Anda dapat menambahkan atau
hapus akun individu dari reservasi yang ada dengan menggunakan perintah pembaruan
dan menambahkan tanda '+' atau '-' sebelum tanda '='. Jika akun ditolak akses ke
reservasi (nama akun didahului dengan '-'), maka semua akun lainnya adalah
secara implisit diperbolehkan untuk menggunakan reservasi dan tidak mungkin juga secara eksplisit
tentukan akun yang diizinkan.
BurstBuffer= [, ,...]
Spesifikasi sumber daya buffer burst yang akan dicadangkan. "buffer_spec"
terdiri dari empat elemen: [plugin:][type:]#[units] "plugin" adalah buffer burst
nama plugin, saat ini "cray" atau "generic". Jika tidak ada plugin yang ditentukan,
reservasi berlaku untuk semua plugin buffer burst yang dikonfigurasi. "type" menentukan a
Sumber daya buffer burst generik Cray, misalnya "node". jika "tipe" tidak
ditentukan, nomor adalah ukuran ruang penyimpanan. "Satuan" mungkin "N"
(node), "GB" (gigabyte), "TB" (terabyte), "PB" (petabyte), dll. dengan
unit default menjadi gigabyes untuk reservasi ruang penyimpanan. Sebagai contoh
"BurstBuffer=cray:2TB" (cadangan 2TB penyimpanan ditambah 3 node dari plugin Cray)
atau "BurstBuffer=100GB" (cadangan 100 GB penyimpanan dari semua buffer burst yang dikonfigurasi
plugin). Pekerjaan yang menggunakan reservasi ini tidak terbatas pada buffer burst ini
sumber daya, tetapi dapat menggunakan sumber daya yang dicadangkan ini ditambah apa pun yang umumnya
tersedia.
IntiCnt=
Opsi ini hanya didukung ketika SelectType=select/cons_res. Mengidentifikasi jumlah
core yang akan dipesan. Jika NodeCnt digunakan, ini adalah jumlah total core untuk
cadangan di mana inti per node adalah CoreCnt/NodeCnt. Jika sebuah nodelist digunakan, ini seharusnya
menjadi array nomor inti dengan simpul: Nodes=node[1-5] CoreCnt=2,2,3,3,4
Lisensi=
Spesifikasi lisensi (atau sumber daya lain yang tersedia di semua node dari
cluster) yang akan dipesan. Nama lisensi dapat diikuti oleh titik dua dan
count (hitungan default adalah satu). Beberapa nama lisensi harus dipisahkan koma
(mis. "Lisensi=foo:4,bar"). Reservasi baru harus menentukan satu atau lebih sumber daya
untuk disertakan: NodeCnt, Node dan/atau Lisensi. Jika reservasi termasuk
Lisensi, tetapi tidak ada NodeCnt atau Node, maka opsinya Bendera=LICENSE_ONLY harus juga
ditentukan. Pekerjaan yang menggunakan reservasi ini tidak terbatas pada lisensi ini, tetapi
dapat menggunakan lisensi yang dicadangkan ini plus lisensi apa pun yang tersedia secara umum.
NodeCnt= [,bil,...]
Identifikasi jumlah node yang akan dipesan. Nomor tersebut dapat menyertakan akhiran "k" atau
"K", dalam hal ini angka yang ditentukan dikalikan dengan 1024. Di BlueGene
sistem, angka ini mewakili hitungan c-node (compute node) dan akan dibulatkan
up sesuai kebutuhan untuk memesan seluruh node (midplanes). Untuk mengoptimalkan topologi
alokasi sumber daya pada reservasi baru (bukan pada reservasi yang diperbarui),
ukuran tertentu yang diperlukan untuk reservasi dapat ditentukan. Misalnya, jika Anda
ingin memesan 4096 c-node pada sistem BlueGene yang dapat digunakan untuk mengalokasikan dua
pekerjaan masing-masing dengan 2048 c-node, tentukan "NodeCnt=2k,2k". Reservasi baru harus
tentukan satu atau lebih sumber daya untuk disertakan: NodeCnt, Nodes dan/atau Lisensi.
Nodes=
Identifikasi node yang akan dipesan. Beberapa nama node dapat ditentukan menggunakan
ekspresi rentang simpul sederhana (misalnya "Nodes=lx[10-20]"). Tentukan nilai data kosong
untuk menghapus semua node dari reservasi: "Nodes=". Reservasi baru harus ditentukan
satu atau lebih sumber daya untuk dimasukkan: NodeCnt, Node dan/atau Lisensi. A
spesifikasi "ALL" akan mencadangkan semua node. Mengatur Bendera=PART_NODES dan
Nama Partisi= agar perubahan pada node yang terkait dengan partisi untuk
juga tercermin dalam node yang terkait dengan reservasi.
Waktu mulai=
Waktu mulai reservasi. Reservasi baru harus menentukan waktu mulai.
Ia menerima waktu dari formulir JJ:MM:SS untuk waktu tertentu dalam sehari (detik adalah
opsional). (Jika waktu itu sudah lewat, hari berikutnya diasumsikan.) Anda juga dapat
menentukan tengah malam, tengah hari, fika (3 sore) atau minum teh (4 PM) dan Anda dapat memiliki
waktu-hari yang diakhiri dengan AM or PM untuk lari pagi atau sore hari. Anda
juga bisa mengatakan hari apa pekerjaan akan dijalankan, dengan menentukan tanggal formulir MMDDYY
or MM/HH/YY or MM.DD.YY, atau tanggal dan waktu sebagai YYYY-MM-DD[THH:MM[:SS]]. Anda dapat
berikan juga waktu like sekarang + menghitung satuan waktu, di mana satuan waktu dapat menit,
jam, hari-hari, atau minggu dan Anda dapat memberi tahu Slurm untuk menjalankan pekerjaan hari ini dengan kata kunci
hari ini dan untuk menjalankan pekerjaan besok dengan kata kunci besok. Anda tidak dapat memperbarui
Waktu mulai dari reservasi di AKTIF negara.
Akhir waktu=
Waktu berakhirnya reservasi. Reservasi baru harus menentukan waktu berakhir atau a
durasi. Format yang valid sama dengan StartTime.
Durasi=
Lamanya reservasi. Reservasi baru harus menentukan waktu berakhir atau a
durasi. Format yang valid adalah menit, menit:detik, jam:menit:detik,
hari-jam, hari-jam:menit, hari-jam:menit:detik, atau TANPA BATAS. Waktu
resolusi adalah satu menit dan nilai detik dibulatkan ke menit berikutnya.
Format keluaran selalu [hari-]jam:menit:detik.
Nama Partisi=
Identifikasi partisi yang akan dipesan.
Flags=
Bendera yang terkait dengan reservasi. Anda dapat menambahkan atau menghapus bendera individu dari
reservasi yang ada dengan menambahkan tanda '+' atau '-' sebelum tanda '='. Untuk
contoh: Flags-=DAILY (CATATAN: pintasan ini tidak didukung untuk semua flag).
Bendera yang saat ini didukung meliputi:
APAPUN_NODES Ini adalah reservasi untuk buffer burst dan/atau lisensi saja dan bukan
menghitung node. Jika tanda ini disetel, pekerjaan yang menggunakan reservasi ini dapat
gunakan buffer dan/atau lisensi burst terkait plus komputasi apa pun
node. Jika tanda ini tidak disetel, pekerjaan yang menggunakan reservasi ini dapat menggunakan
hanya node dan lisensi yang terkait dengan reservasi.
DAILY Ulangi reservasi pada waktu yang sama setiap hari
PERTAMA_CORES Gunakan core bernomor terendah pada node saja.
ABAIKAN_PEKERJAAN Abaikan pekerjaan yang sedang berjalan saat membuat reservasi. Ini
dapat sangat berguna ketika memesan semua node dalam sistem untuk
pemeliharaan.
LISENSI_HANYA Lihat APAPUN_NODES.
PERAWATAN Mode perawatan, menerima perlakuan akuntansi khusus. Ini
partisi diizinkan untuk menggunakan sumber daya yang sudah ada di yang lain
reservasi.
tumpang tindih Reservasi ini dapat mengalokasikan sumber daya yang sudah ada di
reservasi lain.
BAGIAN_NODES Bendera ini dapat digunakan untuk memesan semua node dalam yang ditentukan
partisi. PartitionName dan Nodes=ALL harus ditentukan atau ini
pilihan diabaikan.
REPLACE Sumber daya yang dialokasikan untuk pekerjaan sebagai diisi ulang secara otomatis menggunakan idle
sumber daya. Opsi ini dapat digunakan untuk mempertahankan jumlah yang konstan
sumber daya menganggur tersedia untuk pekerjaan yang tertunda (tergantung ketersediaan
sumber daya menganggur). Ini harus digunakan dengan NodeCnt Pemesanan
pilihan; tidak mengidentifikasi node tertentu untuk dimasukkan dalam
reservasi. Opsi ini tidak didukung pada sistem IBM Bluegene.
SPEC_NODES Reservasi untuk node tertentu (hanya output)
STATIS_ALLOC Jadikan setelah node dipilih untuk reservasi, mereka tidak melakukannya
mengubah. Tanpa opsi ini ketika node dipilih untuk a
reservasi dan satu turun reservasi akan memilih node baru
untuk mengisi tempat.
WAKTU_FLOAT Waktu mulai reservasi relatif terhadap waktu dan pergerakan saat ini
maju melalui waktu (misalnya StartTime=sekarang+10menit akan selalu
10 menit ke depan).
MINGGUAN Ulangi reservasi pada waktu yang sama setiap minggu
Fitur=
Setel fitur simpul yang diperlukan reservasi. Beberapa nilai mungkin "&" dipisahkan
jika semua fitur diperlukan (DAN operasi) atau dipisahkan oleh "|" jika salah satu dari
fitur tertentu diperlukan (operasi ATAU). Nilai dapat dihapus dengan kosong
nilai data, "Fitur=".
pengguna=
Daftar pengguna yang diizinkan untuk menggunakan node yang dipesan, misalnya
"Pengguna = jones1, smith2". Reservasi baru harus menyebutkan Pengguna dan/atau Akun. Jika
baik Pengguna dan Akun ditentukan, pekerjaan harus cocok dengan keduanya untuk menggunakan
reservasi. Pengguna juga dapat ditolak aksesnya ke reservasi dengan mendahului semua
nama pengguna dengan '-'. Awali tanda sama dengan '-' secara bergantian. Sebagai contoh,
"Pengguna=-jones1,-smith2" atau "Pengguna-=jones1, smith2" akan mengizinkan setiap pengguna kecuali jones1
dan smith2 untuk menggunakan reservasi. Anda dapat menambah atau menghapus pengguna individu dari
reservasi yang ada dengan menggunakan perintah update dan menambahkan tanda '+' atau '-'
sebelum tanda '='. Jika pengguna ditolak akses ke reservasi (nama pengguna
didahului oleh '-'), maka semua pengguna lain secara implisit diizinkan untuk menggunakan
reservasi dan tidak mungkin juga secara eksplisit menentukan pengguna yang diizinkan.
sANGAT=
Daftar TRES yang dipisahkan koma diperlukan untuk reservasi. TRES yang didukung saat ini
jenis dengan pemesanan adalah : CPU, Node, License dan BB. CPU dan Node mengikuti
format yang sama seperti masing-masing parameter CoreCnt dan NodeCnt. Nama lisensi dapat berupa
diikuti dengan '=' yang sama dan hitungan:
Lisensi/ = [,Lisensi/ = ,...]
BurstBuffer dapat ditentukan dengan cara yang sama seperti parameter BurstBuffer. Satu-satunya
perbedaannya adalah simbol titik dua ':' harus diganti dengan '=' yang sama untuk
mengikuti format TRES.
Beberapa contoh spesifikasi valid TRES:
TRES=cpu=5,bb/cray=4,license/iop1=1,license/iop2=3
TRES=simpul=5k,lisensi/iop1=2
Seperti yang ditentukan dalam CoreCnt, jika nodelist ditentukan, cpu dapat berupa array core
angka berdasarkan node: node=compute[1-3] TRES=cpu=2,2,1,bb/cray=4,license/iop1=2
Harap dicatat bahwa CPU, Node, License, dan BB dapat menggantikan CoreCnt, NodeCnt, Licenses
dan BurstBuffer parameter masing-masing. Juga CPU mewakili CoreCnt, dalam a
reservasi dan akan disesuaikan jika Anda memiliki utas per inti di node Anda.
SPESIFIKASI UNTUK UPDATE BLOKIR/SUBMP
Hanya sistem bluegene!
Nama Blok=
Identifikasi blok bluegene yang akan diperbarui. Spesifikasi ini diperlukan.
Negara=
Ini akan memperbarui status blok bluegene. (yaitu perbarui BlockName=RMP0
NEGARA = KESALAHAN) PERINGATAN!!!! Dengan pengecualian status RESUME, semua status lainnya
nilai akan membatalkan pekerjaan yang sedang berjalan di blok!
KONSULTASI Kembalikan blok ke keadaan bebas.
ERROR Buatlah agar pekerjaan tidak berjalan di blok.
BUAT ULANG Hancurkan blok saat ini dan buat yang baru untuk menggantikannya.
Menghapus Bebaskan dan hapus blok dari sistem. Jika balok lebih kecil dari
sebuah midplane setiap blok di midplane itu akan dihapus. (hanya tersedia
pada sistem tata letak dinamis)
LANJUT Jika sebuah blok dalam keadaan ERROR RESUME akan mengembalikan blok ke sebelumnya
status yang dapat digunakan (GRATIS atau SIAP).
Nama SubMP=
Identifikasi ionoda gen biru yang akan diperbarui (yaitu bg000[0-3]). Spesifikasi ini
diperlukan. CATATAN: Bahkan pada BGQ di mana nama node diberikan dalam format bg0000[00000]
opsi ini mengambil nama ionoda bg0000[0].
SPESIFIKASI UNTUK UPDATE MEMERINTAH, TATA LETAK
tata ruang=
Identifikasi tata letak yang akan diperbarui. Spesifikasi ini diperlukan.
Kesatuan=
Identifikasi entitas yang akan diperbarui. Spesifikasi ini diperlukan.
kunci=
Kunci/Nilai yang akan diperbarui untuk entitas. Formatnya harus menghormati tata letak.d
file konfigurasi. Key=Jenis tidak dapat diperbarui. Setidaknya satu Kunci/Nilai adalah
diperlukan, beberapa dapat diatur.
SPESIFIKASI UNTUK TAMPILKAN MEMERINTAH, TATA LETAK
Tanpa opsi, daftar semua tata letak yang dikonfigurasi. Dengan tata letak yang ditentukan, menunjukkan entitas
dengan opsi berikut:
kunci=
Kunci/Nilai yang akan diperbarui untuk entitas. Formatnya harus menghormati tata letak.d
file konfigurasi. Key=Jenis tidak dapat diperbarui. Satu Kunci/Nilai diperlukan, beberapa
dapat diatur.
Kesatuan=
Entitas untuk ditampilkan, default tidak digunakan. Dapat diatur ke "*".
Tipe=
Jenis entitas yang akan ditampilkan, default tidak digunakan.
tidak ada tata letak
Jika tidak digunakan, hanya entitas dengan definisi pohon yang ditampilkan. Dengan opsi, hanya
daun ditampilkan.
DESKRIPSI UNTUK TAMPILKAN MEMERINTAH, NODA
Arti dari informasi energi adalah sebagai berikut:
Watt saat ini
Konsumsi daya sesaat dari node pada saat energi node terakhir
sampel akuntansi, dalam watt.
Joule Terendah
Energi yang dikonsumsi oleh node antara terakhir kali dinyalakan dan
terakhir kali didaftarkan oleh slurmd, dalam joule.
Joule yang dikonsumsi
Energi yang dikonsumsi oleh node antara terakhir kali didaftarkan oleh
slurmd daemon dan sampel perhitungan energi node terakhir, dalam joule.
Jika nilai yang dilaporkan adalah "n/s" (tidak didukung), node tidak mendukung konfigurasi
AcctGatherEnergyType pengaya. Jika nilai yang dilaporkan adalah nol, penghitungan energi untuk node adalah
dengan disabilitas.
Arti dari informasi sensor eksternal adalah sebagai berikut:
ExtSensorsJoule
Energi yang dikonsumsi oleh node antara terakhir kali dinyalakan dan
sampel node plugin sensor eksternal terakhir, dalam joule.
ExtSensorsWatt
Konsumsi daya sesaat dari node pada saat eksternal terakhir
sampel node plugin sensor, dalam watt.
ExtSensorsTemp
Suhu node pada saat node plugin sensor eksternal terakhir
sampel, dalam celcius.
Jika nilai yang dilaporkan adalah "n/s" (tidak didukung), node tidak mendukung konfigurasi
Tipe ExtSensors plugin.
Arti dari informasi spesialisasi sumber daya adalah sebagai berikut:
Daftar Spesifikasi CPU
Daftar ID CPU abstrak Slurm pada node ini dicadangkan untuk penggunaan eksklusif oleh
Daemon node komputasi slurm (slurmd, slurmstepd).
MemSpecLimit
Batas memori gabungan, dalam megabita, pada node ini untuk node komputasi Slurm
daemon (slurmd, slurmstepd).
Arti dari informasi memori adalah sebagai berikut:
Memori Nyata
Total memori, dalam MB, pada node.
AlokasiMem
Memori total, dalam MB, saat ini dialokasikan oleh pekerjaan di node.
Mem Gratis
Memori total, dalam MB, saat ini kosong di node seperti yang dilaporkan oleh OS.
LINGKUNGAN VARIABEL
Beberapa kendali pilihan dapat diatur melalui variabel lingkungan. Variabel lingkungan ini,
bersama dengan opsi yang sesuai, tercantum di bawah ini. (Catatan: Opsi baris perintah akan
selalu timpa pengaturan ini.)
SCONTROL_ALL -Sebuah, --semua
SLURM_BITSTR_LEN Menentukan panjang string yang akan digunakan untuk menahan tugas array pekerjaan
ekspresi identitas. Nilai default adalah 64 byte. Nilai 0 akan
cetak ekspresi penuh dengan panjang berapa pun yang diperlukan. Nilai yang lebih besar mungkin
berdampak buruk pada kinerja aplikasi.
SLURM_CLUSTER Sama dengan --cluster
SLURM_CONF Lokasi file konfigurasi Slurm.
SLURM_TIME_FORMAT Tentukan format yang digunakan untuk melaporkan stempel waktu. Sebuah nilai dari standard,
nilai default, menghasilkan output dalam bentuk
"tahun-bulan-tanggalTjam:menit:detik". Sebuah nilai dari relatif Pengembalian
hanya "jam:menit:detik" jika hari ini. Untuk tanggal lain di
tahun ini mencetak "jam: menit" didahului oleh "Besok"
(besok), "Ystday" (kemarin), nama hari yang akan datang
minggu (mis. "Senin", "Selasa", dll.), jika tidak, tanggalnya (mis. "25 Apr").
Untuk tahun-tahun lain ia mengembalikan tanggal bulan dan tahun tanpa waktu (mis
"6 Juni 2012"). Semua cap waktu menggunakan format 24 jam.
Format strftime() yang valid juga dapat ditentukan. Misalnya, nilai
dari "%a %T" akan melaporkan hari dalam seminggu dan cap waktu (mis
12:34:56").
SLURM_TOPO_LEN Tentukan ukuran maksimum garis saat mencetak Topologi. Jika tidak
diatur, nilai default "512" akan digunakan.
OTORISASI
Saat menggunakan Slurm db, pengguna yang telah ditentukan AdminLevel (Operator atau Admin) dan pengguna
yang merupakan koordinator akun diberi wewenang untuk melihat dan memodifikasi pekerjaan,
reservasi, node, dll., sebagaimana didefinisikan dalam tabel berikut - terlepas dari apakah a
Pembatasan PrivateData telah ditentukan dalam file slurm.conf.
kendali Menunjukkan pekerjaan: Admin, Operator, Koordinator
kendali memperbarui pekerjaan: Admin, Operator, Koordinator
kendali antrean: Admin, Operator, Koordinator
kendali Menunjukkan Langkah): Admin, Operator, Koordinator
kendali memperbarui langkah: Admin, Operator, Koordinator
kendali Menunjukkan blok: Admin, Operator
kendali memperbarui blok: admin
kendali Menunjukkan simpul: Admin, Operator
kendali memperbarui simpul: admin
kendali membuat partisi: admin
kendali Menunjukkan partisi: Admin, Operator
kendali memperbarui partisi: admin
kendali hapus partisi: admin
kendali membuat reservasi: Admin, Operator
kendali Menunjukkan reservasi: Admin, Operator
kendali memperbarui reservasi: Admin, Operator
kendali hapus reservasi: Admin, Operator
kendali konfigurasi ulang: admin
kendali menutup: admin
kendali pengambilalihan: admin
CONTOH
# kontrol
scontrol: tampilkan debug bagian
PartitionName=debug
AllocNodes=ALL AllowGroups=ALL Default=YA
DefaultTime=NONE DisableRootJobs=TIDAK Tersembunyi=TIDAK
MaxNodes=TIDAK TERBATAS MaxTime=TIDAK TERBATAS MinNodes=1
Node=kepingan salju[0-48]
Priority=1 RootOnly=TIDAK Dibagikan=YA:4
Status=UP TotalCPU=694 TotalNodes=49
scontrol: perbarui PartitionName=debug MaxTime=60:00 MaxNodes=4
kontrol: tunjukkan pekerjaan 71701
JobId=71701 Nama=nama host
ID Pengguna=da(1000) Id Grup=da(1000)
Prioritas=66264 Akun=tidak ada QOS=normal WCKey=*123
JobState=SELESAI Alasan=Tidak Ada Ketergantungan=(null)
TimeLimit=UNLIMITED Requeue=1 Restart=0 BatchFlag=0 ExitCode=0:0
SubmitTime=2010-01-05T10:58:40 EligibleTime=2010-01-05T10:58:40
StartTime=2010-01-05T10:58:40 EndTime=2010-01-05T10:58:40
SuspendTime=Tidak Ada DetikPreSuspend=0
Partisi=debug AllocNode:Sid=kepingan salju:4702
ReqNodeList=(null) ExcNodeList=(null)
NodeList=kepingan salju0
NumNodes=1 NumCPUs=10 CPU/Tugas=2 Permintaan:C:T=1:1:1
MinCPUsNode=2 MinMemoryNode=0 MinTmpDiskNode=0
Fitur=(null) Reservasi=(null)
Dibagikan=OK Bersebelahan=0 Lisensi=(null) Jaringan=(null)
scontrol: perbarui JobId=71701 TimeLimit=30:00 Prioritas=500
scontrol: tampilkan nama host tux[1-3]
tux1
tux2
tux3
scontrol: buat res StartTime=2009-04-01T08:00:00 Durasi=5:00:00 Pengguna=dbremer
NodeCnt=10
Reservasi dibuat: dbremer_1
scontrol: perbarui Reservasi=dbremer_1 Flags=Maint NodeCnt=20
scontrol: hapus Reservasi=dbremer_1
kontrol: berhenti
PENYALINAN
Hak Cipta (C) 2002-2007 Bupati Universitas California. Diproduksi di Lawrence
Laboratorium Nasional Livermore (lih, DISCLAIMER).
Hak Cipta (C) 2008-2010 Keamanan Nasional Lawrence Livermore.
Hak Cipta (C) 2010-2015 SchedMD LLC.
File ini adalah bagian dari Slurm, program manajemen sumber daya. Untuk detailnya, lihat
<http://slurm.schedmd.com/>.
Slurm adalah perangkat lunak gratis; Anda dapat mendistribusikan ulang dan/atau memodifikasinya di bawah ketentuan
Lisensi Publik Umum GNU sebagaimana diterbitkan oleh Free Software Foundation; baik versi 2
dari Lisensi, atau (sesuai pilihan Anda) versi yang lebih baru.
Slurm disebarluaskan dengan harapan bisa bermanfaat, tapi TANPA JAMINAN APAPUN; tanpa
bahkan jaminan tersirat tentang KELAYAKAN DIPERDAGANGKAN atau KESESUAIAN UNTUK TUJUAN TERTENTU. Lihat
Lisensi Publik Umum GNU untuk perincian lebih lanjut.
Gunakan scontrol online menggunakan layanan onworks.net