Ini adalah perintah sdiag yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa stasiun kerja online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
sdiag - Menjadwalkan alat diagnostik untuk Slurm
RINGKASAN
sdiag
DESKRIPSI
sdiag menampilkan informasi terkait dengan eksekusi slurmctld tentang: utas, agen, pekerjaan, dan
algoritma penjadwalan. Tujuannya adalah untuk mendapatkan data dari perilaku slurmctld membantu untuk
menyesuaikan parameter konfigurasi atau kebijakan antrian. Alasan utama di baliknya adalah untuk mengetahui
Perilaku slurm di bawah sistem dengan throughput tinggi.
Ini memiliki dua mode eksekusi. Modus default --semua menunjukkan beberapa penghitung dan statistik
dijelaskan nanti, dan ada opsi eksekusi lain --mengatur ulang untuk mengatur ulang nilai-nilai tersebut.
Nilai diatur ulang pada tengah malam waktu UTC secara default.
Blok informasi pertama terkait dengan eksekusi slurmctld global:
Server benang menghitung
Jumlah utas slurmctld aktif saat ini. Angka yang tinggi berarti angka yang tinggi
memuat acara pemrosesan seperti pengiriman pekerjaan, pengiriman pekerjaan, penyelesaian pekerjaan,
dll. Jika ini sering mendekati MAX_SERVER_THREADS, ini bisa menunjukkan potensi
kemacetan.
Agen antre ukuran
Desain slurm memiliki skalabilitas dalam pikiran dan mengirim pesan ke ribuan node adalah
bukan tugas yang sepele. Mekanisme agen membantu untuk mengontrol komunikasi antara
daemon slurm dan pengontrol untuk upaya terbaik. Jika nilai ini mendekati
MAX_AGENT_CNT mungkin ada beberapa penundaan yang memengaruhi manajemen pekerjaan.
Jobs disampaikan
Jumlah pekerjaan yang dikirimkan sejak reset terakhir
Jobs mulai
Jumlah pekerjaan yang dimulai sejak reset terakhir. Ini termasuk pekerjaan yang diisi ulang.
Jobs selesai
Jumlah pekerjaan yang diselesaikan sejak reset terakhir.
Jobs dibatalkan
Jumlah pekerjaan dibatalkan sejak reset terakhir.
Jobs gagal
Jumlah pekerjaan gagal sejak reset terakhir.
Blok informasi kedua terkait dengan algoritma penjadwalan utama berdasarkan pekerjaan
prioritas. Siklus penjadwalan menyiratkan untuk mendapatkan kunci job_write_lock, lalu mencoba untuk mendapatkan
sumber daya untuk pekerjaan yang tertunda, mulai dari yang paling prioritas dan turun ke bawah
memesan. Setelah pekerjaan tidak bisa mendapatkan sumber daya, loop terus berjalan tetapi hanya untuk pekerjaan
meminta partisi lain. Pekerjaan dengan ketergantungan atau terpengaruh oleh batas akun adalah
tidak diproses.
Terakhir siklus
Waktu dalam mikrodetik untuk siklus penjadwalan terakhir.
max siklus
Waktu dalam mikrodetik untuk siklus penjadwalan maksimum sejak reset terakhir.
Total siklus
Jumlah siklus penjadwalan sejak reset terakhir. Penjadwalan dilakukan secara berkala
dan ketika pekerjaan diserahkan atau pekerjaan selesai.
Berarti siklus
Rata-rata siklus penjadwalan sejak reset terakhir
Berarti kedalaman siklus
Rata-rata kedalaman siklus. Kedalaman berarti jumlah pekerjaan yang diproses dalam siklus penjadwalan.
siklus untuk menit
Penghitung eksekusi penjadwalan per menit
Terakhir antre panjangnya
Panjang antrian pekerjaan yang tertunda.
Blok informasi ketiga terkait dengan algoritma penjadwalan backfilling. A
siklus penjadwalan pengisian ulang menyiratkan untuk mendapatkan kunci untuk pekerjaan, node, dan objek partisi
kemudian mencoba mendapatkan sumber daya untuk pekerjaan yang tertunda. Pekerjaan diproses berdasarkan prioritas. Jika
pekerjaan tidak bisa mendapatkan sumber daya yang dihitung oleh algoritme ketika itu bisa membuat mereka mendapatkan
waktu mulai pekerjaan di masa mendatang. Kemudian pekerjaan berikutnya diproses dan algoritma mencoba untuk mendapatkan
sumber daya untuk pekerjaan itu tetapi menghindari untuk mempengaruhi sebelumnya yang, dan sekali lagi itu menghitung
waktu mulai di masa depan jika tidak tersedia sumber daya saat ini. Algoritma pengisian ulang membutuhkan
lebih banyak waktu untuk setiap pekerjaan baru untuk diproses karena lebih banyak pekerjaan prioritas tidak dapat terpengaruh. NS
algoritma itu sendiri mengambil langkah-langkah untuk menghindari siklus eksekusi yang panjang dan untuk mengambil semua
mengunci terlalu lama.
Total ditimbun kembali pekerjaan (sejak terakhir cercaan Mulailah)
Jumlah pekerjaan dimulai berkat penimbunan sejak slurm terakhir dimulai.
Total ditimbun kembali pekerjaan (sejak terakhir statistik siklus Mulailah)
Jumlah pekerjaan dimulai berkat pengisian ulang sejak terakhir kali statistik di mana reset. Oleh
default nilai-nilai ini diatur ulang pada tengah malam waktu UTC.
Total siklus
Jumlah siklus penjadwalan sejak reset terakhir
Terakhir siklus ketika
Waktu ketika siklus eksekusi terakhir terjadi dalam format "hari kerja Bulan BulanHari
jam:menit.detik tahun"
Terakhir siklus
Waktu dalam mikrodetik dari siklus pengisian terakhir. Itu hanya menghitung waktu eksekusi
menghapus waktu tidur di dalam siklus penjadwalan ketika membutuhkan terlalu banyak waktu. Catatan
bahwa kunci dilepaskan selama waktu tidur sehingga pekerjaan lain dapat dilanjutkan.
max siklus
Waktu dalam mikrodetik dari eksekusi siklus pengisian ulang maksimum sejak reset terakhir. Dia
hanya menghitung waktu eksekusi menghapus waktu tidur di dalam siklus penjadwalan ketika itu
memakan waktu terlalu banyak. Perhatikan bahwa kunci dilepaskan selama waktu tidur sehingga
pekerjaan lain dapat dilanjutkan.
Berarti siklus
Rata-rata pengisian ulang siklus penjadwalan dalam mikrodetik sejak reset terakhir
Terakhir kedalaman siklus
Jumlah pekerjaan yang diproses selama siklus penjadwalan pengurukan terakhir. Itu dihitung setiap
proses meskipun tidak memiliki opsi untuk dieksekusi karena ketergantungan atau batasan.
Terakhir kedalaman siklus (mencoba terjadwal)
Jumlah pekerjaan yang diproses selama siklus penjadwalan pengurukan terakhir. Itu hanya dihitung
proses dengan kesempatan untuk berjalan menunggu sumber daya yang tersedia. Pekerjaan ini adalah
yang membuat algoritma pengisian ulang lebih berat.
Kedalaman Berarti
Rata-rata pekerjaan yang diproses selama siklus penjadwalan pengisian ulang sejak reset terakhir.
Kedalaman Berarti (mencoba terjadwal)
Rata-rata pekerjaan yang diproses selama siklus penjadwalan pengisian ulang sejak reset terakhir. Dia
hanya menghitung proses dengan kesempatan untuk berjalan menunggu sumber daya yang tersedia. Ini
pekerjaan yang membuat algoritma pengisian ulang lebih berat.
Terakhir antre panjangnya
Jumlah pekerjaan yang tertunda untuk diproses oleh algoritma pengisian ulang. Pekerjaan muncul sebagai
sebanyak partisi yang diminta.
Antre panjangnya Berarti
Rata-rata pekerjaan yang tertunda untuk diproses oleh algoritma pengisian ulang.
Blok informasi keempat dan kelima melaporkan remote yang paling sering dikeluarkan
prosedur panggilan (RPC), panggilan yang dibuat untuk daemon Slurmctld untuk melakukan beberapa tindakan. NS
blok keempat melaporkan RPC yang dikeluarkan berdasarkan jenis pesan. Anda perlu mencari RPC itu
kode dalam kode sumber Slurm dengan mencarinya di file
src/common/slurm_protocol_defs.h. Laporan tersebut mencakup berapa kali setiap RPC
dipanggil, total waktu yang dikonsumsi oleh semua RPC tersebut ditambah waktu rata-rata yang dikonsumsi oleh
setiap RPC dalam mikrodetik. Blok kelima melaporkan RPC yang dikeluarkan oleh ID pengguna, total
jumlah RPC yang mereka keluarkan, total waktu yang dihabiskan oleh semua RPC itu ditambah
waktu rata-rata yang dikonsumsi oleh setiap RPC dalam mikrodetik.
PILIHAN
-a, --semua
Dapatkan dan laporkan informasi. Ini adalah mode operasi default.
-h, --membantu
Cetak deskripsi opsi dan keluar.
-i, --urutkan berdasarkan-id
Urutkan data Remote Procedure Call (RPC) menurut ID jenis pesan dan ID pengguna.
-r, --mengatur ulang
Setel ulang penghitung. Hanya didukung untuk operator dan administrator Slurm.
-t, --urutkan berdasarkan waktu
Urutkan data Remote Procedure Call (RPC) berdasarkan total waktu berjalan.
-T, --urutkan berdasarkan waktu2
Urutkan data Remote Procedure Call (RPC) berdasarkan waktu berjalan rata-rata.
--penggunaan
Cetak daftar opsi dan keluar.
-V, --Versi: kapan
Cetak nomor versi saat ini dan keluar.
LINGKUNGAN VARIABEL
Beberapa sdiag pilihan dapat diatur melalui variabel lingkungan. Variabel lingkungan ini,
bersama dengan opsi yang sesuai, tercantum di bawah ini. (Catatan: opsi baris perintah akan
selalu timpa pengaturan ini)
SLURM_CONF Lokasi file konfigurasi Slurm.
PENYALINAN
Hak Cipta (C) 2010-2011 Barcelona Supercomputing Center.
Hak Cipta (C) 2010-2014 SchedMD LLC.
Slurm adalah perangkat lunak gratis; Anda dapat mendistribusikan ulang dan/atau memodifikasinya di bawah ketentuan
Lisensi Publik Umum GNU sebagaimana diterbitkan oleh Free Software Foundation; baik versi 2
dari Lisensi, atau (sesuai pilihan Anda) versi yang lebih baru.
Slurm disebarluaskan dengan harapan bisa bermanfaat, tapi TANPA JAMINAN APAPUN; tanpa
bahkan jaminan tersirat tentang KELAYAKAN DIPERDAGANGKAN atau KESESUAIAN UNTUK TUJUAN TERTENTU. Lihat
Lisensi Publik Umum GNU untuk perincian lebih lanjut.
Gunakan sdiag online menggunakan layanan onworks.net