זהו הפקודה sdiag שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS
תָכְנִית:
שֵׁם
sdiag - כלי אבחון לתזמון עבור Slurm
תַקצִיר
sdiag
תיאור
sdiag מציג מידע הקשור לביצוע slurmctld על: שרשורים, סוכנים, משרות ו
אלגוריתמי תזמון. המטרה היא להשיג נתונים מהתנהגות slurmctld שעוזרים לכך
התאם פרמטרים של תצורה או מדיניות תורים. הסיבה העיקרית מאחורי היא לדעת
התנהגות עילפון תחת מערכות עם תפוקה גבוהה.
יש לו שני מצבי ביצוע. מצב ברירת המחדל --את כל מציג מספר מונים וסטטיסטיקות
הוסבר מאוחר יותר, ויש אפשרות ביצוע נוספת --אִתחוּל לאיפוס ערכים אלו.
הערכים מאופסים בחצות שעון UTC כברירת מחדל.
גוש המידע הראשון קשור לביצוע slurmctld גלובלי:
שרת חוט לספור
מספר שרשורי slurmctld הפעילים הנוכחיים. מספר גבוה פירושו גבוה
אירועי עיבוד עומסים כמו הגשת משרות, שיגור משרות, השלמת עבודות,
וכו'. אם זה לעתים קרובות קרוב ל-MAX_SERVER_THREADS, זה יכול להצביע על פוטנציאל
צַוַאר הַבַּקבּוּק.
סוֹכֵן תור גודל
לעיצוב Slurm יש מחשבה על מדרגיות ושליחת הודעות לאלפי צמתים היא
לא משימה טריוויאלית. מנגנון הסוכן עוזר לשלוט בתקשורת בין
דמונים של slurm והבקר למאמץ הטוב ביותר. אם הערך הזה קרוב ל
MAX_AGENT_CNT עשויים להיות כמה עיכובים המשפיעים על ניהול משרות.
מקומות תעסוקה הוגש
מספר המשרות שהוגשו מאז האיפוס האחרון
מקומות תעסוקה החל
מספר העבודות שהתחילו מאז האיפוס האחרון. זה כולל עבודות מילוי חוזר.
מקומות תעסוקה נשלם
מספר העבודות שהושלמו מאז האיפוס האחרון.
מקומות תעסוקה מבוטל
מספר המשרות שבוטלו מאז האיפוס האחרון.
מקומות תעסוקה נכשל
מספר המשרות נכשלו מאז האיפוס האחרון.
בלוק המידע השני קשור לאלגוריתם התזמון הראשי המבוסס על משרות
סדרי עדיפויות. מחזור תזמון מרמז לקבל את נעילת job_write_lock, ואז לנסות להשיג
משאבים עבור משרות ממתינות, החל מהעדיפות ביותר והולך בצאצא
להזמין. ברגע שעבודה לא יכולה להשיג את המשאבים, הלולאה ממשיכה לעבוד אלא רק עבור עבודות
מבקש מחיצות אחרות. משרות עם תלות או מושפעות ממגבלות חשבונות הן
לא מעובד.
אחרון מחזור
זמן במיקרו-שניות למחזור התזמון האחרון.
מקס מחזור
זמן במיקרו-שניות עבור מחזור התזמון המרבי מאז האיפוס האחרון.
סה"כ מחזורי
מספר מחזורי התזמון מאז האיפוס האחרון. התזמון נעשה מעת לעת
וכאשר מוגשת עבודה או הושלמה עבודה.
ממוצע מחזור
ממוצע מחזורי התזמון מאז האיפוס האחרון
ממוצע עומק מחזור
ממוצע עומק המחזור. עומק פירושו מספר עבודות שעובדו במחזור תזמון.
מחזורים עבור דקה
מונה של ביצוע תזמון לדקה
אחרון תור אורך
משך העבודות הממתינות בתור.
גוש המידע השלישי קשור לאלגוריתם תזמון מילוי חוזר. א
מחזור תזמון מילוי חוזר מרמז על קבלת מנעולים עבור עבודות, צמתים וחפצי מחיצה
ואז מנסה להשיג משאבים לעבודות ממתינות. משרות מעובדות לפי סדרי עדיפויות. אם
עבודה לא יכולה לקבל משאבים שהאלגוריתם מחשב כאשר הוא יכול לגרום להם להשיג א
שעת התחלה עתידית לתפקיד. לאחר מכן העבודה הבאה מעובדת והאלגוריתם מנסה להשיג
משאבים לעבודה זו אך הימנעות מלהשפיע על קודם יחידות, ושוב זה מחשב
זמן ההתחלה העתידי אם לא המשאבים הנוכחיים הזמינים. אלגוריתם מילוי חוזר לוקח
יותר זמן לעיבוד של כל עבודה חדשה מאחר שלא ניתן להשפיע על עבודות עדיפות יותר. ה
האלגוריתם עצמו נוקט באמצעים כדי להימנע ממחזור ביצוע ארוך ולנקיטת כל
מנעולים יותר מדי זמן.
סה"כ מילוי חוזר משרות (מאז אחרון עילפון הַתחָלָה)
מספר המשרות שהתחילו הודות למילוי חוזר מאז תחילת השפל האחרון.
סה"כ מילוי חוזר משרות (מאז אחרון סטטיסטיקות מחזור הַתחָלָה)
מספר העבודות שהתחילו הודות למילוי חוזר מאז אופס הנתונים הסטטיסטיים בפעם האחרונה. על ידי
ברירת מחדל ערכים אלה מאופסים בחצות שעון UTC.
סה"כ מחזורי
מספר מחזורי התזמון מאז האיפוס האחרון
אחרון מחזור מתי
הזמן שבו התרחש מחזור הביצוע האחרון בפורמט "יום חול חודש חודש יום
שעה:דקה.שניות שנה"
אחרון מחזור
זמן במיקרו-שניות של מחזור המילוי האחרון. זה סופר רק זמן ביצוע
הסרת זמן שינה בתוך מחזור תזמון כאשר זה לוקח יותר מדי זמן. הערה
שמנעולים משתחררים בזמן השינה כדי שעבודה אחרת תוכל להמשיך.
מקס מחזור
זמן במיקרו-שניות של מחזור מילוי חוזר מרבי מאז האיפוס האחרון. זה
סופר רק זמן ביצוע הסרת זמן שינה בתוך מחזור תזמון כאשר זה
לוקח יותר מדי זמן. שימו לב שמנעולים משתחררים בזמן השינה כך
עבודה אחרת יכולה להמשיך.
ממוצע מחזור
הממוצע של מחזורי תזמון מילוי חוזר במיקרו-שניות מאז האיפוס האחרון
אחרון עומק מחזור
מספר העבודות שעובדו במהלך מחזור תזמון המילוי החוזר האחרון. זה נחשב כל
תהליך גם אם אין לו אפשרות לבצע עקב תלות או מגבלות.
אחרון עומק מחזור (לְנַסוֹת לוח זמנים)
מספר העבודות שעובדו במהלך מחזור תזמון המילוי החוזר האחרון. זה נחשב רק
תהליכים עם סיכוי לרוץ בהמתנה למשאבים זמינים. עבודות אלו הן
מה שהופך את אלגוריתם המילוי החוזר לכבד יותר.
עומק ממוצע
הממוצע של עבודות מעובדות במהלך מחזורי תזמון מילוי חוזר מאז האיפוס האחרון.
עומק ממוצע (לְנַסוֹת לוח זמנים)
הממוצע של עבודות מעובדות במהלך מחזורי תזמון מילוי חוזר מאז האיפוס האחרון. זה
סופר רק תהליכים עם סיכוי לרוץ בהמתנה למשאבים זמינים. אלה
העבודות הן מה שהופך את אלגוריתם המילוי החוזר לכבד יותר.
אחרון תור אורך
מספר העבודות הממתינות לעיבוד על ידי אלגוריתם מילוי חוזר. עבודה מופיעה בתור
הרבה פעמים כמו מחיצות זה ביקש.
תור אורך ממוצע
ממוצע העבודות הממתינות לעיבוד על ידי אלגוריתם מילוי חוזר.
גוש המידע הרביעי והחמישי מדווח על השלט המונפק ביותר
קריאות פרוצדורה (RPCs), קריאות שנעשו לדמון Slurmctld לבצע פעולה כלשהי. ה
הבלוק הרביעי מדווח על RPCs שהונפקו לפי סוג הודעה. תצטרך לחפש את ה-RPC האלה
קודים בקוד המקור של Slurm על ידי חיפוש אחריהם בקובץ
src/common/slurm_protocol_defs.h. הדוח כולל את מספר הפעמים שכל RPC הוא
שהופעל, הזמן הכולל הנצרך על ידי כל אותם RPCs בתוספת הזמן הממוצע שנצרך על ידי
כל RPC במיקרו-שניות. הבלוק החמישי מדווח על RPCs שהונפקו על ידי מזהה משתמש, סך הכל
מספר RPCs שהם הנפיקו, הזמן הכולל הנצרך על ידי כל אותם RPCs בתוספת
הזמן הממוצע הנצרך על ידי כל RPC במיקרו-שניות.
אפשרויות
-a, --את כל
קבל ודווח על מידע. זהו מצב הפעולה המוגדר כברירת מחדל.
-h, - עזרה
הדפס תיאור של אפשרויות ויציאה.
-i, --מיון לפי מזהה
מיין נתוני שיחה מרחוק (RPC) לפי מזהה סוג הודעה ומזהה משתמש.
-r, --אִתחוּל
אפס מונים. נתמך רק עבור מפעילי ומנהלי Slurm.
-t, --מיון לפי זמן
מיין נתוני קריאת נוהל מרחוק (RPC) לפי זמן ריצה כולל.
-T, --מיון לפי זמן2
מיין נתוני Remote Procedure Call (RPC) לפי זמן ריצה ממוצע.
--נוֹהָג
הדפס רשימת אפשרויות וצא.
-V, --גִרְסָה
הדפס את מספר הגרסה הנוכחית וצא.
הסביבה וריאציות
כמה sdiag ניתן להגדיר אפשרויות באמצעות משתני סביבה. משתני סביבה אלו,
יחד עם האפשרויות המתאימות להם, מפורטים להלן. (הערה: אפשרויות שורת הפקודה יהיו
תמיד תעקוף את ההגדרות האלה)
SLURM_CONF המיקום של קובץ התצורה של Slurm.
העתקה
זכויות יוצרים (C) 2010-2011 Barcelona Supercomputing Center.
זכויות יוצרים (C) 2010-2014 SchedMD LLC.
Slurm היא תוכנה חופשית; אתה יכול להפיץ אותו מחדש ו/או לשנות אותו תחת התנאים של
רישיון הציבור הכללי של GNU כפי שפורסם על ידי קרן התוכנה החופשית; או גרסה 2
של הרישיון, או (לפי בחירתך) כל גרסה מאוחרת יותר.
Slurm מופץ בתקווה שהוא יהיה שימושי, אך ללא כל אחריות; לְלֹא
אפילו האחריות המשתמעת של סחירות או התאמה למטרה מסוימת. ראה את
רישיון ציבורי כללי של GNU לפרטים נוספים.
השתמש ב-sdiag באינטרנט באמצעות שירותי onworks.net