זמינות אפליקציות ו-DevOps

מהם מדדי ה-MTBF, ה-MTTD וה-MTTR? וכיצד הם קשורים להורדת הזמן הממוצע בין כישלונות הנוגעים לאוטומציית דילוור?

צילום אילוסטרציה: BigStock

ב-DevOps, יש מיקוד רב בכלים המשמשים לאוטומציית דילוור, במיוחד סביב ניהול תצורה (למשלAnsible , Puppet או Chef) ושחרור אוטומציה (CA-Noliosoft או IBM-UrbanCode). המטרה בכלים אלה היא להשיג אוטומציית דילוור שמטרתה להוריד את הזמן הממוצע בין כישלונות עקב בעיות פריסה ותצורה.

כאשר מדברים על מדדי ה-MTBF, ה-MTTD וה-MTTR, חשוב להבין מה כל אחד מהם מייצג:

MTBF (ר"ת Mean Time Between Failures) – הזמן הממוצע בין כישלונות. מדד שמראה כמה אמין מוצר או רכיב חומרה.
MTTD (ר"ת Mean Time To Detect) – הזמן הממוצע לזיהוי. מדד שמראה כמה זמן נדרש כדי לזהות בעיה בייצור.
MTTR (ר"ת Mean Time To Repair) – הזמן הממוצע לתיקון. זהו מדד של תחזוקת הפרטים הניתנים לתיקון. הוא מייצג את הזמן הממוצע הנדרש כדי לתקן רכיב או מוצר שכשל.

הליכה לפי המדדים הללו לא פותרת לחלוטין בעיות זמינות באפליקציה הקשורות לדילוור, מאחר שזמינות מוגדרת כיחס בין ה-Uptime לזמן הביצוע – כולל זמן ממוצע לזיהוי, זמן ממוצע לתיקון ו-Uptime. כלומר, רק הגדלת הזמן הממוצע בין כישלונות עלול לא לעזור עם הזמן הממוצע לתיקון ואינו מתייחס לבעיות של זמן ממוצע לזיהוי בכלל.

כלים אלה יכולים לעזור עם הזמן הממוצע לתיקון במידה שהמומחה מוכן להניח שהוא יתקן את הבעיות על ידי פריסה מחדש. יש מקרים בהם זה מספיק – למשל, בסביבות שבנויות על בסיס קונטיינרים, שבהן הוא יכול לפרוס את הקונטיינרים התקולים בלבד.

לפני האוטומציה – ואחריה

אך אם לחשוב על זה, אוטומציית DevOps יכולה להגדיל את הזמן הדרוש לאבחון בעיה (שלב ההפרדה לגורמים ב-IDEA). לפני האוטומציה, צוות התפעול הכיר לעומק כל פרט הכרוך בפריסה – הרי שחרור הגרסה היה ידני. עכשיו, עם הכלים האוטומטיים, צוות התפעול לא מסוגל לזהות בעיות באותה המהירות, מאחר שהפרטים של הפריסה נסתרים על ידי כלי.

אבטחת ייצור מתמקדת בהפחתת הזמן הממוצע לתיקון על ידי הפחתת הזמן הממוצע לזיהוי, אבחון ותיקון בעיות הפריסה.

הפחתת הזמן לזיהוי – אבטחת ייצור מזהה באופן יזום בעיות פריסה על ידי השוואת תוויות של הרצת אפליקציה בסביבת סטייג׳ינג לזו של סביבת ייצור.

הפחתת הזמן לאבחון ותיקון – אבטחת ייצור מספקת פרטים מדויקים על המיקום של תקלות הפריסה וממפה אותן לתוויות של הרצת האפליקציה, מה שמקל על תיקון הבעיות.

אבטחת ייצור משלימה את יתרונות ה-DevOps. שילוב ניהול תצורה ואבטחת ייצור מגדיל את הזמן הממוצע בין כישלונות, מפחית את הזמן הממוצע לזיהוי ותיקון, ומאפשר ל-IT לענות על המטרה האמיתית של הגדלת זמינות האפליקציה העסקית.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים