החשיבות של האחריות
על כתפי מי מונחת האחריות לפעילות תקינה של מערכת המידע? ● חשוב לענות על השאלה הזאת, כדי שהנושא לא ייפול בין הכיסאות
בטורים האחרונים עסקתי בסוגיות ניהוליות ברמת המקרו. הפעם אני רוצה לחזור לעולמם הספציפי של המנמ"רים ולעסוק בסוגיה ניהולית ברמת המיקרו: על כתפי מי מונחת האחריות לפעילות תקינה של מערכת מידע – האם על מנהל המערכת בצד האפליקטיבי או על גוף התשתיות ו/או התפעול? באחריותו של מי לוודא בתכנון מערכת חדשה שמתאימים לה שרתים בעוצמה הנכונה? כשיש תקלה מערכתית משביתה, מי צריך לנהל את הטיפול בה – האם הגורם האפליקטיבי ביחידת ה-IT או גוף התשתיות ו/או התפעול שלה?
יש בתחום הזה שתי אסכולות. האחת דוגלת בהפרדת תחומי אחריות – שאנשי האפליקציות יתמקדו בפיתוח ובתחזוקה, ואת כל האחריות על התפעול, התקינות והסייזינג לרכז בגופי התשתיות וההפעלה. יתרונותיה של גישה זו הם בהתמחות ובהתמקדות: אנשי הפיתוח פנויים לקדם את מילוי הצרכים לעמידה ביעדים העסקיים כשאנשי התשתיות והתפעול מטפלים בעניינים היומיומיים. האסכולה השנייה קובעת שיש למנהל המערכת אחריות מלאה בצד האפליקטיבי ואנשי התשתיות והתפעול מעניקים לו שירותים במסגרת המשימה. יתרונותיה של גישה זו ברורים מהגדרתה: ראייה כוללת ואחריות ברורה בכל מקרה של בעיה או תקלה.
בעיה טיפוסית שרובצת לפתחו של המנמ"ר היא "הראש הקטן" – קורה שאנשי הפיתוח לא מתעניינים בסוגיות של תשתית ותפעול ושאלה מצידם לא מתעניינים בתחומים האפליקטיבי והעסקי. במצב לא בריא שכזה, כשמתעוררת בעיית ביצועים, מסיר מעצמו איש האפליקציה כל אחריות ואומר שזו בעיית תשתית. איש התשתיות אומר שהוא לא מכיר את האפליקציה ולכן לא יכול לחזות נפחים וצרכי ביצועים. באופן דומה, מתפתח דין ודברים כשמתרחשת תקלה, מגיעים למצב שהדברים נופלים בין הכיסאות – והעולם כמרקחה. נחשפתי באחרונה לתופעה הפוכה ביחידת IT גדולה, שם נקטו אנשי התשתיות ב-"ראש גדול" כשלקחו על עצמם אחריות מלאה לפעילות ייצור תקינה. לצד הבעת הערכה לגישה הבעתי חשש למחיר של "הקטנת ראש" אצל אנשי האפליקציות ואי זמינותם כשצריך יהיה אותם.
הגישה שלי היא שעל כתפיו של מנהל המערכת בגוף האפליקטיבי מונחת האחריות הכוללת לתכנון מערכת, לרבות משאבי התשתית הנדרשים לה, ועל פעילותה התקינה בייצור, כשהפיתוח לוקח גם שיקולי תפעול. הגם שאנשי התפעול מטפלים בשוטף, מנטרים ביצועים ומנהלים אירועים של תקלות, על מנהל המערכת האפליקטיבי לעמוד ביעדי הזמינות שלה. כך הוא יראה את עצמו אחראי לכל מה שקורה איתה וכשמתרחשת תקלה משביתה הוא ייקח "פיקוד", לצד אנשי התשתיות והתפעול.
על מנת שאנשי התשתיות יהיו "מחוברים", נכון להגדיר בגוף זה אחראי לכל מערכת אפליקטיבית, שנושא באחריות גוף התשתית לפעילות התקינה שלה. במסגרת תפקיד שכזה, עליו להעמיק וללמוד את המערכת, יעדיה והדרישות לתפעולה.
והנה קיבלנו מצב שעל כולם להיות "ראש גדול", נושאים באחריות משותפת. שי בסון, משנה למנכ"ל ומנהל חטיבת טכנולוגיות ומשאבים במגדל, מכנה את זה "100-100". זה ביטוי יפה לאחריות המשותפת, כשכל צד צריך לנהוג כנושא ב-100% של האחריות. אני מאמץ את הביטוי.
תגובות
(0)