תכנית המשכיות עסקית והתאוששות מאסון DRP-BCP
מתקני המחשב בימינו מכילים נכסים חיוניים לפעולתו התקינה של הארגון. אנרג'י טים (Energy Team) ומ.ש.ר. הנדסה ופיתוח העובדות בשיתוף פעולה בתחום זה פיתחו מודל משולב עבור לקוחותיהם, המסייע להמשכיות העסקית (Business Continuity) ותורם להכנה נכונה להתמודדות והתאוששות מאסון (Disaster Recovery).
מודל התהליך מתחיל בתכנון וניהול של מתקן המחשב. אנו מציעים ללקוחותינו להקפיד על שלושה שלבים:
● הגדרת הדרישות – תהליך שמתחיל בהגדרה וכתיבה של מסמך דרישות שיכלול את צרכי מתקן המחשב: זמינות, שרידות, אמינות, מיגון, יעילות אנרגטית ותחזוקתיות הדרושים לו.
● תכנון – כתיבת תוכנית מפורטת אשר תדאג כי המתקן והמערכות האלקטרו-מכאניות התומכות הינם במדרוג Tier/Level התואמים את הצרכים.
● ביצוע ובדיקה – ביצוע ומימוש התכנון ובדיקה כי המתקן והמערכות התומכות עומדים בדרישות. בשלב זה יש להשלים את תהליך ההסמכה לרמת המדרוג שנקבעה.
השלב הבא במודל הינו הגדרת נהלי ההתאוששות מאסון (DRP) ואיך הארגון אמור לקבל החלטות ולתפקד בזמן אירוע. איתרנו שלוש נקודות מפתח שיבטיחו שהארגון יצלח אירוע אסון בשלום:
● חלוקת תפקידים ברורה – חילקנו את הארגון לארבע קבוצות:
א. Business Management Team – צוות בראשות מנכ"ל הארגון וסמנכ"לים רלוונטים. צוות זה אחראי להחלטות העסקיות הקשורות באירוע DR.
ב. Critical Management Team – צוות בראשות המנמ"ר ומנהל האגפים ב-IT. אחראים על קבלת ההחלטות על דילוג לאתר המשני, בחירה בין חלופות טכניות וכו'.
ג. Critical Technical Team – צוות בראשות מנהל התשתיות וראשי צוותים רלוונטים. אחראים על גיבוש תמונת המצב הטכנית והנחיית האנשים הפועלים בשטח.
ד. Crisis Operation Team – אנשי ה-Hands on המבצעים את הפעולות בפועל.
ה. על כל האירוע ועל האינטגרציה בין הצוותים השונים מופקד ה-Disaster Recovery Officer המנצח על תפעול האירוע.
● הבניה ברורה של הנהלים – כאן חילקנו את הנהלים לארבעה ספרים:
א. הספר הירוק – כולל את הארכיטקטורה של הפתרון ואת תהליך קבלת ההחלטות.
ב. הספר האדום – הוא זה ששולפים בזמן אסון והוא מתאר את הפעולות שיש לבצע.
ג. הספר הצהוב – בדומה לספר אדום רק עבור תרחישי תרגיל.
ד. הספר הכחול – מכיל את הוראות העבודה הטכניות.
● Runbook – ה-Runbook הוא למעשה קובץ MS Project המכיל את כל המשימות, עם התייחסות למשך ביצוע וגורם אחראי, על פי התלויות הנדרשות בין המשימות, ועם הגדרה ברורה של אבני דרך בהן מציגים סטטוס לצוותים השונים, ומתקבלות החלטות להמשך.
נקודה משמעותית נוספת היא נושא התרגול. ארגונים משקיעים הון עתק בפתרונות DRP, אולם כשהם באים לתרגל הם בוחרים לתרגל תרחישים חלקיים. המשמעות: מה שלא מתורגל יש סיכוי נמוך שיעבוד. ולכן אנו מציעים תפיסת תרגול המבוססת על ארבעת המ"מים:
● מקיף – על התרגיל לכלול לא רק את התשתיות הטכנולוגיות אלא בעיקר את האנשים שמנהלים את התשתיות ואת הנהלת הארגון עצמה.
● מדמה מציאות – באירוע DR אמיתי אנו עובדים עם כל הארגון על אתר ה-DR כולל כל הסניפים וכל הממשקים וכל המשתמשים.
● מתרגל– מתרגיל לתרגיל אנו צריכים להקטין את זמן ההתאוששות ולשפר את הפתרון ועל מנת להבטיח זאת יש לבצע תחקיר מקיף בתום כל תרגיל.
● מעניק ביטחון– תרגיל טוב הוא כזה שמעלה את רמת הבטחון של הנהלת הארגון בהיקף הפתרון וגם במגבלותיו.
לסיכום, על מנת לוודא שברגע האמת תכנית ההתאוששות מאסון (DRP) תעבוד, חשוב להשקיע בתכנון נכון של מתקן המחשב, בתכנון נהלי ההמשכיות העסקית (BCP) וההתאוששות מאסון (DRP) ולבצע תרגול מלא ובדיקות איכותיות של התרחישים השונים.