המשכיות עסקית – להישאר בעסקים (2/2)

חלק שני ואחרון

עצמון מינס, לשעבר מנמ"ר בכיר

בחלק הראשון ראינו שהמשכיות עסקית היא דבר מתבקש לחברה פיננסית ובוודאי לחברת ביטוח, שמגלגלת סכומים עצומים של כסף. אך מה שלעיתים נראה כל כך ברור ומובן, "מתמסמס" כאשר נדרשים להכניס את היד עמוק לכיס ולהשקיע בנושא – בייחוד כאשר תופעת ה-"סמוך" או "לי זה לא יקרה" חוגגת, או כאשר המנמ"ר לא אסרטיבי מספיק בנושא.

אפרים אקרלינג, סמנכ"ל מערכות המידע וחבר הנהלה בחברת הביטוח אליהו, הפנים מהר מאוד את העובדה שהמשכיות עסקית היא דבר מאוד מהותי וקריטי לפעילות החברה. הפסד הכנסות של יום עבודה אחד, שמסתכמות בכמה מליונים, יכול לכסות את העלות של הקמת BCP, ואת התחזוקה והשדרוג השוטף שלה.

תכנון מערך ה-BCP בחברה לקח בחשבון את ההנחות והנקודות הבאות:

–    תוך 4 שעות מקרות מקרה, פס הייצור והמערכות הקריטיות מופעלות מאתר החרום, ותוך יום-יומיים מערכות מידע אחרות
–    מינוי הנהלה חלופית ובעלי תפקידים חלופיים
–    סניפים וסוכנים ממשיכים לעבוד מול אתר החרום
–    אתר החרום מנוהל ומפוקח על ידי כל חברות מיקור-החוץ שעובדות באליהו
–    באתר החרום מוקצה מקום ל-30 עובדים כולל סביבה משרדית מלאה
–    באתר נוסף הוקצה מקום להנהלה החלופית
–    עובדים בעלי גישה לאינטרנט בבית יוכלו להתחבר לאתר החרום
–    הסניפים יתוגברו באנשי המרכז בשעת חרום

באחרונה השלימו באליהו את הפרויקט גדול להתאוששות מאסון (DRP) והמשכיות עסקית. במסגרת הפרויקט, הועבר מערך ה-DR של אליהו מאתר ברעננה, למרכז המחשבים בבית מלם מערכות מקבוצת מלם-תים, שממוקם בירושלים. הסיבות לביצוע השינוי היו:

–    האתר מרוחק מבית אליהו ונבנה בצלע הר שרובו ממוקם מתחת לפני הקרקע
–    שירות מקצה לקצה ואחריות כוללת של הספק (תים מקבוצת מלם-תים)
–    האתר עומד בתקנים מחמירים והוא בעל תנאי שרידות גבוהים בנושאי אספקת חשמל, מיזוג אוויר וכן מערכות מתקדמות לניטור, גילוי, התראה כנגד אש, הצפה, והוא מאובטח על ידי צוות שמירה, מצלמות גלויות ונסתרות
–    האתר מאויש בכוח אדם מקצועי המורגל לתת שרות ותמיכה בנושאי אתר חרום
–    חברת אליהו קיבלה חדר ייעודי לצורך המשכיות עסקית עבור נציגי המשתמשים, חוזה SLA משופר, מנהל פרויקט צמוד, פורטל מעודכן לניהול המשכיות עסקית

אפרים אקרלינג, סמנכ"ל מערכות המידע וחבר הנהלה בחברת הביטוח אליהו. צילום: קובי קנטורבמסגרת הפרויקט, שארך כחצי שנה, בוצע בין היתר תרגיל רחב היקף, שבו התנסו כל המשתמשים בעבודה בזמן חרום באתר חלופי. כמו כן, הוא כלל חיבור של חדרי המיחשוב ל-DR ברשת נפרדת, התקנת קווי פקס ייעודיים והקמת שתי כיתות הדרכה לשעת חרום – אחת לשימוש של 20 אנשים ושנייה לשימוש של 10 אנשים.

"מעבר לשמירה על מאגרי המידע של אליהו והעתקה שוטפת וקבועה בזמן אמת של המידע מבית אליהו לאתר ה-DR בירושלים, יוכלו עשרות אנשי מפתח בחברה לעבוד פיזית באתר", אומר אקרלינג, סמנכ"ל מערכות המידע. לדבריו, "בזכות פרויקט אסטרטגי זה, מובטחת ההמשכיות העסקית באתר החלופי, גם בתרחיש של תקלה מערכתית או אסון".

באליהו קיימת מערכת גיבוי משולבת שמגבה הן למערך האחסון והן לטייפים חיצוניים. הנהלת החברה קבעה בצורה נחרצת שלא מקובל עליה מצב של איבוד נתונים, ולכן מתבצעת רפליקציה בזמן אמת לבסיסי הנתונים באתר החרום, וכצעד משלים מתבצע "גיבוי קר" כל יום. העתק אחד נשאר בכספת חסינת אש בבית אליהו והעתק אחד יוצא למתקן מאובטח לשמירת גיבויים. מתבצעים גיבויים דיפרנציאליים יומיים, וגיבויים שבועיים, חודשיים ורבעוניים מלאים (4 דורות).

אקרלינג, בוגר חיל המודיעין, ידוע כמנמ"ר שלא מתפשר על אבטחת מידע. בתפישה שלו, המושג אבטחת מידע כולל גם המשכיות עסקית ואי איבוד נתונים: "המשכיות עסקית איננה טכנולוגיה, שירות או מוצר ספציפי, ואף לא פרויקט שיש לו התחלה וסוף. זוהי דרך לעשות עסקים ולהישאר בעסקים – תהליך שנועד לוודא שעסקי הארגון ומחוצה לו זמינים גם בעיתות חרום". לדבריו, המשכיות עסקית כוללת בתוכה הרבה נושאים, שכל אחד מהם דורש התייחסות וטיפול: אתר חרום, ניסוי משתמשים, מתודולוגיה, גיבויים, תשתיות, אבטחת מידע, שימור הידע, ניהול סיכונים ושו"ב.

כחלק מנושא ההמשכיות העסקית טופל גם נושא תשתיות המיחשוב:

–    כל מערכות המחשב מגובות במערכת אלפסק חדישה
–    בשעת חרום מופעל אוטומטית גנרטור המספק חשמל למערכת האלפסק
–    מערכת מיזוג נפרדת לחדר המחשב לרבות גלאי חום המנוטר מול חברת האחזקה
–    מערכת כיבוי וגילוי שריפה בחדר במחשב לרבות ניטור לחברת האחזקה והשמירה

על מנת לא לקחת סיכונים מיותרים, אתר החרום לא משמש את החברה בשוטף לצורך הפעלת סביבות פיתוח או טסט, למרות האפשרות לחיסכון כספי באופן זה. שרידות זה שם המשחק, מסביר אקרלינג. לשם כך פעלו באליהו במישורים הבאים:

–    מעבר לתצורת Terminal Server – כל התוכנות מותקנות בשרת ולא בתחנות (מעבר לשרידות ולשאר היתרונות של TS, הדבר מאפשר רפליקציה לאתר החרום, אי איבוד נתונים שנשמרו בדיסק מקומי)
–    VM – כל השרתים הינם שרתים לוגיים המאוחסנים בשרתים פיזיים בתצורת VM מאפשר שרידות ורפליקציה לאתר החרום
–    רשת תקשורת כפולה הן לסניפים והן לטובת הסוכנים שומרת על Uptime מקסימלי
–    שימוש בתוכנת ARIS המכילה את כל התיעוד, נוהלים ומידע המאפשרת שימור ידע וכמובן מרופלקת לאתר החרום

על מנת לוודא שרידות, מתבצע ניטור בזמן אמת:

–    חדר המחשב הממוקם בקומה 13 ממוזג על ידי שני מזגנים נפרדים
–    בכדי למנוע מצב בו המזגנים יפסיקו לעבוד במשך סוף השבוע, זמן בו אין נוכחות לילה וכתוצאה מכך טמפרטורת החדר תעלה, הותקנה מערכת בקרה לניטור חדר מחשב + התראות SMS. מערכת הבקרה רק מתריעה ולא מחוברת למערכות הפיקוד של המיזוג
–    מתבצעת קריאה רציפה של טמפרטורה והתראות מעל סף מסוים (גם לגבי הצפה)
–    כלל החיוויים כוללים מתן התראות במייל ולטלפון סלולרי

כל תעבורת הדואר באליהו מאורכבת בעזרת מערכת שנותנת מענה לנקודות הבאות:

–    שרתי דואר בנפחים גדולים
–    הצורך בשדרוגי חומרה מתמידים לצורך מתן ביצועים טובים יותר
–    טיפול בקבצי PST גיבוי שיחזור
–    הגדלת זמני התחזוקה המונעת למערכות
–    שרתי קבצים עמוסים בנתונים ללא בקרה ואפשרות למחוק קבצים כפולים
–    רכישה מתמדת של דיסקים יקרים למערכות האחסון
–    חלון גיבוי הולך ומתארך
–    רכישה מתמדת של קלטות גיבוי יקרות
–    דרישות לאחזור מידע שנמחק או אבד בים ה PST של המשתמש
–    דרישות לאחזור מידע "חכם" (מי שלח למי ומתי את המייל בנושא מסוים), בעיקר לצורך התדיינות משפטית או חקירה פנימית
–    מתן מענה לחוקי הרגולציה כגון SOX ,Bazel II ועוד

להשלמת תמונת ה-BCP, מספר אקרלינג שבאליהו קיימות ארבע מערכות מרכזיות המנטרות את השרתים והרכיבים הקריטיים ושולחות מיילים לגורם אחראי במידת הצורך:

1.    Host monitor: מערכת הבודקת את כל מחשבי הרשת ומערכות התקשורת באליהו כולל DRP, בודקת חיות ועומסים, בחלק מהשרתים בודקת services המועדים לנפילה, כגון הדפסה (spooler)
2.    Onguard: דוגם DB של אורקל ושל SQL, כולל ב-DRP, ונותן התראות על file system
3.    App manager: דוגם שרתי סאן, File system + cpu + mem
4.    Navisphere: מערכת לניהול וניתור מערך הדיסקים המרכזי של אליהו, כולל DRP, מתריע על נפחים ובעיות חומרה

לסיכום: אסור לחכות לאסונות על מנת להחליט שהולכים על BCP. האסון בכור הגרעיני ביפן, כמו אסונות אחרים ברחבי העולם, מהווים הוכחה איתנה לצורך הממשי בהערכות ארגון לאסון והגדרת תהליכי עבודה למוכנות עסקית. נזקי האסון ביפן מוערכים בכ-180 מילארד דולרים ויכולת הייצוא של יפן בחודשים שלאחריו פחתה בכ-30% . זיכרו: "אם אין BCP לי – מי לי?".

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים