"עברנו מתצורה מבוזרת בשתי מערכות נפרדות – למערכת אחת"

אמרה רס"ל נופר קוטלר, ראש תחום תשתיות המחשוב בחט"ל של זרוע היבשה, והוסיפה: "אנחנו צוות יחסית מצומצם כך שזה מאוד מייעל את העבודה שלנו כעת"

רס"ל נופר קוטלר, ראש תחום תשתיות המחשוב בחט"ל של זרוע היבשה. צילום: ניב קנטור

"בשנה האחרונה החלפנו מערך גיבוי ביחידה. למעשה לא הייתה ממש ברירה. הסיבה שהובילה לכך היא שעבדנו בצורה קצת מסורבלת ולא נוחה עם שתי מערכות גיבוי, צורת עבודה שהיו בה חסרונות רבים – בעיקר מבחינת עלויות בגלל הצורך בהרבה רישויים והמון תחזוקה. מעבר לכך, היה צורך בהכשרה של החיילים לעבוד עם שתי מערכות שונות, וכידוע תחלופת כוח אדם בצבא היא דבר שמתרחש בתדירות מאוד גבוהה, לכן היה כאן גם בזבוז זמן מיותר", כך סיפרה רס"ל נופר קוטלר, ראש תחום תשתיות המחשוב בחט"ל של זרוע היבשה, כשהסבירה את התהליכים שהובילו את היחידה לבחור בהקמת מערכת גיבויים אחודה חדשה.

קוטלר סיפרה כי ליחידה יש דטה סנטר עצמאי מתקדם עם מערך אחסון מאוד גדול, כזה שצריך לספק תשתית לכל המשרתים ביחידה שפרושים בכל הארץ, כולל עבודה מול גורמי חוץ לצורך ייצור ראשוני.

"מעבר לכך נתקלנו גם בהרבה בעיות תמיכה מהחברות השונות ולכן החלטנו לבחור פתרון חדש כשהיעד הראשון היה למצוא מערכת שתאפשר לגבות את ה-NAS ואת ה-SAN ביחד, פתרונות לגיבויים בכמה רמות וכן לאתר ה-DR שלנו", הסבירה קוטלר לאנשי המקצוע הרבים שהתאספו באולם האירועים לאגו שבראשון לציון לכנס Data Centers 2019 של אנשים ומחשבים.

"ברכש נכלל גם שרת פיזי ייעודי לגיבויים גם כדי לשרת את הצורך בשרידות. אחד התהליכים שעברנו לצורך הגיבוי החדש הא צמצום נפחי הגיבוי כדי לחסוך במשאבים. זה היה חשוב מאוד כי זה גם יעזור מאוד להאריך את מחזור השירות של השרת שזה עתה קנינו. עברנו מתצורת עבודה מבוזרת בשתי מערכות נפרדות והצלחנו להכניס הכל למערכת אחת שנותנת מענה כולל. אנחנו צוות יחסית מצומצם כך שזה מאוד מייעל את העבודה שלנו כעת", היא סיכמה.

משה שמריהו, מנהל התפעול והתשתיות בבנק איגוד. צילום: ניב קנטור

משה שמריהו, מנהל התפעול והתשתיות בבנק איגוד. צילום: ניב קנטור

האתגרים והשיקולים בתכנון והעברת מתקן מחשוב

משה שמריהו, מנהל התפעול והתשתיות בבנק איגוד, דיבר על האתגרים והשיקולים בתכנון והעברת מתקן מחשוב כפי שהם באו לידי ביטוי בתכנון ובהעברה של חדר המחשב הראשי של הבנק לאתר מיקור חוץ. באופן כללי הוא סיפר על הפרויקט כי הוא היה מורכב מאוד, עם שותפים בתוך הבנק וגם ספקים חיצוניים עם צורך בתיאום מאוד גבוה.

"היה ברור לנו שאנחנו לעשות הכל – כולל פירוק, סימון והרכבה באתר החדש – בפעם אחת, ולכן היה חשוב מאוד לעשות זאת נכון", הוא סיפר.

הוא גם נדרש לשאלה מה היה השיקול העיקרי שלא לבנות את המתקן החדש במסגרת הנדל"ן של הבנק,, אלא לבחור בחברה חיצונית. "הבחירה הייתה באירוח בפירוש מתוך היבט של עלות מול תועלת. הבחירה הזו מהווה עבורנו חסכון כלכלי – דמי הארנונה, לדוגמה, הכסף שצריכים היינו לשלם עבור חשמל, עבור מים וכוח אדם ומשאבים אם המתקן היה נבנה כחלק מהבנק", אמר.

התהליך כלל גם בדיקות של קווי סיכונים אפשריים. "היו שלושה קווי ניהול סיכונים בבנק. בדקנו הכל מבחינת הספק ואתר האירוח, בדקנו הכל מבחינת הספק שביצע את המעבר בפועל כמו גם את כל תהליך המעבר עצמו, כל דרכי פעולה ואיך מקטינים סיכונים. במקביל היה ליווי של אגף הבקרה וניהול הסיכונים בבנק עצמו גם קו נוסף בדמות ביקורת פנימית, וכל זה כדי לוודא שהפרויקט יצליח", תיאר שמריהו.

הוא גם סיפק תובנה אחת חשובה. "תכננו את האתר כך שישרת אותנו לפחות לעשר השנים הבאות עם הכנה לאופציה לעוד עשר שנים נוספות, כלומר מחשבה מלאה קדימה. ואנחנו מרוצים כי זה מתקן לתפארת עם תשתיות הזנה ושרידות ברמה לאומית, עם חסכון כלכלי וצמצום משמעותי בעלויות הקיום השוטף בתפעול המתקן", סיכם.

גלית כהן, מנהלת פרויקטים ואחראית אחסון מרכזי באל על. צילום: ניב קנטור

גלית כהן, מנהלת פרויקטים ואחראית אחסון מרכזי באל על. צילום: ניב קנטור

חיפוש אחר פתרון שיסרוק את כל התשתית

גלית כהן, מנהלת פרויקטים ואחראית אחסון מרכזי באל על, סיפרה על הטמעת מערכות לבקרת שרידות והמשכיות עסקית בחברה. "סביבת התשתית שלנו מגוונת ואנחנו משלבים בה שיפורים וטכנולוגיות רבות ומגוונות. השרתים הם בעיקר סביבה וירטואלית עם מערכות הפעלה עיליות, ועבור כל מערכת אחסון ראשי יש גם אתר DR עם אפשרות לקפוץ לנקודות זמן מדויקות. אנחנו מספקים מענה פעיל פעיל ברמת האחסון עבור כל מערכת שזקוקה לכך", היא סיפרה.

החיפוש היה אחר פתרון שיסרוק את כל התשתית  כל המגוון של המרכיבים, בסביבה מאוד הטרוגנית בה עובדים עם יצרנים רבים, כשלכל יצרן יש דרכי עבודה מועדפות שאנחנו צריכים לתת להן מענה. "היינו זקוקים לפתרון שיבצע ניתוח ובחינה של המאגר הכללי של הידע, ועל סמך כך לספק מידע לגבי נקודות כשל קיימות שיכולות לגרום להשבתה ו/או לאובדן קשה של היכולת לתת מענה. חיפשנו גם פתרון לגבי רמת האיכות של החיבור לאתר DR", סיפרה כהן.

באל על בחרו בסוף של דבר בפתרון AvailabilityGuard של Continuity Software הישראלית. "משתמשים בפרוטוקולים קיימים בארגון, והמידע הנאסף הוא לצורך ניתוח בלבד ובאופן מינימלי בלי להעמיס את הרשת. ההטמעה נמשכה מספר חודשים. בתהליך הראשון לאחר מכן הוצפו אלפי סיכונים ובעיות ועברנו כל על כל סיכון וסיכון באופן מתודי כולל סיעור מוחות לגבי שינויים, ועם מעקב כדי לבדוק שאם אחרי השינויים שאכן סגרו את הסיכון באמת. אבל עקומת הלמידה הובילה לכך שכיום יש איתותים על כמה סיכונים בודדים בכל חודש בלבד", היא סיכמה.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים