מדוע תקלות בדטה סנטר נמצאות בעלייה?
מחקר של Uptime Institute מצביע כי תדירות התקלות בדטה סנטר וחומרתן נמצאות בעלייה ● ליאור לוי, מנכ"ל ומייסד פרולוג'יק, מסביר ממה נובעת העלייה ואיך ניתן להתמודד עימה
לכאורה, נדמה לנו שתקלות (downtime) בדטה סנטר הן משהו מהעבר, דבר מה שבעידן הדיגיטלי ארגונים לא יכולים יותר לסבול או להכיל. אין מנמ"ר או מנהל תשתיות שלא מכיר את הלחץ שנוצר בארגון ומתפרץ כאשר קיימת נפילה של מערכות מחשוב בארגון, וזו הסיבה שארגונים מבצעים השקעות נרחבות כדי למנוע מצבים אלו. אלא שמחקר חדש של מכון המחקר Uptime Institute מצביע שבפועל המציאות היא הפוכה לחלוטין – תדירות התקלות בדטה סנטר וחומרתן דווקא נמצאות בעלייה.
ממצאי המחקר, בו השתתפו 900 חברות אנטרפרייז וספקיות שירותי אירוח המפעילות אתרי דטה סנטר, מראים כי 31 אחוזים מהארגונים דיווחו על תקלות בדטה סנטר או האטה משמעותית של המערכות ב-12 החודשים האחרונים, זאת בהשוואה ל-25 אחוזים שדיווחו בדו"ח בשנת 2017. יתירה מכך, 48 אחוזים מהארגונים דיווחו על דאון טיים של מערכות או תשתיות ה-IT במהלך שלוש השנים האחרונות. מדובר בשיעור גדול ממה שניתן היה לצפות.
שליש מהארגונים דיווחו על תקלה מהותית שנמשכה חמש שעות או יותר
במרבית המקרים התקלות תוקנו בתוך שעה עד 4 שעות, אך שליש מהארגונים דיווחו על תקלה מהותית שנמשכה חמש שעות או יותר עד לתיקונה. עוד עולה כי 80 אחוזים ממקרי נפילת המערכות ניתן היה למנוע והם נובעים מטעויות אנוש, תקלות באספקת החשמל, תקלה ברשת הארגונית או בעיות קונפיגורציה.
דוגמא מהעת האחרונה התרחשה בסוף יולי כאשר תקלה ברשת הארגונית של אחד ממרכזי המחשוב של חברת התעופה האמריקנית אמריקן איירליינס השביתה את פעילות החברה.
בהודעת החברה נמסר כי התקלה נמשכה כ-30 דקות, מה שהוביל לעצירת טיסות החברה בכול רחבי ארצות הברית, וליצירת איחורים של כמה שעות בלוח הטיסות של החברה. כמובן שמעבר לנזקים הכספיים הישירים שיצרה התקלה במערכות המחשוב, יש כמובן גם את הנזקים העקיפים והיקרים עוד יותר – בעיקר נזק תדמיתי ופגיעה באמינות החברה.
ארגונים חייבים לבצע שדרוג והתאמה של יכולות ניטור וניהול התשתיות
מסתבר כי אחת הסיבות המרכזיות לתקלות, שעליה דיווח מכון Uptime Institute היא המורכבות ההולכת וגדלה של סביבות המחשוב וה-IT. דוגמא למורכבות הזו היא הארכיטקטורה ההיברידית, שבמרכזה הארגון משלב בין סביבות הדטה סנטר הפנים ארגוניות יחד עם אפליקציות ותשתיות העובדות בענן.
הארגונים מנסים לבצע אופטימיזציה של עלויות ורמת סיכון באמצעות שילוב בין סביבות דטה סנטר פנים ארגוניות ובין סביבות הענן, והתוצאה היא סביבה היברידית מורכבת לניהול, בטח ביחס לזו שהייתה קיימת בעולם המחשוב – אפילו בהשוואה למה שהכרנו לפני חמש שנים בלבד.
אחד הפתרונות למורכבות הגדלה של המערכות הוא הסתכלות אסטרטגית וכוללת על תחום פתרונות ניהול וניטור התשתיות בארגון. לא יכול להיות שארגונים מבינים את הקריטיות של המערכות, אך לא מבצעים במקביל התאמה של הפתרונות שיאפשרו להם ניהול, ניטור ופיקוח מלאים על תשתיות המחשוב ורציפות פעולתן. כדי לקבל סביבה של אפס תקלות (zero downtime) ארגונים חייבים לבצע שדרוג והתאמה של יכולות ניטור וניהול התשתיות, שתהיה ברמה אופטימלית ותתאים לדרישות הארגון.
עד היום אנחנו מגיעים לארגונים שעדיין לא מבינים את הערך של תחום ניטור תשתיות ה-IT והאפליקציות. עד היום אנחנו מגיעים לארגונים שמפעילים מערכות נפרדות לניטור סביבות הדטה סנטר ומערכות אחרות לניטור סביבות הענן. המציאות הזו חייבת להשתנות ועולה הצורך לבצע ניטור אפקטיבי, אוטומטי ופרואקטיבי, מקצה לקצה, בזמן אמת, לכלל האפליקציות הארגוניות ולתשתיות ה-IT.
לסיכום, האתגר של הארגונים בתחום של שמירה על זמינות ורציפות הפעולה של מערכות המחשוב ותשתיות ה-IT ימשיך ללוות אותנו. העולם הדיגיטלי הינו חסר סליחה או מחילה לנפילה של המערכות ולחוסר זמינות של האפליקציות הארגוניות. גם המורכבות של המערכות והסביבות הטכנולוגיות תמשיך ללוות אותנו, והמורכבות הזו אף תלך ותגבר.
הסביבה ההיברידית אינה אופנה חולפת והיא תעמיק את נוכחותה בשנים הבאות. הדבר מחייב את הארגונים לשים יותר דגש בכלים ופתרונות שיסייעו להם לנהל ולנטר את הסביבות הללו, כלים אחודים וכוללים, שביכולתם לספק תמונה מלאה ושלמה של מצב כלל המערכות בארגון, וללא תלות במיקום שלהן.
הכותב הוא מנכ"ל ומייסד פרולוג'יק, נציגת SolarWinds בישראל.
תגובות
(0)