"בתקלה בפייסבוק יש הרבה מעבר לבעיית DNS"

כך אמר עמוס רוזנבוים, סמנכ''ל הטכנולוגיות של אואזיס ● "מה שהפך את התקלה לחמורה ולמפתיעה עוד יותר זה שהיא קרתה לנוכח משאבי פייסבוק הכמעט אינסופיים, והעוצמה הטכנולוגית שלה, לפיכך עוד שירותים קריטיים נסמכו על אותה תשתית שנפגעה"

עמוס רוזנבוים, סמנכ''ל הטכנולוגיות של אואזיס.

תקלה בפייסבוק, שהשפיעה על כלל הרשת העולמית למשך שעות, היא שילוב של שתי תקלות הכרוכות זו בזו, שתי תקלות של היבטי תשתית קריטיים באינטרנט – תשתית הניתוב ותשתית ה-DNS", כך אמר עמוס רוזנבוים, סמנכ"ל הטכנולוגיות של אואזיס.

תקלה בפייסבוק. אילוסטרציה: BigStock

תקלה בפייסבוק. אילוסטרציה: BigStock

התקלה שהייתה ללופ אינסופי

לדברי רוזנבוים, "התקלה החלה, כנראה, בכלל מתקלת תקשורת, שלא ידוע מה הסיבה לה. מהות התקלה קשורה לכתובות ה-IP, המנותבות בפרוטוקול BGP – השפה בה הנתבים מדברים ביניהם. כדי שניתן יהיה להגיע אליהם בכל נקודה באינטרנט, עליהם להיות בטבלה. פה, כתובות שרתי פייסבוק נעלמו מהטבלה, כנראה בשל טעות אנוש. אז, משתמשים לא יכולים לבצע פעולה בסיסית של DNS, משמע של תרגום שם – לכתובת".

"התקשורת", הסביר רוזנבוים, "נסמכת על תשתית הניתוב ורובה המכריע על תשתית DNS. כאשר משהו משתבש בתשתית אחת, אז התשתית השנייה משתבשת גם היא וכך נוצרת לה נפילה קטסטרופלית".

"מה שהפך את התקלה לחמורה ולמפתיעה עוד יותר", הסביר, "זה שהיא קרתה, לנוכח משאבי פייסבוק הכמעט אינסופיים, והעוצמה הטכנולוגית שלה. לפיכך, עוד שירותים קריטיים נסמכו על אותה תשתית שנפגעה". 

לדברי רוזנבוים, "לכל ארגון יש 'דלת אחורית', לא במובן של אירוע סייבר, אלא הדרך שלו לשלוט ברכיבי התשתית – גם כשהנתיב המרכזי נפל. אנשי התשתיות של פייסבוק נדרשו להיכנס לנתבים, ולעשות 'רברס' לאותה טעות – אלא שהכניסה אליהם הייתה תלויה בשרתים שנעלמו – וכך נוצר לו לופ אינסופי: תשתית החירום היתה תלויה בתשתית שנפגעה, ולא אפשרה מעבר אליה".

"בדרך כלל, תשתיות הניתוב ותשתיות ה-DNS עובדות היטב"

"ישנה חשיבות מאד גדולה לתחום המכונה Out of band network", הסביר, "וזה בהחלט קשור לתקלת הענק מאמש. מדובר בצורך להחזיק נתיב תקשורת נוסף בתשתיות, עוד קו אינטרנט נפרד, שזה דבר המהווה כאב ראש למנהלי התשתיות. גם להרבה ארגונים בישראל יש בעיות וחוסר בתשתית הגישה שלהם בחירום. מדובר בנושא לוקה בחסר. עד שהארגון אינו חווה תקלה קריטית נוטים לזלזל בתחום, כי זה עוד היבט של הצורך לתחזק. מנהלי התשתיות אומרים לעצמם 'מדוע עלי להשקיע בתחום שימנע תקלות שאינן קורות?'. ככל שהעולם יותר דיגיטלי, כך גדלה החשיבות של טיפול בהיערכות בהיבטי חירום. מה לעשות, אבל ארגונים נוטים להיות ממוקדים בצדדים האפליקטיביים ובביצועים – ופחות בתשתית. היבטי התשתית, האפורים – לא מעניינים ביומיום, כמו שאינך קם בבוקר ומוודא שיש מים זורמים בברז. בגלל שבדרך כלל, תשתיות הניתוב ותשתיות ה-DNS עובדות היטב, כמעט 100% מהזמן – אז לא מרבים לעסוק בהן. אולם כאשר קורה אירוע – כאשר משהו משתבש, אז השיבוש הוא מאוד משמעותי".

"בעשור האחרון", הסביר רוזנבוים, "האינטרנט הפך להיות מאד ממורכז, כאשר כמה חברות ענק, ואמזון, גוגל ופייסבוק בראשן – חולשות על חלק עצום מתשתיות הרשת. אז, אם משהו משתבש, הדבר משפיע על כל המערכת".

"אני מקווה", סיכם רוזנבוים, "כי כמו שאירוע שירביט העלה את המודעות הציבורית לנושאי כופרה והגנת הסייבר, כך, תקלה זו תעלה את המודעות לתשתיות ולחשיבות התחזוקה שלהן. מקבלי ההחלטות בארגונים עסקיים והקברניטים ברמה הלאומית-ציבורית-ממשלתית, נדרשים להקדיש מחשבה ומשאבים לנושא האפור והלא סקסי הזה, כי חשיבותו קריטית, ורק הולכת וגדלה".

תגובות

(1)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

  1. מלכנ שליט

    מעניין מאוד. תודה. הלואיו ש מנע מתקלות כאלה בעתיד

אירועים קרובים