"כמות הנתונים גדולה ונדרשים תבונה מלאכותית, אנליטיקה ומחשוב מבוזר"
כך אמרה ד"ר רות ברגמן, מנהלת מרכז הפיתוח של HPE בישראל, בכנס השנתי של הלשכה לטכנולוגיות המידע בישראל
"כמות הנתונים גדולה ונדרשת תבונה מלאכותית, אנליטיקה ומחשוב מבוזר. כך אמרה ד"ר רות ברגמן, מנהלת מרכז הפיתוח של HPE בישראל.
ברגמן דיברה בכנס "הפסגה הדיגיטלית – מאסטרטגייה ליישום", הכנס השנתי של הלשכה לטכנולוגיות המידע בישראל, על שם שלמה טירן, מיסודה של לשכת מנתחי מערכות מידע. הכנס, בהפקת אנשים ומחשבים, התקיים לאחרונה במרכז הכנסים אווניו, קריית שדה התעופה, בהשתתפות מאות מקצועני IT.
ד"ר ברגמן וקבוצתה עוסקים מזה 20 שנה באנליטיקה של נתונים, והפיתוחים שלהם מיועדים לטפל ב-Big Data, כך שניתן יהיה להגיע לתובנות מכל המידע שזורם היום מכל מקום.
לדבריה, "ישנן שלוש מגמות גדולות: AI או מחשוב קוגניטיבי, אנליטיקה – שפעם היתה עיסוק לאנשים בעלי דוקטורט במדעי המחשב וסטטיסטיקה והיום יש אותה בכל יישום בסלולר, והאינטרנט של הדברים. כמות המידע הגדולה מכריחה את המפתחים להיות חכמים ולבזר את המערכות – כיום יש התכנסות של המפתח והאלגוריתמאי".
"בעתיד המכשירים יהיו קצת יותר אינטליגנטים, והרבה מהמחשוב יעבור מהענן אליהם", מסבירה ברגמן. "לנו יש נקודת מבט על כל המגמות הללו בפרויקט The Machine".
לתקשר אחד עם השני ועם הזכרון
"אחד הדברים שחייבים לשנות הוא רוחב הפס בין המעבד לאחסון. כיום הוא איטי מאוד, ומדברים על איחוד של הזיכרון והאחסון ביחידה אחת. פיתוח טכנולוגי שיכול לעזור יהיה זכרון לא נדיף מהיר יותר מ-Flash, למעשה כמו DRAM אבל זול ויציב בהרבה, ולכן יוכל להחליף את הדיסק הקשיח – למעשה יהיה לנו זכרון מהיר כמו ל-DRAM עם נפח כמו של דיסק".
שינוי הדרגתי נוסף, אומרת ד"ר ברגמן "הוא בשימוש בתקשורת אופטית. היום משתמשים בסיבים אופטיים לתקשורת בין מחשבים מרוחקים, אבל אנו מתכוונים להכניס תקשורת אופטית בין המעבד לזכרון, כך שנוכל לגשת למידע שלנו באופן הרבה יותר מהיר. לשם כך פיתחנו ארכיטקטורה חדשה למחשוב המעבירה אותנו מהעולם של כל הענן למערכות מבוזרות, וממחשוב מבוסס מעבד למחשוב מבוסס זכרון".
"הארכיטקטורה מאחדת את כל הזכרון למה שנראה למעבדים כמו יחידה אחת, והמעבידים יכולים לתקשר אחד עם השני ועם הזכרון" היא מסבירה. "מדובר על זכרון ענק של 300 טרה-בייט שיהיה במרכז, והמעבדים כולם מחוברים אליו".
"הדבר חשוב במיוחד ללימוד מכונה, כאשר המחשב צריך ללמוד מודל ולצורך כך הוא מנתח כמויות אדירות של מידע. הבעיה היא שישנו צוואר בקבוק – כל פעם המעבד צריך לעדכן את הזכרון במודל החדש. זכרון משותף יאפשר לנו לעדכן את הנתונים הרבה יותר מהר".
המכוניות יוכלו לנהוג בעצמן
כדוגמה לשימוש טוב בארכיטקטורה זו, נותנת ד"ר ברגמן את זיהוי התבניות בעיבוד תמונות. "למשל סיווג – יש גידול על העור או אין. כל התחום של למידה עמוקה אינו עתידני. אנחנו משתמשים בזה יום יום. למשל בחיפוש תמונות בגוגל (Google) ובמערכות סיוע לנהג. עוד זמן לא רב המכוניות יוכלו לנהוג בעצמן על סמך הטכנולוגיה הזו".
"יתרון נוסף שתיתן הארכיטקטורה, הוא ייצוג גרפים של יישויות והקשרים ביניהם", אומרת ברגמן. "עד היום השתמשנו בטבלאות שהגיעו כקבוצה אחת מהדיסק. בגרף ניתן לקפוץ מישות לישות דרך החיבורים מבלי להיכשל בשל היעדר חלק מהנתונים. הבעיה – גרף צורך המון זכרון ורק גידול עצום כזה יאפשר ליישם זאת. כל הרשתות החברתיות פועלות בדרך זו. פייסבוק (Facebook) ולינקדאין (LinkedIn) בוחנות כל הזמן את הגרף החברתי שלכם ומשתמשות במידע הזה כדי להתאים לכם את מה שאתם רואים. גם גוגל עושה הרבה כסף מהסתכלות על גרף החיפושים שלכם".
ולבסוף, הסבירה ברגמן כי גם סוגיות אבטחת המידע והאבטחה הפיזית ייהנו מגידול זה בזכרון. "הארגון הדיגיטלי זקוק לסגנון חדש של הגנה. הגישה של פיירוול והגנה מבחוץ לארגון לא מספיקה. צריך להבין את המשתמשים כי במקרים רבים קוד עוין חודר בעזרתם של עובדים בארגון. כדי לגלות תבניות חשודות היום אוספים אלפי או עשרות אלפי אירועים ביום – נצטרך לעבור למאות מיליונים. מאות טרה-בייט יאפשרו לנו לטפל ב-10 מיליון אירועים לשניה וגם לשמר את המידע בזכרון שבועות במקום ימים. גם את הרשת הארגונית כדאי לייצג כגרף, וזה יהיה גרף גדול ומשתנה ללא הרף".
"בעידן האנטרנט של הדברים, לא נוכל להביא את כל המידע העצום הזה למרכז או לענן, ונהיה חייבים לטפל בו בצורה מבוזרת, כפי שמאפשרת הארכיטקטורה החדשה שאנו מפתחים במעבדות HPE", סיכמה ברגמן.
תגובות
(0)