שובר השוויון של התעשייה
דן ענבר, סגן נשיא ומנכ"ל מרכזי הפיתוח של Dell-EMC ישראל, על קפיצת המדרגה הנוכחית של הבינה המלאכותית: למידת המכונה והשפעותיה העסקיות
מנהלים בארגונים מאמינים כי עד שנת 2021, 75% מהיישומים הארגוניים ישתמשו בצורה כזו או אחרת בבינה מלאכותית, כך עולה ממחקר שביצעה IDC. בינה מלאכותית כידוע, אינה פתרון חדש במיוחד וראינו את הטכנולוגיה כבר בכמה שלבים בהתפתחותה הטכנולוגית בעשורים האחרונים, ובוודאי בשנים האחרונות. אז מה מיוחד בקפיצת המדרגה הנוכחית? בשתי מילים: 'למידה עמוקה' (Deep Learning).
אפשר לומר ש"למידת מכונה" (ML, Machine Learning) החלה כבר במלחמת העולם השנייה, כאשר המדינות הלוחמות התמודדו עם אתגרים רבים. כך למשל בתחום הלוחמה האווירית, "האזורים הבטוחים" נותרו פגיעים, בניית חומות גדולות או שימוש באוקיינוס כמחסום התגלו כפתרון לא יעיל ועוד.
מכונות "לומדות" התפתחו בעבר מתוך הצורך להילחם במטוסים
בספרו "עלייתה של המכונה", פורש תומס ריד את ההיסטוריה של הקיברנטיקה (או כפשוטה – סייבר) ומתאר כיצד מכונות "לומדות" התפתחו מתוך הצורך להילחם בזמנו – במטוסים. על ידי שילוב של אדם ומכונה, תותחים נגד מטוסים היו דינמיים יותר במיגור התקפות אוויריות וזו למעשה נקודת ההתחלה של עידן השילוב בין אדם למכונה.
במשך השנים התקדמו המכונות הלומדות – מזיהוי דפוסים בסיסיים ועד לפיתוח רשתות עצביות המאפשרות למכונות לנהוג במכוניות, להטיס מטוסים (ללא טייס) ולהסיע רכבות.
מרבית מההתקדמות בתחום 'למידת מכונה' התאפשרה בזכות 'למידה עמוקה'. תחשבו על DL כתת מערכת בלמידת מכונה שבה האלגוריתמים השונים פשוט לומדים, בכמויות גדולות, ממש כמו המוח האנושי. בלמידת מכונה האלגוריתמים מתוכננים לפי קבוצה מוגדרת של מאפיינים. למשל, הניסיון לזהות סוגי כלי רכב באמצעות לימוד מכונה דורש "בנק מאפיינים" כגון גודל, בסיס גלגלים, סוג הנעה וכדומה. לעומת זאת, למידה עמוקה מאפשרת לרשת העצבית לבנות בנק מאפיינים משלה ולהגדיר את התכונות שהיא מחפשת באמצעות הזנת נתונים.
נראה כי המחקר סביב למידה עמוקה והמתמטיקה שמגיעה עמו, נמצאים פה כבר שנים, אבל רק לאחרונה החלו לממש את הפוטנציאל האמיתי של הטכנולוגיה.
המפתח לעלייתה של הלמידה עמוקה נמצא, כמו תמיד, בנתונים. אחד המומחים העולמיים בתחום האינטליגנציה המלאכותית והלמידה העמוקה הוא הפרופסור אנדרו נג שטען כי עלייתה של הלמידה העמוקה נשענת בעיקר על עלייה באיכות הדטה והאלגוריתמים המשופרים בתחום. ככל שמדעני נתונים ומהנדסי למידת מכונה משתמשים באלגוריתמים טובים יותר, וככל שבנק המידע גדול יותר, כך עולה רמת הדיוק של המודלים והניתוחים השונים.
האינטרס האמיתי מאחורי הקוד הפתוח של החברות הגדולות
עולם למידת המכונה עדיין לא בוגר מספיק, אך ככל שנתקדם, באופן טבעי – נדע יותר. ככל שעסקים מתפתחים באבולוציית למידת המכונה, כגון ללמד רכב לנהוג באופן אוטונומי, הם נדרשים לעבוד עם אלגוריתמים מורכבים יותר, סוגי מידע מגוונים יותר וכמובן כמות מידע עצומה. השיפור בדיוק מראה למדעני הנתונים, כי העיקר בפיתוח מודלים טובים בתחום לימוד המכונה הוא שימוש נכון יותר באלגוריתמים טובים יותר וברשתות עצבים. אולם, הטכנולוגיה עצמה היא רק חלק אחד במשוואה.
בהקשר זה ניתן לבחון את מה שעושות גוגל ופייסבוק בנוגע להטמעת הלמידה העמוקה. שתי הענקיות הנגישו לציבור את גרסאות הקוד הפתוח שלהן לפתרונות למידה עמוקה
באמצעות פלטפורמות Caffe ו-Tensorflow. נשאלת השאלה מדוע שיעשו זאת? האם המתחרה, או חברת הזנק רנדומלית כלשהי, לא יכולה לבנות בעצמה מודלים אשר חוזים אילו פרסומות סביר כי יקליקו עליה יותר?
התשובה פשוטה מאוד – לא. מעטים השחקנים, אם בכלל, שיש להם כמות המידע (בעצם ההון המרכזי כיום) שיש לשתי הענקיות מקליפורניה. הביג דטה הוא שובר השוויון היום, לא אלגוריתם זה או אחר, וזה האינטרס האמיתי מאחורי הקוד הפתוח של החברות הגדולות.
'הון המידע', הוא מושג שעבר מהלכה למעשה בשנים האחרונות, עד אשר הפך לסטנדרט בכל התעשיות. המידע, או ה'דטה', אשר עסקים מחזיקים באמתחתם, הוא למעשה מעין מאיץ חדשנות, ובעולם בו החדשנות היא נותנת הטון – אין חשוב מכך ביציאה אל שוק המחר.
הנתונים יכולים להיות קו פרשת המים אשר יחליט אם הפרויקט העסקי הבא שלכם יהיה מוצלח, או לא. לא צריך להסתמך עוד על אינטואיציה של המנכ"ל או פעולה מבריקה מסוימת בשביל לקוות לטוב. כיום, עסקים יכולים להפחית את הסיכונים אליהם הם נחשפים אם רק יתנו לנתונים לקבוע עבורם מה לעשות.
האתגר כיום טמון בדרכי האיסוף, ההגנה, המיטוב והשיתוף של הנתונים. מה שבאמת עלול להכשיל עסקים בעולם המחר הוא חוסר אסטרטגיית ניהול מידע ראויה כיום.
הכותב הוא סגן נשיא ומנכ"ל מרכזי הפיתוח של Dell-EMC ישראל.
תגובות
(0)