"נותר שובל דיגיטלי עצום – ויש מי שהמידע הזה שווה לו הרבה כסף"

"בכל מקום שאנחנו נמצאים מישהו יודע איפה הייתם ומה עשיתם - אם תבואו בעוד 20-30 שנה ותרצו עבודה - מישהו ישלוף את הפיד", כך אמר רן ברגמן, מדען הנתונים הראשי של דלויט ישראל

רן ברגמן, מדען הנתונים הראשי של דלויט ישראל. צילום: מוטי סדובסקי

"אנחנו משאירים שובל דיגיטלי עצום, ויש מי שהמידע הזה שווה לו הרבה כסף", כך אמר רן ברגמן, מדען הנתונים הראשי של דלויט (Deloitte) ישראל, במפגש שאורגן על ידי החוג למערכות מידע במכללה האקדמית תל אביב-יפו ולשכת טכנולוגיית המידע, שעסק במדעי המידע.

לדברי ברגמן, "בכל מקום שאנחנו נמצאים – מישהו יודע איפה הייתם ומה עשיתם. גוגל (Google) מזהה שהגעתם לקניון ושולחת לכם פרסומות רלוונטיות. ולא רק נתוני מיקום, אלא גם כל טרנזקציה שאנחנו עושים בכרטיס אשראי, כל טקסט שאנחנו כותבים בכל מיני אתרים ובוודאי כל פיד ברשתות החברתיות. הכל נאגר ונשמר. אם תבואו בעוד 20-30 שנה ותרצו עבודה – מישהו ישלוף את הפיד".

"היום מדברים על Data Capital. למישהו הנתונים שווים משהו, למכור משהו, לתת שירות טוב יותר, להזהיר מפני אירועים. אם אדע להשתמש בהם צורה נכונה, אני יוצר ערך לחברה או הרשות. כך לדוגמה אנחנו עובדים עם משרד הבריאות על יכולת לנווט את האמבולנסים למיון הכי פחות עמוס באותו רגע".

ואחרי כל זה, אמר ברגמן, צריך לדבר על Big Data. המונח Big Data הוא מטריה המכילה הרבה דברים שונים: ראשית, יש לטפל באחסון כמויות אדירות של נתונים במנוחה; כל תמונה שצולמה, כל מייל שנשלח.  שנית, ישנם נתונים בתנועה – המערכת מזהה שאתה הולך למשוך כסף מכספומט ומשדרת לך פרסומת רלוונטית. זה לא בדיוק בזמן אמת, אבל מאוד קרוב לכך". הסוגיה השלישית, הסביר ברגמן, "היא שהמידע בא בהמון צורות – קודם כל טקסטים – בעיקר אימיילים שמהם מנסים להבין על מה הלקוח כועס; על המחיר? על השירות? על נותן השירות? הכל סטוכסטי – סטטיסטי. אני מקבל החלטות לפי התבנית שלמדתי מהנתונים. והסוגיה הרביעית היא אנליטיקה – המנסה לייצר את התמונה מאוסף הנקודות בזמן אמת. לדוגמה באובר (Uber) ו-Airbnb המחיר משתנה תוך כדי תנועה".

לדבריו, "מה שאיפשר כל זאת דווקא עכשיו הם השיפור בתשתיות הנתונים שמאפשר להריץ אלגוריתם על מיליוני נתונים, ה-Big Data וה-Hadoop שמאפשרים לבזר את הנתונים על שרתים ומערכות איחסון. בנוסף, היום לא צריך לפתח את כל האלגוריתמים מאפס. אני מסוגל היום לקחת ספריה שמישהו פיתח, ולהשתמש בה היום בבוקר לזיהוי תמונה או לזיהוי שפה".

לסיכום אמר ברגמן, כי "עברנו מנסיון להוציא ערך מהנתונים, בהתאם לבעיות עסקיות שאני רוצה לפתור מראש ליכולת חיזוי, כדוגמת חיזוי נטישה. השלב הבא הוא המחשוב הקוגניטיבי בו נאפשר למכונה להיות חלק מהפתרון. אני מעביר חלק מהעבודה שלי למכונה, היא מבצעת את אותו תהליך שעשינו עד כה אבל באופן אוטומטי ומהר. אנו מצמצמים כל הזמן את הקלט האנושי על ידי כך שאני מאמן את המחשב ואחר כך הוא כבר מזהה תבניות לבד".

שיתוף  מידע ואינטגרציה לאיתור וסיכול פעילות טרור.

מוטי סדובסקי, מנכ"ל חברת הייעוץ DSC סיפר על החמצה בגלל אי-הצלבת מידע בין מקורות גלויים. שורת הפיגועים בפריז בשנת 2015, "החל מרצח חברי מערכת שרלי הבדו (Charlie Hebdo) וארבעה מלקוחות המרכול היפר כשר (Hyper Cacher) בפריז, ובהמשך אותה שנה הטבח בבאטקלן, בשדרות וולטייר ובמסעדות. על שניהם רואים חותם של אל קאעידה".

לדבריו, "הדרך המקובלת היא אכיטקטורת HUB לאנליטיקה של Big Data. אנחנו מזרימים המון מידע, אין לנו בעיה לקלוט – 200 אלף יחידות מידע בשניה צריכות לקבוע מה המידע הרלוונטי שרוצים להזרים לתוך המערכת. בסוף לוקחים את המידע ומנתחים. המתודוגלויה שלי היא הפוכה – בואו נראה מה התוצאות ונראה מה היו צריכים להיות הנתונים".

מוטי סדובסקי, מנכ"ל DSC. צילום: קובי קנטור

מוטי סדובסקי, מנכ"ל DSC. צילום: קובי קנטור ז"ל

שאלת המחקר, אמר סדובסקי, "היא כיצד מקטינים את נזקי הטרור באמצעות מידע. לפעמים אתה יודע איפה המידע, לפעמים אתה יודע שהוא קיים – ולא יודע איפה הוא, אבל מחפשים משהו שאנחנו בכלל לא יודעים מהו".

"רוצחי העיתונאים בשרלי הבדו – האחים קואשי, גדלו כאנשים נורמטיבים, אבל בגיל ילדות נפטרו הוריהם והם התחילו ללכת למסגד הקיצוני בפריז. מסתבר שהם היו מוכרים כבר אז למשטרה, שמצלמת את האנשים שמגיעים למקומות האלה ומתייגת אם פניהם".

"שובל הנתונים של האחים קוואשי היה עצום", מסביר סדובסקי. "שריף שהה חצי שנה בבית סוהר – שהוא בית ספר טוב לטרור – ולאחר שחרורו ביקש לצאת לחו"ל וסורב, אך בכל זאת הצליח לצאת לתימן, שם שהה שלושה חודשים במחנה אימונים. עם שובו הוא רכש נשק אצל סוחר בלגי שגם אחריו המשטרה עוקבת. בנוסף, הוא קיבל העברה בנקאית של 20 אלף דולר שהיה ברור כי היא מגיעה מאל קאעידה. הנתונים היו קיימים אבל כל אחד היה בידי רשות אחרת – המשטרה, שירות התעסוקה, שירות בתי הסוהר, ביקורת הגבולות, המערכת הבנקאית, ניתוח הרשתות החברתיות והמיילים שלהם".

"אם היו עושים משפך של Big Data מכל המקורות האפשריים ומפעילים אלגוריתמים – היו יכולים לאתר אותם", סיכם סדובסקי.

מירב בורנשטיין, סמנכ"ל אסטרטגיה ומוצרים בבאזילה. צילום: מוטי סדובסקי

מירב בורנשטיין, סמנכ"ל אסטרטגיה ומוצרים בבאזילה. צילום: מוטי סדובסקי

מירב בורנשטיין, סמנכ"ל אסטרטגיה ומוצרים בבאזילה, הציגה כיצד החברה העוסקת בניטור ומחקר רשתות חברתיות מאזינה לרשתות חברתיות, כתבות וטוקבקים. לדבריה, "אסור לנו לפי החוק לקרוא פרופילים פרטיים, אבל בכל מקום אחר מותר לנו לקרוא – עמודים ציבוריים, קבוצות פתוחות ואירועים".

"הקשבה לרשתות חברתיות – Social Listening – היא הבאזז-וורד החדש ב-Big Data. אנו מקשיבים לרשתות שמאפשרות זאת, כפייסבוק (Facebook) אינטסגרם (Instagram) וטוויטר (Twitter), וגם הם מגבילים – למשל פייסבוק אוסרת על שימוש ב-Crowler, אך מספקת ממשקי API המאפשרים לה שליטה מה היא מוכנה להוציא החוצה ומה לא".

"היום אנשים עושים הכל ברשת", מסבירה בורנשטיין, "וניתן לחקור, לנתח ולמדוד דברים שבדרך אחרת קשה למדוד, ובעיקר להפיק המון תובנות. כל עסק או ארגון שואף להכיר את הצרכנים שלו באופן מיטבי. עד כה הם עשו זאת באמצעות מחקרי שביעות רצון, קבוצות מיקוד וראיונות עומק, אבל לכל השיטות הללו חסרונות".

כך לדוגמה, אמרה, "יכולנו לדעת בבחירות 2015 שיש הרבה יותר אהדה לבנימין נתניהו לעומת יצחק הרצוג וציפי לבני. כתבתי זאת בשבעה טורים שבועיים שהתפרסמו בגלובס ותמיד נקראתי לאחריהם להנהלת החברה שאמרו לי 'איך את מגיעה למסקנה הזו כשכל כלי התקשורת שמסתמכים על סקרים אומרים ההפך'"?

"אנשים כותבים, עושים לייקים ושיתופים בזמן שהכי מפריע להם. למשל אם הורה מחכה עם הילד יותר מדי זמן במיון ולא מגיע רופא, הוא יכול לכתוב בדפי פייסבוק של תוכניות טלוויזיה, לדוגמה "עושות חשבון" בזמן אמת מהטלפון. פעם כשמישהו כעס על השירות במהלכו אבל בסוף העניינים הסתדרו – לא גילה זאת".

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים